자동 노드 프로비저닝

Karpenter가 어떻게 스케줄링할 수 없는 Pod의 요구 사항에 따라 적절한 크기의 EC2 인스턴스를 동적으로 프로비저닝할 수 있는지 살펴보겠습니다. 이를 통해 EKS 클러스터에서 사용되지 않는 컴퓨팅 리소스의 양을 줄일 수 있습니다.

이전 섹션에서 생성한 NodePool은 Karpenter가 사용할 수 있는 특정 인스턴스 타입을 명시했습니다. 해당 인스턴스 타입들을 살펴보겠습니다:

인스턴스 타입	vCPU	메모리	가격
`c5.large`	2	4GB	+
`m5.large`	2	8GB	++
`r5.large`	2	16GB	+++
`m5.xlarge`	4	16GB	++++

몇 개의 Pod를 생성하고 Karpenter가 어떻게 적응하는지 살펴보겠습니다. 현재 Karpenter가 관리하는 노드는 없습니다:

~$kubectl get node -l type=karpenter

No resources found

다음 Deployment를 사용하여 Karpenter가 스케일 아웃하도록 트리거하겠습니다:

~/environment/eks-workshop/modules/autoscaling/compute/karpenter/scale/deployment.yaml
apiVersion: apps/v1
kind: Deployment
metadata:
  name: inflate
  namespace: other
spec:
  replicas: 0
  selector:
    matchLabels:
      app: inflate
  template:
    metadata:
      labels:
        app: inflate
    spec:
      nodeSelector:
        type: karpenter
      terminationGracePeriodSeconds: 0
      containers:
        - name: inflate
          image: public.ecr.aws/eks-distro/kubernetes/pause:3.2
          resources:
            requests:
              memory: 1Gi

초기에는 실행할 복제본을 0개로 지정하며, 나중에 스케일 업할 예정입니다

NodePool과 일치하는 노드 셀렉터를 사용하여 Pod가 Karpenter가 프로비저닝한 용량에 스케줄링되도록 요구합니다

간단한 pause 컨테이너 이미지를 사용합니다

각 Pod당 1Gi의 메모리를 요청합니다

pause 컨테이너란 무엇인가요?

이 예제에서 다음 이미지를 사용하는 것을 확인할 수 있습니다:

public.ecr.aws/eks-distro/kubernetes/pause

이것은 실제 리소스를 소비하지 않고 빠르게 시작되는 작은 컨테이너로, 스케일링 시나리오를 시연하는 데 매우 적합합니다. 이 특정 실습에서 많은 예제에 이를 사용할 것입니다.

이 deployment를 적용합니다:

~$kubectl apply -k ~/environment/eks-workshop/modules/autoscaling/compute/karpenter/scale

deployment.apps/inflate created

이제 Karpenter가 최적화된 결정을 내리고 있음을 보여주기 위해 이 deployment를 의도적으로 스케일링해 보겠습니다. 1Gi의 메모리를 요청했으므로, deployment를 5개의 복제본으로 스케일링하면 총 5Gi의 메모리를 요청하게 됩니다.

계속하기 전에, 위 표에서 Karpenter가 어떤 인스턴스를 프로비저닝할 것이라고 생각하시나요? 어떤 인스턴스 타입을 프로비저닝하기를 원하시나요?

deployment를 스케일링합니다:

~$kubectl scale -n other deployment/inflate --replicas 5

이 작업은 하나 이상의 새로운 EC2 인스턴스를 생성하므로 시간이 걸립니다. 다음 명령어로 kubectl을 사용하여 완료될 때까지 기다릴 수 있습니다:

~$kubectl rollout status -n other deployment/inflate --timeout=180s

모든 Pod가 실행되면, 어떤 인스턴스 타입이 선택되었는지 확인해보겠습니다:

~$kubectl logs -l app.kubernetes.io/instance=karpenter -n karpenter | grep 'launched nodeclaim' | jq '.'

인스턴스 타입과 구매 옵션을 나타내는 출력을 볼 수 있습니다:

{
  "level": "INFO",
  "time": "2023-11-16T22:32:00.413Z",
  "logger": "controller.nodeclaim.lifecycle",
  "message": "launched nodeclaim",
  "commit": "1072d3b",
  "nodeclaim": "default-xxm79",
  "nodepool": "default",
  "provider-id": "aws:///us-west-2a/i-0bb8a7e6111d45591",
  "instance-type": "m5.large",
  "zone": "us-west-2a",
  "capacity-type": "on-demand",
  "allocatable": {
    "cpu": "1930m",
    "ephemeral-storage": "17Gi",
    "memory": "6903Mi",
    "pods": "29",
    "vpc.amazonaws.com/pod-eni": "9"
  }
}

스케줄링한 Pod들은 8GB 메모리를 가진 EC2 인스턴스에 잘 맞을 것이며, Karpenter는 항상 온디맨드 인스턴스에 대해 가장 낮은 가격의 인스턴스 타입을 우선시하므로 m5.large를 선택할 것입니다.

정보

가장 저렴한 인스턴스 타입이 작업 중인 리전에서 남은 용량이 없는 경우와 같이 가장 낮은 가격 이외의 다른 인스턴스 타입이 선택될 수 있는 특정 경우가 있습니다.

Karpenter가 노드에 추가한 메타데이터도 확인할 수 있습니다:

~$kubectl get node -l type=karpenter -o jsonpath='{.items[0].metadata.labels}' | jq '.'

이 출력은 설정된 다양한 레이블을 보여줍니다. 예를 들어 인스턴스 타입, 구매 옵션, 가용 영역 등입니다:

{
  "beta.kubernetes.io/arch": "amd64",
  "beta.kubernetes.io/instance-type": "m5.large",
  "beta.kubernetes.io/os": "linux",
  "failure-domain.beta.kubernetes.io/region": "us-west-2",
  "failure-domain.beta.kubernetes.io/zone": "us-west-2a",
  "k8s.io/cloud-provider-aws": "1911afb91fc78905500a801c7b5ae731",
  "karpenter.k8s.aws/instance-category": "m",
  "karpenter.k8s.aws/instance-cpu": "2",
  "karpenter.k8s.aws/instance-family": "m5",
  "karpenter.k8s.aws/instance-generation": "5",
  "karpenter.k8s.aws/instance-hypervisor": "nitro",
  "karpenter.k8s.aws/instance-memory": "8192",
  "karpenter.k8s.aws/instance-pods": "29",
  "karpenter.k8s.aws/instance-size": "large",
  "karpenter.sh/capacity-type": "on-demand",
  "karpenter.sh/initialized": "true",
  "karpenter.sh/provisioner-name": "default",
  "kubernetes.io/arch": "amd64",
  "kubernetes.io/hostname": "ip-100-64-10-200.us-west-2.compute.internal",
  "kubernetes.io/os": "linux",
  "node.kubernetes.io/instance-type": "m5.large",
  "topology.ebs.csi.aws.com/zone": "us-west-2a",
  "topology.kubernetes.io/region": "us-west-2",
  "topology.kubernetes.io/zone": "us-west-2a",
  "type": "karpenter",
  "vpc.amazonaws.com/has-trunk-attached": "true"
}

이 간단한 예제는 Karpenter가 컴퓨팅 용량이 필요한 워크로드의 리소스 요구 사항에 따라 적절한 인스턴스 타입을 동적으로 선택할 수 있다는 사실을 보여줍니다. 이는 Cluster Autoscaler와 같은 노드 풀 중심의 모델과 근본적으로 다릅니다. 노드 풀 모델에서는 단일 노드 그룹 내의 인스턴스 타입이 일관된 CPU 및 메모리 특성을 가져야 합니다.