핵심 요약
Kubernetes 1.34 알파가 5월 21일 공개됐다. DRA(Dynamic Resource Allocation)가 GA 예정으로 GPU·FPGA·DPU 같은 특수 자원의 동적 할당이 표준화. 7월 정식 출시 예정.
- DRA: 알파→GA 직진
- Image Volume: Beta
- ConsistentReadFromCache: Stable
- cgroup v1: Deprecation 알림
DRA — 무엇이 달라지나
이전엔 device plugin이 노드 단위 정적 할당이었다. DRA는 ResourceClaim/ResourceClass로 동적 할당. 같은 GPU를 여러 파드가 시간별로 점유하거나, 부분 SR-IOV를 정교히 분배 가능.
YAML 예시
apiVersion: resource.k8s.io/v1beta1
kind: ResourceClaimTemplate
metadata:
name: nvidia-gpu
spec:
spec:
resourceClassName: nvidia.com/gpu
---
apiVersion: v1
kind: Pod
spec:
resourceClaims:
- name: gpu
resourceClaimTemplateName: nvidia-gpu
영향 — GPU 워크로드
| device plugin | DRA | |
|---|---|---|
| GPU 부분 공유(MIG) | 제한적 | 네이티브 |
| 토폴로지 인식 | 약함 | 강함 |
| 스케줄러 통합 | 외부 | 표준 |
국내 영향
- 네이버·카카오·삼성SDS의 LLM 추론 클러스터 효율 +20% 가능
- KT클라우드 GPU as a Service 가격 인하 여력
- VAST Data·WekaIO 같은 스토리지도 DRA 모델 도입

댓글 0