핵심 요약
Talos 1.10으로 모든 베어메탈 K8s 노드 OS 전환 후 6개월. SSH·systemd·셸이 없는 불변 OS의 운영 부담이 일반 Ubuntu 대비 75% 감소, CIS 벤치마크 점수는 자동으로 만점. 패치 도입은 talosctl 한 줄로 OS 재부팅 포함 4분.
1. Talos가 다른 점
- API로만 관리 — SSH·셸 없음
- OS = K8s 노드, 그 외 워크로드 불가
- 전체 OS가 단일 squashfs, 부팅 시 검증
- 패키지 매니저 없음, 업데이트 = OS 이미지 교체
2. 셋업
talosctl gen config my-cluster https://10.0.0.10:6443
talosctl apply-config --insecure -n 10.0.0.11 -f controlplane.yaml
talosctl bootstrap -n 10.0.0.11
kubectl get nodes
전체 노드 부팅 후 클러스터 가동까지 10분.
3. 업그레이드
talosctl upgrade -n 10.0.0.11 --image factory.talos.dev/installer/...
# 노드별 진행, drain → 재부팅 → 복귀
K8s 자체 업그레이드도 동일 흐름. 1.30 → 1.31 → 1.32 6주 만에 무중단 완료.
4. 디버깅
SSH가 없는 게 처음엔 답답하다. talosctl logs, talosctl dashboard, talosctl read /var/log/... 등으로 충분. talosctl shell도 가능하지만 root는 read-only.
5. 보안
| 지표 | Ubuntu LTS | Talos 1.10 |
|---|---|---|
| CIS K8s | 78% | 100% |
| 패치 평균 적용 지연 | 9일 | 1일 |
| OS 사고/년 | 3 | 0 |
6. 함정
- 네이티브 GPU 드라이버는 sidero가 빌드한 이미지 사용 필요
- 일부 CSI는 OS 노드 helper 필요 — Longhorn은 OK, 일부 vendor는 비호환
- 모니터링 에이전트는 컨테이너로만 가능
7. 결정 가이드
- K8s 전용 클러스터 → 강력 추천
- K8s 외 워크로드를 같은 노드에 → 부적합
- 관리 단순화·보안 우선 → Talos
자주 묻는 질문
Q. 클라우드 매니지드 K8s에서? AWS/GCP/Azure 매니지드 K8s는 자체 노드 OS 사용. Talos는 EKS Anywhere, 베어메탈, edge 등에 적합.

댓글 0