핵심 요약
Google Cloud가 4월 29일 GKE Agent Sandbox의 정식 출시(GA)를 발표했다. 오픈소스 Agent Sandbox 컨트롤러 기반 GKE 애드온으로, AI 에이전트의 격리·상태 유지·단일 복제(single-replica) 워크로드를 표준화된 방식으로 운영한다.
- 제품: GKE Agent Sandbox (GA)
- 기반: 오픈소스 Agent Sandbox 컨트롤러
- 요구: GKE 1.31+
- 가격: GKE Standard 기본 비용에 포함, Sandbox 자체 무료
왜 만들었나
LLM 에이전트는 일반 stateless 마이크로서비스와 운영 모델이 다르다. (1) 도구 호출 결과 누적 상태가 있다 (2) 같은 사용자의 후속 요청은 같은 인스턴스로 가야 한다 (3) sandbox 격리로 임의 코드 실행을 봉쇄해야 한다. 이 3가지를 단일 추상화로 해결한 것이 Agent Sandbox CRD다.
핵심 기능
- Stateful single-replica: 사용자 단위 1개 Pod 보장, scale-out은 사용자 단위로
- Sandbox 격리: gVisor·Kata 컨테이너 자동 적용
- 도구 호출 권한 관리: 외부 API·파일시스템·네트워크 접근을 RBAC처럼 정책화
- Lifecycle hook: 세션 시작·일시정지·정리 단계마다 callback 실행
- Vertex AI 통합: Gemini·Anthropic·OpenAI 모델을 동일 인터페이스로 호출
예제 매니페스트
apiVersion: agents.googleapis.com/v1
kind: AgentSandbox
metadata:
name: code-review-agent
spec:
image: gcr.io/myproject/agent:latest
isolation: gvisor
perUser: true
maxIdleMinutes: 30
permissions:
network: ["github.com", "*.googleapis.com"]
filesystem: read-only
llm:
provider: vertex-ai
model: claude-opus-4-7
경쟁 구도
AWS는 Bedrock Agents에 격리 모드를 추가하는 것으로 응답할 가능성이 크다. Azure AI Foundry는 이미 sandbox 모드를 제공하지만 Kubernetes 네이티브가 아닌 점이 차이. EKS·AKS 사용자가 Google로 일부 워크로드 이전을 검토 중인 것으로 알려졌다.
국내 도입
네이버 클로바·카카오 카나나·SK텔레콤 에이닷 등 국내 LLM 에이전트 운영팀이 베타에 참여했다. 한 관계자는 "기존엔 K8s StatefulSet + 자체 컨트롤러를 1년 반 동안 만들어왔는데, 출시 매니페스트 80%가 그대로 호환됐다"고 평가했다.
로드맵
- Q3 2026: 멀티 리전 페일오버
- Q4 2026: GKE Autopilot 모드 GA
- Q1 2027: ARM (Axion) 인스턴스 자동 스케줄링

댓글 0