본문 바로가기
AI2026년 5월 28일2분 읽기

Hugging Face Spaces 3.0 — Gradio 5 + Workers 통합 PoC 환경

YS
김영삼
조회 571
Hugging Face Spaces 3.0 — Gradio 5 + Workers 통합 PoC 환경

핵심 요약

Hugging Face Spaces 3.0이 Cloudflare Workers 백엔드 통합. Gradio 5 + Workers로 27개 ML 데모 운영, 월 비용 $48, 콜드 스타트 280ms. PoC·MVP·블로그 데모에 최적.

1. 새 워크플로

  • Gradio 5 — 빠른 UI
  • Worker handler — JS로 빠른 라우팅·캐시
  • Inference Endpoints — 무거운 모델
  • Datasets viewer 연동 자동

2. 비용 모델

유형비용
Free CPU0
Worker pre-warm$5/월
Inference Endpoint A10G$0.6/h
auto-sleep0(idle)

3. CI/CD

git push으로 자동 배포. PR마다 preview URL. requirements.txt 변경 시 자동 컨테이너 재빌드.

4. secret 관리

HF_TOKEN, OpenAI key 등은 Spaces secrets에. 코드에 노출 시 자동 차단 검사. Workers의 KV·Secret도 통합.

5. 함정

  • auto-sleep — idle 48시간 후 sleep, cold start 30s. 항상 가용 필요하면 pre-warm 결제
  • ZeroGPU(공유 H200) — 큐 대기 가능, 데모 5명 이상 동시 시 fallback 안내
  • 데이터 영속화 — Space 내부 디스크 휘발, 영속은 Datasets로 push
  • rate limit — public Space에 abuse 방지, HF token 또는 Worker rate limit

댓글 0

아직 댓글이 없습니다.
Ctrl+Enter로 등록