핵심 요약
Hugging Face Spaces 3.0이 Cloudflare Workers 백엔드 통합. Gradio 5 + Workers로 27개 ML 데모 운영, 월 비용 $48, 콜드 스타트 280ms. PoC·MVP·블로그 데모에 최적.
1. 새 워크플로
- Gradio 5 — 빠른 UI
- Worker handler — JS로 빠른 라우팅·캐시
- Inference Endpoints — 무거운 모델
- Datasets viewer 연동 자동
2. 비용 모델
| 유형 | 비용 | |
|---|---|---|
| Free CPU | 0 | |
| Worker pre-warm | $5/월 | |
| Inference Endpoint A10G | $0.6/h | |
| auto-sleep | 0(idle) |
3. CI/CD
git push으로 자동 배포. PR마다 preview URL. requirements.txt 변경 시 자동 컨테이너 재빌드.
4. secret 관리
HF_TOKEN, OpenAI key 등은 Spaces secrets에. 코드에 노출 시 자동 차단 검사. Workers의 KV·Secret도 통합.
5. 함정
- auto-sleep — idle 48시간 후 sleep, cold start 30s. 항상 가용 필요하면 pre-warm 결제
- ZeroGPU(공유 H200) — 큐 대기 가능, 데모 5명 이상 동시 시 fallback 안내
- 데이터 영속화 — Space 내부 디스크 휘발, 영속은 Datasets로 push
- rate limit — public Space에 abuse 방지, HF token 또는 Worker rate limit

댓글 0