TECH NOTES
기술노트
현장에서 검증된 개발 지식을 기록합니다.
87654321
AI
Anthropic Files API + Prompt Caching — 멀티문서 처리 비용 80%↓
Files API 업로드, 캐싱 TTL/granularity 설계, 문서 100개 검색 비용 변화 실측. RAG 결합 패턴.
AI
LLM 추론 비용 최적화 — 캐싱·배치·라우팅으로 70% 절감하는 7가지 기법
LLM API 운영 비용 70% 절감하는 7가지 실전 기법. 프롬프트 캐싱·배치 API·모델 라우팅·프롬프트 압축 가이드.
Infra
Cloud Cost Optimization 2026 — FinOps 실전 + Karpenter 자동 최적화
클라우드 비용 30~50% 절감하는 검증된 패턴 — Karpenter 자동 노드 최적화, Spot 활용, 미사용 리소스 청소, FinOps 문화. 실측 사례.
AI
Anthropic Prompt Caching 실전 — 비용 90% 절감 패턴
Claude API의 Prompt Caching으로 같은 컨텍스트 반복 사용 시 90% 비용 절감. 5분 vs 1시간 TTL 선택, cache hit율 모니터링까지.
AI
LLM 비용 최적화 종합 — 캐싱·라우팅·프롬프트 압축·로컬 폴백
LLM API 비용을 5~10배 줄이는 검증된 5가지 기법 — Prompt Caching, Model Routing, Prompt Compression, Local Fallback, Batch API. 실측 사례.
Infra
베어메탈 vs 클라우드 2026 — 비용 분석과 선택 기준
2026년 기준 베어메탈과 클라우드의 TCO 비교, 하이브리드 전략 제시.
AI
Anthropic Batch API — 대량 요청 50% 할인 처리
Anthropic Batch API로 대량 요청을 50% 할인 가격에 비동기로 처리하는 방법.
Infra
FinOps — 클라우드 비용 최적화 실전 가이드
FinOps 방법론으로 클라우드 비용을 체계적으로 관리하고 최적화하는 방법.