LLM 비용 절감Prompt Caching (90% ↓)Haiku·mini 모델 라우팅프롬프트 압축Batch API (OpenAI·Anthropic — 50% ↓)컨텍스트 축소·RAG