본문 바로가기
AI#AI조회 21

Context Caching란?

정의

긴 프롬프트의 반복 부분을 캐시해 비용·지연을 절감. Claude·Gemini가 선도.

Context Caching이란?

시스템 프롬프트·문서·예제처럼 반복되는 긴 컨텍스트를 서버가 캐시해 재사용한다.

절감

  • Claude — 캐시 읽기 90% 할인
  • Gemini — 컨텍스트 캐싱 API
  • OpenAI — 자동 prompt caching

🔗 함께 보면 좋은 용어

AI 전체 →