TECH NOTES
기술노트
현장에서 검증된 개발 지식을 기록합니다.
4321
AI
Claude API 프롬프트 캐싱 완벽 활용 — 비용 90% 절감 실전 패턴 6가지
Claude API의 프롬프트 캐싱은 시스템 프롬프트·도구 정의·긴 문서 재사용 시 비용을 최대 90% 절감한다. cache_control 사용법과 실전 6가지 패턴을 정리한다.
Infra
Kubernetes 1.33 GPU 스케줄링 실전 가이드 — AI 워크로드 비용 60% 절감
Kubernetes 1.33의 GPU 스케줄링 & DRA(Dynamic Resource Allocation) GA를 활용하여 AI 추론 서버를 효율적으로 운영하는 방법을 실습합니다.
Infra
AWS S3 비용 최적화 — 스토리지 클래스와 라이프사이클
AWS S3의 스토리지 클래스별 특성을 비교하고, 라이프사이클 정책과 Intelligent-Tiering으로 스토리지 비용을 최대 90%까지 절감하는 전략을 소개합니다.
AI
LLM 토큰 최적화 — 비용 50% 절감하는 프롬프트 기법
LLM API 비용의 핵심인 토큰 사용량을 효과적으로 줄이는 프롬프트 설계 기법과 시스템 수준 최적화 전략을 다룹니다.