Claude Opus 4.7의 1M 컨텍스트 기능을 쓰니까 코드베이스 분석에 너무 좋은데, 한 호출에 토큰 30~50만이 들어가면서 호출당 $5~10씩 비용이 폭발합니다.
전체를 한 번에 넣지 않고 잘라서 보내고 싶은데, RAG처럼 임베딩 기반 검색으로 가야 할지, 다른 청킹 전략이 있는지 알려주세요.
Claude Opus 4.7의 1M 컨텍스트 기능을 쓰니까 코드베이스 분석에 너무 좋은데, 한 호출에 토큰 30~50만이 들어가면서 호출당 $5~10씩 비용이 폭발합니다.
전체를 한 번에 넣지 않고 잘라서 보내고 싶은데, RAG처럼 임베딩 기반 검색으로 가야 할지, 다른 청킹 전략이 있는지 알려주세요.
댓글 0