Extended Thinking이란?
Claude가 최종 답변 전에 수천~수만 토큰의 내부 추론을 수행하는 모드다. 복잡 수학·논리·코드 디버깅에서 정확도가 크게 향상된다.
API 사용
client.messages.create(
model="claude-opus-4-7",
thinking={"type": "enabled", "budget_tokens": 10000},
messages=[...]
)
언제 효과적인가
- 수학·논리 문제
- 복잡한 코드 디버깅
- 다단계 계획이 필요한 에이전트
단점
응답 시간이 수 초~수 십 초로 늘어남. 간단 대화엔 부적합. 비용도 thinking 토큰이 포함돼 크게 상승.