Top-p란?
확률 내림차순으로 정렬한 토큰들 중 누적 확률이 p에 도달할 때까지의 후보만 남기는 샘플링 기법이다.
예시
top_p = 0.9면 누적 확률 90%에 도달하는 최소 후보 세트에서만 샘플링 — 꼬리의 극저확률 토큰이 자동 배제된다.
권장값
- 기본: 0.9~0.95
- 정확성 중시: 0.5~0.7
- 창의성 중시: 0.95 이상 + temperature 높이기
누적 확률 p 이하의 토큰 후보만 남기고 그 중에서 샘플링하는 방식. 품질과 다양성 균형에 유리.
확률 내림차순으로 정렬한 토큰들 중 누적 확률이 p에 도달할 때까지의 후보만 남기는 샘플링 기법이다.
top_p = 0.9면 누적 확률 90%에 도달하는 최소 후보 세트에서만 샘플링 — 꼬리의 극저확률 토큰이 자동 배제된다.