본문 바로가기
AI#AI#Evaluation조회 20

LLM-as-Judge란?

정의

강한 LLM이 다른 모델 응답을 평가하는 자동 평가 기법. 사람 평가의 대안.

LLM-as-Judge

사람이 일일이 평가하기엔 느리고 비싸다. GPT-4·Claude가 평가자 역할.

주의

  • 자기 모델 선호 편향
  • 길이 편향 (긴 답 선호)
  • Rubric 명확히 제공 필수

🔗 함께 보면 좋은 용어

AI 전체 →