본문 바로가기
Y
S
영삼넷
youngsam.net
프로그램
기술노트
뉴스
사전
자료실
커뮤니티
소개
홈
/
기술 용어 사전
/
LLM-as-Judge
AI
#AI
#Evaluation
조회 2
LLM-as-Judge란?
정의
강한 LLM이 다른 모델 응답을 평가하는 자동 평가 기법. 사람 평가의 대안.
LLM-as-Judge
사람이 일일이 평가하기엔 느리고 비싸다.
GPT-4·Claude가 평가자 역할
.
주의
자기 모델 선호 편향
길이 편향 (긴 답 선호)
Rubric 명확히 제공 필수
🔗 함께 보면 좋은 용어
AI 전체 →
A2A
Agent-to-Agent Protocol
에이전트 간 통신 표준. Google이 제안. MCP와 상호 보완.
Accuracy
전체 예측 중 맞춘 비율. 클래스 불균형 시 오해를 유발할 수 있음.
Activation Function
신경망 뉴런의 비선형 변환. ReLU·GELU·Sigmoid·Tanh.
Adam
적응형 학습률 + 모멘텀을 결합한 최적화 알고리즘. 딥러닝 실무의 표준 선택.
Agentic RAG
LLM이 검색 여부·범위·재검색을 스스로 판단하는 RAG. 도구 사용과 결합.
AGI
Artificial General Intelligence
인간 수준의 범용 지능을 가진 AI. 특정 태스크가 아닌 모든 인지 작업을 수행 가능한 가상적 목표.