본문 바로가기
Y
S
영삼넷
youngsam.net
프로그램
기술노트
뉴스
사전
자료실
커뮤니티
소개
홈
/
기술 용어 사전
/
Speculative Decoding
AI
#AI
조회 1
Speculative Decoding란?
정의
작은 모델로 추측·큰 모델로 검증. 생성 속도 2~3배.
Speculative Decoding
작은 draft 모델이 여러 토큰을
미리 예측
→ 큰 모델이 한 번에 검증. 속도 대폭 향상.
🔗 함께 보면 좋은 용어
AI 전체 →
멀티 에이전트 오케스트레이션
Supervisor·Hierarchy·Network 패턴으로 여러 에이전트 조율.
청킹 전략 상세
고정·문장·계층·의미론적·Agentic 청킹. RAG 품질의 결정.
추론 지연 최적화
TTFT·TPS·Batching·KV Cache·Speculative·Quantization 조합.
A2A
Agent-to-Agent Protocol
에이전트 간 통신 표준. Google이 제안. MCP와 상호 보완.
Accuracy
전체 예측 중 맞춘 비율. 클래스 불균형 시 오해를 유발할 수 있음.
Activation Function
신경망 뉴런의 비선형 변환. ReLU·GELU·Sigmoid·Tanh.