본문 바로가기
Y
S
영삼넷
youngsam.net
프로그램
기술노트
뉴스
사전
자료실
커뮤니티
소개
TECH NOTES
기술노트
현장에서 검증된 개발 지식을 기록합니다.
전체
AI
Frontend
Backend
Database
Infra
Etc
전체
1
건
최신순
조회순
추천순
#Speculative ✕
1
AI
5분 읽기
Speculative Decoding 프로덕션 — LLM 추론 2배 빠르게 만드는 법
draft 모델 + verifier 구조로 토큰 생성을 병렬화. n-gram, Medusa, EAGLE-2 비교와 vLLM 적용 실측 1.8~2.4배.
#LLM
#Inference
#Speculative
2026.05.18