본문 바로가기
Y
S
영삼넷
youngsam.net
프로그램
기술노트
뉴스
사전
자료실
커뮤니티
소개
홈
/
기술 용어 사전
/
PagedAttention
AI
#AI
조회 1
PagedAttention란?
정의
vLLM의 KV Cache 페이지 단위 관리. 메모리 효율 극대.
PagedAttention
OS 가상 메모리 아이디어를 KV Cache에 적용.
메모리 조각 방지·공유
로 처리량 2배+.
🔗 함께 보면 좋은 용어
AI 전체 →
멀티 에이전트 오케스트레이션
Supervisor·Hierarchy·Network 패턴으로 여러 에이전트 조율.
청킹 전략 상세
고정·문장·계층·의미론적·Agentic 청킹. RAG 품질의 결정.
추론 지연 최적화
TTFT·TPS·Batching·KV Cache·Speculative·Quantization 조합.
A2A
Agent-to-Agent Protocol
에이전트 간 통신 표준. Google이 제안. MCP와 상호 보완.
Accuracy
전체 예측 중 맞춘 비율. 클래스 불균형 시 오해를 유발할 수 있음.
Activation Function
신경망 뉴런의 비선형 변환. ReLU·GELU·Sigmoid·Tanh.