본문 바로가기
🤖

AI 427개 용어

LLM·에이전트·RAG·임베딩·프롬프트 등 AI 시대 필수 용어

Agentic Chunking👁 48
LLM이 문서를 의미 단위로 직접 분할. 고비용·고품질.
Agent Memory👁 48
단기·장기 메모리. Conversation buffer·Vector store·Summary.
Agent Sandbox👁 48
에이전트 실행 격리 환경. VM·Firecracker·e2b.
Amazon Bedrock👁 48
AWS의 관리형 LLM 플랫폼. Anthropic·Meta·Mistral·Cohere 모델 제공.
Anthropic Message Batches👁 48
Claude의 배치 API. 50% 할인. 1만 건·24시간.
Arena-Hard👁 48
LMSYS Chatbot Arena 난이도 높은 자동 평가셋.
Autoregressive Model👁 48
이전 출력을 기반으로 다음을 예측하는 모델. GPT·Llama 등 대부분 LLM.
Best-of-N Sampling👁 48
N개 응답을 생성 후 최고를 선택. 단순하지만 효과적인 inference scaling.
Chatbot👁 48
자연어로 대화하는 소프트웨어. LLM 등장 이후 품질·활용이 급상승.
Chunking👁 48
RAG 파이프라인의 첫 단계. 긴 문서를 임베딩·검색에 적합한 단위로 분할.
Claude Artifacts👁 48
대화와 분리된 코드·문서 산출물. 즉시 미리보기·반복.
Code Interpreter👁 48
LLM이 Python을 실행·결과를 관찰. ChatGPT Advanced Data Analysis.
ColBERT (Late Interaction)👁 48
토큰 단위 임베딩 후 지연 결합. BM25+벡터의 중간.
Computer Use API👁 48
Claude Computer Use 공식 API. 도커 예제.
Context Caching👁 48
긴 프롬프트의 반복 부분을 캐시해 비용·지연을 절감. Claude·Gemini가 선도.
CopilotKit👁 48
기존 앱에 AI Copilot 통합. React 컴포넌트·백엔드 포함.
CUDA👁 48
NVIDIA의 GPU 프로그래밍 플랫폼·언어. 딥러닝 프레임워크의 기반.
DeepSeek V3 아키텍처👁 48
MLA·DeepSeekMoE·Multi-token Prediction. V3의 핵심 혁신.
FLUX👁 48
Black Forest Labs(Stable Diffusion 창시자 일부)의 차세대 오픈 이미지 모델. 2024년 공개.
Foundation Model👁 48
대규모 데이터로 사전학습돼 다양한 downstream에 적응 가능한 범용 AI 모델.
FSDP👁 48
Fully Sharded Data Parallel
PyTorch의 대형 모델 분산 학습. ZeRO-3와 유사한 파티셔닝.
Gemini Function Calling👁 48
Google Gemini의 도구 호출. Code Execution·Grounding 내장.
Gemini Thinking👁 48
Google의 reasoning 모델. 추론 토큰 공개.
G-Eval👁 48
GPT-4로 평가. CoT로 평가 이유 생성·점수.
GGUF👁 48
llama.cpp의 양자화 모델 파일 형식. Ollama·LM Studio 표준.
Guardrails 프레임워크👁 48
Guardrails AI·NeMo Guardrails·Llama Guard·OpenAI Moderation.
HF Inference Endpoints👁 48
Hugging Face 모델을 관리형 엔드포인트로 배포.
Interpretability👁 48
딥러닝 모델 내부 동작을 사람이 이해할 수 있게 분석하는 연구 분야.
KV Cache👁 48
Transformer의 Key·Value를 캐시해 재계산 회피. LLM 추론의 메모리 주범.
LangChain LCEL👁 48
LangChain Expression Language
LangChain의 파이프 연산자 기반 체인 조립.
Langfuse👁 48
오픈소스 LLM 관측성 플랫폼. 셀프호스팅 가능. LangSmith 대안.
LangSmith👁 48
LangChain 팀의 LLM 관측·평가 플랫폼. 프로덕션 LLM 디버깅·A/B.
LLM Judge 편향👁 48
LLM이 평가자일 때 생기는 편향. 길이·위치·자기 선호.
Max Tokens👁 48
생성 토큰 상한. 비용·지연 제어.
Model Extraction Attack👁 48
API 호출로 독점 모델을 복제하는 공격.
Model Inversion Attack👁 48
모델 출력에서 학습 데이터를 역추적. 프라이버시 공격.
Multimodal Embedding👁 48
이미지·텍스트·오디오를 같은 벡터 공간에. CLIP·SigLIP.
OpenAI Assistants API👁 48
OpenAI의 스테이트풀 에이전트 API. Threads·Runs·Tools.
Overfitting👁 48
학습 데이터에 과도하게 맞춰져 새 데이터에서 성능이 떨어지는 현상.
Program of Thoughts👁 48
PoT
추론을 코드로 표현·실행. 수학·계산 정확도 향상.
RAG Pipeline👁 48
RAG의 7단계: 문서 → 청크 → 임베딩 → 저장 → 검색 → 리랭킹 → LLM 생성.
Repetition Penalty👁 48
반복 토큰에 페널티. 같은 단어·구 반복 방지.
ROUGE👁 48
요약 품질 지표. Recall 기반 n-gram·LCS.
Structured Output (Strict)👁 48
JSON Schema·Pydantic에 100% 부합하는 출력 보장.
Test-Time Compute👁 48
추론 시 더 오래 생각해 성능 향상. Scaling Law의 새 축.
Whisper API👁 48
OpenAI의 Whisper 클라우드 API. 파일 업로드·실시간 자막.
YOLO👁 48
You Only Look Once
실시간 객체 검출 모델. 이미지 전체를 한 번에 처리해 속도 대비 성능 우수.
Agent Reflection👁 47
에이전트가 자신의 출력을 자기 평가·개선하는 루프.
Backpropagation👁 47
신경망 학습의 핵심 알고리즘. 출력 오류를 거꾸로 전파해 가중치 기울기를 계산.
BERTScore👁 47
BERT 임베딩 유사도 기반 생성 평가. BLEU·ROUGE 대안.