본문 바로가기

AI#AI#LLM조회 139

Token란?토큰

정의

LLM이 텍스트를 처리하는 최소 단위. 한글은 대략 1글자 ≈ 1~2 토큰, 영어는 1단어 ≈ 1.3 토큰.

다른 표현토큰LLM 토큰

토큰이란?

LLM은 텍스트를 직접 다루지 않고 토큰이라는 서브워드 단위로 쪼개 처리한다. 모델별로 Tokenizer가 다르며 비용·컨텍스트 길이도 토큰 기준으로 계산된다.

근사 기준

영어: 1 단어 ≈ 1.3 토큰
한국어: 1 글자 ≈ 1~2 토큰 (모델마다 차이 큼)
코드: 영어보다 많은 편 (특수 문자 많음)

왜 중요한가

API 비용이 토큰 단위 과금
컨텍스트 윈도우(200k, 1M 등)가 토큰 한계
긴 프롬프트는 비용과 지연을 모두 늘린다

📘 관련 기술노트

전체 보기 →

AIOpenAI API 비용 최적화 — 토큰 절감과 모델 선택 전략

BackendJWT 인증 구현 완벽 가이드 — Access Token과 Refresh Token

BackendJWT 인증 시스템 구현 — Access Token + Refresh Token

🔗 함께 보면 좋은 용어

멀티 에이전트 오케스트레이션

Supervisor·Hierarchy·Network 패턴으로 여러 에이전트 조율.

청킹 전략 상세

고정·문장·계층·의미론적·Agentic 청킹. RAG 품질의 결정.

추론 지연 최적화

TTFT·TPS·Batching·KV Cache·Speculative·Quantization 조합.

Agent-to-Agent Protocol

에이전트 간 통신 표준. Google이 제안. MCP와 상호 보완.

전체 예측 중 맞춘 비율. 클래스 불균형 시 오해를 유발할 수 있음.

Activation Function

신경망 뉴런의 비선형 변환. ReLU·GELU·Sigmoid·Tanh.