본문 바로가기
AI#AI조회 23

Streaming Response (LLM)란?

정의

LLM 응답을 토큰별로 실시간 전송. SSE로 구현. ChatGPT의 그 효과.

Streaming이란?

LLM이 생성되는 토큰을 즉시 전송해 사용자가 기다리지 않게 한다.

구현

Server-Sent Events(SSE)가 표준. 클라이언트는 EventSource 또는 fetch ReadableStream으로 수신.

🔗 함께 보면 좋은 용어

AI 전체 →