Streaming이란?
LLM이 생성되는 토큰을 즉시 전송해 사용자가 기다리지 않게 한다.
구현
Server-Sent Events(SSE)가 표준. 클라이언트는 EventSource 또는 fetch ReadableStream으로 수신.
LLM 응답을 토큰별로 실시간 전송. SSE로 구현. ChatGPT의 그 효과.
LLM이 생성되는 토큰을 즉시 전송해 사용자가 기다리지 않게 한다.
Server-Sent Events(SSE)가 표준. 클라이언트는 EventSource 또는 fetch ReadableStream으로 수신.