Groq란?
LLM 추론에 특화된 LPU 칩을 만들어 토큰 생성 속도 혁신.
성능
Llama 3 70B를 초당 수백 토큰으로 서빙. NVIDIA·Groq Cloud API 제공.
LPU(Language Processing Unit) ASIC으로 초고속 LLM 추론. 토큰/초 1000+.
LLM 추론에 특화된 LPU 칩을 만들어 토큰 생성 속도 혁신.
Llama 3 70B를 초당 수백 토큰으로 서빙. NVIDIA·Groq Cloud API 제공.