NVIDIA의 추론 마이크로서비스. 컨테이너로 즉시 배포.
Llama·Mistral·Gemma·DeepSeek을 최적화된 컨테이너로. TensorRT-LLM·Triton 내장. 온프레·클라우드 공통.