TECH NOTES
기술노트
현장에서 검증된 개발 지식을 기록합니다.
4321
AI
Llama 5 405B Multimodal — 자체 호스팅 비용·성능 벤치마크
Llama 5 405B 멀티모달의 자체 호스팅 인프라 비용과 처리량 측정. 8×H200 대비 4×B200 비교, API 대비 손익분기점.
AI
오픈소스 LLM 리더보드 2026-05 — Llama 4·Qwen 3·DeepSeek V4 실측
Llama 4 405B, Qwen 3 235B, DeepSeek V4의 벤치마크·추론 비용·한국어 능력·라이선스를 실측 비교.
AI
Llama.cpp 로컬 LLM 최적화 — 양자화와 GGUF 포맷
llama.cpp를 활용한 로컬 LLM 실행 시 양자화 수준별 성능 차이와 GGUF 포맷의 구조를 분석하고 최적 설정을 찾는 방법입니다.
AI
Ollama 로컬 LLM 실행 — Llama 2·Mistral·Phi
Ollama 로컬 LLM 실행 — Llama 2·Mistral·Phi — 실무에서 바로 적용할 수 있는 가이드입니다.