본문 바로가기
AI#AI#Audio조회 1

Whisper란?

정의

OpenAI의 오픈소스 음성 인식 모델. 99개 언어 지원, 정확도 높음.

Whisper란?

OpenAI가 2022년 오픈소스화한 ASR 모델이다. MIT 라이선스.

특징

  • 99개 언어
  • 한국어 품질 매우 좋음
  • 번역 기능 (→ 영어) 내장
  • 크기: tiny(39M) ~ large(1.5B)

구동

whisper.cpp, faster-whisper로 CPU·엣지에서도 실시간 수준.

📘 관련 기술노트

전체 보기 →

🔗 함께 보면 좋은 용어

AI 전체 →