OpenAI Whisper v4로 콜센터 녹취 STT 처리 중. 정확도 분석:
| 구분 | 정확도(WER) |
|---|---|
| 표준어 (서울·경기) | 5.2% (95% 정확) |
| 경상도 | 28% (72%) |
| 전라도 | 26% |
| 충청도 | 14% (86%) |
| 강원도 | 16% |
경상도/전라도는 매출 비중 큰 지역인데 정확도 너무 낮음. fine-tune 시도해야 할지, 다른 한국어 모델 검토할지 조언 부탁드립니다.
환경: Whisper v4 large, 16kHz audio, OpenAI API
OpenAI Whisper v4로 콜센터 녹취 STT 처리 중. 정확도 분석:
| 구분 | 정확도(WER) |
|---|---|
| 표준어 (서울·경기) | 5.2% (95% 정확) |
| 경상도 | 28% (72%) |
| 전라도 | 26% |
| 충청도 | 14% (86%) |
| 강원도 | 16% |
경상도/전라도는 매출 비중 큰 지역인데 정확도 너무 낮음. fine-tune 시도해야 할지, 다른 한국어 모델 검토할지 조언 부탁드립니다.
환경: Whisper v4 large, 16kHz audio, OpenAI API
댓글 0