Tag:

Robust Speech Recognition via Large-Scale Weak Supervision

OpenAI 9月21号开源了一个新的自动语音识别(Automatic Speech Recognition, ASR)模型Whisper。Whisper模型的训练使用了680k小时的多种语言的语音数据(从网络上搜集而来)进行训练。此模型在不同的口音、背景噪声以及专业术语等上下文环境下都相当鲁棒。此外该模型还支持其它语言(共99种)的语音识别,并支持自动翻译为英文。

OpenAI 9月21号开源了一个新的自动语音识别(Automatic Speech Recognition, ASR)模型Whisper。Whisper模型的训练使用了680k小时的多种语言的语音数据(从网络上搜集而来)进行训练。此模型在不同的口音、背景噪声以及专业术语等上下文环境下都相当鲁棒。此外该模型还支持其它语言(共99种)的语音识别,并支持自动翻译为英文。