OpenAI 开源语音识别模型,99% 准确率支持 100+ 语言
Whisper 是 OpenAI 开源的通用语音识别模型,支持 100+ 语言,在英语准确率上接近人类水平。它有多种大小的模型(tiny 到 large),可以在本地或云端部署。跟 Google Speech-to-Text 比,Whisper 对非英语语言的支持更好;跟 Deepgram 比,Whisper 是开源免费的。是所有语音识别应用的基础模型。
访问官网→
Google 云端语音识别服务,支持 125 种语言
Voci 是值得推荐的 AI 智能工具,帮你提升工作效率
Google云AI语音识别支持125种语言高准确率。
AWS AI语音转录服务自动生成时间戳和说话人标签。
企业级AI语音识别在各种方言口音下保持高准确率。
AI 语音识别和理解 API,支持语音转文字、内容审核、说话人识别和情感分析。开发者友好,提供实时流式接口和预训练模型。