AI音频工具AI语音识别

Whisper (OpenAI)

OpenAI 开源语音识别模型，99% 准确率支持 100+ 语言

标签：AI语音识别

链接直达手机查看

Whisper 是 OpenAI 开源的通用语音识别模型，支持 100+ 语言，在英语准确率上接近人类水平。它有多种大小的模型（tiny 到 large），可以在本地或云端部署。跟 Google Speech-to-Text 比，Whisper 对非英语语言的支持更好；跟 Deepgram 比，Whisper 是开源免费的。是所有语音识别应用的基础模型。

访问官网→

数据统计

相关导航

Rev AI

AI语音识别API为开发者提供高精度实时转录。

Deepgram

企业级 AI 语音识别 API，提供高精度实时和异步转写服务。支持 30+ 种语言，专为电话录音、会议转录和媒体字幕场景优化。

Speechmatics

Speechmatics

企业级AI语音识别在各种方言口音下保持高准确率。

Azure Speech to Text

Azure Speech to Text — AI 智能工具，提升工作效率

Meta出品AI语音识别模型，自监督学习语音表示，高精度语音转文字。

Meta出品AI语音理解模型，自监督语音表示学习，语音识别和分类。