AI音频工具

AI音频生成

>>该分类全部工具

fakeyou

fakeyou,音频生成AI,名人文字转语音工具

bandlab

AI工具箱,bandlab,音乐创作,数字音频工作站,社交平台,免费ai音频分离工具

Adobe Podcast

AI工具箱,Adobe Podcast,Adobe推出的在线AI音频录制和编辑工具

网易天音

网易天音,一站式AI音乐创作平台

riffusion

riffusion,ai生成频谱图并制作音乐

IBM Watson ai

IBM Watson,文字转语音ai自动剪辑

通义听悟

AI工具箱,通义听悟,基于阿里云AI大模型,每天自动获得自动两小时听转写时长

Murf AI

Murf AI AI语音生成器声音克隆工具

uberduck

uberduck ai,优步鸭ai唱歌软件,语音合成器

MusicGen

Meta AI 开发的开源音乐生成模型，通过文本提示词创作高质量音乐片段。支持指定音乐风格、节奏和乐器，可在浏览器中直接体验。

Blogcast

Blogcast - AI音频生成

AIVA

AI 古典音乐作曲，从生成小型乐曲到电影配乐。

Soundraw

AI 音乐生成器，可自定义长度、风格和情绪。

Muse AI

Muse AI 是 Suno 和 AIVA 之外的另一个 AI 音乐选择。它的定位更偏「创作辅助」而非「全自动生成」——你给出哼唱片段或旋律，AI 补全编曲和配器。免费版每月 5 次生成，Pro 版 $14/月 100 次。和 Suno 比，Muse 的控制力更强，可以指定 BPM、调性和乐器；和 AIVA 比，它的入门门槛更低。适合想创作音乐但不是科班出身的人。

Veed AI Voice

https://www.veed.io/tools/t...

Stable Audio

Stability AI 在图片和视频之后，终于把手伸进了音频领域。Stable Audio 用文字描述生成音乐和音效，2025 年更新了 2.0 模型，生成质量大幅提升——能产出三分钟以上的完整曲目，结构有起承转合，不是那种十几秒就断掉的实验品。输入 "90s hip-hop beat with a melancholic piano loop"，出来的东西像模像样。它支持的风格覆盖电子、摇滚、古典、嘻哈、氛围音乐，还能指定 BPM 和调性。最实用的功能是音效生成——敲键盘声、雨声、引擎启动声，输入即出，比去音效库翻半天快得多。免费版每月 20 次生成，付费版 $12/月 500 次。和 Suno AI 比，Stable Audio 更偏"工具"属性——生成的是素材而非成品歌曲；Suno 更像"音乐创作者"，直接出带人声的完整歌曲。和 Mubert 比，Stable Audio 的生成质量更稳定，但 Mubert 在和视频编辑软件的集成上更成熟。适合视频制作者、播客主、独立游戏开发者——需要背景音乐和音效但请不起专业配乐的人。

TextToSpeech在线文本转语音

网站完全是基于微软文本转语音的接口开发的，目前还可以免费使用，页面简洁无广告，主要的是单次生成内容不限字数实在是太强大了。作者最近功能更新的很频繁，新增了自定义多音字，短句，试听功能，还优化了模仿和感情，如果你会一点SSML的话，完全可以自己编辑出各种场景各种对话的音频。而且！这个工具是网站形式的，不限制使用工具。电脑，手机，平板，只要浏览器内打开就可以使用，非常方便。适用与小说推文，视频配音

AI speaker

AI speaker - AI工具集工具介绍与使用指南在AI技术快速发展的今天，AI speak

GPT-SoVITS在线一键语音生成合集(modelscope平台)

该页面展示了作者用GPT-SoVITS项目生成了十几个网络人物的声音，例如AI电棍、AI丁真、AI孙笑川、AI星瞳、AI扇宝等

AI在线一键语音生成合集（Bert-VITS2）

在线一键语音生成网站合集，方便选择不同角色，进入网站即可看到所有生成模型，选择角色后即可生成语音，输入内容，点击生成，可调整生成结果

Ondoku

一个在线合成的网站，支持各国语言的配音，支持语音和语速调节，最重要的网站风格非常小清新。网站有中文，声库也有中文。语音里有大家最爱的xiaoxiao。可以商用，但是有些限制，具体请在https://ondoku3.com/zh-hans/post/terms-licence/查看。

微软有声内容创作（文字转语音）

可以在线使用微软有声内容创作（文字转语音）服务，可以试用精简版有声内容创作晓晓、云希、云健、晓伊等AI声音网址：https://speech.microsoft.com/audiocontentcreation

冬瓜配音-免费文字转语音-ai在线配音生成器

冬瓜配音-免费文字转语音-ai在线配音生成器 - AI工具集工具介绍与使用指南在AI技术快速发展

声咔AI配音-智能语音合成声音克隆平台

声咔AI配音-智能语音合成声音克隆平台 - AI工具集工具介绍与使用指南在AI技术快速发展的今天

AI智能配音

>>该分类全部工具

rvc变声器

rvc变声器,模型下载分享,基于...

制片帮

制片帮,悦音配音,音分轨,人声...

魔音工坊

魔音工坊,ai免费配音网站,配...

悦音配音

悦音配音,AI软件配音媲美真人...

微软配音

微软配音,微软tts ai文字转语音合成助手工具软件

讯飞智作

讯飞智作,科大讯飞ai配音软件...

vits

vits模型下载,语音合成训练,...

WellSaid

面向企业的 AI 配音平台，声音稳定一致，适合培训视频和内部内容。

PlayHT

AI 语音生成平台，声音逼真度在同类工具中排名靠前。

Typecast

AI 语音和虚拟人视频平台，声音带情感变化，适合故事讲述。

Listnr

AI 配音工具，支持 900+ 种声音，可生成音频嵌入网页。

Peech

Peech 是一个 AI 文字转语音朗读器。上传文章、PDF、网页链接，AI 朗读出来，支持 50+ 语言和 200+ 自然语音。免费版每月 10 万字，付费版 $9.99/月 100 万字。和 Speechify 比，Peech 的语音更自然；和微软大声朗读比，它的格式兼容性更好。适合通勤路上听文档和文章的人。

PollyReach

为AI语音代理分配号码实现电话销售客服等任务自动化。

Lovo

AI 语音与视频生成平台，带口型同步功能，适合做虚拟人视频。

MotionSound

MotionSound是一款智能、专业、轻量化的AI智能生成语音生成工具。基于业界领先的深度神经网络技术，提供流畅自然的语音合成服务，让人机沟通更自然、便捷。

Vibe Coder

Deepgram开源语音编程VS Code扩展，用语音指令跟AI编程助手交互

Narration Box

Narration Box 是网页端的 AI 配音工具，主打 700+ 种声音选择。输入文字选好声音，直接生成配音下载。支持 SSML 标记精确控制语速、停顿和重音。付费模式灵活——充值制，按字符计费，用多少充多少，没有过期时间。适合做有声书和视频配音的创作者。

Beepbooply

AI文字转语音平台，提供自然逼真的AI语音合成

TTSMaker 马克配音

TTSMaker（马克配音）是面向国内用户最友好的免费文字转语音工具之一。支持 100+ 种语言和 300+ 种声音风格，中文配音质量在免费 TTS 工具中属于第一梯队——不会像某些免费 TTS 那样有明显的机械感。界面简单，粘贴文字选声音就能导出 MP3，不用注册。免费版每周 20000 字符（约 10 分钟），付费版 ¥19/月起无限使用。跟 Speechify 比，TTSMaker 的中文语音质量更好但英文不如；跟 Edge TTS 比，声音选择更多且可以直接商用。适合做短视频配音、有声内容制作的国内创作者。

Speechify

Speechify 是全球用户量最大的 AI 文字转语音工具，核心场景是把文章、PDF、电子书转成自然的人声朗读。它的声音质量远超系统自带 TTS——有多位名人授权的 AI 声音（包括 Snoop Dogg 和 Gwyneth Paltrow），支持 30+ 种语言，可以 9 倍速播放。浏览器插件能一键朗读任何网页。免费版提供 10 种标准声音，Premium $11.58/月解锁全部。中文语音质量一般，主打英文。跟 NaturalReader 比，Speechify 的 App 体验和浏览器集成更好；跟 ElevenLabs 比，Speechify 偏消费级朗读，ElevenLabs 偏专业级语音合成。适合有大量阅读需求的学生、研究者和通勤族。

MetaVoice Studio

MetaVoice Studio是一款提供自定义语音剪辑服务的工具，用户可以上传声音文件或录制自己的声音来创建个性化的语音剪辑。

Lovify

Lovify Lovable.dev增强插件

OpenAI.fm

OpenAI.fm OpenAI语音模型演示

Vapi

面向开发者的语音AI代理构建平台，灵活API和企业级可靠性

AI语音识别

>>该分类全部工具

otter

otter ai,免费多人语音识别和音频转录文字工具,翻译,听写,app

whisper

whisper,github,openai推出的自动语音辨识模型

AssemblyAI

AI 语音识别和理解 API，支持语音转文字、内容审核、说话人识别和情感分析。开发者友好，提供实时流式接口和预训练模型。

Deepgram

企业级 AI 语音识别 API，提供高精度实时和异步转写服务。支持 30+ 种语言，专为电话录音、会议转录和媒体字幕场景优化。

Azure Speech

微软Azure AI语音服务实时语音转文字和翻译。

依图语音开放平台

依图科技旗下的AI语音开放平台，提供语音识别和合成服务

Google Speech-to-Text

Google云AI语音识别支持125种语言高准确率。

Speechmatics

企业级AI语音识别在各种方言口音下保持高准确率。

TextToSpeech

TextToSpeech — 来自AI语音识别分类的实用 AI 工具推荐

Amazon Transcribe

AWS AI语音转录服务自动生成时间戳和说话人标签。

Rev AI

AI语音识别API为开发者提供高精度实时转录。

HuBERT

Meta出品AI语音理解模型，自监督语音表示学习，语音识别和分类。

Whisper (OpenAI)

OpenAI 开源语音识别模型，99% 准确率支持 100+ 语言

VoiceBase

AI语音识别和分析平台，实时语音转文字和声纹识别分析工具。

IBM Watson Speech to Text

IBM Watson Speech to Text — AI 智能工具，提升工作效率

百度语音识别

百度语音识别是值得推荐的 AI 智能工具，帮你提升工作效率

Google Cloud Speech-to-Text

Google 云端语音识别服务，支持 125 种语言

讯飞语音识别

讯飞语音识别是值得推荐的 AI 智能工具，帮你提升工作效率

Voci

Voci 是值得推荐的 AI 智能工具，帮你提升工作效率

Krisp AI

Krisp AI 是值得推荐的 AI 智能工具，帮你提升工作效率

DeepSpeech

Mozilla出品AI语音识别引擎，开源离线语音转文字解决方案。

讯飞输入法

科大讯飞AI语音输入法，语音识别准确率领先，支持多语种语音输入。

Wav2Vec

Meta出品AI语音识别模型，自监督学习语音表示，高精度语音转文字。

思必驰

中国AI语音识别平台，提供智能语音交互、语音合成和自然语言处理技术。

AI语音克隆

>>该分类全部工具

悟声 AI（Reecho）

全球排名第一的AI语音克隆与合成平台，3秒极速克隆任何人声，支持30+语言，音质自然度业界领先。

Altered

AI语音变声和合成工具，专业的语音转换和配音制作平台

Kits AI

Kits AI 是面向音乐人的 AI 语音工具集，核心功能包括：AI 声音克隆（录几句就能生成你的 AI 歌声）、AI 声音转换（把男声 demo 转成女声）、AI 和声生成。很多独立音乐人用它快速做 Demo——自己唱一遍，转成几种不同的声音测试效果。免费版每月 15 分钟。跟 ElevenLabs 比，Kits 更偏音乐而非配音；跟 Voicemod 比，更偏录音室级别。适合独立音乐人和制作人。

ChatTTS

ChatTTS - AI语音克隆

Musicfy

Musicfy 用 AI 让任何人唱歌。录一段自己的清唱，AI 把声音转换成预设的 AI 歌手音色——包括一些"AI 名人声音"（需注意版权）。还有 AI 翻唱功能：上传一段音频，AI 用另一个 AI 歌手的声音重唱。免费版每月 3 次。跟 Kits AI 比，Musicfy 更偏趣味性而非专业音乐制作；跟 Voicify 比，声音库更丰富但转换质量略逊。适合想在社交媒体上玩 AI 翻唱的普通用户。

Voicebox (Meta)

Voicebox (Meta) — AI 智能工具，提升工作效率

Resemble AI

AI 语音克隆工具，几分钟录音就能生成逼真的数字声音。

All Voice Lab

All Voice Lab - AI工具集工具介绍与使用指南在AI技术快速发展的今天，All V

光语金帆

金融领域AIGC产品

Revoicer

Revoicer 是值得推荐的 AI 智能工具，帮你提升工作效率

Respeecher

好莱坞级别语音克隆引擎，为影视和游戏提供声音替换方案。

GPT-SoVITS在线一键语音生成合集(modelscope平台)

该页面展示了作者用GPT-SoVITS项目生成了十几个网络人物的声音，例如AI电棍、AI丁真、AI孙笑川、AI星瞳、AI扇宝等

光语慧医

AI私人医生

CosyVoice

阿里出品AI语音克隆工具，零样本语音合成和情感语音生成平台。

Wav2Lip

AI唇形同步工具，根据语音自动生成匹配的人脸唇形，适用于视频配音。

VALL-E

微软出品AI语音克隆模型，仅需3秒音频即可克隆任何人声，实现自然语音合成。

Overdub by Descript

Descript内置的AI语音克隆功能，用文字编辑直接修改录音。

MegaTTS

AI语音合成引擎，多风格多语言文本转语音，支持情感和语速控制。

Fish Speech

开源AI语音合成模型，高质量文本转语音，支持中文多风格语音生成。

Tortoise TTS

AI语音合成模型，高保真文本转语音，情感表达和声音克隆的TTS方案。

LipSync

AI语音口型同步工具，上传音频自动生成匹配的口型动画和面部动作。

Bark

AI文本转语音模型，支持情感表达、非语言声音和音乐的自然语音合成。

CereVoice

AI语音克隆与个性化TTS引擎，支持情感表达和语速控制

Coqui.ai

Coqui.ai - AI语音克隆

AI语音分离

>>该分类全部工具

TME Studio

TME Studio,腾讯音乐推出的一...

Lalal.ai

AI 音轨分离工具，可从音频和视频文件中分离人声、伴奏、鼓点、贝斯等不同音轨。支持多种音频格式，高精度 AI 处理音质损失极低。

TME Studio在线音乐创作助手

TME Studio在线音乐创作助手 - AI音乐创作工具，智能作曲轻松创作音乐

Spleeter

Deezer开源AI人声分离，快速将音乐分离成独立音轨。

UVR5

UVR5（Ultimate Vocal Remover 5）是目前最强的免费开源人声分离工具。和 Moises/LALAL.AI 不同，UVR5 需要本地安装，但换来的是更干净的分离效果和完全免费。它能把一首歌分成人声、伴奏、鼓、贝斯等多个独立音轨，支持多种 AI 模型针对不同场景优化。DJ 做 Remix、视频创作者找干净背景音乐、K歌爱好者做伴奏带的刚需工具。完全免费开源，需本地 GPU（NVIDIA）。跟 Moises 比，UVR5 的分离质量更高但需要部署和显卡；跟 LALAL.AI 比，UVR5 免费且可批量处理但上手门槛高。适合有显卡的音乐制作人、DJ 和技术爱好者。

lalal.ai提取人声

从任何音频中提取人声、伴奏和各种乐器基于世界上最先进的人工智能技术的高质量音轨分离器

易我人声分离

易我人声分离 - AI工具集工具介绍与使用指南在AI技术快速发展的今天，易我人声分离作为一款专注

Demucs

Facebook开源AI音轨分离模型，高质量分离效果。

vocalremover人声分离

以去人声来说，只要导入音乐档案，等候约1~2分钟就能完成，完成后可以看它将音乐跟人声分成二个轨道，你可以自行调整二者的音量后再下载为新的文件，左侧栏还有去人声、分离器、变调器、调BPM查询器、剪辑器、合并器、录音、卡拉OK

Vocal Remover AI

AI在线人声分离工具，免费从歌曲中提取人声和伴奏的智能音频处理工具。

iZotope RX AI

AI音频修复工具，专业级降噪修复和人声分离的行业标准工具。

Splitter AI

AI音频分轨工具，自动分离歌曲中的人声和乐器的在线工具。

EZstems

一键分离人声和伴奏的在线AI工具，支持多种音频格式上传。

PhonicMind

AI人声分离工具，从音乐中提取纯净人声。

Splitter.ai

在线AI音轨分离，从歌曲中分离人声和伴奏。

MVSEP – 音乐与语音分离网站

这是一个声音分离的网站，可以上传您选择的歌曲，并利用目前可用的所有声音分离 AI模型进行处理

MDX23声音分离，一键安装包

MDX23声音分离 - AI语音分离工具，智能分离人声和伴奏

SpleeterGUI 人声分离软件

广告这是作者网址：https://makenweb.com/SpleeterGUI最新版2.9.4，大概613MB大小，2.9.4版本删除了预训练模型（这些模型将在您使用应用程序时下载）。以下是搬运阿里云SpleeterGUl_V2.9.2：https://www.aliyundrive.com/s/YwE2FBcM9AmV2.9.1：https://www.weidown.com/yi

Audiostrip

多功能在线音频分离平台，支持人声、乐器、音效一键拆分。

X-Minus Pro

俄语区流行的AI音频分离工具，擅长处理复杂编曲。

LALAL AI

AI人声和伴奏分离工具，高精度音频分离提取和音质修复。

AutoVP

AI人声分离工具，自动分离歌曲中的人声和伴奏，支持批量处理。

Acapella Extractor

专注人声提取的AI分离工具，主打纯净无背景残留。

Songmast

在线母带处理与音频分离一体工具，一站式音频后期。

AI音乐空间

>>该分类全部工具

Mubert

Mubert ai,文字生成bgm背景音乐软件工具网站

Boomy

Boomy,在线ai音乐创作生成工具,几秒钟内创建自己的原创音乐

ACE Studio

ACE Studio,ace虚拟歌姬,虚拟歌手音乐合成软件app

soundful

soundful,ai音乐制作软件,一键生成免版权的背景音乐

BeatBot

BeatBot,ai音乐生成,输入文本提示快速生成歌曲和音乐

soundraw

soundraw,ai音乐作曲生成器自由定制,创作

voicemod

voicemod智能变声器实时语音转换

musiclm

musiclm,google出品输入文本即可生成保保真音频音乐的ai工具

AIVA

AIVA ai,ai作曲,音乐创作软件,人工智能虚拟歌手

tuneflow

tuneflow,新一代智能音乐创作工具,ai音乐软件

vocaloid

vocaloid AI语音合成虚拟歌姬

bgm猫

bgm猫,ai一键生成视频/播客配乐和片头音乐

Jukebox

Jukebox,OpenAI发布的自动点唱机,在音乐类型和风格范围内生成音乐

Udio

Udio 是 2024 年最让人惊喜的 AI 音乐生成器，由前 Google DeepMind 研究员创立。跟 Suno 一样输入文字就能生成歌曲，但 Udio 在音质和音乐性上明显更胜一筹——人声更自然，编曲层次更丰富，不会有"罐头音乐"的塑料感。Remix 功能允许在已有旋律上做变奏，对音乐人有实际创作价值。免费版每月 1200 积分（约 30 首），标准版 $10/月。目前以英文歌为主，中文歌曲还处于早期阶段，发音偶尔不准。跟 Suno 比，音质更好但生成稍慢；跟 Stable Audio 比，Udio 侧重完整歌曲而非纯伴奏。适合音乐创作者找灵感和内容创作者做背景音乐。

Suno

AI 音乐生成平台，支持通过文本提示词生成完整的歌曲，包含歌词、旋律和伴奏。提供多种音乐风格选择，几分钟内即可创作专业品质的音乐。

Brain.fm

AI功能音乐平台，科学设计的音乐帮助专注放松和睡眠

AISong

AI音乐歌曲生成AI工具，输入歌词或主题一键生成完整歌曲

MusicFX

MusicFX 是 Google DeepMind 推出的 AI 音乐生成实验，基于 MusicLM 模型。用文字描述你想要的音乐风格——"90 年代港风流行，有萨克斯和电吉他"——它生成两段 30 秒的音乐片段。跟 Suno/Udio 不同，MusicFX 不做"歌曲"（没有人声），而是做纯器乐段落和背景音乐。完全免费，在 AI Test Kitchen 上可用。跟 Suno 比，MusicFX 更偏氛围音乐和背景配乐；跟 Stable Audio 比，MusicFX 的音质上限更高但控制参数更少。目前最大的限制是每次只能 30 秒且不能指定音调。适合找灵感的音乐人和需要免版权背景音乐的内容创作者。

Cassette

AI音乐创作工具，从文字描述生成音乐

Musick.ai

创作各种流派的高品质原创音乐。用户友好的界面、节省时间的功能、人工智能过滤器、情绪模板和交互式交付。

音疯

音疯是昆仑万维最新推出的一个AI音乐创作平台，只需输入歌词即可生成完整专属歌曲。音疯支持添加参考音乐、录制旋律动机，让AI可以基于你的喜好和灵感进行创作！

唱鸭

唱鸭是什么？唱鸭，是一款...

网易天音

网易天音 - AI工具集工具介绍与使用指南在AI技术快速发展的今天，网易天音作为一款专注于AI工

Seed-Music

字节跳动开源免费，精细控制音乐生成旋律和弦节奏和每个音符细节参数

AI虚拟歌手

DiffSinger

开源 AI 歌声合成引擎，基于扩散模型，输入乐谱和歌词即可生成自然细腻的人声歌唱，支持多语言和多音色定制。

OpenVoice

MyShell 开源的 AI 语音克隆工具，只需短时间参考音频即可克隆说话和唱歌音色，支持情感控制和多语言零样本克隆。

So-VITS-SVC

开源 AI 歌声转换工具，可学习任意音色并对音频进行音色替换，在虚拟歌手和翻唱创作社区广泛使用，效果极佳。

Synthesizer V

Synthesizer V - AI虚拟歌手

Piapro Studio

Crypton官方出品的歌声编辑工作站，深度适配初音未来等声库。

网易云音乐X Studio

网易云音乐 X Studio 是全球首个 AI 歌声合成平台，由网易云音乐和小冰联合推出。跟传统的 TTS 不同，X Studio 生成的不是"朗读"而是"演唱"——你把歌词和旋律输入进去，选择一位 AI 歌手，它用接近真人的音色和情感把歌唱出来。AI 歌手的音色库覆盖流行、民谣、古风等多种风格。免费使用。跟 ACE Studio 比，X Studio 的歌手声音更多样、社区生态更好（用户分享作品）；跟 Synthesizer V 比，X Studio 的上手门槛更低、中文歌曲效果更自然。适合音乐创作者做 Demo、独立游戏开发者做 BGM 演唱和翻唱爱好者。

ACE_Studio

ACE Studio是时域科技旗下的AI歌声合成引擎，支持Android和iOS系统。Windows和macOS版命名为「ACE Studio」。ACE Studio的特色功能包括：声线混合：使用声线混合，从丰富的声线种子中混合制造全新的理想声线，让不可能变得轻而易举。新一代AI人声合成引擎：我们使用毫不妥协的全流程AI技术，在不断追求提升声线自然度与演唱表现力的同时，也将合成速度不断推向极致。众

Covers AI

AI歌曲翻唱生成工具，AI替换原唱声音，生成个性化翻唱版本。

Vocaloid 6

雅马哈出品的AI歌声合成引擎，输入旋律和歌词即可生成逼真的人声演唱。

X Studio · 虚拟歌手

X Studio（简称XS）是北京红棉小冰科技开发的语音合成软件，支持Windows、macOS系统。它提供了各种音色的虚拟歌手，他们能迅速读懂乐谱，并像人类歌手一样，自然地演唱出来。全新升级的AI歌手随时在线，输入曲谱，即刻演唱。更多亮点等你体验：● 3秒超快成曲：全新流式渲染歌声合成技术，一键秒速成曲● 歌手丰富：十余位各具特色的歌手，可以满足创作者不同音乐风格、不同场景的需要 ● 支持参