Meta开源的语音大语言模型,支持语音克隆和TTS。
Meta 开源的语音 LLM,代码和模型权重全公开。和 ElevenLabs 的闭源方案比,MetaVoice 的优势是你可以本地部署、自行微调、不受 API 调用限制。目前支持英文,能克隆声音,能生成带有情绪的语音。需要一定的技术基础(Python、CUDA 环境),适合有自建 TTS 需求的开发团队。
访问官网 →
为视频和游戏提供无限量 AI 音效生成,无需担心版权问题。
面向开发者的语音AI代理构建平台,灵活API和企业级可靠性
AI 音乐生成器,可自定义长度、风格和情绪。
motionsound文本转语音 是一...
专业AI音频处理工具,支持频谱分析、音频修复和降噪。
Blogcast - AI音频生成