10款优秀的开源TTS语音模型推荐
作者:啊哈哈哈 来源:AI零八工具 时间:2025-01-02 10:28:01

在平时的语音合成TTS整理中,目前有许多优秀的文本转语音(TTS)模型可以推荐,以下是我整理的一些在研究和实际应用中表现突出的10款优秀TTS语音模型:
1、GPT-SoVITS
ai 卖货主播大模型Streamer-Sales销冠用的这款TTS模型,支持英语、日语和中文,零样本文本到语音(TTS)。
集成工具包:github:https://github.com/RVC-Boss/GPT-SoVITS
2、Fish Speech v1.2
效果稳定非常好,支持克隆语音。经过 30 万小时的英语、中文和日语音频数据的训练。
模型:https://huggingface.co/fishaudio/fish-speech-1.2
在线版:https://fish.audio/zh-CN/
3、字节的Seed-TTS(不开源)
支持多种语言包括英语、中文,能够进行同语言生成和跨语言生成,能处理各种文本,叙述性文本、情感表达、描述性文本等,能根据不同的情感和语境生成相应的语音。
项目:https://bytedancespeech.github.io/seedtts_tech_report/
4、ChatTTS
对话式 TTS(可多人),支持中英文,韵律细腻。
github:https://github.com/2noise/ChatTTS
模型:https://huggingface.co/2Noise/ChatTTS/tree/main
5、Parler-TTS
可以控制音调、速度、性别、噪音水平、情绪特征等等
github:https://github.com/huggingface/parler-tts
模型:https://huggingface.co/parler-tts
6、MetaVoice-1B
支持多语言,在英语处理上实现了情感语音节奏
github:https://github.com/metavoiceio/metavoice-src
7、MARS5-TTS
MARS5可以为体育解说、动漫等韵律复杂和多样化的场景生成语音
github:https://github.com/Camb-ai/MARS5-TTS
8、OpenVoice
原生支持英语、西班牙语、法语、中文、日语和韩语,具有灵活的语音风格控制和零样本跨语言语音克隆能力。
github:https://github.com/myshell-ai/OpenVoice
9、EmotiVoice
支持中英文双语,包含2000多种不同的音色
github:https://github.com/netease-youdao/EmotiVoice/blob/main/README.zh.md
10、StyleTTS2
近乎人类水平的文本转语音库,它利用风格扩散和对抗训练与大型语音语言模型 (SLM) 来实现人类水平的 TTS 合成。
github:https://github.com/yl4579/StyleTTS2
以上是我整理的10款优秀TTS语音模型,这些模型在不同的应用场景和硬件配置下各有优劣,选择合适的模型需要根据具体应用和资源进行评估。
更多资讯
热门文章
推荐对话
换一换- 人气排行
- 1 “豆包P图”火出圈AI成年轻人修图新选择
- 2 从词书到大模型,AI背词赛道大爆发
- 3 一次美国自驾,看清中美AI的差异性
- 4 3个月新增500万,微软GitHubCopilot累计用户突破2000万
- 5 刚刚,DeepSeek梁文锋NSA论文、北大杨耀东团队摘得ACL 2025最佳论文
- 6 特斯拉Robotaxi上线加州:全程由人类驾驶
- 7 高通孟樸:要把AI“装进”汽车关键在于构建强大的终端侧AI能力
- 8 每月300美元:马斯克宣布将向GrokHeavy订阅用户推出AI虚拟男友服务“Valentine”
- 9 OpenAI年收入或达到120亿美元
- 10 微软公布40个即将被AI摧毁的职业!编辑不幸中招你的职业在名单上吗

