IndexTTS2 实现零样本语音克隆:精准控制+情感解耦

IndexTTS2[1] 是一个突破性的自回归语音合成模型,能在零样本条件下实现两大核心能力:精确的时长控制,以及音色与情感的完美解耦。该模型支持包括愤怒、哭泣、恐惧、沮丧、快乐、惊讶、平静等在内的丰富情感表达。

不过目前官方只放出了演示网站和一些对比音频,期待后续能放出完整模型和代码。

NSFW Grok 推出数字伙伴

马斯克发文表示 Grok 1.1.17 版本带来了 Companions(数字伙伴)功能。更新后,用户只需在设置中向下滚动至语音部分,点击「启用伙伴」即可开启,需要 SuperGrok 订阅。

好感度系统,我只能说,老马是懂用户的。

Logo

火山引擎开发者社区是火山引擎打造的AI技术生态平台,聚焦Agent与大模型开发,提供豆包系列模型(图像/视频/视觉)、智能分析与会话工具,并配套评测集、动手实验室及行业案例库。社区通过技术沙龙、挑战赛等活动促进开发者成长,新用户可领50万Tokens权益,助力构建智能应用。

更多推荐