微软推出语音合成模型NaturalSpeech2

AI行业动态2年前 (2023)发布 ainavi

0 800

微软日前推出语音合成模型NaturalSpeech2，该模型采用潜在扩散式设计，可提供“商业级”语音/歌唱解决方案。在零样本情况下，该模型可以生成具有不同说话人身份、韵律和风格（如唱歌）的语音的能力。且其在零样本条件下生成的语音与语音提示，和真实语音的韵律近乎一致，并在LibriTTS和VCTK测试集上的自然度（以CMOS为度量）与真人语音难以区分。

# AI行业动态

© 版权声明

文章版权归作者所有，未经允许请勿转载。

相关文章

谷歌Gemini1.5火速上线：MoE架构，100万上下文

ainavi

1200

台积电遭攻击，黑客用数据威胁索要 7000 万美元赎金

ainavi

2000

微软正式发布AI内容审核工具Azure AI Content Safety

ainavi

2800

国内高校打造类Sora模型VDT，通用视频扩散Transformer被ICLR 2024接收

ainavi

800

牛津大学团队使用机器学习方法，来弥合量子设备的现实差距

ainavi

3600

博思云创完成A轮融资

ainavi

1601

暂无评论

暂无评论...

AI中国。找到最新的AI写作助手、图像生成工具、AI编程助手以及更多实用工具。一个站点解决所有AI工具需求，解锁无限可能！

友链申请免责声明广告合作关于我们

Copyright © 2025 AI中国粤ICP备2023063465