Loading...

微软发布 DragonV2.1 模型：AI 转录语音更自然，单词错误率平均下降 12.8%、支持合成超 100 种语言

AI前沿资讯5个月前发布 GOODNAV.NET

2.7K 0 0

GoodNav 报道，微软今日发布 DragonV2.1Neural 零次学习模型，该模型只需少量数据即可生成自然、富有表现力的语音，支持超过 100 种语言。

这款文本转语音 (TTS) 模型能够提供更自然、更具表现力的语音，提高发音准确性并增强可控性。它只需要几秒钟的语音样本就能合成超过 100 种语言的语音，显著优于此前版本 DragonV1 在专有名词发音上的不足。

DragonV2.1 模型应用广泛，例如定制聊天机器人声音和为多语言视频配音等。微软表示，该模型的单词错误率 (WER) 平均降低了 12.8%，显著提升了发音准确性。

微软发布 DragonV2.1 模型：AI 转录语音更自然，单词错误率平均下降 12.8%、支持合成超 100 种语言

# AI前沿资讯

© 版权声明

文章版权归作者所有，未经允许请勿转载。

相关文章

“新神登场”，消息称 DeepSeek-R2 AI 模型将于 3 月 17 日发布

GoodNav.net

3.7K

中国科学院青藏高原研究所、阿里云联合发布水能粮多模态推理大模型“洛书”

GoodNav.net

3.3K

2025 年，AI Agent 还会是风口吗？11 个问题揭秘智能体技术发展全貌

GoodNav.net

4.2K

AI 革新医疗：谷歌 DeepMind 首席执行官预测，十年内帮助消灭所有疾病

GoodNav.net

2.9K

消息称小鹏机器人新成立“智能拟态部”，主攻机器人多模态

GoodNav.net

2.7K

美国多所社区大学遭“机器人学生”渗透：一切行动都为了助学金

GoodNav.net

3K

暂无评论

您必须登录才能参与评论！

立即登录

暂无评论...

GoodNav - 发现优质资源网站，探索无限可能！我们精选全球设计、编程、AI、站长、游戏、工具、搜索、百科、生活、教育、娱乐等优质资源网站，助你提升效率，开启精彩网络世界！

友链申请免责声明广告合作关于我们

Copyright © 2022-2025 goodnav.net All Rights Reserved