微软推出NaturalSpeech2语音模型：零样本生成唱歌唱歌_西江热线

微软推出NaturalSpeech2语音模型：零样本生成唱歌唱歌

发布时间：2023-07-28 16:46:49 文章来源：中关村在线

微软近日推出了一款名为NaturalSpeech2的语音模型，该模型采用“潜在扩

(资料图)

微软近日推出了一款名为NaturalSpeech2的语音模型，该模型采用“潜在扩散”式设计，其在零样本语音合成层面的效果显著。微软表示，该模型提供了“商业级”的语音/歌唱解决方案，能够为用户提供高质量、多样化的语音合成体验。微软对NaturalSpeech2进行了一系列演示，展示了其在零样本情况下生成具有不同说话人身份、韵律和风格（如唱歌）的语音的能力。与传统的语音转文字（TTS）系统不同，NaturalSpeech2使用“连续向量”取代“离散标记”来表示语音，从而生成更完整的语音片段，不会产生“缺乏感情”的“棒读（一字一顿地讲话）”现象。实验结果显示，NaturalSpeech2在零样本条件下生成的语音与语音提示和真实语音的韵律近乎一致，并且在LibriTTS和VCTK测试集上的自然度（以CMOS为度量）与真人语音难以区分。该项目的论文已经发布，感兴趣的人可以查阅。

标签：

资讯播报

乐活HOT

曝光！景德镇15家社会单位存在火
曝光！景德镇15家社会单位存在火灾隐患
小威廉姆斯横空出世！用手肘传球
而他早在2011年就选择了退役，时隔6年，本来以为NBA的球场上再也不会出
中国男篮的外线命中率有所提升
中国男篮迎来了海外热身赛的第一场胜利，他们以80比69击败埃及队。这场
芸帙经眼录之合肥沈用熙《沈石坪
笔者所藏《刘壮肃公祠碑》拓本安徽省博藏《沈石翁书刘壮肃公御制碑
最高检发布惩治危害国防利益、侵
今天（7月28日），最高人民检察院发布9起依法惩治危害国防利益、侵犯军
广铁今日部分线路逐步加开列车
记者从广铁集团了解到，台风“杜苏芮”登陆后，铁路部门预计于7月28日1
AEKE“轻力量”家庭智能健身房--
在国家“全民健身”战略的推动下，国民的健康意识日益增强。在互联网智
河南许昌载有33吨危化品的运输车
7月26日上午，在河南省许昌市禹州市，一辆载有33吨纯苯的危化品运输车
安科生物：7月27日融资买入1207.
7月27日，安科生物（300009）融资买入1207 63万元，融资偿还495 2万元
港股大反弹真要来了？350亿基金
7月27日凌晨，美联储宣布将联邦基金利率的目标区间上调至5 25%到5 50%

娱乐LOVE

精彩推送

友情链接:

关于我们网站律师版权声明广告刊登联系邮箱：51 46 76 11 3 @qq.com

Copyright © 1999-2020 www.xjrb.net All Rights Reserved

浙ICP备2022016517号-11