AD
首页 > 头条 > 正文

百度悄然更新Deep Vioce:未来半小时学习万人声音-科技频道-金鱼财经网

[2021-02-26 03:34:29] 来源: 编辑:wangjia 点击量:
评论 点击收藏
导读: 和讯科技 10月25日消息,官方尚未发布,百度悄然发布Deep Vioce 3暨最终版。并表示,该版本可以每次只用半小时,学习2500种声音。Deep Vioce是百度在今年早些时候发布的一个新系统

和讯科技 10月25日消息,官方尚未发布,百度悄然发布Deep Vioce 3暨最终版。并表示,该版本可以每次只用半小时,学习2500种声音。

百度悄然更新Deep Vioce:未来半小时学习万人声音

Deep Vioce是百度在今年早些时候发布的一个新系统,它利用人工智能的深度学习技术,来将文本转换到语音。

刚推出第一版的时候,系统仅能够产生短句,并且声音听上去并不接近于人声。效率上,每次学习一个声音,并需要数小时来掌握数据。

到了今年5月推出的第二版,Deep Vioce 2将学习一个声音的时间缩短到一个半小时,并且一个系统可以学习数百种不同的口音。今天,该文字转语音(TTS)AI再次升级,尽管百度官方还没有宣布此事,但相关论文已经发布在arXiv上。

百度悄然更新Deep Vioce:未来半小时学习万人声音

Deep Vioce 3是基于注意力的全卷积神经TTS系统,与目前最先进的Tacotron系统相比,Deep Vioce 3训练速度提高了10倍。另外,百度在Deep Voice 3上,使用了来自超过2000个声源、长达800多个小时的音频进行训练。

事实上,百度试图在做一个可以掌握多重口音或声音细微差别的系统。虽然目前声音的数量限制于2500,但团队表示,未来版本或可以掌握1万甚至更多。

百度表示:“拥有能够有效地产生各种声音的系统,为许多不可想象的应用和打开了大门。例如,音视频游戏中的每个角色将具有自己独特的声音,以提高用户体验。我们相信,通过使用大量高质量的数据集训练附加的机器学习工程,系统质量将在不久的将来以大大增加。”

查看更多:

为您推荐