AD
首页 > 头条 > 正文

吴恩达:语音技术将改进人机交互的效率-科技频道-金鱼财经网

[2021-02-25 05:04:51] 来源: 编辑:wangjia 点击量:
评论 点击收藏
导读: 在语音开放平台上线三周年之际,百度宣布向公众开放四项全新的语音技术的接口:情感合成、远场方案、唤醒二期技术和长语音方案。“这些技术有很大的潜力,将彻底改变人机交互的效率和办法。未来语音技术在很多应用

在语音开放平台上线三周年之际,百度宣布向公众开放四项全新的语音技术的接口:情感合成、远场方案、唤醒二期技术和长语音方案。

“这些技术有很大的潜力,将彻底改变人机交互的效率和办法。未来语音技术在很多应用场景有很好的机会,将为人机交互带来巨大的改变。”百度首席科学家吴恩达表示。

据介绍,这些技术旨在解决用户在使用语音交互的场合时,普遍感到困扰的一些关键问题。例如,百度情感合成技术主要聚焦在为合成语音“加入情感”,目前可达到接近真人发声效果,百度今年早些时候曾利用此技术,复原已逝明星张国荣的声音。

百度情感合成技术主要聚焦在为合成语音“加入情感”,目前可达到接近真人发声效果。现场测试表明,57%的用户无法区分真人语音与合成语音。尤其是女版声音,基本可以代替妈妈,反复为熊孩子讲故事。《读者》杂志已使用百度情感语音为旗下杂志制作语音版。

类似地,开发者还可以利用新的接口,使语音识别距离增加到3—5米,将设备的语音唤醒率提升到95%以上同时更省电误报更少,或提升长时间语音识别的准确率。这将为语音技术带来远比现在更多的想像空间,而不只是遥控电视或解锁手机。

目前百度语音的识别准确度已达到97%,与近期引起业界关注的讯飞不相上下。当下,讯飞、siri、百度语音占领了我国79%以上的智能语音市场。凭借百度大脑的支持,今年百度语音还获得了麻省理工科技评出的2016年十大科技突破,是国内唯一一个入选的语音识别技术。

来自斯坦福大学的人工智能专家JamesLanday也分享了一项与百度合作的最新研究成果,该研究发现智能手机在语音输入时,输入速度比键盘输入快3倍。

JamesLanday表示,“近两年,受益于大数据和深度学习技术的不断发展,语音识别技术突飞猛进,速度及准确性都有了长足进步。”

目前,百度语音开放平台的合作方涵盖多个领域和场景,包括智能手机领域的联想、中兴;智能家居领域的长虹智能电视、康佳智能电视、SONY智能电视;汽车行业的特斯拉、途胜;智能设备领域的惠普、艾米通讯;智能服务领域的携程、手机QQ阅读等。

百度方面公布的资料显示,百度语音开放平台自2013年10月上线以来,每日在线语音识别要求从2013年的500万上升到今天的1.4亿,在线语音合成每日请求达2亿,开发者数量超过14万。

查看更多:

为您推荐