AD
首页 > 头条 > 正文

和手机聊天,和汽车聊天-科技频道-金鱼财经网

[2021-02-21 19:46:32] 来源: 编辑:wangjia 点击量:
评论 点击收藏
导读: 全新的语音智能生活来了“早上9点提醒我出门去机场”,说完这句话你就可以忙其他的事儿去了,如果你在出差前,对外地的天气不放心,你还可以问你的手机:“我去北京要带伞么?”你的手机会基于互联网上获得的北京

全新的语音智能生活来了

“早上9点提醒我出门去机场”,说完这句话你就可以忙其他的事儿去了,如果你在出差前,对外地的天气不放心,你还可以问你的手机:“我去北京要带伞么?”你的手机会基于互联网上获得的北京天气预报告诉你:“我想不用。”

你还可以用说话的方式告诉你的手机拨打通讯录上电话号码,或者发短信时说出要发送的内容,这就是智能语音给我们生活带来的变化。

2015年3月,电商市场的两个老对手——阿里和京东又在语音识别领域展开新一轮的交锋。 先是3月4日,科大讯飞(002230,股吧)与京东签署投资合作协议,联手在智能家居和语音技术领域展开全面合作。随后,阿里巴巴旗下的神马搜索在11日宣布,近日与云知声达成战略合作,将共同探索语音搜索创新,以满足智能移动硬件设备用户需求。

从苹果公司推出了第一个基于移动智能设备的语言助理Siri到现在,已经过去3年,3年中,语音智能技术的发展速度让人瞠目结舌。Siri的竞争对手也频频出现,包括微软、谷歌等科技巨头都在大力发展自己的智能语音产品。近日,Companies and Markets的评估报告称,未来全球语音识别市场将会变得更加多样化,同时软件准确度上会有大幅提升。预计在2017年以前,这一块的市场将达到1330亿美元。

“2014年语音搜索的使用量已经超过了10%,在未来5年内语音搜索将超过文字搜索”,百度CEO李彦宏这样表示。

未来,我们每个人身边都有一个会说话的机器人,他会将你的工作和生活规划得井井有条,出国时还能做你的专职翻译。回家之后,他又摇身变成贴心管家,帮你开灯、关灯,调节空调和热水器的温度。不但如此,他还会给你讲最新的笑话,唱歌,甚至和你“谈恋爱”,过去科幻小说里才有的情节就要上演了。总而言之,说话是人类最自然的交流方式,机器或许永远不会像人一样去活着,但机器可以变得越来越善解人意。

家居、汽车、医疗、同声翻译 , 语音技术无处不在

智能家居

躺在床上想关灯睡觉,但是太冷不想下床怎么办,你可以掏出手机告诉它,“关灯吧”。苹果公司推出的Apple HomeKit技术可以通过整合iPhone、iPad以及iPod touch上的Siri之后,方便地控制相应的家庭设备。用户可以创建个性化的指令来控制一系列家庭设备,比如关灯、锁门、关闭车库门甚至将恒温器调整至适宜的温度。

这种全新的智能家居产品就要来了。3月19日,海尔对外宣布将在今年4月份正式发布接入HomeKit 的智能空调产品,允许iPhone、iPad和iPod touch用户通过语音或是APP发出指令进行控制。虽然暂时只有空调,但相信未来会有越来越多的类似语音智能家电诞生。

苹果的竞争对手也纷纷出现,3月4日,科大讯飞与京东集团宣告双方将成立一家合资公司并且双方签署了一份《投资合作协议》,拟共同筹资1.5亿元成立讯京信息科技有限公司,重点专注智能家居业务的拓展。新的公司致力于智能家居硬件产品、语音解决方案及智能硬件平台服务的研发和推广,并打造可连接智能应用链的热点产品,让语音智能生活体验进入百姓家。

随后,科大讯飞于3月13日在深圳举行主题为“远场识别良辰可待”的远场识别技术发布会,远场识别技术对外亮相发布,超过5米的远场识别距离大幅突破了现有国内语音交互距离瓶颈,可抵御复杂噪音,进行远距离、高精度的语音识别。这意味着,也许未来我们控制智能家居不需要掏出手机,只要朝这你需要控制的电器说话就可以,这无疑是技术上的有一次重大进步。

智能汽车

百度把语音技术带上了智能汽车产品,1月27日,百度推出全新车联网解决方案百度CarLife,这也是我国首个跨平台车联网解决方案,将兼容多种操作平台。百度已和奥迪、现代、上海通用三家汽车厂商签订了车联网方面的战略合作协议。百度方面介绍,CarLife能够为用户提供业界最准确的路线规划、地点查询、路程估算,帮助用户查找目的地避开拥堵,能随时随地更新地图数据。同时,CarLife还拥有实时停车位查询、停车定位记录、电子狗、实时路况、室内外无缝导航、Handsfree人机对话系统等等。

百度首席科学家吴恩达对外表示,百度的语音识别系统——百度Deep Speech,在噪音环境中(比如汽车内和人群之中)的表现更为突出。CarLife的语音技术和深度学习技术包含有世界领先的机遇人类听觉的cnn+dnn+lstm的语音识别技术与能够提供10万小时混合噪音训练的DNN训练平台,使其更符合汽车平台的应用要求,至少你的汽车不会总和你抱怨:“对不起,我听不清楚”了。

3月11日,阿里巴巴和云知声的合作,也被认为是为即将出现的阿里汽车做铺垫,目前云知声平台已应用于不少移动可穿戴、车载导航设备,双方的合作未来很可能会扩展到智能硬件领域。事实上,此前云知声已经为阿里云提供语音技术识别。

可穿戴设备

而智能语音产品也将出现在可穿戴设备上,整合了Siri功能的Apple Watch就是现阶段出现的最大杀器,未来的智能手表或许都将带上语音识别功能。

如果觉得和手表说话太傻了,或者腾不出手来,那也没关系,试试微软亚洲研究院在安卓系统上推出的Torque,它不但能听懂你说话,还能读懂手势,当你在车来人往的街头,双手被刚刚逛街购买的“战利品”所占据时,轻轻扭动手腕,Torque就能轻松帮你找到周围适合歇脚的咖啡馆。

智能医疗

前一段时间,Siri的技术的发明者,世界上第一家上市的语音识别公司Nuance在其官方博客上,公布了将发力医疗领域的消息。不仅是简单的通过智能手表追踪运动情况和心率,还有直接根据人的身体状况匹配相应的服务如合适的餐厅或食物等,当然这些大多是基于可穿戴设备的。另外他们还考虑到更多场景,诸如紧急语音求助,医患对话存档,呼叫中心的对话听写等。由于医疗领域词汇库专业性强演变性弱,只要建立完整的数据库,就可以做到对疾病名称、药品名称相对精确的识别。国内类似的应用如病历夹与珍立拍,为医生提供一个安全存储病历资料的云空间,方便查找病例,同样支持语音搜索功能。

同声传译

如果你去一个语言不通的国家,想和人交流也是大麻烦。语音交互系统还能成为你的专职翻译。就在去年,微软为 Skype 增加了实时语音翻译功能,并且在同声传译上,Skype看似击败了99.9%的地球人。进入2015年,微软把同声翻译功能加入了其语音智能助手小娜,如果你去了法国,只要用语音提示小娜:“开启法语模式”,小娜就会自动成为你的同声翻译,将你要说的话用法语转述给对方,并将对方的回答翻译成中文告诉你。

就在一个月前,Google Translate实时语音翻译系统也正式上线,它能识别用户的语言,并自动转换成相应本文和语音。而现在,这款“近乎完美”的实时语音翻译系统已正式上线,iOS和安卓版本也都已推出。最新版本支持大众化语言的语音翻译,可以转换成 90种书面文字,速度相比以前也更快。同时,Translate 拍下某个标志或者菜单等上面的文字,系统也能进行识别,并翻译成用户需要的语言,和外国友人进行交流时,方便极了。

觉得闷了,和郭德纲聊天吧

“前方经过火车道口,撞不过火车的请避让……”

“前方经过村庄,村里有小芳。”

当你正和朋友坐在车里,传来了郭德纲口音的语音导航,一定会爆发出一阵哄堂大笑。

没错儿,这是真的是郭德纲。3月13日,高德地图发布了语音导航欢笑版,提供语音导航的人就是郭德纲。进入导航界面之后,郭德纲的声音便会出现,提示用户此次导航全程路程长度以及需要的大体时间。在语音特征上,高德地图的导航语音还是非常有郭德纲本人的腔调和音色特点。

如果你不喜欢郭德纲,没关系,还有方言版,如果再不喜欢,还有林志玲呢!

在此之前, 高德就推出过明星语音播报。当时他们选的明星是林志玲,因为很多男人都很喜欢。高德对为什么郭德纲导航要晚于林志玲导航推出时是这样解释的:当时开车的男性用户多,喜欢林姐姐。现在女性用户越来越多了,会有人不喜欢。

无独有偶,这几个月百度地图也更新了明星语音包。他们签下了鹿晗等明星,就明星对比就看得出百度地图在试图争取年轻的90后用户。将来没准大家开车时,播报路况的全是自己喜欢的明星口音。

让语音设备模仿郭德纲说话,是怎么做到的呢?

根据高德地图提供的资料,郭德纲在前期为高德地图录制了千句以上的重点语句以及日常语句,然后在通过分析其声纹特点,提取相关语音特征,利用TTS语音技术合成郭德纲语音导航,就可以让“郭德纲”来朗读导航的相关内容。

相比于苹果冷冰冰的Siri,微软推出的小娜主打功能之一,就是娱乐性,一如其姐妹小冰,小娜讲笑话的时候会有语气语调,并且会在适合的地方停止,它甚至自己也会发笑。比如你让小娜说个上海话笑话,小娜就会告诉你一个关于过地铁安检时,工作人员让前面“把双肩包过一过”,然后后面阿姨往安检传送带上放了个生煎包的故事,你还可以和她对诗词,唱歌,等等。同时,小娜对视频和音乐内容的调取更敏锐,比如给它们说“我们结婚吧”,Siri完全会认为你在开玩笑,而小娜则会在开玩笑的同时询问你是不是要看韩国综艺节目“我们结婚了”。

会分析、会学习,依托大数据不断进化

“谷歌,为什么天空是蓝色的?”

Android手机只花了不到一秒钟就对这个口头问题作出回应——以一种可以让人理解但又明显自动化的音调。

“在晴朗、无云的白天,天空之所以是蓝色的是因为大气中的微粒对来自太阳的蓝色光散射能力高于红色光。”

在过去的语音系统中,你不可能获得这样的答案,语音系统会识别出你的问题后,给你罗列出一大堆未经筛选的网络搜索结果。

“人工智能应该分为交互智能,以及认知智能”,科大讯飞副总裁胡郁指出,大数据可以提高语音识别功能的IQ。“当老百姓在说他需要机器会语音识别的时候,其实包括了两个过程,一方面就是语音要被自动转化为文字,而另外一方面就是文字的意思要被正确的理解出来并且能够得到执行。”

在越来越多的产品中,被称为“智能大脑”的深度学习技术被运用于语音方面,目前正在大力研发这一技术的企业包括谷歌、微软和中国的百度。其动机在于建立、模拟人脑进行分析学习的神经网络,从而得到更智能的答案。也就是说,语音系统并不仅仅是一张会说话的嘴,其背后还有一个会分析、会思考的大脑,以及互联网上无穷无尽的大数据。今年3月,谷歌投资了Sirius,一个名字酷似Siri的项目,正做着和Siri类似的事情——个人语音助手。 Sirius的野心很大,包括了语音识别、图片匹配、自然语言处理和问答系统。

在今年,最值得期待操作系统产品就是微软的Windows10,其个人语音系统Cortana(小娜)被全面移植进了操作系统,“小娜的学习能力让人吃惊”,一位微软用户这样表示,可能她头一天还不知道的事情,第二天就能给出你正确答案。小娜的这种进化背后,也是其对大数据不断地分析和整理的结果。

微软表示,手机或电脑用户与小娜的智能交互,不是简单地基于存储式的问答,而是对话。它会记录用户的行为和使用习惯,利用云计算、搜索引擎和“非结构化数据”分析,读取和“学习”包括手机中的文本文件、电子邮件、图片、视频等数据,来理解用户的语义和语境,从而实现人机交互。

胡郁指出,即使在实验室里准确度达到了95%的水平的智能语音系统,在实际运用中的正确率被证明仅有55%左右,但随着推广使用,其准确率会不断提高。

“用户在使用这些核心技术的同时,不知不觉中已经贡献了经验和数据。采用的云计算以后,系统可以自动的学习,并且进行核心技术更新,随着使用的人群越来越多,系统的性能也提升了。”

“现在围绕互联网有很多变化,因为现在有很多的数据围绕着语音。过去,很多沟通都是通过文字,过去十年间网页就是一堆文字。如今在百度,我们看到,特别是在移动互联网领域,沟通已经变成了图像和语音。”百度首席科学家吴恩达认为,语音识别会推动物联网的革命。

查看更多:

为您推荐