北京时间9月28日,谷歌宣布网页及移动版的谷歌翻译在中译英的功能上已经开始使用全新的神经机器翻译系统(GNMT:Google Neural Machine Translation)。
谷歌表示,谷歌中译英的翻译功能每条要被调用18万次,为此他们还专门发表了一篇学术论文。
GNMT的工作流程此前谷歌曾宣传过一次谷歌翻译中的神经网络,但是那主要是用于实时视觉翻译功能。今年早些时候谷歌高级研究员杰夫·迪安告诉科技媒体VentureBeat,谷歌正致力于整合深度学习功能到翻译系统中。而今天谷歌的一名发言人给VentureBeat发了一封电子邮件表示GNMT正是这一成果的展示。
谷歌一直在整合深神经网络至其自家的各种应用中,包括Google Allo和Inbox,它也帮助谷歌更有效地运行其数据中心。
GNMT的基础是八层长短期记忆回归神经网络(LSTM-RNNs),“通过将字符分层并分析层与层之间的残留链接来鼓励梯度流翻译”谷歌研究人员在论文中这样写道。一旦神经网络已经与图形处理单元(GPUs)的帮助下得到充分的学习,谷歌就可以凭借其最近推出的张量处理单元(TPUs)做出关于新的数据的推论。
神经机器翻译并不总是最优的,但谷歌的执行在某些情况下已经显示出优势。
“评估显示GNMT相比我们之前的基于短语的系统,已经在很多语言的翻译上减少了60%的错误,比如英语和法语、西班牙语以及汉语的互译”研究人员在论文中写到“进一步的研究证明它越来越接近人工翻译的结果了。”在今天发布的博客里,谷歌脑团队研究的科学家Quoc Le和Mike Schuster指出翻译错误实际上下降了55%-85%“这是通过对在维基百科和新闻网站采集的主要标准化语句的翻译后,在人工翻译评估者的分析下得出的数据。”
谷歌“GNMT仍然存在一些人工翻译不会出现的显著错误,比如漏字、专有名词的混淆和稀有条款,以及虽然可以整体翻译句子但依然不是结合的上下文背景,”乐和舒斯特写道。 “我们可以做很多优化来让它更好地为人们服务。不过,GNMT已经是一个显著的里程碑。”Via VentureBeat
封面新闻记者 蔡世奇编译