TechWeb报道9月26日消息,百度近日宣布其全新的深度学习开源平台PaddlePaddle在开源社区Github及百度大脑平台开放,供广大开发者下载使用。百度成为继Google、Facebook、IBM后另一个将人工智能技术开源的科技巨头,同时也是国内首个开源深度学习平台的科技公司。
继Google、Facebook后百度开放深度学习平台PaddlePaddle什么是PaddlePaddle?
Google于去年11月发布并开源了新的机器学习平台TensorFlow,供相关技术人员进行语音识别或照片识别等多项机器深度学习领域的研究;IBM几乎同步采取了行动,于去年11月底宣布通过Apache软件基金会免费为外部程序员提供System ML人工智能工具的源代码;社交巨头Facebook,继去年1月公开多款深度学习人工智能工具后,又于去年12月开源了Big Sur人工智能硬件架构。
PaddlePaddle的前身是百度于2013年自主研发的深度学习平台Paddle(Parallel Distributed Deep Learning,并行分布式深度学习),且一直为百度内部工程师研发使用。全球各大科技巨头开源的深度学习平台都极具各自技术特点,对于百度,由于其自身在搜索、图像识别、语音语义识别理解、情感分析、机器翻译、用户画像推荐等多领域的业务和技术方向,PaddlePaddle则表现更加全面,是一个相对全功能的深度学习框架。今年9月1日百度世界大会上,百度首席科学家Andrew Ng(吴恩达)首次宣布将百度深度学习平台对外开放,命名PaddlePaddle。有趣的是,Andrew Ng认为PaddlePaddle比Paddle更容易被大家所记住,后来事实证明也的确如此。
PaddlePaddle与TensorFlow会带来什么?
以往,只有像谷歌、百度、Facebook这些大公司有足够的人力、物力、财力去搭建深度学习、神经网络,只有各大公司的技术人员才有机会研究使用,绝大多数的技术人员接触不到, 闭门造车 并不利于人工智能、深度学习的发展。如今,谷歌、百度都将自己的深度学习平台开放,让过去那些有能力却没有机会使用的深度学习的技术人员去研究,去探索,集众人之力,优化深度学习算法和模型,加快该领域的发展。如今,语音、图像、自动驾驶等新兴技术的核心都是深度学习,他的发展进程也直接影响这些技术的进步与发展。
百度资深科学家、PaddlePaddle研发负责人徐伟介绍: 在PaddlePaddle的帮助下,深度学习模型的设计如同编写伪代码一样容易,设计师只需关注模型的高层结构,而无需担心任何琐碎的底层问题。未来,程序员可以快速应用深度学习模型来解决医疗、金融等实际问题,让人工智能发挥出最大作用。
PaddlePaddle能做什么?
目前,PaddlePaddle已在百度30多项主要产品和服务之中发挥着巨大的作用,如外卖的预估出餐时间、预判网盘故障时间点、精准推荐用户所需信息、海量图像识别分类、字符识别(OCR)、病毒和垃圾信息检测、机器翻译和自动驾驶等领域。以外卖行业为例,外卖员等待商家出餐的时间耗时严重,百度将不同时段商家的客流量、菜品的制作时间和订单量等数据交给了PaddlePaddle,经过对海量数据的深度学习处理,如今,百度外卖的内部系统可以预估每个商家菜品出餐时间,及时告知外卖员,提高了送餐效率,系统也可以更加合理地规划取餐和送餐的路线。
早在今年1月份,百度便将可让人工智能软件运行更高效的关键代码Warp-CTC开源。该代码可直接用在当前的人工智能框架中,不仅比传统CTC训练速度快百倍,还大幅降低了对硬件的要求,缩短了研发的周期,让端到端的深度学习变得简单、快速。
据透露,9月底百度还将发布PaddlePaddle的新版本,将全面支持Mac操作系统、以及Cuda8.0和GCC5.4的支持,同时进一步优化了安装过程,帮助更多开放者更好地 上手 。未来,百度还将开放更多在深度学习、人工智能等方向的技术成果,供全球开发者使用,充分发挥科技公司领军作用,推动人工智能技术快速普及。(王卡卡)