开发者福利:百度开源了驱动它搜索、外卖和自

开发者福利:百度开源了驱动它搜索、外卖和自,第1张

开发者福利:百度开源了驱动它搜索、外卖和自

9月初,百度首席科学家吴恩达宣布,百度人工智能技术集成平台百度人脑底层深度学习服务平台Paddle将开源。

服务平台的全称是并行分布式深度学习,已经在百度内部投入了工作环境,带动了企业集团下的30多项商业服务或非商业商品:从提升百度百度云盘的性能,到展示更加精准健康的百度搜索,甚至带动了一部分无人驾驶汽车。就连百度外卖送餐也在用Paddle预测餐饮店的送餐率,改进勇士的外卖送餐方式,让顾客快速用餐。

Paddle的重点产品R&D负责人、优秀生物学家许巍在美国硅谷接受了PingWest的采访,和大家聊起了这个系统软件开源的现实意义。

许巍于2013年从脸书辞职,加入百度深度学习研究院(IDL)。当时IDL发现单个GPU还没有考虑深度神经元网络的训练规则,百度搜索、广告、百度云盘及其新业务流程也对深度学习有了新的要求,而单个GPU训练服务平台的性能和效率略显不足。因此,在许巍的指导下,百度推出了并行处理GPU培训服务平台Paddle。

业界已经有很多开源的深度学习架构,比如Google的TensorFlow,脸书的Torch,伯克利大学视觉效果与教学中心的Caffe。开源的Paddle让百度增添了这一新时尚,也成为国内首家开源深度学习系统软件的大中型科技公司。

应该说,百度开源Paddle正在努力塑造自己在开源界的影响力,尤其是在深度学习方面。许巍表明,除了这个立足点之外,更重要的是打造一个基于开源Paddle的社区,让这个深度学习服务平台能够被工作经验不多的技术工程师和深度学习爱好者应用,主要展示其对外开放和实用性的优势,让资金投入到大量的产业链和科研中,为开源手机软件本身产生股权溢价。

“这两年很多新成立的公司发展很快,应该是开源的贡献。”许巍说。他期望Paddle能够帮助大量的中小企业。

总的来说,Paddle包括了多种业界常见的深度学习实体模型,包括深度神经网络(DNN)、卷积和神经网络(CNN)、递归神经网络(RNN)、复杂记忆实体模型、NTM等。,并应用各种蚁群算法。在物理模型训练层面,Paddle可以应用于多机多独立显卡训练,可以灵活使用用户的硬件配置性能,应用Python/C预测分析socket。

许巍强调,Paddle的一大优势是实用性,一键安装,丰富多彩的演示,以及完善的中英文双语文本文档。适用的系统软件在9月初宣布时是有限的。经过一个月的推广和调整,到本月底,最新版的Paddle开源时,应该可以适用于包括Linux、macOS在内的各种流行的电脑 *** 作系统下的开发工具。

Caffe,Torch,TensorFlow,Paddle这么多开源的深度学习架构,开发者应该如何选择?事实上,这种架构对于不同的可以显示信息的用户有不同的优缺点。比如Caffe在图像上优势明显,而TensorFlow在底层完全适用。但是TensorFlow开发一个设计必须写的代码量显然很大,而且现阶段TensorFlow的开源版本号只能在单机版上 *** 作。

与TensorFlow等“竞争对手”相比,Paddle在灵活性和可扩展性上的优势显露无遗。使用Paddle开发设计时,编写简单的环境变量就可以完成复杂的实体模型,减少代码数量高达75%。除此之外,还可以在多核、多GPU、多机自然环境下使用,也需要多机设备之间进行大量的通信。

“开发者首先考虑的是他们想做的项目在你的服务平台上能不能做,能做才会考虑你。是的,接下来的难度系数是多少?你一定要选难度系数低的。能做,难度系数低,还要看表现。”许巍觉得Paddle功能齐全,性能优越,灵活性强。与其他偏好灵活性但提高了应用难度系数的系统软件相比,更值得考虑。

Paddle和绝大多数深度学习系统软件一样,听起来很复杂,但它处理所有这些具体、简单和重复的任务。以前大多靠人力完成,很难按照设备运行流程解决。

比如百度外卖送餐。从单个顾客的角度来看,顾客无疑希望他们的饭菜能尽快送到。对于勇士来说,每次行程不仅仅是送一顿饭,行程越大效率越高。但顾客并不总是在同一家酒店网上订餐,每家酒店的用餐率也不一样。那样的话,路线分布的优劣,立刻危及到来的客户的感受。我坚信很多人都有过在百度外卖送餐网上点餐的经历,但是还没收到饭就已经饿了。

今天,百度又为“餐厅就餐率预测分析”新项目带来了划桨 *** 作。这套系统软件融合了不同时间段的门店人流量、菜品烹饪时间、订单信息等数据和信息,根据训练好的实体模型进行求解,从而预测战士此行必须带的每一道菜的用餐时间。按照这个预期结果,战士整体规划了路线,把饭快速送到顾客手中,用更少的时间赚了不少佣金,完美。

以百度百度云盘为例。客户的应用的百度云盘背后其实是一块连接互联网的电脑硬盘。电脑硬盘是一种消耗品。被破坏时,系统软件必须从多处寻找电脑硬盘的备份数据,恢复数据信息需要9倍的网络带宽。现在百度用Paddle预测硬盘损坏的时间,在硬盘损坏之前用基本的网络带宽备份数据,节省了大量的网络带宽资源。

近年来,许多大中型互联网公司的关键产品刚刚开始更多地依赖深度学习系统软件。谷歌的搜索,脸书的时间轴也不例外。但在过去,只有这样的大型企业才有足够的整体实力来开发、构建和应用这样的系统软件。

Google去年开放了TensorFlow,称之为强烈推荐。其实百度也想做那样的事情,也想让自己的深度学习能力被外界掌握。Caffe的主要推动者贾评价Paddle“编码质量高,设计方案整齐,是一个非常扎实的架构。”

百度已经为Paddle开通了官网。最新版本将于9月30日发布,包括详细的文本文档和安装说明。现在GitHub已经有了预发布的版本号。“希望对深度学习感兴趣的盆友们讨论一下,尝试应用Paddle,把它的钱投入到大量的领域,处理大量的人工智能技术的问题。”许巍说。

注:阅读相关网站基本建设方法的文章,请移至网站建设教程频道栏目。

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/zz/769564.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-05-02
下一篇 2022-05-02

发表评论

登录后才能评论

评论列表(0条)

保存