在此次大会上,EpiK中国区负责人Eric Yao 做了《分布式知识图谱构建》的主题演讲,其中他重点提及了区块链去中心化的协作模式搭建共建共享共益的开放知识库的构想与实践。同时EpiK产品负责人介绍了即将推出的游戏化数据标注平台,详细内容如下:
前面三位老师分别讲述了知识图谱、区块链和数据标注三个方向的细节,而这三个方面融合在一起又会产生怎样的火花呢?接下来我要讲的EPIK PROTOCOL铭识协议,它的目的就是为了构建人类的永恒知识库,从而提高AI的智能,这就是数据开源或者是知识开源。
为什么要搭建开源知识平台?
EpiK项目是基于区块链的可信的分布式数据和知识的共享平台,通过去中心化数据存储和协作的方式来实现数据的共建和共享。为什么Epik会嵌入到人工智能和区块链的结合的角度,来切入到创业中来?这与当下的时代背景密不可分。
第四次工业革命已经来临了,全面智能化是这个阶段的核心目标之一,各种智能体也在逐渐的走入日常生活,比如说siri、小爱同学等等人工智能的语音助手,还有各种有AI学习能力的家用电器,比如说冰箱洗衣机彩电等等。
人类的知识传承已经有数万年了,最早是甲骨文刻在石头上,最后演变成竹帛纸张,到数字化存在硬盘上,这些知识都以文本和音视频非结构化的数据结构来存储,人类理解这些知识是很容易的,比如,我们可以很轻松的从中或者是从歌曲中判断这个人物的关系和情节。但是对这些信息,机器理解是很难的,很难通过一祯一祯的屏幕来把人类的关系梳理出来,如何让机器理解我们的人类的知识?
谷歌2012年提出知识图谱,它通过结构化的人类体系,从而让机器掌握人类的知识,开拓AI的认知。这里有一个知识图谱,也是我们很熟悉的一部,叫做《复仇者联盟》,它是用一个一个的图谱组成的网络结构,描述了中透露的各种各样的信息,有了这些图谱,AI就可以读懂知识图谱回答很多的问题,比如如何获得宝石位置,从谁那里取得宝石等等。
人工智能是一个大的方向,但是这个事儿和区块链有什么关系,这个就需要引入到一个很严肃的话题,是人类怎么样才能信任人工智能或者机器智能,这里就涉及机器人是否会欺骗人类,引导人类作出错误的决策。
AI或者知识图谱是很多的公司在做得事情,脸书,苹果、亚马逊、阿里巴巴等等,他们每个大公司都耗时费力的构建自己的知识图谱,但是这些知识图谱不是互联互通的,每个公司有自己的知识库,这就涉及到一个问题,中心化的知识库会面临被篡改知识图谱的隐患,由于知识图谱是一个可以一个一个三元组成的拓扑式网络结构,一个结点的变化,很容易导致计算机或者人工智能理解这个节点相关其他节点的关系都会发生变化,从而造成善恶或者立场的变化,这是非常危险的。
同时构建超大规模的知识图谱,还面临着无法组织大量的人工参与到构建知识库的过程中,缺少这样的组织结构,专业化是很难做到的,也会成为机器智能化巨大的障碍。
基于这两点可以看到,构建超大规模知识图谱,区块链技术是目前唯一找到解决这个问题的出路,因此,知识图谱就要开源开放可见度,这是它的必备属性,而不是不可对它产生的结果做解释。
构建开源知识平台有哪些挑战?
知识图谱底层的存储要开放开源和监督,但是人们怎么样可以协作共建知识库,同时可以访问知识库?
这里面有很多挑战,人类的知识是非常多的,领域也非常多,如何搭建共享平台我要是考虑几点。
第一点,如何开放知识共享,通过构建一些合理的工具和机制,让人人都有渠道贡献知识,因为每一个人都是智能体,让有需求的人可以有方法和访问这些知识。
第二条,如何防范知识篡改,或者知识被更改的时候可以溯源的,这就需要用到区块链的东西,它能保证知识的确权和不可更改,同时也可以通过合适的机制保障它可以持续的公开和更新。
接下来是我们如何能保持知识的质量,由于区块链其实是价值的载体,它的存储成本很高,它的优势其实不在于存储成本,而是在于数据的共建和共享,如何保证知识质量是很重要的一个话题。
在知识的产生层面,知识要可以被监督,在知识质量出现问题的时候,它需要被追责,才会形成一个良性循环,让链上的数据变得质量越来越高,越来越有价值。
最后一点,如何激励知识贡献,每个人都会通过我们的系统提供知识或者为我们系统做贡献,但是其实每个人都不一定是自发性的爱好,所以需要合理的激励机制,如何权衡各方面的收益的动态平衡,同时使得激励的分发成本相对比较低,让系统良性的可循环的运作起来,也是非常重要的。
为什么会选择在2020年做这个事情?我们观察到了一些合适的机会,很多的时机已经成熟了:2020年的时候基于区块链的去中心化存储技术刚刚成熟,比如很有名的项目Filecoin,可以借助0知识证明,以极低的管理成本组织超大规模的防篡改可共享的开放存储资源;2020年数据标注这个行业也迎来了一个大的爆发,预计2025年会达到100亿左右的人民币规模,同时会促进大量的年轻的就业人口涌入,为这个行业提供丰富的知识贡献和知识质检人才;2020年,DeFi这个概念迎来了空前的发展,可以更好的帮助解决线上的激励动态分配的问题,同时让数字货币的激励手段变得更加灵活;社会对数字货币的接受程度越来越高,越来越接受激励的合理性的概念。
EpiK构建超大规模知识图谱的解决方案
基于上面的考虑,诞生了EPIK PROTOCOL,EPIK指的是EpigraphyKnowledge,翻译过来就是铭刻在石头上的知识,代表着进入区块链上的知识,就像铭刻在石头上一样,不可以被随意的篡改,目的是依托区块链技术,构建人类永恒知识库,从而开拓AI的学识。针对前面提出的问题,提出三大解决方案。
第一点,要借助去中心化的存储技术,来解决数据的不可篡改问题,就是这样的数据是不可以被随意篡改的,这些知识不会因为私人的利益而随意篡改的,从而实现知识在全国各地永恒存储得以广泛传播。
第二点,借助去中心化自治组织解决劳动力问题,实现各国各界各族人民去中心化协作中公平获益。
第三点,借助通证经济解决自驱力问题,实现生态中各个成员为追求自身利益最大化,从而无形中推动知识图谱数据壮大的过程。
Epik技术架构,分为三大模块,知识提取、知识存储、知识应用,由低到高的三个层级,里面包含了很多的技术细节。
Epik生态参与者包含五个角色:持币用户、数据矿工、领域专家、赏金猎人、数据网关。把这些角色按照数据从生产到存储到使用这三个过程,数据产生的团体包含三种角色,一个是核心用户,一个是领域专家和赏金猎人,核心用户是可以通过投票来票选出领域专家,确保领域专家的权威性和专业性,领域专家是一个非常核心的的人物,负责组织生产各个类目的人类知识库数据,由于整个工作是非常劳动密集型的工作,所以涉及到大量的繁杂的数据纠错和清洗的工作,数据专家是无法完成的,他需要把这些任务拆分出来,发布到平台上,由赏金猎人认领,他的目的就是为了完成领域专家发布的任务,同时获得对应的奖励。
经过领域专家发布任务,把数据梳理和清洗出来以后,通过领域专家上传给数据矿工上,就是底层的存储机制上,这里面有数以万计的数据矿工来共同维持着整个平台数据的不可篡改和确权。
数据从产生到存储下来,可能涉及到应用的环节,上面会有很多应用的生态,如何方便的访问这些数据,就引入了第五个角色,就是数据网关,它的作用就是为整个底层的数据存储提供数据访问和数据索引的服务,为上层的应用层赋能,让上层的应用层更好的使用整个平台存储的数据。
上面说到的两个图偏概念化,下面举一个具体的例子,如何实现商业闭环,这就是一个具像化的图。
首先可以看到上面已经标注了一些角色了,领域专家,数据网关等等,领域专家是行业专家和领域达人,目的是梳理数据格式,组织数据生产和验收数据质量,其处理的数据都是自己所在该领域的公开的数据源,比如说公开的企业信息,公开的教材信息等等,当他把这两个数据源梳理的格式定好了,所要处理的数据任务发到去中心化的平台上,赏金猎人就可以在这个平台上认领任务,他的角色一般是大学生、青年白领等等,有一定的空闲时间,有一定的知识储备和使用工具素养的一些人,他们可以领取众包任务,同时对这些数据进行校对,获取一定的收益。
数据按照我们所需要的格式和质量生产好以后,由领域专家提供给矿工,矿工就是底层的分布式存储节点,由于我们的数据存储比较定向化,都是针对知识领域的,所以对数据存储的要求能力都不是很高,可能要求这些服务器八核16G,250G的ssd固态硬盘,5兆的带宽就可以满足。数据存储了以后,上层会有很多的应用,会访问我们的数据,因为我们的数据很有价值,因为我们整理了公开的企业信息,原题库整理了教材信息,这两种信息对他们来说都是非常有用的,同时我们可以看到上层知识的应用场景都有很大的规模,就是证明我们所服务的市场增长潜力和空间是巨大的,也可以保障整个项目的快速发展。
他们可以通过数据网关很好的访问我们平台上存储的知识和数据,从而实现更多的商业化应用,为整个知识的变现提供价值。
这个系统为什么会很好运作起来?这里面就有一个区块链行业的概念,叫做通证经济,就是我们希望设计合理的通证经济,每个人提供贡献在里面都会有对应的收益,比如领域专家每天会有5880元人民币的收益,可能每个月的收益足够他养活10到20人的小团队,持续的做这个事情。赏金猎人都是小镇青年和白领时间比较零散化的一类人,他们是时薪的方式,可能达到每小时36块钱,完成任务就可以领取这部分的收益。矿工,大概会有30元每台节点一天的收益。最后底层的应用场景,用户想要使用数据是需要去耗费一定的资源的,这是给整个系统注入能量的一个过程,他们需要大概抵押每天是202块钱人民币左右的积分,就可以获得1GB数据的访问权,可以随时的赎回,这形成了商业闭环。
接下来看一下整个项目的路线图:第一阶段是我们已经完成的,如白皮书测试发布,测试网方尖碑发布,到白皮书发布,测试网预挖计划发布,领域专家招募计划启动,都已经完成了,第二阶段是主网v10罗塞塔发布,还有《治理白皮书》发布和知识众包产品10发布,到今年的二三季度,就会发布主网v20,引入重要的概念就是以太坊,EVM虚拟机,同时去中心化治理平台发布和知识众包产品20发布。
顺便提一下,为什么引入EVM信息?这可以很便捷或者0成本的把以太坊上的经济或者去中心化的Eth经济资源引入到知识生态系统中。比如用户想访问我们链上的数据,但是没有链上积分怎么办,就可以通过抵押其他的资产,来获得数据地访问,这样可以快速扩大用户规模,这只是其中的一个应用。
我们将EpiK使命描述为:这将是一场至少延续50年的碳基生命向硅基生命的史诗级布道。这是一个非常长期的赛道,而且Epik也会持续的给这个系统赋能和迭代,让越来越多的用户很好的贡献知识和使用知识。
游戏化数据标注平台即将发布
在这分享一下关于游戏化的数据标注平台产品的一些思考,为大家展现一下未来普通人怎么样能很轻松的参与到EpiK知识图谱构建体系中,来为系统提供自己的知识,从而获取收益。
游戏现在是让整个互联网消耗用户时长非常多的一个领域。这里有一组数据:2004年—2010年《魔兽世界》这个游戏所有玩家的小时数加一起约等于593万年,这个基本上比人类文明的历史还长了,平均玩家每周在虚拟世界里要花调17—22个小时,这基本上相当于上班时间的50%了。
而全球最好的数据集,已经有100万张是已经标注的。它的总数是可能过千万的,但是100万张是带标注的。如果每一张的标注成本是5分钟,那其实只需要《魔兽世界》这个游戏六十万分之一的工作量就可以完成了。所以说其实游戏是一个特别值得我们去思考的东西。
游戏化其实就是把游戏的一些常见的设计思路运作到一些非游戏的领域,比如在线教育、比如一些公益类的项目或者是一些产品设计当中去。
举个例子:支付宝的蚂蚁森林和蚂蚁庄园,蚂蚁森林的累计用户应该是有55个亿了。因为这是公益项目,用户可以根据能量换成植的真树,相当于这个蚂蚁森林种下了122亿颗真的树。蚂蚁庄园的累计用户有4亿,送出了150亿个鸡蛋,这两个项目其实都是一个游戏化的公益项目,但却增加支付宝的活跃度,增加支付宝的黏性,以及拓展支付宝的社交关系链。其实这是一个商业和公益上都双赢的很大体量的项目,虽然它看起来只是一个小游戏。
另外还有一个很好的例子,是一个在台湾的工作室Fourdesire,这个工作室专门喜欢去做这类游戏化的产品。比如说其中有一个叫《记账城市》,《记账城市》是鼓励用户每天去记账,因为记账是一个很枯燥的事情,它用一个用户不断地记账就能换取一些积分,这些积分就能发展用户自己的城市,这个城市里面还有很多好玩的一些小的游戏化的一些特性,这样的话就让挺多人喜欢上记账了,成为一个养成性的存在。
这些游戏类的APP有一个共同的特点,它原本是把一些很枯燥的东西、很枯燥的一些任务包装成一个游戏的壳,用户就能逐渐地沉迷其中了。而且这个工作室最终也获得了一个流量上非常不错的表现,这是一个二三十人的工作室,但是他在全球累计获取了超过2500万的用户,而且《记账城市》经常会被推荐上APP Store首页。
游戏的核心体验是什么?简单总结为四点,第一个就是积分等级成长体验,就是用户长期持续地完成任务会得到这种积分、奖励、等级提升,像《记账城市》就是这个城市逐渐地发展壮大,像《太空冒险》就是你可能去了更远的星球,这样是一个积分等级成长的体验。
另外,游戏当中沉迷的另外一个元素就是它有故事和情感体验,比如说游戏的《使命召唤》里面会有那种战友的剧情,用户就能沉浸其中并能情感投射。包括蚂蚁庄园那只很可爱的小鸡,我们经常看到在朋友圈里很多用户其实会觉得自己的小鸡好久没有喂食了,他其实会产生一种愧疚感,这些东西其实都是这个产品打造出来的优良的情感体验。
还有一个比较重要的是游戏能够有一个成瘾性和进入感也是因为它有即时反馈体验,当用户完成某一个任务之后是有明显的反馈体验设计的。比如说在打篮球的时候当我们去投中一颗篮球的时候,它会擦中那个篮网发出一个声音,这个其实就是一个即时的反馈。比如说我们打FPS类游戏如果是爆头屏幕中间会出现巨大的一个图标提示,这个就是一个即时反馈体验。
最后,社会性互动体验,比如说我们可以跟好友之间一起互动,当年风靡一时的Social game比如说偷菜其实就是借助游戏本身实现人与人之间的互动,这个互动充满了一些很小的暧昧或者说隐含表达性一些东西,这其实是玩家们都很喜欢的。
我们的尝试探索是这样的,第一就是我们觉得数据标注这个业务跟游戏化其实是可以放在一起的。为什么说我们觉得数据标注这个业务跟游戏化是比较适合放在一起的?
其实就是因为第一标注这个任务本身是枯燥重复的,另外,我们也是希望用户在碎片化的时间里能够去进行数据标注的。
假如这个时候我们有一个标注任务是口腔医学相关这个领域的,比如说口呼吸是否会导致下颌收缩,这个东西其实一般的用户是无法去标注的,如果是医生他又很忙,他平时又有大量主业的工作。如果我们能把这样类似于数据标注的业务,在医生这个全国大概只有14万左右人的群体里面,去把它用碎片化的方式拆解成任务,并用游戏化的方式去鼓励用户收集,那么可能这个标注任务就能更好地执行。
为此,我们期待做出这样一个体验的产品,第一它有流畅的标注体验的,这需要有强大的算法支持,能够智能地分配标注任务。第二,我们肯定要尝试不同的游戏化的场景设计,赋予用户这个故事与世界观。
另外,我们要把一些游戏化的元素融入进来,比如我们做随机的抽卡或者成长体系这样的东西,让这个游戏能够具备一个基本的可玩性。
先说下流畅的数据交互,我们现在认为大部分的数据标注任务其实上下文无关的,就是标一个任务和标下一个任务之间是没有太强的关系的。因此,就可以把一些大的任务拆解,拆解之后就可以分发给合适的一些人,比如,我们会发布让用户朗读句子五遍的任务,用户对着这个把这句话朗读出来,满五遍之后这个任务自动提交了,然后用户就能获取相应的一些积分,然后这些积分可以拿来在游戏里做一些好玩的东西。
在游戏场景我们希望讲一个故事,这个故事中可能是某一种浩劫人类文明现在已经被摧毁了,那么我们在这个基础上怎么重启人类文明?在这个主线中,我们要不断地派遣探险队出去探险,去找到过往历史中的一些科技遗迹,然后去升级我们的一些建筑。比如说原本给人类提供能源的是火堆,通过反复的派遣探险队我们最终能变成蒸汽发电站,变完蒸汽发电站之后我们可能会变成核聚变发电站。这样也带着我们重塑一遍人类的科技文明史,带着我们的玩家能够体验到一种带着人类文明从蛮荒的时代走向农业时代、走向蒸汽时代、工业文明包括现在的人工智能未来,未来可能走向太空时代。
但是这件事情其实本身是很难的,我们认为未来的工作难点是:第一,我们的数据标注任务的推荐系统设计,潜在的问题也会非常地多。比如说我们的标注任务怎么能够实时的生成、怎么能够实时的分发,当然还要考虑用户的专业性门槛和反作弊。第二,不同于专业性人员的标注,我们是有员工雇佣的。大家的工作场合是安静的,我们用户的使用场景可能是在地铁上、可能是在上班的闲暇时间、可能是家里。这样的话什么样的人在什么场景下获取什么样的任务能保证我们较好的数据质量,这也是一个问题。第三,多用户提交的时候我们整个标数据的质性度的问题;第四,怎么合理地激励每一个用户,使用户贡献量和激励平衡。整个这一系列的东西都是我们要长期去解决的问题;第五,真正好玩的、用户周期很长、高黏性的一个前端游戏化是怎么实现的,这个也需要逐步探索。比如说什么样的玩法用户喜欢,我们是做一个成长积分不断增长的游戏更好,还是做一个自我挑战的游戏更好,还是单纯只是把一点游戏化的元素融入到移动APP的标注当中就可以,怎么能够避免用户觉得有新鲜感之后就厌烦,或者我们能不能频繁更换主题,这些东西都是未来我们在前端上需要探索的地方。亿万克亚当G952N6是一款4U双路机架式服务器,采用最新一代Intel Xeon可扩展处理器,具备高性能计算特性和灵活的IO扩展能力,是兼备训练与推理功能的全能型AI异构型服务器,可广泛应用于互联网、云计算、数据库和大数据等场景。感兴趣的话点击此处,免费了解一下
云服务器的业内名称其实叫做计算单元。所谓计算单元,就是说这个服务器只能算是一个人的大脑,相当于普通电脑的CPU,里面的资源都是有限的。你要获得更好的性能,解决办法一是升级云服务器,二是将其它耗费计算单元资源的软件部署在对应的云服务上。例如数据库有专门的云数据库服务、静态网页和有专门的文件存储服务。
亿万克作为中国战略性新兴产业领军品牌,拥有中国第一、世界前二的行业领先技术,致力于新型数据中心建设,构筑云端安全数字底座,为客户提供集产品研发、生产、部署、运维于一体的服务器及IT系统解决方案业务,所有产品和技术完全拥有自主知识产权,应用领域涵盖云计算、数据中心、边缘计算、人工智能、金融、电信、教育、能源等,为客户提供全方位安全自主可控技术服务保障。一旦人工智能被大范围应用,对于计算资源的渴求程度将会呈现指数级的提升,那么伴随而产生的 IT 设备投资需求将出现井喷。未来人工智能的应用场景可分为两部分:一部分是替代人工,做一些重复性的劳动,比如全自动生产线、机器翻译、无人驾驶等;另一部分是辅助人类实现更高层次的智能,比如智能交通分流系统、虚拟个人助理、VR/AR 眼镜等。
转眼间,2020已经接近尾声。这一年,有很多变化,也有许多不变的信念与坚守。12月30日,百度发布《百度AI的2020》,以一篇万字长文回顾与总结过去的一年。CTO王海峰总结百度AI在2020年的三大特色:持续 探索 科技 前沿、打造AI新型基础设施、云智一体加速产业智能化。
王海峰表示:“世界的2020,是充满不确定性的变局之年;中国的2020,是团结一心、共克时艰、于变局中开新局的希望之年;百度AI的2020,是坚定信念,拥抱变化,践行“ 科技 为更好“的实干之年。
回望2020年,抗击疫情中,百度AI第一时间贡献了 科技 抗疫、保护生命安全的温度和力量;复工复产和高质量发展中,百度AI是促进创新、构建新格局的新动能;我们的工作和生活中,百度AI在你搜索的每一条信息和知识里、在地图导航的叮咛声中、在国际会议的同传字幕上、在工厂的无人质检设备上、在自动驾驶出租车持续拓展的里程上……百度AI在我们身边每个角落,让我们的工作更高效、生活更便捷。
2020,百度AI的实干之年继续自己的特色之路:持续创新突破, 探索 科技 前沿;自主可控、开源开放,夯实软硬一体AI大生产平台,打造AI新型基础设施;云智一体,使能行业,赋能生态,加速产业智能化。”
一些关键的数字可以窥见百度AI的成绩:在 CVPR、ACL、ECCV、NeurIPS、INTERSPEECH等全球顶级人工智能学术会议和权威竞赛上,百度AI问鼎冠军30多次,论文收录260多篇,持续彰显AI技术领军实力;在人工智能专利申请量和授权量方面,百度以9364件专利申请和2682件专利授权处于中国第一位;今年,百度再次入选《麻省理工 科技 评论》“50家聪明公司”;截止目前,百度共获得了来自政府、行业协会、媒体等多方机构颁发的100多个奖项,例如2020世界人工智能大会最高奖项SAIL奖。
除了这些最直接的数字,《百度AI的2020》还全面展现了其在AI新兴基础设施、产业智能化、AI服务 社会 和人才培养等方方面面的进展和成果。
AI 新型基础设施
2020年,百度AI的四个剪影,描绘出AI进入工业化大生产,成为坚实的AI基础设施。
第一个剪影,百度大脑60勾勒的核心技术自主创新。2020年,百度大脑核心技术突破“知识增强的跨模态深度语义理解”,理解真实世界的复杂场景。另一方面,百度大脑“软硬一体AI大生产平台”升级为AI新型基础设施,更高效地支持AI工业化大生产,帮助产业智能化发展提速。
第二个剪影,百度飞桨持续创新,繁荣的开源生态支持产业发展。飞桨是中国首个开源开放、功能完备、自主可控的产业级深度学习 平台。飞桨开源框架V20RC版本,带来“编程一致、动静统一”的全新开发体验,硬件生态伙伴达到20家,适配或者正在适配的芯片/IP型号29种,提供自主可控的坚实底座,加速AI产业生态构建。飞桨凝聚超过265万开发者,训练34万个模型,服务10万家企业。
第三个剪影,前沿技术描绘的未来蓝图。百度发布了国内首个云原生量子计算平台量易伏Quantum Leaf,提供QCompute等量子开发套件,缩短量子编程全生命周期,实现量子工具链闭环。百度超级链拥有链内并行技术、立体网络等425项技术专利,实现单链87万TPS 的行业领先网络性能,并作为国内首个项目捐赠给开放原子开源基金会。百度人工智能还与生物计算和病毒研究相结合,百度开源了线性时间算法Linearfold,可将此次病毒全基因组二级结构预测从55分钟缩短至27秒,提速120倍。此外,百度推出的全球首个mRNA疫苗基因序列设计算法LinearDesign,能在16分钟内大大提升疫苗设计的稳定性和蛋白质表达水平,从而有效解决了mRNA疫苗研发中最重要的稳定性问题,加速疫苗研发速度。
第四个剪影,云计算铺设的智能经济“高速公路”。今年,百度智能云在业内率先提出AI-Native的云计算架构,发布新一代基础架构百度“太行”,自主研发的云原生数据库产品百度智能云Gaia(盖亚),便捷高效支持产业的智能应用。此外,混合/专有云平台ABC Stack全部支持国产化服务器和 *** 作系统,ABC Stack行业版和企业版重点加持百度自研昆仑AI芯片,实现真正的国产化智能云。
四个“剪影”交叠,“百度AI新基建版图”逐渐清晰。百度正在依托包括百度大脑、飞桨、智能云、数据中心等在内的新型AI基础设施,推动智能交通、智慧城市、智慧金融、智慧能源、智慧医疗、工业互联网和智能制造等领域实现产业智能化升级。
AI 描绘“万物智能”,产业智能化更加澎湃
新冠肺炎疫情对全球经济带来巨大冲击,也让 社会 各界充分意识到人工智能等新兴 科技 的重要价值。百度AI一方面通过搜索、地图、输入法、小度、Apollo等产品和平台服务大众,让生活更简单、更便捷;另一方面通过百度AI to B的重要承载者和输出者——百度智能云,为各行各业大规模输送百度的AI技术成果与平台能力,支持产业智能化升级,加快智能经济的到来。
百度AI助力 搜索体验持续优化,更好地连接信息与服务。 百度移动生态是中国领先的以信息和知识为核心的移动生态,在AI技术的加持下,百家号、智能小程序和托管页三大支柱迅速发展成为国内领先的内容和服务接入平台。基于自然语言处理、知识图谱、语音、视觉、深度学习等AI技术能力,百度搜索也在持续智能化。
新一代人工智能地图—百度地图让出行更简单。 2020年,百度地图坚守AI优势和创新能力升级出行服务,上线熟路导航模式、车道级导航功能、AI室内通和红绿灯倒计时等,已成为国民信赖的权威出行平台。目前,百度地图90%以上的数据生产环节实现AI化,全景地图覆盖全国95%以上的城市,覆盖里程超过300万公里; 语音交互场景也实现迅速增长,百度地图智能语音助手用户量已破4亿。
百度地图AI室内通
AI 全面赋能输入法,市场份额与活跃用户量跃居行业领先。 百度输入法市场份额与月活跃用户量增势迅猛,目前月活突破6亿;多项AI功能取得重大行业突破,其中语音输入能力持续突破,并成为业内首个日均语音请求量破10亿次大关的输入法产品,语音识别准确率达986%,同时实现离线中英自由说升级突破,百度输入法目前已成为语音输入渗透率最高的第三方手机输入法;手写输入持续升级,手写识别准确率提升至96%。
小度“破圈”,拓宽智能助手的应用边界。 小度今年发布了搭载百度鸿鹄芯片的小度智能音箱2红外版、主打在线少儿教育的小度教育智能屏和小度智能早教机、以及超高性价比的智能屏入门级产品小度智能屏Air、随身场景首款新品小度真无线智能耳机和满足每一位家庭成员更多元细分需求的小度智能屏X10,让小度在更多场景和人群实现了“破圈”,加速人工智能硬件的市场普及,拓宽智能助手的应用边界。
Apollo 自动驾驶超过十项中国第一,技术实力领跑行业。 百度Apollo不断刷新智能出行领域的“高难度”。在“万物智能——百度世界2020”大会上,百度完成全球首次全无人驾驶直播,即人工智能系统在没有车内安全驾驶员的情况下独立驾驶。百度先后在长沙、沧州、北京开放Apollo Go自动驾驶出行服务。智能车联产品 Apollo小度车载已进入上百万辆智能 汽车 。百度发布了国内外首个车路行融合的全栈式智能交通解决方案“ACE 交通引擎”,扎根中国智能交通新基建,目前已获近20个城市的智能交通新基建订单。
壮“智”凌云,百度智能云加速产业智能化。 2020年在疫情、全球经济局势变化的背景下,以 科技 创新推动产业发展,提升经济质量的效益和核心竞争力成为关键。百度智能云融合了云计算、百度大脑、大数据等百度核心技术,发布“以云计算为基础,以AI为抓手,聚焦重要赛道”的全新战略,推动产业智能化发展,成为新基建大潮中加速AI工业化大生产的关键力量。
百度智慧城市解决方案已在北京海淀、重庆、成都、苏州、宁波、丽江等10+省市落地应用;智慧金融服务近200家金融客户,构建了超过30家的合作伙伴生态,跻身中国金融云解决方案领域第一阵营;百度智慧医疗“灵医智惠”已经服务300多家医院和1500家基层医疗机构,辅助数万名医生,惠及超过千万患者;智能制造覆盖14大行业,100多家企业,30多个合作伙伴,触达50多类垂直场景,在3C、 汽车 、钢铁、能源等行业已规模落地;百度智慧能源已覆盖电网、发电、新能源、清洁能源、石油、化工等场景,携手国家电网、南方电网智能化升级;发布企业智能应用“百度如流”,构建 AI 时代办公流水线,打造新一代智能工作平台。
服务 社会 与人才培养
没有一个冬天不可逾越,没有一个春天不会来临。2020年,面对突如其来的疫情,百度AI第一时间加入抗疫防疫的战斗中。百度AI出现在中国疾控中心,助力10个小时就完成了北京四个病例样本的全基因组测序;出现在地铁高铁等公共场所,解决佩戴口罩及帽子情况下的体温检测;出现在基层随访的电话中,智能外呼平台一秒呼出1500个电话辅助排查及通知,让基层防控人员有时间坐下来吃一口热饭;AI问诊每日调用近万次,机器人战疫解决方案落地30多家医院、机构,百度地图迁徙大数据平台、实时路况平台为国家防控部署提供参考,发热门诊地图、疫情小区地图、核酸检测机构查询等功能,从不同角度帮助抗疫防疫更快速、更便捷。
百度秉承“ 科技 为更好”的理念,践行企业公民的 社会 责任。百度最早将人工智能技术用于寻人,截止到2020年12月,百度AI寻人已经累计帮助了近12000个家庭团聚。百度AI持续支持文化保护、动物保护,例如百度和国际爱护动物基金会IFAW合作,推出全球首个利用人工智能技术打击野生动物制品非法贸易的平台。
人工智能的快速发展和产业智能化浪潮加剧了全球AI人才的紧缺。面向高校,百度提供了全套教学资源包、实训平台和亿元算力支持,并与高校共建课程体系;目前已举办13期高校师资培训班,培养了1800多位AI教师,支持200余所高校开设AI学分课。前不久,百度飞桨的“大航海”计划公布,其中的“启航”部分面向高校AI人才培养:未来三年,百度飞桨将投入总价值5亿元的资金与资源,支持全国500所高校,重点培训5000位高校AI教师,与高校联合培养50万AI未来人才。
面向未来
2020年,世界格局不断变化。正如百度CTO王海峰所言:“立足新发展阶段,以新理念建新格局, 科技 创新是关键。百度AI的2020,与时代共前行。”
人工智能算法需要强大的计算和存储资源,传统的个人计算机和服务器已经不能满足它们越来越高的需求。除此之外,高性能计算也需要比普通计算更高的耐用性和安全性,这正是运营商服务器的长处之一。运营商的服务器具备高性能、高存储容量、高稳定性和高安全性等优势,可以帮助企业快速搭建高性能的人工智能应用平台,而且它们还具有许多其他优点。首先,运营商的服务器通常具备更快的处理速度和更大的处理能力。这是因为它们使用的是更加先进的处理器,并且可以使用多个处理器同时处理数据和任务,从而提高处理速度和效率。其次,服务器通常具有不间断的电力供应和备用电源,这极大地减少了由于停电或停机造成的数据丢失或损坏的风险。此外,服务器还可以通过专用的软件进行自动备份和数据恢复,确保数据的安全性。最后,服务器通常可以承载更多的网络访问和用户请求,并能够更好地应对负载均衡的问题,从而提高应用程序的响应能力和稳定性。总之,运营商的服务器是进行人工智能开发的理想平台,拥有更加高端的硬件配置和优越的网络环境,这可以降低装备成本、提高应用性能、保证数据的安全性、提供更好的用户体验等。因此,运营商也为人工智能的开发和应用提供了很好的支持和保障。随着人工智能的快速发展,产业化的AI趋势也越发明显。浪潮作为全球领先的AI计算领导厂商,一直在致力于AI服务器的产品打造,现在已经在图像视频、语音识别、金融分析、智能客服等多个AI场景里展开了服务,从而帮助更多的客户实现了AI场景的构建和应用。前不久的生态科技大会上,浪潮科技也公布了最新的NF5488A5服务器数据,相对于之前几款来说,这一产品大幅提升了智能语音、图像识别等AI模型的训练和推理性能,促进了产业AI解决方案的开发与应用。欢迎分享,转载请注明来源:内存溢出
评论列表(0条)