从IT到DT 阿里大数据背后的商业秘密

从IT到DT 阿里大数据背后的商业秘密,第1张

从IT到DT:阿里数据背后的商业秘密
空气污染究竟在多大程度上影响了人们的网购行为?有多少比重的线上消费属于新增消费?为什么中国的“电商百佳县”中浙江有41个而广东只有4个?
这些电商的秘密就隐藏在阿里巴巴商业生态的“大数据”中。
“未来制造业的最大能源不是石油,而是数据。”阿里巴巴董事局主席马云如此形容“数据”的重要意义。
在他看来,阿里巴巴本质上是一家数据公司,做淘宝的目的是为了获得零售的数据和制造业的数据;做蚂蚁金服的目的是建立信用体系;做物流不是为了送包裹,而是这些数据合在一起,“电脑会比你更了解你”。与此同时,产业的发展也正在从IT时代走向以大数据技术为代表的DT时代。
而在阿里巴巴内部,由电子商务、互联网金融、电商物流、云计算与大数据等构成的阿里巴巴互联网商业生态圈,也正是阿里研究院所扎根的“土壤”。
具体而言,阿里巴巴平台的所有海量数据来自于数百万充满活力的小微企业、个人创业者以及数亿消费者,阿里研究院通过对他们的商务活动和消费行为等进行研究分析,从某种程度上可以反映出一个地方乃至宏观经济的结构和发展趋势。
而随着阿里巴巴生态体系的不断拓展和延伸,阿里巴巴的数据资源一定程度上将能够有效补充传统经济指标在衡量经济冷暖方面存在的滞后性,帮助政府更全面、及时、准确地掌握微观经济的运行情况。
从IT到DT
不同于一些企业以技术研究为导向的研究院,阿里研究院副院长宋斐告诉《第一财经日报》记者,阿里研究院定位于面向研究者和智库机构,主要的研究方向包括未来研究(如信息经济)、微观层面上的模式创新研究(如C2B模式、云端制组织模式)、中观层面上的产业互联网化研究(如电商物流、互联网金融、农村电商等)、宏观层面上新经济与传统经济的互动研究(如互联网与就业、消费、进出口等)、互联网治理研究(如网规、电商立法)等。
具体到数据领域,就是在阿里巴巴互联网商业生态基础上,从企业数据、就业数据、消费数据、商品数据和区域数据等入手,通过大数据挖掘和建模,开发若干数据产品与服务。
例如,将互联网数据与宏观经济统计标准对接的互联网经济数据统计标准,包括了中国城市分级标准;网络消费结构分类标准;网上商品与服务分类标准等。
而按经济主题划分的经济信息统计数据库则包括商品信息统计数据库;网购用户消费信息统计数据库;小企业与就业统计数据库;区域经济统计数据库。
还有反映电商经济发展的“晴雨表”——阿里巴巴互联网经济系列指数。其中包括反映网民消费意愿的阿里巴巴消费者信心指数aCCI、反映网购商品价格走势的阿里巴巴全网网购价格指数aSPI和固定篮子的网购核心价格指数aSPI-core、反映网店经营状态的阿里巴巴小企业活跃度指数aBAI、反映区域电子商务发展水平的阿里巴巴电子商务发展指数aEDI等等。其中,现有aSPI按月呈报给国家统计局。
而面向地方政府决策与分析部门的数据产品“阿里经济云图”,则将分阶段地推出地方经济总览、全景分析、监测预警以及知识服务等功能。宋斐告诉记者,其数据可覆盖全国各省、市、区县各级行政单位,地方政府用户经过授权后,可以通过阿里经济云图看到当地在阿里巴巴平台上产生的电子商务交易规模、结构特征及发展趋势。
“借助数据可视化和多维分析功能,用户可以对当地优势产业进行挖掘、对消费趋势与结构变动进行监测、与周边地区进行对比等等。”宋斐表示,该产品未来还可以提供API服务模式,以整合更多的宏观经济数据和社会公开数据,为当地经济全貌进行画像,给大数据时代的政府决策体系带来新的视角和工具。
数据会“说话”
对于如何利用“大数据”,马云在公司内部演讲中曾提到:“未来几年内,要把一切业务数据化,一切数据业务化。”
其中,后半句话可以理解为,让阿里巴巴各项业务所产生、积累的大数据来丰富阿里的生态,同时让生态蕴含的数据产生新的价值,再反哺生态,这是一个相辅相成的循环逻辑。
宋斐对记者举例称,蚂蚁金服旗下的芝麻信用已获得人民银行个人征信牌照批准筹备,未来将通过分析大量的网络交易及行为数据,如用户信用历史、行为偏好、履约能力、身份特质、人脉等信息,对用户进行信用评估,这些信用评估可以帮助互联网金融企业对用户的还款意愿及还款能力做出结论,继而为用户提供快速授信及现金分期服务。本质上来说,“芝麻信用”是一套征信系统,该系统收集来自政府、金融系统的数据,还会充分分析用户在淘宝、支付宝等平台的行为记录。
再如,对于如火如荼的农村电商领域,阿里研究院从2010年就已开始对“沙集模式”个案进行研究,后续一系列基于数据和案例调研所驱动的农村电商研究成果,对于地方政府科学决策,推动当地农村电子商务发展、创造就业和发展地方经济起到了助力作用。到2014年底,全国已经涌现了212个淘宝村,而阿里巴巴也在这一年启动千县万村计划,将在三至五年内投资100亿元,在农村建立起电子商务服务体系。
除了通过数据分析去助力业务外,宋斐告诉记者,有时候大数据报告可能会与传统的印象结论差异很大。
以区域电子商务为例,在阿里研究院发布的2014年中国电商百强县排行榜中,浙江有41个县入围,福建有16个,而广东只有4个,这个结果与传统的印象相差比较大。而事实上,这是因为浙江和广东两省电商发展在地理分布、产业结构等方面的明显不同而带来的。
再如,外界常常认为网络零售替代了线下零售,但事实上,麦肯锡《中国网络零售革命:线上购物助推经济增长》的研究报告,通过借鉴阿里研究中心(阿里研究院前身)和淘宝网UED用户研究团队的大量报告与数据,最后发现:“约60%的线上消费确实取代了线下零售;但剩余的40%则是如果没有网络零售就不会产生的新增消费。”
“这一研究成果,有助于社会各界准确认识网络零售与线下零售的关系,共同探索和建设良好的商业发展环境。”

以下为大家介绍几个代表性数据分析平台:

1、Cloudera

Cloudera提供一个可扩展、灵活、集成的平台,可用来方便的管理您的企业中快速增长的多种多样的数据,从而部署和管理Hadoop和相关项目、 *** 作和分析您的数据以及保护数据的安全。ClouderaManager是一个复杂的应用程序,用于部署、管理、监控CDH部署并诊断问题,ClouderaManager提供AdminConsole,这是一种基于Web的用户界面,是您的企业数据管理简单而直接,它还包括ClouderaManagerAPI,可用来获取集群运行状况信息和度量以及配置ClouderaManager。

2、星环Transwarp

基于hadoop生态系统的大数据平台公司,国内唯一入选过Gartner魔力象限的大数据平台公司,对hadoop不稳定的部分进行了优化,功能上进行了细化,为企业提供hadoop大数据引擎及数据库工具。

3、阿里数加

阿里云发布的一站式大数据平台,覆盖了企业数仓、商业智能、机器学习、数据可视化等领域,可以提供数据采集、数据深度融合、计算和挖掘服务,将计算的几个通过可视化工具进行个性化的数据分析和展现,图形展示和客户感知良好,但是需要捆绑阿里云才能使用,部分体验功能一般,需要有一定的知识基础。maxcompute(原名ODPS)是数加底层的计算引擎,有两个维度可以看这个计算引擎的性能,一个是6小时处理100PB的数据,相当于1亿部高清,另外一个是单集群规模过万台,并支持多集群联合计算。

4、华为

基于Apache进行功能增强的企业级大数据存储、查询和分析的统一平台。完全开放的大数据平台,可运行在开放的x86架构服务器上,它以海量数据处理引擎和实时数据处理引擎为核心,针对金融、运营商等数据密集型行业的运行维护、应用开发等需求,打造了敏捷、智慧、可信的平台软件。

5、网易猛犸

网易猛犸大数据平台使一站式的大数据应用开发和数据管理平台,包括大数据开发套件和hadoop发行版两部分。大数据开发套件主要包含数据开发、任务运维、自助分析、数据管理、项目管理及多租户管理等。大数据开发套件将数据开发、数据分析、数据ETL等数据科学工作通过工作流的方式有效地串联起来,提高了数据开发工程师和数据分析工程师的工作效率。Hadoop发行版涵盖了网易大数据所有底层平台组件,包括自研组件、基于开源改造的组件。丰富而全面的组件,提供完善的平台能力,使其能轻易地构建不同领域的解决方案,满足不同类型的业务需求。

6知于大数据分析平台

知于平台的定位与当今流行的平台定位不一样,它针对的主要是中小型企业,为中小型企业提供大数据解决方案。现阶段,平台主打的产品是舆情系统、文章传播分析与网站排名监测,每个服务的价格单次在50元左右,性价比极高。

刚刚参加完阿里巴巴在北大的技术论坛。有些可以作为回答而分享。
阿里巴巴在08年就把大数据作为一项公司基本战略,要知道那个时候甚至还没几个人开始谈论“大数据”,可以说在大数据方面相比于国内其他互联网公司,阿里是走在前面的。
按马云的话讲,我们正从information technology转向data technology。数据是灵魂。也许并不能保证大数据能给阿里巴巴赚很多钱,但是阿里认为数据对人类有用,所以他们做了。
举一个阿里CTO认为大数据应用和价值的例子:淘宝小贷团队,很小的队伍,完全依赖数据对客户的信用程度作分析,将数据转化为信用,将信用转化为财富,这是传统商业银行冗杂的审核程序,低效和高成本所不能比的。更重要的是,这个项目给近百万的小商户提供了生命线,哪怕只贷一元钱。没有哪个银行会这么做。
我认为阿里巴巴已经是国内互联网大数据的先驱,他们在做有意义的事情。

要是说亿元的服务器(Server)玩游戏,现在还没有这样的游戏商会去用那么贵的东西,有便宜的可用却不用,不划算,实际处理性能也用不上。
除去游戏领域,亿元的服务器比比皆是,银行证券保险业大量使用的Main Fraim(又称主机)就是亿元级别的;若是算上大数据那些服务器,估计更多;尤其天文计算,化学实验模拟,爆炸实验模拟等等。

文|聪明小生 校对|李蓉婳

近年来,随着互联网时代的不断发展,数据已经成为一种资源,对于企业来说,数据也是一家企业的核心之一。像华为、腾讯、阿里等知名的互联网 科技 企业,背后拥有大量的用户,每天有海量的数据需要进行处理和储存,数据的重要性不言而喻。

每一个互联网 科技 企业的背后,至少都会有一个数据中心。2015年,首个国家级数据中心“灾备中心”落户贵州, 从那之后,贵州成为各大互联网 科技 企业建造数据中心的首选省份,华为、腾讯、阿里等国内企业,甚至是美国的苹果公司,纷纷在此落户。

2018年4月28日,在央视的《新闻直播间》栏目中,腾讯贵安七星数据中心首次向外展示施工实景,这个山洞用来放置腾讯业务最核心的数据;在2018年5月26日的数博会上,阿里云正式宣布,将在贵阳建成全球备案中心与技术支持中心;华为则更加厉害,12月20日,也就是前几天,华为云计算技术有限公司贵安新区开园仪式在贵州贵安新区举行,这标志着华为云历时5年建设完成的数据中心正式商用,未来将达到100万台服务器规模。

说到贵州,大家的第一印象就是风景宜人,环境优美,但是因为地处西部的缘故,经济不是很发达。 那么这个省份究竟有什么魅力,能吸引这么多互联网 科技 企业在此建数据中心? 笔者认为,最重要的原因有以下两个。

第一、贵州地理位置优越,气候适宜,环境好

数据中心是储存数据用的,因此里面需要放置大量的设备,而且常年都在运转,而设备一多就要面临如何处理设备的散热问题,如果机器连续高温运转,就很有可能出现故障,不仅带来巨大的经济损失,还有可能危及到数据安全。

为了解决散热问题,微软曾给自家的数据服务器做了一个防水层,然后把服务器投入海中,用海水来散热,但这并不是一个长久之计,毕竟是把服务器放在海里面,时间一长就会损坏服务器的寿命,而且维修起来也比较困难。

而贵州我们都知道,地处云贵高原上,大部分以高原山地为主,冬无严寒夏无酷暑,温差比较小,是一个天然的避暑胜地,同时也有利于数据中心服务器的维护,因此, 这样的气候环境非常适宜大数据服务器运行 。而且,贵州地处西部,距离海洋也比较远,也不会担心遭受台风或者海啸等自然灾害的威胁。

还有一个关键点,数据中心讲究的是安全,贵州山多,山洞也多, 数据中心建造在里面非常隐蔽,山洞的恒温条件也为数据设备的运行提供有利条件。

第二、土地资源、电力资源丰富,为企业节约成本

有人说,既然数据库这么重要,就应该放在北上广深等一线城市,这样才有足够的资金,但是这些地方都有个特点,那便是土地价格贵。数据中心的建造需要大面积的占地,如果是在一二线城市去买这么大一块地,成本就很高了,并且有种大材小用的感觉。 贵州作为欠发达地区,土地价格相对比较低,这样可以节省数据中心的建设成本。

除此之外,电费也是需要考虑的一个重要因素。

一个大型的数据中心,里面的设备在不停工作,就要消耗大量的电力,有数据统计,数据中心建成之后,电力成本会占据全部支出成本的至少50%。

因为地形地势的天然优势,贵州水力资源丰富,有着“南方电池”的美誉,在这里建造数据中心,可以节约电费支出成本,而且贵州欠发达,电费相对来说也比发达地区更加便宜。

华为贵阳渠道业务部相关负责人曾表示, 把大数据基地建在北京,电费可能需要一块钱一度,但是贵阳只需要4毛。 任正非也说到: “华为把全球数据中心放在贵州,一年大概可以节省上亿的电费。”

当然除了以上两个最重要的因素之外,还有其他的一些影响因素,比如说政策。贵州政府知道本省经济不发达,所以推出一些优惠政策,以此吸引这些互联网 科技 公司落户贵州,这些条件都可以为企业节省成本。

马云曾说过,十年二十年之后,世界上最珍贵、最稀缺的资源不是石油,而是数据,大数据是用户的行为数据,未来谁掌握了更多的数据,谁就更有竞争力。

如今贵州利用自己的优势,吸引大量的互联网 科技 企业落户,得益于此,贵州的数字经济已经连续多年位居全国第一,创造了大量的就业岗位。

随着越来越多的企业在此落户,未来,贵州说不定能一跃成为西部经济首屈一指的城市,甚至有可能取代北京中关村,成为中国新的“硅谷”,大家觉得呢?


欢迎分享,转载请注明来源:内存溢出

原文地址: https://outofmemory.cn/zz/13312857.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-07-12
下一篇 2023-07-12

发表评论

登录后才能评论

评论列表(0条)

保存