对话阿里云李飞飞:关于云原生数据库的五大预判

对话阿里云李飞飞:关于云原生数据库的五大预判,第1张

作者:王慧贤

数据存储、数据分析、数据安全......如今,围绕“数据”的话题越来越多,离人们的生活也越来越近。

从陌生到熟悉,数据不仅“出圈”,甚至已然站在了C位。去年,中央发布的《关于构建更加完善的要素市场化配置体制机制的意见》中明确表示,继土地、劳动力、资本、技术后,数据成为第五大生产要素。

步入信息化时代后,数据库、 *** 作系统与中间件作为计算机最基础的三大软件,支撑着企业的正常运行。

当数据成为生产要素后,必然会迎来爆发式增长,企业的数据存储和处理需求将进一步释放。更重要的是,疫情加快了数字化转型的脚步,更加速了企业的上云速度。

从信息化到数字化,时代的变革,总会带来商业世界的变化。如何在云原生架构下使用数据库,成为企业的痛点和云厂商的机会,亚马逊AWS的CTO Werner Vogels曾多次强调:“数据库是云计算的终极之战。”

在数智化时代,云原生到底意味着什么?云原生数据库和传统数据库相比,核心优势是什么?是否把数据库搬上云就是云原生?基于这些问题,雷锋网与阿里巴巴集团副总裁、阿里云数据库产品事业部负责人李飞飞展开一场对话。

国产云原生数据库,摆脱「切肤之痛」

如今,数据库的商业世界,因为云的出现与发展,分成了两大派系。

一派是以Oracle为代表的传统商用数据库,一派是以国外AWS、国内阿里云为代表的云原生数据库,去“IOE革命”下的产物。

其实,早期较为火热的数据库种类有三种,层次式数据库、网络式数据库和关系型数据库。

在《浪潮之巅》一书中,作者吴军写下了这样的观点:“Oracle 的兴起很大程度上靠的是它最早看到关系型数据库的市场前景,并且在商业模式上优于 IBM。”

因此,在云原生数据库“入世”之前,数据库的天下一直是Oracle的,国内大部分互联网公司都不得不采用Oracle+IBM小型机+EMC的模式来维持正常运营。

高昂的费用,使得对于数据库需求较大的互联网巨头“忍无可忍”。

2009年,阿里巴巴的Oracle RAC 集群节点数达到了创记录的20个。可由于Oracle并没有d性扩展的功能,只能按照峰值流量购买小型机和数据库,导致阿里将业务上涨带来的大部分利润,都支付给了Oracle。

第二年,阿里便开始走上了去“IOE”之路,根据开源MySQL搭建了AliSQL,并顺利经过了淘宝双11的考验,国产云原生数据库算是正式摆脱了“切肤之痛”,逐渐受到市场的真正认可。

另一边,国外的AWS在2015年公布了基于云计算的自研数据库Amazon Aurora。Aurora是一个关系型数据库,可以跨3个可用区域复制6份数据,其最大的特性就是高性能和高可用性。

云计算巨头的入局,让云原生数据库在国内外一步步成为主流。据Gartner预测,到了2021年,云数据库在整个数据库市场中的占比将首次达到50%,到2023年,75%的数据库都要跑在云平台之上。

关于云原生数据库,随着逐步的出圈,也让人们关心的焦点从“是啥?”转变为“还能解决哪些问题?”

但云原生数据库存在着数据孤岛的问题,无法打通多个数据系统的情况下,企业在数据加工和数据管理上就会“压力较大”,甚至在数据安全方面还存在隐患。

传统数据仓库一般基于T+1数据集成构建离线数仓,以支撑企业各项分析与服务。传统方案不但会影响线上业务稳定性,且难以支持企业的实时需求。

因此,在李飞飞看来,云原生数据库已经走到2.0阶段。这个阶段要解决的问题,就是上述存在的痛点。

9月26日,在阿里云数据库创新上云峰会上,阿里云发布了首个一站式敏捷数据仓库解决方案。该方案结合一站式数据管理平台DMS及云原生数据仓库AnalyticDB(简称:ADB),实现了库仓一体的技术架构,提供在线数据实时入仓、T+1周期性快照、按需建仓等能力,数据延时低至秒级,持续赋能业务在线化,使企业的在线数据可以释放出更大的价值。

相较于传统方案,阿里云一站式敏捷数据仓库解决方案有4大核心优势:

1、对业务侧影响小,不会因为数据汇聚集中和实时加工影响业务侧正常运行,CPU、内存占用低于5%;

2、事务顺序和数据准确性有保障,且处理链路短,支持在线数据实时处理落仓,效率更高。数据传输效率100m/s,数据延时在10秒内;

3、支持复杂实时数据加工、计算逻辑;

4、低代码 *** 作,能够大大降低实时数仓的构建难度,提升构建效率的同时,支撑企业数字化转型过程中的各类实时场景。

除了实时统计分析场景外,企业为满足周期性数据分析需求,需建设周期性全量快照。

传统数仓的周期性全量集成方案会对生产业务造成稳定性影响、全量集成时效性差、且无法满足客户针对任意时间点进行数据回溯的业务诉求。

针对T+1周期性集成场景,一站式敏捷数据仓库解决方案支持基于拉链表的T+1全量数据快照,用户通过简单几个步骤,即可按需生成各种周期的全量或增量快照。

此外,业务还可按需进行任意时间点的数据回溯,以快速解决数据异常问题。

谈起未来数据库的发展趋势,李飞飞提到以下五点:

1、云原生+分布式一定是数据库的标配,分布式已经是必选项。分布式数据库由多个相互连接的数据库组合而成,面向用户则是以单个数据库的形态出现。云原生分布式数据库具备易用性、高扩展性、快速迭代、节约成本等特征,从资源池化到d性扩展,再到智能运维,再到离在线一体化,解决企业用户的核心诉求。

2、AI for DB(database,指数据库)和 DB for AI 将是主流趋势。用AI将数据库运维管控智能化,尤其在云原生+分布式这个前提下更重要,因为数据库不仅是内核的能力d性高可用、可拓展性,更重要的是部署后应用和运维的复杂度要大大降低。在数据库里,面对越来越多非结构化的数据,分析能力十分重要。

3、数据的安全可信,在今天这个大环境下变得愈发重要,如何确保整个数据库系统,在处理数据全链路过程中提供加密能力、多方安全计算能力、隐私保护的能力,也是很重要的趋势。

4、多模数据处理能力将越来越重要。比如,新型数据库多模态的处理能力,在新能源 汽车 企业打标签、智能电池化预测等应用场景中,将发挥越来越重要的作用。

5、一份数据,多个数据处理引擎:实现仓库一体、仓库联动、仓库打通,数据之间无缝流转。

以上判断,也从侧面反映出阿里云数据库的走向,这点毋庸置疑。但除此之外,业界最关心的,还有开源。

近半年,国内很多厂商相继提出开源战略,背后缘由显而易见,为了打造生态。就在今年的阿里云峰会上,阿里云智能总裁、达摩院院长张建锋(花名行癫)将2021年阿里云的发展关键词归纳为:做好服务、做深基础、做厚中台、做强生态。

做好服务与生态,成为如今厂商们不约而同的目标,而开源,就是最好的选择。

当雷锋网问到:“未来,阿里云数据库会不会把所有能力都开源?”这一问题时,李飞飞给到的回答是:“不会。”

之所以有这样的回答,是因为对于开源,他有着一些判断和看法。

李飞飞表示,这些部分,本就是阿里云数据库的商业化版本。

事实上,业界大多数的数据库厂商都不会针对自身的核心能力开源,如TiDB的核心管控组件、TiFlash。

与像MongoDB,、Cassandra、CouchDB这些以开源起家的数据库厂商不同,开源只是阿里云数据库的战略,不是阿里云数据库的命脉。

前几年,有业内人士表示,在面向开源时,国产数据库首先需要解决信任以及开源知识产权等问题。“开源会让厂商更加认真思考版权还有专利的问题,事实上,选择开源后,对于数据库厂商提出了更高的要求。”

李飞飞认为,开源只是一种选择,数据库开源成功并不代表着商业化就能够成功,不开源也不能代表厂商不先进。

更准确的说,开源只是一种有效手段。

最终,阿里云数据库希望客户能够通过开源版本把阿里云数据库产品技术快速用起来,并能够参与到技术产品的迭代过程中,在一些高阶能力上,借鉴团队专业能力和阿里云的服务能力,成为良好的商业合作伙伴,这是李飞飞以及阿里云数据库对于开源的一些基本思考。雷锋网雷锋网雷锋网

无需用户自己考虑高可用、备份恢复等问题,而且阿里针对开源的数据库做了部分优化。

另外提供一些诸如监控、告警、备份、恢复、调优的手段。

就是减轻用户在业务无关方面的花销,花小钱省下力气聚焦在自己的业务上。

不是西风压倒东风,而是东风压倒西风!

最近, 马来西亚电商巨头PrestoMall宣布,公司已抛弃甲骨文数据库,转而采用阿里云自主研发的POLARDB云数据库。

为什么要和阿里云POLARDB云数据库牵手?效率更高,成本还更低!

事实上,早在去年12月初,PrestoMall已经完成数据库向阿里云POLARDB的整体迁移,迁移后PrestoMall的整体业务运转流畅,IT成本还下降了40%以上。

而相比于阿里的POLARDB云数据库,甲骨文提供的传统数据库太贵了,也太落后了。

作为马来西亚的第二大电商巨头,PrestoMall这几年发展迅速,3年来的营收增长超过250%,线上流量更是井喷式上涨;这时,PrestoMall却发现一个悲哀的现实:老迈的甲骨文数据库已经有些支撑不起公司的业务发展了,长此以往,公司的整体业务会因为数据库管理落后而拉大和第一大电商lazada的差距。

而已经被阿里收购的商lazada的IT数据为什么运转得那么出色?lazada的整体业务全部搬到阿里云上了啊!

为此, PrestoMall决心跳出甲骨文这个大坑,经过多次考察后,最终选择了和阿里云POLARDB云数据库合作。

因为对于PrestoMall这样的电商巨头而言,阿里POLARDB云数据库的优势非常明显:它采用存储计算分离、软硬件一体化设计,天生是为满足电商业务等大规模业务场景而来的:2019年双11当天,POLARDB创下了每秒8700万次的数据库处理峰值新记录。

在刚刚过去的第十届中国数据库技术大会上,荣获世界 科技 大奖的阿里云POLARDB再次获选“年度最佳创新产品”,实力吊打甲骨文数据库。

PrestoMall此时弃甲骨文数据库而就阿里POLARDB云数据库,不失为一种明智的选择。

如今, 时代的发展如风驰电掣,仿佛就在昨天,甲骨文还是那么的无敌于天下!

上世纪70年代,此前一直为中央情报局设计Oracle数据库的拉里·埃里森创立了“软件开发实验室”,随后,因为那篇著名的数据库论文,拉里·埃里森就以甲骨文数据库为公司的数据库命名。

公司迁入硅谷后,甲骨文的业务获得高速增长,客户中就包括埃里森此前的老雇主中情局。1984年左右,甲骨文进军全球十多个发达国家和地区,并于1986年上市,上市当年,甲骨文的年收入达到5500万美元。

1988年,甲骨文的营收超过1亿美元,成为全球第四大软件巨头。几年后,创始人拉里·埃里森成为仅次于比尔盖茨的世界第二富人。

2000年,世界软件领域的基本格局还是微软、IBM、甲骨文三足鼎立。 到了2013年,甲骨文一举超越IBM,成为仅次于微软的全球第二大软件巨头。

当时,全球所有的互联网巨头,都离不开甲骨文的数据库,比如说,阿里巴巴,它是甲骨文在亚洲的最大客户。

甲骨文业务上的成功也为拉里·埃里森带来巨大的财富,他花在购买游艇、私人飞机上的资本高达数十亿美元, 这哥们平时都是驾着米格29战斗机上班,够拽酷了吧?

2018年的福布斯全球富豪榜上,拉里·埃里森以4200亿美元的身家排在全球第7,个人财富是马云、马化腾的1.5倍。

但是最近这几年,因为拉里·埃里森对云计算的短视,全球数据库市场的形势开始急转直下。

在甲骨文数据库称霸全球时,谷歌、亚马逊、阿里巴巴先后开始 探索 云计算技术。

面对对手们的积极转型,拉里·埃里森还是不以为意,因为甲骨文在数据库方面的优势太大了,像马云所说的:“拿着望远镜也找不到对手”。拉里·埃里森还口出狂言:云计算?我完全搞不懂这些家伙在说些什么,简直是一派胡言!

当别人积蓄全力准备反戈一击、立志取代甲骨文的时候,拉里·埃里森还陶醉在过去的旧梦中不愿醒来,人世间最恐怖的事,莫过于此了!

而正是拉里·埃里森在云计算方面的迟钝和轻视,给了其他友军脱颖而出的机会,追不上形势的甲骨文则开始由盛转衰。

多年后,亚马逊AWS成为全球最大的云计算公司,在亚洲,“不务正业”的王坚领导下的阿里云也在2013年研发出能完美驾驭5000台服务器的“飞天系统”,这意味着偌大的阿里巴巴集团从此再也不需要甲骨文数据库了。

2016年左右,拉里·埃里森终于回过神来,开始布局云计算,但为时已晚:亚马逊AWS已绝尘而去,微软、阿里云在全球范围也在无情吞食甲骨文数据库的市场份额。与此同时,因为公司业务向云计算的全面转型,甲骨文不得不在营收大幅下滑的情况下,还要在全球范围里大规模裁员,以集中优势资源提升云计算业务。

在此过程中,甲骨文不断被一个个重要客户抛弃,最后,连股神巴菲特也决定放弃它了。

2018年下半年,巴菲特曾买入了价值21亿美元的甲骨文股票,但是在持有其股票仅几个月后,巴菲特就将甲骨文股票悉数抛出,这样的 *** 作对于巴菲特是非常罕见的,说明连巴菲特已经看衰甲骨文了:我们知道巴菲特买股票有一个鲜明的特点,买了后就长期持有,从不考虑短期持有,比如说可口可乐,苹果等股票,有些都是长期持有达数十年的。

甲骨文这些年的经历也说明: 这是一个其兴也勃焉、其亡也忽焉的裂变时代,在这个不断变化的时代,你要么优秀,要么出局!

未来,大数据、云计算、AI将成为驱动 社会 发展的核心引擎,那些在自主 科技 的尖端跳舞的公司:亚马逊AWS、阿里云、华为5G、特斯拉新能源车.....它们将以自己的勇气重塑这个世界。

同时,那些看不到未来已来的人,将被这个时代狠狠抛弃!

作者:电商君


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/sjk/9916491.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-03
下一篇 2023-05-03

发表评论

登录后才能评论

评论列表(0条)

保存