大数据服务无处不在 Cloudera又该如何应变?
2016年11月10日,笔者有幸采访到Cloudera云计算工程副总裁Vikram Makhija先生,就大数据与云计算如何结合这个问题进行了探讨,通过此次采访,使得我对Cloudera的云策略有了更深层次的了解。
大数据时代急需Hadoop平台
对于大数据这个概念,相信现在对于任何人都不陌生。我们生活在一个数据爆炸的时代,据预测,到了2020年,全球人口将达到77亿,移动终端能够达到1000亿,产生的数据量将更是达到40ZB。
当然,现在人们谈到大数据,总会讲到大数据的4个"V",而人们最看重的是大数据Value(价值),但同样要想得到大数据中的数据价值,成为企业商业模式的推动力,那么就需要解决大数据另外3个"V"的挑战,他们包括Volume(大量)、Velocity(高速)、Variety(多样)。
那么如何从庞大、复杂、多样数据中挖掘出重要的商业价值呢?Hadoop相信大家都听说过了。在大数据产业发展过程中,以Hadoop为代表的开源大数据生态成为大数据和云计算的重要技术支撑,有效推动了开源社区的用户和贡献者,带动了大数据行业的技术进步与商业发展。
由于Hadoop深受客户欢迎,许多公司都推出了各自版本的Hadoop,也有一些公司则围绕Hadoop开发产品。在Hadoop生态系统中,规模最大、知名度最高的公司则是Cloudera,其最早的Hadoop商业刊发版CDH广为人熟知。
云计算让大数据服务无处不在
从2008年创建成立,到2014年进入中国,到如今开始为大量中国客户提供大数据处理服务,Cloudera发展非常快速。值得注意的是,Cloudera还和Intel在开源方面进行合作,在基于开放的Intel平台硬件上做大量优化,让Cloudera产品在英特尔硬件平台发挥更佳的作用。
Hadoop版对于企业客户的价值是什么?Vikram Makhija先生表示:"并不是所有的客户都有能力去自己研发Hadoop产品,但是对Hadoop需求的用户却非常多,我们对针对这些没有能力自己研发Hadoop产品的客户,给他们提供一个安全、稳定、可靠的Hadoop平台,让他们可以轻松的使用Hadoop版本来为自己服务。"
在云计算时代,Cloudera也推出了适合用户采用的结合云的方案,Cloudera可以让客户无论在什么样的云的环境上都可以接受成功。客户采用的无论是公有云或者是私有云,Cloudera都有关于对Hadoop工作运行的支持选择。而且无论是在哪种选择上,客户都能产生最好的结果。
目前,Cloudera逐渐在加强生态建设方面的合作,无论客户在什么云上面Cloudera都能提供服务能力,Cloudera在生态建设方面做了很大努力。目前,Cloudera跟国外的AWS,微软等都有密切的合作,这种合作也会在中国继续为中国客户提供服务。同时,Cloudera也正在与国内的云服务提供商商谈合作。
Cloudera已为云时代准备就绪
值得一提的是,Cloudera在今年又发布了大数据部署和管理工具Cloudera Director 2.0。Vikram Makhija先生表示,新版Cloudera Director简化了在云端执行Hadoop的工作。
Cloudera Director有助于客户更方便地跨各种云环境部署和管理Cloudera Enterprise集群生命周期。客户可以选择用于AWS、谷歌云平台(Google Cloud Platform)和Microsoft Azure的模板,以快速完成配置、增大/缩小集群规模以及终止集群,客户还能够从一个统一的界面监控和管理所有集群。
据Vikram Makhija先生介绍,相对于Cloudera竞争的友商,Cloudera认认为他们在云上管理的工具比他们更加的完善,类似于Cloudera Director这样的部署,Cloudera都是在这里面提供比他们更有竞争能力的管控工具,能够帮助到我们的企业客户去部署自己的大数据平台。
对于很多用户对云的怀疑态度,Vikram Makhija先生表示,其实很多客户对迁移到云都是小心翼翼的,通常是先把一些并不太重要的系统先往云上去迁。但Cloudera的很多客户已经过了那个时期,很多很重要的客户已经把自己核心的业务迁移到云上面,依赖于云和Cloudera公司的服务来支撑他们的核心业务。Cloudera已经为客户上云准备就绪。
关于安全这一块, Cloudera一直是在安全性这方面有很大的投入。大家可以看到Cloudera Navigator一直以来在数据的审计和数据的溯源方面都可以提供这样的功能,包括Cloudera Kerberos验证工具,Cloudera在安全方面提供了全栈的能力。做好大数据平台的安全管控,这也是Cloudera优势的所在。
总结:
可以说,没有大数据的信息,则云计算的计算能力再强大,也难以找到用武之地;没有云计算的处理能力,则大数据技术再出色,也终究难以更好的服务客户。Cloudera将云和大数据很好的结合起来,为客户带来更出色的服务,必将成为大数据行业的首选。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)