阿里云首席技术王坚简历

阿里云首席技术王坚简历,第1张

阿里云首席技术王坚简历为阿里软件的首席技术官。浙江省第十三届人民代表大会代 王坚博士加入阿里巴巴之前任微软亚洲研究院常务副院长,负责用户界面、机器学习、大规模数据处理等研究及 北京adCenter 实验室,曾负责研究与数据驱动软件相关的关 键技术和系统(包括 SQM Watson的数据架构及分析), 微软广告平台的相关技术及无缝个人计算。王坚博士负责所 研发的 SQM 大规模数据处理处理系统被用来帮助 Office 2007 以及几十个微软产品的开发。 从业经历 在1999年加入微软亚洲研究院之前,王坚博士曾为浙 江大学心理学系教授、博士生导师,兼任浙江大学工业心理 学国家专业实验室主任。 王坚博士于1962年月10 月出生,1984 年杭州大学心 理系学士,1990 年杭州大学心理系博士。1992 年晋升为教 授,1993 年列为博士生导师。1996 年为美国纽约州立大学 心理系访问教授,讲授研究生必修课认知心理学。1994-1998 年杭州大学心理系系主任,1998 年入选浙江省“151”人才工 程。1999 年加入微软亚洲研究院任常务副院长;王坚博士是 中国计算机学会常务理事,2008 年被中国计算机学会授予学 会杰出贡献奖并被中国计算机学会YOCSEF 评选为“中国IT 十大杰出青年”。

王坚博士也是美国计算机学会会刊 (Communications 月加盟阿里巴巴集团担任首席架构师一职,帮助阿里巴巴集团建立世 界级的技术团队,并负责集团技术架构以及基础技术平台建 设。2009 月,他又被指派为阿里软件的首席技术官。重大作为 “任何一个城市的摄像头,每天产生的视频都要至少一百万天才能看完,但这些数据却从来没有被当作资源。”最早 提出城市大脑的王坚在深圳再次呼吁,要把数据变成城市治 理最重要的资源。 日,阿里巴巴集团技术委员会主席王坚受邀在由工业和信息化部、深圳市人民 共同主办的新一 代信息技术产业发展高峰论坛上分享对城市大脑项目的实 践和思考,本次论坛在第五届电子信息博览会期间举行。“我 们喊了这么多年的智慧城市,忽然发现没有大脑,智慧无从 谈起。”王坚介绍了城市大脑的缘起,“一个有数据大脑的城 市,才能真正成为可持续发展的城市。” 王坚同时强调王坚简介,中国的城市发展今天面临着前所未有的挑战,没有经验可以借鉴,这就要求我们必须自己解决问 题。“城市大脑是中国为世界所做的重要探索,它将成为一个 重要的城市基础设施,就像电网;而数据也将成为城市治理 最重要的资源,超过土地。

”马云评王坚 第一次见到王坚博士时,我震撼于他对互联网技术未来发展的理解,有一种相见恨晚的感觉。 第一次在集团战略会议上听到博士谈未来数据时代,惊叹于他对数据技术的理解和执着,正因如此,阿里才有了 如今的技术布局。 第一次听博士提出要进行YunOS的研发时,我几乎是 愤怒地惊讶于他的胆识。 第一次听到大家痛诉云手机有多烂的时候,我看到了博士及其团队的顽强。 第一次发生Hadoop(一个开发和运行处理大规模数据的软件平台)和云梯技术之争的时候,我惊喜地看见了一个 了不起的、绝对负责的技术***应有的科学精神和坚持。 大家对于博士的管理方式、沟通方式和执行手法提出过批评,也进行过考量,但无论如何,我们看到的始终是个 谦虚、纯洁,而又积极向上的大男孩。 博士是人不是神,博士的不足大家都知道,我了解的也并不比大家少;但博士了不起的地方,估计很少有人知道。 假如,10年前我们就有了博士,今天阿里的技术可能 会很不一样。 假如,我们的工程师、产品人员和运营服务人员已经具备真正的合作伙伴思想王坚简介,那么阿里的明天会更不一样。 假如,我们的博士是程序员出身,那么阿里的CTO(首席技术官)可能和任何公司的CTO 毫无区别。

假如,一个乐队的指挥需要精通各种乐器才可以当指挥,那么阿里集团的许多高管都要下岗了。 阿里集团没有人天生可以胜任CEO(首席执行官)、 CFO(首席财务官)、CPO(首席产品官)……阿里的了不起 之处就在于我们可以把一个看起来肯定做不了啥“O”的人变 成了独特的“O”! 感谢大家对博士提出的批评,正是这些批评使得博士更加完美。 阿里会把一个心理学博士变成出色的CTO,就像美国会把里根这个演员变成总统一样。 博士能有今天,不光是因为他本人的天赋和努力,更因为你我的支持和帮助。希望大家今后能够继续支持博士的 工作。

在学习了一门技术之后,找到一个合适的职业发展方向是很重要的。

这篇文章是介绍高薪职业方向的程序员的职业发展方向,你喜欢哪个方向就朝哪个方向发展!

1、架构师

这职位听起来很高大上,但它需要强大的技术实力和深厚的技术积累。建筑师的成长需要经验、技术的广度和深度。设计优雅、灵活、扩展性强的架构是架构师的主要工作。

您不能只追求最新最热门的技术,还需要考虑现有团队的能力和技术的成熟度。

人员需求:★

难度指数:★★★★★

2、Java后端程序员

后端程序员主要实现业务逻辑,为前端使用提供接口。

Java是最常用,但也有其他相对小众,比如Python,RubyonRails、PHP等,还有就是PHP,小网站经常用,不论哪个语言,都不难学,这一块的需求是比较大的。

人员需求:★★★★★

难度指数:★★★

3、WEB前端程序员

主要是JavaScript、CSS、jQuery等,近几年来,我们关注浏览器端的用户体验,浏览器端越来越耀眼,所以也非常流行。

人员需求:★★★★★

难度指数:★★★

4、手机端程序员

它主要是Android、iOS,因为移动互联网的发展,现在也非常流行,需求大,其中IOS门槛高,程序员相对较少,但ios程序员薪水高一些。

人员需求:★★★★

难度指数:★★★★

5、系统编程程序员

有的需求复杂,有的需求简单,需要支持大量的用户,大量的并发,如淘宝的“双11”、微信的春节红包。

需要做的虚拟化、云计算、分布式处理,支持系统级扩展。对于海量数据,需要做大数据分析,从中提取有价值的信息,比如Hadoop。由于需要做 *** 作系统,数据库,服务器系统的定制开发,甚至使自己的一套,小企业一般不具备这样的技术能力,主要是BAT这样的公司都在做。人才的需求不是很大,程序员而言,你需要不断学习,在一个区域深入钻研。

人员需求:★★

难度指数:★★★★★

6、安全

在网络时代,一不小心你的信息就可能被泄露,所以,安全变得越来越重要。所以仅仅实现功能和性能是远远不够的。许多公司,特别是BAT,非常重视安全。当然,这个方向也需要对技术进行深入研究。

人员需求:★★

难度指数:★★★★★

7、测试

这在技术上的要求并不是很高,但是它需要测试知识、能够设计测试用例、准备测试数据和执行测试的能力。

现在敏捷开发很流行,测试还需要知道开发知识,至少需要开发一些自动化脚本。因为女生比较细心,所以很多女生都转到了测试这个岗位。一个优秀的测试人员:不仅能出色的完成自己的工作,还能参与设计开发讨论,能够从测试角度提出问题,帮助开发人员提升软件质量!

8、数据库管理员

几乎所有的项目都需要的支持,那种大型项目,就有一个岗位——DBA。他需要深入的掌握专业的数据库知识,进行数据库管理,可以帮助开发团队设计数据库开发,并找出性能瓶颈,性能优化。

程序员简单点就是开发各种软件和网站的,您说的前后端就像显示器和主机,显示器就是前端,主机就是后端,显示器负责显示图像给用户看,主机负责运算逻辑,希望这么说您能理解!

程序员。顾名思义,这是一个,用电脑为工具的工作的人,没有电脑他们就会生存不下去。

具体可以提现在,需要写代码,实现不同的效果。

更多地,可以关注一下培训机构,如北大青鸟、中公优就业、达内。

程序员就是写代码的,这么跟你说吧,悟空问答就是由程序员做出来的一款APP和网站,虽然你不知道是怎么做出来的,但是它的确是由广大程序员做出来的。

在网上看了大家的回答就是几个英文字母对我们这些零基础的人看都看不懂。就这么说吧,程序员是不是做网页的?是不是通过代码让网页上面的每个按钮(或者说连接实现它的功能)比如百度问问上面的我点一下提问就d出一个网页,我点一下问题补充就d出一个东西,再者我点一下提交就能提交了?希望那个大神用这种简单的方式帮我讲讲程序员到底是干什么的。特别是前端和后端分开讲谢谢了

首先我们应该更具体的理解这样一个现象,为什么流行的技术框架会被淘汰。谈到淘汰,常见两种情况:

第一:应用模式被淘汰了,例如:BB机,功能机,最终被智能机淘汰,胶卷被数码相机淘汰,即便诺基亚的功能机做得再完美,也会被淘汰。软件方面例如:终端的字处理,邮件收发等应用软件被视窗应用软件淘汰。

第二:技术升级,新技术弥补了老技术的缺陷,并且引入了更多有优势的功能。例如:Springframework的横空出世,配合Hibernate,在具有同样功效的情况下,解决了EJB的部署复杂,体态臃肿,计算效率低,用灵活性,面向程序员的友好性,淘汰了曾经企业级经典的EJB。

那么对于Hadoop分布式文件系统(HDFS),我们要讨论它的淘汰可能性,淘汰时间,首先我们就要看它为什么要被淘汰的因素。从模式上,分布式文件系统是大数据存储技术极为重要的一个领域,我们还看不到分布式文件系统有被淘汰的任何理由,那么我就再看技术升级是否有淘汰它的可能性。

谈技术升级,首先要看HDFS的缺点,然后再看这种缺点的解决办法,是否会带来新的技术框架,然后让HDFS埋进历史的垃圾堆。

HDFS为集中式协调架构,namenode若是单节点,部署并不复杂,但是namenode作为单节点无法可靠的运行在生产环境,必须对namenode实现双机HA,那么部署复杂度就变得极高,这时候需要在namenode,datanode的基础上再引入namenode active,namenode standby的概念,需要引入QJM的元数据共享存储并基于Paxos做一致性协调,另外需要引入ZKFC和ZooKeeper,解决主备选举,健康探测,主备切换等 *** 作。

因此HDFS的部署复杂度完全是因为namenode HA导致的。这是集中式管理的分布式架构一个原生问题,如果在这个地方进行优化的话,那么就是简化QJM,ZKFC,ZooKeeper的多组服务,用一组服务来代替,但是namenode和datanode的分布式数据块的读写,复制,恢复机制,目前看非常成熟,高效,这是核心问题,并不是缺点,不需要更具颠覆性的优化。

由于namenode在内存中记录了所有数据块(block 默认128M)的信息,索引了数据块与datanode的关系,并且构建了文件系统树,因此可想而知namenode的元数据内存区是大量占用内存,这是没有上限的。对于较大型数据存储项目,例如上百个datanode节点和上千万个数据块的容量来说,元数据在namenode的内存大概能控制在32G以内,这是还没问题的,但是对于构建海量数据中心的超大型项目,这个问题就好像达摩克斯之剑,首先堆内存超过临界范围导致的内存寻址性能问题不说,一旦namenode内存超限到单机内存可承载的物理上最大承受范围,整个hdfs数据平台将面临停止服务。

这个问题的本质还是Google设计GFS时候采用粗放的实用主义,先把元数据都交给主节点在内存中节制,超大问题以后再解决。目前Google的GFS2设计上,已经将元数据在内存中迁移至了BigTable上,那么问题就来了:“BigTable基于GFS,而GFS2的元数据基于BigTable”?有点鸡生蛋还是蛋生鸡的自相矛盾。是的,看似矛盾实质上是架构的嵌套复用,可以这么去解读:GFS2是基于<基于GFS的BigTable的元数据存储>的下一代GFS架构。用BigTable的k-v存储模型放GFS2的元数据,虽然没有内存高效,但是够用,而且可以无限存储,用BigTable专门存储元数据形成的k-v记录最终保存成GFS数据块,因此在GFS的元数据内存中只需少量的内存占用,就能支撑天量的真正应用于数据块存储的GFS2元数据。

基于GFS2的设计思想,我相信下一代HDFS应该也是这样的方案去解决元数据的内存瓶颈问题,也就是基于<基于HDFS的HBase的元数据存储>的下一代HDFS架构。那么HDFS的元数据瓶颈问题将被彻底解决,很难看到比这更具优势的替代性技术框架了。

如下图所示:

副本数默认为3最大的问题就是占空间,这几乎是所有传统分布式文件系统(DFS)的通病。因此HDFS集群的默认空间利用率只有333%,这么低的利用率显然不符合一些场景,例如长期的冷数据备份,那么有没有更好的方式呢?是有的,目前比较成熟的方案就是纠删码技术,类似raid5,raid6,HDFS 30版本以后支持这种模式,叫做Erasure Coding(EC)方案。

HDFS是怎么通过EC方案解决磁盘利用率的问题呢?我们先聊点比较硬的原理,说说EC方案之一的条形布局:

首先数据文件写的时候会向N个节点的块(Block)依次写入,N个Block会被切成多组条(stripe 1 stripe n),如果分布式环境有五个存储节点(DataNode),那么就把stripe切成3个单元(cell),然后再根据这3个cell计算出2个校验cell,然后这5个cell(3个data+2个parity)分别写入5个Block中。数据条就这么依次轮巡的方式,将校验块的位置轮换存储在不同Block上,直至写满,这样校验块的分布可以更均匀。

其次再说取数据,取数据每次只从3个DataNode中各取出1个cell,如果这3个cell都是数据cell,那么就成功拿到一组数据条stripe,如果有一个cell是校验cell,那么就能通过校验cell和另外2个数据cell计算出第3个数据cell,完成数据条stripe的组合。这种情况下,即便是5个datanode节点有2个datanode宕机了,另外3个datanode也能通过校验码计算完成剩余2个节点的数据,这就是利用纠删码技术实现数据冗余的原理。

通过这种方式,我们就比传统2副本50%,3副本333%的多副本模式要省空间,EC中2+1可以达到667%的磁盘利用率,例子是3+2可以达到60%的磁盘利用率

但是其问题是特别消耗CPU计算,上面那种读取情况,五分之三的读取数据条时间都要进行校验码计算。因此可以利用Intel CPU推出的ISA-L底层函数库专门用于提升校纠删码算法的编解码性能。通常情况下,纠删码用于冷数据的冗余,也就是不经常访问,但又必须联机存储以备查询的数据。除了磁盘利用率,多副本方式用空间换效率的方式肯定是最好,没什么问题。

以上就是关于阿里云首席技术王坚简历全部的内容,包括:阿里云首席技术王坚简历、程序员到底是做什么的、Hadoop分布式文件系统(HDFS)会不会被淘汰等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/zz/9798912.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-02
下一篇 2023-05-02

发表评论

登录后才能评论

评论列表(0条)

保存