hadoop是干什么用的?

hadoop是干什么用的?,第1张

提供海量数据存储和计算的。需要java语言基础。

Hadoop实现了一个分布式文件系统(Hadoop Distributed File System),简称HDFS。有高容错性的特点,并且设计用来部署在低廉的(low-cost)硬件上;而且它提供高吞吐量来访问应用程序的数据,适合那些有着超大数据集(large data set)的应用程序。

Hadoop的框架最核心的设计就是:HDFS和MapReduce。HDFS为海量的数据提供了存储,而MapReduce则为海量的数据提供了计算。

扩展资料

Hadoop是一个能够让用户轻松架构和使用的分布式计算平台。用户可以轻松地在Hadoop上开发和运行处理海量数据的应用程序。能够对大量数据进行分布式处理的软件框架Hadoop 以一种可靠、高效、可伸缩的方式进行数据处理。

Hadoop 是可靠的,因为它假设计算元素和存储会失败,因此它维护多个工作数据副本,确保能够针对失败的节点重新分布处理。Hadoop 是高效的,因为它以并行的方式工作,通过并行处理加快处理速度。

参考资料:

百度百科-Hadoop

only servers——仅服务器

重点词汇:servers

发音:英 [ˈsɜːvəz]美 [ˈsɜrvərz]

翻译:

n

侍者;发球者;服务器;服务员;(server的复数)

原形: server

短语搭配

fifty-some computer servers

50多个计算机服务器

fifty-some servers

五十个-一些服务器

双语例句

Primary versus read-only server configuration

主服务器配置与只读服务器配置。

Now, the only server that is listed in Static group servers is the failed server

现在,在 Static group servers 中列出的这台服务器即为故障服务器。

You can not designate this server as a front end server because this is the only server in the organization

无法将此服务器指定为前端服务器,因为它是组织中唯一的服务器。

大数据
大数据技术(big data),或称巨量资料,指的是所涉及的资料量规模巨大到无法通过目前主流软件工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的的资讯。(在维克托·迈尔-舍恩伯格及肯尼斯·库克耶编写的《大数据时代》中[2] 大数据指不用随机分析法(抽样调查)这样的捷径,而采用所有数据的方法)大数据的4V特点:Volume(大量)、Velocity(高速)、Variety(多样)、value(价值)
大数据服务器
一台或多台计算机和数据库管理系统软件共同构成了数据库服务器,数据库服务器为客户应用提供服务,这些服务是查询、更新、事务管理、索引、高速缓存、查询优化、安全及多用户存取控制等
小南国永生花


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/zz/12952061.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-29
下一篇 2023-05-29

发表评论

登录后才能评论

评论列表(0条)

保存