win7怎么安装hadoop?谢谢!

win7怎么安装hadoop?谢谢!,第1张

环境及软件准备:

win7(64位)

cygwin 1.7.9-1

jdk-6u25-windows-x64.zip

hadoop-0.20.2.tar.gz

1.安装jdk,并置java环境变量包括:JAVA_HOME,PATH,CLASSPATH

2.安装Hadoop,版本为0.20.2,我是直接放到/home目录下,并解压

tar –zxvf

hadoop-0.20.2.tar.gz

3.配置Hadoop,需要修改hadoop的配置文件,它们位于conf子目录下,分别是hadoop-env.sh、core-site.xml、hdfs-site.xml

和mapred-site.xml

(1) 修改hadoop-env.sh:

只需要将JAVA_HOME 修改成JDK 的安装目录即可

export

JAVA_HOME=/cygdrive/d/java/jdk1.6.0_25

(注意:路径不能是windows 风格的目录d:\java\jdk1.6.0_25,而是LINUX

风格/cygdrive/d/java/jdk1.6.0_25)

(2) 修改core-site.xml:(指定namenode)

fs.default.name

hdfs://localhost:9000

(3)修改hdfs-site.xml(指定副本为1)

dfs.replication

1

(4) 修改mapred-site.xml (指定jobtracker)

mapred.job.tracker

localhost:9001

4.验证安装是否成功,并运行Hadoop

(1) 验证安装

$ bin/hadoop

Usage: hadoop [--config confdir] COMMAND

where COMMAND is one of:

namenode -format format the DFS filesystem

secondarynamenode run the DFS secondary namenode

namenode run the DFS namenode

datanode run a DFS datanode

dfsadmin run a DFS admin client

mradmin run a Map-Reduce admin client

fsck run a DFS filesystem checking utility

fs run a generic filesystem user client

balancer run a cluster balancing utility

jobtracker run the MapReduce job Tracker node

pipes run a Pipes job

tasktracker run a MapReduce task Tracker node

job manipulate MapReduce jobs

queue get information regarding JobQueues

version print the version

jar run a jar file

distcp copy file or directories recursively

archive -archiveName NAME * create a hadoop archive

daemonlog get/set the log level for each daemon

or

CLASSNAME run the class named CLASSNAME

Most commands print help when invoked w/o parameters.

(2) 格式化并启动Hadoop

bin/hadoop namenode –format

bin/start-all.sh

(3) 查看Hadoop

命令行查看:

$ jps

1608 NameNode

6572 Jps

6528 JobTracker

(注意:win7下cygwin中DateNode和TaskTracker进程是无法显示的,好像是cygwin的问题)

在windows下安装Hadoop时遇到如下问题:

1.windows下启动hadoop提示(hadoop version)

 JAVA_HOME is incorrectly set.

原因:目录的dos文件名模式下的缩写,长于8个字符的文件名和文件夹名,都被简化成前面6个有效字符,后面~1,有重名的就 ~2,~3,

解决方法:在java_home的路径里用PROGRA~1 代替 C:\Program Files

例:java_home=C:\PROGRA~1\Java\jdk1.8.0_121

2.windos的 cmd命令里面的call必须定格写。

解决方法:将Hadoop安装目录下的bin目录下的所有的*.cmd文件中的call语句前边的 空格删掉。

好。步骤如下

1、下载安装JDK,以及Eclipse

具体看此链接:http://blog.csdn.net/weixuehao/article/details/17715793

2、新建JAVA Project

3、去cloudera网站下载hadoop的CDH3u6版本。将起解压到win7的某个目录

4、选中OperateHDFS,右击,选择“property”,d出右侧的窗口;

选择“Java Build Path” —— “Libraries” —— Add External Jars

5、到上面的画面后,下面就是选择开发hadoop程序时,用到的一些jar包

将lib文件夹下的所有的jar包,添加进去;将红框内的jar包,安装进去。

6、创建配置文件夹

7、将core-site.xml,hdfs-site.xml,mapred-site.xml放入到此文件夹中。

8、右键->属性 进行如下 *** 作,添加刚刚创建conf文件夹

配置搞定!

写代码的过程中要写入的namenode和jobtracker地址(修改为你自己的)

在你的代码中,加入如下代码就可以了

Configuration conf = new Configuration();

conf.set("fs.default.name","192.1.1.2:9000")

conf.set("mapred.job.tracker","192.1.1.2:9001")


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/tougao/9955346.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-03
下一篇 2023-05-03

发表评论

登录后才能评论

评论列表(0条)

保存