win7(64位)
cygwin 1.7.9-1
jdk-6u25-windows-x64.zip
hadoop-0.20.2.tar.gz
1.安装jdk,并置java环境变量包括:JAVA_HOME,PATH,CLASSPATH
2.安装Hadoop,版本为0.20.2,我是直接放到/home目录下,并解压
tar –zxvf
hadoop-0.20.2.tar.gz
3.配置Hadoop,需要修改hadoop的配置文件,它们位于conf子目录下,分别是hadoop-env.sh、core-site.xml、hdfs-site.xml
和mapred-site.xml
(1) 修改hadoop-env.sh:
只需要将JAVA_HOME 修改成JDK 的安装目录即可
export
JAVA_HOME=/cygdrive/d/java/jdk1.6.0_25
(注意:路径不能是windows 风格的目录d:\java\jdk1.6.0_25,而是LINUX
风格/cygdrive/d/java/jdk1.6.0_25)
(2) 修改core-site.xml:(指定namenode)
fs.default.name
hdfs://localhost:9000
(3)修改hdfs-site.xml(指定副本为1)
dfs.replication
1
(4) 修改mapred-site.xml (指定jobtracker)
mapred.job.tracker
localhost:9001
4.验证安装是否成功,并运行Hadoop
(1) 验证安装
$ bin/hadoop
Usage: hadoop [--config confdir] COMMAND
where COMMAND is one of:
namenode -format format the DFS filesystem
secondarynamenode run the DFS secondary namenode
namenode run the DFS namenode
datanode run a DFS datanode
dfsadmin run a DFS admin client
mradmin run a Map-Reduce admin client
fsck run a DFS filesystem checking utility
fs run a generic filesystem user client
balancer run a cluster balancing utility
jobtracker run the MapReduce job Tracker node
pipes run a Pipes job
tasktracker run a MapReduce task Tracker node
job manipulate MapReduce jobs
queue get information regarding JobQueues
version print the version
jar run a jar file
distcp copy file or directories recursively
archive -archiveName NAME * create a hadoop archive
daemonlog get/set the log level for each daemon
or
CLASSNAME run the class named CLASSNAME
Most commands print help when invoked w/o parameters.
(2) 格式化并启动Hadoop
bin/hadoop namenode –format
bin/start-all.sh
(3) 查看Hadoop
命令行查看:
$ jps
1608 NameNode
6572 Jps
6528 JobTracker
(注意:win7下cygwin中DateNode和TaskTracker进程是无法显示的,好像是cygwin的问题)
在windows下安装Hadoop时遇到如下问题:
1.windows下启动hadoop提示(hadoop version)
JAVA_HOME is incorrectly set.
原因:目录的dos文件名模式下的缩写,长于8个字符的文件名和文件夹名,都被简化成前面6个有效字符,后面~1,有重名的就 ~2,~3,
解决方法:在java_home的路径里用PROGRA~1 代替 C:\Program Files
例:java_home=C:\PROGRA~1\Java\jdk1.8.0_121
2.windos的 cmd命令里面的call必须定格写。
解决方法:将Hadoop安装目录下的bin目录下的所有的*.cmd文件中的call语句前边的 空格删掉。
好。步骤如下1、下载安装JDK,以及Eclipse
具体看此链接:http://blog.csdn.net/weixuehao/article/details/17715793
2、新建JAVA Project
3、去cloudera网站下载hadoop的CDH3u6版本。将起解压到win7的某个目录
4、选中OperateHDFS,右击,选择“property”,d出右侧的窗口;
选择“Java Build Path” —— “Libraries” —— Add External Jars
5、到上面的画面后,下面就是选择开发hadoop程序时,用到的一些jar包
将lib文件夹下的所有的jar包,添加进去;将红框内的jar包,安装进去。
6、创建配置文件夹
7、将core-site.xml,hdfs-site.xml,mapred-site.xml放入到此文件夹中。
8、右键->属性 进行如下 *** 作,添加刚刚创建conf文件夹
配置搞定!
写代码的过程中要写入的namenode和jobtracker地址(修改为你自己的)
在你的代码中,加入如下代码就可以了
Configuration conf = new Configuration();
conf.set("fs.default.name","192.1.1.2:9000")
conf.set("mapred.job.tracker","192.1.1.2:9001")
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)