win7怎么安装hadoop?谢谢！_教程

环境及软件准备：

win7（64位）

cygwin 1.7.9-1

jdk-6u25-windows-x64.zip

hadoop-0.20.2.tar.gz

1.安装jdk，并置java环境变量包括：JAVA_HOME，PATH，CLASSPATH

2.安装Hadoop，版本为0.20.2，我是直接放到/home目录下，并解压

tar –zxvf

hadoop-0.20.2.tar.gz

3.配置Hadoop，需要修改hadoop的配置文件，它们位于conf子目录下，分别是hadoop-env.sh、core-site.xml、hdfs-site.xml

和mapred-site.xml

(1) 修改hadoop-env.sh：

只需要将JAVA_HOME 修改成JDK 的安装目录即可

export

JAVA_HOME=/cygdrive/d/java/jdk1.6.0_25

（注意：路径不能是windows 风格的目录d:\java\jdk1.6.0_25，而是LINUX

风格/cygdrive/d/java/jdk1.6.0_25）

(2) 修改core-site.xml：（指定namenode）

fs.default.name

hdfs://localhost:9000

(3)修改hdfs-site.xml（指定副本为1）

dfs.replication

(4) 修改mapred-site.xml （指定jobtracker）

mapred.job.tracker

localhost:9001

4.验证安装是否成功，并运行Hadoop

(1) 验证安装

$ bin/hadoop

Usage: hadoop [--config confdir] COMMAND

where COMMAND is one of:

namenode -format format the DFS filesystem

secondarynamenode run the DFS secondary namenode

namenode run the DFS namenode

datanode run a DFS datanode

dfsadmin run a DFS admin client

mradmin run a Map-Reduce admin client

fsck run a DFS filesystem checking utility

fs run a generic filesystem user client

balancer run a cluster balancing utility

jobtracker run the MapReduce job Tracker node

pipes run a Pipes job

tasktracker run a MapReduce task Tracker node

job manipulate MapReduce jobs

queue get information regarding JobQueues

version print the version

jar run a jar file

distcp copy file or directories recursively

archive -archiveName NAME * create a hadoop archive

daemonlog get/set the log level for each daemon

CLASSNAME run the class named CLASSNAME

Most commands print help when invoked w/o parameters.

(2) 格式化并启动Hadoop

bin/hadoop namenode –format

bin/start-all.sh

(3) 查看Hadoop

命令行查看：

$ jps

1608 NameNode

6572 Jps

6528 JobTracker

（注意：win7下cygwin中DateNode和TaskTracker进程是无法显示的，好像是cygwin的问题）

在windows下安装Hadoop时遇到如下问题：

1.windows下启动hadoop提示（hadoop version）

JAVA_HOME is incorrectly set.

原因：目录的dos文件名模式下的缩写，长于8个字符的文件名和文件夹名，都被简化成前面6个有效字符，后面~1，有重名的就 ~2,~3,

解决方法：在java_home的路径里用PROGRA~1 代替 C:\Program Files

例：java_home=C:\PROGRA~1\Java\jdk1.8.0_121

2.windos的 cmd命令里面的call必须定格写。

解决方法：将Hadoop安装目录下的bin目录下的所有的*.cmd文件中的call语句前边的空格删掉。

好。步骤如下

1、下载安装JDK，以及Eclipse

具体看此链接：http://blog.csdn.net/weixuehao/article/details/17715793

2、新建JAVA Project

3、去cloudera网站下载hadoop的CDH3u6版本。将起解压到win7的某个目录

4、选中OperateHDFS，右击，选择“property”，d出右侧的窗口；

选择“Java Build Path” —— “Libraries” —— Add External Jars

5、到上面的画面后，下面就是选择开发hadoop程序时，用到的一些jar包

将lib文件夹下的所有的jar包，添加进去；将红框内的jar包，安装进去。

6、创建配置文件夹

7、将core-site.xml,hdfs-site.xml,mapred-site.xml放入到此文件夹中。

8、右键->属性进行如下 *** 作，添加刚刚创建conf文件夹

配置搞定！

写代码的过程中要写入的namenode和jobtracker地址(修改为你自己的)

在你的代码中，加入如下代码就可以了

Configuration conf = new Configuration()；

conf.set("fs.default.name","192.1.1.2:9000")

conf.set("mapred.job.tracker","192.1.1.2:9001")

欢迎分享，转载请注明来源：内存溢出

原文地址: http://outofmemory.cn/tougao/9955346.html

win7怎么安装hadoop?谢谢！

发表评论

评论列表（0条）