记一次替换HadoopHDFSHBASE的磁盘_随笔

记一次替换Hadoop/HDFS/HBASE的磁盘记一次替换Hadoop/HDFS/Hbase的磁盘 1. 需求

公司近几个月业务增长很快，数据量也大幅增长，但是存储数据的磁盘眼看就要满载，因此主管让我迁移数据，并且给我提了一下几个需求：

2. 方案

参考了(百度了）很多资料后的解决思路：
利用Hadoop副本的机制，集群的副本数是3，先停一个节点的datanode，因为其他两个副本都在其他节点上，不影响hadoop的正常运行，然后修改datanode的磁盘存储目录重启，最后进行副本补全，等副本100%补全后进行下一台节点的磁盘替换。

3. 测试环境实施

 
  dfs.datanode.data.dir
  file:///xdata/hadoop/hdfs/data

启动datanode hadoop-daemon.sh start datanode
检验磁盘是否成功替换：http://ip:50070
运行hadoop fs -setrep -w 3 -R /, 重新生成副本，执行完后不断刷新上面的页面就会发现新磁盘的占用量不断上升。
通过观察http://ip:50070/fsck这个网页来确保副本是否同步完成。如果遇到访问某个目录被拒绝，就执行hdfs dfs -chmod -R 755 目录给文件授权并重新执行第6步的命令，直到网页的所有副本同步完成，即下图的平均副本数达到3。
等上面数据恢复完后替换下一个节点的磁盘，重复上面的步骤。

4. 参考资料

从Hadoop集群中移除一块磁盘的 *** 作

欢迎分享，转载请注明来源：内存溢出

记一次替换HadoopHDFSHBASE的磁盘