csv数据导入Hadoop中的HDFS_教程

作者 : lly

本文介绍通过使用Hadoop命令的方式将csv数据导入进入HDFS中

具体的环境准备及搭建流程可参考以下文章，本文不再做赘述

基础环境准备：https://blog.csdn.net/supermapsupport/article/details/91443032

Hadoop集群搭建：https://blog.csdn.net/supermapsupport/article/details/91972499

未注册到 iServer的 csv 数据进行分布式分析服务，则需确保在 csv 存放目录下有与其对应的 .meta 文件，该.meta文件包含 csv 数据文件的元信息，所以我们将两个数据一起拷入。以示范数据 newyork_taxi_2013-01_14k.csv 为例，.meta 文件内容为：

"FieldInfos": [

{

"name": "col0",

"type": "WTEXT"

} ,

{

"name": "col1",

"type": "WTEXT"

} ,

{

备蔽 "name": "col2",

"type": "WTEXT"

} ,

{

"name": "col3",

"type": "INT32"

} ,

{

"name": "col4",

"type": "WTEXT"

} ,

{

源滚郑 "name": "col5",

"type": "WTEXT"

} ,

{

"name": "col6",

"type": "WTEXT"

} ,

{

"name": "col7",

"type": "INT32"

} ,

{

"name": "col8",

"type": "INT32"

} ,

{

"name": "col9",

"type": "DOUBLE"

} ,

{

"name": "X",

"type": "DOUBLE"

} ,

{

"name": "Y",

"type": "DOUBLE"

} ,

{

"name": "col12",

"type": "DOUBLE"

} ,

{

雹颂 "name": "col13",

"type": "DOUBLE"

}

] ,

"GeometryType": "POINT",

"HasHeader": false,

"StorageType": "XYColumn"

}

1.首先将数据放到opt目录下

2.将示例数据导入到 hdfs 中，启动 hadoop，在 hadoop-2.7.7/bin 中执行

. /hadoop fs -mkdir /input #创建/input 目录

. /hdfs dfs -put /opt / newyork_taxi_2013-01_14k.csv /input/ #将 taxi 数据导入到/input 目录中

. /hdfs dfs -put /opt / newyork_taxi_2013-01_14k.meta /input/

3.导入完成后，可以使用如下命令查看

. /hadoop fs -ls /input

4.输出结果如下

delete对应的行。

删除.META.表项与删除table中一行一样，输入：

delete '.META.',row,column

delete后加上3个参数，分别是：表消培、行、列（如 a:b）就能删除对扒桥携应行。

之春伏后重启hbase，报错就会消失。

欢迎分享，转载请注明来源：内存溢出

原文地址: http://outofmemory.cn/tougao/12294067.html

csv数据导入Hadoop中的HDFS

发表评论

评论列表（0条）