csv数据导入Hadoop中的HDFS

csv数据导入Hadoop中的HDFS,第1张

作者 : lly

本文介绍通过使用Hadoop命令的方式将csv数据导入进入HDFS中

具体的环境准备及搭建流程可参考以下文章,本文不再做赘述

基础环境准备:https://blog.csdn.net/supermapsupport/article/details/91443032

Hadoop集群搭建:https://blog.csdn.net/supermapsupport/article/details/91972499

未注册到 iServer的 csv 数据进行分布式分析服务,则需确保在 csv 存放目录下有与其对应的 .meta 文件,该.meta文件包含 csv 数据文件的元信息,所以我们将两个数据一起拷入。以示范数据 newyork_taxi_2013-01_14k.csv 为例,.meta 文件内容为:

 "FieldInfos": [

      {

          "name": "col0",

          "type": "WTEXT"

      } ,

      {

         "name": "col1",

          "type": "WTEXT"

      } ,

      {

   备蔽       "name": "col2",

          "type": "WTEXT"

      } ,

      {

          "name": "col3",

          "type": "INT32"

      } ,

      {

          "name": "col4",

          "type": "WTEXT"

      } ,

      {

   源滚郑       "name": "col5",

          "type": "WTEXT"

      } ,

      {

          "name": "col6",

          "type": "WTEXT"

      } ,

      {

          "name": "col7",

          "type": "INT32"

      } ,

      {

          "name": "col8",

          "type": "INT32"

      } ,

      {

          "name": "col9",

          "type": "DOUBLE"

      } ,

      {

          "name": "X",

          "type": "DOUBLE"

      } ,

      {

          "name": "Y",

          "type": "DOUBLE"

      } ,

      {

          "name": "col12",

          "type": "DOUBLE"

      } ,

      {

       雹颂   "name": "col13",

          "type": "DOUBLE"

      }

  ] ,

  "GeometryType": "POINT",

  "HasHeader": false,

  "StorageType": "XYColumn"

}

1.首先将数据放到opt目录下

2.将示例数据导入到 hdfs 中,启动 hadoop,在 hadoop-2.7.7/bin 中执行

. /hadoop fs -mkdir /input        #创建/input 目录

. /hdfs dfs -put /opt / newyork_taxi_2013-01_14k.csv /input/ #将 taxi 数据导入到/input 目录中

. /hdfs dfs -put /opt / newyork_taxi_2013-01_14k.meta /input/

3.导入完成后,可以使用如下命令查看

. /hadoop fs -ls /input

4.输出结果如下

额,是指什么?啥叫将hdfs上袜孙友的文件导入数据

上告槐传 hdfs dfs -put

下载 hdfs dfs -get

如果已经存在的文件似乎是不能修改的,比如HIVE输出凯桥结果到目录就是覆盖(而不是修改)。


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/tougao/12289219.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-24
下一篇 2023-05-24

发表评论

登录后才能评论

评论列表(0条)

保存