文本文件导入到数据库中的几种方法

文本文件导入到数据库中的几种方法,第1张

大型的数据库开发中常常遇到数据源是平面文件(如文本文件)的情况,对于这样的数据源,无法使用数据库对其数据进行有效的管理,另外也无法使用SQL语句对其进行查询和 *** 作,所以当务之急就是将这些平面文件导

入到数据库中,然后就可以对其进行高效的 *** 作了。

下面介绍几种常见的数据导入的方法,希望能够给大家启迪。另外,本文所涉及到的数据库均为ORACLE数据库,其实对于其他数据库而言,方法类似。

一、Sql:Loader

该方法是Oracle数据库下数据导入的最重要的方法之一,该工具由Oracle客户端提供,

其基本工作原理是:首先要针对数据源文件制作一个控制文件,控制文件是用来解释如何对源文件进行解析,其中需要包含源文件的数据格式、目标数据库的字段等信息,一个典型的控制文件为如下形式:

LOAD DATA

INFILE '/ora9i/fengjie/agent/data/ipaagentdetail200410txt'

TRUNCATE (也可以用append替换TRUNCATE)

INTO TABLE fj_ipa_agentdetail

fields terminated ","

trailing nullcols

( AGENT_NO char,

AGENT_NAME char,

AGENT_ADDRESS char,

AGENT_LINKNUM char,

AGENT_LINKMAN char

)

其中,INFILE '/ora9i/fengjie/agent/data/ipaagentdetail200410txt'指明所要导入的源文件,其实源文件也可以直接通过命令行来输入获得 ,fj_ipa_agentdetail为目标表的名字,fields terminated ","是指源文件的各个字段是以逗号分隔,trailing nullcols表示遇到空字段依然写入到数据库表中,最后这5个字段是目标数据库表的字段结构。通过上面这个典型的控制文件的格式分析可知,控制文件需要与源文件的格式信息一致,否则导入数据会出现异常。

除了控制以外,sqlloader的还需要数据文件,即源文件。根据格式的不同,源文件可以分为固定字段长度和有分隔符这两大类,这里将分别说明这两种情况:

固定字段长度的文本文件

就是每个字段拥有固定的字段长度,比如:

602530005922 1012

602538023138 1012

602536920355 1012

602531777166 1012

602533626494 1012

602535700601 1012

有分隔符的文本文件

就是每个字段都有相同的分隔符分隔,比如:

1001,上海长途电信综合开发公司,南京东路34号140室

1002,上海桦奇通讯科技有限公司,武宁路19号1902室

1003,上海邦正科技发展有限公司,南京东路61号903室

对于上述两种文件格式sqlloader均可以做处理,下面就前面那个固定长度的文本来举例说明:

由于该文本只有两个字段,一个为设备号,一个是区局编号,两者的长度分别为20和5,那么可以编制控制文件如下:

LOAD DATA

INFILE '/ora9i/fengjie/agent/data/ipaagent200410txt'

TRUNCATE

INTO TABLE fj_ipa_agent

( DEVNO POSITION(1:20) CHAR,

BRANCH_NO POSITION(21:25) CHAR

)

其中,'/ora9i/fengjie/agent/data/ipaagent200410txt'为该文件的完全路径,POSITION(M:N)表示该字段是从位置M到位置N。

对于有分隔符的数据文件,前面已经有一个例子,这里就不再赘述了。总之,使用SqlLoader能够轻松将数据文件导入到数据库中,这种方法也是最常用的方法。

二、 使用专业的数据抽取工具

目前在数据仓库领域中,数据抽取与装载(ETL)是一重要的技术,这一技术对于一些大的数据文件或者文件数量较多尤其适合。这里简单介绍目前一款主流的数据抽取工具 ――Informatica。

该工具主要采用图形界面进行编程,其主要工作流程是:首先将源数据文件的结构(格式)导入为Informatica里,然后根据业务规则对该结构进行一定的转换(transformation),最终导入到目标表中。

以上过程仅仅只是做了一个从源到目标的映射,数据的实际抽取与装载需要在工作流(workflow)里进行。

使用专业的数据抽取工具,可以结合业务逻辑对多个源数据进行join,union,insect等 *** 作,适合于大型数据库和数据仓库。

三、 使用Access工具导入

可以直接在Access里选择‘打开‘文本文件,这样按照向导来导入一个文本文件到Access数据库中,然后使用编程的方法将其导入到最终的目标数据 库中。

这种方法虽然烦琐,但是其对系统的软件配置要求相对较低,所以也是有一定的使用范围

要用navicat导出数据首先要明确你的数据存储的格式

以xxxtxt为例

1、打开navicat,点击要导入到的数据库,再点击汇入精灵,会d出一个框

2、选择数据类型为

文字档案(txt),点击下一步

3、选择要导入数据的路径,编码一般默认65001(utf-8),点击下一步

4、这里的设置全部默认,最好不要修改,直接下一步

5、这里的设置全部默认,最好不要修改,直接下一步

6、这里的“来源资料表”是只你导入数据的文件名,“目标资料表”是你导入

到数据库里面的名称,如果该数据库没有这样的名称,后面的“新增”中会有一个“√”,如果没有则说明这个数据库中已经存在这样一个表了,如果你需要覆盖原来的表则直接点下一步,不然就修改“目标资料表”的名称,确保不存在重名,然后点下一步

7、这里主要选择汇入模式,一个是加入模式,另一个是复制模式,看你自己的选择。点击下一步

8、到了这里设置都完成了,只是需要点击“开始”,如果一切正常,就把数据导入到你的数据库里面了。

希望这些能帮你解决问题,因为我用的是中文版的,如果你用的是英文版,流程也是一样的

第一步,打开导入导出工具。(win7 32位系统下SQL自带,64位系统下好像要装)

第二步,选择源文件的格式。这里txt格式文件选择平面文件源。

第三步,浏览选择文件源,其中代码页要改成简体中文。另外在列中可查看导入的数据列是否正确,在高级中可编辑字段名。

第四步,选择目标服务器和数据库。就是确定数据文件要导入到哪一个一个服务器的哪一个数据库中。

第五步,选择目标表,打开编辑映射。默认时以文件名建立新表。

第六步,编辑映射。把数据对应导入数据库各字段中!若是目标表是新建的,那么要编辑数据库中的个字段名以及数据类型。

那么做完这些后只要数据源没有问题,单击下一步……就可以搞定了。

现在说说导入数据时要注意的地方。在导入txt格式的文件时首先需要注意数据的排列。每一列之间用统一的分隔符隔开,删除无关的行信息。另外需要注意的是,txt格式的文件导入时空格也是被读取的,所以要删除空格。其实导入时我遇到的就这么点问题,却足足卡了我一天半。数据按要求排列后如图所示:

txt同样是可以导入到Sql

Server2000数据库的

但是

前提是你的txt文件内容是有特定的格式

比如

你要的信息字段内容必须用特定的符号隔开(默认是逗号)

a,b,c

e,f,g

如果这样的要求满足的话

然后你

打开sql

server2000

选择数据库——>导入数据

显示导入数据向导-》下一步

在选择数据源的时候

"数据源"选择“文本文件”->下一步

选择行分隔符->下一步

选择列分隔符。。。。。下一步。。。。完成

以上就是关于文本文件导入到数据库中的几种方法全部的内容,包括:文本文件导入到数据库中的几种方法、怎么把txt导入navicat、如何将txt文件导入sqlserver等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/sjk/9476855.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-04-28
下一篇 2023-04-28

发表评论

登录后才能评论

评论列表(0条)

保存