大型的数据库开发中常常遇到数据源是平面文件(如文本文件)的情况,对于这样的数据源,无法使用数据库对其数据进行有效的管理,另外也无法使用SQL语句对其进行查询和 *** 作,所以当务之急就是将这些平面文件导
入到数据库中,然后就可以对其进行高效的 *** 作了。
下面介绍几种常见的数据导入的方法,希望能够给大家启迪。另外,本文所涉及到的数据库均为ORACLE数据库,其实对于其他数据库而言,方法类似。
一、Sql:Loader
该方法是Oracle数据库下数据导入的最重要的方法之一,该工具由Oracle客户端提供,
其基本工作原理是:首先要针对数据源文件制作一个控制文件,控制文件是用来解释如何对源文件进行解析,其中需要包含源文件的数据格式、目标数据库的字段等信息,一个典型的控制文件为如下形式:
LOAD DATA
INFILE '/ora9i/fengjie/agent/data/ipaagentdetail200410txt'
TRUNCATE (也可以用append替换TRUNCATE)
INTO TABLE fj_ipa_agentdetail
fields terminated ","
trailing nullcols
( AGENT_NO char,
AGENT_NAME char,
AGENT_ADDRESS char,
AGENT_LINKNUM char,
AGENT_LINKMAN char
)
其中,INFILE '/ora9i/fengjie/agent/data/ipaagentdetail200410txt'指明所要导入的源文件,其实源文件也可以直接通过命令行来输入获得 ,fj_ipa_agentdetail为目标表的名字,fields terminated ","是指源文件的各个字段是以逗号分隔,trailing nullcols表示遇到空字段依然写入到数据库表中,最后这5个字段是目标数据库表的字段结构。通过上面这个典型的控制文件的格式分析可知,控制文件需要与源文件的格式信息一致,否则导入数据会出现异常。
除了控制以外,sqlloader的还需要数据文件,即源文件。根据格式的不同,源文件可以分为固定字段长度和有分隔符这两大类,这里将分别说明这两种情况:
固定字段长度的文本文件
就是每个字段拥有固定的字段长度,比如:
602530005922 1012
602538023138 1012
602536920355 1012
602531777166 1012
602533626494 1012
602535700601 1012
有分隔符的文本文件
就是每个字段都有相同的分隔符分隔,比如:
1001,上海长途电信综合开发公司,南京东路34号140室
1002,上海桦奇通讯科技有限公司,武宁路19号1902室
1003,上海邦正科技发展有限公司,南京东路61号903室
对于上述两种文件格式sqlloader均可以做处理,下面就前面那个固定长度的文本来举例说明:
由于该文本只有两个字段,一个为设备号,一个是区局编号,两者的长度分别为20和5,那么可以编制控制文件如下:
LOAD DATA
INFILE '/ora9i/fengjie/agent/data/ipaagent200410txt'
TRUNCATE
INTO TABLE fj_ipa_agent
( DEVNO POSITION(1:20) CHAR,
BRANCH_NO POSITION(21:25) CHAR
)
其中,'/ora9i/fengjie/agent/data/ipaagent200410txt'为该文件的完全路径,POSITION(M:N)表示该字段是从位置M到位置N。
对于有分隔符的数据文件,前面已经有一个例子,这里就不再赘述了。总之,使用SqlLoader能够轻松将数据文件导入到数据库中,这种方法也是最常用的方法。
二、 使用专业的数据抽取工具
目前在数据仓库领域中,数据抽取与装载(ETL)是一重要的技术,这一技术对于一些大的数据文件或者文件数量较多尤其适合。这里简单介绍目前一款主流的数据抽取工具 ――Informatica。
该工具主要采用图形界面进行编程,其主要工作流程是:首先将源数据文件的结构(格式)导入为Informatica里,然后根据业务规则对该结构进行一定的转换(transformation),最终导入到目标表中。
以上过程仅仅只是做了一个从源到目标的映射,数据的实际抽取与装载需要在工作流(workflow)里进行。
使用专业的数据抽取工具,可以结合业务逻辑对多个源数据进行join,union,insect等 *** 作,适合于大型数据库和数据仓库。
三、 使用Access工具导入
可以直接在Access里选择‘打开‘文本文件,这样按照向导来导入一个文本文件到Access数据库中,然后使用编程的方法将其导入到最终的目标数据 库中。
这种方法虽然烦琐,但是其对系统的软件配置要求相对较低,所以也是有一定的使用范围
要用navicat导出数据首先要明确你的数据存储的格式
以xxxtxt为例
1、打开navicat,点击要导入到的数据库,再点击汇入精灵,会d出一个框
2、选择数据类型为
文字档案(txt),点击下一步
3、选择要导入数据的路径,编码一般默认65001(utf-8),点击下一步
4、这里的设置全部默认,最好不要修改,直接下一步
5、这里的设置全部默认,最好不要修改,直接下一步
6、这里的“来源资料表”是只你导入数据的文件名,“目标资料表”是你导入
到数据库里面的名称,如果该数据库没有这样的名称,后面的“新增”中会有一个“√”,如果没有则说明这个数据库中已经存在这样一个表了,如果你需要覆盖原来的表则直接点下一步,不然就修改“目标资料表”的名称,确保不存在重名,然后点下一步
7、这里主要选择汇入模式,一个是加入模式,另一个是复制模式,看你自己的选择。点击下一步
8、到了这里设置都完成了,只是需要点击“开始”,如果一切正常,就把数据导入到你的数据库里面了。
希望这些能帮你解决问题,因为我用的是中文版的,如果你用的是英文版,流程也是一样的
第一步,打开导入导出工具。(win7 32位系统下SQL自带,64位系统下好像要装)
第二步,选择源文件的格式。这里txt格式文件选择平面文件源。
第三步,浏览选择文件源,其中代码页要改成简体中文。另外在列中可查看导入的数据列是否正确,在高级中可编辑字段名。
第四步,选择目标服务器和数据库。就是确定数据文件要导入到哪一个一个服务器的哪一个数据库中。
第五步,选择目标表,打开编辑映射。默认时以文件名建立新表。
第六步,编辑映射。把数据对应导入数据库各字段中!若是目标表是新建的,那么要编辑数据库中的个字段名以及数据类型。
那么做完这些后只要数据源没有问题,单击下一步……就可以搞定了。
现在说说导入数据时要注意的地方。在导入txt格式的文件时首先需要注意数据的排列。每一列之间用统一的分隔符隔开,删除无关的行信息。另外需要注意的是,txt格式的文件导入时空格也是被读取的,所以要删除空格。其实导入时我遇到的就这么点问题,却足足卡了我一天半。数据按要求排列后如图所示:
txt同样是可以导入到Sql
Server2000数据库的
但是
前提是你的txt文件内容是有特定的格式
比如
你要的信息字段内容必须用特定的符号隔开(默认是逗号)
如
a,b,c
e,f,g
如果这样的要求满足的话
然后你
打开sql
server2000
选择数据库——>导入数据
显示导入数据向导-》下一步
在选择数据源的时候
"数据源"选择“文本文件”->下一步
选择行分隔符->下一步
选择列分隔符。。。。。下一步。。。。完成
以上就是关于文本文件导入到数据库中的几种方法全部的内容,包括:文本文件导入到数据库中的几种方法、怎么把txt导入navicat、如何将txt文件导入sqlserver等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)