Python csv库整理(部分)

Python csv库整理(部分),第1张

近期,笔者到一些数据竞赛网站进行观察学习,发现很多数据是以csv文件处理的(废话).因而,磨刀不误砍柴工,笔者先对Python的csv库进行学习.

csv模块实现了CSV格式表单数据的读写.这可以以一个兼容Excel的方式读写其数据文件,csv模块中的reader和writer类被用来读写序列化的数据.也可以使用DictReader类和DictWriter类以字典的方式读取数据.

返回一个reader对象裤宴芹,该对象逐行遍历csvfile(文件和列表均适用,但是文件的话应该newline=''.

默认每祥握一行读取一个字符串组成的列表(而非数值,除非修改QUOTE_NONUMERIC).

返回一个writer对象,负责将数据在给定的文件类对象上转换成带分隔符的字符串.csvfile(只要该对象有write()方法,文件的话应该newline=''.)

这两个方法可以把name字符串和dialect关联/脱钩.dialect可以是Dialect的子类,或者fmtparams的关键字参数.

返回一个Dialect对象为name的变种,若其未注册,抛出Error.

返回已经注册的所有变种的 名称

返回当前解析器允许的最大字段大小,如果制定了参数,参数将胡毕成为新的最大字段大小.

该对象 *** 作上类似reader,但是把每行中的信息映射到一个字典,字典的键由fieldnames给出

fieldname的参数是一个序列sequence [1] ,如果参数缺省,默认第一行的值作为字段名.

如果某一行中的字段多于字段名(比如说约定有5项属性,但是这一行却出现了6个数据),则其余字段将放入列表中,字段名由 restkey 指定(默认为 None)。如果非空白行的字段少于字段名,则缺少的值将用 None 填充。

#其实这玩意应该就跟各种填表里面的备注用法差不多.

3.8中返回的行是dict类型.

该对象 *** 作上类似reader,但是把每行中的信息映射到一个字典,字典的键由fieldnames给出,fieldname参数是不可缺省的.restval用来指定字典缺少键的时候要写入的值.extrasaction用于指定关键键在fieldname中找不到的情况的处理机制.'raise'引发ValueError,而'ignore'则会被忽略.

这个类被用来瑞段csv文件的格式

以下诸类均在括号中标注了在其变种注册表中的名称

定义了Excel生成的csv文件的常规属性.('excel')

定义了Excel生成的,tab分割的csv文件的常规属

性.('excel-tab')

定义了UNIX系统上生成的csv文件的常规属性('unix'):

任意可能发生的csv库函数错误.

参考链接

Python3.8.2文档中关于csv库的相关文档

import glob

import os

import re

filelist = glob.glob('*.txt')

p = re.compile(r'<1>(.*)\|(.*)</1>')

for fn in filelist:

try:

fin = open(fn, 'r')

fout = open('pro_' + os.path.split(fn)[1], 'w')

except:

print 'File open error!'

os.exit(1)

for line in fin.readlines():

if '<0>贺毕Rd</0>' in line:

line = p.sub('<1>\g<2>|\g<1></1>', line)

fout.write(line)

fin.close()

fout.close()

输入文件内容:

This is the first line

<0>Rd</0><1>a|b</1>

some test info

<0>Rd</0><1>red|blue</1>

输出文件内容:

This is the first line

<0>Rd</0>橡樱<1>b|a</1>

some test info

<0>Rd<梁拍丛/0><1>blue|red</1>

补充:见上,稍微改改就好了。

用Python对喊老中文件进行的一些基本 *** 作如下:

第一,在桌面上新建一个文件夹test,在该文件夹下创建一个python.txt,在该文郑山件里输入一段文字。

第二,打开cmd命令窗口,并输入python,进入python软件命令窗口。

第三,使用open()函数打开文件python.txt文件。

第四,读取文件内容,主要使用了File对象的read()方法。

第五,覆盖重新写入含谨文件,主要使用了File对象write()方法,这里使用read()函数时,第二个参数设置为'w'。

第六,添加写入文件。这里使用read()函数时,第二个参数为'a'。


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/tougao/12191074.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-21
下一篇 2023-05-21

发表评论

登录后才能评论

评论列表(0条)

保存