近期,笔者到一些数据竞赛网站进行观察学习,发现很多数据是以csv文件处理的(废话).因而,磨刀不误砍柴工,笔者先对Python的csv库进行学习.
csv模块实现了CSV格式表单数据的读写.这可以以一个兼容Excel的方式读写其数据文件,csv模块中的reader和writer类被用来读写序列化的数据.也可以使用DictReader类和DictWriter类以字典的方式读取数据.
返回一个reader对象裤宴芹,该对象逐行遍历csvfile(文件和列表均适用,但是文件的话应该newline=''.
默认每祥握一行读取一个字符串组成的列表(而非数值,除非修改QUOTE_NONUMERIC).
返回一个writer对象,负责将数据在给定的文件类对象上转换成带分隔符的字符串.csvfile(只要该对象有write()方法,文件的话应该newline=''.)
这两个方法可以把name字符串和dialect关联/脱钩.dialect可以是Dialect的子类,或者fmtparams的关键字参数.
返回一个Dialect对象为name的变种,若其未注册,抛出Error.
返回已经注册的所有变种的 名称
返回当前解析器允许的最大字段大小,如果制定了参数,参数将胡毕成为新的最大字段大小.
该对象 *** 作上类似reader,但是把每行中的信息映射到一个字典,字典的键由fieldnames给出
fieldname的参数是一个序列sequence [1] ,如果参数缺省,默认第一行的值作为字段名.
如果某一行中的字段多于字段名(比如说约定有5项属性,但是这一行却出现了6个数据),则其余字段将放入列表中,字段名由 restkey 指定(默认为 None)。如果非空白行的字段少于字段名,则缺少的值将用 None 填充。
#其实这玩意应该就跟各种填表里面的备注用法差不多.
3.8中返回的行是dict类型.
该对象 *** 作上类似reader,但是把每行中的信息映射到一个字典,字典的键由fieldnames给出,fieldname参数是不可缺省的.restval用来指定字典缺少键的时候要写入的值.extrasaction用于指定关键键在fieldname中找不到的情况的处理机制.'raise'引发ValueError,而'ignore'则会被忽略.
这个类被用来瑞段csv文件的格式
以下诸类均在括号中标注了在其变种注册表中的名称
定义了Excel生成的csv文件的常规属性.('excel')
定义了Excel生成的,tab分割的csv文件的常规属
性.('excel-tab')
定义了UNIX系统上生成的csv文件的常规属性('unix'):
任意可能发生的csv库函数错误.
参考链接
Python3.8.2文档中关于csv库的相关文档
import globimport os
import re
filelist = glob.glob('*.txt')
p = re.compile(r'<1>(.*)\|(.*)</1>')
for fn in filelist:
try:
fin = open(fn, 'r')
fout = open('pro_' + os.path.split(fn)[1], 'w')
except:
print 'File open error!'
os.exit(1)
for line in fin.readlines():
if '<0>贺毕Rd</0>' in line:
line = p.sub('<1>\g<2>|\g<1></1>', line)
fout.write(line)
fin.close()
fout.close()
输入文件内容:
This is the first line
<0>Rd</0><1>a|b</1>
some test info
<0>Rd</0><1>red|blue</1>
输出文件内容:
This is the first line
<0>Rd</0>橡樱<1>b|a</1>
some test info
<0>Rd<梁拍丛/0><1>blue|red</1>
补充:见上,稍微改改就好了。
用Python对喊老中文件进行的一些基本 *** 作如下:第一,在桌面上新建一个文件夹test,在该文件夹下创建一个python.txt,在该文郑山件里输入一段文字。
第二,打开cmd命令窗口,并输入python,进入python软件命令窗口。
第三,使用open()函数打开文件python.txt文件。
第四,读取文件内容,主要使用了File对象的read()方法。
第五,覆盖重新写入含谨文件,主要使用了File对象write()方法,这里使用read()函数时,第二个参数设置为'w'。
第六,添加写入文件。这里使用read()函数时,第二个参数为'a'。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)