【Python文件的使用】_python

文件概述文件类别文件是一个存储在辅助存储器上的数据序列，可以包含任何数据内容。

概念上，文件是数据的集合和抽象，类似地，函数是程序的集合和抽象。

用文件形式组织和表达数据更有效也更为灵活。

文件包括两种类型：文本文件和二进制文件。

二进制文件直接由比特0和比特1组成，没有统一字符编码，文件内部数据的组织格式与文件用途有关。

二进制文件和文本文件最主要的区别在于是否有统一的字符编码无论文件创建为文本文件或者二进制文件，都可以用“文本文件方式”和“二进制文件方式”打开，打开后的 *** 作不同。

通过下面的实例，理解文本文件和二进制文件的区别。

#coding=utf-8
textFile = open("7.1.txt", "rt", encoding='utf-8')  # t表示文本文件方式
print(textFile.readline())
textFile.close()
binFile = open("7.1.txt", "rb")  # b表示二进制文件方式
print(binFile.readline())
binFile.close()

输出结果如下：

CSDN是个学习的好地方！

b'CSDN\xe6\x98\xaf\xe4\xb8\xaa\xe5\xad\xa6\xe4\xb9\xa0\xe7\x9a\x84\xe

5\xa5\xbd\xe5\x9c\xb0\xe6\x96\xb9\xef\xbc\x81'

采用文本方式读入文件，文件经过编码形成字符串，打印出有含义的字符；采用二进制方式打开文件，文件被解析为字节（byte）流。

由于存在编码，字符串中的一个字符由2个字节表示。

文件路径

文件有两个关键属性，分别是“文件名”和“文件路径”。

文件名指的是为每个文件设定的名称。

文件路径，是文件存储的位置或即将存储的位置。

文件的编码方式

编码就是用数字来表示符号和文字，它是符号、文字存储和显示的基础。

（1）ASCII编码方式

（2）GB2312编码方式

（3）GBK编码方式

（4）Unicode编码方式

（5）UTF-8编码方式

文件 *** 作 Python对文本文件和二进制文件采用统一的 *** 作步骤，即 “打开- *** 作-关闭”

文件打开 Python通过解释器内置的open()函数打开一个文件，并实现该文件与一个程序变量的关联，open() 函数常用形式是接收两个参数：文件名(file)和打开模式(mode)。

<变量名> = open(<文件名>, <打开模式>)

完整的语法格式为：

open(file,mode='r',buffering=-1,encoding=None,errors=None,newline=None,

closefd=True, opener=None)

参数说明:

file: 必需，文件路径（相对或者绝对路径）。

mode: 可选，文件打开模式
buffering: 设置缓冲
encoding: 一般使用utf8
errors: 报错级别
newline: 区分换行符
closefd: 传入的file参数类型
opener: 设置自定义开启器，开启器的返回值必须是一个打开的文件描述符。

注意：

open函数其中的encoding参数的默认值是None是不能读取中文字符的，所以要给encoding参数赋值为utf-8才能读取中文字符。

文件名可以是文件的实际名字，也可以是包含完整路径的名字。

模式（mode ）参数有：

模式	描述
r	以只读方式打开文件。文件的指针将会放在文件的开头。这是默认模式。如果文件不存在，返回异常FileNotFoundError，默认值
w	覆盖写模式，文件不存在则创建，存在则完全覆盖
x	写模式，文件不存在则创建，存在则返回异常FileExistsError
a	打开一个文件用于追加。如果该文件已存在，文件指针将会放在文件的结尾。也就是说，新的内容将会被写入到已有内容之后。如果该文件不存在，创建新文件进行写入。
b	二进制文件模式。
+	与r/w/x/a一同使用，在原功能基础上增加同时读写功能
t	文本模式 (默认)。
rb	以二进制格式打开一个文件用于只读。文件指针将会放在文件的开头。这是默认模式。一般用于非文本文件如图片等。
r+	打开一个文件用于读写。文件指针将会放在文件的开头。
rb+	以二进制格式打开一个文件用于读写。文件指针将会放在文件的开头。一般用于非文本文件如图片等。
wb	以二进制格式打开一个文件只用于写入。如果该文件已存在则打开文件，并从开头开始编辑，即原有内容会被删除。如果该文件不存在，创建新文件。一般用于非文本文件如图片等。
w+	打开一个文件用于读写。如果该文件已存在则打开文件，并从开头开始编辑，即原有内容会被删除。如果该文件不存在，创建新文件。
wb+	以二进制格式打开一个文件用于读写。如果该文件已存在则打开文件，并从开头开始编辑，即原有内容会被删除。如果该文件不存在，创建新文件。一般用于非文本文件如图片等。
ab	以二进制格式打开一个文件用于追加。如果该文件已存在，文件指针将会放在文件的结尾。也就是说，新的内容将会被写入到已有内容之后。如果该文件不存在，创建新文件进行写入。
a+	打开一个文件用于读写。如果该文件已存在，文件指针将会放在文件的结尾。文件打开时会是追加模式。如果该文件不存在，创建新文件用于读写。
ab+	以二进制格式打开一个文件用于追加。如果该文件已存在，文件指针将会放在文件的结尾。如果该文件不存在，创建新文件用于读写。

默认为文本模式，如果要以二进制模式打开，加上 b 。

文件读写

file 对象使用 open 函数来创建，下表列出了 file 对象常用的函数：

序号	方法及描述
1	file.flush() 刷新文件内部缓冲，直接把内部缓冲区的数据立刻写入文件, 而不是被动的等待输出缓冲区写入。一般情况下，文件关闭后会自动刷新缓冲区，但有时你需要在关闭前刷新它，这时就可以使用 flush() 方法。
2	file.fileno() 返回一个整型的文件描述符(file descriptor FD 整型), 可以用在如os模块的read方法等一些底层 *** 作上。
3	file.isatty() 如果文件连接到一个终端设备返回 True，否则返回 False。
4	file.resd([size]) 从文件读取指定的字节数，如果未给定或为负则读取所有。
5	file.resdline([size]) 读取整行，包括 "\n" 字符。
6	file.resdlines([sizeint]) 读取所有行并返回列表，若给定sizeint>0，返回总和大约为sizeint字节的行, 实际读取值可能比 sizeint 较大, 因为需要填充缓冲区。
7	file.seek(offset[,whence]) 移动文件读取指针到指定位置
8	file.tell() 返回文件当前位置。
9	file.truncate([size]) 从文件的首行首字符开始截断，截断文件为 size 个字符，无 size 表示从当前位置截断；截断之后后面的所有字符被删除，其中 windows 系统下的换行代表2个字符大小。
10	file.write(str) 将字符串写入文件，返回的是写入的字符长度。
11	file.writelines(sequence) 向文件写入一个序列字符串列表，如果需要换行则要自己加入每行的换行符。

实例1：文本文件逐行打印

#coding=utf-8
fname = input("请输入要打开的文件:")
fo = open(fname, "r", encoding="utf-8")
for line in fo.readlines():
    print(line)
fo.close()

运行结果

如果程序需要逐行处理文件内容，建议采用上述代码格式

实例2：对文件进行写入

#coding=utf-8
fname = input("请输入要打开的文件:")
fo = open(fname, "w+")
ls = ["唐诗", "宋词", "元曲"]
fo.writelines(ls)
for line in fo:
    print(line)
fo.close()

运行结果

文件关闭

文件使用结束后要使用close()方法关闭，释放文件的使用授权，该方法的使用方式如下：

<变量名>.close()

欢迎分享，转载请注明来源：内存溢出

原文地址: http://outofmemory.cn/langs/568827.html

【Python文件的使用】

发表评论

评论列表（0条）