python3二进制文件读写直接加b不行吗

python3二进制文件读写直接加b不行吗,第1张

二进制模式,通常用来读取图片、视频等二进制文件。注意,它在读写的时候是以bytes类型读写的,因此获得的是一个bytes对象而不是字符串。在这个读写过程中,需要自己指定编码格式。在使用带b的模式时一定要注意传入的数据类型,确保为bytes类型。

s = 'this is a test'

b = bytes(s,encoding='utf-8')

f = open('test.txt','w')

f.write(s)

##这样没问题,正常写入了文件。

##-------------------------------------------------

s = 'this is a test'

b = bytes(s,encoding='utf-8')

f = open('test.txt','wb')##注意多了个b

f.write(s)

##报错

TypeError: a bytes-like object is required, not 'str'

##意思是它需要一个bytes类型数据,你却给了个字符串

##---------------------------------------------------

s = 'this is a test'

b = bytes(s,encoding='utf-8')

f = open('test.txt','wb')##注意多了个b

f.write(b)##将变量b传给它,b是个bytes类型

二、 + 模式:

对于w+模式,在读写之前都会清空文件的内容,建议不要使用!

对于a+模式,永远只能在文件的末尾写入,有局限性,建议不要使用!

对于r+模式,也就是读写模式,配合seek()和tell()方法,可以实现更多 *** 作。

三、 编码问题

要读取非UTF-8编码的文件,需要给open()函数传入encoding参数,例如,读取GBK编码的文件:

>>>f = open('gbk.txt', 'r', encoding='gbk')

>>>f.read()

'GBK'

遇到有些编码不规范的文件,可能会抛出UnicodeDecodeError异常,这表示在文件中可能夹杂了一些非法编码的字符磨缓。遇到这种情况,可以提供errors参数,表示如果遇到编码错误后如埋渗何处理。

>>>f = open('gbk.txt', 'r', encoding='gbk', errors='ignore')

四、 文件对象 *** 作

每当我们用open方法打开一个文件时,将返回一个文件对象。这个对象内置了很多 *** 作方法。下面假设,已经打开了一个f文件对象。

1. f.read(size)

读取一定大小的数据, 然后作为字符串或字节对象返回。size是一个可选的数字类型的参数,用于指定读取的数据量。当size被忽略了或者为负值,那么该文件的所有内容都将被读取并且返回。

f = open("1.txt", "r")

str = f.read()

print(str)

f.close()

如果文件体积较大,请不要使用read()方法一次性读入内存,而是read(512)这种一点一点的读。

2. f.readline()

从文件中读取一行n内容。换行符为' '。如果返回一个空字符串,说明已经已经读取到最后一行。这种方法,通常是读一行,处理一行,并且不能回头,只能前进,读过的行不能再读了。

f = open("1.txt", "r")

str = f.readline()

print(str)

f.close()

3. f.readlines()

将文件中所有的行,一行一行全部读入一个列表内,按顺序一个一个作为列表的元素,并返回这个列表。readlines方法会一次性将文件全部读入内存,所以也存在一定的风险。但是它有个好处,每行都保存在列表里,可以随意存取。

f = open("1.txt", "r")

a = f.readlines()

print(a)

f.close()

4. 遍历文件

实际上,更多的时候,我们将文件对象作为一个迭代器来使用。

# 打开一个文件

f = open("1.txt", "r")

for line in f:

print(line, end='')

# 关闭打开的文件

f.close()

这个方法很简单, 不需要将文件一次性读出,但是同样没有提供一个很好的控制,与readline方法一样只能前进,不能回瞎液模退。

几种不同的读取和遍历文件的方法比较:如果文件很小,read()一次性读取最方便;如果不能确定文件大小,反复调用read(size)比较保险;如果是配置文件,调用readlines()最方便。普通情况,使用for循环更好,速度更快。

5. f.write()

将字符串或bytes类型的数据写入文件内。write()动作可以多次重复进行,其实都是在内存中的 *** 作,并不会立刻写回硬盘,直到执行close()方法后,才会将所有的写入 *** 作反映到硬盘上。在这过程中,如果想将内存中的修改,立刻保存到硬盘上,可以使用f.flush()方法,但这可能造成数据的不一致。

# 打开一个文件

f = open("/tmp/foo.txt", "w")

f.write("Python 是一种非常好的语言。

我喜欢Python!!

")

# 关闭打开的文件

f.close()

6. f.tell()

返回文件读写指针当前所处的位置,它是从文件开头开始算起的字节数。一定要注意了,是字节数,不是字符数。

7. f.seek()

如果要改变位置指针的位置, 可以使用f.seek(offset, from_what)方法。seek()经常和tell()方法配合使用。

from_what的值,如果是0表示从文件开头计算,如果是1表示从文件读写指针的当前位置开始计算,2表示从文件的结尾开始计算,默认为0,例如:

offset:表示偏移量。

seek(x,0) : 从起始位置即文件首行首字符开始移动 x 个字符

seek(x,1) : 表示从当前位置往后移动x个字符

seek(-x,2):表示从文件的结尾往前移动x个字符

看一个例子:

>>>f = open("d:\1.txt", "rb+")

>>>f.write(b"1232312adsfalafds")

17

>>>f.tell()

17

>>>f.seek(5)

5

>>>f.read(1)

b'1'

>>>f.seek(-3, 2)

14

>>>f.read(1)

b'f'

8. f.close()

关闭文件对象。当处理完一个文件后,调用f.close()来关闭文件并释放系统的资源。文件关闭后,如果尝试再次调用该文件对象,则会抛出异常。忘记调用close()的后果是数据可能只写了一部分到磁盘,剩下的丢失了,或者更糟糕的结果。也就是说大象塞进冰箱后,一定不要忘记关上冰箱的门。

实际项目中经常遇到读取二进制问题,Python下读取二进制文件一般用Python的文件打开读写相关函数和struct.

1。获拍胡歼取文件名filename,可用对话框,也可以直接手写

2。打开文件,这里中是打开,像看书一样,只是打开书,还没有看里面的内容,可以看,也可以不看

binFile=open(filename,'rb')

3。那就看看吧,袭冲binFile现在就是书的名字了。这里我们读入4个字,如果read()将读入整个文件

context=binFile.read(4)

4。读入之后问题来了,context包含四个字(4Bytes),但这四个字是加密的(二进制)。这时要找翻译struct.unpack

realContext=struct.unpack(format,context)

5。format的就是加密规则了,由1,2,4,8个字节组成其他类型,或者其他类型的数组。

a,b,c,d=struct.unpack('4c',context)

读入四个字符

对应格式参考 www.jianshu.com/p/5a985f29fa81

6。打开文件后用完一定要关闭,和看书一个样,看完后要合上,不合上后果自己去想

binFile.close()

7。查找内容,文件内容可以一个一个字的按顺序读出,但如果已经知道内容在什么位置,可以用查找方式读出。

binFile.seek(100)

context=binFile.read(4)

读出100位置后面的4个字,(101,102,103,104)

8。Python还提供也一些高级读写功能,如整做纤行读取等


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/tougao/12191078.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-21
下一篇 2023-05-21

发表评论

登录后才能评论

评论列表(0条)

保存