wb 读取pdf?二进制读取????
换成w+
提示的错误时名称错误,或者打开模式wb错误。
看一下名称是否出错,例如多了空格等
看一下计算机pdf和其他文件内部的区别,例如是否有图片等等,导致
这个问题是你 *** 作系统的默认编码格式和你程序的编码格式不一致。但是所有的系统都是认可unicode编码的,所以你在前面加u就可以正常显示。两种办法,一种就是改变 *** 作系统的默认编码格式,比如windows,利用命令行,将其改成utf-8编码格式;另一种就是类似在前面加u这种办法,在py文件里面,利用python的方法(decode,encode)将其解码,然后编码成window默认的gbk形式的(当然你用的其他系统的话,不一样的,你自己上网了解一下)。python2.X,代码中指定了UTF-8,但是在cmd命令行窗口时,打印的中文仍然会乱码。
在python3不存在该问题
运行结果:
原因
中文windows默认的输出编码为gbk ,与脚本中定义的UTF-8不一样,所以出现了解码失败的情况。
相关推荐:《Python基础教程》
解决方法
有如下两种方法可以解决这个问题
方法一
我们可以通过先把中文解码为unicode,然后再转化为gbk来解决这个问题:
修改后运行结果:
方法二
当然,我们也可以通过改变cmd命令行窗口的输出格式来解决这个问题:
·chcp 65001 就是换成UTF-8代码页
·chcp 936 可以换回默认的GBK
但是这样就降低了脚本的兼容性,在其他环境运行的时候可能还会出现这样的错误,而且可能会影响其他脚本运行,所以推荐使用第一种方法。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)