python 部分中文显示乱码

python 部分中文显示乱码,第1张

wb 读取pdf?二进制读取????

换成w+

提示的错误时名称错误,或者打开模式wb错误。

看一下名称是否出错,例如多了空格等

看一下计算机pdf和其他文件内部的区别,例如是否有图片等等,导致

这个问题是你 *** 作系统的默认编码格式和你程序的编码格式不一致。但是所有的系统都是认可unicode编码的,所以你在前面加u就可以正常显示。两种办法,一种就是改变 *** 作系统的默认编码格式,比如windows,利用命令行,将其改成utf-8编码格式;另一种就是类似在前面加u这种办法,在py文件里面,利用python的方法(decode,encode)将其解码,然后编码成window默认的gbk形式的(当然你用的其他系统的话,不一样的,你自己上网了解一下)。

python2.X,代码中指定了UTF-8,但是在cmd命令行窗口时,打印的中文仍然会乱码。

在python3不存在该问题

运行结果:

原因

中文windows默认的输出编码为gbk ,与脚本中定义的UTF-8不一样,所以出现了解码失败的情况。

相关推荐:《Python基础教程》

解决方法

有如下两种方法可以解决这个问题

方法一

我们可以通过先把中文解码为unicode,然后再转化为gbk来解决这个问题:

修改后运行结果:

方法二

当然,我们也可以通过改变cmd命令行窗口的输出格式来解决这个问题:

    ·chcp 65001 就是换成UTF-8代码页

    ·chcp 936 可以换回默认的GBK

但是这样就降低了脚本的兼容性,在其他环境运行的时候可能还会出现这样的错误,而且可能会影响其他脚本运行,所以推荐使用第一种方法。


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/tougao/11331679.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-15
下一篇 2023-05-15

发表评论

登录后才能评论

评论列表(0条)

保存