如何在Python <3中将UTF-8编码的文本打印到控制台?
print u"some unipre text N{EURO SIGN}"print b"some utf-8 enpred bytestring xe2x82xac".depre('utf-8')
即,如果您有Unipre字符串,则直接打印。如果您有一个字节串,请先将其转换为Unipre。
LANG,
LC_CTYPE)表示utf-8语言环境,因此(理论上)您可以直接打印utf-8字节串,并且应该在终端中正确显示(如果终端设置与语言环境设置一致,则应),但您应避免这种情况:
不要在脚本中对环境字符编码进行硬编码 ; 而是直接打印Unipre 。
您的问题中有许多错误的假设。
您无需设置
PYTHONIOENCODING区域设置即可将Unipre打印到终端。utf-8语言环境支持所有Unipre字符,即按原样工作。
您不需要解决方法
sys.stdout =precs.getwriter(locale.getpreferredencoding())(sys.stdout)。如果某些代码(您无法控制)确实需要打印字节,则可能会中断,并且/或者在将Unipre打印到Windows控制台时可能会中断
(错误的代码页,无法打印无法解码的字符)。正确的语言环境设置和/或
PYTHONIOENCODINGenvvar就足够了。另外,如果你需要更换
sys.stdout,然后用
io.TextIOWrapper()替代
precs模块像
win-unipre-console包一样。
sys.getdefaultencoding()与您的语言环境设置和无关
PYTHONIOENCODING。您认为
PYTHONIOENCODING
应该更改设置的假设
sys.getdefaultencoding()是不正确的。您应该检查一下
sys.stdout.encoding。
sys.getdefaultencoding()打印到控制台时不使用。如果将stdout重定向到文件/管道,除非
PYTHOHIOENCODING已设置,否则它可用作Python
2的后备:
$ python2 -c'import sys; print(sys.stdout.encoding)'UTF-8$ python2 -c'import sys; print(sys.stdout.encoding)' | catNone$ PYTHonIOENCODING=utf8 python2 -c'import sys; print(sys.stdout.encoding)' | catutf8
不要打电话
sys.setdefaultencoding("UTF-8"); 它可能会 无声地
破坏您的数据和/或破坏不期望的第三方模块。请记住
sys.getdefaultencoding(),用于在Python 2中 隐式
地将字节串(
str)转换为/来回转换,例如 。另请参阅
@mesilliac的答案中的引号。
unipre
__
"a" + u"b"
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)