windows下Psychopy3保存文件中文乱码解决办法_教程

最近在使用psychopy3时出现一件非常奇怪的事情：运行结束后保存的csv文件中文乱码并错行。

如图所示：instr是指导语变量，image_file是图片的路径。

这是一个很简单的使用程序，我就直接用了psychopy图形化的builder窗口。这个实验用conditions.xlsx文件控制循环。因为不同的trial指导语不一样，在conditions里面写了一些中文的指导语。但在运行完该程序后，获取到的数据里面中文全部乱码而且有错列，例如本来应该两列的东西拼到了一列。但是在运行呈现的时候，展现出来的指导语都是中文，且脊悉正确。

结合windows下使用python的经验，我估摸着是windows的编码问题。

到这里基本上已经解决了主要问题。但是后续还会出现这种情况，需要进一步查明为什么utf-8在这里无效。首先一个个排除了.py文件的编码问题，全是utf-8。

解决办法1：

1、找到psychopy安装路径下樱御乎的experiment文件，例如：PsychoPy3\Lib\site-packages\psychopy\data\experiment.py

2、把里拆型面def saveAsWideText这一行的 encoding = 'utf-8' 改成 encoding = 'utf-8-sig'，保存！！

3、再运行就OK了。

这种方法有个弊端，就是如果你不使用Excel而是用R语言处理最终的csv数据，那么在用R读入该文件的时候可能需要指定encoding = "utf-8-sig"。

解决办法2：

安装LibreOffice，并将之修改为.csv文件的默认打开程序，该问题就解决了。弊端：这个办法就是要新安装一个软件。

最终发现根本问题在于使用windows里EXCEL打开这个csv文件时，EXCEL默认给这个文件加了BOM，导致这个原本UTF-8编码的文件显示错乱。

也就是原本UTF-8编码的文件，EXCEL非要用UTF-8-sig的编码去打开，导致显示错乱。

python代码文件的编码

py文件默认是ASCII编码，中文在显示时会做一个ASCII到系统默认编码的转换，这时就会出错：SyntaxError: Non-ASCII character。需要在代码文件的第一行或第二行添加编码指示：

1 # coding=utf-8 ##以utf-8编码储存中文字符

2 print '中文'

像上面那样直接输入的字符串是按照代码文件的编码来处理的，如果用unicode编码，有以下三种方式：

1 s1 = u'中凯老皮文' #u表示用unicode编码方式储存信息

2 s2 = unicode('中文','gbk')

unicode是一个内置函数，第二个参数指示源字符串的编码含态格式。

decode是任何字符串具有的方法，将字符串转换成unicode格式，参数指示源字符串的编码格式。

encode也是任何字符串具有的方法，将字符串转换成参数指定的格式。

（2）、字符串的编码

用 u'汉字' 构造出来的是unicode类型，盯差不用的话构造出来是str类型

str的编码是与系统环境相关的，一般就是sys.getfilesystemencoding()得到的值

所以从unicode转str，要用encode方法

从str转unicode，所以要用decode

例如：

# coding=utf-8 #默认编码格式为utf-8

s = u'中文' #unicode编码的文字

print s.encode('utf-8') #转换成utf-8格式输出

但当python中间处理非ASCII编码时，经常会出现如下错误：

UnicodeDecodeError: 'ascii' codec can't decode byte 0x?? in position 1: ordinal not in range(128)

0x??是超出128的数字，python在默认的情况下认为语言的编码是ascii编码，所以无法处理其他编码，需要设置python的默认编码为所需要的编码。

一个解决的方案是在代码中添加：

import sys

reload(sys)

sys.setdefaultencoding('utf-8') （其中utf-8为你想输出的字符编码）

解释：

sys.setdefaultencoding方法在python导入site.py后就删除了(具体代码查看site.py就可以看到)因此如果想用的话可以再重新load进入

总结：

u=u'unicode编码文字'

g=u.encode('gbk') #转换为gbk格式

print g #此时为乱码，因为当前环境为utf-8,gbk编码文字为乱码

str=g.decode('gbk').encode('utf-8') #以gbk编码格式读取g（因为他就是gbk编码的,需要事先知道它是GBK编码）并转换为utf-8格式输出

print str #正常显示中文（同文件输出）

安全的方法：

s.decode('gbk','ignore').encode('utf-8′) #以gbk编码读取（当然是读取gbk编码格式的文字了）并忽略错误的编码，转换成utf-8编码输出。

推荐学习《Python教程》！

这是因为IDLE中使用gbk编码，是ascii扩展字符集。

>>>import sys

>>>sys.getdefaultencoding()

'ascii'解决方法：

在IDLE中执行的时候

去掉字符串前面的u字符，也不要加#coding这一行。

2. 先import sys,然后reload(sys),再使用sys.setdefaultencoding("utf-8")。然后就可梁丛以打印竖渣核前面带u的字符串了余掘。（这是搜来的方法，实验了一下，发现在我这没有输出了。。重启了IDLE，才可以输出，不过又变会ascii了）

在文件中执行

在文件开头声明#coding行，文件保存为utf8编码，在字符串开头加u

欢迎分享，转载请注明来源：内存溢出

原文地址: https://outofmemory.cn/tougao/12282905.html

windows下Psychopy3保存文件中文乱码解决办法

发表评论

评论列表（0条）