"xE4xC5xCCxC9xD3xD8"无效的UTF-8。使用Python测试:
>>> "xE4xC5xCCxC9xD3xD8".depre("utf-8")...UnipreDepreError: 'utf8' prec can't depre bytes in position 0-2: invalid data
如果您正在寻找避免解码数据库中错误的方法,则cp1252编码(又称“ Windows-1252”或“ Windows Western
European”)是最宽松的编码-每个字节值都是一个有效的代码点。
当然,它不再会理解真正的UTF-8,也不会理解任何其他非cp1252编码,但是听起来您不太在意这一点?
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)