[perl]Wide character in print报错

[perl]Wide character in print报错,第1张

概述用perl写文本处理程序,或者写服务器端脚本的时候,常常会遇到“Wide character in print”的警告或者错误。 这是因为在程序中处理中文等宽字符时,perl不能识别要处理的内容。 首先要知道perl只能处理两种编码:ascii码和utf-8。ascii码是很少的,像中文、日文、韩文等字符要想能被perl处理,只能用utf-8编码方式。字符串在perl内部的存储格式如下图: 当fl

用perl写文本处理程序,或者写服务器端脚本的时候,常常会遇到“WIDe character in print”的警告或者错误。

这是因为在程序中处理中文等宽字符时,perl不能识别要处理的内容。

首先要知道perl只能处理两种编码:ascii码和utf-8。ascii码是很少的,像中文、日文、韩文等字符要想能被perl处理,只能用utf-8编码方式。字符串在perl内部的存储格式如下图:

当flag是1的时候,perl就会把那个字符串当做utf-8编码的字符来处理;如果是0,perl就不能认知字符串中除了ascii码之外的字符,这个时候,就会报出“WIDe character in print”的警告或者错误。

举个例子,你要在程序中处理‘当历史成为历史’这个字符串,如果你的程序文件是utf-8编码的话,一般情况下直接处理就行了,因为这 时字符串的utf8-flag是打开的。如果你的程序文件是gb2312的话,那么你就需要把那个字符串的utf8-flag打开。但是,一般还会有这样 的问题,因为这个字符串是gb2312编码的,所以你要做两件事情:将字符串的编码转为utf-8和打开utf8-flag。

use Encode;
use strict;

my $str = "当历史成为历史";
Encode::_utf8_on($str);
print $str. "\n";
Encode::_utf8_off($str);
print $str. "\n";
将上面的这段程序存到文件里,试图运行的时候就会报错:WIDe character in print at test.pl line 6。这就是因为utf8-flag被关闭,perl不能识别字符串。

当然,在每个处理宽字符的地方加上Encode::_utf8_on函数确实是个解决办法。但是一般来说,在每个地方都加上这样的函数,既在编写程序的时候麻烦,维护的时候更麻烦。

这里还有一个更好的办法:在程序文件的头部加上以下内容

use utf8; binmode(STDIN,':enCoding(utf8)'); binmode(STDOUT,':enCoding(utf8)'); binmode(STDERR,':enCoding(utf8)');

总结

以上是内存溢出为你收集整理的[perl]Wide character in print报错全部内容,希望文章能够帮你解决[perl]Wide character in print报错所遇到的程序开发问题。

如果觉得内存溢出网站内容还不错,欢迎将内存溢出网站推荐给程序员好友。

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/langs/1286772.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-06-09
下一篇 2022-06-09

发表评论

登录后才能评论

评论列表(0条)

保存