如何解决网页中文乱码问题_安全

1第一个地方的编码格式为jsp文件的存储格式。Eclipse会根据这个编码格式保存文件。并编译jsp文件，包括里面的汉字。第二处编码为解码格式。因为存为UTF-8的文件被解码为iso8859-1，这样如有中文肯定出乱码。也就是必须一致。而第二处所在的这一行，可以没有。缺省也是使用iso8859-1的编码格式。所以如果没有这一行的话，“我是个好人”也会出现乱码。必须一致才可以。第三处编码为控制浏览器的解码方式。如果前面的解码都一致并且无误的话，这个编码格式没有关系。有的网页出现乱码，就是因为浏览器不能确定使用哪种编码格式。因为页面有时候会嵌入页面，导致浏览器混淆了编码格式。出现了乱码。2表单使用Post方式提交后接收到的乱码问题这个问题也是一个常见的问题。这个乱码也是tomcat的内部编码格式iso8859-1在捣乱，也就是说post提交时，如果没有设置提交的编码格式，则会以iso8859-1方式进行提交，接受的jsp却以utf-8的方式接受。导致乱码。既然这样的原因，下面有几种解决方式，并比较。A，接受参数时进行编码转换Stringstr=newString(requestgetParameter("something")getBytes("ISO-8859-1"),"utf-8")；这样的话，每一个参数都必须这样进行转码。很麻烦。但确实可以拿到汉字。B，在请求页面上开始处，执行请求的编码代码，requestsetCharacterEncoding("UTF-8")，把提交内容的字符集设为UTF-8。这样的话，接受此参数的页面就不必在转码了。直接使用Stringstr=requestgetParameter("something")；即可得到汉字参数。但每页都需要执行这句话。这个方法也就对post提交的有效果，对于get提交和上传文件时enctype="multipart/form-data"是无效的。稍后下面单独对这个两个的乱码情况再进行说明。C，为了避免每页都要写requestsetCharacterEncoding("UTF-8")，建议使用过滤器对所有jsp。现在将常见的乱码问题分为JSP页面显示中文乱码、表单提交乱码两类。1)JSP页面中显示中文乱码在JSP文件中使用page命令指定响应结果的MIME类型，如2)表单提交乱码表单提交时(post和Get方法)，使用requestgetParameter方法得到乱码，这是因为tomcat处理提交的参数时默认的是iso-8859-1，表单提交get和post处理乱码问题不同，下面分别说明。(1)POST处理对post提交的表单通过编写一个过滤器的方法来解决，过滤器在用户提交的数据被处理之前被调用，可以在这里改变参数的编码方式，过滤器的代码如下：Java代码CharacterEncodingFilterjava:publicclassCharacterEncodingFilterimplementsFilter{protectedStringencoding=null;publicvoidinit(FilterConfigfilterConfig)throwsServletException{thisencoding=filterConfiggetInitParameter("encoding");}publicvoiddoFilter(ServletRequestrequest,ServletResponseresponse,FilterChainchain)throwsIOException,ServletException{requestsetCharacterEncoding(encoding);responsesetContentType("text/html;charset="+encoding);chaindoFilter(request,response);}}webxml:CharacterEncodingFilternetvschoolwebCharacterEncodingFilterencodingGBKCharacterEncodingFilter/(2)Get方法的处理tomcat对post和get的处理方法不一样，所以过滤器不能解决get的乱码问题，它需要在其他地方设置。打开\conf目录下serverxml文件，找到对8080端口进行服务的Connector组件的设置部分，给这个组件添加一个属性：URIEncoding="GBK"。修改后的Connector设置为：Java代码注意修改后重新启动tomcat才能起作用。/过滤器的使用/3，表单get提交方式的乱码处理方式。如果使用get方式提交中文，接受参数的页面也会出现乱码，这个乱码的原因也是tomcat的内部编码格式iso8859-1导致。Tomcat会以get的缺省编码方式iso8859-1对汉字进行编码，编码后追加到url，导致接受页面得到的参数为乱码/、。解决法：A，使用上例中的第一种方式，对接受到的字符进行解码，再转码。B，Get走的是url提交，而在进入url之前已经进行了iso8859-1的编码处理。要想影响这个编码则需要在serverxml的Connector节点增加useBodyEncodingForURI="true"属性配置，即可控制tomcat对get方式的汉字编码方式，上面这个属性控制get提交也是用requestsetCharacterEncoding("UTF-8")所设置的编码格式进行编码。所以自动编码为utf-8，接受页面正常接受就可以了。但我认为真正的编码过程是，tomcat又要根据里面所设置的URIEncoding=”UTF-8”再进行一次编码，但是由于已经编码为utf-8，再编码也不会有变化了。如果是从url获取编码，接受页面则是根据URIEncoding=”UTF-8”来进行解码的。4，上传文件时的乱码解决上传文件时，form表单设置的都是enctype="multipart/form-data"。这种方式以流方式提交文件。如果使用apach的上传组件，会发现有很多乱码想象。这是因为apach的先期commons-fileuploadjar有bug，取出汉字后进行解码，因为这种方式提交，编码又自动使用的是tomcat缺省编码格式iso-8859-1。但出现的乱码问题是：句号，逗号，等特殊符号变成了乱码，汉字如果数量为奇数，则会出现乱码，偶数则解析正常。解决方式：下载commons-fileupload-111jar这个版本的jar已经解决了这些bug。但是取出内容时仍然需要对取出的字符进行从iso8859-1到utf-8转码。已经能得到正常所有汉字以及字符。5，Java代码关于url请求，接受参数的乱码url的编码格式，取决于上面所说的URIEncoding=”UTF-8”。如果设定了这个编码格式，则意味着所有到url的汉字参数，都必须进行编码才可以。否则得到的汉字参数值都是乱码，例如一个链接ResponsesendDerect(“/ajspname=张大维”)；而在ajsp里面直接使用Stringname=requestgetParameter("name")；得到的就是乱码。因为规定了必须是utf-8才可以，所以，这个转向应该这样写：ResponsesendDerect(“/ajspname=URLEncodeencode(“张大维”,”utf-8”)；才可以。如果不设置这个参数URIEncoding=”UTF-8”，会怎么样呢不设置则就使用了缺省的编码格式iso8859-1。问题又出来了，第一就是参数值的个数如果是奇数个数，则就可以正常解析，如果使偶数个数，得到最后字符就是乱码。还有就是如果最后一个字符如果是英文，则就能正常解析，但中文的标点符号仍出现乱码。权宜之计，如果您的参数中没有中文标点符号，则可以在参数值最后加一个英文符号来解决乱码问题，得到参数后再去掉这个最后面的符号。也可以凑或使用。6，脚本代码关于url请求，接受到的参数乱码脚本中也会进行页面转向的控制，也会涉及到附带参数，并在接受页面解析这个参数的情况。如果这个汉字参数不进行URIEncoding=”UTF-8”所指定的编码处理，则接受页面接受到的汉字也是乱码。脚本处理编码比较麻烦，必须有相应的编码脚本对应文件，然后调用脚本中的方法对汉字进行编码即可。7，关于jsp在MyEclipse中打开的乱码问题对于一个已经存在的项目，Jsp文件的存储格式可能是utf-8。如果新安装的eclipse，则缺省打开使用的编码格式都是iso8859-1。所以导致jsp里面的汉字出现乱码。这个乱码比较容易解决，直接到eclipse31的偏好设置里面找到general-〉edidor，设置为您的文件打开编码为utf-8即可。Eclipse会自动重新以新的编码格式打开。汉字即可正常显示。8，关于html页面在eclipse中打开出现乱码情况由于大部分页面都是由dreamweaver制作，其存储格式跟eclipse的识别有差别导致。一般这种情况，在eclipse中新建一个jsp，直接从dreamweaver复制页面内容粘贴到jsp即可但我认为真正的编码过程是，tomcat又要根据里面所设置的URIEncoding=”UTF-8”再进行一次编码，但是由于已经编码为utf-8，再编码也不会有变化了。如果是从url获取编码，接受页面则是根据URIEncoding=”UTF-8”来进行解码的。4，上传文件时的乱码解决上传文件时，form表单设置的都是enctype="multipart/form-data"。这种方式以流方式提交文件。如果使用apach的上传组件，会发现有很多乱码想象。这是因为apach的先期commons-fileuploadjar有bug，取出汉字后进行解码，因为这种方式提交，编码又自动使用的是tomcat缺省编码格式iso-8859-1。但出现的乱码问题是：句号，逗号，等特殊符号变成了乱码，汉字如果数量为奇数，则会出现乱码，偶数则解析正常。解决方式：下载commons-fileupload-111jar这个版本的jar已经解决了这些bug。但是取出内容时仍然需要对取出的字符进行从iso8859-1到utf-8转码。已经能得到正常所有汉字以及字符。5，Java代码关于url请求，接受参数的乱码url的编码格式，取决于上面所说的URIEncoding=”UTF-8”。如果设定了这个编码格式，则意味着所有到url的汉字参数，都必须进行编码才可以。否则得到的汉字参数值都是乱码，例如一个链接ResponsesendDerect(“/ajspname=张大维”)；而在ajsp里面直接使用Stringname=requestgetParameter("name")；得到的就是乱码。因为规定了必须是utf-8才可以，所以，这个转向应该这样写：ResponsesendDerect(“/ajspname=URLEncodeencode(“张大维”,”utf-8”)；才可以。如果不设置这个参数URIEncoding=”UTF-8”，会怎么样呢不设置则就使用了缺省的编码格式iso8859-1。问题又出来了，第一就是参数值的个数如果是奇数个数，则就可以正常解析，如果使偶数个数，得到最后字符就是乱码。还有就是如果最后一个字符如果是英文，则就能正常解析，但中文的标点符号仍出现乱码。权宜之计，如果您的参数中没有中文标点符号，则可以在参数值最后加一个英文符号来解决乱码问题，得到参数后再去掉这个最后面的符号。也可以凑或使用。6，脚本代码关于url请求，接受到的参数乱码脚本中也会进行页面转向的控制，也会涉及到附带参数，并在接受页面解析这个参数的情况。如果这个汉字参数不进行URIEncoding=”UTF-8”所指定的编码处理，则接受页面接受到的汉字也是乱码。脚本处理编码比较麻烦，必须有相应的编码脚本对应文件，然后调用脚本中的方法对汉字进行编码即可。7，关于jsp在MyEclipse中打开的乱码问题对于一个已经存在的项目，Jsp文件的存储格式可能是utf-8。如果新安装的eclipse，则缺省打开使用的编码格式都是iso8859-1。所以导致jsp里面的汉字出现乱码。这个乱码比较容易解决，直接到eclipse31的偏好设置里面找到general-〉edidor，设置为您的文件打开编码为utf-8即可。Eclipse会自动重新以新的编码格式打开。汉字即可正常显示。8，关于html页面在eclipse中打开出现乱码情况由于大部分页面都是由dreamweaver制作，其存储格式跟eclipse的识别有差别导致。一般这种情况，在eclipse中新建一个jsp，直接从dreamweaver复制页面内容粘贴到jsp即可在使用JSP的过程中，最使人头疼的一个问题就是中文乱码问题，以下是我在软件开发中遇到的乱码问题以及解决方法。1、JSP页面乱码这种乱码的原因是应为没有在页面里指定使用的字符集编码，解决方法：只要在页面开始地方用下面代码指定字符集编码即可，2、数据库乱码这种乱码会使你插入数据库的中文变成乱码，或者读出显示时也是乱码，解决方法如下：在数据库连接字符串中加入编码字符集StringUrl="jdbc:mysql://localhost/digitgulfuser=root&password=root&useUnicode=true&characterEncoding=utf-8";并在页面中使用如下代码：responsesetContentType("text/html;charset=utf-8");requestsetCharacterEncoding("utf-8");3、中文作为参数传递乱码当我们把一段中文字符作为参数传递个另一页面时，也会出现乱码情况，解决方法如下：在参数传递时对参数编码，比如RearshResjspkeywords="+javanetURLEncoderencode(keywords)然后在接收参数页面使用如下语句接收keywords=newString(requestgetParameter("keywords")getBytes("8859_1"));以上为现阶段遇到的乱码问题，乱码的核心问题还是字符集编码问题，我之前也就是被页面的乱码给困惑了很久感觉这个还是挺有用的就给大家分享下。

三种方法：
1
你把你的系统装换成繁体中文。控制面板里设置（需要安装盘，读字库）
2
你找个简体中文的补丁。或者能正常显示的中文（包括繁体）
3
你用内码转换工具，每次玩的时候运行，就能变成简体的了。

HTML页面设置了UTF-8仍然中文乱码，原因：网页没有设置meta charset编码造成，导致浏览器不能识别网页默认编码类型。

解决的方法如下：

1、首先，打开HTML页面，右键单击HTML页面中的空白处，然后d出下图中的菜单栏，如下图所示。

2、其次，在d出的菜单栏界面中，单击以打开“编码”设置选项，如下图所示。

3、随后，在d出的菜单栏界面中，选择转换编码，如下图所示。

4、最后，问题就解决了，如下图所示。

网页出现乱码，是由于字符编码格式不一致导致的。

如果希望网页当中没有乱码，需要保证浏览器的字符编码格式以及文件的字符编码格式，HTML文件当中内容的字符编码格式保持一致。

在大部分情况下，会将HTML文件的字符编码格式设置为UTF-8。

在HTML文件当中，可以通过meta标签设置字符编码，将charset属性设置为utf-8。

HTML文件本身的编码格式也需要调整为utf-8。在使用标准的HTML代码编辑器（如Sublime）时，网页文档的编码格式默认为utf-8，但是如果是采用txt文本文档作为HTML文件（通过后期修改后缀名），字符编码默认为ANSI，此时就会导致编码的不一致从而引发乱码问题。

浏览器的编码格式需要在浏览器菜单栏当中进行设置，在大部分情况下浏览器默认的字符编码为UNICODE（UTF-8）

首先，编码要设置好。

如果LZ是普通用户，按下图方法设置合适的编码，比如繁体中文、简体中文还有那个“其它”里面的utf-8编码，都试试，应该会有合适的：

但这样有个问题，每次打开这个页面都要选一次。

如果LZ是这个网页的开发者，记得把全站的编码统一下就OK了，如果是繁体，就全部设为繁体 big5，否则，整站文件的默认编码设为utf-8或gd2312，记得，只能选其中一个。

希望以上对LZ有帮助吧。

也许是网络或者对方服务器的问题等等看你本地电脑是解决不了的,如果能解决这一问题有两种现象：一种是语言的选择不当引起的，比如说浏览繁体网页，或国外有些网站，电脑一时不能自动转换内码，而出现了乱码。消除这种情况，可单击浏览器上的“查看”/“编码”，选取你要显示的文字，则乱码取消。另一种是电脑缺少内码转换器，如是则安装上就好了。另外如果你不介意的话,刷新一下就可以了,试试看,不行!

上网时经常遇到这样一个问题，那就是打开一个网页后发现里面全是“看不明白是什么文字的内容”或“不知道写了什么的内容”，我们把这些统称为乱码。下面我说一下如何处理乱码。
第一种方法：刷新页面。刷新页面的方法有三种（其实我们最常用的这三种方法，不仅在网页浏览时使用，在其他问题的解决过程中也常用些三种方法），即使用菜单、使用工具栏，使用右键快捷菜单。
一、使用菜单。打开查看菜单，单击其中的“刷新（R） F5”。括号里的（R）表示，可以用快捷键来进行 *** 作。即“CTRL+R”， *** 作方法是按住CTRL键不放按一次R键。后面的F5说明还可以直接按键盘上的功能键F5。
二、使用工具栏。按一下工具栏（即有各种图标的那一行，这一行的左边一般是“后退”“前进”等按钮）中的刷新按钮（即在一张白纸上有两个弯曲箭头的按钮，在我使用的XP系统中是第四个按钮）。把鼠标移动到此按钮上（是移动到而不是单击或双击），就能在提示语言中看出是不是我们要使用的工具（有时可能需要等上几秒，一定要耐心一点才可以）。
三、使用右键快捷菜单。在网页中鼠标显示为正常的朝着左上的箭头时或鼠标为I形状时，单击鼠标右键，在出现的快捷菜单中单击刷新。
第二种方法：调整编码。这里有两种方法。
一、使用菜单。打开查看菜单，把鼠标移动到“编码”菜单，出现下一级菜单后（在其右侧出现的菜单行，我们叫做下一级菜单或子菜单），单击其中合适的编码。如在浏览中文网站时，就选择简体中文或繁体中文；如浏览朝文网站时，则选择朝文。如果在此一级菜单项中找不到我们要用的菜单项，就把鼠标移动到“其他”菜单项上，出现下一级菜单后，在其中进行选择。
二、使用右键快捷菜单。在网页中鼠标显示为正常的朝着左上的箭头时或鼠标为I形状时，单击鼠标右键，把鼠标移动到“编码”快捷菜单，出现下一级菜单后（在其右侧出现的菜单行，我们叫做下一级菜单或子菜单），单击其中合适的编码。如在浏览中文网站时，就选择简体中文或繁体中文；如浏览朝文网站时，则选择朝文。如果在此一级菜单项中找不到我们要用的菜单项，就把鼠标移动到“其他”菜单项上，出现下一级菜单后，在其中进行选择。
无论用何种方法，在编码的下一级菜单中都有一个“自动选择”一个菜单，一般要选中它。这样进入一个网页后，系统会根据网页的内容选择正确地选择编码，以便正确地显示网页。如果在“自动选择”菜单项前有对钩（√）则说明此项已被选择。如果没有，就要在其上面单击一下。如果要取消“自动选择”，则再在其上面单击一次就可以。
如果是打开网页出现乱码的情况，是因为编码不统一的问题，解决办法，直接在乱码页面，右键--编码--如果是utf-8的话，你改成gb2312，如果是gb2312的话，你改成utf-8。就可以解决了。如果不是这两个的话，你直接改成这两个的任一试试。

欢迎分享，转载请注明来源：内存溢出

原文地址: http://outofmemory.cn/yw/13047534.html

如何解决网页中文乱码问题

发表评论

评论列表（0条）