“JSP页面提交后，提交的post中文是正常的，但是到达服务器上，中文就乱码”是怎么回事?_随笔

有以下几种方法可以解决

1.在jsp 的java代码执行之前写入在 <% response.setContentType("text/htmlcharset=UTF-8")%>一定要是之前，因为设了这个下面代码才开始生效。可以写在jsp开头。

2.在在Servlet中service方法开始部分写入 response.setContentType("text/htmlcharset=UTF-8")

3.在过滤器中写入在Servlet中 response.setContentType("text/htmlcharset=UTF-8") 一般都写在过滤器中，可以减少代码重复量

4.对于提交已经编码的数据需要先解码再编码，也就是楼主的方法

new String(str.getBytes("ISO8859-1"),"UTF-8") 这种方法可以解决提交时候的问题，

new String(str.getBytes("UTF-8"),"ISO8859-1") 同样的道理解决已经编码的数据要显示到页面的时候就要反着写

还有就是项目中最好使用统一的编码包括：文件保存的时候使用的编码，jsp文件翻译时使用的编码，服务器响应编码，和提交编码，还有就是数据库的编码。

eclipse下：jsp和class文件保存时使用编码在文件右键的property选项中能找到，

jsp页面编码有两个<%@ page language="java" contentType="text/htmlcharset=UTF-8"

pageEncoding="UTF-8"%>

pageEncoding是设的是tomcat将jsp文件翻译成servlet程序的时候执行的翻译编码，而charset才是服务器响应编码也就是servlet中的response.setCharacterEncoding 一般都设置成UTF-8；

提交数据的时候也需要你那样转码，不过转码工作却实是写在过滤器里，可以写代码的减少麻烦

提交参数时候要设置request的编码，也就是你遇到的问题，按照我前四步的说明做就可以了。

JSP（全称JavaServer Pages）是由Sun Microsystems公司倡导和许多公司参与共同创建的一种使软件开发者可以响应客户端请求，而动态生成HTML、XML或其他格式文档的Web网页的技术标准。JSP技术是以Java语言作为脚本语言的，JSP网页为整个服务器端的Java库单元提供了一个接口来服务于HTTP的应用程序。用JSP开发的Web应用是跨平台的，既能在Linux下运行，也能在其他 *** 作系统上运行。

解决中文乱码的4种方法

一、JSP页面显示乱码

下面的显示页面(display.jsp)就出现乱码：

程序代码

<html>

<head>

<title>JSP的中文处理</title>

</head>

<body>

out.print("JSP的中文处理")

</body>

</html>

对不同的WEB服务器和不同的JDK版本，处理结果就不一样。原因：服务器使用的编码方式不同和浏览器对不同的字符显示结果不同而导致的。解决办法：在JSP页面中指定编码方式(gb2312),即在页面的第一行加上：<%@ page c%>，就可以消除乱码了。完整页面如下：

<%@ page c%>

<html>

<head>

<title>JSP的中文处理</title>

</head>

<body>

out.print("JSP的中文处理")

</body>

</html>

二、表单提交中文时出现乱码

下面是一个提交页面(submit.jsp)，代码如下：

程序代码

<html>

<head>

<title>JSP的中文处理</title>

</head>

<body>

</div>

</form>

</body>

</html>

下面是处理页面(process.jsp)代码：

程序代码

<%@ page c%>

<html>

<head>

<title>JSP的中文处理</title>

</head>

<body>

<%=request.getParameter("name")%>

</body>

</html>

如果submit.jsp提交英文字符能正确显示，如果提交中文时就会出现乱码。原因：浏览器默认使用UTF-8编码方式来发送请求，而UTF-8和GB2312编码方式表示字符时不一样，这样就出现了不能识别字符。解决办法:通过request.seCharacterEncoding("gb2312")对请求进行统一编码，就实现了中文的正常显示。修改后的process.jsp代码如下：

程序代码

<%@ page c%>

request.seCharacterEncoding("gb2312")

<html>

<head>

<title>JSP的中文处理</title>

</head>

<body>

<%=request.getParameter("name")%>

</body>

</html>

三、数据库连接出现乱码

只要涉及中文的地方全部是乱码，解决办法：在数据库的数据库URL中加上useUnicode=true&characterEncoding=GBK就OK了。

四、数据库的显示乱码

在mysql4.1.0中,varchar类型，text类型就会出现中文乱码，对于varchar类型把它设为binary属性就可以解决中文问题，对于text类型就要用一个编码转换类来处理，实现如下：

程序代码

public class Convert {

/** 把ISO-8859-1码转换成GB2312

public static String ISOtoGB(String iso){

String gb

try{

if(iso.equals("") || iso == null){

return ""

}

else{

iso = iso.trim()

gb = new String(iso.getBytes("ISO-8859-1"),"GB2312")

return gb

}

catch(Exception e){

System.err.print("编码转换错误："+e.getMessage())

return ""

}

把它编译成class，就可以调用Convert类的静态方法ISOtoGB()来转换编码。

form有2中方法把数据提交给服务器，get和post,分别说下吧。

（一）get提交

1.首先说下客户端（浏览器）的form表单用get方法是如何将数据编码后提交给服务器端的吧。

对于get方法来说，都是把数据串联在请求的url后面作为参数，如：http://localhost:8080/servlet?msg=abc

（很常见的一个乱码问题就要出现了，如果url中出现中文或其它特殊字符的话，如：http://localhost:8080//servlet?msg=杭州，服务器端容易得到乱码），url拼接完成后，浏览器会对url进行URL encode，然后发送给服务器，URL encode的过程就是把部分url做为字符，按照某种编码方式（如：utf-8,gbk等）编码成二进制的字节码，然后每个字节用一个包含3个字符的字符串 "%xy" 表示，其中xy为该字节的两位十六进制表示形式。我这里说的可能不清楚，具体介绍可以看下java.net.URLEncoder类的介绍在这里。了解了 URL encode的过程，我们能看到2个很重要的问题，第一：需要URL encode的字符一般都是非ASCII的字符（笼统的讲），再通俗的讲就是除了英文字母以外的文字（如：中文，日文等）都要进行URL encode，所以对于我们来说，都是英文字母的url不会出现服务器得到乱码问题，出现乱码都是url里面带了中文或特殊字符造成的；第二：URL encode到底按照那种编码方式对字符编码？这里就是浏览器的事情了，而且不同的浏览器有不同的做法，中文版的浏览器一般会默认的使用GBK，通过设置浏览器也可以使用UTF-8，可能不同的用户就有不同的浏览器设置，也就造成不同的编码方式，所以很多网站的做法都是先把url里面的中文或特殊字符用 javascript做URL encode，然后再拼接url提交数据，也就是替浏览器做了URL encode，好处就是网站可以统一get方法提交数据的编码方式。完成了URL encode，那么现在的url就成了ASCII范围内的字符了，然后以iso-8859-1的编码方式转换成二进制随着请求头一起发送出去。这里想多说几句的是，对于get方法来说，没有请求实体，含有数据的url都在请求头里面，之所以用URL encode，我个人觉的原因是：对于请求头来说最终都是要用iso-8859-1编码方式编码成二进制的101010.....的纯数据在互联网上传送，如果直接将含有中文等特殊字符做iso-8859-1编码会丢失信息，所以先做URL encode是有必要的。

2。服务器端（tomcat）是如何将数据获取到进行解码的。

第一步是先把数据用iso-8859-1进行解码，对于get方法来说，tomcat获取数据的是ASCII范围内的请求头字符，其中的请求url里面带有参数数据，如果参数中有中文等特殊字符，那么目前还是URL encode后的%XY状态，先停下，我们先说下开发人员一般获取数据的过程。通常大家都是request.getParameter("name")获取参数数据，我们在request对象或得的数据都是经过解码过的，而解码过程中程序里是无法指定，这里要说下，有很多新手说用 request.setCharacterEncoding("字符集")可以指定解码方式，其实是不可以的，看servlet的官方API说明有对此方法的解释：Overrides the name of the character encoding used in the body of this request. This method must be called prior to reading request parameters or reading input using getReader().可以看出对于get方法他是无能为力的。那么到底用什么编码方式解码数据的呢，这是tomcat的事情了，默认缺省用的是 iso-8859-1,这样我们就能找到为什么get请求带中文参数为什么在服务器端得到乱码了，原因是在客户端一般都是用UTF-8或GBK对数据 URL encode，这里用iso-8859-1方式URL decoder显然不行，在程序里我们可以直接

Java代码

1. new String(request.getParameter("name").getBytes("iso-8859-1"),"客户端指定的URL encode编码方式")

还原回字节码，然后用正确的方式解码数据，网上的文章通常是在tomcat里面做个配置

Xml代码

1. <Connector port="8080" protocol="HTTP/1.1" maxThreads="150" connectionTimeout="20000" redirectPort="8443" URIEncoding="GBK"/>

这样是让tomcat在获取数据后用指定的方式URL decoder，URL decoder的介绍在这里

（二）post提交

1.客户端（浏览器）的form表单用post方法是如何将数据编码后提交给服务器端的。

在post方法里所要传送的数据也要URL encode，那么他是用什么编码方式的呢？

在form所在的html文件里如果有段<meta http-equiv="Content-Type" content="text/htmlcharset=字符集（GBK，utf-8等）"/>，那么post就会用此处指定的编码方式编码。一般大家都认为这段代码是为了让浏览器知道用什么字符集来对网页解释，所以网站都会把它放在html代码的最前端，尽量不出现乱码，其实它还有个作用就是指定form表单的post方法提交数据的 URL encode编码方式。从这里可以看出对于get方法来数，浏览器对数据的URL encode的编码方式是有浏览器设置来决定，（可以用js做统一指定），而post方法，开发人员可以指定。

2。服务器端（tomcat）是如何将数据获取到进行解码的。

如果用tomcat默认缺省设置，也没做过滤器等编码设置，那么他也是用iso-8859-1解码的，但是request.setCharacterEncoding("字符集")可以派上用场。

我发现上面说的tomcat所做的事情前提都是在请求头里没有指定编码方式，如果请求头里指定了编码方式将按照这种方式编码。

欢迎分享，转载请注明来源：内存溢出

原文地址: http://outofmemory.cn/zaji/7076273.html

“JSP页面提交后，提交的post中文是正常的，但是到达服务器上，中文就乱码”是怎么回事?

发表评论

评论列表（0条）