JAVA容器:Tomcat 5.X
MVC构架:Struts 1.2
ORM工具:Hibernate 3
数据库:MySQL 5.0
编译IDE:MyEclipse 5.0
知道了有六个地方要设定编码,那么哪种编码最好呢?使用中文可以GBK,但我认为UTF-8会是更好的选择,如果想知道了解编码的更多细节,请访问:
计算机编码大全-A
计算机编码大全-B
好现在选定UTF-8,在上面的这六个地方一一设定吧:
显示界面,JSP
在页面的开头加入或修改成:<%@ page language="java" pageEncoding="utf-8"%>红色部分为要设定部分。
JAVA容器:Tomcat
本人参照某兄台的之作:Tomcat中文编码问题解决方案(简) 有兴趣可以进去看看。
下面开始设定,在Tomcat安装目录下的conf文件打开Server.xml文件,找到相应段落并更改成以下字样:
<Connector port="8080" maxThreads="150" minSpareThreads="25"
maxSpareThreads="75" enableLookups="false" redirectPort="8443"
acceptCount="100" debug="0" connectionTimeout="20000"
disableUploadTimeout="true" URIEncoding="utf-8"/>
红色部分为要设定部分。
MVC构架:Struts
在这里添加一个字符集的Fliter,代码如下:
package com.ruder.filters
//上面的包名表示你把这个Fliter文件放在哪个包中,在下面的Web.xml也要相应改动。
import java.io.IOException
import javax.servlet.Filter
import javax.servlet.FilterChain
import javax.servlet.FilterConfig
import javax.servlet.ServletException
import javax.servlet.ServletRequest
import javax.servlet.ServletResponse
import javax.servlet.UnavailableException
public class SetCharacterEncodingFilter implements Filter {
protected String encoding = null
protected FilterConfig filterConfig = null
protected boolean ignore = true
public void destroy() {
this.encoding = null
this.filterConfig = null
}
public void doFilter(ServletRequest request, ServletResponse response,
FilterChain chain)
throws IOException, ServletException {
// Conditionally select and set the character encoding to be used
if (ignore || (request.getCharacterEncoding() == null)) {
String encoding = selectEncoding(request)
if (encoding != null)
request.setCharacterEncoding(encoding)
}
// Pass control on to the next filter
chain.doFilter(request, response)
}
public void init(FilterConfig filterConfig) throws ServletException {
this.filterConfig = filterConfig
this.encoding = filterConfig.getInitParameter("encoding")
String value = filterConfig.getInitParameter("ignore")
if (value == null)
this.ignore = true
else if (value.equalsIgnoreCase("true"))
this.ignore = true
else if (value.equalsIgnoreCase("yes"))
this.ignore = true
else
this.ignore = false
}
protected String selectEncoding(ServletRequest request) {
return (this.encoding)
}
}
下面是对Web.xml的配置:
<filter>
<filter-name>Set Character Encoding</filter-name>
<filter-class>com.ruder.filters.SetCharacterEncodingFilter</filter-class>
<init-param>
<param-name>encoding</param-name>
<param-value>UTF-8</param-value>
</init-param>
</filter>
<filter-mapping>
<filter-name>Set Character Encoding</filter-name>
<url-pattern>
21public void init(FilterConfig arg0) throws ServletException {
22// TODO Auto-generated method stub
23this.filterConfig = arg0
24this.defaultEncoding = filterConfig.getInitParameter("defaultencoding")
25}
26
27
30public void doFilter(
31ServletRequest request,
32ServletResponse response,
33FilterChain chain)
34throws IOException, ServletException {
35// TODO Auto-generated method stub
36request.setCharacterEncoding(selectEncoding(request))
37chain.doFilter(request, response)
38}
39
40
41public void destroy() {
42
43this.defaultEncoding = null
44this.filterConfig = null
45}
46
47
48protected String selectEncoding(ServletRequest request) {
49
50return this.defaultEncoding
51}
52
53}
4.提交表单的jsp页面设置
<%@ page language="java" contentType="text/htmlcharset=UTF-8"%>
至此问题已经解决,但是还有一些我们应该了解的,下面我简述一下:
为每个jsp页面设置了其编码格式(utf-8),但传递数据到另一页面时依然显示为乱码? 首先要需要了解的是web容器默认编码是iso-8859-1,一个汉字占用两个字节,而在utf-8中一个汉字占用三个字节。所以在数据传递过程中,必须手动设定容器编码格式,否则会出现字符位丢失的情况。即3个字节变为两个字节,自然会变成乱码。为什么保存到数据库中的数据都变成了乱码? 原理同上,首先要搞清楚使用的数据库默认的编码格式,比如mysql默认的字符编码是ISO-8859-1。所以必须手动修改其默认编码格式。 清楚了以上问题后,再来看如何解决utf-8的乱码问题。
1.设置web容器的编码格式。为你的servlet的doGet或doPost方法开始处加入如下代码:request.setCharacterEncoding("utf-8") response.setCharacterEncoding ("utf-8")
2.为每个jsp页面指定其编码格式。<%@ page pageEncoding="utf-8"%>
3.在连接数据库用的URL后加入:useUnicode=truecharacterEncoding=utf-8 如: url="jdbc:mysql:///db1?useUnicode=truecharacterEncoding=utf-8"
4.为指定数据库默认编码格式。在C:\WINDOWS目录下找到my.ini文件,并在 [mysqld]中加入default-character-set=gbk,重新启动mysql服务。
至此,乱码问题全部解决。
起初总搞上去不清,为什么要将mysql的默认编码格式设置为gbk,后来由相关的资料得知utf-8默认输入编码方式为gbk,默认输出编码方式为utf-16be。
个人认为,将数据进行utf-8进行编码的目的(即将中文编码为%的形式),主要是为了在多层服务间进行数据传输时,防止发生字符丢失(如msn)。普通的web程序显然没有必要这样做,只要使用以上方法进行处理,就可以有效的解决乱码问题,从而结省存储空间。如果都像公司的SC系统那样,将一个汉字编码为18个字符后,再存储到数据库中,抛开效率不说,就存储空间的浪费就够人受的,要知道,那是需要银子地!
原来只知道, MySQL类型隐式替换会影响优化器对索引的选择, 由于遇到了一个隐式替换导致的精度丢失的 Bug ,引起了我对隐式替换的实现逻辑的好奇心.
为什么隐式替换会影响精度吗? 不是类似 String.valueOf() 处理吗?
执行SQL 1 :
查询结果 1 :
执行SQL 2 :
查询结果 2 :
由上面的两个SQL看到, 由于where条件的业务订单id筛选项没有添加引号, 导致了精度丢失问题. 210517130303013756 在表中是唯一的, 但是查出来多条数据.
如需构建演示环境请执行如下SQL
这里贴出了数字类型相关的替换规则, 想了解更多请查阅官方文档
有关隐式数字到字符串转换的字符集以及适用于 CREATE TABLE ... SELECT 语句的修改规则,请参阅本节后面的信息。
以下规则描述了比较 *** 作如何发生转换:
有关将值从一种时间类型转换为另一种时间类型的信息,请参见 第11.2.8节“日期和时间类型之间的转换” 。
由于 210517130303013756 没有加引号, 默认将其作为浮点数处理, 所以在 210517130303013756 转浮点数的时候, 导致了精度丢失问题.
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)