myeclipse从mysql里读取数据时乱码

myeclipse从mysql里读取数据时乱码,第1张

显示界面,JSP 2.0

JAVA容器:Tomcat 5.X

MVC构架:Struts 1.2

ORM工具:Hibernate 3

数据库:MySQL 5.0

编译IDE:MyEclipse 5.0

知道了有六个地方要设定编码,那么哪种编码最好呢?使用中文可以GBK,但我认为UTF-8会是更好的选择,如果想知道了解编码的更多细节,请访问:

计算机编码大全-A

计算机编码大全-B

好现在选定UTF-8,在上面的这六个地方一一设定吧:

显示界面,JSP

在页面的开头加入或修改成:<%@ page language="java" pageEncoding="utf-8"%>红色部分为要设定部分。

JAVA容器:Tomcat

本人参照某兄台的之作:Tomcat中文编码问题解决方案(简) 有兴趣可以进去看看。

下面开始设定,在Tomcat安装目录下的conf文件打开Server.xml文件,找到相应段落并更改成以下字样:

<Connector port="8080" maxThreads="150" minSpareThreads="25"

maxSpareThreads="75" enableLookups="false" redirectPort="8443"

acceptCount="100" debug="0" connectionTimeout="20000"

disableUploadTimeout="true" URIEncoding="utf-8"/>

红色部分为要设定部分。

MVC构架:Struts

在这里添加一个字符集的Fliter,代码如下:

package com.ruder.filters

//上面的包名表示你把这个Fliter文件放在哪个包中,在下面的Web.xml也要相应改动。

import java.io.IOException

import javax.servlet.Filter

import javax.servlet.FilterChain

import javax.servlet.FilterConfig

import javax.servlet.ServletException

import javax.servlet.ServletRequest

import javax.servlet.ServletResponse

import javax.servlet.UnavailableException

public class SetCharacterEncodingFilter implements Filter {

protected String encoding = null

protected FilterConfig filterConfig = null

protected boolean ignore = true

public void destroy() {

this.encoding = null

this.filterConfig = null

}

public void doFilter(ServletRequest request, ServletResponse response,

FilterChain chain)

throws IOException, ServletException {

// Conditionally select and set the character encoding to be used

if (ignore || (request.getCharacterEncoding() == null)) {

String encoding = selectEncoding(request)

if (encoding != null)

request.setCharacterEncoding(encoding)

}

// Pass control on to the next filter

chain.doFilter(request, response)

}

public void init(FilterConfig filterConfig) throws ServletException {

this.filterConfig = filterConfig

this.encoding = filterConfig.getInitParameter("encoding")

String value = filterConfig.getInitParameter("ignore")

if (value == null)

this.ignore = true

else if (value.equalsIgnoreCase("true"))

this.ignore = true

else if (value.equalsIgnoreCase("yes"))

this.ignore = true

else

this.ignore = false

}

protected String selectEncoding(ServletRequest request) {

return (this.encoding)

}

}

下面是对Web.xml的配置:

<filter>

<filter-name>Set Character Encoding</filter-name>

<filter-class>com.ruder.filters.SetCharacterEncodingFilter</filter-class>

<init-param>

<param-name>encoding</param-name>

<param-value>UTF-8</param-value>

</init-param>

</filter>

<filter-mapping>

<filter-name>Set Character Encoding</filter-name>

<url-pattern>

21public void init(FilterConfig arg0) throws ServletException {

22// TODO Auto-generated method stub

23this.filterConfig = arg0

24this.defaultEncoding = filterConfig.getInitParameter("defaultencoding")

25}

26

27

30public void doFilter(

31ServletRequest request,

32ServletResponse response,

33FilterChain chain)

34throws IOException, ServletException {

35// TODO Auto-generated method stub

36request.setCharacterEncoding(selectEncoding(request))

37chain.doFilter(request, response)

38}

39

40

41public void destroy() {

42

43this.defaultEncoding = null

44this.filterConfig = null

45}

46

47

48protected String selectEncoding(ServletRequest request) {

49

50return this.defaultEncoding

51}

52

53}

4.提交表单的jsp页面设置

<%@ page language="java" contentType="text/htmlcharset=UTF-8"%>

至此问题已经解决,但是还有一些我们应该了解的,下面我简述一下:

为每个jsp页面设置了其编码格式(utf-8),但传递数据到另一页面时依然显示为乱码? 首先要需要了解的是web容器默认编码是iso-8859-1,一个汉字占用两个字节,而在utf-8中一个汉字占用三个字节。所以在数据传递过程中,必须手动设定容器编码格式,否则会出现字符位丢失的情况。即3个字节变为两个字节,自然会变成乱码。为什么保存到数据库中的数据都变成了乱码? 原理同上,首先要搞清楚使用的数据库默认的编码格式,比如mysql默认的字符编码是ISO-8859-1。所以必须手动修改其默认编码格式。 清楚了以上问题后,再来看如何解决utf-8的乱码问题。

1.设置web容器的编码格式。为你的servlet的doGet或doPost方法开始处加入如下代码:request.setCharacterEncoding("utf-8") response.setCharacterEncoding ("utf-8")

2.为每个jsp页面指定其编码格式。<%@ page pageEncoding="utf-8"%>

3.在连接数据库用的URL后加入:useUnicode=truecharacterEncoding=utf-8 如: url="jdbc:mysql:///db1?useUnicode=truecharacterEncoding=utf-8"

4.为指定数据库默认编码格式。在C:\WINDOWS目录下找到my.ini文件,并在 [mysqld]中加入default-character-set=gbk,重新启动mysql服务。

至此,乱码问题全部解决。

起初总搞上去不清,为什么要将mysql的默认编码格式设置为gbk,后来由相关的资料得知utf-8默认输入编码方式为gbk,默认输出编码方式为utf-16be。

个人认为,将数据进行utf-8进行编码的目的(即将中文编码为%的形式),主要是为了在多层服务间进行数据传输时,防止发生字符丢失(如msn)。普通的web程序显然没有必要这样做,只要使用以上方法进行处理,就可以有效的解决乱码问题,从而结省存储空间。如果都像公司的SC系统那样,将一个汉字编码为18个字符后,再存储到数据库中,抛开效率不说,就存储空间的浪费就够人受的,要知道,那是需要银子地!

原来只知道, MySQL类型隐式替换会影响优化器对索引的选择, 由于遇到了一个隐式替换导致的精度丢失的 Bug ,引起了我对隐式替换的实现逻辑的好奇心.

为什么隐式替换会影响精度吗? 不是类似 String.valueOf() 处理吗?

执行SQL 1 :

查询结果 1 :

执行SQL 2 :

查询结果 2 :

由上面的两个SQL看到, 由于where条件的业务订单id筛选项没有添加引号, 导致了精度丢失问题. 210517130303013756 在表中是唯一的, 但是查出来多条数据.

如需构建演示环境请执行如下SQL

这里贴出了数字类型相关的替换规则, 想了解更多请查阅官方文档

有关隐式数字到字符串转换的字符集以及适用于 CREATE TABLE ... SELECT 语句的修改规则,请参阅本节后面的信息。

以下规则描述了比较 *** 作如何发生转换:

有关将值从一种时间类型转换为另一种时间类型的信息,请参见 第11.2.8节“日期和时间类型之间的转换” 。

由于 210517130303013756 没有加引号, 默认将其作为浮点数处理, 所以在 210517130303013756 转浮点数的时候, 导致了精度丢失问题.


欢迎分享,转载请注明来源:内存溢出

原文地址: https://outofmemory.cn/zaji/8687136.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-04-19
下一篇 2023-04-19

发表评论

登录后才能评论

评论列表(0条)

保存