1、数据库、数据表、字段 编码格式要保持一致
2、如果在doc界面录入数据,要保持当前编码格式与数据表编码格式一致
3、php读取数据显示,要保持文件的编码格式、html页面的编码格式同数据库一致,编码格式为utf-8或gb2312或gbk
4、php连接数据库之后mysql_query('set names gbk')
你的问题应该是数据库编码格式不是utf-8,查看一下
在sql语言里"存在"exists子句是非常不好理解的。exists子句有两种用法,一种为独立exists子查询,另一种是父子关联子查询。前者对父查询不构成筛选作用,子查询若果有记录存在的话则输出所有的父查询记录集,反之则父查询输出空记录集。后者会对父查询构成筛选作用,不使用not关键字的情况下输出父查询中与子查询的交集,而使用not时则输出父查询中与子查询的非交集。至于如何判断exists子查询属于独立还是父子关联查询,以及为什么父子关联exists子查询会对父查询构成筛选作用,解释起来需要很大的篇幅这里就不讲了。反正我们记住父子关联查询的最常用功能就是它可以求出两张表的交集或非交集(使用not关键字)和不使用group分组的情况下求出某张表的最大值或最小值。
显示界面,JSP 2.0JAVA容器:Tomcat 5.X
MVC构架:Struts 1.2
ORM工具:Hibernate 3
数据库:MySQL 5.0
编译IDE:MyEclipse 5.0
知道了有六个地方要设定编码,那么哪种编码最好呢?使用中文可以GBK,但我认为UTF-8会是更好的选择,如果想知道了解编码的更多细节,请访问:
计算机编码大全-A
计算机编码大全-B
好现在选定UTF-8,在上面的这六个地方一一设定吧:
显示界面,JSP
在页面的开头加入或修改成:<%@ page language="java" pageEncoding="utf-8"%>红色部分为要设定部分。
JAVA容器:Tomcat
本人参照某兄台的之作:Tomcat中文编码问题解决方案(简) 有兴趣可以进去看看。
下面开始设定,在Tomcat安装目录下的conf文件打开Server.xml文件,找到相应段落并更改成以下字样:
<Connector port="8080" maxThreads="150" minSpareThreads="25"
maxSpareThreads="75" enableLookups="false" redirectPort="8443"
acceptCount="100" debug="0" connectionTimeout="20000"
disableUploadTimeout="true" URIEncoding="utf-8"/>
红色部分为要设定部分。
MVC构架:Struts
在这里添加一个字符集的Fliter,代码如下:
package com.ruder.filters
//上面的包名表示你把这个Fliter文件放在哪个包中,在下面的Web.xml也要相应改动。
import java.io.IOException
import javax.servlet.Filter
import javax.servlet.FilterChain
import javax.servlet.FilterConfig
import javax.servlet.ServletException
import javax.servlet.ServletRequest
import javax.servlet.ServletResponse
import javax.servlet.UnavailableException
public class SetCharacterEncodingFilter implements Filter {
protected String encoding = null
protected FilterConfig filterConfig = null
protected boolean ignore = true
public void destroy() {
this.encoding = null
this.filterConfig = null
}
public void doFilter(ServletRequest request, ServletResponse response,
FilterChain chain)
throws IOException, ServletException {
// Conditionally select and set the character encoding to be used
if (ignore || (request.getCharacterEncoding() == null)) {
String encoding = selectEncoding(request)
if (encoding != null)
request.setCharacterEncoding(encoding)
}
// Pass control on to the next filter
chain.doFilter(request, response)
}
public void init(FilterConfig filterConfig) throws ServletException {
this.filterConfig = filterConfig
this.encoding = filterConfig.getInitParameter("encoding")
String value = filterConfig.getInitParameter("ignore")
if (value == null)
this.ignore = true
else if (value.equalsIgnoreCase("true"))
this.ignore = true
else if (value.equalsIgnoreCase("yes"))
this.ignore = true
else
this.ignore = false
}
protected String selectEncoding(ServletRequest request) {
return (this.encoding)
}
}
下面是对Web.xml的配置:
<filter>
<filter-name>Set Character Encoding</filter-name>
<filter-class>com.ruder.filters.SetCharacterEncodingFilter</filter-class>
<init-param>
<param-name>encoding</param-name>
<param-value>UTF-8</param-value>
</init-param>
</filter>
<filter-mapping>
<filter-name>Set Character Encoding</filter-name>
<url-pattern>
21public void init(FilterConfig arg0) throws ServletException {
22// TODO Auto-generated method stub
23this.filterConfig = arg0
24this.defaultEncoding = filterConfig.getInitParameter("defaultencoding")
25}
26
27
30public void doFilter(
31ServletRequest request,
32ServletResponse response,
33FilterChain chain)
34throws IOException, ServletException {
35// TODO Auto-generated method stub
36request.setCharacterEncoding(selectEncoding(request))
37chain.doFilter(request, response)
38}
39
40
41public void destroy() {
42
43this.defaultEncoding = null
44this.filterConfig = null
45}
46
47
48protected String selectEncoding(ServletRequest request) {
49
50return this.defaultEncoding
51}
52
53}
4.提交表单的jsp页面设置
<%@ page language="java" contentType="text/htmlcharset=UTF-8"%>
至此问题已经解决,但是还有一些我们应该了解的,下面我简述一下:
为每个jsp页面设置了其编码格式(utf-8),但传递数据到另一页面时依然显示为乱码? 首先要需要了解的是web容器默认编码是iso-8859-1,一个汉字占用两个字节,而在utf-8中一个汉字占用三个字节。所以在数据传递过程中,必须手动设定容器编码格式,否则会出现字符位丢失的情况。即3个字节变为两个字节,自然会变成乱码。为什么保存到数据库中的数据都变成了乱码? 原理同上,首先要搞清楚使用的数据库默认的编码格式,比如mysql默认的字符编码是ISO-8859-1。所以必须手动修改其默认编码格式。 清楚了以上问题后,再来看如何解决utf-8的乱码问题。
1.设置web容器的编码格式。为你的servlet的doGet或doPost方法开始处加入如下代码:request.setCharacterEncoding("utf-8") response.setCharacterEncoding ("utf-8")
2.为每个jsp页面指定其编码格式。<%@ page pageEncoding="utf-8"%>
3.在连接数据库用的URL后加入:useUnicode=truecharacterEncoding=utf-8 如: url="jdbc:mysql:///db1?useUnicode=truecharacterEncoding=utf-8"
4.为指定数据库默认编码格式。在C:\WINDOWS目录下找到my.ini文件,并在 [mysqld]中加入default-character-set=gbk,重新启动mysql服务。
至此,乱码问题全部解决。
起初总搞上去不清,为什么要将mysql的默认编码格式设置为gbk,后来由相关的资料得知utf-8默认输入编码方式为gbk,默认输出编码方式为utf-16be。
个人认为,将数据进行utf-8进行编码的目的(即将中文编码为%的形式),主要是为了在多层服务间进行数据传输时,防止发生字符丢失(如msn)。普通的web程序显然没有必要这样做,只要使用以上方法进行处理,就可以有效的解决乱码问题,从而结省存储空间。如果都像公司的SC系统那样,将一个汉字编码为18个字符后,再存储到数据库中,抛开效率不说,就存储空间的浪费就够人受的,要知道,那是需要银子地!
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)