对于Java,由于默认的编码方式是UNICODE,所以用中文也易出问题,常见的解决是:
String s2 = new String(s1getBytes(“ISO-8859-1”),”GBK”);
1、utf8解决JSP中文乱码问题
一般说来在每个页面的开始处,加入:
<%@ page language="java" contentType="text/html; charset=UTF-8"
pageEncoding="UTF-8"%>
<%@ page language="java" contentType="text/html; charset=UTF-8"
pageEncoding="UTF-8"%>
<%
requestsetCharacterEncoding("UTF-8");
%>
◆charset=UTF-8的作用是指定JSP向客户端输出的编码方式为“UTF-8”;
◆pageEncoding="UTF-8",为了让JSP引擎能正确地解码含有中文字符的JSP页面,这在LINUX中很有效;
◆requestsetCharacterEncoding("UTF-8");是对请求进行了中文编码。
有时,这样仍不能解决问题,还需要这样处理一下:
String msg = requestgetParameter("message");
String str=new String(msggetBytes("ISO-8859-1"),"UTF-8");
outprintln(st);
原因主要有两方面,Java和JSP文件本身编译时产生的乱码问题和Java程序于其他媒介交互产生的乱码问题。首先Java(包括JSP)源文件中很可能包含有中文,而Java和JSP源文件的保存方式是基于字节流的,如果Java和JSP编译成class文件过程中,使用的编码方式与源文件的编码不一致,就会出现乱码。基于这种乱码,建议在Java文件中尽量不要写中文(注释部分不参与编译,写中文没关系),如果必须写的话,尽量手动带参数-ecoding GBK或-ecoding gb2312编译;对于JSP,在文件头加上或基本上就能解决这类乱码问题。本文要重点讨论的是第二类乱码,即Java程序与其他存储媒介交互时产生的乱码。很多存储媒介,如数据库,文件,流等的存储方式都是基于字节流的,Java程序与这些媒介交互时就会发生字符(char)与字节(byte)之间的转换,具体情况如下:从页面form提交数据到java程序 byte->char从java程序到页面显示 char>byte从数据库到java程序 byte>char从java程序到数据库 char>byte从文件到java程序 byte->char从java程序到文件 char->byte从流到java程序 byte->char从java程序到流 char->byte如果在以上转换过程中使用的编码方式与字节原有的编码不一致,很可能就会出现乱码。二、Java/JSP中文乱码的解决方法前面已经提到了Java程序与其他媒介交互时字符和字节的转换过程,如果这些转换过程中容易产生乱码。解决这些乱码问题的关键在于确保转换时使用的编码方式与字节原有的编码方式保持一致,下面分别论述(Java或JSP自身产生的乱码请参看第一部分)。1、JSP与页面参数之间的乱码JSP获取页面参数时一般采用系统默认的编码方式,如果页面参数的编码类型和系统默认的编码类型不一致,很可能就会出现乱码。解决这类乱码问题的基本方法是在页面获取参数之前,强制指定request获取参数的编码方式:requestsetCharacterEncoding("GBK")或 requestsetCharacterEncoding("gb2312")。如果在JSP将变量输出到页面时出现了乱码,可以通过设置 responsesetContentType("text/html;charset=GBK")或 responsesetContentType("text/html;charset=gb2312")解决。如果不想在每个文件里都写这样两句话,更简洁的办法是使用Servlet规范中的过虑器指定编码,过滤器的在webxml中的典型配置和主要代码如下:webxml: CharacterEncodingFilter netvschoolwebCharacterEncodingFilter encodingGBK CharacterEncodingFilter / CharacterEncodingFilterjava: public class CharacterEncodingFilter implements Filter { protected String encoding = null; public void init(FilterConfig filterConfig) throws ServletException { thisencoding = filterConfiggetInitParameter("encoding"); } public void doFilter(ServletRequest request, ServletResponse response, FilterChain chain) throws IOException, ServletException { requestsetCharacterEncoding(encoding); responsesetContentType("text/html;charset="+encoding); chaindoFilter(request, response); } } 2、Java与数据库之间的乱码大部分数据库都支持以unicode编码方式,所以解决Java与数据库之间的乱码问题比较明智的方式是直接使用unicode编码与数据库交互。很多数据库驱动自动支持unicode,如Microsoft的SQLServer驱动。其他大部分数据库驱动,可以在驱动的url参数中指定,如如mm的mysql驱动:jdbc:mysql://localhost /WEBCLDBuseUnicode=true&characterEncoding=GBK。3、Java与文件/流之间的乱码Java读写文件最常用的类是 FileInputStream/FileOutputStream和FileReader/FileWriter。其中FileInputStream 和FileOutputStream是基于字节流的,常用于读写二进制文件。读写字符文件建议使用基于字符的FileReader和 FileWriter,省去了字节与字符之间的转换。但这两个类的构造函数默认使用系统的编码方式,如果文件内容与系统编码方式不一致,可能会出现乱码。在这种情况下,建议使用FileReader和FileWriter的父类:InputStreamReader/OutputStreamWriter,它们也是基于字符的,但在构造函数中可以指定编码类型:InputStreamReader(InputStream in, Charset cs) 和OutputStreamWriter(OutputStream out, Charset cs)。4、其他上面提到的方法应该能解决大部分乱码问题,如果在其他地方还出现乱码,可能需要手动修改代码。解决Java乱码问题的关键在于在字节与字符的转换过程中,你必须知道原来字节或转换后的字节的编码方式,转换时采用的编码必须与这个编码方式保持一致。
最近用到了字符串的压缩 用到了GZipInputStream和GZipOutputStream 再次遇到了阔别已久的中文乱码问题 看了一些相关的文章 觉得我们之所以会遇到这样那样的乱码问题 基本上都是由于我们在某些地方隐含了byte到char的转换 而这种隐含的转换采用的是iso 的编码进行的 以jsp页面中文传递为例子 假设客户端的编码是GB 表单中的中文提交后 首先根据GB 编码转换为字节流 到达服务器端后 如果我们直接在servlet中调用request getParameter(String name)等方法 由于方法返回的是String 对象 所以其中必然隐含了一次从byte到char的转换 错误也就是在这里产生的 如果这次转换采用的编码是iso 得到的当然是乱码 public class Loginextends >
以上就是关于JAVA乱码问题全部的内容,包括:JAVA乱码问题、浅谈如何解决Java/JSP中文乱码问题、分析 Java 中乱码问题产生的根源等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)