mysql数据库表里中文乱码应该选哪种编码？_随笔

数据库中关于字符集的种类有很多,个人建议,数据库字符集尽量使用utf8(utf-8),以使你的数据能很顺利的实现迁移,因为utf8字符集是目前最适合于实现多种不同字符集之间的转换的字符集,尽管你在命令行工具上无法正确查看数据库中的内容,我依然强烈建议使用utf8作为默认字符集.如果你想使用gb2312编码,那么建议你使用latin1作为数据表的默认字符集,这样就能直接用中文在命令行工具中插入数据,并且可以直接显示出来.而不要使用gb2312或者gbk等字符集,如果担心查询排序等问题,可以使用binary属性约束对编程有影响的主要是客户端字符集和数据库字符集（还有一个服务器字符集，不知道干什么用的), 数据库中常用的 *** 作就是保存数据和读取数据，在这过程中，乱不乱码和数据库字符集貌似没有什么关系。我们只要保证写入时选择的字符集和读取时选择的字符集一致，即只需保证两次 *** 作的客户端字符集一致即可。 \x0d\x0a在MySQL的客户端上执行一次查询的过程一般是，在客户端的提示符后面输入一条SQL语句，回车，然后终端显示出查询的结果。这个过程中，只有终端和三个MySQL的系统变量指定了正确的字符集，才能保证我们将一个正确的SQL语句送到服务器，然后服务器返回正确的结果，并且在终端正确显示。 \x0d\x0a三个MySQL的系统变量是： \x0d\x0a1. character_set_client，终端字符集，告诉Server客户端提交的SQL语句的编码格式 \x0d\x0a2. character_set_connection，连接字符集，是服务器翻译SQL语句时用到的编码格式 \x0d\x0a3. character_set_results，返回的结果集的字符集，是服务器返回结果集之前把结果集转换成的编码格式 \x0d\x0a在MySQL终端通过执行命令 show variables like ‘char%’ 可以查看这几个变量的值。这三个变量通常都设定为同一种字符集，用命令set names [charset name]就可以修改这三个变量的值。一般来说，只要你设定了能够表示你的数据的字符集，你查询的结果都可以在终端正确显示。 \x0d\x0a举个例子，使用的表t1是utf8编码，表中的字段c1继承了这个编码，表创建如下 \x0d\x0amysql>create table t1 ( c1 text not null ) character set utf8\x0d\x0a用的字符是汉字“范”，gbk编码为B7 B6，utf8编码为E8 8C 83 \x0d\x0a用下面的SQL语句插入数据 \x0d\x0amysql>insert into t1 values( ‘范’)\x0d\x0aa）如果终端设置为utf8，并且执行了 set names utf8，那么插入到数据库中的就是“范”这个字的utf8编码，这个过程中MySQL不需要做编码转换。写入数据库的内容可以通过执行 select hex( c1 ) from t1 得到数据的十六进制编码来验证。 \x0d\x0a\x0d\x0ab）如果终端设置为 utf8，并且执行了set names gbk，那么执行完这个插入 *** 作后，写入的二进制数据是E9 91 BC，这是“汉字“锣”的utf8编码。这是因为，终端输入的“范”用的是utf8编码，而服务器以为终端发送过来的内容是gbk编码，所以在向t1表中插入的时候进行了一次gbk到utf8的转换，结果当然是错误的。 \x0d\x0a\x0d\x0ac）如果终端设置为gbk，并且执行了set names gbk，那么执行完插入 *** 作后，写入t1的依然是“范”这个字的utf8编码。插入过程中，终端输入的是“范”的gbk编码B7 B6，服务器被告知终端发过来的SQL语句是gbk编码（由character_set_client指定），所以在插入数据前做了一次gbk到utf8的编码转换。 \x0d\x0a\x0d\x0ad）如果终端设置为gbk，并且执行了set names utf8，那么执行完插入 *** 作后，MySQL会报出一个数据被截断的警告。实际上，输入终端的是“范”这个字符的gbk编码B7 B6，而服务器被告知客户端发过来的SQL语句是utf8编码，所以在执行过程中没有做转码，直到插入数据的时候，发现B7 B6不符合utf8的编码规则，给出了警告信息，实际插入的数据是3F 3F，也就是两个问号。 \x0d\x0a\x0d\x0a查询的时候是同样的道理，MySQL也是根据set names设定的字符集来对返回给客户端的结果集做相应的编码转换，如果转换的结果和终端显示的字符集一致，就能正确显示，如果不一致就是乱码。 \x0d\x0a\x0d\x0a结论是，只要终端的字符集和set names指定的字符集一致就可以让MySQL在处理过程中执行正确的转码并且正确地显示。 \x0d\x0a\x0d\x0a另外，如果通过程序 *** 作MySQL数据库，那么也需要事先执行set names命令来指定程序希望输出的字符集。比如，用程序从一个utf8编码的数据库向另外一个gbk编码的数据库进行数据迁移，在选取源数据库数据之前，需要执行set names gbk，才能取到gbk编码的数据。

解决方式

在导出mysql sql执行文件的时候，指定一下编码格式：

复制代码代码如下:

mysqldump -uroot -p --default-character-set=utf8 mo（dbname） >E://xxxx.sql

导入的时候OK了

执行如下

复制代码代码如下:

mysql -u root -p --default-character-set=utf8

use dbname

source /root/newsdata.sql

1.用phpmyadmin创建数据库和数据表

创建数据库的时候，请将“整理”设置为：“utf8_general_ci”

或执行语句：

复制代码

代码如下:CREATE

DATABASE

`dbname`

DEFAULT

CHARACTER

SET

utf8

COLLATE

utf8_general_ci

创建数据表的时候：如果是该字段是存放中文的话，则需要将“整理”设置为：“utf8_general_ci”，

如果该字段是存放英文或数字的话，默认就可以了。

相应的SQL语句，例如：

CREATE

TABLE

`test`

(

`id`

INT

NOT

NULL

`name`

VARCHAR(

)

CHARACTER

SET

utf8

COLLATE

utf8_general_ci

NOT

NULL

PRIMARY

KEY

(

`id`

)

ENGINE

MYISAM

2.用PHP读写数据库

在连接数据库之后：

复制代码

代码如下:$connection

mysql_connect($host_name,

$host_user,

$host_pass)

加入两行：

mysql_query("set

character

set

'utf8'")//读库

mysql_query("set

names

'utf8'")//写库

就可以正常的读写MYSQL数据库了。

用的appserv-win32-2.5.10做的环境，装这个包的时候用默认的utf8编码。

在写数据库连接文件时，写成：

$conn

mysql_connect("$host","$user","$password")

mysql_query("SET

NAMES

'UTF8'")

mysql_select_db("$database",$conn)

然后在做页面时，注意这句：

复制代码

代码如下:<meta

http-equiv="Content-Type"

content="text/html

charset=utf-8"

这样不管输入数据库的中文，还是页面显示，就都正常了。

在DW

CS4版里，默认生成的也是utf8页面。

同样的，如果一开始写数据库连接文件时写成：

mysql_query("SET

NAMES

'GBK'")

那页面也要相应变成：

复制代码

代码如下:<meta

http-equiv="Content-Type"

content="text/html

charset=gb2312"

总结，最后主要是页面编码要统一就可以很方便的解决乱码问题，特别是在mysql_query()这个set

names的设置必须和页面及数据库编码统计一就可以了。

希望这两篇关于UTF-8中文编码乱码的文章，能够更好地帮助大家解决这类问题，希望大家喜欢。

欢迎分享，转载请注明来源：内存溢出

原文地址: http://outofmemory.cn/zaji/7279744.html

mysql数据库表里中文乱码应该选哪种编码？

发表评论

评论列表（0条）