mysql数据库表里中文乱码应该选哪种编码？_随笔

数据库中关于字符集的种类有很多,个人建议,数据库字符集尽量使用utf8(utf-8),以使你的数据能很顺利的实现迁移,因为utf8字符集是目前最适合于实现多种不同字符集之间的转换的字符集,尽管你在命令行工具上无法正确查看数据库中的内容,我依然强烈建议使用utf8作为默认字符集.如果你想使用gb2312编码,那么建议你使用latin1作为数据表的默认字符集,这样就能直接用中文在命令行工具中插入数据,并且可以直接显示出来.而不要使用gb2312或者gbk等字符集,如果担心查询排序等问题,可以使用binary属性约束对编程有影响的主要是客户端字符集和数据库字符集（还有一个服务器字符集，不知道干什么用的), 数据库中常用的 *** 作就是保存数据和读取数据，在这过程中，乱不乱码和数据库字符集貌似没有什么关系。我们只要保证写入时选择的字符集和读取时选择的字符集一致，即只需保证两次 *** 作的客户端字符集一致即可。 \x0d\x0a在MySQL的客户端上执行一次查询的过程一般是，在客户端的提示符后面输入一条SQL语句，回车，然后终端显示出查询的结果。这个过程中，只有终端和三个MySQL的系统变量指定了正确的字符集，才能保证我们将一个正确的SQL语句送到服务器，然后服务器返回正确的结果，并且在终端正确显示。 \x0d\x0a三个MySQL的系统变量是： \x0d\x0a1. character_set_client，终端字符集，告诉Server客户端提交的SQL语句的编码格式 \x0d\x0a2. character_set_connection，连接字符集，是服务器翻译SQL语句时用到的编码格式 \x0d\x0a3. character_set_results，返回的结果集的字符集，是服务器返回结果集之前把结果集转换成的编码格式 \x0d\x0a在MySQL终端通过执行命令 show variables like ‘char%’ 可以查看这几个变量的值。这三个变量通常都设定为同一种字符集，用命令set names [charset name]就可以修改这三个变量的值。一般来说，只要你设定了能够表示你的数据的字符集，你查询的结果都可以在终端正确显示。 \x0d\x0a举个例子，使用的表t1是utf8编码，表中的字段c1继承了这个编码，表创建如下 \x0d\x0amysql>create table t1 ( c1 text not null ) character set utf8\x0d\x0a用的字符是汉字“范”，gbk编码为B7 B6，utf8编码为E8 8C 83 \x0d\x0a用下面的SQL语句插入数据 \x0d\x0amysql>insert into t1 values( ‘范’)\x0d\x0aa）如果终端设置为utf8，并且执行了 set names utf8，那么插入到数据库中的就是“范”这个字的utf8编码，这个过程中MySQL不需要做编码转换。写入数据库的内容可以通过执行 select hex( c1 ) from t1 得到数据的十六进制编码来验证。 \x0d\x0a\x0d\x0ab）如果终端设置为 utf8，并且执行了set names gbk，那么执行完这个插入 *** 作后，写入的二进制数据是E9 91 BC，这是“汉字“锣”的utf8编码。这是因为，终端输入的“范”用的是utf8编码，而服务器以为终端发送过来的内容是gbk编码，所以在向t1表中插入的时候进行了一次gbk到utf8的转换，结果当然是错误的。 \x0d\x0a\x0d\x0ac）如果终端设置为gbk，并且执行了set names gbk，那么执行完插入 *** 作后，写入t1的依然是“范”这个字的utf8编码。插入过程中，终端输入的是“范”的gbk编码B7 B6，服务器被告知终端发过来的SQL语句是gbk编码（由character_set_client指定），所以在插入数据前做了一次gbk到utf8的编码转换。 \x0d\x0a\x0d\x0ad）如果终端设置为gbk，并且执行了set names utf8，那么执行完插入 *** 作后，MySQL会报出一个数据被截断的警告。实际上，输入终端的是“范”这个字符的gbk编码B7 B6，而服务器被告知客户端发过来的SQL语句是utf8编码，所以在执行过程中没有做转码，直到插入数据的时候，发现B7 B6不符合utf8的编码规则，给出了警告信息，实际插入的数据是3F 3F，也就是两个问号。 \x0d\x0a\x0d\x0a查询的时候是同样的道理，MySQL也是根据set names设定的字符集来对返回给客户端的结果集做相应的编码转换，如果转换的结果和终端显示的字符集一致，就能正确显示，如果不一致就是乱码。 \x0d\x0a\x0d\x0a结论是，只要终端的字符集和set names指定的字符集一致就可以让MySQL在处理过程中执行正确的转码并且正确地显示。 \x0d\x0a\x0d\x0a另外，如果通过程序 *** 作MySQL数据库，那么也需要事先执行set names命令来指定程序希望输出的字符集。比如，用程序从一个utf8编码的数据库向另外一个gbk编码的数据库进行数据迁移，在选取源数据库数据之前，需要执行set names gbk，才能取到gbk编码的数据。

这里指的中文数据是用中文命名数据表名和字段名吗，我建议你不要这么做，使用拼音或首字母的方式来命名，数据表后边写好注释是最好的选择。使用中文命名数据表名和字段，实际使用中频繁会频繁切换输入法来查询，会很繁琐，其次，中文在编辑器和页面中存在编码的问题，会导致程序报错，再一个，别人拿到你的程序文件，根据数表名可以直接猜到你的数据表的用途，这也是不安全的。

1，创建table的时候就使用utf8编码

举个例子：

在每次创建表的时候都在最后加上 character set = utf8 就可以很好的支持中文。

2，修改已经有的table的编码

当使用默认编码创建了一个table的时候，是不能支持中文的，这时候使用如下语句对table_name进行修改：

此后再往这个table插入中文的时候，就可以正常存储和读取了，但不知道为什么之前的乱码还是不能纠正，只能新插入的数据没有问题。

[注意] 我google了一下，有些地方说这个命令也行，但是我测试以后并不行

alter table table_name charset=utf8 #这个语句并没有让table_name支持中文

欢迎分享，转载请注明来源：内存溢出

原文地址: http://outofmemory.cn/zaji/5901625.html

mysql数据库表里中文乱码应该选哪种编码？

发表评论

评论列表（0条）