数据库中关于字符集的种类有很多,个人建议,数据库字符集尽量使用utf8(utf-8),以使你的数据能很顺利的实现迁移,因为utf8字符集是目前最适合于实现多种不同字符集之间的转换的字符集,尽管你在命令行工具上无法正确查看数据库中的内容,我依然强烈建议使用utf8作为默认字符集如果你想使用gb2312编码,那么建议你使用latin1作为数据表的默认字符集,这样就能直接用中文在命令行工具中插入数据,并且可以直接显示出来而不要使用gb2312或者gbk等字符集,如果担心查询排序等问题,可以使用binary属性约束 对编程有影响的主要是客户端字符集和数据库字符集(还有一个服务器字符集,不知道干什么用的), 数据库中常用的 *** 作就是保存数据和读取数据,在这过程中,乱不乱码和数据库字符集貌似没有什么关系。我们只要保证写入时选择的字符集和读取时选择的字符集一致,即只需保证两次 *** 作的客户端字符集一致即可。
在MySQL的客户端上执行一次查询的过程一般是,在客户端的提示符后面输入一条SQL语句,回车,然后终端显示出查询的结果。这个过程中,只有终端和三个MySQL的系统变量指定了正确的字符集,才能保证我们将一个正确的SQL语句送到服务器,然后服务器返回正确的结果,并且在终端正确显示。
三个MySQL的系统变量是:
1 character_set_client,终端字符集,告诉Server客户端提交的SQL语句的编码格式
2 character_set_connection,连接字符集,是服务器翻译SQL语句时用到的编码格式
3 character_set_results,返回的结果集的字符集,是服务器返回结果集之前把结果集转换成的编码格式
在MySQL终端通过执行命令 show variables like ‘char%’ 可以查看这几个变量的值。这三个变量通常都设定为同一种字符集,用命令set names [charset name]就可以修改这三个变量的值。一般来说,只要你设定了能够表示你的数据的字符集,你查询的结果都可以在终端正确显示。
举个例子,使用的表t1是utf8编码,表中的字段c1继承了这个编码,表创建如下
mysql> create table t1 ( c1 text not null ) character set utf8;
用的字符是汉字“范”,gbk编码为B7 B6,utf8编码为E8 8C 83
用下面的SQL语句插入数据
mysql> insert into t1 values( ‘范’);
a)如果终端设置为utf8,并且执行了 set names utf8,那么插入到数据库中的就是“范”这个字的utf8编码,这个过程中MySQL不需要做编码转换。写入数据库的内容可以通过执行 select hex( c1 ) from t1 得到数据的十六进制编码来验证。
b)如果终端设置为 utf8,并且执行了set names gbk,那么执行完这个插入 *** 作后,写入的二进制数据是E9 91 BC,这是“汉字“锣”的utf8编码。这是因为,终端输入的“范”用的是utf8编码,而服务器以为终端发送过来的内容是gbk编码,所以在向t1表中插入的时候进行了一次gbk到utf8的转换,结果当然是错误的。
c)如果终端设置为gbk,并且执行了set names gbk,那么执行完插入 *** 作后,写入t1的依然是“范”这个字的utf8编码。插入过程中,终端输入的是“范”的gbk编码B7 B6,服务器被告知终端发过来的SQL语句是gbk编码(由character_set_client指定),所以在插入数据前做了一次gbk到utf8的编码转换。
d)如果终端设置为gbk,并且执行了set names utf8,那么执行完插入 *** 作后,MySQL会报出一个数据被截断的警告。实际上,输入终端的是“范”这个字符的gbk编码B7 B6,而服务器被告知客户端发过来的SQL语句是utf8编码,所以在执行过程中没有做转码,直到插入数据的时候,发现B7 B6不符合utf8的编码规则,给出了警告信息,实际插入的数据是3F 3F,也就是两个问号。
查询的时候是同样的道理,MySQL也是根据set names设定的字符集来对返回给客户端的结果集做相应的编码转换,如果转换的结果和终端显示的字符集一致,就能正确显示,如果不一致就是乱码。
结论是,只要终端的字符集和set names指定的字符集一致就可以让MySQL在处理过程中执行正确的转码并且正确地显示。
另外,如果通过程序 *** 作MySQL数据库, 那么也需要事先执行set names命令来指定程序希望输出的字符集。比如,用程序从一个utf8编码的数据库向另外一个gbk编码的数据库进行数据迁移,在选取源数据库数据之前,需要执行set names gbk,才能取到gbk编码的数据。
数据库编码字符集设置的不对。
数据库码就是数据库编程语言中的代码。流行的关系数据库系统都支持数据库字符集编码,也就是说在创建数据库时可以指定它自己的字符集设置,数据库的数据以指定的编码形式存储。
当应用程序访问数据时,在入口和出口处都会有字符集编码的转换。对于中文数据,数据库字符编码的设置应当保证数据的完整性。
GB2312、GBK、UTF-8等都是可选的数据库字符集编码;当然我们也可以选择。ISO8859-1(8-bit),只是我们得在用程序写数据之前先将16Bit的一个汉字或Unicode拆分成两个8-bit的字符,读数据之后也需要将两个字节合并起来,同时还要判别其中的SBCS字符。
字符编码也称字集码,是把字符集中的字符编码为指定集合中某一对象(例如:比特模式、自然数序列、8位组或者电脉冲),以便文本在计算机中存储和通过通信网络的传递。
常见的例子包括将拉丁字母表编码成摩斯电码和ASCII。其中,ASCII将字母、数字和其它符号编号,并用7比特的二进制来表示这个整数。通常会额外使用一个扩充的比特,以便于以1个字节的方式存储。
在计算机技术发展的早期,如ASCII(1963年)和EBCDIC(1964年)这样的字符集逐渐成为标准。但这些字符集的局限很快就变得明显,于是人们开发了许多方法来扩展它们。
对于支持包括东亚CJK字符家族在内的写作系统的要求能支持更大量
① 首先把MySQL的服务停掉 在运行窗口输入:net stop mysql
② 把服务器和客户端的字符集改成自己想用的字符集:GB2312或是utf8等……
具体 *** 作为:打开mysql安装目录下的myinitet;
找到default-character-set,将其改为自己想用的字符集:GB2312或是utf8等……,要注意的是这里有两个default-character-set,用ctrl+f定位在文件最前面输入default就会找到,都要改过来;
③ 重启MySQL服务器,在运行窗口输入:net start mysql
④ 最重要的是一点是,到这里我们已经能够解决乱码问题了,可问题是我们依然还会出现乱码问题,这是因为我们现在的表被创建的时候用的是默认的字符集(latin1),所以这时候我们要把表删除,然后重建就可以了
在Oracle数据库中出现中文乱码的情况,可能是因为以下几个方面:
字符集不匹配:Oracle数据库默认使用的字符集为AL32UTF8,如果在创建数据库或者表时没有指定字符集或者指定了其他的字符集,则可能会出现乱码问题。在创建表时,可以使用以下语句指定字符集:
CREATE TABLE table_name (column_name1 data_type1,
column_name2 data_type2,
) CHARACTER SET utf8;
数据库连接时没有指定字符集:在连接数据库时,如果没有指定字符集,可能会出现乱码问题。在连接数据库时,可以使用以下语句指定字符集:
DriverManagergetConnection(url, user, password)createStatement();statementexecute("SET NAMES 'utf8'");
字段类型不匹配:在创建表时,如果字段类型不匹配,也可能会导致乱码问题。例如,在使用VARCHAR2类型存储中文字符时,需要指定字符长度,如果长度不够,则可能会出现乱码问题。
如果出现了中文乱码问题,可以使用以下方法解决:
修改字符集:在创建表时,指定正确的字符集;或者在连接数据库时,指定正确的字符集。
修改字段类型:如果存储中文字符的字段类型不正确,可以修改字段类型为NVARCHAR2或者NCHAR类型,这两种类型都支持Unicode字符集,可以正确存储中文字符。
修改数据:如果出现了中文乱码问题,可以通过修改数据的方式解决。可以使用UPDATE语句更新乱码数据,或者使用INSERT语句重新插入正确的数据。
解决中文乱码问题的方法有很多种,需要根据具体情况来选择合适的方法。
以上就是关于mysql数据库表里,中文乱码,应该选哪种编码全部的内容,包括:mysql数据库表里,中文乱码,应该选哪种编码、oracle数据库里中文显示不出来是怎么回事、中文插入数据库为什么显示乱码等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)