utf8编码可以支持一到4
字节的字符编码,在mysql用我们一般使用utf8编码来处理字符类型,通常情况下都没有问题,但遇到4字节编码的字符,在数据存取的时候就会有问题了。\x0d\x0a通常我们可能会得到一个错误或者警告:Incorrect string value: '/xF0/x9D/x8C/x86' for column ...\x0d\x0aMysql 从5.5.3版本开始支持4字节的utf8编码,如果你的Mysql
数据库是5.5.3+,按照以下步骤就能解决这个问题,如果版本低于5.5.3,是不是可以考虑升级数据库版本呢?\x0d\x0a1、在修改数据库编码前先对数据库备份(虽然utf8mb4兼容utf8,但有备无患)\x0d\x0a2、修改数据库的编码、表的编码、列的编码为utf8mb4\x0d\x0a3、在Mysql数据库配置文件(my.ini)中加入如下设置\x0d\x0a\x0d\x0a[client]default-character-set = utf8mb4[mysql]default-character-set = utf8mb4[mysqld]character-set-client-handshake = FALSEcharacter-set-server = utf8mb4collation-server = utf8mb4_unicode_ci\x0d\x0a\x0d\x0a重新启动Mysql数据库,确认设置生效\x0d\x0a\x0d\x0amysql>show VARIABLES like '%char%'+--------------------------+----------------------------------------+| Variable_name| Value |+--------------------------+----------------------------------------+| character_set_client | utf8 || character_set_connection | utf8 || character_set_database | utf8mb4|| character_set_filesystem | binary || character_set_results| utf8 || character_set_server | utf8mb4|| character_set_system | utf8 || character_sets_dir | /home/app/mysql-5.5.33/share/charsets/ |+--------------------------+----------------------------------------+8 rows in set\x0d\x0a\x0d\x0a4、在获取数据库连接的时候执行sql:set names utf8mb4我使用的是alibaba的开源数据库连接池程序,在配置文件中增加一行如下配置\x0d\x0a\x0d\x0a\x0d\x0a\x0d\x0a重新启动应用程序,问题解决
理论上说起来,设置为 utf8 也并非一个完全合适、100% 没毛病的值,即便你将 MySQL 的字符集设置为 utf8 ,也有可能出现乱码!
通过以下命令,你可以查看 MySQL 所支持的所有『字符集』编码:
在显示的 Charset ,你会看见熟悉的 utf8 。
如果你再仔细看一下这一行,你会发现这一行的 Maxlen 列中的值居然是 3 !?
这是 MySQL 中的 utf8 并非我们现在常说的 『真·UTF8』 。它『 最多 』只用 3 个字节存储一个字符,而有些中日韩生僻字<small>(包括 emoji 表情)</small>的 Unicode 编码是需要 4 个字节宽度才能存储的,这就会导致一些乱码的隐患。
MySQL 解决这个问题的方案是绕过 utf8 提出一种新的字符集来实现 『 真·UTF8 』 功能: utf8mb4 。
实际上,为了统一称呼,MySQL 在提出 utf8mb4 字符集之后,就将 utf8 改为 utf8mb3 的别名,因此,你设置字符集为 utf8 本质上就是设置成了 utf8mb3 。
在更高版本(8.x)的 mysql 中,MySQL 直接将 utf8 改为了 utfmb4 的别名。
评论列表(0条)