满足字符集要求,新建系统应用服务优先哪种字符集_sql

mysql

数据库字符集的选择

PIG_先生

转载

关注

1点赞·1712人阅读

在选择数据库字符集时，可以根据应用的需求，结合字符集的特点来权衡，主要考虑以下几方面的因素。

1）满足应用支持语言的需求。如果应用要处理各种各样的文字，或者将发布到使用不同语言的国家或地区，就应该选择 Unicode 字符集。对 MySQL 来说，目前就是 UTF-8。

2）如果应用中涉及已有数据的导入，就要充分考虑数据库字符集对已有数据的兼容性。假如已有数据的字符集是 GBK，如果选择 GB 2312-80 为数据库字符集，就很可能出现某些文字无法正确导入。

3）如果数据库只需要支持一般中文，数据量很大，性能要求也很高，那就应该选择双字节定长编码的中文字符集，比如 GBK。

因为，相对于 UTF-8 而言，GBK 比较“小”，每个汉字只占 2 个字节，而 UTF-8 汉字编码需要 3 个字节，这样可以减少磁盘 I/O、数据库 Cache 以及网络传输的时间，从而提高性能。相反，如果应用主要处理英文字符，仅有少量汉字数据，那么选择 UTF-8 更好，因为 GBK、UCS-2、UTF-16 的西文字符编码都是 2 个字节，会造成很多不必要的开销。

4）如果数据库需要做大量的字符运算，如比较、排序等，那么选择定长字符集可能更好，因为定长字符集的处理速度要比变长字符集的处理速度快。

5）如果所有客户端程序都支持相同的字符集，则应该优先选择该字符集作为数据库字符集。这样可以避免因字符集转换带来的性能开销和数据损失。

6）在多种字符集都能够满足应用的前提下，应尽量使用小的字符集。因为更小的字符集意味着能够节省空间、减少网络传输字节数，同时由于存储空间的较小间接的提高了系统的性能。

ORACLE用这个就行：

NLS_LANG=AMERICAN_AMERICA.ZHS16GBK

说明：

NLS_LANG一般由三个部分组成，语言、地域和字符集

真正影响数据库字符集的其实是第三部分。

ZHS16GBK表示采用GBK编码格式、16位（两个字节）简体中文字符集

LINUX也可以用这个字符集。

欢迎分享，转载请注明来源：内存溢出

原文地址: http://outofmemory.cn/sjk/9891539.html

满足字符集要求,新建系统应用服务优先哪种字符集

发表评论

评论列表（0条）