Unicode 传输格式 8 (UTF-8)
在 ASCII 码基础上发展的协议字符设置。UTF-8 协议提供 ASCII 码的扩展支持,UCS-2 码的翻译,国际 16 进制 Unicode 编码字符设置。与使用字符数据的 ASCII 或扩展 ASCII 编码相比,UTF-8 可获得更大范围的名称。
Unicode 字符系统 (UCS)
作为 Unicode 标准一部分的国际标准字符集参考。现在广泛使用的 UCS 标准的版本是 UCS-2,该版本指定的 16 位字符数值已作为世界上大多数语言的编码标准而被接受,并得到了承认。
直接选unicode就可以了。
如果没有特殊字符,ansi保存也没事。
unicode是2个字节。
这一标准的2字节形式通常称作UCS-2。然而,受制于2字节数量的限制,UCS-2只能表示最多65536个字符。Unicode的4字节形式被称为UCS-4或UTF-32,能够定义Unicode的全部扩展,最多可定义100万个以上唯一字符。2016-06-21颁发的Unicode9,0共收录128,237个字。
Unicode是一种字符集,Unicode的学名是“UniversalMultiple-OctetCodedCharacterSet”,简称为UCS。UCS可以看作是“UnicodeCharacterSet”的缩写。
扩展资料
unicode的使用
1、使用代码页(Codepage)转换表的技术来过渡性的部分解决这一问题,即通过指定的转换表将非 Unicode 的字符编码转换为同一字符对应的系统内部使用的 Unicode 编码。
2、可以在“语言与区域设置”中选择一个代码页作为非 Unicode 编码所采用的默认编码方式,如936为简体中文GBK,950为繁体中文Big5(皆指PC上使用的)。
参考资料来源:百度百科—Unicode
8位一个字节,1个字节表示一个字符即: 2 8 = 256,所以ASCII码最多只能表示256个字符
俗称万国码,把所有的语言统一到一个编码里解决了ascii码的限制以及乱码的问题
unicode码一般是用两个字节表示一个字符,特别生僻的用四个字节表示一个字符
新的问题出现了,如果统一成unicode编码,乱码问题从此消失了但是如果你写的文本基本上都是英文的,
用Unicode编码比ascii编码需要多一倍的存储空间,在存储和传输上十分不方便
utf-8应用而生,它是一个"可变长的编码方式",如果是英文字符,则采用ascii编码,占用一个字节
如果是常用汉字,就占用三个字节,如果是生僻的字就占用4~6个字节
国内版本,一个中文字符 == 两个字节 英文是一个字节
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)