什么是unicode格式？_物联网

Unicode是一种可能的宽字符集。由 Unicode 协会开发的能表示几乎世界上所有书写语言的字符编码标准。Unicode 字符清单有多种代表形式，包括 UTF-8、UTF-16 和 UTF-32。大多 Windows 界面使用 UTF-16。
Unicode 传输格式 8 (UTF-8)
在 ASCII 码基础上发展的协议字符设置。UTF-8 协议提供 ASCII 码的扩展支持，UCS-2 码的翻译，国际 16 进制 Unicode 编码字符设置。与使用字符数据的 ASCII 或扩展 ASCII 编码相比，UTF-8 可获得更大范围的名称。
Unicode 字符系统 (UCS)
作为 Unicode 标准一部分的国际标准字符集参考。现在广泛使用的 UCS 标准的版本是 UCS-2，该版本指定的 16 位字符数值已作为世界上大多数语言的编码标准而被接受，并得到了承认。
直接选unicode就可以了。
如果没有特殊字符，ansi保存也没事。

unicode是2个字节。

这一标准的2字节形式通常称作UCS-2。然而，受制于2字节数量的限制，UCS-2只能表示最多65536个字符。Unicode的4字节形式被称为UCS-4或UTF-32，能够定义Unicode的全部扩展，最多可定义100万个以上唯一字符。2016-06-21颁发的Unicode9，0共收录128，237个字。

Unicode是一种字符集，Unicode的学名是“UniversalMultiple-OctetCodedCharacterSet”，简称为UCS。UCS可以看作是“UnicodeCharacterSet”的缩写。

扩展资料

unicode的使用

1、使用代码页(Codepage)转换表的技术来过渡性的部分解决这一问题，即通过指定的转换表将非 Unicode 的字符编码转换为同一字符对应的系统内部使用的 Unicode 编码。

2、可以在“语言与区域设置”中选择一个代码页作为非 Unicode 编码所采用的默认编码方式，如936为简体中文GBK，950为繁体中文Big5（皆指PC上使用的）。

参考资料来源：百度百科—Unicode

8位一个字节,1个字节表示一个字符即: 2 8 = 256,所以ASCII码最多只能表示256个字符

俗称万国码,把所有的语言统一到一个编码里解决了ascii码的限制以及乱码的问题
unicode码一般是用两个字节表示一个字符,特别生僻的用四个字节表示一个字符

新的问题出现了,如果统一成unicode编码,乱码问题从此消失了但是如果你写的文本基本上都是英文的,
用Unicode编码比ascii编码需要多一倍的存储空间,在存储和传输上十分不方便
utf-8应用而生,它是一个"可变长的编码方式",如果是英文字符,则采用ascii编码,占用一个字节
如果是常用汉字,就占用三个字节,如果是生僻的字就占用4~6个字节

国内版本,一个中文字符 == 两个字节英文是一个字节

欢迎分享，转载请注明来源：内存溢出

原文地址: http://outofmemory.cn/dianzi/13013421.html

什么是unicode格式？

发表评论

评论列表（0条）