中文的ASCII码值的范围是多少?

中文的ASCII码值的范围是多少?,第1张

取值范围是0~127

字符编码方面,ASCII码为标准符号、数字、英文等进行了保留,取值范围是0~127,还有一部分作为扩展ASCII码128~255

当 *** 作系统采用非ASCII编码时(比如汉字编码),一般用扩展ASCII码来进行,约定用128~255范围的编码连续2~3甚至4个来进行汉字编码,(比如国标用连续两个128~255的编码表示1个汉字,分别是区码和位码的编码;UTF-8可以用3个连续的数来表示一个汉字),具体编码规则要看具体定义,一般不相同的。

因此,在处理字符串时,如果是有符号字符串,遇到小于0的字符,会结合后面紧跟的字符来组成一个汉字,大于0的为标准西文字符;如果是无符号的,则可以判断是否大于127。

ascii码是目前计算机中用得最广泛的字符集及其编码,是由美国国家标准局(ANSI)制定的ASCII码(American Standard Code for Information Interchange,美国标准信息交换码),它已被国际标准化组织(ISO)定为国际标准,称为ISO 646标准。适用于所有拉丁文字字母,ASCII码有7位码和8位码两种形式。

1、ASCII是用8位二进制表示的,但最高位是0,一个字符一字节。中文是用所谓机内码(参阅一下区位码、国标码、机内码的内容)表示的,一个汉字二字节,关键是最高位都是1。日文、韩文则是为其分配了不同的编码段。
2、计算机用两个字节来表示一个汉字,“我”在内存里就是这样存放的:CE
D2。CE是str[0]的内容,D2是str[1]的内容。第一次循环输出str[0],但是这个字符在ASCII字符集里代表这样一个东西Î,但是Windows的命令提示符程序读取到这里就会自动使用宽字符集,也就是说,它已经准备好读取下一个字符,然后把他们当成一个字符显示出来。于是就出现了那个汉字。

ASCII编码一个中文字符占二个字节,具体分析如下:

ASCII 是基于拉丁字母的一套电脑编码系统,主要用于显示现代英语和其他西欧语言。它是最通用的信息交换标准;

一个字节只能表示256种符号,肯定是不够的,就必须使用多个字节表达一个符号。比如,简体中文常见的编码方式是 GB2312,使用两个字节表示一个汉字;

所以,ASCII编码一个中文字符占两个字节;

扩展资料:

ASCII码使用指定的7位或8位二进制数组合来表示128或256种可能的字符。标准ASCII码也叫基础ASCII码,使用7位二进制数(剩下的1位二进制为0)来表示所有的大写和小写字母,数字0到9、标点符号,以及在美式英语中使用的特殊控制字符;

常见ASCII码的大小规则:0~9<A~Z<a~z。

参考资料来源:百度百科-ASCII

ASCII码就是美国标准信息交换码。这个编码用8位2进制数表示2的7次方,也就是128个西文字符,包括字母、数字、制表符、标点符号和其他特殊图形符号。

其中:

0~31及127(共33个)是控制字符或通信专用字符(其余为可显示字符),如控制符:LF(换行)、CR(回车)、FF(换页)、DEL(删除)、BS(退格)、BEL(响铃)等;通信专用字符:SOH(文头)、EOT(文尾)、ACK(确认)等;ASCII值为8、9、10 和13 分别转换为退格、制表、换行和回车字符。它们并没有特定的图形显示,但会依不同的应用程序,而对文本显示有不同的影响。

32~126(共95个)是字符(32是空格),其中48~57为0到9十个阿拉伯数字。

65~90为26个大写英文字母,97~122号为26个小写英文字母,其余为一些标点符号、运算符号等。

同时还要注意,在标准ASCII中,其最高位(b7)用作奇偶校验位。所谓奇偶校验,是指在代码传送过程中用来检验是否出现错误的一种方法,一般分奇校验和偶校验两种。奇校验规定:正确的代码一个字节中1的个数必须是奇数,若非奇数,则在最高位b7添1;偶校验规定:正确的代码一个字节中1的个数必须是偶数,若非偶数,则在最高位b7添1。

后128个称为扩展ASCII码。许多基于x86的系统都支持使用扩展(或"高")ASCII。扩展ASCII 码允许将每个字符的第8 位用于确定附加的128 个特殊符号字符、外来语字母和图形符号。

大小规则:

1)数字0~9比字母要小。如"7"<"F";

2)数字0比数字9要小,并按0到9顺序递增。如"3"<"8"

3)字母A比字母Z要小,并按A到Z顺序递增。如"A"<"Z"

4)同个字母的大写字母比小写字母要小。如"A"<"a"。

记住几个常见字母的ASCII码大小:

"换行LF"为0x0A;"回车CR"为0x0D;空格为0x20;"0"为0x30; "A"为0x41;"a"为0x61。

另外还有128-255的ASCII字符。

查询ASCII技巧,方便查询ASCII码对应的字符:新建一个文本文档,按住ALT+要查询的码值(注意,这里是十进制),松开即可显示出对应字符。例如:按住ALT+97,则会显示出'a'。

它由左到右分十进制,八进制和十六进制,分别对应计算机语言的字符。

详细解释:

ASCII码表第36行   36   44   24H   $

其中36是十进制,44是八进制( 也就是十进制的36),24H是十六进制(也就是十进制的36),$是它对应的计算机中的符号。

简介:

ASCII(American Standard Code for Information Interchange,美国标准信息交换代码)是基于拉丁字母的一套电脑编码系统,主要用于显示现代英语和其他西欧语言。它是现今最通用的单字节编码系统,并等同于国际标准ISO/IEC 646。

请注意,ASCII是American Standard Code for Information Interchange缩写,而不是ASC2,有很多人在这个地方产生误解。

ANSII是标准国际编码,只有256个字符,没有汉字,所以表示不了汉字
你说的应该是ansi编码吧,那是系统根据当前地区然后确定的当地编码,例如大陆的ansi编码就代表 国标码GBK编码。
如果是台湾的话,ansi就应该是big5……
这里面涉及编码范围问题,Unicode,big5,gbk国标码都是两个字节表示一个汉字,而utf8是三个字节表示一个汉字。
而且这几种编码中有大量重叠,很难直接判断一个字是哪一种编码,
例如下面:汉字编码范围
名称 第一字节 第二字节
GB2312 0xB0-0xF7(176-247) 0xA0-0xFE(160-254)
GBK 0x81-0xFE(129-254) 0x40-0xFE(64-254)
Big5 0x81-0xFE(129-255) 0x40-0x7E(64-126)
0xA1-0xFE(161-254)
我这里有一些相关解释,可以看看>

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/yw/12824764.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-28
下一篇 2023-05-28

发表评论

登录后才能评论

评论列表(0条)

保存