扩展名为什么的文件以ASCII码值存储

扩展名为什么的文件以ASCII码值存储,第1张

文本文件是一种典型的顺序文件,其文件的逻辑结构又属于流式文件。

特别的是,文本文件是指以ASCII码方式(也称文本方式)存储的文件,更确切地说,英文、数字等字符存储的是ASCII码,而汉字存储的是机内码。文本文件中除了存储文件有效字符信息(包括能用ASCII码字符表示的回车、换行等信息)外,不能存储其他任何信息,因此文本文件不能存储声音、动画、图像、视频等信息。

设某个文件的内容是下面一行文字:

中华人民共和国 CHINA 1949。

如果以文本方式存储,机器中存储的是下面的代码(以十六进制表示,机器内部仍以二进制方式存储):

D6 D0 BB AA C8 CB C3 F1?B9 B2 BA CD B9 FA 20 43

48 49 4E 41 20 31 39 34?39 A1 A3

其中,D6D0、BBAA、C8CB、C3F1、B9B2、BACD、B9FA分别是“中华人民共和国ABCD” 七个汉字的机内码,20是空格的ASCII码,43、48、49、4E、41分别是五个英文字母“CHINA”的ASCII码,31、39、34、39分别是数字字符“1949”的ASCII编码,A1A3是标点“。”的机内码。

从上面可以看出,文本文件中信息是按单个字符编码存储的,如1949分别存储“1”、“9”、“4”、“9”这四个字符的ASCII编码,如果将1949存储为079D(对应二进制为0000 0111 1001 1101,即十进制1949的等值数),则该文件一定不是文本文件。

Turing

ASCII码共128个,其中0~31和127都是不可显示字符,如换行符、回车符等,剩下的32~126都是可显示字符。可显示字符由数字、字母、运算符组成,其中48~57是阿拉伯数字0-9,65~90是26个大写英文字母A-Z,97~122是26个小写英文字母a-z。

其中,ASCII码最小的是序号0的空字符,最大是序号127的删除字符,这2个字符都是控制字符。

控制符是如LF(换行)、CR(回车)、FF(换页)、DEL(删除)、BS(退格)、BEL(响铃)等这样的字符。通信专用字符是如SOH(文头)、EOT(文尾)、ACK(确认)等。

ASCII值为8、9、10 和13 分别转换为退格、制表、换行和回车字符。它们并没有特定的图形显示,但会依不同的应用程序,而对文本显示有不同的影响。

扩展资料:

ASCII字符顺序定义的起因:

在计算机中,所有的数据在存储和运算时都要使用二进制数表示(因为计算机用高电平和低电平分别表示1和0),例如,像a、b、c、d这样的52个字母(包括大写)以及0、1等数字还有一些常用的符号(例如*、#、@等)。

在计算机中存储时也要使用二进制数来表示,而具体用哪些二进制数字表示哪个符号,当然每个人都可以约定自己的一套(这就叫编码),而大家如果要想互相通信而不造成混乱,那么大家就必须使用相同的编码规则。

于是美国有关的标准化组织就出台了ASCII编码,统一规定了上述常用符号用哪些二进制数以及什么样的顺序来表示。

参考资料来源:百度百科-ASCII

在C语言中文件按存储形式可划分为文本文件和二进制文件,文本文件又称纯文本文件。

文本文件是一种计算机文件,它是一种典型的顺序文件,其文件的逻辑结构又属于流式文件。文本文件是指以ASCII码方式(也称文本方式)存储的文件,更确切地说,英文、数字等字符存储的是ASCII码,而汉字存储的是机内码。文本文件中除了存储文件有效字符信息(包括能用ASCII码字符表示的回车、换行等信息)外,不能存储其他任何信息。

二进制文件是指包含在 ASCII及扩展 ASCII 字符中编写的数据或程序指令的文件,广义的二进制文件即指文件,由文件在外部设备的存放形式为二进制而得名。狭义的二进制文件即除文本文件以外的文件。文本文件是一种由很多行字符构成的计算机文件。文本文件存在于计算机系统中,通常在文本文件最后一行放置文件结束标志。文本文件的编码基于字符定长,译码相对要容易一些;二进制文件编码是变长的,灵活利用率要高,而译码要难一些,不同的二进制文件译码方式是不同的。


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/tougao/12030956.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-20
下一篇 2023-05-20

发表评论

登录后才能评论

评论列表(0条)

保存