汉字(Chinese characters)
汉字,是记录汉语的文字系统,并仍然或曾经在日语和朝鲜语、越南语中使用。汉字是世界上最古老的文字之一,拥有4500年以上的历史。狭义地说,它是汉族的文字;广义地言,它是汉字文化圈共同的文字。
汉字是承载文化的重要工具,目前留有大量用汉字书写的典籍。不同的方言都使用汉字作为共同书写体系,因而汉字在历史上对中华文明的传播起到了重要作用,并成为东南亚文化圈形成的内在纽带。在汉字发展过程中,留下了大量诗词、对联等文化,并形成了独特的汉字书法艺术。
一个汉字一般具有多种含义,也具有很强的组词能力,且很多汉字可独立成词。这导致了汉字极高的“使用效率”,2000左右常用字即可覆盖98%以上的书面表达方式。加之汉字表意文字的特性,汉字的阅读效率很高。汉字具备比字母文字更高的信息密度,因此,平均起来,同样内容的中文表达比其他任何字母语言的文字都短。
目前的汉字体系分为繁体字和简体字,前者用于台湾、香港、澳门和北美的华人圈中,后者用于中国大陆和新加坡以及东南亚的华人社区。通常说来,两种汉字书写系统虽然有差异,常用汉字的个体差异不到25%。
由于汉字书写复杂,“汉字落后论”的说法存在了很长时间,认为汉字是教育及信息化瓶颈,并有“汉字拉丁化”甚至废除汉字的推动行为。现在一般认为汉字也有突出优点,初始学习难度虽大,但掌握常用字后不存在类似海量英文单词的继续学习问题,且其表意特性也能充分调动人脑的学习能力。在计算机输入问题基本解决后,“汉字落后论”及“汉字拉丁化”已实际上逐渐被大多数人抛弃。
目前汉字系统已经基本稳定,但汉字的规范化、生僻字的自然消亡仍在继续进行。
造字原理
六书是汉字组字的基本原理,在周礼中就有提到了六书,只是没有说明具体内容。到了东汉,许慎在《说文解字》中,详细阐述了“六书”这个汉字构造原理:象形、指事、会意、形声、转注、假借。
象形:这种造字法是依照物体的外貌特征来描绘出来,所谓画成其物,随体诘诎是也。如日、月、山、水等四个字,最早就是描绘日、月、山、水之图案,后来逐渐演化变成现在的造型。
指事:这是指表现抽象事情的方法,所谓“各指其事以为之”是也。如卜在其上写作“上”,人在其下写作“下”。
形声:此乃文字内以特定形状(字根)表特有的音。例如:胡,这个字也可为一个字根,结合不同的属性字根,可合成为:蝴、蝴、湖、葫、瑚、醐等等,而以同样的发音(也有的只有声母一样),表达不同的事物。但形声字,也因古今语言音韵变迁,不少古代同类形声字在今天的官话已无共同音素了。
会意:这个造字法,是将两个字根组合起来,使衍生出新的含意。如“日”和“月”组起来,就是日光加月光变成“明”。“人”字和“言”字合成“信”字,意思就是人过去所言;有信,就是这个人都很遵守自己说过的话。
[ url]转注:这是用于两个字互为注释,彼此同义而不同形,汉代许慎解释道:“建类一首,同意相受,考、老是也。”,这怎么说呢?此二字,古时“考”可作“长寿”讲,“老”、“考”相通,意义一致,即所谓老者考也,考者老也。诗经的《大雅•棫朴》亦云:“周王寿考。”。苏轼的《屈原塔诗》也有古人谁不死,何必较考折。一语。其中的““考”皆“老”意,特别注意的是,后代的文字学家针对许慎的前述的定义也作了大量的解释。其中包括“形转说、声转说、义转说”三类,只是这三种说法有人认为不够全面,当代古文字家林沄先生也有解释说“转注”就是一个形体(字根)记录两个读音和意义完全不同的两个词。例如“帚和妇”与甲骨文中的“母和女”等等。
假借:这法简言之,借用一字,去表达别的事物。一般来说,是有一个无法描述的新事物,就借用一个发音接近或是属性近似的字根,来表达这个新事物。例如:“又”,本来是指右手(最早可见于甲骨文),但后来被假借当作“也是”的意思。闻,本意是用耳朵听东西的意思。例如《大学‧第七章》中有“视而不见,听而不闻,食而不知其味”,但后来被假借成嗅觉的动词(不过也有人认为这是错用)。
总结以上六书,前两项,“造字法”也;中两项,“组字法”也;后两项,“用字法”也。这六个原理,是古代文字学学者归纳出来的字学理论。其所含汉字构成法则,是长期演化而成的,不是任何一个人独创的。
汉字的结构
汉字由一个或以上的字根以二维方式(欧语系是一维文字)在特定的空间、配置在一个正方块内而组成,因此有方块字的别称,从结构上来看,汉字有以下特色:
单一字内就有很高的信息密度,在表达同样的事物时,可比表音文字用更短的篇幅表达同样的讯息,所以汉字的阅读效率很高。
一个汉字乃由四百多个表意象形字母为基本字根,如金、木、水、火、土等,像积木一样组合而成。
一个未知文字的含意,可拆字,从组成字根以及空间的配置推断出其字义。当时代演进出现新事物难以词的方式来表达时,也能以字根组合原则,合成出新字来用,例如中文的铀字,就是近代为了表现一种新发现的化学元素而新造的字。
汉字组成的字根空间配置对字义有影响:如同样是“心跟亡”的合体,左右排是“忙”,上下排是“忘”,排列不同,导致不同含义;文字右边有“乂”这个字的部件,这表示右手(手的左偏旁表示左手)持某物对左边字根作某事(金文、甲骨文考古的发现),如果右手上面拿东西就变成“攵”,有这个字根的,几乎都是攻击性或是用暴力达成某件事,例如攻、败、敲、收、散、政、牧、敕等等。
字形(汉字书法)
“国”这个字的笔画汉字有各种不同的书写方式,即有不同的字体;不同的字体,汉字的字形不一样。
规整的字体(如楷书、宋体、隶书、篆书等)书写下的汉字是一种方块字,每个字占据同样的空间。汉字包括独体字和合体字,独体字不能分割,如“文”、“中”等;合体字由基础部件组合构成,占了汉字的90%以上。合体字的常见组合方式有:上下结构,如“笑”、“尖”;左右结构,如“词”、“科”;半包围结构,如“同”、“趋”;全包围结构,如“团”、“回”;复合结构,如“赢”、“斑”等。汉字的基础部件包括独体字、偏旁部首和其他不成字部件。
汉字的最小构成单位是笔画。
书写汉字时,笔画的走向和出现的先后次序,即“笔顺”,是比较固定的。基本规则是,先横后竖,先撇后捺,从上到下,从左到右,先外后内,先外后内再封口,先中间后两边。不同书写体汉字的笔顺可能有所差异。
读音
汉字是多种方言的共同书写体系,每个字代表一个音节。中国大陆现今以普通话作为标准读音,普通话的音节由一个声母、一个韵母及声调确定,实际用到1300多个音节。由于汉字数目庞大,因而有明显的同音字现象;同时还有同一字多音的情形,称为多音字。这一情况在各种汉语中是普遍存在的。
汉字虽然以表意为主,但并非没有表音成分,最常见的是人名、地名,其次就是外来词的音译,比如沙发。此外,还有部分原有的表音词,如(一命)“呜呼”、“哈哈”大笑等。但即使如此,还是有一定表意成分,特别是该国国内的人名、地名。而即使是国外的人名、地名,也存在某些表意的底线,比如“Bush”绝不能音译成“不死”。
由于汉字本身不表音,自汉朝到20世纪汉字在数量上、写法上虽有变迁,但无法看出发音的变化。必须进行专门的研究才能推测它们在上古汉语和中古汉语的发音。有学者经研究认为:汉朝之前,一个汉字发音为两个音节,次要音节和主要音节,类似今日的韩、日语。详见上古汉语。
汉字在日语中的读音有“音读”和“训读”之分,往往一个字有很多读法,原因来自中国不同时期传入日本的发音。
在朝鲜语中则大致为一字一音,没有训读。
除了日本以外,其他汉字使用国也有使用了一些多音节的字,如“里”(海里)、“嗧”(加仑)、“瓩”(千瓦)等。但是在大陆地区由于官方废除已基本不使用,台湾仍在使用,一般人也明了其意思。
注音
最早的注音方法是读若法和直注法。读若法就是用音近的字来注音,许慎的说文解字就采用这种注音方法,如“埻,射臬也,读若准”。直注法就是用另一个汉字来表明这个汉字的读音,如“女为说己者容”中,使用“说者曰悦”来进行注音。
以上两种方法都有先天上不完善的地方,有些字没有同音字或是同音字过于冷僻,这就难以起到注音的作用,例如“袜音韈”等。
魏晋时期发展出了反切法,据传是受使用拼音文字的梵文影响。汉字的发音可以通过反切法进行标注,即用第一个字的声母和第二个字的韵母和声调合拼来注音,使得所有汉字发音都有可能组合出来。如“练,朗甸切”,即“练”的发音是“朗”的声母与“甸”的韵母及声调所拼成。
近代以来,又发展出了汉字形式的注音符号(俗称ㄅㄆㄇㄈ)以及很多拉丁字母注音方法。注音符号仍是台湾教学的一部分,而目前中国大陆最为广泛使用的是汉语拼音。
由于汉字以本身表义为主,注音方面较为薄弱。这个特性使得上下千年的文献,不至于产生如同使用拼音文字的西方世界一样,用字措辞太悬殊的差距,但也造成推断古代声韵的难度。例如“庞”从“龙”而得声,但今日北京话前者读“páng”,后者为“lóng”。如何解释这样的差异,就是音韵学所探讨的课题。
汉字与词语
汉字是汉文组成的最小单位。
语素是汉文表意的最小单位,类比于英语的“词汇”和“词组”的总称。绝大多数汉字可以独立构成语素,比如“我”,类比于英语中的单一字母构成的词汇,比如“I”。现经白话文大多数词语都是由两个以上的汉字构成的,不过,和英语中“词汇”和“字母”的关系不同,语素的意思往往和其中各个汉字独立构成语素时的意思有相关性,因此相当程度上简化了记忆。
词语包括语素和若干个语素形成的短语。
汉字的高效率,体现在几百个基本象形字,可以合成表示天上地下的各种事物的上万汉字;几千个常用字,又可以轻松组合出数十万词语。
不过,从另一方面来说,准确掌握这数十万词语的搭配形式和用法也成了一种负担。汉语常用词汇约为几万条,总词汇量约有百万条,虽然从数量上来说显得有些令人望而却步,但由于大多数汉字构词法的表意性,要基本掌握并非遥不可及。因此,仅就词汇而言,其学习难度并不高;相比之下,掌握同样数量外文词汇的记忆强度则要大得多。
而从古文的角度来看,用字本义,比起五四白话文运动以降过度依赖词语,会来的精确且有效率,例如朱邦复先生就提畅精确使用汉字的复古作为。
汉字的数量:汉字的数量并没有准确数字,日常所使用的汉字约为几千字。据统计,1000个常用字能覆盖约92%的书面资料,2000字可覆盖98%以上,3000字时已到99%,简体与繁体的统计结果相差不大。
历史上出现过的汉字总数有8万多(也有6万多的说法),其中多数为异体字和罕用字。绝大多数异体字和罕用字已自然消亡或被规范掉,除古文之外一般只在人名、地名中偶尔出现。此外,继第一批简化字后,还有一批“二简字”,已被废除,但仍有少数字在社会上流行。
汉字数量的首次统计是汉朝许慎在《说文解字》中进行的,共收录9353字。其后,南朝时顾野王所撰的《玉篇》据记载共收16917字,在此基础上修订的《大广益会玉篇》则据说有22726字。此后收字较多的是宋朝官修的《类篇》,收字31319个;另一部宋朝官修的《集韵》中收字53525个,曾经是收字最多的一部书。
另外有些字典收字也较多,如清朝的《康熙字典》收字47035个;日本的《大汉和字典》收字48902个,另有附录1062个;台湾的《中文大字典》收字49905个;《汉语大字典》收字54678个。20世纪已出版的字数最多的是《中华字海》,收字85000个。
在汉字计算机编码标准中,目前最大的汉字编码是台湾的国家标准CNS11643,目前(40)共收录可考证之繁简、日、韩语汉字共76,067个,但并不普及,只有在户政系统等少数环境使用。台港民间通用的大五码收录繁体汉字13053个。GB18030是中华人民共和国现时最新的内码字集,GBK收录简体、繁体及日语、韩语汉字20912个,而早期的GB2312收录简体汉字6763个。而Unicode的中日韩统一表意文字基本字集则收录汉字20902个,另有两个扩展区,总数亦高达七万多字。
初期的汉字系统字数不足,很多事物以通假字表示,使文字的表述存在较大歧义。为完善表述的明确性,汉字经历了逐步复杂、字数大量增加的阶段。汉字数量的过度增加又引发了汉字学习的困难,单一汉字能表示的意义有限,于是有许多单一的汉语意义是用汉语词语表示,例如常见的双字词。目前汉语书写的发展多朝向造新词而非造新字
数据代码检索标识有三种类型。按照规范化程度不同,检索标识可以分为三种类型。
1、规范词是从检索工具或系统的叙词表、主题词表或分类表等词表中选取的规范化的字词、词组或号码,因为词表是数据库标引和检索必须共同遵循使用的检索语言。为了使检索提问标识与信息特征标识相一致,获得最佳的检索效果,应优先选用规范词。
2、规范化的代码索引代码是检索工具或系统为某些主题范畴或主题概念规定的索引单元,这类单元有很好的专指性,是一种有较好检索效果的信息特征标识。如国际专利分类号IC=、PTS数据库的产品代码PC=、标准工业代码SC=等等。
3、自由词是来源于文献信息且具有实质意义的字词、短语或号码。使用自由词检索能够充分利用系统的全文查找功能。
① 首先把MySQL的服务停掉 在运行窗口输入:net stop mysql
② 把服务器和客户端的字符集改成自己想用的字符集:GB2312或是utf8等……
具体 *** 作为:打开mysql安装目录下的myinitet;
找到default-character-set,将其改为自己想用的字符集:GB2312或是utf8等……,要注意的是这里有两个default-character-set,用ctrl+f定位在文件最前面输入default就会找到,都要改过来;
③ 重启MySQL服务器,在运行窗口输入:net start mysql
④ 最重要的是一点是,到这里我们已经能够解决乱码问题了,可问题是我们依然还会出现乱码问题,这是因为我们现在的表被创建的时候用的是默认的字符集(latin1),所以这时候我们要把表删除,然后重建就可以了
中文参考文献格式及示例
文献(拼音wén xiàn),汉语词语,意思为有历史意义或研究价值的图书、期刊、典章。出自《论语·八佾》。下面为大家带来了中文参考文献格式及示例,欢迎大家阅读参考!
一、参考文献的类型及其标识
1、根据GB 3469规定,以单字母方式标识以下各种参考文献类型:
参考文献类型:
专著、论文集、报纸文章、期刊文章、学位论文、报告、标准、专利。
文献类型标识:
M、C、N、J、D、R、S、P。
2、对于专著、论文集中的析出文献,其文献类型标识建议采用单字母“A”;对于其他未说明的文献类型,建议采用单字母“Z”。
3、对于数据库、计算机程序及电子公告等电子文献类型的参考文献,建议以下列双字母作为标识:
电子参考文献类型:
数据库、计算机程序、电子公告
电子文献类型标识:
DB、CP、EB
电子文献载体类型及其标识:磁带(magnetic tape)——MT,磁盘(disk)——DK,光盘(CD-ROM)——CD,联机网络(online)——OL[文献类型标识/载体类型标识]
如:[DB/OL]——联机网上数据库(database online)[DB/MT]——磁带数据库(database on magnetic tape)[M/CD]——光盘图书(monograph on CD-ROM)[CP/DK]——磁盘软件(computer program on disk)[J/OL]——网上期刊(serial online)
[EB/OL]——网上电子公告(electronic bulletin board online)
二、各类参考文献条目的编排格式及示例
a专著、论文集、学位论文、报告
[序号]主要责任者文献题名[文献类型标识]出版地:出版者,出版年起止页码例如:
b期刊文章
[序号]主要责任者文献题名[J]刊名,年,卷(期):起止页码例如:
c论文集中的析出文献
[1]刘国钧,陈绍业,王凤翥图书馆目录[M]北京:高等教育出版社,195715-18
[2]辛希孟信息技术与信息服务国际研讨会论文集:A集[C]北京:中国社会科学出版社,199432-34
[3]张筑生微分半动力系统的不变集[D]北京:北京大学数学系数学研究所,198317-19[4]冯西桥核反应堆压力管道与压力容器的LBB分析[R]北京:清华大学核能技术设计研究院,199721-23
[5]何龄修读顾城《南明史》[J]中国史研究,1998,(3):167-173
[6]金显贺,王昌长,王忠东,等一种用于在线检测局部放电的数字滤波技术[J]清华大学学报(自然科学版),1993,33(4):62-67
[序号]析出文献主要责任者析出文献题名[A]原文献主要责任者(任选)原文献题名[C]出版地:出版者,出版年析出文献起止页码例如:
d报纸文章
[序号]主要责任者文献题名[N]报纸名,出版日期(版次)例如:
e国际、国家标准
[序号]标准编号,标准名称[S]例如:
f专利
[序号]专利所有者专利题名[P]专利国别:专利号,出版日期例如:
g电子文献
[序号]主要责任者电子文献题名[电子文献及载体类型标识]电子文献的出处或可获得地址,发表或更新日期/引用日期(任选)例如:
h各种未定义类型的文献
[序号]主要责任者文献题名[Z]出版地:出版者,出版年
;一、测试内容
1、读单音节字词100个,共10分。
2、读双音节词语50个,共20分。
3、朗读短文400字,共30分。
4、说话,共40分。
二、评分标准
(一)、读单音节字词
单字(声、韵、调)错误,每个字扣01分;字音(声、韵、调)有缺陷的,每个字扣005分;声调属于系统性缺陷的,每类一次性扣05分。该题限时3分钟,超时1分钟以内扣05分,超时1分钟以上扣08分。
1、声母的错误和缺陷
声母错误指:
(1)、明确地把声母甲读作声母乙。
如z→zh,n→l,h→f等,计错误。
(2)、把j,q,x读作g,k,h(街,项)或x→q(翔)等,计错误。
(3)、把不送气音(b,d,g)读作送气音(p,t,k)等,计错误。
(4)、尖音重,把j,q,x读作z,c,s(小,先)计错误。
(5)、其它:r→l(染,让,热),[z](肉),[ɑ](染,让),零声母u 读作[m](蚊)等计错误。
声母缺陷指:
(1)、声母发音含混,或不完全到位。
(2)、发音介于对应音之间(z-zh)等。
2、韵母的错误和缺陷
韵母错误指:
(1)、明确地把韵母甲读作韵母乙,计错误。如(荆州,恩施)e→uo, o(河,课,科),或"iɑn"读作"in"(电,简)。
(2)、改呼的韵母错误。如"船,转"读作quɑn juɑn;把"雨"读作"yi",把"军"读作"jin";把撮口呼韵母读作[Ч],[Ч](黄冈,孝感,荆州)类韵母;把"袄"读作"ngɑo"等,把"木,目"读作"meng"等。
(3)、"uei,uen,uɑn"明显地丢失u韵头。如"最,吨,团"读作"zei, den,tɑn"。
(4)、卷舌的er,没有卷舌动作,读作"e"或[Щ]等。
(5)、韵尾"n"读作"ng",或"ng"读作"n"等。
韵母缺陷指:
韵母发音不到位,如"n,ng"尾区分不明显,"iɑn"口腔开度不够等。
3、声调的错误和缺陷
声调错误指:
(1)、把声调甲明确地读作声调乙,计错误。如阴平读作阳平,阳平读作上声等。
(2)、阳平调有曲折计错误。
(3)、入声字没有改读,或已改读,但调值不对。读单字一项中,有限定的异读词,读音不对,也计错误。
声调缺陷指:
上声调略有曲折,但不到位或上声调只降不升(21-211);去声调、阳平调不到位等,计缺陷。
(二)、读双音节词语
读错一个字,扣02分;字音有缺陷,扣01分,声调属于系统性缺陷的,每类一次性扣1分。限时3分钟,超时1分钟以内扣1分,超时1分钟以上扣16分。
1、双音节词语的错误指:
(1)、双音节词语中单字(声、韵、调)读音错误评判标准与(一)、1-3相同。
(2)、轻声词以《现代汉语词典》(修订本)为准,该读轻声的(如"月亮")没读作轻声,或不该读轻声的(如"腐败")读作轻声,计错误。
(3)、儿化词语没有读作儿化或儿化韵母读成两个音节("儿"独成音节),计错误。
(4)、"一,不"或该变调的上声字不变调,或变调明显不对,计错误。
(5)、有限定音的异读词读音不对,计错误。
2、双音节词语的缺陷指:
(1)、双音节词语中单字(声、韵、调)读音缺陷评判标准与(一)、1-3相同。
(2)、该读轻声的字,轻度不够,不该读轻声的有轻化倾向,计缺陷。
(3)、儿化韵不够准确,"一,不","上声变调"不完全到位,或不够自然,计缺陷。
(三)、朗读
1、读错、漏、加一个字或重复一个字或一个词均扣01分,评判标准同(一)、1-3重复一句话,每次扣02分。语气词"啊"不变化,或变错,每个扣01分。没有标出"儿"的"儿化词",读"儿化"规范自然,不扣分。
2、"方言色彩",一次性扣分,每一类别扣05分,最多扣3分。"方言色彩"各类别按以下几种情况判断:
(1) 该读轻声的字,轻度不够,不该读轻声的字,有轻化倾向,属系统性的。
(2) 语流中某类声调有系统性缺陷。
(3) 某类声母或韵母有系统性缺陷。
(4) 出现三个以上有代表性的方言词语读音,或语气词明显有方言痕迹(呢→le)。
(5) 词语的音长不规范,或受方言影响,一些词语的节奏规律性地忽快忽慢。
3、停顿,断连不当,造成对词的肢解和一句话的误解,或不自然,每次扣05分,最多扣2分。
4、语速过快或过慢,一次性扣1-2分。
5、时限4分钟,超时30秒以上扣1分
(四)、说话
1、语音面貌分六档(25分)
(1) 一档--不扣分,语音标准,无任何方言色彩。
(2) 二档--扣1-3分,偶有方言显露(指声、韵、调错误),但不成系统,也不明显,只有一类系统性缺陷,语音错误在10次以内。
(3) 三档--扣4-6分,普通话腔调较好,有一类系统性错误,但能部分区别,或有三类以内系统性缺陷,语音错误在10-15次之间。
(4)四档--扣7-9分,方音腔调比较明显,且有2-3类系统性错误,基本上不能区分,语音错误在16-20次之间。
以上就是关于我急需有关汉字的内容全部的内容,包括:我急需有关汉字的内容、数据代码检索标识有、将汉语插入到mysql数据库中显示乱码是怎么办等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)