中国汉字

中国汉字,第1张

中国汉字 中国的汉字究竟有多少个?

中国的汉字到底有多少个,目前估计还没人敢说一个具体的数字。

造成这种情况的主要有两种原因:一、伴随着考古的发现,古代出现的而又没有流传下来或者逐渐弃用的汉字慢慢被发现,增加了汉字的总数。

二、随着社会的发展,大家知道一些新的词汇会被创造出来,其实汉字也会被新造出来。

这其实就跟人一样,要生死也要传宗接代。

现在新造汉字最广的领域大概就属化学学科领域了。

随着微世界元素的发现,需要创造新的汉字来表示,而常用的办法就是创造形声会意字,这也就是为啥整个元素周期表遇到不认识的汉字,基本都可以读半边字。

比如铒、钕、铕等等。

所以汉字是一个动态的,会消失也会新生。

把消失的字找出来,把新生的字记录下来是很多文字工作者穷尽一生的事业。

如此,汉字的数量应该还在不断的增加中,但是有一个可以供参考的数字就是北京国安咨询设备公司汉字字库收入的有出处汉字91251个。

不过应该清楚的是,汉字的具体数量肯定比这个要多。

说到记录汉字的数量,就得说到我们的字典了。

中国的字典五花八门,包罗万象,现在简单罗列几种研究中国文字比较重要的几个字典,看看其中收录汉字的数量。

1. 《说文解字》是东汉许慎著的中国第一本字典,收录汉字9353个。

2. 《字林》晋代吕忱著,仿照《说文解字》写的,收录汉字12824个,不过这本字典已经失传了。

3. 《玉篇》是我国第一部按部首分门别类的汉字字典,南朝梁顾野王撰,收录汉字16917个,同样失传。

现存本经过整理,收录汉字22561个。

4. 《类篇》是一部按部首编排的字书。

说是宋司马光写的,其实只是由司马光整理成书而已,收录汉字31319个。

5. 《字汇》明至清初最为流行的字典,后来被《康熙字典》替代,是明代梅膺祚编,收录汉字33179个。

6. 《正字通》,和《字汇》类似,但是注解会比较繁博,而且保存了大量俗字异体,是明代张自烈撰,收录汉字33549个。

7. 《康熙字典》,由总纂官张玉书、陈廷敬主持,修纂官凌绍霄、史夔、周起渭、陈世儒等合力完成的字典,以《字汇》和《正字通》为基础,收录汉字47035个。

8. 《中华大字典》20 世纪 80年代以前中国字典中收字最多的一种。

1915 年中华书局出版,陆费逵、欧阳溥存等编,收录汉字4.8万多。

9. 《汉语大字典》1986年3月9日,由川、鄂两省三百多位专家、学者历经十年编纂完成,首版八卷本于1990年出齐,收录汉字约5.6万个。

新版《汉语大字典》现收楷书单字60370个。

10. 《中华字海》是收录汉字最多的大型字书。

由冷玉龙、韦一心主编,中华书局、中国友谊出版社1994年出版,收录汉字85568个。

先来看一看历代字书收字数:1. 秦《仓颉篇》(李斯)3300字2. 汉《训纂篇》(扬雄,公元1-5年)5340字3. 汉《续训纂篇》(班固,60-70年)6120字4. 汉《说文解字》(许慎,100年)9353字,另有1163“古文”(异体字)5. 魏《声类》(李登,227-239年)11520字6. 晋《字林》(吕忱)12824字7. 后魏《字统》(杨承庆)13734字8. 后魏《广雅》(张揖,480年)18150字9. 梁《玉篇》(顾野王,543年)22726字10. 唐《唐韵》(孙愐,751年)26194字11. 唐《韵海鉴源》(颜真卿,753年)26911字12. 宋《集韵》(丁度,1037-1067年)约30000字13. 宋《类篇》(司马光、王洙等,1066年)31319字14. 明《字彚》(梅膺祚,1615年)33179字15. 明《正字通》(張自烈,1675年)33440字16. 清《(康熙)字典》(张玉书、凌紹雯等,1716年)42174字;(后来台湾地区高树藩有重编,1979年在台湾地区发行,上海书店影印过;近年王宏源有增订,社会科学文献出版社,2015年)17. 民国《中华大字典》(徐元诰, 欧阳溥存编,中华书局,1915年)44908字(按,商务印书馆国际有限公司2014年出版有同名字典,魏励主编,收字57000多个,而且根据《通用规范汉字表》,不再对8105个汉字外进行类推简化,纠正了《中华字海》肆意类推简化的弊病。

)18. 台湾地区《中文大辞典》(张其昀等,1969年)49888字。

按,本典近年正在修订,可能会在大陆发行修订版。

19. 台湾地区《中文资讯交换码第三册》(国字整理小组,1986年)53940字20. 大陆《汉语大字典》(徐中舒等,1990年第一版)54678字,近年第二版收字超过60000字。

21. 台湾地区《异体字字典》(官修,网络版)106230字。

22. 近年网络“字书诂林”“国学大师”称,统计了“81516个Unicode汉字+汉语大字典第二版6万+中华字海8.5万+古壮字+CJK-F&G区+日本和制汉字”,一共约20万字。

其中,Unicode一般翻译成“统一码、万国码、单一码”等,是计算机科学领域里的一项业界国际标准,即把世界各国的文字放进同一个编码系统里面,以方便信息交换。

现在回答你多少个的算法逻辑问题。

首先需要明确的是,我们并不能精确说出究竟汉字有多少个。

原因首先是,以上统计数量虽然像滚雪球一样越滚越多,但大部分是历史累积的结果,虽然我们每个时代的用字量是基本稳定的(约7000字)。

其次,大量异体字是按字形算,还是按其对应的“正体”算,存在认识差异的问题。

此外,近年有些字没有统计进来,比如各种出土文献的文字编、碑刻字典等。

再者,有些看起来像汉字的“汉字”,能不能算“汉字”也是个问题(比如道教符箓用字、西夏大字、女真大字、越南喃字、日本自造字、朝鲜自造字、古壮字、方言自造字,以及中土原生而借入日语、朝鲜语来记录他们语言的字)。

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/bake/4207127.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-10-27
下一篇 2022-10-27

发表评论

登录后才能评论

评论列表(0条)

保存