知网汉语词库(即HowNet)怎样使用

知网汉语词库(即HowNet)怎样使用,第1张

一、理论基础 首先,二者都以一种“模式假设”(patterning hypothesis)为前提和理论基础。其次,“理解性假设”(comprehensiveness hypothesis)也是二者的理论基础。但二者的理论基础不同之处也很多。Wordnet的一个较主要的理论基础是“可分离性假设”(separability hypothesis)即语言的词汇成分可以被离析出来并专门针对它加以研究。 Hownet的最重要的理论基础是它的哲学。其根本点是:世界上一切事物(物质的和精神的)都在特定的时间和空间内不停地运动和变化。部件和属性这两个单位在Hownet的哲学体系中占有着重要的地位,一个事物被视为是整体还是部件,可以因系统的不同而不同对待;而关于对属性的认识是:任何一个事物都一定包含着多种属性,事物之间的异同是由属性决定的,没有了属性就没有了事物。二、设计原理与方法 二者的建设方法最明显的相同之处就是自上而下的方法。具体来说,Wordnet是以同义词集合作为基本构建单位进行组织的。Hownet则是先提取义原,以它为基本构建单位进行组织的。虽然细节不同,但总的指导性建设方法还是相同的。具体的设计原理与建设方法上,两者的不同点就凸现出来了。 1、Wordnet 的基本设计原理是它的“词汇矩阵模型” 一个词汇矩阵从理论上可以用单词与其同义词集合之间的映射来表示。当某个词有多个同义词时,通常同义词集合足以满足差异性的要求。当然,同义词是词形之间的一种词汇关系,但由于这种关系在Wordnet中被赋予了中心角色。因此,同义关系的词被放在中,与其他被放进[]中的词汇关系的词区别开来。Wordnet是按语义关系组织,由于语义关系是多个词义之间的关系,而词义用同义词集合来表示,因此很自然地把语义关系看作为同义词集合之间的一些指针。 2、Hownet的基本设计原理是把概念与概念之间的关系以及概念的属性与属性之间的关系形成一个网状的知识系统。这是它与Wordnet的本质不同。Hownet的建设方法的一个重要特点是自上而下的归纳的方法。通过对全部的基本义原进行观察分析并形成义原的标注集,然后再用更多的概念对标注集进行考核,据此建立完善的标注集。无论是义原的提取还是义原的考核与确定,在Hownet的建设中都是至关重要的并具有决定意义。三、描述关系的比较 1、上下位关系 这是二者都有的。Wordnet是词义之间的语义关系。Hownet的上下位关系由概念的主要特征体现,也具有继承关系。 2、同义关系 同义关系是二者都有的。Wordnet最重要的关系是同义关系。Hownet对于同义的定义与Wordnet相似,都采取了较宽泛的定义,只是Wordnet的同义关系是显性的,而Hownet的同义关系是隐性的。 3、反义关系 Wordnet对于反义关系采取了直接反义和间接反义两种关系都包括的方法。Hownet中的反义关系比Wordnet定义的还要宽泛,只要属性值一样就可以形成反义关系。四、目的与应用 1、目的 Wordnet一开始要建立一个词典浏览器,后来又发展成自足的词汇数据库和语义或义类的机读词典。而Hownet是要建立一个面向计算机的知识库,揭示多重语义关系网络,为自然语言处理系统的建立提供最终需要的知识库。 2、应用 由于二者都是为自然语言信息处理服务的系统,那么二者的应用有交叉。例如,二者都在进行意义排歧,语义分析,语料库语义标注,信息过滤和分类,机器翻译等方面有着十分广泛的应用。 两者又有自己独特的应用领域。例如,Wordnet由于许多国家都在它的基础上建立了词汇数据库,那么Wordnet就可以进行多国语处理的词汇转换。由于它的内部结构是以层次为主,所以可进行信息语义层次检索,还可以进行主题名义识别和图像检索等;而Hownet也有它自己的应用领域,如:基于Hownet的内部语义关系建立,语料库句法关系标注,信息检索系统自然语言接口。还有它关于汉语方面研究与应用的独特之处,如:它的信息过滤和分析系统都是双语的,可以进行事件角色语义特征的提取。把Wordnet和Hownet结合起来的典型应用要算基于两者建设的双语语义词典。五、小结 经过对Wordnet和Hownet的一番比较,可以看出二者虽然是两种系统,但把二者结合起来研究,找出各自的不足之处,对自然语言处理研究还是有一点帮助作用的。Wordnet的词语概念是够用,但关系方面不足以支持推理。Hownet恰恰就是这样一种推理的知识库。Wordnet可向Hownet吸取这一点。Wordnet几乎没有关于句法方法方面的标注。而Hownet作为一个面向计算机并借助于计算机建立的常识知识库,它在语义知识构建方面明显优于Wordnet,而且许多现在Wordnet正致力解决的问题,在Hownet中都不是问题。所以在面向自然语言的信息处理方面,Hownet要优于Wordnet。当然Wordnet的研究人员也从来觉得这是一个“完工”的项目,Wordnet仍在继续发展中。

推荐使用 汉语大辞典v5.31〖完美注册破解版〗

http://www.downxia.com/downinfo/1125.html

是破解版的,非常好用!!!!

可查:成语39188 条、汉字20973 个、词语361253条、诗词93535 首、歇后

语16648 条、灯谜40790 条、对联5358幅、妙言警句13752 条、俗语1929条、谚

语1229条,内设「辞海成语词典」、「常用成语词典」、「新华字典」、「中华

辞海」、「中华诗词」、「拼音专家」、「歇后语大全」、「灯谜大全」、「对

联欣赏」及「辅助词典」等内容;具有方便快捷的查询、模糊查询、扩展查询、

接龙、智能接龙、成语测试游戏、成语速记游戏等功能。其拼音、解释、出处、

示例等等都一目了然。成语查询时,可用通配符“* ”号来连接多个关键词,强

大的模糊查询功能,对关键字的出现顺序都作了编号、排序,查阅非常方便。尤

其是自由自在的成语接龙功能,具有人性化的信息提示,充分展示了人脑与电脑

的互动,增加了学习的趣味性。而且还可以让电脑来表现一下自动接龙的威力,

每次的数目自定(1~100 个),能在几分钟内首尾相接5000多条成语,而无重复,

已经大大超过“吉尼斯记录”。成语测试游戏,可在娱乐中考查成语熟练程度,

同时提高成语水平。成语速记游戏,则可轻轻松松记成语,学习娱乐两不误。其

中「常用成语词典」含成语6000余条,可直接转换,供学生使用。「新华字典」

可查询汉字20973 个,每个字都有解释及示例(其中包括3000多个多音字),并

可进行“拼音码”、“五笔码”、“部首”与汉字互查;支持“同韵字”查询。

「中华辞海」可查询词语357850条,基本涵盖了全部的常用词语,可按词语“词

首”、“词中”、“词尾”进行查询,是您工作、学习的好帮手。「中华诗词」

可查询诗词93535 首,基本上每首都有详细的标题、年代、作者、体载、类别、

内容和赏析等。可选择按“标题”或“内容”中的几个字来查找同一首诗词;也

可按“年代、作者、体载、类别”筛选出要找的诗词。「拼音专家」可把所有简

体字、繁体字轻松地转换成带声调的拼音,如“我爱学习”可转换为“我w ǒ爱

ài 学xué习x í”,再也不用担心有哪个汉字不会认!「灯谜大全」可查谜语

40790 条,可按“谜面、谜目、谜底”快速检索出相应的灯谜。「对联欣赏」分

类列出对联5358幅,方便的查询功能,您一定会喜欢。「歇后语大全」内含歇后

语16648 条,供您查询、欣赏……。「辅助词典」含妙言警句13752 条、俗语1929

条、谚语1229条,以满足您的不同需要。本辞典内容丰富、寓教于乐,特别是查

询非常方便,无论对提高学生的语文写作水平、还是成人的文学素养都有很大的

益处。欢迎选用!

此破解能完美使用,先安装原版的把再破解补丁复制到目录里,再把安装目录下的smartread3.dll unicows.dll两个DLL文件删掉,即可完美使用任何功能


欢迎分享,转载请注明来源:内存溢出

原文地址: https://outofmemory.cn/sjk/9741287.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-01
下一篇 2023-05-01

发表评论

登录后才能评论

评论列表(0条)

保存