qq输入法词库的导入的意思

qq输入法词库的导入的意思,第1张

QQ拼音输入法的词库里有很多的单词词汇,方便用户在输入的时候能够快速的找到。如果我们想要导入或是导出QQ拼音输入法的词库,该怎么弄呢?下面请看小编带来的详细介绍。
QQ拼音输入法导入词库的方法
1、首先我们把从其他输入法导出的词库准备好,然后用“Ctrl+Shift”切换出QQ输入法;
2、接着我们在它的状态栏上点击鼠标右键,并在d出的选项框中打开“属性设置”;
3、在属性设置界面找到“词库”分类,接着在“本地词库管理”中就可以导入或者导出词库了。
关于qq拼音输入法导入词库的方法介绍就是这样,希望大家喜欢。

1、点击桌面图标,打开搜狗输入法。

2、在主界面点击右下角的“我的”。

3、点击右上角的设置图标。

4、点击“快去添加词库”。

5、点击“添加细胞词库”。

6、点击进入一个词库分类。

7、找到自己需要的项目,点击后面的“下载”。等到该项内容下载完成,我们指定的词库就添加成功了。

首先,下载安装一个百度输入法,然后打开百度输入法首页,点击词库管理

然后点击选择分类词库

在这里,可以关闭一些用不到的词库, 然后怎么下载词库呢?点击更多分类词库下载

进入分类词库后,将页面转移到热门词库中, 然后点击选择自己想要添加的词库,点击下载

这里就立刻有显示了

、WordNet的特点
WordNet是一个词与词之间存在各种关系的词典,不同于传统词典和同义词词典,WordNet有如下三个特点:
(1)WordNet与一般字典的不同在于组织结构的不同,它是以同义词集合(Synset)作为基本的构建单位来组织的,用户可以在同义词集合中找到一个合适的词去表达一个已知的概念。而与传统词典类似的是它也给出了定义和例句。
如果说WordNet是一个数据库,那么Synset就是一条数据的主键,而每一条数据,代表的是一个词义。Synset在文件中的格式,上一篇已经介绍了,这次介绍一下python中显示的Synset。

图1Python中的Synset
由上图可见,Synset由三部分组成,第一部分是词义,第二部分是词性,第三部分是编号。

图2有关Synset的一些基本应用
图2是一些关于一条Synset的一些简单的应用,但是Wordnet的用法远不止于此,我将在后面用wordnetpy的代码直接进行介绍。
(2)WordNet不只是用同义词集合的方式罗列概念,而是把这些同义词集合用一定的关系类型关联起来的。其中有同义关系(synonymy)、反义关系(antonymy)、上下位关系(hypernymy/hyponymy)、整体和部分关系(meronymy)和继承关系(entailment)等。WordNet尽可能使词义之间的关系简单,使用起来方便。
WordNet的词汇结构包括九大类:上下位关系(动词、名词)、蕴含关系(动词)、相似关系(名词)、成员部分关系(名词)、物质部分关系(名词)、部件部分关系(名词)、致使关系(动词)、相关动词关系(动词)、属性关系(形容词)。
(3)在WordNet中,大多数的同义词集都有说明性的注释,但一个Synset不等于词典中的一个词条,因为一个Synset只包含一个注释,而在传统词典中的词条是多义词,会有多个解释。
所以说,“一个Synset等于的是一个词义”这一点必须反复强调。以一条词义为一条数据,是跨语言想要成立所必须的条件。
二、WordNet的缺点
我将WordNet的优点按下不表,而单独谈一谈它的缺点,因为它的优点显而易见。好比它以词义为中心的优点让我在做跨语言的项目时会首先想到它。然而优点会让我选择它,缺点也可能会让我不得不放弃它。必须承认,WordNet的一些缺点是致命的,下面就让我来列举一下。
1汉语词条太少
像我在上一篇中所说的,WordNet的英文词条共计:117659条,但中文对应词条却只有42312条。看起来所占比例足足有三分之一,但实际上英文的名词有:82115条,中文的名词则只有两万七千余条(当时统计的数据,具体数据我在撰写本文的时候忘记了,见谅),且不说一些专业名词没有解释、上海、伦敦这种城市名称也没有翻译,就连“”、“普通话”这种中国人的常用词都没有。
2汉语词义存在错误
词条少还可以补充,不过更为可怕的是,有的词条不明所以,甚至根本是错误的翻译!
我们来举一个例子。

图3wordnet文件夹中datanoun文件中的一条Synset——00002137-n
如图三所示,这一条Synset有两个写法,分别是abstraction和abstract_entity,而示意是这样:
a general concept formed by extracting common features from specific examples
这句话的意思和第二个词的意思都非常明显,这个词的中文词义应该是:抽象实体
可是我们的cmn是怎么翻译的呢?

图4cmn文件夹下wn-data-cmntab文件中表示00002137-n的中文对应词
居然出现了“抽象派作品”!而众所周知,这个所谓的“抽象派作品”,只是abstraction的一个词义,而不是00002137-n这一词义的中文意思。
换句话说,这翻译是错的,它以一个单词作为主键进行翻译,而不是以一个词义进行翻译。
我不知道这种现象是个别存在还是偶然状况,一个以万条为单位的文本,我实在无力逐个排查,但是恐怕这一现象并不少见,这个cmn,极有可能是用某种已经存在的词典进行机翻的,而不是逐条对应词义翻译的。

图5abstraction在有道词典中的翻译
如果说连词条都是错误的,基于这个词典所做的工作是否还存在意义?
所以我初步准备在研究生期间,利用业余时间重新编写中文WordNet中的内容,战略放弃cmn(汉语开放词网)所提供的中文WordNet,顺便学习英语。
我将采用机翻+校对的方式,以词义为标准进行对译,最终实现所有词义都有对应多个汉语对译词的中文WordNet,我将它命名为Anlitong Chinese WordNet(acw)。
希望我们可以一起见证它的问世。
3网球问题
说了两个中文WordNet中存在的致命问题之后,我们再来讨论一下WordNet存在的结构性问题。
“网球问题”指怎样把racquet(网球拍)、ball(网球)和net(球网)之类具有情境联想关系的词汇概念联系起来、发现它们之间的语义和推理关系。这是一个自然语言处理和相关的语言知识资源建设的世界性难题。该文以求解“网球问题”为目标,对目前比较主流的几种语言词汇和概念知识库系统(包括WordNet、VerbNet、FrameNet、ConceptNet等)进行检讨,指出它们在解决“网球问题”上还都存在一定的局限性,着重分析它们为什么不能解决“网球问题”。进而指出基于生成词库论的名词物性结构知识描写体系可以解决“网球问题”,主张用名词的物性结构知识和相关的句法组合知识来构建一种以名词(实体)为核心的词汇概念网络,以弥补上述几种知识库系统的不足,为自然语言处理提供一种可资参考的词汇概念知识库体系。
WordNet虽然有词的分类Lexnames,但是太过笼统,对于具体的情景联想关系,并没有什么解决办法。毕竟情境的复杂程度也不低,也许不是一个字典所能涉及的,网络上有一些用物性结构知识解决网球问题的论文,有兴趣的朋友可以看一看。
4消歧问题
WordNet是以词义为主键构建的字典,可是当我们扫描一篇文章的时候,出现的都是具体的词,那么这一个词就对应多个词义,如何分辨出语境中这一词对应的是哪一个词义,才是跨语言识别和句意分析的重点。
5词性较少
WordNet中的词性只有四种,即名词、动词、形容词、副词。
但是自然语言中虽然以这四种词为主,却并不只有这四种词,比如连词和代词,WordNet中都没有(这就导致一句“I love you”,WordNet可能只能识别出“love”,当然,代词方面需要明确其指代对象,这就不是字典可以解决的问题了。)而这四种词性又可以细分并且存在交叉,比如地名、人名、动名词等。现在这一方面反而是一些分词软件走在了前面,WordNet则没有进一步的区分。
以上是我对WordNet的理解、看法和一些想法。下次将通过分析nltk包中的wordnetpy文件来为大家介绍wordnet的每一项具体的功能。

所谓的关键词库指的是一个网站的搜索关键词在搜索引擎中从首页第1位到50位的排名,通常SEO关键词词库的做法有以下几点:

1、利用各种关键词挖掘工具把主词、长尾词、建立表格分类好,目前常用的关键词挖掘工具有:站长工具、5118、爱站网、词库网、百度关键词规划师、百度下拉、搜索相关关键词等等。

2、根据网站实际情况,把指数大的写在首页,一般3到5个,然后把分类好的词自然分布于栏目页、内页等等。

3、词库的建立是通过后期不断优化把站内各关键词从100名之外优化到首页排名一至五十名以内就开始查询得到词库了。


欢迎分享,转载请注明来源:内存溢出

原文地址: https://outofmemory.cn/yw/10374666.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-08
下一篇 2023-05-08

发表评论

登录后才能评论

评论列表(0条)

保存