中文语料库有哪些

中文语料库有哪些,第1张

1 语言资源

2 搜狗实验室(Sogou Labs)

3 Acollection of Chinese corpora and frequency lists

4 Corpus-basedLanguage Study

TheLancaster Los Angeles Spoken Chinese Corpus

5 >

收费:中央研究院-中文剖析树检索系统

6 LivacOnline

7 哈工大信息检索研究中心(HIT CIR)语言技术平台共享资源和程序步骤

8 ToRCH2014语料库 布朗家族中文语料库

9 CCL语料库 模式查询

10 candlewill/Dialog_Corpus

11 MarkWuNLP/MultiTurnResponseSelection

12 Short-TextConversation

13 语料库在线--资源共享

14 BCC语料库

15 LDC语料库 据说有一些中文文本

16 公布一批中文文本分类的新闻语料库 | 我爱自然语言处理

17 THCHS-30 清华大学大学生30小时语音

18 数据下载 - BosonNLP

19 北京宇音天下科技有限公司-下载中心

20 水木社区-源于清华的高知社群

21 语料库 - 自然语言处理与信息检索共享平台 NLPIRorg - Poweredby SupeSite 这个里面有好几个链接,还挺多的

不收费。根据查询公开信息显示语料库是北大提供给广大人民的一个免费教学app,下载好直接登录,搜索自己想要的资料下载即可。语料库指经科学取样和加工的大规模电子文本库,其中存放的是在语言的实际使用中真实出现过的语言材料。

语料库指的是一个大型的文本数据集,通常用于语言学研究、自然语言处理和机器学习等领域。根据查询中国科普网显示,这些数据集通常由特定主题、领域或语言的文本组成,例如新闻报道、小说、博客文章、社交媒体帖子等等,研究人员和技术人员可以使用语料库来训练和测试语言模型、机器翻译系统、情感分析工具等等。

单击导航栏上查询。
按字查询时只能输入一个关键字错误,然后点击查询。
HSK是一项国际汉语能力标准化考试,重点考察汉语为非第一语言的考生在生活、学习和工作中运用汉语进行交际的能力。

语料库中存放的是在语言的实际使用中真实出现过的语言材料。

1、语料库

是语料库语言学研究的基础资源,也是经验主义语言研究方法的主要资源。应用于词典编纂,语言教学,传统语言研究,自然语言处理中基于统计或实例的研究等方面。

2、语料库分类

异质的、同质的、系统的、专用的。

3、语料库特征

语料库中存放的是在语言的实际使用中真实出现过的语言材料,因此例句库通常不应算作语料库;语料库是承载语言知识的基础资源,但并不等于语言知识;真实语料需要经过加工(分析和处理),才能成为有用的资源。


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/yw/12898540.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-28
下一篇 2023-05-28

发表评论

登录后才能评论

评论列表(0条)

保存