语料库和记忆库两者是一样的,没有区别。
英文论文的写作者对在线词典和翻译软件都比较熟悉,但是很多人对语料库是比较陌生的。它是一种未被充分利用的能够帮助学术写作的宝贵资源。
语料库注意:
语料库一般用于词典编纂、语言教学和传统语言研究等领域。语料库分为很多种,例如英国国家语料库(BNC)、美国当代英语语料库(COCA)、密歇根大学学术英语口语语料库(MICASE)、中文文本分类语料库等。语料库具有动态性,即语料是不断动态补充的,可以追踪到语言成分的产生、成长和消亡。
年代才崭露头角的一门交叉学科,它研究自然语言文本的采集、存储、加工和统计分析,目的是凭借大规模语料库提供的客观翔实的语言证据来从事语言学研究和指导自然语言信息处理系统的开发。
语料库顾名思义就是放语言材料的仓库。现在人们谈起语料库,不言而喻是指存放在计算机里的原始文本或经过加工后带有语言学信息标注的语料文本。现在世界上已经有了不少规模较大的语料库,有些是国家级的,有些由大学和词典出版商联合建设。另外,由于个人微机的迅猛发展和存贮数据的硬盘造价持续下降,研究者个人也开始建立适合于自己研究的小型语料库。
语料库语言学(英文corpuslinguistics)这个术语有两层主要含义。一是利用语料库对语言的某个方面进行研究,即“语料库语言学”不是一个新学科的名称,而仅仅反映了一个新的研究手段。二是依据语料库所反映出来的语言事实对现行语言学理论进行批判,提出新的观点或理论。只有在这个意义上“语料库语言学”才是一个新学科的名称。从现有文献来看,属于后一类的研究还是极个别的。所以,严格地说,现在不能把语料库语言学跟语言学的分支,如社会语言学、心理语言学、语用学等相提并论。
近年来,随着我国经济的发展,科研经费的增加,汉语语料库的建设得到了开展。1999年我院把建立汉语语料库列为院重大课题。目前语言所正在构建三个大规模的语料库:现场即席话语语料库,主要方言口语库和现代汉语文本语料库。在世界范围内,我国的语料库建设在规模上还赶不上欧洲的一些发达国家,特别是英国。然而,在语料库语言学的研究上,以及语料库的实际运用上,我国已经进入世界前沿的行列。
20世纪语言研究的总特点可以用四个字概括———高度抽象。最近几十年来,语言研究的高度抽象倾向已经失去主导地位。这主要缘于两个方面的因素:一是计算机技术,特别是基于计算机处理的多媒体技术的飞速发展;二是社会语言学、语用学、会话分析、人类语言学、计算语言学、人机对话研究、语音识别与合成等研究取得令人瞩目的成就。先前难以抓住并进行有效处理的五花八门的实际语料,现在可以对其进行大规模地的、自动的或人机配合的处理。比如个人发音特征,先前认为这跟语言学毫无关系,现在成了侦破语音学的重要内容。侦破语音学家首先建立个人发音特征语料库,这个语料库可以用来鉴别嫌疑犯。概言之,当今的语言研究由先前的高度抽象逐步走向最具体的语言的实际活动,其中包括神经元的运动。比如神经语言学就是要揭开人类大脑神经是如何处理语言这个秘密的学科。
语料库和语料库语言学在当今语言研究由高度抽象转向语言的实际使用这个过渡中起着十分重要的作用:一是提供真实语料;二是提供统计数据;三是验证现行的理论;四是构建新的理论。这些可以说是语料库和语料库语言学的实用价值。提供真实语料可以说是词典编纂的生命线。现在流行的英语词典几乎全部是基于大规模语料库编纂而成的。基于大规模语料库的英语语法书也已经问世。通过大规模语料库建立统计模型成为语言信息处理和加工的主流模式。先前基于规则的机器翻译、语音合成与识别、文语转换等如没有大规模语料库的数据支持,要取得好成果是不可能的。在理论建设上,基于英国国家语料库英语口语库的研究表明,基于真实英语口语语料的英语口语语法跟基于书面语的语法大不相同,甚至可以夸张地说,是不同的语法。
在欧洲,语料库语言学已经成为语言学的主流分支。相信在注重语言实际的我国,语料库语言学也将受到越来越多的研究者的重视,取得丰硕的成果。
参考资料:
词汇作为构成英语大厦的根基,在英语教学中发挥举足 轻重的作用,教育工作者们不断寻求新的教学法,近年来, 计算机语言学和语料库语言学的迅猛发展为英语教育工作者 带来了福音,语料库以其宏达的数据库为词汇教学提供了客 观、可靠的语料,使词汇教学获取了更加直观、科学的教学 依据。语料库对语言学习的重要性与经验证据对语言学习的 重要性一样。实证数据使语言学家做出客观的描述,而不是 主观的描述,也不是基于个人固有的对语言的感知。 一、语料库语言学 关于“语料库”和“语料库语言学”的定义专家学者们 仁者见仁智者见智。其中一种定义为,语料库(corpus,复数 形式corpora):一个语言数据的集合,可以由书面文本构成, 也可以由录音言语的转写本构成。另一种定义为,语料库语 言学:论述语言研究中使用语料的原理和实践。一个计算机 语料库是机器可读文本的重要躯干。(参见Crystal,1992:85) 语料库源自拉丁语corpus,意思是“body”(躯干;身体)它是 一个语篇的集合,在语言学和词汇编纂学上,指语篇、语句 或其他样本的集合,通常作为一个电子数据库储存。语料库 最重要的用途就是可以帮助我们了解语言在现实中的实际使 用情况,通过语料库,我们可以获得某些语言项目或语言结 构的使用频率信息、语境和上下文本信息、语法信息、搭配 信息以及有关语言在实际交际中使用情况即语用信息等。
查看更多
语料库一词在语言学上意指大量的文本,通常经过整理,具有既定格式与标记;事实上,语料库英文 "text corpus" 的涵意即为 "body of text"。
可以查询那些句子、用法合符规范
查不到结果的,避免使用
以上就是关于语料库和记忆库有什么区别,两者是一样的吗全部的内容,包括:语料库和记忆库有什么区别,两者是一样的吗、语料是什么意思、语料库语言学与词汇的关系等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)