自然语言处理研究的是自动的去理解与生成人类语言的算法。小到一个文本匹配的算法,大到机器翻译、对话系统、搜索引擎都能用到自然语言处理技术。自然语言处理的任务包括基础自然语言任务、信息抽取任务、文本生成任务和其他应用任务。
那么自然语言处理的发展历程又是什么样呢?它究竟包含哪几个发展阶段呢?
- 1. 基于规则的方法
- 2. 统计机器学习方法
- 3. 浅层神经网络
- 4. 深层神经网络(预训练模型)
早在19世纪50年代,当计算机科学和人工智能刚刚兴起的时候,自然语言处理的研究领域就出现了用语言学家制定的规则来书写程序,从而完成语言理解和机器翻译等任务。那时候的程序包含很多条件语句。它们都是属于基于规则的系统。然而自然语言充满了歧义性,同样一个词可能有不同的意思,同样一个短语可能表达不同的看法,这些歧义性给语言学家书写规则提出了很大的挑战。很少有一套规则系统能够解决所有的歧义性。其中一个著名的案例发生在60年代,该任务是将俄语翻译成英语,原文的意思是精神很强大但肉体很虚弱:
- The spirit is strong, but the flesh is weak.
- The Vodka is good, but the meat is bad.
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)