二、词法分析

二、词法分析,第1张

从左到右扫描,产生一个个单词符号。词法分析一般作为语法分析的子程序。

单词符号的分类
  • 保留字:比如C语言中的if,else等
  • 标识符:用于标记常量、数组、类型、变量等
  • 常数
  • 运算符:+、-、*、/、<、>等
  • 界符(分隔符):分号,逗号等

一般用二元式作为输出单词的形式:
(单词种别,单词自身的值)
单词种别一般是一个整数码。

正规表达式与正规集

以一个例子来说明正规表达式:
标识符的定义是以字母开头的字母数字串,那么就可以表示为 letter(letter | digit)*
这就是标识符的正规表达式,简称正规式。
正规集就是用正规表达式所能生成的所有组合,设 R 为一个正规式,则 L( R ) 表示 R 的正规集。

有限自动机

如果学过AC自动机或者是字典树的话,会帮助理解有限自动机,因为二者的实现原理是类似的。
有限自动机分为确定有限自动机(DFA)和非确定有限自动机(NFA)
DFA和NFA的主要区别有两点:
1.DFA只有一个初始状态,而NFA可以有若干个初始状态
2.NFA的状态转换函数f不是单值函数,也就是说可以从一个结点通过相同的字符跳转到多个结点。
相同点:都可以用五元组来表示

DFA

表示方法为Md = (S,Σ,f,s0,Z)
S:有限状态集,每个元素为一个状态,罗列了所有会出现的字符
Σ:有穷输入字母表,每一个元素称为一个输入字符,跳转边上的字符从Σ中取
f:一个从 SxΣ 到 S 的单值映射,也就是跳转关系
s0∈S:唯一的初始状态
Z⊂S:一个终态集

NFA

表示方法为Mn = (S,Σ,f,Q,Z)
与DFA不同的部分:
f:一个从 SxΣ* 到 S 的子集映射,SxΣ*表示可以通过空值进行跳转
Q⊂S:非空初态集

下面是DFA和NFA的转换图画法示例

由正规表达式到有限自动机的构造★ 构造非确定有限自动机

第一步:画出如图所示的拓广转换图

第二步:运用如下三条转换规则对拓广图进行扩展

书上的一个例子2.6:

NFA的确定化

每个NFA都能相应地构造出一个与之等价的DFA
我们采用子集法对其进行确定化,也就是将多个状态合并为DFA中的一个状态。
首先介绍一下ε_CLOSURE(I) ,这个表示从状态I经过若干条ε边所能到达的所有状态以及状态I自身的集合
那么同理 a_CLOSURE(I) 表示从状态I经过一条a边和若干条ε边所能到达的所有状态以及状态I自身的集合。可以简化为 Ia 表示。

书上的一个例子2.8:

对例2.6进行确定化:


由于画图比较复杂,略。

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/langs/921485.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-05-16
下一篇 2022-05-16

发表评论

登录后才能评论

评论列表(0条)

保存