从左到右扫描,产生一个个单词符号。词法分析一般作为语法分析的子程序。
单词符号的分类- 保留字:比如C语言中的if,else等
- 标识符:用于标记常量、数组、类型、变量等
- 常数
- 运算符:+、-、*、/、<、>等
- 界符(分隔符):分号,逗号等
一般用二元式作为输出单词的形式:
(单词种别,单词自身的值)
单词种别一般是一个整数码。
以一个例子来说明正规表达式:
标识符的定义是以字母开头的字母数字串,那么就可以表示为 letter(letter | digit)*
这就是标识符的正规表达式,简称正规式。
正规集就是用正规表达式所能生成的所有组合,设 R 为一个正规式,则 L( R ) 表示 R 的正规集。
如果学过AC自动机或者是字典树的话,会帮助理解有限自动机,因为二者的实现原理是类似的。
有限自动机分为确定有限自动机(DFA)和非确定有限自动机(NFA)
DFA和NFA的主要区别有两点:
1.DFA只有一个初始状态,而NFA可以有若干个初始状态
2.NFA的状态转换函数f不是单值函数,也就是说可以从一个结点通过相同的字符跳转到多个结点。
相同点:都可以用五元组来表示
表示方法为Md = (S,Σ,f,s0,Z)
S:有限状态集,每个元素为一个状态,罗列了所有会出现的字符
Σ:有穷输入字母表,每一个元素称为一个输入字符,跳转边上的字符从Σ中取
f:一个从 SxΣ 到 S 的单值映射,也就是跳转关系
s0∈S:唯一的初始状态
Z⊂S:一个终态集
表示方法为Mn = (S,Σ,f,Q,Z)
与DFA不同的部分:
f:一个从 SxΣ* 到 S 的子集映射,SxΣ*表示可以通过空值进行跳转
Q⊂S:非空初态集
下面是DFA和NFA的转换图画法示例
第一步:画出如图所示的拓广转换图
第二步:运用如下三条转换规则对拓广图进行扩展
书上的一个例子2.6:
每个NFA都能相应地构造出一个与之等价的DFA
我们采用子集法对其进行确定化,也就是将多个状态合并为DFA中的一个状态。
首先介绍一下ε_CLOSURE(I) ,这个表示从状态I经过若干条ε边所能到达的所有状态以及状态I自身的集合
那么同理 a_CLOSURE(I) 表示从状态I经过一条a边和若干条ε边所能到达的所有状态以及状态I自身的集合。可以简化为 Ia 表示。
书上的一个例子2.8:
对例2.6进行确定化:
由于画图比较复杂,略。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)