设计一个小语言的词法分析程序

设计一个小语言的词法分析程序,第1张

任务1:识别小型语言所有单词的词法分析程序设计

源程序设计语言 G[<程序>]

<程序>→<变量说明><BEGIN><语句表><END>.

<变量说明>→VAR<变量表>:<类型>;|<空>

<变量表>→<变量表>,<变量>|<变量空宏颤>

<类型>→INTEGER

<语句表>→<语句>| <语句><语句表>

<语句>→<赋值语句>|<条件语句>|<WHILE语句>|<复合语句>

<赋值语句>→<变量>:=<算术表达式>

<条件语句>→IF<关系表达式>THEN<语句>ELSE<语句>

<WHILE语句>→WHILE<关系表达式>DO<语句>

<复合语句>→BEGIN<语句表>END

<算术表达式>→<项>|<算术表达式>+<项>|<算术表达式>-<项>

<项>→<因式>|<项>*<因式>|<项>/<因式>

<因式>→<变量>|<整数>|(<算术表达式>)

<关系表达式>→<算术表达式><关系符><算术表达式>

<变量>→<标识斗败符>

<标识符>→<标识符><字母>|<标识符><数字>|<字母>

<整数>→0|<非零数字><泛整数>

<泛整数>→<数字>|<数字><泛整数>|ε

<关系符>→<|<=|==|>|>=|<>

<字母>

→A|B|C|D|E|F|G|H|I|J|K|L|M|N|O|P|Q|R|S|T|U|V|W|X|Y|Z

<非零数字>→1|2|3|4|5|6|7|8|9

<数字>→<非零数字>|0

<空>→

要求和提示:

词法分析阶段,可以打开任意位置和名称的源文件进行词法分析,可以进行非法字符和数字后边跟字母的错误判断,如果没有错误则提示“词法分析正确完成!”,并且可以选择输出token.txt(token文件)string.txt(符号表)两个文件;

1.词法分析程序的主要任务如下:

① 组织源程序的输入,识别出源程序中的各个基本语法单位(也称为单词或语法符号),按规则转换成二元式的形式;

② 删除无用的空白字符、回车符、及其它非实质性符号;

③ 删除注解行;

④ 为后面的语法和语义分析提供二元式链表;

单词 编码 单词 编码

标识符 1 <15

正整数 2 <= 16

BEGIN 3 >17

END 4 >= 18

IF 5 <>19

THEN 6 == 20

ELSE 7 ; 21

WHILE 8 . 22

DO 9 := 23

INTEGER 10 , 24

+ 11 ( 25

- 12 ) 26

* 13

/ 14

1) 对标识符的长度控制在8个字符(包括8个)以内,超过的做截断处理;

2) 数字不大于65535,否则报错;

3) 能跳过源程序中的空白格:两个单词之间的任何空格,制表符,回车,换行都是白空格,除了用来分隔单词以外,没有意义;

4) 能跳过注释:

a) 接连出现的/*到下一次接连出现的*/之间的任何文字都是注释(多行);

b) 从某行接连出现的//到该行的结尾的任何文字都是注释(单行)。

3.怎样编写词法分析程序:

1) 预处理:把源文件一个字符一个字符的读入词法分析程序设置的输入字符结构体数组中(输入缓冲区),读入过程要删除注释,删除多余的白空格;

2) 从源程序字符数组中获得单词, 编码为二元式.:

二元式采用结构体数组存储, 把单词类型和词元记录下来。

分解单词的方法:

1) Case多路转换语句根据单词的特点直接编写;

2) 通过描述单词的正规文法得到相应的有穷自动机,通过case多路转换语句完成有穷自动机的处理流程。

3.编写词法分析程序要注意的问题:

1) 检查词法是否有错误

检查是否有非法字符:如 @, &, !

检查标志符和数字是否满足限制条件

检查注释符号是否配对

2) 符分隔单词

能够区分两个单词的符号为界符

有些界符不是单词:如白空格

有些界符仅仅用来分隔:如;

有些界符本身还是源程序不可缺少的单词,如(, ), +, /, 等等

有些界符包含两个字符:如<>, >=等等

3) 输出词法错误

如果有错误,需要报告词法错误的原因。并且绝雹要能够越过错误,分解下一个单词,直到源程序结束。

4) 输出的二元式流保存在二元式结构体数组中。

你好,希望采纳!

从产生语言的角度出发,给出文法和语言的定义。

所谓产生语言,是指制定出有限个规则,借助他们就能产生此语言的全部句子。

1.文法的定义

描述语言语法结构的规则称为文法。文法是一个四元组G=(Vn,Vt,P,S)。

Vn是一个非空有限集,其每个元素称为非终结符;

Vt是一个非空有限集,其每个元素称为一个终结符;

Vn∩Vt=∅,Vn和Vt不含公共元素;V=Vn∪Vt,称V是文法G的词汇表,V中的符号称为文法符号。

P是产生式的有限集合,每个产生式形式为“α→β”的规则,α是产生式的左部,α∈V+且α中至少含有一个非终结符,β是产生式的右部,β∈V*,β是α的一个候选式。

S∈Vn,称为开始符号,它至少要在一个产生式中作为左部出现。

2.文法的分类

文法有4种类型:0型、1型、2型、3型。这4类文法之间的差别在于对产生式要施加不同的限制。

0型文法:G的任何产生式α→β,均有α∈(Vn∪Vt)+且α中至少含有一个非终结符,β∈(Vn∪Vt)*;

(对0型文法的每条产生式分别施加以下限制,则可得以下文法。)

1型文法:G的任何产生式α→β(S→ε除外)均满足|α|≤|β|(|x|表示x中文法符号的个数,ε是空串)轿锋;

2型文法:G的任何产生式形如A→β,其中A∈Vn,β∈(Vn∪Vt)*;

3型文法:G的任何产生式形如A→a或者A→aB(或者A→Ba),其中A,B∈Vn,a属于Vt;

0型文法是短语文法,其功能相当于图灵机,任何0型语言都是递归可枚举的。

1型文法是上下文有关文法,对非终结符的替换必须考虑上下文,且不允许替换成空串ε。

2型文法是上下文无关文法,非终结符的替换无须考虑上下文虚岩。

3型文法等价于正规式,因此也被称为正规文法或线性文法。

词法分析的词法规则一般用3型文法;

语法分析的语法规则一般用2型文法;语法分析方法有很多种,根据产生差帆御语法树的方向,可分为自底向上和自顶向下两类。


欢迎分享,转载请注明来源:内存溢出

原文地址:https://54852.com/yw/12316302.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2023-05-22
下一篇2023-05-22

发表评论

登录后才能评论

评论列表(0条)

    保存