
编译原理中的词法分析器的输入是源程序,输出是识别的记号流。
词法分析器编制一个读单词的程序,从输入的源程序中,识别出各个具有独立意义的单词,即基本保留字、标识符、常数、运算符和分隔符五大类。并依次输出各个单词的内部编码及单词符号自身值。(遇到错误时可显示“Error”,然后跳过错误部分继续显示)。
扩展资料
词法分析器的作用:
1、与符号表进行交互,存储和读取符号表中的标识符的信息。
2、读入源程序的输入字符,将他们组成词素,生成并输出一个词法单元序列,每个词法单元序列对应一个于一个词素。
3、过滤掉程序中的注释和空白。
4、将编译器生成的错误消息与源程序的位置联系起。
参考资料来源:
百度百科-词法分析器
我有,这是这学期刚做的,#include <iostream>
#include <fstream>
#include <sstream>
#include <string>
#include <vector>
#include <algorithm>
using namespace std
bool isLetter(char ch){
if ((ch>='A' &&ch<='Z') || (ch>='a' &&ch<='z')) return true
else return false
}
bool isDigit(char ch){
if (ch>='0' &&ch<='9') return true
else return false
}
bool isP(char ch){
if(ch=='+'||ch=='*'||ch=='-'||ch=='/') return true
//ch==':'||ch==','||ch=='='||ch==''||ch=='('||ch==')'
else return false
}
bool isJ(char ch){
if(ch==','||ch==''||ch=='.'||ch=='('||ch==')'||ch=='['||ch==']'||ch=='='||ch==':'||ch=='<'||ch=='>'||ch=='{'||ch=='}'||ch=='#') return true
//
else return false
}
bool isBlank(char ch){
if(ch==' '||ch=='\t') return true
else return false
}
int main(){
string src,ste,s
char ch0,ch,ch1[2]
char ktt[48][20]={"and","begin","const","div","do","else","end","function","if","integer",
"not","or","procedure","program","read","real","then","type","var","while","write","标识符","无符号数",
",","",":",".","(",")","[","]","..","++","--","+","-","*","/","=","<",">","<>","<="
,">=",":=","{","}","#"}
int pos=0
FILE *fp
fp=fopen("d:\\in.txt","r")
ch0=fgetc(fp)
while(ch0!=EOF)
{
//if(ch0!='\t'){src+=ch0}
src+=ch0
ch0=fgetc(fp)
}
src+='#'
cout<<src<<endl
ch=src[pos++]
ste=" "
for(int j=0j<47j++){cout<<j<<ktt[j]<<endl}
cout<<"词法分析:\n"
while(ch!='#')
{
char str[20]
if(ch!='\n')
{
if(isDigit(ch))
{ //判断常数
int i=0
while(isDigit(ch)||ch=='.')
{
str[i++]=ch
//i++
ch=src[pos++]
}
str[i]='\0'
ste=ste+"|"+"22"
cout<<str
continue
}
else if(isLetter(ch))
{ //判断字符
int i=0,j
while(isLetter(ch)||isDigit(ch))
{
str[i++]=ch
//i++
ch=src[pos++]
}
str[i]='\0'
for(j=0j<21j++){ //判断是否关键字
int t=strcmp(str,ktt[j])
if(t==0) {
stringstream ss
ste+="|"
ss<<stess<<j
ss>>ste
break
}
}
if(j==21){ste=ste+"|"+"21"}
// cout<<" "
cout<<str
continue
}
else if(isP(ch)){ ///判断是否运算符
int i=0,j
str[i++]=ch
str[i]='\0'
for(j=34j<38j++){
int t=strcmp(str,ktt[j])
if(t==0) {
stringstream ss
ste+="|"
ss<<stess<<j
ss>>ste
break
}
}
cout<<str
ch=src[pos++]
continue
}
else if(isJ(ch)) //判断是否界符
{
int i=0,j
while(isJ(ch))
{
str[i++]=ch
ch=src[pos++]
}
str[i]='\0'
for(j=23j<47j++){
int t=strcmp(str,ktt[j])
if(t==0) {
stringstream ss
ste+="|"
ss<<stess<<j
ss>>ste
break
}
}
cout<<str
continue
}
else if(isBlank(ch))
{
cout<<ch
ch=src[pos++]
continue
}
}
else{
cout<<ste<<endl
ste=" "
}
ch=src[pos++]
}
return 0
}
还有运行效果图,和实验报告 ,你要的话留下邮箱
任务1:识别小型语言所有单词的词法分析程序设计源程序设计语言 G[<程序>]
<程序>→<变量说明><BEGIN><语句表><END>.
<变量说明>→VAR<变量表>:<类型>;|<空>
<变量表>→<变量表>,<变量>|<变量>
<类型>→INTEGER
<语句表>→<语句>| <语句><语句表>
<语句>→<赋值语句>|<条件语句>|<WHILE语句>|<复合语句>
<赋值语句>→<变量>:=<算术表达式>
<条件语句>→IF<关系表达式>THEN<语句>ELSE<语句>
<WHILE语句>→WHILE<关系表达式>DO<语句>
<复合语句>→BEGIN<语句表>END
<算术表达式>→<项>|<算术表达式>+<项>|<算术表达式>-<项>
<项>→<因式>|<项>*<因式>|<项>/<因式>
<因式>→<变量>|<整数>|(<算术表达式>)
<关系表达式>→<算术表达式><关系符><算术表达式>
<变量>→<标识符>
<标识符>→<标识符><字母>|<标识符><数字>|<字母>
<整数>→0|<非零数字><泛整数>
<泛整数>→<数字>|<数字><泛整数>|ε
<关系符>→<|<=|==|>|>=|<>
<字母>
→A|B|C|D|E|F|G|H|I|J|K|L|M|N|O|P|Q|R|S|T|U|V|W|X|Y|Z
<非零数字>→1|2|3|4|5|6|7|8|9
<数字>→<非零数字>|0
<空>→
要求和提示:
词法分析阶段,可以打开任意位置和名称的源文件进行词法分析,可以进行非法字符和数字后边跟字母的错误判断,如果没有错误则提示“词法分析正确完成!”,并且可以选择输出token.txt(token文件)string.txt(符号表)两个文件;
1.词法分析程序的主要任务如下:
① 组织源程序的输入,识别出源程序中的各个基本语法单位(也称为单词或语法符号),按规则转换成二元式的形式;
② 删除无用的空白字符、回车符、及其它非实质性符号;
③ 删除注解行;
④ 为后面的语法和语义分析提供二元式链表;
单词 编码 单词 编码
标识符 1 <15
正整数 2 <= 16
BEGIN 3 >17
END 4 >= 18
IF 5 <>19
THEN 6 == 20
ELSE 7 ; 21
WHILE 8 . 22
DO 9 := 23
INTEGER 10 , 24
+ 11 ( 25
- 12 ) 26
* 13
/ 14
1) 对标识符的长度控制在8个字符(包括8个)以内,超过的做截断处理;
2) 数字不大于65535,否则报错;
3) 能跳过源程序中的空白格:两个单词之间的任何空格,制表符,回车,换行都是白空格,除了用来分隔单词以外,没有意义;
4) 能跳过注释:
a) 接连出现的/*到下一次接连出现的*/之间的任何文字都是注释(多行);
b) 从某行接连出现的//到该行的结尾的任何文字都是注释(单行)。
3.怎样编写词法分析程序:
1) 预处理:把源文件一个字符一个字符的读入词法分析程序设置的输入字符结构体数组中(输入缓冲区),读入过程要删除注释,删除多余的白空格;
2) 从源程序字符数组中获得单词, 编码为二元式.:
二元式采用结构体数组存储, 把单词类型和词元记录下来。
分解单词的方法:
1) Case多路转换语句根据单词的特点直接编写;
2) 通过描述单词的正规文法得到相应的有穷自动机,通过case多路转换语句完成有穷自动机的处理流程。
3.编写词法分析程序要注意的问题:
1) 检查词法是否有错误
检查是否有非法字符:如 @, &, !
检查标志符和数字是否满足限制条件
检查注释符号是否配对
2) 符分隔单词
能够区分两个单词的符号为界符
有些界符不是单词:如白空格
有些界符仅仅用来分隔:如;
有些界符本身还是源程序不可缺少的单词,如(, ), +, /, 等等
有些界符包含两个字符:如<>, >=等等
3) 输出词法错误
如果有错误,需要报告词法错误的原因。并且要能够越过错误,分解下一个单词,直到源程序结束。
4) 输出的二元式流保存在二元式结构体数组中。
你好,希望采纳!
欢迎分享,转载请注明来源:内存溢出
微信扫一扫
支付宝扫一扫
评论列表(0条)