📄 233.cpp

📁 学习编译原理的实用教程.教程共分7章: 第1章编译系统概述第2章词法分析第3章程序设计语言的语法描述第4章自上而下的语法分析第5章自下而上的语法分析第6章语法制导翻译
💻 CPP
字号:
//2.3.3 扫描器控制程序的实现
#include <iostream.h>
#include <fstream.h>
#include <string.h>
#include <stdlib.h>
#include <conio.h>
const short WORDLEN=20;
struct code_val{
	char code;char val[WORDLEN];
};
//单词编码表
const char *table[]={"begin","end","integer","real","=","+","++","*",",",";","(",")","#"};
const char code[]="{}ac=+$*,;()#";
//DFA列字符
const char COL_CHAR[]="a0=+*,;()# ";
//状态转换矩阵（DFA）
const int DFA[][11]={//strlen("a0=+*,;()# ")=11
	{1,2,3,4,5,6,7,8,9,10,0},
	{11,11},
	{0,12},
	{0},
	{0,0,0,13},
	{0},
	{0},
	{0},
	{0},
	{0},
	{0},
	{11,11},
	{0,12},
	{0}
};
//预处理函数原型
void pro_process(char *);
//扫描函数原型
code_val scanner(char *);
//主函数
void main()
{
	char buf[4048]={'\0'};//扫描缓冲区
//预处理
	pro_process(buf);
//显示buf
	cout<<buf<<endl;
//单词识别
	ofstream coutf("Lex_r.txt",ios::out);
	code_val t;//临时变量
	do{
		t=scanner(buf);//调用一次扫描器获得一个单词二元式
		cout<<t.code<<'\t'<<t.val<<endl;//在屏幕显示单词二元式
 		coutf<<t.code<<'\t'<<t.val<<endl;//将单词二元式输出至文件
	}while(t.code!='#');
	cout<<"End of lexical analysis!"<<endl;
	getch();
}
int col(char);//转换函数
void concat(char [],char);//拼接函数原型
char search_table(char[]);//查单词二元式编码表函数
struct code_val scanner(char *buf)//扫描函数，每调用一次，返回一个单词的二元式。
{
	static int i=0;//buf指针
	struct code_val t={'\0',"NUL"};//临时变量
	char token[WORDLEN]="";//用于拼接单词
//去除前导空格
	while(buf[i]==' ')i++;
//开始识别单词
	int cur_state=0;
	while(DFA[cur_state][col(buf[i])]){//存在后继状态
		concat(token,buf[i]);//拼接
		cur_state=DFA[cur_state][col(buf[i])];//进入下一状态
		if(buf[++i]=='\0')break;//指向下一字符，判缓冲区内字符是否处理完。
	}
//判断当前状态是否是终态，若为非终态报错，终止程序运行。在本例中不存在此情况，故略。
	t.code=search_table(token);//查单词二元式编码表
	if(t.code=='?'){
		if(token[0]>='a'&&token[0]<='z')
			t.code='i';
		else
			t.code='x';
		strcpy(t.val,token);
	}
	return t;//返回当前单词的二元式
}
//转换函数
int col(char c)
{
	if(c>='a'&&c<='z')c='a';
	if(c>='0'&&c<='9')c='0';
//	const char COL_CHAR[]="a0=+*,;()# ";
	for(int i=0;i<=(int)strlen(COL_CHAR);i++)
		if(c==COL_CHAR[i])return i;
	cout<<"Error char>"<<c<<endl;exit(0); //程序终止运行	
}
//拼接函数，原token="BEG", buf[i++]='I', 调用后token="BEGI"。
void concat(char token[],char c)
{
	for(int i=0;token[i];i++);
	token[i]=c;
	token[++i]='\0';
}
char search_table(char token[])//根据token内容查单词二元式编码表，返回单词种别。
{
//	const char *table[]={
//		"begin","end","integer","real","=","+","++","*",",",";","(",")","#"
//	};
//	const char code[]="{}ac=+$*,;()#";
		for(int i=0;i<(int)strlen(code);i++)
			if(strcmp(token,table[i])==0) return code[i];
		return '?';	//'?'表示查表无果
}
//预处理函数
void pro_process(char *buf)
{
	ifstream cinf("source.txt",ios::in);
	int i=0;char old_c='\0',cur_c;//计数器，前一个字符，当前字符。
	bool in_comment=false;//状态标志，false表示当前字符未处于注释中。
	while(cinf.read(&cur_c,sizeof(char))){//从文件读一个字符
		switch(in_comment){
		case false:
			if(old_c=='/' && cur_c=='*'){//进入注释
				i--;//去除已存入扫描缓冲区的字符'/'
				in_comment=true;
			}
			else {
				if(old_c=='\\' && cur_c=='\n') //去除续行符'\'，包括后续换行符。
					i--;//去除已存入扫描缓冲区的字符'\'
				else {
					if(cur_c>='A' && cur_c<='Z') cur_c+=32;
					if(cur_c=='\t' || cur_c=='\n') cur_c=' ';//空格
					buf[i++]=cur_c ;
				}
			}
			break;
		case true:
			if(old_c=='*' && cur_c=='/')//离开注释
				in_comment=false;
		}//end of switch
		old_c= cur_c;//保留前一个字符
	}//end of while
	buf[i]='#';
}
⌨️ 快捷键说明

复制代码 Ctrl + C
搜索代码 Ctrl + F
全屏模式 F11
切换主题 Ctrl + Shift + D
显示快捷键 ?
增大字号 Ctrl + =
减小字号 Ctrl + -