creattoken.java

来自「该文件为编译器词法分析的代码」· Java 代码 · 共 565 行 · 第 1/2 页
JAVA
565 行
package mycompiler.cifa;
import java.io.*;
import java.awt.*;
import java.util.*;

class TokenType
{ 
    int lineshow;
    String Lex;
    String Sem;
} 

class ChainNodeType  
{
    TokenType  Token=new TokenType();      //单词
    ChainNodeType nextToken=null;          //指向下一个单词的指针
}
/********************************************************************/
/* 类  名 CreatToken	                                            */
/* 功  能 总程序的处理					            */
/* 说  明 建立一个类，处理总程序                                    */
/********************************************************************/
public class CreatToken
{
/* MAXTOKENLEN为单词最大长度定义为40 */
int MAXTOKENLEN=40; 

int l=0;               /* 记录源程序长度 */
int char_num=0;          /* 记录文本行的字节位置 */
int lineno=1;           /* 记录行号，从1开始 */
int Tokennum=0;          /* 记录token个数的变量 */
/* 看单词是否是小写，保留字只能小写，如果有大写则为标识符，is为false */
boolean is=true;
boolean EOF = false;     /* EOF当为文件尾时,值为true */
boolean Error=false;
public String tok=null;

/********************************************************************/
/* 函数名 CreatToken	                                            */
/* 功  能 构造函数					            */
/* 说  明                                                           */
/********************************************************************/
public CreatToken(String s)
{ 
    tok=returnTokenlist(getTokenlist(s));
}

/************************************************************/
/* 函数名 getTokenlist					    */
/* 功  能 取得Token序列函数				    */
/* 说  明 函数从源文件字符串序列中获取所有Token序列 	    */
/*        使用确定性有限自动机DFA,采用直接转向法    	    */
/*        超前读字符,对保留字采用查表方式识别    	    */
/*        产生词法错误时候,仅仅略过产生错误的字符,不加改正  */
/************************************************************/
ChainNodeType getTokenlist(String s)
{ 
    ChainNodeType chainHead=new ChainNodeType(); /*链表的表头*/
    ChainNodeType preNode=chainHead;             /*当前结点的前驱结点*/
    TokenType currentToken=new TokenType();  /*存放当前的Token*/
      

    /*String ss=null;
    int beg=0;
    StringTokenizer fenxi=new StringTokenizer(s,"\n");
    while (fenxi.hasMoreTokens())
    {
	String stok=fenxi.nextToken();
        if (beg==0)
            ss=stok+" "+"\n";
        else            
            ss=ss+stok+" "+"\n"; 
        beg=1;       
    }*/ 
    s=s+" ";
    l=s.length();
    char t[]=s.toCharArray();   

    do 
    {              
        /* tokenStringIndex用于记录当前正在识别单词的词元存储区 
	   tokenString中的当前正在识别字符位置,初始为0          */
        char tokenString[]=new char[MAXTOKENLEN+1];
        int tokenStringIndex = 0;
   
        /* 当前状态标志state,始终都是以START作为开始 */
        String state = "START";

        /* tokenString的存储标志save,决定当前识别字符是否存入tokenString */
        boolean save;

        is=true;

        /* 当前确定性有限自动机DFA状态state不是完成状态DONE */
        while (!(state.equals("DONE")))   
        { 
            /* 从源代码文件中获取下一个字符,送入变量c作为当前字符 */
    	    char c = getNextChar(t);

    	    /* 当前正识别字符的存储标志save初始为TRUE */
            save = true;            

            /* 当EOF为true,到达文件尾,字符存储标志save设置为false,无需存储
               当前识别单词返回值currentToken设置为文件结束单词ENDFILE  */
            if (EOF)
            {
               state = "DONE";
               save = false;
               currentToken.Lex = "ENDFILE";
            }					
            else if (state.equals("START"))
            { 
	        /* 当前DFA状态state为开始状态START,DFA处于当前单词开始位置 */
                /* 当前字符c为数字,当前DFA状态state设置为数字状态INNUM 
	           确定性有限自动机DFA处于数字类型单词中               */
	     	if (isdigit(c))				
                   state = "INNUM";				
   
	        /* 当前字符c为字母,当前DFA状态state设置为标识符状态INID 
		   确定性有限自动机DFA处于标识符类型单词中              */
                else if (isalpha(c))
                   state = "INID";				

	        /* 当前字符c为冒号,当前DFA状态state设置为赋值状态INASSIGN 
		  确定性有限自动机DFA处于赋值类型单词中			*/
                else if (c == ':')
                {
                   state = "INASSIGN";
                   save = false;
                }                   		
  		 
	        /* 当前字符c为.,当前DFA状态state设置为数组下标界限状态*/
	        /* INRANGE，确定性有限自动机DFA处于数组下标界限类型单词中*/                            else if (c == '.')
                {
		   state = "INRANGE";
                   save = false;
                }
	    	 
	        /* 当前字符c为',当前DFA状态state设置为字符标志状态*/
	        /* INCHAR，确定性有限自动机DFA处于字符标志类型单词中*/
	        else if (c == '\'')
	        {  
		    save = false;
		    state = "INCHAR";
	        }
		   
		/* 当前字符c为空白(空格,制表符,换行符),字符存储标志save设置为FALSE 
		   当前字符为分隔符,不需要产生单词,无须存储                     */
                else if ((c == ' ') || (c == '\t') || (c == '\n') || (c == '\r'))
                   save = false;				

		/* 当前字符c为左括号,字符存储标志save设置为false     
		   当前DFA状态state设置为注释状态INCOMMENT			  	
		   确定性有限自动机DFA处于注释中,不生成单词,无需存储 */
                else if (c == '{')
		{ 
		    save = false;
                    state = "INCOMMENT";			
		}

	        /* 当前字符c为其它字符,当前DFA状态state设置为完成状态DONE 
	           确定性有限自动机DFA处于单词的结束位置,需进一步分类处理 */
                else
                { 
		    state = "DONE";
                    save = false;			
                    switch (c)
		    {
		            /* 当前字符c为"=",当前识别单词返回值currentToken设置为
                           	等号单词EQ */
                            case '=':
                                currentToken.Lex = "EQ";
                                break;

			    /* 当前字符c为"<",当前识别单词返回值currentToken设置为
                               小于单词LT */
                            case '<':
                                currentToken.Lex = "LT";
                                break;

                            /* 当前字符c为"+",当前识别单词返回值currentToken设置为
                               加号单词PLUS */
                            case '+':
                                currentToken.Lex = "PLUS";
                                break;

                            /* 当前字符c为"-",当前识别单词返回值currentToken设置为
                               减号单词MINUS */
                            case '-':
                                currentToken.Lex = "MINUS";
                                break;

                            /* 当前字符c为"*",当前识别单词返回值currentToken设置为
                               乘号单词TIMES */
                            case '*':
                                currentToken.Lex = "TIMES";
                                break;
   
                            /* 当前字符c为"/",当前识别单词返回值currentToken设置为
                               除号单词OVER */
                            case '/':
                                currentToken.Lex = "OVER";
                                break;
  
                            /* 当前字符c为"(",当前识别单词返回值currentToken设置为
                               左括号单词LPAREN */
                            case '(':
                                currentToken.Lex = "LPAREN";
                                break;

                            /* 当前字符c为")",当前识别单词返回值currentToken设置为
                               右括号单词RPAREN */
                            case ')':
                                currentToken.Lex = "RPAREN";
                                break;

			    /* 当前字符c为";",当前识别单词返回值currentToken设置为
                                分号单词SEMI */
                            case ';':
                                currentToken.Lex = "SEMI";
                                break;
                            /* 当前字符c为",",当前识别单词返回值currentToken设置为
                               逗号单词COMMA */
 			    case ',':
			        currentToken.Lex = "COMMA";
                                break;     		 
                            /* 当前字符c为"[",当前识别单词返回值currentToken设置为
                               左中括号单词LMIDPAREN */
		            case '[':
			        currentToken.Lex = "LMIDPAREN";
			        break;
    		 
                            /* 当前字符c为"]",当前识别单词返回值currentToken设置为
                               右中括号单词RMIDPAREN */
			    case ']':
			        currentToken.Lex = "RMIDPAREN";
			        break;
    
                            /* 当前字符c为其它字符,当前识别单词返回值currentToken
                               设置为错误单词ERROR */
                            default:
                                currentToken.Lex = "ERROR";
		                Error = true;
                                break;
                    }                 
                }
            }   						
	    /********** 当前状态不为开始状态START的处理结束 **********/

	    /* 当前DFA状态state为注释状态INCOMMENT,DFA处于注释位置 */
            else if(state.equals("INCOMMENT")) 
            {    
                /* 当前字符存储状态save设置为FALSE,注释中内容不生成单词,无需存储 */
                save = false;				

		/* 当前字符c为"}",注释结束.当前DFA状态state设置为开始状态START */
                if (c == '}') 
                    state = "START";
            }

	    /* 当前DFA状态state为赋值状态INASSIGN,
               确定性有限自动机DFA处于赋值单词位置 */
            else if(state.equals("INASSIGN"))				
            {
                /* 当前DFA状态state设置为完成状态DONE,赋值单词结束 */
                state = "DONE";
                save = false;				

	        /* 当前字符c为"=",当前识别单词返回值currentToken设置为
                   赋值单词ASSIGN */
		if (c == '=')
                    currentToken.Lex = "ASSIGN";

		/* 当前字符c为其它字符,即":"后不是"=",在输入行缓冲区中回退一个字符                        字符存储状态save设置为FALSE,当前识别单词返回值currentToken设置为                       ERROR */
                else
                { 
                    ungetNextChar();
                    currentToken.Lex = "ERROR";
		    Error = true;
                }         
            }
            /* 当前DFA状态state设置为数组下标界限状态INRANGE,
               确定性有限自动机DFA处于数组下标界限类型单词中 */
creattoken.java - 源码说明

本页面展示了「该文件为编译器词法分析的代码」中的 creattoken.java 源码文件，采用 Java 编程语言编写，共 565 行代码。您可以在线阅读完整代码内容，也可以返回资源详情页下载完整源码包进行本地学习和开发。
虫虫下载站收录了大量与编译器相关的技术资源，包括源代码、技术文档、电路图等，是电子工程师和嵌入式开发者的专业学习平台。
⌨️ 快捷键说明

复制代码Ctrl + C
搜索代码Ctrl + F
全屏模式F11
增大字号Ctrl + =
减小字号Ctrl + -
显示快捷键?