scan.cpp

来自「上课时老师用过的SNL编译器」· C++ 代码 · 共 718 行 · 第 1/2 页
CPP
718 行
	  return;
   }
   
   ChainNodeType *chainHead;    /*链表的表头指针*/
  
   ChainNodeType *currentNode;  /*指向处理当前Token的当前结点*/
   
   ChainNodeType *preNode;      /*指向当前结点的前驱结点*/
   
   ChainNodeType *p1;           /*临时指针，用于释放链表部分*/
   
   TokenType currentToken;      /*存放当前的Token*/

/*产生链表的第一个结点*/   
 chainHead=preNode=currentNode=(ChainNodeType *)malloc(CHAINNODELEN);

/*初始化当前结点中，指向下一个结点的指针为空*/
 currentNode->nextToken=NULL;
do 
{  /* tokenStringIndex用于记录当前正在识别单词的词元存储区 *
	* tokenString中的当前正在识别字符位置,初始为0          */
   int tokenStringIndex = 0;
   
   /* 当前状态标志state,始终都是以START作为开始 */
   StateType state = START;

   /* tokenString的存储标志save,整数类型						*
    * 决定当前识别字符是否存入当前识别单词词元存储区tokenString */
   int save;

   /* 当前确定性有限自动机DFA状态state不是完成状态DONE */
   while (state != DONE)
   
   { 
     /* 从源代码文件中获取下一个字符,送入变量c作为当前字符 */
	   int c = getNextChar();

	 /* 当前正识别字符的存储标志save初始为TRUE */
     save = TRUE;					

     switch (state)
     { 
	   /* 当前DFA状态state为开始状态START,DFA处于当前单词开始位置 */
       case START:

    	 /* 当前字符c为数字,当前DFA状态state设置为数字状态INNUM *
	      * 确定性有限自动机DFA处于数字类型单词中               */
		 if (isdigit(c))				
           state = INNUM;				

		 /* 当前字符c为字母,当前DFA状态state设置为标识符状态INID *
		  * 确定性有限自动机DFA处于标识符类型单词中              */
         else if (isalpha(c))
           state = INID;				

		 /* 当前字符c为冒号,当前DFA状态state设置为赋值状态INASSIGN *
		  * 确定性有限自动机DFA处于赋值类型单词中				   */
         else if (c == ':')
           state = INASSIGN;		
  		 
		 /* 当前字符c为.,当前DFA状态state设置为数组下标界限状态*/
		 /* INRANGE，确定性有限自动机DFA处于数组下标界限类型单词中*/                         
		 else if (c == '.')
		   state = INRANGE;

		 else if (c == '\'')
		     { save = FALSE;
		       state = INCHAR; }
		   
		   /* 当前字符c为空白(空格,制表符,换行符),字符存储标志save设置为FALSE *
		  * 当前字符为分隔符,不需要产生单词,无须存储                        */
         else if ((c == ' ') || (c == '\t') || (c == '\n'))
           save = FALSE;				

		 /* 当前字符c为左括号,字符存储标志save设置为FALSE     *
		  * 当前DFA状态state设置为注释状态INCOMMENT			  *	
		  * 确定性有限自动机DFA处于注释中,不生成单词,无需存储 */
         else if (c == '{')
         { save = FALSE;
           state = INCOMMENT;			
         }

	     /* 当前字符c为其它字符,当前DFA状态state设置为完成状态DONE *
	      * 确定性有限自动机DFA处于单词的结束位置,需进一步分类处理 */
         else

         { state = DONE;				
           switch (c)
           {
			 /* 当前字符c为EOF,字符存储标志save设置为FALSE,无需存储     *
			  * 当前识别单词返回值currentToken设置为文件结束单词ENDFILE */
		     case EOF:
               save = FALSE;
               currentToken.Lex = ENDFILE1;
               break;					

			 /* 当前字符c为"=",当前识别单词返回值currentToken设置为等号单词EQ */
             case '=':
               currentToken.Lex = EQ;
               break;

			 /* 当前字符c为"<",当前识别单词返回值currentToken设置为小于单词LT */
             case '<':
               currentToken.Lex = LT;
               break;

			 /* 当前字符c为"+",当前识别单词返回值currentToken设置为加号单词PLUS */
             case '+':
               currentToken.Lex = PLUS;
               break;

			 /* 当前字符c为"-",当前识别单词返回值currentToken设置为减号单词MINUS */
             case '-':
               currentToken.Lex = MINUS;
               break;

			 /* 当前字符c为"*",当前识别单词返回值currentToken设置为乘号单词TIMES */
             case '*':
               currentToken.Lex = TIMES;
               break;

			 /* 当前字符c为"/",当前识别单词返回值currentToken设置为除号单词OVER */
             case '/':
               currentToken.Lex = OVER;
               break;

			 /* 当前字符c为"(",当前识别单词返回值currentToken设置为左括号单词LPAREN */
             case '(':
               currentToken.Lex = LPAREN;
               break;

			 /* 当前字符c为")",当前识别单词返回值currentToken设置为右括号单词RPAREN */
             case ')':
               currentToken.Lex = RPAREN;
               break;

			 /* 当前字符c为";",当前识别单词返回值currentToken设置为分号单词SEMI */
             case ';':
               currentToken.Lex = SEMI;
               break;
   	    	 /* 当前字符c为",",当前识别单词返回值currentToken设置为逗号单词COMMA */
 			 case ',':
			   currentToken.Lex = COMMA;
               break;     		 
		     /* 当前字符c为"[",当前识别单词返回值currentToken设置为左中括号单词LMIDPAREN */
			 case '[':
			   currentToken.Lex = LMIDPAREN;
			   break;
    		 
			 /* 当前字符c为"]",当前识别单词返回值currentToken设置为右中括号单词RMIDPAREN */
			 case ']':
			   currentToken.Lex = RMIDPAREN;
			   break;
    
			 /* 当前字符c为其它字符,当前识别单词返回值currentToken设置为错误单词ERROR1 */
             default:
               currentToken.Lex = ERROR1;
               Error = true;
			   break;
           }
         }
         break;						
	   /********** 当前状态为开始状态START的处理结束 **********/

	   /* 当前DFA状态state为注释状态INCOMMENT,确定性有限自动机DFA处于注释位置 */
       case INCOMMENT:

		 /* 当前字符存储状态save设置为FALSE,注释中内容不生成单词,无需存储 */
         save = FALSE;				

		 /* 当前字符c为EOF,当前DFA状态state设置为完成状态DONE,当前单词识别结束 *
		  * 当前识别单词返回值currentToken设置为文件结束单词ENDFILE            */
         if (c == EOF)			
         { state = DONE;
           currentToken.Lex = ENDFILE1;

         }

		 /* 当前字符c为"}",注释结束.当前DFA状态state设置为开始状态START */
         else if (c == '}') state = START;
         break;

	   /* 当前DFA状态state为赋值状态INASSIGN,确定性有限自动机DFA处于赋值单词位置 */
       case INASSIGN:				

		 /* 当前DFA状态state设置为完成状态DONE,赋值单词结束 */
         state = DONE;				

		 /* 当前字符c为"=",当前识别单词返回值currentToken设置为赋值单词ASSIGN */
		 if (c == '=')
           currentToken.Lex = ASSIGN;

		 /* 当前字符c为其它字符,即":"后不是"=",在输入行缓冲区中回退一个字符       *
		  * 字符存储状态save设置为FALSE,当前识别单词返回值currentToken设置为ERROR1 */
         else
         { 
           ungetNextChar();
           save = FALSE;
           currentToken.Lex = COLON;
         }
         break;
        
	   case INRANGE:				

		 /* 当前DFA状态state设置为完成状态DONE,赋值单词结束 */
         state = DONE;				

		 /* 当前字符c为".",当前识别单词返回值currentToken设置为下标界UNDERANGE */
		 if (c == '.')
           currentToken.Lex = UNDERANGE;

		 /* 当前字符c为其它字符,即"."后不是".",在输入行缓冲区中回退一个字符       *
		  * 字符存储状态save设置为FALSE,当前识别单词返回值currentToken设置为ERROR1 */
         else
         { 
           ungetNextChar();
           save = FALSE;
           currentToken.Lex = DOT;
         }
         break;
 
	   /* 当前DFA状态state为数字状态INNUM,确定性有限自动机处于数字单词位置 */
    case INNUM:					

		 /* 当前字符c不是数字,则在输入行缓冲区源中回退一个字符					*
		  * 字符存储标志设置为FALSE,当前DFA状态state设置为DONE,数字单词识别完成 *
		  * 当前识别单词返回值currentToken设置为数字单词NUM                     */
         if (!isdigit(c))
         { 
           ungetNextChar();
           save = FALSE;
           state = DONE;
           currentToken.Lex = INTC;
         }
         break;
  case INCHAR:					

         if (isalnum(c))
        
		 { int c1=getNextChar();
            if (c1 =='\'')
			{ save = TRUE;
			   state = DONE;
			  currentToken.Lex = CHARC;
			}
		    else 
			{	ungetNextChar();
                ungetNextChar();
			    //save = TRUE;
                state = DONE;
                currentToken.Lex = ERROR1;
				Error = true;
			}
		 }
		 else
		 {      ungetNextChar();
			    //save = TRUE;
                state = DONE;
                currentToken.Lex = ERROR1;
				Error = true;
			}
		 break;
   /* 当前DFA状态state为标识符状态INID,确定性有限自动机DFA处于标识符单词位置 */
       case INID:					

		 /* 当前字符c不是字母,则在输入行缓冲区源中回退一个字符		 			  *
		  * 字符存储标志设置为FALSE,当前DFA状态state设置为DONE,标识符单词识别完成 *
		  * 当前识别单词返回值currentToken设置为标识符单词ID                      */
         if (!isalnum(c))
         { 
           ungetNextChar();
           save = FALSE;
           state = DONE;
           currentToken.Lex = ID;
         }
         break;

	   /* 当前DFA状态state为完成状态DONE,确定性有限自动机DFA处于单词结束位置 */
       case DONE:	break;	

	   /* 当前DFA状态state为其它状态,此种情况不应发生 */
       default: 

		 /* 将词法扫描器产生错误的状态state写入列表文件listing	*
		  * 当前DFA状态state设置为完成状态DONE					*
		  * 当前识别单词返回值currentToken设置为错误单词ERROR1	*/
         fprintf(listing,"Scanner Bug: state= %d\n",state);
         state = DONE;
         currentToken.Lex = ERROR1;
		 Error = true;
         break;

     }
	 /*************** 分类判断处理结束 *******************/

	 /* 当前字符存储状态save为TRUE,且当前正识别单词已经识别部分未超过单词最大长度 *
	  * 将当前字符c写入当前正识别单词词元存储区tokenString						  */
     if ((save) && (tokenStringIndex <= MAXTOKENLEN))
       tokenString[tokenStringIndex++] = (char) c;

	 if (state == DONE)
     {
	   /* 当前DFA状态state为完成状态DONE,单词识别完成   *
	    * 当前识别单词词元存储区tokenString加上结束标志 */
	   tokenString[tokenStringIndex] = '\0';

	   /* 当前单词currentToken为标识符单词类型,查看其是否为保留字单词 */
    if (currentToken.Lex == ID)
	  { currentToken.Lex =  reservedLookup(tokenString);
		// if (currentToken.Lex != ID)
		//	 strcpy(tokenString," ");
      }
     }
   }
   /**************** 循环处理结束 ********************/
   /*将行号信息存入Token*/
   currentToken.lineshow = lineno;
   /*将单词的语义信息存入Token*/
   strcpy(currentToken.Sem , tokenString); 

  /*将已处理完的当前Token存入链表的Token部分*/
    (currentNode->Token).lineshow=currentToken.lineshow;
   	(currentNode->Token).Lex=currentToken.Lex;
	strcpy((currentNode->Token).Sem,currentToken.Sem);
 
     Tokennum++;   /*Token总数目加1*/
  
     /*若不是第一个结点，则将当前结点连入链表*/ 
	 if (preNode!=currentNode)
	    {  preNode->nextToken=currentNode;
           preNode=currentNode;
	    }   
   /*申请一个新的结点，以记录下一个Token的信息*/
	 currentNode=(ChainNodeType *)malloc(CHAINNODELEN);
   /*初始化这个结点中，指向下一个结点的指针为空*/ 
	 currentNode->nextToken=NULL;
 }
/* 直到处理完表示文件结束的Token:ENDFILE，说明处理完所有的Token*/
/* 并存入了链表中，循环结束*/
 while ((currentToken.Lex)!=ENDFILE1); 

/*将由chainHead指向的Token链表存入文件"Tokenlist"中*/
  ChainToFile(chainHead);   

/*释放链表*/
while (chainHead!=NULL)
{ p1=chainHead->nextToken;
  free(chainHead);  
  chainHead=p1; 
}

//关闭读入的源文件：
fclose(source);

/* 词法分析函数结束 */


}
scan.cpp - 源码说明

本页面展示了「上课时老师用过的SNL编译器」中的 scan.cpp 源码文件，采用 C++ 编程语言编写，共 718 行代码。您可以在线阅读完整代码内容，也可以返回资源详情页下载完整源码包进行本地学习和开发。
虫虫下载站收录了大量与SNL相关的技术资源，包括源代码、技术文档、电路图等，是电子工程师和嵌入式开发者的专业学习平台。
⌨️ 快捷键说明

复制代码Ctrl + C
搜索代码Ctrl + F
全屏模式F11
增大字号Ctrl + =
减小字号Ctrl + -
显示快捷键?