scanner.java

来自「完成编译器的基本功能,并且有界面,简单好用」· Java 代码 · 共 268 行
JAVA
268 行
package compiler.pl0;

import java.io.BufferedReader;
import java.io.IOException;

/**
 *　　词法分析器负责的工作是从源代码里面读取文法符号，这是PL/0编译器的主要组成部分之一。
 */

public class Scanner {
      /**
       * 刚刚读入的字符
       */
      private char ch = ' ';

      String ss = "";

      Err err = new Err();

      public int isArray = 0;
      /**
       * 当前读入的行
       */
      private char[] line;

      /**
       * 当前行的长度（line length）
       */
      public int ll = 0;

      /**
       * 当前字符在当前行中的位置（character counter）
       */
      public int cc = 0;

      /**
       * 当前读入的符号
       */
      public Symbol sym;

      /**
       * 保留字列表（注意保留字的存放顺序）
       */
      private String[] word;

      /**
       * 保留字对应的符号值
       */
      private Symbol[] wsym;

      /**
       * 单字符的符号值
       */
      private Symbol[] ssym;

      // 输入流
      private BufferedReader in;

      /**
       * 标识符名字（如果当前符号是标识符的话）
       * @see Parser
       * @see Table#enter
       */
      public String id;

      /**
       * 数值大小（如果当前符号是数字的话）
       * @see Parser
       * @see Table#enter
       */
      public int num;

      /**
       * 初始化词法分析器
       * @param input PL/0 源文件输入流
       */
      public Scanner(BufferedReader input) {
            in = input;

            // 设置单字符符号
            ssym = new Symbol[256];
            java.util.Arrays.fill(ssym, Symbol.nul);
            ssym['+'] = Symbol.plus;
            ssym['-'] = Symbol.minus;
            ssym['*'] = Symbol.times;
            ssym['/'] = Symbol.slash;
            ssym['('] = Symbol.lparen;
            ssym[')'] = Symbol.rparen;
            ssym['='] = Symbol.eql;
            ssym[','] = Symbol.comma;
            ssym['.'] = Symbol.period;
            ssym['#'] = Symbol.neq;
            ssym[';'] = Symbol.semicolon;

            // 设置保留字名字,按照字母顺序，便于折半查找
            word = new String[] {
                "begin", "call", "const", "do", "else", "end", "if",
                "odd", "procedure", "read", "then", "var", "while", "write"};

            // 设置保留字符号
            wsym = new Symbol[PL0.norw];
            wsym[0] = Symbol.beginsym;
            wsym[1] = Symbol.callsym;
            wsym[2] = Symbol.constsym;
            wsym[3] = Symbol.dosym;
            wsym[4] = Symbol.elsesym;
            wsym[5] = Symbol.endsym;
            wsym[6] = Symbol.ifsym;
            wsym[7] = Symbol.oddsym;
            wsym[8] = Symbol.procsym;
            wsym[9] = Symbol.readsym;
            wsym[11] = Symbol.varsym;
            wsym[10] = Symbol.thensym;
            wsym[12] = Symbol.whilesym;
            wsym[13] = Symbol.writesym;
      }

      /**
       * 读取一个字符，为减少磁盘I/O次数，每次读取一行
       */
      void getch() {
            String l = "";
            try {
                  if (cc == ll) {
                        while (l.equals("")) {
                              l = in.readLine().toLowerCase() + "\n";
                        }
                        ll = l.length();
                        cc = 0;
                        line = l.toCharArray();
                        System.out.println(PL0.interp.cx + " " + l); //NN interp.cx
                        PL0.fa1.println(PL0.interp.cx + " " + l);//cx:虚拟机代码指针
                  }
            }
            catch (IOException e) {
                  throw new Error("program imcomplete");
            }
            ch = line[cc];
            cc++;
      }

      /**
       * 词法分析，获取一个词法符号，是词法分析器的重点
       */
      public void getsym() {
            // Wirth 的 PL/0 编译器使用一系列的if...else...来处理
            // 但是你的助教认为下面的写法能够更加清楚地看出这个函数的处理逻辑
            while (Character.isWhitespace(ch)) { // 跳过所有空白字符
                  getch();
            }
            if (ch >= 'a' && ch <= 'z') {
                  // 关键字或者一般标识符
                  matchKeywordOrIdentifier();
            }
            else if (ch >= '0' && ch <= '9') {
                  // 数字
                  matchNumber();
            }
            else {
                  // 操作符
                  matchOperator();
            }

      }

      /**
       * 分析关键字或者一般标识符
       */
      void matchKeywordOrIdentifier() {
            int i;
            StringBuilder sb = new StringBuilder(PL0.al); //NN StringBuilder
            // 首先把整个单词读出来
            do {
                  sb.append(ch);
                  getch();
            }
            while (ch >= 'a' && ch <= 'z' || ch >= '0' && ch <= '9');
            id = sb.toString();

            // 然后搜索是不是保留字
            i = java.util.Arrays.binarySearch(word, id);

            // 最后形成符号信息
            if (i < 0) {
                  // 一般标识符
                  sym = Symbol.ident;
                  if (ch == '(') {
                        isArray = 1;
                  }
            }
            else {
                  // 关键字
                  sym = wsym[i];
            }
      }

      /**
       * 分析数字
       */
      void matchNumber() {
            int k = 0;
            sym = Symbol.number;
            num = 0;
            do {
                  num = 10 * num + Character.digit(ch, 10);
                  k++;
                  getch();
            }
            while (ch >= '0' && ch <= '9'); // 获取数字的值
            k--;
            if (k > PL0.nmax) {
                  String ss1 = err.report(30);//数字位数越界
                  ss = ss + ss1 + "\n";
                  //System.out.println(ss);
            }
      }

      /**
       * 分析操作符
       */
      void matchOperator() {
            // 请注意这里的写法跟Wirth的有点不同
            switch (ch) {
                  case ':': // 赋值符号
                        getch();
                        if (ch == '=') {
                              sym = Symbol.becomes;
                              getch();
                        }
                        else {
                              // 不能识别的符号
                              sym = Symbol.nul;
                        }
                        break;
                  case '<': // 小于或者小于等于
                        getch();
                        if (ch == '=') {
                              sym = Symbol.leq;
                              getch();
                        }
                        else {
                              sym = Symbol.lss;
                        }
                        break;
                  case '>': // 大于或者大于等于
                        getch();
                        if (ch == '=') {
                              sym = Symbol.geq;
                              getch();
                        }
                        else {
                              sym = Symbol.gtr;
                        }
                        break;
                  default: // 其他为单字符操作符（如果符号非法则返回nil）
                        sym = ssym[ch];
                        if (sym != Symbol.period) {
                              getch();
                        }
                        break;
            }
      }

      public String ret() {
            return ss;
      }
}
scanner.java - 源码说明

本页面展示了「完成编译器的基本功能,并且有界面,简单好用」中的 scanner.java 源码文件，采用 Java 编程语言编写，共 268 行代码。您可以在线阅读完整代码内容，也可以返回资源详情页下载完整源码包进行本地学习和开发。
虫虫开发者社区收录了大量与编译器相关的技术资源，包括源代码、技术文档、电路图等，是电子工程师和嵌入式开发者的专业学习平台。
⌨️ 快捷键说明

复制代码Ctrl + C
搜索代码Ctrl + F
全屏模式F11
增大字号Ctrl + =
减小字号Ctrl + -
显示快捷键?