首页 › 资源下载 › Jsp/Servlet › 一个jsp写的bbs › 源码查看

cwordtokenizer.java

来自「一个jsp写的bbs」· Java 代码 · 共 80 行

JAVA

80 行

package org.apache.lucene.analysis.cw;

import java.io.Reader;
import org.apache.lucene.analysis.*;
import org.apache.lucene.analysis.Token;
import org.apache.lucene.analysis.standard.ParseException;
import org.apache.lucene.analysis.standard.StandardTokenizer;
import java.lang.*;
import java.io.*;
import java.util.*;
import java.util.logging.*;

/**
 * Title: CWordTokenizer
 * Description: 
 * Company:
 *
 * @author 
 * @version 1.0
 *
 */

public final class CWordTokenizer extends Tokenizer {
    public static segmenter mainsegmenter;
    private static Logger logger = Logger.getLogger(CWordTokenizer.class.getName());
    public TokenStream tokenizer;
    
    private Reader input;
    
    public CWordTokenizer(Reader in) {
        try{
            logger.info("Initializing sementer ... ");
            mainsegmenter = SegmenterUtils.getSegmenter("zword.obj");
            logger.info("sementer initialized. ");
        }catch(Exception e){
            logger.warning("Failed loading segmenter!");
        }

        
        if (mainsegmenter != null){
            BufferedReader bin = new BufferedReader(in);
            StringBuffer buffer = new StringBuffer();
            String dataline;
            String processed;
            logger.info("reading src inputstream ");
            try{
                while ((dataline = bin.readLine()) != null){
                    processed = mainsegmenter.segmentLine(dataline, " ");
                    logger.info("process line: " + dataline);
                    logger.info("processed line: " + processed);
                    buffer.append(processed + "\n");
                }
    
            }catch(IOException ioe){
                // ignored
            }finally{
                try{
                    bin.close();
                    in.close();
                }catch(Exception e){}
            }
            
            logger.info("create StandardAnalyzer and pass the job to it ");
            input = new StringReader(buffer.toString());
        }else{
             logger.warning("work w/o segmenter ");
             input = in;
        }
        tokenizer = new CStandardTokenizer(input);
    }
    
    public final void close() throws IOException{
        tokenizer.close();
    }

    public final Token next() throws IOException {
        return tokenizer.next();
    }
}

cwordtokenizer.java - 源码说明

本页面展示了「一个jsp写的bbs」中的 cwordtokenizer.java 源码文件，采用 Java 编程语言编写，共 80 行代码。您可以在线阅读完整代码内容，也可以返回资源详情页下载完整源码包进行本地学习和开发。

虫虫下载站收录了大量与jsp相关的技术资源，包括源代码、技术文档、电路图等，是电子工程师和嵌入式开发者的专业学习平台。

⌨️ 快捷键说明

复制代码Ctrl + C

搜索代码Ctrl + F

全屏模式F11

增大字号Ctrl + =

减小字号Ctrl + -

显示快捷键?