nutchexample.java

来自「LuceneInAction配套源码,LuceneInAction是对lucen」· Java 代码 · 共 74 行

JAVA

74 行

package lia.analysis.nutch;import net.nutch.analysis.NutchDocumentAnalyzer;import net.nutch.searcher.QueryTranslator;import org.apache.lucene.analysis.Analyzer;import org.apache.lucene.analysis.Token;import org.apache.lucene.analysis.TokenStream;import org.apache.lucene.search.Query;import java.io.IOException;import java.io.StringReader;import java.util.ArrayList;public class NutchExample {  public static void main(String[] args) throws IOException {    NutchDocumentAnalyzer analyzer = new NutchDocumentAnalyzer();    displayTokensWithDetails(analyzer, "The quick brown fox...");    net.nutch.searcher.Query nutchQuery =        net.nutch.searcher.Query.parse("\"the quick brown\"");    Query query = QueryTranslator.translate(nutchQuery);    System.out.println("query = " + query);  }  /**   * Copy of AnalyzerUtils.displayTokensWithPositions, except   * uses the "content" field instead of "contents".  Nutch   * demands "content".   */  private static void displayTokensWithDetails(Analyzer analyzer,                                 String text) throws IOException {    Token[] tokens = tokensFromAnalysis(analyzer, text);    int position = 0;    for (int i = 0; i < tokens.length; i++) {      Token token = tokens[i];      int increment = token.getPositionIncrement();      if (increment > 0) {        position = position + increment;        System.out.println();        System.out.print(position + ": ");      }      System.out.print("[" + token.termText() +          ":" + token.type() + "] ");    }    System.out.println();  }  /**   * Copy of AnalyzerUtils.tokensFromAnalysis, except   * uses the "content" field instead of "contents".  Nutch   * demands "content".   */  private static Token[] tokensFromAnalysis(Analyzer analyzer,                               String text) throws IOException {    TokenStream stream =        analyzer.tokenStream("content", new StringReader(text));    ArrayList tokenList = new ArrayList();    while (true) {      Token token = stream.next();      if (token == null) break;      tokenList.add(token);    }    return (Token[]) tokenList.toArray(new Token[0]);  }}

nutchexample.java - 源码说明

本页面展示了「LuceneInAction配套源码,LuceneInAction是对lucene api的详细讲解及具体应用.此源码即应用例子」中的 nutchexample.java 源码文件，采用 Java 编程语言编写，共 74 行代码。您可以在线阅读完整代码内容，也可以返回资源详情页下载完整源码包进行本地学习和开发。

虫虫下载站收录了大量与LuceneInAction相关的技术资源，包括源代码、技术文档、电路图等，是电子工程师和嵌入式开发者的专业学习平台。

⌨️ 快捷键说明

复制代码Ctrl + C

搜索代码Ctrl + F

全屏模式F11

增大字号Ctrl + =

减小字号Ctrl + -

显示快捷键?