lucenepptdocument.java

来自「lucene环境下ppt转txt的源代码,这个代码应该对搜索引擎有一定作用」· Java 代码 · 共 60 行

JAVA

60 行

/* * To change this template, choose Tools | Templates * and open the template in the editor. */package lucenesearch;import java.io.*;import org.apache.lucene.document.Document;import org.apache.lucene.document.Field;import org.apache.poi.hslf.HSLFSlideShow;import org.apache.poi.hslf.model.TextRun;import org.apache.poi.hslf.model.Slide;import org.apache.poi.hslf.usermodel.SlideShow;/** * * @author BileiZhu */public class LucenePPTDocument {    public static Document getDocument(File doc) {        String docPath = doc.getAbsolutePath();        String title = doc.getName();        FileInputStream inputStream = null;        Reader contents = null;        Document document = new Document();        try {            inputStream = new FileInputStream(doc);        } catch (FileNotFoundException e) {            System.out.println(e);        }        StringBuffer sBuff = new StringBuffer("");        try {            SlideShow ss = new SlideShow(new HSLFSlideShow(inputStream));            Slide[] slides = ss.getSlides();            for (int i = 0; i < slides.length; i++) {                TextRun[] t = slides[i].getTextRuns();                for (int j = 0; j < t.length; j++) {                    sBuff.append(t[j].getText());                }            }        } catch (Exception e) {            System.out.println(e);        }        contents = new StringReader(sBuff.toString());        document.add(new Field("path", docPath, Field.Store.YES, Field.Index.NO));        document.add(new Field("title", title, Field.Store.YES, Field.Index.TOKENIZED));        document.add(new Field("contents", contents));        document.add(new Field("information", docPath + Long.toString(doc.lastModified()), Field.Store.YES, Field.Index.UN_TOKENIZED));        return document;    }}

lucenepptdocument.java - 源码说明

本页面展示了「lucene环境下ppt转txt的源代码,这个代码应该对搜索引擎有一定作用」中的 lucenepptdocument.java 源码文件，采用 Java 编程语言编写，共 60 行代码。您可以在线阅读完整代码内容，也可以返回资源详情页下载完整源码包进行本地学习和开发。

虫虫下载站收录了大量与lucene相关的技术资源，包括源代码、技术文档、电路图等，是电子工程师和嵌入式开发者的专业学习平台。

⌨️ 快捷键说明

复制代码Ctrl + C

搜索代码Ctrl + F

全屏模式F11

增大字号Ctrl + =

减小字号Ctrl + -

显示快捷键?