⭐ 欢迎来到虫虫下载站! | 📦 资源下载 📁 资源专辑 ℹ️ 关于我们
⭐ 虫虫下载站

📄 itextpdfextractor.java

📁 《lucene+nutch搜索引擎开发》源代码
💻 JAVA
字号:
package chapter9;

import java.io.*;

import com.lowagie.text.*;
import com.lowagie.text.pdf.*;

public class iTextPDFExtractor {

	public static void iTextGetPDF(String filename) {	
        Document doc=new Document();                     // 创建空白文档对象
        try {
        
        	PdfReader reader = new PdfReader( filename); // 生成PdfReader对象  
        	int pagenum = reader.getNumberOfPages();     // 读取文档页数
        	System.out.println("文档页数 :" + pagenum );   
       	
        	 for(int i = 0; i< pagenum; i++)             // 读取文档内容
        	 {
        		String txtContent = reader.getPageContent(1).toString();
           		System.out.println("文档内容 :" + txtContent);
        	 }
            doc.close();                                 //  关闭文档对象,释放资源
		} catch (FileNotFoundException e) {
			e.printStackTrace();
		}  catch (IOException e) {
			e.printStackTrace();
		} 	
	}
	public static void main(String[] args) {
		iTextGetPDF("D:\\workshop\\docs\\donations.pdf");
	}

}

⌨️ 快捷键说明

复制代码 Ctrl + C
搜索代码 Ctrl + F
全屏模式 F11
切换主题 Ctrl + Shift + D
显示快捷键 ?
增大字号 Ctrl + =
减小字号 Ctrl + -