📄 itextpdfextractor.java

📁 《lucene+nutch搜索引擎开发》源代码

💻 JAVA

字号:

package chapter9;

import java.io.*;

import com.lowagie.text.*;
import com.lowagie.text.pdf.*;

public class iTextPDFExtractor {

	public static void iTextGetPDF(String filename) {	
        Document doc=new Document();                     // 创建空白文档对象
        try {
        
        	PdfReader reader = new PdfReader( filename); // 生成PdfReader对象  
        	int pagenum = reader.getNumberOfPages();     // 读取文档页数
        	System.out.println("文档页数 ：" + pagenum );   
       	
        	 for(int i = 0; i< pagenum; i++)             // 读取文档内容
        	 {
        		String txtContent = reader.getPageContent(1).toString();
           		System.out.println("文档内容 ：" + txtContent);
        	 }
            doc.close();                                 //  关闭文档对象，释放资源
		} catch (FileNotFoundException e) {
			e.printStackTrace();
		}  catch (IOException e) {
			e.printStackTrace();
		} 	
	}
	public static void main(String[] args) {
		iTextGetPDF("D:\\workshop\\docs\\donations.pdf");
	}

}

⌨️ 快捷键说明

复制代码 Ctrl + C

搜索代码 Ctrl + F

全屏模式 F11

切换主题 Ctrl + Shift + D

显示快捷键 ?

增大字号 Ctrl + =

减小字号 Ctrl + -