itextpdfextractor.java

来自「Lucene+nuctch一书的全部源码 测试源码 和几个简单的项目」· Java 代码 · 共 35 行

JAVA
35
字号
package chapter9;

import java.io.*;

import com.lowagie.text.*;
import com.lowagie.text.pdf.*;

public class iTextPDFExtractor {

	public static void iTextGetPDF(String filename) {	
        Document doc=new Document();                     // 创建空白文档对象
        try {
        
        	PdfReader reader = new PdfReader( filename); // 生成PdfReader对象  
        	int pagenum = reader.getNumberOfPages();     // 读取文档页数
        	System.out.println("文档页数 :" + pagenum );   
       	
        	 for(int i = 0; i< pagenum; i++)             // 读取文档内容
        	 {
        		String txtContent = reader.getPageContent(1).toString();
           		System.out.println("文档内容 :" + txtContent);
        	 }
            doc.close();                                 //  关闭文档对象,释放资源
		} catch (FileNotFoundException e) {
			e.printStackTrace();
		}  catch (IOException e) {
			e.printStackTrace();
		} 	
	}
	public static void main(String[] args) {
		iTextGetPDF("D:\\workshop\\docs\\donations.pdf");
	}

}

⌨️ 快捷键说明

复制代码Ctrl + C
搜索代码Ctrl + F
全屏模式F11
增大字号Ctrl + =
减小字号Ctrl + -
显示快捷键?