日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

java pdf转txt【完整代码包含jar包】

發布時間:2024/1/1 编程问答 21 豆豆
生活随笔 收集整理的這篇文章主要介紹了 java pdf转txt【完整代码包含jar包】 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

一、POM
二、代碼
三、效果

一、POM文件

<dependency><groupId>org.apache.pdfbox</groupId><artifactId>pdfbox</artifactId><version>2.0.11</version></dependency>

二、代碼

package com.ct.util;import org.apache.pdfbox.pdmodel.PDDocument; import org.apache.pdfbox.text.PDFTextStripper;import java.io.*;public class Pdf2TextUtil {/*** 傳入一個pdf文件str(文件路徑)* @param fileStr* @throws Exception*/public static String readPdf(String fileStr) throws Exception {// 是否排序boolean sort = false;File pdfFile=new File(fileStr);// 輸入文本文件名稱String textFile = null;// 編碼方式String encoding = "UTF-8";// 開始提取頁數int startPage = 1;// 結束提取頁數int endPage = Integer.MAX_VALUE;// 文件輸入流,生成文本文件Writer output = null;// 內存中存儲的PDF DocumentPDDocument document = null;try {//注意參數是File。document = PDDocument.load(pdfFile);// 以原來PDF的名稱來命名新產生的txt文件textFile=fileStr.replace(".pdf",".txt");// 文件輸入流,寫入文件倒textFileoutput = new OutputStreamWriter(new FileOutputStream(textFile),encoding);// PDFTextStripper來提取文本PDFTextStripper stripper = null;stripper = new PDFTextStripper();// 設置是否排序stripper.setSortByPosition(sort);// 設置起始頁stripper.setStartPage(startPage);// 設置結束頁stripper.setEndPage(endPage);// 調用PDFTextStripper的writeText提取并輸出文本stripper.writeText(document, output);System.out.println(" pdf轉txt成功!");return textFile;} finally {if (output != null) {// 關閉輸出流output.close();}if (document != null) {// 關閉PDF Documentdocument.close();}}}public static void main(String[] args) {try {//單個pdf轉txtString filePath="G:\\test\\分子結構模糊識別文獻\\Current challenges in development of.pdf";String txtStr = readPdf(filePath);// //遍歷讀取文件夾下的文件 // String strPath="G:\\test\\publication-tran1"; // List<File> fileList = FileUtil.getFileList(strPath); // for (int i=0;i<fileList.size();i++){ // try { // String txtStr = readPdf(fileList.get(i).getAbsolutePath()); // } catch (Exception e) { // System.out.println("出錯:"+fileList.get(i).getAbsolutePath()); // } // }} catch (Exception e) {e.printStackTrace();}} }

三、效果

運行后生成的txt文件如下:

總結

以上是生活随笔為你收集整理的java pdf转txt【完整代码包含jar包】的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。