pdfbox 第一页加内容_你用代码做过哪些很酷/有趣的事?
國內一個期刊在接收終稿時需要作者提供一個材料:所有參考文獻首頁的電子版壓縮包(以文獻序號作為文件名,壓縮在一個文件包中)
獲取PDF首頁,一個直觀的想法是:“打開Adobe Acrobat”->"打印"->"選擇頁碼范圍"(選擇第一頁)。但是我這個文章有一百多個參考文獻啊,挨個手動操作可能要搞很久很久,而且我這么懶。。
而且,做這種重復性工作不就是對我這個懶惰的程序員的侮辱嗎?于是嘗試用代碼搞定,一查發現好簡單,用了30行代碼就搞定,代碼如下(使用時候請把路徑中的***替換成你自己的文件路徑):
package com.wkj;
import org.apache.pdfbox.pdmodel.PDDocument;
import org.apache.pdfbox.pdmodel.PDPage;
import java.io.File;
import java.io.IOException;
public class CutPDF {
public static void main(String[] argv) throws IOException {
String inputPath = "*****";
String outputDir = "*****";
File inputDir = new File(inputPath);
String[] files = inputDir.list();
for (int i = 0; i < files.length; i++) {
String filename = inputPath+files[i];
System.out.println(filename);
PDDocument pdfDocument = PDDocument.load(new File(filename));
PDPage firstPage = pdfDocument.getPage(0);
PDDocument doc = new PDDocument();
doc.addPage(firstPage);
String outputFileName = outputDir+files[i];
doc.save(outputFileName);
doc.close();
pdfDocument.close();
}
}
}
抽取100多個PDF文件的首頁大概只要5到6秒鐘!
懶人的快樂就是這么簡單!
總結
以上是生活随笔為你收集整理的pdfbox 第一页加内容_你用代码做过哪些很酷/有趣的事?的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: ios 重复引用 静态库_iOS 解决一
- 下一篇: python2与python3性能对比_