日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程语言 > python >内容正文

python

html旋转代码_付费?是不可能的!20行Python代码实现一款永久免费PDF编辑工具

發布時間:2025/3/15 python 29 豆豆
生活随笔 收集整理的這篇文章主要介紹了 html旋转代码_付费?是不可能的!20行Python代码实现一款永久免费PDF编辑工具 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

PDF(Portable Document Format),中文名稱便攜文檔格式是我們經常會接觸到的一種文件格式,文獻、文檔...很多都是PDF格式。它以格式穩定的優勢,使得我們在打印、分享、傳輸過程中能夠最優的保持原有色彩和格式。

PDF是以PostScript語言圖像模型為基礎的一種文檔格式,它在格式的穩定性方面雖然具有很大優勢。但是,在可編輯性方面卻為使用者引入了另外一個困擾。

例如,在文檔的分割、合并、剪切、轉換、編輯等方面PDF就有些捉襟見肘了。

Adobe Reader、福昕閱讀器、熊貓PDF...經常用到的PDF工具只能用于文檔閱讀,但是免費版都不可以用于文檔編輯。雖然,網頁版PDF工具,例如SmallPDF、I love PDF可以用于PDF的編輯,但是對于文檔大小也有限制。

曾經,為了替換PDF中的一頁,我幾乎試遍了所有市面上主流的PDF工具,最終還是不得不選擇使用付費工具來解決問題。

事后想了想,既然這些商業化軟件不靠譜,為什么不考慮自己動手開發一款工具呢?明明幾十行代碼能夠解決的問題,為什么要費那么多勁去下載、安裝那些沒有節操的軟件呢?

本文就來介紹一下利用Python輕松開發一款PDF編輯工具,可以用于PDF轉txt、分割、合并、剪切、轉換。

PyPDF2

PyPDF2是一個第三方的python PDF庫,它能夠對PDF文件進行分割、合并、裁剪和轉換頁面。

另外,它還可以對PDF文件添加自定義數據、水印、密碼,也可以從PDF文件中檢索出文本和元數據。

安裝

使用pip直接安裝:

pip install PyPDF2

下面就來演示幾項PDF編輯功能,并且會逐行解釋代碼的含義。

刪除PDF頁

先給出實現代碼,

from PyPDF2 import PdfFileWriter, PdfFileReaderoutput = PdfFileWriter() // 1 input1 = PdfFileReader(open("example.pdf", "rb")) // 2def delete_pdf(index):pages = input1.getNumPages() // 3for i in range(pages):if i+1 in index:continueoutput.addPage(input1.getPage(i)) // 4outputStream = open("PyPDF2-output.pdf", "wb")output.write(outputStream) // 5delete_pdf([2,3,4])

下面來解釋一下代碼中的幾個關鍵點:

  • 聲明一個用于輸出PDF的實例;
  • 讀取本地PDF文件;
  • 獲取PDF文檔的頁數;
  • 讀取PDF的第i頁,添加到輸出output實例中;
  • 把編輯后的文檔保存到本地;
  • 合并PDF

    已經實現了刪除PDF頁,接下來就看一下如何把另外一個PDF中的頁面合并到當前PDF中。

    方法1:

    可以沿著前面刪除PDF頁的方式進行拓展一下,對PDF進行合并。

    from PyPDF2 import PdfFileWriter, PdfFileReaderoutput = PdfFileWriter() input1 = PdfFileReader(open("example.pdf", "rb")) input2 = PdfFileReader(open("simple2.pdf", "rb")) // 1def merge_pdf(add_index, origin_index):pages = input1.getNumPages()k = 0for i in range(pages):if i+1 in add_index:output.addPage(input2.getPage(origin_index[k])) // 2pages += 1k += 1output.addPage(input1.getPage(i))outputStream = open("PyPDF2-output.pdf", "wb")output.write(outputStream)merge_pdf([2,3,4], [0, 0, 0])
  • 讀取需要合并的源文件;
  • 遍歷到指定頁,合并源PDF的頁面;
  • 方法2:

    除了方法1,還有另外一種方法可以合并PDF:

    from PyPDF2 import PdfFileMerger // 1merger = PdfFileMerger()input1 = open("document1.pdf", "rb") // 2 input2 = open("document2.pdf", "rb") input3 = open("document3.pdf", "rb")merger.append(fileobj = input1, pages = (0,3)) // 3merger.merge(position = 2, fileobj = input2, pages = (0,1)) // 4merger.append(input3) // 5output = open("document-output.pdf", "wb") merger.write(output)
  • 導入PyPDF2合并模塊PdfFileMerger;
  • 讀取需要處理和合并的PDF文檔;
  • 從第一個PDF文檔中取出需要合并的前3頁;
  • 把第二個PDF文檔的第一頁插入到文檔中;
  • 把第三個PDF文檔附到輸出文檔末尾;
  • 除了上述介紹的2項主要功能,PyPDF2也有一些其他小功能:

    旋轉

    input1.getPage(1).rotateClockwise(90)

    使得頁面1旋轉90度。

    添加水印

    page = input1.getPage(3) watermark = PdfFileReader(open("watermark.pdf", "rb")) page.mergePage(watermark.getPage(0))

    其中,水印存儲在另外一個PDF文檔watermark.pdf中。

    加密

    password = "secret" output.encrypt(password)

    首先給一個secret密碼,然后使用encrypt對輸出文檔進行加密。

    pdfminer

    前面介紹的PyPDF2主要擅長于PDF頁面級編輯,而對于文本和源數據級別編輯能力較弱。

    所以,這里就來介紹另外一款Python庫來彌補它的不足。

    PDFMiner是一個PDF文檔的文本提取工具,它具有如下特性:

    • 能夠準確獲取文本的位置和布局信息;
    • 可以將PDF轉換為HTML/XML等格式;
    • 可以提取目錄;
    • 可以提取標簽內容;
    • 支持各種字體類型(Type1、TrueType、Type3和CID);
    • 支持中、日、韓語言和垂直書寫文本;

    安裝

    pip install pdfminer

    PDF轉TxT

    pdfminer在GitHub的托管項目中,在目錄tools下給出了一些實用的工具集,例如,PDF轉HTML、PDF轉HTML、PDF轉TXT。我們可以直接通過使用下面命令提出PDF文檔中的文本信息。

    pdf2txt.py samples/simple1.pdf

    通過上述2款Python庫,就可以實現從頁面到文本元數據的編輯,本文只是簡單的介紹了每項的基本用法。關于詳細的用法和函數列表,可以閱讀官方文檔,或者閱讀GitHub上項目源碼進行了解。此外,可以在這些基本的用法基礎上進行發散思維,發掘更多有價值的應用場景,例如,提出文本數據之后調用翻譯API進行文獻翻譯。也可以,對軟件進行封裝,開發成一款通用的PDF編輯工具。

    https://u.wechat.com/MCrmocmX5dYALaEqsBzet9s (二維碼自動識別)

    https://u.wechat.com/MCrmocmX5dYALaEqsBzet9s (二維碼自動識別)

    https://u.wechat.com/MCrmocmX5dYALaEqsBzet9s (二維碼自動識別)

    https://u.wechat.com/MCrmocmX5dYALaEqsBzet9s<br> (二維碼自動識別)

    總結

    以上是生活随笔為你收集整理的html旋转代码_付费?是不可能的!20行Python代码实现一款永久免费PDF编辑工具的全部內容,希望文章能夠幫你解決所遇到的問題。

    如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。