日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

PDF文件如何转成markdown格式

發布時間:2025/3/8 编程问答 13 豆豆
生活随笔 收集整理的這篇文章主要介紹了 PDF文件如何转成markdown格式 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

百度上根據pdf轉makrdown為關鍵字進行搜索,結果大多數是反過來的轉換,即markdown文本轉PDF格式。

但是PDF轉markdown的解決方案很少。

正好我工作上有這個需求,所以自己實現了一個解決方案。

下圖是一個用PDF XChange Editor打開的PDF文件,我想將其內容通過markdown格式導出。

(1) 首先將該PDF導出成word格式,后綴.docx

(2) 使用typora獲得該word文檔的markdown源代碼:

此時任務只完成了一半,因為typora這個工具轉換成的markdown格式,如果原始的word文檔里包含圖片,這些圖片以本地圖片的形式存在于markdown里,那我如果直接將包含了這些本地圖片的標簽的markdown發布到簡書,CSDN,開源中國,騰訊云,阿里云這些支持markdown的社區時,這些本地圖片將無法顯示。

因此我們必須找到一個高效的方法,將word里包含的本地圖片先上傳到網絡上,再用生成的包含了圖片網絡url的markdown標簽替換本地圖片標簽。
(3) 把word文件的后綴從.docx改成.zip, 解壓后,在文件夾word的子文件夾media里能找到所有的本地文件。

把這些本地文件全部上傳到網站,生成下面這些url:

我寫了一個工具,可以把僅包含了本地圖片標簽的markdown源代碼和包含了上述在線圖片url標簽的源代碼做一個合并,后并后,本地圖片標簽會被在線圖片標簽取代:

這個工具可以從我github上獲得:
https://github.com/i042416/KnowlegeRepository/blob/master/practice/255_markdown_tool.html

下圖就是我的原始PDF轉換成markdown格式后發布在某社區上的效果,和原始PDF外觀完全一致:

本文來自云棲社區合作伙伴“汪子熙”,了解相關信息可以關注微信公眾號"汪子熙"。

總結

以上是生活随笔為你收集整理的PDF文件如何转成markdown格式的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。