日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

抽取PDF文本

發布時間:2025/7/14 编程问答 24 豆豆
生活随笔 收集整理的這篇文章主要介紹了 抽取PDF文本 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

下載iTextSharp的dll,鏈接:

http://cdnetworks-kr-2.dl.sourceforge.net/project/itextsharp/itextsharp/iTextSharp-5.0.4/itextsharp-5.0.4-dll.zip

示例代碼 using iTextSharp.text.pdf;
using iTextSharp.text.pdf.parser;

namespace ReadPdfDemo
{
????class Program
????{
????????static void Main(string[] args)
????????{
????????????string str = GetAllText(@"C:\Users\dc\Desktop\20101098504717.pdf");
????????}

????????static public string GetAllText(string filePath)
????????{
????????????string text = string.Empty;
????????????PdfReader reader = new PdfReader(filePath);
????????????for (int i = 1; i <= reader.NumberOfPages; i++)
????????????{
????????????????text += GetTextFromPage(reader, i);
????????????}
????????????return text;
????????}

????????static public string GetTextFromPage(PdfReader reader, int pageNum)
????????{
????????????ITextExtractionStrategy strategy = new SimpleTextExtractionStrategy();
????????????return PdfTextExtractor.GetTextFromPage(reader, pageNum, strategy);
????????}
????}
}

轉載于:https://www.cnblogs.com/dc10101/archive/2010/10/11/1847810.html

總結

以上是生活随笔為你收集整理的抽取PDF文本的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。