java poi jar包下载_poi.jar下载-poi.jar包 3.8/3.9/3.10 免费版 - 河东下载站
poi.jar是一款運用于Excel中的開發(fā)程序,一共擁有四個程序組件,每一個都對應(yīng)相關(guān)的開發(fā)過程,主要用途是用于文本提取應(yīng)用程序,如Web蜘蛛程序,索引構(gòu)建器和內(nèi)容管理系統(tǒng),允許您使用Java輕松讀取和寫入各種Excel文件(XLS和XLSX)、允許以內(nèi)存優(yōu)化的方式編寫非常大的Excel(XLSX)文件,讓您在使用Java程序開發(fā)Excel擴展項目的時候可以瀏覽更多的格式,poi在開發(fā)與擴展項目的運用中是非常穩(wěn)定和完整的,用戶可以直接將下載的組件加載到開發(fā)程序中就可以使用了,非常方便。
軟件功能
可以使用Java讀取和寫入MS Excel文件
可以使用Java讀取和寫入MS PowerPoint文件。
Apache POI是您的Java Excel解決方案(適用于Excel 97-2008
OLE2文件包括大多數(shù)Microsoft Office文件,如XLS,DOC和PPT以及基于MFC序列化API的文件格式
對于每個MS Office應(yīng)用程序,存在一個組件模塊,嘗試為OLE2和OOXML文檔格式提供公共的高級Java API
Office OpenXML格式是在Microsoft Office 2007和2008中找到的新的基于標(biāo)準(zhǔn)的XML文件格式。
這包括XLSX,DOCX和PPTX。該項目提供了一個低級別的API來支持使用openxml4j的開放式包裝約定
軟件特色
POI夜間構(gòu)建在Jenkins持續(xù)集成服務(wù)器上運行。
這些構(gòu)建不應(yīng)在生產(chǎn)中使用:它們主要用于開發(fā)人員幫助解決錯誤和評估新功能或想要嘗試最新版本的用戶。
Apache POI在2007年6月成為頂級項目,POI 3.0工件被重新發(fā)布。在此日期之前,POI是Apache Jakarta的一個子項目。
POI允許遠(yuǎn)程攻擊者通過特制OOXML文件(也稱為XML實體擴展(XEE)攻擊)造成拒絕服務(wù)(CPU消耗)
多年來,Apache POI已經(jīng)為所有項目支持的文件格式提供了基本的文本提取。此外,以及(純)文本,這些提供對與給定文件相關(guān)聯(lián)的元數(shù)據(jù)的訪問,例如標(biāo)題和作者。
對于更高級的文本提取需求,包括富文本提取(如格式化和樣式),以及XML和HTML輸出,Apache POI與Apache Tika密切合作, 為所有項目支持的文件格式提供POI驅(qū)動的Tika解析器。
如果你是在交鑰匙文本提取之后,包括最新的支持,樣式等,強烈建議使用 Apache Tika,它建立在POI之上,提供文本和元數(shù)據(jù)提取。如果您希望有非常簡單和獨立的東西,或者您希望進(jìn)行重大修改,那么下面提供的POI提供的文本提取器可能更適合您的需要。
使用方法
很多人都困惑POI那么多Jar到底應(yīng)該導(dǎo)入哪一個。
實際上很多時候我們只利用POI來操作Excel。甚至只用xls這一種格式。
那么就沒有必要全部都導(dǎo)入了。具體應(yīng)該使用哪個JAR包請參考以下內(nèi)容:
當(dāng)我們只要使用xls格式時、只要導(dǎo)入poi-version-yyyymmdd.jar就可以了;
當(dāng)我們還要使用xlsx格式、還要導(dǎo)入poi-ooxml-version-yyyymmdd.jar;
至于poi-ooxml-schemas-version-yyyymmdd.jar這個jar基本不太會用到的;
當(dāng)我們需要操作word、ppt、viso、outlook等時需要用到poi-scratchpad-version-yyyymmdd.jar
使用說明
所有POI文本提取器都從org.apache.poi.POITextExtractor擴展 。這提供了一個跨所有提取器,getText()的通用方法。在許多情況下,返回的文本將是所有你需要的。然而,許多提取器確實提供更有針對性的文本提取方法,因此您可能希望在某些情況下使用這些方法。
所有基于POIFS / OLE 2的文本提取器也從org.apache.poi.POIOLE2TextExtractor擴展 。此外,還提供了獲取HPFS文檔元數(shù)據(jù)的常用方法。
所有基于OOXML的文本提取器也從org.apache.poi.POIOOXMLTextExtractor擴展 。這還提供了獲取OOXML元數(shù)據(jù)的常用方法。
文本提取器工廠
POI提供了一個公共類,根據(jù)提供的文檔內(nèi)容為您選擇適當(dāng)?shù)奈谋咎崛∑鳌?org.apache.poi.extractor.ExtractorFactory提供了一個類似于WorkbookFactory的函數(shù)。您只需傳遞一個InputStream,一個文件,一個POIFSFileSystem或一個OOXML包。它為你找出正確的文本提取器,并返回它。
對于完全檢測和文本提取程序自動選擇,強烈建議用戶調(diào)查 Apache Tika。
Excel
對于.xls文件,有 org.apache.poi.hssf.extractor.ExcelExtractor,它將返回文本,可選擇使用公式而不是其內(nèi)容。類似地,對于.xlsx文件,有 org.apache.poi.xssf.extractor.XSSFExcelExtractor,它提供相同的功能。
對于在受限內(nèi)存占用中工作的用戶,還有兩個可用的Excel文本提取器。對于.xls文件,它是 org.apache.poi.hssf.extractor.EventBasedExcelExtractor,基于流式EventUserModel代碼,并且通常會提供較低的內(nèi)存占用來進(jìn)行提取。然而,它會有問題正確地輸出更復(fù)雜的公式,因為它在記錄通過時工作,因此不能訪問復(fù)雜和共享公式的所有部分。對于.xlsx文件,等效的是 org.apache.poi.xssf.extractor.XSSFEventBasedExcelExtractor,它基于XSSF SAX Event代碼庫。
對于來自Word 97 - Word 2003的.doc文件,在暫存器中有 org.apache.poi.hwpf.extractor.WordExtractor,它將返回文檔的文本。
使用POI 3.7的用戶還可以使用scratchpad類org.apache.poi.hwpf.extractor.Word6Extractor從較舊的Word 6和Word 95文件中提取簡單的文本內(nèi)容 。
對于.docx文件,相關(guān)類是 org.apache.poi.xwpf.extractor.XPFFWordExtractor
PowerPoint
對于.ppt文件,在暫存器中有 org.apache.poi.hslf.extractor.PowerPointExtractor,它將返回幻燈片的文本,可選地僅限于幻燈片文本或注釋文本。對于.pptx文件,要使用的類是 org.apache.poi.xslf.extractor.XSLFPowerPointExtractor
發(fā)布商
對于.pub文件,在scratchpad中有 org.apache.poi.hpbf.extractor.PublisherExtractor,它將為您的文件返回文本。
Visio
對于.vsd文件,在scratchpad中有 org.apache.poi.hdgf.extractor.VisioTextExtractor,它將為您的文件返回文本。
總結(jié)
以上是生活随笔為你收集整理的java poi jar包下载_poi.jar下载-poi.jar包 3.8/3.9/3.10 免费版 - 河东下载站的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: TeeChart学习笔记1:TeeCha
- 下一篇: R语言求微分