日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

java读word_java读word文件(示例代码)

發布時間:2025/3/12 编程问答 19 豆豆
生活随笔 收集整理的這篇文章主要介紹了 java读word_java读word文件(示例代码) 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

Apache POI是Apache軟件基金會的開放源碼函式庫,POI提供API給Java程序對Microsoft Office格式檔案讀和寫的功能。

1.讀取word 2003及word 2007需要的jar包

讀取 2003 版本(.doc)的word文件相對來說比較簡單,只需要 poi-3.5-beta6-20090622.jar 和 poi-scratchpad-3.5-beta6-20090622.jar 兩個 jar 包即可, 而 2007 版本(.docx)就麻煩多,我說的這個麻煩不是我們寫代碼的時候麻煩,是要導入的 jar 包比較的多,有如下 7 個之多: ?1. openxml4j-bin-beta.jar ?2. poi-3.5-beta6-20090622.jar ?3. poi-ooxml-3.5-beta6-20090622.jar ?4 .dom4j-1.6.1.jar ?5. geronimo-stax-api_1.0_spec-1.0.jar ?6. ooxml-schemas-1.0.jar ?7. xmlbeans-2.3.0.jar 其中 4-7 是 poi-ooxml-3.5-beta6-20090622.jar 所依賴的 jar 包(在 poi-bin-3.5-beta6-20090622.tar.gz 中的?ooxml-lib 目錄下可以找到)。

2.換行符號

硬換行:文件中換行,如果是鍵盤中使用了"enter"的換行。

軟換行:文件中一行的字符數容量有限,當字符數量超過一定值時,會自動切到下行顯示。

對程序來說,硬換行才是可以識別的、確定的換行,軟換行與字體大小、縮進有關。

3.讀取的注意事項

值得注意的是: POI 在讀取不會讀取 word 文件中的圖片信息;?還有就是對于 2007 版的 word(.docx), 如果 word 文件中有表格,所有表格中的數據都會在讀取出來的字符串的最后。

4.讀取word文本內容代碼

1 importjava.io.File;

2 importjava.io.FileInputStream;

3 importjava.io.InputStream;

4

5 importorg.apache.poi.POIXMLDocument;

6 importorg.apache.poi.POIXMLTextExtractor;

7 importorg.apache.poi.hwpf.extractor.WordExtractor;

8 importorg.apache.poi.openxml4j.opc.OPCPackage;

9 importorg.apache.poi.xwpf.extractor.XWPFWordExtractor;

10

11 public classTest {

12 public static voidmain(String[] args) {

13 try{

14 InputStream is = new FileInputStream(new File("2003.doc"));

15 WordExtractor ex = newWordExtractor(is);

16 String text2003 =ex.getText();

17 System.out.println(text2003);

18

19 OPCPackage opcPackage = POIXMLDocument.openPackage("2007.docx");

20 POIXMLTextExtractor extractor = newXWPFWordExtractor(opcPackage);

21 String text2007 =extractor.getText();

22 System.out.println(text2007);

23

24 } catch(Exception e) {

25 e.printStackTrace();

26 }

27 }

28 }

總結

以上是生活随笔為你收集整理的java读word_java读word文件(示例代码)的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。