Apache POI Word - 概述



很多時候,軟體應用程式需要生成Microsoft Word檔案格式的參考文件。有時,甚至期望應用程式接收Word檔案作為輸入資料。

任何想要生成MS-Office檔案作為輸出的Java程式設計師都必須使用預定義的只讀API來做到這一點。

什麼是Apache POI?

Apache POI是一個流行的API,允許程式設計師使用Java程式建立、修改和顯示MS-Office檔案。它是一個由Apache軟體基金會開發和分發的開源庫,用於使用Java程式設計或修改MS-Office檔案。它包含用於將使用者輸入資料或檔案解碼為MS-Office文件的類和方法。

Apache POI的元件

Apache POI包含用於處理所有MS-Office的OLE2複合文件的類和方法。此API的元件列表如下:

  • POIFS (Poor Obfuscation Implementation File System) − 此元件是所有其他POI元素的基本因素。它用於顯式讀取不同的檔案。

  • HSSF (Horrible SpreadSheet Format) − 用於讀取和寫入MS-Excel檔案的.xls格式。

  • XSSF (XML SpreadSheet Format) − 用於MS-Excel的.xlsx檔案格式。

  • HPSF (Horrible Property Set Format) − 用於提取MS-Office檔案的屬性集。

  • HWPF (Horrible Word Processor Format) − 用於讀取和寫入MS-Word的.doc副檔名檔案。

  • XWPF (XML Word Processor Format) − 用於讀取和寫入MS-Word的.docx副檔名檔案。

  • HSLF (Horrible Slide Layout Format) − 用於讀取、建立和編輯PowerPoint簡報。

  • HDGF (Horrible DiaGram Format) − 包含用於MS-Visio二進位制檔案的類和方法。

  • HPBF (Horrible PuBlisher Format) − 用於讀取和寫入MS-Publisher檔案。

本教程將指導您完成使用Java處理MS-Word檔案的過程。因此,討論僅限於HWPF和XWPF元件。

注意 − POI的早期版本支援二進位制檔案格式,例如DOC、XLS、PPT等。3.5版及更高版本,POI支援MS-Office的OOXML檔案格式,例如DOCX、XLSX、PPTX等。

廣告