- TIKA 教程
- TIKA - 首頁
- TIKA - 概述
- TIKA - 架構
- TIKA - 環境
- TIKA - 參考 API
- TIKA - 檔案格式
- TIKA - 文件型別檢測
- TIKA - 內容提取
- TIKA - 元資料提取
- TIKA - 語言檢測
- TIKA - GUI
- TIKA 有用資源
- TIKA - 快速指南
- TIKA - 有用資源
- TIKA - 討論
TIKA - 檔案格式
Tika 支援的檔案格式
下表顯示了 Tika 支援的檔案格式。
| 檔案格式 | 包庫 | Tika 中的類 |
|---|---|---|
| XML | org.apache.tika.parser.xml | XMLParser |
| HTML | org.apache.tika.parser.html 並且它使用 Tagsoup 庫 | HtmlParser |
| MS-Office 複合文件 Ole2(2007 年之前)ooxml(2007 年及以後) | org.apache.tika.parser.microsoft org.apache.tika.parser.microsoft.ooxml 並且它使用 Apache Poi 庫 |
OfficeParser(ole2) OOXMLParser (ooxml) |
| OpenDocument 格式(OpenOffice) | org.apache.tika.parser.odf | OpenOfficeParser |
| 行動式文件格式(PDF) | org.apache.tika.parser.pdf 並且此包使用 Apache PdfBox 庫 | PDFParser |
| 電子出版物格式(電子書) | org.apache.tika.parser.epub | EpubParser |
| 富文字格式 | org.apache.tika.parser.rtf | RTFParser |
| 壓縮和打包格式 | org.apache.tika.parser.pkg 並且此包使用 Common 壓縮庫 | PackageParser 和 CompressorParser 及其子類 |
| 文字格式 | org.apache.tika.parser.txt | TXTParser |
| Feed 和聯合格式 | org.apache.tika.parser.feed | FeedParser |
| 音訊格式 | org.apache.tika.parser.audio 和 org.apache.tika.parser.mp3 | AudioParser MidiParser Mp3- 用於 mp3parser |
| 影像解析器 | org.apache.tika.parser.jpeg | JpegParser-用於 jpeg 影像 |
| 影片格式 | org.apache.tika.parser.mp4 和 org.apache.tika.parser.video 此解析器內部使用簡單演算法來解析 Flash 影片格式 | Mp4parser FlvParser |
| java 類檔案和 jar 檔案 | org.apache.tika.parser.asm | ClassParser CompressorParser |
| Mobx 格式(電子郵件) | org.apache.tika.parser.mbox | MobXParser |
| CAD 格式 | org.apache.tika.parser.dwg | DWGParser |
| 字型格式 | org.apache.tika.parser.font | TrueTypeParser |
| 可執行程式和庫 | org.apache.tika.parser.executable | ExecutableParser |
廣告