Lucene - 索引類



索引過程是Lucene提供的核心功能之一。下圖說明了索引過程和類的使用。IndexWriter 是索引過程中最重要和最核心的元件。

Indexing Process

我們將包含欄位(Field)文件(Document)新增到IndexWriter中,IndexWriter使用分析器(Analyzer)分析文件(Document),然後根據需要建立/開啟/編輯索引,並將它們儲存/更新到目錄(Directory)中。IndexWriter用於更新或建立索引,它不用於讀取索引。

索引類

以下是索引過程中常用類列表。

序號 類及描述
1 IndexWriter

此類作為核心元件,在索引過程中建立/更新索引。

2 Directory

此類表示索引的儲存位置。

3 Analyzer

此類負責分析文件並從要索引的文字中獲取標記/單詞。如果沒有進行分析,IndexWriter無法建立索引。

4 Document

此類表示一個包含欄位的虛擬文件,其中欄位是一個物件,可以包含物理文件的內容、元資料等。分析器只能理解Document。

5 Field

這是索引過程的最低單位或起點。它表示鍵值對關係,其中鍵用於標識要索引的值。假設一個用於表示文件內容的欄位,其鍵為“contents”,值可能包含文件部分或全部文字或數字內容。Lucene只能索引文字或數字內容。

廣告