Lucene - 分析器



Analyzer 類負責分析文件並從將要建立索引的文字中獲取標記/單詞。如果沒有分析過程,IndexWriter 無法建立索引。

類宣告

以下是 org.apache.lucene.analysis.Analyzer 類的宣告 −

public abstract class Analyzer
   extends Object
      implements Closeable

類建構函式

下表顯示了一個類建構函式 −

序號 建構函式和說明
1

protected Analyzer()

類方法

下表顯示了不同的類方法 −

序號 方法和說明
1

void close()

釋放此 Analyzer 使用的持久資源。

2

int getOffsetGap(Fieldable field)

與 getPositionIncrementGap(java.lang.String) 相同,除了針對標記偏移量。

3

int getPositionIncrementGap(String fieldName)

如果已向該欄位新增術語,則在建立 Fieldable 例項索引之前呼叫該方法。

4

protected Object getPreviousTokenStream()

由實現 reusableTokenStream 的 Analyzer 使用,以便檢索先前儲存的 TokenStream,以便由同一執行緒重新使用。

5

TokenStream reusableTokenStream(String fieldName, Reader reader)

在同一執行緒上上次呼叫此方法後被允許重新使用的 TokenStream。

6

protected void setPreviousTokenStream(Object obj)

由實現 reusableTokenStream 的 Analyzer 使用,以便儲存 TokenStream,以便同一執行緒稍後重新使用。

7

abstract TokenStream tokenStream(String fieldName, Reader reader)

建立一個 TokenStream,對所提供的 Reader 中的所有文字進行標記化。

繼承的方法

此類繼承了以下類的以下方法 −

  • java.lang.Object
lucene_indexing_classes.htm
廣告
© . All rights reserved.