Lucene - 分析器



Analyzer 類負責分析文件並從要索引的文字中獲取標記/單詞。如果沒有分析,IndexWriter 無法建立索引。

類宣告

以下是org.apache.lucene.analysis.Analyzer類的宣告:

public abstract class Analyzer
   extends Object
      implements Closeable

類建構函式

下表顯示了一個類建構函式:

序號 建構函式和描述
1

protected Analyzer()

類方法

下表顯示了不同的類方法:

序號 方法和描述
1

void close()

釋放分析器使用的永續性資源。

2

int getOffsetGap(Fieldable field)

這類似於 getPositionIncrementGap(java.lang.String),只是針對 Token 偏移量。

3

int getPositionIncrementGap(String fieldName)

如果已經向該欄位添加了術語,則在索引Fieldable例項之前呼叫此方法。

4

protected Object getPreviousTokenStream()

由實現可重用 TokenStream 的分析器使用,用於檢索先前儲存的 TokenStream 以供同一執行緒重複使用。

5

TokenStream reusableTokenStream(String fieldName, Reader reader)

建立一個 TokenStream,允許它從同一執行緒上次呼叫此方法時重複使用。

6

protected void setPreviousTokenStream(Object obj)

由實現 reusableTokenStream 的分析器使用,用於儲存 TokenStream 以供同一執行緒稍後重複使用。

7

abstract TokenStream tokenStream(String fieldName, Reader reader)

建立一個 TokenStream,它對提供的 Reader 中的所有文字進行標記化。

繼承的方法

此類繼承自以下類的方法:

  • java.lang.Object

此分析器根據空格拆分文件中的文字。

lucene_analysis.htm
廣告
© . All rights reserved.