spaCy - Span._ _init_ _ 方法



這是Span類最常用的方法之一。顧名思義,它用於從切片doc[start : end]構造一個Span物件。

引數

下表解釋了它的引數:

名稱 型別 描述
Doc Doc 它表示父文件。
Start Int 它是跨度第一個token的索引。
End Int 它表示跨度後第一個token的索引。
Label int / unicode 它是標籤,用於附加到跨度。例如,命名實體。從 2.1 版開始,標籤也可以是 unicode 字串。
kb_id int / unicode 它表示一個知識庫 ID,用於附加到跨度。例如,命名實體。此 ID 可以是整數,也可以是 unicode 字串。
vector numpy.ndarray[ndim=1, dtype='float32'] 它是跨度的含義表示。

示例 1

下面給出了 Span._ _init_ _ 方法的一個示例:

import spacy
nlp_model = spacy.load("en_core_web_sm")
doc = nlp_model("This is Tutorialspoint.com.")
span = doc[1:4]
span

輸出

執行上述程式碼時,您應該會看到以下輸出:

is Tutorialspoint.com.

示例 2

下面給出了 Span._ _init_ _ 方法的另一個示例:

[t.text for t in span]

輸出

執行上述程式碼時,您應該會看到以下輸出:

['is', 'Tutorialspoint.com', '.']
spacy_container_span_class.htm
廣告

© . All rights reserved.