spaCy - 詞元屬性

在本章中，我們將學習關於 spaCy 中 Token 類的屬性。

屬性

以下是列出的 Token 屬性及其描述。

序號	Token 屬性 & 描述
1	Token.ancestors 用於此詞元的句法後代的最右側詞元。
2	Token.conjuncts 用於返回一個協調詞元的元組。
3	Token.children 用於返回詞元直接句法子詞元的序列。
4	Token.lefts 用於單詞的左側直接子詞元。
5	Token.rights 用於單詞的右側直接子詞元。
6	Token.n_rights 用於單詞右側直接子詞元的數量。
7	Token.n_lefts 用於單詞左側直接子詞元的數量。
8	Token.subtree 這將產生一個包含詞元及其所有句法後代的序列。
9	Token.vector 這表示一個實數值含義。
10	Token.vector_norm 這表示詞元向量表示的 L2 範數。

Token.ancestors

此詞元屬性用於此詞元的句法後代的最右側詞元。

示例

下面給出了 Token.ancestors 屬性的示例：

import spacy
nlp_model = spacy.load("en_core_web_sm")
from spacy.tokens import Token
doc = nlp_model("Give it back! He pleaded.")

it_ancestors = doc[1].ancestors
[t.text for t in it_ancestors]

輸出

['Give']

Token.conjuncts

此詞元屬性用於返回一個協調詞元的元組。此處，詞元本身不會被包含。

示例

Token.conjuncts 屬性的示例如下：

import spacy
nlp_model = spacy.load("en_core_web_sm")
from spacy.tokens import Token
doc = nlp_model("I like cars and bikes")
cars_conjuncts = doc[2].conjuncts
[t.text for t in cars_conjuncts]

輸出

輸出如下：

['bikes']

Token.children

此詞元屬性用於返回詞元直接句法子詞元的序列。

示例

Token.children 屬性的示例如下：

import spacy
nlp_model = spacy.load("en_core_web_sm")
from spacy.tokens import Token
doc = nlp_model("This is Tutorialspoint.com.")
give_child = doc[1].children
[t.text for t in give_child]

輸出

['This', 'Tutorialspoint.com', '.']

Token.lefts

此詞元屬性用於單詞的左側直接子詞元。它將位於句法依存分析中。

示例

Token.lefts 屬性的示例如下：

import spacy
nlp_model = spacy.load("en_core_web_sm")
from spacy.tokens import Token
doc = nlp_model("This is Tutorialspoint.com.")
left_child = [t.text for t in doc[1].lefts]
left_child

輸出

您將獲得以下輸出：

['This']

Token.rights

此詞元屬性用於單詞的右側直接子詞元。它將位於句法依存分析中。

示例

下面給出了 Token.rights 屬性的示例：

import spacy
nlp_model = spacy.load("en_core_web_sm")
from spacy.tokens import Token
doc = nlp_model("This is Tutorialspoint.com.")
right_child = [t.text for t in doc[1].rights]
right_child

輸出

['Tutorialspoint.com', '.']

Token.n_rights

此詞元屬性用於單詞右側直接子詞元的數量。它將位於句法依存分析中。

示例

下面給出了 Token.n_rights 屬性的示例：

import spacy
nlp_model = spacy.load("en_core_web_sm")
from spacy.tokens import Token
doc = nlp_model("This is Tutorialspoint.com.")
doc[1].n_rights

輸出

Token.n_lefts

此詞元屬性用於單詞左側直接子詞元的數量。它將位於句法依存分析中。

示例

Token.n_lefts 屬性的示例如下：

import spacy
nlp_model = spacy.load("en_core_web_sm")
from spacy.tokens import Token
doc = nlp_model("This is Tutorialspoint.com.")
doc[1].n_lefts

輸出

輸出如下：

Token.subtree

此詞元屬性產生一個包含詞元及其所有句法後代的序列。

示例

Token.subtree 屬性的示例如下：

import spacy
nlp_model = spacy.load("en_core_web_sm")
from spacy.tokens import Token
doc = nlp_model("This is Tutorialspoint.com.")
subtree_doc = doc[1].subtree
[t.text for t in subtree_doc]

輸出

['This', 'is', 'Tutorialspoint.com', '.']

Token.vector

此詞元屬性表示一個實數值含義。它將返回一個表示詞元語義的一維陣列。

示例 1

Token.vector 屬性的示例如下：

import spacy
nlp_model = spacy.load("en_core_web_sm")
doc = nlp_model("The website is Tutorialspoint.com.")
doc.vector.dtype

輸出

輸出如下：

dtype('float32')

示例 2

下面給出了 Token.vector 屬性的另一個示例：

doc.vector.shape

輸出

輸出如下：

(96,)

Token.vector_norm

此詞元屬性表示詞元向量表示的 L2 範數。

示例

下面給出了 Token.vector_norm 屬性的示例：

import spacy
nlp_model = spacy.load("en_core_web_sm")
doc1 = nlp_model("The website is Tutorialspoint.com.")
doc2 = nlp_model("It is having best technical tutorials.")
doc1[2].vector_norm !=doc2[2].vector_norm

輸出

True

列印頁面