spaCy - 詞元屬性



在本章中,我們將學習關於 spaCy 中 Token 類的屬性。

屬性

以下是列出的 Token 屬性及其描述。

序號 Token 屬性 & 描述
1

Token.ancestors

用於此詞元的句法後代的最右側詞元。

2

Token.conjuncts

用於返回一個協調詞元的元組。

3

Token.children

用於返回詞元直接句法子詞元的序列。

4

Token.lefts

用於單詞的左側直接子詞元。

5

Token.rights

用於單詞的右側直接子詞元。

6

Token.n_rights

用於單詞右側直接子詞元的數量。

7

Token.n_lefts

用於單詞左側直接子詞元的數量。

8

Token.subtree

這將產生一個包含詞元及其所有句法後代的序列。

9

Token.vector

這表示一個實數值含義。

10

Token.vector_norm

這表示詞元向量表示的 L2 範數。

Token.ancestors

此詞元屬性用於此詞元的句法後代的最右側詞元。

示例

下面給出了 Token.ancestors 屬性的示例:

import spacy
nlp_model = spacy.load("en_core_web_sm")
from spacy.tokens import Token
doc = nlp_model("Give it back! He pleaded.")

it_ancestors = doc[1].ancestors
[t.text for t in it_ancestors]

輸出

['Give']

Token.conjuncts

此詞元屬性用於返回一個協調詞元的元組。此處,詞元本身不會被包含。

示例

Token.conjuncts 屬性的示例如下:

import spacy
nlp_model = spacy.load("en_core_web_sm")
from spacy.tokens import Token
doc = nlp_model("I like cars and bikes")
cars_conjuncts = doc[2].conjuncts
[t.text for t in cars_conjuncts]

輸出

輸出如下:

['bikes']

Token.children

此詞元屬性用於返回詞元直接句法子詞元的序列。

示例

Token.children 屬性的示例如下:

import spacy
nlp_model = spacy.load("en_core_web_sm")
from spacy.tokens import Token
doc = nlp_model("This is Tutorialspoint.com.")
give_child = doc[1].children
[t.text for t in give_child]

輸出

['This', 'Tutorialspoint.com', '.']

Token.lefts

此詞元屬性用於單詞的左側直接子詞元。它將位於句法依存分析中。

示例

Token.lefts 屬性的示例如下:

import spacy
nlp_model = spacy.load("en_core_web_sm")
from spacy.tokens import Token
doc = nlp_model("This is Tutorialspoint.com.")
left_child = [t.text for t in doc[1].lefts]
left_child

輸出

您將獲得以下輸出:

['This']

Token.rights

此詞元屬性用於單詞的右側直接子詞元。它將位於句法依存分析中。

示例

下面給出了 Token.rights 屬性的示例:

import spacy
nlp_model = spacy.load("en_core_web_sm")
from spacy.tokens import Token
doc = nlp_model("This is Tutorialspoint.com.")
right_child = [t.text for t in doc[1].rights]
right_child

輸出

['Tutorialspoint.com', '.']

Token.n_rights

此詞元屬性用於單詞右側直接子詞元的數量。它將位於句法依存分析中。

示例

下面給出了 Token.n_rights 屬性的示例:

import spacy
nlp_model = spacy.load("en_core_web_sm")
from spacy.tokens import Token
doc = nlp_model("This is Tutorialspoint.com.")
doc[1].n_rights

輸出

2

Token.n_lefts

此詞元屬性用於單詞左側直接子詞元的數量。它將位於句法依存分析中。

示例

Token.n_lefts 屬性的示例如下:

import spacy
nlp_model = spacy.load("en_core_web_sm")
from spacy.tokens import Token
doc = nlp_model("This is Tutorialspoint.com.")
doc[1].n_lefts

輸出

輸出如下:

1

Token.subtree

此詞元屬性產生一個包含詞元及其所有句法後代的序列。

示例

Token.subtree 屬性的示例如下:

import spacy
nlp_model = spacy.load("en_core_web_sm")
from spacy.tokens import Token
doc = nlp_model("This is Tutorialspoint.com.")
subtree_doc = doc[1].subtree
[t.text for t in subtree_doc]

輸出

['This', 'is', 'Tutorialspoint.com', '.']

Token.vector

此詞元屬性表示一個實數值含義。它將返回一個表示詞元語義的一維陣列。

示例 1

Token.vector 屬性的示例如下:

import spacy
nlp_model = spacy.load("en_core_web_sm")
doc = nlp_model("The website is Tutorialspoint.com.")
doc.vector.dtype

輸出

輸出如下:

dtype('float32')

示例 2

下面給出了 Token.vector 屬性的另一個示例:

doc.vector.shape

輸出

輸出如下:

(96,)

Token.vector_norm

此詞元屬性表示詞元向量表示的 L2 範數。

示例

下面給出了 Token.vector_norm 屬性的示例:

import spacy
nlp_model = spacy.load("en_core_web_sm")
doc1 = nlp_model("The website is Tutorialspoint.com.")
doc2 = nlp_model("It is having best technical tutorials.")
doc1[2].vector_norm !=doc2[2].vector_norm

輸出

True
廣告