- spaCy 教程
- spaCy - 首頁
- spaCy - 簡介
- spaCy - 入門
- spaCy - 模型和語言
- spaCy - 架構
- spaCy - 命令列助手
- spaCy - 頂級函式
- spaCy - 視覺化函式
- spaCy - 實用函式
- spaCy - 相容性函式
- spaCy - 容器
- Doc 類上下文管理器和屬性
- spaCy - 容器 Token 類
- spaCy - 詞元屬性
- spaCy - 容器 Span 類
- spaCy - Span 類屬性
- spaCy - 容器 Lexeme 類
- 訓練神經網路模型
- 更新神經網路模型
- spaCy 有用資源
- spaCy - 快速指南
- spaCy - 有用資源
- spaCy - 討論
spaCy - 詞元屬性
在本章中,我們將學習關於 spaCy 中 Token 類的屬性。
屬性
以下是列出的 Token 屬性及其描述。
| 序號 | Token 屬性 & 描述 |
|---|---|
| 1 | Token.ancestors 用於此詞元的句法後代的最右側詞元。 |
| 2 | Token.conjuncts 用於返回一個協調詞元的元組。 |
| 3 | Token.children 用於返回詞元直接句法子詞元的序列。 |
| 4 | Token.lefts 用於單詞的左側直接子詞元。 |
| 5 | Token.rights 用於單詞的右側直接子詞元。 |
| 6 | Token.n_rights 用於單詞右側直接子詞元的數量。 |
| 7 | Token.n_lefts 用於單詞左側直接子詞元的數量。 |
| 8 | Token.subtree 這將產生一個包含詞元及其所有句法後代的序列。 |
| 9 | Token.vector 這表示一個實數值含義。 |
| 10 | Token.vector_norm 這表示詞元向量表示的 L2 範數。 |
Token.ancestors
此詞元屬性用於此詞元的句法後代的最右側詞元。
示例
下面給出了 Token.ancestors 屬性的示例:
import spacy
nlp_model = spacy.load("en_core_web_sm")
from spacy.tokens import Token
doc = nlp_model("Give it back! He pleaded.")
it_ancestors = doc[1].ancestors
[t.text for t in it_ancestors]
輸出
['Give']
Token.conjuncts
此詞元屬性用於返回一個協調詞元的元組。此處,詞元本身不會被包含。
示例
Token.conjuncts 屬性的示例如下:
import spacy
nlp_model = spacy.load("en_core_web_sm")
from spacy.tokens import Token
doc = nlp_model("I like cars and bikes")
cars_conjuncts = doc[2].conjuncts
[t.text for t in cars_conjuncts]
輸出
輸出如下:
['bikes']
Token.children
此詞元屬性用於返回詞元直接句法子詞元的序列。
示例
Token.children 屬性的示例如下:
import spacy
nlp_model = spacy.load("en_core_web_sm")
from spacy.tokens import Token
doc = nlp_model("This is Tutorialspoint.com.")
give_child = doc[1].children
[t.text for t in give_child]
輸出
['This', 'Tutorialspoint.com', '.']
Token.lefts
此詞元屬性用於單詞的左側直接子詞元。它將位於句法依存分析中。
示例
Token.lefts 屬性的示例如下:
import spacy
nlp_model = spacy.load("en_core_web_sm")
from spacy.tokens import Token
doc = nlp_model("This is Tutorialspoint.com.")
left_child = [t.text for t in doc[1].lefts]
left_child
輸出
您將獲得以下輸出:
['This']
Token.rights
此詞元屬性用於單詞的右側直接子詞元。它將位於句法依存分析中。
示例
下面給出了 Token.rights 屬性的示例:
import spacy
nlp_model = spacy.load("en_core_web_sm")
from spacy.tokens import Token
doc = nlp_model("This is Tutorialspoint.com.")
right_child = [t.text for t in doc[1].rights]
right_child
輸出
['Tutorialspoint.com', '.']
Token.n_rights
此詞元屬性用於單詞右側直接子詞元的數量。它將位於句法依存分析中。
示例
下面給出了 Token.n_rights 屬性的示例:
import spacy
nlp_model = spacy.load("en_core_web_sm")
from spacy.tokens import Token
doc = nlp_model("This is Tutorialspoint.com.")
doc[1].n_rights
輸出
2
Token.n_lefts
此詞元屬性用於單詞左側直接子詞元的數量。它將位於句法依存分析中。
示例
Token.n_lefts 屬性的示例如下:
import spacy
nlp_model = spacy.load("en_core_web_sm")
from spacy.tokens import Token
doc = nlp_model("This is Tutorialspoint.com.")
doc[1].n_lefts
輸出
輸出如下:
1
Token.subtree
此詞元屬性產生一個包含詞元及其所有句法後代的序列。
示例
Token.subtree 屬性的示例如下:
import spacy
nlp_model = spacy.load("en_core_web_sm")
from spacy.tokens import Token
doc = nlp_model("This is Tutorialspoint.com.")
subtree_doc = doc[1].subtree
[t.text for t in subtree_doc]
輸出
['This', 'is', 'Tutorialspoint.com', '.']
Token.vector
此詞元屬性表示一個實數值含義。它將返回一個表示詞元語義的一維陣列。
示例 1
Token.vector 屬性的示例如下:
import spacy
nlp_model = spacy.load("en_core_web_sm")
doc = nlp_model("The website is Tutorialspoint.com.")
doc.vector.dtype
輸出
輸出如下:
dtype('float32')
示例 2
下面給出了 Token.vector 屬性的另一個示例:
doc.vector.shape
輸出
輸出如下:
(96,)
Token.vector_norm
此詞元屬性表示詞元向量表示的 L2 範數。
示例
下面給出了 Token.vector_norm 屬性的示例:
import spacy
nlp_model = spacy.load("en_core_web_sm")
doc1 = nlp_model("The website is Tutorialspoint.com.")
doc2 = nlp_model("It is having best technical tutorials.")
doc1[2].vector_norm !=doc2[2].vector_norm
輸出
True