- spaCy 教程
- spaCy - 首頁
- spaCy - 簡介
- spaCy - 快速入門
- spaCy - 模型和語言
- spaCy - 架構
- spaCy - 命令列助手
- spaCy - 頂級函式
- spaCy - 視覺化函式
- spaCy - 實用函式
- spaCy - 相容性函式
- spaCy - 容器
- Doc 類上下文管理器和屬性
- spaCy - 容器 Token 類
- spaCy - Token 屬性
- spaCy - 容器 Span 類
- spaCy - Span 類屬性
- spaCy - 容器 Lexeme 類
- 訓練神經網路模型
- 更新神經網路模型
- spaCy 有用資源
- spaCy - 快速指南
- spaCy - 有用資源
- spaCy - 討論
spaCy - 模型初始化
與1.x版本中的spacy model命令類似,Init model命令用於根據原始資料(例如Brown聚類和詞向量)建立新的模型目錄。
Init model命令如下:
python -m spacy init-model [lang] [output_dir] [--jsonl-loc] [--vectors-loc][--prune-vectors]
引數
下表解釋了它的引數:
| 引數 | 型別 | 描述 |
|---|---|---|
| lang | 位置引數 | 它表示模型語言的ISO程式碼。例如,en。 |
| output_dir | 位置引數 | 此引數表示模型輸出目錄。如果它不存在,則會建立它。 |
| --jsonl-loc, -j | 可選引數 | 它表示包含詞彙屬性的JSONL格式詞彙檔案的可選位置。 |
| --vectors-loc, -v | 可選引數 | 它表示向量的可選位置。它應該是一個檔案,其中第一行包含向量的維度,後跟一個空格分隔的Word2Vec表。該檔案可以以.txt格式提供,也可以以.zip或.tar.gz格式的壓縮文字檔案提供。 |
| --truncate-vectors, -t | 可選引數 | 在2.3版本中引入,表示讀取向量檔案時要截斷的向量數量。預設值為0,表示不截斷。 |
| --prune-vectors, -V | 可選引數 | 此引數表示要將詞彙表修剪到的向量數量。預設值為-1,表示不修剪。 |
| --vectors-name, -vn | 可選引數 | 這是要分配給meta.json中詞向量的名稱。例如,en_core_web_md.vectors。 |
| --omit-extra-lookups, -OEL | 標誌 | 在2.3版本中引入,它將從模型中的spacy-lookups-data中省略任何額外的查詢表(聚類/機率/情感)。 |
spacy_command_line_helpers.htm
廣告