spaCy - 模型初始化



與1.x版本中的spacy model命令類似,Init model命令用於根據原始資料(例如Brown聚類和詞向量)建立新的模型目錄。

Init model命令如下:

python -m spacy init-model [lang] [output_dir] [--jsonl-loc] [--vectors-loc][--prune-vectors]

引數

下表解釋了它的引數:

引數 型別 描述
lang 位置引數 它表示模型語言的ISO程式碼。例如,en
output_dir 位置引數 此引數表示模型輸出目錄。如果它不存在,則會建立它。
--jsonl-loc, -j 可選引數 它表示包含詞彙屬性的JSONL格式詞彙檔案的可選位置。
--vectors-loc, -v 可選引數 它表示向量的可選位置。它應該是一個檔案,其中第一行包含向量的維度,後跟一個空格分隔的Word2Vec表。該檔案可以以.txt格式提供,也可以以.zip.tar.gz格式的壓縮文字檔案提供。
--truncate-vectors, -t 可選引數 在2.3版本中引入,表示讀取向量檔案時要截斷的向量數量。預設值為0,表示不截斷。
--prune-vectors, -V 可選引數 此引數表示要將詞彙表修剪到的向量數量。預設值為-1,表示不修剪。
--vectors-name, -vn 可選引數 這是要分配給meta.json中詞向量的名稱。例如,en_core_web_md.vectors
--omit-extra-lookups, -OEL 標誌 在2.3版本中引入,它將從模型中的spacy-lookups-data中省略任何額外的查詢表(聚類/機率/情感)。
spacy_command_line_helpers.htm
廣告
© . All rights reserved.