spaCy - 除錯資料命令



藉助此命令,我們可以分析、除錯和驗證我們的訓練和開發資料。我們還可以獲得一些有用的統計資訊,例如無效的實體標註、迴圈依賴關係和低資料標籤等。

Debug-data 命令如下所示:

python -m spacy debug-data [lang] [train_path] [dev_path] [--base-model] [--pipeline] [--ignore-warnings] [--verbose] [--no-format]

引數

下表解釋了它的引數:

引數 型別 描述
lang 位置引數 此引數表示模型語言。
train_path 位置引數 這是 JSON 格式的訓練資料的位置,可以是檔案或檔案目錄。
dev_path 位置引數 這是用於評估的 JSON 格式的開發資料的位置,可以是檔案或檔案目錄。
--tag-map-path, -tm V2.2.4 選項 在版本 2.2.4 中引入,表示 JSON 格式的標籤對映的位置。
--base-model, -b 選項 此引數是要更新的基礎模型的名稱。它是可選的。它可以是任何可載入的 spaCy 模型。
--pipeline, -p 選項 這是要訓練的管道元件的逗號分隔名稱。預設值為“tagger,parser,ner”。
--ignore-warnings, -IW 標誌 顧名思義,此引數將忽略警告,只顯示統計資訊和錯誤。
--verbose, -V 標誌 它將列印其他資訊和說明。
–no-format, -NF 標誌 它將列印結果。如果您想寫入檔案,可以使用此引數。
廣告

© . All rights reserved.