- spaCy 教程
- spaCy - 首頁
- spaCy - 簡介
- spaCy - 入門
- spaCy - 模型和語言
- spaCy - 架構
- spaCy - 命令列助手
- spaCy - 頂級函式
- spaCy - 視覺化函式
- spaCy - 實用函式
- spaCy - 相容性函式
- spaCy - 容器
- Doc 類上下文管理器和屬性
- spaCy - 容器 Token 類
- spaCy - Token 屬性
- spaCy - 容器 Span 類
- spaCy - Span 類屬性
- spaCy - 容器 Lexeme 類
- 訓練神經網路模型
- 更新神經網路模型
- spaCy 有用資源
- spaCy - 快速指南
- spaCy - 有用資源
- spaCy - 討論
spaCy - 除錯資料命令
藉助此命令,我們可以分析、除錯和驗證我們的訓練和開發資料。我們還可以獲得一些有用的統計資訊,例如無效的實體標註、迴圈依賴關係和低資料標籤等。
Debug-data 命令如下所示:
python -m spacy debug-data [lang] [train_path] [dev_path] [--base-model] [--pipeline] [--ignore-warnings] [--verbose] [--no-format]
引數
下表解釋了它的引數:
| 引數 | 型別 | 描述 |
|---|---|---|
| lang | 位置引數 | 此引數表示模型語言。 |
| train_path | 位置引數 | 這是 JSON 格式的訓練資料的位置,可以是檔案或檔案目錄。 |
| dev_path | 位置引數 | 這是用於評估的 JSON 格式的開發資料的位置,可以是檔案或檔案目錄。 |
| --tag-map-path, -tm V2.2.4 | 選項 | 在版本 2.2.4 中引入,表示 JSON 格式的標籤對映的位置。 |
| --base-model, -b | 選項 | 此引數是要更新的基礎模型的名稱。它是可選的。它可以是任何可載入的 spaCy 模型。 |
| --pipeline, -p | 選項 | 這是要訓練的管道元件的逗號分隔名稱。預設值為“tagger,parser,ner”。 |
| --ignore-warnings, -IW | 標誌 | 顧名思義,此引數將忽略警告,只顯示統計資訊和錯誤。 |
| --verbose, -V | 標誌 | 它將列印其他資訊和說明。 |
| –no-format, -NF | 標誌 | 它將列印結果。如果您想寫入檔案,可以使用此引數。 |
廣告