- Scrapy 教程
- Scrapy - 首頁
- Scrapy 基本概念
- Scrapy - 概述
- Scrapy - 環境
- Scrapy - 命令列工具
- Scrapy - 爬蟲 (Spider)
- Scrapy - 選擇器
- Scrapy - 專案 (Item)
- Scrapy - 專案載入器 (Item Loader)
- Scrapy - Shell
- Scrapy - 專案管道 (Item Pipeline)
- Scrapy - 資料匯出 (Feed)
- Scrapy - 請求 & 響應
- Scrapy - 連結提取器
- Scrapy - 設定
- Scrapy - 異常
- Scrapy 實戰專案
- Scrapy - 建立專案
- Scrapy - 定義專案
- Scrapy - 第一個爬蟲
- Scrapy - 爬取
- Scrapy - 提取專案
- Scrapy - 使用專案
- Scrapy - 跟蹤連結
- Scrapy - 抓取資料
- Scrapy 有用資源
- Scrapy - 快速指南
- Scrapy - 有用資源
- Scrapy - 討論
Scrapy - Telnet 控制檯
描述
Telnet 控制檯是一個在 Scrapy 程序中執行的 Python shell,用於檢查和控制正在執行的 Scrapy 程序。
訪問 Telnet 控制檯
可以使用以下命令訪問 telnet 控制檯:
telnet localhost 6023
基本上,telnet 控制檯在 TCP 埠上列出,該埠在 **TELNETCONSOLE_PORT** 設定中描述。
變數
下表中給出的一些預設變數用作快捷方式:
| 序號 | 快捷方式 & 描述 |
|---|---|
| 1 | crawler 指的是 Scrapy 爬蟲 (scrapy.crawler.Crawler) 物件。 |
| 2 | engine 指的是 Crawler.engine 屬性。 |
| 3 | spider 指的是當前活動的爬蟲。 |
| 4 | slot 指的是引擎槽。 |
| 5 | extensions 指的是擴充套件管理器 (Crawler.extensions) 屬性。 |
| 6 | stats 指的是統計資訊收集器 (Crawler.stats) 屬性。 |
| 7 | setting 指的是 Scrapy 設定物件 (Crawler.settings) 屬性。 |
| 8 | est 指的是列印引擎狀態報告。 |
| 9 | prefs 指的是用於除錯的記憶體。 |
| 10 | p 指的是 pprint.pprint 函式的快捷方式。 |
| 11 | hpy 指的是記憶體除錯。 |
示例
以下是一些使用 Telnet 控制檯的示例。
暫停、恢復和停止 Scrapy 引擎
要暫停 Scrapy 引擎,請使用以下命令:
telnet localhost 6023 >>> engine.pause() >>>
要恢復 Scrapy 引擎,請使用以下命令:
telnet localhost 6023 >>> engine.unpause() >>>
要停止 Scrapy 引擎,請使用以下命令:
telnet localhost 6023 >>> engine.stop() Connection closed by foreign host.
檢視引擎狀態
Telnet 控制檯使用 **est()** 方法檢查 Scrapy 引擎的狀態,如下面的程式碼所示:
telnet localhost 6023 >>> est() Execution engine status time()-engine.start_time : 8.62972998619 engine.has_capacity() : False len(engine.downloader.active) : 16 engine.scraper.is_idle() : False engine.spider.name : followall engine.spider_is_idle(engine.spider) : False engine.slot.closing : False len(engine.slot.inprogress) : 16 len(engine.slot.scheduler.dqs or []) : 0 len(engine.slot.scheduler.mqs) : 92 len(engine.scraper.slot.queue) : 0 len(engine.scraper.slot.active) : 0 engine.scraper.slot.active_size : 0 engine.scraper.slot.itemproc_size : 0 engine.scraper.slot.needs_backout() : False
Telnet 控制檯訊號
您可以使用 telnet 控制檯訊號在 telnet 本地名稱空間中新增、更新或刪除變數。要執行此操作,您需要在處理程式中新增 telnet_vars 字典。
scrapy.extensions.telnet.update_telnet_vars(telnet_vars)
引數:
telnet_vars (dict)
其中,dict 是包含 telnet 變數的字典。
Telnet 設定
下表顯示了控制 Telnet 控制檯行為的設定:
| 序號 | 設定 & 描述 | 預設值 |
|---|---|---|
| 1 | TELNETCONSOLE_PORT 指的是 telnet 控制檯的埠範圍。如果設定為 None,則埠將被動態分配。 |
[6023, 6073] |
| 2 | TELNETCONSOLE_HOST 指的是 telnet 控制檯應監聽的介面。 |
'127.0.0.1' |