Scrapy - Telnet 控制檯



描述

Telnet 控制檯是一個在 Scrapy 程序中執行的 Python shell,用於檢查和控制正在執行的 Scrapy 程序。

訪問 Telnet 控制檯

可以使用以下命令訪問 telnet 控制檯:

telnet localhost 6023

基本上,telnet 控制檯在 TCP 埠上列出,該埠在 **TELNETCONSOLE_PORT** 設定中描述。

變數

下表中給出的一些預設變數用作快捷方式:

序號 快捷方式 & 描述
1

crawler

指的是 Scrapy 爬蟲 (scrapy.crawler.Crawler) 物件。

2

engine

指的是 Crawler.engine 屬性。

3

spider

指的是當前活動的爬蟲。

4

slot

指的是引擎槽。

5

extensions

指的是擴充套件管理器 (Crawler.extensions) 屬性。

6

stats

指的是統計資訊收集器 (Crawler.stats) 屬性。

7

setting

指的是 Scrapy 設定物件 (Crawler.settings) 屬性。

8

est

指的是列印引擎狀態報告。

9

prefs

指的是用於除錯的記憶體。

10

p

指的是 pprint.pprint 函式的快捷方式。

11

hpy

指的是記憶體除錯。

示例

以下是一些使用 Telnet 控制檯的示例。

暫停、恢復和停止 Scrapy 引擎

要暫停 Scrapy 引擎,請使用以下命令:

telnet localhost 6023
>>> engine.pause()
>>>

要恢復 Scrapy 引擎,請使用以下命令:

telnet localhost 6023
>>> engine.unpause()
>>>

要停止 Scrapy 引擎,請使用以下命令:

telnet localhost 6023
>>> engine.stop()
Connection closed by foreign host.

檢視引擎狀態

Telnet 控制檯使用 **est()** 方法檢查 Scrapy 引擎的狀態,如下面的程式碼所示:

telnet localhost 6023
>>> est()
Execution engine status

time()-engine.start_time                        : 8.62972998619
engine.has_capacity()                           : False
len(engine.downloader.active)                   : 16
engine.scraper.is_idle()                        : False
engine.spider.name                              : followall
engine.spider_is_idle(engine.spider)            : False
engine.slot.closing                             : False
len(engine.slot.inprogress)                     : 16
len(engine.slot.scheduler.dqs or [])            : 0
len(engine.slot.scheduler.mqs)                  : 92
len(engine.scraper.slot.queue)                  : 0
len(engine.scraper.slot.active)                 : 0
engine.scraper.slot.active_size                 : 0
engine.scraper.slot.itemproc_size               : 0
engine.scraper.slot.needs_backout()             : False

Telnet 控制檯訊號

您可以使用 telnet 控制檯訊號在 telnet 本地名稱空間中新增、更新或刪除變數。要執行此操作,您需要在處理程式中新增 telnet_vars 字典。

scrapy.extensions.telnet.update_telnet_vars(telnet_vars)

引數:

telnet_vars (dict)

其中,dict 是包含 telnet 變數的字典。

Telnet 設定

下表顯示了控制 Telnet 控制檯行為的設定:

序號 設定 & 描述 預設值
1

TELNETCONSOLE_PORT

指的是 telnet 控制檯的埠範圍。如果設定為 None,則埠將被動態分配。

[6023, 6073]
2

TELNETCONSOLE_HOST

指的是 telnet 控制檯應監聽的介面。

'127.0.0.1'
廣告

© . All rights reserved.