使用 Python Selenium 訪問 HTML 原始碼。


我們可以使用 Selenium webdriver 訪問 HTML 原始碼。我們可以藉助 **page_source** 方法,並將其獲取的值在控制檯中打印出來。

語法

src = driver.page_source

我們還可以藉助 Selenium 中的 Javascript 命令訪問 HTML 原始碼。我們將藉助 **execute_script** 方法,並將命令 **return document.body.innerHTML** 作為引數傳遞給該方法。

語法

h = driver.execute_script("return document.body.innerHTML;")

示例

程式碼實現。

from selenium import webdriver
driver = webdriver.Chrome(executable_path="C:\chromedriver.exe")
driver.implicitly_wait(0.5)
driver.get("https://tutorialspoint.tw/index.htm")
# access HTML source code with page_source method
s = driver.page_source
print(s)

使用 Javascript 執行器的程式碼實現。

from selenium import webdriver
driver = webdriver.Chrome(executable_path="C:\chromedriver.exe")
driver.implicitly_wait(0.5)
driver.get("https://tutorialspoint.tw/index.htm")
# access HTML source code with Javascript command
h = driver.execute_script("return document.body.innerHTML")
print(h)

更新時間:26-10-2020

3K+ 瀏覽

開啟你的 職業生涯

透過完成課程獲得認證

立即開始
廣告
© . All rights reserved.