使用 Python Selenium 訪問 HTML 原始碼。
我們可以使用 Selenium webdriver 訪問 HTML 原始碼。我們可以藉助 **page_source** 方法,並將其獲取的值在控制檯中打印出來。
語法
src = driver.page_source
我們還可以藉助 Selenium 中的 Javascript 命令訪問 HTML 原始碼。我們將藉助 **execute_script** 方法,並將命令 **return document.body.innerHTML** 作為引數傳遞給該方法。
語法
h = driver.execute_script("return document.body.innerHTML;")示例
程式碼實現。
from selenium import webdriver
driver = webdriver.Chrome(executable_path="C:\chromedriver.exe")
driver.implicitly_wait(0.5)
driver.get("https://tutorialspoint.tw/index.htm")
# access HTML source code with page_source method
s = driver.page_source
print(s)使用 Javascript 執行器的程式碼實現。
from selenium import webdriver
driver = webdriver.Chrome(executable_path="C:\chromedriver.exe")
driver.implicitly_wait(0.5)
driver.get("https://tutorialspoint.tw/index.htm")
# access HTML source code with Javascript command
h = driver.execute_script("return document.body.innerHTML")
print(h)
廣告
資料結構
網路
RDBMS
作業系統
Java
iOS
HTML
CSS
Android
Python
C 程式設計
C++
C#
MongoDB
MySQL
Javascript
PHP