課程 說明
在本課程中,我們將教你如何編寫一個充當機器人的程式,搜尋不同的網站以獲取您需要的資訊。與大多數使用高階模組的網路爬蟲和網路抓取課程(實際上您只是複製貼上程式碼)不同,在本課程中,我們將首先教你網路爬蟲所需的所有網路概念。
網路部分
所以,如果我們想先編寫一些程式碼,我們會先解釋程式碼背後的網路細節,然後說明程式碼為什麼能實現其功能。在理論上解釋完所有內容後,我們會實際操作並在 Wireshark 中探索以上所有概念。這樣,您將熟悉 TCP/IP、網路地址轉換、套接字等概念。在網路部分之後,我們將開始程式設計部分。
程式設計部分
在本部分中,我們首先使用像 requests 這樣的高階模組。我們將學習如何傳送 HTTP 請求並接收相關的 HTTP 響應。之後,我們將深入探討 Python 中的 socket 模組,它是 Python 網路程式設計中最重要的模組。因此,我們將建立一個套接字,並學習該模組中的不同方法,藉助這些方法,我們將開始向 Web 伺服器傳送和接收資料,反之亦然。並且我們將學習如何搜尋這些資料以獲取我們最感興趣和有用的資訊。之後,我們將透過使 Kali Linux 充當 Web 伺服器來提供網頁,從而建立一個網站,並學習如何搜尋不同的頁面以查詢電子郵件地址、連結等。
目標
- Python 程式設計
- 套接字程式設計
- Python 中的套接字程式設計
- 網路基礎
- HTTP 和 HTTPS 協議
- 建立網路爬蟲
課程大綱
檢視課程內容的詳細分解
網路基礎和網路爬蟲
16 節課
-
1- 簡介 - 您將在本課程中學到什麼 02:20 02:20
-
2- 簡介 - 什麼是網路爬蟲 11:54 11:54
-
3- TCP/IP 資料包格式 09:36 09:36
-
4- 什麼是套接字 03:27 03:27
-
5- IP 地址 03:55 03:55
-
6- NAT(網路地址轉換) 05:59 05:59
-
7- Wireshark 中的 NAT 04:36 04:36
-
8- 使用 Python requests 模組傳送 HTTP GET 請求 09:01 09:01
-
9- 使用 Python requests 模組傳送 HTTP POST 請求 07:45 07:45
-
10- 如何在 Python 中建立套接字以傳送資料 09:55 09:55
-
11- 如何使用 Python 中的 socket 模組傳送 HTTP 請求 05:30 05:3
-
12- 如何使用套接字接收 HTTP 響應 07:11 07:11
-
13- re 模組(正則表示式) 07:29 07:29
-
14- 列印網頁中的所有連結和電子郵件 16:20 16:20
-
15- 使用 Apache 和 Python 將 Linux 作為 Web 伺服器 12:31 12:31
-
16- 在不同的網頁中搜索電子郵件地址 10:19 10:19
講師 資訊
mgh gh
課程 證書
使用您的證書來改變職業生涯或在您目前的職業生涯中提升自己。
我們的學生與
最佳
相關影片課程
檢視更多

