Tutorialspoint

黑色星期五,享受史最低價! 使用:BFS8

使用套接字程式設計在 Python 中建立網路爬蟲

人物圖示 Mgh Gh

4.5

使用套接字程式設計在 Python 中建立網路爬蟲

如何使用 Python 搜尋不同的網頁以獲取電子郵件地址、影像和其他有用資訊

更新於圖示 更新於 2024 年 9 月

語言圖示 語言 - 英語

人物圖示 Mgh Gh

英語 [CC]

類別圖示 開發,程式語言,

講座 -17

時長 -2 小時

終身訪問

4.5

price-loader

培訓 5 人或更多人?

讓您的團隊隨時隨地訪問 Tutorials Point 10000 多門頂級課程。

課程 說明

在本課程中,我們將教你如何編寫一個充當機器人的程式,搜尋不同的網站以獲取您需要的資訊。與大多數使用高階模組的網路爬蟲和網路抓取課程(實際上您只是複製貼上程式碼)不同,在本課程中,我們將首先教你網路爬蟲所需的所有網路概念。

網路部分

所以,如果我們想先編寫一些程式碼,我們會先解釋程式碼背後的網路細節,然後說明程式碼為什麼能實現其功能。在理論上解釋完所有內容後,我們會實際操作並在 Wireshark 中探索以上所有概念。這樣,您將熟悉 TCP/IP、網路地址轉換、套接字等概念。在網路部分之後,我們將開始程式設計部分。

程式設計部分
在本部分中,我們首先使用像 requests 這樣的高階模組。我們將學習如何傳送 HTTP 請求並接收相關的 HTTP 響應。之後,我們將深入探討 Python 中的 socket 模組,它是 Python 網路程式設計中最重要的模組。因此,我們將建立一個套接字,並學習該模組中的不同方法,藉助這些方法,我們將開始向 Web 伺服器傳送和接收資料,反之亦然。並且我們將學習如何搜尋這些資料以獲取我們最感興趣和有用的資訊。之後,我們將透過使 Kali Linux 充當 Web 伺服器來提供網頁,從而建立一個網站,並學習如何搜尋不同的頁面以查詢電子郵件地址、連結等。

目標

  • Python 程式設計
  • 套接字程式設計
  • Python 中的套接字程式設計
  • 網路基礎
  • HTTP 和 HTTPS 協議
  • 建立網路爬蟲
Creating a Web Crawler in Python using Socket Programming

課程大綱

檢視課程內容的詳細分解

網路基礎和網路爬蟲
16 節課
  • 播放圖示 1- 簡介 - 您將在本課程中學到什麼 02:20 02:20
  • 播放圖示 2- 簡介 - 什麼是網路爬蟲 11:54 11:54
  • 播放圖示 3- TCP/IP 資料包格式 09:36 09:36
  • 播放圖示 4- 什麼是套接字 03:27 03:27
  • 播放圖示 5- IP 地址 03:55 03:55
  • 播放圖示 6- NAT(網路地址轉換) 05:59 05:59
  • 播放圖示 7- Wireshark 中的 NAT 04:36 04:36
  • 播放圖示 8- 使用 Python requests 模組傳送 HTTP GET 請求 09:01 09:01
  • 播放圖示 9- 使用 Python requests 模組傳送 HTTP POST 請求 07:45 07:45
  • 播放圖示 10- 如何在 Python 中建立套接字以傳送資料 09:55 09:55
  • 播放圖示 11- 如何使用 Python 中的 socket 模組傳送 HTTP 請求 05:30 05:3
  • 播放圖示 12- 如何使用套接字接收 HTTP 響應 07:11 07:11
  • 播放圖示 13- re 模組(正則表示式) 07:29 07:29
  • 播放圖示 14- 列印網頁中的所有連結和電子郵件 16:20 16:20
  • 播放圖示 15- 使用 Apache 和 Python 將 Linux 作為 Web 伺服器 12:31 12:31
  • 播放圖示 16- 在不同的網頁中搜索電子郵件地址 10:19 10:19

講師 資訊

user profile image

mgh gh

課程 證書

使用您的證書來改變職業生涯或在您目前的職業生涯中提升自己。

sample Tutorialspoint certificate

我們的學生與

相關影片課程

檢視更多

年度會員

成為 Tutorials Point 的尊貴會員,享受我們龐大的頂級影片課程庫的無限訪問許可權。

立即訂閱
Annual Membership

線上認證

掌握主流技術,成為受人尊敬的認證專業人士。

立即探索
Online Certifications

聯絡我們

1800-202-0515

© . All rights reserved.