Tutorialspoint

黑色星期五,享受歷史最低價! 使用優惠碼:BFS8

PySpark 和 AWS:使用 PySpark 和 AWS 掌握大資料

個人圖示 Packt 出版社

4.5

PySpark 和 AWS:使用 PySpark 和 AWS 掌握大資料

掌握 Spark、Pyspark、AWS、Spark 應用程式、Spark 生態系統、Hadoop 和 PySpark 精通

更新時間圖示 更新於 2024 年 9 月

語言圖示 語言 - 英語

個人圖示 Packt 出版社

英語 [CC]

類別圖示 開發,資料科學,大資料

講座 -149

時長 -16 小時

終身訪問

4.5

price-loader

終身訪問

30 天退款保證

培訓 5 人或以上?

讓您的團隊隨時隨地訪問 Tutorials Point 上 10000 多門頂級課程。

課程描述

Python 和 Apache Spark 是大資料分析領域當前的熱門詞彙。藉助 PySpark,Python 和 Apache Spark 可以協同工作。您將從本課程的基礎知識開始,逐步深入到更復雜的資料分析層面。您將學習如何使用 PySpark 執行端到端的流程,從資料清洗到特徵建立和機器學習模型的實現。

在整個課程中,您將使用 PySpark 進行資料分析。您將研究 Spark RDD、Dataframes 以及少量的 Spark SQL。您還將研究可以使用 Spark RDD 和資料幀進行的資料轉換和操作。此外,您還將研究 Spark 和 Hadoop 的生態系統以及底層架構。為了執行 Spark 指令碼,您將使用 Databricks 環境,您也將有機會對此進行研究。

最終,AWS 雲將讓您體驗 Spark。您將瞭解如何將 AWS 用於計算、資料庫和儲存,以及 Spark 如何與各種 AWS 服務互動以獲取其所需的資料。

課程概述

本課程中的每個理論解釋之後都緊跟著一個實踐應用。

本課程旨在反映僱主最看重的能力。您將學習與 PySpark 相關的所有基礎理論和實踐。

本課程是

  • 易於理解的。
  • 表達清晰的。
  • 全面深入的。
  • 包含即時編碼的實踐操作的。
  • 涵蓋該領域的最新技術和前沿知識的。


本課程對所有基礎知識的全面綜合將鼓勵您快速進步,並獲得超出您所學內容的經驗。您將獲得作業、任務、活動、測驗和解答,並在每個課程結束時提供。基於您之前獲得的概念和技術,這是為了評估和促進您的學習。由於目標是讓您開始進行實施,因此大多數練習都將涉及程式碼。

本課程的一些優勢包括高質量的影片內容、全面的課程材料、評估問題、完整的課程筆記和教育講義。如果您對課程有任何疑問,請隨時聯絡我們樂於助人的工作人員。我們承諾及時回覆。

課程大綱包括 140 多個短影片。除了瞭解 PySpark 和 AWS 的原理和方法論外,您還將獲得許多有用的實施技能。高畫質影片的執行時間約為 16 小時。

為什麼要學習 PySpark 和 AWS?

PySpark 是實現這一魔法的 Python 庫。

由於對 Spark 專業人員的需求量很大,而且薪酬很高,因此學習 PySpark 非常值得。與其他大資料解決方案相比,PySpark 正在以驚人的速度用於處理大資料。

AWS 是增長最快的公共雲,於 2006 年推出。現在是利用您對雲計算知識,特別是 Amazon 的知識的時候了。

完成本課程後,您將能夠將Spark和AWS的概念和實踐應用於現實世界的問題。您將能夠從零開始實施任何需要PySpark知識的專案。您還將瞭解PySpark和AWS的理論和實踐方面。


課程物件

  • PySpark和AWS的初學者以及完全不懂的人。
  • 想要開發智慧解決方案的人。
  • 想要學習PySpark和AWS的人。
  • 喜歡在使用Python實施之前先學習理論概念的人。
  • 想要學習PySpark及其在實際專案中的應用的人。
  • 大資料科學家。
  • 大資料工程師。

目標

  • 介紹大資料及其重要性。
  • PySpark的實踐講解和現場編碼。
  • Spark應用
  • Spark生態系統
  • Spark架構
  • Hadoop生態系統
  • Hadoop架構
  • PySpark RDD
  • PySpark RDD轉換
  • PySpark RDD操作
  • PySpark DataFrame
  • PySpark DataFrame轉換
  • PySpark DataFrame操作
  • PySpark中的協同過濾
  • Spark流處理
  • ETL管道
  • CDC和持續複製

先決條件

  • 具備Python程式設計基礎。
  • 對程式設計有基本的瞭解。
  • 有學習和實踐的意願。
PySpark and AWS: Master Big Data With PySpark and AWS

課程大綱

檢視課程內容的詳細分解

簡介
5 節課
  • 播放圖示 為什麼選擇大資料 03:11 03:11
  • 播放圖示 PySpark的應用 03:12 03:12
  • 播放圖示 教師介紹 00:46 00:46
  • 播放圖示 課程介紹 01:49 01:49
  • 播放圖示 專案概述 03:25 03:25
Hadoop、Spark 生態系統和架構簡介
11 個講座
Tutorialspoint
Tutorialspoint
Spark DF
40 節課
Tutorialspoint
Tutorialspoint
Spark Streaming
9 節課
Tutorialspoint
Tutorialspoint
專案 - 更改資料捕獲/複製正在進行
25 節課
Tutorialspoint

講師 詳情

Packt Publishing

Packt 出版社

課程 證書

使用您的證書來改變職業或在您目前的職業中提升。

sample Tutorialspoint certificate

我們的學生工作
最佳

反饋

S

Shirin Satam

解釋得很好

A

Ashish Kumar Srivastav

非常有幫助。

相關 影片課程

檢視更多

年度會員

成為Tutorials Point的尊貴會員,並享受我們龐大的頂級影片課程庫的無限訪問許可權。

立即訂閱
Annual Membership

線上認證

掌握主要的熱門技術併成為受人尊敬的認證專業人士。

立即探索
Online Certifications

聯絡我們

1800-202-0515

© . All rights reserved.