解釋得很好
PySpark 和 AWS:使用 PySpark 和 AWS 掌握大資料
掌握 Spark、Pyspark、AWS、Spark 應用程式、Spark 生態系統、Hadoop 和 PySpark 精通
講座 -149
時長 -16 小時
終身訪問
課程描述
Python 和 Apache Spark 是大資料分析領域當前的熱門詞彙。藉助 PySpark,Python 和 Apache Spark 可以協同工作。您將從本課程的基礎知識開始,逐步深入到更復雜的資料分析層面。您將學習如何使用 PySpark 執行端到端的流程,從資料清洗到特徵建立和機器學習模型的實現。
在整個課程中,您將使用 PySpark 進行資料分析。您將研究 Spark RDD、Dataframes 以及少量的 Spark SQL。您還將研究可以使用 Spark RDD 和資料幀進行的資料轉換和操作。此外,您還將研究 Spark 和 Hadoop 的生態系統以及底層架構。為了執行 Spark 指令碼,您將使用 Databricks 環境,您也將有機會對此進行研究。
最終,AWS 雲將讓您體驗 Spark。您將瞭解如何將 AWS 用於計算、資料庫和儲存,以及 Spark 如何與各種 AWS 服務互動以獲取其所需的資料。
課程概述
本課程中的每個理論解釋之後都緊跟著一個實踐應用。
本課程旨在反映僱主最看重的能力。您將學習與 PySpark 相關的所有基礎理論和實踐。
本課程是
- 易於理解的。
- 表達清晰的。
- 全面深入的。
- 包含即時編碼的實踐操作的。
- 涵蓋該領域的最新技術和前沿知識的。
本課程對所有基礎知識的全面綜合將鼓勵您快速進步,並獲得超出您所學內容的經驗。您將獲得作業、任務、活動、測驗和解答,並在每個課程結束時提供。基於您之前獲得的概念和技術,這是為了評估和促進您的學習。由於目標是讓您開始進行實施,因此大多數練習都將涉及程式碼。
本課程的一些優勢包括高質量的影片內容、全面的課程材料、評估問題、完整的課程筆記和教育講義。如果您對課程有任何疑問,請隨時聯絡我們樂於助人的工作人員。我們承諾及時回覆。
課程大綱包括 140 多個短影片。除了瞭解 PySpark 和 AWS 的原理和方法論外,您還將獲得許多有用的實施技能。高畫質影片的執行時間約為 16 小時。
為什麼要學習 PySpark 和 AWS?
PySpark 是實現這一魔法的 Python 庫。
由於對 Spark 專業人員的需求量很大,而且薪酬很高,因此學習 PySpark 非常值得。與其他大資料解決方案相比,PySpark 正在以驚人的速度用於處理大資料。
AWS 是增長最快的公共雲,於 2006 年推出。現在是利用您對雲計算知識,特別是 Amazon 的知識的時候了。
完成本課程後,您將能夠將Spark和AWS的概念和實踐應用於現實世界的問題。您將能夠從零開始實施任何需要PySpark知識的專案。您還將瞭解PySpark和AWS的理論和實踐方面。
課程物件
- PySpark和AWS的初學者以及完全不懂的人。
- 想要開發智慧解決方案的人。
- 想要學習PySpark和AWS的人。
- 喜歡在使用Python實施之前先學習理論概念的人。
- 想要學習PySpark及其在實際專案中的應用的人。
- 大資料科學家。
- 大資料工程師。
目標
- 介紹大資料及其重要性。
- PySpark的實踐講解和現場編碼。
- Spark應用
- Spark生態系統
- Spark架構
- Hadoop生態系統
- Hadoop架構
- PySpark RDD
- PySpark RDD轉換
- PySpark RDD操作
- PySpark DataFrame
- PySpark DataFrame轉換
- PySpark DataFrame操作
- PySpark中的協同過濾
- Spark流處理
- ETL管道
- CDC和持續複製
先決條件
- 具備Python程式設計基礎。
- 對程式設計有基本的瞭解。
- 有學習和實踐的意願。
課程大綱
檢視課程內容的詳細分解
簡介
5 節課
-
為什麼選擇大資料 03:11 03:11
-
PySpark的應用 03:12 03:12
-
教師介紹 00:46 00:46
-
課程介紹 01:49 01:49
-
專案概述 03:25 03:25
Hadoop、Spark 生態系統和架構簡介
11 個講座
Spark DF
40 節課
Spark Streaming
9 節課
專案 - 更改資料捕獲/複製正在進行
25 節課
講師 詳情
Packt 出版社
課程 證書
使用您的證書來改變職業或在您目前的職業中提升。
我們的學生工作
與 最佳
反饋
非常有幫助。
相關 影片課程
檢視更多
