敏捷資料科學 - SparkML

機器學習庫也稱為“SparkML”或“MLLib”，包含常見的學習演算法，包括分類、迴歸、聚類和協同過濾。

為什麼學習 SparkML 用於敏捷？

Spark 正在成為構建機器學習演算法和應用程式的事實上的平臺。開發人員在 Spark 上工作以在 Spark 框架中以可擴充套件和簡潔的方式實現機器演算法。我們將學習機器學習的概念、其實用程式和演算法以及此框架。敏捷總是選擇一個能夠提供快速簡短結果的框架。

ML 演算法包括常見的學習演算法，例如分類、迴歸、聚類和協同過濾。

它包括特徵提取、轉換、降維和選擇。

管道提供用於構建、評估和調整機器學習管道的工具。

以下是幾個流行的演算法：

它包括根據過去的行為以及其他使用者做出的類似決策構建模型。此特定過濾模型用於預測使用者感興趣的專案。

它包括過濾專案的離散特徵，以便推薦並新增具有相似屬性的新專案。

在我們接下來的章節中，我們將重點關注使用推薦系統來解決特定問題並從敏捷方法論的角度改進預測效能。

列印頁面