
- H2O 教程
- H2O - 首頁
- H2O - 簡介
- H2O - 安裝
- H2O - 流程
- H2O - 執行示例應用程式
- H2O - 自動機器學習 (AutoML)
- H2O 有用資源
- H2O - 快速指南
- H2O - 有用資源
- H2O - 討論
H2O - 簡介
您是否曾經被要求在一個巨大的資料庫上開發機器學習模型?通常,客戶會提供資料庫並要求您進行某些預測,例如誰將是潛在的購買者;是否可以提前檢測到欺詐案件等。為了回答這些問題,您的任務將是開發一種機器學習演算法,該演算法可以為客戶的查詢提供答案。從頭開始開發機器學習演算法並非易事,並且當市場上有多個現成的機器學習庫可用時,為什麼要這樣做呢?
如今,您更願意使用這些庫,從這些庫中應用經過充分測試的演算法並檢視其效能。如果效能不在可接受的範圍內,您將嘗試微調當前演算法或嘗試完全不同的演算法。
同樣,您可以在同一資料集上嘗試多種演算法,然後選擇最能滿足客戶需求的演算法。這就是 H2O 能幫助您的地方。它是一個開源機器學習框架,具有多種廣泛接受的 ML 演算法的完整測試實現。您只需從其龐大的儲存庫中選擇演算法並將其應用於您的資料集即可。它包含最常用的統計和 ML 演算法。
在此列舉一些,包括梯度提升機 (GBM)、廣義線性模型 (GLM)、深度學習等等。不僅如此,它還支援 AutoML 功能,該功能將對不同演算法在您的資料集上的效能進行排名,從而減少您查詢最佳效能模型的工作量。H2O 在全球 18000 多個組織中使用,並且與 R 和 Python 很好地整合,方便您開發。它是一個記憶體平臺,提供卓越的效能。
在本教程中,您將首先學習如何在您的機器上使用 Python 和 R 選項安裝 H2O。我們將瞭解如何在命令列中使用它,以便您逐行了解其工作原理。如果您是 Python 愛好者,您可以使用 Jupyter 或您選擇的任何其他 IDE 開發 H2O 應用程式。如果您更喜歡 R,您可以使用 RStudio 進行開發。
在本教程中,我們將考慮一個示例,以瞭解如何使用 H2O。我們還將學習如何在程式程式碼中更改演算法並將其效能與之前的演算法進行比較。H2O 還提供了一個基於 Web 的工具來測試資料集上的不同演算法。這稱為 Flow。
本教程將向您介紹 Flow 的使用方法。同時,我們將討論 AutoML 的使用方法,該方法將識別資料集上效能最佳的演算法。您是否很期待學習 H2O?繼續閱讀!