Weka - 啟動資源管理器
在本章中,讓我們深入瞭解資源管理器提供的各種功能,這些功能可用於處理大資料。
當您在“應用程式”選擇器中單擊“資源管理器”按鈕時,將開啟以下螢幕:
在頂部,您將看到以下幾個選項卡:
- 預處理
- 分類
- 聚類
- 關聯
- 選擇屬性
- 視覺化
在這些選項卡下,有幾個預先實現的機器學習演算法。現在讓我們詳細瞭解一下每個演算法。
預處理選項卡
最初,當您開啟資源管理器時,只有“預處理”選項卡可用。機器學習的第一步是對資料進行預處理。因此,在“預處理”選項中,您將選擇資料檔案,對其進行處理並使其適合應用各種機器學習演算法。
分類選項卡
“分類”選項卡為您提供了多種用於對資料進行分類的機器學習演算法。舉幾個例子,您可以應用線性迴歸、邏輯迴歸、支援向量機、決策樹、隨機樹、隨機森林、樸素貝葉斯等演算法。列表非常詳盡,提供了監督和無監督機器學習演算法。
聚類選項卡
在“聚類”選項卡下,提供了多種聚類演算法,例如 SimpleKMeans、FilteredClusterer、HierarchicalClusterer 等。
關聯選項卡
在“關聯”選項卡下,您將找到 Apriori、FilteredAssociator 和 FPGrowth。
選擇屬性選項卡
“選擇屬性”允許您基於多種演算法(例如 ClassifierSubsetEval、PrinicipalComponents 等)進行特徵選擇。
視覺化選項卡
最後,“視覺化”選項允許您視覺化已處理的資料以進行分析。
如您所見,WEKA 提供了多種現成的演算法,用於測試和構建您的機器學習應用程式。要有效地使用 WEKA,您必須對這些演算法有紮實的瞭解,瞭解它們的工作原理,在什麼情況下選擇哪種演算法,在處理後的輸出中尋找什麼等等。簡而言之,您必須擁有機器學習的堅實基礎才能有效地使用 WEKA 構建您的應用程式。
在接下來的章節中,您將深入研究資源管理器中的每個選項卡。
廣告