Weka 是什麼?



WEKA 是一款開源軟體,它提供資料預處理工具、若干機器學習演算法的實現和視覺化工具,以便開發者能夠開發機器學習技術並將其用於實際的資料探勘問題。WEKA 提供的功能摘要如下所示 −

Weka Summarized

如果你觀察圖片流的開頭,就會發現處理大資料以使其適用於機器學習有很多步驟 −

首先,你會從現場收集的原始資料開始。此資料可能包含多個空值和不相關欄位。可使用 WEKA 中提供的資料預處理工具來清理資料。

然後,會將經過預處理的資料儲存到本地儲存中,以便應用機器學習演算法。

接下來,根據要開發的機器學習模型的型別,可以在“分類”、“聚類”或“關聯”等選項中選擇一個。屬性選擇可自動選擇特徵以建立縮減後的資料集。

請注意,在每個類別中,WEKA 都提供了若干演算法的實現。開發者可以選擇一種演算法,設定所需的引數,並在資料集上執行它。

隨後,WEKA 會提供模型處理的統計輸出。它提供了一個視覺化工具來檢查資料。

可以將各種模型應用於同一資料集。然後可以比較不同模型的輸出,並選擇最符合開發目標的模型。

因此,使用 WEKA 可以更快地開發機器學習模型。

既然已經瞭解了 WEKA 是什麼以及它有什麼作用,在下一章中,我們將學習如何將 WEKA 安裝到本地計算機。

廣告
© . All rights reserved.