什麼是Weka資料探勘？

資料探勘資料庫資料結構

Weka 是一套用於資料探勘服務的機器學習演算法。這些演算法可以直接應用於資料集，也可以從您自己的 Java 程式中使用。它包括用於資料預處理、分類、迴歸、聚類、關聯規則和視覺化的工具。它也適用於生成新的機器學習方案。

使用 Weka 的一種方法是將學習方法應用於資料集並分析其輸出以瞭解更多關於記錄的資訊。第二種方法是需要學習的模型來對新例項進行預測。

第三種方法是使用多個學習器並比較它們的效能以選擇一個用於預測。在互動式 Weka 介面中，它可以從選單中選擇所需的學習方法。幾種方法具有可調引數，可以透過屬性表或物件編輯器建立。一個通用的計算結構用於計算所有分類器的效能。

它可以顯示如何使用不同的過濾器，列出過濾演算法並描述其引數。Weka 還包括學習關聯規則、聚類未指定類值的的資料以及選擇資料中相關屬性的演算法的實現。

使用 Weka 的最簡單方法是透過一個稱為 Explorer 的圖形使用者介面。這可以透過選單選擇和表單填寫訪問其一些功能。例如，它可以快速從 ARFF 文件（或電子表格）中讀取資料集並從中構建決策樹。

Explorer 介面透過將選擇顯示為選單、透過使選擇變灰直到它們適合為止強制我們按合適的順序工作以及透過顯示要填寫的表單來提供選項，從而為我們提供幫助。它有利於在滑鼠經過螢幕上的元素時彈出工具提示以瞭解它們的作用。合理的預設值提供了一種方法，使我們能夠以最少的努力獲得結果——但我們將不得不思考它是什麼才能理解結果的含義。

Knowledge Flow 介面允許我們建立用於流式資訊處理的結構。Explorer 介面的侷限性在於，它會將所有內容都載入到主記憶體中，當它可以開啟資料集時，它會直接載入所有內容。

這意味著 Explorer 可用於中小型問題。但是，Weka 包含一些可用於處理大型資料集的增量演算法。Knowledge Flow 介面允許我們圍繞螢幕拖動定義學習演算法和資料來源的框，並將它們連線到所需的配置中。

它允許我們透過連線定義資料來源、預處理工具、學習演算法、計算方法和視覺化模組的元件來定義資料流。如果過濾器和學習演算法適合增量學習，則資料將被額外載入和處理。

Ginni

更新時間： 2022年2月11日

522 次檢視

開啟你的職業生涯

透過完成課程獲得認證

廣告

© . All rights reserved.