Weka - 關聯規則



人們觀察到,購買啤酒的人同時也會購買尿布。也就是說,在購買啤酒和尿布之間存在關聯。儘管這看起來不太令人信服,但這條關聯規則是從大型超市資料庫中挖掘出來的。類似地,花生醬和麵包之間也可能存在關聯。

發現這種關聯對於超市來說至關重要,因為他們可以將尿布放在啤酒旁邊,以便顧客可以輕鬆找到這兩件商品,從而提高超市的銷售額。

Apriori 演算法是機器學習中的一種演算法,它可以找出可能的關聯並建立關聯規則。WEKA 提供了 Apriori 演算法的實現。在計算這些規則時,您可以定義最小支援度和可接受的置信度水平。您將把 Apriori 演算法應用於 WEKA 安裝中提供的 超市 資料。

載入資料

在 WEKA 瀏覽器中,開啟 預處理 選項卡,點選 開啟檔案 ... 按鈕,並從安裝資料夾中選擇 supermarket.arff 資料庫。資料載入完成後,您將看到以下螢幕 -

Loading Data

該資料庫包含 4627 個例項和 217 個屬性。您可以很容易地理解檢測如此大量的屬性之間的關聯有多麼困難。幸運的是,藉助 Apriori 演算法,此任務可以自動化。

關聯規則生成器

點選 關聯規則 選項卡,然後點選 選擇 按鈕。選擇 Apriori 關聯規則,如螢幕截圖所示 -

Associate Tab

要設定 Apriori 演算法的引數,請點選其名稱,將彈出一個視窗,如下所示,允許您設定引數 -

Apriori Algorithm

設定完引數後,點選 開始 按鈕。過一段時間後,您將看到結果,如下面的螢幕截圖所示 -

Start Parameters

在底部,您將找到檢測到的最佳關聯規則。這將有助於超市將其產品存放在合適的貨架上。

廣告

© . All rights reserved.