什麼是關聯規則學習?


關聯規則學習是一種無監督學習技術,它測試一個數據元素對另一個數據元素的依賴性,並進行適當的設計,使其更具成本效益。它試圖發現數據集變數之間的一些有趣的關係或關聯。它依賴於各種規則來發現資料庫中變數之間的有趣關係。

關聯規則學習是機器學習中最重要的方法之一,它被應用於市場籃子分析、網頁使用挖掘、持續生產等領域。在市場籃子分析中,它是許多大型零售商用來發現商品之間關係的一種方法。

網頁挖掘可以被視為將適應性資料探勘方法應用於網際網路,儘管資料探勘被定義為應用演算法來發現主要結構化資料中的模式,並將其固定到知識發現過程中。

網頁挖掘具有支援多個數據型別集合的獨特屬性。網路具有多個方面,為挖掘過程提供了多種方法,例如包含文字的網頁、透過超連結連線的網頁,以及可以透過網路伺服器日誌監控的使用者活動。

在市場籃子分析中,透過發現客戶購物籃中不同商品之間的關聯來分析客戶的購買習慣。透過發現此類關聯,零售商可以透過分析使用者經常購買哪些商品來制定營銷方法。這種關聯可以透過支援零售商進行選擇性營銷和計劃貨架區域來提高銷售額。

關聯規則學習的型別

關聯規則學習有以下幾種型別:

Apriori 演算法 - 該演算法需要頻繁資料集來生成關聯規則。它被設計用於處理包含事務的資料庫。該演算法需要廣度優先搜尋和雜湊樹來有效地計算項集。

它通常用於市場籃子分析和支援學習可以一起購買的產品。它可以用於醫療保健領域,以發現患者的藥物反應。

Eclat 演算法 - Eclat 演算法代表等價類轉換。該演算法需要深度優先搜尋方法來發現事務資料庫中的頻繁項集。它實現了比 Apriori 演算法更快的執行速度。

FP-Growth 演算法 - FP-Growth 演算法代表頻繁模式。它是 Apriori 演算法的增強版本。它以樹結構的形式描述資料庫,稱為頻繁模式樹。這棵頻繁樹旨在提取最頻繁的模式。

更新於: 2022年2月15日

5K+ 次瀏覽

開啟你的 職業生涯

透過完成課程獲得認證

開始學習
廣告