關聯規則的工作原理是什麼?
關聯規則學習是一種無監督學習方法,它測試一個數據元素對另一個數據元素的依賴性,並建立相應的規則以提高效率。它試圖發現數據集變數之間的一些有趣關係或關聯。它依賴於多條規則來發現資料庫中變數之間的有趣關係。
關聯規則學習是機器學習中一項重要的技術,它被應用於市場籃子分析、Web使用挖掘、持續生產等領域。在市場籃子分析中,它被許多大型零售商廣泛用於查詢商品之間的關係。
在市場籃子分析中,透過發現使用者購物籃中不同商品之間的關聯來分析使用者的購買習慣。透過發現這些關聯,零售商可以分析使用者通常購買哪些商品,從而制定營銷策略。這種關聯可以透過選擇性營銷和貨架空間設計來影響銷售額的增長。
多層關聯規則的著名應用領域是市場籃子分析,它透過查詢經常一起購買的商品組合來了解使用者的購買習慣,這體現在概念層次結構的概念中。
關聯規則始於包含一種或多種產品或服務的交易,以及關於交易的一些基本資料。為了分析的目的,產品和服務被稱為專案。
這些交易通常只包含購買的商品。它可以使用諸如日期和時間以及使用者是使用現金還是信用卡付款等資料。
每筆交易都為我們提供了哪些產品與哪些其他產品一起購買的資料。這顯示在一個共現表中,該表顯示某些產品對一起購買的次數。
這些觀察結果是關聯的例項,可以暗示一個正式規則,例如,如果使用者購買蘇打水,那麼使用者也會購買橙汁。在資料中,五筆交易中的兩筆包含蘇打水和橙汁。這兩筆交易構成了該規則。該規則的支援度為五分之二,或 40%。
由於包含蘇打水的兩筆交易也包含橙汁,因此該規則的置信度也很高。因為三筆包含蘇打水的交易中有兩筆也包含橙汁,所以規則“如果蘇打水,則橙汁”的置信度為 67%。反向規則“如果橙汁,則蘇打水”的置信度較低。
廣告