機器學習 - 模型

存在各種機器學習演算法、技術和方法，可用於構建模型，透過使用資料解決現實生活中的問題。在本章中，我們將討論這些不同型別的方法。

機器學習方法主要分為四種類型，根據人類監督進行分類：

監督學習
無監督學習
半監督學習
強化學習

在接下來的四章中，我們將詳細討論這些機器學習模型中的每一個。這裡，讓我們簡要概述一下這些方法。

監督學習

監督學習演算法或方法是最常用的ML演算法。此方法或學習演算法在訓練過程中採用資料樣本（即訓練資料）及其關聯的輸出（即標籤或響應），每個資料樣本都有相應的輸出。

監督學習演算法的主要目標是在執行多個訓練資料例項後，學習輸入資料樣本和對應輸出之間的關聯。

例如，我們有

x：輸入變數和

Y：輸出變數

現在，應用演算法學習從輸入到輸出的對映函式，如下所示：

Y=f(x)

現在，主要目標將是很好地逼近對映函式，以便即使當我們有新的輸入資料 (x) 時，我們也可以輕鬆地預測該新輸入資料的輸出變數 (Y)。

之所以稱為監督學習，是因為整個學習過程可以被認為是在老師或監督者的監督下進行的。監督機器學習演算法的示例包括決策樹、隨機森林、KNN、邏輯迴歸等。

根據ML任務，監督學習演算法可以分為以下兩大類：

分類
迴歸

迴歸

基於迴歸的任務的關鍵目標是預測輸出標籤或響應，這些響應是連續的數值，用於給定的輸入資料。輸出將基於模型在其訓練階段學到的內容。基本上，迴歸模型使用輸入資料特徵（自變數）及其對應的連續數值輸出值（因變數或結果變數）來學習輸入和對應輸出之間的特定關聯。我們將在後續章節中詳細討論迴歸和相關的演算法。

迴歸模型

以下是一些常見的迴歸模型：

無監督學習

顧名思義，無監督學習與監督ML方法或演算法相反，在無監督學習中，我們沒有任何監督者提供任何形式的指導。無監督學習演算法在以下場景中非常有用：我們不像在監督學習演算法中那樣有權使用預先標記的訓練資料，並且我們希望從輸入資料中提取有用的模式。

例如，可以理解為：

假設我們有：

x：輸入變數，則不會有相應的輸出變數，演算法需要發現數據中的有趣模式進行學習。

無監督機器學習演算法的示例包括K均值聚類、K近鄰等。

根據ML任務，無監督學習演算法可以分為以下兩大類：

聚類
關聯
降維

聚類

聚類方法是最有用的無監督ML方法之一。這些演算法用於查詢資料樣本之間的相似性和關係模式，然後根據特徵將這些樣本聚類到具有相似性的組中。聚類的現實世界示例是根據客戶的購買行為對客戶進行分組。

聚類模型

以下是一些常見的聚類模型：

關聯

另一種有用的無監督ML方法是關聯，它用於分析大型資料集以查詢模式，這些模式進一步表示各種專案之間的有趣關係。它也稱為關聯規則挖掘或市場籃子分析，主要用於分析客戶購物模式。

關聯模型

以下是一些常見的關聯模型：

Apriori演算法
Eclat演算法
FP-growth演算法

降維

此無監督ML方法用於透過選擇主要或代表性特徵集來減少每個資料樣本的特徵變數的數量。這裡出現了一個問題，那就是為什麼我們需要降低維度？其背後的原因是特徵空間複雜度問題，當我們開始分析和從資料樣本中提取數百萬個特徵時，就會出現這個問題。此問題通常稱為“維數災難”。PCA（主成分分析）、K近鄰和判別分析是為此目的的一些流行演算法。

降維模型

以下是一些常見的降維模型：

主成分分析(PCA)
自動編碼器
奇異值分解 (SVD)

異常檢測

這種無監督機器學習方法用於發現通常不會發生的罕見事件或觀測值的發生。透過使用學習到的知識，異常檢測方法能夠區分異常資料點和正常資料點。一些無監督演算法，如聚類和KNN，可以根據資料及其特徵檢測異常。

半監督學習

半監督學習演算法或方法既不是完全監督的，也不是完全無監督的。它們基本上介於兩者之間，即監督學習和無監督學習方法。這些型別的演算法通常使用少量監督學習元件，即少量預標記的註釋資料，以及大量無監督學習元件，即大量未標記資料進行訓練。我們可以遵循以下任何一種方法來實現半監督學習方法 -

第一種也是簡單的方法是基於少量標記和註釋的資料構建監督模型，然後透過將其應用於大量未標記資料來構建無監督模型，以獲得更多標記樣本。現在，在這些樣本上訓練模型並重復此過程。
第二種方法需要一些額外的努力。在這種方法中，我們可以首先使用無監督方法對類似的資料樣本進行聚類，對這些組進行註釋，然後使用此資訊的組合來訓練模型。

強化學習

強化學習方法不同於之前研究的方法，而且也很少使用。在這種型別的學習演算法中，會存在一個代理，我們希望在一段時間內對其進行訓練，以便它可以與特定環境互動。代理將遵循一組與環境互動的策略，然後在觀察環境後，它將根據環境的當前狀態採取行動。以下是強化學習方法的主要步驟 -

步驟 1 - 首先，我們需要為代理準備一些初始策略集。
步驟 2 - 然後觀察環境及其當前狀態。
步驟 3 - 接下來，根據環境的當前狀態選擇最佳策略並執行重要操作。
步驟 4 - 現在，代理可以根據其在上一步驟中採取的操作獲得相應的獎勵或懲罰。
步驟 5 - 現在，如果需要，我們可以更新策略。
步驟 6 - 最後，重複步驟 2-5，直到代理學會並採用最佳策略。

強化學習模型

以下是一些常見的強化學習演算法 -

Q學習
馬爾可夫決策過程 (MDP)
SARSA
DQN
DDPG

我們將在接下來的章節中詳細討論以上每個機器學習模型。

列印頁面