機器學習數學



機器學習是一個跨學科領域,涉及計算機科學、統計學和數學。特別是,數學在開發和理解機器學習演算法方面起著至關重要的作用。本章將討論機器學習必不可少的數學概念,包括線性代數、微積分、機率論和統計學。

線性代數

線性代數是處理線性方程及其在向量空間中表示的數學分支。在機器學習中,線性代數用於表示和操作資料。特別是,向量和矩陣用於表示和操作機器學習模型中的資料點、特徵和權重。

向量是有序的數字列表,而矩陣是數字的矩形陣列。例如,向量可以表示單個數據點,而矩陣可以表示資料集。線性代數運算(例如矩陣乘法和求逆)可用於轉換和分析資料。

以下是突出了其在機器學習中重要性的一些重要的線性代數概念:

  • 向量和矩陣 - 向量和矩陣用於表示資料集、特徵、目標值、權重等。
  • 矩陣運算 - 加法、乘法、減法和轉置等運算用於所有機器學習演算法。
  • 特徵值和特徵向量 - 這些在與降維相關的演算法(如主成分分析 (PCA))中非常有用。
  • 投影 - 超平面和到平面的投影的概念對於理解支援向量機 (SVM) 至關重要。
  • 分解 - 矩陣分解和奇異值分解 (SVD) 用於提取資料集中重要資訊。
  • 張量 - 張量用於深度學習中表示多維資料。張量可以表示標量、向量或矩陣。
  • 梯度 - 梯度用於查詢模型引數的最佳值。
  • 雅可比矩陣 - 雅可比矩陣用於分析機器學習模型中輸入和輸出變數之間的關係。
  • 正交性 - 這是在主成分分析 (PCA)、支援向量機 (SVM) 等演算法中使用的核心概念。

微積分

微積分是處理變化率和累積的數學分支。在機器學習中,微積分用於透過找到函式的最小值或最大值來最佳化模型。特別是,廣泛使用的最佳化演算法梯度下降法是基於微積分的。

梯度下降是一種迭代最佳化演算法,它根據損失函式的梯度更新模型的權重。梯度是損失函式相對於每個權重的偏導數的向量。透過迭代地沿負梯度方向更新權重,梯度下降試圖最小化損失函式。

以下是機器學習必不可少的一些重要的微積分概念:

  • 函式 - 函式是機器學習的核心。在機器學習中,模型在訓練階段學習輸入和輸出之間的函式。您應該學習函式的基礎知識,包括連續函式和離散函式。
  • 導數、梯度和斜率 - 這些是理解最佳化演算法(如梯度下降)如何工作的核心概念。
  • 偏導數 - 這些用於查詢函式的最大值或最小值。通常用於最佳化演算法。
  • 鏈式法則 - 鏈式法則用於計算具有多個變數的損失函式的導數。您可以在神經網路中看到鏈式法則的主要應用。
  • 最佳化方法 - 這些方法用於查詢最小化成本函式的引數的最佳值。梯度下降是最常用的最佳化方法之一。

機率論

機率論是處理不確定性和隨機性的數學分支。在機器學習中,機率論用於對不確定或可變的資料進行建模和分析。特別是,高斯分佈和泊松分佈等機率分佈用於對資料點或事件的機率進行建模。

貝葉斯推理是一種機率建模技術,也廣泛用於機器學習。貝葉斯推理基於貝葉斯定理,該定理指出,給定資料的假設機率與給定假設的資料機率乘以假設的先驗機率成正比。透過根據觀察到的資料更新先驗機率,貝葉斯推理可以進行機率預測或分類。

以下是機器學習必不可少的一些重要的機率論概念:

  • 簡單機率 - 它是機器學習中的一個基本概念。所有分類問題都使用機率概念。SoftMax 函式在人工神經網路中使用簡單機率。
  • 條件機率 - 像樸素貝葉斯分類器這樣的分類演算法是基於條件機率的。
  • 隨機變數 - 隨機變數用於為模型引數分配初始值。引數初始化被認為是訓練過程的開始。
  • 機率分佈 - 這些用於查詢分類問題的損失函式。
  • 連續和離散分佈 - 這些分佈用於對機器學習中的不同型別的資料進行建模。
  • 分佈函式 - 這些函式通常用於對線性迴歸和其他統計模型中的誤差項的分佈進行建模。
  • 最大似然估計 - 它是用於分類問題的一些機器學習和深度學習方法的基礎。

統計學

統計學是處理資料的收集、分析、解釋和呈現的數學分支。在機器學習中,統計學用於評估和比較模型、估計模型引數和檢驗假設。

例如,交叉驗證是一種統計技術,用於評估模型在新資料(未見資料)上的效能。在交叉驗證中,資料集被分成多個子集,模型在每個子集上進行訓練和評估。這允許我們估計模型在新資料上的效能,並比較不同的模型。

以下是機器學習中一些重要的統計概念:

  • 均值、中位數、眾數 − 這些度量用於理解資料的分佈並識別異常值。
  • 標準差、方差 − 這些用於理解資料集的變異性並檢測異常值。
  • 百分位數 − 這些用於總結資料集的分佈並識別異常值。
  • 資料分佈 − 指的是資料點在一個數據集中是如何分佈或分散的。
  • 偏度和峰度 − 這是機器學習中機率分佈形狀的兩個重要度量。
  • 偏差和方差 − 它們描述了模型預測中誤差的來源。
  • 假設檢驗 − 它是一個可以利用資料進行檢驗和驗證的初步假設或想法。
  • 線性迴歸 − 它是監督機器學習中最常用的迴歸演算法。
  • 邏輯迴歸 − 它也是一個重要的監督學習演算法,主要用於機器學習。
  • 主成分分析 − 主要用於機器學習中的降維。
廣告