數學在機器學習工作中的作用


在嘗試理解一個跨學科領域(例如,機器學習)時,主要問題是如何多的數學是必要的,以及理解這些技術需要多少數學。

機器學習是關於數學的,它有助於計算從資料中可以獲得的收益以做出準確的預測。預測可以像從給定的一組影像中對狗或貓進行分類一樣簡單,或者根據過去的購買情況向客戶推薦哪些商品。因此,正確理解任何核心機器學習演算法背後的數學概念至關重要。這樣,它可以幫助您為您的資料科學和機器學習專案選擇合適的演算法。

機器學習基於數學需求,只要你能理解為什麼使用數學,它就很有趣。

機器學習中重要的數學概念

統計學

統計學是一個基本概念,每個有抱負的資料科學家都需要學習如何理解機器學習,同時處理諸如假設檢驗、邏輯迴歸、判別分析和分佈之類的概念。

假設你在學校裡學習統計學時遇到了困難。在這種情況下,你需要付出200%的努力來學習統計學的科學部分,因為這對於成為一名成功的資料科學家至關重要。更簡單地說,統計學是機器學習中數學的主要部分。

微積分

許多在學校不喜歡學習微積分的學生將會感到震驚,因為它是機器學習的必要組成部分。幸運的是,你不需要精通微積分;只需要學習和掌握微積分的基本原理。此外,你需要在模型構建過程中理解微積分在機器學習中的實際應用。

因此,如果你理解函式的導數如何在微積分中返回其變化率,你將能夠理解梯度下降的概念。在梯度下降中,我們需要找到函式的區域性最小值等等。如果你有鞍點或多個最小值,梯度下降可能會找到區域性最小值,而不是全域性最小值,除非你從不同的位置開始。資料科學中精通微積分的一些基本主題是——微分和積分微積分、偏導數、向量值函式、方向梯度、雅可比矩陣等等。

線性代數

理解如何構建線性方程對於建立核心機器學習演算法至關重要。這些將用於評估和觀察資料集,並且它也應用於像線性迴歸這樣的機器學習演算法。這些是理解用於機器學習的最佳化技術的必要概念。

我們使用線性代數來執行主成分分析(PCA),它用於降低資料的維數。基於線性代數的數學也廣泛用於神經網路中,用於處理和表示網路。你應該對基於線性代數的數學感興趣,因為它廣泛應用於資料科學。

但是,不要為此感到害怕,因為理解這些概念將非常重要。但是,你不需要成為線性代數專家就能解決大多數問題,對這些概念有紮實的理解就足夠了。如果一開始你難以應付數學,Marc Peter Deisenroth的《機器學習數學》是一本很好的書,可以幫助你開始這段旅程。

離散數學

離散數學關注的是非連續數,即最常見的整數。許多應用需要使用離散數。機器學習中的許多模型都是離散的。例如,神經網路具有整數個節點和連線,它不可能有0.65個節點或九分之一的連線。因此,構建神經網路的數學必須包含一個離散成分,即表示節點和連線數量的整數。

除非你希望處理關係域、圖形模型、組合問題、結構化預測等,否則你可以應付機器學習中離散數學的基礎知識。對於軟體工程專業的畢業生來說,幸運的是,這些概念在他們的學校裡得到了適當的講解。然而,其他人可能需要投入更多的時間來掌握這個主題。因此,離散數學是人工智慧和機器學習的重要組成部分。

機率論

為了正確地管理機器學習預測建模專案,推斷機率是必不可少的。機器學習是從不確定資料中建立預測模型的方法,不確定性涉及處理有缺陷或不完整的資料。不確定性對於機器學習至關重要,但卻是讓新手(特別是那些來自程式設計背景的人)最頭疼的部分之一。

即使藉助正確的機率工具,我們也可以估計問題的答案。

結論

數學已經成為我們日常生活的一部分。從我們醒來直到睡覺,我們在生活的每個部分都使用數學。然而,你可能會思考數學在機器學習中的重要性,以及是否以及如何利用它來解決任何現實世界的業務問題。

更新於:2023年6月12日

421 次瀏覽

啟動你的職業生涯

透過完成課程獲得認證

開始學習
廣告
© . All rights reserved.