解釋什麼是神經元,在機器學習中的神經網路的語境下。


神經元是一個數學函式,它接收一個或多個值作為輸入,並輸出一個單一的數值。

它可以定義如下:

這裡,'f' 指的是函式。

  • 我們首先計算輸入 xi 和權重 wi 的加權和。

  • 權重 wi 也稱為啟用值或啟用函式。

  • 輸入 xi 可以是表示輸入資料的數值,或者如果神經元屬於神經網路,它可以是來自其他神經元的輸出。

  • 權重 wi 是一個數值,可以用來表示輸入的強度或神經元之間連線連結的強度。

  • 權重 'b' 是一個特殊的稱為偏置的值,其輸入始終為 1。

  • 偏置 'b' 用於允許超平面從座標系的中心偏移。

  • 如果不使用偏置,神經元將具有有限的表示能力。

加權和的結果作為輸入傳遞給啟用函式 f,也稱為傳遞函式。

有不同型別的啟用函式,但它們都必須滿足非線性的要求。

一個重要的觀察結果是,神經元類似於邏輯迴歸和感知器。

神經元可以理解為邏輯迴歸和感知器演算法的廣義版本。如果使用邏輯函式或階躍函式作為啟用函式,則神經元可以分別用作邏輯迴歸或感知器。

此外,如果我們不使用任何啟用函式,神經元就變成了一個線性迴歸問題。

先前定義的啟用值可以解釋為向量 w 和向量 x 的點積。

如果 -,則向量 x 將垂直於權重向量 w。

因此,所有向量 x,

在特徵空間 Rn 中定義一個超平面,其中 n 是 x 的維度。

讓我們用簡單的術語來理解以上陳述 - 如果啟用函式是 f(x) = x,並且我們有一個單一的輸入值 x,則神經元的輸出變為 y = wx + b。這是線性方程。

這表明在單維輸入空間中,神經元基本上給出了直線的方程,即定義了一條直線。

如果我們對兩個或多個輸入視覺化相同內容,則神經元定義了一個平面。如果輸入維度是任意數量,則神經元定義了一個超平面。

感知器(神經元)僅適用於線性可分的類別,這是因為它定義了一個超平面。為了克服這一限制,神經元被組織成神經網路。

更新於:2020年12月10日

276 次瀏覽

開啟您的 職業生涯

透過完成課程獲得認證

開始學習
廣告