相關係數和協方差之間是什麼關係?
簡單來說,相關性和協方差都表示兩個變數之間的關係和依賴性。
協方差顯示了在對變數應用函式時,變數之間線性關係路徑的方向。
相反,相關性則衡量了兩個變數之間線性關係的強度和方向。
簡單來說,相關性是協方差的函式。兩者之間的區別在於協方差值未標準化,而相關性值已標準化。兩個變數的相關係數可以透過將這兩個變數的協方差值除以給定值的標準差的乘積來獲得。
協方差是一種定量計算,它顯示了一個變數的偏差函式與其均值匹配的程度,以及另一個函式與其均值的偏差匹配的程度。它是一個數學關係,定義為 -
$$\mathrm{Cov(X,Y) = E[(X − E[X])(Y − E[Y])]}$$
在上式中,
如果 X 和 Y 都高於各自的均值,或者如果 X 和 Y 都低於各自的均值,則外部期望內的表示式將為正。
如果一個變數的值高於其均值,而另一個變數的值低於其均值,則該項變為負值。
如果該表示式的平均值為正,則這兩個隨機變數將具有正相關性。該方程可以改寫為 -
$$\mathrm{Cov(X,Y) = E[XY] − E[Y]E[X]}$$
使用此方程並使用兩個獨立隨機變數的乘積等於期望的乘積這一事實,很容易看出如果兩個隨機變數是獨立的,則它們的協方差為 0。
反之則不總是成立 - 如果兩個隨機變數的協方差值為 0,則它們並不總是獨立的!
因此,我們可以寫 -
$$\mathrm{Cov(X,Y) = Cov(Y, X)}$$
$$\mathrm{Cov(X, X) = E[X 2 ] − E[X]E[X] = Var(X)}$$
$$\mathrm{Cov(aX + b,Y) = aCov(X,Y)}$$
兩個隨機變數之間的相關性,由 ρ(X, Y) 表示,是這兩個變數的協方差,並透過每個變數的方差進行歸一化。這種歸一化消除了單位並對度量進行歸一化,使其始終在 [0, 1] 範圍內 -
$$\mathrm{ρ(X, Y) = Cov(X, Y)\sqrt{Var(X) Var(Y)}}$$
當 ρ(X, Y) = 0 時,如果兩個變數彼此獨立,則它們的相關性將為 0。
資料結構
網路
關係型資料庫管理系統
作業系統
Java
iOS
HTML
CSS
Android
Python
C語言程式設計
C++
C#
MongoDB
MySQL
Javascript
PHP