什麼是相關性?
相關性是指衡量兩個定量變數(例如,身高、體重)之間線性關係強度的指標。主要根據變數的移動方向分為兩種相關性:
正相關 – 在兩個變數的正相關中,兩個變數朝著相同的方向移動。這意味著當一個變數的值上升時,另一個變數也上升,反之亦然。例如,汽車行駛的距離越遠,消耗的燃料就越多。
負相關 – 在負相關的情況下,當一個變數增加時,另一個變數減少,反之亦然。
強相關和弱相關
在強相關中,可以根據另一個變數的值,以相當高的精度預測一個變數的值。在弱相關的情況下,一個變數的平均值與另一個變數相關,但有很多例外。
樣本相關係數“r”量化了關係的強度。相關性也經常進行統計顯著性檢驗。
相關性分析的侷限性
相關性不能顯示除正在探討的兩個變數之外的其他變數的存在或影響。
相關性並不能告訴我們變異的因果關係。
相關性也無法描述曲線關係。
相關性描述資料一起移動的情況
相關性可用於描述資料集中的簡單關係。例如,對於山區公園營地的資料集,可能需要了解營地高度與其夏季平均溫度之間是否存在關係。
在這裡,對於每個單獨的營地,必須測量兩個指標:海拔和溫度。當您使用相關性檢查樣本中這兩個變數時,您會發現線性關係:隨著海拔升高,溫度下降。因此,這兩個變數呈負相關。
相關性數字是什麼意思?
相關性是使用稱為相關係數的無量綱計算來測量的,其範圍從 -1 到 +1,並用“r”表示。統計部分用 p 值表示。因此,相關性通常用兩個關鍵數字來表示:“r=”和“p=”。
“r”越接近零,線性關係就越弱。
正“r”值表示正相關。
負“r”值表示負相關。
p 值為我們提供了證據,根據我們從樣本中觀察到的情況,我們可以證明總體相關係數不同於零。
“無量綱度量”表明相關性存在於其自身的尺度上。在上面給出的示例中,“r”給出的數字與身高或溫度的尺度不同。這與其他形式的統計資料不同。例如,身高測量的平均值與其變數的尺度相同。
廣告