單峰分佈和雙峰分佈的區別
我們的生活充滿了隨機因素,這些因素可能在任何時間對任何特定情況產生重大影響。絕大多數科學領域都嚴重依賴這些隨機變數,尤其是在管理學和社會科學中,儘管化學、工程和物理學也從中受益匪淺。機率和統計特性(包括分佈函式)會被分析和量化。在討論統計概念時,“分佈”一詞通常指的是機率分佈。
分佈描述了變數可能值的範圍以及這些值出現的頻率。變數的模態是指構成資料集中出現次數最多的值或值。資料分佈的第一個特徵是所討論變數的最常見值(s)的出現頻率。可以透過分佈中峰的數量來確定模態。分佈中值的頻率決定了分佈是單峰還是雙峰。讓我們比較和對比單峰分佈和雙峰分佈。
什麼是單峰分佈?
單峰分佈是指只有一個“峰”的分佈,這意味著一個特定值出現的頻率高於其他值。這一點從分佈名稱中就隱含地體現出來了。有時分佈可以被認為具有明顯的峰值。如果分佈只有一個清晰可辨的峰值,或者只有一個值是最常見的,則認為該分佈是單峰的。這意味著分佈中只有一個峰值。超過這個里程碑後,值在上升到該點後開始下降。
迄今為止最常見的單峰分佈形式是正態分佈。有時最高點位於中心,有時位於右側或左側。眾數是資料中最常見的值。無法確保單峰分佈是對稱的;事實上,此類分佈更有可能表現出不對稱或偏斜。如果分佈的平均值偏離中心到左側,我們說它是左偏的,如果它偏離中心到右側,我們說它是右偏的。
什麼是雙峰分佈?
當有兩個峰值彼此幾乎相等時,我們說分佈表現出雙峰特徵。兩個值主導分佈,構成絕大多數出現次數。如果你仔細觀察圖表,你會注意到它有兩個駝峰,就像駱駝的背部一樣。Bi-表示兩個,因此雙峰表示有兩種方法可以做某事。
具有兩個峰值或兩個頻繁值並由間隙分隔表明為雙峰分佈。在雙峰分佈中,有兩個或更多不同的眾數,每個眾數都可以被認為是資料中一個特別引人注目的模式。給定分佈的眾數是出現頻率最高且代表該分佈峰值的值。
雙峰分佈的特點是兩個值占主導地位。在大多數情況下,兩個眾數之間會有很大的差異,並且此分佈比大多數其他分佈具有更多的觀察點。
差異:單峰分佈和雙峰分佈
下表重點介紹了單峰分佈與雙峰分佈的不同之處 -
| 特徵 | 單峰分佈 | 雙峰分佈 |
|---|---|---|
定義 |
分佈中值的頻率決定了分佈是單峰還是雙峰。 單峰是指一個分佈中有一個值比任何其他值都更常見。這裡我們有一個分佈,其中最常見的出現次數或“峰值”是一個整數。 |
在雙峰分佈中,最常見的值是中間的值。這表明兩個最常見數字之間存在差異。 |
重要性 |
具有單峰形狀的分佈具有單個最大值。它被稱為“鐘形曲線”,因為最高點位於中間,並且隨著遠離頂部,鐘形的形狀向下傾斜,就像一個鐘一樣。 由於它是資料中最常出現的數字,因此眾數有時被稱為峰值。 |
當一個分佈有兩個幾乎相等的峰值時,我們說該分佈是雙峰的(或眾數)。 此分佈比大多數其他分佈具有更多的觀察值,並且兩個眾數之間的距離比大多數其他分佈更寬。 |
例子 |
單峰分佈最突出的例子之一是正態分佈,其平均值為零,標準差為一。 它的標準差為 1,平均值為 0。卡方分佈、柯西分佈、指數分佈、學生 t 分佈等等,僅僅是眾多可用分佈中的一小部分例子。 |
雙峰分佈的一個日常例子是倫敦橋在一天中不同時間段的交通量變化。 在上午 8 點到下午 6 點之間,道路上的汽車數量達到峰值,然後數量急劇下降。如果你繪製資料,你會看到同時發生了幾個峰值。 |
結論
從統計學角度來看,單峰分佈具有單個最大值。它被稱為“鐘形曲線”,因為最高點位於中間,並且隨著遠離頂部,鐘形的形狀向下傾斜,就像一個鐘一樣。給出了許多單峰分佈的例子,但正態分佈是迄今為止最常見的。
相反,雙峰分佈的特點是兩個峰值,也稱為兩個主要高點,它們之間有一個稱為區域性最小值的谷值。
資料結構
網路
關係資料庫管理系統 (RDBMS)
作業系統
Java
iOS
HTML
CSS
Android
Python
C 程式設計
C++
C#
MongoDB
MySQL
Javascript
PHP