理解直方圖的解釋


在這篇文章中,我們將學習直方圖,並詳細瞭解直方圖及其各種型別。我們還將看到使用python的實現。

直方圖

直方圖為我們提供了資料的視覺化表示,它用於顯示數值資料的條形圖。我們可以直觀地看到資料集中不同的分佈和模式。直方圖中的X軸用於表示值的範圍,Y軸用於表示資料點的頻率或計數。

直方圖的應用

1. 資料分佈分析

我們使用直方圖來分析資料分佈,並深入瞭解資料的形狀、大小、偏度和趨勢。利用這些因素,我們可以獲得資料的清晰特徵,這些特徵可用於做出良好的決策。

2. 影像處理

我們在影像處理中使用直方圖用於各種目的,例如對比度增強、閾值處理和影像均衡。直方圖技術用於提高對比度並增強影像的視覺效果。我們可以使用畫素強度分析閾值。

3. 質量控制的流程監控

直方圖在質量控制和流程監控中起著至關重要的作用。在製造公司中,我們使用直方圖來監控流程引數並確保產品質量。我們使用直方圖來控制溫度、壓力和偏差,這有助於快速調整這些因素以維持質量標準。

4. 統計分析

直方圖用於探索資料分佈。我們使用直方圖來驗證我們對統計檢驗所做的假設,評估正態性,並識別可能影響所選資料統計模型的資料模式。還可以檢查它是否遵循任何特定的統計分佈,這有助於分析分佈。

直方圖的解釋

規則直方圖

這種型別的直方圖為我們提供了資料的直接視覺化。它用於顯示每個區間內資料的頻率。

示例

import matplotlib.pyplot as plt
import numpy as np

data = np.random.randn(1000)

plt.hist(data, bins=30, edgecolor='red')
plt.title('Regular Histogram')
plt.xlabel('Data')
plt.ylabel('Frequency')
plt.show()

輸出

歸一化直方圖

這種型別的直方圖也稱為機率直方圖。它用於顯示每個區間內資料的頻率和相關頻率。

示例

import matplotlib.pyplot as plt
import numpy as np

data = np.random.randn(500)
plt.hist(data, bins=20, density=True, edgecolor='black')
plt.title('Regular Histogram')
plt.xlabel('Data')
plt.ylabel('Frequency')
plt.show()

輸出

堆疊直方圖

堆疊直方圖用於比較資料集中多個組和類別的分佈。此直方圖為我們提供了視覺化資料集非常有用的工具。

示例

import matplotlib.pyplot as plt
import numpy as np

ds1 = np.random.randn(500)
ds2 = np.random.randn(500)

plt.hist([ds1, ds2], bins=30, stacked=True, edgecolor='black')
plt.title('Stacked Histogram')
plt.xlabel('Data')
plt.ylabel('Frequency')
plt.legend(['Group 1', 'Group 2'])
plt.show()

輸出

二維直方圖

我們使用二維直方圖來表示兩個變數的聯合分佈。我們首先將資料劃分為矩形單元,並根據頻率為每個單元著色。二維直方圖也稱為熱圖。

示例

import numpy as np
import matplotlib.pyplot as plt

x = np.random.randn(1000)
y = np.random.randn(1000)

plt.hist2d(x, y, bins=30, cmap='Blues')
plt.title('2D Histogram')
plt.xlabel('X')
plt.ylabel('Y')
plt.colorbar(label='Frequency')
plt.show()

輸出

累積直方圖

此直方圖用於視覺化資料的累積頻率或累積機率分佈。它為我們提供了不同閾值下資料分佈的詳細資訊。此直方圖顯示了當我們在 x 軸上從左向右移動時資料是如何累積的。

示例

import matplotlib.pyplot as plt
import numpy as np

data = np.random.randn(500)

plt.hist(data, bins=30, cumulative=True, density=True, edgecolor='black')
plt.title('Cumulative Histogram')
plt.xlabel('Data')
plt.ylabel('Cumulative Probability')
plt.show()

輸出

聚類直方圖

聚類直方圖用於顯示不同組和類別的單獨直方圖。我們可以使用此直方圖直接比較不同的直方圖。

示例

import matplotlib.pyplot as plt
import numpy as np

ds1 = np.random.randn(500)
ds2 = np.random.randn(500)

plt.hist(ds1, bins=30, alpha=0.7, label='Group 1', edgecolor='black')
plt.title('Clustered Histogram')
plt.hist(ds2, bins=30, alpha=0.7, label='Group 2', edgecolor='black')
plt.xlabel('Data')
plt.ylabel('Freq')
plt.legend()
plt.show()

輸出

結論

總之,可以說直方圖為我們提供了多種視覺化圖形和探索資料集中模式的方法。我們可以使用多種型別的直方圖,例如規則直方圖、歸一化直方圖、堆疊直方圖、聚類直方圖、累積直方圖來分析資料。在Python語言中,我們有Matplotlib庫,可以使用它來建立直方圖並獲取我們資料分佈的詳細資訊。

更新於:2023年10月6日

195 次檢視

啟動你的職業生涯

透過完成課程獲得認證

開始
廣告
© . All rights reserved.