在 Pandas 中突出顯示每列的最大值


在資料分析和探索任務中,識別 Pandas DataFrame 每列中的最大值對於獲得見解和理解資料至關重要。Python 的 Pandas 庫提供了多種技術來突出顯示這些最大值,使它們在視覺上易於區分。透過應用這些技術,分析師可以快速發現並關注最高值,從而促進決策過程並揭示關鍵趨勢。

本文探討了從內建函式到自定義方法的不同方法,使使用者能夠輕鬆地在使用 Pandas 的資料中突出顯示最大值。

如何在 Pandas 中突出顯示每列的最大值?

Pandas 是 Python 中一個流行的資料操作庫,它提供了強大的工具來處理表格資料。一項常見的任務是識別和突出顯示 DataFrame 每列中的最大值。本文將探討使用 Pandas 來實現此目的的各種技術。

方法 1:使用 Styler.highlight_max()

Pandas Styler 提供了一種名為 highlight_max() 的便捷方法來突出顯示每列中的最大值。Styler.highlight_max() 是 Python 中 Pandas 庫提供的一種方法。它專門設計用於突出顯示 DataFrame 每列中的最大值。

在處理表格資料時,識別和強調最大值通常很有用,以便獲得見解或突出顯示重要的觀察結果。highlight_max() 方法透過自動將樣式應用於每列中的最大值來簡化此任務。

示例

# Import Required Libraries
import pandas as pdd
import numpy as npp

# Create a dictionary for the dataframe
diction = {'Name': ['Sai', 'Prema', 'Akrit', 'Suchitra', 'Abhimanu'],
   'Age': [20, 23, 41, 29, 32],
   'Marks': [92, 84, 35, 88, 83]}

# Converting Dictionary to Pandas Dataframe
dfd = pdd.DataFrame(diction)

# Print Dataframe
dfd
# Highlighting the maximum values of
# last 2 columns
dfd.style.highlight_max(color = 'pink', axis = 0)

輸出

highlight_max() 方法使用預設樣式自動突出顯示每列中的最大值。輸出將顯示突出顯示最大值的 DataFrame。

方法 2:使用 apply() 和 Styler

另一種方法是使用 apply() 方法以及 Styler 物件根據特定條件自定義突出顯示。

apply() 方法與 Pandas 中的 Styler 物件結合使用,允許自定義 DataFrame 樣式。透過定義自定義函式並使用 apply(),您可以將特定的樣式規則應用於 DataFrame 的元素。此方法對於根據某些條件突出顯示特定值或單元格特別有用。使用 apply(),您可以操作 DataFrame 的樣式屬性,例如背景顏色、字型樣式或邊框。這種靈活性使您能夠建立視覺上吸引人和資訊豐富的的資料表示,增強資料探索和演示。

示例

# Import Required Libraries
import pandas as pdd
import numpy as npp

# Create a dictionary for the dataframe
diction = {'Name': ['Sai', 'Prema', 'Akrit', 'Suchitra', 'Abhimanu'],
   'Age': [20, 23, 41, 29, 32],
   'Marks': [92, 84, 35, 88, 83]}

# Converting Dictionary to Pandas Dataframe
dfd = pdd.DataFrame(diction)

# Print Dataframe
dfd

def h_max(s):
	is_max = s == s.max()
	return ['color: red' if cell else '' for cell in is_max]

dfd.style.apply(h_max)

輸出

在這種方法中,我們定義了一個自定義函式highlight_max(),它使用s == s.max()將列中的每個值與最大值進行比較。它返回一個樣式屬性列表,將黃色背景顏色應用於最大值,並將其他值留空。然後,我們使用df.style.apply()將此函式應用於 DataFrame 的每一列,從而生成一個突出顯示的 DataFrame。

結論

總之,突出顯示 Pandas DataFrame 每列中的最大值是資料分析和視覺化中的一項寶貴技術。在本文中,我們探討了實現此目的的兩種方法:使用 Styler.highlight_max() 和使用 apply() 以及自定義函式。這些方法允許輕鬆識別和強調最大值,從而提供對資料分佈和異常值的見解。

無論您是喜歡 Styler.highlight_max() 的簡單性還是 apply() 的自定義選項,突出顯示最大值都會增強資料的視覺表示,有助於資料探索和交流。

更新於: 2023-07-24

1K+ 次瀏覽

開啟你的 職業生涯

透過完成課程獲得認證

開始學習
廣告

© . All rights reserved.