Python 中的 Pandas 是什麼?


Pandas

Pandas 是 Python 程式語言中功能強大的開源庫之一,用於資料分析和資料處理。如果您想處理任何表格資料,例如來自資料庫或任何其他形式的資料(如 CSV、JSON、Excel 等),那麼 Pandas 是最佳工具。

歷史

2008 年,開發人員 Wes McKinney 開始開發 Pandas,用於高效能、靈活的資料分析。

突出特點

  • Pandas 將降低複雜性,使我們的工作變得簡單,並且可以應用於任何有序和無序型別的資料。Pandas 的輸出也是一個名為 DataFrame 的表格形式。

  • 我們可以使用 Matplotlib(也是一個 Python 庫)繪製一些視覺化圖形,它提供了不同的繪圖型別,例如散點圖、條形圖、箱線圖等。

示例

讓我們看一個例子。

df = pd.DataFrame({'x': [3, 6, 8, 7, 12, 5, 10, 18],'y': [2, 5, 12, 3, 8, 4, 15, 6]})
df.plot()

輸出

在上面的程式碼和輸出圖形中,我們看到了我們資料的一個簡單的基本視覺化圖。

  • 從特定列或行過濾資料、選擇、切片和提取在 Pandas 中非常靈活,Pandas 中提供了許多方法來執行所有這些操作。

  • 我們可以在 Pandas 中按列和按行組合或連線多個表,還可以對資料表執行連線/合併操作。

  • 時間序列也是 Pandas 的功能之一,如果您想處理時間和日期,Pandas 將為您提供強大的支援。

  • 要執行數學運算,無需迴圈遍歷資料表的所有行。這些操作可以透過在 Pandas 中使用一些直接方法非常輕鬆地完成,如下面的示例所示。

示例

Example : pandas.DataFrame.mean()

在上面的程式碼塊中,Pandas 表示包的名稱,DataFrame 表示表格資料,mean() 方法將為您提供每列資料的平均值。

更新於: 2021-11-18

355 次瀏覽

啟動您的 職業生涯

透過完成課程獲得認證

立即開始
廣告

© . All rights reserved.