Python Pandas - 簡介



Pandas 是一個開源的 Python 庫,它使用強大的資料結構提供高效能的資料操作和分析工具。Pandas 的名稱來源於面板資料(Panel Data)——計量經濟學中來自多維資料的一個術語。

2008 年,開發人員 Wes McKinney 在需要一個高效能、靈活的工具來分析資料時開始開發 Pandas。

在 Pandas 出現之前,Python 主要用於資料清洗和準備,對資料分析的貢獻很少。Pandas 解決了這個問題。使用 Pandas,我們可以完成資料處理和分析中的五個典型步驟,而不管資料的來源如何——載入、準備、操作、建模和分析。

Python 配合 Pandas 被廣泛應用於學術和商業領域,包括金融、經濟學、統計學、分析學等。

Pandas 的主要特點

  • 快速高效的 DataFrame 物件,具有預設和自定義索引。
  • 用於將資料從不同檔案格式載入到記憶體中資料物件的工具。
  • 資料對齊和缺失資料的整合處理。
  • 資料集的重塑和透視。
  • 基於標籤的大型資料集的切片、索引和子集選擇。
  • 可以刪除或插入資料結構中的列。
  • 對資料進行分組以進行聚合和轉換。
  • 高效能的資料合併和連線。
  • 時間序列功能。
廣告