用於視覺化的Python庫
在本文中,我們將向您展示各種用於視覺化的Python庫及其功能。
在當今時代,檢視分析結果並推斷結果通常比檢視文字資料或CSV檔案來理解結果更方便。
因此,資料視覺化是找到複雜問題答案的一種簡單方法。它還允許使用者比表格更有效地表達他們的結果。
Python中的資料視覺化
Python 提供了多個繪相簿,包括 Matplotlib、Seaborn 和許多其他資料視覺化包,每個庫都有其獨特的特性,可以建立資訊豐富、定製且吸引人的圖表,以儘可能簡單有效的方式呈現資料。
Matplotlib
Matplotlib 是一個 Python 繪相簿,用於建立靜態、動態和互動式視覺化。其計算數學擴充套件是 NumPy。
儘管已經使用了十多年,它仍然是 Python 世界中最流行的繪相簿。它的設計類似於 MATLAB,這是一種在 20 世紀 80 年代開發的許可程式語言。由於 matplotlib 是第一個 Python 資料視覺化庫,許多其他庫都是基於它構建的,或者旨在在研究過程中與它一起使用。
特性
一些庫,例如 pandas 和 Seaborn,充當 matplotlib 的“包裝器”。它們透過減少所需程式碼量來簡化各種 matplotlib 方法的使用。
雖然 matplotlib 非常適合視覺化細節,但對於快速輕鬆地創建出版質量的圖表來說,它並不實用。
Plotly
Plotly 是一個免費的開源繪相簿,用於建立資料視覺化。Plotly (plotly.py) 是一個基於 Plotly JavaScript 庫 (plotly.js) 構建的 Python 庫,可用於建立可在 Jupyter notebook 或使用 Dash 的 Web 應用程式中顯示的基於 Web 的資料視覺化,或儲存為單獨的 HTML 檔案。Plotly 提供超過 40 種不同的圖表型別,包括散點圖、直方圖、折線圖、條形圖、餅圖、誤差條、箱線圖、多軸、sparklines、樹狀圖、3D 圖表等等。Plotly 中還提供了等高線圖,這在其他資料視覺化庫中並不常見。除此之外,Plotly 可以在沒有網際網路連線的情況下使用。
特性
Plotly 支援散點圖、直方圖、折線圖、條形圖、餅圖、誤差條、箱線圖、多軸、sparklines、樹狀圖、3D 圖表等圖表型別。
Plotly 還提供了等高線圖,這在其他資料視覺化庫中並不常見。Plotly 也可在無網路連線的情況下使用。
Seaborn
Seaborn 是一個 Python 庫,允許您建立統計圖形。它具有先進的軟體,可以生成視覺上吸引人和資訊豐富的統計圖形。資料科學家主要將 Matplotlib 用於教育和研究,而 Seaborn 用於出版物和現實世界的演示。Seaborn 現在是事實上的 Python 資料視覺化庫。
特性
Seaborn 利用 matplotlib 的強大功能,只需幾行程式碼即可建立漂亮的圖表。
主要區別在於,它的預設設計和調色盤旨在更具視覺吸引力和傳統感。
Matplotlib 用於建立圖表。
它面向資料集的繪圖機制可與包含整個資料集的資料幀和向量一起使用,在內部執行概念對映和統計聚合以生成有見地的圖表。
Seaborn 是一個完全可訪問的 Python 庫,我們可以使用 pip install 函式在我們的 Python 環境中安裝它。
它旨在使視覺化成為資料探索和理解的關鍵組成部分。
GGplot
ggplot 是一個用於在 Python 中繪製圖表的通用庫,最初是在 R 中實現的。它是一種特定領域語言,用於建立特定領域的視覺化,主要用於資料分析。
Ggplot 允許使用僅兩行程式碼的方式繪製圖表。另一方面,用 matplotlib 編寫的相同程式碼非常複雜,涉及許多程式碼行。因此,ggplot 使圖表編碼更容易。它是一個非常有價值的 Python 庫。
要使用 ggplot 的所有功能,必須使用 pandas。
特性
與 matplotlib 不同,ggplot 允許您疊加元素以建立完整的繪圖。例如,您可以從軸開始,然後新增點、線、趨勢線等等。
儘管“圖形語法”已被譽為“直觀”的繪圖工具,但經驗豐富的 matplotlib 使用者可能難以適應這種新範例。
作者認為,ggplot 不適用於高度個性化的圖形。它犧牲複雜性以換取更簡單的繪圖過程。
Altair
Altair 是一個 Python 統計資料視覺化庫。它基於 Vega 和 Vega-Lite,這是一種用於建立、儲存和共享互動式資料視覺化設計的宣告式語言。Altair 可用於快速建立條形圖、餅圖、直方圖、散點圖、誤差圖、功率譜、莖葉圖等圖表的精美資料視覺化。Altair 需要 Python 3.6、入口點、jsonschema、NumPy、Pandas 和 Toolz,所有這些都將透過 Altair 安裝命令自動安裝。要在 Altair 中獲取資料視覺化,請開啟 Jupyter Notebook 或 JupyterLab 並執行任何程式碼。Altair 的原始碼目前可在 GitHub 上獲得。
特性
Altair 只需少量編碼即可生成條形圖、餅圖、直方圖、散點圖、誤差圖、功率譜、莖葉圖等圖表的精美資料視覺化。
Altair 具有 Python 3.6、入口點、jsonschema、NumPy、Pandas 和 Toolz 等要求,這些都由 Altair 設定命令自動啟用。
Bokeh
圖形語法是 Bokeh 的基礎,它類似於 ggplot 的庫。但是,它是一個未從 R 匯入的 Python 庫。生成互動式、可用於 Web 的繪圖,可以輸出為多種格式,包括 HTML 文件和 JSON 物件。
Bokeh 長期以來一直被認為是即時流式傳輸和資料處理最流行的庫之一。
Bokeh 為使用者提供三個級別:高階、中級和低階。高階使用者可以輕鬆快速地建立直方圖和條形圖。中級使用者可以使用 matplotlib 框架為散點圖建立點。
特性
其主要優勢是能夠生成互動式、可用於 Web 的繪圖,這些繪圖可以方便地匯出為 JSON 物件、HTML 檔案或互動式 Web 服務。
Bokeh 還提供廣播和即時統計。
Bokeh 提供三種佈局,其功能各不相同,以適應不同的使用者風格。
最高級別允許建立簡單的地圖。它可以生成流行的圖表,例如條形圖、箱線圖和直方圖。
Pygal
Pygal 是一個 Python 資料視覺化庫,專門設計用於製作性感的圖表!(正如他們的網站上所述!)雖然 Pygal 與 Plotly 或 Bokeh 類似,因為它生成的圖表可以嵌入網頁並透過 Web 瀏覽器訪問,但主要區別在於它可以生成 SVG(可縮放向量圖形)形式的圖表。這些 SVG 確保您可以清晰地看到圖表而不會丟失任何質量,即使它們被縮放也是如此。但是,SVG 僅適用於較小的資料集,因為過多的資料點會使渲染變得困難,圖表也會變得遲緩。
特性
作業系統上的 Pygal 庫可用於建立簡單的圖表。
此庫可以與流行的 Python Web 介面(如 flask 和 Django)結合使用,以在網頁上生成動態且互動式的圖表。
Pygal 可以建立折線圖、條形圖、直方圖、XY 圖、餅圖、雷達圖、箱線圖、點圖等圖表。
圖表也可以匯出為多種格式,包括 SVG、PNG、Etree 等。Pygal 最適合用於涉及快速簡單圖表的較小 Web 應用程式。
Geoplotlib
Geoplotlib 是一個用於視覺化地理資料的開源 Python 工具箱。它允許建立純 Python 中的硬體加速互動式視覺化,幷包括點地圖、核密度估計、空間圖、Voronoi 鑲嵌、shapefile 和各種其他常見空間視覺化的實現。
Geoplotlib可以生成各種地圖,包括等面積地圖、熱力圖和點密度圖。
特性
大多數資料視覺化庫對建立地圖或處理地理資料支援不足,這就是Geoplotlib作為Python庫如此重要的原因。
它特別方便建立地理地圖,並提供各種地圖型別,例如點密度圖、等值線圖和符號地圖。
結論
在本文中,我們學習了最流行的Python視覺化庫及其功能。
資料結構
網路
關係資料庫管理系統 (RDBMS)
作業系統
Java
iOS
HTML
CSS
Android
Python
C語言程式設計
C++
C#
MongoDB
MySQL
Javascript
PHP