ggplot2 - 簡介



ggplot2 是一個 R 包,專門用於資料視覺化和提供最佳的探索性資料分析。它提供了美觀、便捷的繪圖,並處理諸如繪製圖例和表示圖例等細節。繪圖可以迭代建立並在以後編輯。此包設計為以分層方式工作,首先顯示在使用 R 進行探索性資料分析期間收集的原始資料,然後添加註釋和統計摘要的圖層。

即使是最有經驗的 R 使用者也需要幫助才能建立優雅的圖形。這個庫是建立 R 中圖形的絕佳工具,但即使在近乎每天使用多年的情況下,我們仍然需要參考我們的備忘單。

此包在稱為“圖形語法”的深層語法下工作,該語法由一組可以以多種方式建立的獨立元件組成。“圖形語法”是 ggplot2 非常強大的唯一原因,因為 R 開發人員不受限於其他包中使用的預定義圖形集。語法包括簡單的一組核心規則和原則。

2005 年,Wilkinson 建立或更確切地說起源了圖形語法的概念,以描述所有統計圖形之間包含的深層特徵。它側重於圖層的首要性,其中包括採用嵌入 R 的功能。

“圖形語法”與 R 之間的關係

它告訴使用者或開發人員,統計圖形用於將資料對映到美學屬性,例如顏色、形狀、相關幾何物件(如點、線和條)的大小。繪圖還可以包含所關注資料的各種統計變換,這些變換繪製在提到的座標系上。它還包括一個稱為“分面”的功能,該功能通常用於為提到的資料集的不同子集建立相同的繪圖。R 包含各種內建資料集。這些獨立元件的組合完全構成特定的圖形。

現在讓我們關注可以使用語法建立的不同型別的繪圖:

資料

如果使用者想要視覺化給定的美學對映集,該對映集描述了資料中所需變數如何對映在一起以建立對映的美學屬性。

圖層

它由幾何元素和所需的統計變換組成。圖層包括幾何物件,簡稱 geom,用於實際表示使用點、線、多邊形等幫助繪圖的資料。最好的演示是將觀察結果進行分箱和計數以建立特定的直方圖,以總結特定線性模型的二維關係。

比例尺

比例尺用於對映資料空間中的值,這些值用於建立值,無論是顏色、大小還是形狀。它有助於繪製所需的圖例或座標軸,以提供反向對映,從而可以從提到的繪圖中讀取原始資料值。

座標系

它描述瞭如何將資料座標對映到圖形的提到的平面上。它還提供座標軸和網格線的資訊,這些資訊是讀取圖形所必需的。通常它用作笛卡爾座標系,包括極座標和地圖投影。

分面

它包括關於如何將資料分解成所需子集並將子集顯示為資料倍數的規範。這也被稱為條件或格子過程。

主題

它控制顯示的更細微之處,例如字型大小和背景顏色屬性。為了建立有吸引力的繪圖,最好考慮參考。

現在,討論語法不提供的限制或功能也同樣重要:

  • 它缺乏對應該使用哪些圖形或使用者感興趣的圖形的建議。

  • 它不描述互動性,因為它僅包含靜態圖形的描述。要建立動態圖形,應應用其他替代解決方案。

下面提到了使用 ggplot2 建立的簡單圖形:

Graph Created With ggplot2
廣告