BigQuery - 表元資料



能夠分析和理解組織資料的範圍和內容固然重要,但對於SQL 開發人員而言,瞭解使用 BigQuery 的效能和儲存成本方面也至關重要。

這時,查詢 BigQuery 表元資料對於開發人員來說可能很有用,對於尋求充分利用 SQL 引擎的組織來說更是寶貴。

對於那些沒有廣泛使用元資料的人來說:元資料顧名思義,是關於資料的資料。通常這與圍繞資源效能或監控等方面的統計資料有關。

BigQuery 提供了多個元資料儲存,使用者可以查詢這些儲存以更好地瞭解其專案如何消耗資源,其中包括:

  • INFORMATION_SCHEMA
  • __TABLES__ 檢視
  • BigQuery 審計日誌

每個表都可以像查詢儲存資料一樣進行查詢。

對於 INFORMATION_SCHEMA 和 __TABLES__,需要注意的是表引用的語法有所不同。

不是遵循典型的:project.dataset.table 表示法,INFORMATION_SCHEMA 和 __TABLES__ 的元素是在結束反引號後引用的。

INFORMATION_SCHEMA 是一個數據源,它有幾個分支資源,例如 COLUMNS 或 JOBS_BY_PROJECT

例如,引用 INFORMATION_SCHEMA 看起來像這樣:

Project Dataset Table

它將獲取以下輸出

Project Dataset Table

TABLES 檢視

TABLES 檢視提供表級別的資訊,例如表建立時間和最後訪問表的使用者。需要注意的是,TABLES 檢視可在資料集級別訪問。

Bigquery TABLES View

它將獲取以下輸出

Bigquery TABLES View Output

基於現有表建立模式

INFORMATION_SCHEMA.COLUMNS 的一個有用的用例是能夠使用此查詢基於現有表建立模式:

Creating a Schema Based on an Existing Table
廣告
© . All rights reserved.