- BigQuery 教程
- BigQuery - 首頁
- BigQuery - 概述
- BigQuery - 初始設定
- BigQuery 與本地 SQL 引擎的比較
- BigQuery - Google Cloud Console
- BigQuery - Google Cloud 層次結構
- 什麼是 Dremel?
- 什麼是 BigQuery Studio?
- BigQuery - 資料集
- BigQuery - 表
- BigQuery - 檢視
- BigQuery - 建立表
- BigQuery - 基本模式設計
- BigQuery - 修改表
- BigQuery - 複製表
- 刪除和恢復表
- BigQuery - 填充表
- 標準 SQL 與傳統 SQL
- BigQuery - 編寫第一個查詢
- BigQuery - CRUD 操作
- 分割槽和叢集
- BigQuery - 資料型別
- BigQuery - 複雜資料型別
- BigQuery - STRUCT 資料型別
- BigQuery - ARRAY 資料型別
- BigQuery - JSON 資料型別
- BigQuery - 表元資料
- BigQuery - 使用者自定義函式
- 連線到外部資料來源
- 整合計劃查詢
- 整合 BigQuery API
- BigQuery - 整合 Airflow
- 整合連線的表格
- 整合資料傳輸
- BigQuery - 物化檢視
- BigQuery - 角色和許可權
- BigQuery - 查詢最佳化
- BigQuery - BI 引擎
- 監控使用情況和效能
- BigQuery - 資料倉庫
- 挑戰與最佳實踐
- BigQuery 資源
- BigQuery - 快速指南
- BigQuery - 資源
- BigQuery - 討論
BigQuery - 複雜資料型別
BigQuery 除了支援 STRING、INTEGER 和 BOOLEAN 等“常規”資料型別外,還支援所謂的複雜資料。這通常也稱為巢狀資料,因為資料不適合傳統的扁平表,必須位於列的子集。
複雜資料結構很常見
對巢狀模式的支援允許更簡化的載入過程。儘管 Google Cloud 將關於以下資料型別的教程列為“高階”,但巢狀資料非常常見。
瞭解如何展平並使用這些資料型別是任何面向 SQL 的開發人員的寶貴技能。
這些資料結構常見的原因是源資料(例如 API 的 JSON 輸出)通常以這種格式返回:
[{data: "id": '125467", "name": "Acme Inc.", "locations":
{"store_no": 4, "employee_count": 15}}]
- 請注意,“id”和“name”位於相同的引用級別。可以使用“data”作為鍵訪問它們。
- 但是,要獲取諸如“store_no”和“employee_count”之類的欄位,不僅需要訪問 data 鍵,還需要展平“locations”陣列。
這就是 BigQuery 的複雜資料型別支援非常有幫助的地方。資料工程師無需編寫一個迭代並展開“locations”的指令碼,就可以按原樣將這些資料載入到 BigQuery 表中。
BigQuery 中的複雜資料結構
BigQuery 支援以下三種類型的複雜或巢狀資料:
- STRUCT
- ARRAY
- JSON
處理這些型別的方法將在接下來的章節中解釋。
廣告