BigQuery - 分割槽和叢集



由於本教程中已經使用了“分割槽”“叢集”這兩個術語,因此提供更多上下文資訊很有幫助。

什麼是分割槽和叢集?

這兩個術語用於描述最佳化資料儲存和處理的兩種方法。

分割槽是指開發人員如何分割資料,通常(但並非總是)按日期元素(如年、月或日)進行分割。叢集描述瞭如何在指定分割槽內對資料進行排序。

要使用任何一種儲存方法,都必須定義一個目標欄位。分割槽只能使用一個欄位,而叢集可以使用多個欄位。

需要注意的是,要應用分割槽或叢集,必須在構建的“建立表”階段進行。否則,需要刪除/重新建立表並更新分割槽/叢集規範。

如何在表中應用分割槽或叢集

要在建立表時應用分割槽和/或叢集,請執行以下命令:

Apply Partitioning or Clustering to a Table

您也可以在 UI 中指定這些指令。在點選“建立表”之前,請花一點時間填寫架構建立框正下方的欄位。

如果正確應用分割槽/叢集,可以顯著降低長期儲存成本和處理時間,尤其是在查詢大型表時。

廣告
© . All rights reserved.