什麼是 AWS Redshift:優勢、成本和設定?


我們生活在一個資訊過剩的時代。歡迎來到資料時代,我們每天生成 25 億億位元組(也稱為艾位元組)的資訊。

介紹一下今天的說法:“這是一個巨大的資訊量!”

當今企業利用這些資訊做出關鍵決策。

資料驅動的決策是明智的決策,更有可能取得成功。

什麼是 AWS Redshift?

AWS Redshift 是一種知名的資料倉庫解決方案,能夠處理艾位元組級的資料。

您可能正在考慮支援各種用例,例如處理即時分析、合併不同資料來源、日誌分析等等。

Redshift 得益於其大規模並行處理 (MPP) 技術,能夠以閃電般的速度對海量資料執行操作——同時,其成本通常僅為 Prophet 和 Teradata 等競爭對手提供類似產品的成本的一小部分。

每個 Amazon Redshift 資料倉庫都包含一組節點,這些節點被組織成一個叢集。

每個叢集都執行其 Redshift 引擎並至少儲存一個數據庫。

雖然 Redshift 是一個分析資料庫,但它足夠靈活,可以允許雲使用者執行傳統的關聯資料庫。

此外,它是一個列儲存資料庫,以列式格式儲存資料,這在讀取和寫入資料時可以提高效能。

Redshift 是一種完全託管的資料倉庫,允許使用者從幾 GB 的資料開始,最終擴充套件到 PB 級資料。

它也被稱為 OLAP 樣式(聯機分析處理)資料庫。

AWS Redshift 優勢

  • AWS 整合 − AWS 是三大最流行且最常使用的雲解決方案之一(另外兩個是 Azure 和 Google Cloud),而 Redshift 與 Amazon Web Services 完美配合。

  • 資料加密和安全性 − Amazon 為其客戶提供多層安全性,包括訪問控制、虛擬專用雲和主動資料加密;客戶可以決定需要加密的內容。

  • 速度 − Redshift 由於 MPP 技術而提供無與倫比的速度。

  • 輕鬆部署 − 您可以在幾分鐘內以傳統資料倉庫一小部分的成本部署 Redshift 叢集。

  • 標準、可靠的備份 − Amazon 定期進行可預測的備份,可用於恢復和資料恢復操作。此外,Amazon 將這些資料儲存在多個區域中。

  • 您可以使用熟悉的工具 − Redshift 使用 PostgreSQL,因此所有 SQL 查詢都可以在其中使用。此外,您可以選擇您通常使用的任何 ETL(提取、轉換、載入)、SQL 和商業智慧 (BI) 工具。

  • 乏味任務自動化 − 沒有什麼比一遍又一遍地執行相同的乏味小任務(無論每天、每週、每月還是無論如何)更令人沮喪和耗時的了。Redshift 允許您自動化這些煩人的重複任務,從而讓您的員工可以處理更具挑戰性的職責。

AWS Redshift 成本

成本低至每 TB 資料每小時 0.25 美元,您可以從此基礎上擴充套件。持續評估的資料來自 Amazon 的 Redshift 定價頁面。

Amazon 還提供按需付費定價結構,該結構會根據您的需求進行調整。

總結。使用 Amazon Redshift,您可以從每小時 $0.25 開始,擴充套件到 PB 級資料和數百個併發使用者。選擇適合您業務需求的配置,並能夠在不過度配置計算或儲存的情況下擴充套件容量。

如何設定 Amazon Redshift?

設定 Amazon Redshift 很簡單

  • 獲取 AWS 賬戶:如果您還沒有 Amazon Web Services 賬戶,請建立一個。

  • 開啟防火牆埠:Redshift 需要開啟一個埠,它通常預設為埠 5439,因此請確保您的防火牆中該埠可用。或者,您可以在建立叢集時在防火牆中指定另一個開放埠;但是請注意:建立集群后,您無法更改埠號。

  • 授予訪問其他 AWS 資源的許可權:您需要允許 Redshift 訪問其他 AWS 資源。要麼建立一個與 Redshift 叢集關聯的專用 IAM 角色,要麼向具有所需許可權的 IAM 使用者提供 AWS 訪問金鑰。

  • 啟動 Redshift 叢集:以具有所需許可權的使用者身份登入並開啟 Amazon Redshift 控制檯。

  • 選擇區域:選擇您希望在其中建立第一個叢集的區域。

  • 輸入值:選擇快速啟動叢集並填寫以下值 -

    節點型別:dc2.large。

    處理節點數:2。

    叢集識別符號:examplecluster。

    主使用者名稱稱:awsuser。

    主使用者密碼和確認密碼:為主使用者賬戶輸入一個密碼

    資料庫埠:5439。

    可訪問的 IAM 角色:選擇 myRedshiftRole。

  • 等待:點選啟動叢集,然後等待啟動完成。完成後,單擊關閉返回叢集列表。

  • 選擇叢集:單擊列表上方的叢集按鈕,然後單擊修改。選擇您希望與叢集關聯的 VPC 安全組,然後單擊修改以儲存您的選擇。

  • 授權訪問:您需要配置一個安全組以授權訪問。如果叢集來自 EC2-VPC 平臺,請按照以下步驟操作。

從這裡開始,您可以執行諸如執行查詢之類的任務。同樣,請諮詢 AWS 網站以獲取更詳細的說明。

結論

許多使用者選擇 Amazon Redshift 來加快其上市時間,因為它易於使用,能夠在任何規模上提供效能,並允許您探索所有資料。您可以為可預測的工作負載選擇預配置選項,或者選擇 Amazon Redshift Serverless 選項以自動配置和擴充套件資料倉庫的容量,從而為要求苛刻和不可預測的工作負載提供高效能。

更新於: 2022-11-16

172 次瀏覽

啟動您的 職業生涯

透過完成課程獲得認證

開始
廣告
© . All rights reserved.