
- SageMaker 教程
- SageMaker - 首頁
- SageMaker - 簡介
- 如何設定 SageMaker?
- SageMaker - 構建機器學習模型
- SageMaker - 訓練機器學習模型
- SageMaker - 部署機器學習模型
- SageMaker - 監控與最佳化
- SageMaker - 定價
- SageMaker 資源
- SageMaker - 快速指南
- SageMaker - 資源
- SageMaker - 討論

SageMaker 教程
什麼是 Amazon SageMaker?
Amazon SageMaker 是一款完全託管的 機器學習 (ML) 服務,可幫助資料科學家和開發人員快速構建、訓練和部署 ML 模型到可用於生產的環境中。它簡化了機器學習生命週期的每個步驟,從資料準備到模型訓練和部署。
SageMaker 提供了一個直觀的使用者介面 (UI) 用於執行 ML 工作流,使其工具可用於各種整合開發環境 (IDE)。這減少了管理基礎設施所需的時間、成本和精力。
要開始使用 Amazon SageMaker,您需要設定 SageMaker 筆記本例項或使用 SageMaker Studio。然後,您可以上傳資料、選擇 ML 演算法、訓練模型並部署它。
誰應該學習 SageMaker?
本 Amazon SageMaker 教程可以使包括以下人員在內的各種受眾受益:−
- 資料科學家 − 有興趣構建、訓練和部署機器學習模型而無需管理基礎設施的專業人士。
- 機器學習工程師 − 希望簡化在雲上進行模型開發和部署過程的開發人員和工程師。
- 人工智慧研究人員 − 專注於實施複雜 AI 模型和試驗新演算法的個人。
- 商業分析師 − 那些沒有深入的技術知識但希望利用 AI/ML 模型獲得商業洞察力的專業人士。
- 開發人員/軟體工程師 − 那些希望使用 Amazon SageMaker 的 API 和 SDK 將機器學習模型整合到應用程式或服務中的開發人員。
- 教育工作者和培訓師 − 教授機器學習或 雲計算 的個人,他們需要全面瞭解 SageMaker 才能為學生提供實踐操作培訓。
學習 SageMaker 的先決條件
要使用和理解 Amazon SageMaker,讀者應該具備:−
- 機器學習概念的基本理解 − 熟悉監督學習和無監督學習。他還/她應該有一些使用常見 ML 演算法(如線性迴歸、決策樹和 神經網路)的經驗。
- Python 知識 − Amazon SageMaker 廣泛使用 Python,因此 Python 程式語言的知識對於編寫指令碼、使用 Jupyter 筆記本和實現機器學習模型至關重要。
- AWS 服務經驗 − 熟悉核心 AWS 服務,如用於資料儲存的 S3、用於計算資源的 EC2 和用於管理訪問和安全的 IAM 將是有益的。
- 資料準備的理解 − 構建高效 ML 模型需要具備資料預處理技術、特徵工程和處理大型資料集的經驗。
- Jupyter Notebook 的熟悉程度 − Amazon SageMaker 提供了一個基於 Jupyter 的環境用於編碼和訓練模型,因此熟悉和使用 Jupyter Notebook 將非常有用。
- 基本的雲計算知識 − 瞭解雲計算的工作原理,尤其是在可擴充套件的分散式環境中。在配置 Amazon SageMaker 資源時,這將有所幫助。
SageMaker 常見問題解答
在本節中,我們收集了一組關於 SageMaker 的常見問題及其答案:−
1. 如何開始使用 Amazon SageMaker?
要開始使用 Amazon SageMaker,您需要設定 SageMaker 筆記本例項或使用 SageMaker Studio。然後,您可以上傳資料、選擇 ML 演算法、訓練模型並部署它。SageMaker 為我們提供了一系列內建演算法,這使得快速開始機器學習變得容易。
2. 如何將 Amazon SageMaker 與 Jupyter 筆記本一起使用?
Amazon SageMaker 提供完全託管的 Jupyter 筆記本,您可以使用它們來互動式地開發和試驗機器學習模型。這些筆記本在 EC2 例項上執行,並提供預安裝的庫,如 TensorFlow、PyTorch 和 Scikit-learn (Sklearn)。
您可以輕鬆連線到 AWS 服務(如 S3)以進行資料儲存。您還可以直接從筆記本部署模型。
3. SageMaker 如何確保資料隱私和安全?
Amazon SageMaker 透過以下方式確保資料隱私和安全:−
- 加密(靜態和傳輸中)
- 基於角色的訪問控制 (RBAC)
- 與 AWS Identity and Access Management (IAM) 整合。
除此之外,SageMaker 還支援私有 VPC 端點,用於在您的 SageMaker 例項與其他 AWS 資源之間進行安全通訊,從而提供與外部網路的完全隔離。
4. Amazon SageMaker 的定價是多少?
您可以免費試用 Amazon SageMaker。在 AWS 免費套餐下,您可以免費開始使用 SageMaker。
下表提供了 Amazon SageMaker 免費套餐的詳細資訊:−
SageMaker 功能 | 免費套餐 |
---|---|
Studio 筆記本和筆記本例項 | 在 Studio 筆記本上使用 ml.t3.medium 例項 250 小時,或者在筆記本例項上使用 ml.t2 medium 例項或 ml.t3.medium 例項 250 小時。 |
SageMaker 上的 RStudio | 在 RSession 應用上使用 ml.t3.medium 例項 250 小時,以及 RStudioServerPro 應用的免費 ml.t3.medium 例項。 |
資料整理器 | ml.m5.4xlarge 例項 25 小時。 |
特徵儲存 | 1000 萬個寫入單元、1000 萬個讀取單元、25 GB 儲存空間。 |
訓練 | m4.xlarge 或 m5.xlarge 例項 50 小時。 |
帶有 TensorBoard 的 Amazon SageMaker | ml.r5.large 例項 300 小時。 |
即時推理 | m4.xlarge 或 m5.xlarge 例項 125 小時。 |
無伺服器推理 | 150,000 秒的按需推理時長。 |
畫布 | 每月會話時間 160 小時。 |
超立方體 | m5.xlarge 例項 50 小時。 |
5. Amazon SageMaker 提供哪些付款選項?
免費套餐從您建立第一個 Amazon SageMaker 資源的第一個月開始。之後,您只需為使用的資源付費。
SageMaker 提供以下兩種付款方式:−
- 按需定價 − 無最低費用和預付承諾。
- SageMaker 儲蓄計劃 − 一種靈活的、基於用量的定價模型。
6. Amazon SageMaker 中有哪些節省成本的選項?
Amazon SageMaker 提供各種節省成本的選項,如Spot 例項和批次轉換。
例如,Spot 例項用於訓練作業,與按需定價相比,可節省高達 90% 的費用。另一方面,SageMaker 批次轉換支援大規模推理作業,而無需維護永續性端點。當您不需要即時預測時,它還可以降低成本。
7. Amazon SageMaker 如何支援自動模型調整?
Amazon SageMaker 支援自動模型調整,也稱為超引數最佳化。它透過進行多次訓練執行並根據定義的目標指標評估效能來自動調整模型引數。此功能有助於在無需手動調整模型的情況下獲得更高的準確性。
8. Amazon SageMaker 是否包含預構建演算法?
是的,Amazon SageMaker 提供了一系列預構建的機器學習演算法。它包括線性迴歸、XGBoost、影像分類等演算法,以及 TensorFlow 和 PyTorch 等深度學習框架。這些內建演算法針對大規模訓練進行了最佳化,並且可以輕鬆部署以進行即時推理。
9. 我可以在 Amazon SageMaker 中使用自己的演算法嗎?
是的,Amazon SageMaker 允許您自帶演算法和自定義模型。您可以將程式碼打包到 Docker 容器中並將其部署到 SageMaker。
SageMaker 支援自定義容器和 TensorFlow、PyTorch 和 Scikit-learn 等預構建環境,以實現靈活的開發。
10. 如何在 Amazon SageMaker 中監控和最佳化模型?
為了跟蹤呼叫延遲、錯誤率和資源利用率等效能指標,Amazon SageMaker 與Amazon CloudWatch整合。
除此之外,SageMaker 模型監控器還可以自動檢測資料漂移和其他異常情況,以便您可以根據需要設定警報並採取糾正措施。
11. 我可以使用 SageMaker 自動化 ML 工作流嗎?
是的,您可以使用 Amazon SageMaker 自動化機器學習工作流。它提供了SageMaker Pipelines,這是一種完全託管的服務,可自動化端到端的機器學習生命週期。它使您能夠定義、自動化和管理機器學習工作流,從資料準備到模型部署。它還確保了機器學習管道的可重複性、可擴充套件性和有效管理。
12. 如何在 Amazon SageMaker 中除錯 ML 模型?
Amazon SageMaker 包括偵錯程式,這是一個允許使用者在訓練期間監控和除錯機器學習模型的工具。偵錯程式工具捕獲即時指標(如梯度值和損失),這有助於您識別瓶頸或效能問題。它提供視覺化效果來排除模型訓練過程的故障並提高其準確性。
13. 我可以將 SageMaker 用於強化學習嗎?
是的,Amazon SageMaker 為強化學習 (RL)提供了內建環境。它支援Ray RLlib和Coach等流行的 RL 庫,使您能夠使用 SageMaker 的基礎設施訓練 RL 模型。您還可以模擬用於訓練 RL 代理的環境,然後將訓練後的模型部署到生產端點。
14. Amazon SageMaker 的侷限性是什麼?
雖然 Amazon SageMaker 是一個強大的機器學習平臺,但對於小型專案來說,它可能過於高階。隨著使用量的增加,成本可能會增加,尤其是在大型訓練或即時任務中。使用者應該具備一些 AWS 服務的知識才能最大限度地利用它。