MLOps 工具、最佳實踐和案例研究


MLOps 是一組流程和方法,旨在確保機器學習系統的可擴充套件和可靠部署。為了減少技術債務,MLOps 使用軟體工程最佳實踐,例如自動化測試、版本控制、敏捷概念的應用和資料管理。

使用 MLOps,可以自動化機器學習和深度學習模型在大型生產環境中的部署,同時提高質量並簡化管理流程。在本文中,您將瞭解一些有助於您完成此工作的工具和最佳實踐。

MLOps 最佳實踐

以下是 MLOps 的最佳實踐 -

  • 機器學習生命週期的第一步是確定業務問題,並確定如何使用機器學習來解決它。有一些可量化的 KPI 來衡量業務在多大程度上實現了其目標。需要將一般的業務問題轉換為模型可以追求的效能指標。

  • MLOps 需要現代的工作實踐和組織變革。這將隨著時間的推移以及組織結構和流程的發展而發生。這包括流程更改,例如使用 DevOps 進行部署或增加團隊成員。

  • 選擇 ML 模型可能具有挑戰性。在確定特定模型之前,需要測試幾個不同的模型並記錄結果。跟蹤這些模型非常重要,也許可以透過為每個模型建立單獨的 Git 分支來實現。在嘗試為生產選擇最佳模型時,這有助於進行比較和選擇。

  • 在模型部署後,跟蹤其效能以確保其按預期工作至關重要。一旦我們啟動了機器學習模型,很多事情都可能出錯。透過監控模型來發現輸入和目標變數之間的資料變化是有幫助的。

  • 模型在訓練期間以及部署後使用時都需要系統資源,包括 CPU、GPU、I/O 和記憶體。通過了解系統在各個階段的需求,您的團隊可以最佳化試驗成本並最大化預算。

MLOps 工具

執行任何最佳實踐都很好,但是您需要一個特定的平臺來執行此類任務。以下是一些可能對您的 MLOps 之旅有幫助的流行 MLOps 工具 -

  • Neptune - 它是一個建模工具,充當 MLOps 的元資料儲存庫,有助於研究和生產團隊更好地組織 ML 元資料。它提供了一箇中心位置來收集、記錄、儲存、顯示、比較和查詢在整個機器學習生命週期中生成的所有元資料。該程式允許跟蹤實驗、模型登錄檔、監控機器學習執行以及用於簡單跟蹤的強大儀表板。

  • KFServing - 它是一個構建在 Kubernetes 之上的模型服務工具。KFServing 標準化了 ML 操作併為推理請求提供了 API。它提供了一個簡單但全面的故事來提供生產 ML 推理。它與各種機器學習框架相容,包括 Tensorflow、XGBoost、ScikitLearn 和 ONNX。它還抽象了伺服器配置、網路、健康監控和自動擴充套件的複雜性。

  • Luigi - 它是由 Spotify 開發的編排工具。它是一個基於 Python 的執行框架。它提供了一個工具箱,其中包含許多工作模板,這對團隊很有幫助。為了加強操作的原子性和可靠的資料管道,該工具箱包含用於 HDFS 和本地檔案的系統抽象。此外,它還透過強大的架構提供各種工具和實用程式,例如 A/B 測試分析、內部儀表板和外部報告,以支援複雜的作業管道。

  • MLFlow - 它是一個建模工具,提供更好的靈活性和可擴充套件性,以支援個人和大型企業。任何語言、ML 庫和現有程式碼都與 MLflow 相容。它使您能夠與他人共享您的機器學習程式碼,並使用 Docker 和 Conda 提供用於可重複執行的結構。為了有效地管理 MLflow 模型的整個生命週期,使用了一個集中的模型儲存庫、使用者介面和一組 API。

  • DVC - 它是一個數據工具,具有敏捷性、資料版本控制、可重複性和共享效率等功能,DVC 工具使 ML 專案的資料版本管理變得更簡單。藉助此實驗工具,可以有效地組織和訪問大資料。它使用 Git 標籤、分支和指標簡化了實驗管理,以選擇最佳版本並監控實驗進度。

MLOps 案例研究

以下是 MLOps 的重要案例研究 -

  • 為了有效地將訂單分配給眾多客戶並確定他們的最佳路線,Instacart 使用機器學習來解決路徑最佳化問題。這 篇文章 解釋了整個流程和結構。

  • 光學字元識別和單詞檢測是像文件掃描器這樣的簡單應用程式的兩個獨立部分。此外,端到端系統需要額外的訓練和調整階段。每個都需要一個單獨的生產管道。該團隊收集資料的努力,包括建立他們自己的資料註釋平臺,也在此 文章 中進行了詳細介紹。

  • 篇文章 提供了 Uber 端到端工作流程、Uber 使用機器學習的領域以及團隊的設定方式的出色概述。Uber 在其生產中廣泛使用機器學習。

  • 截至 2018 年,Netflix 擁有超過 1.2 億使用者,其中一半位於美國以外。在這 篇文章 中,他們討論了他們的一些技術挑戰以及他們如何使用機器學習來解決這些挑戰,包括如何預測網路質量、發現裝置異常以及分配資源以進行預期快取。

更新於: 2023 年 2 月 17 日

316 次檢視

開啟你的 職業生涯

透過完成課程獲得認證

開始
廣告
© . All rights reserved.