1. 程式人生 > 其它 >mlops的一些記錄

mlops的一些記錄

目錄

MLOPS

Hidden Technical Debt in Machine Learning Systems.

google對MLOPS的介紹:MLOps:機器學習中的持續交付和自動化流水線

mlops上也有不錯的介紹,那麼如何搭建一個MLOPS?

mymlops是一個不錯的選擇,提供了50+種MLOPS中會用到的工具,根據流程進行組合

看了一圈發現直接使用MLflow或許是最簡潔的方案,如果是雲平臺kuberflow是一個不錯的選擇。目前來看,MLflow對前半部分:模型訓練、管理做的比較好;kuberflow在模型部署方面更有優勢。還需要深入使用,得出進一步結論。

一些公司的架構

美團

https://tech.meituan.com/2020/01/23/meituan-delivery-machine-learning.html

亞馬遜MLOPS

模型構建、訓練評估、生產、測試和質量控制、模型部署、監控

特徵治理

線上:高併發,低延遲

離線:Hbase

實驗管理

  • 實驗版本管理

模型管理

  • 模型編錄
  • 版本控制
  • 元資料管理
  • 上線狀態管理
  • 自動化部署
  • 模型血緣,pipeline記錄

工作流設計

  • 資料流處理
  • 模型訓練
  • 超參調優
  • 模型建立
  • 模型註冊
  • 模型批量管理
  • 特徵質量檢查
  • 可解釋性檢查
  • 條件分支
  • EMR
  • 回撥

模型監控

  • 特徵監控
  • 模型監控

資料是否有差異

指標差異

貝殼MLOPS

  • 資料平臺
  • 訓練平臺
  • 推理平臺

放棄hadoop,轉向k8s

tencent music