mlops的一些記錄
阿新 • • 發佈:2022-05-29
目錄
MLOPS
Hidden Technical Debt in Machine Learning Systems.
google對MLOPS的介紹:MLOps:機器學習中的持續交付和自動化流水線
mlops上也有不錯的介紹,那麼如何搭建一個MLOPS?
mymlops是一個不錯的選擇,提供了50+種MLOPS中會用到的工具,根據流程進行組合
看了一圈發現直接使用MLflow或許是最簡潔的方案,如果是雲平臺kuberflow是一個不錯的選擇。目前來看,MLflow對前半部分:模型訓練、管理做的比較好;kuberflow在模型部署方面更有優勢。還需要深入使用,得出進一步結論。
一些公司的架構
美團
https://tech.meituan.com/2020/01/23/meituan-delivery-machine-learning.html
亞馬遜MLOPS
模型構建、訓練評估、生產、測試和質量控制、模型部署、監控
特徵治理
線上:高併發,低延遲
離線:Hbase
實驗管理
- 實驗版本管理
模型管理
- 模型編錄
- 版本控制
- 元資料管理
- 上線狀態管理
- 自動化部署
- 模型血緣,pipeline記錄
工作流設計
- 資料流處理
- 模型訓練
- 超參調優
- 模型建立
- 模型註冊
- 模型批量管理
- 特徵質量檢查
- 可解釋性檢查
- 條件分支
- EMR
- 回撥
模型監控
- 特徵監控
- 模型監控
資料是否有差異
指標差異
貝殼MLOPS
- 資料平臺
- 訓練平臺
- 推理平臺
放棄hadoop,轉向k8s