機器學習模型部署摘要

阿新 • • 發佈：2022-03-13

1、如果是實時的、小資料量的預測應用，則採用的SOA呼叫Rserve或者python-httpserve來進行應用；這種應用方式有個缺點是需要啟用服務來進行預測，也就是需要跨環境，從Java跨到R或者Python環境。對於效能，基本上我們用Rserver方式，針對一次1000條或者更少請求的預測，可以控制95%的結果在100ms內返回結果，100ms可以滿足工程上的實踐要求。更大的資料量，比如10000/次，100000/次的預測，我們目前評估下來滿足不了100ms的要求，建議分批進行呼叫或者採用多執行緒請求的方式來實現。

2、如果是實時、大資料量的預測應用，則會採用SOA，訓練好的模型轉換成PMML（關於如何轉換，我在下面會詳細描述），然後把模型封裝成一個類，用Java呼叫這個類來預測。用這種方式的好處是SOA不依賴於任何環境，任何計算和開銷都是在Java內部裡面消耗掉了，所以這種工程級別應用速度很快、很穩定。用此種方法也是要提供兩個東西，

模型檔案和預測主類；

3、如果是Offline（離線）預測的，D+1天的預測，則可以不用考慮第1、2中方式，可以簡單的使用Rscript x.R或者python x.py的方式來進行預測。使用這種方式需要一個排程工具，如果公司沒有統一的排程工具，你用shell的crontab做定時呼叫就可以了。

by：【1】

部署方式：

http Restful
runtime 呼叫
pmml, onnx
docker
spark 整合

【1】機器學習演算法線上部署方法. https://zhuanlan.zhihu.com/p/24902234

使用docker+fastapi部署機器學習可參考：

Dcoker官方文件

https://docs.docker.com/engine/install/ubuntu/#install-using-the-convenience-script

fastapi+docker

https://fastapi.tiangolo.com/zh/deployment/docker/#build-a-docker-image-for-fastapi

機器學習模型部署摘要

1、如果是實時的、小資料量的預測應用，則採用的SOA呼叫Rserve或者python-httpserve來進行應用；這種應用方式有個缺點是需要啟用服務來進行預測，也就是需要跨環境，從Java跨到R或者Python環境。對於效能，基本上我

基於FastAPI和Docker的機器學習模型部署快速上手

針對前文所述機器學習模型部署摘要中docker+fastapi部署機器學習的一個完整示例

在AWS上部署、監控和擴充套件機器學習模型

作者|Aparna Dhinakaran 編譯|Flin 來源|towardsdatascience 部署健壯的、可擴充套件的機器學習解決方案仍然是一個非常複雜的過程，需要大量的人力參與，並做出很多努力。因此，新產品和服務需要很長時間才能上市，

比Keras更好用的機器學習“模型包”：0程式碼上手做模型

做機器學習模型時，只是融合各種演算法，就已經用光了腦細胞？又或者覺得，資料預處理就是在“浪費時間”？

從利用認知 API 到構建出自定義的機器學習模型，中間有哪些坑？

如果你從西雅圖駕車往東行，要不了多久就會看到風力發電機組。這些巨大的機器遍佈在連綿起伏的丘陵和平原上，從刮過其間從不間斷的風中生產電力。其中每一臺風機都會生成海量的資料。這些資料被用於強化機器

讓機器耳濡目染：MIT提出跨模態機器學習模型

2019獨角獸企業重金招聘Python工程師標準>>> 時間2017-06-11 17:28:22機器之心

python使用cuML訓練你的機器學習模型

作者|Khuyen Tran 編譯|VK 來源|Towards Data Science 動機 Sklearn是一個很好的庫，有各種機器學習模型，可以用來訓練資料。但是如果你的資料很大，你可能需要很長時間來訓練你的資料，特別是當你用不同的超引數來尋

深度學習模型部署

　　摘要：主要介紹下完成了模型訓練、評估之後的部署環節。　　前言：之前輿情情感分析那一篇文章已經講了如何使用ernie以及paddlehub來進行模型的訓練和優化以及評估環節，所以接下來會講下如何進行部署，進行實際

機器學習模型評估指標

在使用機器學習演算法過程中，針對不同的問題需要不用的模型評估標準，這裡統一彙總。主要以兩大類分類與迴歸分別闡述。

最簡單的機器學習模型搭建——線性迴歸（基於Pytorch和Python 3.7）

技術標籤：神經網路網路深度學習python機器學習構建資料集這裡使用的是torch.rand()函式構建資料集建立一個

網傳位元組跳動實習生刪除 GB 以下所有機器學習模型：疑似被誤刪，影響不大

昨晚脈脈上有網友爆料，位元組跳動一位實習生刪除了公司所有輕量級別的機器學習模型！

建立機器學習模型

一、課題背景：如今交通發展迅速，交通方式越來越多樣化，從以前的步行到如今滿地的汽車飛馳，人們對於速度的追求越來越高，因為有效的交通方式的選擇可以幫助我們大大的縮短在路上的時間，提高我們做事的效率，再

深度學習模型部署的幾種方法

由於模型訓練完之後需要上線部署，這個過程中需要將模型整合到當前的軟體架構中，因此要根據軟體架構考慮模型的實際部署方法。目前來看主流的部署方法有以下幾種方案：

二、機器學習模型評估

二、機器學習模型評估 2.1 模型評估：基本概念錯誤率(Error Rate) 預測錯誤的樣本數a佔樣本總數的比例m

機器學習——模型評估

　　“沒有測量，就沒有科學。”這是科學家門捷列夫的名言。在電腦科學特別是機器學習領域中，對模型的評估同樣至關重要。只有選擇與問題相匹配的評估方法，才能快速地發現模型選擇或訓練過程中出現的問題，迭代地

機器學習模型（二）決策樹

導語：區域性空間的線性擬合非線性（近鄰分析，決策樹），高維空間平面在低維空間的展示（例如：多項式；神經網路；SVM用核函式假裝去高維）。

機器學習模型評估指標彙總 (一）

參考：https://www.cnblogs.com/zongfa/p/9431807.html 在使用機器學習演算法過程中，針對不同的問題需要不用的模型評估標準，這裡統一彙總。主要以兩大類分類與迴歸分別闡述。

機器學習模型的評估指標

（原創）本文討論機器學習的評估指標 1.混淆矩陣混淆矩陣包括4個基本指標量，反映預測正負樣本的情況。他們是 TP,TN,FP,FN，其中第一個字母，表示預測的正確與否，正確為T true，錯誤為F false第二個字母，表示預測

機器學習模型進行predict預測時，預測全為1

最近在維護xgboost二分類運算元，經過現場客戶反饋的問題，模型在評估推理的時候，結果很不理想，實際測試確實模型預測全為1

機器學習—模型選擇與優化7-1（k-fold交叉驗證法）

使用k-fold交叉驗證法選擇最優鑽石價格模型主要步驟流程： 1. 匯入包 2. 匯入資料集