5個常用的機器學習python庫

阿新 • • 發佈：2019-01-06

前言

機器學習的工作內容往往復雜枯燥又困難——通過大量重複工作進行提升必不可少：
彙總工作流及傳輸渠道、設定資料來源以及在內部部署和雲部署的資源之間來回分流。

所以使用工具提升你的工作效率實在很關鍵，而且像這樣的工具越多越好。

好在你學的是Python，作為一門威力巨大的工具語言，Python可以給你提供足夠的輔助工具，讓你在大資料和機器學習專案中游刃有餘。

唯一的問題在於Python海量的資源庫讓患有選擇困難症的你難以取捨，因此糖豆貼心的給你找來了目前評價最高的五個Python庫。

Python學習資料或者需要程式碼、視訊加Python學習群：960410445

1. PyWren

專案地址：https://github.com/ericmjonas/pywren

推薦5個機器學習Python 庫，國內外評價超高

PyWren專案

PyWren，簡單而強大，用於進行基於Python的科學計算工作。

專案 At The New Stack 的簡介這樣描述 PyWren:

把 AWS Lambda 作為一個巨大的平行處理系統，以處理那些可被切割成諸多小任務的專案，同時還可以節約很多記憶體和硬碟空間。

Lambda 函式的一個缺點是執行時間最長不能超過 300 秒。

但是，如果你有一個只花費幾分鐘就能完成卻需要在資料集中執行數千次的工作，那麼 PyWren 也許是一個好選擇，它可以在雲端完成一種使用者硬體上不可用的規模平行化的工作。

2. Tfdeploy

專案地址：https://github.com/riga/tfdeploy

推薦5個機器學習Python 庫，國內外評價超高

Tfdeploy專案

如果你需要使用基於谷歌的 TensorFlow 框架的訓練模型卻不想使用框架本身的話，Tfdeploy可以幫你。

藉由 Tfdeploy，可以在 Python 中使用模型，而且僅僅需要Numpy 的數學和統計庫作為支撐。

幾乎所有能在 TensorFlow 上跑的執行也能在 Tfdeploy 上跑，而且你可以通過標準 Python 隱喻方式來延伸庫的行為（比如，超載一個類別）。

但是，Tf 部署並不支援 GPU 加速。

3.Luigi

專案地址：https://github.com/spotify/luigi

推薦5個機器學習Python 庫，國內外評價超高

Luigi專案

編寫成批作業通常只是處理海量資料的其中一步：你也不得不將所有這些工作串聯起來，做成類似工作流程的東西。

Luigi 是 Spotify 打造的，用於解決所有通常與長期執行成批處理作業有關的管道問題。

有了 Luigi，研發人員就可以從事幾個很難、與資料無關的任務處理——「 Hive 詢問，在 Jave 上完成的 Hadoop 任務， Scala 上的 Spark 任務，從資料庫中匯出表格」——創造一個端到端執行它們的工作流。

對任務的整個描述以及依存性被打造為 Python 模組，和 XML 配置文件或其他資料形式不同，因此，可以被組合到其他以 Python 為中心的專案中去。

4.Kubelib

專案地址：https://github.com/safarijv/kubelib

推薦5個機器學習Python 庫，國內外評價超高

Kubelib專案

如果你採用 Kubernetes 作為完成機器學習工作的編排系統（orchestration system），那你可能要小心的維護以免其自身執行的BUG比它能解決的問題都多。

Kubelib 為 Kubernetes 提供了一系列的 Python 介面，雖說需要 Jekins ing 作為支援，但沒有 Jenkins 的情況下也能夠使用。

它能夠完成暴露在 kubectl CLI 或者 Kubernetes API 中的所有事。

5.PyTorch

專案地址：https://github.com/pytorch/pytorch

推薦5個機器學習Python 庫，國內外評價超高

PyTorch專案

最後一個成員還比較新，但卻已經制造了足夠大的聲勢：Python 庫新成員 Pytorch，這一個Torch 機器學習框架工具。

PyTorch 不僅為 Torch 添加了 Python 埠，也增加了許多其他的便利，比如 GPU 加速，共享記憶體完成多重處理（multiprocessing，特別是多核上隔離開的工作。)

最大的亮點在於它們能為 Numpy 中的無加速功能提供 GPU 驅動的替代選擇。

5個常用的機器學習python庫

前言機器學習的工作內容往往復雜枯燥又困難——通過大量重複工作進行提升必不可少：彙總工作流及傳輸渠道、設定資料來源以及在內部部署和雲部署的資源之間來回分流。所以使用工具提升你的工作效率實在很關鍵，而且像這樣的工具越多越好。好在你學的是Python，作為一門威力巨

Python資料分析與機器學習-Python庫分析科比生涯資料

原始碼下載：http://download.csdn.net/download/adam_zs/10222492 import matplotlib.pyplot as plt import pandas as pd import numpy as np '''科比生涯

機器學習python庫sciki-learn學習筆記

1.計算分類器精度 1.1 from sklearn.metrics import accuracy_score accuracy_score(pred, label_test) 1.2 clf.score(data_test, label_test)

2018 年 8 月以來 5 個最好的機器學習 GitHub 庫和 Reddit 執行緒.md

2018 年 8 月以來 5 個最好的機器學習 GitHub 專案和 Reddit 熱帖 PRANAV DAR, SEPTEMBER 2, 2018 前言當我去年年初開始使用 GitHub 時，我從來沒有想過它對我來說有多麼有用。最初我只是用它來上傳我自己

轉：25個Java機器學習工具和庫

重點推薦系統 mine 很多 .sh 分類器 ssi 包括 eve 轉自：http://www.cnblogs.com/data2value/p/5419864.html 本列表總結了25個Java機器學習工具&庫： 1. Weka集成了數據挖掘工作的機器學習算法

[機器學習python實踐(5)]Sklearn實現集成

ace 訓練存在 edi 每一個 predict utf-8 avg score 1,集成集成（Ensemble）分類模型是綜合考量多個分類器的預測結果，從而做出決策。一般分為兩種方式：1）利用相同的訓練數據同時搭建多個獨立的分類模型，然後通過投票的方式，以少數服從多數

學習筆記(五)5個常用模型的模型建立與評估

5個常用模型的模型建立與評估基本思路資料需求分析資料處理過程匯入包(包括下面的xgboost和lightgbm) 資料分析過程資料標準歸一化使用邏輯迴歸進行預測使用

機器學習 Python基礎1 Pandas DataFrame 常用方法速查手冊中文版

本文轉載自知乎文章 Pandas速查手冊中文版，原英文版 Pandas Cheat Sheet - Python for Data Science，在這基礎上加入了一些自己的理解。 Pandas 速查手冊匯入資料匯出資料建立測試物件檢視、

機器學習 Python基礎2 Pandas DataFrame 常用方法實踐

Pandas DataFrame 常用方法實踐常見的物件型別【pandas.core.series.Series】【pandas.core.frame.DataFrame】常用方法實踐 1）重新索引

Python機器學習依賴庫的安裝（numpy、scipy、sklearn）

說到機器學習，相信大部分的研究者都是使用python來完成的，因為是實在太方便了，幾行程式碼就搞定了，比較前人做的研究都積累在那邊，所以今天我又重新安裝了python（還不是因為要做機器學習方面的實驗和luwn論文），so開始吧！ 1、常用Python機器學習包 Numpy：用於科學計算的包

玩轉人工智慧（8）Python機器學習基礎庫、autoML、Apollo2.0介紹

本文前半部分介紹numpy、scipy、matplotlib、pandas、pyTorch等機器學習的基本函式庫。後半部分介紹cloud autoML和autoML Version、以及X度的Apollo 2.0/auto技術。 numpy庫是python中用來處理資料的函

windows下Python機器學習依賴庫安裝——numpy、scipy、sklearn、xgboost、theano等

接觸機器學習一段時間了，在環境配置上遇到不少坑，windows下環境配置尤甚，但近期發現了簡單也較直接的安裝方式，目前所接觸的所有依賴包無一例外都安裝成功，現分享出來，讓新手朋友少走彎路。一、多版本Python安裝先不論Python2.x與3.x如何取捨，兩個大的版

機器學習-Python自然語言處理庫

自然語言處理的庫非常多，下面列舉一些對Python友好，簡單易用，輕量，功能又全的庫。 1 中文 Hanlp Jieba snownlp 2 英文 NLTK Textblob 3 例項 3.1 中文自然語言處理Pipeline例項 3

機器學習Python實現AdaBoost

出了 .py learn tle 基礎向量 adsi pad del adaboost是boosting方法多個版本號中最流行的一個版本號，它是通過構建多個弱分類器。通過各個分類器的結果加權之後得到分類結果的。這裏構建多個分類器的過程也是有講究的，通過關註之前構建的分

機器學習 Matplotlib庫入門

ima ges 第三方類庫出圖 rgs 使用 src fig form 2017-07-21 15:22:05 Matplotlib庫是一個優秀的python的數據可視化的第三方類庫，其中的pyplot支持了類似matlab的圖像輸出操作。matplotlib.pyplo

機器學習python實戰----邏輯回歸

多次 python實戰 ron and 代碼實現技術訓練集錯誤常數　　當看到這部分內容的時候我是激動的，因為它終於能跟我之前學習的理論內容聯系起來了，這部分內容就是對之前邏輯回歸理論部分的代碼實現，所以如果有不甚理解的內容可以返回對照著理論部分來理解，下面我們進入

機器學習python實戰----線性回歸

pyplot 理論普通遍歷 sca def blog reg .so 一、綱要　　線性回歸的正規方程解法　　局部加權線性回歸二、內容詳述　　1、線性回歸的正規方程解法　　線性回歸是對連續型的數據進行預測。這裏討論的是線性回歸的例子，對於非線性回歸先不做討論。這

5個常用的機器學習python庫

1. PyWren

2. Tfdeploy

3.Luigi

4.Kubelib

5.PyTorch

5個常用的機器學習python庫

推薦5個機器學習Python 庫，國內外評價超高

推薦5個國內外評價超高的機器學習Python 庫

推薦5個國內外評價超高的機器學習Python 庫，實用！

Python資料分析與機器學習-Python庫分析科比生涯資料

機器學習python庫sciki-learn學習筆記

2018 年 8 月以來 5 個最好的機器學習 GitHub 庫和 Reddit 執行緒.md

轉：25個Java機器學習工具和庫

[機器學習python實踐(5)]Sklearn實現集成

學習筆記(五)5個常用模型的模型建立與評估

機器學習 Python基礎1 Pandas DataFrame 常用方法速查手冊中文版

機器學習 Python基礎2 Pandas DataFrame 常用方法實踐

Python機器學習依賴庫的安裝（numpy、scipy、sklearn）

玩轉人工智慧（8）Python機器學習基礎庫、autoML、Apollo2.0介紹

windows下Python機器學習依賴庫安裝——numpy、scipy、sklearn、xgboost、theano等

機器學習-Python自然語言處理庫

機器學習Python實現AdaBoost

機器學習 Matplotlib庫入門

機器學習python實戰----邏輯回歸

機器學習python實戰----線性回歸

5個常用的機器學習python庫

1. PyWren

2. Tfdeploy

3.Luigi

4.Kubelib

5.PyTorch

相關推薦