1. 程式人生 > >20 個頂尖的 Python 機器學習開源專案

20 個頂尖的 Python 機器學習開源專案

1. Scikit-learn

www.github.com/scikit-learn/scikit-learn

Scikit-learn 是基於Scipy為機器學習建造的的一個Python模組,他的特色就是多樣化的分類,迴歸和聚類的演算法包括支援向量機,邏輯迴歸,樸素貝葉斯分類器,隨機森林,Gradient Boosting,聚類演算法和DBSCAN。而且也設計出了Python numerical和scientific libraries Numpy and Scipy

2.Pylearn2

www.github.com/lisa-lab/pylearn2

Pylearn是一個讓機器學習研究簡單化的基於Theano的庫程式。

3.NuPIC

www.github.com/numenta/nupic

NuPIC是一個以HTM學習演算法為工具的機器智慧平臺。HTM是皮層的精確計算方法。HTM的核心是基於時間的持續學習演算法和儲存和撤銷的時空模式。NuPIC適合於各種各樣的問題,尤其是檢測異常和預測的流資料來源。

4. Nilearn

www.github.com/nilearn/nilearn

Nilearn 是一個能夠快速統計學習神經影像資料的Python模組。它利用Python語言中的scikit-learn 工具箱和一些進行預測建模,分類,解碼,連通性分析的應用程式來進行多元的統計。

5.PyBrain

www.github.com/pybrain/pybrain

Pybrain是基於Python語言強化學習,人工智慧,神經網路庫的簡稱。 它的目標是提供靈活、容易使用並且強大的機器學習演算法和進行各種各樣的預定義的環境中測試來比較你的演算法。

6.Pattern

www.github.com/clips/pattern

Pattern 是Python語言下的一個網路挖掘模組。它為資料探勘,自然語言處理,網路分析和機器學習提供工具。它支援向量空間模型、聚類、支援向量機和感知機並且用KNN分類法進行分類。

7.Fuel

www.github.com/mila-udem/fuel

Fuel為你的機器學習模型提供資料。他有一個共享如MNIST, CIFAR-10 (圖片資料集), Google's One Billion Words (文字)這類資料集的介面。你使用他來通過很多種的方式來替代自己的資料。

8.Bob

www.github.com/idiap/bob

Bob是一個免費的訊號處理和機器學習的工具。它的工具箱是用Python和C++語言共同編寫的,它的設計目的是變得更加高效並且減少開發時間,它是由處理影象工具,音訊和視訊處理、機器學習和模式識別的大量軟體包構成的。

9.Skdata

www.github.com/jaberg/skdata

Skdata是機器學習和統計的資料集的庫程式。這個模組對於玩具問題,流行的計算機視覺和自然語言的資料集提供標準的Python語言的使用。

10.MILK

www.github.com/luispedro/milk

MILK是Python語言下的機器學習工具包。它主要是在很多可得到的分類比如SVMS,K-NN,隨機森林,決策樹中使用監督分類法。 它還執行特徵選擇。 這些分類器在許多方面相結合,可以形成不同的例如無監督學習、密切關係金傳播和由MILK支援的K-means聚類等分類系統。

11.IEPY

www.github.com/machinalis/iepy

IEPY是一個專注於關係抽取的開源性資訊抽取工具。它主要針對的是需要對大型資料集進行資訊提取的使用者和想要嘗試新的演算法的科學家。

12.Quepy

www.github.com/machinalis/quepy

Quepy是通過改變自然語言問題從而在資料庫查詢語言中進行查詢的一個Python框架。他可以簡單的被定義為在自然語言和資料庫查詢中不同型別的問題。所以,你不用編碼就可以建立你自己的一個用自然語言進入你的資料庫的系統。

現在Quepy提供對於Sparql和MQL查詢語言的支援。並且計劃將它延伸到其他的資料庫查詢語言。

13.Hebel

www.github.com/hannes-brt/hebel

Hebel是在Python語言中對於神經網路的深度學習的一個庫程式,它使用的是通過PyCUDA來進行GPU和CUDA的加速。它是最重要的神經網路模型的型別的工具而且能提供一些不同的活動函式的啟用功能,例如動力,涅斯捷羅夫動力,訊號丟失和停止法。

14.mlxtend

www.github.com/rasbt/mlxtend

它是一個由有用的工具和日常資料科學任務的擴充套件組成的一個庫程式。

15.nolearn

www.github.com/dnouri/nolearn

這個程式包容納了大量能對你完成機器學習任務有幫助的實用程式模組。其中大量的模組和scikit-learn一起工作,其它的通常更有用。

16.Ramp

www.github.com/kvh/ramp

Ramp是一個在Python語言下制定機器學習中加快原型設計的解決方案的庫程式。他是一個輕型的pandas-based機器學習中可插入的框架,它現存的Python語言下的機器學習和統計工具(比如scikit-learn,rpy2等)Ramp提供了一個簡單的宣告性語法探索功能從而能夠快速有效地實施演算法和轉換。

17.Feature Forge

www.github.com/machinalis/featureforge

這一系列工具通過與scikit-learn相容的API,來建立和測試機器學習功能。

這個庫程式提供了一組工具,它會讓你在許多機器學習程式使用中很受用。當你使用scikit-learn這個工具時,你會感覺到受到了很大的幫助。(雖然這隻能在你有不同的演算法時起作用。)

18.REP

www.github.com/yandex/rep

REP是以一種和諧、可再生的方式為指揮資料移動驅動所提供的一種環境。

它有一個統一的分類器包裝來提供各種各樣的操作,例如TMVA, Sklearn, XGBoost, uBoost等等。並且它可以在一個群體以平行的方式訓練分類器。同時它也提供了一個互動式的情節。

19.Python 學習機器樣品

www.github.com/awslabs/machine-learning-samples

用亞馬遜的機器學習建造的簡單軟體收集。

20.Python-ELM

www.github.com/dclambert/Python-ELM

這是一個在Python語言下基於scikit-learn的極端學習機器的實現。

相關推薦

20 頂尖Python 機器學習開源專案

1. Scikit-learn www.github.com/scikit-learn/scikit-learn Scikit-learn 是基於Scipy為機器學習建造的的一個Python模組,他的特色就是多樣化的分類,迴歸和聚類的演算法包括支援向量機,邏輯迴歸,樸

十大Python機器學習開源專案

1、Scikit-learn 用於資料探勘和資料分析的簡單而有效的工具,基於NumPy,SciPy和matplotlib,開源,商業可用的BSD許可證。 2、Tensorflow  最初由Google機器智慧研究機構的Google Brain小組的研究人員和工程師開發

TOP20你用了幾Python人工智慧與機器學習開源專案

主要發現     相對於2016年的報告,2018年《Top 20 Python AI and

頂級的20Python人工智慧和機器學習開源專案

本文用Python更新了頂級的AI和機器學習專案。Tensorflow已經成為了貢獻者的三位數增

30超讚的機器學習開源專案

Medium上的作者Mybridge從8800個專案中,挑選出了30個GitHub上收穫了超多星星的機器學習專案,量子位搬運一下,希望大家學的開心~ 注:此份列表的星星數量僅供參考,因為,GitHub上的星星數量是動態變化的。 No 1 | FastText 用於快速文字表示和分類的庫。

8800機器學習開源專案為你精選TOP30!

授權自AI科技大本營(ID: rgznai100)本文共圖文結合,建議閱讀5分鐘。本文為大家帶來

從8800機器學習開源專案中精選出Top30,推薦給你

A. 神經網路:深度學習 A-ZTM : 親手搭建人工神經網路(推薦次數68,745 , 4.5/5 stars) B.用Python進行深度學習的TensorFlow的完整指南(推薦次數17,834, 4.6/5 stars) 接下來是Mybridge精選的Top 30的專案: 1. FastT

28Github上最火的機器學習開源專案

1. TensorFlow TensorFlow 是谷歌釋出的第二代機器學習系統。據谷歌宣稱,在部分基準測試中,TensorFlow的處理速度比第一代的DistBelief加快了2倍之多。 具體的講,TensorFlow是一個利用資料流圖(Data Flow Grap

10月機器學習開源專案Top10

參加 2018 AI開發者大會,請點選 ↑↑↑ 作者 | Mybridge 譯者 | 林春眄 整理 | Jane 出品 | AI科技大本營 【導讀】過去一個月裡,我們對近 250 個機器學習開源專案進行了排名,並挑選出熱度前 10 的專案。這份清單

Github近期最有趣的10款機器學習開源專案

https://yq.aliyun.com/ziliao/294260 Face Recognition 世界上最簡單的人臉識別庫 Github近期最有趣的10款機器學習開源專案 本專案號稱世界上最簡單的人臉識別庫,可使用 Python 和命令列進行呼叫。該庫使用 dlib

機器學習開源專案

開源機器學習專案 30 個:原文地址 FastText:用於快速文字表示和分類的庫,基於快速文字的多語言無監督或監督詞嵌入 深色照片風格轉換:論文“深度照片風格轉移”程式碼和資料 Python和世界上最簡單的面部識別api和命令列 洋紅(Magenta):機器智慧生成音樂和藝

2018年10月Top 10機器學習開源專案

上個月MyBridge從250餘個新增機器學習開源專案中評選出了10個最佳專案: 這些專案在GitHub上平均獲得1345個star 專案涵蓋話題:深度學習,漫畫上色,影象增強,增強學習,資料庫 No.1 Fastai:利用當前最好的深度學習演算法簡化訓練神經網路的過程,包含了很多“開箱即用”

最新機器學習開源專案Top10

作者 | Mybridge 譯者 | Linstancy 整理 | Jane 出品 | AI科技大本營 【導讀】過去一個月裡,我們對近 1400 個機器學習專案進行了排名,並挑選出熱度前 10 的專案。這份清單涵蓋了包括 OpenAI 最新開發的 RN

11月最佳機器學習開源專案Top10!

整理 | Jane 出品 | AI科技大本營 過去一個月,我們從近 250 個機器學習開源專案中挑選出了最受大家關注的前十名。這些專案在 GitHub 上平均 Stars 數為 2713。這些專案涉及由 Google AI Research 開源的 BER

Python機器學習實戰專案--預測紅酒質量(超詳細)

用Scikit-Learn(sklearn)建立模型 1 環境搭建  Python 3+NumPy+Pandas+Scikit-Learn (sklearn) 2 匯入庫和模組 Numpy是比Python自身的巢狀列表(nested list structure)結構要高效的多的一

年度大盤點:機器學習開源專案及框架

我們先來看看Mybridge AI 中排名靠前的頂級開源專案,再聊聊機器學習今年都有哪些發展,最後探尋下新的一年中會有哪些有值得我們期待的事情。 頂級的開源專案 BERT BERT,全稱為Bidirectional Encoder Representations from

最適合練手的10大機器學習開源專案,趕緊收藏!

本文推薦的10大機器學習開源專案是由Mybridge從250個機器學習開源專案中挑選出來的,Gi

10大機器學習開源專案推薦(Github平均star為1385)

翻譯 | suisui出品 | 人工智慧頭條(AI_Thinker)本文推薦的10大機器學習開源專案是由Myb

Python & 機器學習專案實踐

機器學習是一項經驗技能,經驗越多越好。在專案建立的過程中,實踐是掌握機器學習的最佳手段。在實踐過程中,通過實際操作加深對分類和迴歸問題的每一個步驟的理解,達到學習機器學習的目的。 預測模型專案模板 不能只通過閱讀來掌握機器學習的技能,需要進行大量的練習。

20很棒的android開源專案幫助你提升開發技能

對程式設計師來說,最好的學習也是閱讀,多看別人優秀的程式碼,加以總結學習應用。如果你想成為一個更好的開發者,就必須閱讀大量的程式碼。 書本,部落格,論壇在一定程度上都是比較好的,但是比不上一些功能完整詳細的開源專案。 所以你要做的就是喝著咖啡看程