1. 程式人生 > >頂級的20名Python人工智慧和機器學習開源專案

頂級的20名Python人工智慧和機器學習開源專案

640?wx_fmt=jpeg&wxfrom=5&wx_lazy=1

本文用Python更新了頂級的AI和機器學習專案。Tensorflow已經成為了貢獻者的三位數增長的第一位。 Scikit-learn下降到第二位,但仍有非常大的貢獻者群體。

進入機器學習和人工智慧並非易事。考慮到今天可用的大量資源,許多有抱負的專業人員和愛好者發現難以在該領域建立正確的路徑。這個領域正在不斷髮展,我們必須跟上飛速發展的步伐。

經過資訊的更新、檢查,本文用Python更新了頂級的AI和機器學習專案。Tensorflow已經成為了貢獻者的三位數增長的第一位。 Scikit-learn下降到第二位,但仍有非常大的貢獻者群體。

與2016年相比,貢獻者人數增長最快的專案是:

1.TensorFlow增長169%,從493個增加到1324個貢獻者

2.Deap,增長86%,從21到39個貢獻者

3.Chainer,增長83%,從84到154個貢獻者

4.Gensim,增長81%,從145到262個貢獻者

5.Neon,增長66%,從47到78個貢獻者

6.Nilearn提高了50%,從46個到69個貢獻者

2018年的更新:

1.Keras,629名貢獻者

2.PyTorch,399名貢獻者

640?wx_fmt=jpeg&wxfrom=5&wx_lazy=1

Github上的前20名Python人工智慧和機器學習專案

大小與貢獻者的數量成正比,顏色代表貢獻者數量的變化,紅色更高,藍色更低。雪花形狀適用於深度學習專案,否則適用於其他專案。

我們看到像TensorFlow、Theano和Caffe這樣的深度學習專案是最受歡迎的專案之一。

640?wx_fmt=jpeg

下面的列表是根據Github上貢獻者的數量以降序給出的專案。貢獻者人數的變化是相對於2016年釋出的前20名Python機器學習的開源專案。

1. TensorFlow 最初是由谷歌機器智慧研究機構的Google Brain Team的研究人員和工程師開發的。該系統的設計是為了便於機器學習的研究,並使其快速、容易地從研究原型過渡到生產系統。

貢獻者:1324(168%),Github 網址:https://github.com/tensorflow/tensorflow

2. Scikit-learn 是用於資料探勘和資料分析的簡單而高效的工具,可供所有人訪問,並且可在各種環境中重用,基於NumPy、SciPy和matplotlib、開源、商業可用,BSD許可證。

貢獻者:1019(39%上),Github網址: https://github.com/scikit-learn/scikit-learn

3. Keras 是一種高階神經網路API,用Python編寫,能夠在TensorFlow、CNTK或Theano上執行。

貢獻者:629(新),Github網址: https://github.com/keras-team/keras

4.Python中的 PyTorch ,張量和動態神經網路以及強勁的GPU加速。

貢獻者:399(新),Github網址:https://github.com/pytorch/pytorch

5. Theano 允許你高效地定義、優化和評估涉及多維陣列的數學表示式。

貢獻者:327(24%上),Github網址: https://github.com/Theano/Theano

6. Gensim 是一個免費的Python庫,它具有可擴充套件的統計語義,分析用於語義結構的純文字文件,檢索語義相似的文件。

貢獻者:262(81%上升),Github網址: https://github.com/RaRe-Technologies/gensim

7. Caffe 是一個深思熟慮的表達,速度和模組化的深度學習框架。它由伯克利視覺和學習中心(BVLC)和社群貢獻者開發。

貢獻者:260(提高21%),Github網址: https://github.com/RaRe-Technologies/gensim

8. Chain er 是一個基於Python的深度學習模型的獨立開源框架。 Chainer提供靈活、直觀和高效能的手段來實施全面的深度學習模型,其中包括最新的模型,如遞迴神經網路和變分自動編碼器。

貢獻者:154(上升84%),Github網址: https://github.com/chainer/chainer

9. Statsmodels 是一個Python模組,允許使用者探索資料,估計統計模型並執行統計測試。描述統計、統計測、繪圖功能和結果統計的廣泛列表適用於不同型別的資料和每個估算器。

貢獻者:144(上升33%),Github網址: https://github.com/statsmodels/statsmodels/

10. Shogun 是機器學習工具箱,它提供了廣泛的統一和高效的機器學習(ML)方法。該工具箱無縫地允許組合多個數據表示、演算法類和通用工具。

貢獻者:139(上升32%),Github網址: https://github.com/shogun-toolbox/shogun

11. Pylearn2 是一個機器學習庫。其大部分功能都建立在Theano之上。這意味著你可以使用數學表示式編寫Pylearn2外掛(新模型,演算法等),Theano將為你優化和穩定這些表示式,並將它們編譯為你選擇的後端(CPU或GPU)。

貢獻者:119(3.5%上),Github網址: https://github.com/lisa-lab/pylearn2

12. NuPIC 是一個開源專案,它基於稱為分層時間儲存器(HTM)的新大腦皮層理論。部分HTM理論已經在應用中實施、測試和使用,HTM理論的其他部分仍在開發中。

貢獻者:85(提高12%),Github網址: https://github.com/numenta/nupic

13. Neon 是Nervana基於Python的深度學習庫。它提供易用性,同時提供最高的效能。

貢獻者:78(66%上),Github網址: https://github.com/NervanaSystems/neon

14. Nilearn 是一個Python模組,用於在NeuroImaging資料上進行快速簡單的統計學習。它利用scikit-learn Python工具箱進行多變數統計,並提供預測建模、分類、解碼或連線分析等應用。

貢獻者:69(上升50%),Github網址: https://github.com/nilearn/nilearn/branches

15. Orange3 是開源機器學習和資料視覺化新手,同時也是專家。使用大型工具箱互動式資料分析工作流程。

貢獻者:53(上升33%),Github網址: https://github.com/biolab/orange3

16. Pymc 是一個python模組,實現貝葉斯統計模型和擬合算法,包括馬爾可夫鏈蒙特卡羅。其靈活性和可擴充套件性使其適用於大量問題。

貢獻者:39(上升5.4%),Github網址: https://github.com/pymc-devs/pymc

640?wx_fmt=jpeg

17. Deap 是用於快速原型設計和測試思想的新型演化計算框架。它試圖使演算法明確、資料結構透明。它與多處理和SCOOP等並行機制完美協調。

貢獻者:39(86%上),Github網址: https://github.com/deap/deap

18. Annoy (近似最近鄰居Oh Yeah)是一個C ++庫,它使用Python繫結來搜尋接近給定查詢點的空間點。它還建立對映到記憶體的大型只讀基於檔案的資料結構,以便許多程序可以共享相同的資料。

貢獻者:35(46%上),Github網址: https://github.com/spotify/annoy

19. PyBrain 是Python的模組化機器學習庫。其目標是為機器學習任務提供靈活、易於使用但仍然強大的演算法,以及各種預定義環境來測試和比較的演算法。

貢獻者:32(3%上),Github網址: https://github.com/pybrain/pybrain

20. Fuel 是一個數據管道框架,它為你的機器學習模型提供他們需要的資料。計劃由Blocks和Pylearn2神經網路庫使用。

貢獻者:32(10%上),Github網址:https://github.com/mila-udem/fuel

640?wx_fmt=jpeg

640?wx_fmt=gif

640?wx_fmt=jpeg


點選下方“閱讀原文”瞭解【人工智慧實驗平臺】↓↓↓