1. 程式人生 > >Anaconda python各模組簡介

Anaconda python各模組簡介

Anaconda Python 是完全免費的企業級的Python發行大規模資料處理、預測分析和科學計算工具。
Anaconda 是 Python 科學技術包的合集,功能和 Python(x,y) 類似。它是新起之秀,已更新多次了。包管理使用 conda,GUI基於PySide,容量適中,但該有的科學計算包都有。Anaconda 支援所有作業系統平臺,它的安裝、更新和刪除都很方便,且所有的東西都只安裝在一個目錄中。Anaconda目前提供Python 2.6.X,Python 2.7.X,Python 3.3.X和Python 3.4.X四個系列發行包,這也是其他發行版所望塵莫及的。

關於Anaconda詳細文件,請在

這裡檢視。

下面介紹Anaconda整合的部分包(Anaconda採用conda進行包管理,想要安裝新包和解除安裝不需要的包都是很方便的,後面會專門介紹)。

第一部分 科學計算相關包

IPython provides a rich architecture for interactive computing with:
1)Powerful interactive shells (terminal and Qt-based).
2)A browser-based notebook with support for code, text, mathematical expressions, inline plots and other rich media.
3)Support for interactive data visualization and use of GUI toolkits.
4)Flexible, embeddable interpreters to load into your own projects.
5)Easy to use, high performance tools for parallel computing.

“iPython 是一個Python 的互動式Shell,比預設的Python Shell 好用得多,功能也更強大。 她支援語法高亮、自動完成、程式碼除錯、物件自省,支援 Bash Shell 命令,內建了許多很有用的功能和函式等,非常容易使用。 ” 啟動iPython的時候用這個命令“ipython –pylab”,預設開啟了matploblib的繪圖互動,用起來很方便。

2. numpy

NumPy is the fundamental package for scientific computing with Python. It contains among other things:
1)a powerful N-dimensional array object
2)sophisticated (broadcasting) functions
3)tools for integrating C/C++ and Fortran code
4) useful linear algebra, Fourier transform, and random number capabilities
Besides its obvious scientific uses, NumPy can also be used as an efficient multi-dimensional container of generic data. Arbitrary data-types can be defined. This allows NumPy to seamlessly and speedily integrate with a wide variety of databases.

NumPy幾乎是一個無法迴避的科學計算工具包,最常用的也許是它的N維陣列物件,其他還包括一些成熟的函式庫,用於整合C/C++和Fortran程式碼的工具包,線性代數、傅立葉變換和隨機數生成函式等。NumPy提供了兩種基本的物件:ndarray(N-dimensional array object)和 ufunc(universal function object)。ndarray是儲存單一資料型別的多維陣列,而ufunc則是能夠對陣列進行處理的函式。

3. scipy: Python Data Analysis Library

SciPy refers to several related but distinct entities:
1)The SciPy Stack, a collection of open source software for scientific computing in Python, and particularly a specified set of core packages.
2)The community of people who use and develop this stack.
3)Several conferences dedicated to scientific computing in Python – SciPy, EuroSciPy and SciPy.in.
4)The SciPy library, one component of the SciPy stack, providing many numerical routines.

matplotlib 是python最著名的繪相簿,它提供了一整套和matlab相似的命令API,十分適合互動式地進行製圖。而且也可以方便地將它作為繪圖控制元件,嵌入GUI應用程式中。Matplotlib可以配合ipython shell使用,提供不亞於Matlab的繪圖體驗。

matplotlib is a python 2D plotting library which produces publication quality figures in a variety of hardcopy formats and interactive environments across platforms. matplotlib can be used in python scripts, the python and ipython shell (ala MATLAB®* or Mathematica®†), web application servers, and six graphical user interface toolkits.

matplotlib 是python最著名的繪相簿,它提供了一整套和matlab相似的命令API,十分適合互動式地進行製圖。而且也可以方便地將它作為繪圖控制元件,嵌入GUI應用程式中。Matplotlib可以配合ipython shell使用,提供不亞於Matlab的繪圖體驗。

第二部分 機器學習、資料探勘相關工具包

You didn’t write that awful page. You’re just trying to get some data out of it. Beautiful Soup is here to help. Since 2004, it’s been saving programmers hours or days of work on quick-turnaround screen scraping projects.

爬蟲工具

2. pandas: Python Data Analysis Library

Pandas is a software library written for the Python programming language for data manipulation and analysis. In particular, it offers data structures and operations for manipulating numerical tables and time series.

Pandas也是基於NumPy和Matplotlib開發的,主要用於資料分析和資料視覺化,它的資料結構DataFrame和R語言裡的data.frame很像,特別是對於時間序列資料有自己的一套分析機制,非常不錯。

3. scikit-learn: Machine Learning in Python

scikit-learn (formerly scikits.learn) is an open source machine learning library for the Python programming language. It features various classification, regression and clustering algorithms including support vector machines, logistic regression, naive Bayes, random forests, gradient boosting, k-means and DBSCAN, and is designed to interoperate with the Python numerical and scientific libraries NumPy and SciPy.

scikit-learn是一個基於NumPy, SciPy, Matplotlib的開源機器學習工具包,主要涵蓋分類,迴歸和聚類演算法,例如SVM, 邏輯迴歸,樸素貝葉斯,隨機森林,k-means等演算法,程式碼和文件都非常不錯,在許多Python專案中都有應用。例如在我們熟悉的NLTK中,分類器方面就有專門針對scikit-learn的介面,可以呼叫scikit-learn的分類演算法以及訓練資料來訓練分類器模型。

4. nltk:Natural Language Toolkit

NLTK is a leading platform for building Python programs to work with human language data. It provides easy-to-use interfaces to over 50 corpora and lexical resources such as WordNet, along with a suite of text processing libraries for classification, tokenization, stemming, tagging, parsing, and semantic reasoning, and an active discussion forum.

自然語言處理包

第三部分 其他重要包

1. conda

Conda is an open source package management system and environment management system for installing multiple versions of software packages and their dependencies and switching easily between them. It works on Linux, OS X and Windows, and was created for Python programs but can package and distribute any software.

conda是一個開源的包管理和環境管理系統。包管理功能能讓你非常容易的安裝和解除安裝各種Python庫,並且很好的管理Anaconda的各個元件。環境管理功能支援在不同的python版本和外掛換將下進行切換,方便不同的開發需求。

相關功能在test-drive文件介紹的非常清楚,在此不再贅述。

2. ipython-notebook

使用一種基於Web技術的互動式計算文件格式。為什麼說它是文件格式,而非計算工具呢?實際上它兩者都是。Notebook 在互動上使用了 C/S 結構,它通過 Tornado 建立一個 shell 伺服器,並使用瀏覽器作為客戶端。另外 notebook 頁面都被儲存為 .ipynb 的類 JSON 檔案格式。這種檔案格式也是 Notebook 最吸引人的地方。IPython Notebook使用瀏覽器作為介面,向後臺的IPython伺服器傳送請求,並顯示結果。在瀏覽器的介面中使用單元(Cell)儲存各種資訊。Cell有多種型別,經常使用的有表示格式化文字的Markdown單元,和表示程式碼的Code單元。

3. spyder

Spyder是Python(x,y)的作者為它開發的一個簡單的整合開發環境。和其他的Python開發環境相比,它最大的優點就是模仿MATLAB的“工作空間”的功能,可以很方便地觀察和修改陣列的值。

4. pyqt

PyQt是一個建立GUI應用程式的工具包。它是Python程式語言和Qt庫的成功融合。Qt庫是目前最強大的庫之一。 PyQt實現了一個Python模組集。它有超過300類,將近6000個函式和方法。它是一個多平臺的工具包,可以執行在所有主要作業系統上,包括UNIX,Windows和Mac。 PyQt採用雙許可證,開發人員可以選擇GPL和商業許可。在此之前,GPL的版本只能用在Unix上,從PyQt的版本4開始,GPL許可證可用於所有支援的平臺。

5. cpython

用C語言實現Python及其直譯器

相關推薦

Anaconda python模組簡介

Anaconda Python 是完全免費的企業級的Python發行大規模資料處理、預測分析和科學計算工具。 Anaconda 是 Python 科學技術包的合集,功能和 Python(x,y) 類似。它是新起之秀,已更新多次了。包管理使用 conda,GUI

深度學習模組簡介及作用

1、BatchNormalization 1.1 簡介 BatchNorm來源參考論文:Ioffe S, Szegedy C. Batch Normalization: Accelerating Deep Network Training by Reducin

python paramiko模組簡介及安裝

一:簡介 paramiko是用python語言寫的一個模組,遵循SSH2協議,支援以加密和認證的方式,進行遠端伺服器的連線。 由於使用的是python這樣的能夠跨平臺執行的語言,所以所有python支援的平臺,如Linux, Solaris, BSD, MacOS X, Windows等,par

python資料分析與挖掘模組簡介

   所謂資料分析,即對已知的資料進行分析,然後提取出一-些有價值的資訊,比如統計出平均數、標準差等資訊,資料分析的資料量有時可能不會太大,而資料探勘,是指對大量的資料進行分析與挖掘,得到一些未知的,有價值的資訊等,比如從網站的使用者或使用者行為資料中挖掘出使用者的潛在需求資訊,

linux系統下 Anaconda 安裝python擴充套件模組 非常方便

最近需要在linux上安裝一些python的擴充套件模組,而我的電腦yum源又不能使用(主要是自己懶得換yum源),如果直接下載模組,然後離線安裝的話,會發現由於缺少其他模組導致安裝失敗,所以非常浪費時間,,,因此,你可以通過安裝Anaconda來安裝pytho

python中os.path以及sys.path模組簡介

1.sys.path —— 動態地改變Python搜尋路徑 如果python中匯入的package或module不在環境變數PATH中,那麼可以使用sys.path將要匯入的package或module加入到PATH環境變數中。 import sys sys.path.a

python中的hashlib模組簡介

python中提供了一個名叫hashlib的模組,用於資料加密 import hashlib#首先匯入hashlib模組 m = hashlib.加密方式()#選擇需要的加密方式 m.update(要加密的資料.encode('utf8'))#對需要加密的資料進行加密 m.disgest

Python影象處理PIL模組詳細介紹

Image模組 Image模組是在Python PIL影象處理中常見的模組,對影象進行基礎操作的功能基本都包含於此模組內。如open、save、conver、show…等功能。 open類 Image.open(file) ⇒ image

python中的queue模組簡介

本文主要介紹python中用來實現執行緒間通訊的訊息佇列模組Queue,主要包括: 模組介紹 API介紹 一、模組介紹 Queue模組用來實現訊息佇列功能,可以實現執行緒間安全的訊息交換。各個執行緒可以通過呼叫訊息佇列例項對訊息佇列進行操縱

python~module gzip 使用方法,及簡介! 附件 python ~ os 模組!!!

這個模組提供了一些簡單的介面來對檔案進行壓縮和解壓縮類似於GNU專案的gzip和gunzip,資料的壓縮源於zlib模組的支援。gzip.open(filename, mode='rb', compresslevel=9, encoding=None, errors=Non

geohash 模組安裝及使用(Anaconda.Python 2)

1 安裝場景 在 anaconda多核心環境中,實現 由 經緯度 得到 geohash 編碼 . 實現方式: 安裝 Geohash 模組 安裝方式 通過 命令列 安裝 在 Anaconda Prompt 視窗中,通過 pip 或 conda 命令安裝G

Python安裝模組(numpy等)問題的兩種解決辦法——常規方法和Anaconda

一.常見模組安裝問題 Python是現在最頂尖的幾個研究方向(人工智慧、機器學習等)的主流程式語言,博主因為要參加競賽也需要學習Python(主要是科學計算方面),現階段會用到的模組有numpy、scipy、matplotlib及scikit-learn(在f

#Python第三方模組學習(二)—— matplotlib模組的功能及使用簡介

本文多來源於網路,部分添加了自己的思考,如侵權請立馬聯絡我作者刪除。本人初來乍到,如有錯誤還望指出,敬謝! 一、折線圖的繪製  plot函式 生成規則,前兩個引數預設為橫座標和縱座標,倘如只給一個引數預設給出為縱座標,橫座標將自動填充[0,n-1]. 這些線的粗細

Anacondapython安裝模組命令

    方法一:         在Anaconda Prompt裡執行conda install 模組名     方法二:         下載模組的whl安裝包,然後在Anaconda Prompt裡執行 pip install 模組名(含路徑)     方法三:  

python框架和模組對矩陣的運算比較

最近在學習numpy,pandas,tensorflow和pytorch,突然想試試各種不同的方法對矩陣的運算效率如何,以下是程式碼: import tensorflow as tf import pandas as pd import torch impor

hadoop streaming anaconda python 計算平均值

sdn cat pipe cal 存在 格式 ins too stream 原始Liunx 的python版本不帶numpy ,安裝了anaconda 之後,使用hadoop streaming 時無法調用anaconda python , 後來發現是參數沒設置好。。。

Unix時間戳轉日期時間格式,C#、Java、Python語言實現!

[1] oda total 轉換 n) str nbsp -m col 之前有個Q上好友沒事問我,怎麽自己寫Unix時間戳轉日期時間?於是我就順手寫了個C#版本給他!最近想起來,就萌發多寫幾個語言的版本分享,權當練習思路外加熟悉另外兩種語言。 先說轉換步驟 先處理年份

[ZZ] 如何在多版本anaconda python環境下轉換spyder

過程 pda 名稱 -- idt anaconda rip gin div https://www.zhihu.com/people/alexwhu/answers 使用anaconda的話,可以參考以下步驟: 1、打開anaconda navigator

Python 3 mysql 簡介安裝

-1 新浪 其他 軟件 epo centos 6 nal base 數據庫管理系統 Python 3 mysql 簡介安裝 一、數據庫是什麽 1、 什麽是數據庫(DataBase,簡稱DB) 數據庫(database,DB)是指長期存儲在計算機內的,有組織,可共享的數據的

python種類型的轉換

數值 style long clas lis 種類 pan 進制轉換 十六 #進制轉換 ord(x) #將一個字符轉換為它的整數值 hex(x) #將一個整數轉換為一個十六進制字符串 oct(