資料分析Numpy庫入門

阿新 • • 發佈：2019-01-10

NumPy庫入門

Python組織不同維度資料的方式

一維資料：用列表，例如：[3.1398, 3.1349, 3.1376] 有序；和集合型別，例如： {3.1398, 3.1349, 3.1376} 無序。

二維資料：列表型別

多維資料：列表型別，例如：[ [3.1398, 3.1349, 3.1376], [3.1413, 3.1404, 3.1401] ]

高維資料：字典型別，例如：dict = {“firstName” :“Tian”, “lastName” : “Song”, }，或者資料表示格式：JSON、XML和YAML格式等。

NumPy簡介

NumPy是一個開源的Python科學計算基礎庫，包含：

1.一個強大的N維陣列物件ndarray

2.廣播功能函式

3.整合C/C++/Fortran程式碼的工具

4. 線性代數、傅立葉變換、隨機數生成等功能

NumPy是SciPy、Pandas等資料處理或科學計算庫的基礎

NumPy的引用，引入模組的別名：import numpy as np。儘管別名可以省略或更改，建議使用這個約定的別名。

NumPy的陣列物件：ndarray

Python已有列表型別，為什麼需要一個數組物件

(型別)？

1.ndarray陣列物件可以去掉元素間運算所需的迴圈，使一維向量更像單個數據；

2.設定專門的陣列物件，經過優化，可以提升這類應用的運算速度；

3.實際觀察可以發現：在科學計算中，一個維度所有資料的型別往往相同；

4.陣列物件採用相同的資料型別，有助於節省運算和儲存空間。

ndarray是一個多維陣列物件，由兩部分構成：

• 實際的資料

• 描述這些資料的元資料（資料維度、資料型別等）

ndarray陣列一般要求所有元素型別相同（同質），陣列下標從0開始。

ndarray在程式中的別名是:array，軸(axis): 儲存資料的維度；秩(rank)：軸的數量。

ndarray物件的屬性

屬性	說明
ndim	秩，即軸的數量或維度的數量
shape	ndarray物件的尺度，對於矩陣，n行m列
size	ndarray物件元素的個數，相當於.shape中n*m的值
dtype	ndarray物件的元素型別
itemsize	ndarray物件中每個元素的大小，以位元組為單位

Ndarray陣列元素型別

資料型別	說明
bool	布林型別，True或False
intc	與C語言中的int型別一致，一般是int32或int64
intp	用於索引的整數，與C語言中ssize_t一致，int32或int64
int8	位元組長度的整數，取值：[‐128, 127]
int16	16位長度的整數，取值：[‐32768, 32767]
int32	32位長度的整數，取值：[‐2^31 , 2^31‐1]
int64	64位長度的整數，取值：[‐2^63 , 2^63‐1]
uint8	8位無符號整數，取值：[0, 255]
uint16	16位無符號整數，取值：[0, 65535]
uint32	32位無符號整數，取值：[0, 2^32‐1]
uint64	32位無符號整數，取值：[0, 2^64‐1]
float16	16位半精度浮點數：1位符號位，5位指數，10位尾數
float32	32位半精度浮點數：1位符號位，8位指數，23位尾數
float64	64位半精度浮點數：1位符號位，11位指數，52位尾數
complex64	複數型別，實部和虛部都是32位浮點數
complex128	複數型別，實部和虛部都是64位浮點數

說明：浮點數的表示：(符號)尾數 *10^指數，複數的表示：實部(.real)+ j虛部(.imag)。

ndarray為什麼要支援這麼多種元素型別？對比：Python語法僅支援整數、浮點數和複數3種類型。

1.科學計算涉及資料較多，對儲存和效能都有較高要求；

2.對元素型別精細定義，有助於NumPy合理使用儲存空間並優化效能；

3.對元素型別精細定義，有助於程式設計師對程式規模有合理評估

注意：ndarray陣列可以由非同質物件構成，非同質ndarray元素為物件型別，但是非同質ndarray物件無法有效發揮NumPy優勢，儘量避免使用。

ndarray陣列的建立方法

1.從Python中的列表、元組等型別建立ndarray陣列

2.使用NumPy中函式建立ndarray陣列，如：arange, ones, zeros等

3. 從位元組流（raw bytes）中建立ndarray陣列

4.從檔案中讀取特定格式，建立ndarray陣列

（1）從Python中的列表、元組等型別建立ndarray陣列：x = np.array(list/tuple)，x = np.array(list/tuple,dtype=np.float32)，當np.array()不指定dtype時，NumPy將根據資料情況關聯一個dtype型別。

（2）使用NumPy中函式建立ndarray陣列，如：arange, ones, zeros等。

函式	說明
np.arange(n)	類似range()函式，返回ndarray型別，元素從0到n‐1
np.ones(shape)	根據shape生成一個全1陣列，shape是元組型別
np.zeros(shape)	根據shape生成一個全0陣列，shape是元組型別
np.full(shape,val)	根據shape生成一個數組，每個元素值都是val
np.eye(n)	建立一個正方的n*n單位矩陣，對角線為1，其餘為0
np.ones_like(a)	根據陣列a的形狀生成一個全1陣列
np.zeros_like(a)	根據陣列a的形狀生成一個全0陣列
np.full_like(a,val)	根據陣列a的形狀生成一個數組，每個元素值都是val

（3）使用NumPy中其他函式建立ndarray陣列：

函式	說明
np.linspace()	根據起止資料等間距地填充資料，形成陣列
np.concatenate()	將兩個或多個數組合併成一個新的陣列

ndarray陣列的變換

對於建立後的ndarray陣列，可以對其進行維度變換和元素型別變換

函式	說明
.reshape(shape)	不改變陣列元素，返回一個shape形狀的陣列，原陣列不變
.resize(shape)	與.reshape()功能一致，但修改原陣列
.swapaxes(ax1,ax2)	將陣列n個維度中兩個維度進行調換
.flatten()	對陣列進行降維，返回摺疊後的一維陣列，原陣列不變

注意：astype()方法一定會建立新的陣列（原始資料的一個拷貝），即使兩個型別一致。

ndarray陣列的操作

索引：獲取陣列中特定位置元素的過程；切片：獲取陣列元素子集的過程。

一維陣列的索引和切片：與Python的列表類似：

ndarray陣列的運算

陣列與標量之間的運算作用於陣列的每一個元素

NumPy一元函式，對ndarray中的資料執行元素級運算的函式

函式	說明
np.abs(x) np.fabs(x)	計算陣列各元素的絕對值
np.sqrt(x)	計算陣列各元素的平方根
np.square(x)	計算陣列各元素的平方
np.log(x) np.log10(x) np.log2(x)	計算陣列各元素的自然對數、10底對數和2底對數
np.ceil(x) np.floor(x)	計算陣列各元素的ceiling值或 floor值
np.rint(x)	計算陣列各元素的四捨五入值
np.modf(x)	將陣列各元素的小數和整數部分以兩個獨立陣列形式返回
np.cos(x) np.cosh(x) np.sin(x) np.sinh(x) np.tan(x) np.tanh(x)	計算陣列各元素的普通型和雙曲型三角函式
np.exp(x)	計算陣列各元素的指數值
np.sign(x)	計算陣列各元素的符號值，1(+), 0, ‐1(‐)

NumPy二元函式

函式	說明
+ ‐ * / **	兩個陣列各元素進行對應運算
np.maximum(x,y) np.fmax() np.minimum(x,y) np.fmin()	元素級的最大值/最小值計算
np.mod(x,y)	元素級的模運算
np.copysign(x,y)	將陣列y中各元素值的符號賦值給陣列x對應元素
> < >= <= == !=	算術比較，產生布爾型陣列

總結

資料分析Numpy庫入門

NumPy庫入門 Python組織不同維度資料的方式一維資料：用列表，例如：[3.1398, 3.1349, 3.1376] 有序；和集合型別，例如： {3.1398, 3.134

python進階（資料分析numpy庫二）

2、ndarray陣列的切片：（1）陣列切片的基本知識各個維度上單獨切片，用 “，” 隔開，用 “：”表示該維度所有的值。

python進階（資料分析numpy庫一）

numpy——基礎，以矩陣為基礎的數學計算模組，純數學儲存和處理大型矩陣。這個是很基礎的擴充套件，其餘的擴充套件都是以此為基礎。 scipy——數值計算庫,在numPy庫的基礎上增加了眾多的數學、科學以及工程計算中常用的庫函式。方便、易於使用、專為科學和工程設計的Py

Python資料分析Numpy庫方法簡介(二)

資料分析圖片儲存:vg 　　1.儲存圖片:plt.savefig(path) 　　2.圖片格式:jpg,png,svg(建議使用,不失真) 　　3.資料儲存格式: excle,csv csv介紹　　csv就是用逗號隔開的純文字資訊!!會以表格的資訊開啟矩陣生成的相關屬性　　　　

Python資料分析numpy庫方法簡介（一）

Numpy功能簡介: 1.官網:www.numpy.org 2.特點:(1)高效的多維矩陣/陣列; 　　　(2);複雜的廣播功能　　　(3):有大量的內建數學統計函式矩陣(多維陣列): 一維陣列: ([ 值1,值2,值3]) 維維陣列:　([[1,2,3],[4,5,6]])

Python資料分析Numpy庫方法簡介(四)

Numpy的相關概念2 副本和檢視副本：複製三種情況屬於淺copy 賦值運算切片檢視：連結，運算元組是，返回的不是副本就是檢視 c =a.view().建立a的檢視/影子和切片一樣都是淺copy

資料分析——numpy庫常用基本操作

本人是一個數據分析的愛好者，由於腦子不夠靈光，所以決定通過寫部落格來記錄自己的學習過程。百度許久，遍歷教程無數，發現做資料分析主要有一下的工具： 1、SAS：SAS（STATISTICAL ANALYSIS SYSTEM，簡稱SAS）公司開發的統計分析軟體，是一個功能強大的資料庫整合平臺。

python資料分析 -- numpy庫初識

標籤（空格分隔）：王小草機器學習筆記 python的強大之處不但因為簡潔易學高效，還在於她有許多庫，可以方便我們得到想要的計算。比如今天講的numpy庫，為python提供了快速的多維陣列的處理能力。有人數，numpy庫的出現使得python可以像mat

資料分析與挖掘入門——學習筆記（三）numpy的基本函式使用

numpy的基本函式使用 1 通用函式彙總一元函式函式說明 abs，fabs 計算整數、浮點數或複數的絕對值，對於非複數值，可以使用更快的fabs sqrt 計算各元素的平方根 square

NumPy庫入門

-s style -1 blog col ray font -128 eight ndarray數組的元素類型 ndarray數組的創建 ndarray數組的操作 ndarray數組的運算

資料分析---pandas庫

一、生成資料表 1、首先匯入pandas庫，一般都會用到numpy庫，所以我們先匯入備用： import numpy as np import pandas as pd 2、匯入CSV或者xlsx檔案： df = pd.DataFrame(pd.r

使用Python進行資料分析--------------NumPy基礎：陣列和向量計算

NumPy（Numerical重點內容 Python的簡稱）是Python數值計算最重要的基礎包。大多數提供科學計算的包都是用NumPy的陣列作為構建基礎。 NumPy的部分功能如下： - ndarray，一個具有向量算術運算和複雜廣播能力的快速且節省空間的多維陣列。 -

資料分析之pandas入門

概念 Python Data Analysis Library 或 pandas 是基於NumPy 的一種工具，該工具是為了解決資料分析任務而建立的。Pandas 納入了大量庫和一些標準的資料模型，提供了高效地操作大型資料集所需的工具。pandas提供了大量能使我們快速便捷地處理資料的

python資料分析超簡單入門 -- 專案實踐篇

| 導語適用於資料分析小白們~ ------ up主也是小白一枚，大加一起交流哈寫在前面的話： 1、專案來源於up主自學udacity中的一個專案實踐，up主自身能力不足，因此文章很淺顯 2、泰坦尼克資料集是kaggle中一個好的可選資料集，網上有很多基於此資料集的分析&a

python大資料分析——Matplotlib庫

Matplotlib作圖基本程式碼 import numpy as np import matplotlib.pyplot as plt x=np.linspace(0,10,1000) #x軸的自變數 y=np.sin(x)+1 #函式 z=np.cos(x**2)+1 #函式 plt

Python中numpy庫入門

Python中numpy Numpy是一個開源的Python科學計算基礎庫以下學習自中國大學MOOC 嵩天《Python資料分析與展示》一.Numpy庫入門 1.Numpy的引入 import numpy as np 使用別名可以縮短在程式中匯入nump

python資料分析處理庫-Pandas資料讀取、索引與計算

Pandas資料讀取、索引與計算 Pandas資料結構為DataFrame，裡面可以同時是int、float、object（string型別時）、datatime、bool資料型別 import p

python資料分析處理庫-Pandas之Series結構及Series常用操作方法

我上上篇部落格說過：Pandas資料結構為DataFrame，裡面可以同時是int、float、object（string型別時）、datatime、bool資料型別。而構成DataFrame結構的每一

資料分析——numpy

DIKW DATA-->INFOMATION-->KNOWLEDGE-->WISDOM 資料-->資訊-->知識-->智慧爬蟲-->資料庫-->資料分析-->機器學習資訊：通過某種方式組織和處理資料，分析資料間的關係，資料就有了意義知識

Python資料分析Pandas庫之熊貓(10分鐘二)

pandas 10分鐘教程(二) 重點發法分組 groupby('列名') groupby(['列名1','列名2',.........]) 分組的步驟 (Splitting) 按照一些規則將資料分為不同的組,拆分 (Applying) 對於每組資料分別

資料分析Numpy庫入門

Python組織不同維度資料的方式

NumPy簡介

NumPy的陣列物件：ndarray

Ndarray陣列元素型別

ndarray陣列的建立方法

ndarray陣列的變換

ndarray陣列的操作

ndarray陣列的運算

總結

相關推薦