資料分析之numpy常用知識點、難點梳理

阿新 • • 發佈：2018-11-09

一、與random有關的一些函式的區別，首先匯入numpy

	import numpy as np

np.random.randint(low, high=None, size=None, dtype=‘l’)
從low到high的範圍隨機取整數填充多維陣列, size用於指定陣列的形狀,dtype預設為長整型
np.random.random(size=None)
函式隨機生成0到1的隨機數 [0,1) 填充陣列,size指定多維陣列的形狀
np.random.randn(d0, d1, …, dn)
產生以0為中心方差為1 的標準正太分佈的隨機數填充陣列, 傳入幾個引數，就建立幾維陣列

np.random.normal(loc=0.0, scale=1.0, size=None)
normal是可以指定中心和方差的一般正態分佈
loc 指明正態分佈的中心
scale 指明正態分佈的變化範圍
np.arange([start, ]stop, [step, ]dtype=None)
從start，到end，每隔step取一個值，放入陣列
step為幾就隔幾個取一個值，預設為1
start和step可以省略

二、numpy整數陣列形式的索引與切片

nd = np.random.randint(0,10,size=(5,6))
nd
array([[1, 2, 1, 9, 4, 0],
       [0, 3, 4, 6, 6, 5],
       [4, 3, 6, 4, 3, 4],
       [7, 9, 6, 5, 9, 9],
       [8, 5, 7, 1, 0, 7]])

順序任意可以正向取也可以反向取可以任意取而且可以重複取

nd[[1,2],1]
array([3, 3])
nd[-1,[0,2,4]]
array([8, 7, 0])
nd[-1,[2,4,0,0,0,0]]
array([7, 0, 8, 8, 8, 8])
nd[[2,4],[1,3]]
array([3, 1])

切片是從外往裡一級一級切

nd[:,0:2]
array([[1, 2],
       [0, 3],
       [4, 3],
       [7, 9],
       [8, 5]])
nd[1:3,1:-1]
array([[3, 4, 6, 6],
       [3, 6, 4, 3]])

三、numpy級聯

np.concatenate((a1, a2, …), axis=0, out=None)
axis引數改變連結的方向, 預設為0，即縱向拼接

nd = np.random.randint(0,10,size=(4,5))  
nd
array([[9, 6, 6, 7, 0],
       [3, 2, 7, 5, 6],
       [1, 8, 5, 9, 9],
       [9, 6, 4, 0, 3]])
np.concatenate((nd,nd),axis=0)  #  或者np.concatenate((nd,nd),axis=-2)
array([[9, 6, 6, 7, 0],
       [3, 2, 7, 5, 6],
       [1, 8, 5, 9, 9],
       [9, 6, 4, 0, 3],
       [9, 6, 6, 7, 0],
       [3, 2, 7, 5, 6],
       [1, 8, 5, 9, 9],
       [9, 6, 4, 0, 3]])
 np.concatenate((nd,nd),axis=1)  # 或者np.concatenate((nd,nd),axis=-1)
 array([[9, 6, 6, 7, 0, 9, 6, 6, 7, 0],
       [3, 2, 7, 5, 6, 3, 2, 7, 5, 6],
       [1, 8, 5, 9, 9, 1, 8, 5, 9, 9],
       [9, 6, 4, 0, 3, 9, 6, 4, 0, 3]])

四、ndarry的聚合操作

只要有ture就返回true
np.any(nd,axis=0)
是否都是True
np.all(nd,axis=0)

np.argwhere()

# 使用argwhere 可以按照值去找 元素的索引 # 使用argwhere 可以按照		      值去找 元素的索引
np.argwhere(nd==9)
# np.argwhere(nd==1)
# np.argwhere(nd>6)
# argwhere本身是用來找 值不是0的元素的索引的
nd
array([[9, 2, 2],
       [7, 7, 0],
       [1, 4, 6]])
nd=9
array([[ True, False, False],
	   [False, False, False],
	   [False, False, False]])

五、廣播機制

對應項相加，不足的部分自動補全

m = np.ones((2, 3))
m
array([[1., 1., 1.],
       [1., 1., 1.]])

a = np.arange(1,4,1) 
a
array([1, 2, 3])

m + a
array([[2., 3., 4.],
       [2., 3., 4.]])

資料分析之numpy常用知識點、難點梳理

一、與random有關的一些函式的區別，首先匯入numpy import numpy as np np.random.randint(low, high=None, size=None, dtype=‘l’) 從low到high的範圍隨機取整數填充多維陣列, size用於

「機器學習」Python資料分析之Numpy進階

請點選此處輸入圖片描述進階廣播法則(rule) 廣播法則能使通用函式有意義地處理不具有相同形狀的輸入。廣播第一法則是，如果所有的輸入陣列維度不都相同，一個“1”將被重複地新增在維度較小的陣列上直至所有的陣列擁有一樣的維度。廣播第二法則確定長度為1的陣列沿著特

「機器學習」Python資料分析之Numpy

請點選此處輸入圖片描述 NumPy的主要物件是同種元素的多維陣列。這是一個所有的元素都是一種型別、通過一個正整數元組索引的元素表格(通常是元素是數字)。在NumPy中維度(dimensions)叫做軸(axes)，軸的個數叫做秩(rank)。例如，在3D空間一個點的座標[1,

資料分析之numpy模組學習

Python模組中的numpy，這是一個處理陣列的強大模組，而該模組也是其他資料分析模組（如pandas和scipy）的核心。接下面將從這5個方面來介紹numpy模組的內容： 1）陣列的建立 2）有關陣列的屬性和函式 3）陣列元素的獲取--普通索引、切片、布林索引和花式索引 4

python資料分析之numpy

（1）在numpy中呼叫numpy.lookfor('keyword')檢視numpy中的所有關鍵字及函式；（2）numpy中的操作物件是array（矩陣），且array中的資料都為相同型別；（3）用numpy.genfromtxt()函式讀.txt檔案；（4）生成矩陣：用numpy.arange

Python資料分析之numpy的使用

在完成了自己的一個小目標後，想繼續往資料探勘和資料分析的方向前進，接下來會陸陸續續的完成學習筆記，方便日後的回顧。在之前的部落格裡有一篇關於numpy的使用：https://blog.csdn.net/totoro1745/article/details/79243465，這裡是進行相關

【Python】資料分析之numpy包

numpy使用示例前言示例程式碼參考資料前言 numpy，全稱numeric python，是一個由多維陣列物件和用於處理陣列的例程集合組成的庫，是python資料分析中最基礎

python資料分析之numpy初始化（一）

以下都用numpy的標準“import numpy as np” 1.numpy是同構資料多維容器，同構即資料型別相同 2.初始化： 2.1np.arange([start,] end [, step

Python資料分析之numpy學習（二）

我們接著《Python資料分析之numpy學習（一）》繼續講解有關numpy方面的知識！統計函式與線性代數運算統計運算中常見的聚合函式有：最小值、最大值、中位數、均值、方差、標準差等。首先來看看陣列元素級別的計算： In [94]: arr11 = 5-np.

用Python做資料分析之Numpy（二）

基礎索引和切片 numpy陣列索引是一個豐富的主題，有時候給你一個數組，可能你只想對其中一部分或者個別元素進行操作，這個時候就該索引出場了。一維陣列十分簡單，表面上與Python list是一樣的。如下： In [60]: arr = np.arange(10) In [61]: ar

資料分析之numpy

轉自：http://blog.csdn.net/xx5595480/article/details/64943459 Python是一門不錯的動態語言，其應用的領域非常廣泛，如web開發、Linux運維、資料探勘、機器學習、爬蟲、推薦系統等。在學完《廖雪峰Pyt

Python資料分析之numpy陣列全解析

1 什麼是numpy numpy是一個在Python中做科學計算的基礎庫，重在數值計算，也是大部分Python科學計算庫的基礎庫，多用於大型、多維資料上執行數值計算。在NumPy 中，最重要的物件是稱為 ndarray 的N維陣列型別，它是描述相同型別的元素集合，numpy所有功能幾乎都以ndarray

利用Python進行資料分析之第七章記錄2 資料規整化:清理、轉換、合併、重塑

索引上的合併 DataFrame中傳入引數left_index=True或者right_index=True（或者兩個都傳入）,表示DataFrame的index（索引）被用作兩個DataFrame連線的連線鍵，如下： dataframe1 = DataFrame({'key':

利用Python進行資料分析之第七章記錄資料規整化:清理、轉換、合併、重塑

合併資料集： pandas物件中的資料可以通過一些內建的方式進行合併： pandas.merge可根據一個或多個鍵將不同DataFrame中的行連線起來。SQL或其它關係型資料庫的使用者對此應該會比較熟悉，因為它實現的就是資料庫的連線操作。 pandas.concat可以沿著一條軸將多個

資料分析之Power Pivot常用函式（持續更新）

RELATED函式 RELATED(ColumnName) RELATED(返回的對應值的列名） →從其他表返回相關值類似於Excel中的Vlookup,Power Query中的合併查詢RELATED 函式要求當前表與包含相關資訊的表之間存在關係,需要指定包含所需資

資料結構與演算法分析之----各種常用排序詳解

package cn.qunye.Sort_排序; import java.util.ArrayList; import java.util.List; /** * 合併排序: * 將待排序元素分成大小大致相同的兩個子集合，分別對兩個子集進行合併排序，最終將排好序的子集合併成所要求的排好序的集合 *

Python資料分析 | (9)NumPy陣列高階操作---變型、重塑、扁平、合併拆分以及重複

本篇部落格所有示例使用Jupyter NoteBook演示。 Python資料分析系列筆記基於:利用Python進行資料分析(第2版) 目錄 1.陣列轉置和軸對換 2.陣列重塑 3.陣列扁平化 4.陣列的合併和拆分 5.元素的重複操作：tile/r

Python資料分析之pandas基本資料結構：Series、DataFrame

1引言本文總結Pandas中兩種常用的資料型別：（1）Series是一種一維的帶標籤陣列物件。（2）DataFrame，二維，Series容器 2 Series陣列 2.1 Series陣列構成 Series陣列物件由兩部分構成：值（value）：一維陣列的各元素值，是一個ndarr

springmvc源碼分析之請求參數、類型轉換、數據綁定

數據 and springmvc 行業 mvc 處理 mapping htm 參數前言通過前面的分析，我們知道了請求過來，怎麽找到相應的handlerMethod。本篇對請求參數的轉換進行講解。概述在進行分析之前，我們回到DispatcherServlet的do

(轉)Python數據分析之numpy學習

.sh dom cno 數據分析開始 mea union nts 統計函數原文：https://www.cnblogs.com/nxld/p/6058572.html Python模塊中的numpy，這是一個處理數組的強大模塊，而該模塊也是其他數據分析模塊（如pand

資料分析之numpy常用知識點、難點梳理

一、與random有關的一些函式的區別，首先匯入numpy

二、numpy整數陣列形式的索引與切片

三、numpy級聯

四、ndarry的聚合操作

五、廣播機制

相關推薦