機器學習之numpy庫中常用的函數介紹（一）

阿新 • • 發佈：2017-10-01

做的 string idt 維度數據 round float 數值 array

1. mat()

mat()與array的區別：

mat是矩陣，數據必須是2維的，是array的子集，包含array的所有特性，所做的運算都是針對矩陣來進行的。

array是數組，數據可以是多維的，所做的運算都是針對數組來進行的

（1）數據能表示的維度不同，array數據可以是多維的，mat的數據必須是2維的。

array能表示超過2維的數據，而mat不能：

技術分享

對於2維的數據，array和mat的表示形式完全一樣(但運算不一樣)：

技術分享

（2）把array轉換為mat

技術分享

（3） matrix 和 array 都可以通過objects後面加.T 得到其轉置。但是matrix objects 還可以在後面加 .H 得到共軛矩陣, 加 .I 得到逆矩陣。

技術分享

（4） array遵從逐個元素的運算，array的類型的a和b的a*b的運算，相當與MATLAB中的a.*b的運算。

數組a，b的點乘乘法運算a*b (逐個元素的運算)：

技術分享

數組a，b的矩陣乘法運算：

技術分享

相當於矩陣A,B的矩陣乘法運算：

技術分享

（5） **運算不一樣

對於array a，a**2運算相當於對於a的元素逐個求平方：

技術分享

對於mat a，a**2運算相當於矩陣相乘a*a:

技術分享

2. list和array的區別

（1） list是python的內置數據類型，list中的數據類型不必相同，主要用來作索性，可以通過索引查找數值，但不能對整個列表進行數值運算

技術分享

但是可以進行+運算，表示的是兩個列表的拼接：
技術分享

（2） array的中的類型必須全部相同（同屬於int,float,duoble）才能進行數組間的運算，否則也只能作索引：

技術分享

3. shape() 讀取矩陣的各個維度的長度

（1）shape() 返回的是各個維度的長度的列表：

技術分享

（2）shape[n ]表示獲取第n個維度的長度

技術分享

4. random.uniform()方法

uniform(x,y): 隨機產生一個在[x, y]範圍內的實數，返回一個浮點數。

技術分享

5. mean()方法

mean()方法為求平均值的方法：

mean(a, axis=None, dtype=None, out=None, skipna=False, keepdims=False)

a: 輸入的數組，array類型

axis： None：計算數組中的所有值的平均值

=0：以列為單位計算數組中每一列的所有值的平均值；

=1：以行為單位計算數組中每一行的所有值的平均值

dtype: 為指定數組中的元素的類型，默認為float64

out: 如果提供，則為計算的輸出結果保存的數組，大小要和輸出結果的數組大小相同

skipna: 如果設置為true，則計算時跳過為NA的值

keepdims: 如果設置為true，輸出結果將保持為1的維度，即計算結果放在一個數組內

技術分享

6. tile() 方法

tile英文單詞意思：拼貼。tile(A, n)功能：將數組A重復n次，構成一個新的數組。

A的類型：array, list, tuple, dict, matrix，int, string, float，bool

n的類型: tuple，list, dict, array, int,bool，不可以是float, string, matrix

（1）當n為一個整數時

技術分享

（2）當n為list，tuple

技術分享

（3）當A的維度 < n的長度時

tile(A, n)將A中的所有元素作為單元，按n變成一個新的數組，以上為例子。

（4）當A的維度 > n的長度時

n的長度不足為A的維度，即在n的前面加上(A的維度-n的長度)，變成與A的維度相同的長度，再進行重復：

技術分享

以上的a的維度為2，n的長度為1，n自動補充為[2-1, 3] =[1, 3], 與以下等效：

技術分享

7. argsort()方法

argsort(a)：對數組或元組a進行升序排序，返回的是升序之後的各個元素在原來a未升序之前的下標，即返回升序之後對應的下標數組。

技術分享

降序排序：

（1）獲取升序排列之後的最後一個下標

技術分享

（2）或者使用argsort(-a)進行降序排列,其中a只能是含相同數據類型的數組，不能是列表

技術分享

8. transpose( )方法

裝置，可以裝置任何類型mat，list，array，當類=類型為mat的時候，等同於A.T

技術分享

9. sum

sum(a, axis=None, dtype=None, out=None, skipna=False, keepdims=False)

a: 輸入的數組，array類型

axis： None：計算數組中的所有值的和

=0：以列為單位計算數組中每一列的所有值的和；

=1：以行為單位計算數組中每一行的所有值的和

dtype: 為指定數組中的元素的類型，默認為float64

out: 如果提供，則為計算的輸出結果保存的數組，大小要和輸出結果的數組大小相同

skipna: 如果設置為true，則計算時跳過為NA的值

keepdims: 如果設置為true，輸出結果將保持為1的維度，即計算結果放在一個數組內

技術分享

10. get()方法

dict.get(key, default=None) key -- 字典中要查找的鍵。default -- 如果指定鍵的值不存在時，返回該默認值。

技術分享

11. operator.itemgetter ()

operator.itemgetter(n)定義了一個用來獲取對象第n個域數據的函數。

技術分享

12. iteritems()

返回字典的一個叠代器。返回一個可以調用的對象(可以從操作對象中提取item）

技術分享

13. sorted() 方法

對list或者iterable進行排列

sorted(iterable, cmp, key, reverse)

iterable指定要排序的list或者iterable，

cmp為函數，指定排序時進行比較的函數，可以指定一個函數或者lambda函數，

key為函數，指定取待排序元素的哪一個域進行排序，

reverse默認為false（升序排列），定義為True時將按降序排列。

技術分享

與sort區別的是，sort會改變原來對象的順序：

ndarray.sort(axis=-1, kind=‘quicksort‘, order=None)

axis：排序的維度，0表示按行，1表示按列

kind：排序的算法，提供了快排、混排、堆排：’quicksort’, ‘mergesort’, ‘heapsort’

order：排列的順序

技術分享

機器學習之numpy庫中常用的函數介紹（一）

做的 string idt 維度數據 round float 數值 array 1. mat() mat()與array的區別： mat是矩陣，數據必須是2維的，是array的子集，包含array的所有特性，所做的運算都是針對矩陣來進行的。 array是數組，數據可以是多

spark 常用函數介紹（python）

put ons value result 組成 hat 是把 mbo flat 原文引自：https://www.cnblogs.com/yxpblog/p/5269314.html 在開始之前，我先介紹一下，RDD是什麽？ RDD是Spark中的抽象數據結構類

Pyhton函數篇（一）之函數中的形參與實參

依然 tell 多個存在默認 urn 字符串 div 地址 1：什麽是函數　　函數其實就是帶名字的代碼塊，用於完成一些具體的工作。如果我們在寫一段程序的時候，需要多次用到同樣的一個功能，如果每次都要重復寫相同的代碼，不僅會增加我們的代碼量，更會讓我們寫出的代碼讓別人看

Kotlin之let,apply,with,run函數區別（轉）

boolean () log 純粹 detail str2 let pre 並不是轉自：https://blog.csdn.net/guijiaoba/article/details/54615036 Kotlin之let,apply,with,run函數區別重新整理

linux學習之多高並發服務器篇（一）

多線程同步 https 進程調度 creat server side lis logs 高並發服務器高並發服務器並發服務器開發 1.多進程並發服務器　　使用多進程並發服務器時要考慮以下幾點：父最大文件描述個數(父進程中需要close關閉accept返回的新文件

整合學習之boosting，Adaboost、GBDT 和 xgboost（一）

在前面的部落格（https://blog.csdn.net/qq_16608563/article/details/82878127）介紹了整合學習的bagging方法及其代表性的隨機森林。此次接著介紹整合學習的另一個方法boosting以及boosting系列的一些演算法，具體包括 Ad

c#窗體學習——常用控制元件介紹（一）

偷懶，轉自若雲流風，原文：https://blog.csdn.net/ruoyunliufeng/article/details/72874691 一．常用控制元件 Lable標籤→僅顯示文字； TextBox文字控制元件→文字框； Button按鈕控制元件

HTML中常用的部分標籤（一）

【常見的塊級標籤】標題標籤<h1></h1>...<h6></h6> 水平線<hr/> 段落<p></p> 換行<br/> 引用<blockquote</b

用unity shaderlab 實現「影之詩」中的閃卡特效（一）

引言大家好我是9級鐵甲蛹，我從今天開始寫部落格了。雖然之前總想過要寫寫技術部落格，但是覺得自己之前的學習經驗對大家可能沒什麼幫助，而且網上許多資料非常詳細。現在決定寫一來是因為最近做了些有意思的東西，恰巧網上沒什麼具體的內容。二來是因為假期到了沒之前那麼忙，

深度學習之卷積神經網路原理詳解（一）

初探CNN卷積神經網路 1、概述典型的深度學習模型就是很深層的神經網路，包含多個隱含層，多隱層的神經網路很難直接使用BP演算法進行直接訓練，因為反向傳播誤差時往往會發散，很難收斂 CNN節省訓練開銷的方式是權共享weight sharing，讓一組神經元

機器學習資料與攻略超強整理吐血推薦（一）

2016年3月，谷歌的AlphaGo對弈世界頂級圍棋棋手韓國人李世石。最終，AlphaGo以五局四勝的戰績擊敗李世石，一時風光無限，同時也在網路上極大的激起了小夥伴們對人工智慧（AI）的興趣。歲末年初，

python的random模塊函數分析（一）

分析之前 pri orm cnblogs 進行 ron sample 函數封裝 random是python產生偽隨機數的模塊，隨機種子默認為系統時鐘。下面分析模塊中的方法： 1.random.randint(start,stop): 這是一個產生整數隨機數的函數，參數st

js函數知識點（一）

scrip article 函數返回值解決方案 net 匿名 res 定義一、函數聲明的方式 function 函數名(參數列表){ 函數體; return 返回值} 問題：會被聲明提前給出以下解決方案： var函數名=function (參數列表){ 函數體;

pandas 常用清洗數據（一）

core pandas mean type book date axis csv strip 數據源獲取： https://www.kaggle.com/datasets 1、 Look at the some basic stats for the ‘imdb_sc

常用記憶體資料庫介紹（一）

分享一下我老師大神的人工智慧教程！零基礎，通俗易懂！http://blog.csdn.net/jiangjunshow 也歡迎大家轉載本篇文章。分享知識，造福人民，實現我們中華民族偉大復興！

Python影象處理庫PIL的Image模組介紹（一）

Image模組是PIL中最重要的模組，它有一個類叫做image，與模組名稱相同。Image類有很多函式、方法及屬性，接下來將依次對image類的屬性、函式和方法進行介紹。 1、 Format 定

Python大數據與機器學習之NumPy初體驗

clas 自己入門 left ray spark AC DC 精通本文是Python大數據與機器學習系列文章中的第6篇，將介紹學習Python大數據與機器學習所必須的NumPy庫。通過本文系列文章您將能夠學到的知識如下：應用Python進行大數據與機器學習

機器學習之特征工程-常用算法及實現

機器學習特征工程 AI ML Feature Engineering 機器學習之特征工程-常用算法及實現

機器學習之numpy和matplotlib學習（十五）

今天來學習矩陣的建立和一些基本運算 #!/usr/bin/env python # -*- coding: utf-8 -*- # @Author : SundayCoder-俊勇 # @File : numpy7.py import numpy as np # numpy基

機器學習之numpy和matplotlib學習（十四）

今天繼續來講numpy中的一些基本函式使用。 #!/usr/bin/env python # -*- coding: utf-8 -*- # @Author : SundayCoder-俊勇 # @File : numpy6.py import numpy as np # n

機器學習之numpy庫中常用的函數介紹（一）

相關推薦