Python--unique()與nunique()函式

阿新 • • 發佈：2021-06-24

1 unique()

統計list中的不同值時，返回的是array.它有三個引數，可分別統計不同的量，返回的都是array.

當list中的元素也是list時，儘量不要用這種方法.

import numpy as np
a = [1,5,4,2,3,3,5]
# 返回一個array
print(np.unique(a))
# [1 2 3 4 5]

# 返回該元素在list中第一次出現的索引
print(np.unique(a,return_index=True))
# (array([1, 2, 3, 4, 5]), array([0, 3, 4, 2, 1]))

# 返回原list中每個元素在新的list中對應的索引
print(np.unique(a,return_inverse=True))
# (array([1, 2, 3, 4, 5]), array([0, 4, 3, 1, 2, 2, 4]))

# 返回該元素在list中出現的次數
print(np.unique(a,return_counts=True))
# (array([1, 2, 3, 4, 5]), array([1, 1, 2, 1, 2]))

# 當加引數時，unique()返回的是一個tuple,這裡利用了tuple的性質，即有多少個元素即可賦值給對應的多少個變數
p,q,m,n = np.unique(a,return_index=True,return_inverse=True,return_counts=True)
print(p,q,m,n)
# [1 2 3 4 5] [0 3 4 2 1] [0 4 3 1 2 2 4] [1 1 2 1 2]

# 注意當list中的元素不是數字而是list的時候,輸出的資料型別與list中元素的長度有關
# 利用這種方法對list中元素去重或求裡面元素的個數都不是好方法，很容易出錯

統計series中的不同值時，返回的是array，它沒有其它引數

import pandas as pd
se = pd.Series([1,3,4,5,2,2,3])
print(se.unique())
# [1 3 4 5 2]

2.nunique()

可直接統計dataframe中每列的不同值的個數,也可用於series,但不能用於list.返回的是不同值的個數.

df=pd.DataFrame({'A':[0,1,1],'B':[0,5,6]})
print(df)
print(df.nunique())
#    A  B
# 0  0  0
# 1  1  5
# 2  1  6
# A    2
# B    3
# dtype: int64

也可與groupby結合使用,統計每個塊的不同值的個數.

all_user_repay = all_user_repay.groupby(['user_id'])['listing_id'].agg(['nunique']).reset_index()
#    user_id  nunique
# 0       40        1
# 1       56        1
# 2       98        1
# 3      103        1
# 4      122        1

Python--unique()與nunique()函式

1 unique() 統計list中的不同值時，返回的是array.它有三個引數，可分別統計不同的量，返回的都是array.

Python range與enumerate函式區別解析

在迭代中enumerate比range更能靈活，一般情況下儘量用erumerate，下面舉例說明：

Python eval 與 exec 函式區別 - Python零基礎入門教程

目錄一.Python eval 與 exec 函式的區別二.價值 10 個億的智慧機器人核心程式碼三.猜你喜歡

Python eval 與 exec 函式的區別 - Python零基礎入門教程

目錄一.Python eval 與 exec 函式的區別二.價值 10 個億的智慧機器人核心程式碼三.猜你喜歡

一篇文章掌握Python生成器與匿名函式，多執行緒與多程序

測試奇譚，BUG不見。講解之前，我先說說我的教程和網上其他教程的區別： 1 我分享的是我在工作中高頻使用的場景，是精華內容；

Python的物件傳遞與Copy函式使用詳解

1、物件引用的傳值或者傳引用 Python中的物件賦值實際上是簡單的物件引用。也就是說，當你建立一個物件，然後把它賦值給另一個變數的時候，Python並沒有拷貝這個物件，而是拷貝了這個物件的引用。這種方式相當於值傳

Python巢狀函式，作用域與偏函式用法例項分析

本文例項講述了Python巢狀函式，作用域與偏函式用法。分享給大家供大家參考，具體如下：

python常見字串處理函式與用法彙總

本文例項講述了python常見字串處理函式與用法。分享給大家供大家參考，具體如下：

python中enumerate() 與zip()函式的使用比較例項分析

本文例項講述了python中enumerate() 與zip()函式的使用比較。分享給大家供大家參考，具體如下：

深入淺析Python 函式註解與匿名函式

函式註解與匿名函式關於函式引數的定義，呼叫以及函式引數的內容，在下面的文章中已經做了初步的介紹，有需要的可以訪問進行了解:

python+opencv邊緣提取與各函式引數解析

前情提要：作為剛入門機器視覺的小夥伴，第一節課學到機器視覺語法時覺得很難理解，

Python自定義聚合函式merge與transform區別詳解

1.自定義聚合函式，結合agg使用 2. 同時使用多個聚合函式 3. 指定某一列使用某些聚合函式

三小時快速入門Python第四篇--函式與物件

函式與物件 1、函式 1 # 使用 \"def\" 來建立一個新的函式 2 def add(x, y): 3print (\"x is {0} and y is {1}\".format(x, y))

Python學習筆記(2)——函式與面向物件程式設計

目錄函式引數形參形參：函式完成其工作所需要的一項資訊實參返回值可變引數模組與函式匯入指定別名函式編寫規範面向物件類屬性與方法繼承模組與類python標準庫類程式設計規範

詳解python中的lambda與sorted函式

lambda表示式 python中形如： lambda parameters: expression 稱為lambda表示式，用於建立匿名函式，該表示式會產生一個函式物件。

python入門教程07-04 （python語法入門之函式物件與閉包）

技術標籤：python人工智慧mysql大資料很多人對於python的函式概念都是很懵的狀態，但是在python中有函式閉包的概念是我們必須所瞭解的，那麼這個概念是什麼意思呢？下面我們來一探究竟。

【人生苦短，我學 Python】基礎篇——函式與模組（Day13）

技術標籤：python程式語言函式模組寫在前面：大家好！我是【AI 菌】，一枚愛彈吉他的程式設計師。我熱愛AI、熱愛分享、熱愛開源！這部落格是我對學習的一點總結與記錄。如果您也對深度學習、機器視覺、演算法

python中的靜態函式與類函式區別與聯絡

靜態方法和類方法在python2.2中被引用，經典類和新式類都可以使用。同時，一對內建函式：staticmethod和classmethod被引入，用來轉化類中某一方法為這兩種方法之一。

python公共方法與公共函式

1、公共方法 + 加法運算適用於所有的基礎資料型別（int float bool）加法運算所有兩側要是同種資料型別

爬蟲與Python：（二）Python基礎篇——12.函式

函式是組織好的、可以重複使用的、用來實現單一或相關功能的程式碼段。函式能提高應用的模組性和程式碼的重複利用率。Python提供了許多內建函式。如print()，但也可以自己建立函式，這被稱為使用者自定義函式。