1. 程式人生 > 程式設計 >Python DataFrame使用drop_duplicates()函式去重(保留重複值,取重複值)

Python DataFrame使用drop_duplicates()函式去重(保留重複值,取重複值)

摘要

在進行資料分析時,我們經常需要對DataFrame去重,但有時候也會需要只保留重複值。
這裡就簡單的介紹一下對於DataFrame去重和取重複值的操作。

建立DataFrame

這裡首先建立一個包含一行重複值的DataFrame。

Python DataFrame使用drop_duplicates()函式去重(保留重複值,取重複值)

2.DataFrame去重,可以選擇是否保留重複值,預設是保留重複值,想要不保留重複值的話直接設定引數keep為False即可。

Python DataFrame使用drop_duplicates()函式去重(保留重複值,取重複值)

3.取DataFrame重複值。大多時候我們都是需要將資料去重,但是有時候很我們也需要取重複資料,這個時候我們就可以根據剛剛上面我們得到的兩個DataFrame來concat到一起之後去重不保留重複值就可以。這樣就把重複值取出來了。

Python DataFrame使用drop_duplicates()函式去重(保留重複值,取重複值)

###############################
分割線:補充
###############################

4.DataFrame根據某列去重

Python DataFrame使用drop_duplicates()函式去重(保留重複值,取重複值)

5.DataFrame根據某幾列去重

Python DataFrame使用drop_duplicates()函式去重(保留重複值,取重複值)

到此這篇關於Python DataFrame使用drop_duplicates()函式去重(保留重複值,取重複值)的文章就介紹到這了,更多相關DataFrame使用drop_duplicates去重內容請搜尋我們以前的文章或繼續瀏覽下面的相關文章希望大家以後多多支援我們!