Pandas詳解十之Dropna濾除缺失資料

阿新 • • 發佈：2019-01-23

約定：

import pandas as pd
import numpy as np
from numpy import nan as NaN

濾除缺失資料

pandas的設計目標之一就是使得處理缺失資料的任務更加輕鬆些。pandas使用NaN作為缺失資料的標記。

使用dropna使得濾除缺失資料更加得心應手。

一、處理Series物件

通過dropna()濾除缺失資料：

se1=pd.Series([4,NaN,8,NaN,5])
print(se1)
se1.dropna()

程式碼結果：

0    4.0
1    NaN
2    8.0
3    NaN
4    5.0
dtype: float64

0    4.0
2    8.0
4    5.0
dtype: float64

通過布林序列也能濾除：

se1[se1.notnull()]

程式碼結果：

0    4.0
2    8.0
4    5.0
dtype: float64

二、處理DataFrame物件

處理DataFrame物件比較複雜，因為你可能需要丟棄所有的NaN或部分NaN。

df1=pd.DataFrame([[1,2,3],[NaN,NaN,2],[NaN,NaN,NaN],[8,8,NaN]])
df1

程式碼結果：

0	1	2
0	1.0	2.0	3.0
1	NaN	NaN	2.0
2	NaN	NaN	NaN
3	8.0	8.0	NaN

預設濾除所有包含NaN：

df1.dropna()

程式碼結果：

0	1	2
0	1.0	2.0	3.0

傳入how=’all’濾除全為NaN的行：

df1.dropna(how='all')

程式碼結果：

0	1	2
0	1.0	2.0	3.0
1	NaN	NaN	2.0
3	8.0	8.0	NaN

傳入axis=1濾除列：

df1[3]=NaN
df1

程式碼結果：

0	1	2	3
0	1.0	2.0	3.0	NaN
1	NaN	NaN	2.0	NaN
2	NaN	NaN	NaN	NaN
3	8.0	8.0	NaN	NaN

df1.dropna(axis=1,how="all")

程式碼結果：

0	1	2
0	1.0	2.0	3.0
1	NaN	NaN	2.0
2	NaN	NaN	NaN
3	8.0	8.0	NaN

傳入thresh=n濾除n行：

df1.dropna(thresh=1)

程式碼結果：

0	1	2	3
0	1.0	2.0	3.0	NaN
1	NaN	NaN	2.0	NaN
3	8.0	8.0	NaN	NaN

df1.dropna(thresh=3)

程式碼結果：

0	1	2	3
0	1.0	2.0	3.0	NaN

謝謝大家的瀏覽，
希望我的努力能幫助到您，
共勉！

Pandas詳解十之Dropna濾除缺失資料

約定： import pandas as pd import numpy as np from numpy import nan as NaN 濾除缺失資料 pandas的設計目標之一就是使得處理缺失資料的任務更加輕鬆些。pan

Dropna濾除缺失資料

import pandas as pd import numpy as np from numpy import nan as NaN123濾除缺失資料pandas的設計目標之一就是使得處理缺失資料的任務更加輕鬆些。pandas使用NaN作為缺失資料的標記。使用dropna使得濾除缺失資料更加得心應手。一、處

Pandas詳解十八之DataFrame物件的-Join合併

約定： import pandas as pd 物件的例項方法-Join DataFrame物件有個df.join()方法也能進行pd.merge()的合併，它能更加方便地按照物件df的索引進行合併，且能同時合併多個DataFr

Pandas詳解十四之DataFrame物件的列和索引之間的轉化

約定： import pandas as pd DataFrame物件的列和索引之間的轉化我們常常需要將DataFrame物件中的某列或某幾列作為索引，或者將索引轉化為物件的列。pandas提供了set_index()/res

Pandas詳解十一之Fillna填充缺失資料

約定： import pandas as pd import numpy as np from numpy import nan as NaN 填充缺失資料 fillna()是最主要的處理方式了。 df1=pd.DataFra

OpenLayers官方示例詳解十之導航控制元件（Navigation Controls）

一、示例簡介這個示例展示瞭如何使用地圖定位控制元件（ol/Control/ZoomToExtent）。在這個示例中，下面的導航控制元件將被新增到地圖： ol/control/Zoom（預設新增） o

Pandas詳解七之DatetimeIndex、PeriodIndex和TimedeltaIndex時間序列

約定： import pandas as pd import numpy as np 時間序列上節介紹的Timestamp、Period和Timedelta物件都是單個值，這些值都可以放在索引或資料中。作為索引的時間序列有：DatetimeInd

flask基礎之session原理詳解(十)

前言 flask_session是flask框架實現session功能的一個外掛，用來替代flask自帶的session實現機制，flask預設的session資訊儲存在cookie中，不夠安全和靈活。 flask的session機制 session是用來幹什麼的呢？由於http協議是一個無狀態的協議，

Openlayers官方示例詳解十二之通過XYZ方式載入瓦片地圖

目錄一、示例簡介二、程式碼詳解三、補充一、示例簡介這個示例展示了通過XYZ格式的URL訪問瓦片地圖資料，有關XYZ方式載入瓦片地圖可以參考這篇文章：萬能瓦片載入祕籍。本示例載入的瓦片地圖是Thunderf

OpenLayers官方示例詳解十一之在自定義canvas元素上渲染OpenLayers的幾何圖形（Render geometries to a canvas）

目錄一、示例簡介二、程式碼詳解一、示例簡介這個示例展示瞭如何將OpenLayers的幾何圖形渲染到任意的canvas元素上。二、程式碼詳解 ol.render.toContext()方法能夠將任意ca

OpenLayers官方示例詳解十五之比例尺控制元件（Scale Line）

目錄一、示例簡介二、程式碼詳解一、示例簡介本示例展示瞭如何建立一個比例尺控制元件（ol.control.ScaleLine），同時讓比例尺控制元件的單位根據使用者的選擇而改變。 OpenLaye

OpenLayers官方示例詳解十四之可重用地圖源（Reusable Source）

目錄一、示例簡介二、程式碼詳解一、示例簡介這個示例展示如何更新地圖中的瓦片。可以呼叫source.setUrl()來更新瓦片地圖源的URL，請注意，當更改瓦片地圖源的URL時，在載入完新的瓦片之前，將不會替換現

OpenLayers官方示例詳解十七之偽造線（Synthetic Points）

一、示例簡介本示例展示瞭如何生成10000條呈螺紋式排列的線要素。低比例尺下效果：放大至高比例尺下的效果：二、程式碼詳解： <!DOCTYPE html

OpenLayers官方示例詳解十六之偽造點（Synthetic Points）

目錄一、示例簡介二、程式碼詳解一、示例簡介本示例首先隨機生成20000個點資料，並加入到地圖中，然後實現了將離滑鼠最近的點高亮顯示的功能。二、程式碼詳解 <!DOCTYPE html> <html lang="

Linux學習之ACL權限詳解(十)

nbsp col 開啟 src qq群 image 通過 defaults access Linux系統ACL權限詳解目錄 ACL權限簡介與開啟查看與設定ACL權限最大有效權限與刪除ACL權限默認ACL權限和遞歸ACL權限　　 ACL權限簡介與開啟權

Nginx詳解十八：Nginx深度學習篇之Rewrite規則

src 開發 gin page return reload 技術 code 效果 Rewrite規則可以實現對url的重寫，以及重定向作用場景： 1、URL訪問跳轉，支持開發設計，如頁面跳轉，兼容性支持，展示效果等 2、SEO優化 3、維護：後臺維護、流量轉

Nginx詳解十九：Nginx深度學習篇之進階高級模塊

cat max 地址 index 信息 access gin 切換以及這裏介紹一些最新或者理解起來有一些難度的Nginx模塊一、secure_link_module模塊作用原理：1、制定並允許檢查請求的鏈接的真實性以及保護資源免遭未經授權的訪問2、限制鏈

詳解十大經典資料探勘演算法之——Apriori

本文始發於個人公眾號：**TechFlow**，原創不易，求個關注今天是機器學習專題的第19篇文章，我們來看經典的Apriori演算法。 Apriori演算法號稱是十大資料探勘演算法之一，在大資料時代威風無兩，哪怕是沒有聽說過這個演算法的人，對於那個著名的啤酒與尿布的故事也耳熟能詳。但遺憾的是，隨著

PHP函數篇詳解十進制、二進制、八進制和十六進制轉換函數說明

ima hat base 價值所有十進制 str from 字節一，十進制（decimal system）轉換函數說明 1，十進制轉二進制 decbin() 函數，如下實例 echo decbin(12); //輸出 1100 echo decbin(26); //輸

Spark函數詳解系列之RDD基本轉換

9.png cal shuff reac 數組a water all conn data 摘要： RDD：彈性分布式數據集，是一種特殊集合 ? 支持多種來源 ? 有容錯機制 ? 可以被緩存 ? 支持並行操作，一個RDD代表一個分區裏的數據集 RDD有兩種操作算子： Tra

Pandas詳解十之Dropna濾除缺失資料

濾除缺失資料

一、處理Series物件

二、處理DataFrame物件

相關推薦