1. 程式人生 > 實用技巧 >pandas.DataFrame刪除/選取含有特定數值的行或列

pandas.DataFrame刪除/選取含有特定數值的行或列

1.刪除/選取某列含有特殊數值的行

import pandas as pd
import numpy as np
 
a=np.array([[1,2,3],[4,5,6],[7,8,9]])
df1=pd.DataFrame(a,index=['row0','row1','row2'],columns=list('ABC'))
print(df1)
df2=df1.copy()
 
#刪除/選取某列含有特定數值的行
#df1=df1[df1['A'].isin([1])]
#df1[df1['A'].isin([1])]  選取df1中A列包含數字1的行
 
df1=df1[~df1['A'].isin([1])]
#通過~取反,選取不包含數字1的行 print(df1)

執行結果 :

2.刪除/選取某行含有特殊數值的列

#刪除/選取某行含有特定數值的列
cols=[x for i,x in enumerate(df2.columns) if df2.iat[0,i]==3]
#利用enumerate對row0進行遍歷,將含有數字3的列放入cols中
print(cols)
 
#df2=df2[cols]   選取含有特定數值的列
df2=df2.drop(cols,axis=1) #利用drop方法將含有特定數值的列刪除
print(df2)

執行結果 :

3.刪除含有空值的行或列

實現思路:利用

pandas.DateFrame.fillna對空值賦予特定值,再利用上文介紹的方法找到這些含有特定值的行或列去除即可。

import pandas as pd
import numpy as np
 
df1 = pd.DataFrame(
    [
        [np.nan, 2, np.nan, 0],
        [3, 4, np.nan, 1],
        [np.nan, np.nan, np.nan, 5],
        [np.nan, 3, np.nan, 4]
    ],columns=list('ABCD'))
print(df1)
df2=df1.copy()
 
df1[
'A']=df1['A'].fillna('null') #將df中A列所有空值賦值為'null' print(df1) df1=df1[~df1['A'].isin(['null'])] print(df1) #刪除某行空值所在列 df2[0:1]=df2[0:1].fillna('null') print(df2) cols=[x for i,x in enumerate(df2.columns) if df2.iat[0,i]=='null'] print(cols) df2=df2.drop(cols,axis=1) print(df2)

執行結果 :