pandas 獲取不符合條件/不包含某個字串的dataframe

阿新 • • 發佈：2021-07-13

工作中資料的處理中往往會遇到篩選出不符合條件的或者不包含某個字元的dataframe，我們會如何去做呢？

可能你會想到用python寫一個函式，然後用panda的apply函式或者map函式來進行處理，不可否認這是一中方法，但是實際上pandas中已經給我們開發了這樣的函式，那我們為什麼不直接呼叫呢？

首先看一下，怎麼篩選出包含某些字串的資料

#這是使用語法,模糊匹配
df[ df['通訊名稱'].str.contains('聯通|移動|小靈通|電信')]

#這一種方法不是匹配，而是等於後面列表中的值，要注意區別
df[ df['通訊名稱'].isin(['聯通','移動','小靈通',' 
電信'])]

包含的字串比較多時就用’|‘管道符隔開

那取出不包含這些字串的資料怎麼操縱呢，很簡單，就是在前面加上一個~這種波浪符號就可以了

df[~ df['通訊名稱'].str.contains('聯通|移動|小靈通|電信')]

沒錯就是這麼簡單的操作，但是contains也有一個不好的地方，就是如果某一列資料時文字型資料，處理起來就不是那麼完美，因為contains函式類似於模糊查詢，所以會出現錯誤匹配或者超出我們需要的匹配範圍

問題又來了如果我們的條件是多個怎麼辦呢？

我們就需要這樣來做

df[ df['通訊名稱'].str.contains('聯通|移動|小靈通|電信') | df[' 
通訊備註'].str.contains('公告|活動|提示|優惠') ]
# 或者這樣寫
df[df["col1"].str.contains('this|that')==False and df["col2"].str.contains('foo|bar')==True]

當然，到哪裡都離不開的正則表示式在這裡也是可以用的

pattern=r'.*?'
df[df[columns].str.contains(pattern)]

這樣你就可以根據自己的需求快樂的指定匹配原則了。

版權宣告：本文為CSDN博主「Danker01」的原創文章，遵循 CC 4.0 BY-SA 版權協議，轉載請附上原文出處連結及本宣告。
原文連結：https://blog.csdn.net/weixin_42575020/article/details/95344914

pandas 獲取不符合條件/不包含某個字串的dataframe

pandas 獲取不符合條件/不包含某個字串的dataframe

JQuery獲取某個父元素的所有子元素/JQuery獲取某個父元素的符合條件的子元素/JQuery獲取某個父元素的子元素，過濾掉不符合條件的

Java List如何移除不符合條件的資料

輸入三個數字，確認輸入的數字是否符合直角三角形的要求，符合現實該三角形的面積，否則顯示不符合條件

C/C++判斷字串是否包含某個字串

oracle判斷某個字串是否包含某個字串的三種方法

js 判斷字串中是否包含某個字串

MySQL如何判斷欄位是否包含某個字串

Linux shell 判斷變數是否包含某個字串的幾種方法

Linux shell 判斷變數是否包含某個字串的幾種方法

Linux命令中查詢以.log結尾檔案中不包含某個特定字串這行的內容【多測師_王sir】

pandas讀取csv檔案提示不存在的解決方法及原因分析

win10系統升級檢測提示“帳號登陸不符合要求”如何解決

給定一個包含大寫字母和小寫字母的字串，找到通過這些字母構造成的最長的迴文串。在構造過程中，請注意區分大小寫。比如"Aa"不能當做一個迴文字串。注意:假設字串的長度不會超過 1010。

光大銀行手機客戶端登入異常：您的網路環境不符合安全要求

Android10相機能夠到獲取經緯度，但是不能在相機中顯示

【WTM框架】查詢列表顯示正常，但是匯出的時候查詢條件不起作用的問題記錄及解決方法

JavaBean元件＜jsp:forward＞動作＜jsp:param＞動作登入頁面輸入使用者名稱和密碼，然後進入檢查頁面判斷是否符合要求，符合要求跳轉到成功介面，不符合要求返回登入介面，顯示錯誤資訊。

Android 11 中獲取第三方app資訊不可見

pip install 代理問題，網速問題，找不到問題，不滿足條件問題,ssl問題

pandas 獲取不符合條件/不包含某個字串的dataframe

相關推薦