pandas DataFrame 交集並集補集

阿新 • • 發佈：2018-10-29

1.0 brief 詳細技術分享 rop utf-8 col pri and

1.場景，對於colums都相同的dataframe做過濾的時候

例如：

df1 = DataFrame([[‘a‘, 10, ‘男‘], 
                 [‘b‘, 11, ‘男‘], 
                 [‘c‘, 11, ‘女‘], 
                 [‘a‘, 10, ‘女‘],
                 [‘c‘, 11, ‘男‘]], 
                columns=[‘name‘, ‘age‘, ‘sex‘])

df2 = DataFrame([[‘a‘, 10, ‘男‘], 
                 [‘b‘, 11, ‘女‘]],
                columns=[‘name‘, ‘age‘, ‘sex‘])

取交集：print(pd.merge(df1,df2,on=[‘name‘, ‘age‘, ‘sex‘]))
取並集：print(pd.merge(df1,df2,on=[‘name‘, ‘age‘, ‘sex‘], how=‘outer‘))
取差集(從df1中過濾df1在df2中存在的行)：

df1 = df1.append(df2)
df1 = df1.append(df2)
df1 = df1.drop_duplicates(subset=[‘name‘, ‘age‘, ‘sex‘],keep=False)
print(df1)

代碼：

# -*- coding:utf-8 -*-
__version__ = ‘1.0.0.0‘
"""
@brief  :   簡介
@details:   詳細信息
@author :   zhphuang
@date   :   2018-10-29
"""

import pandas as pd
from pandas import *

df1 = DataFrame([[‘a‘, 10, ‘男‘],
                 [‘b‘, 11, ‘男‘],
                 [‘c‘, 11, ‘女‘],
                 [‘a‘, 10, ‘女‘],
                 [‘c‘, 11, ‘男‘]],
                columns=[‘name‘, ‘age‘, ‘sex‘])
print("df1:\n%s\n\n" % df1)
df2 = DataFrame([[‘a‘, 10, ‘男‘],
                 [‘b‘, 11, ‘女‘]],
                columns=[‘name‘, ‘age‘, ‘sex‘])
print("df2:\n%s\n\n" % df2)
# 取交集
print("交集:\n%s\n\n" % pd.merge(df1,df2,on=[‘name‘, ‘age‘, ‘sex‘]))

# 取並集
print("並集:\n%s\n\n" % pd.merge(df1,df2,on=[‘name‘, ‘age‘, ‘sex‘], how=‘outer‘))

# 從df1中過濾df1在df2中存在的行，也就是取補集
df1 = df1.append(df2)
df1 = df1.append(df2)
print("補集(從df1中過濾df1在df2中存在的行):\n%s\n\n" % df1.drop_duplicates(subset=[‘name‘, ‘age‘, ‘sex‘],keep=False))

截圖

pandas DataFrame 交集並集補集

1.0 brief 詳細技術分享 rop utf-8 col pri and 1.場景，對於colums都相同的dataframe做過濾的時候例如： df1 = DataFrame([[‘a‘, 10, ‘男‘], [‘b‘, 11,

list集合交集並集補集

前戲：公司有個流程是這樣的，有四條流程，一條流程四個節點。在每個流程第四個節點操作完後，複製當前節點的“疑點”資料至下一流程的節點。本來這是個很簡單的功能，但是當上一條流程的節點資料更改後要同步到下一流程的首節點。原來的做法是刪除下一節點的所以資料，重新插入上一節點的全部

利用linux命令sort和uniq求兩個檔案的交集並集和補集

給定兩個檔案 a.txt 和 b.txt ，每行是一個記錄（假設沒有重複），要求輸出兩集合的交集、並集、差集，輸出的結果只包括唯一項。交集定義為同時出現在兩個檔案中的記錄項，並集定義為出現在任何一個檔案中的記錄項，差集(A-B)定義為出現在A中而且不出現在B中的記錄，對稱

C# 取兩個集合的交集並集差集

兩個 color pre str exce class 並集 blog span 交集：Intersect 並集：Union 差集：Except var A= new List() { 1, 2, 3, 4, 5, 6 }; var B= new List() { 3

03.CSS選擇器-->交集並集選擇器

img ont meta tex es2017 nta color 學習 mage <!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF-8">

Python 求兩個文本文件以行為單位的交集並集差集

cti %s txt readlines nio 兩個 open inter class Python 求兩個文本文件以行為單位的交集並集差集，來代碼： s1 = set(open(‘a.txt‘,‘r‘).readlines()) s2 = set(

Linux shell計算兩個檔案的交集並集和差集

分享一下我老師大神的人工智慧教程！零基礎，通俗易懂！http://blog.csdn.net/jiangjunshow 也歡迎大家轉載本篇文章。分享知識，造福人民，實現我們中華民族偉大復興！

java list 交集並集差集去重複並集

package com; import java.util.ArrayList; import java.util.Iterator; import java.util.List; public class Test { public static void ma

集合去重，取交集並集差值

最好的方式是用set集合做並集，CollectionUtils封裝，union底部用hashmap取值存入hashSet中，去重 // 兩個集合合併成並去重 public void mergeSet(Set a,Set b){ // org.apache.commons.collections.

C++ vector去重交集並集

原文： yongh701 https://blog.csdn.net/yongh701/article/details/51406458 C++雖然對vector封裝了大量的函式，比如判斷元素是否在vector中find、去重的unique，還有在algorithm類中對兩

js求物件陣列的交集/並集/差集/去重

1.求交集　　　　var arr1 = [{name:'name1',id:1},{name:'name2',id:2},{name:'name3',id:3}]; var arr1Id = [1,2,3] var arr2 = [{name:'name1',id

容器的交集並集差集

使用泛型演算法，mark一下 #include <vector> #include <iostream> #include <iterator> #include <algorithm> int main() { std::vector<

遞增有序的順序表表示集合，求解兩個集合的交集並集差集（c語言實現）

#include<stdio.h> #include<stdlib.h> #define max 100 typedef struct { int elem[max]; int length; }List; void UnionLi

1063 Set Similarity （25 分）求集合交集並集比值

題目 Given two sets of integers, the similarity of the sets is defined to be N

求陣列的交集-並集-差集

let a = new Set([1, 2, 3]); let b = new Set([4, 3, 2]); // 並集 let union = new Set([...a, ...b]); //Set(4) {1, 2, 3, 4} // 交集 let in

c++ set 交集並集差集

《Problem A: 求集合的交併補集》 Time Limit: 1 Sec Memory Limit: 4 MB Submit: 973 Solved: 242 [Submit][Status][

python 交集並集例項

q1=[1,2,3] q2=[2,3,4] a = set(q1) b = set(q2) c = a ^ b d = a & b # 交集 e = a | b # 並集 print(c) pr

採用java8 lambda表示式實現 java list 交集並集差集去重複並集

採用java8 lambda表示式實現java list 交集/並集/差集/去重並集一般的javaList 交、並集採用簡單的 removeAll retainAll 等操作，不過這也破壞了原始的javaList物件，採用java8 lambda表示式流操

利用集合的交集並集等圖示展現Mysql的多表的查詢結果

Mysql 多表查詢詳解一.前言二.示例三.注意事項一.前言上篇講到Mysql中關鍵字執行的順序，只涉及了一張表；實際應用大部分情況下，查詢語句都會涉及到多張表格 : 1.1 多表連線有哪些分類? 1.2 針對這些分類有哪些連線方法? 1.3

java 兩個list 交集並集差集去重複並集

List<String> list1 =new ArrayList<String>();list1.add("A");list1.add("B);List<String&

pandas DataFrame 交集並集補集

相關推薦