1. 程式人生 > >dataframe的merge操作

dataframe的merge操作

merge操作的原則

dataframe的merge是按照兩個dataframe共有的column進行連線,兩個dataframe必須具有同名的column。
這裡寫圖片描述

如果兩個dataframe的column都不相同,則會在merge的時候報錯:
這裡寫圖片描述

而當兩個dataframe具有相同的column時,若兩個column中沒有相同的value,則會merge一個空的dataframe:
這裡寫圖片描述

merge的其他引數

one

one引數可以指定merge的列名:
這裡寫圖片描述

例如這裡就指定了merge的列名為key。

如果指定了一個私有的column則會報錯:
這裡寫圖片描述

how

how引數用於指定merge時的操作。
這裡寫圖片描述

例如這裡指定how=left,就是讓df1保留所有的行列資料,df2根據df1的行列進行補全。同理,right也可以指定。

how還可以指定為outer:
這裡寫圖片描述

outer就是how指定為left和right的結果的集合