pandas中concatenate和combine_first的用法

阿新 • • 發佈：2018-11-10

concatenate主要作用是拼接series和dataframe的資料。
combine_first可以做來填充資料。

import numpy as np
import pandas as pd
from pandas import Series, DataFrame

# 設定一個隨機種子，方便除錯
np.random.seed(666)

# Series
arr1 = np.arange(9).reshape(3, 3)
arr2 = np.arange(9).reshape(3, 3)

# numpy的 concatenate 用法
print(np.concatenate( 
[arr1, arr2]))
'''
[[0 1 2]
 [3 4 5]
 [6 7 8]
 [0 1 2]
 [3 4 5]
 [6 7 8]]
'''

print(np.concatenate([arr1, arr2], axis=1))
'''
[[0 1 2 0 1 2]
 [3 4 5 3 4 5]
 [6 7 8 6 7 8]]
'''


s1 = Series([1, 2, 3], index=['A', 'B', 'C'])
s2 = Series([4, 5], index=['E', 'F'])
# 可以看出和numpy的效果一樣
print(pd.concat([s1, s2] 
))
'''
A    1
B    2
C    3
E    4
F    5
dtype: int64
'''
# 用法和 np 一樣 axis = 1, 等於增加了一列
print(pd.concat([s1, s2], axis=1))
# 但是，返回的是一個 <class 'pandas.core.frame.DataFrame'>
print(type(pd.concat([s1, s2], axis=1)))
'''
     0    1
A  1.0  NaN
B  2.0  NaN
C  3.0  NaN
E  NaN  4.0
F  NaN  5.0
'''


df1 = 
 DataFrame(np.random.randn(4, 3), columns=['X', 'Y', 'Z'])
print(df1)
'''
          X         Y         Z
0  0.824188  0.479966  1.173468
1  0.909048 -0.571721 -0.109497
2  0.019028 -0.943761  0.640573
3 -0.786443  0.608870 -0.931012
'''

df2 = DataFrame(np.random.randn(3, 3), columns=['X', 'Y', 'A'])
print(df2)
'''
          X         Y         A
0  0.978222 -0.736918 -0.298733
1 -0.460587 -1.088793 -0.575771
2 -1.682901  0.229185 -1.756625
'''

print(pd.concat([df1, df2]))
'''
          A         X         Y         Z
0       NaN  0.824188  0.479966  1.173468
1       NaN  0.909048 -0.571721 -0.109497
2       NaN  0.019028 -0.943761  0.640573
3       NaN -0.786443  0.608870 -0.931012
0 -0.298733  0.978222 -0.736918       NaN
1 -0.575771 -0.460587 -1.088793       NaN
2 -1.756625 -1.682901  0.229185       NaN
'''

# combine

s1 = Series([2, np.nan, 4, np.nan], index=['A', 'B', 'C', 'D'])
s2 = Series([1, 2, 3, 4], index=['A', 'B', 'C', 'D'])

# 用 s2 中的數值來填充 s1
print(s1.combine_first(s2))

'''
A    2.0
B    2.0
C    4.0
D    4.0
dtype: float64
'''

df1 = DataFrame({
    'X':[1, np.nan, 3, np.nan],
    'Y':[5, np.nan, 7, np.nan],
    'Z':[9, np.nan, 11, np.nan]
})

df2 = DataFrame({
    'Z':[np.nan, 10, np.nan, 12],
    'A':[1, 2, 3, 4]
})

# 功能同樣是填充
print(df1.combine_first(df2))
'''
     A    X    Y     Z
0  1.0  1.0  5.0   9.0
1  2.0  NaN  NaN  10.0
2  3.0  3.0  7.0  11.0
3  4.0  NaN  NaN  12.0
'''

pandas中concatenate和combine_first的用法

concatenate主要作用是拼接series和dataframe的資料。 combine_first可以做來填充資料。 import numpy as np import pandas as pd from pandas import Series, DataFrame # 設

odoo系統中name_search和name_get用法

打印 per sequence not 添加 product xpath ret 領料單自動帶出工序和工序序號,兩個條件都能搜索,並且兩個都帶出來顯示在前端: # 輸入工序序號會自動帶出工序名// def name_search(self, cr,user,name=

SQLServer中exists和except用法

sqlserver sql 一、exists1.1 說明EXISTS(包括 NOT EXISTS)子句的返回值是一個BOOL值。EXISTS內部有一個子查詢語句(SELECT ... FROM...)，我將其稱為EXIST的內查詢語句。其內查詢語句返回一個結果集。EXISTS子句根據其內查詢語句的結果

JAVA中this和super用法

出現子句 package code rgs lean 眼睛都是 java對象　　參考網上資料和自行理解總結java中this和super中各自用法及其差異　　<一>. this的用法　　構造方法是創建java對象的重要途徑,通過new關鍵字調用構造器

pandas中Series()和DataFrame()的區別與聯絡

區別： series，只是一個一維資料結構，它由index和value組成。 dataframe，是一個二維結構，除了擁有index和value之外，還擁有column。聯絡： dataframe由多個series組成，無論是行還是列，單獨拆分出來都是一個series。程式碼演示：

pandas中apply()方法的用法

apply有點像map的用法，可以傳入一個函式。 import numpy as np import pandas as pd from pandas import Series, DataFrame df = pd.read_csv('apply_demo.csv').head(

pandas中Series和Dataframe的排序操作

對pandas中的Series和Dataframe進行排序，主要使用sort_values()和sort_index()。 DataFrame.sort_values(by, axis=0, ascending=True, inplace=False, kind=‘quicksort’,

Matlab中Max和find用法（摘要筆記）

find：找到非零元素的索引和值語法： 1. ind = find(X) 2. ind = find(X, k) 3. ind = find(X, k, 'first') 4. &nb

oracle中add_months和trunc用法

oracle中add_months和trunc用法 2012-06-13 13:45 646人閱讀評論(0) 收藏舉報 oracle date sql 工作

SpringMVC中@Controller和@RequestMapping用法

fff set blank content block 方法封裝 keyword 屬性一、簡介在SpringMVC 中，控制器Controller 負責處理由DispatcherServlet 分發的請求，它把用戶請求的數據經過業務處理層處理之後封裝

javascript中import和export用法總結.md

import import 和 require 的區別 import 和js的發展歷史息息相關，歷史上 js沒有模組(module)體系，無法將一個大程式拆分成互相依賴的小檔案，再用簡單的方法拼裝起來。這對開發大型工程非常不方便。在 ES6 之前，社群制定了一些

SpringMVC中@Controller和@RequestMapping用法和其他常用註解

一、簡介在SpringMVC 中，控制器Controller 負責處理由DispatcherServlet 分發的請求，它把使用者請求的資料經過業務處理層處理之後封裝成一個Model ，然後再把該Model 返回給對應的View 進行展示。在Spring

pandas中pd.groupby()的用法

在pandas中的groupby和在sql語句中的groupby有異曲同工之妙，不過也難怪，畢竟關係資料庫中的存放資料的結構也是一張大表罷了，與dataframe的形式相似。 import numpy as np import pandas as pd from pandas imp

pandas中apply和transform方法的效能比較

1. apply與transform 首先講一下apply() 與transform()的相同點與不同點相同點：都能針對dataframe完成特徵的計算，並且常常與groupby()方法一起使用。不同點： apply()裡面可以跟自定義的函式，包括簡單的求和函式以及複雜的特徵間的差值函式等（注：appl

Pandas的set_index和reset_index用法

set_index(): 函式原型：DataFrame.set_index(keys, drop=True, append=False, inplace=False, verify_integrity=False) 引數解釋： keys：列標籤或列標籤/陣列列表，需要

SQL中IN和EXISTS用法的區別

結論 1. in()適合B表比A表資料小的情況 2. exists()適合B表比A表資料大的情況當A表資料與B表資料一樣大時,in與exists效率差不多,可任選一個使用. select * from A where id in(select id fro

Angular2中Input和Output用法及示例

對於angular2中的Input和Output可以和angularjs中指令作類比。Input相當於指令的值繫結，無論是單向的(@)還是雙向的(=)。都是將父作用域的值“輸入”到子作用域中，然後子作用域進行相關處理。Output相當於指令的方法繫結，子作用域觸發事件

@OneToMany，@ManyToOne 中 @mappedby 和@joincolumn 用法和解釋

/** * 建立了一個實體類。 * * 如何持久化呢？ * * 1、使用@Entity進行實體類的持久化操作，當JPA檢測到我們的實體類當中有 * * @Entity 註解的時候，會在資料庫中生成對應的表結構資訊。 * * * 如何指定主鍵以及主鍵的生成策略？ *

TwinCAT3中TON和R_TRIG用法體會

程式碼在文後使用兩個定時器實現自動交替定時。TRIGGER_ORIGEN為強制輸入，後面自動迴圈交替定時。總結： 1.TON用法例項：TON(IN:= , PT:= , Q=> , ET=> ); IN：上升沿開始計時，要保持高，直到Q輸出，Q未輸

Html A標籤中 href 和 onclick用法、區別、優先級別

http://gocom.primeton.com/blog21307_27051.htm 我以前在寫<A>的href和onclick一直很隨意，後來出過幾次問題，以後才開始重視這個問題：首先摘錄一篇文件：在Javascript中void是一個操

pandas中concatenate和combine_first的用法

相關推薦