python 資料表格的合併和重塑--pd.concat

阿新 • • 發佈：2018-11-15

在進行資料的處理時，經常會進行表格的合併和重塑，pandas中有幾種實用的方法，在此介紹一種pd.concat

1 concat

concat函式是在pandas底下的方法，可以將資料根據不同的軸作簡單的融合

pd.concat(objs, axis=0, join='outer', join_axes=None, ignore_index=False,
       keys=None, levels=None, names=None, verify_integrity=False)

引數說明
objs: series，dataframe或者是panel構成的序列lsit
axis：需要合併連結的軸，0是行，1是列
join：連線的方式 inner，或者outer

其他一些引數不常用，用的時候再補上說明。

1.1 相同欄位的表首尾相接

這裡寫圖片描述

# 現將表構成list，然後在作為concat的輸入
In [4]: frames = [df1, df2, df3]

In [5]: result = pd.concat(frames)

要在相接的時候在加上一個層次的key來識別資料來源自於哪張表，可以增加key引數

In [6]: result = pd.concat(frames, keys=['x', 'y', 'z'])

效果如下

這裡寫圖片描述

1.2 橫向表拼接（行對齊）

1.2.1 axis

當axis = 1的時候，concat就是行對齊，然後將不同列名稱的兩張表合併

In [9]: result = pd.concat([df1, df4], axis=1)

這裡寫圖片描述

1.2.2 join

加上join引數的屬性，如果為’inner’得到的是兩表的交集，如果是outer，得到的是兩表的並集。

In [10]: result = pd.concat([df1, df4], axis=1, join='inner')

這裡寫圖片描述

1.2.3 join_axes

如果有join_axes的引數傳入，可以指定根據那個軸來對齊資料
例如根據df1表對齊資料，就會保留指定的df1表的軸，然後將df4的表與之拼接

In [11]: result 
 = pd.concat([df1, df4], axis=1, join_axes=[df1.index])

這裡寫圖片描述

1.3 append

append是series和dataframe的方法，使用它就是預設沿著列進行憑藉（axis = 0，列對齊）

In [12]: result = df1.append(df2)

這裡寫圖片描述

1.4 無視index的concat

如果兩個表的index都沒有實際含義，使用ignore_index引數，置true，合併的兩個表就睡根據列欄位對齊，然後合併。最後再重新整理一個新的index。
這裡寫圖片描述

1.5 合併的同時增加區分資料組的鍵

前面提到的keys引數可以用來給合併後的表增加key來區分不同的表資料來源

1.5.1 可以直接用key引數實現

In [27]: result = pd.concat(frames, keys=['x', 'y', 'z'])

這裡寫圖片描述

1.5.2 傳入字典來增加分組鍵

In [28]: pieces = {'x': df1, 'y': df2, 'z': df3}

In [29]: result = pd.concat(pieces)

這裡寫圖片描述

1.6 在dataframe中加入新的行

append方法可以將 series 和字典就夠的資料作為dataframe的新一行插入。
這裡寫圖片描述

In [34]: s2 = pd.Series(['X0', 'X1', 'X2', 'X3'], index=['A', 'B', 'C', 'D'])

In [35]: result = df1.append(s2, ignore_index=True)

表格列欄位不同的表合併

如果遇到兩張表的列欄位本來就不一樣，但又想將兩個表合併，其中無效的值用nan來表示。那麼可以使用ignore_index來實現。

這裡寫圖片描述

In [36]: dicts = [{'A': 1, 'B': 2, 'C': 3, 'X': 4},
   ....:          {'A': 5, 'B': 6, 'C': 7, 'Y': 8}]
   ....: 

In [37]: result = df1.append(dicts, ignore_index=True)

python 資料表格的合併和重塑--pd.concat

在進行資料的處理時，經常會進行表格的合併和重塑，pandas中有幾種實用的方法，在此介紹一種pd.concat 1 concat concat函式是在pandas底下的方法，可以將資料根據不同的軸作簡單的融合 pd.concat(objs, axis=0, join='outer'

python 資料表格的合併和重塑--pd.concat

在進行資料的處理時，經常會進行表格的合併和重塑，pandas中有幾種實用的方法，在此介紹一種pd.concat 1 concat concat函式是在pandas底下的方法，可以將資料根據不同的軸作簡單的融合 pd.concat(objs, axis=0, join=

資料基礎---《利用Python進行資料分析·第2版》第8章資料規整：聚合、合併和重塑

之前自己對於numpy和pandas是要用的時候東學一點西一點，直到看到《利用Python進行資料分析·第2版》，覺得只看這一篇就夠了。非常感謝原博主的翻譯和分享。在許多應用中，資料可能分散在許多檔案或資料庫中，儲存的形式也不利於分析。本章關注可以聚合、合併、重塑資料的方法。首先

第八篇2 資料規整：聚合、合併和重塑

在許多應⽤中，資料可能分散在許多⽂件或資料庫中，儲存的形式也不利於分析。本章關注可以聚合、合併、重塑資料的⽅法。⾸先，介紹pandas的層次化索引，它⼴泛⽤於以上操作。然後，深⼊介紹了⼀些特殊的資料操作。一、層次化索引層次化索引（hierarchical indexing）是pandas的⼀項重要

PANDAS 資料合併與重塑（concat篇）

pandas作者Wes McKinney 在【PYTHON FOR DATA ANALYSIS】中對pandas的方方面面都有了一個權威簡明的入門級的介紹，但在實際使用過程中，我發現書中的內容還只是冰山一角。談到pandas資料的行更新、表合併等操作，一般用到的

python資料預處理和特性選擇後列的對映

我們在用python進行機器學習建模時，首先需要對資料進行預處理然後進行特徵工程，在這些過程中，資料的格式可能會發生變化，前幾天我遇到過的問題就是：　　　　對資料進行標準化、歸一化、方差過濾的時候資料都從DataFrame格式變為了array格式。這樣資料的列名就會消失，且進行特徵選擇之後列的數量也會

vue-split-table【表格合併和編輯外掛】

前言 vue-split-table應用的效果圖 vue-split-table開源地址,歡迎star,現在已經開源和同步到npm上輕鬆搞定表格拆分或者合併,編輯,再也不怕被產品懟啦 1.核心原始碼分析 <td>裡面巢狀<table>實現表格拆分; 原生實現

python資料科學基礎和吳恩達作業補缺補漏(三)

Implement the following function, which pads all the images of a batch of examples X with zeros. Use np.pad. Note if you want to pad the

python資料科學基礎和吳恩達作業補缺補漏(二)

Optimization Methods 1-梯度下降法在機器學習中的一個簡單的優化方法是梯度下降（GD）。當你對每一步的所有mm例子採取梯度步驟時，它也被稱為批量梯度下降。 (Batch) Gradient Descent: X = data_input Y = l

python資料科學基礎和吳恩達作業補缺補漏(一)

1.1 向量的1範數向量的1範數即：向量的各個元素的絕對值之和，上述向量a的1範數結果就是：29，MATLAB程式碼實現為：norm（a，1）； 1.2 向量的2範數向量的2範數即：向量的每個元素的平方和再開平方根，上述a的2範數結果就是：15，MATLAB程式碼實現為：norm（a，

Python資料分析環境和工具

一、資料分析工作環境Anaconda:Anaconda（水蟒）是一個科學計算軟體發行版，集成了大量常用擴充套件包的環境，包含了 Python 直譯器，conda 包管理工具，以及 NumPy、Pandas、Matplotlib 等 180 多個科學計算包及其依賴項，並且支援所

pandas資料合併與重塑（pd.concat篇）

1 concat concat函式是在pandas底下的方法，可以將資料根據不同的軸作簡單的融合 1 2 pd.concat(objs, axis=0, join='outer', join_axes=None, ignore_index=False,

第4章：介紹python物件型別/4.1 python的核心資料型別/4.2.1 字串獲取操作、字串合併和重複操作

字串獲取操作概念：用雙引號或者單引號括起來的一串字元字串按下標獲取操作定義字串 >>> S="abcd" 給字串求長度 >>> len(S) 4

利用Python進行資料分析之第七章記錄2 資料規整化:清理、轉換、合併、重塑

索引上的合併 DataFrame中傳入引數left_index=True或者right_index=True（或者兩個都傳入）,表示DataFrame的index（索引）被用作兩個DataFrame連線的連線鍵，如下： dataframe1 = DataFrame({'key':

利用Python進行資料分析之第七章記錄資料規整化:清理、轉換、合併、重塑

合併資料集： pandas物件中的資料可以通過一些內建的方式進行合併： pandas.merge可根據一個或多個鍵將不同DataFrame中的行連線起來。SQL或其它關係型資料庫的使用者對此應該會比較熟悉，因為它實現的就是資料庫的連線操作。 pandas.concat可以沿著一條軸將多個

Python資料處理之（十五）Pandas 合併concat

一、要點 pandas處理多組資料的時候往往會要用到資料的合併處理,使用 concat是一種基本的合併方式.而且concat中有很多引數可以調整,合併成你想要的資料形式. 二、axis(合併方向) axis=0是預設值，因此未設定任何引數時，函式預設axis=0。 >

python資料合併、重塑、移除

目錄合併資料集軸向合併資料重塑移除重複行參考合併資料集 pd.merge(left, right, how, on, left_on, right_on, sort)

在python中使用openpyxl和xlrd建立一個新Excel並把原表格資料複製到新表中

在Python中使用openpyxl和xlrd建立一個新Excel並把原表格資料複製到新表中新的開始文科出生，經濟學專業，年近四旬，純粹是把這個當成一個興趣在學。很早之前就打算學Python，但是一直停留在安裝好Python，這幾天比較空閒，開始從最最基礎自

python資料分析06--Pandas資料歸整：聚合和重塑

在許多應用中，資料可能分散在許多檔案或資料庫中，儲存的形式也不不利利於分析，應採用聚合、合併、重塑資料的方法進行處理。一、層次化索引層次化索引（hierarchical indexing）是pandas的一項重要功能，它使你能在一個軸上擁有多個（兩個以上）索引級別。 In

Python資料分析 | (9)NumPy陣列高階操作---變型、重塑、扁平、合併拆分以及重複

本篇部落格所有示例使用Jupyter NoteBook演示。 Python資料分析系列筆記基於:利用Python進行資料分析(第2版) 目錄 1.陣列轉置和軸對換 2.陣列重塑 3.陣列扁平化 4.陣列的合併和拆分 5.元素的重複操作：tile/r

python 資料表格的合併和重塑--pd.concat

1.1 相同欄位的表首尾相接

1.2 橫向表拼接（行對齊）

1.2.1 axis

1.2.2 join

1.2.3 join_axes

1.3 append

1.4 無視index的concat

1.5 合併的同時增加區分資料組的鍵

1.5.1 可以直接用key引數實現

1.5.2 傳入字典來增加分組鍵

1.6 在dataframe中加入新的行

表格列欄位不同的表合併

相關推薦