運用pandas將字典的列表轉化為獨立的資料列

阿新 • • 發佈：2019-02-03

在Stack Overflow看到的一個帖子table0.csv資料集如下：

name	status	number	message
matt	active	12345	[job: , money: none, wife: none]
james	active	23456	[group: band, wife: yes, money: 10000]
adam	inactive	34567	[job: none, money: none, wife: , kids: one, group: jail]

但現在我想處理資料得到如下的table:

方法一：

首先通過replace（\s+代表一個及以上空格），將list of dict轉化為set of dict

然後使用ast

import ast
df.message = df.message.replace([':\s+,','\[', '\]', ':\s+', ',\s+'], ['":"none","', '{"', '"}', '":"', '","'], regex=True)
df.message = df.message.apply(ast.literal_eval)
df1 = pd.DataFrame(df.pop('message').values.tolist(), index=df.index)

print (df1)

   kids  money group   job  money  wife
0   NaN   none   NaN  none    NaN  none
1   NaN    NaN  band   NaN  10000   yes
2   one    NaN  jail  none   none  none

問題來了因為‘money’在第二行的message中是第三個dict，不同於其他兩行在第二個dict,

因此會產生兩列‘money’。這時候需要我們手動修改，不展開了。

所以按正常的操作得到如下：

df=pd.concat([df,df1],axis=1)

print(df)

    name    status  number  kids  money group   job  money  wife
0   matt    active   12345   NaN   none   NaN  none    NaN  none
1  james    active   23456   NaN    NaN  band   NaN  10000   yes
2   adam  inactive   34567   one    NaN  jail  none   none  none

方法二：

使用yaml包

import yaml
df.message = df.message.replace(['\[','\]'],['{','}'], regex=True).apply(yaml.load)
df1 = pd.DataFrame(df.pop('message').values.tolist(), index=df.index)
print (df1)

  group   job kids  money  wife
0   NaN  None  NaN   none  none
1  band   NaN  NaN  10000  True
2  jail  none  one   none  None

df = pd.concat([df, df1], axis=1)

print (df)

    name    status  number group   job kids  money  wife
0   matt    active   12345   NaN  None  NaN   none  none
1  james    active   23456  band   NaN  NaN  10000  True
2   adam  inactive   34567  jail  none  one   none  Non

源地址：https://stackoverflow.com/questions/43032182/pandas-list-of-dictionary-to-separate-columns

運用pandas將字典的列表轉化為獨立的資料列

在Stack Overflow看到的一個帖子table0.csv資料集如下：namestatusnumbermessagemattactive12345[job: , money: none, wife: none]jamesactive23456[group: band,

怎樣利用Pandas將List列表轉換為Dataframe？

1.一種情況是有兩個列表，合併到一個DataFrame中：假設一個列表為a,另一個列表為b,則可以採用以下兩種方法進行合併：方法1,1 首先將兩個列表合併成一個字典，然後再將該字典傳入到DataFrame中建立，程式碼示例如下： >>> a

Python元組組成的列表轉化為字典

雖然元組、列表不可以直接轉化為字典，但下面的確是可行的，因為經常用python從資料庫中讀出的是元組形式的資料。 >>> cc = [('1',1),('2','jiqw'),('3',1372)] >>> dict(cc) {'1

js將UTC時間轉化為當地時區時間

國外就會時間 var 請求 time() timezone 解決網上我們在進行網站開發的時候有可能會涉及到國外的用戶或者用戶身在國外，這時就會存在時差問題，比如說我們在中國的時間是08:00，但是此時韓國的時間是09:00，如果在網頁上需要進行相關顯示的話就會出現問

iview中使用Tag時進行數據的變化和實現將輸入內容轉化為標簽輸出數組

target spl method handle eof class har ash href 上代碼 <!DOCTYPE html> <html> <head> <meta charset="utf-8">

將H5頁面轉化為圖片

head true pos ref -o 如果 data pad tor 使用html2canvas插件，詳情：http://html2canvas.hertzen.com/ 實例代碼： html <div id="capture" style="padding:

JS將時間戳轉化為時間

style 時間戳 sta turn eth minutes pan div () //將時間戳轉化為時間 function timestampToTime(timestamp) { var date = new Date(timestamp * 1000);/

js將數組轉化為平衡二叉樹

new oot int var console his log ray === function TreeNode(val) { this.value = val;}var sortedArrayToBST = function (nums) { if (nums.le

[DeeplearningAI筆記]卷積神經網絡4.1-4.5 人臉識別/one-shot learning/Siamase網絡/Triplet損失/將面部識別轉化為二分類問題

卷積三元兩個輸出 cti 輸入數學 bubuko 人的 4.4特殊應用:人臉識別和神經網絡風格轉換覺得有用的話,歡迎一起討論相互學習~Follow Me 4.1什麽是人臉識別 Face verification人臉驗證 VS face recognition人臉識

基於opencv將視頻轉化為字符串Java版

com 1.2 stringbu 顯示 bili visible play git osi 基於opencv將視頻轉化為字符串Java版opencv java 先上一個效果圖吧首先,弄清一下原理我們要將視頻轉化為字符畫,那麽就需要獲取畫面的每一幀,也就

將一個字串轉化為整數——微軟面試題

github地址：https://github.com/ALXlixiong/offer 題目描述：將一串由數字（可能包含正負號）組成的字串轉化為整數；注意事項：（1）判斷字串是否為空；（2）判斷數字是否溢位（正負號）（3）是否含有其他符號程式碼： #inclu

將區域性變數轉化為全域性變數

區域性變數的轉換將要轉換的區域性變數，在該類的構造器中宣告，並作為引數傳入。 public class ATMThread extends Thread{ //account為區域性變數 private Account account; private double n

Python將圖片彩色轉化為素描

第一種： from PIL import Image, ImageFilter, ImageOps img = Image.open('E:\\picture\\1.png') def dodge(a, b, alpha): return min(int(a*255/(256-b

案例將日期格式轉化為字串

輸出：2018年X月X日 00:00:00 星期X var date = new Date(); function dateToString(date) { var dateStr = ""; var week = ["星期天", "星期一", "星期二", "星期三", "星期四"

maven工程依賴配置（將功能模組打包為獨立jar，使用maven進行管理）

第一步：建立maven工程（eclipse） 1）： 2） 3） 4）拓展公共模組pom檔案如下： <project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="htt

[python] pinyin 模組 -- 將漢字文字轉化為拼音

許多情況下，我們需要將一段漢字轉換為拼音。比如我們可以用拼音來進行排版，或者是將拼音輸出到其他程式，生成語音。一般將漢字轉化成拼音這樣的功能，我們需要一個字典來實現。比如 Mandarin.dat 。不過在 PyPI 中，已經有不少模組將其封裝，而這裡要介紹的就是 pinyin 模組。 1

LeetCode 108——將有序陣列轉化為二叉搜尋樹

1. 題目 2. 解答一棵高度平衡的二叉搜尋樹意味著根節點的左右子樹包含相同數量的節點，也就是根節點為有序陣列的中值。因此，我們將陣列的中值作為根節點，然後再遞迴分別得到左半部分資料轉化的左子樹和右半部分資料轉化的右子樹即可。遞迴終止的條件是陣列為空，這時候返

js 快速將字串陣列轉化為數字陣列（互換）

轉載於這裡 var arr = [1, 2, 3, 4, 5, 6, 7, 8, 9]; arr.map(String); //結果： ['1', '2', '3', '4', '5', '6'

[流暢的 C]C語言將結構體轉化為字串

[流暢的 C] C語言將結構體轉化為字串 Overview 思路直接使用 memcpy 之類的是不可以的。所以最好的做法就是定義結構體的時候就實現對字串的轉換。就像 Python 的 __str__ 一樣。（不好意思，博主雷打不動轉python！信仰

matlab怎麼將一個矩陣轉化為灰度圖

用三個函式即可，第一個函式imagesc()、第二個colormap()函式、第三個函式為flipud函式（）： imagesc(A)將矩陣A中的元素數值按大小轉化為不同顏色，並在座標軸對應位置處以這種顏色染色。 colormap(gray)將矩陣A的顏色圖轉化

運用pandas將字典的列表轉化為獨立的資料列

相關推薦