Json檔案解析與讀寫至DataFrame
阿新 • • 發佈:2018-12-12
簡介
簡單講一下怎麼把txt檔案中的json格式檔案匯入到python中,同時轉為Data Frame形式的資料框。
以方便後續進行資料分析。
環境介紹
系統環境:Windows 10
Python版本:Python 3.5
GUI:Anaconda Spyder
必備庫:pandas, json
程式碼及解釋
如果你的txt中只有一個json物件,那麼用以下的語法就可以:
import pandas as pd import json # 讀取只包含一個json物件檔案的txt path = 'C:/Users/your_file_path/data.txt' file = open(path,'r') js = file.read() data_list = json.loads(js) data_df = pd.DataFrame(data_list,index = [0])
如果你的txt檔案中包含了多個json物件檔案。
那麼,你就需要新建一個空的dataframe,然後逐行讀取為json檔案,並將結果插入dataframe中。程式碼如下:
import pandas as pd import json # 讀取含有所有行的txt檔案 # 讀取json中的各個行 path = 'C:/Users/your_file_path/data.txt' file = open(path,'rb') js = file.read().decode('utf-8') type(js) df_empty = pd.DataFrame() for line in open(path, encoding='UTF-8'): data_list = json.loads(line) # 讀取每一行,將每一行讀取成為json檔案 data_df = pd.DataFrame(data_list, index=[0]) # 將每一行轉成data frame的形式 df_empty = df_empty.append(data_df) # 將每一行轉化append新增到原來空的data frame下