1. 程式人生 > 其它 >預備知識 pandas

預備知識 pandas

預備知識 pandas

建立一個數據

#pandas預備知識 
import os 
os.makedirs(os.path.join('data'),exist_ok=True) #exist_ok = True 可以在檔案已有的時候不建立
data_file = os.path.join('data','hourse.csv')
with open(data_file,'w') as f: 
    f.write("NumRooms,Alley,Prices\n")
    f.write("NA,Pave,213231232\n") 
    f.write("2,NA,213231231\n")
    f.write("4,NA,213214214\n")
    f.write("NA,NA,245531444")

使用pandas檢視建立好的csv檔案

import pandas as pd 
data = pd.read_csv(data_file) 
data

輸出

     NumRooms	Alley	Prices
0	NaN	Pave	213231232
1	2.0	NaN	213231231
2	4.0	NaN	213214214
3	NaN	NaN	245531444

將資料劃分,用 data.iloc[:]進行劃分資料

inputs,outputs = data.iloc[:,0:2],data.iloc[:,2]
inputs = inputs.fillna(inputs.mean()) #在NaN處填充均值 
inputs

輸出

NumRooms Alley
3.0 Pave
2.0 NaN
4.0 NaN
3.0 NaN

將如上資料轉換成張量格式

import torch 
x,y = torch.tensor(inputs.values),torch.tensor(outputs.values)
x,y

輸出

(tensor([[3., 1., 0.],
         [2., 0., 1.],
         [4., 0., 1.],
         [3., 0., 1.]], dtype=torch.float64),
 tensor([213231232, 213231231, 213214214, 245531444]))