預備知識 pandas
阿新 • • 發佈:2021-12-11
預備知識 pandas
建立一個數據
#pandas預備知識 import os os.makedirs(os.path.join('data'),exist_ok=True) #exist_ok = True 可以在檔案已有的時候不建立 data_file = os.path.join('data','hourse.csv') with open(data_file,'w') as f: f.write("NumRooms,Alley,Prices\n") f.write("NA,Pave,213231232\n") f.write("2,NA,213231231\n") f.write("4,NA,213214214\n") f.write("NA,NA,245531444")
使用pandas檢視建立好的csv檔案
import pandas as pd
data = pd.read_csv(data_file)
data
輸出
NumRooms Alley Prices
0 NaN Pave 213231232
1 2.0 NaN 213231231
2 4.0 NaN 213214214
3 NaN NaN 245531444
將資料劃分,用 data.iloc[:]
進行劃分資料
inputs,outputs = data.iloc[:,0:2],data.iloc[:,2] inputs = inputs.fillna(inputs.mean()) #在NaN處填充均值 inputs
輸出
NumRooms | Alley |
---|---|
3.0 | Pave |
2.0 | NaN |
4.0 | NaN |
3.0 | NaN |
將如上資料轉換成張量格式
import torch
x,y = torch.tensor(inputs.values),torch.tensor(outputs.values)
x,y
輸出
(tensor([[3., 1., 0.], [2., 0., 1.], [4., 0., 1.], [3., 0., 1.]], dtype=torch.float64), tensor([213231232, 213231231, 213214214, 245531444]))