學習資料預處理
阿新 • • 發佈:2018-12-14
# GB18030,全稱:國家標準GB18030 - 2005《資訊科技中文編碼字符集》,是中華人民共和國現時最新的內碼字集, # 是GB18030 - 2000《資訊科技資訊交換用漢字編碼字符集基本集的擴充》的修訂版。GB18030與GB2312 - 1980和GBK相容,共收錄漢字70244個 df = pd.read_csv(path, encoding="gb18030") # 去掉集合競價的時間 # 每個交易日9: 15至9: 25(深圳包括9: 15至9:25和14: 57至15: 00),證券交易所交易主機接受參與競價交易的申報 # 每個交易日9: 25至9: 30,交易主機只接受申報,但不對買賣申報或撤銷申報作處理。交易所認為必要時,可以調整接受申報時間 # loc 行 startTime = df.loc[0, '時間'][0:10]+' 09:26' endTime = df.loc[0, '時間'][0:10]+' 15:00:01' # 篩選 df = df[df['時間']>startTime] df = df[df['時間']<endTime] # T 轉置 df = pd.DataFrame([in_volume, total_volume]).T # index : Write row names 寫入行名 df.to_csv(path+r'/%s_資金流向.csv'%date, index=False, header=False, mode='a+')