1. 程式人生 > >學習資料預處理

學習資料預處理

# GB18030,全稱:國家標準GB18030 - 2005《資訊科技中文編碼字符集》,是中華人民共和國現時最新的內碼字集,
# 是GB18030 - 2000《資訊科技資訊交換用漢字編碼字符集基本集的擴充》的修訂版。GB18030與GB2312 - 1980和GBK相容,共收錄漢字70244個
df = pd.read_csv(path, encoding="gb18030")

# 去掉集合競價的時間
# 每個交易日9: 15至9: 25(深圳包括9: 15至9:25和14: 57至15: 00),證券交易所交易主機接受參與競價交易的申報
# 每個交易日9: 25至9: 30,交易主機只接受申報,但不對買賣申報或撤銷申報作處理。交易所認為必要時,可以調整接受申報時間

# loc 行
startTime = df.loc[0, '時間'][0:10]+' 09:26'
endTime = df.loc[0, '時間'][0:10]+' 15:00:01'

# 篩選
df = df[df['時間']>startTime]
df = df[df['時間']<endTime]

# T 轉置
df = pd.DataFrame([in_volume, total_volume]).T
#  index : Write row names  寫入行名
df.to_csv(path+r'/%s_資金流向.csv'%date, index=False, header=False, mode='a+')