pandas 之資料的簡單處理和排序輸出
阿新 • • 發佈:2019-01-09
import pandas as pd
from pandas import DataFrame, Series #要排序,需新增
data_4= pd.read_csv('(result-4)句網綜合-pandas.csv',usecols=[0,3],header=0,names=['句子','句綜合'],encoding='gbk',dtype={'句子':'int','句綜合':np.float64},error_bad_lines = False)
#排序 fboth=pd.merge(data_4,data_5) fboth['句分配詞權']=fboth['句網綜合']/fboth['詞數'] from pandas import DataFrame, Series #要排序,需新增 frame = DataFrame(fboth) frame.sort_values(by='句子',inplace = True) #新增inplace = True 替換
fboth.to_csv('每句-pandas.txt',index=False,header=False,sep='\t')
frame.to_csv('(result-5)-pandas.txt',index=False,header=False,sep='\t',columns=['句子','句分配']) #生成的文字有四列,下一階段要使用的是第0和第3列