python編碼及類型轉換
阿新 • • 發佈:2017-05-25
chardet 只讀 字符串 class log oop 文件 判斷字符串 ()
使用chardet模塊來判斷數據的編碼;輸入參數為str類型。
#coding:utf-8
import cchardet
f =open(‘hadoop.txt‘,‘r‘) #打開文本文件,只讀
about=f.read() #讀取文本內容
print cchardet.detect(about) #判斷字符串編碼
#將字符串的原編碼先轉成unicode編碼,再轉成utf-8編碼
print about.decode(‘gbk‘).encode(‘utf-8‘)
pd.DataFrame數據類型轉換
# -*- coding: UTF-8 -*-
import pandas as pd
df = pd.DataFrame([{‘col1‘:‘a‘, ‘col2‘:‘1‘}, {‘col1‘:‘b‘, ‘col2‘:‘2‘}])
print df
print ‘查看df對象數據類型‘
print df.dtypes
df[‘col2‘] = df[‘col2‘].astype(‘int‘)
print ‘-------------------------------------------‘
print df[‘col2‘] .dtypes
df[‘col2‘] = df[‘col2‘].astype(‘float64‘)
print ‘-------------------------------------------‘
print df.dtypes
當然方法還有很多。。。
python編碼及類型轉換