【python】read_csv+編碼問題

阿新 • • 發佈：2019-01-30

想要讀取一個excel檔案，並且獲取某一個分類下的所有的資料

1 pandas官方api有read_excel方法,然而我試了總是提示找不到這個方法，so 還是採用了read_csv

2 將excel轉為csv檔案，pd.read_csv(path)可以讀取，但是亂碼，pd.read_csv(path,encoding='utf-8')會出現

只有變更csv檔案本身的編碼了，用notepad開啟，有個編碼選擇，前方高能，注意：

我這裡一開始選擇了utf8編碼，導致後來出現了獲取資料不準確的問題，在轉碼的時候，有些字元錯誤導致，分隔符並沒有解析出來，

csv本來就是逗號分隔符檔案，所以讀取的話就會出現資料移動的問題

我在csv檔案中並沒有看出這個問題，groupby的時候發現出現了不應該出現的資料統計，所以定位到出現錯誤的index

data_r = data['***'] #返回series

data_err = data_r[data_r == '******'] 返回index和值

用notepad開啟發現錯誤所在序列，確實現實了問題

這裡高新技術和國稅本來應該是兩列，但是因為轉碼錯誤，導致“，”解析不出來，整個資料左移了一位

最後嘗試了下 csv檔案轉碼的時候在notepad裡選擇 utf8無bom編碼格式

最後成功

__author__ = 'user'
# -*- coding:utf-8 -*-
import numpy as np
import pandas as pd
import matplotlib as plt
from pandas import Series,DataFrame

data = pd.read_csv('E:/yangnan/work/2013_1.csv')
print  data.columns
data_scale = data['企業規模（國家統計局標準）']
print data_scale.size
print data_scale.value_counts()

【python】read_csv+編碼問題

想要讀取一個excel檔案，並且獲取某一個分類下的所有的資料 1 pandas官方api有read_excel方法,然而我試了總是提示找不到這個方法，so 還是採用了read_csv 2 將excel轉為csv檔案，pd.read_csv(path)可以讀取，但是亂碼，pd

【python】聲明編碼的格式

cnblogs 表達 html log 則表達式 pre tar 聲明 nbsp 來自：http://www.xuebuyuan.com/975181.html 編碼聲明必須在第一行或者第二行，且要符合正則表達式 "coding[:=]\s*([-\w.]+)"

【Python】python基礎語法編碼

finall ont 實現 tro out 程序 port 其他 pytho 編碼默認情況下，python以UTF-8編碼，所有的字符串都是Unicode字符串，可以為代碼定義不同的的編碼。 #coding:UTF-8 #OR #-*- coding:UTF-8 -

【python中的編碼問題】

網絡文件操作指定 enc 引號 pytho ascii碼磁盤 encode 1、首先要在開頭說明編碼方式為：utf-8 例如：-*- coding: utf-8 -*- 2、如果遇到字符串，立刻轉化為unicode，不要使用str()，直接使用unicode() un

【Python】utf8,unicode,ascii編碼的相互轉換

（linux系統為例）中文字元：腳對應編碼如下： utf8編碼： unicode編碼：(引號前有 u) ascii編碼：【1】unicode與ascii互轉涉及函式：ord()與 ch

【python】使用cjson的編碼問題

cjson庫相對於python自帶的json庫，效率會高一些。兩者用法也都相對簡單。對於json，可直接使用json.loads(str)來將json字串轉為json物件。而對於cjson，則可以

【Python】正則表達式1（未完）

pes mmu get regular rop 則表達式 line out github 1、正則表達式唯一的用途就是在文本中匹配和尋找模式，模式可以簡單，也可以復雜。 2、Regexr 這個網站很個性的就是，有一個community標簽，打開後可以看到評分由高到低

【LeetCode】【Python】Binary Tree Inorder Traversal

nod 不知道 otto div ack return integer neu else Given a binary tree, return the inorder traversal of its nodes‘ values. For example: Gi

【Python】決策樹的python實現

uia bmp say 不知道 times otto outlook lru bgm 【Python】決策樹的python實現 2016-12-08 數據分析師Nieson 1. 決策樹是什麽? 簡單地理解，就是根據一些 feature 進行分類，每個節點提一個問

【Python】基礎知識

數據文件專用一切都元組內存引用傳遞 asc ilo 1. python腳本語言的第一行，目的就是指出，你想要你的這個文件中的代碼用什麽可執行程序去運行它 #!/usr/bin/python 是告訴操作系統執行這個腳本的時候，調用/usr/bin下

【Python】python2.7 安裝配置OpenCV2

pen 2.4.1 安裝 so文件 strong make lib con ack 環境：Ubuntu16.04 anaconda Python2.7 opencv2.4.13 安裝opencv後 import cv2 遇到錯誤信息： No module named cv2

【Python】數組排序

log false blog sort函數 () ron 返回 imp 總結 1.numpy庫：argsort() 　　argsort函數返回的是數組值從小到大的索引值（升序排列）一維： In [1]: import numpy as np In [2]: x

【Python】selenium調用IE11瀏覽器，報錯“找不到元素”NoSuchWindowException: Message：Unable to find element on closed window

conn ont csdn creates logs 註冊 target get 意思當編寫自動化腳本，定位瀏覽器元素時，報如下錯誤：代碼： >>> # coding=utf-8 >>> from selenium import w

【Python】Selenium元素定位錯誤之解決辦法

tor log -m alt src 多個 common nbu invalid 當使用class定位元素時發現報錯：錯誤信息：selenium.common.exceptions.InvalidSelectorException: Message: Compound

【Python】京東商品價格監控

ets amp inpu text init clas bject logs while import requests,json,re,winsound,time class Stock(object): def __init__(self):

【python】python魔法方法(待填坑)

絕對值 tle init cls -m del __init__ 另一個 trunc 參考博文：http://pyzh.readthedocs.io/en/latest/python-magic-methods-guide.html 參考博文英文原版：http://www

【Python】05、python程序結構控制語句

python一、程序結構程序結構：語句和表達式按照什麽樣的順序執行所有語言無非就三種程序結構：順序：默認結構語句從上到下依次一行一行的執行，分支：選擇一個分支執行，永遠最多只執行一個分支循環：二、分支結構語句1、Python的比較操作

【Python】06、python內置數據結構1

python list 一、數據結構與獲取幫助信息1、數據結構通過某種方式（例如對元素進行編號）組織在一起的數據元素的集合，這些數據元素可以是數字或者字符，甚至可以是其它的數據結構。 python的最基本數據結構是序列序列中的每個元素被分配一個序號（即元素的位置），也稱為索引：索引從0開始編

【Python】07、python內置數據結構之字符串及bytes

str 字符串一、字符串1、定義和初始化In [4]: s = "hello python" In [4]: s = "hello python" In [5]: s Out[5]: ‘hello python‘ In [6]: s = ‘hello python‘ In [7]: s Out

【Python】10、python內置數據結構之集合

set一、集合1、集合的定義In [74]: s = {} In [74]: s = {} # 空大括號是空的字典 In [75]: type(s) Out[75]: dict In [77]: type(s) Out[77]: set In [78]: help(set) Help on cl

【python】read_csv+編碼問題

相關推薦