Pandas讀取並修改excel

阿新 • • 發佈：2019-01-07

一、前言

最近總是和excel打交道，由於資料量較大，人工來修改某些資料可能會有點浪費時間，這時候就使用到了Python資料處理的神器—–Pandas庫，話不多說，直接上Pandas。

二、安裝

這次使用的python版本是python2.7，安裝python可以去python的官網進行下載，這裡不多說了。

安裝完成後使用Python自帶的包管理工具pip可以很快的安裝pandas。

pip install pandas

如果使用的是Anaconda安裝的Python，會自帶pandas。

三、read_excel()介紹

首先可以先建立一個excel檔案當作實驗資料，名稱為example.xlsx，內容如下：

name	age	gender
John	30	male
Mary	22	female
Smith	32	male

這裡是很簡單的幾行資料，我們來用pandas實際操作一下這個excel表。

# coding:utf-8
import pandas as pd

data = pd.read_excel('example.xlsx', sheet_name='Sheet1')
print data

結果如下：

這裡使用了read_excel()方法來讀取excel，來看一個read_excel()這個方法的API，這裡只截選一部分經常使用的引數：

pd.read_excel(io, sheet_name=0, header=0, names=None, index_col=None, usecols=None)

這裡主要引數為io，sheet_name，header，usecols和names

io：excel檔案，如果命名為中文，在python2.7中，需要使用decode()來解碼成unicode字串，例如： pd.read_excel('示例'.decode('utf-8))

sheet_name：返回指定的sheet，如果將sheet_name指定為None，則返回全表，如果需要返回多個表，可以將sheet_name指定為一個列表，例如['sheet1', 'sheet2']

header：指定資料表的表頭，預設值為0，即將第一行作為表頭。

usecols：讀取指定的列，例如想要讀取第一列和第二列資料：

    pd.read_excel("example.xlsx", sheet_name=None, usecols=[0, 1])

四、使用

這裡先來一個在機器學習中經常使用的：將所有gender為male的值改為0，female改為1。

# coding:utf-8
import pandas as pd
from pandas import DataFrame

# 讀取檔案
data = pd.read_excel("example.xlsx", sheet_name="Sheet1")

# 找到gender這一列，再在這一列中進行比較
data['gender'][data['gender'] == 'male'] = 0
data['gender'][data['gender'] == 'female'] = 1
print data

結果如下：
這裡寫圖片描述

需要注意的是，這裡的data為excel資料的一份拷貝，對data進行修改並不會直接影響到我們原來的excel，必須在修改後儲存才能夠修改excel。儲存的程式碼如下：

DataFrame(data).to_excel('example.xlsx', sheet_name='Sheet1', index=False, header=True)

這時候我們再開啟example.xlsx檔案看看是否更改了：

這裡寫圖片描述
如果我們想要新增加一列或者一行資料怎麼辦呢？這裡給出參考：

新增列資料：

data['列名稱'] = None

新增行資料，這裡行的num為excel中自動給行加的id數值

data.loc[行的num] = [值1， 值2， ...]

以上面的資料為例：

# coding:utf-8
import pandas as pd
from pandas import DataFrame

data = pd.read_excel("example.xlsx", sheet_name='Sheet1')

# 增加行資料，在第5行新增
data.loc[5] = ['James', 32, 'male']

# 增加列資料，給定預設值None
data['profession'] = None

# 儲存資料
DataFrame(data).to_excel('example.xlsx', sheet_name='Sheet1', index=False, header=True)

開啟excel看到的結果如下：
這裡寫圖片描述

說完了增加一行或一列，那怎樣刪除一行或一列呢？

import pandas as pd
from pandas import DataFrame

data = pd.read_excel("example.xlsx", sheet_name='Sheet1')

# 刪除gender列，需要指定axis為1，當刪除行時，axis為0
data = data.drop('gender', axis=1)

# 刪除第3,4行，這裡下表以0開始，並且標題行不算在類
data = data.drop([2, 3], axis=0)

# 儲存
DataFrame(data).to_excel('example.xlsx', sheet_name='Sheet1', index=False, header=True)

這時候開啟excel可以看見gender列和除標題行的第3，4行被刪除了。
這裡寫圖片描述

總結

pandas除了上述的基本功能以外，還有其它更高階的操作，想要進一步學習的小夥伴們可以去pandas網站進行學習。

Pandas讀取並修改excel檔案筆記

第一步安裝pandas 我們使用Python自帶的包管理工具pip來進行pandas安裝。 pip install pandas 安裝完成後，我們測試一下效果，輸入下列程式碼： #import the pandas library and aliasing as pd imp

Pandas讀取並修改excel

一、前言最近總是和excel打交道，由於資料量較大，人工來修改某些資料可能會有點浪費時間，這時候就使用到了Python資料處理的神器—–Pandas庫，話不多說，直接上Pandas。二、安裝這次使用的python版本是python2.7，安裝py

pandas讀取20W資料excel，每999行生成一個查詢sql語句

前言工作中遇到一個小問題，Oralce資料庫的查詢是不能大於1000條in查詢的，所以需要對檔案進行切割。資料來源是20w的excel資料，於是想到用pandas對其進行讀取，然後每998行生成一個新的sql檔案。程式碼實現 # coding = utf-8 """ @

【學習筆記】使用python批量讀取並修改xml檔案（3）

在大老闆的安排下最近在某公司實習，實習期間要求實現一個影象識別模組的封裝。無奈基礎太薄弱，只能將任務細分，單獨學習來實現。以此為背景…… 經過公司師姐的指點，突然毛瑟頓開，編寫了V3.0的程式碼，可以實現的功能：使用者輸入欲改變的圖片尺寸後計算新的xml中bnb box的值、將圖片尺寸改變後

【學習筆記】使用python批量讀取並修改xml檔案（2）

在大老闆的安排下最近在某公司實習，實習期間要求實現一個影象識別模組的封裝。無奈基礎太薄弱，只能將任務細分，單獨學習來實現。以此為背景…… 這一篇記錄一些在實際使用中踩到的坑。在實際使用中，我在A資料夾下對圖片進行了標註，隨後將圖片移動到B資料夾下。那麼相應的，標註後的xml檔案中，<p

【學習筆記】使用python批量讀取並修改xml檔案

在大老闆的安排下最近在某公司實習，實習期間要求實現一個影象識別模組的封裝。無奈基礎太薄弱，只能將任務細分，單獨學習來實現。以此為背景…… 本篇目標：通過python批量訪問並修改xml檔案。目前，存在的問題是，標註好一批圖片後，若改變圖片尺寸，則原始的xml檔案中的bnbbox資料作廢

【學習筆記】使用python批量讀取並修改xml檔案（4）

在大老闆的安排下最近在某公司實習，實習期間要求實現一個影象識別模組的封裝。無奈基礎太薄弱，只能將任務細分，單獨學習來實現。以此為背景…… 程式碼更新V4.0版本，通過openCV實現xml中bounding box在原始影象和尺寸調整後的圖片中的視覺化（part three部分）。方便對比尺

java：讀取並修改word中的內容並儲存。

1.讀取word內容 2.修改要修改的內容 3.儲存word public Map readwriteWord(Map<String, String> map,String gcid,String deptid) { //查詢word模板

在Java中讀取並儲存EXCEL檔案中圖片

/* * 儲存excel中的圖片(以檔案形式儲存，或者存入資料庫) * * basePath:應用所在路徑,附件存放路徑: * 引數：is是上傳的附件檔案流 */ public void saveSheetImgByFile(

OLE上傳及下載並修改excel

對於比較複雜的格式的EXCEL，不方便自己用程式來寫格式，此時可以用OLE將EXCEL模板傳到系統當中去，然後從系統中下載該模板後再填充需要的資料儲存即可實現要想的EXCEL. 上傳excel檔案

SilverLight C#程式之：讀取並修改App.config檔案

1. 向專案新增app.config檔案：右擊專案名稱，選擇“新增”→“新增新建項”，在出現的“新增新項”對話方塊中，選擇“新增應用程式配置檔案”；如果專案以前沒有配置檔案，則預設的檔名稱為“app.config”，單擊“確定”。出現在設計器檢視中的app.config檔案為

Pandas 讀取Excel並設定n列做MultiIndex

Pandas 讀取Excel並設定n列做MultiIndex #讀取資料 import pandas as pd import numpy as np import glob,os path=r'e:\tj\month\fx1809' file=glob.glob(os.path.join(pa

用pandas讀取excel並畫圖展示

初學python,啥都不懂。剛好有個資料想分析一下，便搜尋瞭如何使用python處理Excel並展示，短短的一段程式碼浪費了很多時間，直接貼程式碼吧： python dict orderedDict pandas xlrd 程式碼塊程式碼塊語法遵循標準markdow

機器學習之數據預處理，Pandas讀取excel數據

修改 ould text 形式參數 indicate 索引 ive XP url Python讀寫excel的工具庫很多，比如最耳熟能詳的xlrd、xlwt，xlutils，openpyxl等。其中xlrd和xlwt庫通常配合使用，一個用於讀，一個用於寫excel。xlut

Pandas讀取excel資料——pearson相關性分析

利用Pandas和tushare進行一個簡單的資料讀取和分析一丶Pandas的DataFrame操作方法一個表格型資料，提供列名和不同的值，以及索引值通過下面程式碼記錄一些DataFrame的方法 from pandas import Series,DataFram

使用POI操作Excel修改模板(批量替換excel中的資料並判斷excel版本)

package com.sycamore.controller; import org.apache.poi.POIXMLDocument; import org.apache.poi.hssf.usermodel.HSSFCell; import org.apache.poi.hssf.userm

C#使用NPOI讀取excel模板，並匯出excel

private void ExportDoctoryCase(HttpContext context) { //載入模板檔案路徑 string TempletFileName = context.Serv

Python3 進行讀取、修改和寫Excel表格(.xlsx檔案)的常用功能示例

讀取我一般用xlrd（僅支援讀），修改用openpyxl（支援讀寫改），寫用xlsxwriter（僅支援寫） xlrd安裝命令 pip install xlrd openpyxl安裝命令 pip install openpyxl xlsxwriter安裝命令 pip install

python讀取json格式檔案和用pandas讀取excel檔案

IT Xiao Ang Zai 9月30號版本：python3.7 程式設計軟體：sublime 一：python解析json資料 1.什麼是json： (1)JSON(JavaScript Object Notation) 是一種輕量級的資料交換格式。它

讀取Excel檔案，並對Excel檔案進行描述性分析

> mydata<-read.csv("E:\\╰凝初寒つ\\學習檔案\\大資料概論\\R語言\\soapdata.csv",header=T) > dim(mydata) > mydata<-head(mydata,41) >

Pandas讀取並修改excel

一、前言

二、安裝

三、read_excel()介紹

四、使用

總結

相關推薦