1. 程式人生 > >pandas+xlrd+numpy按元素計算批量處理excel所有sheet

pandas+xlrd+numpy按元素計算批量處理excel所有sheet

import pandas as pd
import xlrd
import numpy as np

xlsfile = r'D:\workfile\uv\wind.xls'
book = xlrd.open_workbook(xlsfile) 
#xlrd用於獲取每個sheet的sheetname  
#count = len(book.sheets())
with pd.ExcelWriter('newxls.xls') as writer:
    for sheet in book.sheets():
        print sheet.name
        df = pd.read_excel(xlsfile,sheet.name,index_col = None
) df1=df.replace(9999,np.nan).dropna(axis=0) df2=df1.iloc[:,:2] df3=df1.iloc[:,2] #np.sin和np.cos按元素計算,好啊 df4=(-1)*np.sin(df3)*df1.iloc[:,3] df5=(-1)*np.cos(df3)*df1.iloc[:,3] #重新拼接 pieces=[df2,df4,df5] df6=pd.concat(pieces,axis=1
) #對columns重新命名 column_index={'jingdu':'jingdu','weidu':'weidu',0:'u',1:'v'} df7=df6.rename(columns=column_index) #結果寫入excel中的sheet df7.to_excel(writer,sheet_name = sheet.name)

相關推薦

pandas+xlrd+numpy元素計算批量處理excel所有sheet

import pandas as pd import xlrd import numpy as np xlsfile = r'D:\workfile\uv\wind.xls' book = xlrd.open_workbook(xlsfile) #xlrd用

Python批量處理Excel檔案到同一檔案的不同sheet上(未完...)

存在每次活動整理的Excel資料檔案,需放在一個Excel上進行儲存#-*-coding:utf-8-*- import os import pandas as pd path='' files=os.

Excel轉Html(十一)--POI處理Excel-獲取sheet總行數-總列數-行高-列高

獲取sheet行總數:sheet.getLastRowNum() 列總數:dataMap.get("maxColNum-" + form.getFormName() 獲取列最多的行,特別注意:sheet.getRow(0).getPhysicalNumberOfCells()不準確 行高:r

動態可視化 數據可視化之魅D3,Processing,pandas數據分析,科學計算Numpy,可視化包Matplotlib,Matlab語言可視化的工作,Matlab沒有指針和引用是個大問題

com 行數據 操作dom 判斷 互動 otl .org zhang mouse 動態可視化 數據可視化之魅D3,Processing,pandas數據分析,科學計算包Numpy,可視化包Matplotlib,Matlab語言可視化的工作,Matlab沒有指針和引用是個大問

利用pandasnumpy計算表中每一列的均值

import numpy as np import pandas as pd df = pd.DataFrame({'var1':np.random.rand(100), #生成100個0到1之間的隨機數 'var2':100,

pandasnumpy處理資料中的空值(np.isnan()/pd.isnull())

最近在做資料處理的時候,遇到個讓我欲仙欲死的問題,那就是資料中的空值該如何獲取。 我的目的本來是獲取資料中的所有非零且非空值,然後再計算獲得到的所有資料計算均值,再用均值把0和空值填上。這個操作讓我意識到了i is None/np.isnan(i)/i.isnull()之間的差別,再此

數字遞增批量重新命名檔案的批處理

按00001這類格式遞增批量重新命名ren.bat:@echo off SETLOCAL ENABLEDELAYEDEXPANSION set /A num=0 FOR /F "tokens=*" %%i in ('dir /A-D /B /OD /TC') do (     IF NOT "%%i"=="%

Python資料處理效能對比,原生,PandasNumpy哪個更優秀

今天為大家分享一個關於資料處理效能的對比,從原生,Pandas ,Numpy這三個方面對比?你覺得哪個更優秀呢?對於一個數據科學家來說,速度和時間是一個很至關重要的的因素 下圖顯示了我的實驗結果(詳情如下),與純Python的處理速度做出對比。   如你所見,Nump

資料預處理(3) ——資料歸約 使用python(sklearn,pandasnumpy)實現

資料預處理的主要任務有: 一、資料預處理 1.資料清洗 2.資料整合 3.資料轉換 4.資料歸約 4.資料歸約 資料規約技術可以用來得到資料集的規約表示,它小得多,但仍接近於保持原始資料的完整性。也就是說,在規約後的資料集挖掘將更加有效。 (1)資料立方體

python計算的效率問題-pandasnumpy結合代替遍歷pandas資料

越來越考慮效率的問題了,以前寫程式碼只要能夠實現自己想要的功能就行,現在,既要實現自己想要的功能,又追求高的效率,也許,在碼農的道路上,越走越遠了(_-_)原始資料如下:計算那一天是月初,原先使用的方法為:在這種情況下,遍歷pandas,明顯效率很不高def get_yuec

功能第五篇——批量處理(JDBC)

需要 res col dsta 添加 name call table creat 綜述 批量處理一般指批量插入,批量更新,刪除通過可

使用Python通過xlrd處理excel實戰

python excel xlrd 項目需求: 通過指定excel文件,文件格式如下: 要求下載第四列URL中的圖片,圖片保存名稱為,url中的名稱,每個公司需要單獨建立一個獨立的文件夾,公司下面會有不同類型的圖片,不同類型的圖片也需要不同的文件夾保存,最終將圖

樣式版本批量處理,使用文件修改最後日期作為版本號參數

pen crm each etl eric builder class a space dex using System;using System.Collections.Generic;using System.IO;using System.Linq;using Sys

html5有哪些新特性、移除了那些元素?如何處理HTML5新標簽的瀏覽器兼容問題?如何區分 HTML 和 HTML5?

als ie8 mil oct scrip locals bsp 框架 canvas 新特性: 1. 拖拽釋放(Drag and drop) API 2. 語義化更好的內容標簽(header,nav,footer,aside,article,section) 3. 音頻、視

MATLAB 批量處理圖片

mit other with ted using isn val end ner p.p1 { margin: 0.0px 0.0px 0.0px 0.0px; font: 10.0px Courier } p.p2 { margin: 0.0px 0.0px 0.0px

mybatis 的批量處理功能

設置 light col cep 錯誤 復雜 param etc cut 由於在3.1.1升級後,可直接通過batchExcutor實現具體的批量執行。在該excutor中會重用上一次相同的prepareStatement。/** * 批量插入數據 <br/>

ArcGIS中的批量處理

blog 自己 exc 多行 解決方法 選擇 可選 ont 遇到 在實際生產過程中,經常遇到批量處理數據的情況。在ArcGIS中,除自己寫代碼來處理這類問題外,它提供了一個批量處理的工具,在ToolBox對應的工具上右鍵即可選擇批處理工具。 和單個處理方式一樣,輸入參數

異步IO實戰之四:異步IO的單個處理批量處理

c語言 異步io aio_write 異步IO由於它的非阻塞特性和強大的並發能力,非常適合用在要求高並發和高吞吐率的場景,比如用在提供SAN存儲的塊設備讀寫的實現上。和傳統IO模式類似,異步IO提供了一次提交一個IO請求的模式,還提供了一次提交一組IO請求的方式。下面將分別介紹這兩種模式的使用方法

基於SmartThreadPool線程池技術實現多任務批量處理

C# .NET 多線程技術 Thread SmartThreadPool 一、多線程技術應用場景介紹本期同樣帶給大家分享的是阿笨在實際工作中遇到的真實業務場景,請跟隨阿笨的視角去如何采用基於開源組件SmartThreadPool線程池技術實現多任務批量處理。在工作中您是否遇到過如何快速高效