Excel 檔案資料讀取和篩選

阿新 • • 發佈：2018-11-19

需求：已知一個excel 表中的"Sheet1"中，有id, name, salary 3列的內容，要求將薪水重複次數最多的按從高到低進行排序

#coding=utf-8
import xlrd
from collections import Counter
import operator
file = r'C:\\Users\\belle.zhao\\Desktop\\test.xlsx'
data = xlrd.open_workbook('C:\\Users\\belle.zhao\\Desktop\\test.xlsx','rb')  # 開啟excel檔案
table = 
 data.sheet_by_name('Sheet1')   # 選擇sheet頁
ncols = table.ncols  # 獲取sheet1 頁的列數
nrows = table.nrows  # 獲取sheet1頁的行數
colsvalue = table.col_values(2)  # 讀取第3列（索引從0開始）的值存在變數"colsvalue"中
cols2=colsvalue[1:]   # 將去除第1個值後的其他元素存到新的變數"cols2"中
list1 = []
list2 = []

# 法一遍歷
for n in cols2:
      if int(n) > 
 4000:
        list1.append(n)
print("選出薪水高於4000的所有員工：",list1)

# # 法二遍歷
# for i in colsvalue[1:]:
#     if i >= 4000:
#         list2.append(i)
# print("選出薪水高於4000的所有員工：",list2)

one_count=cols2.count(3000)  # 統計3000在clos2中出現的次數
print("3000在cols2中出現的次數是：",one_count)

repet_salary={}   # 定義一個空的字典
for n in cols2:
    if 
 n not in repet_salary.keys():
        repet_salary[n]=cols2.count(n)
print("未經過排序的不同層次薪水及其重複次數是：", repet_salary)   # 根據表中薪水出現的次數進行統計，未進行排序
print("未經過排序的不同層次薪水重複次數排名前三的是：" ,Counter(repet_salary).most_common(3))

sort_count=sorted(Counter(repet_salary).most_common())
print("按薪水進行排序，並統計重複次數：",sort_count)
sort_salary=sorted(repet_salary)
print("按薪水進行排序，不統計重複次數：",sort_salary)
sort_list=sorted(repet_salary.items(), key=operator.itemgetter(1)) # 將repet_salary按第二個元素（重複次數）進行排序
print("按薪水重複次數進行排序後sort_list是：",sort_list)
print(type(sort_list))
result=[]
for item in sort_list[::-1]: # sort_list[::-1] 將sort_list裡的元素倒敘排列
    result.append((item[0]))
print("不同層次的薪水按重複次數從高到低進行排列：" , result)

執行結果如下：
在這裡插入圖片描述

Excel 檔案資料讀取和篩選

需求：已知一個excel 表中的"Sheet1"中，有id, name, salary 3列的內容，要求將薪水重複次數最多的按從高到低進行排序 #coding=utf-8 import xlrd from collections import Counter import opera

超大資料量的xlsx格式的excel檔案的讀取和解析，解決了POI方式的記憶體溢位和效能問題

在之前的博文《POI讀取並解析xlsx格式的excel檔案》中，在小資料量的情況下是可以輕鬆愉快的處理的，但是當excel檔案的資料量達到百萬級的時候， InputStream is = files[i].getInputStream(); XSSFWorkbook

Python使用pandas讀取Excel檔案資料和預處理小案例

假設有Excel檔案data.xlsx，其中內容為現在需要將這個Excel檔案中的資料讀入pandas，並且在後續的處理中不關心ID列，還需要把sex列的female替換為1，把sex列的male替換為0。本文演示有關的幾個操作。（1）匯入pandas模組 >>> import p

VBA下彈框開啟excel檔案並讀取資料

Sub LoadExcelData() Dim wkbk As Workbook '定義一個工作薄 Dim myFileName As String '定義要讀取的檔案路徑 Dim dataRow As Integer '定義資料的行 D

SqlServer表和Excel檔案資料相互複製方法

SqlServer資料表和Excel檔案之間進行資料互動是很常見的，除了資料庫自帶的“匯入資料”和“匯出資料”功能可以實現兩者之間的資料互動外，還可以直接通過複製的方式進行資料互動。資料庫UserI

使用python讀取excel檔案資料

# -*- coding : UTF-8 -*- import xlrd class OpenExl(): #初始化exl檔案，by_index表示第幾個工作表單，預設值為0。 def __init__(self, exc_file, by_index = 0): # 開啟檔

C#讀取Excel檔案資料

相當簡單,Excel就像資料庫,每個Sheet就是一個Table. Microsoft.Jet.OLEDB驅動.之後是DataReader迴圈,或DataSet處理都非常簡單. #region set connectionstring strConn = @"Provide

springMVC從上傳的Excel檔案中讀取資料

package com.jun.util; import java.io.File; import java.io.FileInputStream; import java.io.IOException; import java.io.InputStream; import java.util.Arr

java使用POI實現excel檔案的讀取，相容字尾名xls和xlsx

首先，引入所需的jar包：如果是maven管理專案的jar包，只需在pom.xml中加上：  <dependency>

java實現json檔案的讀取和解析

<dependency> <groupId>commons-io</groupId> <artifactId>commons-io</artifactId>

python包-numpy資料讀取和儲存（二）

目錄 0.為什麼要使用numpy儲存資料 1.儲存為二進位制檔案(.npy/.npz)並讀取 numpy.save和numpy.load numpy.savez numpy.savez_compressed 2.儲存到文字檔案 numpy.savetxt nump

kitti LIDAR點雲二進位制檔案的讀取和顯示

import numpy as np import mayavi.mlab pointcloud = np.fromfile(str("000010.bin"), dtype=np.float32, count=-1).reshape([-1,4]) print(poin

Appium資料配置-Yaml資料讀取和轉換（2）

背景 Appium裡面的capability檔案在遇到不同裝置或測試不同軟體時需要手動修改，此時直接在程式碼內修改引數，顯然是可不取的，故使用Yaml來配置相關引數，自動化指令碼直接呼叫對應的引數即可。此外Yaml語言是一種通用的資料序列化格式。 Yaml語法規則如下：大小寫敏感

php使用phpexcel類操作excel檔案資料

php使用phpexcel類操作excel檔案資料首先下載phpexcel git地址：https://github.com/PHPOffice/PHPExcel/releases 這裡下載了1.8.1.zip 解壓之後進入目錄，Classes目錄，複製PHPExcel.php和

c++檔案的讀取和寫入

ofstream是從記憶體到硬碟，ifstream是從硬碟到記憶體，其實所謂的流緩衝就是記憶體空間在C++中，有一個stream這個類，所有的I/O都以這個“流”類為基礎的，包括我們要認識的檔案I/O. stream這個類有兩個重要的運算子： 1、插入器(<<)

java poi excel關於資料碰撞和excel資料追加

package excel; import jxl.Cell; import jxl.CellType; import jxl.Sheet; import jxl.Workbook; import jxl.write.Label; import jxl.write.WritableWorkbo

TensorFlow走過的坑之---資料讀取和tf中batch的使用方法

首先介紹資料讀取問題，現在TensorFlow官方推薦的資料讀取方法是使用tf.data.Dataset，具體的細節不在這裡贅述，看官方文件更清楚，這裡主要記錄一下官方文件沒有提到的坑，以示"後人"。因為是記錄踩過的坑，所以行文混亂，見諒。 I 問題背景不感興趣的可跳過此節。最近在研究ENAS的程式

【C#】C# Excel表資料讀取

using System; using System.Data; using System.Windows.Forms; using System.Data.OleDb; using System.IO; namespace TestExerciser { class ExcelDataRea

python建立Excel檔案資料的方法

# -*- coding: utf-8 -*-# @Time : 2018/12/6 17:10# @Author : suchao# @Disc: : 生成10000條Excel資料# @File : 1000data.py# @Software: PyCharmimport xlrd ,

tensorflow資料讀取和處理

檔案匹配 ["file0", "file1"]或[("file%d" % i) for i in range(2)] files = tf.train.match_filenames_once("C:/path/to/data.tfrecords-*") 讀取

Excel 檔案資料讀取和篩選

相關推薦