Pandas讀取excel資料——pearson相關性分析

阿新 • • 發佈：2018-11-11

利用Pandas和tushare進行一個簡單的資料讀取和分析

一丶Pandas的DataFrame操作方法

一個表格型資料，提供列名和不同的值，以及索引值

通過下面程式碼記錄一些DataFrame的方法

from pandas import Series,DataFrame
#一個字典資料
data={'nike':['hello','world','baby','love'],
     'year':[2000,1526,11616,123],
     'name':['bob','lucy','amy','andy']}
#將字典/列表 資料轉化為DataFrame 

d=DataFrame(data)
print(d)
#改變資料的輸出順序，按列的形式
print(DataFame(data),columns=['name','year','nike'])
#改變其輸出的索引名(按abcd索引而不是0123)
print(DataFrame(data),columns=['name','year','nike'],index=['a','b','c','d'])
#新增一列則該列全部值為21
d['number']=21 
#新增一列用Series賦值
d1=Series([1,2,3,4])
d['number']=d1
d2=d.T#資料轉置

二丶資料抽取和儲存分析

這裡用到了一個庫tushare，裡面有很多的資料，連結地址為：
http://tushare.org/trading.html
我們從這裡面抽取了浦發銀行和廣大銀行的資料，然後儲存和分析其相關性

import matplotlib.pyplot as plt
import numpy as np
import tushare as ts
from pandas import DataFrame,Series

s_pf='600000'#浦發銀行股票程式碼
s_gd='601818'#光大銀行股票程式碼
sdate='2017-01-01'#資料獲取開始日期
edate='2017-12-31'#資料獲取結束日期 

df_pf=ts.get_h_data(s_pf,start=sdate,end=edate).sort_index(axis=0,ascending=True)#豎著排序
df_gd=ts.get_h_data(s_gd,start=sdate,end=edate).sort_index(axis=0,ascending=True)#豎著排序
#將兩個資料整合到一起
df=pd.concat([df_pf.close,df_gd.close],axis=1,keys=['pf_close','gd_close'])
#填充資料
df.ffill(axis=0,inplace=True)
#儲存資料
df.to_csv('pf_gd.csv')

#然後對資料進行分析
corre=df.corr(method='pearson',periods=1)#方法選擇person相關性
print(corre)
plt.plot(figsize=(20,12))
plt.show()

輸出結果：

相關性接近0.7

這裡寫圖片描述

Pandas讀取excel資料——pearson相關性分析

利用Pandas和tushare進行一個簡單的資料讀取和分析一丶Pandas的DataFrame操作方法一個表格型資料，提供列名和不同的值，以及索引值通過下面程式碼記錄一些DataFrame的方法 from pandas import Series,DataFram

pandas讀取20W資料excel，每999行生成一個查詢sql語句

前言工作中遇到一個小問題，Oralce資料庫的查詢是不能大於1000條in查詢的，所以需要對檔案進行切割。資料來源是20w的excel資料，於是想到用pandas對其進行讀取，然後每998行生成一個新的sql檔案。程式碼實現 # coding = utf-8 """ @

pandas讀取Excel檔案，以0開頭的資料，出現數據缺失

這裡以從深交所現在的日行情資料檔案為例，格式為xlsx 直接使用df = pd.read_excel(os.getcwd() + os.sep + 'stock.xlsx')讀取檔案時，證券程式碼被轉換為數字（000001 =>1），0被捨去，導致不正確。

Python使用pandas讀取Excel檔案資料和預處理小案例

假設有Excel檔案data.xlsx，其中內容為現在需要將這個Excel檔案中的資料讀入pandas，並且在後續的處理中不關心ID列，還需要把sex列的female替換為1，把sex列的male替換為0。本文演示有關的幾個操作。（1）匯入pandas模組 >>> import p

機器學習之數據預處理，Pandas讀取excel數據

修改 ould text 形式參數 indicate 索引 ive XP url Python讀寫excel的工具庫很多，比如最耳熟能詳的xlrd、xlwt，xlutils，openpyxl等。其中xlrd和xlwt庫通常配合使用，一個用於讀，一個用於寫excel。xlut

【兩行命令】R語言讀取excel資料

安裝庫安裝xlsx install.packages("xlsx") 使用 library(xlsx) ray = read.xlsx('D:/Code/R/Data in Excel/Chapter 8/gamma-ray.xls',1) 後面的引數，第一個放

8、利用xlrd讀取excel資料

在同一個sheet表中可以有多個表，表與表之間用空格來隔離，遇到空格，則認為這個表結束了。程式碼如下： import xlrdfile_path = "C:/Users/Administrator/Desktop/python/excel/1.xlsx"sheet_name = '表2't

10、利用POI讀取excel資料

自動化指令碼和資料是分離的，這裡是通過POI來實現excel的資料讀取的。以下實現的是1個excel sheet表中可以分作多個表，判斷一個表是否結束是根據空格來的。程式碼為： package common;import java.util.ArrayList;import java.

讀取Excel資料根據經緯度調取阿里雲API獲取地址名稱 + 柱形圖轉化顯示實戰

1、需求：前兩天接到boss給我的一個任務，需要根據經緯度資訊統計省份分佈，boss給了我一張excel，包含資料包括：經度、緯度、使用次數，想要我統計每一個省份的次數之後 2、解決思路：通過檔案讀取方式獲得對應經度、緯度、使用次數資料，，然後呼叫阿里雲或者高德地圖的API就可

Pandas 讀取Excel並設定n列做MultiIndex

Pandas 讀取Excel並設定n列做MultiIndex #讀取資料 import pandas as pd import numpy as np import glob,os path=r'e:\tj\month\fx1809' file=glob.glob(os.path.join(pa

java讀取Excel資料

Java讀取Excel中的資料一下載匯入java.jxl.jar 二新建一個Excel表格並且在裡面有內容（記得另存為97-2003版本，否則會出現 Unable to recognize OLE stream 異常）三編輯程式碼如下如果有什麼寫的

[Pandas]利用Pandas處理excel資料

Python 處理excel的第三包有很多，比如XlsxWriter、xlrd&xlwt、OpenPyXL、Microsoft Excel API等，最後綜合考慮選用了Pandas。 Pandas 是基於NumPy 的一種工具，該工具是為了解決資料分析任務而建立的。Pandas 納入了大量

Python利用pandas處理Excel資料的應用

Python利用pandas處理Excel資料的應用最近迷上了高效處理資料的pandas，其實這個是用來做資料分析的，如果你是做大資料分析和測試的，那麼這個是非常的有用的！！但是其實我們平時在做自動化測試的時候，如

Python模組-xlrd模組讀取Excel資料

xlrd模組 xlrd模組說明 xlrd是一個庫，用於從Excel檔案中讀取資料和格式化資訊，無論它們是.xls還是.xlsx檔案 xlrd方法有很多種，這裡只說明常用的 xlrd.open_workbook Excel檔案讀取方法本文不涉及帶有公式和巨集的複雜Excel公式資料說明 https://

Python讀取Excel檔案並生成分析結果

筆者需要對存放在Excel裡的很多媒資檔案進行分析，這些節目的解析度有高清、標清之分，高清的節目名稱前面加上“HD-”，比如下面的“HD-護寶聯盟第一季”，標清的則直接是節目名稱，如“HD-護寶聯盟第一季”，這些節目可能分別屬於電視劇、電影、娛樂的欄目，每個節目有對應的時長（分鐘數），然後按欄目放在不同的sh

python讀取json格式檔案和用pandas讀取excel檔案

IT Xiao Ang Zai 9月30號版本：python3.7 程式設計軟體：sublime 一：python解析json資料 1.什麼是json： (1)JSON(JavaScript Object Notation) 是一種輕量級的資料交換格式。它

Java使用Poi讀取Excel資料(exor)

讀取Excel使用一個小工具exor exor是一個開源專案，封裝了一些poi讀取excel的操作，可以讀取excel資料並格式化為二維結構 xlsx和xls格式都可以讀取 exor的依賴：commons-collections4-4.2、poi-3.17、poi-oo

使用pandas讀取excel

本文為作者原創，未經允許不得擅自轉載。 Excel是微軟的經典之作，在日常工作中的資料整理、分析和視覺化方面，有其獨到的優勢，尤其在你熟練應用了函式和資料透視等高階功能之後，Excel可以大幅度提高你

C#(.net)讀取excel資料轉為datatable

#region 讀取Excel中的資料 /// <summary> /// 讀取Excel中的資料支援表頭(.xlsx) 不支援表頭(.xls) &

PHPExcel之讀取excel資料匯入資料庫

//讀取excel資料匯入到資料庫 public function d_video() { $res = $this->goods_import('./1.xlsx', 'xlsx');//讀取excel表中的資料 dump($res);

Pandas讀取excel資料——pearson相關性分析

一丶Pandas的DataFrame操作方法

二丶資料抽取和儲存分析

輸出結果：

相關推薦