python常用統計量的計算

阿新 • • 發佈：2019-01-08

# -*- coding: utf-8 -*-
"""
Created on Tue Jun 27 09:19:25 2017

@author: yunjinqi 
 
E-mail:[email protected] 
 
Differentiate yourself in the world from anyone else.
"""
import pandas as pd  
import scipy.stats as sts  
import numpy as np
#葛洲壩
df=pd.read_excel('C:/Users/HXWD/Desktop/600068.xlsx')  
df.head()  
############################################計算資料的基本統計量：均值，方差，偏度，峰度等  
index=list(df.columns)
stock068=[]
for i in range(1,4):
    scores=np.array(df.ix[::,i])    
    pe=df.ix[::,i].describe()
    pe.name='葛洲壩'+index[i]
    print(pe)
    pe['偏度']=sts.skew(scores)
    pe['峰度']=sts.kurtosis(scores)
    stock068.append(pe)
stock068=pd.DataFrame(stock068).T
print (stock068)
#海瀾之家
df=pd.read_excel('C:/Users/HXWD/Desktop/600398.xlsx')  
df.head()  
############################################計算資料的基本統計量：均值，方差，偏度，峰度等  
index=list(df.columns)
stock398=[]
for i in range(1,4):
    scores=np.array(df.ix[::,i])    
    pe=df.ix[::,i].describe()
    pe.name='海瀾之家'+index[i]
    print(pe)
    pe['偏度']=sts.skew(scores)
    pe['峰度']=sts.kurtosis(scores)
    stock398.append(pe)
stock398=pd.DataFrame(stock398).T
print (stock398)
#data=pd.concat([stock068,stock398],axis=1, join_axes=[data.index])
data=stock068.join(stock398)
print (data)
data.to_csv('統計.csv')

#常用統計量的計算

#2018.01.16重新回來看峰度的計算，發現sts.kurtosis(），df.kurt()兩個計算均存在某些問題，與eviews的描述性統計結果不一致，可能是計算口徑不同。借用一篇別人編寫純程式碼計算的公式，得到了和eviews一樣的結果，程式碼如下

import math
def calc(data):
    n = len(data)
    niu = 0.0
    niu2 = 0.0
    niu3 = 0.0
    for a in data:
        niu += a
        niu2 += a**2
        niu3 += a**3
    niu/= n   #這是求E(X)
    niu2 /= n #這是E(X^2)
    niu3 /= n #這是E(X^3)
    sigma = math.sqrt(niu2 - niu*niu) #這是D（X）的開方，標準差
    return [niu,sigma,niu3] #返回[E（X）,標準差，E（X^3）]

def calc_stat(data):
    [niu,sigma,niu3] = calc(data)
    n = len(data)
    niu4 = 0.0
    for a in data:
        a -= niu
        niu4 += a ** 4
    niu4 /= n   
    skew = (niu3 - 3*niu*sigma**2 - niu**3)/(sigma**3)
    kurt =  niu4/(sigma**4)
    return [niu,sigma,skew,kurt] #返回了均值，標準差，偏度，峰度

建議計算峰度的程式使用下面的程式碼

python常用統計量的計算

# -*- coding: utf-8 -*- """ Created on Tue Jun 27 09:19:25 2017 @author: yunjinqi E-mail:[email protected] Differentiate your

時間序列分析（2）Python-基本統計量的計算

# -*- coding: utf-8 -*- """ Created on Fri Feb 17 11:30:57 2017 @author: yunjinqi E-mail:[email

Python常用變量處理手記

gpo 拼接字符串 body https class page tuple python pytho 拼接字符串和數字時，應先把數字做轉換如，bytes(page) 再做拼接：str+page 使用list和tuple https://www.liaoxuefeng.co

流式資料中的數學統計量計算

在科技飛速發展的今天，每天都會產生大量新資料，例如銀行交易記錄，衛星飛行記錄，網頁點選資訊，使用者日誌等。為了充分利用這些資料，我們需要對資料進行分析。在資料分析領域，很重要的一塊內容是流式資料分析。流式資料，也即資料是實時到達的，無法一次性獲得所有資料。通常情

Matlab中常用的統計量函式

轉自網易部落格 wstbrkwong Matlab中常用的統計量函式 13個統計量：最大最小值及其所在位置，均值，幾何平均數，中位數，眾數，極差，方差，標準差，偏斜度，峰度，協方差，相關係數。 %% 1.求最大最小值及其所在位置

23、python對資料進行求和、方差、平均值等基本統計指標計算

基本統計分析：描述性統計分析，用來概括失誤整體狀況以及事物間聯絡，以便發現其內在的規律的統計分析方法常用的統計指標：計數求和平均值方差標準差 1 函式描述性統計函式： describe（）常用的統計函式：統計函式註釋 s

python中關於統計相關計算的庫和函式

一、python庫下載及安裝下載地址為http://www.lfd.uci.edu/~gohlke/pythonlibs/ 如下所示：下拉此頁，可發現該頁為python庫的下載頁面：

Python語言程式設計（MOOC崇天）第六章組合資料型別學習筆記（基本統計值計算+文字詞頻統計）

複習：今日內容：組合資料型別集合型別及操作：集合型別的定義：非可變的資料型別：整數、浮點、元組、負數、字串型別可變的資料型別：列表list和字典dict。所以看不到集合中有列表、{[ ]} 就算是set([1

R語言︱基本函式、統計量、常用操作函式

先言：R語言常用介面操作幫助：help(nnet) = ?nnet =??nnet 清除命令框中所有顯示內容：Ctrl+L 清除R空間中記憶體變數：rm(list=ls())、gc() 獲取或者設

python常用模塊

sin info app ans tro apple mozilla pre pytho urllib 1. urllib.urlopen() 打開網頁 from urllib import request import json response = request.

Python常用的文件讀寫操作和字符串操作

dir info load char 編碼 lines resolve values ror 文件讀寫操作 fileUtils.py # -*- coding: utf-8 -*- import os def getFileList(dir, fileList=[]):

【python的變量，輸入輸出，判斷，循環】

-- 聲明變量 sta += 區分 object pass bin 數字一、python的基礎語法和規則 1.變量 ①.變量的命名規則語法：（下劃線或字母）+（任意數目的字母、數字或下劃線）變量名必須以下劃線或字母開頭，而後面接任意數目的字母、數字或下劃線

Python常用端口掃描

ket end tcp sock try rac iso finally error from socket import *import sys host=sys.argv[1]service={‘21‘:‘FTP‘,‘23‘:‘Telnet‘,‘25‘:‘SMTP‘,‘

Python - 關於Python的變量

python variable Python的變量是動態的，不需要預先申明，當賦值時自動創建變量，並且Python變量存儲的是對象的引用（非變量本身）。Python變量的命名規則與C語言相似，並且在日常使用中一般會遵循以下一些規則：A. 一般不以單下劃線“_”開頭，因為以單下劃線開頭的變量不能被fro

python 常用的模塊(base64)轉

mlu eba 轉換方法查表字符串 cookie bcd ace 如果 Base64是一種用64個字符來表示任意二進制數據的方法。用記事本打開exe、jpg、pdf這些文件時，我們都會看到一大堆亂碼，因為二進制文件包含很多無法顯示和打印的字符，所以，如果要讓記事本這樣

python基礎---變量

python變量變量1、變量的特征把程序運算的中間結果臨時存到內存裏，以備後面的代碼繼續調用 age=18 #定義一個變量定義一個變量有三個特征：id：id(age) #變量的ID號，就是此變量的值在內存中的位置type：type(age) #變量的數據類型value：age #變

Python Day05 python 環境變量和import模塊導入

__file__ end os.path app abs bsp 方法實現末尾 1.定義模塊：本質就是.py結尾的文件（邏輯上組織python代碼）模塊的本質就是實現一個功能文件名就是模塊名稱包：一個有__init__.py的文件夾；用來存放

python的變量

不同變量名執行 pre soft int 數據過程沒有變量用來存儲數據，可以是數字也可以是其它類型。定義變量的格式必須是英文、數字和"_"下劃線的組合，不能以數字開頭。不能以關鍵字做變量名。 a = 1 定義變量a 是一個整數。 b=‘pytho

Python常用庫

當前 mtime localtime 數據同時標準時區 pick import A .標準庫， time datetime 兩個標準庫 1.time 與 datetime 1)時間戳 2)格式化時間 3）元祖（struct_time）共九個元素，t

Python 常用函數Time

class ges 默認一個結構化類型 %d .cn 夏令時時間戳(timestamp)：通常來說，時間戳表示的是從1970年1月1日00:00:00開始按秒計算的偏移量。我們運行“type(time.time())”，返回的是float類型。格式化的時間字符串

python常用統計量的計算

相關推薦