1. 程式人生 > 實用技巧 >商務與經濟統計第三章 數值方法

商務與經濟統計第三章 數值方法

變異程度變數:即離散程度的度量

1 : 極差:最簡單的變異程度度量

極差=最大值-最小值

2 : 四分位數 間距 第三四分位數Q3與第一四分位數Q的差值,也就是說,四分位數間距是中 間50%資料的極差。

IQR=Q3-Q1

3 :方差

方差=∑(觀測值-平均值)2/N

4:標準差:方差的平方根

5:標準差係數 -1 0 1 絕對值越接近1表示離散程度越小

標準差係數=(標準差/平均數)*100%

6:形態度量

樣本偏移程度計算

import pandas as pd
x = [53, 61, 49, 66, 78, 47]
s = pd.Series(x)
print(s.skew())

7:相對位置的度量值能幫我們確定一個特殊的數值距平均數有多遠

z=(樣本值-樣本平均數)/標準差

--------------------------

切比雪夫定理:與平均數的距離在z個標準差之內的資料值所佔的比例至少為(1-1/z2),其中z是大於1的實數。

切比雪夫定理可應用於任何資料集,並能夠估計與平均數的距離在一定個數的標準差之間內的最少數量的資料值。如果已知資料集近似呈現鍾型分佈,則有更多的資料值在範圍之內。

異常值檢測方法:

下限=Q1-1.5*IQR。 IQR=Q3-Q1

上限=Q1+1.5*IQR

用於第一和第三四分位數以及四分位數間距確定一場值的方法,不必與依據z-分數小於-3或大於3的方法相同。可以選用一種或來兩種方法。