【DA】SciPy的統計模組：scipy.stats

阿新 • • 發佈：2021-01-26

技術標籤：DA scipy

SciPy的統計模組是scipy.stats，其中有一個類是連續分佈的實現，一個類是離散分佈的實現。此外，該模組中還有很多用於統計檢驗的函式。

# 匯入包
from scipy import stats
import matplotlib.pyplot as plt

# 1.使用`scipy.stats`包按正態分佈生成隨機數
generated = stats.norm.rvs(size=900)

# 2.用正態分佈去擬合生成的資料，得到其均值和標準差
print("Mean", "Std", stats.norm.fit( 
generated)) 
# Mean Std (-0.027757190138192445, 0.9967355589828278)

# 3.偏度（skewness）描述的是概率分佈的偏斜（非對稱）程度。我們來做一個偏度檢驗。
# 該檢驗有兩個返回值，其中第二個返回值為p-value，即觀察到的資料集服從正態分佈的概率，取值範圍為0~1。
print("Skewtest", "pvalue", stats.skewtest(generated))
# Skewtest pvalue SkewtestResult(statistic=-0.4227102833216121, pvalue=0.6725066519280437) 

# 因此，該資料集有67%的概率服從正態分佈。

# 4.峰度（kurtosis）描述的是概率分佈曲線的陡峭程度。我們來做一個峰度檢驗。該檢驗與
# 偏度檢驗類似，當然這裡是針對峰度。
print("Kurtosistest", "pvalue", stats.kurtosistest(generated))
# Kurtosistest pvalue KurtosistestResult(statistic=0.6422156432448409, pvalue=0.5207331773445296)

# 5.正態性檢驗（normality test）可以檢查資料集服從正態分佈的程度。我們來做一個正態性 

# 檢驗。該檢驗同樣有兩個返回值，其中第二個返回值為p-value。
print("Normaltest", "pvalue", stats.normaltest(generated))
# Normaltest pvalue NormaltestResult(statistic=0.5911249160542223, pvalue=0.7441129374456706)

# 6.使用SciPy我們可以很方便地得到資料所在的區段中某一百分比處的數值
print("95 percentile", stats.scoreatpercentile(generated, 95)) # 95 percentile 1.6419459784929902 

# 7.將前一步反過來，我們也可以從數值1出發找到對應的百分比
print("Percentile at 1", stats.percentileofscore(generated, 1)) # Percentile at 1 84.44444444444444

# 8.使用Matplotlib繪製生成資料的分佈直方圖。
plt.hist(generated)
plt.show()

在這裡插入圖片描述
我們經常會遇到兩組資料樣本，它們可能來自不同的實驗，但互相有一些關聯。統計檢驗可以進行樣本比對。scipy.stats模組中已經實現了部分統計檢驗。

另一種筆者喜歡的統計檢驗是scikits.statsmodels.stattools中的Jarque-Bera正態性檢驗。SciKits是Python的小型實驗工具包，它並不是SciPy的一部分。此外還有pandas，它是scikits.statsmodels 的分支。

【DA】SciPy的統計模組：scipy.stats

技術標籤：DAscipy SciPy的統計模組是scipy.stats，其中有一個類是連續分佈的實現，一個類是離散分佈的實現。此外，該模組中還有很多用於統計檢驗的函式。

【Python】Flask日誌記錄：將日誌輸出到多個檔案、顯示行號、模組名稱、日誌級別等

技術標籤：DEVOPS 參考文章：Flask使用日誌記錄到檔案示例-部落格園 flask的日誌記錄需要用到python標準庫logging的支援。

【python】解決報錯：沒有sklearn.cross_validation模組，sklearn.model_selection模組的

技術標籤：python 問題 Python指令碼報錯 ModuleNotFoundError: No module named ‘sklearn.cross_validation

【MySQL】MySQL技術內幕：深入理解 InnoDB 和 MyISAM 儲存引擎

文章目錄引言1. InnoDB2. MyISAM3. InnoDB和MyISAM儲存引擎的區別3.1兩種儲存引擎的區別小結3.2聚簇索引和非聚簇索引原理4. 小結

【vue】elementUI報錯：_self.$scopedSlots.default is not a function

Vue會盡可能高效地渲染元素，通常會複用已有元素而不是從頭開始渲染。這樣也不總是符合實際需求，所以 Vue 為你提供了一種方式來表達“這兩個元素是完全獨立的，不要複用它們”。只需新增一個具有唯一值的

【轉】Spring 官方宣佈：新的 Spring OAuth 2.0 授權伺服器釋出第一個版本

　　原文地址：https://www.oschina.net/news/118103/new-spring-oauth-server 　　原文作者：碼農小胖哥

【分散式】Zookeeper原始碼分析：Jute序列化

概要 Zookeeper的客戶端和服務端進行網路通訊實現資料傳輸使用了序列化元件Jute，它最初是Hadoop中預設的序列化元件（Record IO）中的序列化元件，後來Hadoop從0.21.0版本開始廢棄了Record IO，而使用Avro這個序列化

轉：【MySQL】連線錯誤過多：is blocked because of many connection errors; unblock with 'mysqladmin flush-host

轉：https://blog.csdn.net/ningjiebing/article/details/102408136 錯誤原因同一個ip在短時間內產生太多（超過mysql資料庫max_connection_errors的最大值）中斷的資料庫連線而導致的阻塞；

【S004】盈時策略：甲醇策略，年化收益170%，近八成勝率

關注公眾號：盈時策略盈虧曲線圖策略基本資訊策略名稱：YS_MA_60min_S004 (甲醇)

【S005】盈時策略：甲醇策略，年化收益近200%，盈虧比近2.00

關注公眾號：盈時策略盈虧曲線圖策略基本資訊策略名稱：YS_MA_60min_S005 (甲醇)

【Canal】【MySQL】解密阿里Canal ：（一）Canal工作原理

我們先回顧一下，傳統MySQL主從複製工作原理： 1、現在有一個客戶端，往主庫（Master）中寫入一條資料；

【JPA】【概念】JPA概念解析：CascadeType（各種級聯操作）詳解

轉《JPA實體關係對映：@ManyToMany多對多關係、@OneToMany@ManyToOne一對多多對一關係和@OneToOne的深度例項解析》

【Mysql】 Mysql 統計資料庫大小及資訊

1：使用以下命令查詢指定資料庫容量大小： where table_schema=\'mysql\'#mysql是資料庫名稱，將mysql修改自己想要查詢的資料庫即可。

【譯】關於Rust模組的清晰解釋

原文連結: http://www.sheshbabu.com/posts/rust-module-system/ 原文標題: Clear explanation of Rust’s module system

【Python3】xlwt/xlrd模組讀取和新建excel並生成直方圖

此文轉載自：https://blog.csdn.net/weixin_52855865/article/details/110109460#commentBox Python-Excel處理

【BUUCTF】WEB篇1：[HCTF 2018]WarmUp

來源：BUUCTF 進入頁面： F12檢視原始碼： <!DOCTYPE html> <html lang=\"en\"> <head>

【Linux】系統監控工具：iotop

[root@wallet01 ~]# python -V Python 2.7.5 [root@wallet01 ~]# tar xvf iotop-0.6.tar.gz [root@wallet01 ~]# cd iotop-0.6

【專題】Python加密模組hashlib的使用

技術標籤：Python基礎與進階python Python加密模組hashlib的使用一、加密演算法介紹二、MD5加密演算法三、sha1加密演算法四、加密演算法應用場景五、小結

【LeetCode】連結串列問題：雙指標或回溯

技術標籤：# LeetCodeleetCode 雙指標或回溯對於連結串列中要拿到後幾個元素的問題，一定是雙指標對於連結串列前幾個元素要使用後面的元素，那麼可以遞歸回溯

【LeetCode】連結串列問題：虛擬頭節點

技術標籤：# LeetCodeleetcode演算法虛擬頭節點對於有刪除問題，一定要設定虛擬頭節點

【DA】SciPy的統計模組：scipy.stats

相關推薦