利用python進行單邊T檢驗

阿新 • • 發佈：2018-12-19

可以利用 python 中的 scipy.stats.ttest_ind 做關於兩組資料的雙邊 t 檢驗，結果比較簡單。但是做大於或者小於的單邊檢測的時候需要做一些處理，才能得到正確的結果。

from scipy import stats
import numpy as np

A = np.array([ 0, 1, 2, 3, 4, 5, 6, 7, 8, 9])
B = np.array([ 0, 2, 5, 6, 8, 10, 13, 14, 17, 20])

很顯然，A的均值為4.5，B的均值為9.5. 為了檢測這種差異是否顯著，我們做個單邊的 t 檢驗，證實這種差異的顯著性。

這裡備擇假設應該為我們想要證明的假設，即 B>A.

所以，原假設和備擇假設分別設為：

$H0: A \geq B, H1: A < B$

現在我們呼叫 scipy.stats.ttest_ind(x, y) 函式，這個函式預設我們想驗證 x.mean()-y.mean() 這個假設。為了在計算的過程中得到正數，我們呼叫 stats.ttest_ind(B,A)，這裡設定方差不相等。

stats.ttest_ind(B,A,equal_var= False)

# 程式執行結果
Ttest_indResult(statistic=2.204452592164665, pvalue=0.04653783266614884)

根據 scipy.stats.ttest_ind(x, y) 文件的解釋，這是雙邊檢驗的結果。為了得到單邊檢驗的結果，需要將計算出來的 pvalue 除於2 取單邊的結果(這裡取閾值為0.05）。

$p/2 < alpha(0.05)$

所以這裡我們可以拒絕原假設，即接受備擇假設，A < B。

作為驗證，我們還可以根據自由度和置信區間（95%）查詢 t 值驗證結果是否正確。

$df = samplesize1 + samplesize2 - 2 = 10 + 10 -2 = 18$

通過在 t 分佈表上查詢，得到

$tcrit(df=18, confidencelevel = 95\%) = 1.734$

這裡 t > tcrit, 還是拒絕原假設。

利用python進行單邊T檢驗

可以利用 python 中的 scipy.stats.ttest_ind 做關於兩組資料的雙邊 t 檢驗，結果比較簡單。但是做大於或者小於的單邊檢測的時候需要做一些處理，才能得到正確的結果。 from scipy import stats import numpy as

利用python進行T檢驗

引入所需的包 from scipy import stats import numpy as np 注：ttest_1samp, ttest_ind, ttest_rel均進行雙側檢驗 H0:μ=μ0 H1:μ≠μ0 單樣本T檢驗-ttest_

利用python進行數據分析——histogram

python hist()DataFrame.hist(data, column=None, by=None, grid=True, xlabelsize=None, xrot=None, ylabelsize=None, yrot=None,ax=None, sharex=False, sharey=Fal

PYTHON學習（三）之利用python進行數據分析(1)---準備工作

-- 下載 rip 安裝包 png 要求 eight code 電腦　　學習一門語言就是不斷實踐，python是目前用於數據分析最流行的語言，我最近買了本書《利用python進行數據分析》（Wes McKinney著），還去圖書館借了本《Python數據分析基礎教程--N

利用Python進行圖片發送與接收的兩種方法---包含客戶端和服務器端代碼

list() tmp span 客戶端 time() failed pri ucc out 第一種方法 opencv、requests、flask 此方法比較耗費時間 600毫秒左右客戶端代碼 #coding:utf-8 import cv2 import json i

利用Python進行數據分析_Pandas_匯總和計算描述統計

描述行數 OS 進行 weight pytho col font gpo 申明：本系列文章是自己在學習《利用Python進行數據分析》這本書的過程中，為了方便後期自己鞏固知識而整理。利用Python進行數據分析_Pandas_匯總和計算描述統計

利用Python進行冒泡排序

odin 位置數組越界 span RR 結果 pri AS 最大 # -*- coding:utf-8 -*- ## 冒泡排序解析 """ 冒泡排序的必備知識：互換位置用temp臨時變量 a1 = 456 a2 = 123 temp = a1 a1 = a2 a2

利用Python進行數據分析——pandas入門

平均值標準 AR 找不到 recent 位置 index 操作基於利用Python進行數據分析——pandas入門基於NumPy建立的 from pandas importSeries,DataFrame,import pandas as pd 一、兩種數據

【Matplotlib】利用Python進行繪圖

官方文檔 ech subplot 表達式 str -m 多條 isp 字符串【Matplotlib】　　教程：https://morvanzhou.github.io/tutorials/data-manipulation/plt/ 　　官方文檔：https://m

《利用python進行數據分析》學習筆記--pandas(1)

索引 eight and dong 改變組成過濾 isnull 學習 pandas主要的兩個數據結構是：Series 和DataFrame 1、Series series 類似於一維數組，由索引+數據組成若不指定索引，則會自動創建0到N-1的整數型索引，可

分享《利用Python進行數據分析(第二版)》高清中文版PDF+英文版PDF+源代碼

pan http aid follow cee 下載書籍 ofo 利用《利用Python進行數據分析(第二版)》高清中文版PDF+英文版PDF+源代碼《利用Python進行數據分析(第二版)》【中文版和英文版】【高清完整版PDF】+【配套源代碼】《利用Python進行

《利用Python進行數據分析》(Wes McKinney).pdf高清版免費下載

eric 研討會為什麽元素 nand 層次第6章描述學習下載地址：網盤下載備用地址：網盤下載內容簡介 · · · · · ·【名人推薦】 “科學

分享《利用Python進行數據分析(第二版)》高清中文版PDF+高清英文版PDF+源代碼

mar cee nag 分享 bdb log 資料 cto 完整版資料下載：https://pan.baidu.com/s/1K3DjJ9S1S3AxpacEElNF9Q 《利用Python進行數據分析(第二版)》【中文版和英文版】【高清完整版PDF】+【配套源代碼】《利

《利用Python進行數據分析(第二版)》高清中文版PDF+高清英文版PDF+配套源代碼

ref 行數 watermark alt shadow href tps ado 經典資料下載：https://pan.baidu.com/s/1K3DjJ9S1S3AxpacEElNF9Q 更多最新的資料請見：http://blog.51cto.com/3215120

利用python進行資料分析（第二版） pdf下載

適讀人群：適合剛學Python的資料分析師或剛學資料科學以及科學計算的Python程式設計者。閱讀本書可以獲得一份關於在Python下操作、處理、清洗、規整資料集的完整說明。本書第二版針對Python 3.6進行了更新，並增加實際案例向你展示如何高效地解決一系列資料分析問題。你將在閱讀

《利用Python進行資料分析》學習記錄

第8章249頁原語句：party_counts = pd.crosstab(tips.day, tips.size) 現在的pandas似乎有個size屬性，就是計算資料的大小，而不會返回那一列具體的資料，比如這裡tips這個csv資料，其裡面包含一列size資料，現在來執行這句語句的話，

資料基礎---《利用Python進行資料分析·第2版》第12章 pandas高階應用

之前自己對於numpy和pandas是要用的時候東學一點西一點，直到看到《利用Python進行資料分析·第2版》，覺得只看這一篇就夠了。非常感謝原博主的翻譯和分享。前面的章節關注於不同型別的資料規整流程和NumPy、pandas與其它庫的特點。隨著時間的發展，pandas發展出了更多適

資料基礎---《利用Python進行資料分析·第2版》第6章資料載入、儲存與檔案格式

之前自己對於numpy和pandas是要用的時候東學一點西一點，直到看到《利用Python進行資料分析·第2版》，覺得只看這一篇就夠了。非常感謝原博主的翻譯和分享。訪問資料是使用本書所介紹的這些工具的第一步。我會著重介紹pandas的資料輸入與輸出，雖然別的庫中也有不少以此為目的的工具

資料基礎---《利用Python進行資料分析·第2版》第4章 NumPy基礎：陣列和向量計算

之前自己對於numpy和pandas是要用的時候東學一點西一點，直到看到《利用Python進行資料分析·第2版》，覺得只看這一篇就夠了。非常感謝原博主的翻譯和分享。 NumPy（Numerical Python的簡稱）是Python數值計算最重要的基礎包。大多數提供科學計算的包都是用Nu

資料基礎---《利用Python進行資料分析·第2版》第11章時間序列

之前自己對於numpy和pandas是要用的時候東學一點西一點，直到看到《利用Python進行資料分析·第2版》，覺得只看這一篇就夠了。非常感謝原博主的翻譯和分享。時間序列（time series）資料是一種重要的結構化資料形式，應用於多個領域，包括金融學、經濟學、生態學、神經科學、物

利用python進行單邊T檢驗

相關推薦