matlab第十二課:統計
阿新 • • 發佈:2018-11-17
目標:
- 統計
統計
概述:
- 資料的科學
- 涉及資料的收集,分析,解釋,演示和組織
統計的主要方法:
- 描述性統計
- 推理統計
一、推理統計
數值模式和圖形方法查詢模式,總結資料集中的資訊
Mean, Median, Mode, and Quartile(四分位數):
Range and Interquartile Range
Variance and Standard Deviation:
Figures Are Always More Powerful:
x = 1:14; freqy = [1 0 1 0 4 0 1 0 3 1 0 0 1 1]; subplot(1,3,1); bar(x,freqy); xlim([0 15]); subplot(1,3,2); area(x,freqy); xlim([0 15]); subplot(1,3,3); stem(x,freqy); xlim([0 15]);
Boxplot:
每個位置從左往右分別代表最小值、下四分位點、中位數、上四分位點和最大值。
marks = [80 81 81 84 88 92 92 94 96 97];
boxplot(marks)
prctile(marks, [25 50 75])
Skewness: skewness()
X = randn([10 3])*3; X(X(:,1)<0, 1) = 0; X(X(:,3)>0, 3) = 0; boxplot(X, {'Right-skewed', 'Symmetric', 'Left-skewed'}); y = skewness(X) y = 1.0487 0.2193 -1.5381
Kurtosis(峰態):
- 分佈平坦度的一種度量
- 正態分佈的峰度為零。
- 正峰度:更陡峭的峰
- 負峰度:更平坦的峰
二、描述性統計
使用樣本資料進行估計、決策和預測的方法
Statistical Hypothesis Testing(統計假設檢驗):
利用資料進行決策的一種方法
例如:我在這個班上能拿到A級嗎?
其中H0是空假設,H1是可選擇假設。
Hypothesis Testing Procedure(假設檢驗程式):
- 為假設檢驗確定概率,比如0.95
- 95%是H0的置信區間
- 檢查你的分數是否落入區間
t-test Example:
load stockreturns;
x1 = stocks(:,3);
x2 = stocks(:,10);
boxplot([x1, x2], {'3', '10'});
[h,p] = ttest2(x1, x2)
h =
1
p =
0.0423
Two-tailed Significance Test:
One-tailed Significance Test:
Common Hypothesis Tests: