R-sampe & seq函式學習[轉載]
阿新 • • 發佈:2018-12-26
轉自:https://blog.csdn.net/u012108367/article/details/69913280
https://blog.csdn.net/qq_33547243/article/details/79054112
1.R中的sample函式
在醫學統計學或者流行病學裡的現場調查、樣本選擇經常會提到一個詞:隨機抽樣。
隨機抽樣是為了保證各比較組之間均衡性的一個很重要的方法。那麼今天介紹的第一個函式就是用於抽樣的函式sample:
> x=1:10 > sample(x) [1] 8 9 5 2 3 10 6 1 4 7 #隨機抽樣,預設是不放回抽樣> sample(x,size = 5) [1] 9 4 5 6 2 #size引數,規定抽樣個數 > sample(x,size = 5) [1] 4 3 1 5 9 #這次抽樣結果和上次不同,證明是隨機的 > sample(x,replace = T) [1] 5 5 8 8 7 3 3 7 6 2 #引數是否是放回抽樣。
上述抽樣過程中,每個元素被抽取的概率相等,稱為隨機抽樣。
有時候我們的抽取元素的概率未必相等(如常見的二項分佈概率問題),此時我們需要新增一個引數prob,也就是“probability”(概率)的縮寫。假設一名醫生給患者做某手術成功的概率是80%,那麼現在他給20例病人做手術,可能有哪幾次是成功的呢?程式碼如下:
這些程式碼告訴我們,對每一個元素都可以給定一個概率,且每個概率是獨立的,即在引數prob中,不一定所有元素的概率加起來等於1,它只代表某元素被抽取的概率而已。