如何用R語言抽取出服從一般分佈的樣本

阿新 • • 發佈：2019-01-01

在實際情況中，我們經常會遇到要求生成服從某一分佈的隨機數的問題，下面我們就用R來生成這樣一個樣本。
首先，我們先來看如何生成服從均勻分佈的樣本，需要用到函式runif()，程式碼如下：

> runif(5)
[1] 0.09970285 0.49268793 0.56826709 0.77191564 0.33798831

如果要生成[0, 10]上的均勻分佈，程式碼如下：

> runif(5,0,10)
[1] 9.859786 8.692407 3.417506 2.696649 8.567304

類似地，在R語言中還可以用rnorm()生成服從正態分佈的樣本，用rexp()生成服從指數分佈的樣本，用rbeta()生成服從beta分佈的樣本，相同的還有rbinom()，rcauchy()，rchisq()，rf()，rgamma，rt()等一些常見的分佈。

如果要抽樣的總體的分佈沒有在R中被定義過，是一個一般的分佈，應該如何抽樣呢？

下面就介紹如何抽取服從一般分佈的樣本。
先給定一個分佈的分佈函式：

F(x)=⎧⎩⎨⎪⎪0x21x<00≤x<1x≥1

這是一個連續型分佈函式。

求出逆函式為：

F−1(x)=x√0≤x≤1

於是從該連續型分佈中抽取樣本的R程式碼如下：

> inv_F <- function(x) {
+ F <- sqrt(x)
+ return(F)
+ }
> x <- runif(10000)
> sam <- sapply(x,inv_F)
> plot(sam)

影象如下：
這裡寫圖片描述
從影象可以看出抽取的樣本服從該分佈。

下面介紹抽取服從離散型分佈的樣本：
分佈函式為：

F(x)=⎧⎩⎨⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪00.250.50.751x<−6−6≤x<−5−5≤x<−3−3≤x<1x≥1

求出逆函式為：

F−1(x)=⎧⎩⎨⎪⎪⎪⎪⎪⎪−6−5−310≤x≤0.250.25<x≤0.50.5<x≤0.750.75<x≤1

R程式碼如下：

> inv_F <- function(x) {
+ if(x >= 0 && x <= 0.25)
+ F <- -6
+ else if 
(x > 0.25 && x <= 0.5)
+ F <- -5
+ else if(x > 0.5 && x <= 0.75)
+ F <- -3
+ else if(x > 0.75 && x <= 1)
+ F <- 1
+ return(F)
+ }
> x <- runif(10000)
> sam <- sapply(x,inv_F)
> length(which(sam==-6))/10000
[1] 0.2513
> length(which(sam==-5))/10000
[1] 0.2502
> length(which(sam==-3))/10000
[1] 0.2496
> length(which(sam==1))/10000
[1] 0.2489

從結果可以看出抽取的樣本服從該分佈。

最後介紹抽取服從奇異型分佈的樣本：
分佈函式為：

F(x)=⎧⎩⎨⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪00.1250.250.3750.51−12e−(x+1)x<−6−6≤x<−5−5≤x<−3−3≤x<−2−2≤x<−1x≥−1

逆函式為：

F−1(x)=⎧⎩⎨⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪−6−5−3−2−1−ln(2−2x)0≤x≤0.1250.125<x≤0.250.25<x≤0.3750.275<x≤0.5x>0.5

R程式碼如下：

> inv_F <- function(x) {
+ if(x <= 0.125)
+ F <- -6
+ else if(x > 0.125 && x <= 0.25)
+ F <- -5
+ else if(x > 0.25 && x <= 0.375)
+ F <- -3
+ else if(x > 0.375 && x <= 0.5)
+ F <- -2
+ else if(x > 0.5)
+ F <- -1-log(2-2*x)
+ return(F)
+ }
> x <- runif(10000)
> sam <- sapply(x,inv_F)
> length(which(sam==-6))/10000
[1] 0.1225
> length(which(sam==-5))/10000
[1] 0.1272
> length(which(sam==-3))/10000
[1] 0.128
> length(which(sam==-2))/10000
[1] 0.1257
> plot(sam)

影象如下：

這裡寫圖片描述

從影象和輸出結果可以看出抽取的樣本服從該分佈。

如何用R語言抽取出服從一般分佈的樣本

在實際情況中，我們經常會遇到要求生成服從某一分佈的隨機數的問題，下面我們就用R來生成這樣一個樣本。首先，我們先來看如何生成服從均勻分佈的樣本，需要用到函式runif()，程式碼如下： > runif(5) [1] 0.09970285 0.492

用R語言隨機生成AR,MA,ARMA,ARIMA模型的命令，畫出acf，pacf圖

set.seed(10);x=rnorm(150)par(mfrow=c(1,2))#一行兩列，兩個圖ts.plot(x);acf(x)set.seed(101);x=NULL;for(i in 1:200)x=c(x,0.5-0.3*i+rnorm(1))#隨機產生數par

用c++語言實現出四則運算的題

using div style cin 隨機函數 color 地方 switch ase 設計思路 1.利用隨機函數隨機兩個兩位數 2.用其中一個數除以4取余函數 0 1,2,3 用switch語句分表代表加、減、乘、除。 3.輸出式子 4.利用for循環實現題的量增 5

用R語言分析與預測員工離職

在實驗室搬磚之後，繼續我們的kaggle資料分析之旅，這次資料也是答主在kaggle上選擇的比較火的一份關於人力資源的資料集，關注點在於員工離職的分析和預測，依然還是從資料讀取，資料預處理，EDA和機器學習建模這幾個部分開始進行，最後使用整合學習中比較火的random forest演算法來預

◮ R語言筆記(三): 二項分佈概率問題的求解

★這裡首先總體介紹一些統計學常用的R語言中的分佈函式：正態分佈函式：norm() 泊松分佈函式：pois() 指數分佈函式：exp() Gamma分佈函式：gamma() 均勻分佈函式：unif() ★二項分佈函式：binom()

用R語言進行分位數迴歸

非線性分位數迴歸這裡的非線性函式為Frank copula函式。（六）非線性分位數迴歸這裡的非線性函式為Fran

用R語言的quantreg包進行分位數回歸

mit perl package html enter 思想 anti res comment 什麽是分位數回歸分位數回歸(Quantile Regression)是計量經濟學的研究前沿方向之一，它利用解釋變量的多個分位數（例如四分位、十分位、百分位等）來得到被解釋變量

用R語言進行分位數迴歸：基礎篇

用R語言進行分位數回歸：基礎篇

ron 理學 style 位數 ext wan r語言 center 基礎篇用R語言進行分位數回歸：基礎篇詹鵬（北京師範大學經濟管理學院北京） http://www.xiaowanxue.com/up_files/20

用C語言算出1到100出現了幾次9

題目要求編寫程式數一下 1到 100 的所有整數中出現多少次數字9。程式分析一共有100個數字，9的數目為9,19,29…99和91,92,93…99。此時要算出9的個數，則要將這些數的個數相加，如果餘數為9，則加1；如果商為9，則加1。核心程式碼如下

用C語言求出0～999之間的所有“水仙花數”並輸出

執行環境: win10 vs2013 “水仙花數”是指一個三位數，其各位數字的立方和確好等於該數本身，如；153＝1＋5＋3?，則153是一個“水仙花數”。在數論中，水仙花數（Narcissis

用R語言實現對不平衡資料的四種處理方法

https://www.weixin765.com/doc/gmlxlfqf.html 在對不平衡的分類資料集進行建模時，機器學**演算法可能並不穩定，其預測結果甚至可能是有偏的，而預測精度此時也變得帶有誤導性那麼，這種結果是為何發生的呢？到底是什麼因素影響了這些演算法的表現？在不平衡的

用R語言做資料清理

資料的清理如同列夫托爾斯泰所說的那樣：“幸福的家庭都是相似的，不幸的家庭各有各的不幸”，糟糕的噁心的資料各有各的糟糕之處，好的資料集都是相似的。一份好的，乾淨而整潔的資料至少包括以下幾個要素： 1、每一個觀測變數構成一列 2、每一個觀測物件構成一行 3、每一個型別的觀測單元構成一個表就像我

用R語言進行方差分析

R語言中與方差分析有關的包有car、gplots、HH、rrcov、multicomp、effects、MASS和mvoutlier。單因素方差分析 #運用multcomp包中的cholesterol資料 library(multcomp) attach(cholesterol) #檢視

用R語言進行基本統計分析

1. 描述性統計分析使用自帶的summary（）函式 > myvars <- c("mpg","hp","wt") > summary(mtcars[myvars]) mpg hp wt Mi

用R語言生成隨機數模擬鬥地主

程式介紹（Part A）鬥地主中有時候會發現自己某一張牌沒有，比如J一張都沒抓到，下面使用R語言生成隨機數，模擬計算如果自己J一張都沒抓到的情況下，其他兩人抓到J炸的概率為0.104 iterSum = 1000000 #總實驗次數 countlostOn

用R語言進行迴歸分析

1.單變數線性迴歸 > y<-c(5,7,9,11,16,20) > x<-c(1,2,3,4,7,9) > lsfit(x,y) $coefficients Int

乾貨：用R語言進行資料提取的方法！

　資料提取是資料分析當中重要的一環，也是需要資料分析師耐心細心地做好。我們大聖眾包（www.dashengzb.cn）小編今天就和大家分享藍鯨的文章，如何通過R語言對資料進行提取分析，達到所需。　　讀取並建立資料表　　首先第一步是讀取資料，並建立名稱為lo

R語言：生成正態分佈資料生成--rnorm,dnorm,pnorm,qnorm

norm是正態分佈，前面加r表示生成隨機正態分佈的序列，其中rnorm(10)表示產生10個數；給定正太分佈的均值和方差， Density(d), distribution function§, quantile function(q) and random® generation

資料分析--用R語言預測離職（下）

資料分析–用R語言預測離職（下）接上一篇~ 接下來我們探索離職和其他分類變數的關係~ > library(scales) > k1 <- ggplot(attr.df, aes(x=Gender,fill=Attrition))+

如何用R語言抽取出服從一般分佈的樣本

相關推薦