1. 程式人生 > >初識R語言介紹以及常見的問題

初識R語言介紹以及常見的問題

R語言是用於統計分析,圖形表示和報告的程式語言和軟體環境。 R語言由Ross Ihaka和Robert Gentleman在紐西蘭奧克蘭大學建立,目前由R語言開發核心團隊開發。

R語言的核心是解釋計算機語言,其允許分支和迴圈以及使用函式的模組化程式設計。 R語言允許與以C,C ++,.Net,Python或FORTRAN語言編寫的過程整合以提高效率。

R語言在GNU通用公共許可證下免費提供,併為各種作業系統(如Linux,Windows和Mac)提供預編譯的二進位制版本。

R是一個在GNU風格的副本左側的自由軟體,GNU專案的官方部分叫做GNU S.

R的演變

R語言最初是由紐西蘭奧克蘭奧克蘭大學統計系的Ross Ihaka和Robert Gentleman寫的。 R語言於1993年首次亮相。

  • 一大群人通過傳送程式碼和錯誤報告對R做出了貢獻。

  • 自1997年年中以來,已經有一個核心組(“R核心團隊”)可以修改R原始碼歸檔。

R的特點

如前所述,R語言是用於統計分析,圖形表示和報告的程式語言和軟體環境。 以下是R語言的重要特點:

  • R語言是一種開發良好,簡單有效的程式語言,包括條件,迴圈,使用者定義的遞迴函式以及輸入和輸出設施。

  • R語言具有有效的資料處理和儲存設施,

  • R語言提供了一套用於陣列,列表,向量和矩陣計算的運算子。

  • R語言為資料分析提供了大型,一致和整合的工具集合。

  • R語言提供直接在計算機上或在紙張上列印的圖形設施用於資料分析和顯示。

作為結論,R語言是世界上最廣泛使用的統計程式語言。 它是資料科學家的第一選擇,並由一個充滿活力和有才華的貢獻者社群支援。 R語言在大學教授並部署在關鍵業務應用程式中。 本教程將教您R程式設計與適當的例子在簡單和容易的步驟。

什麼是R語言程式設計?

R語言是一種用於統計分析和為此目的建立圖形的程式語言。不是資料型別,它具有用於計算的資料物件。它用於資料探勘,迴歸分析,概率估計等領域,使用其中可用的許多軟體包。

R語言中的不同資料物件是什麼?
它們是R語言中的6個數據物件。它們是向量,列表,陣列,矩陣,資料框和表。

什麼使R語言中的有效變數名?
有效的變數名稱由字母,數字和點或下劃線字元組成。變數名以字母或不以數字後跟的點開頭。

陣列和矩陣之間的主要區別是什麼?


矩陣總是二維的,因為它只有行和列。但是陣列可以具有任何數量的維度,並且每個維度是矩陣。例如,3x3x2陣列表示維度為3x3的2個矩陣。

R語言中的哪個資料物件用於儲存和處理分類資料?
R語言中的因子資料物件用於儲存和處理R語言中的分類資料。

如何在R語言中載入和使用csv檔案?
可以使用R語言ead.csv函式載入csv檔案。 R語言在使用此函式讀取csv檔案時建立資料框。

如何獲取R語言中當前工作目錄的名稱?
命令getwd()給出了R語言環境中的當前工作目錄。

什麼是R語言 Base包?
這是在R語言環境設定時預設載入的包。它提供了R語言環境中的基本功能,如輸入/輸出,算術計算等。

在邏輯迴歸中如何使用R語言?
邏輯迴歸處理測量二元響應變數的概率。在R語言中,函式glm()用於建立邏輯迴歸。

如何訪問名為M的矩陣的第2列和第4行中的元素?

表示式M [4,2]給出了第4行和第2列的元素。

什麼是向量中元素的回收?舉個例子。
當在操作中涉及不同長度的兩個向量時,較短向量的元素被重用以完成操作。這被稱為元素迴圈。示例-v1 <-c(4,1,0,6)和V2 <-c(2,4),則v1 * v2給出(8,4,0,24)。重複元件2和4。

在R語言中呼叫函式有什麼不同的方法?
我們可以用3種方式在R語言中呼叫一個函式。第一種方法是通過使用引數的位置來呼叫。第二個方法id通過使用引數的名稱來呼叫,第三個方法是通過預設引數呼叫。

什麼是R語言中的延遲函式評估?
函式的延遲評估意味著,只有當它在函式體內部使用時,才會評估引數。如果沒有對函式體中的引數的引用,則它被簡單地忽略。

如何在R語言中安裝軟體包?
要在R語言中安裝一個包,我們使用下面的命令。

install.packages("package Name")

命名用於讀取XML檔案的R語言包。
名為“XML”的包用於讀取和處理XML檔案。

我們可以更新和刪除列表中的任何元素嗎?
我們可以更新任何元素,但我們只能刪除列表末尾的元素。

給一般表示式在R語言中建立一個矩陣。
在R語言中建立矩陣的一般表示式是 - matrix(data,nrow,ncol,byrow,dimnames)

該函式用於在R語言中建立boxplot圖形?
boxplot()函式用於在R語言中建立箱線圖。它使用公式和資料框作為輸入建立箱線圖。

在做時間序列分析時,在ts()函式中fR語言equency = 6是什麼意思?
頻率6表示時間序列資料的時間間隔是每10分鐘一小時。

什麼是R語言中的資料重塑?
在R語言中,資料物件可以從一種形式轉換為另一種形式。例如,我們可以通過合併許多列表來建立資料框。這涉及一系列R語言命令,以將資料帶入新格式。這被稱為資料整形。

R語言unif(4)的輸出是什麼?
它生成0和1之間的4個隨機數。

如何獲得R語言中安裝的所有軟體包的列表?
使用命令

installed.packages()

執行命令 - strsplit(x,“e”)是什麼意思?
它將向量x中的字串拆分為字母e位置處的子字串。

給一個R指令碼從字串中提取大寫的所有唯一字 - “快速的棕色狐狸跳過懶惰的狗”。

x <- “快速的棕色狐狸跳過懶惰的狗”
split.string <- strsplit(x,"")
extract.words <- split.string [[1]]
result <- unique(tolower(extract.words))
print(result)


向量v是c(1,2,3,4),列表x是列表(5:8),v * x [1]的輸出是什麼?
v * x [1]中的錯誤:二進位制運算子的非數值引數

向量v是c(1,2,3,4),列表x是列表(5:8),v * x [[1]]的輸出是什麼?
[1] 5 12 21 32s

unlist()是什麼?
它將列表轉換為向量。

給予R語言表示式,從使用pbinom的硬幣51個硬幣中得到26個或更少的頭。

x <- pbinom(26,51,0.5)
print(x)
X是向量c(5,9.2,3,8.51,NA),mean(x)的輸出是什麼?
NA


如何將JSON檔案中的資料轉換為資料框?
使用函式as.data.frame()

在R語言中給出一個函式,用向量的元素的和代替向量x的所有缺失值?

function(x){x [is.na(x)] <sum(x,na.rm = TRUE); x }

apply()在R語言中的用途是什麼?
它用於對陣列中的每個元素應用相同的函式。例如,查詢每行中行的平均值。

是陣列稱為矩陣還是矩陣稱為陣列?
每個矩陣可以稱為陣列,但不能相反。矩陣總是二維的,但陣列可以是任何維度。

如何找到缺失值的幫助頁面?
?NA

如何獲得向量x的標準偏差?
sd(x,na.rm = TRUE)

如何在R語言中設定當前工作目錄的路徑?
setwd("Path")

"%%"和"%/%"之間有什麼區別?
"%%"給出第一向量與第二向量的除法的餘數,而"%/%"給出第一向量與第二向量的除法的商。

col.max(x)是什麼?
查詢該列具有每行的最大值。

給出建立直方圖的命令。
hist()

如何從R語言工作區中刪除向量?
rm(x)

列出包"MASS"中可用的資料集
data(package ="MASS")

列出所有可用軟體包中可用的資料集。

data(package = .packages(all.available = TRUE))

什麼是命令的使用 - install.packages(file.choose(),repos = NULL)?
它用於通過瀏覽和選擇檔案從本地目錄安裝R語言包。

給出命令以檢查元素15是否存在於向量x中。

15%在%x


給出建立散點圖矩陣的語法。

pairs(formula, data)

其中公式表示成對使用的變數系列,資料表示從中獲取變數的資料集。

R語言中的subset()函式和sample()函式有什麼區別?
subset()函式用於選擇變數和觀察值。 sample()函式用於從資料集中選擇大小為n的隨機樣本。

如何檢查"m"是R語言中的矩陣資料物件?
is.matrix(m)應該重新執行TRUE。

下面的表示式all(NA == NA)的輸出是什麼?

[1] NA


如何獲得矩陣在R語言中的轉置?
函式t()用於轉置矩陣。示例-t(m),其中m是矩陣。

在R語言中使用"next"語句是什麼?
當我們想要跳過迴圈的當前迭代而不終止它時,R程式語言中的"next"語句是有用的。