拓端tecdat|R語言IRT理論:擴充套件Rasch模型等級量表模型lltm、 rsm 和 pcm模型分析心理和教育測驗資料視覺化
原文連結:http://tecdat.cn/?p=26096
原文出處:拓端資料部落公眾號
摘要
我們首先介紹擴充套件 Rasch 模型的方法論,然後是一般程式描述和應用主題,包括簡單的 Rasch 模型、評級量表模型、部分信用模型及其線性擴充套件。這種線性結構的結合允許對協變數的影響進行建模,並能夠分析重複的分類測量。
簡介
Rost (1999) 在他的文章中聲稱,“儘管 Rasch 模型已經存在了這麼長時間,但目前 95% 的心理學測試仍然是使用經典測試理論的方法構建的”。基本上,他引用了很少使用 Rasch 模型 (rm) 的以下原因: 原始形式的 Rasch 模型 (Rasch 1960) 僅限於二分項,對於實際測試目的而言,可以說限制性太強。因此,研究人員應該關注擴充套件的 Rasch 模型。
除了基本的 rm,可以計算的模型有:線性邏輯檢驗模型 (Scheiblechner 1972)、評級量表模型 (Andrich 1978)、線性評級量表模型 (Fischer and Parzer 1991)、部分信用模型(Masters 1982)和線性部分信用模型(Glas 和 Verhelst 1989;Fischer 和 Ponocny 1994)。
擴充套件 Rasch 模型
一般表達
Andersen (1995) 推匯出以下表示,這些表示基於 Rasch 對多組資料的一般表示式。資料矩陣表示為 X,行中的人 v 和列中的專案 i。總共有 v = 1, ..., n 個人和 i = 1, ..., k 項。資料矩陣 X 中的單個元素表示為 xvi。此外,每個專案 i 都有一定數量的響應類別,用 h = 0, ..., mi 表示。對專案 i 的響應 h 的相應概率可以根據以下兩個表示式匯出(Andersen 1995):
或者
這裡,φh 是專案引數的評分函式,θv 是一維人蔘數,βi 是專案引數。在等式 1 中,ωh 對應於類別引數,而在等式 2 中,βih 是專案類別引數。
擴充套件 Rasch 模型的表示
對於二分項的普通 Rasch 模型,等式 1 簡化為
主要假設,也適用於本文提出的概括,是:潛在特徵的單維性、原始分數的充分性、區域性獨立性和平行專案特徵曲線 (iccs)。相應的解釋可以在 Fischer (1974) 中找到,在 Fischer (1995a) 中可以找到數學推導和證明。
對於二分項,Scheiblechner (1972) 提出了(更受限制的)線性邏輯檢驗模型 (lltm),後來由 Fischer (1973) 形式化,通過將專案引數拆分為線性組合
請注意,專案 i 和操作 j 的權重 wij 必須先驗地固定。關於認知操作的進一步闡述可以在 Fischer (1974, p. 361ff.) 中找到。因此,從這個角度來看,lltm 比 Rasch 模型更簡潔。
不過,還有另一種看待 lltm 的方法:基本 Rasch 模型在重複測量和組對比方面的概括。需要注意的是,兩種型別的重新引數化也適用於線性評級量表模型(lrsm)和線性部分信用模型(lpcm),相對於下面介紹的基本評級量表模型(rsm)和部分信用模型(pcm) . 關於 lltm,Fischer (1974) 已經介紹了將其用作 Rasch 模型的推廣以進行重複測量的可能性。在隨後的幾年中,這一建議得到了進一步的闡述。
在這一點上,我們將專注於 Rasch 模型的簡單多分類推廣,即 rsm (Andrich 1978),其中每個專案 Ii 必須具有相同數量的類別。對於等式 1,可以將 φh 設定為 h,其中 h = 0, ..., m。由於在 rsm 中專案類別的數量是恆定的,因此使用 m 而不是 mi。因此,由此得出
具有 k 個專案引數 β1, ..., βk 和 m + 1 個類別引數 ω0, ..., ωm。此引數化導致對單個專案的響應類別 Ch 進行評分。專案引數可以像方程 4 中那樣以線性組合進行拆分。
最後,介紹了 Masters (1982) 開發的 pcm 及其線性擴充套件 lpcm (Fischer and Ponocny 1994)。pcm 為 h = 0, ..., mi 的每個 Ii ×Ch 組合分配一個引數 βih。因此,恆定評分屬性不能保留專案,此外,專案可以具有不同數量的響應類別,由 mi 表示。因此,pcm 可以被視為 rsm 的推廣,並且人 v 對類別 h(專案 i)的響應的概率定義為
很明顯,(6) 是 (2) 在 φh = h 方面的簡化。至於lltm和lrsm,lpcm是通過重新引數化基本模型的item引數來定義的,即
應用示例
在以下小節中,提供了與不同模型和設計矩陣場景相關的各種示例。由於可理解性問題,資料集保持相當小。
示例 1:Rasch 模型
我們從一個基於 100×30 資料矩陣的簡單 Rasch 模型開始示例部分。首先,我們估計專案引數,然後估計人員引數。
然後我們使用 Andersen 的 LR 檢驗與平均分割標準進行擬合優度:
> lrre
我們看到模型擬合,並且該結果的圖形表示(僅專案子集)在圖 中通過帶有置信橢圓的擬合優度圖給出。
- > plotGOF(lrres.rasch, beta.subset = c(14, 5, 18, 7, 1), tlab = "item",
- + conf = list(ia = FALSE, col = "blue", lty = "dotted"))
為了能夠繪製置信橢圓,需要在計算 LR 測試時設定 se = TRUE。
示例 2:lltm 作為受限 Rasch 模型
對專案引數進行線性擴充套件的模型也可以看作是其底層基本模型的特例。事實上,下面提出的 lltm 並遵循 Scheiblechner (1972) 的原始想法,是一個受限的 rm,即與 Rasch 模型相比,估計引數的數量更小。資料矩陣 X 由 n = 15 個人和 k = 5 個專案組成。此外,我們指定具有特定權重元素 wij 的設計矩陣 W。
- > retm <- LLTM(lt2, W)
- > summary(resm)
summary方法為基本引數和結果專案引數提供點估計和標準誤差。請注意,專案引數始終根據等式 1 和 2 而不是 3 估計為容易度引數。
示例 3:rsm 和 pcm
同樣,我們現在提供一個人工資料集,其中 n = 300 人,k = 4 個專案;他們每個人都有 m + 1 = 3 個類別。我們從 rsm 的估計開始,隨後,我們計算相應的類別交叉引數。
- > thresholds(resm)
位置引數基本上是專案難度,閾值是圖 4 中給出的 icc 圖中類別曲線相交的點:
> plotICC(res.rsm, mplot = TRUE, legpos = FALSE, ask = FALSE)
rsm 將所有專案的閾值距離限制為相同。使用 pcm 可以放寬這個強假設。結果以人員-專案地圖表示(參見圖 5)。
- > res.pcm <- PCM(pcmdat2)
- > plotPImap(res.pcm, sorted = TRUE)
在估計人員引數後,我們可以檢查專案擬合統計資訊。
- itemfit(pcm)
比較 rsm 和 pcm 的似然比檢驗表明 pcm 提供了更好的擬合。
- > pvalue <- 1 - pchisq(lr, df)
用於在不同組中重複測量的 lpcm
最複雜的示例是指具有兩個測量點的 lpcm。此外,對於治療是否有效的假設也很有趣。相應的對比是下面 W 中的最後一列。首先,指定資料矩陣 X。我們假設一個由 k = 3 個專案組成的人工測試,該測試向受試者展示了兩次。X 中的前 3 列對應於第一個測試場合,而後 3 列對應於第二個場合。通常,前 k 列對應於第一個測試場合,接下來的 k 列對應於第二個測試場合,依此類推。總共有 n = 20 個科目。其中,前10人屬於第一組(如對照組),後10人屬於第二組(如實驗組)。這由組向量指定:
> grouplpcm <- rep(1:2, each = 10)
同樣,W 是自動生成的。通常,對於此類設計,W 的生成首先包括專案對比,然後是時間對比,最後是除第一個測量點之外的組主效應(由於可識別性問題,如前所述)。
- > rm <- LPCM
- > model.matrix
引數估計如下:
> coef
檢驗 η 引數是否等於 0 與那些涉及專案的引數(在本例中為 η1,...,η8)幾乎無關。但是對於其餘的對比,H0 : η9 = 0(意味著沒有一般時間效應)不能被拒絕(p = .44),而假設 H0 : η10 = 0 在應用 z 時必須被拒絕(p = .004) -檢驗。這表明在測量點上存在顯著的實驗效果。如果使用者想要執行額外的檢驗,例如兩個 η 引數的等價性的 Wald 檢驗,可以應用 vcov 方法來獲得方差-協方差矩陣。
討論與展望
cml 估計方法與 em 演算法相結合,也可用於估計混合 Rasch 模型 (MIRA)。這種模型背後的基本思想是擴充套件的 Rasch 模型適用於個體的亞群,但每個亞群具有不同的引數值。
在 Rasch 模型中,專案辨別引數 αi 始終固定為 1,因此它不會出現在基本方程中。2-pl 模型可以通過 ltm 包進行估計(Rizopoulos 2006)。然而,Verhelst 和 Glas (1995) 制定了單引數邏輯模型 (oplm),其中 αi 不會因專案而異,但不等於 1。估計 oplm 的基本策略是一個三步法:首先,計算 Rasch 模型的專案引數。然後,在一定的限制條件下計算判別引數。最後,使用這些判別權重,oplm 的專案引數是使用 cml 估計的。這是 Rasch 模型在不同斜率方面更靈活的版本。
對不同數量的專案類別的概括、允許引入專案協變數和/或趨勢的線性擴充套件以及可選的組對比是在測試中檢查專案行為和個人表現時的重要問題。這提高了 irt 模型在各種應用領域的可行性。
最受歡迎的見解
3.matlab中的偏最小二乘迴歸(PLSR)和主成分迴歸(PCR)
6.r語言中對LASSO迴歸,Ridge嶺迴歸和Elastic Net模型實現