1. 程式人生 > >科學研究設計七:單案例設計

科學研究設計七:單案例設計

說明

這是Bangor University 2007年School of Sport Health & Exercise Sciences的教學講義,大家可以在這裡檢視原課程的講義

課程目錄

為什麼要看這個?

這個在我看來,適合大學生或者剛入學的研究生學習,主要為了提高科學素養、培養科學研究的思維以及一些研究設計中要考慮的很多細節問題。雖然裡面沒有很多高超的方法,而且課程也是十年前的,但是裡面對於科學的理解以及思考問題的思維方式確實值得剛進入科研這條不歸路的人學習。

格式說明

  1. 標題格式都按照markdown排版的,但是標題之間的關係可能沒有排好,主要是參考了原課程網站的標題設計
  2. 書中一些專有名詞或者大牛們說的話都沒有翻譯,以防止因為我的問題導致誤解
  3. 名人名言和我自己的理解都是用引言格式標註的,不同的是,大牛們的話是英文,我自己的理解是中文
  4. 因為課程中有問答環節,問題我會用加粗來標識,問題的答案一般會用斜體來標識

最後一句話

因為本人英文水平有限,有些話翻譯得可能很彆扭,有能力的話建議大家去看原網址。

這裡寫圖片描述
在應用行為分析領域最初開發了單案例實驗設計作為傳統組設計的替代品,評估臨床和應用研究中的治療效果。典型的早期應用是研究行為矯正措施的效果,例如在學習困難的人群中使用強化時間表為。此後,他們被廣泛應用於各種其他研究領域,包括體育和運動科學。這些設計原則上可以用來評估心理上還是生理上任何種類的變化。然而,他們最常用的用途是確定改變特定可觀察行為的治療效果。例如,在我們自己的領域,可能會改變訓練方法,運動表現,堅持鍛鍊計劃等等。因此,我將在行為變化的背景下討論單案例設計,但要記住,行為變化不一定是使用這些設計可以檢驗的唯一因變數。例如,一名前SSHES學生在他的最後一年的專案中使用了一個單案例設計來評估在高海拔地區各種生理引數的變化。

優勢 Some advantages

與組設計相比,單一案例設計具有兩大優勢。首先,從實際角度來看,他們需要的參與者較少,因此更容易進行。其次,更重要的是,它們是具體到人(idiographic)的,可以深入研究干預措施對個人的影響。在一個典型的通用(組)設計中,比如隨機前測後測對照組的設計,我們對參與者進行干預的結果進行平均,並通過確定這些組之間是否存在統計學顯著差異來評估其效果。這就存在了兩個主要問題。

首先,干預可能會對一些參與者產生很大的影響,但對其他參與者的影響甚至不大,甚至完全沒有影響。平均效應忽略干預對參與者個體的影響。其次,當干預對參與者有不同的影響時,我們最終會得到很大的組內差異。從你的統計訓練你應該認識到,如果組間變化低於組內變化,即使干預對接受它的個體有效果,我們的測試也不能檢測到統計學上顯著的效應。因此,當實際上治療具有實際或臨床意義時,通式設計可能不會發現統計學顯著的效果。

或者,如果樣本量足夠大,我們可能會發現一個具有很小實際意義的治療的統計學顯著效果。例如,假設我們進行了一項小組研究來評估新的飲食習慣對嚴重肥胖人群體重的影響。我們選擇體重超過120KG的參與者,我們發現,在干預之後,治療組平均失去300g。對照組體重沒有變化。如果我們的樣本量足夠大,我們可以發現這種差異具有統計顯著性,但顯然它沒有什麼實際或臨床意義。對於二十石以上的人來說,減掉300g對他們的生命或健康沒有明顯的影響。

基本原則 Fundamental principles

單案例設計的目的是證明治療導致了任何可觀察到的行為變化,而不是其他因素。因此,這些設計的一個主要問題,就像對於組設計一樣,它們應該具有較高的內部效度,並且表現出治療的因果效應。請記住,內部效度關係到研究設計使我們能夠將因變數的變化歸因於獨立變數(干預)的操縱,而不是其他因素。所以我們必須排除成熟,歷史,選擇等威脅的有效性。在小組設計中,我們通過比較治療組和未接受治療的對照組來做到這一點。在單案例設計中,我們沒有一個沒有處理的小組。但是,每個參與者都有一個沒有治療的條件。也就是說,我們可以比較參與者在治療前和治療後的行為。換句話說,每個參與者都是自己的控制組。

案例設計的邏輯非常簡單。關鍵原則或標準是當且僅當在應用治療時觀察到行為改變時,獲得治療效果的證據。換句話說,行為的改變必須與實施治療相一致。如果確實如此,並且這樣做是重複的,那麼觀察到的變化不太可能是由於其他因素造成的,我們至少可以合理地確信治療是有效的。

這個標準只是表達我們在第五課中遇到的兩個同時提出的命題的另一種方式,這個命題必須被實現,以確定它確實是X導致Y而不是別的:

If X, then Y 和 If not X, then not Y

當且僅當在應用治療時觀察到行為改變時,才能獲得治療功效的證據。

那麼,一個非常基本的單例設計將如下所示:

這裡寫圖片描述

我們獲得了一個我們想要改變的行為的基線測量,實施治療,然後後續測量,看看行為是否已經改變。 統計檢驗可用於檢查變化是否具有統計顯著性,但是,這些變化超出了本課的範圍。 通常在單案例設計中,檢查效果的主要方法是通過視覺檢查:我們對資料進行繪製並檢視是否存在明顯變化。 發生變化的例子看起來像這樣:
這裡寫圖片描述

行為已經在基線評估了六個點,每個點都由一個綠點表示。 然後介紹干預,用垂直虛線表示。 隨後又進行了六次行為評估。水平線斷開代表基線和後續行為的平均水平。 實線表示如果幹預措施沒有效果,在隨訪期間將觀察到的行為水平。

這裡的視覺檢查表現出明顯的行為變化。 但是,這樣一個簡單的設計不一定會讓我們排除變化的替代解釋。 這將類似於使用預實驗,單組,預測試後測試設計。 任何數量的因素都可能與治療期一致,並導致觀察到的變化。 這種設計不能完全符合上面給出的關鍵標準。 也就是說,我們可以看到,行為的變化發生,如果和當時的治療是應用(如果X,然後Y),而不僅是當(如果不是X,那麼不Y)。 我們不知道如果我們沒有實施治療,會發生什麼。 但無論如何,我們本可以得到觀察到的變化。

ABAB設計 ABAB (Reversal) designs

為了滿足這個關鍵標準,最早加強單案例設計的嘗試被稱為ABAB或逆向設計:

這裡寫圖片描述

這裡我們得到我們的基準測量(A),然後引入處理(B)。 只有當引入治療(如果X,然後是Y),我們正在尋找行為的變化。 然後我們進入逆轉階段(A);治療被刪除,我們正在尋找行為返回到基準水平(如果不是X,那麼不是Y)。 最後,我們重新引入治療(B),看看行為是否再次改變(如果X,那麼Y)。 以下是治療成功的假設例子:

這裡寫圖片描述

在這裡,實線表示如果前一個階段沒有效果將會存在的行為水平。 我們可以看到,當治療被引入時,行為增加,當治療被移除時返回到基線,並且當重新引入治療時,再次增加。

這種設計符合我們顯示治療效果的關鍵標準。 當且僅當治療到位時,我們觀察變化。 有效性的威脅(例如成熟)幾乎不可能與引入治療正好吻合,而是在治療被移除的地方停止使用,然後與重新引入治療一致。 因此,我們可以得出結論,這是導致行為改變的治療。

想象一下,當繪製結果看起來像這樣:

這裡寫圖片描述

我們現在不滿足這個關鍵標準,因為只有當治療有效時,行為才會有所改變。 因此,我們不得不得出這樣的結論,要麼是別的什麼造成了這種變化,要麼是因為治療而導致的任何變化都是不可逆轉的。

所以,ABAB設計的內部效度很強。 但是,前面的例子說明了一個明顯的缺點。 這就是說,他們要求治療的效果在實施時才顯而易見。 顯然,在現實生活中,我們希望我們的干預措施具有更持久的效果。 因此,在現實世界中,我們很可能得到類似於最後一組的結果:引入治療導致(相對)永久性的行為改變。 既然我們現在還沒有一種情況,行為只是在治療的時候才會發生變化,我們不能得出任何確鑿的因果推論。 再次,成熟的有效性威脅可能與引入治療相吻合。

多基線設計 Multiple baseline designs

多基線設計是單案例方法的更復雜的應用,避免了在ABAB設計中需要扭轉處理效果的問題。 這裡介紹的干預效果是通過在不同的時間點把它引入到不同的基線來證明的。 如果每個基線變化,當且僅當它是干預的目標時,那麼效應可以歸因於干預而不歸因於其他因素。

有多種不同型別的多基線設計。 最常用的是跨行為的多個基線和跨參與者的多個基線。

跨行為的多基線 Multiple baselines across behaviours

通過跨行為的多個基線,治療被相繼引入不同的行為。 例如,我們可能要評估一個意象訓練(imagery training)計劃對運動的不同方面的影響,比如說在足球或曲棍球上的對手,傳球和射門。 基線是針對每個行為建立的,然後將干預分別應用於每個行為,一次一個。 如果成功,結果將如下所示:

這裡寫圖片描述

每個行為都是針對性的,我們可以看到我們的關鍵標準已經得到滿足:當且僅當應用干預時,行為才會發生變化。

多基線設計要求基線是獨立的。 這意味著治療的效果不能推廣到非目標行為。 例如,在這個例子中的表演者可能會開始使用意象來加強他們的傳球和射門,而這些行為是專門針對目標的。 如果治療的效果影響一個行為之前的目標,那麼我們在一個變化之前看到它發生,我們不會滿足當時的行為改變的關鍵標準,當只有當治療是適用的。 這是跨行為設計的多個基線的嚴重限制,因為有效的治療很可能推廣到非目標效能方面。 例如,我們的參與者可能會覺得意象正在幫助他們解決問題,所以他們自發地開始將其應用到遊戲的其他方面。

跨參與者的多個基線 Multiple baselines across participants

跨參與者的多基線不太可能被基線的非獨立性困擾。 這裡的基線是個人,依次對每個人進行治療。 如果不允許參與者討論彼此的干預,或者看到其他人在幹什麼,那麼基線應該保持獨立。 以下是涉及三個人的參與者研究的多個基準的結果:

這裡寫圖片描述

正如你所看到的,我們的關鍵標準在這裡得到滿足。 當且僅當每個人的行為被定位時,行為才會改變。 在三個不同的人身上,由於除干預之外的其他因素,恰恰在同一時間應用這種治療方法,同樣的行為也不太可能發生改變。 因此,還有其他解釋的假設是不合理的,我們可以確信,干預是有效的。

行為評估 Behavioural assessment

在單案例設計中,可觀察到的行為是因變數,對行為進行有效可靠的評估顯然是重要的。 通常情況下,這將涉及培訓至少兩名觀察員按照特定的標準對行為進行評分,直到他們達到預先確定的評分人間可靠性水平(見第四課:測量)。

更多優勢 More advantages

我們已經討論了單案例設計的具體性質如何使我們能夠避免組設計中的組內變化問題。進一步的優勢在於能夠深入檢查干預措施的效果。例如,這些設計可以很容易地用來檢視具體的干預,以確定其活性成分或提高其功效。有些干預措施相當複雜,涉及很多方面。這可能是其中一些方面的工作,而其他方面是無效的。使用單案例設計,我們可以梳理干預的不同方面,並單獨或以各種組合的方式應用這些方面,以找出最佳的方法。我們也可以嘗試改變干預措施或增加新的程式或技術,以提高其有效性。不同的治療也可以相互比較,看哪個是最好的。

單案例設計方法提供了許多機會,仔細檢查和操縱干預,以瞭解正在發生什麼以及如何改進。例如,考慮以下跨參與者研究中多個基線的結果模式:

這裡寫圖片描述

在這裡很明顯,治療的效果不會立即出現,而是需要一段時間才能開始,也許是因為個人需要在新的治療方法產生效果之前進行鍛鍊。 因此,參與者三缺乏變化可能是因為後續評估沒有延續足夠長的時間來顯示任何變化。 這樣的結果模式可能會導致我們試圖加強幹預,使其更加直接的影響。

侷限 Limitations

單病例設計的一個主要問題是,為了對干預的有效性有信心,我們需要多少次來證明一個效果? 跨參與者多基線設計中三個參與者? 五個?十個? 這個問題沒有答案。 另一方面是我們可以忍受多少無效的影響,並仍然有信心干預? 考慮以下結果:

這裡寫圖片描述

看來,治療對參與者1有很大的影響,對參與者2影響很小,對參與者3沒有影響。 我們應該從中得出什麼結論呢? 這是一個很困難的問題。 然而,我們從這樣圖中可以得到資訊,並引導我們進一步研究重要的問題。 這裡的一個顯而易見的問題是試圖確定是什麼導致了參與者1的反應,以及/或者是什麼導致參與者3沒有反應。 換句話說,我們可以探索個人客戶特徵如何與治療相互作用,這可能導致我們開發新的或更有效的治療。

另一個不確定性問題出現在基準階段期望的方向有變化的趨勢。 考慮這些結果:

這裡寫圖片描述

在基線階段,這些趨勢表現出增加的趨勢。這並不罕見,可能是由於對行為的熟悉程度或練習日益增加,特別是對於參與者而言,這是一種新的行為。問題是,干預結果之後觀察到的增加是干預的結果,還是隻是延續了一個本來可能發生的趨勢?但是請注意,這裡的跟蹤趨勢比基線更陡峭。幸運的是,可以應用統計技術來確定趨勢的變化是否顯著。

這種單案設計的問題讓我想起了童謠裡的小女孩:當她好的時候,她非常好,但當她壞的時候,她很可怕。同樣,當干預明顯而一致地有效時,這些設計顯示得非常清楚;當干預的影響不是那麼清晰或者一致時,對結果的解釋可能是可怕的!

另一個限制涉及非特定的治療效果,特別是注意力效應,參與者對實驗情況的效益和需求特徵的期望(參見第六課)。由於研究人員和參與者之間通常涉及很多聯絡,而且研究人員尋找的內容通常非常明顯,所以單案設計可能特別容易出現這樣的問題。

最後一個問題是外部有效性或泛化的問題:我們可以在多大程度上將研究結果推廣到其他人或情況?這個問題也沒有真正的答案。但是,這不是唯一的個案設計。從第六課中回顧研究的有效性,從邏輯上說,我們決不能將研究結果推廣到所涉及的特定參與者以及研究發生的背景或情境之外。儘管如此,我們可能對涉及許多參與者的團隊設計的結論的普遍性更加信任,而不是僅涉及少數參與者的單案例設計。

Conclusion

單案例設計是一種可供選擇的研究方法,用於檢驗具體而又定量的干預措施的有效性。 因此,我們對定性研究方法獲得了一些豐富和深入的理解,同時能夠量化變化並對資料及其解釋保持相對客觀的立場