1. 程式人生 > >用概率判生死:法庭上的數學證據

用概率判生死:法庭上的數學證據

給大家分享一個概率統計的故事。

法官如果通過擲硬幣的方式來判一個人有沒有罪,肯定沒人會服。但歷史上真的發生過這種事,當然不會是拋硬幣,而是——算一個更復雜的概率。概率斷案好不好用,看看幾個案例就知道了。如果概率玩的不好,辯護時被佔便宜的事也發生過。

洛杉磯搶劫案

歷史上最著名的案例要數 1964 年夏天發生在美國洛杉磯的一起劫案。一天中午,一位老婦人從雜貨店買了東西推著小車回家,途經一條小巷時,突然被一位衝過來的年輕女子推倒,等老婦人醒過神來,發現自己身上的錢包已被偷走,女賊也早跑了很遠。雖然老婦人沒有看清罪犯是什麼樣子,可小巷周圍的不少住戶都曾與這位女子擦肩而過,並且看到她在街頭跳上一輛車逃離現場。

後來警方根據目擊者描述的犯罪者特徵,幾天後在附近逮捕了一對夫妻(Malcolm Collins 和 Janet Collins. Malcolm)。可是在法庭上,目擊者中並沒有人能夠清晰地指認出罪犯,因此檢方很難將 2 人定罪。於是檢察官們想出了一個“新穎的辦法”,他們把目擊證人說出的幾條主要特徵列了出來,並且根據洛杉磯地區的資料估算了這些特徵會出現的概率:

黃色的汽車:1/10    
嘴上面有短鬍子的男性:1/4    
絡腮鬍子的黑人:1/10    
馬尾辮女孩:1/10    
金髮女孩:1/3    

汽車中有膚色不同的夫妻倆:1/1000

檢察官找來一位“數學專業人士”,計算了在整個洛杉磯地區符合上述各條特徵的夫婦存在的概率,這位“數學專業人士”認為最後的概率應該是 6 個概率值乘到一起,結果就是 1/1200萬。檢察官據此告知評審團,如此小的概率很難發生,附近地區很難再找到另外一對 6 項特徵全部符合的夫婦,所以這對嫌疑人一定是罪犯。陪審團最終採納了檢方的意見,判定這對夫婦搶劫罪成立。可是後來加州高等法院駁回了這個判決,他們認為檢方使用的概率作為證據的方式是錯誤的。

首先,概率乘法公式 P(ABC) = P(A)P(B)P(C) 一定要在 A,B,C 都是獨立事件的時候才成立,可是目擊者提供的那些特徵並不相互獨立,比如留八字鬍的男性和留絡腮鬍的男性這兩項,“男性”這個資訊是重疊的,而喜歡留鬍子的人往往兩個位置都會留鬍子,兩個特徵高度關聯,同時發生的概率遠遠大於兩個數字相乘。馬尾辮女孩和短髮女孩也是同樣的道理。這樣的話,正確的概率可能會是 1/1200萬的很多倍,並沒有那麼低。

退一步說,假定概率真的是 1/1200萬,以案發附近地區有 400 萬人算,至少有2位夫婦符合目擊者全部特徵的概率是 1 - (11999999/12000000) 4000000 ,超過 30%,也就是說,僅僅根據 1/1200萬 的概率斷就判定這對夫婦是唯一的也沒有道理。

母親殺子案

類似的用數學計算來判案還不止一次。1999 年,英國也有一次“概率定罪”的案件。一個Sally Clark的婦女第一個孩子出生之後幾個星期離奇死亡,醫生查不出其他病因,只診斷為一種叫 SIDS (嬰兒猝死綜合症)的罕見疾病。隨後Clark再次懷孕,第 2 個孩子也在出生後幾個星期死亡,原因再次被診斷為SIDS。這件事引起了警方的懷疑,警方認為 2 個孩子有可能是“被猝死”的,將 Clark 逮捕。

在法庭上,檢方引用醫生的證明,聲稱 SIDS 這種病發病率很低,而且不是遺傳病,所以可以把兩個孩子的 SIDS 死亡看作獨立事件,相乘之後的概率只有 1/7300萬。和洛杉磯劫案類似,概率在這裡再次被當做一個關鍵證據。檢方以此說服了陪審團,法庭最後認為兩個孩子連續得這種突發罕見疾病的概率很低,很難發生,Clark 殺死孩子罪行應該成立,被送入監獄。

和上一個故事的結局一樣,這個判決後來也被推翻了, Clark 被無罪釋放。不妨讓我們來看看檢方的觀點。他們認為

P(兩個孩子都死於SIDS) = 1/73000000
P(Clark殺了兩個孩子) = 1 - 1/73000000 = 72999999/73000000

幾乎是鐵定的事實。但是,檢方疏忽了一個非常關鍵的事實,那就是上面這個推理只有在 P(兩個孩子都死於SIDS) + P(Clark殺了孩子) = 1 時才成立。事實上,除了這兩種情況外還有其他可能,檢方並不能完全排除。英國皇家統計學會後來指出,真要計算的話,一位母親連續殺死自己兩個親骨肉這樣極其變態行為發生的可能性同樣是極低的,甚至低於兩個孩子都死於 SIDS 病的可能性。在判斷概率的時候,不能只看P(兩個孩子都死於SIDS)有多小,還要看和P(母親連續殺死兩個孩子)做相對比較。最後上訴的一方憑藉更加全面的解釋和一些新證據(比如第二個孩子可能受過細菌感染,有可能既不是死於 SIDS,也不是被殺)成功地為 Clark 洗脫罪名。

辛普森案

第三個案件是美國的 1994 年到 1995 年的Simpson辛普森案件,辛普森是當年著名的橄欖球明星,因為涉嫌殺害自己的妻子被起訴,引起軒然大波,當時估計全美有1億人看了對這個案件的電視轉播。

腰纏萬貫的辛普森花高價聘請“夢幻組合律師團”為自己辯護,其中包括哈佛大學法學院的教授Alan Dershowitz,作為一位百戰百勝的律師,Alan在這個案件中作為辯方一員再次大展身手。本來警方在案件現場收集到了很多證據,包括帶血的手套、血跡、現場DNA檢驗。為了證實辛普森是有意圖殺害自己妻子的,警方還特意收集了大量辛普森長期毆打虐待妻子的證據。似乎辛普森難逃被定罪伏法的命運,可是辯護律師們通過各種方法一一化解掉了檢方的所有證據,護律師團還宣稱洛杉磯警察局有其他失職行為。在經歷了長達9個月的審判後,辛普森被宣判無罪。在 9 個月的馬拉松式審判中,有一個用數學來辯護的小插曲。就是在對於虐待妻子這一條上,大律師Alan用概率的方法在法庭上辯解,“美國每年有 400 萬婦女被丈夫或男友毆打,可是美國每年只有 1432 名婦女被丈夫殺死,這樣說明那些長期虐待妻子的男人最後出手殺人的概率也就 1/2500,檢方的說法不靠譜”。Alan的辯詞似乎聽起來挺有道理,檢察官一時“反應不過來”,提不出好的理由進行反駁。可是從概率的角度上看,Alan的辯詞只是狡辯而已。我們定義事件 A 是一個美國人虐待了妻子, B 是一個美國人殺了妻子。在事先沒有任何給定資訊的前提下,Alan律師估計的條件概率是P(B|A) = 1/2500。

但現實是,事件 A 已經發生,辛普森確實虐待了妻子,概率為1。他的妻子被殺的事情也已經發生,只是不清楚是誰是凶手。P(B|A)中 A、B 真正的定義應該是:

  • A:一個人虐待了妻子並且妻子被殺
  • B:凶手正是這個人

根據資料,P(B|A)可以達到 90% 之高,也就是說在所有遭到謀殺的被虐美國妻子中,90%是被施虐者殺害。不過在庭審的時候,檢方並沒有能及時提出這個論點,不幸讓Alan律師的詭辯得逞。