1. 程式人生 > >4星|《對賭:資訊不足時如何做出高明決策》:賭徒概率思維最優

4星|《對賭:資訊不足時如何做出高明決策》:賭徒概率思維最優

對賭:資訊不足時如何做出高明決策

作者是認知心理學博士,有一個職業撲克玩家哥哥,機緣巧合專職玩德州撲克20年。

作者在玩牌過程中意識到,撲克比賽中的決策次數特別多特別頻繁,差不多每兩分鐘要有一次決策,可能一個決策就影響到一套房子的輸贏。於是對優秀撲克選手的決策模式做了許多思考。

書中總結了優秀撲克選手的決策思路,最重要的我認為是兩點:
1:概率思維:認識到世界是不可知的,只能儘量選擇贏牌概率最大的方案;
2:正確的決策不一定導致好的結果:正確的決策可能導致輸牌,絕不能因此認為決策就是錯誤的;

作者引用了博弈論的基本理論,認為生活中只要有選擇就是在博弈,在賭自己的選擇是最優的,真實的生活更像撲克而不是象棋:自己接下來摸到什麼牌對手摸到什麼牌是未知的,運氣的成分很大,很自然回用結果來判斷決策的對錯(但這是不對的),賭徒的概率思維在生活中是最優選擇。

書中還給出跟概率思維相反的常見思維誤區:動機性推理、自利性偏差、偏見盲點、確認性思維、時間貼現、事後偏見等。

作者也給出了讓大腦逐步跳出思維誤區適應概率思維的一些方法,比如參加求真小組,小組內討論問題嚴格區分情緒、決策、結果,重點討論決策過程是不是最優而不關注情緒和結果。

作者自己兒子考試成績不好,總是習慣性地怪罪老師不好,作者用這個例子說明這種失敗了怪別人的思維誤區是人類天性,認識到這一點才能更好地幫助他人。

上面我說的概率思維,書中大部分時候叫做“對賭思維”,個別地方叫概率思維。書中頻繁出現“對賭”這個詞,根據上下文來看,基本確定就是英文“bet”也就是賭博。

總體評價4星,非常好。

 

以下是書中一些內容的摘抄:

1:一段時間後,這些世界一流的撲克玩家教會了我打牌的本質:面對不確定的未來做決策。將決策視為對賭的啟示使我能夠在不確定的情況下找到學習的機會。我發現,將決策視為對賭使我避免了常見的決策陷阱,讓我以更理性的方式從結果中學習,並儘可能地在此過程中不受情緒的左右。P前言7

2:當我剛開始玩撲克時,有經驗的玩家讓我警惕以結果為導向的危險,告誡我不能僅僅因為眼前的幾手牌沒有打好就要去改變策略,要抵制這種誘惑。P4

3:現在我們花一點時間,先回想一下去年你做過的最佳決策是什麼,再想一想最差決策是什麼。我敢打賭,你的最佳決策帶來了一個好結果,而最差決策導致了一個壞結果。P4

4:我們在日常生活中做出的決策,無論是關於商業、儲蓄、消費、健康、生活方式、養育子女,還是人際關係的決策,都相當符合馮·諾依曼對“真正的博弈”的定義。它們涉及不確定性、風險和偶爾的欺詐,這些都是撲克遊戲的主要元素。P19

5:這就是象棋,但現實生活並非如此。現實生活更像撲克,所有這些不確定因素都給了我們欺騙自己和曲解資訊的空間。對於一些我們從未發現的錯誤,撲克給我們保留了餘地。因為一旦贏了牌我們就不會再去追究自己的錯誤;在所有決策正確但仍然輸牌時,撲克也允許我們將失敗的結果當作決策失誤的證明。P21

6:優秀的撲克玩家和英明的決策者之間的共同之處就是他們都接受這樣一個事實:我們的世界是無常的和不可預知的。他們清楚,自己幾乎不可能確切地知道某件事情將會如何發生。他們接受這種不確定性,並試圖弄清這種不確定的程度,而不是專注於如何才能確定。P27

7:有很多原因可以解釋為什麼接受不確定性並給它一個熱烈的擁抱會幫助我們成為更好的決策者。這裡提供兩個例子。首先,“我不確定”僅僅代表一種對世界更準確的描述;其次,當我們接受了自己對某事物無法確定的時候,就不容易陷入黑白思維的陷阱。P28

8:無論何時我們做出育兒選擇(關於紀律、營養、學校、育兒理念,居住地的選擇等)都是在“博弈”。我們認為這些選擇將實現我們為孩子設計的未來,並且它們要優於我們可能會做出的任何其他選擇。因為有限資源的限制,我們必須分配我們的時間、金錢和注意力。P46

9:在做大部分決策時,我們並不是在與另一個人對賭。確切地說,我們是在與所有我們放棄選擇的各種預期版本的自我進行對賭。P46

10:如何才能確定我們做出了最正確的決策呢?如果另一種選擇會給我們帶來更多的快樂、滿足或金錢呢?很可惜,答案是:我們無法確定。因為有一些我們無法左右的事物(運氣)在影響著結果。我們想象的結果僅僅是一些尚未發生的可能性。47

11:令人驚訝的是,一個人越聰明他的盲點偏見就越大。研究人員通過對受試者進行了七種認知偏差測試後發現,認知能力對偏見盲點沒有絲毫的減弱作用。而且,那些意識到自己偏見的人並不能更好地克服它們。事實上,在這七項測試中的六項結果顯示,“認知能力更好的參與者表現出了更大的偏見盲點”。P65

12:獲得經驗和成為專家之間有著很大的差異。這種差異在於能否識別決策結果何時會帶來學習機會,以及學習內容是什麼。P81

13:如果生活更像象棋而不是撲克,那也許我們就能以更理想的方式進行學習。由於不確定性的減少,結果質量和決策質量之間的聯絡會更加清晰。P83

14:我們應對結果的方式有著可預見的模式:把好的結果歸功於自己,把壞結果歸咎於運氣,所以我們自己並沒有錯。這樣做的結果是我們無法從經驗中進行有效的學習。“自利性偏差”(self-serving bias)是這種區分結果模式的術語。P92

15:不幸的是,通過觀察他人來學習也同樣充滿了偏見。就像我們會模式化地對自己的決策結果進行區分一樣,對於同行們的決策結果我們也早就事先確定了區分的方式。與對待自己的決策結果一樣,我們也採用了同樣的非黑即白思維來區分他人的結果,不同的是我們反轉了劇情。P101

16:但是艾維不是這種人。對他來說,從錯誤中學習的機會比利用晚餐來慶祝自己的勝利重要得多。他剛剛在一場漫長的世界級撲克競賽中贏得冠軍以及50萬美元的獎金,但他只想和另一名職業玩家討論如何才能做出更好的決策。P111

17:《習慣的力量》(The Power of Habit)一書中提供了一種改變習慣的黃金法則——應對習慣的最佳方式是尊重習慣迴路:“想改變一種習慣,你必須保持原有的提示,兌現原有的獎勵,但要新增新的常規。” P112

18:動機性推理和自利性偏差是深深紮根於我們大腦運作方式的兩種思維習慣。我們在確認性思維的形成上投入巨大,而且總是在毫無知覺的情況下就陷入這些偏見的陷阱中。確認性思維很難被發現也很難被改變,而且當我們試圖改變它時會發現,它也很難實現自我強化。通過對賭思維來獎勵自己是一種辦法, P139

19:我親身體驗了團體認同重塑個人思維習慣的力量。我的進步和提高得益於以下幾個方面的努力嘗試:成為最好的不吝嗇於肯定他人的人,成為最勇於承認錯誤的人,以及成為最善於在好結果中發現錯誤的人。P139

20:在我的職業生涯早期,我的撲克小組告訴我輸牌時避免受到自利性偏差影響的方法是預先設定一個“損失限額”——他們建議當我在牌局中輸掉600美元時就離開牌桌。給我建議的那些聰明的、經驗豐富的玩家知道,在輸牌時人往往會變得不夠理性,因此在分析自己輸牌原因(運氣糟糕還是發揮失常)的時候很容易會出現差錯。P143

21:首先,異端學會的研究表明,人們會自然而然地傾向於同質性和確認性思維。我們都有被與我們想法接近的人吸引的經歷。完全為追求真理而培養的科學家們也不能對此免疫。P154

22:根據該論文,CUDOS的含義如下:C(Communism):共有性(資料屬於團體)。U(Universalism):普遍性(主張和證據無論出處均適用統一標準)。D(Disinterestedness):無私利性(對影響團體評估的潛在衝突保持警惕)。O(Organized)S(Skepticism):有條理的懷疑性(團體討論鼓勵參與和異議)。如果你想選擇一個制定團隊參與規則的參考範例,默頓提出的規範無疑是最好的。P160

23:另一種將資訊與信使分離的方式是,想象資訊出自我們重視程度不同的來源。當我們喜歡的某個人告訴我們某個資訊時,試想一下我們討厭的某個人告訴我們同樣的資訊,反之亦然。P170

24:在使用我打過的牌局作為例證時,我只會講到決策環節,不會更進一步透露牌局結果。我的撲克團體就是這樣訓練我的。P174

25:我通常都會發現,在切換立場進行辯論或嫻熟地為異議進行辯護之後,在某個問題上觀點相距甚遠的兩個人都會逐漸向中間靠攏。P176

26:我們應該鼓勵懷疑主義並在可能的情況下將其付諸實踐。“魔鬼擁護者”(devil's advocate)一詞是從幾個世紀以前天主教會在封聖程式中聘請人來對聖徒地位提出反對意見的實踐中發展而來的。就像美國中央情報局有紅色突擊隊以及國務院有異議渠道一樣,我們可以將異議納入我們的職業和個人生活中。P178

27:我的兒子非常善於把糟糕的考試成績歸咎於老師。我必須小心謹慎地以避免重複萊特曼的錯誤。我會對他說:“有這樣的老師一定讓你感到很難過吧。你認為應該怎麼做才能改善今後的成績呢?”這種方式立即確認了孩子的看法,而且引發了有效的話題討論,P183

28:這種我們都不得不以犧牲未來自我為代價來滿足當前自我的傾向被稱為時間貼現(temporal discounting).我們寧願非理性地得到大打折扣的立即獎勵也不願意等待一段時間來獲得更大的延時獎勵。一個成人時間貼現的例子來自20世紀90年代關於軍事縮編的一項研究,該縮編導致成千上萬的軍人以極低的折扣率選擇一次性付清退休金而不是有保障的年金支付。P190

29:商業記者和作家蘇茜·韋爾奇(Suzy Welch)開發了一款名為10-10-10的流行工具,它具有將未來的我們帶入自己當前決策的效果。“每一個10-10-10的過程都會以一個問題開始·.....”“我的每一次選擇在10分鐘/10個月/10年內分別得到了什麼結果?”這一系列問題觸發了提示責任性對話。P196

30:這樣一來,水手們可以安全地行船而免於受到歌聲的影響,同時奧德修斯也可以在不危及船隻的情況下欣賞塞壬的歌聲。這個計劃完美無缺。這種行為——利用過去的我們阻止現在的我們做出蠢事——被稱為尤利西斯合約(Ulysses contract)。P210

31:投資顧問會採用這種方式與客戶討論他們的目標。他們會提前與客戶確認在何種情況下應該針對特定股票進行買入、賣出、持有或壓低頭寸。如果客戶稍後想要做出情緒化的決定(如涉及投資價值的突然上升或下降),顧問就可以提醒客戶之前進行的討論和達成的一致意見。P212

32:那些在追求目標過程中想象障礙的人更有可能取得成功。這種策略被她稱為“心理對照”(mental contrasting)。她的第一項研究涉及了參加減肥計劃的女性,結果顯示,那些對減肥有著強烈的積極設想的受試者比那些持有負面想象的受試者少減掉24磅(約11千克)。P233

33:事後看來,當時的2%~3%變成了100%,所有其他樹枝,無論多麼粗壯,也都會被忽略掉。這就是事後偏見,概率思維的死敵。P238