資料越多，AI 決策模型越脆弱

阿新 • • 發佈：2021-08-16

資料是構建人工智慧系統必需的關鍵基礎設施。資料在很大程度上決定了 AI 系統的效能、公平性、穩健性、安全性和可擴充套件性。

那麼，用足夠多的資料訓練而來的 AI 系統，能夠做出正確的決策麼？今年 5 月份，medium 上的 Marianne Bellotti 博主發表了一篇名為“AI 正在解決錯誤問題的文章”。在文章中，作者提出一個觀點：在更多資料（資訊）加持下，人類都不一定做出“合適決策”，為什麼要假設 AI 會表現更好呢？

為了論證這個觀點，博主寫道：

“在現實生活中，決策者往往為了節約成本而進行優化決策。但決策畢竟是根據結果來判斷好壞的，在正確分析的基礎上還需要一點運氣。在結果出來之前，即使是在絕佳資料支援下最仔細、最徹底構建的策略也無法保證決策的絕對正確。”

顯然，這一觀點的意思是：決策的過程與其說是對資料的客觀分析，不如說是對風險和優先順序的權衡。

最後，基於上述觀察，作者論證了這麼一個觀點：資料驅動的 AI 模型，在做決策時候，極易受到攻擊。

AI 的方向存在偏差

面對一個難題，分步驟、有條理的解決方案是值得肯定的。有哪些假設？假設如何構建？需要解決的問題？如果這些假設不同，會解決不同的問題嗎？想要解決的問題和結果之間有什麼關係？以上這些子問題，對於決策過程異常重要。

假設訪問更多資料是決策者做出更好決策的關鍵，所以研究者希望餵給系統越多資料，AI 越好的做出決策，擁有更少的負面影響。

在這一假設下，我們理所當然的認為：完美資訊應該自動改善決策過程。考慮到現實，這一假設是錯誤的。

例如，人工智慧可以正確識別內容，但基於該內容做出的決策在很大程度上受到使用者和組織的規範和期望的影響。

顯然，當團隊做出決策時，考慮到各個利益相關者及其激勵因素，改進決策的最佳途徑就不再是獲取更多資料，而是需要加強利益相關者之間的溝通。

這對於問題“從國家層面來看，為了提高 AI 的決策能力，是否需要花費數十億美元來清理資料和增強資料感測器？”有了更好的回答。

畢竟，美國國防部每年在員工身上花費 11-150 億美元，以求他們將資料處理成某種形式。經過數十年的投資、監管和標準制定，我們今天與 1970 年時候的“計算機化的大腦（computerized brain）”提法相比，本質上並沒提高多少。然而，隨著計算機越來越先進，人們也越來越沉迷資料。

資料驅動的脆弱性

談論資料質量的方式具有誤導性。我們談到“乾淨”資料，就好像存在一種資料既準確（且無偏差）又可重用的狀態。其實，乾淨與準確不同，準確與可操作又不同。而無論哪種型別的資料出現問題，都有可能阻礙 AI 模型的開發，或者影響 AI 模型做決策。

資料出問題的方式有很多，例如：資料實際上不正確、已損壞或採用錯誤格式。還有些更微妙的錯誤：資料是在特定上下文中獲取的，但重用的時候不恰當；資料沒有標準化導致相同的事情，表達方式不一；對於模型來說資料處於錯誤的粒度級別......

對於上述問題，僅使用單一資料來源是無法解決的。如果有攻擊者試圖往模型、系統中注入“錯誤”，那麼這些問題更不可能解決了。

AI 雖然創造了新機會，但我們也不能忽略它的脆弱性。換句話說，AI 帶來新解決方案的同時，也發明了新攻擊方法。例如 Deepfake、衛星資料的“位置欺騙”等。這些“有毒”技術正在和“良善”技術一起進步。

當前的 AI 系統完全依賴資料質量，雖然技術已經比較成熟，但這種設計方案極易受到攻擊。因此在這種情況下，AI 系統必須被設計成能夠靈活應對不良資料的模型。讓 AI“反脆弱”是一種抵禦攻擊風險的方式。

什麼是反脆弱人工智慧？

在系統思維中，“反脆弱”是一種設計，不僅可以從故障中恢復，而且在遇到故障時更加強大、更有效。基於實際改善決策的因素構建 AI 系統將為反脆弱人工智慧創造機會。

認知科學的研究中提到，良好的決策是：主動闡明假設、構建假設檢驗驗證這些假設以及在利益相關者之間建立清晰的溝通渠道的產物。

許多引發人為錯誤的認知偏差都是上述三方面出現問題的結果。例如沒有清楚地闡明假設，就將解決方案應用於不合適的環境條件；不測試假設，就無法根據不斷變化的條件來調整正確的決策。

AI 很容易受到不良資料的影響，因為我們過分強調了它在分類和識別方面的應用，而低估了它在建議和情境化方面的應用。然而，決策型 AI 又非常容易被破壞。

設計反脆弱 AI 非常困難，因為將演算法分析的結果作為結論和作為建議，這兩者之間有很大的差別。而決策者，為了節省精力非常有可能一股腦的將 AI 輸出作為結論。這種想法，已經在刑事司法和警務領域造成了災難性的錯誤。

那麼在醫學中，為什麼 AI 能夠提高決策質量？因為，許多診斷並沒有單一的正確答案，某種症狀背後可能對應多種疾病，到底患有哪種疾病，可能只是概率問題。臨床醫生會在頭腦中建立一個決策樹，其中包含他能想到的所有可能病因，並讓病人做排除某些可能病因的測試。因此，醫學診斷是一個“定義假設、檢驗測試、進一步縮小可能病因集”的迴圈過程，直到決策收斂。

這時候，AI 決策模型的作用是提示醫生將可能的疾病型別納入他的決策樹，所以儘管可能資料不佳，但患者的治療效果卻有所改善。目前，這種 AI 已經在用於改善醫療專業人員之間的溝通和知識共享，或在關鍵時刻從患者那裡獲得新的相關資訊。

使用 AI 進行決策的正確姿勢

在決定如何最好地利用人工智慧時，技術領導者需要首先考慮他們如何定義需要解決的問題。如果 AI 是改善決策，那麼 AI 應該引導決策者進行假設檢驗，而不是試圖超越專家。

當 AI 試圖勝過專家，它完全取決於接收到的資料的質量，從而產生了一系列漏洞，攻擊者可以輕鬆地利用這些漏洞。

當人工智慧的目標不是成為最好的頂級專家，而是加強和支援決策實踐時，其對不良資料具有彈性並能夠具有反脆弱的功能。

但這樣的人工智不能做決定。相反，它幫助人們闡明決策背後的假設，將這些假設傳達給其他利益相關者，並在與這些假設相關的條件發生重大變化時提醒決策者。

綜上，人工智慧可以幫助決策者弄清楚什麼狀態是可能的，或者在什麼條件下它們是可能的。這樣的解決方案可以通過解決現有弱點來增強決策團隊的整體能力，而不是因不良資料產生一些新的弱點。

資料越多，AI 決策模型越脆弱

AI 的方向存在偏差

資料驅動的脆弱性

什麼是反脆弱人工智慧？

使用 AI 進行決策的正確姿勢

資料越多，AI 決策模型越脆弱

跳槽漲薪越多，你心裡越慌

訊息越傳越多，蘋果 iPhone 摺疊屏、全面屏將更早推向市場

ofo 小黃車推出“拉好友，幫你退押金”活動：邀請好友越多，退押金越快

【備戰昆明站】0307 做題越多，悲傷越多（cf775+上海站的題目）

復旦教授打網約車 800 餘次調研報告：智慧手機越貴，接單車型越貴

自定義UICollectionViewFlowLayout實現橫向滾動時，離中心點越近，item越大，離中心店越遠，item越小的效果

歷時 7 年研究結果出爐：學歷越高，大腦退化可能越慢

清華校友陳怡然、楊越組隊進軍 AI 晶片市場，成立蘋芯科技，最新 Pre-A 輪斬獲近千萬美元

訊息稱人才流失嚴重，育碧加拿大將為員工加薪：工資越高加得越多

原神發明幀率乘區？為什麼電腦幀率越高，凌人出刀次數越多？

機器越“智慧”，資料標註員越容易被淘汰？丨曼孚科技

使用執行緒池+CountDownLatch 實現多執行緒協同工作結果彙總（適用於資料運算分析，資料庫操作，網頁爬蟲）

有了資料湖探索服務，企業決策“新”中有數

7599 元起，戴爾靈越 7300 輕薄本上架：11代酷睿處理器，9月30日開售

戴爾釋出新款靈越一體機，搭載 11 代酷睿

# Markdown學習 ## 1.標題怎麼寫用#（幾級標題幾個＃字型越小#越多）+空格+標題名稱 ## 2.字型粗體： +文字+ 效果粗體斜體：* +文字+

資料分析告訴你，AI論文怎麼投

行為分析(商用級別)01 - 所有資源連結分享：論文，原始碼，資料集，預訓練模型等

報告稱手機越貴打車越貴，滴滴客服迴應：並不存在蘋果手機打車貴情況

資料越多，AI 決策模型越脆弱

AI 的方向存在偏差

資料驅動的脆弱性

什麼是反脆弱人工智慧？

使用 AI 進行決策的正確姿勢

相關推薦