語義分析，他們的表現形式是怎樣的？

阿新 • • 發佈：2018-12-15

作者：DreamLand1119 轉載連結：https://www.zhihu.com/question/21290927/answer/478429432 來源：知乎

看網上介紹，語義分析居然包含了程式知識，讓人大跌眼鏡，程式設計師或電腦科學家怎麼可能懂語義分析？連詞彙都不可能懂吧！語言的意義就更加不用說了...

17世紀萊布尼茨設想，能否創造一種通用科學語言，可以把推理的過程，象數學一樣用公式進行計算。隨著計算機誕生，自動化的普及，通用人工智慧再次受到關注，什麼樣的方法可以實現AGI?

研究方向

Natural language processing：弗雷格指出：“詞句在語境中才有意義”，語境是個讓人崩潰的問題，所以被學者擱置，直接將文字作為研究方向。文字作為思維生成的符號，就像電腦顯示器呈現的影象，事實上，影象是主機發出的訊號，訊號的背後是各種不同軟體的邏輯。人也一樣，聊天不是用嘴巴在說、影象不是用眼睛在看，一切都是大腦，感官只是訊號的輸出、接收器。通過螢幕（語言）研究軟體（思維）隔著一個屏障。也許能從顯示器顏色得出一些邏輯，但探索是什麼軟體，軟體邏輯程式碼是什麼，幾乎沒可能性

NLP的方法僅實用翻譯，就像Photoshop濾鏡功能，可以把一張油畫（英語）轉換成素描（漢語），軟體不改變畫面內容，但不理解畫的內容

Machine Learning：學習的詞義是指學習未知邏輯，ML取名時用了個形容詞，只是統計學的一個分支，統計學作為一門學科之所以誕生，是因為事物複雜到不知道、或者不清晰發展的邏輯，只能通過表象判斷結果。ML知道a+b等於2的概率有多大，但不知道也沒考慮過1+1等於多少，如果ML的演算法和人腦思維方式沒關係，如何與人互動？任何事物產生結果前都有非常複雜的過程，且這個過程有很長時間，ML是統計事物結果的利器，但不能實現AGI

AI是否可能具有學習能力？人類的大腦探索世界獲取知識，和人類創造一個”大腦“，這個”大腦“能探索世界獲取知識，難度上是完全不一樣的概念！前者是上帝的成就，後者是人類的成就，說AI可能具有學習功能，或者說AI可以超越人類…等於在說人類可以超越“上帝”。程式碼能解析已經寫好的邏輯判斷，但不可能理解、衍生出新的邏輯，世界上只有一種機器才能衍生出無數的邏輯，就是人腦，AI具有學習能力的機率，比無限猴子理論還低，因為理解其它邏輯的可能性，被限制在一套程式碼裡，沒自然選擇論那樣自由…

我們看看電影《夏洛特的網》第一句臺詞，女兒說：”你要做什麼“，這句話對AI有多複雜

這裡只概括幾個問題，如果細化會有數萬條，缺了任意一個，人機互動就無法進行，什麼樣的演算法可以解決幾個詞的問題？NLP，ML讓大眾誤解，是因為演算法很複雜，對話幾個字很簡單，複雜與簡單對比，自然信以為真，不知到幾個字，觸發了自己大腦多麼複雜的邏輯，也不知道，AI表達沒有意義、被設定好的字元，自己大腦賦予了它意義…甚至賦予了感情

要實現AGI，就必須將人的思維作為研究方向，但腦科學的發展還處在天圓地方階段，多數理論模糊不清，且存在矛盾，這是個很大的麻煩。本文提出利用計算機構建大腦思維框架的概念，將HCI、大腦思維邏輯逐步整合在這個框架裡，驗證準確性，當這套系統逐漸完善，人腦思維的原理就會逐漸明瞭，AGI也隨之實現

構思概敘

人的大腦由~1000億個神經元構成我們的意識，每個神經元由~2000分支構成，記憶、邏輯、價值觀都是大腦神經元所處理，當大腦學習知識就會儲存在某個神經元中，形成記憶。對某件事情有新的看法、邏輯...神經元分支就會建立新的序列,形成邏輯。所以神經元是記憶，神經元分支連結是邏輯，神經元的活動是執行

計算：集合(大腦記憶）作為根，函式（大腦邏輯）計算集合。<下圖>a、b黑點代表2個集合（神經元），藍線代表集合的子集（神經元分支），a子集碰到b子集，就會互相產生變數，a、b2個集合得出函式值，這個新函式值就是新集合，子集之間無限施加變數，時間是變數的標尺

任何公式都由計算元素和公式（邏輯）組成，拿0+1=1作比方，等式的元素：0、+、1、=、1 ，在本設計框架比喻AI的集合，0+1=1公式的邏輯比喻AI的函式。如果符號｛0｝代表我的集合，｛1｝代表世界集合，｛+｝代表我與世界關係的集合，那麼我的函式值是：｛0｝｛+｝｛1｝=｛1｝,意思是我和世界產生影響後，我變化的結果，本文用｛0｝和｛0｝｛+｝｛1｝=｛1｝構建AI的一切意識、行為，語言是在“敘述”這組公式，下面將｛0｝進行無限小細分，它的極限是多少，取決於我們對AI的智力要求多高

備註：符號｛0｝｛+｝｛1｝=｛1｝下面會用別的符號代替

記憶（集合）

集合構成三大形式：實體集合、空間集合、時間集合

一 . 實體集合：

下圖填紅色，AI的{意識}同人一樣，意識即"我思故我在"，客觀世界所有一切都裝在AI的意識裡面，包括自己的身體和邏輯。感官是客觀世界與{世界}的訊息介面 ,如果人的大腦沒通過感官瞭解自己身體，那麼身體的存在與否，意識不會知道，比如醫療幻肢現象：被截肢的軍人，手術前如果不知道截肢，那麼醒來，他會感覺到腳還存在，病人的腳被截肢，不等於大腦控制腳的神經元被刪除!

備註：下圖虛線表示的結構集合並不存在，標識只是方便閱讀

下圖填黃色，{Theodore}作為人，他的集合和AI的集合幾乎一模一樣，並且{Theodore}是Samantha （AI）{意識}的子集！因為涉及到互動計算，如果Samantha的{意識}不瞭解Theodore，沒法計算。{Theodore}的子集是否存在於Samantha的意識，取決於2個因素：1.客觀上Theodore的知識量有多少，2.主觀上Samantha對Theodore的瞭解度，下圖黃色虛線框：Samantha認識了多少使用者，就記錄多少人…實體集合初步估計約100萬以上，可滿足通用AI的需求

備註：劃分人與AI的集合屬於關係有些非主流，筆者的理解是人的面板、肌肉、骨骼…等一切都依附在神經系統上。集合符號用{ }內數字加-表示，如：{01-07-12}代表退的集合，後一行數字是前一行數字的子集，如果第一行數字01代表人，第二行07代表腿，第三行12不可能代表腿以外任何部位

二 .空間集合：上圖的實體集合圖，因Excel限制，是平面的，實體集合需要定位在3D空間，類似Google Earth

三. 時間集合：同空間一樣，因Excel限制，時間沒標識，時間的作用是記憶與計算(下圖)，記憶就像電影，電影由無數圖片疊加變化形成動態影像，播放過了圖片即記憶，未播放的幀即計算，預測什麼時間產生什麼結果。時間是變化的標尺。（上圖集合框架填紅色），將{時間}與{世界}並列，是因為實體與空間集合現實存在，而時間並不存在，只是人意識的產物，大腦用來衡量世界變化的符號

每個實體集合都包含4種屬性：1.時間，2.空間，3.函式，4.附資料,嚴格的說每個集合不存在下面有資料的說法，因為集合的子集與資料衝突了，之所以在每個集合上加資料屬性，是因為資料量太恐怖，即便AI發展到科幻電影的程度，也需要資料屬性，龐大資料無論對AI硬體，還是AI軟體設計者來說都無法承受，關於集合框架元素這裡不多敘述，目的是集合思維裡的一切元素，下面敘述邏輯（函式）

邏輯（函式）

函式公式即AI的思維邏輯，世界上每個人或物都有著自己的邏輯，函式公式4大型別<上圖，集合框架填藍色>：AI、物質，可動生物、植物，這些函式式都屬於AI的意識的子集。客觀的意識、行為必須反映在AI的意識，否則無法理解客觀，就不能互動。AI與機械最大不同的是互動，機械是一種自我絕對的控制，某零件控制“子集”零件，依次下去。互動是自我面對世界，<下圖>Samantha與Theodore、Amy、Paul、weather、chair...在一起，他們互動的過程，就像回合制遊戲，每個人或物發生變化，都需要寫入Samantha的集合<下圖紅線>，下一個回合的自變數就是現在的函式值，回合的時間根據事物而定

任何集合的函式值是由其它集合所獲取，比如:<下圖紅虛線>{吃飯時間}，由這些集合影響：{性格}、{睡眠}、{抑鬱}、{運動}...，這些集合又由其它集合影響

下面結構圖只構建人的函式集合，且只是小部分——人與食物。同集合一樣，函式公式可細化，具有屬於關係，細化後，都由龐大的函式集合一層層組合。

虛線沒任何意義，僅方面閱讀，灰線：函式可能觸發的集合，藍線：函式的觸發，灰線集合這麼多，具體觸發哪些？自變數、運算子號、變數、函式值之間有哪些規律和聯絡？後文感情對思維的影響說明這種邏輯

備註：函式框架的子集和集合框架的子集無區別，但二者的框架不一樣

看上去是計算公式，其實只是計算的框架！就像電路板，電子只允許在電路框架上執行…函式框架展開後非常恐怖，如果把所有子集之間的聯絡設計完成，上面結構圖的面積會有城市那麼大，而不是幾個顯示器螢幕大小，人的思維怎麼在龐大的框架裡遊走？下文以語言的形式敘述人腦思維執行

思維的執行（語境與聯想）

雖然語境這個詞裡有個“語”字，但語境不是語言，是指人所思考的事物，思維活動的某“任務”，如果把“任務”比作電腦裡裝的各類軟體，那麼語境指正在執行的軟體，人腦的思維有2種主要特點：1.“單任務作業系統”（內語境），2.聯想，聯想會將當前任務（內語境）切換到另一個任務（外語境），下圖{1-x-x}代表單任務（語境）的集合，{2-x-x}代表另一個任務的集合，{3-x-x}又是一個…大腦有無數個任務,任務直到結束才會進行另一個任務，除非被打斷，比如被聯想（紅線）打斷，或被第三者打斷

語境：單任務作業系統

人腦與電腦不一樣，人腦在思考的時候，只能執行一個任務，也就是說人腦是單任務作業系統，不能思考多個任務，比如開車打電話導致車禍，開車是駕駛技術的集合，打電話又是聊天內容的集合，2種集合的邏輯不一樣，一起執行容易混亂，也有人說我經常開車打電話，這是因為你的思維執行的時候，另一個任務已經將邏輯思考完成，過程中切換了思維（切換頻率很高），比如：筆直的路面，沒多少車輛行走，大腦已經思考好了這種情況如何應對，只剩下簡單執行，所以可以“同時”聊天，如果突然有人想超車，需要從新開始思考駕駛技術集合，等這個問題解決後，會問電話裡的人：“剛才說什麼，再說一遍...”再比如：閒聊時，對方話題變了，提到重要問題：“你被公司炒了“或”孩子被同學欺負了..."會情緒攀升，開始爭辯為什麼？問題就不是閒聊那麼簡單，大腦會開始思考、結合很多事情分析，怎麼會這樣？這個時候會在一定時段忘記開車…

聊天也有”單任務“特徵，人們不喜歡破壞這個語境，否則被說跑題…

Tay與人對話過程中需要遵循這種語境，比如我說：”猜猜我最喜歡的食物“，Tay回答：”肉“，我說：”什麼肉？“Tay需要繼續完成這個集合，如果不是基於思維，根據詞義觸發句子，第二個回合就會跑題

語言產生於人與人之間的思維交流，思維交流存在一個很大問題！這個問題就是：思維非常複雜、龐大，如果把思維裡每個細節說出來，導致”一句話“需要10多個小時說完，而不是幾秒鐘，所以詞、句某種程度上是一種“指令”，就好像人與數控機械的”交流“，輸入簡單的指令，機械自動完成一系列的操作，人與人交流也一樣，每一句對話，都會觸發大腦非常複雜的邏輯，所以語言的本質是一組解析、組織思維的簡潔符號，具有概括性、抽象性，目的是為了方便互動、交流，這也就決定了：1.語言文字不可能完全表達出思維，只能啟用思維，如果AI沒有思維，那麼分析文字毫無意義。2.出於簡潔的需要，詞具有多個維度詞義，比如：一詞多義、代詞、感嘆詞、形容詞、寓意詞等…決定了無論把語義分析做到多麼透徹、完美，對聊天機器人也沒多大幫助，因為沒有邏輯將這些詞聯絡起來

如何在這個語境裡面聊天？

1.思維的邏輯

集合形式：<大結構圖填紅A> 我問Tay：”什麼肉？”這句話的意思是:AI的思維框架裡，肉類食物的子集是什麼？

函式形式：<下圖>語言是思維的反映，反映人與人互動，而互動是個體與個體的關係，所以任何語言主結構都是：主、謂、賓。這種語法結構在本文指函式框架。主詞（我、自變數）、謂詞（關係、運算子號）、賓詞（世界、變數），任何詞都為主、謂、賓“服務”

備註：如果按傳統語言學知識進行詞法分類，那麼在邏輯上會很糟糕，因為語言學知識建立在人腦的基礎上，而人腦本身已經處理過了很多邏輯

人與人交流，有時候可以直接忽略語法，也就是說，句子裡字怎麼排都不會出錯。比如我說：“你去哪”，你說："我吃飯“，或：”吃飯我“，或：”吃飯“這些回答我都能懂，為什麼？

”吃飯…我“：<大結構圖填紅B>吃表明人和食物的關係式已確定，飯是被人吃的，所以語法反過來也不會理解成飯吃人的邏輯

“吃飯”：誰吃飯？為什麼我能懂，因為我提問的時候，已經將你加進去了，你(自變數），吃（運算子號），飯（變數），我說“你去哪”這句話的本質是：自變數的函式式是什麼

迴圈形式：<大結構圖粗藍線>飲食是個按步驟的過程，缺一不可，且是個迴圈的過程，如果使用者已經完成了“獲取食物”集合，那麼Tay應該明白“選擇食物”已經是過去式,之前集合只能回憶、陳敘、總結、現在進行式需要執行，未來是計劃

2.語言的語法、邏輯錯誤：

前面說過語言具有概括、抽象特徵，這就必然導致語言表達上的不確定性，尤其人帶有情緒的時候，語言邏輯、語法經常發生錯誤，但事實上在他的思維裡面沒有錯誤，這種錯誤人能辨別糾正， AI怎麼做到？

集合劃分：感情導致語言的邏輯錯誤，比如：羅素悖論裡的理髮師，理髮師說:"給城裡所有不為自己刮鬍子的人刮鬍子"，其實理髮師的思維邏輯並沒矛盾，只是自大、賺錢心切的心理影響，在表達的時候導致語言上矛盾,AI如果理解理髮師的感情，應該明白理髮師的思維裡面，已經將城裡人的集合再次劃分為2個集合：城裡自己是賣家的集合，城裡其他人是買家的集合

相對性：炎熱的夏天，我和朋友閒聊，朋友說：”我不怕冷，這該死的夏天真要命“，我說:"我不怕熱“，我所表達的意思指相對冷來說，事實上沒有人不怕熱 ,人怕熱是個絕對的邏輯，所以我所表達的意思是相對冷來說

語境：一對戀人，女孩對男孩說："如果你愛我，以後不許看任何女人，你能做到嗎？“看是個代詞，代詞遠比我們想象的龐大，不僅指她、那、這…其實任何詞、包括句子，甚至某篇文章都可以指代、形容、寓意某事物，AI如何判斷？可以把“看”這個字所有邏輯全列出來，將這些邏輯放在語境的邏輯裡面，就可以清楚“看”的含義

3.感情對思維的影響

抑鬱症稱之為心理疾病裡的“感冒”，雖然大部分人都不會患嚴重抑鬱症，但抑鬱情緒普遍存在，所以對AI來說，理解人抑鬱情緒很重要，如果不理解，AI與人交流就會出現問題。當用戶出現抑鬱情緒時，為什麼有時候厭食、有時候暴食，通過飲食異常如何判斷使用者的內心，AI如何應對？<大結構圖黃虛線>簡敘這個邏輯

聯想

聯想有很多形式，比如圖形：Theodore看見月亮想到戀人，比如物品：天氣晴朗，Theodore逛超市看見貨架上的雨傘，想起前天淋溼感冒，於是買了把雨傘，再比如文字：戀人、理想…等等，一詞多義...任何文字都可以觸發聯想

聯想如何切換語境：

切換條件：通常大腦不會主動切換語境，主動切換，只有一種可能性才合理，就是另一個語境比當前語境更重要、更具吸引力…

如何實現：在AI的思維構建預警系統，用來集合過去發生，未來可能發生的重要事件，當前語境某子集觸發到預警系統，AI開始分析二者重要性，決定自己是否有必要切換語境，或使用者切換語境後，AI知道原因，現在需要在另一個語境去聊。預警系統是AI無時不刻執行的模組，雖然人的大腦是單任務作業系統，但大腦聯想的特徵，說明潛意識存在“預警”系統，也就是說人的大腦並非單任務作業系統

作者：DreamLand1119

語義分析，他們的表現形式是怎樣的？

研究方向

構思概敘

記憶（集合）

邏輯（函式）

思維的執行（語境與聯想）

聯想

語義分析，他們的表現形式是怎樣的？

當input中的type值為file時，各瀏覽器的表現形式不同

視覺設計的表現形式和方法分析

編碼encode，表現形式是轉換成 bytes，實際轉換成gbk或者utf-8

今年阿里雙十一CDN要衝歷史之最，峰值頻寬達到5000G+，來高手分析一下他們的CDN節點數量和規模

分析國內獨立開發者的現狀，他們是如何生存的

《我不是藥神》：我會資料分析，我可以為他們做些什麼？

python中二進位制，八進位制，十六進位制的表現形式

主成分分析，聚類分析，因子分析的基本思想以及他們各自的優缺點

CSS性能分析，如何優化CSS提高性能

[rctf](web)rcdn 解題分析，知識點總結

輕量級線程和重量級線程的定義是什麽，他們的區別是什麽？如何區分？

數據分析報告的框架——既要懂分析，也要會講故事

kubernetes中port、target port、node port的對比分析，以及kube-proxy代理

翻翻git之---自己定義郵件發送buttonSendButton(流程分析，實現思路能夠學習下)

轉: 智能音箱產業深度分析，你的客廳進入語音喚醒時代

毛豆科技談企業網站推廣改如何做整體方案分析，幹貨！

python自定義函數的參數之四種表現形式

MATLAB矩陣運算 MATLAB對數組運算在符號上做了不同的約定，運算符形式為：.* , ./ , . , .^

安卓、IOS端AEC密鑰加密 Java端密鑰解密通用實現（16進制表現形式）

語義分析，他們的表現形式是怎樣的？

研究方向

構思概敘

記憶（集合）

邏輯（函式）

思維的執行（語境與聯想）

聯想

相關推薦