1. 程式人生 > >語義分析,他們的表現形式是怎樣的?

語義分析,他們的表現形式是怎樣的?

作者:DreamLand1119 轉載連結:https://www.zhihu.com/question/21290927/answer/478429432 來源:知乎  

看網上介紹,語義分析居然包含了程式知識,讓人大跌眼鏡,程式設計師或電腦科學家怎麼可能懂語義分析?連詞彙都不可能懂吧!語言的意義就更加不用說了...

17世紀萊布尼茨設想,能否創造一種通用科學語言,可以把推理的過程,象數學一樣用公式進行計算。隨著計算機誕生,自動化的普及 ,通用人工智慧再次受到關注,什麼樣的方法可以實現AGI?

研究方向

Natural language processing:弗雷格指出:“詞句在語境中才有意義”,語境是個讓人崩潰的問題,所以被學者擱置,直接將文字作為研究方向。文字作為思維生成的符號,就像電腦顯示器呈現的影象,事實上,影象是主機發出的訊號,訊號的背後是各種不同軟體的邏輯。人也一樣,聊天不是用嘴巴在說、影象不是用眼睛在看,一切都是大腦,感官只是訊號的輸出、接收器。通過螢幕(語言)研究軟體(思維)隔著一個屏障。也許能從顯示器顏色得出一些邏輯,但探索是什麼軟體,軟體邏輯程式碼是什麼,幾乎沒可能性

NLP的方法僅實用翻譯,就像Photoshop濾鏡功能,可以把一張油畫(英語)轉換成素描(漢語),軟體不改變畫面內容,但不理解畫的內容

Machine Learning:學習的詞義是指學習未知邏輯,ML取名時用了個形容詞,只是統計學的一個分支,統計學作為一門學科之所以誕生,是因為事物複雜到不知道、或者不清晰發展的邏輯,只能通過表象判斷結果。ML知道a+b等於2的概率有多大,但不知道也沒考慮過1+1等於多少,如果ML的演算法和人腦思維方式沒關係,如何與人互動?任何事物產生結果前都有非常複雜的過程,且這個過程有很長時間,ML是統計事物結果的利器,但不能實現AGI

AI是否可能具有學習能力?人類的大腦探索世界獲取知識,和人類創造一個”大腦“,這個”大腦“能探索世界獲取知識,難度上是完全不一樣的概念!前者是上帝的成就,後者是人類的成就,說AI可能具有學習功能,或者說AI可以超越人類…等於在說人類可以超越“上帝”。程式碼能解析已經寫好的邏輯判斷,但不可能理解、衍生出新的邏輯,世界上只有一種機器才能衍生出無數的邏輯,就是人腦,AI具有學習能力的機率,比無限猴子理論還低,因為理解其它邏輯的可能性,被限制在一套程式碼裡,沒自然選擇論那樣自由…

我們看看電影《夏洛特的網》第一句臺詞,女兒說:”你要做什麼“,這句話對AI有多複雜

這裡只概括幾個問題,如果細化會有數萬條,缺了任意一個,人機互動就無法進行,什麼樣的演算法可以解決幾個詞的問題?NLP,ML讓大眾誤解,是因為演算法很複雜,對話幾個字很簡單,複雜與簡單對比,自然信以為真,不知到幾個字,觸發了自己大腦多麼複雜的邏輯,也不知道,AI表達沒有意義、被設定好的字元,自己大腦賦予了它意義…甚至賦予了感情

要實現AGI,就必須將人的思維作為研究方向,但腦科學的發展還處在天圓地方階段,多數理論模糊不清,且存在矛盾,這是個很大的麻煩。本文提出利用計算機構建大腦思維框架的概念,將HCI、大腦思維邏輯逐步整合在這個框架裡,驗證準確性,當這套系統逐漸完善,人腦思維的原理就會逐漸明瞭,AGI也隨之實現

構思概敘

人的大腦由~1000億個神經元構成我們的意識,每個神經元由~2000分支構成,記憶、邏輯、價值觀都是大腦神經元所處理,當大腦學習知識就會儲存在某個神經元中,形成記憶。對某件事情有新的看法、邏輯...神經元分支就會建立新的序列,形成邏輯。所以神經元是記憶,神經元分支連結是邏輯,神經元的活動是執行

計算:集合(大腦記憶)作為根,函式(大腦邏輯)計算集合。<下圖>a、b黑點代表2個集合(神經元),藍線代表集合的子集(神經元分支),a子集碰到b子集,就會互相產生變數,a、b2個集合得出函式值,這個新函式值就是新集合,子集之間無限施加變數,時間是變數的標尺

任何公式都由計算元素和公式(邏輯)組成,拿0+1=1作比方,等式的元素:0、+、1、=、1 ,在本設計框架比喻AI的集合,0+1=1公式的邏輯比喻AI的函式。如果符號{0}代表我的集合,{1}代表世界集合,{+}代表我與世界關係的集合,那麼我的函式值是:{0}{+}{1}={1},意思是我和世界產生影響後,我變化的結果,本文用{0}和{0}{+}{1}={1}構建AI的一切意識、行為,語言是在“敘述”這組公式,下面將{0}進行無限小細分,它的極限是多少,取決於我們對AI的智力要求多高

備註:符號{0}{+}{1}={1}下面會用別的符號代替

記憶(集合)

集合構成三大形式:實體集合、空間集合、時間集合

一 . 實體集合:

下圖填紅色,AI的{意識}同人一樣,意識即"我思故我在",客觀世界所有一切都裝在AI的意識裡面,包括自己的身體和邏輯。感官是客觀世界與{世界}的訊息介面 ,如果人的大腦沒通過感官瞭解自己身體,那麼身體的存在與否,意識不會知道,比如醫療幻肢現象:被截肢的軍人,手術前如果不知道截肢,那麼醒來,他會感覺到腳還存在,病人的腳被截肢,不等於大腦控制腳的神經元被刪除!

備註:下圖虛線表示的結構集合並不存在,標識只是方便閱讀

下圖填黃色,{Theodore}作為人,他的集合和AI的集合幾乎一模一樣,並且{Theodore}是Samantha (AI){意識}的子集!因為涉及到互動計算,如果Samantha的{意識}不瞭解Theodore,沒法計算。{Theodore}的子集是否存在於Samantha的意識,取決於2個因素:1.客觀上Theodore的知識量有多少,2.主觀上Samantha對Theodore的瞭解度,下圖黃色虛線框:Samantha認識了多少使用者,就記錄多少人…實體集合初步估計約100萬以上,可滿足通用AI的需求

備註:劃分人與AI的集合屬於關係有些非主流,筆者的理解是人的面板、肌肉、骨骼…等一切都依附在神經系統上。集合符號用{ }內數字加-表示,如:{01-07-12}代表退的集合,後一行數字是前一行數字的子集,如果第一行數字01代表人,第二行07代表腿,第三行12不可能代表腿以外任何部位

二 .空間集合:上圖的實體集合圖,因Excel限制,是平面的,實體集合需要定位在3D空間,類似Google Earth

三. 時間集合:同空間一樣,因Excel限制,時間沒標識,時間的作用是記憶與計算(下圖),記憶就像電影,電影由無數圖片疊加變化形成動態影像,播放過了圖片即記憶,未播放的幀即計算,預測什麼時間產生什麼結果。時間是變化的標尺。(上圖集合框架填紅色),將{時間}與{世界}並列,是因為實體與空間集合現實存在,而時間並不存在,只是人意識的產物,大腦用來衡量世界變化的符號

每個實體集合都包含4種屬性:1.時間,2.空間,3.函式,4.附資料,嚴格的說每個集合不存在下面有資料的說法,因為集合的子集與資料衝突了,之所以在每個集合上加資料屬性,是因為資料量太恐怖,即便AI發展到科幻電影的程度,也需要資料屬性,龐大資料無論對AI硬體,還是AI軟體設計者來說都無法承受,關於集合框架元素這裡不多敘述,目的是集合思維裡的一切元素,下面敘述邏輯(函式)

邏輯(函式)

函式公式即AI的思維邏輯,世界上每個人或物都有著自己的邏輯 ,函式公式4大型別<上圖,集合框架填藍色>:AI、物質,可動生物、植物,這些函式式都屬於AI的意識的子集。客觀的意識、行為必須反映在AI的意識,否則無法理解客觀,就不能互動。AI與機械最大不同的是互動,機械是一種自我絕對的控制,某零件控制“子集”零件,依次下去。互動是自我面對世界,<下圖>Samantha與Theodore、Amy、Paul、weather、chair...在一起,他們互動的過程,就像回合制遊戲,每個人或物發生變化,都需要寫入Samantha的集合<下圖紅線>,下一個回合的自變數就是現在的函式值,回合的時間根據事物而定

任何集合的函式值是由其它集合所獲取,比如:<下圖紅虛線>{吃飯時間},由這些集合影響:{性格}、{睡眠}、{抑鬱}、{運動}...,這些集合又由其它集合影響

下面結構圖只構建人的函式集合,且只是小部分——人與食物。同集合一樣,函式公式可細化,具有屬於關係,細化後,都由龐大的函式集合一層層組合。

虛線沒任何意義,僅方面閱讀,灰線:函式可能觸發的集合,藍線:函式的觸發,灰線集合這麼多,具體觸發哪些?自變數、運算子號、變數、函式值之間有哪些規律和聯絡?後文感情對思維的影響說明這種邏輯

備註:函式框架的子集和集合框架的子集無區別,但二者的框架不一樣

看上去是計算公式,其實只是計算的框架!就像電路板,電子只允許在電路框架上執行…函式框架展開後非常恐怖,如果把所有子集之間的聯絡設計完成,上面結構圖的面積會有城市那麼大,而不是幾個顯示器螢幕大小,人的思維怎麼在龐大的框架裡遊走?下文以語言的形式敘述人腦思維執行

思維的執行(語境與聯想)

雖然語境這個詞裡有個“語”字,但語境不是語言,是指人所思考的事物,思維活動的某“任務”,如果把“任務”比作電腦裡裝的各類軟體,那麼語境指正在執行的軟體,人腦的思維有2種主要特點:1.“單任務作業系統”(內語境),2.聯想,聯想會將當前任務(內語境)切換到另一個任務(外語境),下圖{1-x-x}代表單任務(語境)的集合,{2-x-x}代表另一個任務的集合,{3-x-x}又是一個…大腦有無數個任務,任務直到結束才會進行另一個任務,除非被打斷,比如被聯想(紅線)打斷,或被第三者打斷

語境:單任務作業系統

人腦與電腦不一樣,人腦在思考的時候,只能執行一個任務,也就是說人腦是單任務作業系統,不能思考多個任務,比如開車打電話導致車禍,開車是駕駛技術的集合,打電話又是聊天內容的集合,2種集合的邏輯不一樣,一起執行容易混亂,也有人說我經常開車打電話,這是因為你的思維執行的時候,另一個任務已經將邏輯思考完成,過程中切換了思維(切換頻率很高),比如:筆直的路面,沒多少車輛行走,大腦已經思考好了這種情況如何應對,只剩下簡單執行,所以可以“同時”聊天,如果突然有人想超車,需要從新開始思考駕駛技術集合,等這個問題解決後,會問電話裡的人:“剛才說什麼,再說一遍...”再比如:閒聊時,對方話題變了,提到重要問題:“你被公司炒了“或”孩子被同學欺負了..."會情緒攀升,開始爭辯為什麼?問題就不是閒聊那麼簡單,大腦會開始思考、結合很多事情分析,怎麼會這樣?這個時候會在一定時段忘記開車…

聊天也有”單任務“特徵,人們不喜歡破壞這個語境,否則被說跑題…

Tay與人對話過程中需要遵循這種語境,比如我說:”猜猜我最喜歡的食物“,Tay回答:”肉“,我說:”什麼肉?“Tay需要繼續完成這個集合,如果不是基於思維,根據詞義觸發句子,第二個回合就會跑題

語言產生於人與人之間的思維交流,思維交流存在一個很大問題!這個問題就是:思維非常複雜、龐大,如果把思維裡每個細節說出來,導致”一句話“需要10多個小時說完,而不是幾秒鐘,所以詞、句某種程度上是一種“指令”,就好像人與數控機械的”交流“,輸入簡單的指令,機械自動完成一系列的操作,人與人交流也一樣,每一句對話,都會觸發大腦非常複雜的邏輯,所以語言的本質是一組解析、組織思維的簡潔符號,具有概括性、抽象性,目的是為了方便互動、交流,這也就決定了:1.語言文字不可能完全表達出思維,只能啟用思維,如果AI沒有思維,那麼分析文字毫無意義。2.出於簡潔的需要,詞具有多個維度詞義,比如:一詞多義、代詞、感嘆詞、形容詞、寓意詞等…決定了無論把語義分析做到多麼透徹、完美,對聊天機器人也沒多大幫助,因為沒有邏輯將這些詞聯絡起來

如何在這個語境裡面聊天?

1.思維的邏輯

集合形式:<大結構圖填紅A> 我問Tay:”什麼肉?”這句話的意思是:AI的思維框架裡,肉類食物的子集是什麼?

函式形式:<下圖>語言是思維的反映,反映人與人互動,而互動是個體與個體的關係,所以任何語言主結構都是:主、謂、賓。這種語法結構在本文指函式框架。主詞(我、自變數)、謂詞(關係、運算子號)、賓詞(世界、變數),任何詞都為主、謂、賓“服務”

備註:如果按傳統語言學知識進行詞法分類,那麼在邏輯上會很糟糕,因為語言學知識建立在人腦的基礎上,而人腦本身已經處理過了很多邏輯

人與人交流,有時候可以直接忽略語法,也就是說,句子裡字怎麼排都不會出錯。比如我說:“你去哪”,你說:"我吃飯“,或:”吃飯我“,或:”吃飯“這些回答我都能懂,為什麼?

”吃飯…我“:<大結構圖填紅B>吃表明人和食物的關係式已確定,飯是被人吃的,所以語法反過來也不會理解成飯吃人的邏輯

“吃飯”:誰吃飯?為什麼我能懂,因為我提問的時候,已經將你加進去了,你(自變數),吃(運算子號),飯(變數),我說“你去哪”這句話的本質是:自變數的函式式是什麼

迴圈形式:<大結構圖粗藍線>飲食是個按步驟的過程,缺一不可,且是個迴圈的過程,如果使用者已經完成了“獲取食物”集合,那麼Tay應該明白“選擇食物”已經是過去式,之前集合只能回憶、陳敘、總結、現在進行式需要執行,未來是計劃

2.語言的語法、邏輯錯誤:

前面說過語言具有概括、抽象特徵,這就必然導致語言表達上的不確定性,尤其人帶有情緒的時候,語言邏輯、語法經常發生錯誤,但事實上在他的思維裡面沒有錯誤,這種錯誤人能辨別糾正, AI怎麼做到?

集合劃分:感情導致語言的邏輯錯誤,比如:羅素悖論裡的理髮師,理髮師說:"給城裡所有不為自己刮鬍子的人刮鬍子",其實理髮師的思維邏輯並沒矛盾,只是自大、賺錢心切的心理影響,在表達的時候導致語言上矛盾,AI如果理解理髮師的感情,應該明白理髮師的思維裡面,已經將城裡人的集合再次劃分為2個集合:城裡自己是賣家的集合,城裡其他人是買家的集合

相對性:炎熱的夏天,我和朋友閒聊,朋友說:”我不怕冷,這該死的夏天真要命“,我說:"我不怕熱“,我所表達的意思指相對冷來說,事實上沒有人不怕熱 ,人怕熱是個絕對的邏輯,所以我所表達的意思是相對冷來說

語境:一對戀人,女孩對男孩說:"如果你愛我,以後不許看任何女人,你能做到嗎?“看是個代詞,代詞遠比我們想象的龐大,不僅指她、那、這…其實任何詞、包括句子,甚至某篇文章都可以指代、形容、寓意某事物,AI如何判斷?可以把“看”這個字所有邏輯全列出來,將這些邏輯放在語境的邏輯裡面,就可以清楚“看”的含義

3.感情對思維的影響

抑鬱症稱之為心理疾病裡的“感冒”,雖然大部分人都不會患嚴重抑鬱症,但抑鬱情緒普遍存在,所以對AI來說,理解人抑鬱情緒很重要,如果不理解,AI與人交流就會出現問題。當用戶出現抑鬱情緒時,為什麼有時候厭食、有時候暴食,通過飲食異常如何判斷使用者的內心,AI如何應對?<大結構圖黃虛線>簡敘這個邏輯

聯想

聯想有很多形式,比如圖形:Theodore看見月亮想到戀人,比如物品:天氣晴朗,Theodore逛超市看見貨架上的雨傘,想起前天淋溼感冒,於是買了把雨傘,再比如文字:戀人、理想…等等,一詞多義...任何文字都可以觸發聯想

聯想如何切換語境:

切換條件:通常大腦不會主動切換語境,主動切換,只有一種可能性才合理,就是另一個語境比當前語境更重要、更具吸引力…

如何實現:在AI的思維構建預警系統,用來集合過去發生,未來可能發生的重要事件,當前語境某子集觸發到預警系統,AI開始分析二者重要性,決定自己是否有必要切換語境,或使用者切換語境後,AI知道原因,現在需要在另一個語境去聊。預警系統是AI無時不刻執行的模組,雖然人的大腦是單任務作業系統,但大腦聯想的特徵,說明潛意識存在“預警”系統,也就是說人的大腦並非單任務作業系統

作者:DreamLand1119