人工智能的瓶頸問題與本體論語義學的回應
要回答機器的語義加工何以可能,完成機器對人類自然語言加工的模擬,首先必須解決的問題是:人的自然語言加工何以可能?根據本體論語義學家的研究,所以可能的條件不外是:人類有將它與語言關聯起來的能力,有別的技能,有情感和意誌之類的非理性方面,因為人們賦予語詞的意義常帶有情感色彩。另外,就是活動的目的、計劃及程序,最後就是各種知識資源。
本體論語義學認為,人類之所以能理解和產生意義,最重要的條件就是人類有一種本體論圖式。正是借助它,任何語言一進到心靈之中就有了自己的歸屬,被安放進所屬的類別之中,如聽到了“紅”一詞,人們馬上有這樣的歸類:它指的是屬性,與“綠”“藍”等屬一類,為物體所具有,因而不是物體,等等而是基本概念與範疇。尼倫伯格等人說:“本體論語義學試圖探討的是人們在內省式和反思式地看待概念時對這些概念的運用。人們常常談論屬性。虛構的實在(獨角獸或赫爾墨斯)和抽象的實質,把它們當作存在的。不過對於我們來說,決定把它們放在本體論之中不是根源於這樣的事實,即這些實在是用自然的語言指稱的,而是因為我們相信:由於人們在他們的宇宙中有這些概念因而語言才指稱它們。”[10]因此,在語義機模型中,我們首先要建立的就是這種本體論圖式。根據他們的看法,“本體論提供的是描述一種語言的詞匯單元的意義所需的原語言,以及說明編碼在自然語言表征中的意義所需的原語言。而要提供這些東西,本體論必須包含有對概念的定義,這些概念可理解為世界上的事物和事件類別的反映。從結構上說,本體論是一系列的構架,或一系列被命令的屬性-價值對子。”[11]它為要表征的詞項的意義作本體論的定位,即說明它屬於哪一類存在,其特點、性質、邊界條件是什麽。例如當有一詞“pay”輸入進來,首先就要經過本體論這一環節,換言之,該詞首先要被表征為一個本體論概念,要被放進本體論的概念體系之中,一當這樣做了,它的屬性、值便被規定了。有了本體論概念框架,在這種靜態知識資源上就可以不斷生成各種含有意義表征的動態知識資源。動態的知識資源是在應用所提出的任務、要求的基礎上所產生的知識。
有了關於人類加工自然語言所需條件比較清楚和量化的認識,就有可能通過建立相應的網絡讓計算機也獲得這樣的條件,進而讓機器表現出對意義的敏感,最終具有語義加工能力。本體論語義學相信:這不是沒有可能的,至少有巨大的開發前景。對此,本體語義學進行大膽地嘗試,並建構出典型的語義加工模型。其具體操作就是:先讓加工器具備靜態和動態的知識知源,然後讓其有相應的加工能力。在實踐的基礎上,尼倫伯格等人通過分析公認的自然語言加工Stratified模型,詳細說明了機器進行語義加工的基本原理與過程。
![](http://i2.51cto.com/images/blog/201806/20/f77a4f7f8837e89d69cda8b31caa078a.png?x-oss-process=image/watermark,size_16,text_QDUxQ1RP5Y2a5a6i,color_FFFFFF,t_100,g_se,x_10,y_10,shadow_90,type_ZmFuZ3poZW5naGVpdGk=)
在尼倫伯格等人看來,智能主體要理解文本意義離不開至少六個基本環節的加工。第一步是文本分析,即要對輸入的文本產生一個表征了文本的意義的正式表達式。由這任務所決定,它必須有分析器和生成器。從文本分析過程來說,文本要輸入到系統之中,首先要經過“前加工”將文本加以重新標記,並區別分析不同語言、不同體裁和風格的不同文本,以便讓文本能為系統所分析。第二步是對標記過的文本動用生態學、形態學、語法學、詞匯學的靜態知識資源作形態學分析,形成關於文本單詞的引用形式分辨。例如碰到“書”這個詞的輸入,形態學分析會這樣來分析:“book,名詞,復數”,“book,動詞,現在時,第三人稱,單數”等。第三步就會把它們送給詞匯學分析器,並激活這一分析器的入口。這個入口包含有許多類型的知識和信息,如關於句法的信息,關於詞匯語義學的信息,其作用是檢查、凈化形態學分析的結果。例如英文文本中可能夾雜有法、德、意等語言的單詞,還有一些模棱兩可的單詞,更麻煩的是,有些詞在詞匯分析器中沒有出現過,因此無法予以檢查。在這些情況下,就要予以查檢、甄別,如對不熟悉的詞,它有一些處理的步驟和辦法。第四步是句法分析。第五步是決定基本的語義從屬關系,例如建立未來的意義表征的命題結構,確定哪些因素將成為這些命題的主題,並決定該命題的屬性位置。
在此基礎上,本體論語義學提出了語義加工機的完整構想。尼倫伯格認為,機器要完成文本意義表征,必須有加工器和靜態知識資源。首先第一步,借助靜態知識資源(生態學、句法、形態學、詞匯學、詞源和本體論及事實材料)對輸入文本作出分析,然後又借助這些知識資源產生文本意義表征。分析模塊和語義生成器都離不開靜態知識資源。知識資源是如何得到的呢?要靠學習。“本體論語義學必須涉及到學習:它們越起作用,它們儲存的關於世界的知識就越多,它們可望達到的結果就越好。”[12]除了靜態知識之外,計算機要完成語義表征,還必須有動態的知識,它們是關於意義表征的程序方面的知識以及推理類型的知識。另外,加工器還要有這樣的動態能力,即把所儲存的知識動態地提取出來,運用於知識表征。尼倫伯格等人說“在本體論語義學中,這些目的是通過把文本意義表征、詞匯和本體論關聯起來而實現的。”[13]“我們關於表征文本意義的方案動用了兩種手段,一是本體論概念的例示,二是與本體論無關的參數的例示。前者提供了與任何可能的文本意義表征例示相一致的、抽象的、非索引的命題。這些例示是這樣得到的,即提供了基本的本體論陳述,它們有具體的情境的、包含有參數的值,如方面、方式、共指等。”[14]在這裏,本體論的概念之所以抽象但又必要,主要是因為它提供了對存在和語詞的分類,如對於要表征的意義,它首先要借助這種本體論範疇確定它是屬於物體、屬性、方面、方式、過程、活動、數量中的哪一種。簡言之,對於任一詞的意義或所指,首先要借助本體論概念確定它應包含在哪一類存在範疇之中。在此基礎上,再用非本體論參數分析它的具體的、情境方面的值。
三 特點與問題
本體論語義學與其他人工智能理論、自然語言加工系統相比有自己的一些鮮明特點。其一,它強
以上,陳如初拙見!若有冒犯,請見諒。
責任編輯:Giiso智搜信息技術版權所有:www.giiso.com 轉載請註明出處
人工智能的瓶頸問題與本體論語義學的回應