1. 程式人生 > 其它 >>>人工智慧:知識圖譜基礎知識

>>人工智慧:知識圖譜基礎知識

技術標籤:圖資料庫知識圖譜大資料

本體知識圖譜

本體就是對那些可能相對於某一智慧體(agent)或智慧體群體而存在的概念和關係的一種描述。

​ ——湯姆·格魯伯——《邁向知識共享型本體的設計原則》。

​ 本體從schema的角度來定義(自上向下),而知識圖譜其實更強調的是資料層(自底向上)來構建。對於領域或垂直行業的知識圖譜,一般都需要有本體層。而實體可以定義為本體的某個概念的例項。

​ ——王昊奮老師

本體(ontology)主要應用於:人工智慧、語義網、軟體工程、 生物醫學資訊學、圖書館學以及資訊架構。

本體從分類上來說,分為:

  • 領域本體

domain ontology或者說domain-specific ontology,即領域特異性本體。

所建模的是某個特定領域。如醫學領域的氨基酸本體(Amino Acid Ontology)、細胞週期本體(Cell-Cycle Ontology,CCO)、疾病本體(Disease Ontology)等。

  • 上層本體

​ upper ontology或者說foundation ontology,即基礎本體。
指一種由那些在各種各樣的領域本體之中都普遍適用的共同物件所構成的模型。其中所收錄的核心詞表,可以用來描述一套領域當中的物件。如openCyc。

  • openCyc

​ 是一個致力於將各個領域的本體及常識知識綜合地整合在一起,並在此基礎上實現知識推理的人工智慧專案。其目標是使人工智慧的應用能夠以類似人類推理的方式工作。Cyc知識庫中表示的知識一般形如“每棵樹都是植物”、“植物最終都會死亡”。當提出“樹是否會死亡”的問題時,推理引擎可以得到正確的結論,並回答該問題。

常見的本體要素有:

  • 個體(例項):基礎的或者說“底層的”物件。

  • 類:集合(sets)、概念、物件型別或者說事物的種類。

  • 屬性:物件(和類)所可能具有的屬性、特徵、特性、特點和引數。

  • 關係:類與個體之間的彼此關聯所可能具有的方式。

  • 函數術語:在宣告語句當中,可用來代替具體術語的特定關係所構成的複雜結構。

  • 約束(限制):採取形式化方式所宣告的,關於接受某項斷言作為輸入而必須成立的情況的描述。。

  • 規則:用於描述可以依據特定形式的某項斷言所能夠得出的邏輯推論的,if-then(前因-後果)式語句形式的宣告。

  • 公理:採取特定邏輯形式的斷言(包括規則在內)所共同構成的就是其本體在相應應用領域當中所描述的整個理論。這種定義有別於產生式語法和形式邏輯當中所說的“公理”。在這些學科當中,公理之中僅僅包括那些被斷言為先驗知識的宣告。就這裡的用法而言,“公理”之中還包括依據公理型宣告所推導得出的理論。

  • 事件(哲學):屬性或關係的變化。

其他關於本體的概念,參考Google:https://googleblog.blogspot.com/2012/05/introducing-knowledge-graph-things-not.html

舉個例子,我們檢視章子怡參演的電影:

match (p:Person{name:"章子怡"})-[r]-(q) return r,p,q