第二節 知識表示與知識建模
一、 早期知識表示簡介
1. 知識特性:相對正確性、不確定性、可表示性、可利用性
2. 知識分類:常識性知識、領域性知識(作用範圍);事實性知識、過程性知識控制知識(作用及表示);確定性知識、不確定性知識(確定性);邏輯性知識、形象性知識(結構及表現形式)
3. 早期知識表示方法:一階謂詞邏輯(例:has_son(X,Y))、產生式規則(IF---THEN---置信度CF)、框架、語義網路(節點-弧-節點)、邏輯程式、預設邏輯、模態邏輯
Horn邏輯,一階謂詞邏輯的子集
原子Atom:P(t1,t2..,tn)
規則Rules由原子構建:
has_child(X,Y):-has_son(X,Y)
事實是沒有體部和變數的規則 has_child(Helen,Jack):-
描述邏輯:一階謂詞邏輯的可判定子集,用於描述概念和屬性
概念:一個領域的子集 {x|Student(x)}
關係:該領域上的二元關係 {<x,y>|friend(x,y)}
個體:一個領域內的示例 {XiaoMing}
TBox:包含內涵知識,描述概念的一般性質,例:Mother、Person、has_child
ABox:包含外延知識,描述領域中的特定個體,例:Mother(Helen)
框架
在框架理論中,框架就是知識表示的基本單位
組成:槽:用於描述所論物件某一方面的屬性
側面:用於描述相應屬性的一個方面
優點:描述完善和全面,質量高,允許數值計算
缺點:成本高,對知識庫的質量要求非常高,表達形式不靈活,難與其他形式資料集關聯使用。
產生式模式:
優點:自然性、模組性、有效性、清晰性
缺點:效率不高(規則庫龐大、匹配費時),不能表達具有結構性的知識
語義網路
節點:表示各種事物、概念、情況、屬性、動作狀態等,每個節點可以帶有若干屬性;
弧:表示各種語義聯絡,指明它所連線的節點之間某種語義關係。
二、 基於語義網的知識表示框架
u 知識表示(representation)
Ø 什麼是RDF(資源描述框架,Resource Description Framework)?
Resource:頁面、圖片、視屏等任何具有URI識別符號
Description:屬性、特徵和資源之間的關係
Framework:模型、語言和這些描述的語法
在RDF中,知識總是以三元組(triple)形式出現:(主,謂,賓)
RDF也是一個圖模型(節點-邊-節點),資源和屬性用URI標識(可以理解為ID)
RDF允許空白節點,一個資源可以是匿名的即不被URL標識(_:X),例,haofen是某一次KG講座的講者
RDF是資料模型(RDF/XML、Turtle、N-Triples),不是序列格式化
封閉世界假設-開放世界假設
例:(CCF ADL,speaker,Haofen)並不意味著CCF ADL講座只有一位講者,而是CCF ADL
講者至少有一位講者
帶標註RDF:時間、不確定性、空間、信任等
RDF和RDFS(RDF Schema)
RDFS為RDF模型提供了一個基本的型別系統,是在RDF基礎上提供了一個術語、概念等的定義方式,以及哪些屬性可以應用到哪些物件上。u 知識查詢:
SPARQL簡介
是RDF的查詢語言,可以對不同的資料集撰寫複雜的連線,由所有主流資料庫支援
本體可以填充知識與查詢之間的語義間隙