1. 程式人生 > >第二節 知識表示與知識建模

第二節 知識表示與知識建模

一、 早期知識表示簡介

1.  知識特性:相對正確性、不確定性、可表示性、可利用性

2.  知識分類:常識性知識、領域性知識(作用範圍);事實性知識、過程性知識控制知識(作用及表示);確定性知識、不確定性知識(確定性);邏輯性知識、形象性知識(結構及表現形式)

3.  早期知識表示方法:一階謂詞邏輯(例:has_son(X,Y))、產生式規則(IF---THEN---置信度CF)、框架、語義網路(節點-弧-節點)、邏輯程式、預設邏輯、模態邏輯

Horn邏輯,一階謂詞邏輯的子集

原子Atom:P(t1,t2..,tn)  

規則Rules由原子構建:


has_child(X,Y):-has_son(X,Y)           

事實是沒有體部和變數的規則     has_child(Helen,Jack):-

描述邏輯:一階謂詞邏輯的可判定子集,用於描述概念和屬性

概念:一個領域的子集 {x|Student(x)}

關係:該領域上的二元關係 {<x,y>|friend(x,y)}

個體:一個領域內的示例 {XiaoMing}

TBox:包含內涵知識,描述概念的一般性質,例:Mother、Person、has_child

ABox:包含外延知識,描述領域中的特定個體,例:Mother(Helen)

 框架

在框架理論中,框架就是知識表示的基本單位

組成:槽:用於描述所論物件某一方面的屬性

          側面:用於描述相應屬性的一個方面


優點:描述完善和全面,質量高,允許數值計算

缺點:成本高,對知識庫的質量要求非常高,表達形式不靈活,難與其他形式資料集關聯使用。

 產生式模式:


優點:自然性、模組性、有效性、清晰性

缺點:效率不高(規則庫龐大、匹配費時),不能表達具有結構性的知識

語義網路

節點:表示各種事物、概念、情況、屬性、動作狀態等,每個節點可以帶有若干屬性;

弧:表示各種語義聯絡,指明它所連線的節點之間某種語義關係。


二、 基於語義網的知識表示框架

知識表示(representation)

Ø  什麼是RDF(資源描述框架,Resource Description Framework)?

Resource:頁面、圖片、視屏等任何具有URI識別符號

Description:屬性、特徵和資源之間的關係

Framework:模型、語言和這些描述的語法

在RDF中,知識總是以三元組(triple)形式出現:(主,謂,賓)

RDF也是一個圖模型(節點-邊-節點),資源和屬性用URI標識(可以理解為ID)

RDF允許空白節點,一個資源可以是匿名的即不被URL標識(_:X),例,haofen是某一次KG講座的講者


RDF是資料模型(RDF/XML、Turtle、N-Triples),不是序列格式化




封閉世界假設-開放世界假設

例:(CCF ADL,speaker,Haofen)並不意味著CCF ADL講座只有一位講者,而是CCF ADL

講者至少有一位講者

帶標註RDF:時間、不確定性、空間、信任等

RDF和RDFS(RDF Schema)

RDFS為RDF模型提供了一個基本的型別系統,是在RDF基礎上提供了一個術語、概念等的定義方式,以及哪些屬性可以應用到哪些物件上。

知識查詢:

SPARQL簡介

是RDF的查詢語言,可以對不同的資料集撰寫複雜的連線,由所有主流資料庫支援







本體可以填充知識與查詢之間的語義間隙