知識圖譜的筆記之一(1)
好記星不如爛筆頭,而且最近由於專案的需要,看了一些知識圖譜的資料,突發奇想在這裡記錄下自己的學習過程,剛開始寫會有很多的缺陷,還請讀者給出寶貴的建議;下面就言歸正傳,開始寫筆記了。
在我們在百度裡面搜尋知識圖譜,都會從Google在2012年釋出的一篇部落格的開始說起的,然後開始講解未來搜尋引擎的發展等等之類的東西。通過最近看的資料,我發現其實知識圖譜起源並不是從Google那篇的部落格,我目前看到的資料在2008年國內就有相關資料《科學知識圖譜的發展歷程》(目前我看到最早的)。所以這裡關於Google提出知識圖譜之後的發展,我在這裡不做講解可以參考其他網站。 我這裡先從知識庫和知識圖譜的區別開始。
知識圖譜和知識庫的概念:
知識圖譜本質上是一種語義網路。其結點代表實體(entity)或者概念(concept),邊代表實體/概念之間的各種語義關係。知識圖譜(或者知識庫)可以看做是服從於本體(Ontology ) 控制的知識單元的載體,即本體(Ontology )是蛋糕的模具,Knowledge Base 是蛋糕。知識圖譜是基於圖的資料結構,它的儲存方式主要有兩種形式:RDF儲存格式和圖資料庫(Graph Database)。
知識庫是知識工程中重中之重結構化,易操作,易利用,全面有組織的知識叢集,是針對某一(或某些)領域問題求解的需要,採用某種(或若干)知識表示方式在計算機儲存器中儲存、組織、管理和使用的互相聯絡的知識片集合。這些知識片包括與領域相關的理論知識、事實資料,由專家經驗得到的啟發式知識,如某領域內有關的定義、定理和運演算法則以及常識性知識等。
知識庫就是一個關於相關領域的資料庫。知識圖譜是一個用圖的形式表示和儲存的資料庫。我在這裡理解為知識圖譜是知識庫的升級版。這樣理解的原因如下:
1、知識庫通常使用是關係型資料庫,但是不代表知識庫不能將知識用圖的形式展現出來。記得我們在建立關係型資料庫之前都要畫E—R圖。
下班了,先寫到這裡!