1. 程式人生 > >知識圖譜(Knowledge Graph)小結

知識圖譜(Knowledge Graph)小結

知識圖譜(Knowledge Graph)小結

一、知識圖譜(Knowledge Graph)主要目的是在海量網路資料中以更直觀的方式把知識展現給使用者

二、KG特徵和功能:本質上是一種語意網路,使用者查詢關鍵詞對映到語意知識庫的概念上,

核心是知識庫。

三、知識圖譜流程:知識獲取,知識融匯,知識儲存,查詢式語意理解,知識檢索和視覺化

     3.1知識獲取:

     在大資料環境下,可通過機器學習,知識挖掘,自然語言處理等方式獲取,這說明在學習知識圖譜的同時,對於機器學習,資料探勘等相關方向也要有一定的瞭解和運用。

     3.2知識融合:

     面對網路上獲取的大量資料,其格式,屬相等需要統一,這稱為異構資料。

     實體和關係是圖譜中基本要素,如同圖中的頂點和邊一樣,實體的重要度根據     

PageRank等演算法進行排序

     在知識融合過程中,還需要通過推理檢測邏輯矛盾,通過聚合、分類把知識具體化和分類整合。

     因為任何實體都不是單獨孤立的,與周圍一些概念存在一定邏輯關係,由此可看出在離散數學的中數理邏輯,關係證明等基礎知識的重要性,以及與圖論的結合。

     3.3知識儲存:

     主要依賴於海量資料儲存技術來管理大規模分散式的資料,以實現大容量,可擴充套件,高可靠性和高效能。

     3.4查詢式語意理解:

     各種查詢式方法,查詢式語意的分析,分詞,標註,糾錯,語法分析,與知識庫匹配,使用者情感及語境,查詢式擴充套件,主要以

自然語言處理人工智慧為基礎。

     3.5知識檢索:

     此階段涉及到資訊檢索,知識挖掘扥關鍵技術(相似性,重要性)。對查詢語意進行解析,與知識庫的知識匹配,進行統計,排序,推理,預測。為使用者查詢出關鍵完整準確的有效資訊,同時推薦使用者可能感興趣的資訊(涉及到推薦系統)。

     3.6視覺化展現:

     提升使用者體驗和效果,更注重內容顯示粒度上的把握,需要涉及到Web客戶端技術,視覺化技術,人機互動技術幫助使用者提高體驗效果。

四、知識圖譜的應用

     4.1商業搜尋引擎的應用:如百度、搜狗等,國外谷歌。

     4.2問答系統的應用:蘋果的Siri

     4.3電商平臺運用:淘寶

     4.4社交網路運用:FB

     4.5其他領域:如教育科研,醫療,生物研究的

五.小結:

    知識圖譜作為近兩年在大資料時代下新穎的知識組織與檢索技術,其知識組織和展示的優勢逐漸體現出來,受到眾多領域的關注。應用前景十分廣泛。當前知識圖譜發展還處於初級階段,面臨眾多挑戰和難題,如:知識庫的自動擴充套件,異構知識處理,推理規則學習,跨語言檢索等。