知識圖譜(Knowledge Graph)小結
知識圖譜(Knowledge Graph)小結
一、知識圖譜(Knowledge Graph)主要目的是在海量網路資料中以更直觀的方式把知識展現給使用者
二、KG特徵和功能:本質上是一種語意網路,使用者查詢關鍵詞對映到語意知識庫的概念上,
核心是知識庫。
三、知識圖譜流程:知識獲取,知識融匯,知識儲存,查詢式語意理解,知識檢索和視覺化
3.1知識獲取:
在大資料環境下,可通過機器學習,知識挖掘,自然語言處理等方式獲取,這說明在學習知識圖譜的同時,對於機器學習,資料探勘等相關方向也要有一定的瞭解和運用。
3.2知識融合:
面對網路上獲取的大量資料,其格式,屬相等需要統一,這稱為異構資料。
實體和關係是圖譜中基本要素,如同圖中的頂點和邊一樣,實體的重要度根據
PageRank等演算法進行排序
在知識融合過程中,還需要通過推理檢測邏輯矛盾,通過聚合、分類把知識具體化和分類整合。
因為任何實體都不是單獨孤立的,與周圍一些概念存在一定邏輯關係,由此可看出在離散數學的中數理邏輯,關係證明等基礎知識的重要性,以及與圖論的結合。
3.3知識儲存:
主要依賴於海量資料儲存技術來管理大規模分散式的資料,以實現大容量,可擴充套件,高可靠性和高效能。
3.4查詢式語意理解:
各種查詢式方法,查詢式語意的分析,分詞,標註,糾錯,語法分析,與知識庫匹配,使用者情感及語境,查詢式擴充套件,主要以
3.5知識檢索:
此階段涉及到資訊檢索,知識挖掘扥關鍵技術(相似性,重要性)。對查詢語意進行解析,與知識庫的知識匹配,進行統計,排序,推理,預測。為使用者查詢出關鍵完整準確的有效資訊,同時推薦使用者可能感興趣的資訊(涉及到推薦系統)。
3.6視覺化展現:
提升使用者體驗和效果,更注重內容顯示粒度上的把握,需要涉及到Web客戶端技術,視覺化技術,人機互動技術幫助使用者提高體驗效果。
四、知識圖譜的應用
4.1商業搜尋引擎的應用:如百度、搜狗等,國外谷歌。
4.2問答系統的應用:蘋果的Siri
4.3電商平臺運用:淘寶
4.4社交網路運用:FB
4.5其他領域:如教育科研,醫療,生物研究的
五.小結:
知識圖譜作為近兩年在大資料時代下新穎的知識組織與檢索技術,其知識組織和展示的優勢逐漸體現出來,受到眾多領域的關注。應用前景十分廣泛。當前知識圖譜發展還處於初級階段,面臨眾多挑戰和難題,如:知識庫的自動擴充套件,異構知識處理,推理規則學習,跨語言檢索等。