1. 程式人生 > >知識圖譜(歷史回顧及技術挑戰)

知識圖譜(歷史回顧及技術挑戰)

知識圖譜的基礎知識

什麼是知識?

知識的形成分為下面四個部分,數字附上量綱資訊結合生活嘗試變成知識,如今天13度,直接穿件衣服就出去啦

知識的體系主要有陳述性知識和程式性知識,右側遊戲規則需要認為設定,AlphaGo Zero還是需要知識

10年穀歌提取出來,以前搜尋主要是字串匹配,後來谷歌將零散的資訊結合起來,變成知識圖譜

沒有出現知識圖譜之前,搜尋愛因斯坦,會出現字串匹配現象如下左圖,右圖是出現知識圖譜之後,會出現資訊卡片,愛因斯坦經歷、名人等資訊,Google提出應用

1、知識圖譜歷史回顧

主要三個時代:本體時代、語義網時代、知識圖譜時代

本體時代:

本體是一個不同實體間共享的概念,例如傢俱,床、椅子,傢俱被人使用

知識圖譜例子:

WordNet計算機可讀的詞典

自然語言處理中的基礎元件

語義網時代:

網際網路中的知識通過網頁連結起來,語義網主要以RDF形式構建知識圖譜

資料來源

知識圖譜時代:

語義時代是以RDF形式構建知識圖譜代表比較大,後來大家紛紛推出自己的知識圖譜,以屬性圖管理的方式構建

知識圖譜比較火的原因如下幾條:1、機器學習成熟 2、圖資料庫成熟 3、行業成功案例湧現 4、自然語言處理技術成熟

 

小結:

知識圖譜是一種實體之間關係的語義描述,形式化表示(如:RDF,RDFS,OWL)

實體(Entities):

      真實世界物件(things,places,people)

      抽象概念(genres,religions,professions)

關係(Relationships)

      將實體按語義關係連線成一張大網

語義描述(Semantic descriptions)

      類別和屬性

上面是按照時代發展角度來考慮知識圖譜的,從技術角度來考慮知識圖譜:

    人工構建知識圖譜

          WordNet

          CYC

    基於Wikipedia的開放知識圖譜

         Yago:Wikipedia + WordNet

         DBPedia:基於社群抽取Wikipedia結構化資訊

         Wikidata、BabelNet

  基於文字抽取知識圖譜

        NELL、Knowledge Vault、Probase

  領域知識圖譜

       金融、公安等

現有知識圖譜不足,對時空性的建模不足

2、知識圖譜生命週期概述

知識圖譜的生命週期

知識圖譜技術生態

3、構建領域知識圖譜的挑戰

去做領域知識圖譜構建

資訊融合,資料融合需求迫切

個人服務和企業服務隱私等都有不同

我們需要:可自由擴充套件的資料模式

企業迫切需要將非結構化資料結構化

行業智慧問答大幅降低資料使用門檻

基於事實圖譜資料儲存、融合、分析統一平臺,為使用者提供統一的消費入口,以不同的形態(檢索、分析、視覺化)展示給使用者