一文揭祕!自底向上構建知識圖譜全過程
阿新 • • 發佈:2019-02-13
阿里妹導讀:知識圖譜的構建技術主要有自頂向下和自底向上兩種。其中自頂向下構建是指藉助百科類網站等結構化資料來源,從高質量資料中提取本體和模式資訊,加入到知識庫裡。而自底向上構建,則是藉助一定的技術手段,從公開採集的資料中提取出資源模式,選擇其中置信度較高的資訊,加入到知識庫中。
在本文中,筆者主要想分享一下自底向上構建知識圖譜的全過程,拋磚引玉,歡迎大家交流。
“The world is not made of strings , but is made of things.”
——辛格博士,from Google.
知識圖譜,是結構化的語義知識庫,用於迅速描述物理世界中的概念及其相互關係,通過將資料粒度從document級別降到data級別,聚合大量知識,從而實現知識的快速響應和推理。
當下知識圖譜已在工業領域得到了廣泛應用,如搜尋領域的Google搜尋、百度搜索,社交領域的領英經濟圖譜,企業資訊領域的天眼查企業圖譜等。
2842041297.png
在知識圖譜技術發展初期,多數參與企業和科研機構主要採用自頂向下的方式構建基礎知識庫,如Freebase。隨著自動知識抽取與加工技術的不斷成熟,當前的知識圖譜大多采用自底向上的方式構建,如Google的Knowledge Vault和微軟的Satori知識庫。