語義網路，語義網，連結資料和知識圖譜

阿新 • • 發佈：2019-02-15

文章釋出在我的知乎專欄，對知識圖譜感興趣的朋友可以關注。

前一篇文章“為什麼需要知識圖譜？什麼是知識圖譜？——KG的前世今生”提及了和知識圖譜相關的一些早期概念。為了讓讀者能夠更好地區分這些概念，以及更好地在整體上把握知識譜圖發展過程，本文將對這些概念作一個更為詳細的介紹。

一、語義網路（Semantic Network）

對於初學者來講，這個概念很容易和語義網（Semantic Web）相混淆。為了行文一致，除非特別說明，語義網路指Semantic Network，語義網指Semantic Web。

語義網路是由Quillian於上世紀60年代提出的知識表達模式，其用相互連線的節點和邊來表示知識。節點表示物件、概念，邊表示節點之間的關係。

語義網路

語義網路的優點：
1. 容易理解和展示。
2. 相關概念容易聚類。

語義網路的缺點：
1. 節點和邊的值沒有標準，完全是由使用者自己定義。
2. 多源資料融合比較困難，因為沒有標準。
3. 無法區分概念節點和物件節點。
4. 無法對節點和邊的標籤(label，我理解是schema層，後面會介紹)進行定義。

簡而言之，語義網路可以比較容易地讓我們理解語義和語義關係。其表達形式簡單直白，符合自然。然而，由於缺少標準，其比較難應用於實踐。看過上一篇文章的讀者可能已經發現，RDF的提出解決了語義網路的缺點1和缺點2，在節點和邊的取值上做了約束，制定了統一標準，為多源資料的融合提供了便利。另外，RDF對is-a關係進行了定義，即，rdf:type（是rdf標準中的一個詞彙，之後的文章會介紹）。因此，不管在哪個語義網路中，表達is-a關係，我們都用rdf:type，在語法上形成了統一。比如上圖中貓、熊與哺乳動物的關係就可以形式化的表達為：

貓 rdf:type 哺乳動物

熊 rdf:type 哺乳動物

但還有個問題，如何區分概念和物件？即定義Class和Object(也稱作Instance, Entity)。如果不能區分，會對我們產生什麼影響？舉個例子，假如我們有兩個語義網路A和B。在A中，熊是哺乳動物的一個例項。在B中，熊是哺乳動物的一個子類。前者是is-a關係，後者是subClassOf關係。這種情況常有發生，我們建模的角度不同，那麼同一個事物的表示也可能不同。如果我們不能用一種方法來區別兩者，不僅會給我們帶來理解上的困難，在進行融合的時候也會造成資料衝突。我們不能說A既是B的一個例項，又是B的一個子類。W3C制定的另外兩個標準RDFS/OWL解決了這個問題，如下圖。

在語義網技術棧中，RDFS和OWL是RDF更上一層的技術，主要是為了解決語義網路的缺點3和缺點4，其提供了schema層的描述。在後續文章中，我們將更詳細地介紹RDF，RDFS/OWL。在這裡，讀者只需要知道，通過RDFS或者OWL中的預定義詞彙，我們可以形式化地宣告一個類：

哺乳動物 rdf:type rdfs:Class

或者

哺乳動物 rdf:type owl:Class

通過RDFS也可以宣告一個子類：

熊 rdf:type rdfs:Class

熊 rdfs:subClassOf 哺乳動物

或者宣告一個例項

熊 rdf:type 哺乳動物

我們也可以把rdf:type用a代替，即：

熊 a 哺乳動物

RDF，RDFS/OWL屬於語義網技術棧，它們的提出，使得語義網克服了語義網路的缺點。

儘管語義網路有這些缺點，還是有許多專案是基於語義網路的思想建立起來的。下面列幾個比較出名和實用的專案：
- WordNet。它是一個英語的詞彙庫，將英語單詞劃分為同義詞集合，用不同的語義關係將這些集合關聯起來。其在自然語言處理的中有許多應用，比如消歧、資訊檢索、文字分類、文字摘要等等。
- BabelNet。相對於WordNet，BabelNet是一個多語言的詞彙庫。它是通過自動把維基百科連結到WordNet上構建起來的，另外也用到了其他的一些詞彙資源。
- HowNet，即知網，中文語義詞典。其以漢語和英語詞語所代表的概念為描述物件，構建了一個包含概念之間以及概念所具有的屬性之間的關係的常識知識庫。

二、語義網（Semantic Web）和連結資料（Linked Data）

語義網和連結資料是全球資訊網之父Tim Berners Lee分別在1998年和2006提出的。相對於語義網路，語義網和連結資料傾向於描述全球資訊網中資源、資料之間的關係。其實，本質上，語義網、連結資料還有Web 3.0都是同一個概念，只是在不同的時間節點和環境中，它們各自描述的角度不同。它們都是指W3C制定的用於描述和關聯全球資訊網資料的一系列技術標準，即，語義網技術棧。

語義網是一個更官方的名稱，也是該領域學者使用得最多的一個術語，同時，也用於指代其相關的技術標準。在全球資訊網誕生之初，網路上的內容只是人類可讀，而計算機無法理解和處理。比如，我們瀏覽一個網頁，我們能夠輕鬆理解網頁上面的內容，而計算機只知道這是一個網頁。網頁裡面有圖片，有連結，但是計算機並不知道圖片是關於什麼的，也不清楚連結指向的頁面和當前頁面有何關係。語義網正是為了使得網路上的資料變得機器可讀而提出的一個通用框架。“Semantic”就是用更豐富的方式來表達資料背後的含義，讓機器能夠理解資料。“Web”則是希望這些資料相互連結，組成一個龐大的資訊網路，正如網際網路中相互連結的網頁，只不過基本單位變為粒度更小的資料，如下圖。

語義網

連結資料起初是用於定義如何利用語義網技術在網上釋出資料，其強調在不同的資料集間建立連結。Tim Berners Lee提出了釋出資料的四個原則，並根據資料集的開放程度將其劃分為1到5星5個層次。連結資料也被當做是語義網技術一個更簡潔，簡單的描述。當它指語義網技術時，它更強調“Web”，弱化了“Semantic”的部分。對應到語義網技術棧，它傾向於使用RDF和SPARQL（RDF查詢語言）技術，對於Schema層的技術，RDFS或者OWL，則很少使用。連結資料應該是最接近知識圖譜的一個概念，從某種角度說，知識圖譜是對連結資料這個概念的進一步包裝。本專欄的頭像，讀者可能在很多地方看見過，這其實就是開放連結資料專案（Linked Open Data Project）進展的視覺化（讀者可以開啟連結檢視可互動的視覺化圖），也通常用來展示當前開放知識圖譜的規模，涉及的領域以及知識圖譜間的連結關係。

開放連結資料專案

三、知識圖譜（Knowledge Graph）

上一篇文章中，我們用平實的語言給出了知識圖譜的定義和組織形式。用更正式的說法，知識圖譜是由本體（Ontology）作為Schema層，和RDF資料模型相容的結構化資料集。本體本身是個哲學名詞，AI研究人員於上個世紀70年代引入計算機領域。Tom Gruber把本體定義為“概念和關係的形式化描述”，分別指實體的類層次和關係層次。我們以上篇文章羅納爾多知識圖為例，我們用IRI唯一標誌的節點都是某個類的一個例項，每一條邊都表示一個關係。羅納爾多是一個人，里約熱內盧是一個地點，我們用RDF來表示就是：

www.kg.com/person/1 rdf:type kg:Person.

www.kg.com/place/10086 rdf:type kg:Place.

關係我們也稱為屬性（Property），根據是實體和實體之間的關係還是實體和資料值之間的關係分為物件屬性（Object Property）和資料屬性（Data Property）。在圖中，羅納爾多和里約熱內盧的關係（本例中是物件屬性）與羅納爾多和全名的關係（本例中是資料屬性）用RDF就可以表示為：

www.kg.com/person/1 kg:hasBirthPlace www.kg.com/place/10086

www.kg.com/person/1 kg:fullName “Ronaldo Luís Nazário de Lima”^^xsd:string

這裡kg:Person，kg:Place，kg:hasBirthPlace，kg:fullName是我們在Ontology中定義好的類和關係。

羅納爾多知識圖譜

連結資料和知識圖譜最大的區別在於：
1. 正如上面Open Linked Data Project所展示的，每一個圓圈代表一個獨立存在和維護的知識圖譜；連結資料更強調不同RDF資料集（知識圖譜）的相互連結。
2. 知識圖譜不一定要連結到外部的知識圖譜（和企業內部資料通常也不會公開一個道理），更強調有一個本體層來定義實體的型別和實體之間的關係。另外，知識圖譜資料質量要求比較高且容易訪問，能夠提供面向終端使用者的資訊服務（查詢、問答等等）。

四、總結

本文介紹了和知識圖譜相關的幾個早期概念，以及他們之間的異同。在下一篇文章當中，我們將會介紹語義網技術棧中比較基礎和重要的技術標準：RDF，RDFS和OWL。另外，會結合實踐，讓讀者學會用protege自頂向下地構建自己的本體結構。

參考資料：

語義網路，語義網，連結資料和知識圖譜

文章釋出在我的知乎專欄，對知識圖譜感興趣的朋友可以關注。前一篇文章“為什麼需要知識圖譜？什麼是知識圖譜？——KG的前世今生”提及了和知識圖譜相關的一些早期概念。為了讓讀者能夠更好地區分這些概念，以及更好地在整體上把握知識譜圖發展過程，本文將對這些概念作一個更

知識圖譜—語義網路、語義網、連結資料、知識圖譜

一、語義網路語義網路是由Quillian於上世紀60年代提出的知識表達模式，其用相互連線的節點和邊來表示知識。節點表示物件、概念，邊表示節點之間的關係。語義網路的優點： 1. 容易理解和展示。 2. 相關概念容易聚類。語義網路的缺點：

油猴指令碼第一家，網頁網盤連結實時判斷+資源搜尋網站導航，資源重度患者的福利

現在網路上找資源，資源都是存在百度網盤的，大家都知道，百度網盤連結失效的非常之多。遇到網盤連結我們都要一個一個點進去檢視連結是否失效，這樣操作費時又累人。這時這個油猴指令碼就可以幫忙了。實時判斷網頁中百度網盤連結狀態。同時，這個油猴指令碼還會再網頁的適當位置推薦資源網站MAP，找資源什麼

我是學Java的，想嘗試學習大資料和資料探勘，該怎麼規劃學習路線？

個人是從Java後端開發，經過3個月的業餘自學成功轉型大資料工程師。背景介紹完畢，開始正式一本正經回答問題: 本回答目錄: 一.大資料方向工作介紹二.大資料工程師的技能要求三.大資料學習路徑四.學習資源推薦（書籍、部落格、網站）一.大資料方向工作介紹

檔案操作：有五個學生，每個學生有 3 門課的成績，從鍵盤輸入以上資料（包括學生號，姓名，三門課成績），計算出平均成績，將所輸入有的資料和計算出的平均分數存放在磁碟檔案 "stud "中

import java.io.BufferedWriter; import java.io.FileWriter; import java.io.IOException; import java.uti

上網問題解決：ping的通閘道器，外網，ping的通dns伺服器，但是無法上網

今天來到實驗室，開啟ubuntu，發現不能上網，這種情況也見多了。開始一步步測試解決，最後發現今天遇到的問題非常怪。病情診斷： 1,可以ping通閘道器 2,可以ping通dns伺服器 3,測試可以ping通外網而且，我隔壁的人用的dns伺服器跟我是一樣的，上網無壓力

因特網，網際網路，有線網，無線網，區域網，乙太網，全球資訊網的區別及聯絡

因特網前身ARPANRT現在的因特網, 約5億個節點,逾20億使用者。（可以說是最大的統稱）連線的兩個或多個**網路(**一個泛指，其中包含區域網)形成了“網際網路絡”或稱“網際網路”（internet，小寫 i 開頭）因此，網際網路是因特網的一部分。區域

IP，子網，子網掩碼，閘道器，DNS到底都是啥

最近在做通訊的時候老是把這些術語給記混淆了，索性寫個部落格記下來。1.IP地址 IP地址一般泛指IPv4，長32位元，以點分十進位制表示，範圍為0.0.0.0~255.255.255.255，IP地址是唯一標識網際網路計算機的邏輯地址。也就是說，每臺計算機都有唯

對W3C標準，對錶現與資料分離、Web語義化等有深刻理解

看了好多微博總結了一下概念，首先先介紹一下W3C 啥是W3C不是wc，這個建立於 1994 年的組織，其宗旨是通過促進通用協議的發展並確保其通用型，以激發 web 世界的全部潛能，指全球資訊網聯盟（World Wide Web Consortium）一個很牛x的組織。程式碼標準 w3c官網也可以借鑑

Kafka消息投遞語義-消息不丟失，不重復，不丟不重

日誌 pac tps 啟動事務性 enc 解決 tof 重新啟動目錄 1. Kafka消息投遞語義-消息不丟失，不重復，不丟不重 1.1. 介紹 1.2. Producer 消息生產者端 1.3. Broker 消息接收端 1.4. Consumer 消息消費

語義分割(semantic segmentation) 常用神經網絡介紹對比-FCN SegNet U-net DeconvNet，語義分割,簡單來說就是給定一張圖片,對圖片中的每一個像素點進行分類；目標檢測只有兩類,目標和非目標，就是在一張圖片中找到並用box標註出所有的目標.

avi projects div 般的 ict 中間接受 img dense from：https://blog.csdn.net/u012931582/article/details/70314859 2017年04月21日 14:54:10 閱讀數：4369

語義網路，語義網，連結資料和知識圖譜

一、語義網路（Semantic Network）

二、語義網（Semantic Web）和連結資料（Linked Data）

三、知識圖譜（Knowledge Graph）

四、總結

參考資料：

語義網路，語義網，連結資料和知識圖譜

知識圖譜—語義網路、語義網、連結資料、知識圖譜

油猴指令碼第一家，網頁網盤連結實時判斷+資源搜尋網站導航，資源重度患者的福利

我是學Java的，想嘗試學習大資料和資料探勘，該怎麼規劃學習路線？

檔案操作：有五個學生，每個學生有 3 門課的成績，從鍵盤輸入以上資料（包括學生號，姓名，三門課成績），計算出平均成績，將所輸入有的資料和計算出的平均分數存放在磁碟檔案 "stud "中

上網問題解決：ping的通閘道器，外網，ping的通dns伺服器，但是無法上網

因特網，網際網路，有線網，無線網，區域網，乙太網，全球資訊網的區別及聯絡

IP，子網，子網掩碼，閘道器，DNS到底都是啥

對W3C標準，對錶現與資料分離、Web語義化等有深刻理解

Kafka消息投遞語義-消息不丟失，不重復，不丟不重

怎樣用電腦連結別人的無線網路（沒有密碼的情況下，生活艱苦，被逼無奈）

VS2013 c++連結資料庫，應用儲存過程，向資料庫中寫入資料

R-CNN論文翻譯:豐富的功能層次結構，用於精確的物件檢測和語義分割

關於python在爬蟲scrapy框架，使用happybase方法連結hbase進行資料上傳操作

11月24日杭州大資料技術沙龍來襲，網易大資料、網易嚴選、螞蟻金服大咖親身經驗分享！

【計算機視覺必讀乾貨】影象分類、定位、檢測，語義分割和例項分割方法梳理

順豐3億條客戶資料疑洩露，暗網售價兩個比特幣

資料結構-第一章，順序表，連結串列，棧結構，佇列結構的關係（個人見解）

表單補充，labed標籤，html5新增表單元素和語義

語義網路，語義網，連結資料和知識圖譜

一、語義網路（Semantic Network）

二、語義網（Semantic Web）和連結資料（Linked Data）

三、知識圖譜（Knowledge Graph）

四、總結

參考資料：

相關推薦