1. 程式人生 > 資料庫 >知識圖:從圖和資料庫中獲取知識

知識圖:從圖和資料庫中獲取知識

知識圖:從圖和資料庫中獲取知識

知識圖到底是什麼,以及關於它們的所有炒作是什麼?如果想成為世界各地的Airbnbs,Amazon,Google和LinkedIn,那麼學會區分真實的炒作,定義不同型別的圖以及為用例選擇合適的工具和資料庫至關重要。

知識圖被炒作。現在可以正式地說這句話,因為。儘管不必等待Gartner-將其。像在該領域活躍的任何人一樣,看到了機遇和威脅:伴隨著炒作而來的是混亂。

知識圖是真實的。至少已經過去了20年。知識圖在其原始定義和化身中一直與知識表示和推理有關。諸如受控詞彙表,分類法,模式和本體之類的東西都是基於標準和實踐的語義Web基礎構建的。

為什麼這樣的人,,,,和在其核心業務的運動知識圖?和如何通過最新產品加入圖資料庫供應商的組織?以及如何運營這項工作?

知識圖很酷之前

知識圖聽起來很酷。但是到底是什麼呢?這聽起來像是一個幼稚的問題,但實際上正確定義定義是如何構建知識圖。從分類法到本體-本質上是複雜性各異的方案和規則-多年來人們一直在這樣做。

RDF是用於編碼這些模式的標準,具有圖結構。因此,將編碼在圖結構頂部的知識稱為“知識圖”聽起來很自然。從事這種工作的人,即資料建模人員,被稱為知識工程師或本體專家。

此外:。

那麼,有什麼變化?為什麼這樣的人,,,,和在其核心業務的運動知識圖?和如何通過最新產品加入圖資料庫供應商的人群?以及如何使這項工作?

通過基礎架構規劃避免5G部署陷阱

5G將對的資料基礎架構產生越來越多的新需求,因此現在是規劃部署的時候了。

由Vertiv贊助 

這些知識圖可能有許多應用程式-從分類專案到資料整合和在Web上釋出,再到複雜的推理。對於一些最著名的網站,可以檢視schema.org,Airbnb,Amazon,Diffbot,Google,LinkedIn,Uber和Zalando。

因此,知識圖現在處於新興技術的炒作週期中。對於擁有20多年曆史的技術來說還不錯。

 

 圖片:Gartner)

像任何資料建模一樣,這是艱鉅而複雜的工作。它必須考慮到許多利益相關者和世界觀,管理出處和架構漂移等。加上混合推理和Web擴充套件,事情很容易失控,這也許可以解釋為什麼直到最近,這種方法在現實世界中還不是最流行。

另一方面,無模式已經很流行了。無需模式即可快速入門。它至少在一定程度上更簡單,更靈活。不過,不使用模式的簡單性可能會讓人感到欺騙。因為最後,無論使用哪個域,都將存在一個架構。閱讀模式?精細。但是根本沒有架構嗎?

可能對先驗知識不夠了解。它可能很複雜,並且可能會演變。但是它將存在。因此,忽略或淡化架構並不能解決任何問題,只會使情況變得更糟。問題將潛伏,並浪費時間和金錢,因為它們將。

那時的重點不是拋棄模式,而是使其具有功能性,靈活性和可互換性。RDF非常擅長此操作,因為它也是資料交換的標準化格式(例如JSON-LD)的基礎。順便說一句,以及。

將知識納入圖表

那麼,炒作是什麼?已有20年曆史的技術如何在臭名昭著的炒作週期中嶄露頭角?炒作也是真實的,這就是原因。這與AI宣傳的飛速發展是同一回事:方法的變化並沒有太大變化,更多的是資料和計算能力可以使之大規模執行。

另外,AI本身也有幫助。或者,更確切地說,是這種自下而上的基於機器學習的AI,如今已經大肆宣傳。知識圖本質上也是AI。只是另一種。不是一些現在大肆宣傳的AI,而是象徵性,自上而下,基於規則的AI。迄今為止不受歡迎的那種。

並不是說這種方法沒有侷限性。很難以一種功能性的方式來編碼有關複雜域的知識,並很難對其進行大規模推理。因此,機器學習的工作方式就像無模式的方式一樣流行。而且也有很好的理由。

 

 知識圖起初可能很難,但不要放棄。實踐使之完美。

隨著,其他事情也開始發生。非RDF圖的工具和資料庫出現在市場上,並開始獲得成功。這些具有標記屬性型別(LPG)的圖更簡單,更省力。與RDF相比,它們要麼缺少架構,要麼具有基本的架構功能。

而且它們通常在表現更好。最近,。這些都是非常有用的東西。

演算法,分析和機器學習可以提供有關圖的見解,其中一些常見用例是欺詐檢測或建議。因此,可以說,這種技術和應用程式是自底向上地從圖形中獲取知識的。另一方面,RDF圖可以自上而下地將知識帶到圖中。

那麼,自下而上的圖也是知識圖嗎?

此外:

正如知識工程師會說的那樣,這是語義問題。進行知識圖炒作很誘人。但最後,缺乏明確性證明服務很少。圖形演算法,圖形分析以及基於圖形的機器學習和見解都是很好的,準確的術語。而且它們也不與“傳統”知識圖互斥。

前面提到的所有突出的用例都是基於多種方法的。例如,擁有知識圖並使用填充知識圖-至少在例項方面(如果不是實體的話)。這也是。

一些舊的東西,一些新的東西,還有一些用於圖資料庫的東西

像往常一樣,用於圖形的方法和工具的選擇取決於用例。這也適用於圖資料庫,隨著它們的發展,一直對其進行密切監控,並迅速增加了新的供應商和功能。

在都是圖形資料庫:TigerGraph和Memgraph。如果需要更多證明該領域進展迅速的證據,則可以使用。順便說一下,兩家創業公司都只有不到兩年的歷史。

對於T非常活躍的一年。今天,TigerGraph宣佈了一個新版本。它有一些舊的東西,一些新的東西以及一些借來的東西-儘管無法真正發現任何藍色。

 

 

 自上而下,還自下而上?掌握圖表知識?圖片:組織物理

 

淹沒資料與大資料不同。這是大資料的真實定義,以及如何將其用於數字化轉型的有力例證。

新事物很少。都在解決TigerGraph的現有痛點。TigerGraph增加了與流行的資料庫和資料儲存系統的整合,這些資料庫和資料儲存系統包括:RDBMS,Kafka,Amazon S3,HDFS和Spark(即將推出)。TigerGraph說,將在TigerGraph推出時託管開源聯結器。

當然,如果沒有社群,github儲存庫就不值錢了。TigerGraph正在為此進行努力,並宣佈了新的開發人員門戶和電子書。該版本還帶來了更多的部署選項,為現有的Amazon AWS添加了對Microsoft Azure的支援。跟上容器化趨勢,還添加了對Docker和Kubernetes的支援。

之前提到了圖演算法,這可能是該版本中最有趣的方面,它與查詢語言結合在一起。TigerGraph增加了對圖形演算法的支援,例如PageRank,最短路徑,連線的元件和社群檢測。有趣的是,這些都是通過TigerGraph自己的查詢語言GSQL支援的。

已經提到。最近,,在思維共享方面領先的圖形資料庫供應商Neo4j提出。與SPARQL的RDF相比,LPG領域中不存在此功能。

TigerGraph最初響應Neo4j。但是現在,情況正在發生變化。TigerGraph剛剛釋出了Neo4j遷移工具包,該工具包主要基於將Neo4j的查詢語言Cypher轉換為GSQL。這是與TigerGraph討論的重點。

TigerGraph這樣做很有意義,因為必須遷移Neo4j的查詢語言Cypher中的現有查詢主體,這將是一個障礙。有趣的部分是TigerGraph如何選擇實現此目標:作為一次性的,成批的翻譯過程,而不是以互動方式進行。

這是一個戰略選擇。TigerGraph希望人們改用GSQL,而不是在TigerGraph之上使用Cypher。。TigerGraph上有一些故事可以分享,這對於有多大的作用,但是如何發揮作用是任何人的要求。

TigerGraph公告中的早期部分是。這些基準實際上是新基準,但是TigerGraph自隱身以來便已成為基準。對於聲稱因其MPP架構而比其他任何方法都快的解決方案,這也很有意義。該基準測試將TigerGraph與Neo4j,Amazon Neptune,JanusGraph和ArangoDB進行了比較,毫不奇怪地發現它比所有這些都更快。

借來的部分?為什麼,當然是知識圖。TigerGraph的員工還證實了客戶對此表現出的極大興趣,例如,中國的知識圖譜事件吸引了1000多人。什麼知識圖?好吧,現在你知道了。