1. 程式人生 > 其它 >圖分析簡單概述

圖分析簡單概述

1、什麼是圖

近幾年,全球大資料進入了加速發展時期,資料量呈指數級增長。大資料中不同個體間的關聯關係產生的資料以圖的形式呈現。這裡的圖是針對數學中的“圖論”而言,主要是由點和邊組成的資料結構。頂點相當於樹中的節點。頂點之間的關聯關係,被稱之為邊。例如:坐在辦公室的三個人,這三個人就是三個點。三個人之間的關係稱之為邊,如:同事關係,師妹關係,專案合作關係等等。

2、什麼是圖分析

圖分析使用基於圖的方法來分析連線的資料。我們可以:查詢圖資料,使用基本統計資訊,視覺化地探索圖、展示圖,或者將圖資訊預處理後合併到機器學習任務中。圖的查詢通常用於區域性資料分析,而圖計算通常涉及整張圖和迭代分析。

3、圖分析常見的應用場景

  3.1社交網路分析 社交網路是十分常見的一類圖資料,代表著各種個人或組織之間的社會關係,而圖資料能夠呈現複雜的社交網路關係,進而易於使用者進行進一步的分析。例如,在一個典型的社交網路中,常常會存在“誰認識誰,誰上過什麼學校,誰常住什麼地方”,Facebook,Twitter,Linkedin用它來管理社交關係,實現好友推薦。

  3.2電子購物應用 電子購物是網際網路中的一類核心業務,在這類場景中,節點分為兩類:使用者和商品,存在的關係有瀏覽、收藏、購買等。使用者與商品之間可以存在多重關係,如既存在收藏關係也存在購買關係。這類複雜的資料場景可以用屬性圖輕鬆描述。電子購物催生了一項大家熟知的技術應用—推薦系統。使用者與商品之間的互動關係,反映了使用者的購物偏好。例如,經典的啤酒與尿布的故事:愛買啤酒的人通常也更愛買尿布。

  3.3交通網路應用 交通網路具有多種形式,比如地鐵網路中將各個站點作為節點,站點之間的連通性作為邊。通常在交通網路中我們比較關注的是路徑規劃相關的問題:比如最短路徑問題,再如我們將車流量作為網路中節點的屬性,去預測未來交通流量的變化情況。

4、圖分析的優點

一般來說,關係分析通過一對一甚至一對多的比較來研究關係,而圖分析也可以比較多對多的關係。關係資料庫由嚴格的模式組成,因為很難向它們新增新的資料關係,因此,關係分析最適用於按表和列排序的結構化且不變的資料。而圖分析由圖資料庫而不是關係資料庫提供支援,在圖形資料庫中可以相對輕鬆地新增資料和資料關係,這可以為圖分析在資料組織中節省更多時間,花費更少的精力合併資料來源和點。 此外,與大多數其他資料分析工具和模型相比,圖形在視覺上更有吸引力且更易於理解。它還可以找到間接關係,並可以將大量複雜的資料凝聚在一起,可以提高預測和決策的準確性,給人們提供更深入的見解。

5、圖分析常用的工具有哪些

圖資料庫:一些流行的圖形資料庫包括 - ArangoDB、Amazon Neptune、Neo4j、Orient DB、Dgraph、FlockDB。 圖分析平臺包括:TigerGraph,這是一個企業級圖分析平臺。BigGraph,這是來自阿里的大規模線上圖分析平臺。 圖計算引擎包括:GraphX、Giraph、GraphScope。大家一般對GraphX和Giraph比較熟悉,Graph Scope是由阿里巴巴的達摩院研究的一個一站式大規模圖計算系統。在下一篇文章中會詳細介紹這些圖資料相關的工具。