了解大數據的特點、來源與數據呈現方式
1.分析所采用數據的來源有哪些?
(1)交易數據。包括POS機數據、信用卡刷卡數據、電子商務數據、互聯網點擊數據、“企業資源規劃”(ERP)系統數據、銷售系統數據、客戶關系管理(CRM)系統數據、公司的生產數據、庫存數據、訂單數據、供應鏈數據等。
(2)移動通信數據。能夠上網的智能手機等移動設備越來越普遍。移動通信設備記錄的數據量和數據的立體完整度,常常優於各家互聯網公司掌握的數據。移動設備上的軟件能夠追蹤和溝通無數事件,從運用軟件儲存的交易數據(如搜索產品的記錄事件)到個人信息資料或狀態報告事件(如地點變更即報告一個新的地理編碼)等。
(3)人為數據。人為數據包括電子郵件、文檔、圖片、音頻、視頻,以及通過微信、博客、推特、維基、臉書、Linkedin等社交媒體產生的數據流。這些數據大多數為非結構性數據,需要用文本分析功能進行分析。
(4)機器和傳感器數據。來自感應器、量表和其他設施的數據、定位/GPS系統數據等。這包括功能設備會創建或生成的數據,例如智能溫度控制器、智能電表、工廠機器和連接互聯網的家用電器的數據。來自新興的物聯網(Io T)的數據是機器和傳感器所產生的數據的例子之一。來自物聯網的數據可以用於構建分析模型,連續監測預測性行為(如當傳感器值表示有問題時進行識別),提供規定的指令(如警示技術人員在真正出問題之前檢查設備)等。
2.大數據的呈現方式有哪些?
(1)將指標數值化 (2)將指標圖形化 (3)將指標關系圖形化 (4)將時間和空間可視化 (5)將數據進行概念轉換
3.大數據的特點是什麽?對思維方式有何影響?
(1)大數據的特點:
1、數據量大
人類社會產生的數據每兩年就增加一倍——“大數據摩爾定律”。
2、數據類型繁多
大數據的數據類型豐富,包括結構化數據和非結構化數據,其中,結構化數據占10%左右,主要是指存儲在關系數據庫中的數據;後者占90%左右,種類繁多,主要包括郵件、音頻、視頻、微信、微博、位置信息、鏈接信息、手機呼叫信息、網絡日誌等。
3、處理速度快
數據處理和分析的速度通常要達到秒級響應。
4、價值密度低
在大數據時代,很多有價值的信息都是分散在數據海量中的。譬如監控視頻,平時可能沒有什麽作用,但當發生盜竊事件時,只有記錄了案發時刻的那一段視頻是有用的。
(2)大數據對思維方式的影響:
(1)人們處理的數據從單一樣本數據變成全量數據(全樣本數據);
(2)由於是海量數據和全樣本數據,人們不得不接受數據的混雜性,而放棄對精確性的追求;
(3)人類通過對大數據的處理,放棄對因果關系的渴求,轉而關註相關性關系(即數據的關聯性關系)。
了解大數據的特點、來源與數據呈現方式