1. 程式人生 > 其它 >Splunk:大資料智慧分析平臺&全能日誌分析利器

Splunk:大資料智慧分析平臺&全能日誌分析利器

Splunk是什麼?
從功能上講,Splunk是一款功能完善、強大的機器資料(MachineData)分析平臺,涵蓋機器資料收集、索引、搜尋、監控、分析、視覺化、告警等功能。之所以說是“平臺”而不僅僅是工具,是因為Splunk經過多年的發展,功能十分強大且靈活,允許使用者在其上自定義應用(App),目前其提供的官方和非官方應用多達數百個,且大多數均可以免費下載並使用;同時,Splunk還提供了強大API集,開發人員可以使用Python、Java、JavaScript、Ruby、PHP、C# 程式語言開發應用程式。

從技術上講,Splunk是一個時間序列索引器(time-seriesindexer)。在Splunk索引資料時,它基於資料的時間戳(Timestamp)將資料拆分為事件(Event)。事件通常也稱為記錄或者資料行,並且每一個時間都有一個時間戳,它是Splunk資料分析的一個關鍵元素。Splunk預設使用時間戳細分事件。

Splunk公司
Splunk創建於2003,總部位於美國舊金山,2006年釋出第一款產品,在全球15個國家設有辦事處,擁有1000多名員工。目前Splunk只在美國舊金山、西雅圖和上海設有開發中心,而亞太區總部設在香港。Splunk於2012年4月19日在納斯達克上市,作為第一家主打“大資料”牌上市的公司,在上市首日,其發行股價大漲109%,估值達到32.8億美元。公司的官方網址是:www.splunk.com。

目前Splunk在全球有超過7000個使用者,分佈在銀行、電信以及一些大型企業,財富100強中超過一半是Splunk的客戶,中國有超過70家企業客戶。在中國市場,Splunk的業務主要集中在電信、保險和銀行業等,例如銀聯支付、民生保險、百聯支付、國美電器、中國移動和中國電信等。

Splunk能為企業帶來什麼?
Splunk可以支援任何IT 裝置(伺服器、網路裝置、應用程式、資料庫等)所產生的日誌,且可以對日誌進行高效搜尋,並通過非常好的圖形化的方式展現出來。此外Splunk的搜尋功能異常強大,被稱為“Googlefor IT”,正所謂用搜索引擎將IT化繁為簡。其應用主要分為五大塊:IT運營、應用管理、安全合規、網路智慧與商業分析,適合多種不同職能型別的使用者使用,包括:IT管理員、資料分析師、安全分析師和業務使用者。

應用管理
開發維護一個複雜的應用程式,傳統的應用軟體配備不足,無法應對當今應用程式體系結構和部署環境的複雜性。Splunk能夠在最短的事件內發現問 題,解決問題,並且可以提前增加預警功能,防止問題產生。另外,在Splunk過去所做的上千個案例中,將平均故障恢復時間減少了60%~80%。同時, 在故障解析時,由於不需要訪問實際運用的資料庫就可迅速進行檢索,在加強安全效能方面也是一個優點。

IT運營管理
世界各地的IT資料中心都極其複雜,通過層疊並結合成千上萬的不同技術和裝置來提供業務服務。虛擬化和雲端計算加劇了這種複雜性,尤其是在出現中斷或 效能問題的時候。這樣會花費大量寶貴的時間。Splunk能提供更好的解決方案。它收集和索引了由IT基礎結構-網路、伺服器和客戶作業系統、hypervisor、資料庫稽核線索、訊息佇列-產生的所有資料。它可以處理機器生成的任何資料,包括日誌、檔案配置、效能指標、SNMPtrap和自定義應用程式日誌等等。無需使用自定義分析器或介面卡。

安全性與合法性
安全性與合法性問題將很快地發生在企業體系機構中的任何地方。攻擊簽名或基於系統的規則越來越具有突變性,不僅僅是惡意的內部訪問必須防範。Splunk,所有資料一起檢索,事件發生時的調查瞬間不僅僅是調查,將來監視和預警結合起來可以提前發現有問題的事件。


業務分析
就業務活動而言,遇到緊要故障或者威脅,Splunk不僅能作為解決方案給出評估,還可對威脅原因且以前大量客戶行為及事業活動進行分析,對收益貢 獻作出評估。例如:將基本資料庫及維護團隊結合起來進行網站日誌分析,營銷策略和客戶在線上線下的購買行為之間的收益關聯性進行分析,基於IT基本設施使 用率的分析,Splunk對所有業務活動都可進行靈活運用。

Splunk與大資料
最初,Splunk大部分的收益來自IT監控和對技術裝置的日誌追蹤。伴隨著大資料的浪潮,現在Splunk已從一家部門級IT解決方案提供商成長為一家企業級資料平臺提供商,將應用場景擴大到更多領域以及企業內部的更多部門。作為一個完全整合的大資料解決方案,Splunk通用的引擎能夠將任何的機器資料廣泛地索引,並支援任何格式的資料,而無需進行格式轉換;實時的搜尋引擎,帶來了類似於Google的快速搜尋結果;而其自主開發的類似於MapReduce的分散式架構,為系統的可擴充套件性提供了保證,能夠輕鬆擴充套件到支援每天新增上百TB的資料,配合基於角色的資料訪問控制,還能夠跨多個數據中心執行。


————————————————
版權宣告:本文為CSDN博主「splunk_nathan」的原創文章,遵循CC 4.0 BY-SA版權協議,轉載請附上原文出處連結及本宣告。
原文連結:https://blog.csdn.net/splunk_nathan/article/details/39475287