1. 程式人生 > 其它 >PVE 虛擬機器模板和克隆介紹

PVE 虛擬機器模板和克隆介紹

一、ElasticSearch簡介

一個完整的集中式日誌系統,需要包含以下幾個主要特點:

  • 收集-能夠採集多種來源的日誌資料
  • 傳輸-能夠穩定的把日誌資料傳輸到中央系統
  • 儲存-如何儲存日誌資料
  • 分析-可以支援 UI 分析
  • 警告-能夠提供錯誤報告,監控機制

ELK提供了一整套解決方案,並且都是開源軟體,之間互相配合使用,完美銜接,高效的滿足了很多場合的應用。目前主流的一種日誌系統。

1.1Elasticsearch

Elasticsearch是一個基於Apache Lucene(TM)的開源搜尋引擎。無論在開源還是專有領域,Lucene可以被認為是迄今為止最先進、效能最好的、功能最全的搜尋引擎庫。

特點:

l分散式的實時檔案儲存,每個欄位都被索引並可被搜尋

l分散式的實時分析搜尋引擎--做不規則查詢

l可以擴充套件到上百臺伺服器,處理PB結構化或非結構化資料

Elasticsearch也使用Java開發並使用Lucene作為其核心來實現所有索引和搜尋的功能,但是它的目的是通過簡單的RESTful API來隱藏Lucene的複雜性,從而讓全文搜尋變得簡單。

ES能做什麼?

全文檢索(全部欄位)、模糊查詢(搜尋)、資料分析(提供分析語法,例如聚合)

1.2Elasticsearch使用案例

12013年初,GitHub拋棄了Solr,採取ElasticSearch 來做PB級的搜尋。

“GitHub使用ElasticSearch搜尋20TB的資料,包括13億檔案和1300億行程式碼

2維基百科:啟動以elasticsearch為基礎的核心搜尋架構SoundCloud“SoundCloud使用ElasticSearch1.8億使用者提供即時而精準的音樂搜尋服務

3百度:百度目前廣泛使用ElasticSearch作為文字資料分析,採集百度所有伺服器上的各類指標資料及使用者自定義資料,通過對各種資料進行多維分析展示,輔助定位分析例項異常或業務層面異常。目前覆蓋百度內部20多個業務線(包括casio、雲分析、網盟、預測、文庫、直達號、錢包、風控等),單叢集最大100臺機器,200

ES節點,每天匯入30TB+資料

4新浪使用ES 分析處理32億條實時日誌

5阿里使用ES 構建挖財自己的日誌採集和分析體系

1.3、同類產品

SolrElasticSearchHermes(騰訊)(實時檢索分析)

lSolrES

1.源自搜尋引擎,側重搜尋與全文檢索。

2.資料規模從幾百萬到千萬不等,資料量過億的叢集特別少。

有可能存在個別系統資料量過億,但這並不是普遍現象(就像Oracle的表裡的資料規模有可能超過Hive裡一樣,但需要小型機)。

lHermes

1.一個基於大索引技術的海量資料實時檢索分析平臺。側重資料分析。

2.資料規模從幾億到萬億不等。最小的表也是千萬級別。

騰訊17TS5機器,就可以處理每天450億的資料(每條資料1kb左右),資料可以儲存一個月之久。

lSolrES區別

全文檢索、搜尋、分析。基於lucene

  1. Solr 利用 Zookeeper 進行分散式管理,而 Elasticsearch 自身帶有分散式協調管理功能;
  2. Solr 支援更多格式的資料,而 Elasticsearch 僅支援json檔案格式;
  3. Solr 官方提供的功能更多,而 Elasticsearch 本身更注重於核心功能,高階功能多有第三方外掛提供;
  4. Solr 傳統的搜尋應用中表現好於 Elasticsearch,但在處理實時搜尋應用時效率明顯低於 Elasticsearch-----附近的人

Lucene是一個開放原始碼的全文檢索引擎工具包,但它不是一個完整的全文檢索引擎,而是一個全文檢索引擎的架構,提供了完整的查詢引擎和索引引擎,部分文字分析引擎

搜尋引擎產品簡介