ElasticSearch 筆記（一）

阿新 • • 發佈：2018-12-06

一、Elasticsearch 印象

分散式、全文檢索、資料分析。

二、為什麼不用傳統關係型資料庫，如 MySQL，做搜尋

舉個反例。假設有以下資料庫表 t_game：

id	name
1	唐僧取經
2	西天取經
3	唐僧不取經

需求：你在搜尋輸入框中輸入 “唐僧取經”，希望找出相關的遊戲。

轉化成 SQL 就是：SELECT * FROM t_game where name LIKE '%唐僧取經%';

LIKE 前後模糊匹配，不走索引，只能全表掃描，資料量很大的話，比如有個 1 千萬條記錄，就需要掃描 1 千萬次，效能肯定很差。

還有一個問題，當你搜索 “唐僧取經” 的時候，也許 “唐僧不取經” 也是你想要的結果，

但是 SQL 查詢無法匹配這條記錄。

所以，用關係型資料庫做搜尋，有兩大問題：① 全表掃描，效能不好 ② 只能把輸入關鍵字作為一個整體，也就是不能全文檢索。

三、全文搜尋和倒排索引

利用一種叫做 “倒排索引” 的東東，大致原理：

把 t_game 表的 name 欄位進行分詞，然後記錄分出來的詞對應的 id

分詞	ids
取經	1、2、3
唐僧	1、3
西天	2
不	3

然後，對搜尋關鍵字 “唐僧取經” 也進行分詞：唐僧、取經。

第一次拿 “唐僧” 去查倒排索引，可以查到遊戲 id 為：1、3 的記錄；接著用 “取經” 再去查倒排索引，

可以查到遊戲 id 為：1、2、3 的記錄，合併結果就是返回 1、2、3 的記錄。

在本例中，即使資料有千千萬，只需要 2 次查詢，就可以查到所有結。

所以，利用倒排索引，可以解決兩個問題：全文搜尋、效能問題。

四、lucene

簡單來說就是一個 jar 包，封裝了建立倒排索引的演算法，已經各種搜尋演算法，可以用來做全文檢索。

五、Elasticsearch

lucene 雖然可以做全文檢索，

但是隻能單機，不能叢集，當資料量太大以致單機無法容納，需要分散式處理時，處理起來很麻煩；

也不能做複雜的資料分析。

於是順其自然的就有了 Elasticsearch，Elasticsearch 可以分散式叢集，並且可以做一些複雜的資料分析，而且高可用，

當一些節點掛掉後，還能正常對外服務。

Elasticsearch筆記（一）—— Linux下安裝Elasticsearch

Linux下安裝Elasticsearch 1、版本雖然眼下已經出了v6.5.0，但為了和ik分詞器版本一致，這裡選擇6.4.3的版本。官網：https://www.elastic.co/ 選擇適用於linux的安裝包進行下載 2、安裝與配置 2.1.新建使用者

ElasticSearch 筆記（一）

一、Elasticsearch 印象分散式、全文檢索、資料分析。二、為什麼不用傳統關係型資料庫，如 MySQL，做搜尋舉個反例。假設有以下資料庫表 t_game：

白日夢的Elasticsearch筆記（一）基礎篇

[TOC] ## 一、導讀 ![](https://img2020.cnblogs.com/blog/1496926/202101/1496926-20210113231945281-1997291032.png) Hi All！我們一起學點有意思的！NoSQL！歡迎訂閱白日夢Elasticsea

ELK學習筆記（一）安裝Elasticsearch、Kibana、Logstash和X-Pack

成功前端功能靈活日誌分析傳統開發人員收集還在最近在學習ELK的時候踩了不少的坑，特此寫個筆記記錄下學習過程。日誌主要包括系統日誌、應用程序日誌和安全日誌。系統運維和開發人員可以通過日誌了解服務器軟硬件信息、檢查配置過程中的錯誤及錯誤發生的原因。經常分析日

ElasticSearch 菜鳥筆記（一）ElasticSearch 入門簡介

前言 ElasticSearch 是一個高可用開源全文檢索和分析元件。提供儲存服務，搜尋服務，大資料準實時分析等。一般用於提供一些提供複雜搜尋的應用。 ElasticSearch 提供了一套基於restful風格的全文檢索服務元件。前身是compass，直到

《代碼閱讀》讀書筆記（一）

需求的人一行編碼重要流動使用分析缺少《代碼閱讀》讀書筆記(一) 《代碼閱讀》（《Code Reading The Open Source Perspective》）Diomidis Spinellis 著 ---------------------

python框架之 Tornado 學習筆記（一）

tornado pythontornado 一個簡單的服務器的例子：首先，我們需要安裝 tornado ，安裝比較簡單： pip install tornado 測試安裝是否成功，可以打開python 終端，輸入： import tornado.https

Scala學習筆記（一）編程基礎

大數據上一個 extends 移除 condition api arr 調用方法 tab 強烈推薦參考該課程：http://www.runoob.com/scala/scala-tutorial.html 1. Scala概述 1.1. 什麽是Scala Scala

3D Game Programming withDX11 學習筆記（一）數學知識總結

表示圖形 http 根據轉置元素 material -s com 　　在圖形學中，數學是不可或缺的一部分，所以本書最開始的部分就是數學知識的復習。在圖形學中，最常用的是矢量和矩陣，所以我根據前面三個章節的數學知識，總結一下數學知識。一、矢量　數學中的矢量，擁有

系統分析與設計學習筆記（一）

學習掌握應該溝通基本最終表示對象毫無為什麽要學習這門課程？　　“擁有一把錘子未必能成為建築師”。這門課程學習的是面向對象分析和設計的核心技能的重要工具。對於使用面向對象技術和語言來，創建設計良好、健壯且可維護的軟件來說，這門課程所

最大熵學習筆記（一）預備知識

color wrap targe dsm entropy plus 文件 eight 相關鏈接生活中我們常常聽到人們說“不要把雞蛋放到一個籃子裏”。這樣能夠減少風險。深究一下，這是為什麽呢？事實上，這裏邊包括了所謂的最大熵原理（The Maxim

Logstash筆記（一）

logstash（一）含義： logstash是一種分布式日誌收集框架，開發語言是JRuby，當然是為了與Java平臺對接，不過與Ruby語法兼容良好，非常簡潔強大，經常與ElasticSearch，Kibana配置，組成著名的ELK技術棧，非常適合用來做日誌數據的分析。當然它可以單獨出

Nginx模塊之Nginx-Ts-Module學習筆記（一）搶險體驗

學習筆記體驗 nginx模塊 int images clas tps gin issues 1、通過HTTP接收MPEG-TS2、生產和管理Live HLS 3、按照官方的編譯和配置，當然了我是第一次編譯沒有通過，在作者重新調整下，編譯成功，感謝：@arut https:

Hadoop自學筆記（一）常見Hadoop相關項目一覽

-a https class Lucene 百萬 data fcm you 轉換本自學筆記來自於Yutube上的視頻Hadoop系列。網址： https://www.youtube.com/watch?v=-TaAVaAwZTs（當中一個）以後不再贅述自學筆

SICP讀書筆記（一）

自由運用實參隱藏更多定義並不是謂詞精確第一章構造過程抽象計算過程是存在於計算機裏的一類抽象事物，它在演化過程中會去操作一些被稱為數據的抽象事物。我們通過創建被稱為程序的規則模式來指導這類過程的進行。程序由程序設計語言編排而成。我們將要使用Lisp

jq學習筆記（一）

簡單 ren 當前一個 text 互斥元素如果 property 1 .attr() 與 .removeAttr()方法 - atr()方法用來獲取和設置元素屬性 attr()有4個表達式： attr(傳入屬性名)：獲取屬性的值 attr(屬性名, 屬性

Redis學習筆記（一）關於在windows64位環境下的安裝學習使用

客戶端 mas key-value 錯誤 services 再次基準 alt 類型前言由於工作需要，目前我正在學習使用Redis。我當時學習Redis就從網上下載了點資料就開始學習了。入門看的是《REDIS入門指南》，這本書個人覺得很適合新手用來學習接觸。根據書上的引

Memcache 學習筆記（一）----Memcache — Linux部署

工作 apach sch trick 解壓 font ash 一個鍵值　　Memcache 一、Memcache簡介（內容摘自 --百度百科）　　memcache是一套分布式的高速緩存系統，由LiveJournal的Brad Fitzpatrick開發，但目前被許多網

JavaScript高級程序設計筆記（一）

循環語句基本能力至少 oat som 最大數 earch define 1. ECMA規定了這門語言的下列組成部分：語法、類型、語句、關鍵字、保留字、操作符、對象 2. 什麽是 ECMAScript 兼容支持 ECMA描述的所有“類型、值、對象、屬性、函數以及

HtmlParser學習筆記（一）-- 創建Parser對象

nco 修改英文 text aid 意思 charset 網頁第一個首先，介紹下HTMLParser的核心類，org.htmlparser.Parser類，這個類實際完成了對於HTML頁面的分析工作。主要的構造函數如下： public Parser ();

ElasticSearch 筆記（一）

相關推薦