elasticsearch中的精準文字位置匹配

阿新 • • 發佈：2019-01-10

在elasticsearch中，將長篇幅的文件劃分為樹形結構的段落後，有助於文字的精準位置匹配，

例如：原來的content是這樣的：

content = "一、大標題 \n 1. 一級標題 \n 1> 二級標題"

段落劃分後，是如下這樣：

content = {
    paras: [
        {
            "text": "大標題",
             "sub_paras": [
                     {
                         "text": "一級標題",
                         "sub_paras": [
                              {
                                  "text": "二級標題"
                                }
                          ]
                      }
              ]
        }
    ]
}

如果在查詢時，只想定位到文字所在的段落，可以這樣查詢：

            "query": {
                "bool": {
                    "should": [
                        {"nested": {
                            "path": "content.paras",
                            "query": {
                                "term": {
                                    "content.paras.text": "哈哈"
                                }
                            },
                            "inner_hits": {
                                "name": "inner_hit_p"
                            }
                        }},
                        {"nested": {
                            "path": "content.paras.sub_paras",
                            "query": {
                                "term": {
                                    "content.paras.sub_paras.text": "哈哈"
                                }
                            },
                            "inner_hits": {
                                "name": "inner_hit_sub_p"
                            }
                        }},
                        {"nested": {
                            "path": "content.paras.sub_paras.sub_paras",
                            "query": {
                                "term": {
                                    "content.paras.sub_paras.sub_paras.text": "哈哈"
                                }
                            },
                            "inner_hits": {
                                "name": "inner_hit_sub_sub_p"
                            }
                        }},
                    ]
                }
            }

elasticsearch中的精準文字位置匹配

在elasticsearch中，將長篇幅的文件劃分為樹形結構的段落後，有助於文字的精準位置匹配，例如：原來的content是這樣的： content = "一、大標題 \n 1. 一級標題 \n 1> 二級標題" 段落劃分後，是如下這樣： content = {

ElasticSearch教程——精準全文檢索

ElasticSearch彙總請檢視：ElasticSearch教程——彙總篇 1、為帖子資料增加標題欄位 POST /forum/article/_bulk { "update": { "_id": "1"} } { "doc" : {"title" : "this is

如何通過迅捷OCR文字識別軟體精準識別圖片中的文字

　　怎樣精準的將圖片中的文字識別出來呢？相信這是很多人的煩惱，因為我們經常會遇到文字識別的時候，使用到的方法也有很多，但是很多方法識別出來的效果不是很好，需要對比著原圖去改正，這就很令人煩惱了。下面小編將分享一種在圖片文字識別軟體中精準提取文字的方法，一起來學習下。　　步驟一、文字識別的話需要使用到工具，

如何通過迅捷OCR文字識別軟件精準識別圖片中的文字

提取技術分享圖片文字 term 圖片局部自動 color 通過 img 怎樣精準的將圖片中的文字識別出來呢？相信這是很多人的煩惱，因為我們經常會遇到文字識別的時候，使用到的方法也有很多，但是很多方法識別出來的效果不是很好，需要對比著原圖去改正，這就很令人煩惱了。下面小

Elasticsearch學習之深入搜索一 --- 提高查詢的精準度

ast 多少 opera 相關度滿足 ini 無法 sea 進行 1. 為帖子增加標題字段 POST /forum/article/_bulk { "update": { "_id": "1"} } { "doc" : {"title" : "this is java

Nginx得Location配置詳解之精準匹配

location的匹配過程一、location 的定義 location 有“定位”的意思，根據Uri來進行不同的定位。在虛擬主機的配置中，是必不可少得，location可以把網站的不同部分，定位到不同的處理方式上。二、location 的語法 location [

曲速未來：智慧合約中最少的廣告費最精準的廣告推送案例分析

事由區塊鏈安全諮詢公司曲速未來訊息：就在前幾天，許多以太坊錢包賬戶都收到了一種名為blockwell.ai KYC Casper Token代幣轉進/出賬訊息：令人奇怪的是這些賬號均表示之前對這個Token的“一無所知”

貝萊德精準清倉紅黃藍？景林資產教育中概股佈局曝光

@央廣軍事11月10日訊息,2018中國航展上首次公開展出的“瞭望者Ⅱ”察打一體導彈無人艇，是剛剛成功進行首發導彈飛行試驗命中靶心的實艇，試驗成功後隨即吊裝到展位與公眾見面。據媒體此前報道，該艇是中國第一艘導彈無人艇，也是繼以色列拉斐爾海上騎士後全球第二個成功發射導彈的無人艇，填補了國內導彈無人艇這一技術空白

綜合微軟、AMiner兩大學術圖譜，清華大學唐傑博士如何將Open Academic Graph億級資料精準匹配

AI 科技評論按：近日，清華大學副教授、Arnetminer 創始人唐傑博士在微博上公開了開放學術組織（Open Academic Society）釋出的億級學術圖譜——Open Academic Graph。據唐傑博士介紹，該圖譜目前集成了兩個最大的公開學術圖譜：微軟學術圖譜（MAG）

Elasticsearch學習之深入搜尋一 --- 提高查詢的精準度

為帖子增加標題欄位 POST /forum/article/_bulk { "update": { "_id": "1"} } { "doc" : {"title" : "this is java and elasticsearch blog"} } { "update":

Elasticsearch全文搜尋控制精準度

前言本文主要是關於全文搜尋控制精準度的操作其他搜尋請參考：一、使用operator 搜尋結果中必須至少包括run、jump兩種愛好 GET people/_search {

webview中巢狀html實現精準定位（百度地圖、高德地圖、騰訊地圖、H5原生定位）js對比

最近在實現一個功能，就是在安卓手機和蘋果手機嵌入html程式碼，實現精準定位，我為此對比幾種定位的方法。我要的是精準定位，就是誤差在100米左右的功能，類似與外賣app那種定位精確度 1. 首先是原生h5定位 if(browser.versions.an

精準營銷：挖掘日誌中的手機號碼資訊

精準營銷：挖掘日誌中的手機號碼資訊日誌中手機號碼的價值當我們在做營銷活動時，常常有這樣的苦惱：花了一大筆錢，哪些客戶打開了廣告，哪些客戶轉化成了付費使用者，要有一個kpi指標來衡量整個投放效果。轉化率高的客戶，有哪些特徵？是否可以用來作為參考，提升下次的投放精準度。在精準投放的基

【產業智慧官】用新一代技術+商業作業系統(AI-CPS OS:雲端計算+大資料+物聯網+區塊鏈+人工智慧),在場景中構建狀態感知-實時分析-自主決策-精準執行-學習提升的認知計算和機器智慧

產業智慧官用新一代技術+商業作業系統(AI-CPS OS:雲端計算+大資料+物聯網+區塊鏈+人工智慧),在場景中構建狀態感知-實時分析-自主決策-精準執行-學習提升的認知計算和機器智慧...

Python爬蟲：在帶有多個屬性值的class選擇器中選擇其中一個值，實現標籤快速精準定位

在寫爬蟲時，定位標籤位置獲取想要的資料是匹配工作的重點。通過class或id選擇器的值（屬性值要求在網頁中是唯一的）可以很快的實現標籤的定位。 <span data-post-id="114214" class=" btn-bluet-bigger href-styl

正則精準匹配IP的問題

經常會碰到匹配IP的問題，很多時候用粗略點方式，比如 \d{3}\.\d{3}\.\d{3}\.\d{3} 使用上面的就可以匹配，但有時候，要準確匹配的話，上面的顯然就不行比如999.10.10.10顯然就不是IP地址 (1-255).(0-255).(0-255).(0-254)上

nginx----Location詳解之精準匹配

location 語法 location 有”定位”的意思, 根據URL來進行不同的定位. 在虛擬主機的配置中,是必不可少的,location可以把網站的不同部分,定位到不同的處理方式上. 比如, 碰到.php, 如何呼叫PHP直譯器? --這時就需要location l

elasticsearch 多詞短語位置匹配查詢

類似 match 查詢， match_phrase 查詢首先將查詢字串解析成一個詞項列表，然後對這些詞項進行搜尋，但只保留那些包含全部搜尋詞項，且位置與搜尋詞項相同的文件。比如對於 quick fox 的短語搜尋可能不會匹配到任何文件，因為沒有文件包含的 quick 詞之後緊跟著 fox 。

ES 5.x中在精準搜尋時的過濾方式

之前一直有個問題沒解決，比如希望通過kibana的Discover裡的filter去過濾某個域名，request為"/"的請求，需求是精確匹配：那麼在Dev Tools裡對應的查詢應該和下面類似： GET index-example/_search { "query": { "

Location詳解之精準匹配、正則匹配

location / { root /usr/local/nginx/html; index index.html index.htm; } location ~ image { root /var/www/image

elasticsearch中的精準文字位置匹配

相關推薦