2-2、深入搜尋 -基於詞項和基於全文的搜尋

阿新 • • 發佈：2021-08-16

1. 基於詞項和基於全文的搜尋

基於 Term 的查詢

Term 是表達語意的最⼩單位。搜尋和利⽤統計語⾔模型進⾏⾃然語⾔處理都需要處理 Term
特點
- Term Level Query: Term Query / Range Query / Exists Query / Prefix Query /Wildcard Query
- 在 ES 中，Term 查詢，對輸⼊不做分詞。會將輸⼊作為⼀個整體，在倒排索引中查詢準確的詞項，並
  且使⽤相關度算分公式為每個包含該詞項的⽂檔進⾏相關度算分 – 例如“Apple Store”
- 可以通過 Constant Score 將查詢轉換成⼀個 Filtering，避免算分，並利⽤快取，提⾼效能
例子
建立index products_test

關於Term 查詢的例子
POST /products_test/product/_bulk
{ "index": { "_id": 1 }}
{ "productID" : "XHDK-A-1293-#fJ3","desc":"iPhone" }
{ "index": { "_id": 2 }}
{ "productID" : "KDKE-B-9947-#kL5","desc":"iPad" }
{ "index": { "_id": 3 }}
{ "productID" : "JODL-X-1937-#pV7","desc":"MBP" }

POST /products_test/_search
{
  "query": {
    "term": {
      "desc.keyword": {
        //"value": "iPhone"  查不到結果
        //"value":"iphone"   可以查到
      }
    }
  }
}
上面查詢分別返回什麼？

term 查詢欄位不分詞，可以再mapping 中設定 keyword

複合查詢 Constant Score 轉為 Filter
- 將 Query 轉成 Filter，忽略 TF-IDF 計算，避免相關性算分的開銷
- Filter 可以有效利⽤快取

POST /products_test/_search
{
  //"explain": true,
  "query": {
    "constant_score": {     // 忽視計算分數帶來的效能影響
      "filter": {
        "term": {
          "productID.keyword": "XHDK-A-1293-#fJ3"
        }
      }

    }
  }
}

基於全文的查詢

基於全⽂本的查詢
- Match Query / Match Phrase Query / Query String Query
特點
- 索引和搜尋時都會進⾏分詞，查詢字串先傳遞到⼀個合適的分詞器，然後⽣成⼀個供查詢的詞
  項列表
- 查詢時候，先會對輸⼊的查詢進⾏分詞，然後每個詞項逐個進⾏底層的查詢，最終將結果進⾏合
  並。併為每個⽂檔⽣成⼀個算分。- 例如查 “Matrix reloaded”，會查到包括 Matrix 或者 reload
  的所有結果。

 post product_test/_search
{
 "query":{
    "match":{
      "desc":{
          "query":"dejxv"
      }
    }
  }
}

match 與 match_phrase 區別？

2-2、深入搜尋 -基於詞項和基於全文的搜尋

1. 基於詞項和基於全文的搜尋基於 Term 的查詢 Term 是表達語意的最⼩單位。搜尋和利⽤統計語⾔模型進⾏⾃然語⾔處理都需要處理 Term

SpringBoot---快取技術2（基於Redis註解和基於RedisTemplate的手動快取，包括將快取資料序列化成json資料，有原始碼）

基於註解的Redis快取實現 1、加入redis依賴 <dependency> <groupId>org.springframework.boot</groupId>

浙大版《C語言程式設計（第3版）》題目集習題2-4 求交錯序列前N項和

- - -》博主推薦，學生黨、程式設計師必備，點選檢視- - - >>>>> 熱門文章推薦

習題2-5 求平方根序列前N項和 (15 分)

習題2-5 求平方根序列前N項和 (15 分) 本題要求編寫程式，計算平方根序列的前N項之和。可包含標頭檔案math.h，並呼叫sqrt函式求平方根。

2.2、基於註解的DI注入

學習資源：動力節點的2020最新Spring框架教程【IDEA版】-Spring框架從入門到精通

來學演算法 #2 深度、廣度優先搜尋（1）

技術標籤：演算法來學演算法 #2 深度、廣度優先搜尋（1）深度、廣度優先搜尋——重要的搜尋方法提起搜尋，我們首先想到的可能是查詞典。其實，深度、廣度優先搜尋和查詞典是一樣的。比如，我們要查詢一個成語

索尼 FX6 電影機 ver.2.0 韌體將至：AI 實時跟蹤對焦、呼吸補償等多項功能搶先看

1 月 13 日訊息，索尼 FX6 電影攝影機近期將獲得ver.2.0 韌體更新，帶來多項新功能。索尼於 2020 年 11 月釋出了全畫幅電影攝影機 FX6，支援 4K 120p 格式拍攝，用於 15+ 級動態範圍，ISO 最高可達 40 萬，售價 480

4.1 數列的概念2 (遞推公式、前n項和)

\\({\\color{Red}{歡迎到學科網下載資料學習 }}\\) [ 【基礎過關係列】高二數學同步精品講義與分層練習(人教A版2019）]

有4個圓塔,圓心分別為(2,2)、(-2,2)、(-2,-2)、(2,-2),圓半徑為1,見圖。這4個塔的高度為10m,塔以外無建築物。今輸入任一點的座標，求該點的建築高度(塔外的高度為零)

有4個圓塔,圓心分別為(2,2)、(-2,2)、(-2,-2)、(2,-2),圓半徑為1,見圖。這4個塔的高度為10m,塔以外無建築物。今輸入任一點的座標，求該點的建築高度(塔外的高度為零)。

Educational Codeforces Round 88 (Rated for Div. 2) B、New Theatre Square C、Mixing Water

題目連結：B、New Theatre Square 題意：你要把所有“.” 都變成“*”，你可以有兩個選擇，第一種就是一次鋪一個方塊（1*1），第二種就是同一行一次鋪兩個（1*2）。第一種花費x，第二種花費y。

Educational Codeforces Round 88 (Rated for Div. 2) D、Yet Another Yet Another Task

題意：給你一個含n個數a1,a2...an的陣列，你要找到一個區間[l,r],使得al+a(l+1)+...+a(r-1)+ar減去max(al,a(l+1),...,a(r-1),ar)的值儘可能大

Codeforces Round #660 (Div. 2) A、B、C題解

A. Captain Flint and Crew Recruitment #構造題目連結題意定義一類正整數，能夠被\\(p*q\\)表示，其中\\(p、q(1<p<q)\\)均為素數，稱之為\\(nearly\\ prime\\) 。現要求判斷整數\\(n\\)，是否能被4個不同整

Java入門2.2---面向物件的主線2---面向物件的三大特徵：封裝性、繼承性、多型性

二、主線2：面向物件的特徵---封裝性、繼承性、多型性（抽象性） 1.封裝與隱藏

springboot-2.3.x最新版原始碼閱讀環境搭建(基於gradle構建)

一、前言跟很多小夥伴聊天，發現一個嚴重的問題，很多小夥伴橫向發展的貌似很不錯，很多技術都能說出一二，但是如果在某個技術上深挖一下就不行了，問啥啥不會。就拿springboot來說，很多同學止步於springboot的應用

【Spring Security】2. EableWebSecurity、WebSecurityConfiguration和過濾器鏈原始碼解析

1 @EnableWebSecurity原始碼解析 @Retention(RetentionPolicy.RUNTIME) @Target({ElementType.TYPE}) @Documented

《pytorch 入門學習——2. 詞向量和語言模型》

fizz buzz 遊戲 https://zhuanlan.zhihu.com/p/105924322 word2vec：skip-gram https://zhuanlan.zhihu.com/p/105955900

2.3、Spring多配置檔案

學習資源：動力節點的2020最新Spring框架教程【IDEA版】-Spring框架從入門到精通

Codeforces Round #669 (Div. 2) A、B題題解

Problem A - Ahahahahahahahaha https://codeforces.com/contest/1407/problem/A 題意：給定一個偶數陣列(元素值 0，1），在刪除一定的陣列元素（最多 \\(n / 2\\) 個) 以後偶數位和是否能等於奇數位和。

《深入理解計算機系統》學習筆記（二）2.2~2.3

《深入理解計算機系統》學習筆記（二）２.２無符號數的編碼　　假設對於一個w位的無符號整數，用二進位制位元位可以表示為[xw-1 , xw-2 , … , x0]。那麼我們可以用一個函式表示如下：　　每個位Ｘｉ都取

Java day 2-常量、資料型別和運算子

目錄常量的概述和使用資料型別資料型別轉換 char資料型別計算運算子練習題常量的概述和使用

2-2、深入搜尋 -基於詞項和基於全文的搜尋

1. 基於詞項和基於全文的搜尋

基於全文的查詢

相關推薦