11.best fields策略（dis_max參數設置）

阿新 • • 發佈：2018-02-28

一位計算 cor left write solution 們的 score 策略

主要知識點

常規multi-field搜索結果分析
dis_max參數設置

一、為帖子數據增加content字段

POST /forum/article/_bulk

{ "update": { "_id": "1"} }

{ "doc" : {"content" : "i like to write best elasticsearch article"} }

{ "update": { "_id": "2"} }

{ "doc" : {"content" : "i think java is the best programming language"} }

{ "update": { "_id": "3"} }

{ "doc" : {"content" : "i am only an elasticsearch beginner"} }

{ "update": { "_id": "4"} }

{ "doc" : {"content" : "elasticsearch and hadoop are all very good solution, i am a beginner"} }

{ "update": { "_id": "5"} }

{ "doc" : {"content" : "spark is best big data solution based on scala ,an programming language similar to java"} }

二、多字段搜索（multi-field搜索）

1、搜索title或content中包含java或solution的帖子

GET /forum/article/_search

{

"query": {

"bool": {

"should": [

{ "match": { "title": "java solution" }},

{ "match": { "content": "java solution" }}

]

}

2、結果分析

期望的排在第一位是doc5，結果是doc2,doc4排在了前面。原因如下：

計算每個document的relevance score的方式是：每個query的分數，乘以matched query數量，除以總query數量

算一下doc4的分數

{ "match": { "title": "java solution" }}，針對doc4，是有一個分數的，假設是1.1

{ "match": { "content": "java solution" }}，針對doc4，也是有一個分數的，假設是1.2

所以是兩個分數加起來是2.3，matched query數量 = 2，總query數量 = 2，計算的分數就是2.3 * 2 / 2 = 2.3

算一下doc5的分數

{ "match": { "title": "java solution" }}，針對doc5，是沒有分數的

{ "match": { "content": "java solution" }}，針對doc5，是有一個分數，假設是2.3

matched query數量 = 1，總query數量 = 2，計算的分數就是2.3 * 1 / 2 = 1.15

通過計算發現：doc4兩個field匹配到一個關鍵詞，分數反而高，doc5一個field匹配到兩個關鍵詞，分數反而低了，這樣不符合我們的預期。

三、best fields策略（dis_max參數設置）

best fields策略，就是說，搜索到的結果中，如果某一個field中匹配到了盡可能多的關鍵詞，那麽就應被排在前面；而不是盡可能多的field匹配到了少數的關鍵詞排在前面。

dis_max語法，直接取多個query中，分數最高的那一個query的分數即可。

{ "match": { "title": "java solution" }}，針對doc4，是有一個分數的，1.1

{ "match": { "content": "java solution" }}，針對doc4，也是有一個分數的，1.2

取最大分數，1.2

{ "match": { "title": "java solution" }}，針對doc5，是沒有分數的

{ "match": { "content": "java solution" }}，針對doc5，是有一個分數的，2.3

取最大分數，2.3

所以doc5就可以排在更前面的地方，符合我們的需要。

語法：

GET /forum/article/_search

{

"query": {

"dis_max": {

"queries": [

{ "match": { "title": "java solution" }},

{ "match": { "content": "java solution" }}

]

}

另一種寫法：結果是一樣的。

GET /forum/article/_search

{

"query": {

"dis_max": {

"tie_breaker": 0.7,

"boost": 1.2,

"queries": [

{"bool": {"should": [

{"match": {"title": "java solution"}},

{"match": {"content": "java solution"}}

]

}

}]

}

11.best fields策略（dis_max參數設置）

一位計算 cor left write solution 們的 score 策略主要知識點常規multi-field搜索結果分析 dis_max參數設置一、為帖子數據增加content字段 POST /forum/article/

PTGUI全景合成軟件使用二(鏡頭參數設置）

照片 fff 成像 sony jpeg src 參數設置系列自動拍攝VR全景照片盡量選擇大廣角或者魚眼鏡頭進行拍攝，這樣合成一張全景照片所需要的照片數量大為減少，照片數量越少合成全景照片難度越小，但相應的照片成像會有所下降，手機觀賞的話影響不大。現在大部分拍攝所使用的

JVM調優（二）經驗參數設置

too 語言相關 jdk5 nta 回收算法 from 情況根據調優設置具體解析　　堆大小設置　　　　JVM 中最大堆大小有三方面限制：相關操作系統的數據模型（32-bt還是64-bit）限制；系統的可用虛擬內存限制；系統的可用物理內存限制。32位系統下，一般限

了解java虛擬機—非堆相關參數設置（4）

了解 dir direct 相關配置申請 xss 進入 ces 復雜非堆內存相關配置-XX:PermSize永久區初始大小-XX:MaxPermSize永久區最大大小在JDK1.8中使用-XX:MxMetaspaceSize配置永久區最大大小-Xss線程棧大小-XX:

了解java虛擬機—JVM相關參數設置（2）

打印 upload mda 數值選擇 ssl 使用情況 src pat 1. JVM相關參數設置JVM相關配置-XX:+PrintGC兩次次YoungGC，兩次FullGC。-XX:+PrintGCDetails打印GC時的內存，並且在程序結束時打印堆內存使用情況-X

使用CefSharp在.Net程序中嵌入Chrome瀏覽器（二）——參數設置

個性化 cache .html 下一個 back 下一步 init false family 原文:使用CefSharp在.Net程序中嵌入Chrome瀏覽器（二）——參數設置在實現了.Net程序中嵌入Chrome瀏覽器後，下一步的個性化操作就是加入一些設置了，在前面的文章

Laravel5.2隊列驅動expire參數設置帶來的重復執行問題數據庫驅動

laravel php 隊列 ‘connections‘ => [ .... ‘database‘ => [ ‘driver‘ => ‘database‘, ‘table‘ => ‘jobs‘,

Jmeter各項參數設置

sta size mes load -c 測試一行位置循環 1.Jmeter參數化：方法1：step 右鍵-添加-前置處理器-用戶參數添加用戶、添加變量，設置叠代方式找到請求，將需要參數化的常量用參數替換方法2：通過CSV data source的方式 s

西門子SE70參數設置步驟

故障幫助時間學會沒有接口申請開始機構一、初始化（恢復出廠值） P053=7 （權限設置）定義參數化所用接口 P60=2 （菜單類型選擇）固定設置，用於恢復到工廠設置 P366=0 （提升10）選擇工廠設置或固定設置 P970 =0 （啟動參數復

調用enqueue執行異步請求有一個參數設置回調。

lba esp ack req bbs request對象調用企業開發前面的內容介紹了OkHttp，本章就來教大家okhttp的基本使用，學了這些基本東西之後，大家有其他的需求可以自行擴展。以下的所有請求都是異步請求服務器，在真實的企業開發中，基本都是異步。首先創

springmvc接口接收json類型參數設置

edi alt per 不能 convert ping ota pan art Springmvc需要如下配置： 1.開啟註解  <mvc:annotation-driven /> 2.加入相關bean <

curl學習之curl_setopt參數設置大總結

std delet 參數設置 oci 忽略 urlencode 請求 condition quest CURL函數庫裏最重要的函數是curl_setopt(),它可以通過設定CURL函數庫定義的選項來定制HTTP請求使用方法：bool curl_setopt (int c

Nhibernate/Hibernate 使用存儲過程多參數設置

ner map ini names project als service location work <?xml version="1.0" encoding="utf-8" ?> <hibernate-mapping xmlns="urn:n

【JVM】6、聊聊JVM常用參數設置

閾值 policy 虛擬機棧時間戳 ces 增加 action 垃圾容易整體考慮堆大小 -Xms3550m，初始化堆大小。通常情況和-Xmx大小設置一樣，避免虛擬機頻繁自動計算後調整堆大小。 -Xmx3550m，最大堆大小。考慮分代設置堆大小首先通過jstat等

MySQL 參數設置-持續更新

tab mysq ron 表示 tro strong 設置 nbsp nod InnoDB_file_per_table InnoDB_file_per_table=0; InnoDB_file_per_table=1 0為默認設置，標識每個數據庫使用一個表空間；修改

sublime text 3基本參數設置及插件使用

修改使用 text ont 顏色調色板 log shift images sublime text 3常用基本設置，包括插件，字體等一些配置。寫個隨筆，備忘。 soda主題：特別喜歡；插件：Color Highlighter輸入顏色時，可以看到顏色。在Color

【nginx筆記】系統參數設置-使Nginx支持更多並發請求的TCP網絡參數

logs 個數服務操作 fin 主動長度連接數量內核參數首先，需要修改/etc/sysctl.conf來更改內核參數。例如，最常用的配置： fs.file-max = 999999 net.ipv4.tcp_tw_reuse = 1 net.ipv4.tcp_

記一次錯誤的系統參數設置導致無法保持登錄狀態

linux如題，某天用xshell登錄華為雲(Centos 7)，發現每間隔15分鐘自動斷開連接。百度後，備份並修改了/etc/profile，將TMOUT鍵值由900修改為1h。保存後，source /etc/profile 使之生效，發現ssh剛連接進來1秒即斷開。不僅ssh登錄，從華為雲的遠程控制臺登

【ArcEngine】AE連接SDE_For_SQLServer參數設置

version col 數據 pro pan pre property ces per SDE for sqlserver直連的ArcEngine訪問 Ae中的數據的連接實質還是采用服務連接的方式。連接代碼如下： 1 public IWorkspace Ge

[轉]JVM參數設置、分析

ons first java性能情況下兩個 doc lena -1 pro 不管是YGC還是Full GC,GC過程中都會對導致程序運行中中斷,正確的選擇不同的GC策略,調整JVM、GC的參數，可以極大的減少由於GC工作，而導致的程序運行中斷方面的問題，進而適當的

11.best fields策略（dis_max參數設置）

相關推薦