isearch5 index,attribute和summary。
索引
isearch5 支持的索引分為:index,attribute和summary。
Index指的是倒排索引,它存儲了存儲了從term到DocID的映射關系,形如:
term-->(Doc1,Doc2,...,DocN);倒排索引主要用在檢索中,它能快速的定位用戶查詢到關鍵字對應的document。比如同事間經常說的”xx“進召回往往指的就是這個”xx“信息被建立了倒排索引。
Attribute指的是正排索引,它存儲從DocID到field的映射關系,形如:
DocID-->(term1,term2,...termn)。正排索引分單值和多值兩種,單值attribute由於長度是固定的(不包括string類型),因此查找效率高,而且可以支持更新。多值attribute表示某個field中有多個數據(數量不固定),由於長度不確定,因此查找效率相較與單值更慢。正排索引主要是在查詢到了某個Document後,根據docid值能快速獲取到其attribute用來統計、排序、過濾中。比如我們經常聽到的”xx“計算相關性,那麽”xx“這個信息就往往建立了正排索引,需要註意的是ranker中使用的字段必須全部進正排,否則ranker取不到這些字段。
summary的存儲形式與attribute類似,但是summary是將一個Document對應的多個field存儲在一起,並且建立映射,所以能很快從docid定位到對應的summary內容。summary主要是用於結果的展示。
並不是所有的字段都需要建立索引,特別對於商品搜索,一些字段僅僅用於展示,而不用檢索或者計算相關性,那麽這些字段就存在Doc中,一起返回給前端供應用展示,比如商品的detail鏈接。
isearch5 index,attribute和summary。