1. 程式人生 > >ElasticSearch最佳入門實踐(六十六)倒排索引組成結構以及其索引可變原因

ElasticSearch最佳入門實踐(六十六)倒排索引組成結構以及其索引可變原因

倒排索引,是適合用於進行搜尋的

倒排索引的結構
(1)包含這個關鍵詞的document list
(2)包含這個關鍵詞的所有document的數量:IDF(inverse document frequency)
(3)這個關鍵詞在每個document中出現的次數:TF(term frequency)
(4)這個關鍵詞在這個document中的次序
(5)每個document的長度:length norm
(6)包含這個關鍵詞的所有document的平均長度

倒排索引不可變的好處
(1)不需要鎖,提升併發能力,避免鎖的問題
(2)資料不變,一直儲存在os cache中,只要cache記憶體足夠
(3)filter cache一直駐留在記憶體,因為資料不變
(4)可以壓縮,節省cpu和io開銷

倒排索引不可變的壞處:每次都要重新構建整個索引