1. 程式人生 > >EI檢索與目錄

EI檢索與目錄

特殊 proc 目前 blog 模糊 節點 process 評價 較高的

EI檢索與目錄

最為常見的EI檢索系統,其基本思想是:使用Robot來遍歷EI將EI上分布的信息下載到本地文檔庫;然後對文檔內容進行自動分析並建立索引;對於用戶提出的EI檢索請求,通過檢查索引找出匹配的文檔(或鏈接)並返回給用戶.在查詢時,用戶不需要知道搜索中索引的具體組織形式.最為著名的搜索有NorthernLight,AltaVista,Infoseek等.其中,NorthernLight和AltaVista所索引的Web頁面都已經超過了100000000。

與搜索的工作方式不同.它並不使用Robot下載EI文檔,而是由人工收集或者由EI站點的作者主動提交;目錄一般也不對文檔內容進行自動分析和建立索引,而是由人工對EI站點和文檔進行評價、分類並給出簡要描述.經過上述處理的EI信息資源按照主題分類並以樹狀的形式加以組織,從樹的根節點逐層向下列出了從一般到特殊的分類及各級子類,而葉節點則包含指向EI信息資源的鏈接.用戶可以通過瀏覽目錄中的分類來查詢EI信息.當目錄中包含太多的分類和鏈接時,目錄本身也變得不便於瀏覽.例如,目前Yahoo包含有指向500000個站點的鏈接,分布在25000個分類中為此,目錄通常也提供EI檢索功能以方便用戶.需要說明的是,目錄提供的是對分類以及EI信息描述的索引,這與搜索提供對文檔內容的全文索引是不同的。

搜索和目錄這兩種EI信息EI檢索系統各有所長. 通常,由於搜索具有龐大的全文索引數據庫,因此適用於EI檢索難以查找的信息或者一些比較模糊的主題;而目錄有助於逐步縮小主題或者查找某個主題的常見的、質量較高的信息.由於這兩種系統彼此互補,因此一些將兩者結合起來的混合系統也開始出現,例如:Look Smart等.現有的一些著名的搜索和目錄也呈現出逐漸融合的趨勢.例如,Yahoo在目錄EI檢索服務的基礎之上,已經開始使用Inktomi的EI全文索引數據庫提供與搜索引擎類似的EI信息全文EI檢索服務.在下文中,除非特別說明,我們將二者統稱為EI檢索。![](http://i2.51cto.com/images/blog/201808/15/3d83fb8f29c8c9b34e1d6a54d6763085.jpg?x-oss-process=image/watermark,size_16,text_QDUxQ1RP5Y2a5a6i,color_FFFFFF,t_100,g_se,x_10,y_10,shadow_90,type_ZmFuZ3poZW5naGVpdGk=)

EI檢索與目錄