1. 程式人生 > >著名的影象檢索系統

著名的影象檢索系統

1. QBIC(Query By Image Content)影象檢索系統 IBM 公司 90年代開發製作的影象和動態景象檢索系統,是第一個基於內容的商業化的影象檢索系統。QBIC 系統提供了多種的查詢方式,包括:利用標準範圖(系統自身提供)檢索,使用者繪製簡圖或掃描輸入影象進行檢索,選擇色彩或結構查詢方式,使用者輸入動態影象片段和前景中運動的物件檢索。在使用者輸入影象、簡圖或影象片段時,QBIC 對輸入的查詢影象進行顏色、紋理、形狀等特徵進行分析和抽取,然後根據使用者選擇的查詢方式分別進行不同的處理。QBIC 中使用的顏色特徵有色彩百分比、色彩位置分佈等;使用的紋理特徵是根據Tamura 
提出的紋理表示的一種改進,即結合了粗糙度、對比度和方向性的特性;使用的形狀特徵有面積、圓形度、偏心度、主軸偏向和一組代數矩不變數。QBIC 還是少數幾個考慮了高維特徵索引的系統之一。
QBIC除了上面的基於內容特性的檢索,還輔以文字查詢手段。例如為舊金山現代藝術博物館的每幅作品給予標準描述資訊:作者、標題、日期,許多作品還有內容的自然描述。
2.
Virage 
是由 Virage 公司開發的基於內容的影象檢索引擎.QBIC 系統一樣,它也支援基於色彩、顏色佈局、紋理和結構等視覺特徵的影象檢索。Jerry 等人還進一步提出了影象管理的一個開放式框架,將視覺特徵分為通用特徵(如顏色、紋理和形狀)和領域相關特徵(如用於人臉識別和癌細胞檢測等)兩類。

VIRAGE公司的VIR(Visual Information Retrieval)影象引擎提供了四種可視屬性檢索(顏色、成分、紋理和形狀)。每種屬性被賦予0到10的權值。通過顏色特性檢索是最簡單明瞭的,該軟體對選出的基礎影象的色調、色彩以及飽合度進行分析,然後在影象庫中查詢與這些顏色屬性最接近的影象。成分(composition)特性指相關顏色區域的近似程度。 
使用者可以設定一個或多個屬性權值來優化檢索。要達到最佳平衡度需要反覆試驗,但檢索過程是相當快的。在結果顯示矩陣中可以選擇檢視369121518個簡圖。通過對四個屬性權值的調整,顯示出不同的檢索結果。簡圖是根據相似度降序排列。點選簡圖示題將得到該影象的一些詳細說明,包括
Virage計算出的相似比。
3.
RetrievalWare 
是由 Excalibur 科技有限公司開發的一種基於內容的影象檢索工具。早期版本中,可以看到該系統的重點在於運用神經網路演算法實現影象檢索。在比較新的版本中r提供基於6種影象屬性的檢索,分別是顏色、形狀、紋理、顏色結構、亮度結構和縱橫比。顏色屬性是對影象的顏色及其所佔的比率進行測定,但並不包括對顏色的結構或位置的測定,這一項是由顏色結構屬性控制的;形狀屬性指影象中物體的輪廓或線條的相對方位、彎曲度及對比度;紋理屬性是指影象的平滑度或粗糙度,一幅圖的表面特性;亮度屬性是指構成影象的象素組合的亮度。這是一個非常有力的影象檢索工具。
4.
Photobook 
是美國麻省理工學院的多媒體實驗室所開發的用於影象查詢和瀏覽的互動工具。它由三個子系統組成,分別負責提取形狀、紋理、面部特徵。因此,使用者可以在這三個子系統中分別進行基於形狀、基於紋理和基於面部特徵的影象檢索。
 Photobook 的最新版本 FourEyes 中,Picard 等人提出了把使用者加入到影象注註釋和檢索過程中的思想。同時由於人的感知是主觀的,他們又提出了“模型集合”來結合人的因素。實驗結果表明,這種方法對於互動式影象註釋來說非常有效。
5.
VisualSEEK 
是基於視覺特徵的檢索工具, WebSEEK 是一種面向 WWW 的文字或影象搜尋引擎。這兩個檢索系統都是由哥倫比亞大學開發的。它們的主要特點是採用了影象區域之間空間關係和從壓縮域中提取的視覺特徵。系統所採用的視覺特徵是利用顏色集和基於小波變換的紋理特徵。VisualSEEK 同時支援基於視覺特徵的查詢和基於空間關係的查詢。WebSEEK 包括三個主要模組:影象/視訊採集模組,主題分類和索引模組,查詢、瀏覽和檢索模組。
相對於其它的多媒體檢索系統,VisualSEEK 的優點在於:高效的 Web 影象資訊檢索,採用了先進的特徵抽取技術,使用者介面強大,操作簡單,查詢途徑豐富,輸出畫面生動且支援使用者直接下載資訊。而 WebSEEK 本身就是一個獨立的全球資訊網視覺化程式設計工具,已經對 650000 幅影象和 10000 個影象片段進行了編目,使用者可以使用目錄瀏覽和特徵檢索方式進行影象檢索。