Omnity: 新的語義搜索引擎
在全球信息呈爆炸式增長的今天,科研人員若想要跟蹤自身研究領域的最新進展,就要花費很多的時間和精力,要是想深入了解其他領域,就要先估量一下自己的時間是不是還夠用。Omnity是一款專為研究人員設計的全新搜索引擎,旨在幫助解決這些難題,加速“在學科領域內和學科領域之間發現隱藏的高價值互連模式”,使跨學科的研究變得更加容易。Omnity對學術界尤其有用,允許科學家、工程師、醫療專業人士、金融專家和律師搜索信息,數據來源包括科學期刊、專利、資助申請、臨床試驗、法律記錄、財務報告等等。
乍一看,這不就是google 學術做的事情嗎?這個新系統還能比google學術跟全更好?不同於谷歌的關鍵字搜尋機制,Omnity采用語義搜尋方法。對於任何查詢,Omnity能幫助用戶跨越不同的文件與網頁、新聞、專利等進行搜索,返回的搜索結果也不再限於關鍵字本身,而是根據詞語背後的意義找出關連性更強的資訊。所以當研究人員試圖調研跨學科文獻或者搜索不太熟悉的研究主題時,使用Omnity除了可以看到文章被引用次數最多的作者或是該研究主題的權威學術機構外,還可以得到一些意想不到的有用信息。
根據Omnity的官方網站(https://www.omnity.io/)的介紹,Omnity是一個可以利用文檔中所有文本內容的匹配引擎,是一種完全顛覆式的革命。當Omnity對整個文檔進行搜索時,會忽略像像he、she、it,but等之類沒有實際意義的詞,然後更專註於文件的獨特性,從而找出關連性更強的信息。Omnity還會將文檔與服務器的數百萬個其他文檔進行比較,從而提供更有效和更有創意的搜索。
相比於傳統的依靠關鍵詞和引用鏈接的搜索方式,Omnity具有以下三個明顯的特征:
- Omnity允許用戶使用整個文件作為搜索源進行查詢。
- 文件之間是以文本的內容進行相互關聯,而不是基於鏈接和引用關系。這樣一來,即便文件之間並無鏈接或引用關系,憑借文本內容間的相關性也可完成精確搜索。
- 這種形式的文件相關性搜索所要檢索的文件數量非常龐大,但Omnity使用了獨特的搜索方式,檢索過程非常迅速。即便是在現在這個不斷增長的大數據環境下,Omnity也能幫助用戶實現快速檢索。
2016年12月13日,Omnity對搜索工具進行了更新,支持多達100種語言的多語言文檔搜索,其中包括日語、漢語、西班牙語和阿拉伯語等。用戶只需上傳任何一種語言,機器可識別文檔,搜索引擎就會以英語返回搜索結果。
在搜索欄中鍵入查詢內容或將文檔拖放到搜索窗口中。Omnity會讀取查詢文檔並“提煉”出其中最不尋常的詞語。然後它通過開發的搜索引擎來獲取查詢結果。用戶還可以對檢索結果進行進一步的篩選,從而得到滿意的搜索結果。目前,Omnity的基本服務是免費的,但是要使用其增強功能就需要付費。
Omnity將來是獨角獸還是曇花一現,現在不得而知。但是作為比較有特色的搜索工具,將它當作google學術的一個補充也還是挺不錯的。
Omnity: 新的語義搜索引擎