微軟影片索引器更新!找影片更簡單

阿新 • • 發佈：2019-01-11

微軟影片索引器更新!找影片更簡單
微軟的影片索引器服務（Video Indexer）以多模態主題推理（Multi-modal Topic Inferencing），為使用者提供更直覺的影片分類方法，還能優化其內容探索功能。微軟提到，由於影片索引器可以理解媒體中的內部關係，因此比手動標記影片內容更加高效且低成本。大型媒體服務常會面臨媒體內容管理的問題，而且要對媒體進行內容探索，也會因規模的關係變得更加困難，雖然將影片按主題分類是一個好方法，但是內容分類是需要演繹推理的，影片中不一定會明確的顯示，微軟舉例，像是醫療保健相關的影片，內容並不一定會出現醫療保健這個詞。有不少企業轉而手動標記內容，但微軟表示，手動不只成本高昂且耗時，容易發生錯誤並且無法有效擴充套件。為了解決這個問題，微軟在其影片索引器加入了多模態主題推理，該功能使用跨頻道模型，索引媒體內容以自動推理主題。該模型會將影片概念投影到3個本體（Ontology），並以3大訊號包含轉譯影片語音還有字幕OCR的文字，以及對影片進行名人人臉辨識結果，來推論影片主題。
微軟影片索引器更新!找影片更簡單

影片索引器用於推理影片主題的本體包括IPTC、百科和影片索引器分層主題。IPTC本體在媒體企業中很受歡迎，提供超過1,100個術語的媒體主題分類。而百科的170萬個類別，也可用作主題卷標，優點是這些類別受到良好的維護，主題與文章採用的類圖連結，使其成為一種高解析的本體。影片索引器分層主題本體則是一個最大深度為3層，擁有超過2萬條目的專有的分層本體。影片索引器過去使用關鍵詞萃取模型，強調經轉譯與字幕OCR的重要詞彙，微軟以Build 2018開發人員大會的開幕主題演講為例，透過萃取關鍵詞索引主題，會出現網頁開發、單詞嵌入、無伺服器運算等關鍵詞。微軟提到，關鍵詞萃取與主題推理模型最大的差異在於，關鍵詞是影片中明確提到的術語，而主題是推論出來的，像是使用知識圖透過（Knowledge Graph）彙整相似的概念，以推論出高階內隱概念。

微軟影片索引器更新!找影片更簡單

影片索引器應用兩個模型來萃取主題，第一個是深度神經網路，根據大型專有資料集，直接對原始文字進行評分和排名，該模型會將影片轉譯文字，映像至影片索引器本體與IPTC。第二個模型則是對影片中提到的命名實體，使用光譜圖演算法（Spectral Graph Algorithms），該演算法利用經辨識名人的百科ID，以及OCR和翻譯文字的訊號。
由於這兩類訊號分屬結構化和非結構化的資料，因此微軟使用ELIS（Entity Linking Intelligent Service）會在自由格式文字中識別命名實體，將非結構化資料轉成結構化，以便之後能完全利用結構化資料進行主題擷取。微軟利用百科頁面實體的相似度，以及從影片頁面擷取到的不同概念，建置出圖，並在最後階段，根據後驗機率（Posteriori Probability）排名百科類別，以找出適合的主題。更多相關IT資訊：勝博發愛心公益

http://chiayuan.org.tw/

微軟影片索引器更新!找影片更簡單

微軟影片索引器更新!找影片更簡單

《Inside C#》筆記(六) 屬性、數組、索引器

c#裏面的索引器註意

9.SFB前端、邊緣服務器更新

c#索引器

java漏洞成黑客目標微軟呼籲用戶更新軟件

索引和查找課堂筆記與解讀同伴問題和收獲

dataframe按值（非索引）查找多行

采用ADM2483磁隔離器讓RS485接口更簡單更安全

對象存儲 JavaScript SDK 更新，即刻體驗更簡單·可信賴的服務

VI編輯器查找替換

Nginx服務器log_format設置更詳細的日誌格式

利用Python叠代器查找最小值和最大值

elasticsearch 5.x 系列之六文檔索引，更新，查詢，刪除流程

SQLServer 2016安裝時的錯誤：Polybase要求安裝Oracle JRE 7更新51或更高版本

SQL Server 2017安裝錯誤：Polybase要求安裝Oracle JRE 7更新51或更高版本的兩種解決方法

《隨筆四》——C#中的 “ 索引器和屬性的相同點和不同點、索引器與陣列的區別、索引器的過載 ”

elasticsearch（一）java 分別使用同步和非同步方法進行索引、更新操作

elasticsearch 索引，更新，增量更新，不停機修改升級 ,簡單使用

pymongo建立索引、更新、刪除

微軟影片索引器更新!找影片更簡單

相關推薦