1. 程式人生 > >第七屆IEEE多媒體會議

第七屆IEEE多媒體會議

2018.8.18

1. 清華大學 戴瓊海院士

十億畫素計算攝像技術

摘要:

為了突破傳統成像和感測中的根深蒂固的假設和物理限制,提出了一種新的計算攝影理論和關鍵計算技術,即十億畫素計算攝像。利用提出的實時超大尺寸成像系統,在釐米尺度和微米解析度上進行了一些生物動力學的研究。

2. 科大訊飛副總裁 李世鵬

AI for A Better World

摘要:

張博士分享了一些關於科大訊飛公司的先進技術,以及通過AI技術和創新構建更好世界願景。作為語言和語言理解的世界先驅和領導者,科大訊飛公司正在消除人與人之間以及人與機器之間的語言溝通障礙。它的開放式平臺為成千上萬的開發者提供了超越想象的應用程式和創新。分享了一些利用人工智慧技術在教育、醫療和司法方面做出的初步成效。

3. 香港理工大學 David Zhang (張大鵬)教授

A New Multimedia Application: Computerized TCM Diagnosis

摘要:

多媒體是使用不同形式內容的組合,而中醫診斷主要以“望聞問切”為基礎,即視覺/聽覺/嗅覺/觸覺感測,這可以認為是典型的多媒體應用。然而,中醫診斷仍然依賴於醫生的經驗,並不能量化的。在此次報告中,張教授介紹了其課題組利用多媒體技術來科學量化中醫的研究成果。通過一些中醫辨證採集裝置,在醫院採集多種類似於舌象、脈象、氣味、聲音的先驗資料。然後,使用統計模式識別方法從這些影象/波形中提取所有可能的特徵,並將它們融合在一起。在訓練資料與測試資料匹配後,設計一些決策規則。最後,將其應用到實際的中醫診斷系統中,以說明該方法的有效性。

4. 微軟亞洲研究院 曾文軍教授

From Human Pose Estimation to Action Recognition

摘要:

近來,機器學習技術已經被廣泛地利用來將原始視訊資料轉換成洞察力以促進各種視訊應用和服務。由於人類是許多視訊中的主體,理解人類成為視訊理解的關鍵步驟。在這次報告中,曾教授介紹了利用CNN/LSTM,檢視適應模型,時空注意力模型和生成對抗網路(GANS)研究2D/3D人體姿勢估計/跟蹤和動作識別的最新成果

5. 北京交通大學 趙耀教授

Towards Weakly-Supervised Image Semantic Segmentation

摘要:

為了減少畫素級標註對全監督影象語義分割的沉重負擔,近年來出現了許多弱監督的影象語義分割方法。隨著深度卷積神經網路的發展,在語義分割方面取得了很大的進展。在此次報告中,趙教授介紹了基於深度學習的弱監督影象語義分割的一些成果。

6. 北京大學 田永鴻教授

Compact Representation and Joint Optimization of Visual Signals and Features for Video Big Data

摘要:

視訊資料的指數增長對當前的視訊分析和處理框架提出了巨大的挑戰。一方面,這些巨大的視覺資料來源可以被城市大腦分析,以獲得對於城市發展有價值的洞察力(例如,城市交通狀況)。另一方面,將來自全市的成百上千個攝像頭的所有視訊流聚集到城市大腦中進行大規模資料分析和檢索是不切實際的。一種可能的解決方案是在邊緣伺服器甚至攝像機上提取視覺特徵,然後實時地將緊湊的特徵流聚集到城市大腦中。在這種情況下,每個攝像機將同時輸出兩個流,包括壓縮的視訊流和緊湊的特徵流。因此,聯合表示和優化特徵描述符和視覺內容是非常可取的。在此次報告中,田教授介紹了其課題組利用深度神經網路共同壓縮視訊內容和特徵描述符的最新成果。

7.西電 王楠楠副教授

摘要:

異構面部影象是指具有不同模態或形式的人臉影象,例如,線性線條圖和素描肖像,近紅外影象,熱紅外影象和可見影象,低解析度和高解析度影象,面部動畫和麵部影象 用不同的表情,面對不同姿勢的影象。異構面部影象合成(HFIS)意味著不同模態影象之間的換。王教授介紹了其課題組在異構人臉影象合成和識別研究方面的最新進展。