1. 程式人生 > >視頻結構化相關調研

視頻結構化相關調研

down flickr 關系 微博 資源分配 雅虎 learning 視頻 migration

視頻結構化是一種視頻內容信息提取的技術,它對視頻內容按照語義關系,采用時空分割、特征提取、對象識別等處理手段,組織成可供計算機和人理解的文本信息的技術。


深度學習為視覺和語言之間搭建了一座橋梁
https://weibo.com/ttarticle/p/show?id=2309404128390117477519

NLP註意力模型
https://mp.weixin.qq.com/s/5miocWSsDyOtUUwiTaUZdw
人腦的註意力模型,說到底是一種資源分配模型,註意力總是集中在畫面中的某個焦點部分,而對其它部分視而不見。

微博反垃圾系統
反垃圾系統由微博機器學習團隊研發,針對有害信息及人身攻擊言論做到大規模的智能處理。該系統在淺層模型的基礎上引入深度語義模型,通過對垃圾文本進行文本深度表示(word embedding),然後串聯長短時記憶網絡(LSTM),有效提升垃圾內容識別的準確率和召回率。

DeepMind提出SCAN:僅需五對樣本,學會新的視覺概念!
https://www.leiphone.com/news/201707/b4RTBYI0kiYOF4VY.html

資源 | 從全連接層到大型卷積核:深度學習語義分割全指南
http://www.dlworld.cn/YeJieDongTai/4476.html

分析海量視頻中的違規內容,七牛如何構建彈性深度學習計算平臺
http://www.infoq.com/cn/articles/qiniu-build-an-elastic-depth-learning-computing-platform
1.提到場景識別相關

Peter Cnudde談雅虎如何使用Hadoop、深度學習和大數據平臺
http://www.infoq.com/cn/articles/peter-cnudde-yahoo-big-data
在類似Flickr和Esports這樣的產品中,你們如何使用深度學習?您可以談一下你們正在使用的算法和技術嗎?
1.提到了自動簡化照片的分類
2.自動從現場直播視頻流中實時地檢測比賽的精彩片段

用兩個使用Caffe的小項目案例演示遷移學習的實用性
http://www.infoq.com/cn/news/2016/12/Two-Caffe-practical-migration
案例一新加坡政府機構組織的視頻分析挑戰賽
比賽內容就是通過視頻分析,檢測出視頻中出現的人臉並定位。
提到的代碼及paper:https://github.com/Russell91/ReInspect

播放量從每天 100 萬到 10 億,我們做對了哪些
http://www.infoq.com/cn/presentations/play-volume-from-1-million-to-1-billion-per-day-which-we-do-right
http://www.infoq.com/cn/presentations/play-volume-from-1-million-to-1-billion-per-day-which-we-do-right#downloadPdf
文本分析
視頻內容分析
用戶行為分析
視頻自動加頻道,視頻封面自動化,消重自動化

視頻結構化相關調研