《開拓者開發團隊》第二次作業:基於彈幕評論的大數據分析平臺項目開題報告
一、項目申請簡表
項目名稱 |
基於彈幕評論的大數據分析平臺 |
|||||||||||||||
項 目 類 別 |
本科生 |
研究生 |
||||||||||||||
學術課題項目填寫標 記(√) |
( ) A、自然科學學術論文 (√ ) B、科技發明制作 ( ) C、社會科學論文與調查報告 |
類別 標記 ( ) |
( ) A、學術科研類項目 ( ) B、社會調查類項目 ( ) C、創新實踐類項目 |
|||||||||||||
創新創業 項目填寫 標記(√) |
(√)信息技術 ( )電子商務 ( )健康醫療 ( )新能源新材料 ( )跨境電子商務 ( )智能制造 ( )文化創意 ( )旅遊時尚 ( )現代農業 |
|||||||||||||||
申請金額 |
30000 |
起止時間 |
2018-5-3至2018-6-20 |
|||||||||||||
申 請 者 |
團隊組長 |
姓名 |
杜世康 |
性別 |
男 |
出生年月 |
1997.1 |
民族 |
漢 |
|||||||
專業 |
計算機科學與技術 |
入學時間 |
2015.8 |
|||||||||||||
學院 |
計算機科學與工程學院 |
聯系電話 |
17793147249 |
|||||||||||||
主 要 成 員(不含申請者) |
姓 名 |
專業及年級 |
項目中的分工 |
簽 字 |
||||||||||||
劉 丹 |
計算機科學與技術 三年級 |
後臺開發 |
劉 丹 |
|||||||||||||
王靜雅 |
計算機科學與技術 三年級 |
後臺開發 |
王靜雅 |
|||||||||||||
李玉瑩 |
計算機科學與技術 三年級 |
後臺開發 |
李玉瑩 |
|||||||||||||
尹楠 |
計算機科學與技術 三年級 |
數據庫設計 |
尹 楠 |
|||||||||||||
曹瑩雯 |
計算機科學與技術 三年級 |
系統前臺設計 |
曹瑩雯 |
|||||||||||||
|
|
|
|
|||||||||||||
研 究項目 內 容 概 述 |
“基於彈幕評論的大數據分析平臺”,利用國內知名的直播平臺-鬥魚,通過其彈幕服務器第三方接入協議來爬取海量彈幕數據,作為一個實驗的基礎。對於彈幕數據做一個大數據的
|
|||||||||||||||
二、立論依據(項目定位)
隨著互聯網的不斷發展和推進,網絡在線直播視頻,已經在人們觀看視頻過程中占據了主要地位,“彈幕”因其高互動性和娛樂性已經流行開來,而彈幕自身包含的豐富文本信息和與視頻內容相關的時序性特征為數據挖掘提供了可能。而目前計算機領域對於彈幕研究的主要應用可概括為垃圾彈幕的識別和過濾,視頻流行程度的預測,視頻的自動標記,視頻精彩片段的抽取等。
|
||||||||||||||||
三、研究方案
1、研究目標、研究內容和擬解決的關鍵問題 “基於彈幕評論的大數據分析平臺”,利用國內知名的直播平臺-鬥魚,通過其彈幕服務器第三方接入協議來爬取海量彈幕數據,作為一個實驗的基礎。預期的目的是利用Java多線程編程實現實時獲取彈幕並能夠通過大數據分析出一些基本的指標並直觀展示出來,做一些簡單的數據挖掘,如果進展順利,也可以做類似精彩視頻片段推薦這樣更有意義的事!
2、擬采取的技術路線 擬定的技術路線為首先利用Java多線程編程來實時爬取海量鬥魚彈幕數據,其次利用Spginmvc,Spring data,H-ui搭建本次項目的主體框架並集成數據可視化工具Echarts體現大數據分析結果,最後利用Python制作數據診斷工具來了解特征的分布及基本的統計指標值,再有目的性的選擇一些聚類,分類,文本挖掘算法對於彈幕數據做一個大數據的分析,並將實驗數據通過echarts展示在大數據分析平臺上。
3、項目進度時間安排 (文獻查閱): 2018 年 5 月 3 日至 2018 年 5 月10日 (方案設計): 2018 年 5 月10日至 2018 年 5 月20日 (實驗研究): 2018 年 5 月20日至 2018 年 5 月31日 (數據處理): 2018 年 5 月31日至 2018 年 6 月 5 日 (研制開發): 2018 年 6 月 5 日至 2018 年 6 月15日 (撰寫論文或研究報告): 2018 年 6 月15日至 2018 年 6 月20日
|
||||||||||||||||
四、預期成果
對鬥魚平臺的彈幕做一個大數據分析,自身定位是提供服務的第三方平臺。目標用戶可以是直播平臺自身,通過海量彈幕數據去做針對鬥魚彈幕用戶的用戶分析,直播視頻的推薦,深入點也可以精彩片段的推薦等,服務對象是直播平臺自身。如果各大直播平臺都提供開放的彈幕獲取接口,預計用戶量可以是各大直播平臺。目標用戶也可以是平臺主播,例如:通過對彈幕數據的分析,做一個粉絲禮物貢獻排行榜,彈幕活躍粉絲排行版,去增強主播和這些鐵粉的聯絡互動。還可以通過彈幕文本分析指出主播的優缺點,再例如,對於愛看唱歌類直播的粉絲一般彈幕會刷歌名去要求主播獻唱,而把這樣的信息反饋給主播可以說是非常有價值的。這時候的服務對象就是各大主播了,而預計用戶數量則不可估計
|
二、立項書github 地址: https://github.com/LWDLYC/xixi
《開拓者開發團隊》第二次作業:基於彈幕評論的大數據分析平臺項目開題報告