中文情感分析任務資料集
阿新 • • 發佈:2021-01-16
技術標籤:情感分析nlp資料集資料集自然語言處理情感分析NLPCC
1 NLPCC
1.1 NLPCC-2012
下載網址:http://tcci.ccf.org.cn/conference/2012/pages/page10_dl.html
其中有兩份檔案,推薦下載2012-9-12的資料,比較全。
資料格式為xml,資料樣式如下:
<weibo id="15">
<sentence id="1" opinionated="Y" polarity="NEG" target_word_1=" 官二代" target_begin_1="1" target_end_1="3" target_polarity_1="NEG">#官二代求愛不成將少女毀容#太囂張了,就跟“我的爸爸是李剛”差不多了</sentence>
</weibo>
1.2 NLPCC-2013
樣例下載網址:http://tcci.ccf.org.cn/conference/2013/pages/page04_sam.html,task-2(中文微博情緒識別)
測試集下載網址:http://tcci.ccf.org.cn/conference/2013/pages/page04_tdata.html
資料格式為xml,資料樣式如下:
<weibo id="1" emotion-type="none">
<sentence id="1" emotion_tag="N">三八節下午路過中牟縣~見到很多美女~手執鮮花[鮮花]~一打聽~這裡不僅美女如雲~而且是千古笫一帥哥潘安的故里。。。</sentence>
<sentence id="2" emotion_tag="N">[給力][萌]</ sentence>
</weibo>
1.3 NLPCC-2014
樣例下載網址:http://tcci.ccf.org.cn/conference/2014/pages/page04_sam.html,task-1(Emotion Analysis in Chinese Weibo Texts)
測試集下載網址:http://tcci.ccf.org.cn/conference/2014/pages/page04_tdata.html,task-1(Emotion Analysis in Chinese Weibo Texts)
資料格式為xml,資料樣式如下:
<weibo id="1" emotion-type1="disgust" emotion-type2="none">
<sentence id="1" opinionated="N" keyexpression1="null">今兒老爸逮著我一頓狠念!</sentence>
<sentence id="2" opinionated="Y" emotion-1-type="disgust" emotion-2-type="none" keyexpression1="各種煩躁">念得我各種煩躁……</sentence>
<sentence id="3" opinionated="Y" emotion-1-type="disgust" emotion-2-type="none" keyexpression1="真煩人">我要不要考慮下降低迴家的頻率啊 回來一次吵一次= =真煩人!!!</sentence>
</weibo>