1. 程式人生 > 其它 >中文情感分析任務資料集

中文情感分析任務資料集

技術標籤:情感分析nlp資料集資料集自然語言處理情感分析NLPCC

1 NLPCC

1.1 NLPCC-2012

下載網址:http://tcci.ccf.org.cn/conference/2012/pages/page10_dl.html

其中有兩份檔案,推薦下載2012-9-12的資料,比較全。

資料格式為xml,資料樣式如下:

<weibo id="15">
    <sentence id="1" opinionated="Y" polarity="NEG" target_word_1="
官二代"
target_begin_1="1" target_end_1="3" target_polarity_1="NEG">
#官二代求愛不成將少女毀容#太囂張了,就跟“我的爸爸是李剛”差不多了</sentence> </weibo>

1.2 NLPCC-2013

樣例下載網址:http://tcci.ccf.org.cn/conference/2013/pages/page04_sam.html,task-2(中文微博情緒識別)

測試集下載網址:http://tcci.ccf.org.cn/conference/2013/pages/page04_tdata.html

,task-2(中文微博情緒識別)

資料格式為xml,資料樣式如下:

<weibo id="1" emotion-type="none">
    <sentence id="1" emotion_tag="N">三八節下午路過中牟縣~見到很多美女~手執鮮花[鮮花]~一打聽~這裡不僅美女如雲~而且是千古笫一帥哥潘安的故里。。。</sentence>
    <sentence id="2" emotion_tag="N">[給力][萌]</
sentence
>
</weibo>

1.3 NLPCC-2014

樣例下載網址:http://tcci.ccf.org.cn/conference/2014/pages/page04_sam.html,task-1(Emotion Analysis in Chinese Weibo Texts)

測試集下載網址:http://tcci.ccf.org.cn/conference/2014/pages/page04_tdata.html,task-1(Emotion Analysis in Chinese Weibo Texts)

資料格式為xml,資料樣式如下:

<weibo id="1" emotion-type1="disgust" emotion-type2="none">
    <sentence id="1" opinionated="N" keyexpression1="null">今兒老爸逮著我一頓狠念!</sentence>
    <sentence id="2" opinionated="Y" emotion-1-type="disgust" emotion-2-type="none" keyexpression1="各種煩躁">念得我各種煩躁……</sentence>
    <sentence id="3" opinionated="Y" emotion-1-type="disgust" emotion-2-type="none" keyexpression1="真煩人">我要不要考慮下降低迴家的頻率啊 回來一次吵一次= =真煩人!!!</sentence>
</weibo>