【資料運營】在運營中,為什麼文字分析遠比數值型分析重要?一個實際案例,五點分析(下)
https://www.pmcaff.com/article/index/408451832537216?from=profile
本文是《資料分析中,文字分析遠比數值型分析重要!》的下篇,以一個實際案例來聊聊文字分析在實際運營中如何落地。行為脈絡如下:先簡要講述文字分析的分支---情緒分析的基本原理,然後以亞馬遜的Kindle Voyage的使用者評論作為“情緒分析”的實操分析,最後羅列了幾個實用的文字分析工具,以期對大家有所幫助。
在大資料時代還未來臨前,企業一般根據自身積累的歷史資料,以及一線運營人員的主觀經驗來猜測使用者接下來的反應,以此作為制定後續營銷、運營方案的依據。
然而,在這個VUCA時代(寶潔公司營運長Robert McDonald借用一個軍事術語來描述這一新的商業世界格局,即volatility,易變性;uncertainty,不確定性;complexity,複雜性;ambiguity,模糊性),商業場景的變化速度和複雜程度今非昔比,使用者的喜好也容易受外界“場景”的影響,就如“孩子的臉”和“六月的天”一樣善變,先前積累的經驗往往不足以作為企業下一階段進行市場謀劃和運營的依據。
VUCA時代的特徵
根據《資料運營|資料分析中,文字分析遠比數值型分析重要!(上)》的分析,我們可知,大資料文字分析正是應對上述困局的一劑良方。
(一)
接下來,我們將從理論到實踐,聊聊文字分析是如何應用在商業實踐中的。
1.文字分析重構產品的營銷和運營流程
藉助基於大資料的文字分析,我們可以對使用者行為和想法進行科學分析,使使用者洞察由原來的主觀“猜測”轉變為以資料為驅動的精準預測。在新產品上市前,或者是小規模投放市場後,在社交媒體上對粉絲和潛在使用者的言論進行收集,對其進行文字分析,知道他們喜歡產品的哪些方面,對哪些方面不太滿意,以及他們對產品的其他期望,從而敏捷、快速、準確的對使用者的反饋做出積極的迴應。
由此可見,有文字分析介入的產品運營流程被“重構”了,如下圖所示。
有文字分析參與的運營分析邏輯流程
其中,對使用者言論進行文字分析的“精髓”在於對提煉出的文字資料的所表達出的“情緒”的解讀,也就是使用者言論的情緒分析。
在理解文字分析語境下的“情緒分析”前,我們先看看它的一般含義。
2.大資料文字分析中的“情緒分析”是什麼?
先說“情緒”。“情緒”這個詞,在心理學中的一般含義是:對一系列主觀認知經驗的通稱,是多種感覺、思想和行為綜合產生的心理和生理狀態。我們日常中最普遍的情緒就是喜、怒、憂、思、悲、恐、驚,也就是中醫中所說的“七情”。
那麼,“情緒分析”就是有效且準確的識別這些具體的情緒,根據得到的結果,進一步對產生於自身或者他人的情緒採取合理的應對措施(如疏導自身消極情緒、理解他人的反常行為等)。
與此類似,基於大資料文字資料的“情緒分析”,也被業界稱為“觀點挖掘”,它利用多樣化、海量的社會化媒體做客服,藉助數量龐大的社交網路平衡語料和新聞平衡語料的機器學習模型,對所獲取文字中的情感傾向和評價物件進行提取,使運營者更全面、更深入地瞭解使用者的“心聲”,掌握使用者對於產品的喜好程度,及使用者視角下的產品優缺點。
值得注意的是,基於大資料文字的情緒分析在於深度分析評論的意義(評論的是事物的哪些方面)以及附帶的情緒傾向(是“褒”是“貶”,還是“中立”),而不是評論本身在說的文字。
下面,筆者將以基於亞馬遜上Kindle Voyage商品評論的文字資料為例,來聊聊文字資料的情緒分析在商業實踐中的運用。
3.“情緒分析”在商業實踐中的正確開啟方式
現在,筆者以亞馬遜官網2014年9月份在其平臺上發售的Kindle Voyage電子書閱讀器珍藏限量為例,對其商品評論區的使用者評論進行基於文字資料的“情緒分析”,看看我們能從中得到哪些有價值的insight,以便優化我們的運營工作。
亞馬遜官網上Kindle Voyage電子書閱讀器的商品詳情頁
- 分析時間段:2014.12.01~2015.06.23
- 資料來源:亞馬遜官網上Kindle Voyage電子書閱讀器商品評論區
- 意見領袖總數(評價者):1675人
- 原始評價:2720條
- 詳細評價資訊(包括對評價的“迴應”,即評價的評價,如此迴圈):4659條
亞馬遜Kindle Voyage電子書閱讀器珍藏限量版評論區
(二)
筆者將從以下5個方面,即使用者聚焦點分析、使用者反饋趨勢分析、使用者情緒分析、使用者反饋分析,以及各地域使用者評級分佈及情緒分析,對Kindle Voyage亞馬遜商品評論區的4659條使用者留言/評論進行文字分析。
對Kindle Voyage使用者評論進行文字分析的幾大模組
1、使用者典型意見分析
大資料文字分析中的“典型意見”是指,將使用者的意見進行單據級別的語義聚合,將內涵相近但表述有差異的意見/看法聚合在一起,抽取出其中典型的使用者反饋/意見,在短時間內迅速梳理出使用者對於產品所關注的話題。
使用者評論的典型意見分析
從上圖可以看出,通過對這些使用者留言的典型意見進行分析,再結合Kindle Voyage的商品詳情描述,我們可以瞭解到使用者對於Kindle Voyage的評價主要集中在以下7個方面:
- 捆綁銷售策略(話題1)
- 限量發售策略(話題2)
- 螢幕顯示效果(話題3)
- 原裝配套皮套(話題4)
- 與其“同族兄弟”kindle Paper White的比較(話題5)
- 螢幕的亮度自動調節功能(話題6、話題7)
- 售後客服評價(話題8)
關於使用者對這些話題的具體評價和情緒感受,我們需要做進一步的分析。
2、使用者反饋趨勢分析
使用者反饋趨勢分析曲線展現了文字資料量在時間上的分佈情況,可以從巨集觀上掌握上述8個話題所對應評論(量)的發展走勢,以便做好及時跟進,發掘出其中有價值的言論。
下圖中,從下至上,依次是話題1到話題8的評論數量隨時間變化的增減趨勢。其中,評論量的大小以圖形面積的大小來呈現。
使用者評論量隨時間軸的變化趨勢
可以看到,這些話題的釋出數量的增減走勢基本相同,且在2015-3-1達到評論高峰,2016-1-25達到小高峰,這兩個時間點的前後數天的購買人數激增。然而在2016-4-24這一天商品評論區的總體評論量驟然減少,對於這幾個異常點,運營人員可以調出對於日期的銷售記錄、商品維護日誌等資料找出原因,以便對症下藥,做好後續的運營工作。
3、使用者評價和情緒分析
這部分包含2個模組,即使用者評價和情緒分析,二者存在一定的正相關關係,也就是說,使用者評價較高,相應的情緒偏正面,反正亦然。
(1)使用者評價分析
使用者評論星級分佈表
使用者評價星級佔比圖
從上面2個圖可知,超過63%的使用者對於Kindle Voyage的產品效能是非常滿意的,給出了5顆星的評價;次之的四顆星評價佔到19.15%的比重,以上二者比重之和超過80%,可知Kindle Voyage總體的市場反饋非常不錯。
(2)使用者總體情緒傾向分析
使用者的總體情感偏向
使用者的情感度分佈
上圖是使用者對於Kindle Voyage總體情感的儀表盤,是根據使用者對於Kindle Voyage的文字評論進行情緒傾向分析得出的,能反映消費者對於Kindle Voyage總體態度是肯定還是否定。該儀表盤分為3個大的方向,即負面情緒、中性情緒和正面情緒,其中暗含的使用者態度就是對產品不滿意、產品一般和產品很不錯。
從上面2個圖可以看出,購買者對於Kindle Voyage以中性評論為主,情感正面值為1.06,總體情感偏向於正面,說明大家對Kindle Voyage的真實看法與評價星級總體傾向是一致的,沒有言不由衷。
4、個體使用者情緒傾向分析
上面的是全體使用者對於Kindle Voyage的總體情緒傾向,但在很多時候,我們想要知道哪些使用者的“發聲”在這些評論中更具代表性。這就需要分析引擎在語義層面上對每個使用者進行重要性排名,從中發掘出有“話語權重”較大的“意見領袖”。
更進一步,我們要對其中單個使用者的情緒態度、評價和所關注的產品方面進行分析,這就涉及到以單個使用者為主體的情緒傾向分析了。
以下2個圖分別關注的是意見領袖(使用者)情緒分析總覽和單個意見領袖(使用者)的詳細情緒分析。從中我們可以看到評論使用者的名稱、評論的數量、情緒是屬性及相應的情緒數值。
使用者(意見領袖)情緒分析總覽
如果我們想對某個重要使用者的情緒進行詳細分析,我們可以點開這個使用者的詳細資料,進行深入的分析。如下圖所示:
單個意見領袖(使用者)的詳細情緒分析
從上圖中我們可以瞭解到為什麼該使用者對Kindle Voyage持正面態度(正面情緒用紅色顯示)了---下面的正面關鍵詞雲顯示出該使用者對Kindle Voyage的手感、螢幕顯示和做工質量很滿意。此外,在“焦點概覽”裡,我們可以瞭解到類似的評論有8條,在哪個時間節點達到峰值。
在進行上述分析後,我們還需要進一步讀懂評論區的全體使用者對Kindle Voyage的反饋,知道使用者喜歡它的哪些方面,對哪些方面還不是太滿意,以及這些(不)滿意的方面的程度如何,這是“情緒分析”中的重中之重。
所以,我們需要進行下一步分析——使用者反饋分析。
5、用反饋分析
這部分的原理是,從眾多使用者評論中提取出跟產品屬性相關且有代表性的關鍵詞,並進行相似文字聚類,然後給出相應權重,最後匹配相應的情緒屬性和情緒值。最終的結果使得運營者擁有了使用者視角,知曉產品有哪些地方表現尚可,哪些地方反映平平,而哪些地方是需要進行改進和完善的。
下圖是使用者對於Kindle Voyage使用後的評論中提取並聚類的關鍵詞雲,其中文字大小代表該詞的權重(重要程度和詞頻),字型顏色表明該詞的情緒偏向(紅色是正面評價,灰色是中性評價,藍色是負面評價)。
使用者的對於Kindle Voyage評論的主要關注點
根據關鍵詞及其重要程度排名,筆者找到了使用者滿意的幾個方面:
- 螢幕顯示效果良好,這一點使用者很是認可,“顯示效果”、“解析度高”、“看著舒服”、“字跡清晰”等關鍵詞顯示較大,此類評價的使用者居多;字型為紅色,表明使用者反映的情感正面積極。
- 產品(及周邊)質量不錯,體現在“做工精細”、“續航能力”、“原裝皮套”、“值得擁有”、“Ipad Mini(那樣的做工)”、“實體翻頁鍵(不錯)”、“一分錢一分貨”等關鍵詞上。
- “限量珍藏版“這個概念牌打得好,使用者也願意為此買單,這主要體現在“限量珍藏版”這個詞頻較高且為紅色的關鍵字上。
另一方面,運營方也要及時瞭解使用者的負向反饋,針對性地改進服務質量。
還好,在這裡只出現了“壓敏按鍵”這些負面詞彙,點開“壓敏按鍵”一詞,看到使用者的詳細吐槽……“壓敏按鍵在按下的時候出現下陷情形……”雖然這樣的反饋不多,但仍要引起高度警惕,具體排查是產品本身的設計問題,還是極個別的產品質量問題,並將此反饋傳遞給相關負責部門。
6、地域評分和情緒分析
將使用者的反饋資料和評分同步到地圖上,通過形成的資料地圖可以直觀的看到各地對於Kindle Voyage的評價和情緒度,從而對整體的使用者反饋情況進行監控,重點“關照”其中的使用者差評“重災區”。
此處選取的是Kindle Voyage在江蘇省各市的使用者反饋資料,反映出該地區Kindle Voyage使用者對於產品的評價及情緒傾向性。
其中,數值代表評分高低,顏色反映情緒值,綠色代表良好,藍色是一般,紅色代表處於警報狀態,需要重點關注,排查問題發生的具體原因。
江蘇省各市Kindle Voyage使用者的評分及情緒度分佈
這裡可以看到,徐州市、連雲港市等城市的使用者反饋良好,反映在評分較高,且顏色為綠色。然而,淮安市、鎮江市和南京市的Kindle Voyage使用者卻非常不滿意,評分較低且情緒度處於紅色警報狀態,需要引起客戶體驗部門的高度重要,做好使用者情緒疏導和公關工作。
結語
從上面的例項中,我們可以體會到大資料文字分析對於產品、設計、營銷和運營的巨大價值,它的重要性不亞於傳統的結構性資料分析。用正確的方式閱讀這些海量的文字資料,我們就可以直接讀懂使用者的想法,獲得強有力的決策支援,從而使產品研發、營銷推廣和日常運營更貼近消費者需求,最終在使用者心中形成良好的品牌形象。
在文章末尾,介紹幾個較為實用的文字分析工具給大家:
1.圖悅:線上詞頻分析工具、詞雲製作工具,還可以自定義詞雲的形狀。
2.新浪微輿情:全網事件分析(基於關鍵詞設定,實時抓取全網跟關鍵詞有關的資訊)、基使用者畫像分析(在競品分析和微博傳播路徑分析中基於使用者興趣標籤和微博發言所得)。
3. 騰訊文智:詞法類分析(把句子拆解成詞語進行詞性標註,如名詞、動詞、形容詞等)、句法類分析(對句子的詞性分析基礎上,繼續分析主、謂、賓、定、狀、補的句子結構)、篇章類分類(有內容分類、情感分析、關鍵字分析,以及對全文摘要的提取分析)
網址:http://nlp.qq.com/semantic.cgi
4. 大資料搜尋與挖掘平臺:功能模組較全,文字分析一條龍服務,包括分詞標註、實體抽取、詞頻統計、文字分類、情感分析、關鍵詞提取、相關詞分析、依存文法、簡繁轉換、自動註音和摘要提取等。
網址:http://ictclas.nlpir.org/nlpir/
5. Linguakit:不僅能夠提取關鍵詞,還能實現文字翻譯、詞頻統計、詞雲圖和文字情感分析等功能。
網址:https://linguakit.com/en/?utm_campaign=elearningindustry.com