商業數據分析流程
數據分析大體上的分析結構如下所示(分析流程圖如下所示):
首先,需要對現狀和預期有一個很好的把握。其次,弄清現狀和預期之間的差距,並調查導致差距產生的關鍵因素,即發現問題。這樣的因素可能很多,所以要收集數據和加工,並在此基礎上進行數據分析。主要是挖掘出導致此問題發生的關鍵性因素,然後綜合考慮時間成本和金錢成本等情況,提出對策以解決現有問題。
1、現狀和預期
什麽是數據分析中的問題呢?在這裏主要是指,現狀與之前的預期之間存在一定的差距,導致了現在的問題發生。
2、發現問題
(1)區別“問題”與“現象”。
“問題”是指我們實際需要解決的問題,而“現象”只是“問題”的一種表象,我們需求做的是挖掘出導致這種現象發生的背後問題,所以應對“現象”、“問題”加以區分。例如,在商業活動中,“客戶流失”、“銷售額下降”等只是“背後問題”表現出來的現象,需要相關負責人討論發現需要解決的問題。
(2)牢記“預期”,並認識到“現狀”與其之間的差距。
找到問題需要認清“現狀”與“預期”之間的差距,而找到差距需要則需要對數據進行觀察(很好的理解預期,然後根據現在的情況發現導致問題發生的本質性原因),並且將數據進行分解後觀察(例如銷售額下降了,到底是購買人數下降了還是人均消費金額下降了,或者是兩者都下降了),然後對數據進行比較觀察(進行同期比較或不同企業之間進行比較,或對消費群體進行細分再比較,如按照年齡、性別等特征分組比較)。
3、數據的收集和加工
(1)數據收集
首先判斷需要用到哪些數據,以及需要考慮數據的獲取難度以及成本,當一些必要數據獲取不到或者成本較高時,是否可以用其他數據替代。
(2)數據加工
若數據從不同的文件中或數據庫不同的表中獲取出來,則可以先對數據進行整合,然後可以根據要研究的問題生成判定變量或者離散變量,主要用於方便建模。
4、數據分析
商業數據分析根據問題種類主要分為“決策支持”與“自動化·最優化”兩大類。
決策支持主要利用簡單求和、交叉列聯表等統計方法對數據進行分析。
自動化·最優化則利用機器學習中模型對數據進行分析,是對決策支持的深入分析,找出解決問題的途徑與方法,挖掘潛在的信息。
5、解決對策
基於分析結果判斷是否采取相應的解決對策。
參考:《數據分析實戰》
商業數據分析流程