傳說中的馬爾科夫鏈到底是個什麼鬼?
作者
介紹
louwill,忠實R粉,資料科學愛好者。
個人公眾號:資料科學家養成記
話說自從接觸資料分析以來,就不斷在各種文獻和大牛的文章裡看到馬爾科夫鏈這種東西。對於像小編這種經管出身、半路出家的資料愛好者而言,老是讓這種一頭霧水的名詞出現在自己眼前又無可奈何的樣子,真是忍無可忍。於是,在今天這樣一個好日子裡,我們就好好的來懟一懟這個傳說的馬爾科夫鏈。
本來想閒話短說,但好像要把馬爾科夫鏈這種東西說清楚還不得不提隨機過程這門課。廣大理工科的同學一定知道,所謂隨機過程,它其實就是一個過程,就好像今天勇士隊輸了,那她下場會不會贏呢?下場不贏那下下場呢?以及我們怎麼預測勇士隊下場贏還是輸呢?隨機過程就是這樣一個工具,它通過各種定量的分析和數理統計的公式推導來預測勇士隊下場比賽會不會贏。
所以,你可能猜出來了,馬爾科夫鏈就是一種隨機過程,那它到底是哪種隨機過程呢?小編也說不清楚,我們就拿小編每天下午五點鐘的狀態來舉個例項吧。
話說在讀研的小編每天在學校日子充盈,每天不是在搞資料分析就是在看資料分析,小編每天下午五點鐘只有三種狀態:在實驗室搞資料(學習)、在和女朋友去食堂的路上(陪女友)以及在籃球場打球(打球)。
現在你們是知道小編每天下午五點鐘的狀態了。那你們想知道小編N天后的某個下午五點在幹嘛嗎?知道你們不想,就假裝很想知道的樣子就好。
現在我們來做個假設,小編每個五點鐘狀態之間的轉移都是有一定的概率支撐的。比如說,小編今天下午五點鐘在籃球場打球,那明天陪女友的概率是多少呢?或者明天在學習的概率有多少呢?或者明天下午五點還在球場打球的概率是多少呢?小編手畫個圖,更直觀一點:
小編圖中畫的那個概率矩陣就是傳說中的狀態轉移矩陣,我們把它命名為P。並且這個P是保持不變的,也就是說小編今天的到明天的狀態轉移矩陣和明天到後天的狀態轉移矩陣是一樣的。有了這個矩陣之後,你們就可以推算出N天后小編下午五點的狀態分佈了。
今天是6月10號,11號的狀態矩陣可以通過P1*P計算得到(不會矩陣乘法的自己去找線性代數看哈),12號的狀態矩陣可以通過P2*P得到,以此類推,可見馬爾科夫鏈的狀態分佈只和當前狀態有關,而和之前的狀態無關!
所以,這就是小編對於馬爾科夫鏈的簡單解釋,應該都能讓大家看懂吧。至於隱馬爾科夫模型、馬爾科夫鏈蒙特卡洛(小編的畢業設計)這些內容,聽起來就怕人,這裡就不說啦!
公眾號後臺回覆關鍵字即可學習
回覆 R R語言快速入門及資料探勘
回覆 Kaggle案例 Kaggle十大案例精講(連載中)
回覆 文字挖掘 手把手教你做文字挖掘
回覆 視覺化 R語言視覺化在商務場景中的應用
回覆 大資料 大資料系列免費視訊教程
回覆 量化投資 張丹教你如何用R語言量化投資
回覆 使用者畫像 京東大資料,揭祕使用者畫像
回覆 資料探勘 常用資料探勘演算法原理解釋與應用
回覆 機器學習 人工智慧系列之機器學習與實踐
回覆 爬蟲 R語言爬蟲實戰案例分享