機器學習專項練習筆記(持續更新)
##1.卷積神經網路計算尺寸
輸出尺寸=(輸入尺寸-filter尺寸+2*padding)/stride+1
卷積向下取整,池化向上取整
stride=1時,當kernel=3,padding=1或kernel=5,padding=2 卷積前後尺寸不變。
##2.序列模式挖掘
序列:一個序列即是一個完整的資訊流。每個序列由不同的元素按順序有序排列,每個元素由不同專案(也叫事件)組成。
序列資料庫:將相同使用者ID的記錄合併在一起,有時可以忽略每個事務的發生時間,僅保留事務間的偏序關係。
序列、元素、單項:一條序列<(10,20),30,(40,50,60)>裡面包含3個元素(3個事務),6個單項(長度為6,也叫6-序列),元素內的單項不考慮順序關係。
###序列模式挖掘演算法概述(未完待續)
演算法基石:AprioriALL、AprioriSome、dynamicSome
類Apriori演算法:GSP、Spade
基於劃分的模式生長演算法:FreeSpan、prefixSpan
基於序列的比較演算法:Disc-all
##3.貝葉斯判別
假設所有特徵之間相互獨立
先驗概率: ,是指根據以往經驗和分析得到的概率.
後驗概率: ,事情已經發生,要求這件事情發生的原因是由某個因素引起的可能性的大小
類條件概率(似然函式): ,類條件概率中的類指的是把造成結果的所有原因進行列舉,分別討論
貝葉斯公式:結果推原因
全概率公式:原因推結果,
###3.1 最小誤判概率(最大後驗概率)準則判決
if
then
if
then
###3.2 最小損失準則
在3.1的基礎上計算出每個後驗概率出來
令決策的數目為類數c,如果決策 定義為判別x屬於 類,
那麼對於給定的模式x在採取決策 的條件下損失的期望為:
條件期望損失 (x)刻畫了在模式為x、決策為 條件下的平均損失,故也稱為條件平均損失或條件平均風險(Risk)。(做決策 的平均損失)
if then
if then
兩邊分母p(x)約掉:
if