1. 程式人生 > >資料分析師:大資料建模,你需要了解九大形式

資料分析師:大資料建模,你需要了解九大形式

“沒有免費的午餐”理論已經應用於機器學習領域,無偏的狀態好於(如一個具體的演算法)任何其他可能的問題(資料集)出現的平均狀態。沒有一個演算法適合每一個問題。但是經 過資料探勘處理的問題或資料集絕不是隨機的,也不是所有可能問題的均勻分佈,他們代表的是一個有偏差的樣本,那麼為什麼要應用NFL的結論?答案涉及到上 面提到的因素:問題空間初始是未知的,多重問題空間可能和每一個數據挖掘目標相關,問題空間可能被資料預處理所操縱,模型不能通過技術手段評估,業務問題本身可能會變化。由於這些原因,資料探勘問題空間在資料探勘過程中展開,並且在這個過程中是不斷變化的,以至於在有條件的約束下,用演算法模擬一個隨機選擇的資料集是有效的。對於資料探勘者來說:沒有免費的午餐。