1. 程式人生 > >多項式曲線擬合

多項式曲線擬合

這是一個簡單的迴歸問題 多項式函式的形式 在這裡插入圖片描述 調整多項式函式擬合訓練資料,可以通過最小化誤差函式的方法實現。誤差函式衡量了對於任意給定的W值,函式y與訓練集資料的差別。 在這裡插入圖片描述 因子1/2是為了後續計算方便而加入的,由於誤差函式是係數w的二次函式,因此它關於係數的導數是w的線性函式,所以誤差函式的最小值有一個唯一解。 當M=9, E(w)=0, 然而,擬合的曲線劇烈震盪,這種行為叫做過擬合 目標是通過對新資料的預測實現良好的泛化性,定量考察模型的泛化性與M的關係。考察方式:考慮一個額外的測試集,這個測試集由100個數據點組成,這100個數據點的生成方式與訓練集的生成方式完全相同,但是在目標值中包含的隨機噪聲值不同。對於每個M的選擇,有時使用根均方誤差更方便 在這裡插入圖片描述

除以N讓我們能夠以相同的基礎對比不同大小的資料集,平方根確保了Erms與目標變數t使用相同規模和單位進行度量。

對於一個給定的模型複雜度,資料集規模越大,我們能用來擬合數據的模型就越複雜,資料點的數量不應該小於模型的可調節引數的數量的若干倍。