機器學習要註意的事情(五)
在上一篇文章中我們給大家介紹了機器學習需要註意的相關事項,這些內容都是我們在學習機器學習時必須註意的內容,今天我們會繼續為大家介紹更多有關機器學習需要註意的內容,希望這篇文章能夠更好地幫助大家理解機器學習。
我們需要註意的是,理論保證通常與實際情況不一樣,這是因為機器學習的論文充滿了理論保證。最常見的類型是為了確保良好的泛化所需要的示例數量。這就需要我們正確看待這些理論保證。首先,我們需要註意的是這些都是可能的。歸納法傳統上與演繹法形成鮮明對比,在演繹法中我們可以保證結論是正確的,這其實是許多世紀以來的傳統智慧。如果學習者返回了一個與特定訓練集一致的假設,那麽這個假設很可能泛化的很好。
如果有足夠大的訓練集,那麽學習者可能會返回一個泛化很好的假設或者無法找到一個與訓練集一致的假設。這個界限也沒有說明如何選擇一個好的假設空間。它只告訴我們,如果假設空間包含真正的分類器,那麽學習者輸出壞分類器的概率就會隨著訓練集的大小而減少。倘若我們縮小假設空間,約束就會得到改善,但它包含真正的分類器的可能性也會減小。但是另一種常見的理論保證是很相似的,具體就是有了無限的數據,學習者就可以輸出正確的分類器。這是讓人安心的,但由於它的漸近保證,在選擇學習者的時候就會顯得輕率。在實踐中,我們很少處於這種不對稱的狀態。所以就出現了兩種情況,那就是如果給了無限的數據之後,學習者A比B更好,那麽在給了有限數據的情況下,通常學習者B比A要更好。
我們在這篇文章中給大家介紹了關於機器學習中需要註意的內容。在機器學習中,理論保證的主要作用不是作為實際決策的標準,而是作為算法設計的理解和驅動力的來源。在這種能力下,它們非常有用。事實上,理論與實踐的互動是機器學習取得長足進步的主要原因之一。我們需要註意的是,學習是一種復雜的現象,只有理論上的依據能夠很好地服務於實踐中的工作才意味著我們真正了解了機器學習。
機器學習要註意的事情(五)