機器學習總結(三)：矩估計

阿新 • • 發佈：2019-01-06

鑑於後續機器學習課程中多次提到引數估計的概念，為了避免囫圇吞棗的理解某些知識點，決定對概率統計的這部分知識點進行簡要總結，這篇部落格主要涉及的是點估計中的矩估計知識點，後續的部落格將總結點估計中其他兩個比較常見的方式，極大似然估計以及最小二乘法。

基礎概念

為什麼要出現估計呢？

因為在統計學中，所要觀測的資料量往往都比較大，我們不可能將所有資料全部都進行統計，一種可行的方式就是從這些資料量中抽取一部分資料，這時候便用到了估計的知識，用抽取出來的樣本的情況來估計總體的情況。

引數估計的概念

引數估計指的是根據從總體中抽取出來的樣本來估計總體分佈中包含的未知引數的方法，分為點估計和區間估計兩種。

點估計的概念

依據從總體中抽取出來的樣本來估計總體分佈中的未知引數，點估計具體分為：矩估計、極大似然估計(MLE)以及最小二乘法。

區間估計的概念

依據抽取出來的樣本，根據一定的準確度和精確度要求，構造適當的區間作為對總體分佈中的未知引數的真值所在範圍的估計，比如人們常說的百分之多少把某個資料控制在某個範圍內就是區間估計最通俗的表述。

大數定律

矩估計的理論依據就是基於大數定律的，大數定律語言化的表述為：當總體的k階矩存在時，樣本的k階矩依概率收斂於總體的k階矩，即當抽取的樣本數量n充分大的時候，樣本矩將約等於總體矩。

矩估計

矩的概念

詳情見附加筆記第(1)點

樣本矩、樣本均值、樣本方差的概念

詳情見附加筆記第(2)點

矩估計實現原理

矩估計的原理總結來講為：令總體矩的k階矩分別等於樣本的k階矩即可，至於到底會涉及到k是多大就要看你要估計的總體中包含幾個未知引數了，包含幾個k就應該是幾。

通俗的講，為什麼k階樣本矩分別等於k階總體矩就能算出總體的引數，原因在於，樣本中的期望和方差是我們可以直觀計算出來的常數，而總體的期望和方差是帶有未知引數的，兩者分別相等能夠聯立出等式計算出未知引數。

一個簡單的例子

詳情見附加筆記第(3)點

關於樣本均值、樣本方差、總體均值、總體方差的符號說明

詳情見附加筆記第(4)點

矩估計的優缺點

優點：在不清楚總體分佈具體屬於什麼分佈的情況下，只需要根據均值和方差進行估計即可。

缺點：如果在總體分佈已知的情況下，並不能很好的使用對應分佈型別的資訊，因為矩估計根本就不看重總體分佈到底屬於那種型別。

關於樣本方差公式中除以n-1而不是n的思考

這樣做的目的純粹是為了保證能夠無偏估計引數

無偏估計的概念

用樣本統計量來估計總體引數時的一種無偏判斷，如果估計量的數學期望等於被估引數的真實值，則稱此估計量為被估引數的無偏估計。

對樣本方差中除以n-1原因的探討

詳情見附加筆記第(5)點

附加筆記

參考文獻

機器學習總結(三)：矩估計

鑑於後續機器學習課程中多次提到引數估計的概念，為了避免囫圇吞棗的理解某些知識點，決定對概率統計的這部分知識點進行簡要總結，這篇部落格主要涉及的是點估計中的矩估計知識點，後續的部落格將總結點估計中其

機器學習總結(三)——SVM

1. SVM的原理是什麼 svm是一種二分類模型，是一種在特徵空間中尋找間隔最大化的分離超平面的線性分類器。線性可分樣本：可以通過硬間隔最大化學習線性分類器實現。近似線性可分：通過引入鬆弛變數，通過軟間隔最大化，學習線性分類器；非線性樣本

MySql分割槽學習總結三：HASH，KEY

在本次章節介紹HASH分割槽和KEY分割槽 HASH分割槽 HASH分割槽的一大特點就是可以更平均的將資料分散到各個分割槽中，不會像RANGE分割槽一樣資料可能會集中在一個分割槽中。HASH分割槽簡單來說是基於取模運算結果進行的分割槽。HASH分割槽分為常規分割槽和線性分割槽。但是常

機器學習筆記三：梯度下降

一.迭代思想這裡要寫的其實跟主題梯度下降是沒有關係的。但是它能夠讓非常新的新手體會迴圈往復的迭代修改一個或者多個值到最優的思想。所以這裡把這個列到最開始，隨便看看體會一下就行了。假設我們現在要來求解一個線性方程組, 這個方程組很容易,可以用各種方法

機器學習總結（三）：SVM支援向量機（面試必考）

基本思想：試圖尋找一個超平面來對樣本分割，把樣本中的正例和反例用超平面分開，並儘可能的使正例和反例之間的間隔最大。演算法推導過程：（1）代價函式：假設正類樣本y =wTx+ b>=+1,負

機器學習第三練：為慈善機構尋找捐助者

alt earch .get 變量照相標簽 log 比較 random 這個任務同樣是在Jupyter Notebook中完成，項目目的是通過前面的所有特征列，當然去掉序號列，然後預測最後一列，收入‘income‘，究竟是大於50K，還是小於等於50K. 第一

機器學習第二章：模型評估與選擇-總結

但是交叉 roc曲線掃描 com ram hidden 技術分享 preview 1、數據集包含1000個樣本，其中500個正例，500個反例，將其劃分為包含70%樣本的訓練集和30%樣本的測試集用於留出法評估，試估算共有多少種劃分方式。留出法將數據集劃分為兩個互斥的

演算法工程師修仙之路：吳恩達機器學習（三）

吳恩達機器學習筆記及作業程式碼實現中文版第三章多變數線性迴歸多維特徵現在我們對房價模型增加更多的特徵，例如房間數樓層等，構成一個含有多個變數的模型，模型中的特徵為

[機器學習]模型評估：ROC，AUC，KS，GINI，Lift，Gain 總結

中文，英文，簡稱在模型建立之後，必須對模型的效果進行評估，因為資料探勘是一個探索的過程，評估-優化是一個永恆的過程。在分類模型評估中，最常用的兩種評估標準就是KS值和GINI, AUC值. 可能有人會問了，為什麼不直接看正確率呢？你可以這麼想，如果一批樣本中，正樣本佔

HADOOP學習筆記總結三：zookeeper

在學習Hbase時，官方文件說hbase依賴於zookeeper來管理與跟蹤其分散式資料的狀態，hregionserver與hmaster都需要向它註冊。那什麼是zookeeper呢？今天學習一下： 1、zookeeper是什麼 ZooKeeper是一種分散式協調服務，用

機器學習之旅：支援向量機通俗導論（理解SVM的三層境界）

支援向量機通俗導論（理解SVM的三層境界）作者：July、pluskid ；致謝：白石、JerryLead出處：結構之法演算法之道blog。前言動筆寫這個支援向量機(support vector machine)是費了不少勁和困難的，原因很簡單，一者這個東西本身就並

機器學習總結（十）：常用聚類演算法（Kmeans、密度聚類、層次聚類）及常見問題

任務：將資料集中的樣本劃分成若干個通常不相交的子集。效能度量：類內相似度高，類間相似度低。兩大類：1.有參考標籤，外部指標；2.無參照，內部指標。距離計算：非負性，同一性（與自身距離為0），對稱性

臺大林軒田《機器學習基石》：作業三python實現

在學習和總結的過程中參考了不少別的博文，且自己的水平有限，如果有錯，希望能指出，共同學習，共同進步 13 給定target function，我們的工作是在X=[-1,1]x[-1,1]上隨機產生1000個點，利用f(x1,x2)計算它的值，然後

機器學習總結（二）：梯度消失和梯度爆炸

神經網路的訓練過程通常分為兩個階段：前向傳播和反向傳播。前向傳播如下圖所示，原理比較簡單上一層的神經元與本層的神經元有連線，那麼本層的神經元的啟用等於上一層神經元對應的權值進行加權和運算，最後通過一個非線性函式（啟用函式）如ReLu，sigmoid等

NG機器學習總結-（三）線性迴歸以及python實現

在前面已經簡單介紹了迴歸問題（預測房價），其實在統計學中，線性迴歸（Linear Regression）是利用被稱為線性迴歸方程的最小平方函式（Cost Function）對一個或多個自變數和因變數之間關係進行建模的一種迴歸分析。這種函式式一個或多個被稱為迴歸係數的模型引數的

機器學習概念篇：監督學習、過擬合，正則化，泛化能力等概念以及防止過擬合方法總結

上個系列【數字影象處理】還將繼續更新，最近由於用到機器學習演算法，因此將之前學習到的機器學習知識進行總結，打算接下來陸續出一個【機器學習系列】，供查閱使用！本篇便從機器學習基礎概念說起！一、解釋監督學習，非監督學習，半監督學習的區別監督學習、非監督學

併發程式設計學習總結(一) ：java 建立執行緒的三種方式的優缺點和例項

java 建立執行緒有三種方式： (一) 實現Runnable介面優點：(1) 建立執行緒的同時可以繼承其他的類，從而可以擴充套件類的功能。

深度學習之三：機器學習的策略

本文為Andrew ng深度學習課程的第三部分，主要總結了機器學習的策略方法。 1 機器學習策略之一當我們的模型搭建出來之後，策略可以指引我們為了達到目標，如何採取下一步行動。 1.1 正交化當設計和訓練一個監督學習的系統時，我們依賴下面四條正交

機器學習總結（九）：梯度消失（vanishing gradient）與梯度爆炸（exploding gradient）問題

（1）梯度不穩定問題：什麼是梯度不穩定問題：深度神經網路中的梯度不穩定性，前面層中的梯度或會消失，或會爆炸。原因：前面層上的梯度是來自於後面層上梯度的乘乘積。當存在過多的層次時，就出現了內在本質

機器學習演算法篇：最大似然估計證明最小二乘法合理性

最小二乘法的核心思想是保證所有資料誤差的平方和最小，但我們是否認真思考過為什麼資料誤差平方和最小便會最優，本文便從最大似然估計演算法的角度來推導最小二乘法的思想合理性，下面我們先了解一下最大似然估計和最小二乘法，最後我們通過中心極限定理剋制的誤差ε服從正態分佈

機器學習總結(三)：矩估計

基礎概念

為什麼要出現估計呢？

引數估計的概念

點估計的概念

區間估計的概念

大數定律

矩估計

矩的概念

樣本矩、樣本均值、樣本方差的概念

矩估計實現原理

一個簡單的例子

關於樣本均值、樣本方差、總體均值、總體方差的符號說明

矩估計的優缺點

關於樣本方差公式中除以n-1而不是n的思考

無偏估計的概念

對樣本方差中除以n-1原因的探討

附加筆記

參考文獻

相關推薦