機器學習儲備(2):高斯分佈
今天講解獨立同分布的概念,高斯分佈,一維高斯分佈。
1、獨立同分布
指隨機過程中,任何時刻的取值都為隨機變數,如果這些隨機變數服從同一分佈,並且互相獨立,那麼這些隨機變數是獨立同分布。
先說說獨立這個概念。在預測德克薩斯州區域的房屋價值時,房屋樣本x1和樣本x2之間的預測是相互獨立的,它們之間不存在任何關係,這也是接近實際的。
同分布是指預測的房屋都是來自於德克薩斯州這塊區域的,你不能拿北京的某個小三居扔到這個模型中去做預測吧,如果非要這樣,誤差一定會很大。
2、高斯分佈
高斯分佈(Gaussian distribution), 又稱為正態分佈(Normal distribution),是一個非常重要在各個領域有廣泛應用的概率分佈。
正態曲線的特點是中間高,兩頭低,左右對稱,人們經常稱之為鐘形曲線。
若隨機變數X服從一個數學期望為μ、方差為σ^2的正態分佈,記為N(μ,σ^2)。
其概率密度函式為正態分佈的,期望值μ決定了它的位置,標準差σ^2資料的偏離程度。
當μ = 0,σ = 1時的高斯分佈又稱為標準正態分佈。
3、一維正態分佈
若隨機變數服從如下的概率密度函式,則表明是一維正態分佈。
當然,還有多維正態分佈,在此不做詳述。
相關推薦
機器學習儲備(2):高斯分佈
今天講解獨立同分布的概念,高斯分佈,一維高斯分佈。 1、獨立同分布 指隨機過程中,任何時刻的取值都為隨機變數,如果這些隨機變數服從同一分佈,並且互相獨立,那麼這些隨機變數是獨立同分布。 先說說獨立這個概念。在預測德克薩斯州區域的房屋價值時,房屋樣本x1和樣本x2之間的預測是相互獨立的,它
機器學習儲備(3):似然函式例子解析
似然函式是個什麼函式,它的意義是什麼?它與概率相比,有什麼不同嗎? 1、似然函式 似然函式是一種關於統計模型中的引數的函式,表示模型引數中的似然性。 給定輸出 x 時,關於引數 θ 的似然函式 L(θ|x),在數值上它等於給定引數 θ 後變數 X 的概率: 這個是非常
機器學習儲備(1):協方差和相關係數
為了深刻理解機器學習演算法的原理,首先得掌握其中涉及到的一些基本概念和理論,比如概率,期望,標準差,方差。在這些基本概念上,又衍生出了很多重要概念,比如協方差,相關係數等。今天我們就來聊聊這些組成機器學習的基本概念。 1、概率 概率 P 是對隨機事件發生的可能性的度量。 例如,小明在期末
機器學習儲備(4):最常用的求導公式
求導公式在機器學習的梯度下降中經常使用,因為梯度就意味著要求導,所以將使用頻率最高的幾個公式羅列在下面,方便查閱。 其中第三個是第二個的特列 求導比較重要的一條性質便是鏈式求導法則,它其實並不難理解,因為求導數意味著由外及內的,一層一層地將變化傳遞到最裡頭。 例如,要求解 
AWS機器學習初探(2):文字翻譯Translate、文字轉語音Polly、語音轉文字Transcribe
這幾個服務的功能和使用都很直接和簡單,因此放在一篇文章中介紹。 1. 文字翻譯服務 Translate 1.1 功能介紹 AWS Translate 服務是一種AWS 機器學習應用服務,它利用高階機器學習技術來進行文字翻譯。它的使用非常簡單,只需要提供輸入文字,該服務就給出輸出文字。 輸入
機器學習系列(2):logistic迴歸,貝葉斯(bayes)方法
前言:這章主要介紹logistic迴歸和bayes法。兩者都屬分類,前者引入了logistic函式,後者引入了貝葉斯定理,都是比較基礎的數學知識。 但是logistic無需先驗的訓練樣本,後者需要。 貝葉斯法很強大,很多郵件
空域分析及變換(2):高斯拉普拉斯金字塔
空域分析及變換(2):高斯拉普拉斯金字塔 引言 1、高斯金字塔 2、拉普拉斯金字塔 3、高斯金字塔與拉普拉斯金字塔 引言 影象處理–>空間域處理–>高斯金字塔、拉普拉斯金字塔.金字塔參考。影象金
Python機器學習筆記:不得不瞭解的機器學習知識點(2)
之前一篇筆記: Python機器學習筆記:不得不瞭解的機器學習知識點(1) 1,什麼樣的資料集不適合用深度學習? 資料集太小,資料樣本不足時,深度學習相對其它機器學習演算法,沒有明顯優勢。 資料集沒有區域性相關特性,目前深度學習表現比較好的領域主要是影象/語音/自然語言處理等領域,
深度學習——機器學習策略(2)
語音識別 peak 分類器 9.png 場景 end 射線 erro 完成 1. 誤差分析manual error analysis 對學習的結果進行人工誤差分析。 例:貓的分類器 比如train結果的正確率為90%(10%的誤差),對結果進行人工分析,如果發現有些狗被識別
機器學習筆記(2)——CART樹
而後 並不是 參數 生成 AS 最大值 介紹 ... 訓練數據 CART樹 CART樹與上一篇文章提到的ID3、C4.5的區別在於: (1)CART樹只能夠生成2個結點,即CART樹是一棵二叉決策樹,而後兩者在進行劃分時可以根據特征值的種類生成2個以上的結點
深入學習Redis(2):持久化
kvm 服務器 let vm虛擬機 文件同步 8K bus lena 機制 前言 在上一篇文章中,介紹了Redis的內存模型,從這篇文章開始,將依次介紹Redis高可用相關的知識——持久化、復制(及讀寫分離)、哨兵、以及集群。 本文將先說明上述幾種技術分別解決了Redis高
Node.js學習筆記(2):基本模塊
依次 常用模塊 nbsp 兩個 避免 ESS 第三方 text 編程 Node.js學習筆記(2):基本模塊 模塊 引入模塊 為了編寫可維護的代碼,我們把很多函數分組,分別放到不同的文件裏,這樣,每個文件包含的代碼就相對較少,很多編程語言都采用這種組織代碼的方式。在No
SLS機器學習介紹(02):時序聚類建模
文章系列連結 SLS機器學習介紹(01):時序統計建模 SLS機器學習介紹(02):時序聚類建模 SLS機器學習介紹(03):時序異常檢測建模 SLS機器學習介紹(04):規則模式挖掘 前言 第一篇文章SLS機器學習介紹(01):時序統計建模上週更新完,一下子炸出了很多潛伏的業
開源容器openshift學習筆記(2):新增Registry元件
開篇之前如果沒有安裝openshift環境可以參考我的博文:centos7下安裝openshift 本系列部落格學習筆記參考《開源容器雲openshift》一書:下載連線:https://download.csdn.net/download/u012371097/10745382  
機器學習筆記(一):最小二乘法和梯度下降
一、最小二乘法 1.一元線性擬合的最小二乘法 先選取最為簡單的一元線性函式擬合助於我們理解最小二乘法的原理。 要讓一條直接最好的擬合紅色的資料點,那麼我們希望每個點到直線的殘差都最小。 設擬合直線為
linux學習筆記(2):檔案管理
1. 建立 建立檔案 touch 檔名 舉例:touch file1 flie2 flie3… 新建目錄 mkdir 目錄名 舉例:mldir dir 建立遞迴目錄 mkdir -p 目錄名/目錄名/目錄名… 舉例:mkdir -p dir1/dir2/dir3 2. 刪除 刪除檔案
學習筆記(2):模擬登陸抽屜網(ajax)
import requests ''' 目的:模擬登陸抽屜網 工具:python3 所用模組:requests ----->模擬瀏覽器的請求,並且得到返回訊息 ''' # 1.登陸地址的獲取: # 抽屜網的登陸頁面並不是重新整理整個頁面,屬於ajax區域性請求,要首先
機器學習實戰(2)-決策樹
構建決策樹最重要的是分裂屬性的選取,重要的是每個屬性在節點的位置,比如說第一個節點屬性為什麼是A而不是B。分裂屬性就是在某個節點處按照某一特徵屬性的不同劃分構造不同的分支,其目標是讓各個分裂子集更加的純,所謂的純是指儘量讓一個分裂子集中待分類項屬於同一類別。判斷純的方法有ID3,C4.5,CART演算法。&n
機器學習筆記(十):TensorFlow實戰二(深層神經網路)
1 - 深度學習與深層神經網路 深度學習的精確定義為:“一類通過多層非線性變換對高複雜性資料建模演算法的集合” 因此,多層神經網路有著2個非常重要的特性 多層 非線性 1.1 - 線性模型的侷限性 線上性模型中,模型的輸出為輸入的加權和,假設一
機器學習筆記(九):Tensorflow 實戰一 (Tensorflow入門)
1 - TsensorFlow計算模型 ——計算圖 1.1- 計算圖的概念 計算圖是TensorFlow中最基本的一個概念,TensorFlow中的所有計算都會被轉化為計算圖上的節點。 在TensorFlow中,張量可以簡單地理解為多為陣列。如果說TensorFlow的第一個詞T