一、線性代數
- 常見概念
- 線性變換
二、概率論
- 兩大學派
- 兩種概率估計方法
- 舉例說明
- 兩種隨機變數

一、線性代數

萬事萬物都可以被抽象成某些特徵的組合，線性代數的本質是將具體事物抽象為數學物件，描述其靜態和動態的特徵。

常見概念

標量（scalar）
一個標量 a 可以是整數、實數或複數
向量（vector）
多個標量 a1,a2,⋯,an 按一定順序組成一個序列。通常用一維陣列表示，例如語音訊號

矩陣（matrix）
矩陣包含向量，一個m*n的矩陣,可以看成是由n個m維的列向量構成,也可以看成是由m個n維的行向量構成。通過用二維陣列表示，例如灰度影象
張量（tensor）
張量就是高階的矩陣，如果把三階魔方的每一個小方塊看作一個數，它就是個 3×3×3 的張量，3×3 的矩陣則恰是這個魔方的一個面，也就是張量的一個切片。通過用三維乃至更高維度的陣列表示，例如RGB影象
範數（norm）
對單個向量大小的度量，描述的是向量自身的性質，將向量對映為一個非負的數值。
內積（inner product）
兩個向量之間的相對位置，即向量之間的夾角。計算的則是兩個向量之間的關係
線性空間（linear space）
一個集合，元素是具有相同維數的向量（可以是有限個或無限個），並且定義了加法和數乘等結構化的運算

內積空間（inner product space）
定義了內積運算的線性空間
正交基（orthogonal basis）
在內積空間中，一組兩兩正交的向量。正交基的作用就是給內積空間定義出經緯度。⼀旦描述內積空間的正交基確定了，向量和點之間的對應關係也就隨之確定。
標準正交基（orthonormal basis）
正交基中基向量的範數單位長度都是1

線性變換

線性變換描述了向量或者作為參考系的座標系的變化，可以用矩陣表示；
線性空間中，變化的實現有兩種方式:

點的變化
Ax=y
表示向量 x 經過矩陣 A 所描述的變換，變成了向量 y
參考系的變化
描述矩陣的⼀對重要引數是特徵值λ和特徵向量x。
對於給定的矩陣 A，假設其特徵值為λ，特徵向量為 x，則它們之間的關係如下：
Ax=λx
矩陣的特徵和特徵向量描述了變化速度與方向。
把矩陣所代表的變化看作奔跑的人，那麼特徵值λ代表奔跑的速度，特徵向量x代表奔跑的方向。

更通俗的理解是：在空間裡將一個物體拉伸、旋轉到另外的一個形狀

二、概率論

同線性代數一樣，概率論也代表一種看待世界的方式，關注的焦點是生活中的不確定性和可能性。
概率論是線性代數之外，人工智慧的另一個理論基礎，多數機器學習模型採用的都是基於概率論的方法。
由於實際任務中可供使用的訓練資料有限，因而需要對概率分佈的引數進行估計，這也是機器學習的核心任務。

兩大學派

頻率學派（Frequentists）
頻率派認為引數是客觀存在，不會改變，雖然未知，但卻是固定值。只是觀察者的我們無從知曉，因此在計算具體事件的概率時，要先確定分佈的型別和引數，以此為基礎進行概率推演
貝葉斯學派（Bayesians）
貝葉斯派則認為引數是隨機值，固定的先驗分佈是不存在的。假設本身取決於觀察結果，資料的作用就是對假設做出不斷修正，使觀察者對概率的主觀認識更加接近客觀實際。

頻率派最常關心的是似然函式，而貝葉斯派最常關心的是後驗分佈。

兩種概率估計方法

極大似然估計法（maximum likelihood estimation）
思想是使訓練資料出現的概率最大化，依此確定概率分佈中的未知引數，估計出的概率分佈也就符合訓練訓練資料的分佈。
最大似然估計法估計引數時，只需要使用訓練資料
最大後驗概率法（maximum a posteriori estimation）
思想是根據訓練資料和已知的其他條件，使未知引數出現的可能性最大化，並選取最可能的未知引數取值作為估計值。
最大後驗概率法估計引數時，除了訓練資料外，還需要額外的資訊，也就是貝葉斯中的先驗概率

舉例說明

好學生和差學生打架

極大似然估計：老師認為肯定是差學生的錯，因為差學生愛惹事
最大後驗概率：老師如果知道優等生和差學生之間的過節（先驗資訊），把這些因素考慮進來，就不會簡單地認為是養生挑釁。
極大似然是尋找一組引數使得觀測資料出現的概率最大，最大後驗是尋找當前觀測資料下出現概率最大的一組引數。

兩種隨機變數

離散型隨機變數（discrete random variable）
在一定區間內取值有有限個或者可數個，例如某些地區人口的出生數
連續型隨機變數（continuous random variable）
在一定區間內變數取值有無限個，數值無法一一列舉出來，例如某些地區的房價

相關推薦

線性代數和概率論——機器學習基礎

目錄一、線性代數常見概念線性變換二、概率論兩大學派兩種概率估計方法舉例說明兩種隨機變數

機器學習基礎4--評估線性分類

inf 學習 org 研究 ima TE .org 線性數據如線性回歸一樣,我們也分成了訓練集和測試集. 用訓練集進行分類器的學習,用測試集來評估分類錯誤. 分類錯誤: 　　測試集 -> 隱藏類型標簽 -> 放到分類器進行處理 -> 得出結果 -&g

機器學習基礎--概率論與數理統計（已學習到P65）(忘記的東西都在這)

1、條件概率 2、全概率公式條件：B1,B2,B3...Bn是總體S的一個劃分，即且 3

機器學習基礎（三十） —— 線性迴歸、正則化（regularized）線性迴歸、區域性加權線性迴歸（LWLR）

1. 線性迴歸線性迴歸根據最小二乘法直接給出權值向量的解析解（closed-form solution）： w=(XTX)−1XTy 線性迴歸的一個問題就是有可能出現欠擬合現象，因為它求的是具有最小均方誤差（LSE，Least Square Erro

機器學習基礎——推導線性迴歸公式

在之前的文章當中，我們介紹過了簡單的樸素貝葉斯分類模型，介紹過最小二乘法，所以這期文章我們順水推舟，來講講線性迴歸模型。線性迴歸的本質其實是一種統計學當中的迴歸分析方法，考察的是自變數和因變數之間的線性關聯。後來也許是建模的過程和模型訓練的方式和機器學習的理念比較接近，所以近年來，這個模型被歸入到了機器學

機器學習基礎

機器訓練集回歸標準 func inf 特征種類算法 2017-06-25 20:53:07 一、機器學習的定義 Tom Mitchell:機器學習是對能通過經驗自動改進的計算機算法的研究。機器學習可以彰顯數據背後真正的含義。二、機器學習的分類（1）監督學習 s

機器學習基礎概念筆記

最大什麽 mar 機器學習決策常見 idg 框架評估監督學習：分類和回歸屬於監督學習。這類算法必須知道預測什麽，即目標變量的分類信息。　　常見算法：k-近鄰算法、線性回歸、樸素貝葉斯算法、支持向量機、決策樹、Lasso最小回歸系數估計、Ridge回歸、局部加權線

機器學習基礎題目

neu eba play pmf soft 有時 works boost chl 1. 在深度學習中，涉及到大量矩陣相乘，現在需要計算三個稠密矩陣A,B,C的乘積ABC，假設三個矩陣的尺寸分別為m*n,n*p,p*q,且m<n<p<q，以下計算順序效率最高

機器學習基礎——模型參數評估與選擇

比較 html 貝葉斯分類試驗聚類算法偏差 height 所有識別當看過一些簡單的機器學習算法或者模型後，對於具體問題該如何評估不同模型對具體問題的效果選擇最優模型呢。 1. 經驗誤差、泛化誤差假如m個樣本中有a個樣本分類錯誤錯誤率：E = a / m;

機器學習基礎及案例

ear plot width src python das aip 案例 ast 　　下面是部分機器學習的案例，合適入門的朋友學習，有numpy、pandas、matplotlib、scipy、skearn、TensorFlow等庫的基本案例教程。機器學習基礎及案例

《Python機器學習基礎教程》高清版免費PDF下載

虛擬變量 fontsize otl 指標停用計算處理方法 .net 基礎教程 Python機器學習基礎教程-[德] 安德裏亞斯·穆勒（Andreas C.Müller）[美]莎拉·吉多（Sarah Guido）著，張亮（hy

《機器學習實戰》第一章——機器學習基礎——筆記

1.機器學習的一個主要任務就是分類。 2.學習如何分類需要做演算法訓練，為演算法輸入大量已分類資料作為演算法的訓練集。 3.分類問題中的目標向量稱為類別，並假定分類問題只存在有限個數的類別。 4.訓練資料和測試資料。 5.假定某一個演算法，經過測試滿足精確度要求，已經學會了如何分類，

機器學習基礎（六）—— 交叉熵代價函式（cross-entropy error）

分享一下我老師大神的人工智慧教程！零基礎，通俗易懂！http://blog.csdn.net/jiangjunshow 也歡迎大家轉載本篇文章。分享知識，造福人民，實現我們中華民族偉大復興！

《機器學習基礎教程》中文PDF+英文PDF

下載：https://pan.baidu.com/s/1Yr0sP96vxlhYPgE9CcZqCA 更多資料分享：http://blog.51cto.com/3215120 《機器學習基礎教程》中文PDF+英文PDF中文PDF，帶目錄和書籤；英文PDF，文字可以複製貼上；兩版可以對比學習。本書是一本機器

分享《機器學習基礎教程》中文PDF+英文PDF

下載：https://pan.baidu.com/s/1Yr0sP96vxlhYPgE9CcZqCA 更多資料分享：http://blog.51cto.com/3215120 《機器學習基礎教程》中文PDF+英文PDF中文PDF，帶目錄和書籤；英文PDF，文字可以複製貼上；兩版可以對比學習。本書是一本機器

TensorFlow系列專題（二）：機器學習基礎

歡迎大家關注我們的網站和系列教程：http://www.tensorflownews.com/，學習更多的機器學習、深度學習的知識！目錄：資料預處理歸一化標準化離散化二值化啞編碼

TensorFlow系列專題（一）：機器學習基礎

歡迎大家關注我們的網站和系列教程：http://www.tensorflownews.com/，學習更多的機器學習、深度學習的知識！一．人工智慧發展 1956年的8月，美國達特茅斯學院（Dartmouth College）舉行了一次研討會，這次會議由約翰[圖片上傳失敗...(ima

線性代數在機器學習上的基本應用

本人碩渣一枚，之前研究方向為GPU平行計算。現在開始學習機器學習和深度學習。俗話說好記性不如爛筆頭。僅以此記錄我的學習過程。線性代數在機器學習方面有著重要的應用，為了更好的理解機器學習，複習一下線性代數。以前不知道線性代數在機器學習中的應用，這裡我推薦大家學習一下李巨集毅教授的課程講解的

《Python機器學習基礎教程》高清中文版PDF+高清英文版PDF+原始碼

資料下載：https://pan.baidu.com/s/13PSIZb_-8BVowXBjIodw8Q 《Python機器學習基礎教程》【中文版和英文版】【高清完整版PDF】+【配套原始碼】《Python機器學習基礎教程》中文和英文兩版對比學習，高清完整版PDF，帶書籤，可複製貼上；還有配套原始碼；

class average accuracy, accuracy ,precision ,recall 機器學習基礎評價標準

這幾個評價標準非常容易弄混與想當然。認真看哈，很重要。對於室內場景，或者是任何帶類別的識別任務，都會有class average accuracy. 大家想當然的翻譯成類平均識別率，就會和precision搞混。而且又因為它帶一個accuracy，所以會和accuracy搞混。

線性代數和概率論——機器學習基礎