機器學習-準備之主要概念

阿新 • • 發佈：2018-11-12

一數學

1 代數

變數、係數和函式
線性方程式，例如 y = b +w1x1 +w2x2
對數和對數方程式，例如 y = In(1+e^z)
S 型函式

前面幾個知識點比較好理解，我們看一下 S 型函式
S型函式（Sigmoid function）是BP神經網路中常用的非線性作用函式，即sigmoid函式，公式是f(x)=1/(1+e^-x)（-x是冪數）。Sigmoid函式又分為Log-Sigmoid函式和Tan-Sigmoid函式。由於BP神經網路的傳遞函式必須可微，所以感知器的傳遞函式–二值函式在這裡不可用，故BP神經網路一般使用Sigmoid函式或者線性函式作為傳遞函式。而Sigmoid函式又分為Log-Sigmoid函式（一般所說的S型函式就是這個的簡稱）和Tan-Sigmoid函式（又稱為雙曲正切S型函式），前者的值域為（0，1），後者的值域為（-1,1）。

2 線性代數

張量和張量等級
矩陣乘法

張量（Tensor）是一個定義在一些向量空間和一些對偶空間的笛卡兒積上的多重線性對映，其座標是|n|維空間內，有|n|個分量的一種量，其中每個分量都是座標的函式，而在座標變換時，這些分量也依照某些規則作線性變換。r 稱為該張量的秩或階（與矩陣的秩和階均無關係）。
在同構的意義下，第零階張量（r = 0）為標量（Scalar），第一階張量（r = 1）為向量（Vector），第二階張量（r = 2）則成為矩陣（Matrix）。例如，對於3維空間，r=1時的張量為此向量：（x,y,z）。由於變換方式的不同，張量分成協變張量（Covariant Tensor，指標在下者）、逆變張量（Contravariant Tensor，指標在上者）、混合張量（指標在上和指標在下兩者都有）三類。

在這裡插入圖片描述

3 三角學

Tanh（作為啟用函式進行講解，無需提前掌握相關知識）
tanh是雙曲函式中的一個，tanh()為雙曲正切。在數學中，雙曲正切“tanh”是由基本雙曲函式雙曲正弦和雙曲餘弦推導而來。
函式：y=tanh x；定義域：R，值域：(-1,1)。y=tanh x是一個奇函式，其函式影象為過原點並且穿越Ⅰ、Ⅲ象限的嚴格單調遞增曲線，其影象被限制在兩水平漸近線y=1和y=-1之間
在這裡插入圖片描述

4 統計資訊

均值、中間值、離群值和標準偏差

離群值(outlier)，也稱逸出值，是指在資料中有一個或幾個數值與其他數值相比差異較大。chanwennt準則規定，如果一個數值偏離觀測平均值的概率小於等於1/(2n)，則該資料應當捨棄（其中n為觀察例數，概率可以很據資料的分佈進行估計）。

標準差也被稱為標準偏差，標準差(Standard Deviation)描述各資料偏離平均數的距離（離均差）的平均數，它是離差平方和平均後的方根，用σ表示。標準差是方差的算術平方根。標準差能反映一個數據集的離散程度，標準偏差越小，這些值偏離平均值就越少，反之亦然。標準偏差的大小可通過標準偏差與平均值的倍率關係來衡量。平均數相同的兩個資料集，標準差未必相同。
總體標準偏差，

u代表總體X的均值。

5 微積分

導數概念（您不必真正計算導數）
梯度或斜率
偏導數（與梯度緊密相關）
鏈式法則（帶您全面瞭解用於訓練神經網路的反向傳播演算法）

導數（Derivative）是微積分中的重要基礎概念。當函式y=f（x）的自變數x在一點x0上產生一個增量Δx時，函式輸出值的增量Δy與自變數增量Δx的比值在Δx趨於0時的極限a如果存在，a即為在x0處的導數，記作f’（x0）或df（x0）/dx。

梯度的本意是一個向量（向量），表示某一函式在該點處的方向導數沿著該方向取得最大值，即函式在該點處沿著該方向（此梯度的方向）變化最快，變化率最大（為該梯度的模）。
在單變數的實值函式的情況，梯度只是導數，或者，對於一個線性函式，也就是線的斜率。
斜率亦稱“角係數”，表示平面直角座標系中表示一條直線對橫座標軸的傾斜程度的量
偏導數反映的是函式沿座標軸正方向的變化率。
鏈式法則是微積分中的求導法則，用於求一個複合函式的導數，是在微積分的求導運算中一種常用的方法。複合函式的導數將是構成複合這有限個函式在相應點的導數的乘積，就像鎖鏈一樣一環套一環，故稱鏈式法則。

機器學習-準備之主要概念

一數學 1 代數變數、係數和函式線性方程式，例如 y = b +w1x1 +w2x2 對數和對數方程式，例如 y = In(1+ez) S 型函式前面幾個知識點比較好理解，我們看一下 S 型函式 S型函式（Sigmoid funct

周志華《機器學習》之第六章（支援向量機）概念總結

在之前就一直總是零零碎碎瞭解過這個熱及一時的統計學方法對樣本進行分類的支援向量機演算法。一直想系統的瞭解一下支援向量機這個很強的分類演算法，有幸在周老師的機器學習這本書中進行系統的學習。這裡我只列出一些需要重點理解的概念，以方便以後自己進行回顧，在部落格中也

周志華《機器學習》之第七章（貝葉斯分類器）概念總結

貝葉斯分類器是利用概率的知識完成資料的分類任務，在機器學習中使用貝葉斯決策論實施決策的基本方法也是在概率的框架下進行的，它是考慮如何基於這些概率和誤判損失來選擇最優的類別標記。 1、貝葉斯決策論條件風險：假設有N種可能的類別標記，Y={c1,c2,c3

周志華《機器學習》之第九章（聚類）概念總結

記得在讀研期間，去選修資料探勘與資料倉庫這門課，當時老師講的很多的一個知識點，那就是聚類分析，然後老師講了很多什麼關聯分析等等，很多都忘記了，當時也是聽得雲裡霧裡的。看完周老師在機器學習這本書中提到的聚類，大概理解了聚類能做什麼，能解決什麼樣的問題。周老師在資料

機器學習實戰之PCA

數據預處理每一個 numpy 矩陣分享 topn 文本 bsp 偽代碼一，引言　　降維是對數據高維度特征的一種預處理方法。降維是將高維度的數據保留下最重要的一些特征，去除噪聲和不重要的特征，從而實現提升數據處理速度的目的。在實際的生產和應用中，降維在一定的信息損失範

機器學習入門之四：機器學習的方法-神經網絡（轉載）

轉載 bsp 圖像 src nbsp 加速數值 str 我們　　轉自飛鳥各投林　　神經網絡　　　　神經網絡(也稱之為人工神經網絡，ANN)算法是80年代機器學習界非常流行的算法，不過在90年代中途衰落。現在，攜著“深度學習”之勢，神

機器學習算法基礎概念學習總結（轉載）

原則不清楚 tof 條件 cnblogs 偽代碼相關關系什麽最近鄰　　來源：lantian0802的專欄　　blog.csdn.net/lantian0802/article/details/38333479 　　　　一、基礎概念　　　　　　

機器學習入門之決策樹算法

所有最大的 id3 次數要去決策樹算法 4.5 獲取 ddl 1、什麽是決策樹（Decision Tree）決策樹是一個類似於流程圖的樹結構，其中每一個樹節點表示一個屬性上的測試，每一個分支代表一個屬性的輸出，每一個樹葉節點代表一個類或者類的分布

Docker 學習筆記之核心概念

api rest api 核心概念 log 筆記 try nbsp .com ont Docker核心概念： Docker Daemon Docker Container Docker Registry Docker Client 通過rest API 和Docker

機器學習入門之python實現圖片簡單分類

numbers org 路徑圖片分類 jpg animal 入門 res windows 小任務：實現圖片分類 1.圖片素材 python批量壓縮jpg圖片: PIL庫 resize http://blog.csdn.net/u012234115/article/

《機器學習》第二章概念學習和一般到特殊序

hang 描述兩個 str 依賴實例 sport 遊泳 win 《機器學習》第二章概念學習和一般到特殊序 2.1.簡介布爾函數一般形式：F(b1, b2, ..., bn)，其中 bi的定義域為{0,1}，F的值域為{0, 1}。在一般的定義域上的，取值在 {

機器學習實戰之第二章 k-近鄰算法

lifo -h 訓練數據 adl sdi 加載 erro orm 數據集第2章 k-近鄰算法 KNN 概述 k-近鄰（kNN, k-NearestNeighbor）算法主要是用來進行分類的. KNN 場景電影可以按照題材分類，那麽如何區分動作片和愛情片呢？

（原創）(二)機器學習筆記之數據預處理

labels 學習筆記取值特征 tarray 均值 imp represent 中位數數據預處理數據預處理一般包括：（1）數據標準化這是最常用的數據預處理，把某個特征的所有樣本轉換成均值為0，方差為1。將數據轉換成標準正態分布的方法：對每維特征單

Spark2.0機器學習系列之7： MLPC（多層神經網絡）

element nbsp hid 隨機梯度下降 support file dict 分類器希望 Spark2.0 MLPC（多層神經網絡分類器）算法概述 MultilayerPerceptronClassifier（MLPC）這是一個基於前饋神經網絡的分類器，它是一種在

如何使用 scikit-learn 為機器學習準備文本數據

提取 color wiki analytic 準備 ast oca 局限 parse 歡迎大家前往雲+社區，獲取更多騰訊海量技術實踐幹貨哦~ 文本數據需要特殊處理，然後才能開始將其用於預測建模。我們需要解析文本，以刪除被稱為標記化的單詞。然後，這些詞還需要被編碼為整型或

機器學習總結之第一章緒論

分享概率都是 ack 學習包含 png 分類 post 機器學習總結之第一章緒論 http://www.cnblogs.com/kuotian/p/6141728.html 1.2基本術語特征向量：即示例，反映事件或對象在某方面的性質。例如，西瓜的色澤，敲聲。

機器學習總結之第二章模型評估與選擇

概率密度函數列聯表 ext 5.1 ima 其中 bsp 泛化能力分解機器學習總結之第二章模型評估與選擇 2.1經驗誤差與過擬合錯誤率 = a個樣本分類錯誤/m個樣本精度 = 1 - 錯誤率誤差：學習器實際預測輸出與樣本的真是輸出之間的差異。訓練誤差：即

python機器學習密碼之初來乍到

Python項目開發之環境搭建 Anaconda+Pycharm 機器學習近來火得可謂人盡皆知。其實樓主現在的研究方向是橢圓曲線密碼的硬件實現。so，我一直以為這跟Python，神經網絡啥的確是八竿子打不著，然而，這個世界上就是不缺那種能開先河能擺證據撂服眾生的大神。舉個栗子這篇文章learing t

JavaScript高級程序設計學習(二)之基本概念

參數調用 name btn 記得 mco 多說 body 運維 rstp 任何語言的核心都必然會描述這門語言基本的工作原理。而描述的內容通常都要涉及這門語言的語法、操作符、數據類型、內置功能等用於構建復雜解決方案的基本概念。如前所述， ECMA-262通過叫做 ECMA

機器學習入門之使用numpy和matplotlib繪制圖形

作用應該方式 9.png 5.1 環境就是清華大學圖1 　　機器學習當中能深入淺出的方法第一步就是先學會用numpy了。numpy是一個第三方的開源python庫，他提供了許多科學的數值計算工具，尤其是大型矩陣計算，但使用配置非常簡單，結合matplotlib能夠

機器學習-準備之主要概念

一 數學

1 代數

2 線性代數

3 三角學

4 統計資訊

5 微積分

相關推薦

一數學