機器學習 LogsticRegression 正則化(matlab實現)

阿新 • • 發佈：2019-02-01

仍然使用之前的根據學生兩學期分數，預測錄取情況

主程式：

X = load('ex4x.dat');
y = load('ex4y.dat');
plotData(X,y);
[m,n] = size(X);
X = [ones(m,1),X];
lambda = 1;
%[cost,grad] = costFunction(theta,X,y,lambda);
%fprintf('Cost at initial theta (zeros): %f\n', cost);
init_theta = zeros(n+1,1);
options = optimset('GradObj', 'on', 'MaxIter', 400);
f = @(t)(costFunction(t, X, y, lambda));
[theta, J, exit_flag] = fminunc(f, init_theta, options);

% Plot Boundary
plotDecisionBoundary(theta, X, y);
hold on;
title(sprintf('lambda = %g', lambda))

% Labels and Legend
xlabel('Microchip Test 1')
ylabel('Microchip Test 2')

legend('y = 1', 'y = 0', 'Decision boundary')
hold off;

% Compute accuracy on our training set
p = predict(theta, X);

fprintf('Train Accuracy: %f\n', mean(double(p == y)) * 100);

畫原始的兩學期分數分佈圖：

function plotData(X, y)
    figure;
    hold on;
    pos = find(y == 1);
    neg = find(y == 0);
    plot(X(pos, 1), X(pos, 2), 'k+', 'LineWidth', 2, 'MarkerSize', 7);
    plot(X(neg, 1), X(neg, 2), 'ko', 'MarkerFaceColor', 'y', 'MarkerSize', 7);
    legend('y == 1','y == 0');
    hold off;
end

代價函式：

梯度（正則化，theta0不參與正則化）：

function [J, grad] = costFunction(theta,X,y,lambda)
  m = length(y);
  %grad = zeros(m,1);
  sig = inline('1./(1+exp(-z))');
  grad = zeros(size(theta));
  J = 1/m*(sum(-y.*log(sig(X*theta))-(1-y).*log(1-sig(X*theta)))) +lambda/(2*m)*sum(theta(2:size(theta)).^2);%計算代價
  for j = 1:size(theta)
    if j == 1
      grad(j) = 1/m*sum((sig(X*theta)-y)'*X(:,j));
    else
      grad(j) = 1/m*sum((sig(X*theta)-y)'*X(:,j)) + lambda/m*theta(j);
    end
  end
end

畫圖裡麵包含了各種情況（這裡只是用了最簡單的那種）：

function plotDecisionBoundary(theta, X, y)
%PLOTDECISIONBOUNDARY Plots the data points X and y into a new figure with
%the decision boundary defined by theta
%   PLOTDECISIONBOUNDARY(theta, X,y) plots the data points with + for the 
%   positive examples and o for the negative examples. X is assumed to be 
%   a either 
%   1) Mx3 matrix, where the first column is an all-ones column for the 
%      intercept.
%   2) MxN, N>3 matrix, where the first column is all-ones

    % Plot Data
    plotData(X(:,2:3), y);
    hold on

    if size(X, 2) <= 3
        % Only need 2 points to define a line, so choose two endpoints
        plot_x = [min(X(:,2))-2,  max(X(:,2))+2];

        % Calculate the decision boundary line
        plot_y = (-1./theta(3)).*(theta(2).*plot_x + theta(1));

        % Plot, and adjust axes for better viewing
        plot(plot_x, plot_y)

        % Legend, specific for the exercise
        legend('Admitted', 'Not admitted', 'Decision Boundary')
        axis([10, 70, 30, 100])
    else
        % Here is the grid range
        u = linspace(-1, 1.5, 50);
        v = linspace(-1, 1.5, 50);

        z = zeros(length(u), length(v));
        % Evaluate z = theta*x over the grid
        for i = 1:length(u)
            for j = 1:length(v)
                z(i,j) = mapFeature(u(i), v(j))*theta;
            end
        end
        z = z'; % important to transpose z before calling contour

        % Plot z = 0
        % Notice you need to specify the range [0, 0]
        contour(u, v, z, [0, 0], 'LineWidth', 2)
    end
    hold off

end

預測：

function p = predict(theta, X)
    sig = inline('1./(1+exp(-z))');
    p = sig(X * theta) >= 0.5;
end

機器學習 LogsticRegression 正則化(matlab實現)

仍然使用之前的根據學生兩學期分數，預測錄取情況主程式：X = load('ex4x.dat'); y = load('ex4y.dat'); plotData(X,y); [m,n] = size(X)

機器學習：正則化技術

正則化（regularization）技術是機器學習中十分常用的技術，它在不同的模型或者情景中以不同的名字出現，比如以L2正則化為例，如果將L2正則化用於linear regression，那麼這就對應了ridge regression；如果將L2正則化用於神經網路（neural network），

【機器學習】正則化方法

正則化方法：L1和L2 regularization、資料集擴增、dropout 正則化方法：防止過擬合，提高泛化能力，減少部分特徵的權重，進而忽略部分無關緊要的特徵。因為考慮全部特徵會將噪聲加入進去，也就導致過擬合。在訓練資料不夠多時，或者overtraining時，常常會導致overf

[work*] 機器學習中正則化項L1和L2的直觀理解

正則化（Regularization）機器學習中幾乎都可以看到損失函式後面會新增一個額外項，常用的額外項一般有兩種，一般英文稱作-norm和-norm，中文稱作L1正則化和L2正則化，或者L1範數和L2範數。 L1正則化和L2正則化可以看做是損失函式的懲罰項。所謂『懲罰

【機器學習】正則化的線性迴歸 —— 嶺迴歸與Lasso迴歸

注：正則化是用來防止過擬合的方法。在最開始學習機器學習的課程時，只是覺得這個方法就像某種魔法一樣非常神奇的改變了模型的引數。但是一直也無法對其基本原理有一個透徹、直觀的理解。直到最近再次接觸到這個概念，經過一番苦思冥想後終於有了我自己的理解。 0. 正則化（

機器學習筆記——正則化（regularization）

正則化過擬合我們在利用資料來進行曲線擬合的時候會出現三種情況，欠擬合（underfitting），合適（just right），過擬合（overfitting）。欠擬合的情況一般是由於變數太少，而過擬合的原因一般是變數太多下面我們主要考慮過擬合的問題。過擬合的解決方法一

機器學習中正則化項L1和L2的直觀理解

正則化（Regularization）機器學習中幾乎都可以看到損失函式後面會新增一個額外項，常用的額外項一般有兩種，一般英文稱作ℓ1ℓ1-norm和ℓ2ℓ2-norm，中文稱作L1正則化和L2正則化，或者L1範數和L2範數。 L1正則化和L2正則化可以看做

機器學習5 正則化的線性迴歸（Regularized Linear Regression）和偏差對方差（Bias v.s. Variance）

在這篇博文中我們將會實現正則化的線性迴歸以及利用他去學習模型，不同的模型會具有不同的偏差-方差性質，我們將研究正則化以及偏差和方差之間的相互關係和影響。這一部分的資料是關於通過一個水庫的水位來預測水庫的流水量。為了進行偏差和方差的檢驗，這裡用12組資料進行迴

機器學習之正則化（Regularization）

1. The Problem of Overfitting 1 還是來看預測房價的這個例子，我們先對該資料做線性迴歸，也就是左邊第一張圖。如果這麼做，我們可以獲得擬合數據的這樣一條直線，但是，實際上這並不是一個很好的模型。我們看看這些資料，很明顯，隨著房子面積增大，住房價格的變化趨於穩定或者說越往右越平緩

系統學習機器學習之正則化（二）

監督機器學習問題無非就是“minimizeyour error while regularizing your parameters”，也就是在規則化引數的同時最小化誤差。最小化誤差是為了讓我們的模型擬合我們的訓練資料，而規則化引數是防止我們的模型過分擬合我們的訓練資料。多麼簡約的哲學啊！因為引數太多，會導致

斯坦福大學機器學習筆記——正則化的邏輯迴歸模型

在上面部落格中我們討論了正則化的線性迴歸模型，下面我們來討論一下正則化的邏輯迴歸模型。前面我們講述了兩種常用於邏輯迴歸的方法：基於梯度下降法的邏輯迴歸模型基於高階優化的邏輯迴歸模型基於

深度學習基礎--正則化與norm--區域性響應歸一化層(Local Response Normalization, LRN)

區域性響應歸一化層(Local Response Normalization, LRN) 區域性響應歸一化層完成一種“臨近抑制”操作，對區域性輸入區域進行歸一化。該層實際上證明已經沒啥用了，一般也不用了。參考資料：見郵件公式與計算該層需要的引數包括：

深度學習基礎--正則化與norm--Ln正則化綜述

L1正則化 L1範數是指向量中各個元素的絕對值之和。對於人臉任務原版的人臉畫素是 64*64，顯然偏低，但要提高人臉清晰度，並不能僅靠提高圖片的解析度，還應該在訓練方法和損失函式上下功夫。眾所周知，簡單的 L1Loss 是有數學上的均值性的，會導致模糊。

深度學習基礎--正則化與norm--L1範數與L2範數的聯絡

L1範數與L2範數的聯絡假設需要求解的目標函式為：E(x) = f(x) + r(x) 其中f(x)為損失函式，用來評價模型訓練損失，必須是任意的可微凸函式，r(x)為規範化約束因子，用來對模型進行限制。根據模型引數的概率分佈不同，r(x)一般有: 1）L1正規化

深度學習基礎--正則化與norm--正則化(Regularization)

正則化(Regularization) 一種防止過擬合，提高泛化能力的技巧，因此演算法正則化的研究成為機器學習中主要的研究主題。此外，正則化還是訓練引數數量大於訓練資料集的深度學習模型的關鍵步驟。正則化可以避免演算法過擬合，過擬合通常發生在演算法學習的輸入資料無法反應真實的分佈

深度學習基礎--正則化與norm--正則化技術

正則化技術一種防止過擬合，提高泛化能力的技巧，因此演算法正則化的研究成為機器學習中主要的研究主題。此外，正則化還是訓練引數數量大於訓練資料集的深度學習模型的關鍵步驟。正則化可以避免演算法過擬合，過擬合通常發生在演算法學習的輸入資料無法反應真實的分佈且存在一些噪聲的情況。

深度學習：正則化（L2、dropout）

一、在瞭解正則化之前，先引入一個概念“過擬合” 定義給定一個假設空間H，一個假設h屬於H，如果存在其他的假設h’屬於H,使得在訓練樣例上h的錯誤率比h’小，但在整個例項分佈上h’比h的錯誤率小，那麼就說假設h過度擬合訓練資料。也就是說一個假設在訓練資料上能夠獲

theano學習之正則化

先上程式碼： from __future__ import print_function import theano from sklearn.datasets import load_boston#波士頓房價資料 import theano.tensor as T import numpy a

機器學習中正則懲罰項L0/L1/L2範數詳解

https://blog.csdn.net/zouxy09/article/details/24971995 原文轉自csdn部落格，寫的非常好。 L0: 非零的個數 L1: 引數絕對值的和 L2:引數平方和

深度學習之正則化系列（2）：資料集增強（資料增廣）

讓機器學習模型泛化得更好的最好辦法是使用更多的資料進行訓練。當然，在實踐中，我們擁有的資料量是很有限的。解決這個問題的一種方法是建立假資料並新增到訓練集中。對於一些機器學習任務，建立新的假資料相當簡單。對分類來說這種方法是最簡單的。分類器需要一個複雜的高維輸入

機器學習 LogsticRegression 正則化(matlab實現)

相關推薦