深度學習情感分析（隨機梯度下降代碼實現）

阿新 • • 發佈：2018-02-04

隨機梯度下降 exp utf8 ret .get bsp 這一理論 body

1.代碼沒有引入深度學習包，實現了簡單的隨機梯度下降算法。

2.理論較簡單。

# coding:utf8
# Author:Chaz
import sys,time
import numpy as np

g = open("reviews.txt","r")
reviews = list(map(lambda x:x[:-1],g.readlines()))
g.close()

f = open("labels.txt","r")
labels = list(map(lambda x:x[:-1].upper(),f.readlines()))
f.close()

class SentimentNetwork():
     
def __init__(self,reviews,labels,hidden_nodes = 10 ,learning_rate = 0.1):
        np.random.seed(1)
        self.pre_process_data(reviews,labels)
        self.init_network(len(self.review_vocab),hidden_nodes,1,learning_rate)

    def pre_process_data(self,reviews,labels):
        review_vocab = set()
         
for review in reviews:
            for word in review.split(" "):
                review_vocab.add(word)
        self.review_vocab = list(review_vocab)

        label_vocab = set()
        for label in labels:
            label_vocab.add(label)
        self.label_vocab = list(label_vocab)

        self.review_vocab_size  
= len(self.review_vocab)
        self.label_vocab_size = len(self.label_vocab)

        self.word2index = {}
        for i,word in enumerate(review_vocab):
            self.word2index[word] = i

        self.label2index = {}
        for i,label in enumerate(label_vocab):
            self.label2index[label] = i

    def init_network(self,input_nodes,hidden_nodes,output_nodes,learning_rate):
        self.input_nodes = input_nodes
        self.hidden_nodes = hidden_nodes
        self.output_nodes = output_nodes

        self.learning_rate = learning_rate

        self.weight_0_1 = np.zeros((self.input_nodes,self.hidden_nodes))
        self.weight_1_2 = np.random.normal(0.0,self.output_nodes**-0.5,(self.hidden_nodes,self.output_nodes))

        self.layer_0 = np.zeros((1,self.input_nodes))
        self.layer_1 = np.zeros((1, hidden_nodes))

    def update_input_layer(self,review):
        self.layer_0 *=0
        for word in review.split(" "):
            if word in self.word2index.keys():
                # print(self.word2index[word])
                # print(self.layer_0[0])
                self.layer_0[0][self.word2index[word]] = 1


    def get_target_for_label(self,label):
        if label == "POSITIVE":
            return 1
        else:
            return 0

    def sigmoid(self,x):
        return 1/(1 + np.exp(-x))

    def sigmoid_output_2_derivative(self,output):
        return output * (1 - output)

    def train(self,train_reviews_raw,train_labels):
        train_reviews = list()
        for review in train_reviews_raw:
            indices = set()
            for word in review.split(" "):
                if (word in self.word2index.keys()):
                    indices.add(self.word2index[word])
            train_reviews.append(list(indices))
        assert (len(train_reviews) == len(train_labels))
        correct_so_far = 0
        start = time.time()

        for i in range(len(train_reviews)):
            review = train_reviews[i]
            label = train_labels[i]
            self.update_input_layer(train_reviews_raw[i])
            self.layer_1 *= 0
            for index in review:
                self.layer_1 += self.weight_0_1[index]

            layer_2 = self.sigmoid(self.layer_1.dot(self.weight_1_2))

            layer_2_error = layer_2 - self.get_target_for_label(label) # Output layer error is the difference between desired target and actual output.
            layer_2_delta = layer_2_error * self.sigmoid_output_2_derivative(layer_2)

            layer_1_error = layer_2_delta.dot(self.weight_1_2.T) # errors propagated to the hidden layer
            layer_1_delta = layer_1_error # hidden layer gradients - no nonlinearity so it‘s the same as the error

            self.weight_1_2 -= self.layer_1.T.dot(layer_2_delta) * self.learning_rate # update hidden-to-output weights with gradient descent step
            for index in review:

                self.weight_0_1[index] -= layer_1_delta[0] * self.learning_rate

            if layer_2 > 0.5 and label == "POSITIVE":
                correct_so_far += 1
            elif layer_2 <0.5 and label =="NEGATIVE":
                correct_so_far += 1

            elapsed_time = float(time.time() - start)

            reviews_per_second = i / elapsed_time if elapsed_time > 0 else 0

            sys.stdout.write("\rProgress:" + str(100 * i / float(len(train_reviews)))[:4]                              + "% Speed(reviews/sec):" + str(reviews_per_second)[0:5]                              + " #Correct:" + str(correct_so_far) + " #Trained:" + str(i + 1)                              + " Training Accuracy:" + str(correct_so_far * 100 / float(i + 1))[:4] + "%")
            if i % 2500 == 0 :
                print("")


    def test(self,test_reviews,test_labels):
        correct = 0
        start = time.time()

        for i in range(len(test_reviews)):
            pred = self.run(test_reviews[i])
            if pred == test_labels[i]:
                correct +=1
            elapsed_time = float(time.time() - start)

            reviews_per_second = i / elapsed_time if elapsed_time > 0 else 0
            sys.stdout.write("\rProgress:" + str(100 * i / float(len(test_reviews)))[:4]                          + "% Speed(reviews/sec):" + str(reviews_per_second)[0:5]                          + " #Correct:" + str(correct) + " #Tested:" + str(i + 1)                          + " Test Accuracy:" + str(correct * 100 / float(i + 1))[:4] + "%")
    def run(self,review):
        self.update_input_layer(review.lower())
        # print(self.layer_0.shape,self.weight_0_1.shape)
        layer_1 = self.layer_0.dot(self.weight_0_1)
        # print(layer_1.shape,self.weight_1_2.shape)
        layer_2 = self.sigmoid(layer_1.dot(self.weight_1_2))

        if layer_2[0] > 0.5 :
            return "POSITIVE"
        else:
            return "NEGATIVE"

mlp = SentimentNetwork(reviews[:-1000],labels[:-1000],learning_rate=0.001)
mlp.train(reviews[:-1000],labels[:-1000])
mlp.test(reviews[-1000:],labels[-1000:])

View Code

某一層w梯度 = 輸入.T * （（後一層delta * 後一層權重.T == error）* 激活函數導數 ==這一層delta）* 學習速率

深度學習情感分析（隨機梯度下降代碼實現）

隨機梯度下降 exp utf8 ret .get bsp 這一理論 body 1.代碼沒有引入深度學習包，實現了簡單的隨機梯度下降算法。 2.理論較簡單。 # coding:utf8 # Author:Chaz import sys,time import numpy

深度學習筆記之【隨機梯度下降（SGD）】

筆記優化問題 toc 最終來看應用優化算法樣本找到隨機梯度下降幾乎所有的深度學習算法都用到了一個非常重要的算法：隨機梯度下降（stochastic gradient descent,SGD) 隨機梯度下降是梯度下降算法的一個擴展機器學習中一個反復出現的

【深度學習】線性迴歸（二）小批量隨機梯度下降及其python實現

文章目錄概述小批量隨機梯度下降解析解和數值解小批量隨機梯度下降 python實現需要的先驗知識程式碼和實驗概述本文

深度學習中的三種梯度下降方式：批量（batch），隨機（stochastic），小批量（mini-batch）

　　1，批量梯度下降法（Batch Gradient Descent）：在更新引數時都使用所有的樣本來進行更新。　　優點：全域性最優解，能保證每一次更新權值，都能降低損失函式；易於並行實現。　　缺點：當樣本數目很多時，訓練過程會很慢。　　2，隨機梯度下降法（Stoch

學習筆記13：隨機梯度下降法（Stochastic gradient descent, SGD）

假設我們提供了這樣的資料樣本（樣本值取自於y=3*x1+4*x2）：x1x2y1419252651194229x1和x2是樣本值，y是預測目標，我們需要以一條直線來擬合上面的資料，待擬合的函式如下：我們

對數幾率回歸法（梯度下降法，隨機梯度下降與牛頓法）與線性判別法(LDA)

3.1 初始屬性 author alt closed sta lose cnblogs 　　本文主要使用了對數幾率回歸法與線性判別法（ＬＤＡ）對數據集（西瓜３.０）進行分類。其中在對數幾率回歸法中，求解最優權重Ｗ時，分別使用梯度下降法，隨機梯度下降與牛頓法。代碼如下：

機器學習：線性回歸——理論與代碼實現（基於正規方程與梯度下降）

overfit 返回 pen ear 隨機梯度是否很大的建模回歸一線性模型給定由n個屬性描述的列向量\(f(\mathbf{x})={(x^{(1)};x^{(2)};...;x^{(n)})}\)，其中 \(x^{(j)}\)是\(\textbf{x}\)

深度學習筆記——線性單元和梯度下降

程式碼參考了零基礎入門深度學習(2) - 線性單元和梯度下降這篇文章，我只對程式碼裡可能存在的一些小錯誤進行了更改。至於線性單元的原理以及程式碼裡不清楚的地方可以結合該文章理解，十分淺顯易懂。 from DL.perceptron import Perceptron # 定義啟用函式f f =

sklearn的快速使用之五（隨機梯度下降）

import sys import matplotlib.pyplot as plt from sklearn.linear_model import SGDRegressor from sklearn.preprocessing import StandardScaler plt.f

第六章（隨機梯度下降）

測試資料1： 5,1 1 7,2 1 9,3 2 11,4 1 19,5 3 18,6 2 測試程式碼1： import org.apache.spark.mllib.linalg.Vectors import org.apache.spark.mllib.regression

[深度學習入門]實戰一·Numpy梯度下降求最小值

[深度學習入門]實戰一·Numpy梯度下降求最小值問題描述：求解y1 = xx -2 x +3 + 0.01*(-1到1的隨機值) 與 y2 = 0 的最小距離點（x,y）給定x範圍（0，3 不使用學習框架，手動編寫梯度下降公式求解，提示：x = x - alp*(y1-

深度學習-24:數值計算、梯度下降和最小二乘法

深度學習-24:數值計算、梯度下降和最小二乘法深度學習原理與實踐(開源圖書)-總目錄，建議收藏，告別碎片閱讀！機器學習或人工智慧中會使用大量的數值計算，使用迭代演算法計算估計值來解決既定約束的數學問題，而非使用嚴格的解析過程推匯出公式來解決資料問題。數值上

【機器學習筆記04】隨機梯度下降

梯度下降梯度下降是一個尋找函式機值的方式，屬於最優化裡的基礎演算法，在低維度的情況下非常容易理解。例如存在函式y=x2y=x^2y=x2存在導數dy=2x，若當前點在x=1點，設dx的步長為0.1。此時我們通過負梯度計算下一個x點xt+1=xt−2∗0.

梯度下降法的三種形式BGD（批量梯度下降）、SGD（隨機梯度下降）以及MBGD（小批量梯度下降）

在應用機器學習演算法時，我們通常採用梯度下降法來對採用的演算法進行訓練。其實，常用的梯度下降法還具體包含有三種不同的形式，它們也各自有著不同的優缺點。　　下面我們以線性迴歸演算法來對三種梯度下降法進行比較。　　一般線性迴歸函式的假設函式為：

batch gradient descent（批量梯度下降）和 stochastic gradient descent（隨機梯度下降）

批量梯度下降是一種對引數的update進行累積，然後批量更新的一種方式。用於在已知整個訓練集時的一種訓練方式，但對於大規模資料並不合適。隨機梯度下降是一種對引數隨著樣本訓練，一個一個的及時update的方式。常用於大規模訓練集，當往往容易收斂到區域性最優解。詳細參見：Andrew Ng 的Machine

Python 文字挖掘：使用機器學習方法進行情感分析（一、特徵提取和選擇）

def create_word_bigram_scores(): posdata = pickle.load(open('D:/code/sentiment_test/pos_review.pkl','r')) negdata = pickle.load(open('D:/code/senti

LSTM Theano sentiment analysis 深度學習情感分析教程

學習LSTM最好的教程之一莫過是deep learning tutorial 見 http://deeplearning.net/tutorial/lstm.html 這裡的Sentiment analysis實際上和 Topic classification有點像首先學

線性收斂的隨機優化演算法之 SAG、SVRG（隨機梯度下降）

梯度下降法大家族（BGD，SGD，MBGD）批量梯度下降法（Batch Gradient Descent）　　　　批量梯度下降法，是梯度下降法最常用的形式，具體做法也就是在更新引數時使用所有的樣本來進行更新隨機梯度下降法（Stochastic Gradient Descent）　　　　隨機

Ubuntu 18.04 搭建帶GPU的TensorFlow、Keras、Pytorch深度學習開發環境（不用手動安裝cudnn和cuda）

Ubuntu 18.04 搭建帶GPU的TensorFlow、Keras、Pytorch深度學習開發環境（不用手動安裝cudnn和cuda）對學習深度學習的新手來說，環境搭建沒有大神指導會比較麻煩，今天介紹一種簡單、簡單、非常簡單的環境搭建方法。 1.安裝Anaconda

隨機梯度下降的公式實現

我們給出一組房子面積，臥室數目以及對應房價資料，如何從資料中找到房價y與面積x1和臥室數目x2的關係？為了實現監督學習，我們選擇採用自變數x1、x2的線性函式來評估因變數y值，得到：這裡，sita1、sita2代表自變數x1、x2的權重（weights），sita0代表偏移量。為了方便

深度學習情感分析（隨機梯度下降代碼實現）

相關推薦