機器學習9：“Hello World” of deep learning

阿新 • • 發佈：2018-12-09

一、框架

1、TensorFlow或者theano比較靈活，可以理解成微分器，你可以用來實現Gradient Decent，但用起來實際上是有難度的；

2、keras其實是TensorFlow或theano的API介面，可以幫助你快速做一個模型，現在TensorFlow預設使用Keras介面，theano也可以安裝使用keras；

3、keras有很多現成的介面幫助你，你同樣可以有靈活性寫自己的函式；

4、keras的documentation：http://keras.io/；

5、使用keras更像是在搭積木；

二、“Hello World”

1、資料準備

2、模型構建

model = Sequential()建立一個model；

add新增“層”，Dense裡面是輸入和輸出的維數，只有第一層用輸入，中間層預設上一層的輸出為輸入；

每一層新增一個啟用函式Activation,啟用函式可以有多種選擇；

3、模型評價（Loss Function與優化方法）

使用compile函式，這裡選擇了CrossEntropy作為損失函式，adam作為梯度優化方法

4、訓練

x_train是訓練資料，y_train是標籤型別，batch_size是將資料分成多塊，表示每塊的大小，nb_epoch表示重複調引數的次數，這裡不是每個塊裡面的調參次數，每個塊裡面依然調很多次引數，這裡是重複所有塊的次數。

資料表示如下（資料輸入前需要轉化成相應形式）：

x_train輸入10000張28*28圖片，那麼資料維數是10000*784

y_train輸入10000張圖片的標籤，每一列代表一個標籤，圖中第一個標籤是｛0，0，0，0，0，1，0，0，0，0｝，代表數字“5”

batch_size的大小設定有所講究，對於GPU來說，設定太小的話，batch數量就多，就要分很多次計算，運算時間會比較長，設定太大的話，每個batch裡面一次調整很多引數可能會出錯。

下圖是兩個batch分開計算與合併起來計算的速度說明：

5、模型的儲存與測試

三、調引數

模型需要調整Loss Function，梯度下降方法以及層數獲得最好的效果

機器學習9：“Hello World” of deep learning

一、框架 1、TensorFlow或者theano比較靈活，可以理解成微分器，你可以用來實現Gradient Decent，但用起來實際上是有難度的； 2、keras其實是TensorFlow或theano的API介面，可以幫助你快速做一個模型，現在TensorFlow預設使用Keras介面

機器學習與深度學習系列連載：第二部分深度學習（九）Keras- “hello world” of deep learning

Keras Kearas 是深度學習小白程式碼入門的最佳工具之一。如果想提升、練習程式碼能力，還是建議演算法徒手python實現。複雜的深度神經網路專案還是推薦TensorFlow或者Pytorch Keras是一個高層神經網路API，Keras由純Pyt

李巨集毅機器學習 P15 “Hello world” of deep learning 筆記

我們今天使用Keras來寫一個deep learning model。 tensorflow實際上是一個微分器，它的功能比較強大，但同時也不太好學。因此我們學Keras，相對容易，也有足夠的靈活性。李教授開了一個玩笑：下面我們來寫一個最簡單的deep learning mo

機器學習筆記1 - Hello World In Machine Learning

之間項目圍棋 gpu 強勁大量數據特殊轉換成 [1] 前言 Alpha Go在16年以4:1的戰績打敗了李世石，17年又以3:0的戰績戰勝了中國圍棋天才柯潔，這真是科技界振奮人心的進步。伴隨著媒體的大量宣傳，此事變成了婦孺皆知的大事件。大家又開始激烈的討論機器人什

2018-3-21李巨集毅機器學習視訊筆記（十三）--“Hello Wrold” of Deep learning

Keras：有關的介紹：總的來說就是一個深度學習框架keras - CSDN部落格https://blog.csdn.net/xiaomuworld/article/details/52076202軟體工程中的框架：一種可複用的設計構件（從巨集觀上大體結構的一種規定約束）軟體

機器學習綜述與“Hello World”實戰

本文結構思維導圖概述友情提示： 1. 對於本文中資料集，訓練集，特徵點，空間等基礎概念，請參考周志華老師的《機器學習》第一章的內容 2. Python的語法並不難理解，有編碼基礎的可以直接看懂，如果不懂，請參考廖雪峰老師的個人部落格中Python的教學內容&nbs

李巨集毅機器學習筆記-6 深度學習簡介（Brief Introduction of Deep Learning）

Brief Introduction of Deep Learning - 深度學習簡介 1. 前言 deep learning 在近些年非常熱門，從2012年開始，深度學習的應用數目幾乎是呈指數增長的。深度學習的發展史如下圖：

COBOL學習之一：HELLO WORLD 的編譯與執行

一、第一個HELLO WORLD 程式寫好了，很簡單，問題就在如何用JCL去提交編譯COBOL程式。出現了N多錯誤。。又寫了個JCL，提交了下：這次比上次好多了，至少，JCL沒有錯誤。找了下，問題在

李巨集毅機器學習 P13 Brief Introduction of Deep Learning 筆記

deep learning的熱度增長非常快。下面看看deep learning的歷史。最開始出現的是1958年的單層感知機，1969年發現單層感知機有限制，到了1980年代出現多層感知機（這和今天的深度學習已經沒有太大的區別），1986年又出現了反向傳播演算法（通常超過3

機器學習10：Tips of DNN——啟用函式選擇

一、Training和Testing情形 overfitting：Training Data上表現良好，Testing Data表現不好。 Training失敗：梯度消失等情形。如下的例子屬於Training失敗，並非overfitting：雖然層數增加導致訓練結果變差，但

機器學習15：why deep？

一、Deep更有效率 1、90年代的Universality Theorem指出任何連續函式都可以用一層隱藏層表示出來（可能需要用到較多的神經元）；然而，實際的應用表明，Deep層更有效率。 2、對於下面的例子圖1直接使用一層網路對長髮女、長髮男、短髮女、短髮男四種類型進行分類；

Android學習筆記2：Hello World程式解析

《第一行程式碼——Android》郭霖著 Android Studio入門到精通 Android Studio與Eclipse的一些不同 Android Studio是基於IDEA的，IDEA 全稱IntelliJ IDEA，是java語言開發的整合環境。IDEA

Django2.0：【Django2.0教程】02.入門儀式：Hello World 視訊學習筆記

進入到需要放置專案的路徑，使用如下命令建立專案： $ django-admin startproject mysite 這裡，mysite為專案名稱，也可以是其他的名字。進入到mysite目錄之後，可以看到目錄結構如下： . ├── mana

【學習筆記】〖九度OJ〗題目1464：Hello World for U

題目描述： Given any string of N (>=5) characters, you are asked to form the characters into the shape of U. For example, "helloworld" can be printed as:

RabbitMQ消息隊列（二）：”Hello, World“

復雜 article ins don title apple lar github publish 本文將使用Python（pika 0.9.8）實現從Producer到Consumer傳遞數據”Hello, World“。首先復習一下上篇所學：RabbitM

機器學習(3)：信息論

clas spa strong nbsp 信息熵機器 ont 應用信息 1.信息熵 2.相對熵 3.互信息 4.交叉熵及深度學習的應用機器學習(3)：信息論

Spark機器學習(5)：SVM算法

線性 logs pro 二維 log libs jar 解析 cti 1. SVM基本知識 SVM(Support Vector Machine)是一個類分類器，能夠將不同類的樣本在樣本空間中進行分隔，分隔使用的面叫做分隔超平面。比如對於二維樣本，分布在二維平面上，此

機器學習入門：線性回歸及梯度下降

想要 oom 考試 erl text local oca 希望觀察機器學習入門：線性回歸及梯度下降本文會講到： (1)線性回歸的定義 (2)單變量線性回歸 (3)cost function：評價線性回歸是否擬合訓練集的方法 (4)梯度下

Spark機器學習(6)：決策樹算法

projects 信息 txt .cn import n) .com util seq 1. 決策樹基本知識決策樹就是通過一系列規則對數據進行分類的一種算法，可以分為分類樹和回歸樹兩類，分類樹處理離散變量的，回歸樹是處理連續變量。樣本一般都有很多個特征，有的特征對分

Spark機器學習(8)：LDA主題模型算法

算法 ets 思想 dir 骰子 cati em算法第一個不同 1. LDA基礎知識 LDA（Latent Dirichlet Allocation）是一種主題模型。LDA一個三層貝葉斯概率模型，包含詞、主題和文檔三層結構。 LDA是一個生成模型，可以用來生成一篇文

機器學習9：“Hello World” of deep learning

一、框架

二、“Hello World”

三、調引數

相關推薦