keras中to_categorical函式解析

阿新 • • 發佈：2018-12-17

1.to_categorical的功能

簡單來說，to_categorical就是將類別向量轉換為二進位制（只有0和1）的矩陣型別表示。其表現為將原有的類別向量轉換為獨熱編碼的形式。先上程式碼看一下效果：

from keras.utils.np_utils import *
#類別向量定義
b = [0,1,2,3,4,5,6,7,8]
#呼叫to_categorical將b按照9個類別來進行轉換
b = to_categorical(b, 9)
print(b)

執行結果如下：
[[1. 0. 0. 0. 0. 0. 0. 0. 0.]
 [0. 1. 0. 0. 0. 0. 0. 0. 0.]
 [0. 0. 1. 0. 0. 0. 0. 0. 0.]
 [0. 0. 0. 1. 0. 0. 0. 0. 0.]
 [0. 0. 0. 0. 1. 0. 0. 0. 0.]
 [0. 0. 0. 0. 0. 1. 0. 0. 0.]
 [0. 0. 0. 0. 0. 0. 1. 0. 0.]
 [0. 0. 0. 0. 0. 0. 0. 1. 0.]
 [0. 0. 0. 0. 0. 0. 0. 0. 1.]]

to_categorical最為keras中提供的一個工具方法，從以上程式碼執行可以看出，將原來類別向量中的每個值都轉換為矩陣裡的一個行向量，從左到右依次是0,1,2，...8個類別。2表示為[0. 0. 1. 0. 0. 0. 0. 0. 0.]，只有第3個為1，作為有效位，其餘全部為0。

2.one_hot encoding(獨熱編碼)介紹

獨熱編碼又稱為一位有效位編碼，上邊程式碼例子中其實就是將類別向量轉換為獨熱編碼的類別矩陣。也就是如下轉換：

     0  1  2  3  4  5  6  7  8
0=> [1. 0. 0. 0. 0. 0. 0. 0. 0.]
1=> [0. 1. 0. 0. 0. 0. 0. 0. 0.]
2=> [0. 0. 1. 0. 0. 0. 0. 0. 0.]
3=> [0. 0. 0. 1. 0. 0. 0. 0. 0.]
4=> [0. 0. 0. 0. 1. 0. 0. 0. 0.]
5=> [0. 0. 0. 0. 0. 1. 0. 0. 0.]
6=> [0. 0. 0. 0. 0. 0. 1. 0. 0.]
7=> [0. 0. 0. 0. 0. 0. 0. 1. 0.]
8=> [0. 0. 0. 0. 0. 0. 0. 0. 1.]

那麼一道思考題來了，讓你自己編碼實現類別向量向獨熱編碼的轉換，該怎樣實現呢？

以下是我自己粗淺寫的一個小例子，僅供參考：

def convert_to_one_hot(labels, num_classes):
    #計算向量有多少行
    num_labels = len(labels)
    #生成值全為0的獨熱編碼的矩陣
    labels_one_hot = np.zeros((num_labels, num_classes))
    #計算向量中每個類別值在最終生成的矩陣“壓扁”後的向量裡的位置
    index_offset = np.arange(num_labels) * num_classes
    #遍歷矩陣，為每個類別的位置填充1
    labels_one_hot.flat[index_offset + labels] = 1
    return labels_one_hot
#進行測試
b = [2, 4, 6, 8, 6, 2, 3, 7]
print(convert_to_one_hot(b,9))

測試結果：
[[0. 0. 1. 0. 0. 0. 0. 0. 0.]
 [0. 0. 0. 0. 1. 0. 0. 0. 0.]
 [0. 0. 0. 0. 0. 0. 1. 0. 0.]
 [0. 0. 0. 0. 0. 0. 0. 0. 1.]
 [0. 0. 0. 0. 0. 0. 1. 0. 0.]
 [0. 0. 1. 0. 0. 0. 0. 0. 0.]
 [0. 0. 0. 1. 0. 0. 0. 0. 0.]
 [0. 0. 0. 0. 0. 0. 0. 1. 0.]]

3.原始碼解析

to_categorical在keras的utils/np_utils.py中，原始碼如下：

def to_categorical(y, num_classes=None, dtype='float32'):
    """Converts a class vector (integers) to binary class matrix.
    E.g. for use with categorical_crossentropy.
    # Arguments
        y: class vector to be converted into a matrix
            (integers from 0 to num_classes).
        num_classes: total number of classes.
        dtype: The data type expected by the input, as a string
            (`float32`, `float64`, `int32`...)
    # Returns
        A binary matrix representation of the input. The classes axis
        is placed last.
    # Example
    ```python
    # Consider an array of 5 labels out of a set of 3 classes {0, 1, 2}:
    > labels
    array([0, 2, 1, 2, 0])
    # `to_categorical` converts this into a matrix with as many
    # columns as there are classes. The number of rows
    # stays the same.
    > to_categorical(labels)
    array([[ 1.,  0.,  0.],
           [ 0.,  0.,  1.],
           [ 0.,  1.,  0.],
           [ 0.,  0.,  1.],
           [ 1.,  0.,  0.]], dtype=float32)
    ```
    """
    #將輸入y向量轉換為陣列
    y = np.array(y, dtype='int')
    #獲取陣列的行列大小
    input_shape = y.shape
    if input_shape and input_shape[-1] == 1 and len(input_shape) > 1:
        input_shape = tuple(input_shape[:-1])
    #y變為1維陣列
    y = y.ravel()
    #如果使用者沒有輸入分類個數，則自行計算分類個數
    if not num_classes:
        num_classes = np.max(y) + 1
    n = y.shape[0]
    #生成全為0的n行num_classes列的值全為0的矩陣
    categorical = np.zeros((n, num_classes), dtype=dtype)
    #np.arange(n)得到每個行的位置值，y裡邊則是每個列的位置值
    categorical[np.arange(n), y] = 1
    #進行reshape矯正
    output_shape = input_shape + (num_classes,)
    categorical = np.reshape(categorical, output_shape)
    return categorical

看過原始碼之後，確實覺得自己的程式碼還需要完善。框架裡的一些api，我們可以先自己想著來寫，然後和原始碼進行對比學習，這是一個很好的學習方法。

keras中to_categorical函式解析

1.to_categorical的功能簡單來說，to_categorical就是將類別向量轉換為二進位制（只有0和1）的矩陣型別表示。其表現為將原有的類別向量轉換為獨熱編碼的形式。先上程式碼看一下效果： from keras.utils.np_utils import

Keras 中 list_pictures 函式的原始碼分析及改進

1. list_pictures 的原始碼分析及改進 1.1 list_pictures 的原始碼分析首先來看一下 list_pictures 的原始碼，具體如下 def list_pictures(directory, ext='jpg|jpeg|bmp

Matlab中axes函式解析

axes函式,在Matlab的幫助文件中的說明： “Create axes graphics object” ----建立座標系圖形物件語法： axes axes('PropertyName',propertyValue,...) axes(h)

c++中find函式解析

++ 總述：以下所講的所有的string查詢函式，都有唯一的返回型別，那就是size_type，即一個無符號整數（按打印出來的算）。若查詢成功，返回按查詢規則找到的第一個字元或子串的位置；若查詢失敗，返回npos，即-1（打印出來為4294967295）。

keras中內建的多種損失函式

詳細講解 keras中的損失函式 mean_squared_error

深度學習基礎系列（五）| 深入理解交叉熵函式及其在tensorflow和keras中的實現

　　在統計學中，損失函式是一種衡量損失和錯誤（這種損失與“錯誤地”估計有關，如費用或者裝置的損失）程度的函式。假設某樣本的實際輸出為a，而預計的輸出為y，則y與a之間存在偏差，深度學習的目的即是通過不斷地訓練迭代，使得a越來越接近y，即 a - y →0，而訓練的本質就是尋找損失函式最小值的過程。　　常見的

Python中functools模組函式解析

Python自帶的 functools 模組提供了一些常用的高階函式，也就是用於處理其它函式的特殊函式。換言之，就是能使用該模組對可呼叫物件進行處理。 functools模組函式概覽 functools.cmp_to_key(func) functools.total_order

HEVC中的Merge Mode——x265程式碼getInterMergeCandidates（）函式解析

HEVC中的mv預測技術主要分為兩種：AMVP mode 和Merge mode，這裡就主要來聊聊Merge mode。由於很多時候當前的編碼CU與相鄰已經完成編碼的CU具有相同的mv，因此從相鄰的若干個PU中獲取最佳的mv就是Merge mode要做的主要事

【PHP】解析PHP中的函式

目錄結構： contents structure [+] 可變引數的函式變數函式回撥函式自定義函式庫閉包（Closure）函式的使用在這篇文章中，筆者將會講解如何使用PHP中的函式，PHP是一門弱語言型別，相比較於強語言型別（java

Python中numpy庫unique函式解析

a = np.unique(A)對於一維陣列或者列表，unique函式去除其中重複的元素，並按元素由大到小返回一個新的無元素重複的元組或者列表import numpy as np A = [1, 2, 2, 5,3, 4, 3] a = np.unique(A) B=

Python機器學習筆記：深入理解Keras中序貫模型和函式模型

　先從sklearn說起吧，如果學習了sklearn的話，那麼學習Keras相對來說比較容易。為什麼這樣說呢？　　我們首先比較一下sklearn的機器學習大致使用流程和Keras的大致使用流程： sklearn的機器學習使用流程： 1 2 3 4

Cocos2dx中常用回撥函式解析

先來看回調函式的定義： class Node; typedef void (Ref::*SEL_CallFunc)(); typedef void (Ref::*SEL_CallFuncN)(Node*); typedef void (Ref::*SEL

Deep Learning 32: 自己寫的keras的一個callbacks函式,解決keras中不能在每個epoch實時顯示學習速率learning rate的問題

1 from __future__ import absolute_import 2 from . import backend as K 3 from .utils.generic_utils import get_from_module 4 from six.moves import z

Unity3D中的線性插值Lerp()函式解析

在unity3d中經常用線性插值函式Lerp()來在兩者之間插值，兩者之間可以是兩個材質之間、兩個向量之間、兩個浮點數之間、兩個顏色之間，其函式原型如下： function Lerp(start : Material, end : Material, t : f

韋東山第三期視訊數碼相框中的電子書專案的ShowOnePage函式解析

解析：int ShowOnePage(unsigned char *pucTextFileMemCurPos) 其中： iLen = g_ptEncodingOprForFile->GetCodeFrmBuf(pucBufStart, g_pucTextFil

python中eval()函式和input()函式用法解析

1.eval()函式 eval(<字串>)能夠以Python表示式的方式解析並執行字串，並將返回結果輸出。eval()函式將去掉字串的兩個引號，將其解釋為一個變數。作用： a. 處理數字單引號，雙引號，eval()函式都將其解釋為int型別；三引號

keras中的keras.utils.to_categorical方法

to_categorical(y, num_classes=None, dtype='float32') 將整型標籤轉為onehot。y為int陣列，num_classes為標籤類別總數，大於max(y

SQL中SUBSTRING函式的用法及例項解析

一、定義：SQL 中的 substring 函式是用來擷取字串中的一部分字元。這個函式的名稱在不同的資料庫中不完全一樣。 MySQL: SUBSTR( ), SUBSTRING( ) Oracle: SUBSTR( ) SQL Server: SUB

C 和 C++ 中的mian函式解析

main函式的返回值： return返回的數值由程式的作者自定。返回不同的值可以代表不同的含義，一般是代表出錯的原因,傳統上返回0代表程式正常結束。 main函式的返回值用於說明程式的退出狀態。如果返回0，則代表程式正常退出，否則代表程式異常

Halcon中OCR的實現及關鍵函式解析

　　OCR的實現共分為兩步，1是使用字元資料來訓練OCR。2是使用OCR進行字元的識別。訓練分類器　　訓練分類器共分為4步：1是使用閾值來分割字元區域；2是呼叫append_ocr_trainf

keras中to_categorical函式解析

1.to_categorical的功能

2.one_hot encoding(獨熱編碼)介紹

3.原始碼解析

相關推薦