人臉表情識別實驗——fer2013

阿新 • • 發佈：2019-02-09

2018年7月21日22:43:57更新
轉化好的圖片資料集，百度雲分享見文章末尾。

人臉表情識別——fer2013

一、實驗概覽

第一篇文獻中有網路結構圖，但根據我做實驗的情況來看，這篇論文水分較大，達不到論文中所說的分類精度。第二篇內容比第一篇詳細很多，很值得參考。

二、實驗過程

1、準備資料集

下載fer2013之後，解壓出的是csv格式的資料，我們需要先將資料轉換成圖片。

這裡寫圖片描述

step 1: 從fer2013.csv中提取出訓練集、驗證集和測試集

這裡寫圖片描述

convert_fer2013.py:

# -*- coding: utf-8 -*- 

import csv
import os

database_path = r'F:\Datasets\fer2013'
datasets_path = r'.\datasets'
csv_file = os.path.join(database_path, 'fer2013.csv')
train_csv = os.path.join(datasets_path, 'train.csv')
val_csv = os.path.join(datasets_path, 'val.csv')
test_csv = os.path.join(datasets_path, 'test.csv')


with 
 open(csv_file) as f:
    csvr = csv.reader(f)
    header = next(csvr)
    rows = [row for row in csvr]

    trn = [row[:-1] for row in rows if row[-1] == 'Training']
    csv.writer(open(train_csv, 'w+'), lineterminator='\n').writerows([header[:-1]] + trn)
    print(len(trn))

    val = [row[:-1] for 
 row in rows if row[-1] == 'PublicTest']
    csv.writer(open(val_csv, 'w+'), lineterminator='\n').writerows([header[:-1]] + val)
    print(len(val))

    tst = [row[:-1] for row in rows if row[-1] == 'PrivateTest']
    csv.writer(open(test_csv, 'w+'), lineterminator='\n').writerows([header[:-1]] + tst)
    print(len(tst))

注意：在Windows平臺中，需要在csv.writer()中加上lineterminator='\n'不然在生存的csv檔案中，每行之間會有空行，影響後續操作。在Linux平臺中不需要這樣做。

step 2: 將csv中的資料轉化成圖片

這裡寫圖片描述

convert_csv2gray:

# -*- coding: utf-8 -*-
import csv
import os
from PIL import Image
import numpy as np


datasets_path = r'.\datasets'
train_csv = os.path.join(datasets_path, 'train.csv')
val_csv = os.path.join(datasets_path, 'val.csv')
test_csv = os.path.join(datasets_path, 'test.csv')

train_set = os.path.join(datasets_path, 'train')
val_set = os.path.join(datasets_path, 'val')
test_set = os.path.join(datasets_path, 'test')

for save_path, csv_file in [(train_set, train_csv), (val_set, val_csv), (test_set, test_csv)]:
    if not os.path.exists(save_path):
        os.makedirs(save_path)

    num = 1
    with open(csv_file) as f:
        csvr = csv.reader(f)
        header = next(csvr)
        for i, (label, pixel) in enumerate(csvr):
            pixel = np.asarray([float(p) for p in pixel.split()]).reshape(48, 48)
            subfolder = os.path.join(save_path, label)
            if not os.path.exists(subfolder):
                os.makedirs(subfolder)
            im = Image.fromarray(pixel).convert('L')
            image_name = os.path.join(subfolder, '{:05d}.jpg'.format(i))
            print(image_name)
            im.save(image_name)

生成的資料集目錄結構如下：

這裡寫圖片描述

2、訓練網路

網路結構如下：

這裡寫圖片描述

我在網路中的每一層後面都加入了BN，這樣訓練速度和效果都有提升，80次迭代的測試集acc=0.615
2. 程式碼如下:

# -*- coding: utf-8 -*-
from __future__ import print_function, division
import torch
import torch.nn as nn
import torch.optim as optim
from torch.autograd import Variable
import torch.nn.functional as F
import matplotlib.pyplot as plt
import os
from torchvision import datasets, transforms
import time

data_transforms = {
    'train': transforms.Compose([
        transforms.RandomResizedCrop(42),
        transforms.RandomHorizontalFlip(),
        transforms.Grayscale(),
        transforms.ToTensor(),
        # transforms.Normalize()
    ]),
    'test': transforms.Compose([
        # transforms.Resize(256),
        transforms.CenterCrop(42),
        transforms.Grayscale(),
        transforms.ToTensor(),
        # transforms.Normalize()
    ])
}

data_dir = r".\datasets"
image_datasets = {x: datasets.ImageFolder(os.path.join(data_dir, x), data_transforms[x]) for x in ['train', 'test']}
dataloaders = {x: torch.utils.data.DataLoader(image_datasets[x], batch_size=32, shuffle=True, num_workers=4)
               for x in ['train', 'test']}
dataset_sizes = {x: len(image_datasets[x]) for x in ['train', 'test']}
class_names = image_datasets['train'].classes

use_gpu = torch.cuda.is_available()


def imshow(inp, title=None):
    inp = inp.numpy().transpose(1, 2, 0)
    plt.imshow(inp)
    if title is not None:
        plt.title(title)
    plt.pause(10)


class Model(nn.Module):
    def __init__(self):
        super(Model, self).__init__()
        self.bn_x = nn.BatchNorm2d(1)
        self.conv1 = nn.Conv2d(in_channels=1, out_channels=32, kernel_size=5, stride=1, padding=2)
        self.bn_conv1 = nn.BatchNorm2d(32, momentum=0.5)
        self.conv2 = nn.Conv2d(in_channels=32, out_channels=32, kernel_size=4, stride=1, padding=1)
        self.bn_conv2 = nn.BatchNorm2d(32, momentum=0.5)
        self.conv3 = nn.Conv2d(in_channels=32, out_channels=64, kernel_size=5, stride=1, padding=2)
        self.bn_conv3 = nn.BatchNorm2d(64, momentum=0.5)
        self.fc1 = nn.Linear(in_features=5 * 5 * 64, out_features=2048)
        self.bn_fc1 = nn.BatchNorm1d(2048, momentum=0.5)
        self.fc2 = nn.Linear(in_features=2048, out_features=1024)
        self.bn_fc2 = nn.BatchNorm1d(1024, momentum=0.5)
        self.fc3 = nn.Linear(in_features=1024, out_features=7)

    def forward(self, x):
        x = self.bn_x(x)
        x = F.max_pool2d(F.tanh(self.bn_conv1(self.conv1(x))), kernel_size=3, stride=2, ceil_mode=True)
        x = F.max_pool2d(F.tanh(self.bn_conv2(self.conv2(x))), kernel_size=3, stride=2, ceil_mode=True)
        x = F.max_pool2d(F.tanh(self.bn_conv3(self.conv3(x))), kernel_size=3, stride=2, ceil_mode=True)
        x = x.view(-1, self.num_flat_features(x))
        x = F.tanh(self.bn_fc1(self.fc1(x)))
        x = F.dropout(x, training=self.training, p=0.4)
        x = F.tanh(self.bn_fc2(self.fc2(x)))
        x = F.dropout(x, training=self.training, p=0.4)
        x = self.fc3(x)
        return x

    def num_flat_features(self, x):
        size = x.size()[1:]  # all dimensions except the batch dimension
        num_features = 1
        for s in size:
            num_features *= s
        return num_features


def test_model():
    inputs, labels = next(iter(dataloaders['train']))
    print(inputs.size())
    if use_gpu:
        inputs, labels = Variable(inputs.cuda()), Variable(labels.cuda())
    else:
        inputs, labels = Variable(inputs), Variable(labels)

    # out = torchvision.utils.make_grid(inputs)
    #
    # imshow(out, title=[class_names[x] for x in classes])
    model = Model()
    if use_gpu:
        model = model.cuda()
    print(model)
    outputs = model(inputs)
    print(outputs)


def train_model(model, criterion, optimizer, num_epochs=25):
    since = time.time()

    best_model_wts = model.state_dict()
    best_acc = 0.0

    for epoch in range(num_epochs):
        print('Epoch {}/{}'.format(epoch, num_epochs - 1))
        print('-' * 10)

        for phase in ['train', 'test']:
            if phase == 'train':
                # scheduler.step()
                model.train(True)
            else:
                model.train(False)

            running_loss = 0.0
            running_corrects = 0

            for data in dataloaders[phase]:
                inputs, labels = data

                if use_gpu:
                    inputs, labels = Variable(inputs.cuda()), Variable(labels.cuda())
                else:
                    inputs, labels = Variable(inputs), Variable(labels)

                optimizer.zero_grad()

                outputs = model(inputs)
                _, preds = torch.max(outputs.data, 1)
                loss = criterion(outputs, labels)

                if phase == 'train':
                    loss.backward()
                    optimizer.step()

                running_loss += loss.data[0]
                running_corrects += torch.sum(preds == labels.data)

            epoch_loss = running_loss / dataset_sizes[phase]
            epoch_acc = running_corrects / dataset_sizes[phase]

            print('{} Loss: {:.4f} Acc: {:.4f}'.format(phase, epoch_loss, epoch_acc))

            if phase == 'test' and epoch_acc > best_acc:
                best_acc = epoch_acc
                best_model_wts = model.state_dict()

            print()

        time_elapsed = time.time() - since
        print('Training complete in {:0f}m {:.0f}s'.format(time_elapsed // 60, time_elapsed % 60))
        print('Best test Acc: {:4f}'.format(best_acc))

        model.load_state_dict(best_model_wts)
        torch.save(model, 'best_model.pkl')
        torch.save(model.state_dict(), 'model_params.pkl')


if __name__ == '__main__':
    # test_model()
    model = Model()
    if use_gpu:
        model = model.cuda()
    criterion = nn.CrossEntropyLoss()
    optimizer = optim.Adam(model.parameters())
    train_model(model, criterion, optimizer, num_epochs=100)

實驗未最終完成，後面再補充。

人臉表情識別實驗——fer2013

2018年7月21日22:43:57更新轉化好的圖片資料集，百度雲分享見文章末尾。人臉表情識別——fer2013 一、實驗概覽第一篇文獻中有網路結構圖，但根據我做實驗的情況來看，這篇論文水分較大，達不到論文中所說的分類精度。第二篇

Tensorflow入門教程(二十九)人臉表情識別(上)人臉表情資料集-fer2013

------韋訪 20181102 1、概述好久沒更新tensorflow的教程了，這這段時間一直在學習機器學習的基礎，但是如果想去找工作，沒有一點實際的應用可能就沒那麼容易聊了，所以，做一下人臉表情識別的例子，其實我最終的目的是想做一個疲勞檢測的例子，這裡就先練練手，

CNN fer2013資料集人臉表情識別及優化（1）

fer2013資料集介紹 fer2013資料集來自於kaggle上的一次人臉表情比賽，資料下載地址為：[https://www.kaggle.com/c/challenges-in-represent

人臉表情識別深度神經網絡 python實現簡單模型 fer2013數據集

lib [1] clas nbsp ces ini batch 類別 rep 參考網址：https://sefiks.com/2018/01/01/facial-expression-recognition-with-keras/ 1.數據集介紹及處理：（1)　　數據

《基於剪下波變換的人臉表情識別》筆記

【時間】2018.10.16 【題目】《基於剪下波變換的人臉表情識別》筆記【論文連結】http://www.wanfangdata.com.cn/details/detail.do?_type=degree&id=Y2102266 概述本文是閱

人臉表情識別筆記（二）特徵提取之LBP（區域性二值模式）原理及MATLAB程式碼

一：原理部分 LBP（Local Binary Pattern，區域性二值模式）是一種用來描述影象區域性紋理特徵的運算元；它具有旋轉不變性和灰度不變性等顯著的優點。它是首先由T. Ojala, M.Pietikäinen, 和D. Harwood 在1994年提出，用

人臉表情識別概述（一）

一、人臉表情識別技術目前主要的應用領域包括人機互動、安全、機器人制造、醫療、通訊和汽車領域等二、1971年，心理學家Ekman與Friesen的研究最早提出人類有六種主要情感，每種情感以唯一的表情來反映人的一種獨特的心理活動。這六種情感被稱為基本情感，由憤怒（anger

人臉表情識別常用的幾個資料庫

人臉表情識別就是讓計算機識別人臉的各種表情，進而分析表情所代表的情緒，意圖等。人臉表情識別可以用在測謊，醫學輔助診斷，人機互動方面。與人臉識別相比，人臉表情特徵更加細微，而且受各種因素的干擾也更大

cpp-BP與特徵臉實現人臉表情識別(一):BP神經網路

這是一份充滿野指標的只是用來理解的玩具程式碼最近用耶魯人臉庫簡單實現了人臉表情識別，寫幾篇部落格留個紀念。分為 BP神經網路與實現人臉識別兩篇部落格，對於遇到的問題與程式碼進行總結分析。第一篇需要理解 BP神經網路的原理，先給出程式碼再總結。直接複製貼上程

人臉表情識別——定製自己的資料載入方式

背景將人臉分割成幾部分，送入並行的網路結構。出現的問題是：使用torchvision.datasets.ImageLoader函式載入資料集後，當使用torch.utils.data.DataLoader進行shuffle後，這幾部分的影象的Label無

深度動態序列人臉表情識別——論文筆記

人臉表情識別分為動態序列識別和靜態圖片識別，本文只與動態序列有關這裡也有一篇推送解析的這篇文章，但是不全，很多提到的文章沒有翻譯，不過只作為概覽的話倒是可以深度學習 + 動態序列人臉表情識別綜述研究背景與意義人臉表情識別已經成為一個人機互動領域的研究熱點，涉及到心理學、統計學

表情識別實驗

1.實驗資料實驗資料採用Kaggle的一個表情分類比賽資料（），該資料集包含三萬多張人臉圖片，每張圖片被標註為“0=Angry, 1=Disgust, 2=Fear, 3=Happy, 4=Sad, 5=Surprise, 6=Neutral”（7類）的其中一種，

論文分析--《基於深度學習的人臉表情識別演算法研究_宋新慧》

1.摘要：文章中提出的演算法：1）針對靜態的影象：細節感知遷移網路資料集：CK+；Kaggle2）針對視訊序列：利用多工學習的遞迴神經網路資料集：I-PFE2.本文工作：1）基於細節感知遷移網路的人臉表情識別：傳統特徵提取方法存在的問題：光照、角度等影

人臉表情識別經典論文

主要是重點研究了四篇人臉表情識別的paper。分別是一篇中文中文文獻：2006年清華大學朱健翔發表在《光電子·鐳射》上面的文章《結合Gabor特徵與Adaboost的人臉表情識別》。三兩篇外文文獻：2014CVPR上面的文章《Facial Expression Recogn

人臉識別之表情識別（五）--MBP+CNN

轉自：https://blog.csdn.net/app_12062011/article/details/80482048 EmotiW 2015 LBP特徵輸入到CNN模型中，並經過特殊對映，得到高於基線15%的效能提升。作者採用了： 4個cnn模型VGG S,VGG M-2

深度學習（一）——deepNN模型實現攝像頭實時識別人臉表情（C++和python3.6混合程式設計）

一、背景介紹最近需要做人臉識別方向的東西，就被分配了新的任務，利用攝像頭實時檢測人臉表情，並製作成一個小軟體，這裡當然要用C++實現，並用C++做成一個介面。由於博主之前用python做過類似的小程式，因此這裡的模型實現主要採用了python，為了用C++實現介面，這裡採用C++呼叫py

【蜂口 | AI人工智慧】表情識別——龍鵬深度學習與人臉影象應用連載（七）

本次繼續給大家帶來的是表情識別這個問題。我們將從四個方向給大家進行分享。首先，我們會給大家科學地定義一下表情是什麼？表情實際上包含了我們平常所說的表情以及微表情。其次，我們會簡單地介紹一下傳統方法的研究思路。傳統的方法主要從靜態圖和動態視訊兩個方面進行講述。然後，我們再給大

keras系列︱人臉表情分類與識別：opencv人臉檢測+Keras情緒分類（四）

人臉識別熱門，表情識別更加。但是表情識別很難，因為人臉的微表情很多，本節介紹一種比較粗線條的表情分類與識別的辦法。 Keras系列：本次講述的表情分類是識別的分析流程分為：

OpenCV人臉識別實驗（一）——特徵臉（Eigenfaces）及其重構的原始碼詳解

1、介紹Introduction 從OpenCV2.4開始，加入了新的類FaceRecognizer，我們可以使用它便捷地進行人臉識別實驗。本實驗採用的程式設計環境為：opencv3.0+VS2013。人臉識別的實驗已經轉移到face模組中， face模組在我這裡的路徑為

人臉屬性識別演算法 | 性別+種族+年齡+表情

　內容梗概　　隨著社會的發展，快速有效的自動身份驗證在安防領域變的越來越迫切。由於生物特性是人的內在屬性，具有很強的自身穩定性和個體差異性，是身份驗證的最理想依據。利用人臉屬性進行身份驗證又是最自然直接的手段，相比其它人體生物特性，它具有直接、友好、方便的特點，更容易

人臉表情識別實驗——fer2013

人臉表情識別——fer2013

一、實驗概覽

二、實驗過程

1、準備資料集

step 1: 從fer2013.csv中提取出訓練集、驗證集和測試集

step 2: 將csv中的資料轉化成圖片

2、訓練網路

相關推薦