基於圖嵌入的高斯混合變分自編碼器的深度聚類(Deep Clustering by Gaussian Mixture Variational Autoencoders with Graph Embedding, DGG)

阿新 • • 發佈：2020-07-07

基於圖嵌入的高斯混合變分自編碼器的深度聚類

Deep Clustering by Gaussian Mixture Variational Autoencoders with Graph Embedding, DGG

作者：凱魯嘎吉 - 部落格園http://www.cnblogs.com/kailugaji/

1. 引言

這篇博文主要是對論文“Deep Clustering by Gaussian Mixture Variational Autoencoders with Graph Embedding”的整理總結，這篇文章將圖嵌入與概率深度高斯混合模型相結合，使網路學習到符合全域性模型和區域性結構約束的強大特徵表示。將樣本作為圖上的節點，並最小化它們的後驗分佈之間的加權距離，在這裡使用Jenson-Shannon散度作為距離度量。

閱讀這篇博文的前提條件是：瞭解高斯混合模型用於聚類的演演算法，瞭解變分推斷與變分自編碼器，進一步瞭解變分深度嵌入(VaDE)模型。在知道高斯混合模型(GMM)與變分自編碼器(VAE)之後，VaDE實際上是將這兩者結合起來的一個產物。與VAE相比，VaDE在公式推導中多了一個變數c。與GMM相比，變數c就相當於是GMM中的隱變數z，而隱層得到的特徵z相當於原來GMM中的資料x。而基於圖嵌入的高斯混合變分自編碼器的深度聚類(DGG)模型可以看做在VAE的基礎上結合了高斯混合模型與圖嵌入來完成聚類過程，公式推導中同樣增加了表示類別的變數c，同時，目標函式後面加了一項圖嵌入的約束項。比起VaDE來說，可以理解為多了一個約束項——圖嵌入，當然目標函式還是有所不同。

下面主要介紹DGG模型目標函式的數學推導過程。推導過程用到了概率論與數理統計的相關知識，更用到了VaDE模型推導裡面的知識，如果想要深入瞭解推導過程，請先看變分深度嵌入(VaDE)模型的相關推導。

2. 目標函式的由來與轉化

3. 目標函式具體推導

4. 引數更新過程及聚類結果

5. 我的思考

在推導過程中我與原文中的推導有不一樣的地方。

1）我的推導過程中變分下界L中第二項係數是1/2，原文直接是1，而在支撐材料裡面仍然是1/2，因此可以認為是作者筆誤造成的。

2）我的推導過程中變分下界L中的第二項與第四項都有常數項（藍框框標出的），這兩項正好正負抵消，才沒有這個引數項，而在原文支撐材料裡面直接第二四項都沒有常數項。不過這只是支撐材料的內容，在原文中沒有太大影響。

3）我用的是πk，原文用的πik。這點沒有太大影響。

6. 參考文獻

[1]Linxiao Yang, Ngai-Man Cheung, Jiaying Li, and Jun Fang, "Deep Clustering by Gaussian Mixture Variational Autoencoders with Graph Embedding", In ICCV 2019.

[2] 論文補充材料：Deep Clustering by Gaussian Mixture Variational Autoencoders with Graph Embedding - Supplementary

[3] DGG Python程式碼：https://github.com/ngoc-nguyen-0/DGG

[4]變分深度嵌入(Variational Deep Embedding, VaDE) - 凱魯嘎吉 - 部落格園

[5]變分推斷與變分自編碼器 - 凱魯嘎吉 - 部落格園

基於圖嵌入的高斯混合變分自編碼器的深度聚類(Deep Clustering by Gaussian Mixture Variational Autoencoders with Graph Embedding, DGG)

基於圖嵌入的高斯混合變分自編碼器的深度聚類 Deep Clustering by Gaussian Mixture Variational Autoencoders with Graph Embedding, DGG

pytorch-自編碼器與變分自編碼器-有損影象壓縮

筆記摘抄 importtorch fromtorch import nn, optim fromtorch.utils.data import DataLoader fromtorchvision import transforms, datasets

[tensorflow2.0]採用自定義層和模型在minist資料集上實現VAE(變分自編碼器)

技術標籤：tensorflowpython 使用keras的API進行搭建 from tensorflow.keras import layers

#MNIST資料集上條件變分自編碼器#程式碼

import torch from torch import nn import torch.nn.functional as F import torchvision from torch.utils.data import DataLoader

VAE(變分自編碼器的torch實現) —— jupyter實現(注意tqdm模組不同)

簡單實現了torch版本的變分自編碼器參考大佬TensorFlow版本的VAE：膜拜大佬 import os

變分自動編碼器

變分自動編碼器 Diederik Kingma和Max Welling於2013年推出了自動編碼器的另一個重要類別，並迅速成為最受歡迎的自動編碼器型別之一：變分自動編碼器

python 基於opencv實現高斯平滑

假設一個列數為W,行數為H的高斯卷計運算元gaussKernel,其中W,H均為奇數，描點位置在（(H-1)/2,(W-1)/2）,構建高斯卷積核的步驟如下

使用K-means和高斯混合模型對影象進行聚類

匯入圖片 %matplotlib inline import numpy as np import skimage.io as SKimg import matplotlib.pyplot as plt

Sklearn實現高斯混合模型

技術標籤：機器學習# Sklearn筆記sklearn高斯混合模型機器學習 import numpy as np import matplotlib.pyplot as plt

高斯混合狀態空間模型

狀態空間模型狀態空間模型一般包括一個量測方程 (mesurementequation) 和一個轉移方程 (transition equation)，後者描述了狀態如何與觀測向量之間相互作用。

統計學習：EM演算法及其在高斯混合模型(GMM)中的應用

1. EM演算法的基本思想我們在應用中所面對的資料有時是缺損的/觀測不完全的。我們將資料分為：

基於RNN自編碼器的離群點檢測

作者|David Woroniuk 編譯|VK 來源|Towards Data Science 什麼是異常異常，通常稱為異常值，是指資料中不符合資料系列總體行為的資料點、資料序列或模式。因此，異常檢測就是檢測不符合更廣泛資料中的模式的資料點

GYM-100199H Cracking' RSA 數論，高斯消元求自由變元

GYM-100199H Cracking\' RSA 數論，高斯消元求自由變元題意首先題目友好的給定一個\\(t\\) ，再給定一個數\\(m\\) 表示接下來有\\(m\\) 個數，表示接下來的數字都由素數表中的前\\(t\\)個數組成。

基於opencv對圖片新增高斯模糊和高斯去噪（python）

技術標籤：opencvcvpython 圖片的位置與程式碼處於一個資料夾下；生成的圖片也在同一個資料夾下。

基於C語言的高斯曲線擬合原理以及實現【轉】

https://blog.csdn.net/dingzj2000/article/details/103719368?utm_medium=distribute.pc_relevant.none-task-blog-OPENSEARCH-3.control&depth_1-utm_source=distribute.pc_relevant.none-task-blog-OPENSEARCH

數值分析3-解線性方程組的高斯消去法、LU分解法及列主元消去法的matlab程式和除錯方法

技術標籤：數值分析-matlab程式matlab線性代數矩陣對於形如Ax=b的線性方程組，線上性代數中是通過求逆的方式求解的，即x=A-1b,而在數值分析中，解線性方程組的方法是通過直接法或者迭代法來實現的，今天寫的三個

【影象去噪】基於matlab全變分演算法（TV）影象去噪【含Matlab原始碼 625期】

一、簡介全變分（Total variation），也稱為全變差，是圖象復原中常用的一個名詞。本文簡要介紹全變分的概念以及在圖象去噪中的應用。

【影象去噪】基於matlab全變分演算法影象去噪【含Matlab原始碼 626期】

一、簡介全變分（Total variation），也稱為全變差，是圖象復原中常用的一個名詞。本文簡要介紹全變分的概念以及在圖象去噪中的應用。

【影象增強】基於matlab高斯+低通+巴特沃斯濾波虹膜影象濾波【含Matlab原始碼 501期】

一、簡介基於matlab虹膜影象高斯濾波、低通濾波、巴特沃斯濾波二、原始碼 function varargout = frequencydem(varargin)

P3232 [HNOI2013]遊走題解(圖上隨機遊走問題高斯消元

題目連結題目思路就是一個圖上隨機遊走問題模板程式碼 #include<bits/stdc++.h>