影象質量評估IQAtriq和hyperIQA個人理解

阿新 • • 發佈：2022-01-18

影象質量評估IQAtriq和hyperIQA個人理解

triq

Junyong You1, Jari Korhonen2

作者單位：1. 挪威研究中心； 2. 中國深圳深圳大學

方法

解決問題：transformer或者Vit不可以輸入不同尺度的影象問題。

解決方式：Feature projection, max-pooling

總體上也就是嘗試了transformer用於IQA的可能性和效果，結果效果很好。

根據ViT設計了一個可以在一定尺度大小內的影象輸入transformer的模型。主要貢獻是對影象進行預處理使影象做為影象塊輸、入transformer模型中，模型輸出的是5個分級的分佈值，最後將五個分數加權求和得到最終的預測分數。

優點：效果最好。transformer最近比較火，也許可以有些優化。比如MAE，不過理論上使用MAE會提升速度，可能降低準確度。

缺點：模型對於解析度大的模型需要重新設計，並且推理時間較長。

hyperIQA（西北工業大學）

方法

主要解決問題：

失真多樣性和內容變化

失真多樣性：主要是說其他模型只是關注模型的全域性特徵，也就是深層特徵，但是淺層的區域性特徵也是很重要的，比如如果圖片有一部分的質量相當差，其他部分都好，人眼會覺得分數很低，但是模型會預測的分數還不錯。

解決方式就是引入底層特徵。

首先，當前的深度模型只學習用於分類的全域性特徵。然而，對於真實的 IQA 來說，扭曲在很多方面都是多種多樣的，其中大部分存在於區域性地區。忽略區域性模式可能會導致預測質量與人類視覺感知之間的不一致，因為當影象的其餘部分表現出相當好的質量時，人類視覺系統 (HVS) 對區域性失真很敏感。

內容變化：對於人類視角來說，不同內容的圖片應該會賦予不同的美學評價觀念，比如對人臉和景色的美學評價不應該相同（景色那必是比人臉分高的）所以圖片內容模型的引數自適應調整。比如，人類檢查員會認為晴朗的藍天影象是高質量的，而大多數 IQA 方法將其誤認為是由於影象包含大的扁平區域而導致的模糊影象。

解決方式就是先做內容識別，也就是影象語義理解，再預測分數。

優點：速度快比triq快。

缺點：效果比triq差一點點，並且需要將多輸入的224*224影象做resize或者其他處理，理論上可能會對結果有影響，目前實驗測試影響可以忽略。

隨心隨我

影象質量評估IQAtriq和hyperIQA個人理解

影象質量評估IQAtriq和hyperIQA個人理解

triq

方法

hyperIQA（西北工業大學）

方法

影象質量評估IQAtriq和hyperIQA個人理解

【Python】迭代器和生成器的個人理解，再講一講協程

Vue原始碼學習心得之$emit和$on以及$off的個人理解

super()的個人理解和疑問

Fork/Join模式中fork和invokeAll區別的個人理解

xml檔案卷積神經網路_CNN卷積神經網路入門個人理解和例項程式碼(註釋詳細，一勞永逸)...

3行Python程式碼實現影象照片摳圖和換底色的方法

利用OpenCV中對影象資料進行64F和8U轉換的方式

PHP get和set的理解

[Python影象處理]十二.影象向下取樣和向上取樣

基於個人理解的springAOP部分原始碼分析，內含較多原始碼，慎入

關於char[]和char*的理解

影象處理中Stride和Width的關係

對Python的 ‘==‘ 和 ‘is‘的理解，希望對你有幫助

pytest－ fixture個人理解總結

策略模式的個人理解

.Net中堆和棧的理解

關於反射的一些個人理解

關於 Python 裝飾器的一些個人理解

strategy策略模式個人理解

影象質量評估IQAtriq和hyperIQA個人理解

影象質量評估IQAtriq和hyperIQA個人理解

triq

方法

hyperIQA（西北工業大學）

方法

相關推薦