1. 程式人生 > >google影象新壓縮技術RAISR的測試

google影象新壓縮技術RAISR的測試

不久前,Google剛剛釋出了一種名為RAISR(Rapid and Accurate Super Image Resolution,意為“快速、精確的超級影象解析度技術”)的影象壓縮技術,旨在儲存寶貴的資料,而不犧牲照片質量;並在頻寬受限的移動裝置上提供清晰銳利的影象。

Google聲稱,該技術可以降低高達75%的頻寬,RAISR分析同一影象的低解析度和高解析度版本,瞭解到高解析度版本出眾的原因,然後在低解析度版本模擬出來。實際上就是使用機器學習建立一個類似Instagram的過濾器,欺騙你的眼睛,讓你相信低解析度與高解析度影象是一致的。

看到這個技術,想測試一下,順便看一下演算法原理,剛好網上有一些相關的程式碼,主要參考程式碼如下:https://github.com/MKFMIKU/RAISR

仔細看了下演算法的原理,才發現這個演算法的壓縮機制主要包括兩個部分:

(1)先建立一個低解析度的圖片,儲存在hashtable中。

(2)在高低解析度的成對圖片中學習,即先對低解析度圖片應用低功耗的的升取樣,然後在升取樣圖片和高解析度圖片的組合中學習過濾器。

如下這段核心程式碼可以看到:

mat = cv2.imread("./train/alp2.jpg")
h = np.load("lowR2.npy")

mat = cv2.cvtColor(mat, cv2.COLOR_BGR2YCrCb)[:,:,2]


# 升取樣
LR = cv2.resize(mat,(0,0),fx=2,fy=2)

LRDirect = np.zeros((LR.shape[0],LR.shape[1]))
for xP in range(5,LR.shape[0]-6):
    for yP in range(5,LR.shape[1]-6):
        patch = LR[xP-5:xP+6,yP-5:yP+6]

       # 之前儲存的方向強度等屬性資訊
        [angle,strenth,coherence] = hashTable(patch,Qangle,Qstrenth,Qcoherence)
        j = angle*9+strenth*3+coherence
        A = patch.reshape(1,-1)
        t = xP%2*2+yP%2

# 過濾器
        hh = np.matrix(h[j,t])
        LRDirect[xP][yP] = hh*A.T

  從上面可以看出,RAISR 的過濾器都是根據影象的邊緣特徵訓練的:亮度和色彩梯度、平實和紋理區域等。這又受到方向(direction,邊緣角度)、強度(strength,更銳利的邊緣強度更高)和黏性(coherence,一項量化邊緣方向性的指標)的影響。

由於本人的測試環境為:python3.6,而示例程式中有一些地方的指令碼語言應該是在2.7環境下編譯的,因此需要對上述程式碼中進行相應的修訂,主要是:

from scipy.sparse.linalg import cg

這個呼叫需要更加顯性。

剩下的相關修改地方已經提交在github程式中:https://github.com/ndscigdata/RAISR/tree/master

測試效果如下所示:



相關推薦

google影象壓縮技術RAISR測試

不久前,Google剛剛釋出了一種名為RAISR(Rapid and Accurate Super Image Resolution,意為“快速、精確的超級影象解析度技術”)的影象壓縮技術,旨在儲存寶貴的資料,而不犧牲照片質量;並在頻寬受限的移動裝置上提供清晰銳利的影象

[AI 技術文章之其三] 基於神經網路的影象壓縮技術

前言 這兩個月真是突如其來的清閒……偶爾分配來個 Bug,但經常就很快搞定了。跟組長討論了一下程式碼結構優化方面的問題,把之前加入的一套業務邏輯做了整體優化,然後又陷入 “閒” 者模式。 剩下的大多時間都是在學習學習,熟悉熟悉專案原始碼。現在主要在搞 MTK

數據庫壓縮技術探索

實踐 占用 開始 trac 簡單介紹 找到 不必要 哲學 詳細 作為數據庫,在系統資源(CPU、內存、SSD、磁盤等)一定的前提下,我們希望: 存儲的數據更多:采用壓縮,這個世界上有各種各樣的壓縮算法; 訪問的速度更快:更快的壓縮(寫)/解壓(讀)算法、更大的緩存。 幾

P1319 壓縮技術

amp break for sin can algorithm clu %d 一行 題目描述 設某漢字由N X N的0和1的點陣圖案組成,如下圖。我們依照以下規則生成壓縮碼。連續一組數值:從漢字點陣圖案的第一行第一個符號開始計算,按書寫順序從上到下,由左到右。第一個數表示連

為什麽有人討厭GOOGLELOGO

什麽 blank get 為什麽 google ongl http list com %E9%81%93%E5%BE%B7%E8%BE%A9%E8%AE%BA%E7%A8%8B%E5%BA%8F%E5%91%98%E7%94%A8%E8%84%9A%E6%9C%AC%E4%

高級軟件測試技術測試管理工具實踐day3)

由於 其他 將他 一個 png 安裝 模塊 了解 com 昨天在晚上由於安裝bugzilla中有一些小問題,並且需要手工安裝很多perl模塊 ppm install XXX(模塊名稱)。一直到過了十二點就沒有繼續更博了。所以由今天更。 繼昨天的安裝問題之後終於安裝

高級軟件測試技術測試管理工具實踐day4)

所有 作業 指導 基本使用 管理 完成 視頻 bugzilla 軟件測試技術 今天是截止日期,有胡俊輝的指導下小組成員都了解使用了Bugzilla的基本使用。大家都在晚上之前把各自的文檔匯總給汪鴻,由他撰寫了操作手冊。並且在下午楊瑞豐完成了視頻的錄制工作。但

淺談存儲重刪壓縮技術(一)

emc 將他 壓力測試 處理方式 比對 公眾號 center str 今天 淺談重刪壓縮技術(一) <喜歡更多內容可以關註微信公眾號“圍爐煮酒論IT”>作為一個做企業存儲市場的存儲人,最近兩年我不斷被重刪壓縮撩撥著。對於重刪壓縮這個技術的好壞,真實需求還是偽需求

《矽谷》裏神乎其神的壓縮技術,AI正在一點點做出來

效果 通過 imp 清晰度 文檔 另一個 alt 進步 改版 好劇總是追的特別快,比如說我們熟悉的黃暴神劇《矽谷》,今年該迎來第五季了。這部劇裏讓人印象深刻的東西很多,而劇裏幾個主角發明的創業神器、號稱能改變世界命運的“魔笛手”絕對是其中之一。給沒看過這部劇的朋友介紹一下,

張詩明: Linux內核內存壓縮技術

lan linu log bcd post div lcd dsl jdwp nh南腔竿dv河懈障t1獵趴惺http://hy8gykdyyzm.wikidot.com/zp來唐霸5d婦稼帳dt鬃瓶壞http://wxzzyzjdhydz.wikidot.com/bn讜毀烏

Google開源的 RISC-V IP核: “BottleRocket”(https://cnrv.io)

-s git link ilog 配置 三級 ttl github 非官方 BottleRocket是RISCV RV32IMC的實現。 Google在2017年11月29日在Github上非官方開源了BottleRocket的RTL代碼,同時表明這並不是一個官方支持的G

System.Web.Optimization 合並壓縮技術的使用

準備 img 改進 fma 路徑 appdata 難度 目錄名 文件的  捆綁和壓縮原理是:將多個css文件動態合並和壓縮為一個css文件、多個js文件動態合並和壓縮為一個js文件,如此達到減少瀏覽器對服務器資源文件的請求數量、縮小資源文件的尺寸來提高頁面反應速度的目的。A

騰訊技術分享:GIF動圖技術詳解及手機QQ動態表情壓縮技術實踐

表示 pack iii 技巧總結 fff 設備 思路 表情包 作用 本文來自騰訊前端開發工程師“ wendygogogo”的技術分享,作者自評:“在Web前端摸爬滾打的碼農一枚,對技術充滿熱情的菜鳥,致力為手Q的建設添磚加瓦。” 1、GIF格式的歷史 GIF ( Graph

關於資料庫壓縮技術

壓縮功能幾乎是當前主流資料庫的標配功能,除了能夠節省儲存空間外,在IO密集型的系統中, 可能也會帶來效能的提升。由於我們的儲存引擎也需要做記錄級壓縮的功能,所以很長的一段時間都在研究資料庫壓縮的技術,包括演算法的選型及優化,當然這之前要對現有主流資料庫的壓縮功能做一些調研。 資料的來源比較分散,有手

JDK1.7特性(經過本人測試的結果)

網上有很多關於jdk版本的部落格, 我從中選取了一些進行了驗證,發現很多錯誤並作出了修改.  對集合類的語言支援; (經過will我的實踐,這是一個假訊息!) 自動資源管理; 改進的通用例項建立型別推斷;   數字字面量下劃線支援;&n

影象語義分割技術

https://www.leiphone.com/news/201705/YbRHBVIjhqVBP0X5.html 大多數人接觸 “語義” 都是在和文字相關的領域,或語音識別,期望機器能夠識別你發出去的訊息或簡短的語音,然後給予你適當的反饋和回覆。嗯,看到這裡你應該已經猜到了,影象領域也是存

基於深度學習的影象語義分割技術概述之4常用方法 5.4未來研究方向

https://blog.csdn.net/u014593748/article/details/72794459 本文為論文閱讀筆記,不當之處,敬請指正。 A Review on Deep Learning Techniques Applied to Semantic Segmen

Google開源AI模型,語音區分準確率92%創新高 | 論文+GitHub

雷剛 發自 凹非寺 量子位 報道 | 公眾號 QbitAI 一個AI音箱,認得每一個說話的物件。 所謂“千人千面”,此之謂也。小孩說話,它就依照小孩的喜好和模式,老人票友,它的智慧推薦也相應變化…… 總之一個音箱,對每一個跟他說話的人,都能分辨清楚——對人類再正常不

Atitit 文件資料的摘要與壓縮技術總結abstract tech v4 目錄 1. 概念包含了原文字中的重要資訊,其長度不超過或遠少於原文字的一半” 1 2. 1. 摘要的作用 應用場景 1 2

Atitit 文件資料的摘要與壓縮技術總結abstract tech v4   目錄 1. 概念包含了原文字中的重要資訊,其長度不超過或遠少於原文字的一半” 1 2. 1. 摘要的作用 應用場景 1 2.1. 如自動報告生成、新聞標題生成、搜尋結果預覽等。此外

一種的自動化 UI 測試解決方案 Airtest Project

今天分享一個自動化UI測試工具airtest——一款網易出品的基於影象識別面向遊UI測試的工具,也支援原生Android App基於元素識別的UI自動化測試。主要包含了三部分:Airtest IDE、Airtest(用截圖寫指令碼)和 Poco(用介面UI元素來寫指令碼)。 來自google的評價: