google影象新壓縮技術RAISR的測試
不久前,Google剛剛釋出了一種名為RAISR(Rapid and Accurate Super Image Resolution,意為“快速、精確的超級影象解析度技術”)的影象壓縮技術,旨在儲存寶貴的資料,而不犧牲照片質量;並在頻寬受限的移動裝置上提供清晰銳利的影象。
Google聲稱,該技術可以降低高達75%的頻寬,RAISR分析同一影象的低解析度和高解析度版本,瞭解到高解析度版本出眾的原因,然後在低解析度版本模擬出來。實際上就是使用機器學習建立一個類似Instagram的過濾器,欺騙你的眼睛,讓你相信低解析度與高解析度影象是一致的。
看到這個技術,想測試一下,順便看一下演算法原理,剛好網上有一些相關的程式碼,主要參考程式碼如下:https://github.com/MKFMIKU/RAISR
仔細看了下演算法的原理,才發現這個演算法的壓縮機制主要包括兩個部分:
(1)先建立一個低解析度的圖片,儲存在hashtable中。
(2)在高低解析度的成對圖片中學習,即先對低解析度圖片應用低功耗的的升取樣,然後在升取樣圖片和高解析度圖片的組合中學習過濾器。
如下這段核心程式碼可以看到:
mat = cv2.imread("./train/alp2.jpg")
h = np.load("lowR2.npy")
mat = cv2.cvtColor(mat, cv2.COLOR_BGR2YCrCb)[:,:,2]
# 升取樣
LR = cv2.resize(mat,(0,0),fx=2,fy=2)
LRDirect = np.zeros((LR.shape[0],LR.shape[1]))
for xP in range(5,LR.shape[0]-6):
for yP in range(5,LR.shape[1]-6):
patch = LR[xP-5:xP+6,yP-5:yP+6]
# 之前儲存的方向強度等屬性資訊
[angle,strenth,coherence] = hashTable(patch,Qangle,Qstrenth,Qcoherence)
j = angle*9+strenth*3+coherence
A = patch.reshape(1,-1)
t = xP%2*2+yP%2
# 過濾器
hh = np.matrix(h[j,t])
LRDirect[xP][yP] = hh*A.T
從上面可以看出,RAISR 的過濾器都是根據影象的邊緣特徵訓練的:亮度和色彩梯度、平實和紋理區域等。這又受到方向(direction,邊緣角度)、強度(strength,更銳利的邊緣強度更高)和黏性(coherence,一項量化邊緣方向性的指標)的影響。
由於本人的測試環境為:python3.6,而示例程式中有一些地方的指令碼語言應該是在2.7環境下編譯的,因此需要對上述程式碼中進行相應的修訂,主要是:
from scipy.sparse.linalg import cg
這個呼叫需要更加顯性。
剩下的相關修改地方已經提交在github程式中:https://github.com/ndscigdata/RAISR/tree/master
測試效果如下所示:
相關推薦
google影象新壓縮技術RAISR的測試
不久前,Google剛剛釋出了一種名為RAISR(Rapid and Accurate Super Image Resolution,意為“快速、精確的超級影象解析度技術”)的影象壓縮技術,旨在儲存寶貴的資料,而不犧牲照片質量;並在頻寬受限的移動裝置上提供清晰銳利的影象
[AI 技術文章之其三] 基於神經網路的影象壓縮技術
前言 這兩個月真是突如其來的清閒……偶爾分配來個 Bug,但經常就很快搞定了。跟組長討論了一下程式碼結構優化方面的問題,把之前加入的一套業務邏輯做了整體優化,然後又陷入 “閒” 者模式。 剩下的大多時間都是在學習學習,熟悉熟悉專案原始碼。現在主要在搞 MTK
數據庫壓縮技術探索
實踐 占用 開始 trac 簡單介紹 找到 不必要 哲學 詳細 作為數據庫,在系統資源(CPU、內存、SSD、磁盤等)一定的前提下,我們希望: 存儲的數據更多:采用壓縮,這個世界上有各種各樣的壓縮算法; 訪問的速度更快:更快的壓縮(寫)/解壓(讀)算法、更大的緩存。 幾
P1319 壓縮技術
amp break for sin can algorithm clu %d 一行 題目描述 設某漢字由N X N的0和1的點陣圖案組成,如下圖。我們依照以下規則生成壓縮碼。連續一組數值:從漢字點陣圖案的第一行第一個符號開始計算,按書寫順序從上到下,由左到右。第一個數表示連
為什麽有人討厭GOOGLE的新LOGO
什麽 blank get 為什麽 google ongl http list com %E9%81%93%E5%BE%B7%E8%BE%A9%E8%AE%BA%E7%A8%8B%E5%BA%8F%E5%91%98%E7%94%A8%E8%84%9A%E6%9C%AC%E4%
高級軟件測試技術(測試管理工具實踐day3)
由於 其他 將他 一個 png 安裝 模塊 了解 com 昨天在晚上由於安裝bugzilla中有一些小問題,並且需要手工安裝很多perl模塊 ppm install XXX(模塊名稱)。一直到過了十二點就沒有繼續更博了。所以由今天更。 繼昨天的安裝問題之後終於安裝
高級軟件測試技術(測試管理工具實踐day4)
所有 作業 指導 基本使用 管理 完成 視頻 bugzilla 軟件測試技術 今天是截止日期,有胡俊輝的指導下小組成員都了解使用了Bugzilla的基本使用。大家都在晚上之前把各自的文檔匯總給汪鴻,由他撰寫了操作手冊。並且在下午楊瑞豐完成了視頻的錄制工作。但
淺談存儲重刪壓縮技術(一)
emc 將他 壓力測試 處理方式 比對 公眾號 center str 今天 淺談重刪壓縮技術(一) <喜歡更多內容可以關註微信公眾號“圍爐煮酒論IT”>作為一個做企業存儲市場的存儲人,最近兩年我不斷被重刪壓縮撩撥著。對於重刪壓縮這個技術的好壞,真實需求還是偽需求
《矽谷》裏神乎其神的壓縮技術,AI正在一點點做出來
效果 通過 imp 清晰度 文檔 另一個 alt 進步 改版 好劇總是追的特別快,比如說我們熟悉的黃暴神劇《矽谷》,今年該迎來第五季了。這部劇裏讓人印象深刻的東西很多,而劇裏幾個主角發明的創業神器、號稱能改變世界命運的“魔笛手”絕對是其中之一。給沒看過這部劇的朋友介紹一下,
張詩明: Linux內核內存壓縮技術
lan linu log bcd post div lcd dsl jdwp nh南腔竿dv河懈障t1獵趴惺http://hy8gykdyyzm.wikidot.com/zp來唐霸5d婦稼帳dt鬃瓶壞http://wxzzyzjdhydz.wikidot.com/bn讜毀烏
Google開源新的 RISC-V IP核: “BottleRocket”(https://cnrv.io)
-s git link ilog 配置 三級 ttl github 非官方 BottleRocket是RISCV RV32IMC的實現。 Google在2017年11月29日在Github上非官方開源了BottleRocket的RTL代碼,同時表明這並不是一個官方支持的G
System.Web.Optimization 合並壓縮技術的使用
準備 img 改進 fma 路徑 appdata 難度 目錄名 文件的 捆綁和壓縮原理是:將多個css文件動態合並和壓縮為一個css文件、多個js文件動態合並和壓縮為一個js文件,如此達到減少瀏覽器對服務器資源文件的請求數量、縮小資源文件的尺寸來提高頁面反應速度的目的。A
騰訊技術分享:GIF動圖技術詳解及手機QQ動態表情壓縮技術實踐
表示 pack iii 技巧總結 fff 設備 思路 表情包 作用 本文來自騰訊前端開發工程師“ wendygogogo”的技術分享,作者自評:“在Web前端摸爬滾打的碼農一枚,對技術充滿熱情的菜鳥,致力為手Q的建設添磚加瓦。” 1、GIF格式的歷史 GIF ( Graph
關於資料庫壓縮技術
壓縮功能幾乎是當前主流資料庫的標配功能,除了能夠節省儲存空間外,在IO密集型的系統中, 可能也會帶來效能的提升。由於我們的儲存引擎也需要做記錄級壓縮的功能,所以很長的一段時間都在研究資料庫壓縮的技術,包括演算法的選型及優化,當然這之前要對現有主流資料庫的壓縮功能做一些調研。 資料的來源比較分散,有手
JDK1.7新特性(經過本人測試的結果)
網上有很多關於jdk版本的部落格, 我從中選取了一些進行了驗證,發現很多錯誤並作出了修改. 對集合類的語言支援; (經過will我的實踐,這是一個假訊息!) 自動資源管理; 改進的通用例項建立型別推斷; 數字字面量下劃線支援;&n
影象語義分割技術
https://www.leiphone.com/news/201705/YbRHBVIjhqVBP0X5.html 大多數人接觸 “語義” 都是在和文字相關的領域,或語音識別,期望機器能夠識別你發出去的訊息或簡短的語音,然後給予你適當的反饋和回覆。嗯,看到這裡你應該已經猜到了,影象領域也是存
基於深度學習的影象語義分割技術概述之4常用方法 5.4未來研究方向
https://blog.csdn.net/u014593748/article/details/72794459 本文為論文閱讀筆記,不當之處,敬請指正。 A Review on Deep Learning Techniques Applied to Semantic Segmen
Google開源新AI模型,語音區分準確率92%創新高 | 論文+GitHub
雷剛 發自 凹非寺 量子位 報道 | 公眾號 QbitAI 一個AI音箱,認得每一個說話的物件。 所謂“千人千面”,此之謂也。小孩說話,它就依照小孩的喜好和模式,老人票友,它的智慧推薦也相應變化…… 總之一個音箱,對每一個跟他說話的人,都能分辨清楚——對人類再正常不
Atitit 文件資料的摘要與壓縮技術總結abstract tech v4 目錄 1. 概念包含了原文字中的重要資訊,其長度不超過或遠少於原文字的一半” 1 2. 1. 摘要的作用 應用場景 1 2
Atitit 文件資料的摘要與壓縮技術總結abstract tech v4 目錄 1. 概念包含了原文字中的重要資訊,其長度不超過或遠少於原文字的一半” 1 2. 1. 摘要的作用 應用場景 1 2.1. 如自動報告生成、新聞標題生成、搜尋結果預覽等。此外
一種新的自動化 UI 測試解決方案 Airtest Project
今天分享一個自動化UI測試工具airtest——一款網易出品的基於影象識別面向遊UI測試的工具,也支援原生Android App基於元素識別的UI自動化測試。主要包含了三部分:Airtest IDE、Airtest(用截圖寫指令碼)和 Poco(用介面UI元素來寫指令碼)。 來自google的評價: