1. 程式人生 > >轉碼解密挖礦!顯示卡計算能力大對比

轉碼解密挖礦!顯示卡計算能力大對比

GPU通用計算髮展勢頭迅猛

    泡泡網顯示卡頻道8月27日 現在的顯示卡市場,同質化已經嚴重到了什麼地步呢?不僅僅是板卡廠商之間的顯示卡效能基本沒區別,而且同價位的N卡和A卡在不同遊戲中的表現也是難分勝負,讓遊戲玩家們難以抉擇。

不談遊戲!市售顯示卡通用計算能力

    於是NVIDIA和AMD的競爭開始逐漸淡化遊戲,而強調功能和應用,三屏、3D、PhysX、視訊等開始大行其道。不過這些功能都難以量化,隨著CUDA和Stream的飛速發展催生了OpenCL和DirectCompute通用計算標準,使得NVIDIA和AMD在另一條道路上展開了新的競賽——平行計算。

    近年來GPU已經在科學研究和超級計算領域取得突破性進展,隨著數百萬支援CUDA的GPU已經遍佈全球計算機,軟體開發人員、科學人士和研究人員正在利用CUDA探測到更多更廣的領域中,包括影象和視訊編輯、計算生物學和計算化學、流體力學模擬、CT影象重組、地震分析、光線追蹤以及其它更多。近年來超級計算機的突飛猛進很大程度上也是得益於強大的GPU加盟。

效能說話!市售顯示卡通用計算能力亂鬥

    對顯示卡感興趣的朋友都知道,通用計算之所以如此熱門,根本原因在於顯示卡核心GPU的多流處理器(相當於數百核心)架構:GPU強大的並行浮點運算能力是僅僅擁有個位數核心的中央處理器CPU無法望其項背的。而通用計算技術可以發揮GPU的長處,讓其電腦運算速度飆升,一些應用程式的速度可以提高數倍甚至數十倍,讓原來因為運算量巨大而不可完成的任務變得可行。

    而在家用、辦公電腦上,藉助GPU加速的軟體也越來越多,這些軟體有的可以用來轉碼,有的可以用來增強影象、視訊的畫質,有的可以將2D電影轉換成3D,有的還能智慧歸類和編輯照片……

AMD和NVIDIA通用計算解析

    跟以往的GPGPU概念不同的是,CUDA是一個完整的解決方案,包含了API、C編譯器等,能夠利用顯示卡核心的片內L1 Cache共享資料,使資料不必經過記憶體-視訊記憶體的反覆傳輸,shader之間甚至可以互相通訊,對資料的儲存也不再約束於以往GPGPU的紋理方式,存取更加靈活,可以充分利用stream out(流輸出)特性,最典型的例子就是PhysX物理加速特效。PhysX最早是Aegia公司推出的硬體級物理加速技術,NVIDIA將其收購之後便通過CUDA環境將PhysX軟體化,由顯示卡中的shader單元承擔物理加速特效的運算。

效能說話!市售顯示卡通用計算能力亂鬥

    對於Stream技術,AMD宣稱可讓顯示卡內數百個平行串流核心,為各種一般用途的應用帶來加速的效果,打造各種優異的平臺,並可大幅提升每瓦效能,而實現這一點的前提就依賴於AMD獨特的流處理器單元設計。

效能說話!市售顯示卡通用計算能力亂鬥

    GF100的512個CUDA核心都符合IEEE 754-2008浮點演算法(Cypress也是如此)和完整的32位整數演算法,而後者在過去只是模擬的,事實上僅能計算24-bit整數乘法;同時全面引入的還有積和熔加運算(Fused Multiply-Add/FMA)。此外雙精度浮點(FP64)效能大大提升,峰值執行率可以達到單精度浮點(FP32)的1/2,而過去只有1/8,AMD從R600開始到現在的Cypress核心都是1/5,沒有做任何變化。

蛋白質摺疊分散式計算:N卡優勢巨大

    其實業界第一款GPU通用計算軟體就是使用者科學計算,它就是由斯坦福大學主導的Folding @ Home分散式計算,最早支援ATI顯示卡,而NVIDIA後來者居上,目前N卡所貢獻的運算能力已經超越了所有CPU之和,A卡也不弱!

效能說話!市售顯示卡通用計算能力亂鬥

   [email protected]是一個研究蛋白質摺疊、誤折、聚合及由此引起的相關疾病的分散式計算工程。最開始[email protected]僅支援CPU,後來加入了對PS3遊戲機的支援,但同樣是使用內建的CELL處理器做運算。[email protected]因ATI的加入為GPU計算翻開了新的一頁,如今[email protected]第二代GPU客戶端已經能夠支援ATI和NVIDIA的全系列DX10 11 GPU

效能說話!市售顯示卡通用計算能力亂鬥

    針對Fermi核心的平衡運算優勢,《[email protected]》最新版本GPU3,專為新一代Fermi系列顯示卡而設,進一步善用Fermi核心架構之優勢。

效能說話!市售顯示卡通用計算能力亂鬥

    據官方介紹,新版的蛋白質摺疊運算速度及穩定性已經大幅提高,而且加入更加科學計算專案,希望能籍Fermi核心的架構優勢,加快《[email protected]》內的各項複雜運算。Shader的頻率對影響運算效能非常大,所以NVIDIA可以領先AMD很多。

GPU暴力破解密碼:A卡遙遙領先

    遺失密碼是一件令人相當煩惱的事,尤其因忘記工作文件密碼所做造成的金錢損失更是十分“杯具”,如何快捷高效地找回密碼是件難事。現行GPU的發展越來越強勢,通用執行能力已經遠超於CPU,而CPU的執行能力卻是有限的,所以能夠發揮出GPU強大的通用運算能力定必會大大縮短破解密碼的時間。

    GPU就是顯示卡的“心臟”,也就相當於CPU在電腦中的作用,它決定了該顯示卡的檔次和大部分效能外,還有著大規模的平行計算能力,可以讓開發人員領先出引人入用的消費級和專業級的計算應用程式。無論是NVIDIA的CUDA或者是AMD的Stream運算,都是眾多軟體廠商所追捧的。

效能說話!市售顯示卡通用計算能力亂鬥

    我們找來了Elcomsoft出品的ADVanced Office Password Recovery,是一款同時支援CPU與GPU的Office密碼恢復軟體。最多可支援32個CPU或核心和8個GPU同樣執行,也可以指定全部或者是部分CPU/GPU核心進行恢復密碼的工作。

    測試中我們關閉所有CPU核心,完全由GPU獨立工作來破解一個由6位數字加密的Word檔案。

效能說話!市售顯示卡通用計算能力亂鬥

效能說話!市售顯示卡通用計算能力亂鬥

    密碼破解對於流處理器數量非常敏感。AMD的GPU由於SIMD架構的龐大流處理器優勢遙遙領先於NVIDIA GPU。

高清視訊轉碼:N卡略快於A卡

    Cyberlink(訊連科技)旗下大名鼎鼎PowerDVD相信大家都非常熟悉,作為一家專注視訊與多媒體的軟體開發商,Cyberlink不久前推出了一款專業的快速視訊轉換軟體——MediaShow Espresso,需要注意的是MediaShow(魅力四射)是一款視訊編輯軟體,而MediaShow Espresso才是視訊轉換軟體。

效能說話!市售顯示卡通用計算能力亂鬥

    現在編碼解碼軟體滿天飛,但是MediaShow Espresso卻有它的獨到之處。它是第一款同時支援CUDA與Stream加速的視訊轉換軟體,除此之外它還對IntelCorei7處理器的超執行緒及SSE4指令集做了優化,因此無論純CPU轉碼還是GPU加速,其速度比傳統軟體都要快。

    測試視訊檔案為長度為3分42秒位元速率22M的H.264編碼的M2TS檔案。測試中我們開啟GPU解碼與GPU編碼選項,將編解碼工作交由GPU來完成。

效能說話!市售顯示卡通用計算能力亂鬥

    可以看出,GPU視訊轉碼時,CPU和GPU都要參加計算,而且GPU不需要盡全力,所以高階GPU和中端GPU的效能是差不多的。總體來看N卡的CUDA效能要優於A卡的Stream效能。

    值得注意的是,本次測試使用的是同時支援CUDA和Stream的MediaShow Espresso進行測試,如果使用僅支援CUDA的MediaCoder軟體的話,N卡的視訊轉碼速度還能更快,這方面A卡無論效能還是軟體支援度都不如N卡。

DirectCompute理論效能:A卡略佔優勢

    ComputeMark由捷克硬體和遊戲網站CzechGamer.com的Robert Varga開發製作,引擎是基於Jan Vlietinck的Fluid3D Demo。軟體能夠使顯示卡佔用率達到99%,而CPU佔用率僅0-1%,避免由CPU效能造成對測試成績的影響。同時該軟體還有功耗測量的功能,測試時間可以隨意設定。

效能說話!市售顯示卡通用計算能力亂鬥

    ComputeMark需要在純DX11環境下執行,包括Windows 7 32/64位作業系統、DX11 API和DX11顯示卡。

效能說話!市售顯示卡通用計算能力亂鬥

    最終結果很和諧,雖然A卡的理論浮點運算能力很高,但在DirectCompute理論測試當中,同級別的A卡並不比N卡高多少。因為DirectCompute現階段主要還是在遊戲當中使用,因此意義不是很大。

Bitcoin挖礦效能測試:A卡絕對優勢

    如果您還不瞭解比特幣的話,不妨看看前不久我們的評測文章《掛機也能賺錢?教你用顯示卡挖礦賺美元》。這裡就直接引用測試資料:

效能說話!市售顯示卡通用計算能力亂鬥

    下面筆者做個簡要分析:

1. HD6990擁有兩顆GPU,核心頻率與單核心的HD6970完全相同,所以挖礦效能正好翻倍。事實上HD6990就是需要開兩個挖掘器分配給兩顆GPU一起計算。
2. AMD上代HD5870流處理器稍多於HD6970,但核心頻率稍低,最終兩代旗艦單卡的挖礦效能差不多。要知道VLIW4架構的HD6970遊戲效能要強於VLIW5架構的HD5870,但挖礦效能似乎只取決於理論浮點運算能力,跟架構和效率毫無關係。
3. Barts核心的HD6790擁有256Bit視訊記憶體位寬,比128Bit的HD6770大一倍。但兩者的挖礦效能完全相同,所以視訊記憶體位寬頻率對效能沒有任何影響,影響效能的唯一因素就是流處理器數量及頻率。
4. NV頂級單卡GTX580還不如HD6750,但要比CPU強很多,畢竟它也有數百顆核心。

    那為什麼A卡和N卡的差距如此之大呢?比特幣挖掘器採用的是SHA-256,這是由美國國家安全域性發明的一種安全雜湊函式,一般用於密碼加密與解密。這種演算法會進行大量32位整數迴圈右移運算,這個操作在AMD GPU那裡可以通過單一硬體指令實現,而在NVIDIA GPU那裡需要三次硬體指令來模擬(2移+1加),僅這一條就為AMD帶來額外的1.7倍運算效率優勢(大約1900指令來執行SHA-256壓縮操作,而不是NVIDIA的大約3250指令)。

    如此一來,AMD較高的浮點運算能力再加上演算法效率優勢,AMD GPU在密碼破解與比特幣挖掘時的效能,大概是NVIDIA GPU的3倍以上!

總結:GPU的未來不是遊戲而是計算

    通過前面幾項不同型別的通用計算應用來看,A卡和N卡之間的效能差距是相當大的,而且動不動就是幾倍以上的差距。A卡恐怖的理論效能有時候確實有效果,但有時候還是要大幅落後於N卡,這與雙方在3D遊戲中和諧愉快的表現截然相反!

    這種奇怪的現象,一方面是由雙方截然不同的架構所造成的,另一方面是不同應用的演算法不同,可能會比較“偏愛”某一種架構。最終,就要看誰在軟體優化方面做得好,誰就能勝出。目前來看CUDA還是佔有明顯的上風,已經有很多超級計算機配備了NVIDIA Tesla加速卡,CUDA的應用軟體還是要比Stream多很多的。

效能說話!市售顯示卡通用計算能力亂鬥

    不管CUDA和Stream孰強孰弱,OpenCL和DirectCompute標準誰能笑到最後,GPU的地位顯然在迅速攀升。超級計算機想要在效能上取得突破,使用GPU+CPU的異構架構是唯一選擇,未來高效能運算已經離不開GPU的支援了。

    NVIDIA和ATI從3D遊戲戰場打到了通用平行計算領域,到底誰能笑到最後現在還是個未知數。

效能說話!市售顯示卡通用計算能力亂鬥

    對於普通使用者來說,顯示卡已經不再是一塊單純的3D遊戲加速卡,以視訊應用為代表的高效能運算軟體率先步入GPU通用計算的大門,未來將會有更多計算軟體使用GPU強大的運算能力來加速,CPU和GPU的地位將變得同等重要。現在,玩家們因一兩款特別喜愛的遊戲而升級顯示卡;將來,或許很多不玩遊戲的人,也會加入到獨立顯示卡的行列!■

相關推薦

解密顯示計算能力對比

GPU通用計算髮展勢頭迅猛     泡泡網顯示卡頻道8月27日 現在的顯示卡市場,同質化已經嚴重到了什麼地步呢?不僅僅是板卡廠商之間的顯示卡效能基本沒區別,而且同價位的N卡和A卡在不同遊戲中的表現也是難分勝負,讓遊戲玩家們難以抉擇。     於是NVIDIA和

解密 顯示計算能力對比

                GPU通用計算髮展勢頭迅猛    泡泡網顯示卡頻道8月27日 現在的顯示卡市場,同質化已經嚴重到了什麼地步呢?不僅僅是板卡廠商之間的顯示卡效能基本沒區別,而且同價位的N卡和A卡在不同遊戲中的表現也是難分勝負,讓遊戲玩家們難以抉擇。    於是NVIDIA和AMD的競爭開始逐漸淡

金鎬系統ETHOS系統顯示超頻教程

        我們知道,用顯示卡礦機挖礦,不論是A卡還是N卡,顯示卡都是工作在超頻狀態下的,今天就談談金鎬系統ETHOS如何適當設定顯示卡超頻引數,讓你的顯示卡工作在最佳狀態。         我們知道,A卡超頻都是通過修改顯示卡的BIOS後刷入超頻的,但是一般來說,修改

渡鴉幣-RVN,AA顯示、RVN軟體及錢包地址初學教程

渡鴉幣RVN採用X16R演算法,支援A卡和N卡挖礦。 RVN挖礦軟體T-Rex0.7.0版本更新,為CUDA 10和最新的Nvidia GPU架構提供更多的新能改進。新版本T-Rex 0.7.0帶有CUDA 10二進位制檔案,支援Nvidia Volta(Ti

Caffe的編譯(匹配顯示計算能力

環境:GTX1060(notebook) Ubuntu16.04-Desktop Anaconda3.0虛擬環境下的python2.7 CUDA8.0 CUDNN6.0 由於編譯安裝OpenCV 3比較複雜,直接使用sudo apt-get install libopencv-dev 安裝的

Mchain正式被Sinoc IPFS機廠商併購使用Sinoc品牌

Sinoc(mchain)如何購買實體礦機 在Mchain合約算力平臺滿一週年之際,我們迎來了Sinoc公司並購Mchain科研基金會的重大利好訊息,為了本次並購重組相關內容推進,Mchain合約算力平臺自亞太時間2018年9月15日0:00起正式切換為Sinoc礦機託管平

礦工必看的指南,五分鐘帶你熊市

就在前幾天CCTV再次報道區塊鏈,《比特幣“礦難”風暴,礦機量價齊跌九成,硬體市場“至暗時刻”》新聞。新聞中稱,大約有130萬臺某主流礦機在這一場比特幣暴跌的浪潮中關機,雜湊率也一再下降。 而且就在前幾天還出現了礦機按斤賣的熱搜新聞,是將區塊鏈再次推向了熱門,好多人都在問,都說區塊鏈是網際網路的第二次革

錯過了比特幣,還可以試試貢嘎GGA

區塊鏈的話題近年來一直很熱,當然最受關注的還是比特幣BTC和挖礦,關於內蒙等地區數萬臺比特幣礦機的造富故事也常被人提及。且不說2017年底一個比特幣的價格達到了2萬美元,就是當前的近七千美元的價格也是讓人驚詫不已。其實,在2009年比特幣剛剛出來的時候,並不值錢

以太坊難度炸彈是什麼?極大抑制礦工繼續以POW方式

以太坊的“難度炸彈”(“Difficulty Bomb”)指的是,在挖掘演算法中,使用以太幣在區塊鏈上對礦工進行獎勵的難度越來越大。隨著遊戲變得更加複雜(礦工發現以太幣難掙得多),在以太坊區塊鏈上塊的生產之間將會有相當長的時間差。這將以指數的方式放緩,其對礦商的吸引力也將下降。這個場景的開始被稱為“以太坊冰期

JavaScript(js) 前臺 引數傳遞亂碼 問題--已解決 中文字元亂碼

最多使用的應為encodeURIComponent,它是將中文、韓文等特殊字元轉換成utf-8格式的url編碼,所以如果給後臺傳遞引數需要使用encodeURIComponent時需要後臺解碼對utf-8支援(form中的編碼方式和當前頁面編碼方式相同) escape不編碼

[]Ubuntu系統中AMD/ATI顯示檢視溫度、頻率及超頻

轉自:http://blog.sina.com.cn/s/blog_49cfe3f10100kfte.html首先要正確安裝AMD官方顯示卡驅動,推薦最新版本,驅動的安裝見:Ubuntu下AMD顯示卡驅動安裝方法 如果你想超頻,可以用以下命令進行設定,如果不超頻,下面幾個命令也很有用途, 命令使用:atico

聊聊區塊鏈,雖然我不

​ 封面 摩爾定律說硬體18月會效能翻一番,還有不知道哪個大拿說軟體技術也會4年一個革命,也就是讓大家活到老學到唄,作為一個技術型的產品經理,為了不落後,也抽了點時間研究一下區塊鏈的相關知識,這裡寫一點的區塊鏈的見解,歡迎討論,文末有相關書籍和資料推薦,請擴充套件閱讀。 說到區塊鏈,大家就會聯想到一些概念

NVIDIA GPUs Compute Capability 英偉達顯示計算力簡介及cuda支援顯示連結

深度學習中我們對GPU的計算能力一般是要求大於5.0,具體情況具體分析,低於5.0也並非一定不可以。 那為啥不用CPU?CPU只能一個一個按照順序進行運算,GPU可以利用多個CUDA核心並行進行運算,GPU的浮點算力比CPU更強,另外計算速度的標準是TFLOPS(每秒萬億次

h5三公源一條龍別人在忙,阿裏工程師卻悄悄用區塊鏈搞了件大事

遍布 加密算法 算法 展望 運行 網絡 工程 要求 區塊 阿裏妹導讀:h5三公源碼一條龍(h5.hxforum.com)企鵝2952777280 源碼出售 房卡出售 後臺出租當阿裏技術遇見區塊鏈,會碰撞出什麽火花呢?天貓進出口技術團隊運用區塊鏈技術,讓每一個進口商品都有了唯

以太坊(ETH)顯示教程總結,新手教程,有圖有真相

以太幣(ETH)是以太坊(Ethereum)的一種數字代幣,被視為"比特幣2.0版",採用與比特幣不同的區塊鏈技術"以太坊"(Ethereum),開發者們需要支付以太幣(ETH)來支撐應用的執行。和其他數字貨幣一樣,可以在交易平臺上進行買賣。 以太坊ETH採用Ethash(Dagger-Ha

渡鴉幣(RVN)顯示教程&軟體下載

渡鴉幣RVN 顯示卡挖礦教程 渡鴉幣RVN採用X16演算法,RVN使用顯示卡挖礦,A卡和N卡都可以。 一、獲取錢包地址: 以下方式均可: ●錢包下載地址: ●各大交易所充值: QBTC網 (推薦使用,支援中文,註冊後進入“資產”頁面,搜尋RVN,獲取錢包地

Bminer首次支援A,本次支援Beam的AMD顯示

Bminer於北京時間01-09日釋出11.4.0  試驗性支援AMD挖Beam 這是Bminer首次支援AMD卡功能。期待各位使用者反饋。 Beam挖礦教程: 下方是用Bminer挖Beam的步驟,您需要在案例的基礎上,對下面的欄位做出調整: 用您的錢

手把手教你玩12306驗證的秘密

這樣的 隨機數 結構 實現 把手 session 劃分 技術交流 簡單的 12306相信對很多小夥伴都不陌生,假如問你對這個網站的印象的時候,你不是會立即想起那個坑爹的驗證碼,而正是這個驗證碼,也一時間成為小夥伴們討論的話題,今天思夢PHP就給大家帶來他的實現辦法,純屬技術

網易星球手機,仿公信寶不要太明顯偽區塊鏈搜集用戶隱私?

加速 信用 信息 是什麽 復制。 必須 需求 進入 基於 昨天,網易上線了一款名為“星球”的區塊鏈產品,目前正在內測中,內測期間,用戶需要通過老用戶邀請方能註冊,新用戶註冊後可領取數字資產“黑鉆”。 看下面的文字之前,建議先看關於公信寶的稿子。標題為《公信寶PK李笑來Can

以太坊源機制:

date 問題 pem 廣播 tty hand 同時 就會 upd 狗年吉祥,開工利是,我們繼續研究以太坊源碼。從本篇文章開始,我們會深入到以太坊核心源碼中去,進而分析與研究以太坊的核心技術。 關鍵字:拜占庭,挖礦,礦工,分叉,源碼分析,uncle叔塊,agent,w