1. 程式人生 > >不可不看!真正專業顯示卡技術分析評測

不可不看!真正專業顯示卡技術分析評測

                 近年來圖形卡產品有了爆炸式的增長,專業圖形卡產品和娛樂圖形卡產品的界限越來越模糊。許多DIYer通過RivaTuner等工具輕易的修改Geforce為Quadro、修改Radeon為FireGL。但是這樣的修改並沒有使得專業圖形卡的價格有所下降,專業圖形卡的價格依然幾倍於娛樂圖形卡。即便是Quadro和Geforce有如此親近的血緣關係,兩者的價格依然是天淵之別。  有DIYer認為將Geforce通過各種軟體修改為Quadro就能得到一張專業的圖形卡,這張修改來的圖形卡在OpenGL方面的表現的確有了明顯的提升。但這就是專用圖形卡的全部嗎?答案絕對是否定的。要弄清楚專業圖形卡和娛樂圖形卡的區別,我們首先需要了解專業圖形卡究竟能幹些什麼事情。  還有人認為如果擁有一片專業圖形卡,那在執行3ds Max、Maya、Softimage XSI等DCC類軟體時的速度將會大大提升、最終渲染時間也將極大縮短。但是當他們花了幾萬元買來一片專業圖形卡的時候,他們會發現這些軟體的最終渲染時間並沒有減少。事實上現階段專業圖形卡最大的作用依然是加快DCC類軟體的創作速度——無論是Quadro還是Wildcat,他們都著重於加速Maya、Softimage XSI等軟體在建模、貼圖、光照時候的視口工作區(Viewport)預覽速度。面對複雜的場景時,往往拖動一下滑鼠、畫一條直線都需要系統耗費大量時間來重新繪製預覽工作區,這樣整個創作過程就會變得極端低效。一旦你有了這些專業圖形卡,再次打開復雜的場景進行編輯修改時他們將會以實時的速度給你提供預覽,而不必冗長的等待。  既然專業圖形卡能加速DCC類軟體的預覽速度,為啥他們面對最終渲染時表現卻那麼強差人意呢?這個問題的答案正在不斷變化。2001年時,幾乎所有的好萊塢特效/3D製作室都認為對最終渲染進行硬體加速的結果將是災難性的。這是因為當時的專業圖形卡的可程式設計能力非常弱,渲染出來的結果往往和預計有著明顯的差異。而到了今天,在新一輪統計中眾多的好萊塢工作室越來越多的在某些場景中使用硬體加速渲染。這幾年來隨著GPU可程式設計能力的不斷提升,GPU終於也能渲染出和CPU軟體渲染媲美的最終效果了,而前者的速度卻是後者的幾百倍甚至上萬倍。
根據標準衛星資料繪製的視覺化模擬地圖
除了GPU可程式設計效能的提升外,各類3D軟體對於硬體的支援也越來越成熟。其中低端的3ds max在6.0內已經引入了DX9 Shader加速預覽Plug-in,到了3ds max7則將這個功能徹底加強。中端市場的Maya從5.0開始加入了對硬體加速預覽的支援,到了Maya 6.0時更是能夠提供多種硬體加速預覽、加速最終渲染的配置和方案。至於電影級3D軟體的王者Softimage XSI在3.0的時候對於硬體的支援已經非常領先了,在進化到4.0之後用硬體加速最終渲染的結果已經能和CPU Scanline軟體渲染相提並論。一旦OpenGL 2.0得到全面的應用,這些軟體對於硬體的支援將會更進一步。  GPU在進步、軟體在進步,但專業圖形卡在DCC類軟體中依然有著不可逾越的界限。熟悉3D DCC類軟體的朋友應該知道新版本的3D DCC軟體往往包含3種渲染技術,他們分別是最為古老的Scanline演算法(掃描線演算法)、Global Illumination(全域性照明,包含Ray Trace,光線追蹤演算法、Radiosity,光能傳遞或者叫做輻射度演算法)和最新引入的硬體渲染。事實上硬體渲染也是基於Scanline的。(下頁將會有關於這些名詞的解析)  然而,在日常應用中GI的優勢已經越來越明顯,許多設計師也更傾向於使用GI類渲染器來完成他們的工作。由於Ray Trace演算法和Radiosity演算法包含大量的有限元分析計算和迭代,傳統的GPU對此毫無辦法,更遑論加速了。直到現在,用GPU加速GI類計算依然處於實驗室階段。在今年的SIGGRAPH 05中德國Sarrland大學展示了能夠實時加速GI類計算的硬體SaarCOR的可執行版本。其相關論文在2002年SIGGRAPH會議上已經發表,由此可見開發難度。
由4個FPGA組成的SaarCOR系統(圖中尚有2個FPGA空位
由SaarCOR進行實時渲染的Quake3光線追蹤版引擎繪製的畫面(注意看水壺上的光線反射場景)
  不要以為專業圖形卡就只能畫畫3D圖形,事實上他們的用處遠遠超過你的想象。現代科學研究中根本無法離開專業圖形卡的幫助,專業圖形卡能夠對視覺化計算進行加速、能夠繪製衛星地圖、能夠繪製3D熱源分佈圖甚至是進行模擬裝配和流體力學計算。通過一定的演算法,專業圖形卡甚至還能加速聲音的視覺化處理(這也是General Purpose GPU專案的研究目標)。我們熟悉的美軍M1A1坦克、F22戰鬥機上就裝配有NVIDIA Quadro圖形晶片,配合Wind River實時作業系統進行衛星地圖的繪製和目標鎖定識別瞄準。
Quantum3D和美軍合作開發的地形匹配鎖定瞄準系統
熱成像渲染
  在前面介紹專業顯示卡時,提到了Global Illumination、Ray Tracing等專業名詞,下面就對它們的含義作一些簡單的解釋。  什麼是Global Illumination?
採用全域性照明渲染器繪製的3D圖片(請注意本文所有示例圖片都為直接渲染而成)
  Global Illumination(全域性照明)是一個和Local Illumination(區域性照明)相對的概念。絕大部分簡單的3D軟體都能提供Local Illumination的支援。但是Local Illumination在應用上有極大的侷限。Local Illumination只考慮光源對目標物體的改變,而不去考慮該光源對其他物件的影響。而在Global Illumination中光線對於目標物件以外的影響將會被同時計算。現代的全域性照明往往同時包含了光線追蹤渲染和輻射度渲染,渲染器用輻射度計算出全域性與檢視無關的照明方案,然後Ray tracing使用這個方案渲染跟檢視相關的影象並增加映象高光和反射。現階段應用最廣泛的Mental Ray、Final Render等渲染器都提供了對GI的支援。  什麼是Ray Tracing?
  我們將光源分成眾多的射線,然後再沿著視點和象素連線射出一條光線,之後根據材質的屬性計算出這些光線被物體吸收、折射、反射後最終回到視點中的數值變化,從而獲得一個正確光照場景。OpenGL ARB在2005年1月31日宣佈,已經有研究組織成功的在Geforce6800 GT GPU上通過Cg和OpenGL API實現硬體光線追蹤計算。
用OpenGL API在Geforce6800 GT上實現硬體Raytrace(按此下載該示例,需要Geforce6800 GT以上顯示卡)
2002年Graphics Hardware會議上北卡羅萊納大學發表的光線追蹤GPU構想
  什麼是Radiosity?
LightWave 8中Radiosity渲染器所渲染出的圖片
  Radiosity (輻射度渲染或光能傳遞) 演算法其本質就是將光看作是一種物理輻射,然後計算輻射的傳導就能獲得加之於每個物件物體上的光照強度,從而獲得正確的渲染結果。輻射度渲染通過制定在場景中光線的來源並且根據物體的位置和反射情況來計算從觀察者到光源的整個路徑上的光影效果。在這條線路上,光線受到不同物體的相互影響,如:反射、吸收、折射等情況都被計算在內。和其他渲染方法相比,Radiosity更接近於光的自然傳播原理,因而受到廣泛的歡迎。
單純採用Radiosity演算法進行的場景渲染
  10年前專業圖形卡市場被幾家公司牢牢佔據——3Dlabs、Evans & Sutherland、Quantum3D、Diamond。時過境遷,眾所周知Diamond已經在幾年前倒閉,旗下的FireGL圖形卡開發小組被賣給了ATi。3Dlabs被創新收購後一蹶不振,直到Wildcat Realizm系列圖形卡才挽回顏面。Evans & Sutherland、Quantum3D兩家則徹底退出專業圖形卡市場轉向視覺化模擬領域,Evans & Sutherland美國軍方開發了MCT系統對飛行員進行視覺化模擬培訓,Quantum3D則和NVIDIA合作為美國軍方開發了America Amry視覺化模擬訓練系統。除了美國軍方之外,這兩家視覺化模擬器產品也被眾多公司、機構所採用,兩家的產品幾乎壟斷了整個高階視覺化模擬器市場。
Quantum3D的IDX2000視覺化模擬器/center>  在讓我們看看3Dlabs。作為OpenGL的起草人之一,3Dlabs和SGI合力搭建了整個3D世界的基石。因此在很長一段時間內,3Dlabs的專業圖形卡有著極高的市場份額。與此同時3Dlabs的“半專業”圖形卡Premeida2在民用圖形卡市場獲得了不小的成功。可惜這次的成功使得3Dlabs開始狂妄了起來,Premedia3遲遲無法完成研發,周圍的對手卻在虎視耽耽,準備瓜分專業圖形卡市場。
E&S的飛行培訓視覺化模擬器
  NVIDIA Geforce256的誕生絕對是計算機圖形史劃時代的進步。T&L的引入一下子拉近了專業卡和民用卡之間的距離。以往專業卡上昂貴的獨立幾何處理單元被整合進了GPU內部,這樣民用圖形卡首次有了和專業圖形卡相提並論的機會。NVIDIA隨後夥同了ELSA共同推出了核心邏輯設計幾乎和Geforce256完全相同的Quadro256 GPU。NVIDIA Quadro的成功和曾經輝煌的ELSA密不可分。在Quadro以前ELSA已經在專業市場上佔據大量的份額,基於3Dlabs圖形晶片的ELSA GLoria系列圖形卡成為當時眾多DCC工作者夢寐以求的東西。
Quantum3D/NVIDIA和美國軍方聯手開發的戰地士兵訓練系統(也就是America Army遊戲的專業版)
  在Quadro之前,NVIDIA和ELSA試探性的推出基於RIVA TNT2的專業卡ELSA Synergy II圖形卡,該卡上市後成為當時價效比最高的產品。也為日後Quadro的成功打下了基礎。據稱當年ELSA的工程師們單就修改TNT2原始驅動中所存在的Bugs就多達3000多個,更不用說接下來的PCB重新設計及針對軟體的優化工作量了。NVIDIA推出Quadro大獲成功後不久,為了徹底完善專業圖形卡領域的驅動支援,將整個ELSA專業圖形卡驅動研發隊伍納入旗下,而ELSA在失去這支精銳隊伍之後開始一蹶不振。
第一片採用NVIDIA圖形晶片的專業圖形卡
  當時還有另外一家公司於ELSA旗鼓相當,那就是Diamond。和ELSA不同,Diamond的專業圖形卡從設計到驅動研發是由旗下一個獨立的工作組完成的,該工作組就是FireGL。FireGL從SPEA公司轉到Diamond旗下後,無論是產品的推出速度還是產品的競爭力上都有了驚人的提升。在這段時期內,FireGL小組推出了FireGL 1000、FireGL 2000、FireGL 3000、FireGL 4000共4片圖形卡。有趣的是這4片圖形卡的圖形核心竟然來自於3家毫無關聯的公司。FireGL 1000採用了3Dlabs Premedia NT+GLint Delta核心,而FireGL 2000的圖形核心來自於AVANCE Logic。FireGL 3000同樣使用Premedia Avance。最後的FireGL 4000竟然選擇了三菱3D PRO 2MP圖形核心。  隨後因為臺灣廠商的加入,板卡製造行業的利潤急速下滑。Diamond和ELSA同時遇到經營危機,Diamond被S3收購後改名為Sonic Blue,專門推出S3圖形晶片的圖形卡。而FireGL小組則採用IBM Rasterizer及RC1000+GT1000等圖形核心陸續推出了FireGL 1~FireGL 4共4片專業圖形卡和Quadro分庭抗禮。之後的事情相信大家也很清楚了,Sonic Blue再次完蛋,S3被VIA買下,FireGL則被出售給了ATi,拉開了ATi切入專業圖形卡市場的序幕。  FireGL併入ATi近一年後,採用ATi Radeon8500 GPU推出了基於DirectX 8的FireGL 8800/8700。但是R200核心設計顯然不適合用作專業用途,DirectX 8在專業領域面對OpenGL依然顯得太嫩了,所以FireGL 8800/8700最終只能依靠低價佔領市場。緊接著3ds max加入了D3D 9支援,而3ds max的D3D執行效率竟然超過OpenGL。ATi的Radeon 9700系列也通過DX9揚眉吐氣。基於R300核心的FireGL X1自然也趁勢出擊給予了Quadro強力的阻擊。

  在經歷了近10年的發展之後,專業圖形卡已經非常成熟。在我們以往測試過的所有專業圖形卡中都展示了許多一致的特性。對於新一代專業圖形卡我們認為它們必須具備以下特性,才能滿足我們不斷提升的需求。基於PCI Express Graphic(X16)介面  儘管使用PCI Express Graphic(X16,以下簡稱PEG)介面的娛樂用圖形卡對比相同型號的AGP圖形卡在效能上的優勢微弱,但這並不代表PEG介面所提供的效能僅稍好於AGP 8X。在絕大部分遊戲應用中所需要呼叫的紋理容量基本很少超過256MB。而在專業應用中,所需要的紋理卻經常突破1GB。要高效的對這些紋理進行操作,顯然需要1GB以上的視訊記憶體,可惜的是如此大量視訊記憶體的顯示卡價格將會驚人的昂貴。於是將紋理儲存在系統記憶體中會是一個折中的辦法,要高效的呼叫系統記憶體中的紋理,顯然需要高速的介面,此時PEG介面的效能表現絕對超乎你的想象。完善的I/O介面  Dual DVI-I介面是專業圖形卡必然的選擇。DVI-I介面的好處是你可以根據需要使用轉換頭而將他們輕易的變成D-Sub輸出,但是如果你僅僅只有1個DVI-I和1個D-sub輸出,在連線DVI裝置時將會遇到極大的限制。與此同時,圖形卡所能提供的最大輸出解析度也需要特別注意。許多設計師喜歡使用22寸甚至更大的顯示器,這些顯示器的解析度有1920x1200甚至更高,圖形卡能否在如此高解析度情況下提供清晰穩定的輸出和所需重新整理率也需要特別關注。  除了視訊輸出外,叢集多屏渲染使用者還需要GenLock介面和FrameLock介面以保證所有系統重新整理率上同步,從而保證渲染、演示結果的正確。而要求更高的使用者恐怕還需要SDI介面直接輸出未壓縮的SD/HD視訊訊號和立體眼鏡介面。在選購專業圖形卡時,我們必須要清楚的瞭解所需埠。小知識:   什麼GenLock、FrameLock?

  Genlock(Generator Lock)其實就是提供該顯示卡重新整理率訊號的埠。在多個顯示卡/系統連線進行共同輸出時(如視訊牆、超高清晰度衛星地圖顯示)多個系統會因為行重新整理率的不同導致畫面出現閃爍或者條紋。GenLock介面則能夠將顯示卡的內部重新整理率型號告知其他系統的顯示卡,在共同進行連續視訊輸出時保持行重新整理同步,避免這些情況的發生。  在進行叢集渲染和視覺化模擬時,每個顯示系統所分到的任務量並不是一致的,複雜度的不同渲染時間自然也就不同,他們在進行共同輸出時就會導致最終畫面錯誤或者破碎。所以我們需要通過FrameLock介面來傳輸資料快取同步訊號和行重新整理訊號,以保證整個叢集中所有系統最終顯示速率的一致和渲染結果的正確。  什麼是SDI?

QuadroFX 4000 SDI上的HD/SD通用10bit SDI介面

  SDI(Serial Digital Interface, 序列數字介面)是一種被廣泛應用在專業視訊編輯廣播領域的介面。該介面的速度為270Mb/s,能夠傳輸10bit精度,未經任何壓縮的數字視訊訊號。是傳輸質量最高的數字視訊介面之一。常用於連線非線性視訊編輯系統和線性視訊編輯系統,也有用SDI介面進行直接視訊輸出和錄影。隨著高清晰電視的來臨,SDI介面也發展出了HD-SDI格式。對OpenGL完善的支援  DirectX是娛樂顯示卡所必須遵循的規範,而專業圖形卡所必須遵循的規範顯然就是OpenGL了。OpenGL 1.0儘管已經發表了近十年,但靈活的擴充套件性和開放性使得OpenGL依然成為最強悍的圖形API。事實上,所有關於圖形學的研究都涉及OpenGL,所有的專業2D、3D程式都構建在OpenGL之上。專業圖形卡只有提供對OpenGL完善的支援,才能正確的執行所有應用。  隨著OpenGL 2.0的釋出,各專業圖形卡製造商也紛紛推出了支援OpenGL 2.0的驅動程式。3Dlabs作為OpenGL的締造者之一,表現當然是驚人的迅速。而NVIDIA的OpenGL 2.0驅動也緊隨其後。至於ATI則步伐相對慢了一點。絕對的穩定性  在幾百個小時的工作即將完成時,系統的突然崩潰!這樣一次崩潰往往會對使用者造成極大的損失。專業工作站基本都是7x24不間斷工作的,這樣的工作環境對於硬體來說絕對是個挑戰。因此所有的專業圖形卡都不惜工本的採用最為頂級的元件和較為保守的設計。所以即便是做工遠超同系列遊戲卡的專業圖形卡,其核心/視訊記憶體頻率較之依然有所降低。  在驅動方面,專業圖形卡為了保證渲染結果和精度往往也會犧牲一定的速度。與此同時,為了獲得對相應軟體的完美支援,各大圖形卡製造商還與軟體生產商進行相互的合作,甚至有專門對應某軟體的驅動版本以便獲得速度和穩定性的提升。在廠商認證方面,無論是NVIDIA還是3Dlabs抑或ATi都做的相當好,幾乎所有找得到的DCC、CAD等軟體都有相應的通過廠商認證的驅動。足夠高的渲染精度  幾乎所有的3D工作者都會遇到這樣的情況:在3D軟體中建模完成之後,發現有些圓弧部分、人體的關節部分有明顯閃爍的黑點,或者是直接破裂。這樣的情況就是專業圖形卡的精度不足導致的。早期ATi的專業圖形卡如FireGL X1只有4bit的子象素精度,同時Z-Buffer的精度也較為底下,在渲染大部分圓弧過渡的物件時都會產生破裂和黑點。而3Dlabs和NVIDIA則很早就將子象素精度提高到了12bit甚至是16bit,徹底杜絕了該問題的產生。在我們本次的測試中,所有顯示卡都沒有發生因為子象素精度不足導致的畫面錯誤。

 這次測試的產品包括NVIDIA的QuadroFX 1400、ATi的FireGL V7100以及3Dlabs的Wildcat Realizm 800共三塊專業顯示卡,測試平臺方面,我們選擇了兩顆AMD Opteron 875雙核心處理器、4條Corsair DDR400記憶體(帶ECC檢驗),而主機板則選擇了泰安S2895,採用nForce Professional晶片組。  眾所周知,nVIDIA是現在全球顯示卡領域的龍頭大哥,不但在個人電腦遊戲顯示卡獨樹一幟,而且在專業繪圖顯示卡也擁有雄厚的技術實力。特別是Quadro FX系列,更適用於CAD和科研應用的效能最高的圖形處理解決方案,今天我們IT評測室就為大家帶來Quadro FX1400的實物介紹。  初看到該款麗臺Quadro FX1400專業繪圖顯示卡外觀,和我們現在的遊戲顯示卡區別並不大。然而它卻擁有業界唯一真正的128位浮點運算的3D圖形渲染管線,能夠在一個寬廣的動態範圍內,提供給圖形成千上萬種色彩,同時還提供令人驚訝的視覺衝擊以及最高的精度,遠遠滿足複雜的3D效果圖需要的眾多高準確度的資料運算要求。
  另外就專業顯示卡來說,想必大家平時也很少接觸和了解到,專業繪圖顯示卡與高階 3D 遊戲卡之間的要求和差別簡單來說就是:專業繪圖顯示卡是用來建立遊戲中使用的模型/環境,而遊戲卡則只是為了玩遊戲。遊戲主要要求在一個視窗獲得高幀幅率。專業繪圖顯示卡需要解決的問題在於,使用極其先進而複雜的應用程式,同時在輪廓線和深淺模式中執行,且同時開啟或關閉多個視窗及選單,專業繪圖顯示卡的設計也要能夠處理百萬多邊形的較大檔案。
這就是Quadro FX 1400的核心所在
視訊記憶體方面,該款顯示卡採用的是HY顆粒,採用128 MB 256 bit DDR SDRAM記憶體規格
 ATi和nVIDIA一樣,都在專業顯示卡領域逐漸獲得了相當程度的認可,不過和NVIDIA不同,ATI在專業領域的進步並不一帆風順,一方面是ATI自身在技術方面與NVIDIA並不完全相容,而NVIDIA則在行業裡處於規範制訂者行列,與“行業規範制訂者”不同必然會產生一些負面影響,另一方面ATI在專業領域的宣傳並不是很花精力,與NVIDIA不遺餘力地力推其高階專業產品相比,ATI的操作略顯保守。  這款是來自ATI FireGL PCI-Express系列中最高規格的FireGL V7100,或者可以說就是ATi Radeon X800XT的專業版本。
  FireGL V7100從硬體規格看其實和X800XT一模一樣,外觀上的差異也僅僅只在於顯示卡所提供的顯示輸出介面或是多幾個電容、電阻,並沒有什麼太突出的地方。這點和NVIDIA同出一脈,都採用使用軟體識別的方式區分專業和非專業顯示卡,從而實現降低研發成本的目的。
  顯示卡使用的視訊記憶體為2ns規格,預設頻率1GHz。我們注意到在每顆視訊記憶體的邊上都有一個空焊位,而這塊樣卡是256MB規格,也就是說未來會提供512MB視訊記憶體規格的產品,從而實現更加強大的效能。256MB視訊記憶體在目前頂級專業顯示卡領域中不具有競爭優勢,想必ATI也是非常清楚的。
  FireGL V7100的核心和普通的X800XT沒有什麼區別,只是名稱換成了FireGL。事實上,目前雖然我們沒有更詳細對這款顯示卡進行測試,但它的硬體規格、軟體配套都還不能讓我們為之動心,希望在未來的評測中能看到優秀的效能表現,但也必須指出一點,要指望它在整個評測中獲得最好的表現從我的角度來看未免難度太大。
  如果你是一個顯示卡發燒友,如果你在為你的PCI-E顯示卡而自豪,如果你還在為雙顯示卡SLI技術而垂涎欲滴,如果你還在為256bit視訊記憶體位寬而感到沾沾自喜,如果你還在渴望能有512MB的視訊記憶體來玩轉DOOM3,那麼我奉勸你一定要來看看這款顯示卡——3Dlabs的Wildcat Realizm 800。  隨著NVIDIA和ATI在專業顯示卡領域的不斷突飛猛進,很多人開始逐漸遺忘一個曾經在業內呼風喚雨的專業顯示卡產品設計與製造的老大級人物——3Dlabs。專業顯示卡的評測在業內並不多,而家用遊戲顯示卡則不斷受到大眾媒體的追捧,隨著家用遊戲顯示卡在3D技術方面的不斷進步,NVIDIA和ATI不斷得到媒體的曝光,專業顯示卡方面也乘機獲得了大量的造勢宣傳幫助,相反3Dlabs即便擁有強悍的產品卻苦於“報效無門”,無處宣傳。
  我在北京有一個朋友專門經營面向專業使用者的產品,平時我所需要得到的一些專業技術方面的幫助也主要來自於他,他對於我們近期釋出的《強到極限 概念工作站級平臺獨家賞析》非常感興趣,更對我們計劃製作專業的工作站平臺評測極為支援。其實原本在我們的計劃中並沒有考慮增加3Dlabs方面的產品評測,因為畢竟對我們絕大多數人來說,它的顯示卡實在超出了我們所需要的範圍,不過他的誠懇與熱情還是打動了我們,並且,更多的專業顯示卡顯然能更加幫助我們的專業評測獲得更多資料,並具有更強的說服力,因此來自3Dlabs的頂級民用專業工作站顯示卡Wildcat Realizm 800來到了我們的評測室。
  樸素的顯示卡包裝盒內裝著的配件屈指可數,一塊顯示卡(其實或者應該說是一塊磚頭),一本說明書,一張驅動光碟,一小盒DVI轉VGA介面(兩個)和一根用於將4PIN電源通用線纜轉為顯示卡上專用的6PIN介面使用的轉接線。其實我從來沒有指望過在我上次收藏了一塊Voodoo5 5500之後還會有更加誇張的超大顯示卡擺在我的面前,這次這款Realizm 800擺在我的面前時我著實想了好久怎樣才能把它鎖進抽屜——因為它的長度已經超過抽屜。什麼?您問我如何把它裝進機箱?嗯……說實話,其實這件事我壓根沒考慮過,專業工作站應該會有它能匹配的機箱使用吧,家用機箱要想用這塊顯示卡的話,估計得在機箱前面板打上一個大洞才有可能。
  任何一個發燒友都會很想看到這款專業頂級工作站顯示卡驚人巨大的散熱器之下的各種晶片(組),不過我們在經過詳細考慮之後還是決定暫時不拆,除了考慮到是否會產生損壞等問題,另一個重要的問題是拆完這些散熱器之後如何裝好,並保證散熱能力實在是一件非常考驗我們的事。為了保證在測試過程中不會損壞,我們決定將這個操作步驟留到評測結束之後。
  本文的開始,我們提到了關於顯示卡的規格,事實上這款顯示卡的規格的確足以讓所有人為之傾倒。該款顯示卡採用的是新規格的PCI-Ex16介面,介面預設速率為上下行共8GB/s的資料傳輸率。在基本處理器配置方面,它擁有兩顆VPU和一顆獨立的VSU。所謂的獨立VSU全稱是Vertex/Scalability Unit,直譯為頂點資料平衡處理單元,它的用途是用於平衡兩顆VPU處理器的運算負荷。Realizm 800使用的兩顆VPU執行頻率無法判斷,3Dlabs暫時也沒有公開宣佈,它的另一款Realizm 200使用的是1顆VPU,在過去的測試中反應出的結果是Realizm 800略微領先Realizm 200大概20%。
  在處理核心方面的優勢在於,3Dlabs保證這款顯示卡在多VPU負荷方面採用硬體級別(VSU)的內建平衡系統,不會出現相容性問題的同時還保證了效能的提升,相反而言,NVIDIA目前提出的SLI技術,在實現過程中可能受到種種限制,目前在遊戲方面的限制就需要軟體的支援,在專業軟體方面還有更多未知因素等待。那麼,如果NVIDIA推出類似GIGABYTE的3D1式專業顯示卡是否能解決這個問題呢?恐怕很難,3Dlabs通過VSU來實現硬體的多VPU任務平衡,而SLI是軟體型的支援,並且是通過一定的程式識別後啟用SLI支援,屬於一種軟體式的任務平衡,與Realizm 800的多VPU技術還是有一定的差距。  在視訊記憶體方面,Realizm 800使用了20顆視訊記憶體,容量規格高達640MB,其中512MB為通用視訊記憶體,另外128MB為直聯突發視訊記憶體。通用視訊記憶體的記憶體位寬高達512bit,而128MB突發視訊記憶體位寬則為128bit。不過其中512MB通用視訊記憶體根據我們的判斷為兩顆VPU各擁有256MB/256bit,在3Dlabs方面則將其等效為512bit來進行宣傳。  無論如何,3Dlabs這款Wildcat Realizm 800給我們提供的效能感受都會是驚人的。
  在整個測試中,我們採用了SPEC組織提供的VIewperf 8和SPECapc測試套件。SPEC(Standard Performance Evaluation Corporation)是由IBM、Intel、SGI、ATi、NVIDIA等幾十個業界領導企業於1988年共同組成的計算機效能評估小組。時至今日,SPEC已經有上百個會員,他們幾乎囊括了我們所熟知的所有硬體製造商。與此同時,SPEC的組織結構也有了較大的發展,SPEC旗下分為3個小組,分別是著重於系統圖形運算效能評估的The Graphics Performance Characterization Group (GPC)、著重於對超級計算機和高效能運算機進行效能評估的The High-Performance Group (HPG)和著重於對普通工作站、伺服器效能進行評估的The Open Systems Group (OSG)。  SPEC在高階效能評估方面有著絕對的領導力——所有的測試都基於真實指令碼、所有的測試都對會員提供原始碼。幾乎所有的研究機構都用SPEC套件來衡量系統的執行速度,世界超級計算機500強(Top500)也採用了SPEC測試套件來進行效能模擬。  SPEC Viewpref 8.01  在本次測試中,我們首先使用了合成類的SPEC Viewpref 8.01進行測試。SPEC Viewpref 8.01包含7個真實測試指令碼,分別基於入門3D軟體3ds max 3.1、工程設計軟體CATIA V5R12、科學視覺化模擬軟體CEI EnSight、室內建模軟體Lightscape Visualization System、中端3D設計軟體Maya 5.0、工程虛擬設計裝配軟體PTC Pro/Engineer 2001、Solidworks 2004 k、Unigraphics V17。
  在Viewpref 8.01的測試中,擁有2個VPU和1個VSU加上512MB視訊記憶體的3dlabs Wildcat Realizm 800以壓倒性的優勢超過了ATi FireGL V7100和NVIDIA QuadroFX 1400及QuadroFX 1400 SLI。在OpenGL應用中3Dlabs徹底可程式設計的流水線、額外存放指令的128MB儲存器、單獨的幾何(Vertex Shader)及負載平衡VSU體現出了應有的價值。這樣的效能優勢,即便是面對同級別的Quadro FX 4400也能毫無懼色。  經過幾年的耕耘,ATi FireGL也迎來了他們的收穫。與之前的產品相比,ATi FireGL V7100表現的效能已經有了長足的進步。但ATi R300/R420 GPU的體系結構在執行OpenGL應用時的效率較為底下的問題似乎依然困擾著FireGL。在絕大部分應用中,擁有16條流水線的FireGL V7100效能甚至不敵檔次更低的QuadroFX 1400。也許ATi是時候重寫OpenGL引擎程式碼了。  QuadroFX 1400是我們所測試最具價效比的專業圖形卡產品、QuadroFX 1400的價格僅有上面2款產品的一半,甚至更低。但是QuadroFX 1400所能提供的效能卻不僅僅是50%。得益於NV4x體系結構,NVIDIA QuadroFX 1400在較小電晶體規模上實現較高的專業效能。需要指出的是,NVIDIA在專業圖形卡方面的軟體開發力度相當大,不僅提供了完善的Forceware驅動,還額外提供了為加速AutoCAD預覽的PowerDraf、加速3ds max Viewport預覽的Maxtreme7等軟體。近期NVIDIA推出的NVIDIA Gelato離限渲染器更是實現了完整硬體加速的最終渲染。  隨後我們採用了SPECapc For Maya 6和SPECapc For 3ds max 7兩個套件對圖形卡的實際效能進行考察。SPECapc和上面的Viewpref 8.01不同,SPECapc需要完整版本的Maya 6和3ds max 7,同時SPEC僅僅提供相應的指令碼設定和最終加權得分計算方法。這些測試都將在各個軟體內部完成。

 SPECapc For maya 6測試由3個場景共30項測試組成,其中27項測試將會迴圈執行3次。其中魷魚、螞蟻兩個場景由NVIDIA提交,SPEC全體成員稽核通過。在SPECapc for Maya測試中圖形子系統效能將會佔總成績的70%,而CPU效能佔20%、I/O子系統(包含記憶體速度和硬碟速度)效能佔10%。在這個測試中,得分為1的參考系統為Pentium 4 1.5GHz、1GB PC800 ECC RDRAM和NVIDIA Quadro2 Pro圖形卡、20GB ATA/100硬碟。如果目標系統的得分為2,則可以表明在日常使用中完成相同工作量,目標系統只需要耗費參考系統50%的時間。

  在本次測試中NVIDIA QuadroFX 1400 SLI取得了最高圖形效能得分,QuadroFX 1400緊隨其次。QuadroFX 1400的全面勝利,源於NVIDIA驅動能夠完整的提供Maya Hardware Rendering的硬體加速支援。3dlabs Wildcat Realizm 800由於驅動程式缺乏相應的支援,導致成績墊底。而FireGL V7100同樣因為對Maya硬體渲染和實時預覽的支援問題導致成績偏低

  SPECapc for 3ds max7包含眾多的測試場景,場景選擇覆蓋了簡單的三角形到複雜建模和大型場景。由於在3ds max7中DirectX加速和OpenGL加速都已經相當完善,而DirectX加速甚至效率更高,因此SPECapc for 3ds max7測試中包含了OpenGL和DX 2種執行路徑。該測試的參考平臺為Intel Xeon 2.4GHz、1GB PC800 RDRAM、Quadro XGL700圖形卡和40GB ATA/100硬碟。

  在3ds max7測試中3dlabs Wildcat Realizm 800佔據了頭把交易,而QuadroFX 1400 SLI緊隨其後,FireGL V7100位居第三。QuadroFX 1400墊底。這樣的效能結果幾乎和他們各自的售價成正比。但是Wildcat Realizm 800由於缺少對3ds max 7 Viewport的實時加速工具,導致效能成績偏低,未能徹底釋放Realizm 800的效能。

 在我們完成了所有專業圖形卡測試之後,我們發現單論效能,專業圖形卡發展的速度極其迅猛。3dlabs依靠Wildcat Reailzm 800再次向世人展示了他的力量,而NVIDIA的QuadroFX 1400則重新整理了專業圖形卡效能價格比的標準。至於ATi FireGL V7100則依然缺乏強大的競爭力。如果你的工作包含極端複雜的3D模型和海量的紋理,那3dlabs Wildcat Realizm 800將有助你顯著提升工作效率。對於預算有限的SOHO設計師和初學者來說QuadroFX 1400將會是他們最佳選擇。  在整個測試中,對專業圖形卡的功能和加速範圍上我們依然有所期待。現在市場上所有專業圖形卡在最終渲染方面都無能為力,在Mental Ray、Final Render等渲染器大行其道的今天,顯然最終渲染耗費了大量的時間。要加速GI渲染,我們需要的更像是IBM Cell處理器那樣的MIMD處理能力,而不是遊戲卡上極端的填充率和幾何設定能力。在經歷了遊戲和專業的融合之後,也許今天遊戲圖形卡和專業圖形卡應該再次分道揚鑣、各自發展了?