1. 程式人生 > 資訊 >【IT之家評測室】完整 GA104 核心!英偉達 GeForce RTX 3070 Ti 評測

【IT之家評測室】完整 GA104 核心!英偉達 GeForce RTX 3070 Ti 評測

今年的中國臺北電腦展上,英偉達帶來 GeForce RTX 30 系列的兩款 Ti 產品,分別是 GeForce RTX 3080 Ti 和 GeForce RTX 3070 Ti。GeForce RTX 3080 Ti 已經在先前解禁,而今天 GeForce RTX 3070 Ti 的效能測試也正式解禁。已經收到公版的 GeForce RTX 3070 Ti 顯示卡,這一顯示卡基於完整的 GA104 核心設計,公版上市首發價格為 4499 元。

英偉達 GeForce RTX 3070 Ti 採用了基於三星 8 奈米工藝 NVIDIA Ampere 核心 GA104-400 核心,相比於 GA102 尺寸更小,核心面積為 393 平方毫米,電晶體總數相應的也大概只有 174 億。面積與電晶體總數整體都減少了 40% 左右,這帶來了更低的發熱量和功耗。

這次 GeForce RTX 3070 Ti 使用的 GA104-400 是一個完整的 GA104 核心,它總共包含 6 組 GPC,每組 GPC 包含 4 組 TPC,總共 24 組 TPC,每個 TPC 包含 2 組 SM 單元,總共 48 組 SM 單元,每個 SM 單元包含 128 個 CUDA 核,共計 6144 個 CUDA 核。另外還有 192 個第三代 Tensor Core、48 個第二代 RT Core、192 個紋理單元、96 個光柵處理單元。基礎頻率為 1575MHz,加速頻率達到 1770MHz。

從紙面引數來看,由於之前推出的 GeForce RTX 3070 與 GeForce RTX 3070 Ti 僅相差 2 組 SM 單元,因此在實際效能提升上,二者應該相差不大。按照此前英偉達對產品的定位,Ti 往往相比於純數字系列效能表現高出不少,而 SUPER 則相比於純數字系列高出一點點,這次英偉達給 GeForce RTX 3070 SUPER 只留出了 47 組 SM 單元這一個坑位,很有可能未來 RTX 3070 系列不再可能會推出 SUPER 系列產品了。

這次 NVIDIA Ampere 架構中負責光追運算的 RT Core 得到更新,其最大的更新是增加了動態模糊的加速運算支援,英偉達表示第二代 RT Core 光追效率是上一代的 8 倍。負責 AI 計算的 Tensor Core 這次在 NVIDIA Ampere 架構中也升級到第三代,作為顯示卡的 AI 大腦,Tensor Core 通過加速深度神經網路處理資料,相比第二代 Tensor Core,第三代的 Tensor Core 能效更高。

更強的 AI 處理能力也讓 DLSS 功能得到更大的進化,甚至可以觸及 8K 這個現階段顯示行業的上限,DLSS 8K 這一功能通過深度學習將畫面解析度從 2K 提升到 8K,這裡第三代 Tensor Core 功能上的進化功不可沒。

基於 NVIDIA Ampere 架構的第三代 Tensor Core 還可以支援全新的 NVIDIA Broadcast 技術。

NVIDIA Broadcast 技術允許玩家在視訊直播過程中進行 AI 實時聲畫處理,實現高質量、高幀率的流暢直播體驗。通過這項技術可以實現 AI 智慧降噪,虛擬背景和自動取景等功能。

這次 GeForce RTX 3070 Ti 配備了 8GB 的 GDDR6X 視訊記憶體,視訊記憶體位寬達到 256bit,視訊記憶體頻率達到 14Gbps,視訊記憶體頻寬達到 608GB/s,相比於 GeForce RTX 3070 有了不少的提升。GDDR6X 捨棄了 GDDR6 採用的 NRZ 編碼方式轉而採用對電壓控制更加精細的 PAM4 編碼。

PAM4 編碼方式可以通過四種不同的電平來代表 2 個 bit 的邏輯資訊,分別是 00、01、10、11,而原先的 NRZ 編碼方式則只能在單位時間內由高低電平表示 0、1 兩個資料,因此 PAM4 編碼的波特率僅為 NRZ 編碼的一半。

另外,英偉達 GeForce RTX 30 系列顯示卡也對 AV1 編碼格式以及 DP 1.4a、HDMI 2.1 介面進行了支援,HDMI 2.1 其傳輸能力更加強大,顯示卡可以輸出 [email protected] 或者 [email protected] 視訊內容。

英偉達在 GeForce 顯示卡中還引入了 NVIDIA Reflex 低延遲技術,這項技術通過 GeForce 顯示卡以及 G-Sync 共同作用實現競技類遊戲更低的系統延時,以此實現更快的目標獲取,以此提升瞄準的準確性。目前,這項功能已經支援《APEX 英雄》、《堡壘之夜》、《使命召喚:黑色行動冷戰》等遊戲。

由於在核心上相差不多,如果說在 GeForce RTX 3070 與 GeForce RTX 3070 Ti 之間進行選擇,可能 GeForce RTX 3070 價效比更高一些,畢竟二者在 SM 單元上相差不大,但 GeForce RTX 3070 Ti 在視訊記憶體規格上更勝一籌。接下來,我們首先來看一下公版的 GeForce RTX 3070 Ti 顯示卡整體的外觀情況。

外觀

公版的 GeForce RTX 3070 Ti 顯示卡延續了 GeForce RTX 30 系列前後雙風扇設計,相比於 GeForce RTX 3080/RTX 3080 Ti 低奢的鎘金色外觀,GeForce RTX 3070 Ti 整體則是銀灰色的設計。

此前上市的 GeForce RTX 3070 散熱鰭片整體都是斜著的紋路,只有靠近介面的一側是橫向散熱鰭片,而這次 GeForce RTX 3070 Ti 則是豎向排布的散熱鰭片。

前後雙風扇設計,可以在機箱內形成兩個獨立的風道,一路風道直接排出 GPU 核心熱量,另一路風道則利用散熱管在顯示卡上方形成另外一個風道,以此傳導顯示卡產生的廢熱。在執行過程中並沒有明顯的風噪,非常安靜。為了保證前後雙風扇散熱能在技術上實現,英偉達公版的顯示卡均是採用小 PCB 板以此實現前後雙風扇散熱這項技術。

不過,在背部的散熱風扇上,GeForce RTX 3070 Ti 並沒有像 GeForce RTX 3080 Ti 那樣有著很大面積的散熱鰭片包裹。

考慮到 GeForce RTX 3070 Ti 與 GeForce RTX 3070 比較相似,並且散熱結構也大差不差,可能 GeForce RTX 3070 Ti 在實際的散熱表現上會稍微差一些。

因為 PCB 板架構更加緊湊,所以電源介面的尺寸和體積不得不做出調整,這裡英偉達在 GeForce RTX 3070 Ti 上同樣採用的 12 Pin 的小介面供電。好在英偉達官方有提供轉接線,以此相容主流電源。

介面方面,GeForce RTX 3070 Ti 擁有 3 個 DP 1.4a 介面和 1 個 HDMI 2.1 介面。公版全家福包括顯示卡本體、說明書、保修證明和轉接線。接下來,我們通過實際場景來看一下它的表現如何。

理論表現

首先,我們來看一下 GeForce RTX 3070 Ti 的理論表現,之前 GPU-Z 此前升級過一輪對 GeForce RTX 3070 Ti 的識別還是很全面的,作為首發媒體之一,拿到的測試驅動版本號是 466.61。

接下來,我們來看一下此次評測的硬體平臺,平臺資訊如下:

接下來,我們通過 3DMark 來看一下 GeForce RTX 3070 Ti 的理論表現。

Fire Strike 測試中我們看到,GeForce RTX 3070 Ti 顯示卡 DX11 Fire Strike Extreme 得分 17858 分,Fire Strike Ultra 得分 8959 分。

Time Spy 測試中,GeForce RTX 3070 Ti 顯示卡 DX12 Time Spy 得分 14520 分,Time Spy Extreme 得分 7135 分。GeForce RTX 3070 Ti 相比 GeForce RTX 3070 有著更多的 CUDA 核,所以我們看到 Time Spy 測試與 Fire Strike 測試 GeForce RTX 3070 Ti 在資料上表現不錯,DX11 整體效能大概有 10% 上下的提升,DX12 大約 6% 上下提升。

光線追蹤部分測試,由於 GeForce RTX 3070 Ti 和 GeForce RTX 3070 僅僅相差 2 個 RT Core,因此實際光追表現並沒有提升太多,大概僅有 1% 的提升。

由於採用了完整的 GA104 核心,GeForce RTX 3070 Ti 在 DX11 和 DX12 表現上相比於 GeForce RTX 3070 表現更好,不過 SM 僅僅增加了 2 組,RT Core 提升不明顯,因此在光追場景下二者差距不大。接下來,我們通過具體的遊戲場景來對 GeForce RTX 3070 Ti 進行測試。

遊戲場景

在遊戲測試場景中,選擇《孤島驚魂:新曙光》、《古墓麗影:暗影》、《刺客信條:奧德賽》等幾款遊戲進行測試,測試均在 1080P 240Hz 場景下進行。測試資料如下:

通過測試我們看到,相比於 GeForce RTX 3080,這次公版的 GeForce RTX 3070 Ti 在遊戲幀率表現上與其平均相差 30% 上下。在 DLSS 能力上,完整的 GA104 核心在超效能情況下,可以為幀率帶來 3.6 倍的幀率增益。

散熱與功耗

通過 Furmark 甜甜圈測試對公版的 GeForce RTX 3070 Ti 進行拷機測試,測試結果如下:

通過測試我們看到,採用了完整 GA104 核心的 GeForce 3070 Ti 顯示卡在預設功耗上更高,達到 290W,由於採用了與 GeForce RTX 3070 幾乎一致的散熱結構,我們看到在實際溫度控制上,GeForce RTX 3070 Ti 表現並不理想,溫度達到 80 度,幾乎與公版的 GeForce RTX 3080 Ti 一致。想要解決散熱問題,現在來看只有非公版產品才能勝任了。

總結

這次 GeForce RTX 3070 Ti 擁有完整的 GA104 核心,相比於 Ge Force RTX 3070 產品有大約 8% 的提升,由於主要負責光追計算的 RT Core 數量差距不大,因此在這方面提升相對有限。

完整的 GA104 核心帶來的發熱問題是公版 GeForce RTX 3070 Ti 需要解決的問題,由於少了一組散熱鰭片,並且整體功耗的上升,這大大影響了溫度這一因素。好在老黃一定對礦老闆們做出了很多限制,相信以後非公版的 GeForce RTX 3070 Ti 可以更容易買到。