隨著NVIDIA RTX 30系的發佈,在我們為旗艦卡性能大呼過癮的同時,對新一代甜品卡也充滿了很多期待。GTX1060改善了玩家的遊戲體驗,RTX 2060讓玩家接觸到了入門光追,正當我們翹首期盼RTX 3060的時候,NVIDIA不按常理出牌,發佈了RTX 3060 Ti這款甜品之上的顯卡。今天給大家帶來這款映眾RTX 3060 Ti 冰龍超級版顯卡的測評。
都說今年最晚發佈的這款RTX 3060 Ti是一塊甜品級顯卡,而我給它的定位卻是甜品卡之上。因為“Ti”這個後綴非常罕見,而且如果出現Ti作為後綴的情況,按照以往的慣例也應該是先發布旗艦產品,而這次的RTX 3060 Ti定位則是在RTX 3060(真甜品)之上的。另一方面在性能上這次的RTX 3060 Ti已經了超越RTX 2080 SUPER。如果強行把它說成遊戲甜品卡的確有些不妥,恐怕只有價格上比較"甜品"吧。
在評測開始前,筆者為大家總結一些該顯卡的特點,也方便大家有針對性的閱讀:
採用RTX 30冰龍家族式設計語言,LED炫紅燈箱設計低調沉穩
6熱管散熱加直觸工藝,有效控溫
超越RTX 2080 SUPER的性能表現,RTX 2060的價格
映眾RTX 3060 Ti 冰龍超級版
01映眾RTX 3060 Ti 冰龍超級版外觀
映眾 GeForce RTX 3060 Ti冰龍超級版顯卡採用金屬槍灰色和黑色的碰撞拼接設計,這也是RTX 30冰龍家族式設計語言。映眾GeForce RTX 3060 Ti顯卡採用了三風扇的散熱設計,沒有在頂部額外搭載風扇。
映眾RTX 3060 Ti 冰龍超級版
映眾GeForce RTX 3060 Ti冰龍超級版顯卡長約310mm,最厚的地方在55mm左右,對於機箱大小有一定的要求。主散熱部分則是採用3個92mm鐮刀形風扇葉進行散熱,能有效的對內部進行散熱,保證顯卡的穩定運行環境。
映眾RTX 3060 Ti 冰龍超級版
映眾GeForce RTX 3060 Ti冰龍超級版顯卡側面擁有一個LED炫紅燈箱,在未點亮的狀態下為全黑屏,看上去比較沉穩低調。點亮顯卡以後我們就能看到炫酷的燈效。不過有些可惜的是燈光只有紅色,對於喜歡彩光的玩家來說有一點點可惜。
映眾RTX 3060 Ti 冰龍超級版
不過點亮之後顏值滿滿,這種紅與黑的結合非常有電競的氛圍感。
映眾RTX 3060 Ti 冰龍超級版
映眾GeForce RTX 3060 Ti冰龍超級版顯卡的背板尾部採用鏤空設計,配合一體式的背板可以讓熱風迅速穿透散熱鰭片以及背板,令顯卡溫度進一步下降,另外在背板靠近芯片部位也有散熱孔設計,以便發熱嚴重的元件能快速散熱。
映眾RTX 3060 Ti 冰龍超級版
我們常說買燈送顯卡,這回買散熱一樣送顯卡。映眾GeForce RTX 3060 Ti冰龍超級版顯卡的內部散熱配置採用6熱管散熱方案,熱管採用密壓直觸工藝,每一根熱管都與GPU親密接觸。外加之間介紹的三把強勁風扇和一體背板鏤空設計,能有效的保證顯卡運行中的散熱效果,穩定控溫。
映眾RTX 3060 Ti 冰龍超級版
映眾GeForce RTX 3060 Ti冰龍超級版顯卡基於NVIDIA公版方案,配備了6+2相供電,電源部分顯卡採用8Pin接口設計 ,使用上一代顯卡的玩家可以輕鬆過渡,使用600W以上電源的玩家無需更換電源即可實現拔插升級。
映眾RTX 3060 Ti 冰龍超級版
在視頻輸出接口上,映眾GeForce RTX 3060 Ti冰龍超級版顯卡採用DP*3+HDMI 2.1的4接口設計,充分滿足用戶的擴展需求;另外由於本次HDMI 2.1的升級,該接口可支持單線8K的視頻輸出;同時接口上還採用了鍍金設計,不易被氧化,有效延長接口的壽命。
映眾RTX 3060 Ti 冰龍超級版
02NVIDIA Ampere架構下RTX 3060 Ti
映眾RTX 3060 Ti 冰龍超級版採用了NVIDIA Ampere架構,我們首先來看一下RTX 3060 Ti的提升。
第一代RTX架構 Turing下的RTX 2060 SUPER
第二代RTX架構 Ampere下的RTX 3060 Ti
相較於初代的Turing RTX架構,NVIDIAAmpere架構在算力上有著成倍的增長,這一點在RTX 3060 Ti中依舊有體現,每個時鐘執行2次著色器運算,而Turing為1次,RTX 3060 Ti的著色器性能達到16.2 TFLOPS單精度性能,而Turing為7.2 TFLOPS。
NVIDIAAmpere架構翻倍了光線與三角形的相交吞吐量,RT Core達到31.6 RTTFLOPS,而Turing為21.7 RT TFLOPS。
全新的Tensor Core可自動識別並消除不太重要的DNN權重,處理稀疏網絡的速率是Turing的兩倍,算力高達129.6 TensorTFLOPS,而Turing為57.4 TensorTFLOPS。
RTX 3060 Ti採用GA104核心擁有174億個晶體管,392平方毫米的面積,基於三星的8nm NVIDIA定製工藝,另外在RTX 3060 Ti中我們都知道仍然採用了GDDR6顯存,不過不同於RTX 3080的Micron,RTX 3060 Ti採用了三星的GDDR6顯存。
我們在發佈會中經常聽到性能翻倍的說法,其實是因為本次NVIDIAAmpere的SM在Turing基礎上增加了一倍的FP32運算單元,這就使得每個SM的FP32運算單元數量提高了一倍,同時吞吐量也就變為了一倍。
而通常我們計算顯卡的CUDA數量,並不是把SM中的所有單元加起來計數,而是隻統計FP32單元的數量,所以這樣一來,SM中的【FP32 : INT32】 從 1:1 變為 2:1。
RTX 3060 Ti共有4864個CUDA,其實它有2432個INT32單元,但由於內部的FP32數量翻了一倍,所以最終實現了4864這個驚人的數字。
而這樣粗暴的提升CUDA數量對於遊戲其實有著非常大的幫助,通常在遊戲中浮點運算相比整數計算要常用的多,圖形、算法以及各種計算操作中著色器工作負載通常需要混合使用FP32算數指令,而FP32的加速也有助於光線追蹤降噪著色器。
光追工作原理示意
在此次的NVIDIAAmpere架構中,NVIDIA官方宣佈為第二代RT Core,它和第一代有什麼不同呢。首先要知道RT Core的工作原理是,著色器發出光線追蹤的請求,交給RT Core來處理,它將進行兩種測試,分別為邊界交叉測試(Box Intersection testing)和三角形交叉測試(Triangle Intersectiontesting)。基於BVH算法來判斷,如果是方形,那麼就返回縮小範圍繼續測試,如果是三角形,則反饋結果進行渲染。
而光線追蹤最耗時的正是求交計算,因此,要提升光線追蹤性能,主要是對兩種求交(BVH/三角形求交)進行加速。
RT Core的變化
在Turing的RT Core中,可以每個週期完成5次BVH遍歷、4次BVH求交以及一次三角形求交,在第二代RT Core 裡,NVIDIA增加了一個新的三角形位置插值模塊以及一個的額外的三角形求交模塊,這樣做的目的是為了提升諸如運動模糊特效時候的光線追蹤性能。
運動模糊渲染原理
第二代RT Core可以讓光線追蹤與著色同時進行,進行的光線追蹤越多,加速就越快,它將光線相交的處理性能提升了一倍,在渲染有動態模糊的影像時,按照NVIDIA自己的實測,比Turing快8倍。
稀疏深度學習
Tensor Core可以看作是GeForce RTX GPU上的AI大腦。可加速用於深度神經網絡處理功能的線性代數,這是現代AI的基礎。例如用於AI超分辨率的NVIDIA DLSS和用於AI增強的聲畫處理技術NVIDIA Broadcast應用。
在本次的NVIDIA Ampere架構的Tensor Core也得到了極大地加強,在第三代Tensor Core中,NVIDIA引入了稀疏化加速,可自動識別並消除不太重要的DNN(深度神經網絡)權重,同時依然能保持不錯的精度。
首先原始的密集矩陣會經過訓練,刪除掉稀疏矩陣,再經過訓練稀疏矩陣,從而實現稀疏優化,進而提高Tensor Core的性能。
與此次RTX 30系顯卡一同發佈的還有一項新技術——RTX IO。目前很多遊戲動輒幾十G甚至百G的安裝空間,對於存儲空間的負擔暫且不提,但存放在硬盤中的數據,如果顯卡想要讀取到,需要先由CPU從硬盤中讀取壓縮過的數據,經過解壓縮再發送到顯存中。
雖然隨著NVMe SSD的推出,讀取速度相較機械硬盤能夠快20倍,但受制於傳統I/O限制,NVMe高達7GB/秒的高速讀寫對於CPU是極大的負擔。
傳統的數據交換
在這個過程中,會佔用多個CPU核心,壓力急劇增大,佔用較多的內存,而此時其實GPU是處於閒置狀態的。RTX IO的作用就是越過CPU解壓再傳輸數據這一步,直接從PCIE總線讀取硬盤上經過壓縮的數據,並且完成無損GPU解壓,降低CPU佔用,變向提升了性能。
RTX IO可以極大解放CPU負擔
當然這項技術作為系統底層的運行方式改變,還需要藉助微軟發佈的DirectStorage來實現,對於目前容量的遊戲來說,RTX IO的改善效果有限,但假以時日等遊戲容量上百G成為常態的時候,這項技術將會發揮巨大的功效。
同時搭配新增的HDMI 2.1接口,可以支持單線8K的視頻輸出,而上一代HDMI 2.0僅支持4K 98Hz的視頻輸出,如果想要連接8K電視,則需要更多的線纜支持。
033D MARK理論性能測試
首先介紹一下測試平臺,為了保證此次評測能夠發揮映眾GeForce RTX 3060 Ti冰龍超級版顯卡的最佳性能,主板和CPU採用了目前桌面旗艦級配置,具體如下。
配置信息
在測試成績上,基準測試採用3DMARK,遊戲性能測試使用遊戲自帶Benchmark,同時為了減小誤差,每項測試成績均測試3遍取平均值。
GPU-Z參數
首先看一下GPU-Z的參數,軟件更新到2.36已經可以正確顯示核心並修復了紋理單元識別錯誤的情況。RTX 3060 Ti採用GA104核心,三星8nm工藝,芯片面積392平方毫米,擁有4864個CUDA,映眾GeForce RTX 3060 Ti冰龍超級版的頻率為1410-1750MHz。頻率相較於公版要更高一些,顯卡採用8GB GDDR6顯存,位寬為256bit,顯存帶寬達到了448GB/s,光柵單元和紋理單元為80和152。
下面先進行的是用來衡量顯卡DX11理論性能的3DMARKFS套裝:FS,FSE,FSU三者分別對應顯卡在1080P、2K、4K的理論性能,取顯卡分數實際測試結果如下:
3D MARK FS套裝測試
在針對顯卡DX11性能的3DMARK FS套裝測試中,我們主要對比映眾GeForce RTX 3060 Ti冰龍超級版和RTX 2080 SUPER,整體來看各項成績中均小幅領先RTX 2080 SUPER;各項成績差值在2-5%之間。
3D MARK TS套裝測試
而在針對DX12環境下的Time Spy和Time Spy Extreme測試中,映眾GeForce RTX 3060 Ti冰龍超級版領先RTX 2080 SUPER更多,在TSE成績中領先11%。
3D MARK 光追測試
PortRoyal是3DMARK中專門針對光追性能的測試項,映眾GeForce RTX 3060 Ti冰龍超級版的測試結果要優於RTX 2080 SUPER,幅度為4%左右。
在理論測試中,映眾GeForce RTX 3060 Ti冰龍超級版可以說是RTX 2080 SUPER的OC版,而映眾GeForce RTX 3060 Ti冰龍超級版的價格比當時RTX 2080 SUPER的價格便宜幾千元,這樣的性價比我們不服不行啊!
04遊戲性能測試
在遊戲性能測試中,我們選擇了《古墓麗影:暗影》、《德軍總部新血脈》、《孤島驚魂5》、《刺客信條:奧德賽》、國產遊戲《邊境》、《光明記憶:無限》的benchmark跑分軟件。
另外在遊戲測試中,由於顯卡驅動的版本更新和遊戲更新非常影響遊戲幀數,所有benchmark跑分成績均以本次成績為準。
《古墓麗影:暗影》遊戲測試
《古墓麗影:暗影》遊戲測試
由於本次的參測顯卡比較多,而古墓麗影分為標準測試和光追DLSS效果的測試,故分為兩張表格進行對比,共2組6測。第一組為預設最高畫質下,RTX OFF/DLSS OFF;第二組為預設最高畫質下,RTX 超高/DLSS ON。
其中不難看出RTX 3080仍然遙遙領先,映眾GeForce RTX 3060 Ti冰龍超級版也要小幅領先RTX 2080 SUPER的分數,差距在2幀左右。
《德軍總部新血脈》遊戲測試
《德軍總部新血脈》由於自帶兩個benchmark,所以我們的數據取跑分均值。映眾RTX 3060 Ti 冰龍超級版顯卡相較RTX 2080 SUPER在1080P分辨率下提升7%,2K分辨率下提升16%,4K分辨率下提升4%。但從如此規整的等差數列中,不難發現RTX 3080原本不應該是這個水平,其中不知道是驅動問題還是遊戲更新所致。
《刺客信條:奧德賽》遊戲測試
接下來是《刺客信條:奧德賽》,其中映眾RTX 3060 Ti 冰龍超級版顯卡比RTX 2080 SUPER在1080P分辨率下分數高2%;2K分辨率下高4%;4K分辨率下高9%。
《孤島驚魂5》遊戲測試
《孤島驚魂5》同樣算是優化比較到位的3A大作,映眾RTX 3060 Ti 冰龍超級版顯卡比RTX 2080在1080P分辨率下分數高2%;2K分辨率下高14%;4K分辨率下高18%。
《光明記憶:無限》遊戲測試
《光明記憶:無限》是由飛燕群島工作室開發的《光明記憶》新系列,目前還沒有遊戲提供試玩,不過benchmark的跑分軟件官方已經提供,玩家可以在steam上自行下載。另外我們在測試的時候由於無法關閉光追選項,故所有測試成績均為“RTX 最高/DLSS 質量”模式下進行。
這款benchmark跑分軟件在光追效果最高的情況下,運用了多種光線追蹤技術,所以即使強如RTX 3080在4K分辨率下也只能跑到35幀。
《邊境》遊戲測試
《邊境》同樣是一款來自柳葉刀工作室的國產3A大作,具體發售日期不明,目前僅提供了benchmark跑分軟件。同樣的目前跑分軟件不支持關閉光追選項,所以在測試時我們選擇“RTX 最高/DLSS 性能”下進行。
05溫度與功耗測試
在溫度功耗測試方面,室溫24℃,我們並沒有採用全封閉式的機箱,而是採用測試平臺的方法,這樣做可以最大限度的保證顯卡除了自身散熱外將風道等外因減小到最低。
功耗測試(點擊查看大圖)
功耗測試中,我們選擇FurMark軟件進行拷機測試,功耗僅計算顯卡自身。作為一款甜品級顯卡映眾RTX 3060 Ti 冰龍超級版顯卡的功耗要小得多,在峰值情況下整體平均在205W左右。
溫度對比
溫度方面,本次的映眾RTX 3060 Ti 冰龍超級版顯卡溫度相對公版低了7-8℃,出色的散熱設計在10多分鐘的拷機中,溫度保持在64℃。
06部分遊戲光追效果展示
上面我們測試了部分遊戲的光追和DLSS性能表現,這些效果具體在遊戲中是什麼表現,下邊筆者選擇了兩款遊戲給大家展示一下。
《堡壘之夜》RTX ON(點擊查看大圖)
《堡壘之夜》RTX OFF(點擊查看大圖)
堡壘之夜的光追效果還是比較明顯的,其中加入了反射、全局照明和路徑追蹤等效果。卡車車身上的反射較為明顯,角色身上的環境光在打開光追後更為寫實,另外仔細看的話遠處建築物的玻璃同樣有光線的反射,整體畫質改善非常明顯。
《魔獸世界9.0》RTX ON(點擊查看大圖)
《魔獸世界9.0》RTX OFF(點擊查看大圖)
第二組對比來自最新的《魔獸世界9.0》,同樣作為一款卡通渲染的網遊來說,魔獸的年代更加久遠,此次加入光追效果在整體視覺上沒有堡壘之夜明顯。不過如遠處的樹木陰影,以及近處石臺下方的陰影都比較明顯。
《控制》RTX ON(點擊查看大圖)
《控制》RTX OFF(點擊查看大圖)
第三組對比為《控制》遊戲,這款遊戲所採用的引擎物理效果非常出色,同時光追開關的對比也是肉眼可見的明顯。包括玻璃上的人物反光,遠處地面的植物反光都比較清晰,同時打開光追後屋頂處的明暗對比也更加明顯。
07軟硬兼施 鑄就Ampere
好的硬件沒有軟件的加持,相當於空有長柄沒有槍頭,想要發揮十成威力則必須軟硬搭配,反之亦然。此次隨著發佈會共同推出的還有以下幾項非常值得大家關注。
NVIDIA Reflex
以往我們關注延遲大多從顯示器上瞭解到幾毫秒極速響應,但那隻是作為最終端的顯示輸出效果,你是否想過從系統內部到實際看到的畫面有多大延遲?
NVIDIA Reflex
在20系顯卡中NVIDIA反覆提及的“幀能贏”,在30系顯卡中也做了更進一步的突破,除了NVIDIA將推出自己的電競顯示器NVIDIA 360Hz G-SYNC ESPORTS,還有NVIDIA Reflex技術。
以往如果想測量系統延遲需要高速相機以及定製的LED鼠標電路。而使用帶有NVIDIA Reflex技術的顯示器將內置精確的延遲分析工具,可在CPU和GPU中優化渲染管道,極大減少延遲時間,將系統延遲整體降低至30ms以下。不過就像圖中所示,為此你需要一個支持反射延遲分析的鼠標。
NVIDIA Broadcast
NVIDIA Broadcast是一款易用且專業的直播軟件,它的強大之處就在於主播不再需要任何的背景佈置,只需要一個普通的攝像頭和一張GeForce RTX系列的顯卡即可。
這款軟件可以讓你雜亂無章的房間立即變成直播間,其內置了音頻降噪、背景虛化、虛擬背景、頭部追蹤等功能。NVIDIA Broadcast的工作原理是利用AI算法通過DGX超級計算機深度學習而來。
同時RTX 30系顯卡擁有目前最好的硬件解碼器,大部分用戶的電腦在直播時打開OBS推流後CPU佔用會直接飆升到50%左右,而基於GPU的NVENC解碼可以極大地減輕CPU負擔。
NVIDIA Studio
對於內容創作者來說,提到軟件可能大部分只會想到內容創作的相關軟件,但NVIDIA專為內容創作者推出的NVIDIA Studio驅動則是承擔著連接創作軟件和顯卡功能的關鍵。
NVIDIA Studio
NVIDIA Studio驅動經過更新與優化,對於最新版本的Adobe系列軟件支持更為穩定,同時附帶更出彩的創作功能。利用NVIDIA CUDA技術,GPU加速特效可實現更快的實時視頻編輯並加速渲染輸出,並讓原本只能進行軟件編碼輸出的視頻輕鬆得到硬件的支持。另外在AI計算方面的優勢,包括自動標記片段、特效追蹤和人臉識別等功能,都有顯著的速度提升。
以GPU渲染為14.98秒 而CPU渲染為11分鐘
當然NVIDIA Studio的加速創作絕不止Adobe一家,DaVinci、Keyshot、Blender、D5等專業軟件中都有非常亮眼的表現。不僅能提供強大且穩定的運行環境,更能以GPU加速,有效提升創作效率。
08映眾RTX 3060 Ti 冰龍超級版顯卡總結
從外觀上來說,映眾RTX 3060 Ti 冰龍超級版繼承了新一代30系超級冰龍一貫的設計風格,獨特的燈箱設計讓我們對它的沉穩印象在上機點亮的一刻徹底改觀。如果你鍾愛這樣的金屬風格和散熱設計,那這款顯卡一定很適合你。
映眾RTX 3060 Ti 冰龍超級版
從性能上來說,映眾RTX 3060 Ti 冰龍超級版直接超過了RTX 2080 SUPER,並且在售價上保持了與RTX 2060相同。這樣的性價比不禁讓人感嘆真香,也正是這一性能,讓新一代的映眾RTX 3060 Ti 冰龍超級版脫離了甜品卡的範疇,我想這應當是一張不折不扣的性能卡。
映眾RTX 3060 Ti 冰龍超級版
另外從遊戲方面來說,映眾RTX 3060 Ti 冰龍超級版完全可以滿足在2K分辨率下的高幀率遊戲體驗,甚至大部分遊戲在4K分辨率下也可以保障60幀的流暢運行。已經能滿足絕大部分玩家的遊戲需求,面對現階段的遊戲大作完全沒有壓力,非常值得購買。
轉載請超鏈接註明:頭條資訊 » 比甜品卡更甜!映眾RTX 3060Ti冰龍超級版評測
免責聲明 :非本網註明原創的信息,皆為程序自動獲取互聯網,目的在於傳遞更多信息,並不代表本網贊同其觀點和對其真實性負責;如此頁面有侵犯到您的權益,請給站長發送郵件,並提供相關證明(版權證明、身份證正反面、侵權鏈接),站長將在收到郵件24小時內刪除。