12月1日RTX 3060 Ti性能解禁,隨著60型號的發佈,NVIDIA RTX 30系顯卡從入門到旗艦級產品已經補全,橫跨整個四季度的顯卡新品發佈,讓喜歡DIY硬件的玩家過足了癮。今天我們為大家帶來的是耕升GeForce RTX 3060 Ti顯卡評測。
本次解禁的RTX 3060 Ti則比較不按常理出牌,首先“60 Ti”這個型號自常規系列的GTX 760 Ti之後就沒有出現過(16系顯卡除外),可以說近兩年的甜品顯卡“Ti”這個後綴非常罕見,其次如果出現Ti作為後綴的情況,按照以往的慣例也應該是先發布旗艦產品,如GeForce RTX 2080 Ti。
在公版評測中想必大家也已經清楚RTX 3060 Ti的性能,超越RTX 2080 SUPER並且在價格上與RTX 2060相同,真香就完了。在評測開始前,筆者為大家總結一些該顯卡的特點,也方便大家有針對性的閱讀:
超越RTX 2080 SUPER的性能表現,RTX 2060的價格
出色的散熱
總的來說耕升GeForce RTX 3060 Ti 追風保持了公版的性能,並在散熱表現上加以改進,外觀則保持著追風系列一貫的風格。
耕升GeForce RTX 3060 Ti追風
在性能表現上,耕升GeForce RTX 3060 Ti追風不但在2K分辨率下可以做到更高幀率的運行,甚至在4K分辨率下的部分遊戲也有不錯的表現,打破了人們對甜品卡性能不足的印象,加之超高的性價比,這款RTX 3060 Ti完全可以滿足絕大部分遊戲玩家的需求。
01耕升GeForce RTX 3060 Ti追風外觀
首先還是先來看外觀,我們本次評測的耕升GeForce RTX 3060 Ti追風保持了該系列一貫的風格,簡單硬朗的線條點綴整體卡身。
耕升GeForce RTX 3060 Ti追風
耕升GeForce RTX 3060 Ti追風顯卡的整體尺寸為315×125×49mm,相對其他30系顯卡來說更小巧,厚度也更薄。顯卡正面採用三個90mm風扇主動散熱,內部為第二代風盾散熱器,採用加大面積銅散熱底座,並覆蓋大面積散熱鰭片以快速導熱。
耕升GeForce RTX 3060 Ti追風背板
耕升GeForce RTX 3060 Ti追風的背板尾部採用鏤空設計,可以讓熱風迅速穿透散熱鰭片以及背板,令顯卡溫度進一步下降,另外在背板靠近芯片部位也有散熱孔設計,以便發熱嚴重的元件能快速散熱。
耕升GeForce RTX 3060 Ti追風視頻接口
視頻輸出接口上,耕升GeForce RTX 3060 Ti追風採用DP 1.4a*3+HDMI 2.1的4接口設計,另外新的HDMI 2.1接口可支持單線8K的視頻輸出。
耕升GeForce RTX 3060 Ti追風供電接口
在供電接口上,耕升GeForce RTX 3060 Ti追風採用了單8pin供電,而且由於RTX 3060 Ti的自身功耗較小,實測滿載功耗僅為200W左右,外接供電的150W加上板子的75W,仍然是有富餘的。
02NVIDIA Ampere架構下的RTX 3060 Ti
耕升GeForce RTX 3060 Ti追風採用了NVIDIA Ampere架構,我們首先來看一下RTX 3060 Ti的提升。
第一代RTX架構 Turing下的RTX 2060 SUPER
第二代RTX架構 Ampere下的RTX 3060 Ti
相較於初代的Turing RTX架構,NVIDIAAmpere架構在算力上有著成倍的增長,這一點在RTX 3060 Ti中依舊有體現,每個時鐘執行2次著色器運算,而Turing為1次,RTX 3060 Ti的著色器性能達到16.2 TFLOPS單精度性能,而Turing為7.2 TFLOPS。
NVIDIAAmpere架構翻倍了光線與三角形的相交吞吐量,RT Core達到31.6 RTTFLOPS,而Turing為21.7 RT TFLOPS。
全新的Tensor Core可自動識別並消除不太重要的DNN權重,處理稀疏網絡的速率是Turing的兩倍,算力高達129.6 TensorTFLOPS,而Turing為57.4 TensorTFLOPS。
RTX 3060 Ti採用GA104核心擁有174億個晶體管,392平方毫米的面積,基於三星的8nm NVIDIA定製工藝,另外在RTX 3060 Ti中我們都知道仍然採用了GDDR6顯存,不過不同於RTX 3080的Micron,RTX 3060 Ti採用了三星的GDDR6顯存。
我們在發佈會中經常聽到性能翻倍的說法,其實是因為本次NVIDIAAmpere的SM在Turing基礎上增加了一倍的FP32運算單元,這就使得每個SM的FP32運算單元數量提高了一倍,同時吞吐量也就變為了一倍。
而通常我們計算顯卡的CUDA數量,並不是把SM中的所有單元加起來計數,而是隻統計FP32單元的數量,所以這樣一來,SM中的【FP32 : INT32】 從 1:1 變為 2:1。
RTX 3060 Ti共有4864個CUDA,其實它有2432個INT32單元,但由於內部的FP32數量翻了一倍,所以最終實現了4864這個驚人的數字。
而這樣粗暴的提升CUDA數量對於遊戲其實有著非常大的幫助,通常在遊戲中浮點運算相比整數計算要常用的多,圖形、算法以及各種計算操作中著色器工作負載通常需要混合使用FP32算數指令,而FP32的加速也有助於光線追蹤降噪著色器。
光追工作原理示意
在此次的NVIDIAAmpere架構中,NVIDIA官方宣佈為第二代RT Core,它和第一代有什麼不同呢。首先要知道RT Core的工作原理是,著色器發出光線追蹤的請求,交給RT Core來處理,它將進行兩種測試,分別為邊界交叉測試(Box Intersection testing)和三角形交叉測試(Triangle Intersectiontesting)。基於BVH算法來判斷,如果是方形,那麼就返回縮小範圍繼續測試,如果是三角形,則反饋結果進行渲染。
而光線追蹤最耗時的正是求交計算,因此,要提升光線追蹤性能,主要是對兩種求交(BVH/三角形求交)進行加速。
RT Core的變化
在Turing的RT Core中,可以每個週期完成5次BVH遍歷、4次BVH求交以及一次三角形求交,在第二代RT Core 裡,NVIDIA增加了一個新的三角形位置插值模塊以及一個的額外的三角形求交模塊,這樣做的目的是為了提升諸如運動模糊特效時候的光線追蹤性能。
運動模糊渲染原理
第二代RT Core可以讓光線追蹤與著色同時進行,進行的光線追蹤越多,加速就越快,它將光線相交的處理性能提升了一倍,在渲染有動態模糊的影像時,按照NVIDIA自己的實測,比Turing快8倍。
稀疏深度學習
Tensor Core可以看作是GeForce RTX GPU上的AI大腦。可加速用於深度神經網絡處理功能的線性代數,這是現代AI的基礎。例如用於AI超分辨率的NVIDIA DLSS和用於AI增強的聲畫處理技術NVIDIA Broadcast應用。
在本次的NVIDIA Ampere架構的Tensor Core也得到了極大地加強,在第三代Tensor Core中,NVIDIA引入了稀疏化加速,可自動識別並消除不太重要的DNN(深度神經網絡)權重,同時依然能保持不錯的精度。
首先原始的密集矩陣會經過訓練,刪除掉稀疏矩陣,再經過訓練稀疏矩陣,從而實現稀疏優化,進而提高Tensor Core的性能。
與此次RTX 30系顯卡一同發佈的還有一項新技術——RTX IO。目前很多遊戲動輒幾十G甚至百G的安裝空間,對於存儲空間的負擔暫且不提,但存放在硬盤中的數據,如果顯卡想要讀取到,需要先由CPU從硬盤中讀取壓縮過的數據,經過解壓縮再發送到顯存中。
雖然隨著NVMe SSD的推出,讀取速度相較機械硬盤能夠快20倍,但受制於傳統I/O限制,NVMe高達7GB/秒的高速讀寫對於CPU是極大的負擔。
傳統的數據交換
在這個過程中,會佔用多個CPU核心,壓力急劇增大,佔用較多的內存,而此時其實GPU是處於閒置狀態的。RTX IO的作用就是越過CPU解壓再傳輸數據這一步,直接從PCIE總線讀取硬盤上經過壓縮的數據,並且完成無損GPU解壓,降低CPU佔用,變向提升了性能。
RTX IO可以極大解放CPU負擔
當然這項技術作為系統底層的運行方式改變,還需要藉助微軟發佈的DirectStorage來實現,對於目前容量的遊戲來說,RTX IO的改善效果有限,但假以時日等遊戲容量上百G成為常態的時候,這項技術將會發揮巨大的功效。
同時搭配新增的HDMI 2.1接口,可以支持單線8K的視頻輸出,而上一代HDMI 2.0僅支持4K 98Hz的視頻輸出,如果想要連接8K電視,則需要更多的線纜支持。
033DMARK理論性能測試
首先介紹一下測試平臺,為了保證此次評測能夠發揮耕升GeForce RTX 3060 Ti追風顯卡的最佳性能,主板和CPU採用了目前桌面旗艦級配置,具體如下。
在測試成績上,基準測試採用3DMARK,遊戲性能測試使用遊戲自帶Benchmark,同時為了減小誤差,每項測試成績均測試3遍取平均值。
GPU-Z參數
首先看一下GPU-Z的參數,軟件更新到2.36已經可以正確顯示核心並修復了紋理單元識別錯誤的情況。RTX 3060 Ti採用GA104核心,三星8nm工藝,芯片面積392平方毫米,擁有4864個CUDA,耕升GeForce RTX 3060 Ti追風的頻率與公版相同為1410-1665MHz。採用8GB GDDR6顯存,位寬為256bit,顯存帶寬達到了448GB/s,光柵單元和紋理單元為80和152。
下面先進行的是用來衡量顯卡DX11理論性能的3DMARKFS套裝:FS,FSE,FSU三者分別對應顯卡在1080P、2K、4K的理論性能,取顯卡分數實際測試結果如下:
3D MARK FS套裝測試
在針對顯卡DX11性能的3DMARK FS套裝測試中,我們主要對比耕升GeForce RTX 3060 Ti追風和RTX 2080 SUPER,整體來看各項成績中均小幅領先RTX 2080 SUPER;各項成績差值在1-4%之間。
3D MARK TS套裝測試
而在針對DX12環境下的Time Spy和Time Spy Extreme測試中,耕升GeForce RTX 3060 Ti追風領先RTX 2080 SUPER更多,在TSE成績中領先8%。
3D MARK 光追測試
PortRoyal是3DMARK中專門針對光追性能的測試項,耕升GeForce RTX 3060 Ti追風的測試結果要優於RTX 2080 SUPER,但幅度不大為3%左右。
在理論測試中,耕升GeForce RTX 3060 Ti追風可以說是RTX 2080 SUPER的OC版,雖然提升不大,但我們時刻不要忘記,兩款顯卡差了2000多元。
04遊戲性能測試
在遊戲性能測試中,我們選擇了《古墓麗影:暗影》、《德軍總部新血脈》、《孤島驚魂5》、《刺客信條:奧德賽》、國產遊戲《邊境》、《光明記憶:無限》的benchmark跑分軟件。
另外在遊戲測試中,由於顯卡驅動的版本更新和遊戲更新非常影響遊戲幀數,所有benchmark跑分成績均以本次成績為準。
《古墓麗影:暗影》遊戲測試
《古墓麗影:暗影》遊戲測試
由於本次的參測顯卡比較多,而古墓麗影分為標準測試和光追DLSS效果的測試,故分為兩張表格進行對比,共2組6測。第一組為預設最高畫質下,RTX OFF/DLSS OFF;第二組為預設最高畫質下,RTX 超高/DLSS ON。
其中不難看出RTX 3080仍然遙遙領先,耕升GeForce RTX 3060 Ti追風也要小幅領先RTX 2080 SUPER的分數,但是差距不大。
《德軍總部新血脈》遊戲測試
《德軍總部新血脈》由於自帶兩個benchmark,所以我們的數據取跑分均值。耕升GeForce RTX 3060 Ti追風相較RTX 2080 SUPER在1080P分辨率下提升7%,2K分辨率下提升16%,4K分辨率下提升4%。但從如此規整的等差數列中,不難發現RTX 3080原本不應該是這個水平,其中不知道是驅動問題還是遊戲更新所致。
《刺客信條:奧德賽》遊戲測試
接下來是《刺客信條:奧德賽》,其中耕升GeForce RTX 3060 Ti追風比RTX 2080 SUPER在1080P分辨率下分數高2%;2K分辨率下高4%;4K分辨率下高9%。
《孤島驚魂5》遊戲測試
《孤島驚魂5》同樣算是優化比較到位的3A大作,耕升GeForce RTX 3060 Ti追風比RTX 2080在1080P分辨率下分數高2%;2K分辨率下高14%;4K分辨率下高18%。
《光明記憶:無限》遊戲測試
《光明記憶:無限》是由飛燕群島工作室開發的《光明記憶》新系列,目前還沒有遊戲提供試玩,不過benchmark的跑分軟件官方已經提供,玩家可以在steam上自行下載。另外我們在測試的時候由於無法關閉光追選項,故所有測試成績均為“RTX 最高/DLSS 質量”模式下進行。
這款benchmark跑分軟件在光追效果最高的情況下,運用了多種光線追蹤技術,所以即使強如RTX 3080在4K分辨率下也只能跑到35幀。
《邊境》遊戲測試
《邊境》同樣是一款來自柳葉刀工作室的國產3A大作,具體發售日期不明,目前僅提供了benchmark跑分軟件。同樣的目前跑分軟件不支持關閉光追選項,所以在測試時我們選擇“RTX 最高/DLSS 性能”下進行。
05溫度與功耗測試
在溫度功耗測試方面,室溫24℃,我們並沒有採用全封閉式的機箱,而是採用測試平臺的方法,這樣做可以最大限度的保證顯卡除了自身散熱外將風道等外因減小到最低。
功耗測試中,我們選擇FurMark軟件進行拷機測試,功耗僅計算顯卡自身。作為一款甜品級顯卡耕升GeForce RTX 3060 Ti追風的功耗要小得多,在峰值情況下整體平均在200W左右。
溫度對比
溫度方面,本次的耕升GeForce RTX 3060 Ti追風溫度相對公版低了7-8℃,出色的散熱設計在10多分鐘的拷機中,溫度保持在67℃。
06部分遊戲光追效果展示
上面我們測試了部分遊戲的光追和DLSS性能表現,這些效果具體在遊戲中是什麼表現,下邊筆者選擇了兩款遊戲給大家展示一下。
《堡壘之夜》RTX ON(點擊查看大圖)
《堡壘之夜》RTX OFF(點擊查看大圖)
堡壘之夜的光追效果還是比較明顯的,其中加入了反射、全局照明和路徑追蹤等效果。卡車車身上的反射較為明顯,角色身上的環境光在打開光追後更為寫實,另外仔細看的話遠處建築物的玻璃同樣有光線的反射,整體畫質改善非常明顯。
《魔獸世界9.0》RTX ON(點擊查看大圖)
《魔獸世界9.0》RTX OFF(點擊查看大圖)
第二組對比來自最新的《魔獸世界9.0》,同樣作為一款卡通渲染的網遊來說,魔獸的年代更加久遠,此次加入光追效果在整體視覺上沒有堡壘之夜明顯。不過如遠處的樹木陰影,以及近處石臺下方的陰影都比較明顯。
《控制》RTX ON(點擊查看大圖)
《控制》RTX OFF(點擊查看大圖)
第三組對比為《控制》遊戲,這款遊戲所採用的引擎物理效果非常出色,同時光追開關的對比也是肉眼可見的明顯。包括玻璃上的人物反光,遠處地面的植物反光都比較清晰,同時打開光追後屋頂處的明暗對比也更加明顯。
07軟硬兼施 鑄就Ampere
好的硬件沒有軟件的加持,相當於空有長柄沒有槍頭,想要發揮十成威力則必須軟硬搭配,反之亦然。此次隨著發佈會共同推出的還有以下幾項非常值得大家關注。
NVIDIA Reflex
以往我們關注延遲大多從顯示器上瞭解到幾毫秒極速響應,但那隻是作為最終端的顯示輸出效果,你是否想過從系統內部到實際看到的畫面有多大延遲?
NVIDIA Reflex
在20系顯卡中NVIDIA反覆提及的“幀能贏”,在30系顯卡中也做了更進一步的突破,除了NVIDIA將推出自己的電競顯示器NVIDIA 360Hz G-SYNC ESPORTS,還有NVIDIA Reflex技術。
以往如果想測量系統延遲需要高速相機以及定製的LED鼠標電路。而使用帶有NVIDIA Reflex技術的顯示器將內置精確的延遲分析工具,可在CPU和GPU中優化渲染管道,極大減少延遲時間,將系統延遲整體降低至30ms以下。不過就像圖中所示,為此你需要一個支持反射延遲分析的鼠標。
NVIDIA Broadcast
NVIDIA Broadcast是一款易用且專業的直播軟件,它的強大之處就在於主播不再需要任何的背景佈置,只需要一個普通的攝像頭和一張GeForce RTX系列的顯卡即可。
它戳我臉!
這款軟件可以讓你雜亂無章的房間立即變成直播間,其內置了音頻降噪、背景虛化、虛擬背景、頭部追蹤等功能。NVIDIA Broadcast的工作原理是利用AI算法通過DGX超級計算機深度學習而來。
NVENC編碼
同時RTX 30系顯卡擁有目前最好的硬件解碼器,大部分用戶的電腦在直播時打開OBS推流後CPU佔用會直接飆升到50%左右,而基於GPU的NVENC解碼可以極大地減輕CPU負擔。
NVIDIA Studio
對於內容創作者來說,提到軟件可能大部分只會想到內容創作的相關軟件,但NVIDIA專為內容創作者推出的NVIDIA Studio驅動則是承擔著連接創作軟件和顯卡功能的關鍵。
NVIDIA Studio
NVIDIA Studio驅動經過更新與優化,對於最新版本的Adobe系列軟件支持更為穩定,同時附帶更出彩的創作功能。利用NVIDIA CUDA技術,GPU加速特效可實現更快的實時視頻編輯並加速渲染輸出,並讓原本只能進行軟件編碼輸出的視頻輕鬆得到硬件的支持。另外在AI計算方面的優勢,包括自動標記片段、特效追蹤和人臉識別等功能,都有顯著的速度提升。
以GPU渲染為14.98秒 而CPU渲染為11分鐘
當然NVIDIA Studio的加速創作絕不止Adobe一家,DaVinci、Keyshot、Blender、D5等專業軟件中都有非常亮眼的表現。不僅能提供強大且穩定的運行環境,更能以GPU加速,有效提升創作效率。
01耕升GeForce RTX 3060 Ti追風外觀
從性能上來說,RTX 3060 Ti給了我們足夠的精細,作為一款甜品卡,原本以為只是能超過RTX 2070 SUPER的性能,沒想到一舉超過了RTX 2080 SUPER,並且在售價上保持了與RTX 2060相同。
耕升GeForce RTX 3060 Ti追風
而這其中的區別不僅僅是價格,全新的NVIDIA Ampere架構採用了第二代RT Core和第三代Tensor Core,在光線追蹤和AI學習方面都有不同程度加強,還擁有更高的能耗比。
另外從遊戲方面來說,這款甜品卡同樣有著非常恐怖的性能,完全可以滿足在2K分辨率下的高幀率遊戲體驗,甚至大部分遊戲在4K分辨率下也可以保障60幀的流暢運行。
耕升GeForce RTX 3060 Ti追風
個人認為耕升GeForce RTX 3060 Ti追風完全可以滿足絕大部分玩家的日常需求,不管是深度辦公、後期剪輯還是3A遊戲,都能有出色的表現。尤其對於遊戲玩家來說,作為甜品卡的RTX 3060 Ti在現階段暢玩任何3A大作都不成問題。
(7568394)
轉載請超鏈接註明:頭條資訊 » 耕升RTX 3060 Ti追風評測 等風來不如追風去
免責聲明 :非本網註明原創的信息,皆為程序自動獲取互聯網,目的在於傳遞更多信息,並不代表本網贊同其觀點和對其真實性負責;如此頁面有侵犯到您的權益,請給站長發送郵件,並提供相關證明(版權證明、身份證正反面、侵權鏈接),站長將在收到郵件24小時內刪除。