2016.07.19 21:00

NVIDIA GeForce GTX 1060 實測,新中階強卡性能堪比 GeForce GTX 980

ADVERTISEMENT

NVIDIA 於本月初 7 號,發布第三款 Pascal 架構產品 GeForce GTX 1060 訊息,但性能數據露出與上市時間推遲至 19 號晚間才解禁。GeForce GTX 1060 定位在主流性能價格帶,基本而言是要用來取代 GeForce GTX 960,可期待 Pascal 架構帶來性能大躍進。

Pascal 陸續登場,性能堪比高兩階 Maxwell 舊品

NVIDIA 在去年 1 月底,正式推出新一代中階顯示晶片 GeForce GTX 960,除了基於二代 Maxwell 架構設計帶來優異的電力效率比,更率先內建支援 H.265/HEVC 格式影片硬體解碼加速功能。到了今年,NVIDIA 改推最新架構 Pascal,已有兩款高階產品 GeForce GTX 1080/1070 上市,取代基於一代 Maxwell 架構設計的 GeForce GTX 980/970。

GeForce GTX 1080/1070 性能表現簡單來說,就是堪比前一代高出兩個等級的自家大哥,例如 GeForce GTX 1070 近乎 GeForce GTX 980Ti,而 GeForce GTX 1080 堪比原單卡王 GeForce GTX Titan X。然而 TDP 卻維持相近或只多出些許的規格,這意味 Pascal 架構的電力效率比又比 Maxwell 來得更精進,能夠以下犯上對自家大哥逼宮。

ADVERTISEMENT

這意味 GeForce GTX 1060 表現也很值得期待,性能超越 GeForce GTX 970 應該是毫無問題,更甚者還能挑戰 GeForce GTX 980。目前正在出清的 GeForce GTX 970 最低價格約 8,490 元,GeForce GTX 980 則是在 15,990 元左右,至於 GeForce GTX 1060 卡廠參考價格為 249 美元(折合約新台幣 7,880 元),市場真實零售價格同樣令人有所期待。


▲ NVIDIA GeForce GTX 1060 Founders Edition(創始版)。

基於 Pascal 架構設計的 GeForce GTX 1060,亦具備同步多重投射(Simultaneous Multi-Projection)技術,NVIDIA 相當強調這項技術功能。SMP 位於 PolyMorph 4.0 引擎單元內,是特別針對環繞顯示與虛擬實境應用設計,改善以往可能出現的比例錯誤之類現象。SMP 最多可支援 16 個 Viewport,指定中央點後只需要經過一次渲染處理,這能降低 3D 幾何圖形運算負載,並且提升多螢幕、VR 應用的效能。

ADVERTISEMENT

GeForce GTX 1060 晶片代號為 GP106,本身有 2 個圖形處理群組(Graphics Processing Clusters),串流多處理器(Streaming Multiprocessor)則為 10 個。每個 SM 擁有 128 個 CUDA 核心,並配備 256KB 暫存器與 96KB 共享記憶體,L1 Cache 則有 48KB。至於紋理單元(Texture Units)與光柵處理單元(Raster Operator Units),數量分別為 80 與 48 個,故 CUDA 總和數量達 1280 個。


▲ GeForce GTX 1060 規格表。

CUDA、記憶體數量增加,但 TDP 維持不變

與高一階的 GeForce GTX 1070 相比,特別是紋理單元與 CUDA 總數少了三分之一左右,但是和被取代者 GeForce GTX 960 相較,除了圖形處理群組同為 2 個,其他單元都增加了不等數量。其架構具有 6 個 32bit 記憶體控制器(總和 192bit),每 8 個 ROP 單元配備 256KB 容量 L2 Cache,因此 L2 Cache 總和容量為 1536K,反觀 GeForce GTX 960 只有 1024K。

ADVERTISEMENT

如前述,GeForce GTX 1060 記憶體介面頻寬設定為 192bit,既有產品則是 128bit。此外儘管維持配備 GDDR5 類型記憶體,但採用顆粒速率達 8Gbps(等效時脈 8000MHz),比起前代產品 7Gbps(7010MHz)高一截。規格標示記憶體頻寬資訊,GeForce GTX 1060 達到 192GB/s,反觀 GeForce GTX 960 只有 112GB/s,兩者相差約 72%。


▲ GeForce GTX 1060 架構示意圖。

在此規格下,GeForce GTX 1060 貼圖填充率標示值為 120.5GT/s,較前代產品 72.1GT/s 高出約 67%。儘管片面規格還是不比前代高階產品,然而加上核心架構差異這變數,其速率還是得以超越 109GT/s 的 GeForce GTX 970。因此 GeForce GTX 1060 的性能表現,要超 GeForce GTX 970、趕 GeForce GTX 980,前者是十拿九穩、後者則是有這機會。

ADVERTISEMENT

GeForce GTX 1060 電晶體總數有 44 億萬個,與 29.4 億萬個的 GeForce GTX 960 相比,多出 49%。但受惠於 Pascal 架構晶片採用 16nm FinFET 製程生產,TDP(Thermal Design Power,散熱設計功率)仍然維持在 120W,同樣只需要 6pin 的 PCIe 輔助電源。儘管架構設計規格有所提升,但是 NVIDIA 拿掉了 SLI 多路顯示卡運作功能,這是否為缺憾見仁見智。


▲ GeForce GTX 1060 創始版電路板完整樣貌。

Pascal 全面支援 HEVC 編解碼,HDR 包括在內

去年登場的 GeForce GTX 960,率先支援 H.265/HEVC 格式影片硬體壓/解壓縮加速,當時的高階與旗艦產品皆並未支援解碼加速,NVIDIA 今年將這機能普及進 Pascal 架構,因此 GeForce GTX 1080/1070/1060 等全面支援。我們使用 Potplayer 簡單試驗,在下方提供播放 H.265/HEVC 與 HDR 格式影片時,硬體加速啟用前後差異讓大家參考。

所支援影片格式大致規格,H.265/HEVC 方面為 4K @ 120Hz/8K @ 30Hz、最高流量 320Mbps,色彩深度 8/10/12bit。至於觀賞網路影片普遍會用到的 YouTube 服務,Google 是主推 VP9 壓縮格式,Pascal 支援規格可達 4K @ 120Hz、最高流量 320Mbps。如果你玩遊戲的同時會用到即時轉播功能,Pascal 內建 H.264、H.265 編碼器,皆可支援 4K @ 60Hz(HEVC 支援 10bit 色彩深度)規格即時壓縮處理。


▲ Pascal 架構對應支援 H.265/HEVC 格式影片硬體編解碼加速。


▲ 4K、H.265/HEVC 影片規格:10bit、59.940FPS、總流量 51.5Mbps。(處理器使用率線條較低部分是啟用硬體加速)


▲ 4K、H.265/HEVC、HDR 影片規格:10bit、59.940FPS、總流量 75.8Mbps。(處理器使用率線條較低部分是啟用硬體加速)

 

(下一頁還有:性能實測)

ADVERTISEMENT