GDDR6 和記憶體壓縮

隨著螢幕解析度越來越高,繪圖技巧日趨複雜,GPU 不僅需要更快的繪圖記憶體,也需要更多的繪圖記憶體容量,NVIDIA 繼首先採用 GDDR5X 和 HBM2 之後,Turing 架構也率先採用了 GDDR6 繪圖記憶體。

GeForce RTX 2080 和 GeForce RTX 2080 Ti 均採用 14Gbps 速度 GDDR6,單一封裝為雙通道 16bit 共 32bit。欲達成 14Gbps 速度,NVIDIA 仔細地設計內部記憶體控制器與電路板佈線,減少串音干擾達 40%。另外根據 GDDR6 製造商 Micron 資料,GDDR6 DQ 資料傳輸針腳被 Vss 圍繞,能夠提供較好的訊號傳輸品質。

為了避免眼圖在接收端張得不夠開,影響 0 與 1 的判斷,GDDR6 每次接收資料時都可以設定 VREFD,而 GDDR5X 則是以每資料 byte 為單位設定;另外還有 1-tap DFE(Decision Feedback Equalization),當正確偵測到 1 個 bit 訊號時,統合對傳輸通道的量測結果,即可計算出此 bit 對接下來訊號的干擾並去除,以便更容易判斷下個 bit 訊號是 0 或 1。

接收方眼圖張得越開,表示更容易判斷傳輸訊號為 0 或是 1
▲接收方眼圖張得越開,表示更容易判斷傳輸訊號為 0 或是 1。

Turing 架構再次升級記憶體壓縮技術,減少資料從 GDDR6 記憶體搬移至 L2 快取,或是材質單元之間、畫面緩衝區的資料傳輸量。加總 GDDR6 記憶體頻寬進步和增強壓縮技術,Turing 的有效頻寬與 Pascal 相比提升 50%。

GeForce RTX 2080Ti 記憶體有效頻寬,大約比 GeForce GTX 1080 Ti 提升 50%
▲GeForce RTX 2080Ti 有效記憶體頻寬,大約比 GeForce GTX 1080 Ti 提升 50%。

視訊功能加強

顯示卡對於部分玩家而言,打電動為其最主要的功用,另外也有一派玩家用來加速視訊影片編碼與解碼。Turing 內部包含加強版 NVENC 編碼器,支援 HEVC 8K@30FPS HDR 影片編碼,並可於 HEVC 編碼解省最高 25% 流量、H.264 編碼亦可節省最高 15% 流量,影片壓縮畫質也比 Pascal 世代或是軟體壓縮(fast 等級演算法)來得好。

NVDEC 解碼器同時更新,以 30FPS 的速率解碼 HEVC YUV444 色深 10bit/12bit HDR 影片,或是 H.264 8K 和 VP9 色深 10bit/12bit HDR 影片。Turing 原生支援 ITU-R Recommendation BT.2100 色調映射,避免在不同的 HDR 螢幕出現色調偏移現象。

4K 解析度影片壓縮串流對於 CPU 負荷不小,使用 Turing 架構的硬體壓縮功能,可以將遊戲效能下滑幅度控制在 1%
▲4K 解析度影片壓縮串流對於 CPU 負荷不小,使用 Turing 架構的硬體壓縮功能,可以將遊戲效能下滑幅度控制在 1%。

DXVA Checker 所示資訊,HEVC 和 VP9 均支援 8K 解析度影片解碼
▲DXVA Checker 所示資訊,HEVC 和 VP9 均支援 8K 解析度影片解碼。

Founders Edition 視訊輸出連接埠提供 3 個支援 DSC(Display Stream Compression)1.2 的 DisplayPort 1.4a,最高可以輸出 8K@60Hz,另外也保留 1 個 HDMI 2.0b,最高支援 4K@60Hz,HDCP 2.2 加密支援性也不成問題。特別的是新增 1 組 USB Type-C 並支援 VirtualLink,將 VR 頭戴顯示器需要的電源、影像、資料傳輸集中於 1 條纜線。

Scanner API 與多相轉換效率

從 GeForce RTX 2070、GeForce RTX 2080、GeForce RTX 2080 Ti 的 Founders Edition 發表之初,就可以嗅到與前一世代不太相同的味道,Turing 世代特地強調超頻性,連 NVIDIA 官方 Founders Edition 版本都有不同程度的超頻。

NVIDIA 這次自行放入超頻專用 Scanner API,只要在支援的軟體按下按鈕,即可透過 NVIDIA 自己的測試演算法和工作負載,自動找尋這張顯示卡的最高頻率。目前已知 EVGA 的 Precision X1 軟體會支援 Scanner API,經過 20 分鐘即可自動超頻完成,相信其它廠商軟體在不久的將來也會跟進。

輕鬆按個按鈕,透過 Scanner API 即可找尋顯示卡最高運作時脈,自動超頻完成
▲輕鬆按個按鈕,透過 Scanner API 即可找尋顯示卡最高運作時脈,自動超頻完成。

GeForce RTX 2080、GeForce RTX 2080 Ti 的 Founders Edition 顯示卡,相較過去 GeForce GTX 1080 和 GeForce GTX 1080 Ti 採用更多的電源轉換相位,除顯而易見用來應付碩大晶粒的耗電,並兼顧轉換效率避免多餘廢熱,能夠根據實際耗電量的不同,由低至高分別開啟 1 相至全體,讓轉換效率維持在最高的狀態。

多相位轉換雖然保證較大的功率輸出,卻不保證擁有最好的轉換效率,Founders Edition 可以根據實際的耗電量多寡,調整使用電源相位轉換數量
▲多相位轉換雖然保證較大的功率輸出,卻不保證在所有功率輸出範圍均擁有最好的轉換效率,Founders Edition 可以根據實際的耗電量多寡,調整供電相位轉換數量。

NVLink SLI

TU102 和 TU104 均支援 2 張顯示卡 SLI 串聯運算,2 張顯示卡透過 NVLINK 傳輸繪製完畢的畫面以及相關資料,串聯方式限制 2 張顯示卡(2 個 GPU),3-way 和 4-way 串連方式不受 Turing 架構所支援。TU102 具備 2 個 8 通道第二代 NVLINK,雙向頻寬為 100GB/s,TU104 則具備 1 個 8 通道第二代 NVLINK,雙向頻寬為 50GB/s。(註:單向頻寬減半)

NVLINK 橋接器具備多種間隔版本,不變的是每個要價美金 79 元,折合約新台幣 2,500 元,想要跟著顯示卡或是主機板隨貨贈送有相當難度
▲NVLINK 橋接器具備多種間隔版本,不變的是每個要價美金 79 元,折合約新台幣 2,500 元,看看哪個佛心廠商跟隨顯示卡或是主機板一同贈送。

透過 NVLINK 最高可達雙向 100GB/s 頻寬,讓 GeForce RTX 2080 Ti 支援 8K 解析度環景螢幕組態
▲透過 NVLINK 最高可達雙向 100GB/s 頻寬,讓 GeForce RTX 2080 Ti 支援 8K 解析度環景螢幕組態。

Ansel EXR、AI UP-RES、RT

隨著 Turing 架構加入 Tensor 核心和 RT 核心,多出機器學習和光追蹤運算,在遊戲內擷取畫面的 Ansel 同步出現新功能。EXR 用來擷取 HDR 遊戲畫面,而 AI UP-RES 是經過機器學習訓練之後,可以把原始擷取 1080p 解析度畫面,輸出成 8K 解析度。RT 則是以更高精度、更多光線的光追蹤運算方式,產生有如真實世界相片的截圖,由於截圖時不講究畫面輸出速率,因此不必擔心光追蹤運算量。

Ansel RT 能夠以更好的光追蹤運算,輸出栩栩如生的遊戲擷圖
▲Ansel RT 能夠以更好的光追蹤運算,輸出栩栩如生的遊戲擷圖。

 

(下一頁:Founders Edition 硬體分析)

使用 Facebook 留言

發表回應

謹慎發言,尊重彼此。按此展開留言規則