2013.12.06 09:02

平價單核 Hawaii R7、R9 新舊 GPU 混搭風:XDMA 串連技術,多螢幕效能實戰

ADVERTISEMENT

架構篇:R9 290X 完全解析

R7、R9系列共計有R7 260X、R9 270X、R9 280X、R9 290、R9 290X,但先前也說過,R7 260X等同HD 7790、R9 270X等同HD 7870、R9 280X等同HD 7970,只有R9 290與R9 290X算是新的核心。因此,接下來編輯部不贅述以前曾介紹過的R7 260X、R9 270、R9 280X等卡,評測重心放在這次搭載Hawaii核心的R9 290X身上。

XDMA 串連技術

很多人看到R9 290X的第一個反應都是,怎麼沒了CrossFire的金手指,是不支援多卡模式了嗎?事實上R2 290與R9 290X仍支援CrossFire,且不需要使用以往位於顯卡頂端的橋接器。Hawaii核心架構內建硬體DMA引擎,此硬體是為了UHD輸出與Eyefinity而設計,串連GPU免用橋接器的XDMA只是附屬的功能,且支援Frame Paceing同步技術,幀與幀之間的延遲也會下降。透過PCI-E 3.0的頻寬即可提供GPU與GPU溝通,不用再另闢路徑同步輸出訊號,或許會有助於提升串連效率。

XDMA 運作方式

 ▲(傳統橋接)

ADVERTISEMENT

 ▲(XDMA技術)

目前主流的橋接方式是透過顯卡頂端金手指,更早之前還有透過DVI纜線的橋接的版本。因為PCI-E 3.0頻寬足夠使用,透過晶片組就能傳輸,不需要再安裝橋接器,未來或許NVIDIA也有可能使用相關技術。

Hawaii 核心規模擴大

R9 290X使用的仍是GCN架構,與前代HD 7970使用的Tahiti核心相比,差異在於多了DMA引擎、XDMA、Ture Audio等硬體設計。重要的是,Hawaii擴增了核心規模,ALU(Arithmetic Logic Unit,算數邏輯單元)或稱SP(Stream Processor,串流處理器,與NVIDIA的CUDA Core意義相同)數量從2048個增加到2816個,數量增加幅度為37.5%。

ADVERTISEMENT

Hawaii的核心架構類似但不同於Tahiti,GPU內最大的硬體單元稱為Shader Engine總計有4組。每組Shader Engine中,共有11組CU(Computing Unit)。從架構上來說,Hawaii比Tahiti多了2組Geometry Processor,ROP數量也從32個增加到64個。

前端單元中,Tahiti只有2個ACE(Asynchronous Compute Engine,異步運算引擎),Hawaii則是增加到8個。且能力也有所提升,先前每週期可管理2個任務,現在則是增加到8個,前後代管理能力分別為4個與64個。恰巧的是,PS4的ACE配置跟Hawaii完全相同,這也留給大家想像的空間。因為規模增加,核心面積變為438m㎡。在同樣在28nm製程下,核心面積只增加24%的情況,電晶體數量卻增加了近50%,改變幅度非常大。

介面頻寬高達 512bit

此外在記憶體方面改動也相當明顯,記憶體介面頻寬(Memory Interface Width)將增加為512bit。顯示卡歷史上僅有R600核心的HD 2900XT,以及GT200核心的GTX 280使用過512bit的記憶體控制器。此舉有助於提升記憶體與GPU之間溝通的效率,但增加記憶體介面頻寬就得提高GPU記憶體控制器頻寬。一般而言這會需要增加大量的電晶體,還記得當年那R600跟GT200巨大的核心嗎?如今製程改良,應該不至於會出現相同的結果。

ADVERTISEMENT

事實上,Hawaii的核心架構密度相當高,512bit記憶體控制器面積比前代386bit佔用的面積還要小。記憶體方面雖然時脈降低,但記憶體介面頻寬增加,使得記憶體頻寬提升20%以上。而記憶體方面的改良,或許會成為AMD在UHD大戰當中的利器也說不定。

CCC 的安靜模式

除了顯卡方面的改進外,CCC主控台也有不小的改變。以往核心時脈皆以MHz為調整單位,現在則是改用百分比為單位,設計類似NVIDIA的Boost功能。R9 290X可使用安靜模式,該模式可自由調整GPU溫度與風扇轉速的關係式。若將GPU目標溫度提升、風扇轉速降低,就能達到類似廠商自製卡那種低噪音的使用體驗。最高時脈、最高溫度、最高轉速都可自行設定,但設定值僅供系統參考,畢竟你設定出的參數顯卡不見得能辦到。當然,要溫度低、安靜、高效能,肯定是辦不到的事情。

 ▲GPU當中最大的電晶體單位是Shader Engine,下一層則是CU(Computing Unit)。相較於Tahiti的電晶體數量,Hawaii足足增加了近50%。除了ALU增加外,ACE、RB(Render Back ends)數量也是倍增,周邊的硬體單元像是Ture Audio、XDMA等也使用了不少的電晶體與核心面積。下方表示MC的則是記憶體控制器,每組64 bit,8組共計512 bit。

ADVERTISEMENT

 

ADVERTISEMENT