2012.01.30 10:46

AMD HD 7970 之 GCN 架構完全解析,帶來 GPU 革命

ADVERTISEMENT

改革點在於執行方式

從VLIW 4到Non-VLIW架構,差異點在於執行方式。前者雖然每周期可執行4次操作(Operations),但說穿了還是1條指令。而且先前也說過,這種架構非常依賴指令最佳化,才能發揮最高效益。

而Non-VLIW架構也就是GCN,雖然每次只能執行1個ALU操作,但是4組SIMD可同時執行4條執行緒。且每項操作都是Occupancy Limitation,可讓使用率接近100%。理論上GCN架構在指令層面以及使用率層面,都會比以往更有效率。

ADVERTISEMENT

▲VLIW 4與Non-VLIW架構差異最大處在於執行方式,前者只能接受1條指令,後者可執行指令增加,且核心使用率更高,效能自然會表現比較好。

複雜的記憶體共享架構

說到GCN就不得不講它的記憶體架構,由於CU內有向量運算單元又有純量運算單元,讓架構變得很複雜。每個CU有獨立的16KB L1快取,CU內每個向量運算單元又有64KB的暫存器,每4個CU再共用16KB Instruction Cache(指令快取)以及32KB Scalar Data Cache(純量資料快取)。而且所有L1快取都是可讀寫操作,並非上代只能讀取。至於L2快取則透過64bit介面與L1連接,且所有L2都是同步且可供任何CU存取。

AMD將此L1共享命名為GDS(Global Data Share,全局資料共享),認為此設計有益於CU之間的同步,原文為「Global Data Share facilitates synchronization between CUs」。

ADVERTISEMENT

GCN的設計不難看出AMD相當重視資料同步,CU內LDS本地快取都能直接與L2連接,所有資料都是CU共享。更強的是還能跟系統記憶體同步,提高了處理器與顯示核心的交換能力,對於AMD這種有CPU又有GPU的廠商特別有利。

▲GCN的快取共享機制十分複雜,CU間可共享L1、L2快取,每個CU也有獨立的快取,有意於CU間的資料同步。

ADVERTISEMENT

X86虛擬記憶體

不能不提的是,這次GCN支援X86 Virtual Memory(X86虛擬記憶體)功能。簡單來說就是將顯卡上GDDR5記憶體,虛擬為處理器可識別的系統記憶體。HD 7970使用的GDDR5記憶體頻寬(Memery Bandwidth)高達264GB/s,一般四通道DDR3頻寬則只有30~50GB/s不等,遠超過現在X79四通道DDR3所提供的頻寬數倍。透過虛擬記憶體,有助於GPGPU運算以及部分3D遊戲。

▲GDDR5記憶體頻寬高達264GB/s,而四通道的X79也不過30~50GB/s,透過虛擬記憶體技術,可讓顯卡記憶體被識別為系統記憶體。

ADVERTISEMENT

暫時無用的DX 11.1

雖然HD 7970是第一張支援DirectX 11.1的顯卡,但硬體走在軟體前面有時是種不幸。由於API實在太新,導致沒有遊戲以及作業系統可支援。至少得等到Windows 8推出之後才有可能支援新API,當下支援DirectX 11.1宣示意義大於實質意義。

DirectX 11.1與以往DirectX 9.0c、DirectX 10.1一樣是個更新的小版本,並非導入新功能,而是改進自身技術。但是DirectX 11.1有個新功能只有支援DirectX 11.1的顯卡才能開啟,那就是TIR(Target Independent Rasterization)姑且直譯為目標獨立光柵。

此功能必須硬體配合才能開啟,因此過去的DirectX 11顯卡不可能透過驅動更新等方式取得。不過DirectX 11.1得等到Windows 8上市,上市之後還要等遊戲支援,看樣子DirectX 11.1還有段很長的路要走。

革命還沒結束

這次HD 7970測試受到AMD不對等的媒體政策箝制,歐美媒體早在12月底就能測試並報導,而其餘地區只能在1月9日正式解禁後拿到顯卡。HD 7970的新技術不只上述這些,另外還有記憶體除錯機制、通用運算機制、Eyefinity 2.0、ZeroCore、VCE編碼引擎、PCI-E 3.0介面、GPU解壓縮應用等等,當然還有最重要的效能測試,小編已經完成HD 7970的實測,會儘快用另一篇文章做說明。

整體來看,GCN架構是包著MIMD皮的SIMD架構,某些方面跳脫以往效率不彰的問題,但是新架構勢必需要時間最佳化,或許下個世代會看到更完整的設計。但是不論如何,目前的設計看來,GCN改進之處非常多,有令人期待之處,但也令人擔心的是,這段路NVIDIA早在2年前就開始走了,是否能一舉超過對手,還得等時間證明。

延伸閱讀:

ADVERTISEMENT