Dc5306d6ed6dab48db9983d8f2b202ba 雖然慢了點,Intel IDF 舉辦時還是釋出了 Skylake 平台較為詳盡的資料,本次為 處理器所整合第九代繪圖顯示核心,資料顯示剛上市不久的 Core i5-6600K Core i7-6700K,架構上依然使用 EU 組合成 SubsliceSubslice 再組合成 Slice,依據產品型號不同,最高可整合 3 Slice

Skylake 架構和前代 Haswell 相同,繪圖核心可和處理核心共享 LLC(L3 快取)使用權,不同的是 eDRAM 管理方式改變,Skylake 將 eDRAM 控制器放在 System Agent,LLC 就可空出 512KB 的位置改放程式資料,而現在 eDRAM 被視為 LLC 和主記憶體之間的 memory side 快取。

eDRAM 和處理器其它部分放在同一封裝內,擁有自己的運作時脈,最高可達 1.6GHz,讀取和寫入匯流排分離,每個時脈分別各有 32byte 的吞吐量。依據不同的處理器配置,可能為 64MB~128MB 容量,也有可能完全沒有,如已發售的 Core i7-6700K 就沒有整合 eDRAM。


▲Core i7-6700K 的晶片照和功能區塊圖。

第九代繪圖顯示核心的記憶體階層改進部分,尚有 SVM(Shared Virtual Memory,共享虛擬記憶體)的寫入效能增長,這是得益於新的 LLC 管理策略和可用空間加大的結果。材質樣本現在原生支援 NV12 YUV 格式,可和運算 API 或是媒體固定功能單元有更好互動。

此外 EU 現在也支援執行緒層級的多工處理,可將目前的執行緒中斷執行其它的執行緒,循環輪替式(round-robin)排程和 32bit 浮點數原子式操作(執行途中不會被中斷)也在支援列表中。

第九代繪圖顯示核心依然保有前幾代的組合彈性,可依市場、效能、消耗功率等條件,組合出不同的產品。EU 執行單元與 Haswell 並沒有什麼太大不同,每個 EU 有 7 組線程,每組線程有 128 個 SIMD-8 32bit 通用暫存器。每個 EU 每個時脈最高可發送(issue)4 個指令給後端的單元,包含 2 組 SIMD 浮點單元(也可處理整數)、1 組分支、1 組發送。


▲單個 EU 的結構。

Subslice 維持第八代 8 個 EU 為 1 組的傳統,每個 Subslice 內部包含可依據每個 EU 工作負荷量,進行執行緒配發的 Local Thread Dispatcher,以及負責材質影像處理的 Sampler,資料輸入輸出的 Data Port。匯流排頻寬也無增減,Sampler 每個時脈可讀入 64byte,Data Port 每個時脈則是讀寫各 64byte。


▲單一 Subslice 結構。

第八代、第九代的 Slice 部分由 3 組 Subslice 組成,Slice 也是未來 Intel 在組合不同效能繪圖處理器時的單位,或是直接遮蔽 Subslice 內部的 EU。目前已推出的 Core i7-6700K 和 Core i5-6600K 的 Intel HD Graphics 530,就是僅有 1 組 Slice 的組合。

單一 Slice 包含分配執行緒的線路、768KB 容量 L3 快取(第八代為 384KB~576KB)、1 組比較小的本地分享記憶體結構(存放各組 EU 共享的資料),供媒體或繪圖使用的固定功能單元。各組 Subslice 除了和 L3 快取有自己的獨立通道之外,L3 快取和外界也有 1 組每時脈週期讀寫各 64byte 的通道。


▲單一 Slice 結構。

若是要將 Slice 組合成不同等級的產品,最後還需要不同的功能組合,Command Streamer 把從驅動程式傳來的 command stream 解析成眾多指令,Global Thread Dispatcher 再把這些指令分配給下面的 Slice,也會設法平衡各個 Slice 的工作負擔。

第九代繪圖顯示核心和處理器其它部分溝通,依靠 Graphics Technology Interface 進行,而 Graphics Technology Interface 意義上直接和 LLC 進行連結。和第八代相同,與 LLC 相連的介面通道寬度有 2 種設定,1 種為高效能的每時脈週期 64byte 讀、64byte 寫,或是較低功耗的 64byte 讀、32byte 寫。


▲整合 3 組 slice 的示意圖。

整體來說,第九代繪圖顯示核心在硬體方面進步不算大,文件上標示的最大峰值運算速度也與第八代相同。不過就目前已發售的 Core i5-6600K 和 Core i7-6700K 來看,使用的 HD Graphics 530 為完整的 3 組 Slice 共 24 個 EU,不像 Core i5-4690K 和 Core i7-4790K 配備的 HD Graphics 4600 只有 20 個 ,運算單元的多寡成為目前 Skylake 和 Haswell 繪圖效能的分野。

資料來源

The Compute Architecture of Intel Processor Graphics Gen8

The Compute Architecture of Intel Processor Graphics Gen9

延伸閱讀

Intel 第六代 Core 微架構,Skylake 資訊快速瀏覽

Intel Skylake 平台解禁登場,第六代 Core 製程躍進電力效率比再提升

使用 Facebook 留言

發表回應

謹慎發言,尊重彼此。按此展開留言規則