2012.03.13 11:27

安裝 Windows 7 更新檔,實測 AMD FX 處理器效能增加多少?

ADVERTISEMENT

不論是軟體或硬體,革命性新架構都需要時間磨合。AMD 的 (推土機)也有類似的問題,由於採用新設計的 CMT(Clustered Multi Threading,叢集多執行緒)架構,使得 「認不出來這個架構」。現在微軟針對 Bulldozer 提供更新檔,小編實測到底效能增加了多少!

快速目錄:

  • 推土機使用CMT(叢集多執行緒)架構,兼有單晶片多核心、同步多執行緒的優點

不論是軟體或硬體,革命性新架構都需要時間磨合。Intel在2008年首度推出,雖然理論效能遠高於當代處理器,但是實測中也發現不少軟體或遊戲的效能「出不來」。

Win 7 認不出推土機架構,效能跑不出來

推土機推不動

AMD 的 (推土機)也有類似的問題,由於採用新設計的CMT(Clustered Multi Threading,叢集多執行緒)架構,使得Windows 7等作業系統「認不出來這個架構」。現在微軟針對Bulldozer提供KB2646060以及KB2645594更新檔,讓FX處理器不再跛腳。

ADVERTISEMENT

CMP架構:核心量取勝

為什麼CMT架構會讓處理器效率不彰?得先從處理器的架構談起會比較有概念。先前處理器架構大致上有2個派別,分別為CMP(Chip MultiProcessor,單晶片多核心)與SMT(Simultaneous Multithreading,同步多執行緒)架構。

前者就是AMD拿手的多核心架構,透過增加核心數量來堆疊處理器效能,現在六核心、八核心,或是伺服器市場的十二核處理器都是代表。優點是架構簡單、堆疊容易,效能提升是顯而易見的。但缺點就是電晶體數量較多,成本比SMT更高,且核心數量到達一定程度後,效能與成本效益越會越來低。

SMT架構:成本低、效益高

SMT架構則是Intel使用的HT(Hyper-Threading,超執行緒)技術,它能讓1個核心具備多個執行緒,並且能共享資源,硬體上需要增加的成本比CMP架構還低。Intel最早在Pentium 4時代加入HT技術,後期隨著多核心架構的優勢而消失。到了Nehalem時期才再度回歸,目前Core i3與Core i7多款產品都有支援HT技術。

ADVERTISEMENT

CMT:模組化多核心架構

Bulldozer使用的CMT架構不同於CMP或SMT,當初AMD在設計時希望能將核心與執行緒的效益最大化。以往CMP與SMT各有其優缺點,CMP效率比SMT高,但SMT成本又比CMP低。取其優點後,產生的就是CMT架構。

截長補短的CMT

CMT是Clustered Multi Threading的簡寫,根據字面上的意思是叢集多執行緒。若講的白話一些,可以把它當成模組化多核心。Bulldozer一改過去的核心架構,處理器由模組(Module)構成,每個模組內有2個獨立卻能共享部分資源的實體核心。透過模組化設計,讓每個模組可執行2個執行緒,可節省硬體成本,又能強化效能。

多核心的新定義

八核心的FX-8150處理器內有4個模組,每個雙核心模組有2個整數單元(Integer Unit),並1個共享的浮點運算單元(Flex Floating Point Unit,簡稱FPU),整數單元內還有調度器(Scheduler)。由於具備調度器,因此Bulldozer的模組可執行2個執行緒,這就是AMD定義的CMT架構。

ADVERTISEMENT

傳統核心設計上,處理器每個核心都有獨立的整數運算單元,以及浮點運算單元。但Bulldozer架構的核心在傳統的定義中並不算完整的核心,因此也有人說FX-8150這種CMT架構處理器,只能算是四核心八執行緒處理器。

▲1個CMT雙核心組的規模,大約是2個單核心的75%,理論吞吐量可以達到兩個單核心的90%。Bulldozer採用嶄新的雙核心模組設計方式,算是以成本考量優先,比較有「C/P值」的設計新思維。

ADVERTISEMENT

效能才是指標

記憶比較好的讀者,應該記得Intel Core 2 Quad Q6600這顆由2個E6700組成的處理器,當時就有人說它是「假四核」。時至今日,應該也沒有人會否認它是四核心處理器。筆者認為,CMT架構過於特殊,無法用傳統核心來定義,在規格上做口舌之爭沒有太大的意義,效能才是最重要的指標。

1分鐘看懂Bulldozer架構

Bulldozer使用的CMT架構異於傳統設計,八核心的FX-8150內有4個雙核心模組,並非傳統8個獨立核心。雙核心模組中有共享的浮點運算單元(FPU)、預取器(Fetch)、解碼器(Decode)以及L2 cache,共享著多數的資源,看起來就像是1位能力比較強的員工在做著2人份的工作。

AMD認為超過80%的運算都是整數運算,因此增加少量的核心面積,整數運算單元就能帶來80%的效能提升,是相當划算的交易。而理想中數據經過預取(Fetch)、解碼(Decode)後,經過2個調度器(Scheduler)到達運算單元,同時間可有2個執行緒在運作,理論表現遠高於Intel HT技術帶來的效益。

(後面還有:免費更新檔,裝了效能強)

延伸瀏覽:

ADVERTISEMENT