70d0a31827998fb33f20934dddb70a5c 不論是軟體或硬體,革命性新架構都需要時間磨合。AMD 的 Bulldozer(推土機)也有類似的問題,由於採用新設計的 CMT(Clustered Multi Threading,叢集多執行緒)架構,使得 Windows 7「認不出來這個架構」。現在微軟針對 Bulldozer 提供更新檔,小編實測到底效能增加了多少!

快速目錄:

不論是軟體或硬體,革命性新架構都需要時間磨合。Intel在2008年首度推出Nehalem架構Core i7,雖然理論效能遠高於當代處理器,但是實測中也發現不少軟體或遊戲的效能「出不來」。

Win 7 認不出推土機架構,效能跑不出來

推土機推不動

AMD 的 Bulldozer(推土機)也有類似的問題,由於採用新設計的CMT(Clustered Multi Threading,叢集多執行緒)架構,使得Windows 7等作業系統「認不出來這個架構」。現在微軟針對Bulldozer提供KB2646060以及KB2645594更新檔,讓FX處理器不再跛腳。

CMP架構:核心量取勝

為什麼CMT架構會讓處理器效率不彰?得先從處理器的架構談起會比較有概念。先前處理器架構大致上有2個派別,分別為CMP(Chip MultiProcessor,單晶片多核心)與SMT(Simultaneous Multithreading,同步多執行緒)架構。

前者就是AMD拿手的多核心架構,透過增加核心數量來堆疊處理器效能,現在六核心、八核心,或是伺服器市場的十二核處理器都是代表。優點是架構簡單、堆疊容易,效能提升是顯而易見的。但缺點就是電晶體數量較多,成本比SMT更高,且核心數量到達一定程度後,效能與成本效益越會越來低。

SMT架構:成本低、效益高

SMT架構則是Intel使用的HT(Hyper-Threading,超執行緒)技術,它能讓1個核心具備多個執行緒,並且能共享資源,硬體上需要增加的成本比CMP架構還低。Intel最早在Pentium 4時代加入HT技術,後期隨著多核心架構的優勢而消失。到了Nehalem時期才再度回歸,目前Sandy Bridge系列Core i3與Core i7多款產品都有支援HT技術。

CMT:模組化多核心架構

Bulldozer使用的CMT架構不同於CMP或SMT,當初AMD在設計時希望能將核心與執行緒的效益最大化。以往CMP與SMT各有其優缺點,CMP效率比SMT高,但SMT成本又比CMP低。取其優點後,產生的就是CMT架構。

截長補短的CMT

CMT是Clustered Multi Threading的簡寫,根據字面上的意思是叢集多執行緒。若講的白話一些,可以把它當成模組化多核心。Bulldozer一改過去的核心架構,處理器由模組(Module)構成,每個模組內有2個獨立卻能共享部分資源的實體核心。透過模組化設計,讓每個模組可執行2個執行緒,可節省硬體成本,又能強化效能。

多核心的新定義

八核心的FX-8150處理器內有4個模組,每個雙核心模組有2個整數單元(Integer Unit),並1個共享的浮點運算單元(Flex Floating Point Unit,簡稱FPU),整數單元內還有調度器(Scheduler)。由於具備調度器,因此Bulldozer的模組可執行2個執行緒,這就是AMD定義的CMT架構。

傳統核心設計上,處理器每個核心都有獨立的整數運算單元,以及浮點運算單元。但Bulldozer架構的核心在傳統的定義中並不算完整的核心,因此也有人說FX-8150這種CMT架構處理器,只能算是四核心八執行緒處理器。

▲1個CMT雙核心組的規模,大約是2個單核心的75%,理論吞吐量可以達到兩個單核心的90%。Bulldozer採用嶄新的雙核心模組設計方式,算是以成本考量優先,比較有「C/P值」的設計新思維。

效能才是指標

記憶比較好的讀者,應該記得Intel Core 2 Quad Q6600這顆由2個E6700組成的處理器,當時就有人說它是「假四核」。時至今日,應該也沒有人會否認它是四核心處理器。筆者認為,CMT架構過於特殊,無法用傳統核心來定義,在規格上做口舌之爭沒有太大的意義,效能才是最重要的指標。

1分鐘看懂Bulldozer架構

Bulldozer使用的CMT架構異於傳統設計,八核心的FX-8150內有4個雙核心模組,並非傳統8個獨立核心。雙核心模組中有共享的浮點運算單元(FPU)、預取器(Fetch)、解碼器(Decode)以及L2 cache,共享著多數的資源,看起來就像是1位能力比較強的員工在做著2人份的工作。

AMD認為超過80%的運算都是整數運算,因此增加少量的核心面積,整數運算單元就能帶來80%的效能提升,是相當划算的交易。而理想中數據經過預取(Fetch)、解碼(Decode)後,經過2個調度器(Scheduler)到達運算單元,同時間可有2個執行緒在運作,理論表現遠高於Intel HT技術帶來的效益。

(後面還有:免費更新檔,裝了效能強)

延伸瀏覽:

AMD 降價了!調降數款 Bulldozer 與 Phenom II CPU 報價

AMD A8-3870K 的驚奇,高手超上 5.9GHz

AMD 八核推土機 bulldozer 來了,不鎖頻空冷可望 5GHz

使用 Facebook 留言

1531b459706130e194c34a40f616d270?size=48&default=wavatar
1.  ZEUS (發表於 2012年3月13日 11:48)
AMD這兩年的效能實在是太慘了,Intel一直追著摩爾定律在進步~
AMD出的推土機產品卻連上一代的Phenom,這實在是支持者最不想看見的事~

雖然下一代打樁機號稱有15%效能提升,但是以目前來看,就算15%,恐怕也只是跟二代的Core i3平起平做而已,AMD CPU真的要加油了!
Ca0f38b3e2679a9ddbb65e101bd04360?size=48&default=wavatar
2.  優秀 (發表於 2012年3月13日 12:29)
這才叫專業的測試報導啊。
看看那些充斥在其他網站的廣告文,真是垃圾...javascript:;
Tast
5.  Tast (發表於 2012年3月13日 15:35)
7-zip基礎單位確實是KB/s
只不過印象中速度開始超過10MB的時候就會以MB/s顯示
詩人Smile
6.  詩人Smile (發表於 2012年3月13日 21:00)
其實AMD出這招,很多人都只是以為沒招了才這樣玩
我認為AMD這步是不得不為,他遲早都要這樣做的
為了CPU與GPU的完美融合在鋪路呀..........
Charlie Chou
7.  Charlie Chou (發表於 2012年3月14日 00:37)
不過照這樣看起來
感覺Core 2 Quad系列灌了應該也會變快的意思囉?
Core 2 Quad不是是兩顆雙核心拼起來的嗎?
還是他只對AMD FX系列有用而已?
(但Core 2 Quad Q8400也確實可以灌這個更新就是了...)

發表回應

謹慎發言,尊重彼此。按此展開留言規則