相關文章

Mali 以前好像只有PC平台追求顯示效能、3D效果,但隨著時代改變,iPhone那像絲一般的順暢操作體驗、及手機3D遊戲所帶來的驚人華麗效果,不僅讓使用者眼界大開,也讓食古不化的傳統行動終端開發者終於醒悟:重視行動終端的人機介面使用體驗,已經變成為一部行動裝置成功的條件。

隨著iPhone、Android等手機作業系統都將桌面的3D加速納入必要支援條件,3D效能的話題也從PC平台,延燒至行動平台上。但明明iPhone上面顯示的只有2D桌面,為何要扯到3D加速?事實上,iPhone的桌面動畫效果是基於Core Animation技術,而這個技術正是根基於OpenGL這個著名的3D標準,在行動應用上稱為OpenGL ES。

▲iPhone帶來 的不是硬體設計的革新,而是人機介面的進化。

相較之下,如WM系統的2D畫面要透過老舊的GDI介面處理,整個流程由CPU親自計算,如果背景有其他程式在執行,那系統的畫面切換反應更會遲緩不堪。透過GPU加速,以及關鍵動畫畫格插補技術,加上非常霸道的單工規定,iPhone才能利用與傳統WM產品相去不大的SoC硬體,呈現出順暢異常的畫面移動效果。

▲主流行動作業系統的介面呈現主要是透過OpenGL ES,並取用GPU的硬體加速能力。

WebGL來助陣

Android師法了iPhone在2D桌面環境採用GPU加速的作法,同樣也是利用OpenGL ES來處理桌面捲動與畫面切換特效。除了2D桌面以外,未來也有個叫做WebGL的網頁標準,如果成功推廣,那麼網頁瀏覽器的成像引擎(如WebKit或Gecko)都可以利用GPU來加速網頁內容的成像。屆時,CPU的工作就變得非常單純,就是躲在背後負責資源控管、邏輯運算,眼睛看得到的地方都會透過GPU來完成。

OpenGL ES在手機桌面的工作,主要是用來處理灰階負載影像、映像、文字及背景。視桌面圖形複雜度,每秒約處理200個以內的多邊形,此外,透過像是即時調整對比、亮度及彩度、衍射與景深/模糊等後處理,也能為桌面帶來相當炫麗的即時效果, 缺少GPU的輔助處理,那可能會讓這些轉場效果有如幻燈片一般遲滯。

除了行動平台以外,數位電視、STB等家用娛樂系統也常採用ARM架構,光在介面顯示上,若處理每秒30格的1080P影像,每秒最少要有120MPix/s 原始像素填充速率,加上各種線性過濾處理,花在畫面的計算能量可能要高達3.2GFLOPS以上,傳統CPU架構或2D繪圖控制器絕對無法負擔這樣的工作。

主流GPU:PowerVR

正因如此,3D加速在各種平台上也越來越受重視。目前在ARM平台上,PowerVR是最主流的3D顯示核心,其次是出自於ATI,被Qualcomm所併購的Adreno核心,接著便是NVIDIA使用在Tegra之中的GeForce核心。

PowerVR不僅在行動應用領域佔有大部分的市場,不久前也跨過界,成為Intel行動處理器Atom的顯示核心(可見GMA有多麼不堪),雖說最高階產品的理論效能只有接近NVIDIA或AMD的桌機、筆電低階產品的水準,但其功耗表現上的優勢,加上SoC整合繪圖核心的趨勢催化之下,在相關應用領域享有領導地位。

▲目前PowerVR算是行動應用領域最普及的GPU架構之一。

雖然NVIDIA與ATI都針對行動平台提出解決方案,但是這些解決方案都是獨立顯示晶片,不僅昂貴,而且要佔用寶貴的電路板空間,加上功耗表現也不符行動應用需求,因此兩家的顯示方案只有在少數的產品裡出現,ATI被AMD併購之後,AMD也覺得行動繪圖核心實乃雞肋,食之無味,棄之又可惜,因此把相關技術轉售給Qualcomm,榨取最後的剩餘價值。

NVIDIA的行動顯示方案GoForce其實也面臨類似的狀況,但與AMD不同的是,NVIDIA把GoForce整併進Tegra的計畫內,為自家創造出另一個產品線,但自此,NVIDIA也不再提供繪圖晶片給其它行動平台製造商。

ARM與PowerVR哥倆好?

話說PowerVR的崛起,其實ARM也扮演著關鍵性的角色,擁有PowerVR產品技術的Imagination公司跟ARM恰巧是同鄉,皆為英國公司。一開始,Imagination只是家IP授權界的菜鳥,推的又是當時冷門的繪圖核心IP,在業務推展上頗為艱辛,因此,ARM若有客戶需要SoC繪圖IP需求時,便會順道介紹Imagenation給客戶,經過了幾年,Imagination在繪圖核心IP授權業務上漸有起色,3D加速能力開始被業界重視,ARM自己卻尷尬了起來。

我們都知道,ARM在授權IP時,會依照不同的功能區塊來加以計算,而因為一般運算模式的轉移,多媒體應用抬頭,相關的計算強化模組(如NEON等DSP計算單元)近來也逐漸熱門,ARM自己也透過併購手段,取得了相當多多媒體編解碼IP,在相關領域投入非常多的資源。但是Imagination公司的PowerVR繪圖核心卻開始撈過界,不僅開始整合自己的多媒體編解碼模組,甚至也開始搞自己的多執行緒CPU核心,雖然與ARM的泛用取向有所不同,但是重疊之勢在所難免。

Mali繪圖核心登場

企業為了求得更大的利益,擴大客戶基礎本來就是天經地義的事情,因此產品線客戶族群的的切割、甚至新產品線的創造,有時候就無法避免跟原本的市場領導者互相重疊。ARM原先就是處理器IP市場的領導者,而Imagination則是繪圖IP的領導者,面對市場對3D加速能力的需求,ARM也開始思考推出自己的繪圖核心,也就是Mali。

處理器IP與繪圖IP的架構與設計概念上有很大的差別,ARM再厲害也沒辦法無中生有,而且還要跟市面上的同質產品競爭,從頭研發顯得緩不濟急,因此ARM決定透過併購的手段,取得了相當優秀的Mali技術架構。與PowerVR架構最大的不同是,Mali是非常純粹的繪圖核心,由於ARM處理器部分已經加入了大量SIMD單元,足以肩負起相當程度的多媒體編解碼加速,再者,ARM也強調技術來源的統一性,避免來自不同公司的IP之間互相配合、驗證,導致各自的技術認知不同,使得開發時程延長。

ARM原先只有CPU部分的IP,但是經過這些年來的併購,除了部分類比IP以外,ARM幾乎已經能夠通吃包含CPU、DSP、GPU,以及許多軟體加解密、多媒體編解碼、通訊介面等不同的IP,ARM也開始打出一站到位的IP授權方式,把很多IP包一包一次賣。重點是,ARM也不會便宜賣,而是讓開發者省了過程中的整合驗證時間,所謂時間就是金錢,ARM也自信其方案能讓客戶縮短開發時程,讓產品能夠準時上市,藉此提高客戶的獲利。

1. 中低階Mali 55

回過頭來看Mali,他是個相當標準的GPU核心,核心部分並不像其他GPU整合了多媒體加速單元(因為都在CPU那邊了),目前有分出三大產品線,分別是Mali 55、Mali 200與Mali 400。Mali 55的多邊形成像能力為每秒300萬個,採用65nm低功耗製程,尺寸僅1mm^2,支援OpenGL ES 1.0,主要應用在中低階手機平台、數位相框、導航系統等較小,較輕薄省電的產品。

▲未來全3D化的導航產品將成潮流,這也是Mali 55可發揮之處。

2. 中高階Mali 200

次高階的Mali 200具備每秒1600萬個多邊形加速能力,與市面上的主流產品相當,大約等於PowerVR SGX530的程度。這款繪圖核心支援了完整的OpenGL ES 2.0規範,能夠應用在一般時下流行的手機基頻、高階應用處理、導航裝置之中。

3. 最高階Mali 400

至於Mali架構中最高階的Mali 400,是一款可延伸性相當高的多核GPU架構。單核多邊形處理能力為每秒3000萬個,但最高可使用4個核心,不過其多核心只是增加像素處理部分,與多邊形相關的Vertex Processor並沒有跟著增加,所以在最高四核心的配置下,依然只有3000萬個多邊形,但像素處理能力則是增加到10億個pixel。

▲電視及STB產品的智慧化,帶來顯示介面與內容編解碼能力的需求。

雖然說Mali架構GPU核心在行動平台上還算少見,但是在HDTV、STB之中應用的廣度已經相當高,未來Android或Google TV的加入,對於視覺強化的需求也會更迫切。ARM的Mali架構雖然不是市面上所能取得最高效能的產品,但是其重視均衡性,以及與原有CPU進行完整工作分配的應用概念,是其最大優勢。

目前市面上的嵌入式GPU,除了NVIDIA以外,其它都是Tile Based成像,且是unified shader架構,架構上差不多,潛力也相近。在IP授權領域,PowerVR要寄人籬下,但Mali有ARM這位富爸爸,雖然理論性能方面並不是最強,不過嵌入式繪圖技術不像PC繪圖品般追求絕對效能,而是以均衡為重,藉由ARM的力拱,很難看出Mali有什麼成功不了的理由。

使用 Facebook 留言

59f00e0e6e74a2d03bb818fd552fdeaf?size=48&default=wavatar
1.  叫我葛先生 (發表於 2010年6月01日 15:59)
關於Mali 400的部分,其實Mali 400單核多邊形處理能力為每秒3000萬個。最高使用4個核心,所以其實可以創造出每秒大於10億個全屏反鋸齒像素點的成像能力。

另外,Mali採用第二代的Tile Based架構,同時採用了即時渲染以及Tile Base的好處。所以ARM Mali在與PowerVR對應產品比較上,在大小,帶寬,功耗,全屏反鋸齒畫質及效能等各方面都有突出的表現,特別是帶寬及全屏反鋸齒效能更是領先業界。

總言之,Mali的表現真的不錯,受到很多大廠採用,也難怪它的授權數在這幾年內大增。再繼續看看還會有什麼樣的好表現吧~
Dark Eric
2.  Dark Eric (發表於 2010年6月14日 05:34)
Mali 400的多核配置比較特殊,他只有增加Pixel的處理單元,但是Vertex部分並沒有增加,所以即便是四核,依然只能達到3000萬個多邊形的輸出能力..

發表回應

謹慎發言,尊重彼此。按此展開留言規則