Imagination Rogue GPU技術(shù)優(yōu)勢分析
2013年全球微處理器銷售額將以史上最快的增長速度突破610億美元,這主要歸功于連接到互聯(lián)網(wǎng)的手機(jī)和平板電腦的強勁需求。據(jù)調(diào)研機(jī)構(gòu)Gartner的預(yù)測,2015年全球200~300美元中價位智能移動設(shè)備(智能手機(jī)/平板電腦)出貨量將達(dá)5.8億臺,并且用戶主要使用的功能是影音編輯和分享。
本文引用地址:http://butianyuan.cn/article/201610/307390.htm得益于浮點運算優(yōu)勢,GPU可以有效地接替來自CPU在圖形渲染過程中產(chǎn)生的幾乎所有計算負(fù)荷,并且速度十分驚人。因此,當(dāng)系統(tǒng)檢測需要更復(fù)雜的計算時,運算會從CPU切換到GPU工作模式,在一些測試環(huán)境下,渲染性能可以輕易地從十幾幀每秒加速到上百幀每秒。在GPU技術(shù)的支持下,芯片供應(yīng)商和設(shè)備制造商可提供諸如3D UI、實時視頻圖像處理、具有逼真圖像體驗的游戲應(yīng)用和增強實境等豐富的應(yīng)用模式。
所以,今后整個行業(yè)對GPU的重視會大大超過CPU本身,因為今后主流消費者使用移動設(shè)備主要的用處是多媒體娛樂,視頻和游戲的處理都更加依賴GPU的計算能力。GPU在移動處理器中的重要程度已經(jīng)日益凸顯,高通移動處理器的一大賣點就是自己的Adreno GPU。
當(dāng)然在移動GPU市場的老大是Imagination,根據(jù)市場研究公司Jon Peddie Research的報告,Imagination以37.6%的市場份額,依然穩(wěn)坐2013年移動GPU領(lǐng)先供應(yīng)商頭把交椅。但它的最大競爭對手ARM在GPU的市場份額也達(dá)到了18.4%,由于Adreno GPU的市場份額全部來自自家的處理器,不會對外授權(quán),所以今后的GPU市場競爭主要是Imagination和ARM之間的戰(zhàn)爭。這兩家IP巨頭除了在CPU領(lǐng)域展開競爭以外,在GPU領(lǐng)域的戰(zhàn)火也燒到了下一代GPU內(nèi)核。
PowerVR 6系列GPU與競爭對手Mali-T600系列GPU的規(guī)格對比
PowerVR 6系列Rogue GPU 公布于2011 年第三季度。CES 2012 上,PowerVR Rogue GPU 首批兩款產(chǎn)品,PowerVR G6200 和 PowerVR G6400 亮相。2013 年 Imagination 又公布了 PowerVR Series 6XE 和 PowerVR Series 6XT 兩個子系列產(chǎn)品。6系列GPU都支持DirectX 10,部分型號可支持最新的DirectX 11.1,還支持OpenGL 3.x/4.x、OpenGL ES 3.0,以及通用計算領(lǐng)域的OpenCL 1.x、Renderscript Compute。根據(jù)配置的不同,PowerVR 6系列GPU的浮點性能在100Gflops到最高1Tflops之間,可帶來最多60倍于5系列的圖形和計算性能提升。
Intel Atom 處理器 Z3480、蘋果 iPhone 5S 的A7處理器乃至聯(lián)發(fā)科MT8135等都集成了Imagination 最新一代的PowerVR Rogue GPU。
Mali-T600 系列于2012 年露面,開發(fā)代號Midgard,是 ARM 的首個統(tǒng)一渲染架構(gòu)。Mali-T600全系列支持OpenGL ES 2.0/1.1,OpenCL 1.1,DirectX 11,其中Mali-T622、Mali-T624、Mali-T628、Mali-T678還能夠支持OpenGL ES3.0。露面最早的Mali-T604 是第一代,Mali-T624 / 628 / 678 等后續(xù)產(chǎn)品則是第二代。Mali-T624的規(guī)格參數(shù)基本與T604一致,不過核心升級到了第二代Midgard,T628最多能支持8核配置。曇花一現(xiàn)的Mali-658還是第一代Midgard架構(gòu),現(xiàn)在已經(jīng)被二代Midgard架構(gòu)的T678取代,之前的資料顯示T658的性能是Mali-400 MP的10倍,計算性能是后者的4倍,Mali-678只會比這個指標(biāo)更強。
以上的對比可以看出,PowerVR 6系列支持的API更加全面,多了OpenGL的支持,雖然在移動消費端用處還不大,但在工業(yè)級應(yīng)用還是有很大優(yōu)勢的。
PowerVR的看家本領(lǐng)——TBDR渲染技術(shù)
首先說說Imagination最具優(yōu)勢的移動渲染技術(shù)TBDR。由于功耗和內(nèi)存帶寬的限制,移動平臺的GPU相對于桌面平臺,會有一些不同。目前幾乎所有的桌面GPU(nVIDIA,AMD)都是IMR(Immediate Mode Rendering,直接模式渲染)架構(gòu),在移動領(lǐng)域,nVIDIA的GeForce ULP和Vivante的GC系列GPU都是屬于IMR架構(gòu)。IMR架構(gòu)的GPU渲染完物體后,都會把結(jié)果寫到系統(tǒng)內(nèi)存中的幀緩存里,因此就可能出現(xiàn)GPU花了大量的時間渲染了一個被遮擋的看不見的物體,而最后這些結(jié)果在渲染完遮擋物后被覆蓋,做了無用功。這個問題稱之為Overdraw。另外,由于IMR架構(gòu)的GPU頻繁的讀寫和修改幀緩存,因此對帶寬的要求比較高,同時也增加了電力的消耗。所以,大部分的移動GPU都采用TBR(Tile Based Rendering,分塊渲染)的架構(gòu)。
ARM的Mali GPU和高通的Adreno GPU采用TBR架構(gòu),實際上Imagination的PowerVR也是分塊渲染的。TBR架構(gòu)在把三角形場景變成像素圖前,先把整個畫面分成小塊,這些小塊的渲染在GPU上的高速緩存里進(jìn)行,這樣就可以避免對幀緩存(位于系統(tǒng)內(nèi)存里)的頻繁讀寫和修改。但是,除去PowerVR外的TBR GPU同IMR一樣,還是不能避免Overdraw的問題。而PowerVR的不同之處在于,它采用的TBDR(Tile Based Deferred Rendering,分塊延時渲染)架構(gòu),可以徹底避免Overdraw的問題。相比TBR更進(jìn)一步的是,TBDR在光柵化之后,有一個HSR(Hidden Surface Removal,隱藏曲面消除)硬件單元,通過對一個塊內(nèi)的三角形進(jìn)行測試,剔除掉被遮擋的三角形,合成一幅由所有可見部分組成的畫面,交給后續(xù)的流水線去渲染。這樣不可見部分就不需要著色器去做相應(yīng)的計算,也不需要去拾取相應(yīng)的紋理,節(jié)省了計算量的同時也節(jié)省了帶寬,對移動設(shè)備來說有很大的幫助。
GPU的競爭也是軟件生態(tài)系統(tǒng)的競爭
移動GPU的硬件架構(gòu)是影響游戲流暢度以及省電的重要因素,但在軟件支持方面,紋理壓縮格式也是影響游戲支持度高低的重要因素,由于移動GPU并不像桌面GPU以及游戲都有統(tǒng)一的DirectX標(biāo)準(zhǔn),造成不同移動GPU所支持的紋理壓縮格式技術(shù)互不兼容,也造就了移動GPU 多強鼎立的局面。
移動GPU主流的紋理壓縮格式分別為ETC、PVRTC、S3TC、ATITC,在3D游戲中豐富的紋理和細(xì)節(jié)對游戲的質(zhì)量可說是相當(dāng)重要。不過,由于顯示內(nèi)存和帶寬受限的緣故,所有紋理都必須經(jīng)過壓縮,否則會帶給顯示內(nèi)存和帶寬極大的壓力,而紋理壓縮格式便是用來解決這項問題。在OpenGL ES 2.0版本規(guī)范里,將ETC(Ericsson Texture Compression)列為移動GPU紋理壓縮格式的固定班底,并且要求各個移動GPU都必須支持此種紋理壓縮格式技術(shù)。
Imagination 的PowerVR Rogue GPU 系列支持的是 PVRTC (PowerVR Texture Compression) 和 ETC,ARM的Mali-T600 系列支持的是ETC 和ASTC。ASTC由ARM 提出,2012 年被 Khronos 組織認(rèn)可,納入到OpenGL ES 3.0 標(biāo)準(zhǔn)中。不過 ASTC 并非強制性的標(biāo)準(zhǔn),目前也只有 Mali-T600 系列支持。PowerVR 可以做到將紋理壓縮至最小體積(原圖十分之一不到)但仍保持清晰,比OpenGL ES 官方標(biāo)準(zhǔn)的S3TC 和ETC 要小了一半體積,這也算是PowerVR的技術(shù)優(yōu)勢。
ETC 是最通用的紋理壓縮格式,幾乎所有的安卓設(shè)備都可以支持 ETC 壓縮的文件。不過ETC 并不招廠商待見,因為 ETC 紋理壓縮不支持 Alpha 通道,只能用于壓縮不透明的材質(zhì),且只能將單一紋理拆解成2個間接執(zhí)行。S3TC是桌面顯卡通用的壓縮格式,看起來是最完美的選擇,可惜 S3TC 還是一種私有的標(biāo)準(zhǔn),有專利上的麻煩。
盡管PVRTC 是PowerVR 專有的格式,但PowerVR 已占據(jù)最大的移動GPU市場份額,開發(fā)者做紋理時勢必會考慮到這一標(biāo)準(zhǔn)。加之本身這一標(biāo)準(zhǔn)具有高壓縮率的優(yōu)勢,更能推動3D游戲技術(shù)的進(jìn)步。ASTC 則太新鮮,現(xiàn)在還鮮有開發(fā)者支持這個標(biāo)準(zhǔn),市場上Mali GPU的占有率也還不足以幫助這一標(biāo)準(zhǔn)推廣。
總結(jié)
ARM的Mali GPU給人的感覺更像是PC中的公版顯卡一樣,積極支持各種最新標(biāo)準(zhǔn),注重性能功耗比。但是Mali GPU的問題在于目前授權(quán)使用的大部分還是Mali-450 MP以下的,Mali-T604除了在三星的Exynos 5250中有過應(yīng)用,發(fā)布過一年多以來未見其他處理器集成。即便是三星這個老朋友,新一代的Exynos 5 Octa也改用PowerVR的GPU核心了,感覺業(yè)界的接受度還是不夠高。
PowerVR Rogue GPU 延續(xù)了 Imagination 一貫的技術(shù)優(yōu)勢:TBDR渲染技術(shù)獨步天下,且對各類 API 的支持領(lǐng)先于業(yè)界。這一代顯卡的性能甚至超越了部分桌面 GPU,能耗卻比桌面 GPU 更低,適合多種嵌入式移動設(shè)備。相比另一主要競爭者ARM Mali-T600系列,PowerVR Rogue GPU 優(yōu)勢在于紋理壓縮標(biāo)準(zhǔn)已有健壯的生態(tài)系統(tǒng)支持,而Mali 的標(biāo)準(zhǔn)目前還沒能贏得開發(fā)者首肯,紙面的技術(shù)優(yōu)勢無法體現(xiàn)出來。GPU的性能和軟件的優(yōu)化有極大關(guān)系,這是現(xiàn)在PowerVR系列GPU能夠領(lǐng)先市場的最大優(yōu)勢。
Imagination能成為移動GPU的老大顯然會有很多獨特優(yōu)勢和技術(shù)。它的GPU不是理論性能最強的,不過單位功耗性能、單位面積性能表現(xiàn)都很強,多核集成、配套的開發(fā)工具、PVRTC紋理壓縮格式、TBDR渲染技術(shù)都是它沖鋒陷陣的利器,綜合起來PowerVR還是表現(xiàn)最優(yōu)秀的移動GPU。
評論