ARM big.LITTLE系統(tǒng)技術應用
圖5的性能測評是由Cortex-A15與Cortex-A7中央處理器集群各自獨立運轉。測試芯片的Cortex-A15最高頻率達1.2GHz,Cortex-A7則為1GHz。性能測評結果顯示,雖然測試芯片上的內存系統(tǒng),其性能不如big.LITTLE 系統(tǒng)級芯片量產(chǎn)后的預測水平,Cortex-A15與Cortex-A7中央處理器的性能仍落在預期范圍內。根據(jù)各個核心獨立運轉所得結果,我們對平臺測量big.LITTLE性能的準確度深具信心。測試芯片平臺軟件包含基本的Linux核心,還采用了中央處理器轉移軟件與big.LITTLE MP修正程序組,以測試中央處理器轉移或big.LITTLE MP模式。
本文引用地址:http://butianyuan.cn/article/147851.htm而用來測試big.LITTLE性能的任務量,主要基于Android Cream Sandwich系統(tǒng),通過網(wǎng)頁進行網(wǎng)絡瀏覽器性能循環(huán),背景則有音效播放。在這個使用實例中,是以相當密集的工作量搭配對性能需求不高的背景活動。網(wǎng)絡瀏覽器每2秒便進行網(wǎng)頁循環(huán),每頁卷動達500像素,因此對系統(tǒng)性能需求相對較高。為了在進行性能測試的同時測量性能與能耗,首先必須建立性能與能耗的基線。而這個基線則搭配獨立運作的Cortex-A15集群進行測量。
值得一提的是,這組結論屬于較早期的測試結果;用來測試的第一版big.LITTLE MP修正程序組,將Linux排程程序從一個完整而平衡的排程模式調整成big.LITTLE模式。我們預期軟件修正后性能與能耗將會改善,也會尋找其他可調校的元素。另外 ,測試芯片缺少繪圖處理器;這將使得中央處理器的負載高于搭載繪圖處理器的系統(tǒng)在卸除狀態(tài)下的負載水平,而在中央處理器負載較低的狀況下,可能會較常使用LITTLE核心,進而達到節(jié)能目的。它包含一套基本的電壓及頻率操作點(DVFS),但沒有對單處理器核心做獨立的電源開關設計,因此big.LITTLE系統(tǒng)單芯片量產(chǎn)后測試結果有望提升。舉例來說,后臺任務的性能便可節(jié)省超過70%的能耗。
如何選擇big.LITTLE軟件模式
各界最常見的疑問就是:“應該選擇哪一種軟件模式?”目前主要是在中央處理器轉移與big.LITTLE MP之間選擇一種,而兩種方式各有優(yōu)劣勢。在中央處理器轉移方面,由于big以及LITTLE核心處于搭配成對的狀態(tài),因此對稱式的拓撲能順暢運作。而big及LITTLE核心數(shù)量不同的非對稱式拓撲則需要額外運作。由于Cortex-A7中央處理器核心體積較小,因此可使用4個LITTLE核心加上1到2個big核心,這種作法可能會具有吸引力。從正面的角度來看,中央處理器轉移讓電源及性能的調校更為容易,可重復利用既有的操作系統(tǒng)電源管理程序代碼,代表產(chǎn)品將有多年的研發(fā)及測試結果作為支持。加上不必調整核心的排程程序,范圍比執(zhí)行big.LITTLE MP模式更為簡化, 而軟件模式也正日趨成熟。整體而言,中央處理器轉移是一種極佳的解決方案,2013上半年后可望進入量產(chǎn),并持續(xù)為尚未完成big.LITTLE MP模式升級準備的系統(tǒng)提供可行的轉移模式解決方案。
big.LITTLE MP具有多項技術上的優(yōu)勢,雖然技術尚未完全成熟,但目前正處于進階研發(fā)階段,測試結果如本文所示相當不錯。由于支持非對稱式拓撲為標準配備,因此無需調整軟件,big.LITTLE MP技術便能利用系統(tǒng)中所有核心。它在性能與能耗方面優(yōu)點更多。舉例來說,它能同步利用所有核心以提升性能,或將big與LITTLE核心上的DVFS設定與排程程序設定調成不同狀態(tài)以節(jié)省更多能耗。因為需要增加調校的動作,才能從big.LITTLE MP平臺獲取完整的性能及能耗優(yōu)勢,所以彈性提升仍有其代價。這與過去數(shù)年來由硅組件以及代工廠商將操作系統(tǒng)能源管理設定以及DVFS參數(shù)數(shù)據(jù),并依據(jù)裝置需求轉化為移動系統(tǒng)級芯片平臺的主流做法并無太大差異。big.LITTLE MP 模式將轉移模式延伸并納入新的參數(shù)數(shù)據(jù),不僅更為節(jié)能,更能為經(jīng)過性能優(yōu)化的big核心增加系統(tǒng)響應度。
big.LITTLE MP模式正快速成熟,雖然尚未成為主流技術,但目前這項技術已可接受合作伙伴整合,并有望在2013下半年打入上游。所幸支持big.LITTLE MP并不需要改變硬件,因此晶圓廠可能會部署具有中央處理器轉移的平臺,針對部署平臺進行核心更新并升級至big.LITTLE MP模式,或建設現(xiàn)有的big.LITTLE平臺以便在2013年后半年直接取得big.LITTLE MP 軟件轉移模式。
雖然big.LITTLE MP模式尚未進入量產(chǎn),但如文中測試結果,我們可以看到相關軟件已開始運作,并已開始在硅組件廠研發(fā)平臺端進行測試。big.LITTLE MP軟件已用于我們的測試系統(tǒng),目前正積極進行軟件強化,并針對各種實際應用將系統(tǒng)性能調校至最佳效果。
有部分的可調校因素已在應用中,包括排程程序的負載平衡策略、上下移轉點以及線程優(yōu)先順序,ARM與芯片設計合作伙伴將持續(xù)就上述領域進行系統(tǒng)調校。
新一代big.LITTLE硬件
Cortex-A15與Cortex-A7核心代表第一代的big.LITTLE硬件。ARM已發(fā)布兩款具有big.LITTLE處理性能的新型中央處理器核心,即Cortex-A57以及Cortex-A53處理器。Cortex-A57處理器是經(jīng)過性能優(yōu)化的big核心,每頻率周期的性能可增加25%,頻率性能也更為提高,效率則略高于Cortex-A15處理器。Cortex-A53處理器為LITTLE核心,每頻率周期的性能可增加40%,能源效率則大約于Cortex-A7處理器相同。
這些新的處理器核心在架構上都完全相同,并支持ARMv8架構,因此能導入全新的NEON技術與浮點功能、加密加速并支持64位架構。除了AMBA4 ACE,兩種核心也都支持新一代高速緩存一致總線架構,且與現(xiàn)有的ARMv7中央處理器核心相同,能在AArch32模式下執(zhí)行既有程序代碼。支持64位及額外一般用途緩存器的應用方式效率更高,且能耗增加不多。同時,微架構也經(jīng)過強化,以增加各核心在每個指令頻率周期中的傳輸量。這些新款核心在經(jīng)過軟件細節(jié)升級并支持64位尋址模式后,將會與Cortex-A15以及Cortex-A7處理器一樣支持big.LITTLE技術。
結論
big.LITTLE系統(tǒng)為能耗及性能控制點的極度寬動態(tài)(wide dynamic range)開啟了大門。這是僅由單一類型處理器組成的產(chǎn)品所無法達到的。目前市面上設備的工作量往往混雜了需求程度高低不同的線程,這種寬動態(tài)便可為其提供完美的執(zhí)行環(huán)境。由于日后Cortex-A7將成為平臺主力,這一系統(tǒng)另一個優(yōu)點即能夠打造基于Cortex-A7的高度節(jié)能產(chǎn)品。
評論