新聞中心

EEPW首頁 > 嵌入式系統(tǒng) > 設(shè)計(jì)應(yīng)用 > ARM Cortex-A 移動(dòng)處理器發(fā)展概覽

ARM Cortex-A 移動(dòng)處理器發(fā)展概覽

作者: 時(shí)間:2017-10-21 來源:網(wǎng)絡(luò) 收藏

  簡介

本文引用地址:http://butianyuan.cn/article/201710/367207.htm

   Cortex-A 移動(dòng)應(yīng)用產(chǎn)品線橫跨了幾代產(chǎn)品和三個(gè)主要產(chǎn)品類別。有些開發(fā)人員和 SoC 設(shè)計(jì)人員經(jīng)歷了一款或多款新型 的推出過程,他們知道該產(chǎn)品線如何從單個(gè)高性能通用 CPU 設(shè)計(jì)演進(jìn)成為三個(gè)不同產(chǎn)品線,分別面向高端、中端、入門級(jí)的移動(dòng)設(shè)備 SoC 市場(chǎng),這讓他們受益匪淺。

  Cortex-A8

   在 2005 年向市場(chǎng)推出 Cortex-A8 ,是第一款支持 armv7-a 架構(gòu)的處理器。ARMv7 包括 3 個(gè)關(guān)鍵要素:NEON 單指令多數(shù)據(jù) (SIMD) 單元、ARM trustZone 安全擴(kuò)展、以及thumb2 指令集,通過 16 位和 32 位混合長度指令以減小代碼長度。Cortex-A8 是 ARM 實(shí)現(xiàn)的第一個(gè)基于新ISA的超標(biāo)量處理器:它實(shí)現(xiàn)了完全雙發(fā)射流水線,這意味著 cortex-a8 能夠同時(shí)發(fā)出在指令流中先后出現(xiàn)的任何兩個(gè)沒有數(shù)據(jù)依賴的指令。但是,它不能亂序來發(fā)射或撤銷指令 –該功能在之后的設(shè)計(jì)中才被實(shí)現(xiàn)。

  

  當(dāng)我們推出 Cortex-A8 時(shí),很多合作伙伴認(rèn)為這款處理器放在移動(dòng)電話上是大材小用,他們很自然地質(zhì)疑道,“客戶會(huì)在手機(jī)上瀏覽互聯(lián)網(wǎng)?不太可能吧。”但是,我們和業(yè)界一些主要思想領(lǐng)袖合作,向客戶將會(huì)需要的產(chǎn)品邁進(jìn),尤其是因?yàn)楫?dāng) Cortex-A8 在 2008 年投入批量生產(chǎn)時(shí),高帶寬無線連接 (3G ) 已經(jīng)問世,大屏幕也用于移動(dòng)設(shè)備。創(chuàng)新的移動(dòng)行業(yè)充分利用了該產(chǎn)品:Cortex-A8 芯片的推出正好趕上了智能手機(jī)出貨量猛增的大好時(shí)機(jī)。

  Cortex-A9

  推出 Cortex-A8 之后不久,ARM 又推出了首款多核 ARMv7 CPU:cortex-a9。Cortex-A9 利用硬件模塊來管理 CPU 集群中一至四個(gè)核心之間的高速緩存一致性,加入了一個(gè)外部二級(jí)高速緩存。理論上,客戶可以設(shè)計(jì)不包括二級(jí)緩存的小型版本 Cortex-A9,這種設(shè)計(jì)允許剔除管理高速緩存一致性的邏輯模塊,以實(shí)現(xiàn)尺寸更小的單核設(shè)計(jì)。但實(shí)際上,大多數(shù)設(shè)計(jì)都采用雙核個(gè)或更多核心并附帶二級(jí)高速緩存。此外,在2011 年底和 2012 年初,當(dāng)移動(dòng) SoC 設(shè)計(jì)人員可以采用多個(gè)核心之后,提高性能的突破點(diǎn)從提高單核性能轉(zhuǎn)移到提高核的數(shù)量。旗艦級(jí)高端移動(dòng) CPU迅速從最初的雙核拓?fù)浣Y(jié)構(gòu)移至四核 Cortex-A9。

  

  除了開啟了多核性能大門之外,與 Cortex-A8 相比,每個(gè) Cortex-A9 處理器的單時(shí)鐘周期指令吞吐量提高了大約 25%。這個(gè)性能的提升是在保持相似功耗和芯片面積的前提下, 通過縮短流水線并亂序執(zhí)行以及在流水線早期階段集成neon SIMD 和浮點(diǎn)功能而實(shí)現(xiàn)的。

  Cortex-A15

  隨著智能手機(jī)市場(chǎng)開始加速發(fā)展,ARM 再次預(yù)見到了不斷發(fā)展的移動(dòng)系統(tǒng)對(duì)芯片性能提出的更高要求。為此ARM開發(fā)了一款性能上大幅提升的處理器,用以專門針對(duì)新的高端移動(dòng)市場(chǎng)。在已經(jīng)非常強(qiáng)大的 Cortex-A9 的基礎(chǔ)上,ARM 憑借 cortex-a15 又將性能提高了 50% 以上。此外,Cortex-A15 引入了一系列架構(gòu)擴(kuò)展,從而實(shí)現(xiàn)了更大物理地址空間、硬件虛擬化支持和擴(kuò)展一致性。在 32 位系統(tǒng)中內(nèi)存被劃分為 2GB 設(shè)備內(nèi)存和 2GB 普通內(nèi)存,當(dāng)設(shè)備的 RAM 超出2GB的時(shí)候,擁有更大的物理地址空間就變得異常重要。ARM和其他合作伙伴也一直在探索虛擬化技術(shù)在商務(wù)移動(dòng)系統(tǒng)和自帶設(shè)備中的用戶操作系統(tǒng)以及類似應(yīng)用情景進(jìn)行探索。。擴(kuò)展一致性在 big.LITTLE 處理器技術(shù)中被應(yīng)用的淋漓盡致,它提供了一種降低平均功耗并在功耗受限的條件下優(yōu)化達(dá)到最大性能的方法。

  

  Cortex-A15 集群集成了監(jiān)聽控制單元 (SCU) 以實(shí)現(xiàn)硬件一致性,每個(gè)集群包含一至四個(gè) CPU 核心,并集成二級(jí)高速緩存控制器 – Cortex-A15 之后的所有 ARM Cortex-A 系列 CPU 都沿用了這種拓?fù)浣Y(jié)構(gòu)。

  在移動(dòng)設(shè)備中不斷突破性能極限

  

  比較 Cortex-A 系列高端處理器的性能,可以看到自從 Cortex-A8 1GH 處理器在 2008 年上市以來,性能有了大幅提升。

  一致性擴(kuò)展機(jī)制,實(shí)現(xiàn)為 AMBA ACE, 使下圖所示的big.little SoC成為可能。在 big.LITTLE 系統(tǒng)中,通常實(shí)現(xiàn)一個(gè)“大”CPU 集群,并對(duì)其進(jìn)行調(diào)節(jié)以滿足高性能的要求,同時(shí)對(duì)“小”的 CPU 集群進(jìn)行調(diào)節(jié),滿足對(duì)高能效。在典型工作負(fù)載中,LITTLE 處理器可以處理絕大部分工作,而“big”CPU 集群的激活時(shí)間不足 10%,在很多情況下還達(dá)不到總 CPU 運(yùn)行時(shí)間的 1%。通過 CoreLink CCI-400 高速緩存一致性互連組件,CPU 集群能夠監(jiān)聽其他集群的高速緩存,從而實(shí)現(xiàn)軟件線程從一個(gè)集群到另一集群的快速轉(zhuǎn)移。

  Cortex-A12

  隨著智能手機(jī)市場(chǎng)的爆炸式增長,SoC 供應(yīng)商和 OEM 將該市場(chǎng)劃分為旗艦高端級(jí)別、中端級(jí)別、低成本入門級(jí)別。隨著這些細(xì)分市場(chǎng)的出現(xiàn),ARM 一直在定義專門針對(duì)上述三個(gè)級(jí)別市場(chǎng)的不同處理器。cortex-a12 是采用全新微架構(gòu)的一個(gè)全新處理器,專門面向快速發(fā)展的中端移動(dòng)市場(chǎng)。下圖顯示了這些細(xì)分市場(chǎng)的規(guī)模,以及面向這些細(xì)分市場(chǎng)的 ARM Cortex-A 產(chǎn)品:

  

  Cortex-A12 的設(shè)計(jì)面向中端移動(dòng) SoC,以滿足這一細(xì)分市場(chǎng)對(duì)于芯片面積和功耗的要求。它使用無序雙執(zhí)行流水線,其性能比當(dāng)前在許多中端移動(dòng) SoC 中使用的 Cortex-A9 高出 40%。Cortex-A12 在 2013 年中推向市場(chǎng),有望在 2014 投入量產(chǎn)。它是一款 32 位處理器,具有與 Cortex-A15 相同的物理地址擴(kuò)展和相關(guān)的架構(gòu)特性。

  

  Cortex-A12 能夠在很多(但并非全部)用例中提供接近 Cortex-A15 的性能。Cortex-A12 還針對(duì)中端移動(dòng)設(shè)計(jì)進(jìn)行了優(yōu)化,取消了一些企業(yè)功能,使用略微簡單的流水線,因此在橫跨多個(gè)市場(chǎng)的高端設(shè)備上都可以找到Cortex-A15的身影,而 Cortex-A12 則專門面向中端移動(dòng)設(shè)計(jì)。



  Cortex-A57

  cortex-a57 是 ARM 針對(duì) 2013 年、2014 年和 2015 年設(shè)計(jì)起點(diǎn)的 CPU 產(chǎn)品系列的旗艦級(jí) CPU,它采用 armv8-a 架構(gòu),提供 64 位功能,而且通過 Aarch32 執(zhí)行狀態(tài),保持與 ARMv7 架構(gòu)的完全后向兼容性。在高于 4GB 的內(nèi)存廣泛使用之前,64 位并不是移動(dòng)系統(tǒng)真正必需的,即便到那時(shí)也可以使用擴(kuò)展物理尋址技術(shù)來解決,但盡早推出 64 位,可以實(shí)現(xiàn)更長、更順暢的軟件遷移,讓高性能應(yīng)用程序能夠充分利用更大虛擬地址范圍來運(yùn)行內(nèi)容創(chuàng)建應(yīng)用程序,例如視頻編輯、照片編輯和增強(qiáng)現(xiàn)實(shí)。新架構(gòu)可以運(yùn)行 64 位操作系統(tǒng),并在操作系統(tǒng)上無縫混合運(yùn)行 32 位和 64 位應(yīng)用程序。ARMv8 架構(gòu)可以實(shí)現(xiàn)狀態(tài)之間的輕松轉(zhuǎn)換。

  除了 ARMv8 的架構(gòu)優(yōu)勢(shì)之外,Cortex-A57 還提高了單個(gè)時(shí)鐘周期性能,比高性能 的Cortex-A15 CPU 高出了 20% 至 40%。它還改進(jìn)了二級(jí)高速緩存的的設(shè)計(jì)以及內(nèi)存系統(tǒng)的其他組件,極大的提高了能效。Cortex-A57 將為移動(dòng)系統(tǒng)提供前所未有的高能效性能水平,而借助 big.LITTLE,SoC 能以很低的平均功耗做到這一點(diǎn)。

  高效率產(chǎn)品線:Cortex-A5、Cortex-A7、Cortex-A53

  隨著智能手機(jī)市場(chǎng)的崛起,最先出現(xiàn)的市場(chǎng)是入門級(jí)市場(chǎng)。在新興市場(chǎng),移動(dòng)設(shè)備沒有獲得無線運(yùn)營商的補(bǔ)貼,因此用戶必須支付全價(jià)來購買移動(dòng)設(shè)備,并且按月支付合約的服務(wù)費(fèi)用。新興市場(chǎng)的價(jià)格范圍在 150 美元以下,并將很快降至 75 美元以下 – 我們需要一種不同類型的 SoC 設(shè)計(jì)來滿足這些市場(chǎng)的需求。在 Cortex-A9 發(fā)布之后不久,ARM 試圖開發(fā)一款處理器來滿足這一市場(chǎng)需求:這款產(chǎn)品的尺寸和功耗與舊款 ARM926 等功能性手機(jī)處理器大致相同,但性能高于在第一代智能手機(jī)中使用的 arm11 系列。2009 年,我們發(fā)布了 Cortex-A5,該設(shè)計(jì)通過有序單執(zhí)行 8 級(jí)流水線實(shí)現(xiàn)了上述目標(biāo)。利用這種簡單流水線設(shè)計(jì),我們可將功耗保持在非常低的水平。而簡化的功能集,造就了ARM 有史以來最高效的(每 mW 性能)應(yīng)用處理器。

  在 cortex-a5 取得成功的基礎(chǔ)上ARM又設(shè)計(jì)了目前已在入門級(jí)智能手機(jī)中得到大量應(yīng)用cortex-a7 處理器,形成了一個(gè)充滿活力的智能手機(jī)處理器細(xì)分市場(chǎng)。隨著 Cortex-A5 取得成功,下一個(gè)目標(biāo)是開發(fā)能夠匹配 Cortex-A15 的架構(gòu)功能集的類似處理器,從而在 big.LITTLE 配對(duì)中將其與 Cortex-A15 結(jié)合使用。同時(shí),該款處理器還應(yīng)該在 Cortex-A5 的基礎(chǔ)上提升性能,并具有與之相同的功效、和相似的功耗以及芯片大小。Cortex-A7 通過添加部分雙執(zhí)行,增加TLB 和內(nèi)存結(jié)構(gòu),同時(shí)集成二級(jí)高速緩存,將單時(shí)鐘周期性能提高了 20%。

  高能效 CPU 產(chǎn)品線的最新成員利用了相同的 8 級(jí)有序流水線,但通過多種方式顯著提升了性能,包括完全雙執(zhí)行流水線、更寬的內(nèi)部總線、增強(qiáng)浮點(diǎn)和 SIMD 吞吐容量、更大的TLB,以及其他對(duì)存儲(chǔ)器系統(tǒng)的改進(jìn)。cortex-a53 包括可選 內(nèi)部RAM ECC 保護(hù),還提供外部總線選項(xiàng),使得該處理器在移動(dòng)和企業(yè)應(yīng)用中都可以部署。

  

  除了微架構(gòu)性能改進(jìn)之外,Cortex-A53 還增加了對(duì) ARMv8 架構(gòu)的支持,為獨(dú)立入門級(jí)移動(dòng)芯片設(shè)計(jì),和包含多個(gè) Cortex-A53 集群的可擴(kuò)展企業(yè)應(yīng)用引入 64 位功能,同時(shí)在高端移動(dòng)系統(tǒng)中,將Cortex-A53和性能更強(qiáng)的Cortex-A57在big.LITTLE系統(tǒng)設(shè)計(jì)中配對(duì)使用。

  下圖顯示了連續(xù)幾代高能效Cortex-A CPU 的性能對(duì)比。因?yàn)椴捎米钚碌脑O(shè)計(jì) Cortex-A53 能夠提供比僅僅幾年前的旗艦級(jí) CPU (Cortex-A9)出色的多性能。下圖顯示的性能比較測(cè)試是在相同頻率下進(jìn)行的。在物理實(shí)現(xiàn)中,Cortex-A53、Cortex-A7 和 Cortex-A5 的 8 級(jí)流水線達(dá)到的頻率和采用更長流水線的“big” Cortex-A CPU能達(dá)到的頻率差距在15%之內(nèi)。實(shí)際量產(chǎn) SoC 頻率存在很大差異,取決于流程選項(xiàng)和后端設(shè)計(jì),我們已經(jīng)看到 Cortex-A7 在采用 28nm制程下可以達(dá)到 1.2GHz、1.5GHz 甚至更高的頻率。

  

  有關(guān) ARM 的高效率產(chǎn)品線的更多信息,請(qǐng)參閱 Kinjal Dave 的博客 – 高效率、中端或高性能 Cortex-A – 差異何在?

  有關(guān) Cortex-A53 的更多信息,請(qǐng)參閱我早期的關(guān)于最新高效率 Cortex-A CPU 的博客 – 有關(guān) Cortex-A53 的 5 大必備知識(shí)

  移動(dòng)應(yīng)用處理器全面路線圖

  本路線圖將上述所有處理器都集中在單個(gè)圖表中,展示了 ARM所提供的高性能級(jí)別、中端級(jí)別、入門級(jí)別的移動(dòng)應(yīng)用程序處理器,以及所支持的高速緩存一致性互聯(lián)組件。

  

  以上路線圖展示了ARM 三個(gè)級(jí)別的移動(dòng)應(yīng)用處理器產(chǎn)品路線圖,我們未來產(chǎn)品的開發(fā)也將繼續(xù)遵循這一路線。我們專門針對(duì)高端、中端和高效率這三個(gè)細(xì)分市場(chǎng)的處理器設(shè)計(jì),使我們能夠提供針對(duì)這三級(jí)智能手機(jī)和平板電腦市場(chǎng)的定制產(chǎn)品。

  為適當(dāng)任務(wù)尋找適當(dāng)處理器不再是難以決斷的選擇

  ARM 的 big.LITTLE 技術(shù)旨在為消費(fèi)者提供最佳整體用戶體驗(yàn) – 包括按需動(dòng)態(tài)性能、更高的能效、“不發(fā)熱”的耐用器件。市場(chǎng)上最早利用該技術(shù)的產(chǎn)品包括三星 GS4(國際版)和三星 Note 3(國際版)

  下圖顯示了將在 2013 年和 2014 年推出的采用未來設(shè)計(jì)的高端移動(dòng) CPU 子系統(tǒng),將在 2014 年和 2015 年的設(shè)備中使用。它采用 big.LITTLE 電源管理技術(shù),利用 Cortex-A57 的強(qiáng)大性能,并且提供高速緩存一致性互聯(lián) (cci) 功能,能夠?yàn)镚PU 計(jì)算提供的 IO 一致性的支持。

  有關(guān) big.LITTLE 的更多詳細(xì)信息,請(qǐng)參見我近期在 ARM TechCon 2013上進(jìn)行的有關(guān) big.LITTLE 平臺(tái)測(cè)量結(jié)果的演示(旨在展示性能改進(jìn)和節(jié)能):big.LITTLE 技術(shù)向完全異構(gòu)全局任務(wù)調(diào)度邁進(jìn) - Techcon 演示文稿

  另外,您可能希望閱讀我早期論述該技術(shù)要點(diǎn)的博客 – 有關(guān) big.LITTLE 的十大必備知識(shí)

  

  以上系統(tǒng)示意圖展示了最先進(jìn)的移動(dòng) CPU 設(shè)計(jì),它采用 Cortex-A57 和 Cortex-A53 處理器,并且結(jié)合最新的 mali_t760 GPU。請(qǐng)注意,它具有 2 個(gè) big 核心。從我們已經(jīng)進(jìn)行的性能測(cè)試來看,2 個(gè) big 核心似乎已經(jīng)能滿足當(dāng)前工作負(fù)載。采用由Cortex-A15和Cortex-A7構(gòu)成的當(dāng)前最高端的移動(dòng) SoC的拓?fù)浣Y(jié)構(gòu)示意圖和下圖也是非常類似。Cortex-A50 系列處理器代表了將在 2014 年間問世的移動(dòng) SoC 的未來拓?fù)浣Y(jié)構(gòu)發(fā)展趨勢(shì) … 但 ARM 不會(huì)就此止步。我們將繼續(xù)在低功耗 CPU、GPU 和系統(tǒng)設(shè)計(jì)領(lǐng)域開發(fā)新的創(chuàng)新技術(shù),以此推動(dòng)智能手機(jī)、平板電腦和新興設(shè)備類型的創(chuàng)新,實(shí)現(xiàn)高效移動(dòng)計(jì)算,提升全球數(shù)十億用戶的生活質(zhì)量。

  



關(guān)鍵詞: cortex-A 處理器 ARM

評(píng)論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉