新聞中心

EEPW首頁 > 智能計算 > 業(yè)界動態(tài) > Arm在2018為業(yè)界又帶來了哪些驚喜?

Arm在2018為業(yè)界又帶來了哪些驚喜?

作者:左小木 時間:2018-07-04 來源:電子產(chǎn)品世界 收藏

在踏入互聯(lián)網(wǎng)時代,尤其是移動互聯(lián)網(wǎng)時代,能夠得到時代寵幸的公司并不多,其中,算是一個。

本文引用地址:http://www.butianyuan.cn/article/201807/382740.htm

而近期,又針對當(dāng)下應(yīng)用潮流對于高性能處理器的需求,推出了更高性能的產(chǎn)品序列,包括移動領(lǐng)域應(yīng)用的,視覺影像應(yīng)用的GPU——,以及針對超高清視頻處理器解決方案的Mali-V76。

更高效率的

新一代相對于前代(Cortex-A75)而言,同樣采用了于2017年對外發(fā)布的DynamIQ技術(shù)前提下,還采用了先進的7nm制程工藝,實現(xiàn)了35%的性能提升、40%的能效提升和4倍的機器學(xué)習(xí)運算能力。

第二次應(yīng)用到Cortex架構(gòu)CPU中的DynamIQ技術(shù),其實是Arm于2017年發(fā)布的在big.LITTLE基礎(chǔ)上演進的芯片架構(gòu),主要針對現(xiàn)在應(yīng)用火熱的人工智能及機器學(xué)習(xí)方面的能力進行了優(yōu)化,因而也被稱為DynamIQ big.LITTLE。

相對于先前架構(gòu),DynamIQ主要有三方面的突出能力:

1)DynamIQ允許在單一計算集群上進行大小核配置,能夠?qū)崿F(xiàn)1+3、1+7、3+5等組態(tài)(目前最多可以支持配置8核),因而可配置性提升得以進一步提升;

2)DynamIQ可以對每一個處理器進行獨立的頻率控制以及開、關(guān)、休眠狀態(tài)的控制,能夠?qū)崿F(xiàn)高效、無縫地在不同任務(wù)間切換合適的處理器;

3)DynamIQ還對內(nèi)存子系統(tǒng)進行了重新設(shè)計,可以對內(nèi)存進行更細顆粒度的管理,實現(xiàn)更快的數(shù)據(jù)讀取和全新的節(jié)能特性。

也因此,應(yīng)用DynamIQ的CPU更適用于能耗更高、需要快速響應(yīng)的應(yīng)用。

同時,此次Cortex-A76在延用前代v8.2架構(gòu)及DynamIQ技術(shù)外,其特點是采用全新的微處理器架構(gòu),在微處理器架構(gòu)方面的改進包括提升每周期處理指令數(shù)量和更深度的內(nèi)存層級平行處理。

Arm針對圖像處理應(yīng)用的GPU開發(fā)路線

隨著AR/VR、高清手游等對圖像質(zhì)量及圖像渲染能力有高需求的應(yīng)用領(lǐng)域的興起,專用于圖像處理的GPU也開始受到關(guān)注。而Mali系列則是Arm針對這一應(yīng)用領(lǐng)域開發(fā)的GPU。

Arm針對GPU的開發(fā)路線可以分為三類,包括針對成本敏感型的市場的超高效GPU系列UTGARD(出于對成本的考慮,我們可能會在性能以及提供的功能方面做一些折中去優(yōu)化成本)、擁有最佳的性價比的主流GPU產(chǎn)品系列MIDGARD,以及擁有最高性能的高性能GPU系列BIFROST。

此次推出的則是針對高性能應(yīng)用的GPU,而作為這一代產(chǎn)品的第三個迭代產(chǎn)品,采用Bifrost繪圖架構(gòu)及7nm制造工藝,同樣在性能上擁有可觀的性能提升。

與上一代Mali-G72相比,有30%性能密度、30%的能源效率及2.7倍的機器學(xué)習(xí)能力的提升。高能效在帶來峰值時的性能高和功耗低同時,也意味著更長的電池續(xù)航時間。例如一款手機其他配置相同,采用G76GPU玩游戲的時長要高于采用G72GPU的手機。

Mali-V76:8K60幀的解碼性能

Arm是如何設(shè)計視頻處理器的呢?

Arm區(qū)域市場經(jīng)理王田指出,“首先,我們先指定一個具有給定性能級別的核心,并針對多個編解碼視頻標準進行優(yōu)化,分析需要支持的視頻標準,并確定哪些功能可以用硬件來實現(xiàn),哪些功能最好放在軟件中實現(xiàn)。通過這種方式可以達到更好的軟、硬件協(xié)同的效果。然后,我們有一套硬件模塊來加速指定的通用功能,并通過路徑和硬件IP無縫協(xié)作控制這些功能,執(zhí)行指定編解碼功能。運行固件時,我們有一套專用的微處理器,提供特定的軟件控制程序,通過固件提供安卓或者Linux的驅(qū)動,這些都是基于像OpenMAX的集成層,并根據(jù)未來安卓系統(tǒng)的需求可以更新到安卓多媒體的框架。”

Mali-V76系統(tǒng)解決方案

Mali-V76系統(tǒng)解決方案的硬件支持固定的功能模塊,例如運動估計、運動補償、比特流處理、區(qū)塊濾波器、DMA、MMU引擎等。除了運動估計,Mali-V76所有固定硬件加速模塊的吞吐量提升了一倍,同時還增加了第二組的AXI總線,能達到更高的帶寬需求。

在軟件方面,Mali-V76除了支持264、265、VP9等主流視頻標準,還支持10 bit 264編解碼,支持中國廣播電視標準(例如AVS、AVS Plus)。而在軟件框架上,Mali-V76支持內(nèi)存的分配、多核之間任務(wù)調(diào)度以及更好的功耗方面的優(yōu)化。

Mali-V76性能表現(xiàn)

在性能方面,相比于上一代Mali-V61產(chǎn)品相比,Mali-V76支持8K60幀的視頻解碼,速度也是Mali-V61的兩倍;在4K 120幀解碼性能節(jié)點,在提供同樣解碼能力的同時,有40%的面積節(jié)??;在編碼質(zhì)量上,同樣的內(nèi)容和條件下,有25%的編碼質(zhì)量提升。

Mali-V76在600 GHz運行四核的時,能夠提供每秒4K 12幀的吞吐量。例如在電視墻的應(yīng)用中,Mali-V76最高可以提供16路(4×4)1080P 60幀解碼性能,或者提供4路4K 60幀的解碼性能。這就為更高畫質(zhì)VR/AR應(yīng)用體驗帶來了可能。

Project Trillium機器學(xué)習(xí)平臺

人工智能的興起及智能設(shè)備爆發(fā)式增長帶來數(shù)據(jù)量的急劇增長,而這就帶來了本地和云端的兩種數(shù)據(jù)存儲方式,本地存儲空間有限,而云端存儲又帶來了成本、安全和速度的問題,因而帶來了邊緣的概念。而邊緣進行機器學(xué)習(xí)發(fā)展到現(xiàn)在已經(jīng)遠不是一款CPU,甚至不只是CPU自身的問題,而是一個生態(tài)問題。Project Trillium則是Arm為了實現(xiàn)在邊緣的人工智能和機器學(xué)習(xí)工作負載于2018年3月推出的開發(fā)的平臺。

Project Trillium能夠為開發(fā)者提供什么呢?

Project Trillium機器學(xué)習(xí)平臺最上層是現(xiàn)在主流的機器學(xué)習(xí)的大的體系。Arm機器學(xué)習(xí)事業(yè)部技術(shù)總監(jiān) Ian Bratt稱,Arm絕對不是要和機器學(xué)習(xí)大的體系去競爭的,相反我們能夠幫助從這些系統(tǒng)的機器學(xué)習(xí)工作負載能夠在邊緣成功部署。

中間層是由Arm提供的豐富的開源軟件工具和資料庫,所有的這些軟件工具和資料庫的核心和基礎(chǔ)是Arm的演繹推理引擎——Arm NN。

最底層則是Arm硬件處理器方面產(chǎn)品,包括Arm自身的Cortex系列的CPU、Mali系列GPU產(chǎn)品以及Arm專門針對機器學(xué)習(xí)所推出的專用的芯片。

Arm機器學(xué)習(xí)專用芯片三大聚焦點

Ian Bratt還介紹了設(shè)計機器學(xué)習(xí)專用芯片的的三大設(shè)計特點。

第一,卷積處理效率的提升。由于現(xiàn)在的機器學(xué)習(xí)需要人工處理大量卷積類的工作,因而要提高整體ML的處理效率,卷積處理效率的提升是非常關(guān)鍵的一環(huán)。

第二,總體芯片功耗的降低。在芯片上進行數(shù)據(jù)傳輸所消耗的電量遠大于處理每個比特的數(shù)據(jù)本身所消耗的電量,因此要降低總體芯片功耗需要實現(xiàn)更加有效的數(shù)據(jù)移動。

第三,芯片架構(gòu)的可編程性。人工智能領(lǐng)域本身是一個全新的領(lǐng)域,神經(jīng)網(wǎng)絡(luò)技術(shù)仍在不斷地變化中,因而芯片架構(gòu)本身的可編程性也尤為重要。

小結(jié)

   Arm此次發(fā)布的三款產(chǎn)品更新主要仍然是針對移動領(lǐng)域的應(yīng)用產(chǎn)品,而更高的性能、更低的功耗以及更強大的機器學(xué)習(xí)能力是此次產(chǎn)品更新的主要能力提升,同時也是應(yīng)對市場上各類產(chǎn)品對性能、智能等需要作出的又一次突破。

除了產(chǎn)品更新之外,我們也看到Arm除了原有的生態(tài)之外,還在著力擴展自己在人工智能方面的生態(tài)。雖然巨頭廠商不斷追逐,帶有“智能”頭銜的產(chǎn)品也在迭代更新,而其實真正的智能之路其實才剛剛開始。



關(guān)鍵詞: Arm Cortex-A76 Mali-G76 AI

評論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉