新聞中心

EEPW首頁 > 智能計算 > 業(yè)界動態(tài) > Arm在2018為業(yè)界又帶來了哪些驚喜?

Arm在2018為業(yè)界又帶來了哪些驚喜?

作者:左小木 時間:2018-07-04 來源:電子產品世界 收藏

在踏入互聯(lián)網(wǎng)時代,尤其是移動互聯(lián)網(wǎng)時代,能夠得到時代寵幸的公司并不多,其中,算是一個。

本文引用地址:http://www.butianyuan.cn/article/201807/382740.htm

而近期,又針對當下應用潮流對于高性能處理器的需求,推出了更高性能的產品序列,包括移動領域應用的,視覺影像應用的GPU——,以及針對超高清視頻處理器解決方案的Mali-V76。

更高效率的

新一代相對于前代(Cortex-A75)而言,同樣采用了于2017年對外發(fā)布的DynamIQ技術前提下,還采用了先進的7nm制程工藝,實現(xiàn)了35%的性能提升、40%的能效提升和4倍的機器學習運算能力。

第二次應用到Cortex架構CPU中的DynamIQ技術,其實是Arm于2017年發(fā)布的在big.LITTLE基礎上演進的芯片架構,主要針對現(xiàn)在應用火熱的人工智能及機器學習方面的能力進行了優(yōu)化,因而也被稱為DynamIQ big.LITTLE。

相對于先前架構,DynamIQ主要有三方面的突出能力:

1)DynamIQ允許在單一計算集群上進行大小核配置,能夠實現(xiàn)1+3、1+7、3+5等組態(tài)(目前最多可以支持配置8核),因而可配置性提升得以進一步提升;

2)DynamIQ可以對每一個處理器進行獨立的頻率控制以及開、關、休眠狀態(tài)的控制,能夠實現(xiàn)高效、無縫地在不同任務間切換合適的處理器;

3)DynamIQ還對內存子系統(tǒng)進行了重新設計,可以對內存進行更細顆粒度的管理,實現(xiàn)更快的數(shù)據(jù)讀取和全新的節(jié)能特性。

也因此,應用DynamIQ的CPU更適用于能耗更高、需要快速響應的應用。

同時,此次Cortex-A76在延用前代v8.2架構及DynamIQ技術外,其特點是采用全新的微處理器架構,在微處理器架構方面的改進包括提升每周期處理指令數(shù)量和更深度的內存層級平行處理。

Arm針對圖像處理應用的GPU開發(fā)路線

隨著AR/VR、高清手游等對圖像質量及圖像渲染能力有高需求的應用領域的興起,專用于圖像處理的GPU也開始受到關注。而Mali系列則是Arm針對這一應用領域開發(fā)的GPU。

Arm針對GPU的開發(fā)路線可以分為三類,包括針對成本敏感型的市場的超高效GPU系列UTGARD(出于對成本的考慮,我們可能會在性能以及提供的功能方面做一些折中去優(yōu)化成本)、擁有最佳的性價比的主流GPU產品系列MIDGARD,以及擁有最高性能的高性能GPU系列BIFROST。

此次推出的則是針對高性能應用的GPU,而作為這一代產品的第三個迭代產品,采用Bifrost繪圖架構及7nm制造工藝,同樣在性能上擁有可觀的性能提升。

與上一代Mali-G72相比,有30%性能密度、30%的能源效率及2.7倍的機器學習能力的提升。高能效在帶來峰值時的性能高和功耗低同時,也意味著更長的電池續(xù)航時間。例如一款手機其他配置相同,采用G76GPU玩游戲的時長要高于采用G72GPU的手機。

Mali-V76:8K60幀的解碼性能

Arm是如何設計視頻處理器的呢?

Arm區(qū)域市場經(jīng)理王田指出,“首先,我們先指定一個具有給定性能級別的核心,并針對多個編解碼視頻標準進行優(yōu)化,分析需要支持的視頻標準,并確定哪些功能可以用硬件來實現(xiàn),哪些功能最好放在軟件中實現(xiàn)。通過這種方式可以達到更好的軟、硬件協(xié)同的效果。然后,我們有一套硬件模塊來加速指定的通用功能,并通過路徑和硬件IP無縫協(xié)作控制這些功能,執(zhí)行指定編解碼功能。運行固件時,我們有一套專用的微處理器,提供特定的軟件控制程序,通過固件提供安卓或者Linux的驅動,這些都是基于像OpenMAX的集成層,并根據(jù)未來安卓系統(tǒng)的需求可以更新到安卓多媒體的框架?!?/p>

Mali-V76系統(tǒng)解決方案

Mali-V76系統(tǒng)解決方案的硬件支持固定的功能模塊,例如運動估計、運動補償、比特流處理、區(qū)塊濾波器、DMA、MMU引擎等。除了運動估計,Mali-V76所有固定硬件加速模塊的吞吐量提升了一倍,同時還增加了第二組的AXI總線,能達到更高的帶寬需求。

在軟件方面,Mali-V76除了支持264、265、VP9等主流視頻標準,還支持10 bit 264編解碼,支持中國廣播電視標準(例如AVS、AVS Plus)。而在軟件框架上,Mali-V76支持內存的分配、多核之間任務調度以及更好的功耗方面的優(yōu)化。

Mali-V76性能表現(xiàn)

在性能方面,相比于上一代Mali-V61產品相比,Mali-V76支持8K60幀的視頻解碼,速度也是Mali-V61的兩倍;在4K 120幀解碼性能節(jié)點,在提供同樣解碼能力的同時,有40%的面積節(jié)??;在編碼質量上,同樣的內容和條件下,有25%的編碼質量提升。

Mali-V76在600 GHz運行四核的時,能夠提供每秒4K 12幀的吞吐量。例如在電視墻的應用中,Mali-V76最高可以提供16路(4×4)1080P 60幀解碼性能,或者提供4路4K 60幀的解碼性能。這就為更高畫質VR/AR應用體驗帶來了可能。

Project Trillium機器學習平臺

人工智能的興起及智能設備爆發(fā)式增長帶來數(shù)據(jù)量的急劇增長,而這就帶來了本地和云端的兩種數(shù)據(jù)存儲方式,本地存儲空間有限,而云端存儲又帶來了成本、安全和速度的問題,因而帶來了邊緣的概念。而邊緣進行機器學習發(fā)展到現(xiàn)在已經(jīng)遠不是一款CPU,甚至不只是CPU自身的問題,而是一個生態(tài)問題。Project Trillium則是Arm為了實現(xiàn)在邊緣的人工智能和機器學習工作負載于2018年3月推出的開發(fā)的平臺。

Project Trillium能夠為開發(fā)者提供什么呢?

Project Trillium機器學習平臺最上層是現(xiàn)在主流的機器學習的大的體系。Arm機器學習事業(yè)部技術總監(jiān) Ian Bratt稱,Arm絕對不是要和機器學習大的體系去競爭的,相反我們能夠幫助從這些系統(tǒng)的機器學習工作負載能夠在邊緣成功部署。

中間層是由Arm提供的豐富的開源軟件工具和資料庫,所有的這些軟件工具和資料庫的核心和基礎是Arm的演繹推理引擎——Arm NN。

最底層則是Arm硬件處理器方面產品,包括Arm自身的Cortex系列的CPU、Mali系列GPU產品以及Arm專門針對機器學習所推出的專用的芯片。

Arm機器學習專用芯片三大聚焦點

Ian Bratt還介紹了設計機器學習專用芯片的的三大設計特點。

第一,卷積處理效率的提升。由于現(xiàn)在的機器學習需要人工處理大量卷積類的工作,因而要提高整體ML的處理效率,卷積處理效率的提升是非常關鍵的一環(huán)。

第二,總體芯片功耗的降低。在芯片上進行數(shù)據(jù)傳輸所消耗的電量遠大于處理每個比特的數(shù)據(jù)本身所消耗的電量,因此要降低總體芯片功耗需要實現(xiàn)更加有效的數(shù)據(jù)移動。

第三,芯片架構的可編程性。人工智能領域本身是一個全新的領域,神經(jīng)網(wǎng)絡技術仍在不斷地變化中,因而芯片架構本身的可編程性也尤為重要。

小結

   Arm此次發(fā)布的三款產品更新主要仍然是針對移動領域的應用產品,而更高的性能、更低的功耗以及更強大的機器學習能力是此次產品更新的主要能力提升,同時也是應對市場上各類產品對性能、智能等需要作出的又一次突破。

除了產品更新之外,我們也看到Arm除了原有的生態(tài)之外,還在著力擴展自己在人工智能方面的生態(tài)。雖然巨頭廠商不斷追逐,帶有“智能”頭銜的產品也在迭代更新,而其實真正的智能之路其實才剛剛開始。



關鍵詞: Arm Cortex-A76 Mali-G76 AI

評論


相關推薦

技術專區(qū)

關閉