Arm發(fā)布全新終端計算子系統(tǒng),引領AI驅動下的移動設備性能革新
5 月 30 日,Arm發(fā)布了最新的 Arm 終端計算子系統(tǒng) (Arm CSS for Client),為移動設備行業(yè)帶來了新的突破。隨著人工智能 (AI) 發(fā)展的逐漸深入,AI帶給了我們越來越多的體驗提升,我們正在見證 AI 從手機到筆記本電腦所取得的顯著創(chuàng)新,并由此誕生了 AI 智能手機和 AI PC。就在這AI的浪潮之下,Arm所發(fā)布的終端 CSS 旨在加速設備端AI 的發(fā)展,為智能手機、筆記本電腦、可穿戴設備和數(shù)字電視等設備提供更強大的性能和更高的能效。
Arm 終端事業(yè)部產(chǎn)品管理副總裁James McNiven在日前舉辦的媒體溝通會上介紹了Arm發(fā)布的終端 CSS。
James McNiven表示,Arm終端CSS將物理實現(xiàn)與 Armv9 的 AI 優(yōu)勢結合在一起,整合了最新的 Armv9.2 CPU 和最新的 Immortalis GPU,最新的 CoreLink 系統(tǒng)互連和系統(tǒng)內存管理單元 (SMMU),并優(yōu)化到內存及 SoC 其他部分的計算路徑。其中,Arm首次在終端領域為CPU 和 GPU 提供物理實現(xiàn),不僅簡化了 SoC 設計流程,還可確保了產(chǎn)品上市速度。
本次發(fā)布的重頭戲是最新的 Armv9 CPU —— Arm Cortex-X925,以及 Immortalis GPU —— Arm Immortalis-G925。
我們先來看看Cortex-X925,命名的改變代表的不止是新一代的設計,更是性能的大幅提升。對此James McNiven進一步談到,Cortex-X925 是 Cortex-X 推出以來取得最高 IPC 同比增幅的 CPU,通過結合新設計所實現(xiàn)的微架構改進和頻率提升,Cortex-X925 在 Geekbench 中實現(xiàn)了 36% 的單線程性能增長。以 AI 性能為例,與去年的 Cortex-X CPU 相比,詞元 (Token) 首次響應時間提高了 41%,其LLM的初始響應能力有了顯著改善。Arm是怎么做到如此顯著的性能提升的呢?James McNiven在現(xiàn)場對媒體進行了深入的闡述,得益于微架構的顯著演進——Arm迄今為止最寬的解碼和矢量設計帶來了巨幅的提升,實現(xiàn)了 50% TOPS 數(shù)的增長。通過更強的可配置性和更大的私有 L2 緩存大小,保留進出過CPU的指令和數(shù)據(jù)。而且Arm的 RTL 和物理設計團隊之間也展開了進一步協(xié)作,針對3nm工藝,提升頻率和效率。
而在GPU方面,Arm帶來了全新的Arm Immortalis-G925。與CPU的命名一致,作為Arm性能最強、效率最高的 GPU,其在名字上也作出了相應的調整。在各種圖形應用上,Immortalis-G925 的性能同比提高了 37%;而在多個 AI/ML 網(wǎng)絡上進行測量時,實現(xiàn)了約 34% 的性能提升。此外,還有光線追蹤技術。2022 年,Immortalis 將光線追蹤技術引入智能手機。今年,Arm大幅提高了光線追蹤技術在面對復雜物體時的表現(xiàn),其性能提升高達 52%。
在 CSS 上的效率方面,James McNiven介紹到,與 Cortex-A720 相比,Cortex-A725 的能效提高了 35%。該成果源于Arm改進了微架構,并善用工藝和物理 IP 優(yōu)化?!靶『恕盋ortex-A520 CPU 也隨著工藝和物理實現(xiàn)的提升而得到了改進。至于圖形效率,Arm發(fā)現(xiàn)在提供與去年終端平臺相同水平的游戲性能下,《堡壘之夜》等手游的功耗降低了 30%。至于可擴展性,Arm的合作伙伴可以利用這一系列不同的 CPU 和 GPU 選項,針對大屏幕計算、智能手機、數(shù)字電視和可穿戴設備等精心設計自己的解決方案。
除了通過 CSS 推動性能和效率提升之外,Arm也一直始終致力于為每一位安卓設備用戶提高性能。在 Cortex-X925 帶來的 30% 性能提升基礎上,Arm對網(wǎng)頁瀏覽器進行了改進,使其性能提高了 23%。除了 Chrome,中國的手機廠商也將這些改進引入到其瀏覽器中。與此同時,Arm繼續(xù)攜手 Google,推動其安卓動態(tài)性能框架 (Android Dynamic Performance Framework) 的發(fā)展。在最新版本的框架中,實現(xiàn)高端內容的每幀能耗降低了 25%,幀速率則提高了 35%。此外,Arm還調整了安卓工作負載在不同 CPU 核心之間的平衡方式,從而為 YouTube 節(jié)省了高達 10% 的功耗。針對 Google 的 AV1 視頻編解碼器,Arm對其進行了軟件優(yōu)化,使當下安卓設備的視頻性能最多可提高 40%。
Arm 終端 CSS 的發(fā)布標志著移動設備行業(yè)邁向了新的階段,將推動設備端 AI 應用的普及和發(fā)展。開發(fā)者可以利用終端CSS 的強大性能和軟件支持,打造出更加智能、高效和用戶體驗更佳的設備。
圖:Arm 終端事業(yè)部產(chǎn)品管理副總裁James McNiven(圖左)與 vivo 首席芯片規(guī)劃專家夏曉菲(圖右)分享雙方合作
vivo作為Arm的合作伙伴也來到了溝通會的現(xiàn)場,vivo 首席芯片規(guī)劃專家夏曉菲表示,vivo 非常注重用戶體驗,在 Arm CSS 的技術基礎之上,vivo與 Arm 密切合作,共同推動開發(fā)者生態(tài),使手機更流暢更好用,同時也為設備端帶來了前沿的 AI 體驗。Arm 持續(xù)加大 AI 技術上的布局。相信大家會看到 Arm CSS 里面集成更多更強大的 AI 能力,同時提供一個更加廣泛的針對開發(fā)者的開發(fā)環(huán)境,能夠讓所有的開發(fā)者基于通用平臺開發(fā)出自己基于端側的生成式 AI 應用和體驗。
Arm 終端CSS 的發(fā)布為移動設備行業(yè)帶來了新的機遇,將推動設備端 AI 應用的快速發(fā)展。其卓越的的高性能、高效率和高可擴展性,將幫助開發(fā)者打造出更加智能、高效和用戶體驗更佳的設備,為消費者帶來更加美好的未來。
評論