新聞中心

EEPW首頁 > 嵌入式系統(tǒng) > 設(shè)計應(yīng)用 > RISC-V如何推動邊緣機器學習的發(fā)展

RISC-V如何推動邊緣機器學習的發(fā)展

—— 借助高能效RISC-V處理器,實現(xiàn)機器學習工作負載的邊緣計算
作者:Brandon Lewis,貿(mào)澤電子專稿 時間:2024-04-22 來源:EEPW 收藏


本文引用地址:http://butianyuan.cn/article/202404/457934.htm

1713792043620345.png

圖源:ipopba/Stock.adobe.com

當你入了機器學習(ML)領(lǐng)域的門之后,很快就會發(fā)現(xiàn),云端的數(shù)據(jù)存儲和處理成本竟然如此之高。為此,許多企業(yè)都上了內(nèi)部部署基礎(chǔ)設(shè)施的車,試圖通過這些設(shè)施來承載其ML工作負載,從而限制上述成本??杉幢闳绱?,這些內(nèi)部的數(shù)據(jù)中心還是會帶來諸如功耗增加等代價,尤其是在規(guī)模較大的情況下。而功耗增加,就意味著電費支出更高,還會給設(shè)備散熱制造麻煩,對可持續(xù)發(fā)展也會構(gòu)成不利影響。

在云服務(wù)和內(nèi)部部署場景中,這些開銷與輸入到中心樞紐的數(shù)據(jù)量直接相關(guān)。而解決的辦法,就是在數(shù)據(jù)到達樞紐之前,盡可能過濾掉其中多余的部分,這就需要借助邊緣計算系統(tǒng),在盡可能接近數(shù)據(jù)采集來源的地方分析輸入數(shù)據(jù)。

當然,這些邊緣計算系統(tǒng)能夠?qū)崿F(xiàn)這種改變的前提,在于它們自身必須具備高能效,而新一代的處理器恰在此時悄然面世。這些處理器能夠?qū)崿F(xiàn)三倍于其他指令集架構(gòu)(ISA)設(shè)備的單位性能能效。

邊緣ML中的:指令更少,功耗更低

ML與邊緣計算的融合,使智能設(shè)備獲得了自主決策和實時適應(yīng)的能力。對這類數(shù)據(jù)處理層次的需求與處理器技術(shù)的進步不謀而合,后者已經(jīng)應(yīng)用到了以下聯(lián)網(wǎng)邊緣應(yīng)用中:

●   可穿戴設(shè)備:配備RISC-V處理器的健身追蹤器可在設(shè)備上執(zhí)行活動識別和健康監(jiān)測,實時向用戶提供個性化的建議和反饋。

●   智能樓宇:RISC-V處理器已經(jīng)運用到樓宇自動化設(shè)備中,這些設(shè)備可以實時執(zhí)行物體檢測、異常識別、智能自動化和安全防護。

●   機器人:配備RISC-V處理器的工業(yè)機器人可以實時處理圖像和檢測物體,從而適應(yīng)不斷變化的環(huán)境,并自主執(zhí)行復(fù)雜任務(wù)。

RISC-V將在轉(zhuǎn)變各種應(yīng)用場景的過程中持續(xù)發(fā)揮關(guān)鍵作用,這部分源于它具有開放、標準化的ISA以及高計算效率,可簡化復(fù)雜AI算法在邊緣設(shè)備上的實現(xiàn)。這種效率源自RISC-V架構(gòu)最基本的構(gòu)件:指令集。

RISC-V以簡化的ISA為基礎(chǔ),具有一套基本的整數(shù)指令(RV32I或RV64I),同時處理器架構(gòu)師可以添加可選擴展,以適應(yīng)各種使用場景。其中,有兩個關(guān)鍵性的擴展顯著提高了RISC-V處理器的ML運算能力:

●   向量擴展 (V):該擴展提供了向量運算支持,這對高效矩陣乘法和許多ML算法中的基本運算而言是至關(guān)重要的。向量擴展可以讓處理器在多個數(shù)據(jù)元素上同時執(zhí)行多種運算,從而顯著提高性能。

●   壓縮擴展 (C):該擴展引入了壓縮指令,編碼所需的位數(shù)更少,因此代碼量更小、內(nèi)存占用更低。這對內(nèi)存資源有限的邊緣設(shè)備尤為重要。

結(jié)合這些擴展,RISC-V處理器可在執(zhí)行ML工作負載時實現(xiàn)高性能和高效率。RISC-V處理器IP公司SiFive正是借助向量擴展和其他微體系結(jié)構(gòu)創(chuàng)新,實現(xiàn)了比競品高30%至40%的能效。[1]

實際上,有研究表明,RISC-V設(shè)備在CPI方面往往優(yōu)于大多數(shù)現(xiàn)有指令集架構(gòu),這里的CPI是指執(zhí)行一條指令所需的平均時鐘周期數(shù)。[2]這些測試表明,RISC-V設(shè)備有能力在保持熱效率的同時,在更長的時間內(nèi)執(zhí)行復(fù)雜的ML任務(wù)。

RISC-V生態(tài)系統(tǒng)和邊緣ML工具

RISC-V的模塊化ISA尤其適合開發(fā)緊湊型高能效處理器。它的指令集更加直接,有助于優(yōu)化設(shè)計、縮短芯片設(shè)計和驗證時間、降低成本,當然還能降低功耗。

要在終端系統(tǒng)中實現(xiàn)所有這些優(yōu)勢,最終還是要靠開發(fā)人員。RISC-V技術(shù)為何能在邊緣計算環(huán)境中得到快速應(yīng)用?基于開放標準的處理器硬件,以及圍繞它而產(chǎn)生并且共同成長的軟件和工具生態(tài)系統(tǒng),可謂功不可沒。

LLVM和GCC等流行的編譯器現(xiàn)在都支持RISC-V,可確保生成的代碼針對目標處理器進行優(yōu)化,包括對ISA擴展的利用。與此同時,TensorFlow和PyTorch等流行的ML框架也正在向RISC-V移植,一眾嵌入式軟件企業(yè)也貢獻出了自己的ML庫、框架和中間件。

例如,Antmicro和Google Research合作為基于RISC-V的邊緣ML應(yīng)用開發(fā)了快速原型設(shè)計和投產(chǎn)前 (pre-silicon) 開發(fā)解決方案,該解決方案由Renode仿真框架和Kenning裸機運行時組成(圖1)。這種聯(lián)合解決方案可以讓ML模型運行在模擬的RISC-V硬件上,幫助開發(fā)人員加快工程開發(fā)周期。最終,在投入昂貴的芯片制造工序之前,就可以對整個技術(shù)棧進行評估和優(yōu)化。

image.png

圖1 Antmicro與Google Research合作推出的RISC-V仿真框架。它為加速ML開發(fā)提供了硬件/軟件協(xié)同設(shè)計流程 (圖源:作者)

當然,RISC-V和ML開發(fā)工具都還有有改進空間。在這些生態(tài)系統(tǒng)共同發(fā)展的過程中,仍有一些挑戰(zhàn)需要克服,包括以下方面:

●   成熟度:與更加成熟的架構(gòu)相比,RISC-V生態(tài)系統(tǒng)相對較新,因而經(jīng)驗豐富的開發(fā)人員并不多,可供使用的工具和庫也不夠全面。

●   標準化:盡管有RISC-V International組織為供應(yīng)商之間的合作和創(chuàng)新奠定基礎(chǔ),但在開放的生態(tài)系統(tǒng)中,產(chǎn)品的實現(xiàn)方式一定是多種多樣的,這可能會帶來架構(gòu)碎片化和兼容性問題。持續(xù)的標準化工作對于維持平穩(wěn)統(tǒng)一的開發(fā)流程至關(guān)重要。

●   硬件可及性:針對ML任務(wù)優(yōu)化的商用RISC-V處理器市場仍然很有限。不過,隨著需求的增加,硬件格局也將隨之發(fā)展和擴大。

要應(yīng)對這些挑戰(zhàn),就需要業(yè)界領(lǐng)導者、研究機構(gòu)和開源社區(qū)開展合作與投資。我們沒有任何理由認為業(yè)界或開源和開放標準社區(qū)會停止向RISC-V生態(tài)系統(tǒng)加以投入,也就沒有理由認為RISC-V技術(shù)會停止在高能效邊緣應(yīng)用領(lǐng)域的發(fā)展。

RISC-V塑造邊緣ML的未來

從實現(xiàn)的角度而言,精簡指令集計算機 (RISC) 和復(fù)雜指令集計算機 (CISC) 之間的爭論在很大程度上已經(jīng)過時?,F(xiàn)在,CPU的效率和性能主要取決于它的微架構(gòu),而架構(gòu)又是通過其ISA和用于制造物理芯片的制程節(jié)點來實現(xiàn)的。

隨著RISC-V和邊緣ML市場的發(fā)展,我們將持續(xù)見證硬件創(chuàng)新和更加專業(yè)化的RISC-V處理器。這些處理器可能會包含專用的加速器、優(yōu)化的內(nèi)存架構(gòu)和其他各種功能,以提高執(zhí)行ML工作負載的整體性能和效率。

這些新增功能將繼續(xù)拓寬采用RISC-V的邊緣設(shè)備的應(yīng)用領(lǐng)域,為其在從智能家居和醫(yī)療保健設(shè)備到工業(yè)自動化系統(tǒng)和自動駕駛汽車等各個領(lǐng)域的部署鋪平道路。憑借如此廣泛的應(yīng)用范圍,基于RISC-V的處理器技術(shù)將持續(xù)作為智能、互聯(lián)邊緣ML系統(tǒng)的基本構(gòu)件——這一趨勢已在多個領(lǐng)域的實際應(yīng)用中占據(jù)主導地位。

隨著RISC-V生態(tài)系統(tǒng)不斷成熟、開發(fā)人員對該架構(gòu)日益熟悉,更多的創(chuàng)新應(yīng)用將不斷涌現(xiàn),實現(xiàn)更加出色的ML應(yīng)用。未來將是智能、互聯(lián)和高效創(chuàng)新的時代。

參考資料

[1] SiFive website, n.d., accessed February 16, 2024, https://www.sifive.com/.

[2] Wajid Ali. "Exploring Instruction Set Architectural Variations: x86, ARM, and RISC-V in Compute-Intensive Applications," Engineering: Open Access 1, no. 3, (2023):157–162.

作者簡介

image.png

Brandon是一位有超過十年經(jīng)驗的深度技術(shù)記者、講述者和技術(shù)作家,從軟件初創(chuàng)公司到半導體巨頭都是他曾經(jīng)報道過的對象。他關(guān)注的領(lǐng)域包括嵌入式處理器、硬件、軟件和工具,因為它們都與電子系統(tǒng)集成、物聯(lián)網(wǎng)/工業(yè)4.0部署和邊緣人工智能等用例有關(guān)。他還是一名出色的播客、視頻博主、活動主持人和會議發(fā)言人,并曾在多家電子工程貿(mào)易出版物中擔任主編和技術(shù)編輯。Brandon在不出席B2B技術(shù)受眾的大型活動時,會通過電視指導菲尼克斯地區(qū)的體育特許經(jīng)營公司。



關(guān)鍵詞: RISC-V 邊緣機器學習

評論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉