眾廠商談邊緣AI的技術與產品策略
高精度的FPGA架構
本文引用地址:http://butianyuan.cn/article/201811/395028.htm無論是作為協(xié)處理器、獨立的處理單元亦或是簡單的橋接,只要客戶尋求的價值定位是創(chuàng)新、快速上市、低延遲、靈活的IO以及可編程性,F(xiàn)PGA就有其獨特的優(yōu)勢。靈活IO可以在不同的應用場景支持不同類別的傳感器,甚至處理多個傳感器交互和融合。AI目前還在初步階段,萊迪思預計神經網絡引擎需要可編程性持續(xù)演進和優(yōu)化。通用的MCU功耗和延遲一般會較高,加入固化的加速器雖然可以改善當下的性能,在未來幾年內不能持續(xù)優(yōu)化的缺陷會是個很大的限制。在新一版的CNN加速器IP,萊迪思針對了神經網絡的需求來優(yōu)化了DRAM存儲器帶寬,使得ECP5的推理性能最多提升至2倍。
隨著AI不斷火熱,IoT和智能傳感器市場將持續(xù)增長。物聯(lián)網世界的多樣性也將是FPGA靈活架構大放異彩的機會。因此在超低功耗、低成本、小尺寸的iCE40 UltraPlus上,萊迪思也推出了輕量化CNN來滿足更靈活的性能、精度、功耗的平衡與取舍。盡管輕量化CNN比之前推出的二值神經網絡(BNN)功耗稍高,但是其精度和性能也更優(yōu)秀,CNN在業(yè)界的接受度也比BNN更為廣泛。
更高性能的邊緣應用
Achronix的FPGA產品和技術專注于邊緣應用上的多種人工智能(AI)需求,例如汽車傳感器融合、目標檢測和識別、AI和機器學習,以及360度環(huán)繞視圖系統(tǒng)等需要在邊緣上本地處理數據的應用。
可編程邏輯提供了使計算更加以數據為中心的能力。雖然傳統(tǒng)的處理器都要求數據通過復雜的高速緩存層級被送到其流水線中,而可編程邏輯則能夠構建數據流水線。借助由定制邏輯電路和數字信號處理器(DSP)引擎組成的數據單元來在數據通過時操控它們,數據可以從一個節(jié)點到另一個節(jié)點無縫流動;每個單元都已準備好把數據轉發(fā)到需要它們的下一個節(jié)點。隨著需求的變化,其中的邏輯陣列可以輕松地重新連線形成新的配置。與更適合處理控制密集型代碼的微處理器相比,這種邏輯陣列可以為以數據為中心的應用提供更好的支持。然而,獨立FPGA芯片通常會產生更大的功耗,這是因為需要將數據頻繁地移入和移出更專用的ASIC芯片中。
嵌入式FPGA(eFPGA)技術提供了一種方法,可以在一個封裝芯片中滿足邊緣計算應用的能效、性能、延遲和面積限制。結合eFPGA技術,可以把平時部署在獨立的ASIC芯片中的常用功能在定制硬件中實現(xiàn)集成,以帶來更高的性能和密度。對于機器學習應用,這些功能可以是用于卷積內核或最大池計算的專用處理器陣列。通過在同一芯片上集成可編程邏輯和定制邏輯,可以避免在芯片外傳輸數據,從而節(jié)省大量功耗。
有關開發(fā)環(huán)境和技術方面內容如下:
Speedcore?嵌入式FPGA:它是經流片驗證的高密度、高性能eFPGA半導體知識產權(IP)產品。
Speedchip? FPGA合封芯片:FPGA合封芯片專為嵌入到先進的系統(tǒng)級封裝(SiP)解決方案進行了優(yōu)化,如通過硅介電層或有機基板實現(xiàn)了2.5D封裝。
Speedster?22i FPGA:這是一系列高性能和高密度FPGA芯片,帶有適用于通信應用的嵌入式系統(tǒng)IP,包括10 G / 100 G以太網、100 G Interlaken、PCIe Gen3×8和DDR3等。
PCIe Accelerator-6D加速板:它們是具有業(yè)界最高存儲器帶寬的、基于FPGA的PCIe附加卡,適用于高速加速應用。
Achronix?的自動化設計(CAD)環(huán)境被稱為ACE,它與行業(yè)標準的邏輯綜合工具配合使用,使FPGA設計人員能夠輕松地將其設計映射到Achronix FPGA芯片中。
支持生態(tài)系統(tǒng)與AI的開發(fā)和應用
Imagination的業(yè)務是為半導體芯片提供必要的內核構建模塊。Imagination主要以自己的嵌入式圖形(GPU)技術和神經網絡加速器(NNA)技術而聞名,并將這些技術授權給全球領先的芯片供應商。他們的半導體芯片廣泛應用于多種產品和服務,因此Imagination在市場中擁有非常獨特的地位,因為Imagination可以支持整個生態(tài)系統(tǒng)參與人工智能(AI)的開發(fā)和應用。
GPU和NNA現(xiàn)在是邊緣AI的必要元素。隨著眾多企業(yè)開始認識到在各種任務(從自然語言處理到圖像分類)中應用神經網絡的潛力,引入人工智能元素的產品數量也開始穩(wěn)步增加。同時,這些任務的處理正在從傳統(tǒng)的基于云架構轉移向設備端本身,基于硬件的專用神經網絡加速器現(xiàn)在可嵌入至半導體芯片中,以實現(xiàn)本地的AI處理。從可監(jiān)控前方道路的先進駕駛輔助系統(tǒng)(ADAS)到虛擬助手等聲控的消費性電子產品,關于集成的、基于神經網絡AI的機會正在向多個細分市場延伸。
不可否認,AI正在成為許多應用的必要元素。但是,仍然有很多挑戰(zhàn)。其中之一就是在邊緣和云之間平衡處理負載,并找到放置AI本身的最佳位置。例如,邊緣AI可用于消費性設備上的本地語音識別,比如識別“喚醒詞”或簡單指令,但是依然有必要在云端進行大部分的語音AI處理,以便利用那些無法在設備端存儲的龐大知識庫?,F(xiàn)在許多設備都標榜帶有AI,但實際上,除了依靠云端去給人智能的印象以外,就僅僅只是在本地做了簡單的模式匹配和識別而已。
半導體工藝不斷演進,為在邊緣設備上進行更多的AI處理創(chuàng)造了機會。例如,Imagination將看到能夠監(jiān)控特定事件的智能安全攝像頭。它們將使用邊緣AI處理來識別視頻流中的特征,例如道路上的車輛或鏡頭中的人臉,然后觸發(fā)特定事件,例如計算車輛的數量或允許授權人員訪問。他們甚至可以通過減少“誤報”的數量來節(jié)省成本,因為攝像頭中的邊緣AI可以識別正常行為和可疑行為之間的差異。
另一個挑戰(zhàn)是,盡管AI應用的數量在不斷增加,但這并不一定意味著集成了AI加速功能的SoC是所有應用場景的前進方向。的確,如果Imagination考慮AI去覆蓋大部分細分市場,那么由于使用該技術的各種產品具有截然不同的工藝要求,碎片化會自然而然地發(fā)生。碎片化的市場對于使用專用SoC提供服務具有挑戰(zhàn)性,所以“一應俱全”的方法不會始終適用。雖然諸如手機或ADAS(高級駕駛員輔助系統(tǒng))等一些市場為SoC供應商提供了大量機會,但許多以人工智能應用為目標的市場將自然呈現(xiàn)出低銷量前景。例如,一些產品可能需要AI進行語音處理或圖像識別,但不是兩者都需要;同樣,智能家居供應商不大可能只為將AI功能嵌入他們的控制面板而去使用原本為智能手機設計的SoC,因為這不符合成本效益。這個難題的解決方案就是打造專用的AI芯片,其可以作為輔助芯片與主應用處理器一起使用,去卸載通常由主應用處理器中的NNA內核處理的AI推理任務。這樣做的優(yōu)勢是SoC供應商可以提供一系列具有不同性能水平的邊緣AI芯片;同時,原始設備制造商(OEM)可以根據他們希望在自己的特定應用中所處理的AI處理開銷來選擇適當地擴展產品解決方案。
RISC-V適合AI、物聯(lián)網等創(chuàng)新
有人預言,RISC-V或將是繼Intel和Arm之后的第三大主流處理器體系。實際上,三年前RISC-V基金會剛剛成立,如今已有200余家會員,會員遍布27個國家,得到了來自中國、印度、俄羅斯等國政府、高校、企業(yè)界的支持。RISC-V為何在短時間內受歡迎?
相比Intel和Arm,RISC-V有三大特點。
首先,從微處理器角度看,RISC-V的Core(核)設計得非常精巧、簡單、有效,允許運行基本的操作系統(tǒng)。
其次,允許可擴展,由非營利組織——RISC-V基金會運營的,不像過去Intel和Arm等是由一家公司運營的,RISC-V核是大家(Community)運營的,只要加入基金會,成為基金會成員,就可以用。RISC-V的可擴充性允許開發(fā)者加自己新的指令,而且允許開發(fā)者的設計是開源的,也可以不開源,也可以用來賺錢,也可以做研究……這種靈活的模式帶來了微處理器的革命。實際上,RISC-V是第一個硬件開源的,開源了ISA。ISA指令集是硬件與軟件的接口。
第三,帶來很多創(chuàng)新。在微處理器產品里,從IT和IC領域里,很長時間里被Intel壟斷的,之后有Arm。由于知識產權的限制,其他公司不能使用Intel或Arm的ISA指令來做自己事情,除非得到授權。因此,多年來,很少有開發(fā)者在架構方面做創(chuàng)新。不過,RISC-V開了一扇門,允許公司、高校師生、研究機構等做產品或進行研究。有個形象的比喻,過去只有一種榔頭,做任何事都要用這個榔頭,現(xiàn)在允許大家開發(fā)各種各樣的榔頭。
值得指出的是,RISC-V并不是比Intel和Arm好。因為Intel和Arm也是非常優(yōu)秀的公司,投入了大量資金和努力,開發(fā)了很好的產品。區(qū)別在于那兩種芯片/架構是私人所有的,不是開放、免費的,RISC-V是第一個在微處理器領域里把ISA指令架構開放,這是一場革命,帶來了全新的商業(yè)形態(tài)和創(chuàng)新環(huán)境。
原來的商業(yè)模式,Intel和Arm把產品做好了,無法改變。但市場上應用場景在變,目前已經超越PC和手機時代了。在很多應用場景,例如AI、物聯(lián)網和區(qū)塊鏈等有很多創(chuàng)新的應用,對架構有新的要求,老是用一套做是不行的,RISC-V允許核本身不動,基本ISA由community(社區(qū))統(tǒng)一管理,允許加不同的東西進來,這樣可以把很多事情做好。
RISC-V的ISA是開放和免費的。有三種模式:1.有可能開源社區(qū)獲得免費的設計,像Linux;2.商業(yè)模式方面,有的是像致象爾、SiFive、晶心科技等公司,利用ISA設計芯片,銷售IP和設計,出售證書(licensing)或royality(版權);3.賣芯片。由表1可見,Arm不做芯片,只做設計。Intel不賣設計,只出售芯片。RISC-V在這三個方面都可以。
參考文獻:
[1] 任澤坤.芯片廠商引領廣電的人工智能化[J],電子產品世界,2017(10);19~23
[2] 王瑩.人工智能的進展及發(fā)展建議[J],電子產品世界,2017(2);19~23
[3] 有鵬,劉勇,楊林莉,等. 基于物聯(lián)網的圖像監(jiān)控系統(tǒng)[J],電子產品世界,2017(7);37~40
本文來源于《電子產品世界》2018年第12期第11頁,歡迎您寫論文時引用,并注明出處。
評論