東芝開發(fā)出帶DNN的汽車級圖像識別芯片(SoC)
2019年2月,東芝開發(fā)出一款汽車級圖像識別芯片(SoC),與東芝上一代產(chǎn)品相比,該產(chǎn)品使深度學(xué)習(xí)加速器的速度提升10倍,功效提高4倍。由于新產(chǎn)品加入了深度神經(jīng)網(wǎng)絡(luò)(DNN)模仿大腦神經(jīng)網(wǎng)絡(luò)的算法,與傳統(tǒng)模式識別和機器學(xué)習(xí)相比,DNN的識別處理精度要高得多,預(yù)計該產(chǎn)品將會在汽車領(lǐng)域得到廣泛應(yīng)用。這也是東芝目前最新的AI方向的產(chǎn)品。
本文引用地址:http://butianyuan.cn/article/201905/400294.htm值得一提的是,東芝的這項技術(shù)成果已于2019年2月19日在美國舊金山舉行的2019 IEEE國際固態(tài)電路會議(ISSCC)上公之于眾,并且新系統(tǒng)級芯片符合全球汽車功能安全標(biāo)準(zhǔn)ISO26262的要求。
東芝通過在硬件上實現(xiàn)深度學(xué)習(xí)的DNN加速器解決了這一難題。它具有三大特點。
? 并行MAC單元。DNN處理需要大量MAC計算。東芝的新產(chǎn)品有四個處理器,每個處理器包含256個MAC單元。因此提高了DNN的處理速度。
? 減少了動態(tài)隨機存取存儲器(DRAM)存取。傳統(tǒng)的系統(tǒng)級芯片沒有本地內(nèi)存,無法在靠近DNN執(zhí)行單元的位置保存臨時數(shù)據(jù),并且在訪問本地內(nèi)存時會產(chǎn)生較大功耗。同時,加載用于MAC計算的加權(quán)數(shù)據(jù)也會產(chǎn)生較大功耗。東芝新產(chǎn)品可在DNN執(zhí)行單元附近執(zhí)行靜態(tài)隨機存取存儲器(SRAM),并將DNN處理分為多個子處理塊,因此可將臨時數(shù)據(jù)保存在SRAM內(nèi),從而減少了DRAM存取。此外,東芝還在加速器上增加了一個解壓縮單元??赏ㄟ^解壓縮單元加載預(yù)先壓縮并存儲在DRAM中的加權(quán)數(shù)據(jù)。因此,降低了加載來自DRAM的加權(quán)數(shù)據(jù)時產(chǎn)生的功耗。
? 減少了SRAM存取。傳統(tǒng)深度學(xué)習(xí)需要在處理DNN的每一層之后訪問DRAM,因此功耗過高。該加速器在DNN的DNN執(zhí)行單元中設(shè)計有管線層結(jié)構(gòu),以便在一次SRAM存取期間執(zhí)行一系列DNN計算。
評論