技術(shù)革命!主流芯片架構(gòu)正在發(fā)生重大變化?
更多計(jì)算,更少移動(dòng)
本文引用地址:http://butianyuan.cn/article/201808/391400.htm使問題變得更加復(fù)雜的是,邊緣設(shè)備以各種頻率和速度產(chǎn)生了多種不同類型的數(shù)據(jù)。為了使數(shù)據(jù)在各種處理單元之間流暢地移動(dòng),必須比過去更加有效地管理它。
“有四種主要配置 - 多對(duì)多、內(nèi)存子系統(tǒng)、低功耗IO以及網(wǎng)狀和環(huán)形拓?fù)?,”Arteris IP董事長(zhǎng)兼首席執(zhí)行官Charlie Janac說。 “你可以將所有這四個(gè)要素放在單個(gè)芯片中,現(xiàn)在的決策型IoT芯片就是這么做的?;蛘吣梢蕴砑泳哂懈咄掏履芰Φ腍BM子系統(tǒng)。但是由于其中一些工作負(fù)荷是面向特定行業(yè)需求,而且每個(gè)芯片都需要面對(duì)多個(gè)工作負(fù)荷,具有多個(gè)引腳,所以問題依然很復(fù)雜。你看其中一些物聯(lián)網(wǎng)芯片,它們會(huì)收集大量的數(shù)據(jù)。些工作負(fù)載非常具體,每個(gè)芯片有多個(gè)工作負(fù)載和引腳。 如果你看一些物聯(lián)網(wǎng)芯片,它們會(huì)收集大量的數(shù)據(jù)。像汽車中的雷達(dá)和LiDAR這樣的東西尤其如此。如果沒有某種先進(jìn)的互連技術(shù),它們的存在毫無意義?!?/p>
挑戰(zhàn)在于如何盡量減少數(shù)據(jù)移動(dòng),以及在需要時(shí)最大程度提高數(shù)據(jù)傳輸速度,并以某種方式在不消耗太多功率的情況下取得本地處理和集中處理的平衡。
“一方面是帶寬問題,”NetSpeed Systems產(chǎn)品營(yíng)銷經(jīng)理Rajesh Ramanujam說。 “如果可能的話,您希望盡量不要移動(dòng)數(shù)據(jù),因此您可以將數(shù)據(jù)放得離處理器更近。但是,如果您必須移動(dòng)數(shù)據(jù),則需要盡可能地壓縮數(shù)據(jù)。但是,現(xiàn)實(shí)情況往往更加復(fù)雜,你必須從系統(tǒng)級(jí)別查看這種可能性。每一步都需要考慮多個(gè)因素,確定您是以傳統(tǒng)的讀寫方式使用內(nèi)存還是利用新的內(nèi)存技術(shù)。在某些情況下,您可能希望更改數(shù)據(jù)本身的存儲(chǔ)方式。如果您想要更快的性能,通常意味著更大的芯片尺寸,這會(huì)影響功耗?,F(xiàn)在你還要考慮功能安全,因此不得不擔(dān)心數(shù)據(jù)過載。”
這就是為什么人們把那么多的注意力放在加強(qiáng)邊緣處理能力和增加各種處理單元之間的傳輸吞吐能力上?,F(xiàn)在,隨著架構(gòu)的演化和完善,處理的實(shí)現(xiàn)方式和位置都發(fā)生了很大變化。
比如,Marvell推出了一款內(nèi)置AI能力的SSD控制器,它可以在邊緣節(jié)點(diǎn)上處理更大的計(jì)算負(fù)荷。其中的AI引擎可用于固態(tài)存儲(chǔ)本身的分析。
“你可以直接將模型加載到硬件中,并在SSD控制器上進(jìn)行硬件處理,”Marvell的首席工程師Ned Varnica說。 “今天,云端主機(jī)就是這樣做的。但是,如果每個(gè)SSD都要將數(shù)據(jù)發(fā)送到云端,那將會(huì)產(chǎn)生巨大的網(wǎng)絡(luò)流量。最好在邊緣就地處理,主機(jī)只需要發(fā)出元數(shù)據(jù)形式的命令。 這樣一來,您擁有的存儲(chǔ)設(shè)備越多,處理能力就越強(qiáng)。降低網(wǎng)絡(luò)傳輸?shù)暮锰幏浅4?。?/p>
這種方法有一點(diǎn)特別值得注意,即它強(qiáng)調(diào)數(shù)據(jù)根據(jù)應(yīng)用類型而移動(dòng)的靈活性。主機(jī)可以生成一個(gè)任務(wù),將它發(fā)送到存儲(chǔ)設(shè)備上進(jìn)行處理,然后只需要返回元數(shù)據(jù)或者計(jì)算結(jié)果。在另外一種場(chǎng)景中,存儲(chǔ)設(shè)備可以存儲(chǔ)數(shù)據(jù),對(duì)數(shù)據(jù)進(jìn)行預(yù)處理并從生成元數(shù)據(jù)、標(biāo)簽和索引,主機(jī)需要進(jìn)行進(jìn)一步分析時(shí)再讀回它們。
這只是其中一種方案,還有其它的選擇。三星的Rupley強(qiáng)調(diào)了亂序處理和融合習(xí)語,它們可以解碼兩條指令并將它們?nèi)诤显趩蝹€(gè)操作中。
AI監(jiān)督和優(yōu)化
在所有這些之上是人工智能,它是芯片架構(gòu)領(lǐng)域的新技術(shù)。它不管操作系統(tǒng)和中間件如何管理功能,而是在系統(tǒng)級(jí)別上監(jiān)督芯片以及芯片之間的行為。在某些情況下,AI可以體現(xiàn)為芯片內(nèi)的神經(jīng)網(wǎng)絡(luò)。
eSilicon市場(chǎng)營(yíng)銷副總裁Mike Gianfagna表示,“AI的作用并不是將更多東西包裝在一起,多到足夠改變傳統(tǒng)的處理方式。通過AI和機(jī)器學(xué)習(xí),你可以在系統(tǒng)周圍部署人工智能,以獲得更高效和預(yù)測(cè)性的處理。它有時(shí)可以是在系統(tǒng)內(nèi)獨(dú)立運(yùn)行的單獨(dú)芯片?!?/p>
Arm正在開發(fā)首款機(jī)器學(xué)習(xí)芯片,它計(jì)劃于今年晚些時(shí)候推出,面向多個(gè)細(xì)分市場(chǎng)和垂直市場(chǎng)?!斑@是一種新型處理器,”Arm的杰出工程師Ian Bratt說。 “它包括一個(gè)基本塊,其中帶有一個(gè)計(jì)算引擎、一個(gè)MAC引擎和一個(gè)帶有控制單元和廣播網(wǎng)絡(luò)的DMA引擎。該芯片共有16個(gè)計(jì)算引擎,使用7nm制造工藝,在1GHz主頻下可達(dá)到4 teraOps的計(jì)算能力。”
Arm機(jī)器學(xué)習(xí)處理器架構(gòu)
由于Arm生態(tài)系統(tǒng)面向多個(gè)合作伙伴,因此該芯片比其它AI/ML芯片更加通用,配置能力更強(qiáng)。它沒有搭建一個(gè)包羅萬物的單片架構(gòu),而是根據(jù)功能劃分不同處理單元,因此每個(gè)計(jì)算引擎都是面向不同的功能特征。Bratt表示,AI芯片的四個(gè)關(guān)鍵要素是靜態(tài)調(diào)度、高效卷積、帶寬減少機(jī)制以及面向未來設(shè)計(jì)的可編程性。
英偉達(dá)則采取了不同的策略,它選擇在GPU旁邊構(gòu)建專用的深度學(xué)習(xí)引擎,以優(yōu)化圖片和視頻處理的數(shù)據(jù)傳輸。
結(jié)論
芯片制造商表示,通過實(shí)行部分或全部這些方法,他們可以每隔幾年就將性能提高一倍,以跟上數(shù)據(jù)爆炸性增長(zhǎng)的步伐,同時(shí)滿足功耗的嚴(yán)格限制。這些方法不僅是提供更多計(jì)算機(jī),還正在改變芯片設(shè)計(jì)和系統(tǒng)工程化的起點(diǎn),它們更多考慮數(shù)據(jù)的不斷增長(zhǎng),而不是硬件和軟件的限制。
Synopsys公司董事長(zhǎng)兼聯(lián)席首席執(zhí)行官Aart de Geus說:“當(dāng)最初一代計(jì)算機(jī)開始進(jìn)入公司時(shí),很多人都認(rèn)為世界的發(fā)展速度將會(huì)加快很多。沒有計(jì)算機(jī)時(shí),他們用一堆紙質(zhì)的會(huì)計(jì)賬簿進(jìn)行會(huì)計(jì)處理。自那以后,各種公司事務(wù)的處理速度發(fā)生了指數(shù)級(jí)的變化,現(xiàn)在,這種變化再一次來到了我們面前。這種快速的變化就像突然可以把會(huì)計(jì)賬簿打印出來了一樣。就像在農(nóng)業(yè)領(lǐng)域里,你只需要在某一天溫度上升的時(shí)候灌溉適當(dāng)?shù)乃湍撤N肥料,就可以等待豐收一樣,機(jī)器學(xué)習(xí)也是這種之前并不明顯的優(yōu)化。”
西門子子公司Mentor的總裁兼首席執(zhí)行官Wally Rhines也認(rèn)可這種觀點(diǎn)?!靶录軜?gòu)將被人們接納,人們將在新架構(gòu)下設(shè)計(jì)芯片,在許多甚至大多數(shù)場(chǎng)景下執(zhí)行機(jī)器學(xué)習(xí),就像您的大腦有能力從經(jīng)驗(yàn)中學(xué)習(xí)一樣。我拜訪了20多家正在做自己的專用AI處理器的公司,它們都有自己的特色。你會(huì)越來越多地在各種特定應(yīng)用中看到它們,它們對(duì)傳統(tǒng)的馮諾伊曼架構(gòu)形成了有效補(bǔ)充。神經(jīng)形態(tài)計(jì)算將成為處理,它將幫助我們提高計(jì)算效率、降低成本,在移動(dòng)和聯(lián)接性的環(huán)境中完成工作,現(xiàn)在我們還必須在大型服務(wù)器集群中完成這些工作?!?/p>
評(píng)論