新聞中心

EEPW首頁 > 專題 > AI架構(gòu)創(chuàng)新和高端芯片發(fā)展

AI架構(gòu)創(chuàng)新和高端芯片發(fā)展

作者:魏少軍 時(shí)間:2018-02-27 來源:電子產(chǎn)品世界 收藏
編者按:在“2017中國集成電路產(chǎn)業(yè)促進(jìn)大會(huì)”上,清華大學(xué)魏少軍教授就架構(gòu)創(chuàng)新和高端芯片發(fā)展做了相關(guān)報(bào)告。根據(jù)魏少軍教授會(huì)上報(bào)告整理,已獲作者授權(quán)。

作者 / 魏少軍 清華大學(xué)微納電子學(xué)系主任 (北京 100084)

本文引用地址:http://butianyuan.cn/article/201802/376161.htm

魏少軍,博士,教授,清華大學(xué)微納電子學(xué)系主任,清華大學(xué)微電子學(xué)研究所所長,清華大學(xué)移動(dòng)計(jì)算研究中心主任 。

摘要:在“2017中國產(chǎn)業(yè)促進(jìn)大會(huì)”上,清華大學(xué)魏少軍教授就發(fā)展做了相關(guān)報(bào)告。根據(jù)魏少軍教授會(huì)上報(bào)告整理,已獲作者授權(quán)。

0 引言

  隨著近年來人工智能(AI)的興起,AI芯片的需求量越來越大,性能要求越來越高。而AI運(yùn)算量很大,這就意味著其需要有足夠高的運(yùn)算速度,預(yù)計(jì)其運(yùn)算速度需要達(dá)到每秒幾千億次。如果從能量效率角度分析,大概要做到每瓦1萬億次。因此,國內(nèi)做AI芯片的企業(yè)大部分還在用專用芯片在做。采用專用的問題在于,當(dāng)網(wǎng)絡(luò)一旦變化,專用做成的芯片將無法應(yīng)對(duì)再應(yīng)用。這就為可編程器件帶來了機(jī)遇。

1 FPGA難以達(dá)到AI的要求

  可編程器件的一個(gè)優(yōu)點(diǎn)是可以通過軟件的方式來改變芯片的功能,從而適應(yīng)各種不同功能的應(yīng)用。最終提升銷量,從而分?jǐn)偖a(chǎn)品的成本。

  而現(xiàn)在較為常用的可編程器件——FPGA仍然存在諸多問題,還難以達(dá)到AI的速率及通過軟件改變芯片功能的需求。

  1)FPGA的配置信息量很大,多達(dá)數(shù)十兆字節(jié),因而所需配置時(shí)間也很長,大概要幾十毫秒,甚至幾秒。

  2)能量效率低。FPGA面板利用率很低,大概只有5%用來進(jìn)行計(jì)算,95%用來配置信息。正因?yàn)槠?5%是用來配置用的,還要耗電,因而能量效率很低。

  3)另外,由于各方面原因,F(xiàn)PGA往往需要最先進(jìn)的工藝,同時(shí)還必須要有電路設(shè)計(jì)的支持,這也帶來了高設(shè)計(jì)成本。

  FPGA存在的問題總結(jié)起來包含十點(diǎn):高細(xì)密度、配置信息量大、配置時(shí)間長、需要斷電靜態(tài)配置、沒有邏輯復(fù)用能力、面積利用率低、能量效率低、工藝要求較高、對(duì)開發(fā)人員知識(shí)儲(chǔ)備要求高、價(jià)格貴,具體如表1所示。

2 理想的硬件結(jié)構(gòu)

  如圖1所示系統(tǒng)架構(gòu)為設(shè)想的理想系統(tǒng)架構(gòu)。其中左邊為軟件(應(yīng)用),如果不考慮硬件的代價(jià),左邊有怎樣的操作,右邊就要對(duì)應(yīng)怎樣的硬件,左邊和右邊的拓?fù)浣Y(jié)構(gòu)是完全一致的。從計(jì)算上來看,這樣的結(jié)構(gòu)一定是效率最高的。

  在這樣的架構(gòu)中,軟件可以無窮大,例如寫一個(gè)循環(huán)語句,可以一直循環(huán)下去,但是硬件不論多大都是有邊界的,這就需要將軟件分塊搬到硬件上按順序執(zhí)行。這樣搬的過程中,右邊的硬件架構(gòu)其實(shí)是在不斷變化的,我們稱之為架構(gòu)和功能可以動(dòng)態(tài)按照軟件要求實(shí)時(shí)改變。

3 軟件執(zhí)行方式

  軟件信息主要可以分為兩類:計(jì)算信息和控制信息。如果我們將軟件寫成如圖2所示形式,中間對(duì)應(yīng)的是控制信息,用來控制程序執(zhí)行流程,右邊對(duì)應(yīng)的是計(jì)算信息。如果將軟件中的計(jì)算信息和控制信息分開,就可以找到相應(yīng)的架構(gòu),包括控制單元和數(shù)據(jù)通道。

  數(shù)據(jù)通道對(duì)應(yīng)的是陣列,控制單元對(duì)應(yīng)的是有限狀態(tài)機(jī),不論是陣列,還是有限狀態(tài)機(jī),都是完全可編程的。從而實(shí)現(xiàn)不同軟件部分按要求搬進(jìn)去執(zhí)行,具體地,將分塊軟件按照他們的依賴關(guān)系送到數(shù)據(jù)通道中,通過數(shù)據(jù)通道配置其中陣列,并執(zhí)行。

  而在軟件配置和執(zhí)行過程中,如果整個(gè)系統(tǒng)是按照C語言編寫的,通過編譯器會(huì)產(chǎn)生一系列的控制流,最后在硬件芯片上運(yùn)行。這種架構(gòu)的獨(dú)特之處在于采用控制流、數(shù)據(jù)流和配置流代替之前的指令集。



上一頁 1 2 下一頁

評(píng)論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉