人工智能?自動(dòng)駕駛?云計(jì)算?數(shù)據(jù)中心?10nm FPGA全程帶飛
CPU疲于應(yīng)對(duì)未來(lái)大數(shù)據(jù)運(yùn)算
當(dāng)下時(shí)代的主題究竟是什么?5G通信?人工智能?自動(dòng)駕駛?還是云計(jì)算?或許都是;又或許,都不是。當(dāng)你看到在這些前端應(yīng)用市場(chǎng)不斷迸發(fā)著激情和靈感時(shí),如何滿足其背后以指數(shù)形式增長(zhǎng)的數(shù)據(jù)需求就成了諸多工程師最為頭疼的問(wèn)題。
有數(shù)據(jù)顯示,到2020年,平均每位互聯(lián)網(wǎng)用戶每天將會(huì)產(chǎn)生1.5GB數(shù)據(jù)流量,自動(dòng)駕駛汽車每天將會(huì)產(chǎn)生4TB數(shù)據(jù)流量,聯(lián)網(wǎng)飛機(jī)每天將會(huì)產(chǎn)生5TB數(shù)據(jù)流量,智能工廠每天將會(huì)產(chǎn)生1PB數(shù)據(jù)流量,云視頻提供商每天將會(huì)生成750PB視頻類的數(shù)據(jù)流量。在聯(lián)網(wǎng)的世界里,數(shù)據(jù)量將會(huì)以指數(shù)形式增長(zhǎng)。(1PB=1024TB)
目前,全世界有80億個(gè)終端聯(lián)網(wǎng),到2020年將會(huì)有500億個(gè)終端聯(lián)網(wǎng),與此同時(shí),未來(lái)聯(lián)網(wǎng)設(shè)備將會(huì)需要更寬的帶寬。據(jù)思科預(yù)測(cè),到2020年,聯(lián)網(wǎng)IP流量將會(huì)達(dá)到2300EB(1EB=1024PB)。這時(shí),數(shù)據(jù)中心會(huì)與終端連接,形成一個(gè)良性循環(huán),而物聯(lián)網(wǎng)的發(fā)展將會(huì)加速這一循環(huán),使得網(wǎng)絡(luò)將必須在更高的速度上處理更多數(shù)據(jù),數(shù)據(jù)中心也需要做更復(fù)雜的計(jì)算,處理更大的數(shù)據(jù)級(jí),嵌入式終端和設(shè)備也要做很多本地計(jì)算。另外,數(shù)據(jù)中心還需要應(yīng)對(duì)更多具有挑戰(zhàn)性的負(fù)載,例如大數(shù)據(jù)分析和機(jī)器學(xué)習(xí),這又將會(huì)在整個(gè)循環(huán)中產(chǎn)生很多數(shù)據(jù)瓶頸和計(jì)算熱點(diǎn),這些都使得CPU無(wú)法單獨(dú)應(yīng)對(duì)。
如何解決這一難題呢?
FPGA:讓我來(lái)為計(jì)算加點(diǎn)料!!!
圖1 數(shù)據(jù)中心與終端設(shè)備的良性循環(huán)
FPGA:時(shí)代的推手
5G通信、物聯(lián)網(wǎng)、云計(jì)算、智慧城市、自動(dòng)駕駛及雷達(dá)和航天是當(dāng)下最火爆的六大應(yīng)用市場(chǎng),而由于這些應(yīng)用都涉及到海量的數(shù)據(jù)和高速的運(yùn)算能力,每個(gè)市場(chǎng)都在面臨連接數(shù)量和計(jì)算復(fù)雜度的急速增長(zhǎng),單靠CPU已經(jīng)很難輕松拿下未來(lái)這場(chǎng)攻堅(jiān)戰(zhàn)。而利用FPGA開發(fā)系統(tǒng)時(shí),系統(tǒng)設(shè)計(jì)不會(huì)被鎖定,開發(fā)周期短,相比專用硬件具有更好的容錯(cuò)性。因而,可以說(shuō)FPGA的又一主場(chǎng)即將到來(lái)。
例如,在當(dāng)下熱點(diǎn)之一的無(wú)人駕駛領(lǐng)域,隨著無(wú)人駕駛的不斷發(fā)展,對(duì)性能將會(huì)有更高的要求,而在對(duì)算法應(yīng)用上也將會(huì)有很大的不確定性,因而會(huì)出現(xiàn)很多計(jì)算孤島,每一個(gè)孤島會(huì)有自己的本身硬件和開發(fā)環(huán)境,這對(duì)制造開發(fā)商來(lái)說(shuō)是不可持續(xù)的。FPGA在以下兩個(gè)領(lǐng)域可以發(fā)揮關(guān)鍵作用:
1)本地計(jì)算。例如傳感器融合,深度學(xué)習(xí)推算這些都是要在汽車上本地實(shí)時(shí)進(jìn)行。
2)安全可靠的5G連接。把汽車和其他車輛及云端實(shí)現(xiàn)連接。
在智慧城市領(lǐng)域,同樣,計(jì)算孤島也正在出現(xiàn),包括交通管理系統(tǒng)、照明管理系統(tǒng)、泊車管理系統(tǒng)和安全攝像頭,實(shí)際上都是各自為政的,眾多不同的系統(tǒng)由眾多不同的廠家來(lái)生產(chǎn),有不同架構(gòu)和開發(fā)環(huán)境,不同的系統(tǒng)之間無(wú)法實(shí)現(xiàn)數(shù)據(jù)共享,城市管理者無(wú)法實(shí)現(xiàn)對(duì)城市全面的了解。而CPU+FPGA實(shí)際上可以取代一些專有的架構(gòu),只需要通過(guò)加速幾個(gè)關(guān)鍵功能就可以提供本地計(jì)算、連接和分析能力。另外,也可以將眾多的孤島放到單一的英特爾架構(gòu)上,加上FPGA的環(huán)境及5G網(wǎng)絡(luò),從而降低開發(fā)成本和錯(cuò)誤率,并使系統(tǒng)具備機(jī)器學(xué)習(xí)的能力,以應(yīng)對(duì)未來(lái)更加復(fù)雜的網(wǎng)絡(luò)環(huán)境和城市環(huán)境。
這些應(yīng)用都很好地說(shuō)明了FPGA在加速良性循環(huán)方面的重要作用。
FPGA才是異構(gòu)計(jì)算的神助手
其實(shí)FPGA相當(dāng)于一個(gè)具有以下兩方面優(yōu)點(diǎn)先進(jìn)的多功能加速器:
1) 擁有巨大的編程靈活性,支持高度差異化的產(chǎn)品;
2) 可以在現(xiàn)場(chǎng)重新配置,虛擬加速任何數(shù)字算法;
3) 支持并行運(yùn)算;
4) 吞吐量、實(shí)時(shí)速度、能耗等性能相比CPU或GPU優(yōu)異10倍;
5) 低時(shí)延可以處理更多數(shù)據(jù)。
因此,F(xiàn)PGA是一種兼具硬件性能和軟件可編程能力的產(chǎn)品,對(duì)于異構(gòu)計(jì)算來(lái)說(shuō)尤為重要。
FPGA在異構(gòu)計(jì)算中具體有兩種加速形式,即旁路加速和內(nèi)建加速。旁路加速可以將重度計(jì)算功能轉(zhuǎn)移到FPGA上,從而釋放處理器去處理其他功能;而如果時(shí)延比較重要,則可以進(jìn)行內(nèi)建加速,從而通過(guò)FPGA的多功能性帶來(lái)更好的網(wǎng)絡(luò)存儲(chǔ)和計(jì)算的加速。另外,英特爾FPGA產(chǎn)品在包括數(shù)據(jù)庫(kù)加速、基因測(cè)序、存儲(chǔ)及云端已經(jīng)有具體的應(yīng)用和很好的效果。
圖2 FPGA在異構(gòu)計(jì)算中的兩種加速形式
10nm FPGA帶節(jié)奏
Altera并入英特爾并成為英特爾PSG事業(yè)部,獲得了英特爾領(lǐng)先業(yè)界三年的制程技術(shù),帶來(lái)更大的容量和更快的速度。最新的STRATIX?10高端芯片已經(jīng)有樣片,ARRIA?10產(chǎn)品已經(jīng)在全面生產(chǎn),而CYCLONE?10和MAX?10已經(jīng)可以大量出貨。
圖3 STRATIX?10/ARRIA?10/CYCLONE?10/MAX?10
下一代基于英特爾10nm制程的新FPGA產(chǎn)品——Falcon Mesa,使用英特爾10nm制程及世界最先進(jìn)的FINFET技術(shù),也是第二代使用HyperFlexTM和基于EMIB異構(gòu)SIP(EMIB是英特爾的接口規(guī)范。)的產(chǎn)品。新產(chǎn)品會(huì)支持下一代HBM,轉(zhuǎn)換速率達(dá)112Gbps,還支持PCIe 4x16,從而可以支持16TB的大帶寬。
圖4 英特爾公司可編程解決方案事業(yè)部副總裁兼客戶體驗(yàn)事業(yè)部總經(jīng)理Rina Raman
英特爾公司可編程解決方案事業(yè)部副總裁兼客戶體驗(yàn)事業(yè)部總經(jīng)理Rina Raman稱,“這是Altera并入英特爾后第一代使用英特爾10nm制程技術(shù)開發(fā)出來(lái)的產(chǎn)品,我們將繼續(xù)推動(dòng)摩爾定律的實(shí)現(xiàn),為業(yè)界帶來(lái)領(lǐng)先的性能和能效?!?/p>
評(píng)論