為低功耗、高性能通用FPGA樹立行業(yè)“新標(biāo)桿”
為了強(qiáng)化Nexus系列產(chǎn)品的領(lǐng)先地位,萊迪思在過去的18個(gè)月內(nèi)推出了四款基于Nexus技術(shù)平臺(tái)的產(chǎn)品,包括主攻嵌入式視頻應(yīng)用的CrossLink-NX、經(jīng)過重新定義的通用FPGA Certus-NX、第二代安全FPGA Mach-NX、高級(jí)通用FPGA CertusPro-NX,以及預(yù)計(jì)將于2022年推出的同樣基于FD-SOI平臺(tái)的兩款新品。
本文引用地址:http://butianyuan.cn/article/202109/428001.htmNexus平臺(tái)代表了低功耗FPGA技術(shù)在近十年內(nèi)最重要的更新。作為Nexus家族的最新成員,CertusPro-NX主要是為了滿足智能系統(tǒng)中的數(shù)據(jù)協(xié)同處理、5G通信基礎(chǔ)設(shè)施中的高帶寬信號(hào)橋接、以及ADAS系統(tǒng)中的傳感器接口橋接等創(chuàng)新應(yīng)用需要而推出的,并在功耗設(shè)計(jì)、系統(tǒng)帶寬、邊緣處理、可靠性、封裝多樣性等多個(gè)方面得到了進(jìn)一步提升。
之所以選擇這樣的設(shè)計(jì)思路,是因?yàn)閺漠?dāng)前的行業(yè)發(fā)展趨勢來看,網(wǎng)絡(luò)邊緣設(shè)備的智能化程度正在大幅提高,它們一方面需要更高的接口帶寬以便于快速傳輸數(shù)據(jù),另一方面又需要更多小尺寸的系統(tǒng)集成和便于優(yōu)化散熱管理的低功耗方案。
“新標(biāo)桿”的成色
與競品相比,CertusPro-NX最大的特點(diǎn)在于它專為網(wǎng)絡(luò)邊緣處理進(jìn)行了優(yōu)化,不僅擁有行業(yè)領(lǐng)先的能耗效率和可靠性,還在超小的封裝尺寸中提供了行業(yè)最佳的系統(tǒng)帶寬,且是同類產(chǎn)品中唯一支持LPDDR4外部存儲(chǔ)器的FPGA產(chǎn)品。
通過利用萊迪思在FPGA架構(gòu)方面的創(chuàng)新和28nm低功耗FD-SOI制造工藝,CertusPro-NX器件的功耗比同類競品FPGA低四倍。通過改變基底的偏壓,開發(fā)人員可以自由選擇采用高性能(HP)還是低功耗(LP)模式運(yùn)行。
但功耗并非是Nexus平臺(tái)的唯一優(yōu)勢。像CertusPro-NX這樣的Nexus系列器件通常在其他方面也優(yōu)于相似的競品,包括數(shù)據(jù)處理性能、系統(tǒng)帶寬、存儲(chǔ)密度和對(duì)器件小尺寸的支持。
CertusPro-NX FPGA支持多達(dá)8個(gè)可編程SERDES通道,速度高達(dá)10.3Gbps,提供同類產(chǎn)品中最高的系統(tǒng)帶寬(是同類競品FPGA的兩倍之多),并支持主流的通信和顯示接口,如10 Gigabit Ethernet、PCI Express、SLVS-EC、CoaXPress和DisplayPort。
同時(shí),為滿足網(wǎng)絡(luò)邊緣AI和機(jī)器學(xué)習(xí)應(yīng)用對(duì)穩(wěn)定的數(shù)據(jù)協(xié)處理的需求,CertusPro-NX FPGA支持多達(dá)100K邏輯單元,是目前所有基于Nexus的FPGA中邏輯密度最高的器件,其片上存儲(chǔ)器容量也比同類其他FPGA高出約65%,是目前唯一支持LPDDR4 DRAM存儲(chǔ)標(biāo)準(zhǔn)的低功耗FPGA。此外,CertusPro-NX在可編程架構(gòu)基礎(chǔ)上還增加了超高效的DSP模塊,以及小型和大型內(nèi)部存儲(chǔ)器模塊,用于支持人工智能和機(jī)器學(xué)習(xí)應(yīng)用中的低延遲數(shù)據(jù)處理。
CertusPro-NX FPGA的設(shè)計(jì)面積僅為81mm2,比競品器件小6.5倍,例如擁有相同邏輯單元的Xilinx Artix-7 100K LC的尺寸面積為529mm2,是CertusPro-NX的6.5倍;而尺寸面積為121mm2的Intel Cyclone V GT 77K LC,邏輯單元僅有77K。這樣的小尺寸設(shè)計(jì)對(duì)于工業(yè)攝像頭或通信系統(tǒng)中使用SFP模塊的開發(fā)人員來說,是一個(gè)關(guān)鍵的設(shè)計(jì)考慮因素。
此外,考慮到汽車、工業(yè)和通信領(lǐng)域的關(guān)鍵型應(yīng)用必須有高的可靠性,實(shí)現(xiàn)可預(yù)測的性能并確保用戶安全,萊迪思將CertusPro-NX器件抗軟錯(cuò)誤能力提高了100倍,并可在-40℃至125℃的結(jié)溫范圍內(nèi)正常工作。這意味著,CertusPro-NX FPGA能夠以合理的商業(yè)成本為下一代通信、嵌入式、工業(yè)和汽車應(yīng)用帶來極高的可靠性,幫助系統(tǒng)時(shí)刻保持在線,保障最終用戶的安全。
全新的FPGA產(chǎn)品包括CPNX-50K和CPNX-100K兩個(gè)型號(hào),分別擁有52K和96K的邏輯單元數(shù)量,傳統(tǒng)的EBR(嵌入式memory)和大型RAM分別達(dá)到3.7Mb和3.6Mb,18×18 DSP與PLL數(shù)量最高可達(dá)156個(gè)和4個(gè),并支持10GE PCS、PCIe Gen 3、SGMII CDR、ADC等硬核模塊。
與此同時(shí),易于使用的Lattice Radiant設(shè)計(jì)軟件的最新版本現(xiàn)已推出。除了支持CertusPro-NX FPGA之外,Radiant 3.0在整個(gè)設(shè)計(jì)流程中優(yōu)化了信號(hào)可追溯性,讓開發(fā)人員能夠更輕松地在HDL源代碼和RTL視圖以及技術(shù)視圖之間追蹤驗(yàn)證信號(hào)。新版本可以讓用戶在萊迪思綜合引擎(LSE)和Synplify Pro綜合引擎之間進(jìn)行選擇,提高了設(shè)計(jì)靈活性。在Radiant 3.0中,時(shí)序分析與其他操作分開,因此可以獨(dú)立運(yùn)行時(shí)序分析。設(shè)計(jì)人員可以在設(shè)計(jì)中探索不同的“假設(shè)”場景,無需重新運(yùn)行映射和布局布線,這極大地加快了迭代設(shè)計(jì)過程。
開辟主流FPGA的新天地
CertusPro-NX FPGA將于2022年第二季度量產(chǎn)發(fā)貨,首發(fā)器件為CPNX-100K,截至目前,客戶樣片和搶先體驗(yàn)軟件已經(jīng)發(fā)布。結(jié)合萊迪思sensAI、mVision、Automate一系列解決方案,CertusPro-NX將在網(wǎng)絡(luò)邊緣AI、嵌入式視覺系統(tǒng)及自動(dòng)化工廠建設(shè)等方面取得廣泛應(yīng)用。
● 機(jī)器視覺和網(wǎng)絡(luò)邊緣AI
除了拓展CertusPro-NX的可編程邏輯架構(gòu)外,萊迪思還強(qiáng)化了該平臺(tái)的AI功能。憑借7.3 Mb的內(nèi)部存儲(chǔ)器,客戶可以加載輕量化的神經(jīng)網(wǎng)絡(luò)來識(shí)別物體、監(jiān)聽關(guān)鍵詞或檢測異常行為。然而硬件只是設(shè)計(jì)的一方面。萊迪思sensAI軟件集合能與Caffe、TensorFlow、TensorFlow Lite和Keras等框架配合使用,且擁有萊迪思AI編譯器的支持。這一經(jīng)過驗(yàn)證的解決方案集合為眾多萊迪思客戶提供了功耗和資源效率充分優(yōu)化的人工智能應(yīng)用。該軟件平臺(tái)與公司的多款FPGA兼容(CertusPro-NX的兼容性計(jì)劃于今年晚些時(shí)候推出)。
網(wǎng)絡(luò)邊緣的機(jī)器視覺應(yīng)用不僅要求使用硬件來實(shí)現(xiàn)神經(jīng)網(wǎng)絡(luò),還需要傳感器兼容、傳感器聚合和圖像預(yù)處理等功能。在這方面,萊迪思通過可編程I/O和SERDES模塊來為CertusPro-NX的客戶提供足夠的靈活性。例如,許多高清圖像傳感器都采用SLVS-EC接口,這是許多網(wǎng)絡(luò)邊緣AI加速器所缺少的;可編程SERDES還支持各種將數(shù)據(jù)從網(wǎng)絡(luò)邊緣傳輸?shù)较到y(tǒng)內(nèi)部的標(biāo)準(zhǔn),包括CoaXPress和10G Ethernet。
由于DRAM操作會(huì)增加功耗并降低吞吐量,所以如果所有權(quán)重都存儲(chǔ)在芯片上,神經(jīng)網(wǎng)絡(luò)就能以最佳狀態(tài)運(yùn)行,且能夠最大限度地減少DRAM訪問。因此,客戶希望擁有更大的片上存儲(chǔ)器。萊迪思全新FPGA可以存儲(chǔ)多達(dá)100萬個(gè)8位權(quán)重——幾乎是Cyclone V GT或Artix-7的兩倍。由于芯片內(nèi)部可以存儲(chǔ)更多的權(quán)重,CertusPro-NX可以在不訪問DRAM的情況下運(yùn)行更大的AI模型,從而降低功耗。
如果CertusPro-NX確實(shí)需要訪問DRAM時(shí)會(huì)使用可編程I/O模塊,它支持LPDDR4和速度達(dá)1066Mbps的DDR3存儲(chǔ)器。坦率地說,支持LPDDR4會(huì)增加芯片和系統(tǒng)的功耗,但由于CertusPro-NX有著更大的片上存儲(chǔ)器和優(yōu)化的存儲(chǔ)器控制器,它可以通過使用片上和外部存儲(chǔ)器,減少存儲(chǔ)器訪問時(shí)間來達(dá)到更低的功耗,從而解除了這種擔(dān)憂。
● 工業(yè)物聯(lián)網(wǎng)
最新一代工業(yè)物聯(lián)網(wǎng)的特點(diǎn)就是大規(guī)模自動(dòng)化,這得益于互連和數(shù)據(jù)分析方面的進(jìn)步。為實(shí)現(xiàn)自動(dòng)化分揀和包裝等任務(wù),智能工廠需要數(shù)千臺(tái)物聯(lián)網(wǎng)設(shè)備,它們每天共生成和處理的數(shù)據(jù)量達(dá)TB級(jí)。驅(qū)動(dòng)這些設(shè)備的芯片必須尺寸小、功耗低且可靠性高。為了讓客戶為工業(yè)4.0做好充分準(zhǔn)備,萊迪思在其最新一代FPGA中采用了以上原則。
與基于28nm Bulk CMOS工藝的FPGA競品相比,采用FD-SOI工藝制造的CertusPro-NX漏電流最多可降低75%,而漏電流是產(chǎn)生靜態(tài)功耗和待機(jī)功耗的主要原因。以設(shè)計(jì)需要65K邏輯單元、使用75%DSP和存儲(chǔ)器資源、運(yùn)行兩個(gè)5Gbps SERDES通道,在85℃結(jié)溫和125MHz頻率下運(yùn)行的方案而言,CertusPro-NX的總功耗(動(dòng)態(tài)+靜態(tài))比Artix-7少75%,比Cyclone V GT少65%。
與英特爾和賽靈思的同類FPGA相比,萊迪思FPGA的功耗降低65-75%(數(shù)據(jù)來源:萊迪思)
得益于此,CertusPro-NX擁有了更多的低功耗和散熱空間,從而幫助OEM廠商縮減系統(tǒng)尺寸,降低散熱管理成本。例如在工業(yè)馬達(dá)在運(yùn)行期間,熱量會(huì)在馬達(dá)中積聚并提高FPGA周圍的環(huán)境溫度。與競品相比,萊迪思的低功耗解決方案能讓FPGA控制更高扭矩的馬達(dá)而不會(huì)過熱。
與Artix-7相比,CertusPro-NX可降低99%的軟錯(cuò)誤數(shù)量,平均故障間隔時(shí)間(MTBF)是Artix-7的110倍,且無需使用軟錯(cuò)誤檢測邏輯和糾錯(cuò)代碼,這些均來自FD-SOI所擁有的消除單粒子翻轉(zhuǎn)(SEU)錯(cuò)誤的額外優(yōu)勢,汽車、醫(yī)療、工業(yè)機(jī)器人等行業(yè)將因此獲益良多。
● 5G應(yīng)用
在5G應(yīng)用中,考慮到5G基站空間狹小,數(shù)據(jù)流動(dòng)量大,功耗比4G基站高70%等因素,基站OEM廠商往往需要FPGA來協(xié)助增強(qiáng)處理器或ASIC芯片,因?yàn)榍罢呔邆涓叩男省?/p>
CertusPro-NX在擁有SERDES功能的同類芯片產(chǎn)品尺寸最小,功耗低于Artix-7和Cyclone V GT,能夠簡化基站的散熱管理,非常適合小尺寸設(shè)計(jì),且數(shù)據(jù)速率不會(huì)受到限制。如圖所示,CertusPro-NX擁有的75Gbps SERDES帶寬比Artix-7高36%,是Cyclone V GT的2倍以上,對(duì)于數(shù)據(jù)包管理等高帶寬功能,CertusPro-NX可提供更高的吞吐量、面積和效率。
CertusPro-NX的SERDES總帶寬超過競品2倍之多,在數(shù)據(jù)密集型操作方面有著顯著優(yōu)勢。(數(shù)據(jù)來源:萊迪思)
結(jié)語
CertusPro-NX是萊迪思為“主流FPGA”市場注入的新活力。多年來,這一重要領(lǐng)域投資較少,主要競爭對(duì)手在過去十年中甚至都沒有發(fā)布任何一款新的低成本架構(gòu)產(chǎn)品,因此CertusPro-NX有機(jī)會(huì)通過PCIe Gen3和LPDDR4等新技術(shù)來鞏固其最新產(chǎn)品系列的市場地位,更好地服務(wù)于5G基站、工業(yè)物聯(lián)網(wǎng)和機(jī)器視覺等新興市場。
評(píng)論