為低功耗、高性能通用FPGA樹立行業(yè)“新標桿”

作者：時間：2021-09-03 來源：電子產(chǎn)品世界

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢

為了強化Nexus系列產(chǎn)品的領(lǐng)先地位，萊迪思在過去的18個月內(nèi)推出了四款基于Nexus技術(shù)平臺的產(chǎn)品，包括主攻嵌入式視頻應(yīng)用的CrossLink-NX、經(jīng)過重新定義的通用FPGA Certus-NX、第二代安全FPGA Mach-NX、高級通用FPGA CertusPro-NX，以及預(yù)計將于2022年推出的同樣基于FD-SOI平臺的兩款新品。

本文引用地址：http://www.butianyuan.cn/article/202109/428001.htm

Nexus平臺代表了低功耗FPGA技術(shù)在近十年內(nèi)最重要的更新。作為Nexus家族的最新成員，CertusPro-NX主要是為了滿足智能系統(tǒng)中的數(shù)據(jù)協(xié)同處理、5G通信基礎(chǔ)設(shè)施中的高帶寬信號橋接、以及ADAS系統(tǒng)中的傳感器接口橋接等創(chuàng)新應(yīng)用需要而推出的，并在功耗設(shè)計、系統(tǒng)帶寬、邊緣處理、可靠性、封裝多樣性等多個方面得到了進一步提升。

之所以選擇這樣的設(shè)計思路，是因為從當(dāng)前的行業(yè)發(fā)展趨勢來看，網(wǎng)絡(luò)邊緣設(shè)備的智能化程度正在大幅提高，它們一方面需要更高的接口帶寬以便于快速傳輸數(shù)據(jù)，另一方面又需要更多小尺寸的系統(tǒng)集成和便于優(yōu)化散熱管理的低功耗方案。

“新標桿”的成色

與競品相比，CertusPro-NX最大的特點在于它專為網(wǎng)絡(luò)邊緣處理進行了優(yōu)化，不僅擁有行業(yè)領(lǐng)先的能耗效率和可靠性，還在超小的封裝尺寸中提供了行業(yè)最佳的系統(tǒng)帶寬，且是同類產(chǎn)品中唯一支持LPDDR4外部存儲器的FPGA產(chǎn)品。

通過利用萊迪思在FPGA架構(gòu)方面的創(chuàng)新和28nm低功耗FD-SOI制造工藝，CertusPro-NX器件的功耗比同類競品FPGA低四倍。通過改變基底的偏壓，開發(fā)人員可以自由選擇采用高性能(HP)還是低功耗(LP)模式運行。

但功耗并非是Nexus平臺的唯一優(yōu)勢。像CertusPro-NX這樣的Nexus系列器件通常在其他方面也優(yōu)于相似的競品，包括數(shù)據(jù)處理性能、系統(tǒng)帶寬、存儲密度和對器件小尺寸的支持。

CertusPro-NX FPGA支持多達8個可編程SERDES通道，速度高達10.3Gbps，提供同類產(chǎn)品中最高的系統(tǒng)帶寬(是同類競品FPGA的兩倍之多)，并支持主流的通信和顯示接口，如10 Gigabit Ethernet、PCI Express、SLVS-EC、CoaXPress和DisplayPort。

同時，為滿足網(wǎng)絡(luò)邊緣AI和機器學(xué)習(xí)應(yīng)用對穩(wěn)定的數(shù)據(jù)協(xié)處理的需求，CertusPro-NX FPGA支持多達100K邏輯單元，是目前所有基于Nexus的FPGA中邏輯密度最高的器件，其片上存儲器容量也比同類其他FPGA高出約65%，是目前唯一支持LPDDR4 DRAM存儲標準的低功耗FPGA。此外，CertusPro-NX在可編程架構(gòu)基礎(chǔ)上還增加了超高效的DSP模塊，以及小型和大型內(nèi)部存儲器模塊，用于支持人工智能和機器學(xué)習(xí)應(yīng)用中的低延遲數(shù)據(jù)處理。

CertusPro-NX FPGA的設(shè)計面積僅為81mm²，比競品器件小6.5倍，例如擁有相同邏輯單元的Xilinx Artix-7 100K LC的尺寸面積為529mm²，是CertusPro-NX的6.5倍；而尺寸面積為121mm²的Intel Cyclone V GT 77K LC，邏輯單元僅有77K。這樣的小尺寸設(shè)計對于工業(yè)攝像頭或通信系統(tǒng)中使用SFP模塊的開發(fā)人員來說，是一個關(guān)鍵的設(shè)計考慮因素。

此外，考慮到汽車、工業(yè)和通信領(lǐng)域的關(guān)鍵型應(yīng)用必須有高的可靠性，實現(xiàn)可預(yù)測的性能并確保用戶安全，萊迪思將CertusPro-NX器件抗軟錯誤能力提高了100倍，并可在-40℃至125℃的結(jié)溫范圍內(nèi)正常工作。這意味著，CertusPro-NX FPGA能夠以合理的商業(yè)成本為下一代通信、嵌入式、工業(yè)和汽車應(yīng)用帶來極高的可靠性，幫助系統(tǒng)時刻保持在線，保障最終用戶的安全。

全新的FPGA產(chǎn)品包括CPNX-50K和CPNX-100K兩個型號，分別擁有52K和96K的邏輯單元數(shù)量，傳統(tǒng)的EBR(嵌入式memory)和大型RAM分別達到3.7Mb和3.6Mb，18×18 DSP與PLL數(shù)量最高可達156個和4個，并支持10GE PCS、PCIe Gen 3、SGMII CDR、ADC等硬核模塊。

與此同時，易于使用的Lattice Radiant設(shè)計軟件的最新版本現(xiàn)已推出。除了支持CertusPro-NX FPGA之外，Radiant 3.0在整個設(shè)計流程中優(yōu)化了信號可追溯性，讓開發(fā)人員能夠更輕松地在HDL源代碼和RTL視圖以及技術(shù)視圖之間追蹤驗證信號。新版本可以讓用戶在萊迪思綜合引擎(LSE)和Synplify Pro綜合引擎之間進行選擇，提高了設(shè)計靈活性。在Radiant 3.0中，時序分析與其他操作分開，因此可以獨立運行時序分析。設(shè)計人員可以在設(shè)計中探索不同的“假設(shè)”場景，無需重新運行映射和布局布線，這極大地加快了迭代設(shè)計過程。

開辟主流FPGA的新天地

CertusPro-NX FPGA將于2022年第二季度量產(chǎn)發(fā)貨，首發(fā)器件為CPNX-100K，截至目前，客戶樣片和搶先體驗軟件已經(jīng)發(fā)布。結(jié)合萊迪思sensAI、mVision、Automate一系列解決方案，CertusPro-NX將在網(wǎng)絡(luò)邊緣AI、嵌入式視覺系統(tǒng)及自動化工廠建設(shè)等方面取得廣泛應(yīng)用。

● 機器視覺和網(wǎng)絡(luò)邊緣AI

除了拓展CertusPro-NX的可編程邏輯架構(gòu)外，萊迪思還強化了該平臺的AI功能。憑借7.3 Mb的內(nèi)部存儲器，客戶可以加載輕量化的神經(jīng)網(wǎng)絡(luò)來識別物體、監(jiān)聽關(guān)鍵詞或檢測異常行為。然而硬件只是設(shè)計的一方面。萊迪思sensAI軟件集合能與Caffe、TensorFlow、TensorFlow Lite和Keras等框架配合使用，且擁有萊迪思AI編譯器的支持。這一經(jīng)過驗證的解決方案集合為眾多萊迪思客戶提供了功耗和資源效率充分優(yōu)化的人工智能應(yīng)用。該軟件平臺與公司的多款FPGA兼容(CertusPro-NX的兼容性計劃于今年晚些時候推出)。

網(wǎng)絡(luò)邊緣的機器視覺應(yīng)用不僅要求使用硬件來實現(xiàn)神經(jīng)網(wǎng)絡(luò)，還需要傳感器兼容、傳感器聚合和圖像預(yù)處理等功能。在這方面，萊迪思通過可編程I/O和SERDES模塊來為CertusPro-NX的客戶提供足夠的靈活性。例如，許多高清圖像傳感器都采用SLVS-EC接口，這是許多網(wǎng)絡(luò)邊緣AI加速器所缺少的；可編程SERDES還支持各種將數(shù)據(jù)從網(wǎng)絡(luò)邊緣傳輸?shù)较到y(tǒng)內(nèi)部的標準，包括CoaXPress和10G Ethernet。

由于DRAM操作會增加功耗并降低吞吐量，所以如果所有權(quán)重都存儲在芯片上，神經(jīng)網(wǎng)絡(luò)就能以最佳狀態(tài)運行，且能夠最大限度地減少DRAM訪問。因此，客戶希望擁有更大的片上存儲器。萊迪思全新FPGA可以存儲多達100萬個8位權(quán)重——幾乎是Cyclone V GT或Artix-7的兩倍。由于芯片內(nèi)部可以存儲更多的權(quán)重，CertusPro-NX可以在不訪問DRAM的情況下運行更大的AI模型，從而降低功耗。

如果CertusPro-NX確實需要訪問DRAM時會使用可編程I/O模塊，它支持LPDDR4和速度達1066Mbps的DDR3存儲器。坦率地說，支持LPDDR4會增加芯片和系統(tǒng)的功耗，但由于CertusPro-NX有著更大的片上存儲器和優(yōu)化的存儲器控制器，它可以通過使用片上和外部存儲器，減少存儲器訪問時間來達到更低的功耗，從而解除了這種擔(dān)憂。

● 工業(yè)物聯(lián)網(wǎng)

最新一代工業(yè)物聯(lián)網(wǎng)的特點就是大規(guī)模自動化，這得益于互連和數(shù)據(jù)分析方面的進步。為實現(xiàn)自動化分揀和包裝等任務(wù)，智能工廠需要數(shù)千臺物聯(lián)網(wǎng)設(shè)備，它們每天共生成和處理的數(shù)據(jù)量達TB級。驅(qū)動這些設(shè)備的芯片必須尺寸小、功耗低且可靠性高。為了讓客戶為工業(yè)4.0做好充分準備，萊迪思在其最新一代FPGA中采用了以上原則。

與基于28nm Bulk CMOS工藝的FPGA競品相比，采用FD-SOI工藝制造的CertusPro-NX漏電流最多可降低75%，而漏電流是產(chǎn)生靜態(tài)功耗和待機功耗的主要原因。以設(shè)計需要65K邏輯單元、使用75%DSP和存儲器資源、運行兩個5Gbps SERDES通道，在85℃結(jié)溫和125MHz頻率下運行的方案而言，CertusPro-NX的總功耗(動態(tài)+靜態(tài))比Artix-7少75%，比Cyclone V GT少65%。

與英特爾和賽靈思的同類FPGA相比，萊迪思FPGA的功耗降低65-75％（數(shù)據(jù)來源：萊迪思）

得益于此，CertusPro-NX擁有了更多的低功耗和散熱空間，從而幫助OEM廠商縮減系統(tǒng)尺寸，降低散熱管理成本。例如在工業(yè)馬達在運行期間，熱量會在馬達中積聚并提高FPGA周圍的環(huán)境溫度。與競品相比，萊迪思的低功耗解決方案能讓FPGA控制更高扭矩的馬達而不會過熱。

與Artix-7相比，CertusPro-NX可降低99%的軟錯誤數(shù)量，平均故障間隔時間(MTBF)是Artix-7的110倍，且無需使用軟錯誤檢測邏輯和糾錯代碼，這些均來自FD-SOI所擁有的消除單粒子翻轉(zhuǎn)(SEU)錯誤的額外優(yōu)勢，汽車、醫(yī)療、工業(yè)機器人等行業(yè)將因此獲益良多。

● 5G應(yīng)用

在5G應(yīng)用中，考慮到5G基站空間狹小，數(shù)據(jù)流動量大，功耗比4G基站高70%等因素，基站OEM廠商往往需要FPGA來協(xié)助增強處理器或ASIC芯片，因為前者具備更高的效率。

CertusPro-NX在擁有SERDES功能的同類芯片產(chǎn)品尺寸最小，功耗低于Artix-7和Cyclone V GT，能夠簡化基站的散熱管理，非常適合小尺寸設(shè)計，且數(shù)據(jù)速率不會受到限制。如圖所示，CertusPro-NX擁有的75Gbps SERDES帶寬比Artix-7高36%，是Cyclone V GT的2倍以上，對于數(shù)據(jù)包管理等高帶寬功能，CertusPro-NX可提供更高的吞吐量、面積和效率。

CertusPro-NX的SERDES總帶寬超過競品2倍之多，在數(shù)據(jù)密集型操作方面有著顯著優(yōu)勢。（數(shù)據(jù)來源：萊迪思）

結(jié)語

CertusPro-NX是萊迪思為“主流FPGA”市場注入的新活力。多年來，這一重要領(lǐng)域投資較少，主要競爭對手在過去十年中甚至都沒有發(fā)布任何一款新的低成本架構(gòu)產(chǎn)品，因此CertusPro-NX有機會通過PCIe Gen3和LPDDR4等新技術(shù)來鞏固其最新產(chǎn)品系列的市場地位，更好地服務(wù)于5G基站、工業(yè)物聯(lián)網(wǎng)和機器視覺等新興市場。

新聞中心

為低功耗、高性能通用FPGA樹立行業(yè)“新標桿”

評論

相關(guān)推薦

技術(shù)專區(qū)