在芯片設計中嵌入eFPGA——從起點開始
雖然系統(tǒng)級芯片(SoC)的架構師們已了解嵌入式FPGA(eFPGA)內核能如何為他們的ASIC/SoC設計增加價值,甚至是在規(guī)劃出一個具體應用之前就了解,但可能還不清楚如何開始進行一次評估。Achronix將該階段稱為準備階段或者Phase Zero——這是一個客戶去規(guī)劃其應用概念的評估期,客戶可以通過使用Achronix的工具和模型來對這些概念進行測試。
本文引用地址:http://butianyuan.cn/article/201806/381722.htm以下是一種非常實用的方法,可以幫助設計人員去決定eFPGA是否是其下一代SoC的正確選擇。
為什么會考慮使用eFPGA
設計人員通常會遇到各種各樣的計算處理問題,常用的解決方案都是在SoC中嵌入CPU或GPU,然后依靠外部的分立FPGA來進行加速。通常情況下,推動SoC設計團隊去探索嵌入一個可編程陣列結構的主要動力是增加可用來解決問題的技術,使用傳統(tǒng)方法去解決這些問題既棘手又成本高。
利用已經在多種ASIC設計中得到驗證的eFPGA半導體知識產權( IP)產品,可支持SoC開發(fā)人員為其解決方案增加邏輯可編程能力,從而設計出能夠適應多種應用的同一款器件。在SoC中嵌入一個可編程硬件加速器不僅具有與之俱來的系統(tǒng)級優(yōu)勢,eFPGA還可為SoC設計人員提供其它優(yōu)勢。例如,eFPGA可提供與應用相匹配的存儲器、查找表(LUT)和數字信號處理器(DSP)單元模塊等個性化組合。eFPGA還可以改善帶寬、信號延遲、延遲時間和功耗,最重要的是成本方面的節(jié)省。除了這些優(yōu)勢以外,隨著采用eFPGA后對電源和冷卻需求的降低,電路板的設計也變得更簡單。最終,系統(tǒng)的物料清單(BoM)成本也降低了,這是因為不再需要獨立的FPGA芯片以及諸如電平位移器和穩(wěn)壓器等所有支持它的器件了。
一旦決定采用eFPGA途徑,潛在客戶心中的下一個問題都差不多是“先不要在意數據手冊,重要的是我該如何評估Speedcore eFPGA IP的能力是否可解決我的問題?”
Phase Zero準備階段,也是合作的第一步
通常情況下,Achronix的客戶是通過了解設計流程來找到對Speedcore eFPGA IP的“感覺”而開始了這個過程。該過程從使用Achronix的ACE設計工具開發(fā)樣例設計開始,其中已經準備好了客戶要求的許多核心功能。該步驟有助于客戶去熟悉Speedcore的設計流程和可用于支持他們自己設計工作的資源。這個流程有助于客戶進一步清晰Speedcore IP在其潛在ASIC設計中的設計理念,并且在獲得最終解決方案之前對功耗和性能設定期望值。
準備階段很快就發(fā)展成為高度協(xié)作參與階段,該階段可通過IP和設計流程培訓、咨詢問答環(huán)節(jié)、及應用討論來明了客戶對Speedcore eFPGA的評估。此項交互性工作理應共享文檔、工具、專業(yè)知識和詳細的技術資料,因而在Achronix和客戶之間需要簽署一份相互保密協(xié)議(NDA),以保護大家的知識產權。一旦NDA完成,Achronix將為評估人員提供登錄認證信息來允許他們去下載ACE工具并激活評估用的許可。
ACE包括一個經Achronix優(yōu)化的Synopsys Synplify Pro軟件,以及對Speedcore IP的全面支持。為了幫助評估,ACE工具在下載時附帶了兩個樣例性的Speedcore實例,可以用于所針對的樣例設計。這兩個樣例實例擁有不同的面積大小和資源數量(BRAM、LUT等等),以便于支持ASIC設計團隊去將他們的設計編譯到一個Speedcore eFPGA中,從而更好地、更深入地了解設計流程和性能。
設計人員需要大量的反饋——ACE設計工具會生成多個有關性能、功耗和資源利用率的報告,也包括各種用于版圖設計、布局和布線、位流數據生成、調試支持、靜態(tài)時序分析、以及自動功能和時序仿真的工具。Achronix的應用團隊將在整個過程中提供培訓和支持。
面向金屬堆層的邏輯綜合
使用ACE軟件工具,客戶能夠通過RTL邏輯綜合對Speedcore IP進行基準測試,目標是兩個通用Speedcore樣本實例中的一個。通常,該過程是在Achronix應用團隊的幫助下執(zhí)行的。在這個階段,評估人員通常會收集資源使用率,及最高頻率(fMAX)和早期的功耗集合文件。
一旦有了從初步評估中獲得的數據,客戶就能夠確定他們自己獨特的Speedcore實例所需的、合適的資源組合——即一個能夠滿足他們準確需求的實例。Achronix則以預計的芯片面積和IP的縱橫比、靜態(tài)功耗分布圖、配置時間和可編程單元模塊的精確配比作為回應。影響Speedcore實例的這些早期面積評估的變量包括設計元素本身、客戶在性能和功耗之間的權衡、及客戶的目標工藝節(jié)點和金屬層數。
查找表和邏輯存儲器已經演變
不同FPGA陣列結構之間的硬件差別一直存在。Speedcore eFPGA陣列結構基于4輸入查找表,而與其它FPGA供應商的6輸入查找表架構截然不同。使用4輸入查找表是一個深思熟慮的選擇,因為經驗數據表明4輸入查找表方案可為絕大多數當代的可編程邏輯應用提供最佳性能,并同時兼顧到芯片面積。
另一個顯著區(qū)別是Speedcore陣列結構的分布式存儲器。Speedcore邏輯RAM(LRAM)單元模塊為4096位(被配置為128x32),使其比其他競爭對手產品所采用的分布式存儲器協(xié)議更大,因而是諸如緩沖任務這樣的中型應用最理想的選擇。事實上,Speedcore LRAM已經被證實特別適用于各種各樣的聯(lián)網和多媒體功能,包括包管理和視頻處理。并且通過提供塊隨機存儲器(BRAM)和行業(yè)領先的LRAM,Speedcore存儲器單元模塊有助于設計人員去選擇合適的存儲器配置,來為其個性化的Speedcore實例優(yōu)化其中每平方毫米片芯上的性能。
原始設計轉換和RTL
對于eFPGA的客戶來說,從以前面向分立FPGA芯片的RTL開始不是很少見的,而且它們通常還針對某一特別的FPGA供應商的架構進行優(yōu)化。為了將這些代碼重新定向到Speedcore架構上,可以使用Achronix提供的IP庫來幫助客戶將原有的Intel/Altera和Xilinx的設計轉換為面向Achronix架構的設計。此外,任何最初打算用于標準單元實現的RTL都可以在目標Speedcore eFPGA上工作,但將受益于為Speedcore架構去優(yōu)化代碼的努力??蛻艨梢圆殚喴唤M已發(fā)布的代碼寫作最佳范例,這樣就能更高效地使用Speedcore邏輯、存儲器和DSP資源。
整個過程密切合作
Achronix的應用團隊經常深度參與到Speedcore客戶的項目中。這種參與是Achronix和ASIC團隊之間的協(xié)同評估努力的一個正常組成部分,并有助于解釋設計結果,從而推動功耗、編譯時間、配置時間和性能方面的進一步改善。
準備階段只是引入Speedcore的開始,它支持設計人員去充分探索使用一個或多個定制化Speedcore實例去部署SoC的益處。一旦準備階段完成(可控制在僅僅3周之內),剩下的就是推動設計步驟向前,也就是完成授權許可協(xié)議。這樣的一份協(xié)議(包括條款、條件和授權時間)實際上與半導體行業(yè)內去購買嵌入式CPU、基于標準的電路單元模塊和大多數其它嵌入式IP的許可是一致的。簡而言之,確定一款Speedcore eFPGA是否是您下一個SoC開發(fā)項目的合適選擇,就是一個直接明了的、由Achronix團隊密切支持的評估過程。
作者:Alok Sanghavi,Achronix Semiconductor資深產品營銷經理
評論