新聞中心

EEPW首頁(yè) > 設(shè)計(jì)應(yīng)用 > 自適應(yīng)計(jì)算:走進(jìn)不斷擴(kuò)張的Versal世界

自適應(yīng)計(jì)算:走進(jìn)不斷擴(kuò)張的Versal世界

作者:賽靈思芯片市場(chǎng)營(yíng)銷總監(jiān) Manuel Uhm 時(shí)間:2021-11-18 來(lái)源:電子產(chǎn)品世界 收藏

2021 年 4 月,業(yè)界領(lǐng)先的 Versal? AI Core 和 Versal Prime 系列器件開始全面量產(chǎn)發(fā)貨,這也意味著賽靈思繼FPGA 之后而打造的ACAP 自適應(yīng)計(jì)算加速平臺(tái)謝列,取得了令人激動(dòng)的階段性成果,

本文引用地址:http://butianyuan.cn/article/202111/429727.htm

但是就如同我們的宇宙萬(wàn)物一樣,Versal? 世界發(fā)展的腳步也從未停歇。從客戶設(shè)計(jì),生態(tài)系統(tǒng)合作伙伴 (包括第三方參考設(shè)計(jì)、IP、軟件和操作系統(tǒng)支持)到產(chǎn)品系列 ( 如近期推出的 Versal AI Edge 和 HBM 系列 )及每個(gè)系列的多種器件,以及硬化 IP 特性,基準(zhǔn)測(cè)試,軟 IP 庫(kù)和軟件庫(kù)等,齊頭并進(jìn),不斷推進(jìn)。

本文我將著重為大家介紹人工智能開發(fā)者最關(guān)注的 Versal AI Core 系列的最新發(fā)展。 

Versal AI Core 系列的新特性

Versal AI Core 系列的最新擴(kuò)展,是新增兩大 VC2xxx ACAP 系列,即 VC2802 和 VC2602。如果您認(rèn)為 VC2xxxx 器件肯定意味著 AI Core 系列中增添了某些重要的新的硬化 IP 特性,恭喜您答對(duì)了!如下表所示,VC2xxx 系列帶來(lái)了三大激動(dòng)人心的新特性:

1.AIE-ML 是 AI 引擎的最新版本,其中包括緊密耦合的存儲(chǔ)器塊,可提供優(yōu)異的存儲(chǔ)器訪問(wèn)并降低時(shí)延

2.具有多個(gè)視頻解碼器引擎 (VDE) 的集成視頻解碼器單元 (VDU)

3.PCIe? Gen5 支持

1637203761750038.png

關(guān)于AIE-ML 及其與 VC1xxx 器件內(nèi)的 AI 引擎的差異,詳見(jiàn) Xilinx.com 上的 AI 引擎技術(shù)頁(yè)面中的詳細(xì)介紹。

簡(jiǎn)單地說(shuō),AIE-ML 使用的是與 AI 引擎相同的基礎(chǔ)架構(gòu)和工具流,但通過(guò)添加對(duì) INT4、BFLOAT16 的原生支持,將每個(gè) AI 引擎的本地?cái)?shù)據(jù)存儲(chǔ)器容量倍增至 64KB,并新增與 AIE-ML 陣列直接耦合的 512KB 存儲(chǔ)器塊(即無(wú)需將自適應(yīng)引擎中的鄰近可編程邏輯 (PL) 用于存儲(chǔ)器緩存),AIE-ML 還能針對(duì)機(jī)器學(xué)習(xí)進(jìn)行進(jìn)一步優(yōu)化。這樣一來(lái),與 AI 引擎相比,AIE-ML 的 AI 計(jì)算密度提高 4 倍,時(shí)延降低一半,與 GPU 相比單位功耗性能增加 4 倍。每個(gè) AIE-ML 大約等同于 100 個(gè) DSP58、2000 個(gè) LUT,以及 16 個(gè) PL 的Block RAM,使用基于 PL 的實(shí)現(xiàn)方案可以將功耗節(jié)省 33%。

VDU 能夠支持單路 4Kp60 流的 H.264 和 H.265 編解碼,或者最多 32 路 720p15 流及兩者之間的所有編解碼。如果要想在 PL 中實(shí)現(xiàn)上述標(biāo)準(zhǔn),那么每單元就需要 12 萬(wàn)個(gè) LUT、50 個(gè) DSP58 和 3 個(gè)Block RAM。使用硬化 VDU 后,可將每個(gè) VDU 的功耗降低 3.6W。這使其理想適用于眾多智能視頻應(yīng)用。在這些應(yīng)用中,多部視頻攝像頭向中央樞紐饋送數(shù)據(jù),中央樞紐負(fù)責(zé)解碼并執(zhí)行先進(jìn) ML 算法

此外,PCIe Gen5 還新增了對(duì)最先進(jìn)的 PCI Express 標(biāo)準(zhǔn)的支持。該標(biāo)準(zhǔn)即將在數(shù)據(jù)中心內(nèi)部署,以在云端實(shí)現(xiàn)更大帶寬和更高智能。增加硬化 PCIe Gen5 支持能帶來(lái)可觀的效益,不僅能節(jié)省 30 萬(wàn) LUT,還能將每核心功耗降低節(jié)省 3W 。

智能應(yīng)用

當(dāng)然,VC2802 和 VC2602 ACAP 中的所有這些新特性,自然必有其用處。它們將支持大量全新的“智能”應(yīng)用,在邊緣和世界各地的數(shù)據(jù)中心中廣泛部署。其中一個(gè)示例就是智慧城市應(yīng)用。這類應(yīng)用使用多個(gè)視頻攝像頭監(jiān)測(cè)車流或人流,并使用實(shí)時(shí) ML 算法評(píng)估實(shí)時(shí)流量或周邊安全。

1637203795545766.png

另一種智能應(yīng)用是零售領(lǐng)域的“智能零售防損”應(yīng)用。視頻攝像頭可以用在商場(chǎng)和店鋪里,在銷售點(diǎn)實(shí)時(shí)監(jiān)控商品失竊或商品貼標(biāo)錯(cuò)誤。損耗 (Shrinkage )是零售業(yè)的一大難題,智能零售應(yīng)用能夠顯著降低損耗率。

1637203818278273.png

這些只是 Versal 生態(tài)系統(tǒng)通過(guò)擴(kuò)張,支持新市場(chǎng)和新用例的一小部分示例。 

入門指南

如果您已準(zhǔn)備好立即加入 Versal設(shè)計(jì)的世界,我想推薦兩種評(píng)估與原型設(shè)計(jì)平臺(tái)作為您的起點(diǎn)。一個(gè)是 VCK190 套件,也是首款 Versal AI Core 系列評(píng)估套件。另一個(gè)是SmartLynq+ 模塊,為實(shí)現(xiàn)高速調(diào)試與追溯而構(gòu)建,提供包含 AI 引擎在內(nèi)的對(duì) Versal 架構(gòu)的完整可見(jiàn)性。 

此外,我們還提供了豐富的文檔、示例、參考設(shè)計(jì)、資源和方法,為您在評(píng)估平臺(tái)上的開發(fā)工作提速。如果您剛剛開始接觸 Versal ACAP,也無(wú)需擔(dān)心!您可以先使用我們的設(shè)計(jì)流程助手 (  Design Flow Assistant)啟動(dòng)開發(fā)規(guī)劃,然后使用我們的設(shè)計(jì)流程中心( Design Process Hubs),輕松地按設(shè)計(jì)流程找到全部文檔。此外,我們還在賽靈思 GitHub 上提供了大量的 Versal 和 Vitis 開源示例和有針對(duì)性的參考設(shè)計(jì)。 

后續(xù)更精彩

VC2802 和 VC2602 的加入,為 AI Core 系列帶來(lái)了激動(dòng)人心的新功能,然而, 這并不是全部,未來(lái)還會(huì)有更多令人興奮的消息。歡迎申請(qǐng)加入 Versal ACAP 快報(bào)更新列表,率先獲得最新產(chǎn)品訊息。



關(guān)鍵詞:

評(píng)論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉