博客專欄

EEPW首頁 > 博客 > 奕斯偉發(fā)布最強RISC-V AI SoC:八核CPU+雙核NPU,算力達40TOPS!

奕斯偉發(fā)布最強RISC-V AI SoC:八核CPU+雙核NPU,算力達40TOPS!

發(fā)布人:芯智訊 時間:2024-10-09 來源:工程師 發(fā)布文章

8月19日,“第四屆滴水湖中國RISC-V產業(yè)論壇”正式在上海臨港滴水湖洲際酒店召開。北京奕斯偉計算技術股份有限公司智能計算事業(yè)部交付中心中心長路向峰先生推介了全球首款搭載64位RISC-V亂序執(zhí)行CPU及自研高性能NPU的雙DIE互聯(lián)AI SoC EIC7702X,算力高達40TOPS!

image.png

近年來,在中美科技戰(zhàn)、國產芯片自主可控的大背景之下,開源RISC-V架構的在中國獲得了蓬勃發(fā)展,一大批的國產芯片設計廠商都有在做基于RISC-V架構的自研芯片。而隨著自去年以來AI大模型的快速發(fā)展,也開始有不少廠商發(fā)力基于RISC-V架構AI SoC。

北京奕斯偉科技集團有限公司是一家集成電路領域產品和服務提供商,核心業(yè)務包括芯片與方案、硅材料、生態(tài)鏈開發(fā)等板塊。其中,從事芯片與方案業(yè)務的奕斯偉計算公司是一家以RISC-V為基礎的新一代計算架構芯片與方案提供商,目前也推出了一系列基于RISC-V架構的AI SoC。

image.png

據介紹,目前奕斯偉智能計算事業(yè)部已經推出了多款基于RISC-V架構高性能AI SoC,其中EIC7700X是全球首款搭載64位RISC-V亂序執(zhí)行CPU及自研高性能NPU的AI SoC,基于四核的SiFive P550 RISC-V CPU內核,支持64位亂序執(zhí)行能力,它的DMIPS跑分可以達到8.57分,這個是要超過競品A76的指標,并且其還集成了NPU內核,AI算力約20TOPS,能夠支持在端側加速生成式AI大模型。

而EIC7702X則是在EIC7700X基礎上進行了雙DIE互聯(lián)封裝,即擁有了8核SiFive P550 RISC-V CPU內核,和雙核NPU內核,實現(xiàn)了EIC7700X兩倍的性能,進一步提升了CPU及AI性能,AI算力高達40TOPS,是全球基于RISC-V架構性能最高的AI SoC,可以滿足各類AI智能設備、AI PC、AI加速卡等產品的需求。

image.png

根據路向峰公布的測試數據來看,EIC7700X和EIC7702X都可以支持運行Llama 2 70億參數大模型,EIC7700X可以實現(xiàn)每秒8個Token的生成,EIC7702X可以實現(xiàn)每秒16個Token的生成。

image.png

“我們這個芯片在自研的時候也是創(chuàng)新性的引入了很多指令優(yōu)化,涉及到數據流的優(yōu)化,所以不光是它的整個性能好,它的利用率也是得到了極大的優(yōu)化。它內部支持的數據精度包含F(xiàn)P16,這對于精度要求比較高的場合是非常合適的。這個芯片內部支持了LPDDR4/4X/6等不同的接口,EIC7700X達到32GB,EIC7702X達到了64GB,分別是64-Bit和128-bit。這個也是特別適用于大模型,它們對于整個參數數量大、帶寬吞吐量要求較高的特點。除了NPU的這些優(yōu)勢之外,這個芯片內部集成了豐富的視頻編解碼,3D的GPU及豐富的外設。芯片整體的功耗也是非常低的,在桌面應用下只有2.6瓦的功耗?!甭废蚍暹M一步解釋道。

image.png

△在25路1080P的解碼加上回放的場景,EIC7700X的功耗是2.83W,覆蓋了桌面、辦公及媒體播放。右邊的三列實際上在上面的業(yè)務基礎之上,還添加了NPU推理的性能,這個可以當作一個AI PC典型應用的場景,它的功耗也控制在6-7W,這樣就使得它適用于電池供電或者是一些無風扇設計的一些被動散熱的場合。

路向峰表示:“我們這個產品因為內部的CPU算力非常高,所以也是適用于邊緣側的一些AI應用,像筆記本電腦或者是平板這樣的一類產品。這個核心原因:一方面是,EIC7702X內部的高性能CPU;第二方面是,EIC7702X內部有2個GPU,可以為游戲等一些對GPU要求較高的場景(3D渲染)提供支持。EIC7702X有2路輸出,因此可以適用于筆記本一路接內置屏、第二路解外置屏。還有CV類算法與大語言模型,這些也是為對應的場景提供了較有力的軟件層面的適配和支持。EIC7700X/EIC7702X出色AI性能和能效表現(xiàn),則主要得益于兩方面的工作:一是,硬件上NPU內部的設計優(yōu)化。二是,采用的編譯器框架能夠根據網絡模型特點自動適配NPU,使得內部的數據流盡量達到最優(yōu)化。采用了這些優(yōu)化之后,現(xiàn)在芯片支持的整個編譯器的框架包含了TensorFlow、PyTorch等多種框架?!?/p>

在論壇的展示區(qū)域,奕斯偉也展示了基于EIC7702X方案的AI PC產品,支持Linux系統(tǒng)。此外,EIC7702X還可用作AI加速卡,EIC7702X通過內部的Switch互聯(lián),做到一個板子上往外通過PCIE接口提供出來,用戶在主機就可以調用實現(xiàn)軟件功能

image.png

據路向峰透露,EIC7702X即將在今年8月初已經正式量產,目前已經獲得了一些客戶的采用,預計很快將會上市。

編輯:芯智訊-浪客劍


*博客內容為網友個人發(fā)布,僅代表博主個人觀點,如有侵權請聯(lián)系工作人員刪除。



關鍵詞: 芯片

相關推薦

技術專區(qū)

關閉