無問芯穹打通七家國產芯片DeepSeek-R1適配優(yōu)化,助力全國產化AI產業(yè)閉環(huán)構建
近日,無問芯穹宣布獲七家國產芯片鼎力支持,正打通DeepSeek-R1、V3在壁仞、海光、摩爾線程、沐曦、昇騰、燧原、天數智芯等七個硬件平臺的多芯片適配優(yōu)化,現(xiàn)開發(fā)者已可以通過Infini-AI異構云平臺一鍵獲取DeepSeek系列模型與多元異構國產算力服務。
本文引用地址:http://www.butianyuan.cn/article/202502/466862.htm自春節(jié)前夕爆火,DeepSeek已牽動了國內超30家云服務商與近20家芯片企業(yè)宣布接入,到目前為止,這場熱鬧還只是一場由DeepSeek引發(fā)的流量蛋糕切分大戰(zhàn)。而隨著無問芯穹宣布獲7家國產芯片鼎力支持,并帶著多芯片適配的DeepSeek-R1入場,DeepSeek為可控國產算力撬動的歷史機遇,正在變得更加清晰。
加速助建“國產模型-國產系統(tǒng)-國產芯片”全國產AI產業(yè)閉環(huán)
國產的大部分模型是通過國際主流芯片(如英偉達)訓練得到,尚未與國內的AI系統(tǒng)、芯片形成閉環(huán)生態(tài)。無問芯穹聯(lián)合創(chuàng)始人、CEO夏立雪表示, DeepSeek的突破激發(fā)了越來越多的下游應用創(chuàng)造力,未來行業(yè)日均tokens消耗量將達到百萬億級別,不僅將激發(fā)國產芯片的市場需求,也為打造全國產AI產業(yè)閉環(huán),實現(xiàn)更可控的自主算力發(fā)展創(chuàng)造了有力條件。
在美國,模型、系統(tǒng)、芯片已經形成閉環(huán)生態(tài)。以英偉達為例,其GPU的主流地位與CUDA生態(tài)有直接關系,CUDA的護城河是軟件堆棧,可以讓研究人員和軟件開發(fā)者更好地在GPU上編程和構建各種各樣的應用,牽引下一代芯片的迭代方向。但是隨著Transformer統(tǒng)一模型結構,大模型應用落地場景所需的算子數量大幅度收縮,CUDA護城河正在變薄。
“DeepSeek作為開源模型,其之于AI 2.0時代,正如Android之于移動互聯(lián)網革命,將重構整個產業(yè)生態(tài),引發(fā)鏈式反應,加快上層應用發(fā)展和下層系統(tǒng)‘統(tǒng)一’增速,由此廣泛調動起跨越軟硬件和上下游的生態(tài),一起加大投入‘模型-芯片-系統(tǒng)’協(xié)同優(yōu)化和垂直打通,從而繼續(xù)‘打薄CUDA生態(tài)’。某種程度上來說,CUDA已經是歷史了”。夏立雪舉例,這類協(xié)同優(yōu)化工作包括根據新一代模型架構來定義未來芯片的底層電路實現(xiàn),以及根據國產AI系統(tǒng)的互聯(lián)通信方式來設計高效的混合專家模型結構等。
對此,無問芯穹提出了“三步走”模式來促進全國產AI產業(yè)閉環(huán)的打通——基于主流芯片開展極致軟硬件協(xié)同優(yōu)化,以有限算力實現(xiàn)國產模型能力追趕;推動國產芯片開放底層生態(tài),搭建“異構”AI系統(tǒng)解決算力缺口,實現(xiàn)模型能力趕超;構建國產“同構”系統(tǒng),支持Scaling Law持續(xù)發(fā)展,打造“國產模型-國產芯片-國產系統(tǒng)”的全國產AI產業(yè)閉環(huán),實現(xiàn)更可控的自主算力發(fā)展。
與此同時,針對國內 源分布不均衡,技術和應用場景不匹配,導致的大量異構算力未能全量利用問題,無問芯穹也將通過整合異構、異地、異屬算力資源,轉化為標準算力服務并規(guī)?;瘡椭?,并緊密跟蹤下游應用需求,提升算力配置效率。這不僅能解決部分地區(qū)存在的算力閑置問題,滿足日益增長的應用需求,還能在使用閉環(huán)中,促成硬件與算法正向循環(huán)。
夏立雪表示,通過打通DeepSeek-R1、V3在國產硬件平臺的多芯片適配優(yōu)化,無問芯穹希望進一步團結從模型到芯片的上下游產業(yè)伙伴,在打造“國產模型+國產算力+國產系統(tǒng)+國產應用”全國產化AI產業(yè)鏈的進程中起到牽引帶動作用,集中優(yōu)勢資源,支持模型性能長足進步,推動中國AI自主可控長遠發(fā)展,為人工智能行業(yè)發(fā)展筑牢算力基礎。
有力驗證軟硬協(xié)同優(yōu)化是實現(xiàn)模型能力突破的必然路徑
在DeepSeek模型迄今發(fā)布的3個大版本中,盡管參數規(guī)模實現(xiàn)十倍增長,但所使用的訓練服務算力卻并沒有和模型尺寸等比例的成倍增加,其核心是利用軟硬件協(xié)同設計的思想,不斷提升系統(tǒng)開銷(即模型的訓練成本)到模型尺寸、能力的轉化率。DeepSeek有力驗證了在算力受限的條件下,軟硬協(xié)同優(yōu)化路線的有效性,特別在國內算力受限場景下實現(xiàn)模型能力的突破,具有重要意義。
無問芯穹是軟硬協(xié)同的堅定踐行者,其核心技術團隊源自清華大學納米集成電路與系統(tǒng)實驗室能效計算組(NICS-EFC),該組最早在 2018 年總結出“深度學習算法-編譯-芯片聯(lián)合設計”路線,致力于人工智能場景下能效電路和系統(tǒng)設計方法的研究,是軟硬協(xié)同路線上的最早開拓者之一。
自成立以來,無問芯穹依托“多元異構、軟硬協(xié)同”的核心技術優(yōu)勢,打造了連接“M種模型”和“N種芯片”的“M×N”AI基礎設施新范式,致力于在國內算力生態(tài)的市場格局相對分散,高端算力受限的情況下,實現(xiàn)不同模型和不同硬件之間的統(tǒng)一部署和聯(lián)合優(yōu)化,像“淘寶”一樣把各種不同的模型和算力資源統(tǒng)一起來,變成一套標準化服務,提供給最終客戶,被譽為中國的“CoreWeave”。
就在近日,國際最權威的科技商業(yè)媒體之一《麻省理工科技評論》刊發(fā)了一篇題為《關注DeepSeek之外的四家中國人工智能初創(chuàng)公司》的報道,指出階躍星辰、面壁智能、智譜AI、無問芯穹四家企業(yè)同樣展現(xiàn)出不遜于DeepSeek的技術實力與全球競爭力。
有業(yè)內人士指出,結合這四家被點名企業(yè)的特征分析來看,DeepSeek可能正在讓國際意識到,除了DeepSeek之外,中國還存在若干路徑獨特的團隊,在用“力大磚飛”堆疊GPU算力儲備、比拼模型精度的巨頭競賽之外,找到未被五角大樓戰(zhàn)略家們關注到的“blind spot( 盲點) ”,跨越軟硬件,攢動上下游,走出可能出奇制勝的技術路徑。
評論