無問芯穹打通七家國產芯片DeepSeek-R1適配優(yōu)化，助力全國產化AI產業(yè)閉環(huán)構建

作者：時間：2025-02-12 來源：動點科技

加入技術交流群
- 掃碼加入
  和技術大咖面對面交流
  海量資料庫查詢

近日，無問芯穹宣布獲七家國產芯片鼎力支持，正打通DeepSeek-R1、V3在壁仞、海光、摩爾線程、沐曦、昇騰、燧原、天數智芯等七個硬件平臺的多芯片適配優(yōu)化，現(xiàn)開發(fā)者已可以通過Infini-AI異構云平臺一鍵獲取DeepSeek系列模型與多元異構國產算力服務。

本文引用地址：http://www.butianyuan.cn/article/202502/466862.htm

自春節(jié)前夕爆火，DeepSeek已牽動了國內超30家云服務商與近20家芯片企業(yè)宣布接入，到目前為止，這場熱鬧還只是一場由DeepSeek引發(fā)的流量蛋糕切分大戰(zhàn)。而隨著無問芯穹宣布獲7家國產芯片鼎力支持，并帶著多芯片適配的DeepSeek-R1入場，DeepSeek為可控國產算力撬動的歷史機遇，正在變得更加清晰。

加速助建“國產模型-國產系統(tǒng)-國產芯片”全國產AI產業(yè)閉環(huán)

國產的大部分模型是通過國際主流芯片（如英偉達）訓練得到，尚未與國內的AI系統(tǒng)、芯片形成閉環(huán)生態(tài)。無問芯穹聯(lián)合創(chuàng)始人、CEO夏立雪表示， DeepSeek的突破激發(fā)了越來越多的下游應用創(chuàng)造力，未來行業(yè)日均tokens消耗量將達到百萬億級別，不僅將激發(fā)國產芯片的市場需求，也為打造全國產AI產業(yè)閉環(huán)，實現(xiàn)更可控的自主算力發(fā)展創(chuàng)造了有力條件。

在美國，模型、系統(tǒng)、芯片已經形成閉環(huán)生態(tài)。以英偉達為例，其GPU的主流地位與CUDA生態(tài)有直接關系，CUDA的護城河是軟件堆棧，可以讓研究人員和軟件開發(fā)者更好地在GPU上編程和構建各種各樣的應用，牽引下一代芯片的迭代方向。但是隨著Transformer統(tǒng)一模型結構，大模型應用落地場景所需的算子數量大幅度收縮，CUDA護城河正在變薄。

“DeepSeek作為開源模型，其之于AI 2.0時代，正如Android之于移動互聯(lián)網革命，將重構整個產業(yè)生態(tài)，引發(fā)鏈式反應，加快上層應用發(fā)展和下層系統(tǒng)‘統(tǒng)一’增速，由此廣泛調動起跨越軟硬件和上下游的生態(tài)，一起加大投入‘模型-芯片-系統(tǒng)’協(xié)同優(yōu)化和垂直打通，從而繼續(xù)‘打薄CUDA生態(tài)’。某種程度上來說，CUDA已經是歷史了”。夏立雪舉例，這類協(xié)同優(yōu)化工作包括根據新一代模型架構來定義未來芯片的底層電路實現(xiàn)，以及根據國產AI系統(tǒng)的互聯(lián)通信方式來設計高效的混合專家模型結構等。

對此，無問芯穹提出了“三步走”模式來促進全國產AI產業(yè)閉環(huán)的打通——基于主流芯片開展極致軟硬件協(xié)同優(yōu)化，以有限算力實現(xiàn)國產模型能力追趕；推動國產芯片開放底層生態(tài)，搭建“異構”AI系統(tǒng)解決算力缺口，實現(xiàn)模型能力趕超；構建國產“同構”系統(tǒng)，支持Scaling Law持續(xù)發(fā)展，打造“國產模型-國產芯片-國產系統(tǒng)”的全國產AI產業(yè)閉環(huán)，實現(xiàn)更可控的自主算力發(fā)展。

與此同時，針對國內源分布不均衡，技術和應用場景不匹配，導致的大量異構算力未能全量利用問題，無問芯穹也將通過整合異構、異地、異屬算力資源，轉化為標準算力服務并規(guī)?；瘡椭?，并緊密跟蹤下游應用需求，提升算力配置效率。這不僅能解決部分地區(qū)存在的算力閑置問題，滿足日益增長的應用需求，還能在使用閉環(huán)中，促成硬件與算法正向循環(huán)。

夏立雪表示，通過打通DeepSeek-R1、V3在國產硬件平臺的多芯片適配優(yōu)化，無問芯穹希望進一步團結從模型到芯片的上下游產業(yè)伙伴，在打造“國產模型+國產算力+國產系統(tǒng)+國產應用”全國產化AI產業(yè)鏈的進程中起到牽引帶動作用，集中優(yōu)勢資源，支持模型性能長足進步，推動中國AI自主可控長遠發(fā)展，為人工智能行業(yè)發(fā)展筑牢算力基礎。

有力驗證軟硬協(xié)同優(yōu)化是實現(xiàn)模型能力突破的必然路徑

在DeepSeek模型迄今發(fā)布的3個大版本中，盡管參數規(guī)模實現(xiàn)十倍增長，但所使用的訓練服務算力卻并沒有和模型尺寸等比例的成倍增加，其核心是利用軟硬件協(xié)同設計的思想，不斷提升系統(tǒng)開銷（即模型的訓練成本）到模型尺寸、能力的轉化率。DeepSeek有力驗證了在算力受限的條件下，軟硬協(xié)同優(yōu)化路線的有效性，特別在國內算力受限場景下實現(xiàn)模型能力的突破，具有重要意義。

無問芯穹是軟硬協(xié)同的堅定踐行者，其核心技術團隊源自清華大學納米集成電路與系統(tǒng)實驗室能效計算組（NICS-EFC），該組最早在 2018 年總結出“深度學習算法-編譯-芯片聯(lián)合設計”路線，致力于人工智能場景下能效電路和系統(tǒng)設計方法的研究，是軟硬協(xié)同路線上的最早開拓者之一。

自成立以來，無問芯穹依托“多元異構、軟硬協(xié)同”的核心技術優(yōu)勢，打造了連接“M種模型”和“N種芯片”的“M×N”AI基礎設施新范式，致力于在國內算力生態(tài)的市場格局相對分散，高端算力受限的情況下，實現(xiàn)不同模型和不同硬件之間的統(tǒng)一部署和聯(lián)合優(yōu)化，像“淘寶”一樣把各種不同的模型和算力資源統(tǒng)一起來，變成一套標準化服務，提供給最終客戶，被譽為中國的“CoreWeave”。

就在近日，國際最權威的科技商業(yè)媒體之一《麻省理工科技評論》刊發(fā)了一篇題為《關注DeepSeek之外的四家中國人工智能初創(chuàng)公司》的報道，指出階躍星辰、面壁智能、智譜AI、無問芯穹四家企業(yè)同樣展現(xiàn)出不遜于DeepSeek的技術實力與全球競爭力。

有業(yè)內人士指出，結合這四家被點名企業(yè)的特征分析來看，DeepSeek可能正在讓國際意識到，除了DeepSeek之外，中國還存在若干路徑獨特的團隊，在用“力大磚飛”堆疊GPU算力儲備、比拼模型精度的巨頭競賽之外，找到未被五角大樓戰(zhàn)略家們關注到的“blind spot( 盲點) ”，跨越軟硬件，攢動上下游，走出可能出奇制勝的技術路徑。

新聞中心

無問芯穹打通七家國產芯片DeepSeek-R1適配優(yōu)化，助力全國產化AI產業(yè)閉環(huán)構建

評論

相關推薦

技術專區(qū)

新聞中心

無問芯穹打通七家國產芯片DeepSeek-R1適配優(yōu)化，助力全國產化AI產業(yè)閉環(huán)構建

評論

相關推薦

技術專區(qū)

無問芯穹打通七家國產芯片DeepSeek-R1適配優(yōu)化，助力全國產化AI產業(yè)閉環(huán)構建