新聞中心

EEPW首頁(yè) > 網(wǎng)絡(luò)與存儲(chǔ) > 新品快遞 > 當(dāng)我們談?wù)揇PU時(shí),我們?cè)谡務(wù)撌裁?/p>

當(dāng)我們談?wù)揇PU時(shí),我們?cè)谡務(wù)撌裁?/h1>
作者: 時(shí)間:2024-06-25 來(lái)源:EEPW 收藏

2024年6月19日,重新定義——2024產(chǎn)品發(fā)布會(huì)順利舉辦,這對(duì)來(lái)說(shuō)是個(gè)大日子。故事還要從6年前說(shuō)起,據(jù)CEO鄢貴海分享,“從創(chuàng)立之處中科馭數(shù)團(tuán)隊(duì)就帶著對(duì)科技創(chuàng)新無(wú)比堅(jiān)定的信念、對(duì)發(fā)展自主可控核心技術(shù)的不懈追求,對(duì)變幻莫測(cè)的市場(chǎng)的深深敬畏,和對(duì)未來(lái)智能計(jì)算技術(shù)趨勢(shì)的研判,從實(shí)驗(yàn)室勇敢地邁出了科技創(chuàng)業(yè)的穩(wěn)健步伐。不僅要把做成一個(gè)產(chǎn)品,更要把“馭數(shù)”做成一個(gè)品牌,做成一個(gè)在數(shù)字時(shí)代助力數(shù)字中國(guó)的品牌,成為這個(gè)時(shí)代趁勢(shì)而上的企業(yè)?!?。

本文引用地址:http://www.butianyuan.cn/article/202406/460320.htm

1719300527641869.jpg


在復(fù)雜大型芯片每代產(chǎn)品普遍3~5年的研發(fā)周期中,中科馭數(shù)用6年的時(shí)間,完成了三代芯片的迭代,平均每代芯片迭代僅有不到2年的時(shí)間。同時(shí)在成本控制上,也遠(yuǎn)小于行業(yè)的平均值。其秘訣——就是全棧技術(shù)自主研發(fā),重硅前驗(yàn)證,快速迭代。用理論來(lái)指導(dǎo)實(shí)踐,而非盲目地訴諸于通過(guò)工程試錯(cuò)來(lái)優(yōu)化設(shè)計(jì)。

何為“重新定義

DPU是當(dāng)下算力基礎(chǔ)設(shè)施的核心創(chuàng)新之一,被寄予了數(shù)據(jù)中心三大支柱芯片之一的定位,戴上了“PU”的王冠。好比數(shù)據(jù)網(wǎng)絡(luò)的——高鐵時(shí)代,已經(jīng)不僅僅是連通城市問(wèn)題,而是徹底重構(gòu)了地理位置的邏輯距離。

1719300550550932.png

如果把CPU比做大腦、那么GPU就好比是肌肉、而DPU就是神經(jīng)中樞。CPU承載了應(yīng)用生態(tài),決定了計(jì)算系統(tǒng)是否可以通用;GPU提供了高密度各類(lèi)精度的算力,決定了系統(tǒng)是否有足夠的“力量”;DPU負(fù)責(zé)數(shù)據(jù)在各種CPU和GPU之間高效流通,決定了系統(tǒng)是否能協(xié)同工作。

關(guān)于DPU的重新定義,鄢貴海表示可以從兩個(gè)維度來(lái)深入理解。首先,DPU已超越單純的芯片范疇,它涵蓋了更廣泛的架構(gòu)和軟件生態(tài)。同時(shí)我們也強(qiáng)調(diào)了軟件護(hù)城的概念,這意味著基礎(chǔ)軟件和平臺(tái)在云端的深度集成與應(yīng)用是DPU技術(shù)落地的關(guān)鍵。因此,要真正發(fā)揮DPU的潛力,需要在架構(gòu)、軟件以及應(yīng)用這三個(gè)層次上共同發(fā)力。

第二個(gè)維度涉及DPU的目標(biāo)應(yīng)用。傳統(tǒng)的DPU理解往往局限于卸載CPU上的某些任務(wù),但這種觀念已經(jīng)過(guò)時(shí)且具有誤導(dǎo)性。如今的DPU應(yīng)用遠(yuǎn)不止于此,它處理的任務(wù)類(lèi)型更為廣泛和復(fù)雜。例如,在處理安全業(yè)務(wù)或構(gòu)建分布式安全機(jī)制時(shí),DPU能夠輕松應(yīng)對(duì)CPU難以有效處理的負(fù)載。DPU已成為算網(wǎng)融合的關(guān)鍵組件,特別是在網(wǎng)絡(luò)中進(jìn)行計(jì)算的任務(wù),這是CPU無(wú)法替代的。

綜上所述,DPU的定義需要分層次理解,不能僅局限于芯片本身。同時(shí),也應(yīng)該摒棄狹義的DPU功能認(rèn)知,而是將其置于更廣泛的分布式和集群性系統(tǒng)背景下考慮。這樣才能更準(zhǔn)確地把握DPU在計(jì)算機(jī)系統(tǒng)中所承載的負(fù)載類(lèi)型,從而更好地利用這一關(guān)鍵組件提升系統(tǒng)的整體性能。

不同技術(shù)路線(xiàn)的DPU

       全球DPU芯片市場(chǎng)正在經(jīng)歷一場(chǎng)由多家科技巨頭引領(lǐng)的變革。NVIDIA之外,Intel在2015年收購(gòu)Altera后,于2021年6月推出了IPU類(lèi)DPU產(chǎn)品,而Marvell自2018年起通過(guò)收購(gòu)Cavium、Avera Semiconductor和Innovium等公司增強(qiáng)實(shí)力。Xilinx在2019年收購(gòu)Solarflare后,于2020年發(fā)布Alveo系列加速卡,隨后于2022年被AMD收購(gòu),進(jìn)一步擴(kuò)大了AMD在DPU領(lǐng)域的布局,完成了從CPU、GPU、FPGA到DPU的全云端覆蓋。

國(guó)內(nèi)市場(chǎng)上,除了阿里巴巴、華為和騰訊等領(lǐng)軍企業(yè)外,新興廠商如中科馭數(shù)、云豹智能、云脈芯聯(lián)等也紛紛崛起。

在技術(shù)層面,DPU的不同技術(shù)路徑各有優(yōu)劣。ASIC以其高性能、低功耗和低成本著稱(chēng),但可編程性較低;FPGA提供了高靈活性和可編程性,但成本高昂、功耗較大;而基于SoC的技術(shù)路線(xiàn),如NVIDIA的Blue Field DPU,以其可編程性和高靈活性成為DPU發(fā)展的主流方向,為更復(fù)雜、更廣泛的應(yīng)用場(chǎng)景提供了更優(yōu)的實(shí)施選項(xiàng)。

中科馭數(shù)CTO盧文巖指出,F(xiàn)PGA在過(guò)去兩年中因其開(kāi)發(fā)效率而受到廣泛青睞,但其局限性也愈發(fā)明顯:功耗偏高、頻率難以大幅提升,且資源受限。因此,F(xiàn)PGA更適合作為DPU產(chǎn)品早期驗(yàn)證階段的產(chǎn)品路線(xiàn)。

中科馭數(shù)所走的技術(shù)路線(xiàn)與AMD相近,強(qiáng)調(diào)可編程處理核心與輕量級(jí)控制的結(jié)合,這種技術(shù)策略近期表現(xiàn)出強(qiáng)勁的生命力。業(yè)界普遍認(rèn)可的重?cái)?shù)據(jù)通路加輕量級(jí)控制的趨勢(shì),正是中科馭數(shù)與AMD所采納的發(fā)展方向,并經(jīng)過(guò)數(shù)年探索,這一路線(xiàn)已得到業(yè)界的廣泛認(rèn)同。

打造獨(dú)立自主的DPU生態(tài)

國(guó)內(nèi)首顆量產(chǎn)全功能DPU芯片K2-Pro,由中科馭數(shù)研發(fā),是專(zhuān)為突破大規(guī)模數(shù)據(jù)中心性能瓶頸而設(shè)計(jì)的高效數(shù)據(jù)處理芯片。它采用自主研發(fā)的KPU架構(gòu),集成了網(wǎng)絡(luò)、存儲(chǔ)、安全及計(jì)算等多功能,實(shí)現(xiàn)包處理速率翻倍至80Mpps,并支持高達(dá)200G的網(wǎng)絡(luò)帶寬。

K2-Pro憑借高度可編程性,為數(shù)據(jù)中心提供了靈活擴(kuò)展性,并在處理復(fù)雜任務(wù)時(shí)能耗降低30%。作為純國(guó)產(chǎn)高性能解決方案,K2-Pro適用于云計(jì)算、智能計(jì)算及高性能計(jì)算等領(lǐng)域。其背后的KPU架構(gòu)基于“軟件定義硬件”技術(shù),通過(guò)定制化的功能核實(shí)現(xiàn)高效處理,而KISA指令集則是業(yè)界首個(gè)面向DPU的專(zhuān)用指令系統(tǒng),支持敏捷異構(gòu)。


1719300588368187.jpg 

在專(zhuān)用計(jì)算領(lǐng)域,DPU作為一種復(fù)雜的算力芯片,其編程范式的多樣性和不統(tǒng)一性,很難滿(mǎn)足上層應(yīng)用敏捷迭代的需求。KISA(Kernel-based Instruction Set Architecture)是中科馭數(shù)面向DPU強(qiáng)IO、強(qiáng)數(shù)據(jù)、弱控制、敏捷異構(gòu)的需求而推出的強(qiáng)擴(kuò)展指令集,是業(yè)界首個(gè)面向DPU領(lǐng)域的專(zhuān)用指令集。不同于傳統(tǒng)的CPU指令集,KISA面向數(shù)據(jù)而非控制,高計(jì)算密度型而非低計(jì)算密度型,以數(shù)據(jù)流為基本操作單元,而非字節(jié)。更重要的是,KISA首次在指令集層次支持敏捷異構(gòu),用一套統(tǒng)一的指令實(shí)現(xiàn)了多種異構(gòu)處理核進(jìn)行管理調(diào)度。

目前,KISA指令集涵蓋了KISA基礎(chǔ)架構(gòu)、以及面向DPU專(zhuān)用處理擴(kuò)展指令,包含包解析、轉(zhuǎn)發(fā)指令、以及表查詢(xún)指令等?;贙ISA已經(jīng)覆蓋25大類(lèi)應(yīng)用場(chǎng)景,累計(jì)數(shù)百個(gè)用例,得到非常充分驗(yàn)證。

1719300630974763.jpg

此外,中科馭數(shù)還推出了DPU敏捷異構(gòu)軟件開(kāi)發(fā)平臺(tái)HADOS 3.0,該平臺(tái)集成了DPU核心軟件能力,并提供了豐富的API和模塊,已廣泛應(yīng)用于金融、電信等行業(yè),展現(xiàn)出與業(yè)界巨頭競(jìng)爭(zhēng)的實(shí)力。K2-Pro芯片的成功研發(fā),使得中科馭數(shù)能夠推出思威、福來(lái)、功夫三大產(chǎn)品系列,精準(zhǔn)滿(mǎn)足各類(lèi)業(yè)務(wù)場(chǎng)景需求。

潛力無(wú)限的DPU市場(chǎng)

隨著信息技術(shù)的持續(xù)發(fā)展,數(shù)據(jù)中心網(wǎng)絡(luò)帶寬從100G邁入400G,甚至將提升至800G或1.6T。然而,作為提供算力的物理載體,受限于通用CPU的結(jié)構(gòu)的馮諾依曼瓶頸、摩爾定律逐漸失效等因素的影響,以CPU為網(wǎng)絡(luò)核心的數(shù)據(jù)處理能力難以支持大規(guī)模新型數(shù)據(jù)中心的網(wǎng)絡(luò)和數(shù)據(jù)的算力需求。

由此,DPU已經(jīng)成為繼CPU、GPU之后未來(lái)數(shù)據(jù)中心的第三顆主力芯片。DPU提供的高吞吐、低時(shí)延、基礎(chǔ)設(shè)施卸載能力,幫助數(shù)據(jù)中心完美的規(guī)避了“信息孤島”問(wèn)題。未來(lái)的技術(shù)發(fā)展趨勢(shì)將會(huì)是高度集成化的片上數(shù)據(jù)中心的模式(Data Center Infrastructure on a chip),即一個(gè)GPU、CPU、DPU共存的時(shí)代。

全球范圍內(nèi),英偉達(dá)、英特爾、AMD、微軟等業(yè)界巨頭紛紛在DPU領(lǐng)域展開(kāi)積極布局。特別是英偉達(dá),憑借其GPU與DPU的強(qiáng)強(qiáng)聯(lián)合,推出了針對(duì)高性能計(jì)算的先進(jìn)算力方案,并在每年的GTC大會(huì)上持續(xù)展現(xiàn)其創(chuàng)新實(shí)力。而在國(guó)內(nèi),中科馭數(shù)更是脫穎而出,率先完成了三代DPU芯片的研發(fā)迭代,并成功實(shí)現(xiàn)規(guī)?;逃?,展現(xiàn)了國(guó)內(nèi)DPU產(chǎn)業(yè)的強(qiáng)勁實(shí)力。

從國(guó)際市場(chǎng)上來(lái)看,2020年,全球DPU市場(chǎng)空間為30.5億美元,截至2021年達(dá)到50.7億美元,預(yù)計(jì)至2025年,市場(chǎng)空間將有望達(dá)到245.3億美元,五年復(fù)合增速為51.73%。

1719300646621123.png

近年來(lái),受新基建、數(shù)字化轉(zhuǎn)型及數(shù)字中國(guó)等國(guó)家政策推動(dòng),以及企業(yè)降本增效的迫切需求,我國(guó)數(shù)據(jù)中心業(yè)務(wù)收入呈現(xiàn)出持續(xù)高速增長(zhǎng)的態(tài)勢(shì)。據(jù)權(quán)威統(tǒng)計(jì),2021年我國(guó)數(shù)據(jù)中心行業(yè)市場(chǎng)收入已高達(dá)1500.2億元,同比增長(zhǎng)率高達(dá)28.5%。隨著各地區(qū)、各行業(yè)數(shù)字化轉(zhuǎn)型的深入,預(yù)計(jì)數(shù)據(jù)中心市場(chǎng)收入將持續(xù)保持增長(zhǎng)。

根據(jù)2023年《中國(guó)數(shù)據(jù)中心產(chǎn)業(yè)發(fā)展白皮書(shū)》,預(yù)計(jì)至 2025 年“十四五”規(guī)劃期末,擬實(shí)現(xiàn)數(shù)據(jù)中心機(jī)架規(guī)模增長(zhǎng)至 1400 萬(wàn)架,規(guī)??偭糠瓋杀?,總增量投資約7000 億元。

按服務(wù)器規(guī)模預(yù)計(jì),未來(lái)幾年云與數(shù)據(jù)中心領(lǐng)域每年國(guó)內(nèi)服務(wù)器出貨量將維持在500萬(wàn)臺(tái)左右,其中DPU滲透率在10%左右,單臺(tái)服務(wù)器可以配置一塊到多塊DPU板卡,預(yù)計(jì)每年DPU需求量將在100萬(wàn)片左右。

云計(jì)算行業(yè)也呈現(xiàn)出強(qiáng)勁的增長(zhǎng)勢(shì)頭。隨著數(shù)據(jù)中心帶寬的不斷迭代(平均每2-3年一次),DPU(數(shù)據(jù)處理單元)在支持用戶(hù)數(shù)據(jù)中心帶寬升級(jí)和靈活部署新功能方面發(fā)揮著重要作用。2017-2019年,我國(guó)云計(jì)算行業(yè)規(guī)模增速均保持在30%以上,2021年市場(chǎng)規(guī)模更是達(dá)到了3102億元。亞馬遜、阿里云、華為等云計(jì)算巨頭紛紛發(fā)展符合自身需求的DPU產(chǎn)品線(xiàn),以應(yīng)對(duì)市場(chǎng)的高速增長(zhǎng)。

在自動(dòng)駕駛領(lǐng)域,DPU的部署將顯著提升車(chē)載終端的處理能力和傳輸速率,降低時(shí)延,確保車(chē)輛在高速移動(dòng)場(chǎng)景下維持穩(wěn)定的數(shù)據(jù)交換。未來(lái),智能駕駛的每個(gè)車(chē)機(jī)節(jié)點(diǎn)都可以視為一個(gè)小型數(shù)據(jù)中心,產(chǎn)生大量的數(shù)據(jù)處理、轉(zhuǎn)發(fā)、交換和存儲(chǔ)需求。預(yù)計(jì)每輛智能駕駛汽車(chē)都將配備DPU以降低無(wú)線(xiàn)側(cè)傳輸時(shí)延。例如,NVIDIA的智能駕駛平臺(tái)Atlan就集成了DPU芯片,并計(jì)劃于2025年應(yīng)用于車(chē)機(jī)之上。隨著L3及以上級(jí)別自動(dòng)駕駛汽車(chē)的逐步落地,DPU在車(chē)載領(lǐng)域的應(yīng)用前景廣闊。

       綜上所述,DPU技術(shù)作為數(shù)據(jù)中心繼CPU、GPU之后的第三顆主力芯片,其未來(lái)的發(fā)展勢(shì)頭強(qiáng)勁且前景廣闊。隨著數(shù)字化轉(zhuǎn)型的深入推進(jìn)和AI技術(shù)的飛速發(fā)展,數(shù)據(jù)處理和計(jì)算需求呈現(xiàn)爆炸式增長(zhǎng),DPU以其高效的數(shù)據(jù)處理能力和低延遲特性,正逐步成為算力基礎(chǔ)設(shè)施中的關(guān)鍵組成部分。

我們期待在中科馭數(shù)作為國(guó)產(chǎn)DPU廠商能夠帶領(lǐng)行業(yè)扎實(shí)走好創(chuàng)新之路,助力大數(shù)據(jù)時(shí)代的發(fā)展,推動(dòng)“3U一體”的國(guó)內(nèi)認(rèn)知和布局。



關(guān)鍵詞: 中科馭數(shù) DPU

評(píng)論


相關(guān)推薦

技術(shù)專(zhuān)區(qū)

關(guān)閉