企業(yè) | 中國最大的計算芯片亮相,突破封裝極限
在近年來興起的國產(chǎn)芯片發(fā)展浪潮中,成立于2018年的燧原科技必然是當中不得不提的一個。
作為一家專注人工智能領(lǐng)域云端算力平臺,開發(fā)自主知識產(chǎn)權(quán)的高算力、高能效比、可編程的通用人工智能訓(xùn)練和推理產(chǎn)品的企業(yè),燧原科技自2018年成立以來,就獲得了多家領(lǐng)先資本的青睞。截止今年,公司已經(jīng)獲得了32億人民幣的投資。在這些資金的推動下,公司在產(chǎn)品方面也獲得了高速發(fā)展。
如上圖所示,燧原在成立次年,就推出了公司的第一代訓(xùn)練芯片“邃思1.0”和“云燧T10/T11”人工智能訓(xùn)練加速卡。并在接下來的一年里獲得了客戶和行業(yè)的認可。到了近日,燧原科技又帶來了公司新一代的芯片“邃思2.0”和全新的“云燧T20/T21”。給相關(guān)應(yīng)用的性能帶來了大幅度提升。從某種程度看,燧原的這些產(chǎn)品還刷新了中國芯片的記錄。
中國最大的計算芯片
“我們新發(fā)布的邃思2.0是中國最大的計算芯片,與競爭對手的最新旗艦相比,邃思2.0也毫不遜色”,燧原科技COO張亞林在發(fā)布會上強調(diào)。從他的介紹我們可以看到,燧原科技的新一代芯片采用了2.5D封裝,在其中整合了9顆芯片。這樣的設(shè)計也使得整個芯片的整體封裝尺寸做到了驚人的57.6mm×57.6mm,達成國內(nèi)領(lǐng)先的成就。
據(jù)介紹,邃思2.0進行了大規(guī)模的架構(gòu)升級,采用了新一代全自研的GCU-CARA全域計算架構(gòu),針對人工智能計算的特性進行深度優(yōu)化,夯實了支持通用異構(gòu)計算的基礎(chǔ);支持全面的計算精度,涵蓋從FP32、TF32、FP16、BF16到INT8,并成為中國首款支持單精度張量TF32數(shù)據(jù)精度的人工智能芯片。單精度FP32峰值算力達到40 TFLOPS,單精度張量TF32峰值算力達到160 TFLOPS,以上數(shù)據(jù)均為國內(nèi)第一。
此外,通過對HBM2E存儲的采用,燧原科技讓“邃思2.0”擁有了海量的吞吐能力。
從張亞林的介紹我們得知,邃思2.0共搭載了4顆HBM2E片上存儲芯片,高配支持64 GB內(nèi)存,帶寬達1.8 TB/s。值得一提的是,“邃思2.0”是中國第一顆支持世界最先進存儲HBM2E和單芯片64 GB內(nèi)存的產(chǎn)品。
在發(fā)布邃思2.0的同時,燧原科技還帶了公司的全新產(chǎn)品路線圖。張亞林在會上更是公布了燧原產(chǎn)品定理。他表示,燧原的每一代產(chǎn)品必須比前一代在“平均業(yè)務(wù)”中將每瓦性能提升三倍以上。在成本方面,也會更有優(yōu)勢。軟件更是必然會后向兼容可靠。
基于這樣的思路,燧原發(fā)布了公司訓(xùn)練計算產(chǎn)品和推理計算產(chǎn)品的路線圖。張亞林表示,公司的下一代訓(xùn)練芯片將在2023年面世,每瓦性能會比邃思2.0提升兩倍。屆時還會有推理芯片同步亮相,其性能也將獲得大幅提升。
不輸友商旗艦的加速卡
得益于邃思2.0的優(yōu)越性能,燧原科技打造出了不輸友商旗艦的加速卡云燧T20/T21.
如上圖所示,燧原科技第二代通用人工智能訓(xùn)練加速卡“云燧T20”是一個全高全長的PCIE板卡,在FP 32/TF 32下的峰值算力可以做到134.4T(單精度張量)和33.6T(單精度)。在BF16/FP16下的峰值算力則能做到134.4T。INT8的峰值算力更是達到了268.8T。這樣的數(shù)據(jù)讓其在與友商的旗艦相比,也能夠做到不相上下。這對于一個成立僅幾年的公司而言,是一個難得的成就。
至于采用OAM模組模式設(shè)計的云燧T21,如上圖所示,也在多個模式下?lián)碛薪艹龅谋憩F(xiàn)。
除了在計算能力上有了大幅度的提升,燧原科技同時還在互聯(lián)與軟件上同步投入,這讓公司能夠在降低開發(fā)者開發(fā)門檻的同時,還能提升板卡在系統(tǒng)中的性能。
據(jù)介紹,燧原在新產(chǎn)品中引入GCU-LARE全域互聯(lián)技術(shù),作為一項公司專為人工智能訓(xùn)練集群研發(fā)的互聯(lián)技術(shù),GCU-LARE能提供雙向300 GB/s互聯(lián)帶寬,支持數(shù)千張云燧CloudBlazer加速卡互聯(lián),實現(xiàn)優(yōu)異的線性加速比。
與此同時,燧原自主知識產(chǎn)權(quán)的計算及編程平臺馭算TopsRider也獲得了升級。
燧原方面表示,通過軟硬件協(xié)同架構(gòu)設(shè)計,全新的馭算TopsRider能夠充分發(fā)揮邃思2.0的性能;基于算子泛化技術(shù)及圖優(yōu)化策略,能支持主流深度學(xué)習框架下的各類模型訓(xùn)練;再通過利用Horovod分布式訓(xùn)練框架與GCU-LARE互聯(lián)技術(shù)相互配合,為超大規(guī)模集群的高效運行提供解決方案。開放升級的編程模型和可擴展的算子接口,為客戶模型的優(yōu)化提供了自定義的開發(fā)能力。
在發(fā)布兩款加速卡的同時,燧原還介紹了一個基于公司訓(xùn)練卡打造的超大規(guī)模智算集群。張亞林告訴記者,這個名為云燧智能集群(CloudBlazer Matrix 2.0)的產(chǎn)品包含了8192張云燧訓(xùn)練卡,可實現(xiàn)最高1.3E的算力。放眼全球,這在之前是沒有人能做到的。“這代表著燧原正使用集群化產(chǎn)品登上中國智能計算和新基建算力舞臺”,張亞林強調(diào)。
共推生態(tài)
在產(chǎn)品發(fā)布會的同期,燧原科技CEO趙立東還帶來了公司在生態(tài)方面的計劃。
他首先指出,在工業(yè)4.0“智造”時代,人工智能是關(guān)鍵動力。但因為摩爾定律放緩,產(chǎn)業(yè)必須會加快在異構(gòu)計算的投入。那就意味著以芯片為核心的算力是工業(yè)4.0兵家必爭之地?;谶@個考慮,燧原科技推出了異構(gòu)計算生態(tài)——“燎原”計劃。
趙立東表示?!傲窃庇媱澋哪繕擞腥齻€,分別是以人工智能為起點,構(gòu)建通用異構(gòu)計算生態(tài);構(gòu)建標準化的技術(shù)體系以及共建完整生態(tài)服務(wù)數(shù)字中國。而“燎原”計劃的內(nèi)涵也包括繁榮開放的開發(fā)者生態(tài)、健康互利的產(chǎn)業(yè)生態(tài)和持續(xù)創(chuàng)新的教科研生態(tài)。
趙海東進一步指出,經(jīng)過幾年的發(fā)展,燧原科技已經(jīng)發(fā)展起了一個研發(fā)人員接近90%的超過五百人團隊。這個擁有深厚水平的團隊也圍繞芯片的方方面面,為公司積累下了52項專利(包括45項發(fā)明專利),公司同時還有近30項專利正在申請。
從當前的行業(yè)現(xiàn)狀看來,無論是在云端AI芯片,還是云端推理芯片,都擁有巨大的成長基于。尤其是對于中國的相關(guān)從業(yè)者而言,更是機會多多。而對于跑得比較快的燧原來說,他們正處于一個前所未有的好位置,未來也值得期待。
來源:半導(dǎo)體行業(yè)觀察
*博客內(nèi)容為網(wǎng)友個人發(fā)布,僅代表博主個人觀點,如有侵權(quán)請聯(lián)系工作人員刪除。
電容式接近開關(guān)相關(guān)文章:電容式接近開關(guān)原理