博客專欄

EEPW首頁 > 博客 > 壁仞科技首款GPU亮點劇透!獨家對話CTO洪洲

壁仞科技首款GPU亮點劇透!獨家對話CTO洪洲

發(fā)布人:芯東西 時間:2021-06-15 來源:工程師 發(fā)布文章
首款7nm GPU支持云端訓(xùn)練和推理,目前已至收尾階段。

作者 |  心緣
編輯 |  漠影
成立18個月,累計融資逾47億元,兩個月前的上海壁仞科技,因為“吸金”能力大刷一把存在感。GPU(Graphics processing unit)圖形處理器,又被稱作顯示芯片,是擅長做圖像圖形相關(guān)運算工作的微處理器。進入后摩爾時代,GPU應(yīng)用能力愈發(fā)超出圖形渲染,被用到通用計算領(lǐng)域。尤其伴隨著人工智能(AI)應(yīng)用趨火,一批主攻云端通用智能計算的GPGPU創(chuàng)企誕生。壁仞科技即是國內(nèi)GPGPU創(chuàng)業(yè)潮中的新秀之一。自2019年9月成立以來,壁仞科技的融資一輪接著一輪,動輒單筆逾十億人民幣,雖然相較于英偉達單款芯片數(shù)十億美元的研發(fā)投入仍有較大差距,但這樣密集而強大的融資能力,令不少看客訝異。繼新融資后,它又馬不停蹄地國內(nèi)頂尖高校簽訂新的合作協(xié)議,包括合作清華大學(xué),推進“通用圖形處理架構(gòu)與應(yīng)用創(chuàng)新研究專項”;合作復(fù)旦大學(xué),共建“智能計算芯片聯(lián)合實驗室”。在獲得多家知名投資機構(gòu)青睞的背后,這家神秘創(chuàng)企有怎樣一支強大的創(chuàng)始團隊坐鎮(zhèn)?在技術(shù)和落地方面有什么差異化打法?它所押注的GPGPU賽道,會是催火國內(nèi)云端AI芯片的好生意嗎?針對這些問題,近日,壁仞科技CTO兼首席架構(gòu)師洪洲(Mike Hong)接受芯東西的獨家專訪,講述從擔(dān)任海思自研GPU負責(zé)人和首席架構(gòu)師,到進入壁仞科技創(chuàng)業(yè)的幕后故事,并分享了在GPU芯片設(shè)計及人才培養(yǎng)方面的一些心得體會。洪洲告訴芯東西,壁仞科技同時支持AI訓(xùn)練和推理的首款7nm芯片開發(fā)進展順利,預(yù)計今年正式流片,性能將對標英偉達下一代GPU計算芯片。壁仞科技的第二款芯片也已經(jīng)啟動架構(gòu)設(shè)計。


“吸金”創(chuàng)始團:華為高通GPU架構(gòu)大神帶隊


壁仞科技給外界留下的第一印象是“吸金猛獸”。成立不到一年,壁仞科技接連在2020年6到8月拿下多輪融資,不僅以11億人民幣刷新業(yè)界A輪融資記錄,而且去年累計融資已接近20億元。今年3月底,壁仞科技又宣布累計融資已增至47億元。從投資方陣營來看,其中不乏啟明創(chuàng)投、IDG資本、華登國際、高瓴資本、格力創(chuàng)投、中芯聚源等知名投資機構(gòu)。選擇押注在這樣一家初出茅廬的創(chuàng)企,他們究竟看中了壁仞科技的什么特質(zhì)?洪洲給出的答案是:壁仞科技創(chuàng)始團隊,在創(chuàng)業(yè)之初,已經(jīng)展現(xiàn)出匯集人才的能力、團隊執(zhí)行能力,以及整合多方資源的能力:創(chuàng)立壁仞科技前,創(chuàng)始人、董事長張文曾任AI獨角獸商湯科技的總裁,并主導(dǎo)了商湯在上海、成都等地的大規(guī)模合作落地項目。他還曾與中芯國際創(chuàng)始人張汝京博士共同創(chuàng)辦LED產(chǎn)業(yè)園以及LED芯片企業(yè)映瑞光電。硬件架構(gòu)負責(zé)人洪洲擁有近30年GPU架構(gòu)設(shè)計經(jīng)驗,在GPU架構(gòu)設(shè)計、渲染算法、光線跟蹤算法、并行計算、GPGPU、X86和Arm SoC的架構(gòu)設(shè)計等方面有50多項已獲批準的專利。軟件生態(tài)負責(zé)人焦國方曾是華為Futurewei公司GPU技術(shù)首席科學(xué)家,負責(zé)GPU相關(guān)的所有軟件生態(tài);還曾在高通工作11年,成功領(lǐng)導(dǎo)和研發(fā)了5代高通Adreno移動GPU架構(gòu)。此前他亦在老牌圖形芯片供應(yīng)商Trident、S3 Graphics工作數(shù)年。壁仞科技的另外兩位聯(lián)合創(chuàng)始人徐凌杰、張凌嵐,均是產(chǎn)業(yè)界的資深人士,擁有豐富的從業(yè)經(jīng)驗。“壁仞科技匯聚了大部分最頂尖的華人GPU架構(gòu)師?!庇腥诉@樣評價。對于這一說法,洪洲認為非常貼切:“從90年代開始的20多年內(nèi)成長起來的(華人)架構(gòu)師,基本上都在我們這邊。”
27年經(jīng)驗積累,曾組建海思GPU研發(fā)團隊


洪洲本科畢業(yè)于北大“王牌專業(yè)”數(shù)學(xué)系,繼而選擇在清華經(jīng)管學(xué)院攻讀當(dāng)時很火的數(shù)量經(jīng)濟學(xué)碩士。20世紀90年代初,正是圖形芯片的黃金期,還在紐約州立大學(xué)攻讀計算機科學(xué)專業(yè)的洪洲,碩士畢業(yè)即開始研發(fā)計算機圖形芯片,一做就是27年。GPU亦是在那個時期誕生,最初僅作為圖形顯示芯片。21世紀前后,圖形芯片市場經(jīng)過一輪蕩氣回腸的廝殺較量,英偉達與ATI兩家巨頭脫穎而出,將其他競爭者或吞并或逼至絕境。到2003年左右,GPU開始被用于通用加速計算。洪洲在那時負責(zé)設(shè)計英偉達Tesla架構(gòu)和性能調(diào)優(yōu),英偉達第一版CUDA即基于該架構(gòu)開發(fā)。他還分別在S3 Graphics、兆芯等知名企業(yè)領(lǐng)導(dǎo)和管理GPU研發(fā)項目多年。在積累了足夠的GPU研發(fā)經(jīng)驗后,2016年,洪洲入職華為美研所,組建了一個遍及全球數(shù)百人的海思自研GPU團隊,推進全球領(lǐng)先且擁有自主IP的GPU芯片研發(fā)。焦國方也是同年進入華為在美國的業(yè)務(wù)主體Futurewei,任GPU首席科學(xué)家。
對標英偉達下一代產(chǎn)品,首款芯片今年流片


洪洲與張文是在2019年上海世界人工智能大會上遇見的。當(dāng)時兩人深聊之后一拍即合,發(fā)現(xiàn)在通用計算、國產(chǎn)大算力方面的很多共通的理念。同年9月,壁仞科技在上海創(chuàng)立,致力于開發(fā)基于原創(chuàng)性的高性能GPGPU產(chǎn)品的通用計算軟硬件體系。洪洲也在不久之后正式加入壁仞科技。公司一成立,其第一款通用算力芯片研發(fā)隨即開始全方位啟動。▲壁仞科技通過采用高端封裝技術(shù),壁仞科技的第一款GPU芯片定位高端通用智能計算,具備高性能、可擴展性、可虛擬化等特性,支持云端訓(xùn)練和推理,目前已經(jīng)到了收尾階段,預(yù)計將在今年流片。這顆芯片對標的,是國際GPU霸主英偉達還在醞釀之中的下一代5nm GPU計算芯片。當(dāng)然,一家初創(chuàng)公司如果剛起步就全面對標英偉達,無異于以卵擊石。對此壁仞科技的策略是,先聚焦幾個點上,打一場不對稱的戰(zhàn)爭英偉達GPU并非面向AI訓(xùn)練和推理的最優(yōu)芯片,而是一個多能力芯片。以A100為例,其雙精度對HPC很重要,但對AI加速來說,其在能效比、算力等方面并非最優(yōu)解。因此壁仞科技選擇首先專攻通用AI訓(xùn)練和推理能力,將圖形渲染等與AI加速無關(guān)的設(shè)計剝離掉,更聚焦于在自家芯片上如何合理安排更多的運算和存儲單元。“如果純粹從硬件來說,我們是有比較大的勝算的?!焙橹拚f,不過畢竟英偉達在軟件、生態(tài)方面積累深厚,因此壁仞科技面臨的關(guān)鍵問題,是如何補足這些缺口?!拔覀円仓?,我們不可能很快補足它,但我們有信心?!?/span>從研發(fā)伊始,壁仞科技就做好了前瞻性規(guī)劃,與供應(yīng)商、生態(tài)合作伙伴及客戶早早開始溝通,已對客戶需求分析地非常清楚。等芯片流片后,壁仞科技下一步將重點推進加速芯片商用落地的軟件工作。壁仞科技的另一個勝算是天時、地利、人和如今很多英偉達用戶愿意看到另一個選擇,無論是商業(yè)用戶,還是國家層面數(shù)據(jù)中心,對國產(chǎn)化的需求都與日俱增。這些對于包括壁仞科技在內(nèi)的國內(nèi)企業(yè),無疑是難得的契機。隨著首款芯片進入收尾,壁仞科技的第二款芯片已經(jīng)開始啟動架構(gòu)設(shè)計,之后壁仞科技還將逐步推出面向智算中心、云游戲、邊緣計算GPU芯片。
解析壁仞科技GPGPU三大亮點特性


除了對標英偉達,壁仞科技也面臨著與多家國內(nèi)云端AI芯片及GPGPU創(chuàng)企的競爭。在壁仞科技團隊看來,客戶習(xí)慣是芯片研發(fā)的至上準則。正如開慣了法拉利的人不愿騎三輪車,用慣了英偉達V100、A100等國際主流芯片的客戶也不會樂意用算力一般、不好用的芯片。這一背景下,壁仞科技著重優(yōu)化其芯片的3個亮點特性:通用性、高算力、芯粒(chiplet)技術(shù)。1、通用性:從兼容CUDA到取代CUDA“我們要做一個真正能落地的、能兼容現(xiàn)在的生態(tài)的、真正能大規(guī)模量產(chǎn)的通用架構(gòu)?!焙橹拚f。在洪洲看來,新的GPU板卡要無縫地支持CUDA生態(tài),這比更高的算力,更好的能效比更重要。因此,目前階段必須保證用CUDA寫的程序能無縫運行在壁仞科技的異構(gòu)計算開發(fā)平臺上,不應(yīng)當(dāng)為了追求所謂的極致能效,而打破對通用編程模型的兼容性。當(dāng)前壁仞科技的第一要務(wù)是在打造自有編程模型的同時,兼容CUDA當(dāng)前版本,并會面向未來的設(shè)計,新增很多東西,使程序能跑得更快更好。這只是第一步,壁仞科技的終極目標,是提供比CUDA更好的自研編程模型。


2、高算力:融合多種架構(gòu)的優(yōu)點“高算力對我們來說極端重要?!焙橹拚f,壁仞科技芯片的單位瓦算力非常高,并且有信心打敗英偉達下一代產(chǎn)品。達到這一性能表現(xiàn),離不開其芯片架構(gòu)的優(yōu)化——以通用性為根本的同時,在專用領(lǐng)域做深耕、優(yōu)化,融入多種架構(gòu)的優(yōu)點。傳統(tǒng)GPGPU主要做向量運算,但對于AI加速來說,矩陣運算對數(shù)據(jù)的帶寬需求比向量操作低。考慮到這些問題,壁仞科技不拘泥于傳統(tǒng)的向量流處理架構(gòu),而會在其理念中加入數(shù)據(jù)流處理單元、近存儲計算架構(gòu)等其他元素,并對重點場景進行特殊優(yōu)化,使其能處理各種數(shù)據(jù)類型,從而在同等能耗上,獲得比英偉達高好幾倍的算力。單顆芯片算力的提升只是一個點,壁仞科技還在其芯片中引入非常高的互連帶寬,能做到數(shù)百數(shù)千的芯片大規(guī)模拓展,從而實現(xiàn)集群化大算力。對于數(shù)據(jù)中心而言,未來算力將是王道。如果能將單卡算力提高2倍,其他條件不變時,綜合性價比則有望提高2倍,相應(yīng)地,數(shù)據(jù)中心服務(wù)器的總擁有成本(TCO)就會降低約一半。3、芯粒(chiplet):提高性價比的必備技術(shù)當(dāng)先進芯片制程走向7nm、5nm、3nm,芯粒(chiplet)成為一種愈發(fā)熱門的技術(shù)方向。一顆芯片上有不同功能的組件,如果這些組件全部用最先進的技術(shù)節(jié)點來制造,成本將非常高。而芯粒技術(shù)的價值在于,允許不同組件分別選擇其合適的技術(shù)節(jié)點來生產(chǎn),然后再像拼樂高一樣堆疊封裝在一起,不僅提高芯片整體性價比,也能通過更有序的配置來提升芯片處理能力。英特爾、AMD等大公司均在積極探索芯粒技術(shù)。該技術(shù)對小公司同樣有價值,如果不走芯粒方向,無論是產(chǎn)品性價比,還是能接觸到的市場空間,都會有很多局限性。“我們的芯片已經(jīng)采用chiplet技術(shù),可以說比英偉達走得快?!焙橹拚f。
團隊擴至400余人,三招解決人才困境


在洪洲看來,缺少原創(chuàng)的芯片架構(gòu)是中國現(xiàn)存的一個短板,當(dāng)前國內(nèi)真正做原創(chuàng)性GPU的團隊非常稀缺。兩大國際GPU巨頭中,英偉達在國內(nèi)沒有核心IP研發(fā)團隊,AMD在上海只有一小部分研發(fā)團隊。國內(nèi)真正從GPU底層架構(gòu)和軟件做起來的,只有原來的兆芯團隊和現(xiàn)在的海思團隊。但原創(chuàng)性不是照著別家的架構(gòu)比葫蘆畫瓢,而是真正解決整個通用計算問題。這需要組建一支有多年積累的、全面性的團隊,除了硬件人才外,軟件人才、編譯器人才也極為關(guān)鍵。壁仞科技團隊有很多成員來自產(chǎn)業(yè)鏈各環(huán)節(jié)的領(lǐng)先企業(yè),覆蓋架構(gòu)、設(shè)計、驗證、后端、封裝、系統(tǒng)、軟件等環(huán)節(jié)。洪洲總結(jié)該團隊“非常強大,是一個成建制團隊”。如何解決國內(nèi)GPGPU人才稀缺、優(yōu)質(zhì)人才招募難度升級的問題?壁仞科技思考了三條路徑:持續(xù)吸納國內(nèi)人才、招募海外人才、培養(yǎng)新鮮血液。“壁仞科技團隊的凝聚力極強,也在不斷吸引海內(nèi)外的人才加入?!焙橹拚J為,頂尖高校的優(yōu)秀畢業(yè)生如果能被培養(yǎng)好,可能會比國內(nèi)一些有經(jīng)驗的GPU工程師更具戰(zhàn)斗力。截至目前,壁仞科技的團隊已擴張至400,其中約有4/5在上海,其他團隊則分布在北京、珠海和北美,未來也計劃拓展到更多其他城市。據(jù)他透露,已經(jīng)有不少在海外招募的GPU高端人才回到國內(nèi)做全職。
結(jié)語:云端算力爭奪戰(zhàn)方興未艾


在去年GTIC 2020全球AI芯片創(chuàng)新峰會上,壁仞科技聯(lián)合創(chuàng)始人徐凌杰談道,壁仞科技與其他芯片企業(yè)的關(guān)系并非是“競爭”,而是“競合”。“壁仞科技需要更多人才加入到這個行業(yè)中,有了這樣的硬件生態(tài)和商業(yè)生態(tài),才能打造好基礎(chǔ)設(shè)施,”他期盼這個生態(tài)能更加繁榮,“越來越多的人看到基礎(chǔ)設(shè)施和算力間的矛盾,看到基礎(chǔ)設(shè)施的不足,才能夯實我國的信息高速公路?!?/span>看到機會的不止是壁仞科技,除了早先入局的寒武紀、比特大陸、燧原科技等云端芯片創(chuàng)企外,過去一年間,陸續(xù)有新玩家現(xiàn)身,大量資本也正積極地涌入這一賽道。對于高額融資帶來的名氣和質(zhì)疑,洪洲并不關(guān)心,“這個產(chǎn)業(yè)向來是用產(chǎn)品說話,我們只關(guān)注自己(的研發(fā)),把我們自己(的產(chǎn)品)做好?!?/span>而從已有進展來看,國內(nèi)云端AI芯片及GPU賽道的硝煙才剛剛開始彌漫,入局者變多,但規(guī)?;涞爻晒胁幻黠@,這場圍繞云端算力的資金、人才、市場爭奪戰(zhàn)顯然還未到高潮。


*博客內(nèi)容為網(wǎng)友個人發(fā)布,僅代表博主個人觀點,如有侵權(quán)請聯(lián)系工作人員刪除。

三相異步電動機相關(guān)文章:三相異步電動機原理


關(guān)鍵詞: 壁仞科技

技術(shù)專區(qū)

關(guān)閉