博客專欄

EEPW首頁 > 博客 > 平庸向左,黃仁勛向右

平庸向左,黃仁勛向右

發(fā)布人:硅星人 時間:2022-04-04 來源:工程師 發(fā)布文章

創(chuàng)立29年,英偉達(dá)每一步都走得難說完美,但絕不平庸。

——

文|杜晨    編輯 | Vicky Xiao


1.

創(chuàng)立一家公司很容易,保持一家公司活著很難。

為了讓曾經(jīng)多次處在存亡之際的英偉達(dá)能夠活下去,聯(lián)合創(chuàng)始人兼 CEO 黃仁勛 (Jensen Huang) 在過去的29年里曾經(jīng)做出許多在當(dāng)時極具風(fēng)險的決定。

神奇的是,這些決定當(dāng)中的絕大多數(shù),最后竟然都被證明是正確的:從 TNT,到可編程 Shader(著色器),再到 CUDA 架構(gòu)以及其開源和前向兼容,以及總是超過當(dāng)前圖形市場主流應(yīng)用場景需求的算力和存儲性能水平——這些關(guān)鍵的技術(shù)和產(chǎn)品,以及革新性的戰(zhàn)略決策,次又一次將英偉達(dá)在計算市場的地位推至新高。

在營銷策略助推下,今天的人們尊稱黃仁勛為“AI教父”,夸張地將英偉達(dá)的圖形計算產(chǎn)品描述為“核彈”。然而實際上,黃仁勛并沒有什么封神的幻想——他做出的很多決定,完全是為了避免自己最害怕的事情發(fā)生:

英偉達(dá)淪為一家平庸的個人電腦零部件供應(yīng)商。

“屏幕上就有那么多像素,芯片上能加的功能就那么多,但晶體管的數(shù)量還在不斷增加。這樣下去,在某個時間點上,圖形計算性能完全可以足夠任何人使用。你看今天各種集成顯卡,性能又好,又不要錢,就會發(fā)現(xiàn)這個分析是完全正確的,”

“那么,如果我們不重新發(fā)明電腦圖形計算,不革自己的命,不徹底解放這塊圖形處理器的能力的話,結(jié)局就是英偉達(dá)必然會被商品化 (commoditized)?!?/strong>

——黃仁勛,via Stratechery 

帶著這樣的恐懼,黃仁勛走上了一條自己革自己命的創(chuàng)業(yè)路。這條路,走到今天,已將近三十年。

2.

最近,英偉達(dá)召開了年度技術(shù)大會 GTC 2022,發(fā)布了最新一代商用級 H100 GPU,和以知名計算機(jī)科學(xué)家 Grace Hopper 命名的 Hopper 架構(gòu)。新架構(gòu)采用臺積電4納米制程工藝,內(nèi)存帶寬達(dá)到每秒3TB,在32和64位浮點計算上相比前一代 Ampere 架構(gòu)的 A100 GPU 快了三倍。

H100 已經(jīng)成為最新一代“核彈”,但英偉達(dá)還有更多殺手锏:

通過最新的互聯(lián)技術(shù) NVLink 技術(shù),8張H100單卡連接構(gòu)成了的 DGX H100 模組化超級計算機(jī),算力達(dá)到了驚人的 1EFlops;而 NVLink Switch 技術(shù)在擴(kuò)展性上也獲得了史詩級提升,支持最多256張 H100 GPU 互聯(lián)。

由于 GPU 進(jìn)行深度學(xué)習(xí)計算需要大量的內(nèi)存帶寬,英偉達(dá)甚至和 ARM 合作開發(fā)了一款采用全新 Grace 架構(gòu)的 CPU,專門用來輔助 GPU 進(jìn)行帶寬分配,從而讓 GPU 可以全力開動進(jìn)行計算,不會因為在內(nèi)存帶寬上受到限制而影響發(fā)揮。

圖片

早已在深度學(xué)習(xí)計算方面身位領(lǐng)先的英偉達(dá),再一次打造了新的 GPU、CPU 架構(gòu)、互聯(lián)技術(shù)。今天這家公司早已不再是單純的顯卡技術(shù)公司——它已經(jīng)將圖形加速計算的功力推到極限,為深度學(xué)習(xí)計算帶來了新的可能性。

在 GTC 大會上,黃仁勛認(rèn)為人類將會迎來 AI 被 AI(而不只是人類)所創(chuàng)造出來的時代,并將其稱為“生產(chǎn)智能”(intelligence manufacturing)。

會后,黃仁勛接受了 Stratechery 博客主筆/知名分析師 Ben Thompson 的采訪。特別的是,黃仁勛在這次采訪中談到了一些過去鮮少討論的話題——特別是對于公司平庸化的恐懼,以及英偉達(dá)三十年的創(chuàng)業(yè)路走到今天的感悟。

在他看來,沒有比讓英偉達(dá)變成 “Wintel” 生態(tài)下的一家普通供應(yīng)商更可怕的事情了。

2009年,黃仁勛在斯坦福大學(xué)做了一場名為“Vision Matters”的演講。其中,他回憶起了公司在2000年推出可編程像素著色器(programmable pixel shader, 以下簡稱可編程 shader),在當(dāng)時差點要了公司的命。

但是如果沒做那個決定,英偉達(dá)可能就不會獲得今天的行業(yè)地位。

作為獨立圖形處理器概念的主要推手,英偉達(dá)拿著紅衫等投資者的2000多萬美元苦心研發(fā) GPU 技術(shù),雖然頭兩款產(chǎn)品 NV1、NV2 GPU 都遭遇了失敗,還好 NV3(正式命名為 RIVA 128)由于技術(shù)相對先進(jìn)、價格低廉,推出不到1年就實現(xiàn)了100萬枚出貨量。在 RIVA 128 打下的基礎(chǔ)上,英偉達(dá)又在次年推出了 RIVA TNT,性能顯著優(yōu)于當(dāng)時的競爭對手 3dfx 的產(chǎn)品,成功攬下當(dāng)時多家顯卡廠商加入其陣營。

RIVA 128 和 TNT 的優(yōu)秀戰(zhàn)績,助推英偉達(dá)在1999年成功上市,然而當(dāng)時的黃仁勛已經(jīng)不再看好這兩款產(chǎn)品所代表的技術(shù)理念了。

早年的 GPU 產(chǎn)品,包括 RIVA TNT 在內(nèi),都屬于固定功能的芯片。這類芯片的優(yōu)勢就是運行固定功能的效率很高。

然而在黃仁勛看到的未來里,提升 GPU 的純粹性能將變得毫無意義。因為屏幕上的像素總量是有限的,一個處理器里能放進(jìn)去的既有功能也是有限的。結(jié)果就是,總有一天人們將會滿足于現(xiàn)有 GPU 的性能,不再需要更新更快的 GPU……屆時,英偉達(dá)將會淪為一家平庸的 PC 零部件供應(yīng)商。

于是,黃仁勛開始了英偉達(dá)的第一次“離經(jīng)叛道”:推出了可編程 shader。

英偉達(dá)這樣做的背后理念,就是改變 GPU 作為固定功能處理器的身份,將它變成一個可編程的處理器,讓用戶可以在英偉達(dá) GPU 上做更多創(chuàng)意工作,包括3D渲染、特效制作、游戲開發(fā)等——這樣,英偉達(dá) GPU 的用戶將不僅僅是普通消費者,也將包括開發(fā)者。

圖片

3.

這次轉(zhuǎn)型差點要了英偉達(dá)的命,不是因為這個方向錯了——它是正確的,只是發(fā)生得太早了。

前面提到,面向特定功能設(shè)計的處理器運行起來效率高,而如果要把 GPU 做成可編程的,則 GPU 的運行效率會比之前低,而且要在算力、內(nèi)存等各方面的增加額外成本。

英偉達(dá)把可編程 shader 及適配顯卡做出來了,可是圖形開發(fā)者還沒有準(zhǔn)備好為未來買單。他們所開發(fā)的游戲和圖形計算應(yīng)用,在當(dāng)時還無法從可編程 shader 技術(shù)中獲益。結(jié)果就是,英偉達(dá)搞的新技術(shù)和產(chǎn)品很好很強大,從消費者的視角來看卻過于昂貴且沒用。

“這個處理器架構(gòu)是全新的,可編程像素 shader 在過去從來沒有過,可編程的 GPU 處理器和編程模型也前所未有——所有這些尷尬的現(xiàn)實,我們都只能咽到肚子里?!秉S仁勛說。

圖片GTC 2020,黃仁勛從烤箱里拿出即將發(fā)布的顯卡

"咽下去之后,我們接下來組建了編譯器團(tuán)隊,研究 SDK和庫,到處去找開發(fā)者去跟他們安利我們的新架構(gòu),讓他們意識到這套東西的好處——我們甚至要自己動手開發(fā)庫,拿給開發(fā)者看把他們的應(yīng)用導(dǎo)入到我們這里有多容易、有哪些好處;我們甚至用了市場營銷的預(yù)算,幫開發(fā)者營銷他們用我們架構(gòu)開發(fā)的新產(chǎn)品,來創(chuàng)造市場需求……"

久而久之,英偉達(dá)不再是一家硬件公司了??梢哉f它是為了體面地活下去,而不得不實現(xiàn)了“硬件技術(shù)+軟件體驗+開發(fā)生態(tài)”垂直整合的技術(shù)平臺公司。

后來的 GeForce、CUDA、Tensor Core 等,每一個在英偉達(dá)公司技術(shù)發(fā)展歷程上寫下濃墨重彩一筆的技術(shù),從某些角度上都和可編程 shader 相似:超前的技術(shù)能力、較高的可編程自由度、面向生態(tài)合作伙伴開放的商業(yè)模式等。

但與此同時,它們其實都是黃仁勛為了避免英偉達(dá)走向平庸而決定推出的。如果沒有 Shader、CUDA、RTX、DGX 等這些在各自的誕生時間點上顯得“離經(jīng)叛道”的技術(shù),今天的英偉達(dá)恐怕早已淪為一家普通的顯卡公司,和今天掛著 GeForce 的名號生產(chǎn)顯卡的那些我們耳熟能詳?shù)钠放疲瑳]有多少不同。

4.

英偉達(dá)最近幾年全力投入 AI 技術(shù)的支持,同樣是避免公司走向平庸的結(jié)果。

按黃仁勛的說法,英偉達(dá)公司歷史上幾次具有里程碑意義的關(guān)鍵技術(shù)推出,背后其實都是對自家 GPU 技術(shù)的發(fā)展成果進(jìn)行了“泛化”(generalize),然后發(fā)現(xiàn)居然它可以做更多不同的事情。

結(jié)果就是,英偉達(dá)在不斷遷移和泛化 GPU 能力的過程中,建立了一套全新的,基于 GPU 技術(shù)的計算機(jī)科學(xué)構(gòu)。

而當(dāng)人工智能時代來臨的時候,英偉達(dá)搭建好的這套新架構(gòu)非常適合用來加速深度學(xué)習(xí)方面的任務(wù)。

正是在這樣的條件下,黃仁勛從之前的顯卡大王變成了如今的 “AI教父”。但如果有人以為英偉達(dá)只是碰巧趕上這波 AI 的浪潮,那他就大錯特錯了。

早在十年前,黃仁勛就已經(jīng)相信,圖形計算加速成就了早年的英偉達(dá)那樣,而新時代的英偉達(dá)應(yīng)該全力投入到 AI 計算的加速上,而且沒有別的公司比英偉達(dá)更適合做這件事。

一個最典型的例子就是機(jī)器人 (robotics)。黃仁勛表示:“一個經(jīng)典的機(jī)器人問題,涉及感知、推理、規(guī)劃,以及之后許許多多的不同任務(wù)。這些任務(wù)涉及多個傳感器的大量實時數(shù)據(jù);并且出于多元化和冗余的目的,處理器需要用不同的算法進(jìn)行處理。”這些任務(wù)的特性,正好是英偉達(dá)的 GPU 架構(gòu)所擅長的。

包括 AI、自動駕駛、數(shù)據(jù)中心/高性能計算、超級計算機(jī)、工業(yè)邊緣計算、元宇宙相關(guān)的融合現(xiàn)實互動技術(shù)等等……現(xiàn)在如果我們?nèi)ビミ_(dá)的網(wǎng)站上,會看到這家公司簡直無所不做,早已不是大部分普通消費者用戶所認(rèn)識的那家顯卡公司了。

這些較新的業(yè)務(wù),都可以被視為英偉達(dá)避免平庸而不斷突破自己邊界的體現(xiàn)。

在采訪中,黃仁勛說自己這一生最大的禮物,就是身邊有著一群世界上最富有才能的同事。而他自己最大的才能,是堅韌不拔。

“我堅持這條路的時間比其他人都長,但那只是因為我有耐心而已。只要我選定了一條道路,我能夠一直在上面走很長很長的時間。這就是我的耐心?!?/span>


*博客內(nèi)容為網(wǎng)友個人發(fā)布,僅代表博主個人觀點,如有侵權(quán)請聯(lián)系工作人員刪除。



關(guān)鍵詞: 黃仁勛

相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉