平庸向左，黃仁勛向右

發(fā)布人：硅星人時間：2022-04-04 來源：工程師

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢

創(chuàng)立29年，英偉達(dá)每一步都走得難說完美，但絕不平庸。

——

文｜杜晨編輯 | Vicky Xiao

創(chuàng)立一家公司很容易，保持一家公司活著很難。

為了讓曾經(jīng)多次處在存亡之際的英偉達(dá)能夠活下去，聯(lián)合創(chuàng)始人兼 CEO 黃仁勛 (Jensen Huang) 在過去的29年里曾經(jīng)做出許多在當(dāng)時極具風(fēng)險的決定。

神奇的是，這些決定當(dāng)中的絕大多數(shù)，最后竟然都被證明是正確的：從 TNT，到可編程 Shader（著色器），再到 CUDA 架構(gòu)以及其開源和前向兼容，以及總是超過當(dāng)前圖形市場主流應(yīng)用場景需求的算力和存儲性能水平——這些關(guān)鍵的技術(shù)和產(chǎn)品，以及革新性的戰(zhàn)略決策，一次又一次將英偉達(dá)在計算市場的地位推至新高。

在營銷策略助推下，今天的人們尊稱黃仁勛為“AI教父”，夸張地將英偉達(dá)的圖形計算產(chǎn)品描述為“核彈”。然而實(shí)際上，黃仁勛并沒有什么封神的幻想——他做出的很多決定，完全是為了避免自己最害怕的事情發(fā)生：

英偉達(dá)淪為一家平庸的個人電腦零部件供應(yīng)商。

“屏幕上就有那么多像素，芯片上能加的功能就那么多，但晶體管的數(shù)量還在不斷增加。這樣下去，在某個時間點(diǎn)上，圖形計算性能完全可以足夠任何人使用。你看今天各種集成顯卡，性能又好，又不要錢，就會發(fā)現(xiàn)這個分析是完全正確的，”

“那么，如果我們不重新發(fā)明電腦圖形計算，不革自己的命，不徹底解放這塊圖形處理器的能力的話，結(jié)局就是英偉達(dá)必然會被商品化 (commoditized)?！?/strong>

——黃仁勛，via Stratechery

帶著這樣的恐懼，黃仁勛走上了一條自己革自己命的創(chuàng)業(yè)路。這條路，走到今天，已將近三十年。

最近，英偉達(dá)召開了年度技術(shù)大會 GTC 2022，發(fā)布了最新一代商用級 H100 GPU，和以知名計算機(jī)科學(xué)家 Grace Hopper 命名的 Hopper 架構(gòu)。新架構(gòu)采用臺積電4納米制程工藝，內(nèi)存帶寬達(dá)到每秒3TB，在32和64位浮點(diǎn)計算上相比前一代 Ampere 架構(gòu)的 A100 GPU 快了三倍。

H100 已經(jīng)成為最新一代“核彈”，但英偉達(dá)還有更多殺手锏：

通過最新的互聯(lián)技術(shù) NVLink 技術(shù)，8張H100單卡連接構(gòu)成了的 DGX H100 模組化超級計算機(jī)，算力達(dá)到了驚人的 1EFlops；而 NVLink Switch 技術(shù)在擴(kuò)展性上也獲得了史詩級提升，支持最多256張 H100 GPU 互聯(lián)。

由于 GPU 進(jìn)行深度學(xué)習(xí)計算需要大量的內(nèi)存帶寬，英偉達(dá)甚至和 ARM 合作開發(fā)了一款采用全新 Grace 架構(gòu)的 CPU，專門用來輔助 GPU 進(jìn)行帶寬分配，從而讓 GPU 可以全力開動進(jìn)行計算，不會因?yàn)樵趦?nèi)存帶寬上受到限制而影響發(fā)揮。

早已在深度學(xué)習(xí)計算方面身位領(lǐng)先的英偉達(dá)，再一次打造了新的 GPU、CPU 架構(gòu)、互聯(lián)技術(shù)。今天這家公司早已不再是單純的顯卡技術(shù)公司——它已經(jīng)將圖形加速計算的功力推到極限，為深度學(xué)習(xí)計算帶來了新的可能性。

在 GTC 大會上，黃仁勛認(rèn)為人類將會迎來 AI 被 AI（而不只是人類）所創(chuàng)造出來的時代，并將其稱為“生產(chǎn)智能”(intelligence manufacturing)。

會后，黃仁勛接受了 Stratechery 博客主筆/知名分析師 Ben Thompson 的采訪。特別的是，黃仁勛在這次采訪中談到了一些過去鮮少討論的話題——特別是對于公司平庸化的恐懼，以及英偉達(dá)三十年的創(chuàng)業(yè)路走到今天的感悟。

在他看來，沒有比讓英偉達(dá)變成 “Wintel” 生態(tài)下的一家普通供應(yīng)商更可怕的事情了。

2009年，黃仁勛在斯坦福大學(xué)做了一場名為“Vision Matters”的演講。其中，他回憶起了公司在2000年推出可編程像素著色器（programmable pixel shader, 以下簡稱可編程 shader），在當(dāng)時差點(diǎn)要了公司的命。

但是如果沒做那個決定，英偉達(dá)可能就不會獲得今天的行業(yè)地位。

作為獨(dú)立圖形處理器概念的主要推手，英偉達(dá)拿著紅衫等投資者的2000多萬美元苦心研發(fā) GPU 技術(shù)，雖然頭兩款產(chǎn)品 NV1、NV2 GPU 都遭遇了失敗，還好 NV3（正式命名為 RIVA 128）由于技術(shù)相對先進(jìn)、價格低廉，推出不到1年就實(shí)現(xiàn)了100萬枚出貨量。在 RIVA 128 打下的基礎(chǔ)上，英偉達(dá)又在次年推出了 RIVA TNT，性能顯著優(yōu)于當(dāng)時的競爭對手 3dfx 的產(chǎn)品，成功攬下當(dāng)時多家顯卡廠商加入其陣營。

RIVA 128 和 TNT 的優(yōu)秀戰(zhàn)績，助推英偉達(dá)在1999年成功上市，然而當(dāng)時的黃仁勛已經(jīng)不再看好這兩款產(chǎn)品所代表的技術(shù)理念了。

早年的 GPU 產(chǎn)品，包括 RIVA TNT 在內(nèi)，都屬于固定功能的芯片。這類芯片的優(yōu)勢就是運(yùn)行固定功能的效率很高。

然而在黃仁勛看到的未來里，提升 GPU 的純粹性能將變得毫無意義。因?yàn)槠聊簧系南袼乜偭渴怯邢薜模粋€處理器里能放進(jìn)去的既有功能也是有限的。結(jié)果就是，總有一天人們將會滿足于現(xiàn)有 GPU 的性能，不再需要更新更快的 GPU……屆時，英偉達(dá)將會淪為一家平庸的 PC 零部件供應(yīng)商。

于是，黃仁勛開始了英偉達(dá)的第一次“離經(jīng)叛道”：推出了可編程 shader。

英偉達(dá)這樣做的背后理念，就是改變 GPU 作為固定功能處理器的身份，將它變成一個可編程的處理器，讓用戶可以在英偉達(dá) GPU 上做更多創(chuàng)意工作，包括3D渲染、特效制作、游戲開發(fā)等——這樣，英偉達(dá) GPU 的用戶將不僅僅是普通消費(fèi)者，也將包括開發(fā)者。

這次轉(zhuǎn)型差點(diǎn)要了英偉達(dá)的命，不是因?yàn)檫@個方向錯了——它是正確的，只是發(fā)生得太早了。

前面提到，面向特定功能設(shè)計的處理器運(yùn)行起來效率高，而如果要把 GPU 做成可編程的，則 GPU 的運(yùn)行效率會比之前低，而且要在算力、內(nèi)存等各方面的增加額外成本。

英偉達(dá)把可編程 shader 及適配顯卡做出來了，可是圖形開發(fā)者還沒有準(zhǔn)備好為未來買單。他們所開發(fā)的游戲和圖形計算應(yīng)用，在當(dāng)時還無法從可編程 shader 技術(shù)中獲益。結(jié)果就是，英偉達(dá)搞的新技術(shù)和產(chǎn)品很好很強(qiáng)大，從消費(fèi)者的視角來看卻過于昂貴且沒用。

“這個處理器架構(gòu)是全新的，可編程像素 shader 在過去從來沒有過，可編程的 GPU 處理器和編程模型也前所未有——所有這些尷尬的現(xiàn)實(shí)，我們都只能咽到肚子里?！秉S仁勛說。

GTC 2020，黃仁勛從烤箱里拿出即將發(fā)布的顯卡
"咽下去之后，我們接下來組建了編譯器團(tuán)隊(duì)，研究 SDK和庫，到處去找開發(fā)者去跟他們安利我們的新架構(gòu)，讓他們意識到這套東西的好處——我們甚至要自己動手開發(fā)庫，拿給開發(fā)者看把他們的應(yīng)用導(dǎo)入到我們這里有多容易、有哪些好處；我們甚至用了市場營銷的預(yù)算，幫開發(fā)者營銷他們用我們架構(gòu)開發(fā)的新產(chǎn)品，來創(chuàng)造市場需求……"
久而久之，英偉達(dá)不再是一家硬件公司了?？梢哉f它是為了體面地活下去，而不得不實(shí)現(xiàn)了“硬件技術(shù)+軟件體驗(yàn)+開發(fā)生態(tài)”垂直整合的技術(shù)平臺公司。
后來的 GeForce、CUDA、Tensor Core 等，每一個在英偉達(dá)公司技術(shù)發(fā)展歷程上寫下濃墨重彩一筆的技術(shù)，從某些角度上都和可編程 shader 相似：超前的技術(shù)能力、較高的可編程自由度、面向生態(tài)合作伙伴開放的商業(yè)模式等。
但與此同時，它們其實(shí)都是黃仁勛為了避免英偉達(dá)走向平庸而決定推出的。如果沒有 Shader、CUDA、RTX、DGX 等這些在各自的誕生時間點(diǎn)上顯得“離經(jīng)叛道”的技術(shù)，今天的英偉達(dá)恐怕早已淪為一家普通的顯卡公司，和今天掛著 GeForce 的名號生產(chǎn)顯卡的那些我們耳熟能詳?shù)钠放疲瑳]有多少不同。
4.
英偉達(dá)最近幾年全力投入 AI 技術(shù)的支持，同樣是避免公司走向平庸的結(jié)果。
按黃仁勛的說法，英偉達(dá)公司歷史上幾次具有里程碑意義的關(guān)鍵技術(shù)推出，背后其實(shí)都是對自家 GPU 技術(shù)的發(fā)展成果進(jìn)行了“泛化”(generalize)，然后發(fā)現(xiàn)居然它可以做更多不同的事情。
結(jié)果就是，英偉達(dá)在不斷遷移和泛化 GPU 能力的過程中，建立了一套全新的，基于 GPU 技術(shù)的計算機(jī)科學(xué)架構(gòu)。
而當(dāng)人工智能時代來臨的時候，英偉達(dá)搭建好的這套新架構(gòu)非常適合用來加速深度學(xué)習(xí)方面的任務(wù)。
正是在這樣的條件下，黃仁勛從之前的顯卡大王變成了如今的 “AI教父”。但如果有人以為英偉達(dá)只是碰巧趕上這波 AI 的浪潮，那他就大錯特錯了。
早在十年前，黃仁勛就已經(jīng)相信，圖形計算加速成就了早年的英偉達(dá)那樣，而新時代的英偉達(dá)應(yīng)該全力投入到 AI 計算的加速上，而且沒有別的公司比英偉達(dá)更適合做這件事。
一個最典型的例子就是機(jī)器人 (robotics)。黃仁勛表示：“一個經(jīng)典的機(jī)器人問題，涉及感知、推理、規(guī)劃，以及之后許許多多的不同任務(wù)。這些任務(wù)涉及多個傳感器的大量實(shí)時數(shù)據(jù)；并且出于多元化和冗余的目的，處理器需要用不同的算法進(jìn)行處理?！?/span>這些任務(wù)的特性，正好是英偉達(dá)的 GPU 架構(gòu)所擅長的。
包括 AI、自動駕駛、數(shù)據(jù)中心/高性能計算、超級計算機(jī)、工業(yè)邊緣計算、元宇宙相關(guān)的融合現(xiàn)實(shí)互動技術(shù)等等……現(xiàn)在如果我們?nèi)ビミ_(dá)的網(wǎng)站上，會看到這家公司簡直無所不做，早已不是大部分普通消費(fèi)者用戶所認(rèn)識的那家顯卡公司了。
這些較新的業(yè)務(wù)，都可以被視為英偉達(dá)避免平庸而不斷突破自己邊界的體現(xiàn)。
在采訪中，黃仁勛說自己這一生最大的禮物，就是身邊有著一群世界上最富有才能的同事。而他自己最大的才能，是堅(jiān)韌不拔。
“我堅(jiān)持這條路的時間比其他人都長，但那只是因?yàn)槲矣心托亩?。只要我選定了一條道路，我能夠一直在上面走很長很長的時間。這就是我的耐心?！?/span>

*博客內(nèi)容為網(wǎng)友個人發(fā)布，僅代表博主個人觀點(diǎn)，如有侵權(quán)請聯(lián)系工作人員刪除。

博客專欄

平庸向左，黃仁勛向右

相關(guān)推薦

技術(shù)專區(qū)

博客專欄

平庸向左，黃仁勛向右

相關(guān)推薦

技術(shù)專區(qū)

平庸向左，黃仁勛向右