博客專欄

EEPW首頁 > 博客 > 英偉達(dá)是如何煉成的?

英偉達(dá)是如何煉成的?

發(fā)布人:傳感器技術(shù) 時(shí)間:2022-08-01 來源:工程師 發(fā)布文章

今天,當(dāng)你走進(jìn)顯卡市場,映入眼簾的各類產(chǎn)品大多屬于同一家公司——英偉達(dá)(Nvidia)。砥礪多年,如今的英偉達(dá)赫然在芯片界擁有著無可撼動(dòng)的巨頭地位?;仡櫽ミ_(dá)披荊斬棘的逆襲之路,讓我們回到那個(gè)群雄林立、硝煙四起的精彩年代:


1993年,30歲的黃仁勛與兩位合伙人一起創(chuàng)辦了Nvidia,作為自己的而立之禮。


1995年,Nvidia的第一款芯片NV1四處碰壁,公司只剩下30天的周轉(zhuǎn)資金。


1998年,Nvidia推出RIVA TNT,與當(dāng)時(shí)如日中天的3dfx的Voodoo卡分庭抗禮。


1999年,第一顆GPU——GeForce 256誕生,成為Nvidia在顯卡史上留下的濃墨重彩的一筆。


2000年,Nvidia收購了曾經(jīng)的對手3dfx,憑借著GeForce系列加冕為“顯卡之王”;另一邊,ATI不甘示弱地推出了Radeon DDR,AN對峙拉開序幕。


2006年,經(jīng)過與ATI長達(dá)6年的拉鋸戰(zhàn),Nvidia獲勝,并發(fā)布CUDA架構(gòu),邁向了新的革命進(jìn)程。


十幾年的時(shí)間說長不長,但放在芯片行業(yè)已足夠使滄海變桑田,物轉(zhuǎn)又星移。在一輪輪硝煙彌漫的商業(yè)戰(zhàn)中,對手換了一個(gè)又一個(gè),英偉達(dá)卻始終屹立不倒,不斷書寫著傳奇。


那么,英偉達(dá)是如何在群雄爭霸、變幻莫測的市場中審時(shí)度勢,百煉成鋼的呢?本文將分五個(gè)部分加以分析:


1. 前情概要:從VGA到GPU

2. 首次亮相,出師不利

3. 背水一戰(zhàn),后來居上

4. 定義GPU,對峙ATI

5. 一統(tǒng)天下,發(fā)布革命性CUDA架構(gòu)


01

前情概要:從VGA到GPU



說到顯卡,就不得不提它的由來——VGA Card。最初的顯卡稱為顯示適配器,是不受關(guān)注的電腦主板上的小芯片。隨著人們對PC圖形界面的需求越來越高,顯示適配器的彩色顯示能力大大增強(qiáng),VGA card也從主板上獨(dú)立出來,顯卡這才誕生,但名稱并未固定下來:


VGA Card的第一代產(chǎn)品,是由ATI發(fā)布的 ATI VGA Wonder(圖像顯示卡),它只有輸出圖像功能。


到了第二代,Graphics Card(圖形加速卡)已經(jīng)具備了圖形處理能力,將CPU從大量圖形計(jì)算工作中部分解放了出來,微軟Windows界面運(yùn)行更加流暢。


到了第三代,Video Card(視頻加速卡)具備了視頻輔助解碼功能,此時(shí)仍是ATI主導(dǎo)發(fā)布。


經(jīng)過了單色、彩色、2D、視頻,到了3D時(shí)代,顯卡市場迎來了新局面。1996年,3dfx旗下的Voodoo系列異軍突起。第四代3D加速卡革新了所有PC圖形處理器,也開啟了顯卡史上的“戰(zhàn)國時(shí)代”。


激烈的市場競爭加快了技術(shù)的更迭,1999年,英偉達(dá)發(fā)布了第五代顯卡~GPU(圖形處理器),硬件T&L賦予了GPU更多的圖形計(jì)算能力,顯卡由此上升到了與CPU比肩的高度。


從輸出圖形的微小芯片,到足以與CPU相提并論的圖形處理器,顯卡一步步從邊緣走向舞臺(tái)中心,而英偉達(dá)也是這樣逐步登上圖形市場之巔的。



02

首次亮相,出師不利



英偉達(dá)的故事,要從1993年說起。


那年,剛從斯坦福畢業(yè)兩年的黃仁勛懷揣著雄心壯志,與Curtis Priem和Chris Malachowsky兩位合伙人創(chuàng)辦了Nvidia。英偉達(dá)的初衷是瞄準(zhǔn)3D領(lǐng)域,研發(fā)用于加快游戲中3D圖像渲染速度的專用芯片,以帶來更逼真的顯示效果。


當(dāng)時(shí)的顯卡市場情況并不樂觀,3D技術(shù)蓄勢待發(fā),2D統(tǒng)治力仍然在線。


市面上已有20多家圖形芯片公司,后起之秀層出不窮,市場趨于飽和。同時(shí)段ATI已發(fā)展多年,S3又憑借著出色的2D畫質(zhì),擊敗了對家Trident,盛極一時(shí)。英偉達(dá)所面臨的對手不可謂不強(qiáng)大。


但彼時(shí)的英偉達(dá)初出茅廬,工程師們一腔熱血,潛心打磨了兩年,終于推出了第一款面向游戲主機(jī)的圖形卡芯片NV1。然而,這樣一款被寄予厚望的匠心之作,卻差點(diǎn)將英偉達(dá)扼殺在搖籃里。


英偉達(dá)為什么出師不利?其根本原因還是顯卡與API的適配性出了問題。


電腦由不同硬件組成,由軟件發(fā)布指令驅(qū)動(dòng)硬件完成相應(yīng)工作。顯卡作為重要的硬件,其設(shè)計(jì)必然要能夠執(zhí)行軟件的指令,而連接顯卡與軟件的重要環(huán)節(jié)就是圖形API。


圖形API是一個(gè)大量底層圖形指令的集合,軟件只需將自己所要進(jìn)行的工作表達(dá)成特定的函數(shù),進(jìn)而根據(jù)API中規(guī)定好的指令功能設(shè)定出函數(shù)的執(zhí)行和指令的調(diào)用方式,便可以調(diào)用硬件來執(zhí)行這些函數(shù),完成圖形的表達(dá)工作。而被調(diào)用的硬件,即顯卡,其設(shè)計(jì)則需要遵循API的需求。因此,顯卡的實(shí)際性能表現(xiàn)是由其與API的契合度決定的。


英偉達(dá)在NV1的設(shè)計(jì)上,集成了最大最全的游戲方案,迥異于市面上的所有其他芯片產(chǎn)品。NV1不僅同時(shí)支持2D、3D處理能力,還擁有當(dāng)時(shí)流行的音頻處理能力,按理來說性能應(yīng)該很能打。


然而,英偉達(dá)選擇了方形繪圖來實(shí)現(xiàn)游戲的的3D效果,它能讓NV1用更少的計(jì)算量來顯示更光滑的3D物體。


事不湊巧,在NV1發(fā)布的同一年,微軟開發(fā)出了采用多邊形成像技術(shù)的圖形編程接口——Direct3D標(biāo)準(zhǔn),加上此前SGL發(fā)布的OpenGL,兩者都是采取三角形繪圖渲染。


NV1采取的非主流設(shè)計(jì),使它既不支持 OpenGL標(biāo)準(zhǔn),也不支持后來的 direct X 標(biāo)準(zhǔn)。與主流的API標(biāo)準(zhǔn)相悖,意味著NV1完全無法兼容行業(yè)通用標(biāo)準(zhǔn)。


此外,NV1身兼眾多功能,這也使開發(fā)成本居高不下,產(chǎn)品最終的售價(jià)高達(dá)399美元,是同期其他同類產(chǎn)品價(jià)格的兩倍。價(jià)格過高和需求不匹的雙重壓力下,NV1競爭優(yōu)勢并不突出,銷量冷淡。


產(chǎn)品剛面世就跌了個(gè)大跟頭,英偉達(dá)舉步維艱,運(yùn)營資金一度只能維持公司運(yùn)轉(zhuǎn)30天。


縱使NV1讓英偉達(dá)開局不利,但它讓游戲?qū)么罄惺兰慰吹搅擞ミ_(dá)的技術(shù)潛力。關(guān)鍵時(shí)刻,世嘉將瀕危的英偉達(dá)拉上了岸。


圖片


游戲機(jī)與PC不同,有自己的API,而且英偉達(dá)集成 2D 和聲卡的做法也很適合游戲機(jī)。世嘉要求調(diào)整 NV1 的架構(gòu),并用在土星游戲機(jī)上,隨后成為了NV1芯片的最大客戶。NV1有了用武之地,終于可以大展身手。


有了第一次合作之后,世嘉又找到了英偉達(dá),希望他們來做下一代主機(jī)dream cast的顯示芯片,但英偉達(dá)沒有抓住這個(gè)機(jī)會(huì)。在幫助世嘉開發(fā)NV2的時(shí)候,英偉達(dá)堅(jiān)持基于方形繪圖的設(shè)計(jì)理念與世嘉產(chǎn)生分歧,雙方的合作就此中止。


與世嘉合作破裂,研發(fā)中的 NV2 芯片也因此流產(chǎn),但世嘉提供的700萬美元開發(fā)資助并未收回,這也成為了英偉達(dá)的救命稻草??恐@700萬美金,英偉達(dá)終于摸到了市場的脈象。



03

背水一戰(zhàn),后來居上



頭兩次的失敗給初生的牛犢狠狠澆了兩盆水。英偉達(dá)終于意識(shí)到,自己首先是一家公司,其次才是一家技術(shù)公司。閉門造車能夠成功的前提是出門合轍,衡量硬件開發(fā)成功的標(biāo)尺握在軟件的手里。


1997年,英偉達(dá)推出全球首款128位3D處理器riva128。riva128使用了三角形繪圖,加入了 OpenGL 和 Direct X 等主流 API 的支持。它也是當(dāng)時(shí)最早的支持AGP1x規(guī)范的顯示芯片之一。此外,riva128采用了當(dāng)時(shí)最新的NV3核心,頻率能達(dá)到100MHz,制造工藝350nm,晶體管數(shù)量300萬。


憑借低廉的價(jià)格與高性能的2D/3D加速,riva128迅速獲得設(shè)備制造商(OEM)的認(rèn)可。1997年底,Dell、Gateway和Micron相繼使用了riva 128。零售市場上,Diamond、STB、ASUS、ELSA和Canopus等也都相繼推出了基于riva128的產(chǎn)品。


riva128在前四個(gè)月內(nèi)出貨量突破100萬臺(tái),這一成功為英偉達(dá)積聚了足夠的資金發(fā)展后續(xù)產(chǎn)品,也讓英偉達(dá)得以進(jìn)一步挑戰(zhàn)當(dāng)時(shí)的市場霸主——3dfx。


1996年,3dfx公司推出Voodoo圖形芯片組。Voodoo是一款為游戲玩家量身定制的產(chǎn)品,專注于3D加速卡, 并支持D3D和OpenGL。Voodoo是一塊3D子卡,需要配合2D顯卡才能工作,但它可以跑出非常驚艷的 3D 畫面。


而英偉達(dá)的riva 128,顯示核心最大僅僅支持4MB顯存,3D分辨率只有800x600,在總體性能上與Voodoo仍有一定差距。


當(dāng)時(shí)的顯卡市場,可謂是3dfx一枝獨(dú)秀。在Voodoo統(tǒng)治市場的鼎盛時(shí)期,3dfx占據(jù)了3D加速器市場80-85%的份額。


為什么Voodoo會(huì)如此受市場追捧呢?原因離不開它獨(dú)有的 API——Glide。


Glide是專為Voodoo卡打造的底層API,使得Voodoo無須硬件廠商額外提供API就可以直接開發(fā)游戲。在當(dāng)時(shí),Glide被公認(rèn)為最好的3D接口程序,具有超高的易用性和穩(wěn)定性。


由于Glide免費(fèi)授權(quán),90年代后期的絕大部分頂級游戲都支持Glide,比如極品飛車、雷神之錘系列等。當(dāng)時(shí)的 PC 游戲也掀起一股 “Glide” 熱潮,即使價(jià)格遠(yuǎn)高于同時(shí)期的riva128,不少人依然愿意花高價(jià)選擇Voodoo。


1997 年 11 月,3dfx推出Voodoo2。Voodoo2性能暴增,它的像素單元從一組升級到了兩組,頻率從 50 兆提高到了 90 兆。


此外,Voodoo2 還有一個(gè)殺手锏——SLI。憑借SLI,機(jī)器可以插入兩張Voodoo2,獲得成倍的性能提升。在那個(gè)平均工資都只有 600 塊的時(shí)代,一張Voodoo2的價(jià)格就一度高達(dá) 3000元。加上初代Voodoo的成功,不斷有游戲廠商尋求合作,最終Voodoo2成為了 3 dfx 最成功的一款產(chǎn)品。


面對強(qiáng)勢的3dfx,英偉達(dá)緊追不舍。


1998 年,英偉達(dá)推出TNT,與 Voodoo2競爭市場。相比 riva 128,TNT像素渲染管線增加到了兩根,與此同時(shí),TNT也加入了 32 位色深的支持,相比同期只支持 16 位的Voodoo2,性能大幅提升,成為當(dāng)時(shí)速度最快的3D加速卡。


但由于0.25微米制程在當(dāng)時(shí)沒有完善,英偉達(dá)只好采用0.35微米制程,TNT也只能在90MHz下工作,實(shí)際上,TNT 性能未能趕超Voodoo2,而是互有勝負(fù)。


好在,英偉達(dá)的渠道廣,贏得了各大 OEM 廠商、板卡廠商的信任。在各大廠商的幫忙之下,英偉達(dá)扭虧為盈,站上了與3dfx爭霸的擂臺(tái)。


圖片


那么英偉達(dá)又是如何擊敗當(dāng)時(shí)的巨頭3dfx呢?


在科技的比拼中,實(shí)力永遠(yuǎn)是制勝的第一位。而在瞬息萬變的芯片行業(yè),創(chuàng)新與質(zhì)量便是實(shí)力的代名詞。


隨著微軟Direct X的更新完善,3dfx引以為傲的獨(dú)家API Glide在功能和效率上卻仍在原地踏步,因此逐漸失去了游戲開發(fā)商的青睞。到了1999年,大量游戲開始轉(zhuǎn)投Direct X和OpenGL。直到2000年12月,3dfx才宣布其Glide專有圖形API以開源形式提供。


除了在圖形API方面固步自封,3dfx的第二個(gè)問題出在代工廠。


為了在激烈戰(zhàn)局中維持利潤,3dfx于1998年收購了一線板卡廠商STB。但該公司使用的代工廠,與臺(tái)積電以及聯(lián)華電子相比,質(zhì)量和生產(chǎn)成本都完全沒有競爭力。


此外,在團(tuán)結(jié)產(chǎn)業(yè)鏈方面,3dfx也犯了大錯(cuò)。由于收購STB,3dfx放棄了其他板卡廠商并收回芯片授權(quán),自己生產(chǎn)顯卡。這一舉動(dòng)激怒了技嘉,帝盟等一眾板卡制造商,它們紛紛轉(zhuǎn)投英偉達(dá)的懷抱。


無獨(dú)有偶,在此前的1997年,3dfx就因上市需要公開資料,將世嘉DC的詳細(xì)參數(shù)公布于眾,導(dǎo)致違約,兩家對簿公堂,最終世嘉終止與3dfx的合作。


昏招迭出之下,3dfx后續(xù)推出的Voodoo3沒能履行其架構(gòu)和功能設(shè)置的承諾。


反觀同期英偉達(dá)的riva TNT2,則采用了臺(tái)積電的250nm工藝,并提供了最初的TNT所希望的性能,全面勝過了Voodoo 3。


圖片


因而,到了1999年初,英偉達(dá)與3dfx的爭霸賽逐漸沒有了懸念,隨著下半年英偉達(dá)向市場投以重磅炸彈,顯卡市場開啟了“楚漢爭雄”階段。



04

定義GPU,對峙ATI



1999年10月1日,紛爭不斷的顯卡市場響起了一記驚雷。


英偉達(dá)發(fā)布了GeForce 256 SDR,這是一款基于臺(tái)積電220納米工藝、集成了2300萬個(gè)晶體管的芯片,是世界上第一顆 GPU(圖形處理器)。


GeForce 256第一次在顯卡中加入了硬件T&L,即transforming&lighting(坐標(biāo)轉(zhuǎn)換和光照計(jì)算),能夠進(jìn)行大量浮點(diǎn)運(yùn)算,從而將原本依賴于CPU的3D計(jì)算剝離到顯卡上,釋放了大量CPU資源,在使得游戲運(yùn)行更流暢的同時(shí),也大幅提高了畫面的精細(xì)度。


顯卡的地位隨著GPU時(shí)代到來而大大提高,成為了游戲電腦中最核心的硬件。


此外,GeForce 256 也是史上第一款256位的顯卡,帶來了有史以來最大的一次性能提升。首發(fā)的SDR版本相比TNT2只過去了半年,性能卻有60%的提升,兩個(gè)月后發(fā)布的DDR版本又在SDR版的基礎(chǔ)上提升了30%的性能。


英偉達(dá)憑借著GeForce 256這張卡皇領(lǐng)先的T&L引擎和翻倍的性能,打得各路對手不知所措。在臺(tái)式機(jī)版本上市一個(gè)月后,英偉達(dá)宣布了他們第一個(gè)適用于專業(yè)工作站的產(chǎn)品——Quadro,即基于GeForce 256的SGI VPro V3和VR3。


2000年12月25日,英偉達(dá)以 7000 萬美元外加 100 萬股股****,總計(jì) 1.1 億美元的價(jià)格收購了 3 dfx 的資產(chǎn)和專利,此時(shí)放眼市場,能夠與英偉達(dá)一戰(zhàn)的只剩下了ATI。


圖片


當(dāng)年,英偉達(dá)的利潤為4100萬美元,是1998年的十倍,相比老牌巨頭ATI的1.6億美元,雖仍有一段距離,但這股增長的勁頭不容小覷。


英偉達(dá)過關(guān)斬將,終于在世紀(jì)之交與ATI展開了正面對決,而這場拉鋸戰(zhàn)一打就是六年。


英偉達(dá)的GeForce 256為其帶來了無限榮耀,隨后發(fā)布的繼任者GeForce 2 GTS又將上一代的性能大幅提升。在英偉達(dá)的步步緊逼下,ATI決定放手一搏,建立一條全新的游戲產(chǎn)品線。


2000年8月,全世界第一張Radeon顯卡上市了,它就是Radeon DDR,ATI宣稱其為“有史以來為臺(tái)式PC設(shè)計(jì)的最強(qiáng)大的圖形處理器”,ATI也憑借其卓越的T&L性能和對即將推出的Direct X 8的支持而勉強(qiáng)追上了英偉達(dá)的步伐,暫且保住了圖形市場份額第一的位置。


但反攻也隨之到來。


英偉達(dá)于2001年2月27日發(fā)布了GeForce 3,給GPU帶來了一項(xiàng)突破性的改變——可編程頂點(diǎn)著色器,用于更緊密地控制多邊形網(wǎng)格運(yùn)動(dòng)和更流暢的動(dòng)畫序列,大大改進(jìn)了傳統(tǒng)的GPU工作流程。


微軟隨后推出的Direct X(dx) 8第一次引入了Shader model的概念,制定了可編程著色器的標(biāo)準(zhǔn),使得GeForce 3成為了超高分辨率下的視覺王者。


但由于支持Shader model的游戲當(dāng)時(shí)尚未推出,GeForce 3最初的表現(xiàn)并不出眾,這就使ATI有了喘息之機(jī)。


ATI在2001年10月推出了新一代的旗艦顯卡,Radeon 8500,搭載了大幅改進(jìn)過的R200 GPU,并首次支持到 dx 8.1,領(lǐng)先于GeForce 3的dx 8,性能幾乎達(dá)到前一代Radeon DDR 的2.5倍。同時(shí),Radeon 8500還帶來了其他先進(jìn)技術(shù),令微軟也對ATI另眼相看。


在GF3系列的低時(shí)鐘Ti 200和超頻Ti 500型號的前后夾擊下,Radeon 8500表現(xiàn)依然不俗,A卡從這時(shí)打響了“驅(qū)動(dòng)戰(zhàn)未來”的名號。


然而,N卡的市占率并沒有受到太大影響,這要?dú)w功于英偉達(dá)對產(chǎn)品線的部署。


早在256時(shí)期,英偉達(dá)就通過DDR、SDR和TNT三個(gè)系列實(shí)現(xiàn)了高中低端全面布局,再到GeForce 2時(shí)期的旗艦版GeForce 2 ultra、高端GeForce 2 Ti、甜品GeForce 2 Pro、中端GeForce 2 gts 和 低端的GeForce 2 MX,覆蓋了顯卡市場的每個(gè)死角,只有消費(fèi)者想不到,沒有英偉達(dá)賣不到。


至此,英偉達(dá)控制了32%的圖形市場,ATI為19%。


Nvidia在2002年2月發(fā)布了GeForce 4,從MX系列到高性能的Titanium系列(Ti 4400和Ti 4600),加上基于TSMC的150nm工藝,全方位滿足不同消費(fèi)者對性能和性價(jià)比的需求。


面對GeForce 4出色的銷量,ATI破釜沉舟,選擇放棄R200的舊架構(gòu),用時(shí)一年打造出了R300,即Radeon 9700 Pro,這也成為A卡最高光的時(shí)刻。


Radeon 9700 Pro有許多“第一”的光環(huán):全球第一款支持DX 9和SM(Shader model)2.0,全球第一款使用AGP 8倍速接口,全球第一款配備256bit位寬的128 MB DDR顯存……這枚顯卡的核心里包含1.07億個(gè)晶體管,能夠完成DX 9的海量浮點(diǎn)運(yùn)算,還支持高級渲染器語言HLSL,在畫面效果大幅飛躍的同時(shí)還降低了開發(fā)難度。


與R300相比,GeForce 4的性能遭到全面碾壓,即使是高端的Ti 4600,很多游戲運(yùn)行起來也落后R300一倍以上。R300標(biāo)著和Ti4600相同的定價(jià),提供的卻是翻倍的性能,自然廣受游戲廠商的歡迎。


面對ATI的逆風(fēng)翻盤,英偉達(dá)這一次沒有給出及格的反應(yīng)。


在錯(cuò)過了微軟DX 9架構(gòu)確立的消息后,英偉達(dá)推出的FX系列由于兼容問題和高溫自燃事故全面崩盤。


曾經(jīng)的手下敗將3dfx在搬到英偉達(dá)之后終于實(shí)現(xiàn)了復(fù)仇,交出了糟糕的NV30圖形芯片——臭名昭著的“吸塵器”FX 5800和速度較慢的FX 5800 Ultra,甚至還落后于預(yù)定期限,更別提追上ATI了。


在這一回合里,ATI始終憑借著優(yōu)越的驅(qū)動(dòng)程序保持領(lǐng)先,市場的天平開始向A卡傾斜。于是英偉達(dá)痛定思痛,迅速投入了下一代DX9.0c 顯卡的研發(fā)。


功夫不負(fù)有心人,2004年英偉達(dá)又向沉寂許久的顯卡市場投下了一顆重磅炸彈——GeForce 6800 Ultra(NV40),首次支持Direct X 9.0c、SM 3.0,疊加Nvidia的PureVideo解碼和播放引擎,還引入了SLI技術(shù),即允許多個(gè)GPU連接在一起,從而顯著提升單臺(tái)機(jī)器的圖形處理能力。


另一邊,ATI僅在一個(gè)月后就拿出了R400c 應(yīng)對,但只是沿用R300的架構(gòu),并不支持DX 9.0c、SM 3.0。


2005年,英偉達(dá)與ATI繼續(xù)交錯(cuò)發(fā)布新產(chǎn)品,戰(zhàn)況激烈。ATI的年度收入達(dá)到22億美元,創(chuàng)下公司歷史最高紀(jì)錄。然而,凈利潤卻下滑至1,690萬美元,這是受累于加速迭代產(chǎn)品和高額的研發(fā)費(fèi)用。光靠ATI的力量已經(jīng)無力再與英偉達(dá)競爭。


2006年10月25日,ATI被CPU巨頭AMD收購,AMD因此背負(fù)了巨額債務(wù)。


負(fù)債累累的AMD在CPU方面應(yīng)戰(zhàn)英特爾,在GPU方面應(yīng)戰(zhàn)英偉達(dá),不同的強(qiáng)敵使其一時(shí)難以招架,隨之帶來市場份額下滑與顯卡發(fā)布延期,這就給英偉達(dá)創(chuàng)造了寬松的發(fā)展空間,使其進(jìn)一步搶占了更多的市場份額。


AN爭霸戰(zhàn),終于以英偉達(dá)的勝利告終。



05

一統(tǒng)天下,發(fā)布革命性CUDA架構(gòu)



隨著顯卡大戰(zhàn)走向終結(jié),GPU的發(fā)展也迎來了一個(gè)轉(zhuǎn)折點(diǎn)。


在當(dāng)時(shí),英特爾的CPU可以通過多線程技術(shù)被所有計(jì)算機(jī)應(yīng)用分享,但GPU還只能通過OpenGL/Direct X等接口跟用戶交互。到了2005年,主要的GPU制造商都使用頂點(diǎn)著色單元和像素渲染單元兩種計(jì)算資源。然而,合理配置這兩種資源的問題卻始終沒有得到完美解決。特別是兩種處理器數(shù)量的最佳比例是隨應(yīng)用的變化而變化的,因此經(jīng)常出現(xiàn)一種處理器不夠用、而另一種處理器閑置的情況,這就限制了高性能運(yùn)算技術(shù)的發(fā)展。


雖然當(dāng)時(shí)英偉達(dá)的傳統(tǒng)游戲和專業(yè)繪圖業(yè)務(wù)并沒有這樣的高性能運(yùn)算需求,英偉達(dá)首席科學(xué)家David Kirk卻認(rèn)為,從長遠(yuǎn)看,讓原本只做3D渲染的GPU技術(shù)通用化,有重大戰(zhàn)略意義。


如果能夠給GPU裝備一組完全相同的、具有較強(qiáng)編程能力的內(nèi)核,根據(jù)任務(wù)情況在頂點(diǎn)和片元處理任務(wù)之間動(dòng)態(tài)分配,問題就會(huì)被完美地解決了,而這套編程體系正是著名的CUDA(Compute Unified Device Architecture)技術(shù)。


David Kirk最終說服黃仁勛,投入大量資源研發(fā)能夠讓GPU變得通用化的CUDA技術(shù),并讓每一顆英偉達(dá)GPU都支持CUDA。這一舉動(dòng)在當(dāng)時(shí)被視為不計(jì)成本的瘋狂之舉,絕對是一場****上全部身家的押注。


在技術(shù)方面,芯片面積增大、散熱增加、成本上升、故障率增高;同時(shí),還要保證每款產(chǎn)品的軟件驅(qū)動(dòng)都支持CUDA,這對英偉達(dá)的工程師來說是巨大的工作量。


在資金方面,一旦項(xiàng)目啟動(dòng),每年砸到CUDA的研發(fā)成本估算就有5億美元,而當(dāng)時(shí)公司全年的總收入約30億美元。更何況,在當(dāng)時(shí)CUDA只是一個(gè)與公司核心業(yè)務(wù)關(guān)系不緊密的軟件平臺(tái)。最后來看,自CUDA推出以來,英偉達(dá)在將GPU轉(zhuǎn)化為更通用的計(jì)算工具上投入了將近100億美元。


從G80開始,英偉達(dá)GPU體系結(jié)構(gòu)已經(jīng)全面支持通用編程,同時(shí)英偉達(dá)也推出了CUDA編程技術(shù),為GPU通用程序設(shè)計(jì)提供了第一套完整工具。在G80之后,英偉達(dá)又推出G90、Fermi、Kepler和Maxwell等多代GPU,其通用計(jì)算能力越來越強(qiáng)大。


圖片

NVIDIA G80體系結(jié)構(gòu)


而此時(shí),計(jì)算行業(yè)也正在發(fā)生著變革,摩爾定律帶來的計(jì)算提升速度正在放緩,這也讓當(dāng)初借此統(tǒng)治芯片市場的英特爾地位發(fā)生動(dòng)搖。諸多芯片設(shè)計(jì)公司試圖從無到有打造更專業(yè)的芯片,并讓該類芯片與英特爾處理器一同運(yùn)行。


英偉達(dá)不需要從頭做起,只要重新定位已有的芯片,利用在CUDA項(xiàng)目中開發(fā)的芯片和軟件,就打造出一個(gè)廣受程序員和企業(yè)歡迎的技術(shù)平臺(tái)。


芯片戰(zhàn)爭還在繼續(xù)。


在AI領(lǐng)域,芯片制造商之間的斗爭才剛開始。英特爾接連重金收購了可編程芯片制造商Altera、專注于研究深度學(xué)習(xí)和機(jī)器視覺的其他創(chuàng)業(yè)公司、還有為汽車生產(chǎn)自動(dòng)駕駛設(shè)備的以色列公司Mobileye。谷歌也在自研人工智能芯片,在TPU的助力下,谷歌在圍棋比賽中擊敗了世界冠軍柯潔。


但無論是誰,都無法在通用計(jì)算領(lǐng)域真正與英偉達(dá)爭雄。



06

尾聲



分久必合,合久必分。經(jīng)歷了戰(zhàn)國混戰(zhàn)、楚漢爭雄,英偉達(dá)成為顯卡市場毋庸置疑的統(tǒng)治者。


但英偉達(dá)一路上的挫折實(shí)在不少,黃仁勛也不是一個(gè)全知全能的創(chuàng)業(yè)者。創(chuàng)業(yè)初期執(zhí)意用方形繪圖的技術(shù)路線,追求盡善盡美的全能產(chǎn)品定義,都是英偉達(dá)曾經(jīng)犯過的致命錯(cuò)誤。但是,好在黃仁勛懸崖勒馬,在存亡危急之秋力挽狂瀾,最終成長為一個(gè)在商業(yè)上高度理性、卻又保持積極進(jìn)取、知道犯錯(cuò)就打臉改正的企業(yè)家。


而英偉達(dá)一路崛起和升級打怪的關(guān)鍵,在于敏銳把握商業(yè)環(huán)境中的關(guān)鍵變量,永遠(yuǎn)比對手先行一步。


正是在世紀(jì)之交的顯卡大戰(zhàn)中,黃仁勛天才般地聚集了GPU行業(yè)成功所需的核心要素:


在圖形API上,英偉達(dá)開放擁抱direct x和OpenGL,摒棄閉門造車的陋習(xí);


在產(chǎn)品定義上,英偉達(dá)率先將硬件T&L等功能從CPU解放出來,重新定義了GPU,并逐漸修煉出嫻熟的刀法,為不同的人群和市場定位出高、中、低端產(chǎn)品,最大化市場收益;


在技術(shù)路線上,英偉達(dá)廣泛吸取業(yè)界的前瞻性概念并加以激進(jìn)實(shí)現(xiàn),率先支持shader model和發(fā)布CUDA,都是無與倫比的杰作;


在晶圓代工上,英偉達(dá)與臺(tái)積電結(jié)成了牢固的同盟,由此開始了長達(dá)二十多年的戰(zhàn)斗友誼,產(chǎn)業(yè)鏈上游始終穩(wěn)如磐石;


在板卡和OEM廠商上,英偉達(dá)團(tuán)結(jié)了最多的產(chǎn)業(yè)鏈下游,鞏固了市場渠道。


在劇烈動(dòng)蕩的芯片市場,黃仁勛在混沌變化的環(huán)境中建立了全面穩(wěn)固的支撐,英偉達(dá)的創(chuàng)新冒險(xiǎn)也由此變得不再那么高風(fēng)險(xiǎn)而致命,而是可以一步一步,搭建起通往通用計(jì)算的天梯,完成對計(jì)算世界的整合。


英偉達(dá)的神話至今還在延續(xù)。太平洋西岸的中國,一場對標(biāo)英偉達(dá)的創(chuàng)業(yè)潮徐徐拉開了帷幕。


那么,誰能成為中國的英偉達(dá)呢?


來源:遠(yuǎn)川科技評論


*博客內(nèi)容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀點(diǎn),如有侵權(quán)請聯(lián)系工作人員刪除。

功分器相關(guān)文章:功分器原理


關(guān)鍵詞: 英偉達(dá)

相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉