英偉達的進化之路:從電子游戲到人工智能
“深度學習幾乎和大腦一樣”,黃仁勛說:“它非常有用,你可以教會他幾乎所有事情。但是它有一個非常大的壁壘,那就是它需要大量的計算。而我們的GPU具備這樣的計算能力,是深度學習計算模型的理想選擇?!?/p>本文引用地址:http://butianyuan.cn/article/201612/341844.htm
深度學習發(fā)展史具有里程碑意義的事件發(fā)生在2010年帕羅奧圖的一家日本餐館,在這里,斯坦福的軟件語言學教授吳恩達(Andrew Ng)會見了Google 當時的 CEO 拉里·佩奇和塞巴斯蒂安·特倫(Sebastian Thrun)。塞巴斯蒂安·特倫是一位才華洋溢的計算機科學家,后來成為了Google X實驗室的負責人。早在2008年吳恩達就發(fā)表了一篇關于將GPU運用到深度學習模型的學術文章。“深度學習在2008年還不常見”,吳恩達說:“當時的風氣是寫出花哨的算法?!?/p>
特倫開發(fā)了最早一批的自動駕駛車,在斯坦福他和吳恩達的辦公室只有一墻之隔,這兩位科學家共同選擇了在Google建立一個深度學習研究團隊。這樣的選擇是有道理的:Google有大量的計算基礎設施,這對于搭建世界上最大的神經網絡來說是再好不過的了。佩奇同意了他們的想法,Google Brain就這樣誕生了。Google Brain產出的深度學習幾乎滲透到了Google的每一個產品里,尤其是搜索、語音識別和圖像識別。
在谷歌開始開發(fā)Google Brain的同時,相隔2500英里以外的另一只研究團隊也在搗鼓著深層學習。2012年,當時還是多倫多大學博士研究生的Alex Krizhevsky向ImageNet大賽提交了他出色的研究成果。全球各地的參賽者都可以向ImageNet大賽提交自己的軟件,比賽內容是軟件對圖像中的物件和場景識別的精準度。Alex Krizhevsky在自己的房間里用兩塊英偉達GeForce游戲芯片開發(fā)出了他的深度學習神經網絡系統(tǒng),他向其中導入了120萬張圖片來訓練其深度學習模型。他開發(fā)的這套模型所達到的圖像識別準確度是前所未有的,錯誤率只有15%——對于以前25%的錯誤率來說是巨大的進步。Alex Krizhevsky的研究成果不僅贏得了當年的ImageNet大賽還立刻在學術界引起了巨大的反響。(Alex Krizhevsky和他以前在多倫多大學的教授現在都在Google工作。)
有了這樣的進步以后,深層學習開始以野火般的趨勢推展開來。除了谷歌以外,微軟、Facebook和亞馬遜也開始著手富有前瞻性的深層學習項目。英偉達加大了對CUDA基礎軟件生態(tài)系統(tǒng)的投資,這一決定成為了推動這一場變革的關鍵助因?!斑@需要多年投入大量資金,”英偉達CUDA開發(fā)團隊領頭人Ian Buck說:“我們現在正在從多年前這筆富有遠見的投資中收獲果實,這是黃仁勛多年來一直的承諾?!?/p>
基于深層學習,英偉達持續(xù)優(yōu)化其硬件。英偉達將8片最新發(fā)布的服務器芯片Tesla P100集裝在一個三英尺長五英寸厚的長方形容器中,英偉達將這個容器命名為DGX-1并號稱其是“世界上第一臺盒子里的AI”。這臺售價130,000美金的機器的計算速度達到了每秒170萬億次( teraflop),這相當于250臺傳統(tǒng)服務器的計算速度。今年8月,黃仁勛親自將第一臺DGX-1送給Elon Musk,Elon Musk在舊金山運營了一個名為OpenAI的非營利AI項目。
黃仁勛的競爭意識在他早年就顯現出來了。黃仁勛于1963年出生在臺灣,在他10歲那年,他的父母還在辦理移民手續(xù),他被送到肯塔基州東部偏遠地區(qū)的寄宿學校上學,在那里度過了糟糕的青春時光。當時那里環(huán)境惡劣,他的室友是比他年長7歲,身上有7處刀傷的男生。黃仁勛找到了自己的情緒出口,他迷上了乒乓球。1978年,15歲那年,他在美國乒乓球公開賽中奪得了青年組雙人季軍。
黃仁勛在高中時又迷上了計算機,后來在俄勒岡州立大學(Oregon State University)學習計算機科學及芯片設計。在那里,他還遇見了他的老婆Lori。畢業(yè)以后,他們搬到了硅谷,在這里黃仁勛的第一份工作是在Intel的對手AMD那里設計處理器芯片。同時,他繼續(xù)進修學習,在1992年,他在斯坦福取得了電氣工學學碩士學位。接下來,他就在芯片制造商LSI Corp.遇見了Malachowsky和Priem,當時Malachowsky和Priem都還在Sun Microsystems工作。
他們三個想創(chuàng)辦一家圖像處理芯片公司時,黃仁勛才剛滿30歲。他們在早期圖像處理中看到了可以帶來進步的巨大機遇,他們的產品后來也成功的運用在了PC上。
英偉達在1995年發(fā)布了第一代芯片NV1,耗費了1千萬美金開發(fā)費,這筆錢由紅杉資本和Sutter Hill Ventures提供。英偉達設想NV1可以在很多場景下使用,但不幸的是消費者并不買單。當時英偉達才剛建立起來兩年,瀕臨破產,他們被迫解雇了幾乎一半的員工,最后留下了40人。他們于1997年發(fā)布的第三代芯片RIVA128終于取得了成功。RIVA128的速度比其他圖形處理器快4倍,公司的危機也由此解除了。
在接下來一二十年里,各廠商都在不斷打破處理速度記錄,這已成為該行業(yè)和英偉達的常態(tài)。但是當時的70家GPU公司現在還存在的只有英偉達和AMD了。
在當時,黃仁勛就成功地打造了愉快的工作氛圍,這呼應了該公司在Just 100榜單上的排名。他一直心系員工。在2015年的一場關于工作環(huán)境多樣化的會議上,他和一群英偉達女員工聊后發(fā)現了她們不能在事業(yè)上更上一層的原因。其中很重要的一點就是產假。黃仁勛決心改善這一狀況?,F在英偉達的員工可以休22周的帶薪產假,另外還有8周的彈性時間作為回歸過渡期。
黃仁勛將員工的幸福都歸功于英偉達所做的事業(yè)。進入深沉學習這樣的領域也為整個工作氛圍注入了新的活力。“工作必須能夠給整個社會帶來價值。我們希望我們的工作可以改進癌癥的早期發(fā)現和診斷。這多么美妙啊!”
英偉達的成功并不是沒有人注意到,幾乎所有的大型芯片商都突然開始追尋AI夢了,同時也有大量的初創(chuàng)公司開始開發(fā)架構新型的深層學習芯片。開始躁動的不僅是芯片制造商。未來科技業(yè)中,深層學習至關重要,因此英偉達最重要的客戶Google現在也開始制造芯片了,成了其競爭對手。Google在此之前從未制造過芯片。
Google在5月的開發(fā)者大會上宣布已經搭建好了一款名為Tensor Processor Unit的定制芯片,該芯片專為其深層學習框架TensorFlow制造。Google表示已經在其數據中心中使用此芯片以改善其地圖服務和優(yōu)化搜索結果。
無獨有偶,英偉達的另一客戶微軟現在也開始為自己的數據中心開發(fā)制造芯片,該定制芯片被命名為FPGA,量產后,該芯片可以被重新編碼,對于AI app來說十分有利。
半導體行業(yè)的領軍人物英特爾似乎尤其懼怕英偉達的進步。在錯過了智能手機的浪潮以后,它不能再錯過深層學習的浪潮了。英特爾沒有先進的AI研究,于是選擇了瘋狂收購。英特爾最近買進了兩家AI初創(chuàng)公司:在8月以4億多美金購入了Nervana,接下來還會收購Movidius,該筆收購還暫未披露任何報價。去年英特爾還豪擲160億美金購入了FPGA制造商Altera。
英特爾非常注重維護其收入來源——數據中心。英特爾以壟斷地位占據了該市場幾乎99%的市場份額。英偉達現有的芯片還不能替代英特爾的處理器,英特爾的處理器速度仍然更勝一籌。但是英特爾更想的是它的客戶們都只用它的產品。因此,英特爾計劃在2017年發(fā)布一款為深層學習優(yōu)化的服務器芯片——新一代Xeon Phi處理器。英特爾高調的宣布,有了從Nervana購入的技術,該公司可以在2020年之前將現有的深層學習網絡速度提高100倍。
英偉達的優(yōu)勢是它早于英特爾,AMD及其他對手在深層學習領域開展業(yè)務。但是它也不能松懈。多年來,它在該領域一枝獨秀,但是現在市場涌入了更多競爭者了。“我認為英偉達所處的位置非常好,形勢對他們非常有利,但是我還是不能保證他們會怎么樣,”資深科技分析家 Jon Peddie說到,“有太多人對這個市場虎視眈眈了。”
“AI 計算是計算機的未來,”黃仁勛說:“只要我們繼續(xù)保持著最優(yōu)AI計算平臺的位置,我認為我們可以獲得大量業(yè)務。最終,GPU會存在于每一個公司?!?/p>
黃仁勛沿襲了曾長期執(zhí)掌英特爾的Andy Grove 在其90年代的暢銷書《只有偏執(zhí)狂才能生存》(Only the Paranoid Survive)中的哲學理念。
“我一直都假設我們30天以后就沒有業(yè)務了,”黃仁勛說:“這從來沒有變過。這不是害怕失敗,這是害怕自滿,我不想在心中為自滿留下一點點位置。”
評論