新聞中心

EEPW首頁 > 智能計(jì)算 > 業(yè)界動態(tài) > AI芯片大戰(zhàn)格局解讀:這場三國殺有點(diǎn)熱鬧

AI芯片大戰(zhàn)格局解讀:這場三國殺有點(diǎn)熱鬧

作者: 時間:2017-05-16 來源:億歐網(wǎng) 收藏
編者按:眼看著英偉達(dá)在這人工智能的浪潮中一騎絕塵,它的技術(shù)到底能有多厲害?難道其他芯片巨頭就真的在吃干飯嗎?

  的無人車在美國開了幾十萬公里,通過訓(xùn)練練出一個自動駕駛的模型。這個模型訓(xùn)練出來之后,未來可以部署到每一臺量產(chǎn)的無人車,實(shí)現(xiàn)自動駕駛。在自動駕駛中,這個模型就必須實(shí)時進(jìn)行推斷。

本文引用地址:http://www.butianyuan.cn/article/201705/359223.htm

  英偉達(dá)Q1的財(cái)報發(fā)布后幾小時,股價就暴漲14%。

  老黃的Keynote還沒講完,英偉達(dá)市值就被推高20%,突破700億美元。

  華爾街瘋狂的背后,是人工智能的大潮,與推動這一大潮的全新技術(shù)。

  英偉達(dá)最新的GPU芯片——TeslaV100及其TensorCore,必將讓這科技的大潮又起一層浪。

  今天,我們特意邀請到兩位芯片領(lǐng)域的專家,專門來聊聊英偉達(dá)的新技術(shù),以及這場芯片大戰(zhàn)的關(guān)鍵看點(diǎn)。

  英偉達(dá)領(lǐng)先多少

  昨天以前,英偉達(dá)在深度學(xué)習(xí)芯片領(lǐng)域已經(jīng)非常領(lǐng)先了,但是還不是遙不可及。

  但在一口氣發(fā)布的7個產(chǎn)品和計(jì)劃后,特別是其中的TeslaV100,確實(shí)震撼??梢哉f,大大拉開了它與競爭對手的距離。

  這不由得讓人想起90年代,思科成為互聯(lián)網(wǎng)第一波紅利的最大獲益者?,F(xiàn)在AI時代的到來,盡管我們還不知道它這一輪到底能沖多高,但大家都還在摩拳擦掌、買槍買炮。

  而英偉達(dá)卻第一時間成為一家獨(dú)大的軍火商,肯定是AI第一波紅利的最大獲益者。

  英偉達(dá)在GTC大會推出的全新GPU,確實(shí)在技術(shù)上劃了時代,吊打所有對手。

  通用的GPU單元,專門的Tensor加速器,矩陣運(yùn)算絕對性能爆炸,同時還兼顧其他算法。不愧是英偉達(dá)憑借多年在深度學(xué)習(xí)領(lǐng)域的積累、對需求深刻洞察之后推出的心血大作,比上一代強(qiáng)大十倍的性能,既適合訓(xùn)練又適合部署。

  就此,老黃已直接對絕大多數(shù)做深度學(xué)習(xí)芯片的創(chuàng)業(yè)項(xiàng)目宣判了死刑。

  為什么GPU就適合AI?

  我們來科普一下。深度學(xué)習(xí)是機(jī)器學(xué)習(xí)的一種技術(shù),基于深度神經(jīng)網(wǎng)絡(luò),這一輪AI主要就是深度學(xué)習(xí)技術(shù)突破引領(lǐng)的。

  而深度學(xué)習(xí)里面絕大多數(shù)的運(yùn)算都是矩陣運(yùn)算,矩陣運(yùn)算天生就容易并行,而GPU最擅長的就是做并行數(shù)學(xué)計(jì)算,所以特別適合做深度學(xué)習(xí)。

  2012年的時候,Geoffrey Hinton的學(xué)生Alex Krizhevsky用GPU來做深度學(xué)習(xí),并且取得了ImageNet大賽冠軍。經(jīng)過他們的評測,用GPU比CPU快60倍。

  人工智能研究者一找上GPU,英偉達(dá)立馬抓住機(jī)會,短時間內(nèi)動用數(shù)千工程師、投入20億美元,研發(fā)出第一臺專門為深度學(xué)習(xí)優(yōu)化的Pascal GPU。所以,在深度學(xué)習(xí)大行其道的今天,英偉達(dá)就成了大贏家了。而深度學(xué)習(xí)中GPU的應(yīng)用,有這兩個場景:一個是訓(xùn)練,一個是部署。所謂訓(xùn)練,就是AI的構(gòu)建過程,研究員在線下通過喂給AI算法大量的數(shù)據(jù),產(chǎn)生出一個模型。而部署,就是把訓(xùn)練好的這個模型拿到應(yīng)用現(xiàn)場去用,去做推斷。

  比如說,的無人車在美國開了幾十萬公里,通過訓(xùn)練練出一個自動駕駛的AI模型。這個模型訓(xùn)練出來之后,未來可以部署到每一臺量產(chǎn)的谷歌無人車,實(shí)現(xiàn)自動駕駛。在自動駕駛中,這個AI模型就必須實(shí)時進(jìn)行推斷。

  訓(xùn)練階段,我們主要關(guān)心的是大規(guī)模的計(jì)算吞吐率,而到了部署中,更強(qiáng)調(diào)的是絕對的計(jì)算能力、低延遲、高性能功耗比、高穩(wěn)定性。

  現(xiàn)在在AI界,訓(xùn)練模型普遍采用英偉達(dá)的GPU,但是到了部署領(lǐng)域呢,有人用GPU,有人用谷歌的TPU,有人用英特爾,還有一大批嵌入式芯片開發(fā)商正在開發(fā)專用的前端深度學(xué)習(xí)芯片。

  但是,剛剛發(fā)布的V100,既適合做訓(xùn)練,又適合做推斷,除了功耗較大以外,在能力方面實(shí)現(xiàn)了左右通殺,所以確實(shí)厲害。

  另外,英偉達(dá)還有一個專門用來部署的運(yùn)行時環(huán)境叫TeslaRT。所以英偉達(dá)在AI芯片領(lǐng)域真有點(diǎn)一騎絕塵的架勢了。

  難道無人能擋英偉達(dá)?

  AI芯片這么大的一塊蛋糕,總得多有幾個人來分才熱鬧,就算英偉達(dá)現(xiàn)在的優(yōu)勢不容置疑,那接下來的疑問就是,它的優(yōu)勢究竟能持續(xù)多久?

  谷歌TPU

  幾天前,在谷歌TPU團(tuán)隊(duì)出走半數(shù)后,計(jì)算機(jī)體系架構(gòu)的宗師DavidPatterson宣布他要加入谷歌,正式參與TPU項(xiàng)目。

  上個月,谷歌關(guān)于TPU性能的論文披露說,TPU運(yùn)行速度是英偉達(dá)和英特爾相關(guān)處理器的15-30倍,能效高出30-80倍。

  谷歌的TPU適用于部署,能跟谷歌自家的TensorFlow緊密結(jié)合??上情]源的,谷歌視它為核心競爭力,應(yīng)該不會開放給別人用。

  TPU的第一版很驚艷,不過缺點(diǎn)也很多?,F(xiàn)在從谷歌的論文來看,這個架構(gòu)有點(diǎn)過時,實(shí)踐當(dāng)中也會有很大局限性。雖說這次DavidPatterson加入谷歌TPU團(tuán)隊(duì)的動靜很大,但我們還是應(yīng)當(dāng)保持冷靜、繼續(xù)觀察。

  英特爾

  另一個能跟英偉達(dá)叫板的,就是老牌芯片巨頭英特爾,但它的CPU擅長高速處理數(shù)字,卻不擅長處理音視頻等非結(jié)構(gòu)化數(shù)據(jù)。

  于是在去年,英特爾耗資4億美元收購深度學(xué)習(xí)初創(chuàng)企業(yè)Nervana,試圖通過Nervana Systems在硅層實(shí)現(xiàn)機(jī)器學(xué)習(xí)。今年3月,這家土豪又怒砸153億美元收購一家以色列芯片公司Mobileye,土豪要用自己家的高性能計(jì)算和網(wǎng)絡(luò)連接能力,結(jié)合Mobileye的計(jì)算機(jī)視覺專業(yè)技術(shù),打造從云端直達(dá)每輛汽車的無人駕駛解決方案,深化它在自動駕駛領(lǐng)域的布局。

  收購Nervana,是英特爾非常厲害的一招。因?yàn)?,這家公司前幾年一直在幫英偉達(dá)優(yōu)化GPU平臺。他們是一群頂級黑客團(tuán)隊(duì),hack了GPU的native指令集,寫出了比當(dāng)時的cudnn(NVIDIA自己的深度學(xué)習(xí)數(shù)學(xué)庫)還要快若干倍的數(shù)學(xué)庫。他們的成果都開源給了社區(qū),cudnn后面的進(jìn)步很大程度是因?yàn)槲樟诉@些成果。這家公司被英特爾收購后,就斷了繼續(xù)為英偉達(dá)提供服務(wù)的可能,同時也極大增強(qiáng)了英特爾的實(shí)力。

  英特爾現(xiàn)在是allinAI,它的幾大產(chǎn)品線,都會重點(diǎn)針對深度學(xué)習(xí)進(jìn)行專門定制,比如之前作為HPC平臺的XeonPhi加速計(jì)算卡,收購的AlteraFPGA,包括NervanaSystem,都是各自獨(dú)立的深度學(xué)習(xí)產(chǎn)品線。其他還包括IoT部門,還有收購的Movidius公司,這些是提供嵌入式和端的解決方案。

  這樣來看,在深度學(xué)習(xí)芯片上,英偉達(dá)一馬當(dāng)先,英特爾黃雀在后,而谷歌的TPU,還真是任重而道遠(yuǎn)啊。



關(guān)鍵詞: AI 谷歌

評論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉