新聞中心

EEPW首頁 > 智能計算 > 設計應用 > 詳解人工智能芯片 CPU/GPU/FPGA有何差異?

詳解人工智能芯片 CPU/GPU/FPGA有何差異?

作者: 時間:2017-04-01 來源:行業(yè)報告研究院 收藏
編者按:CPU與GPU在各自領域都可以高效地完成任務,但當同樣應用于通用基礎計算領域時,設計架構(gòu)的差異直接導致了兩種芯片性能的差異。

  4.行業(yè)的佼佼者:Nvidia

本文引用地址:http://butianyuan.cn/article/201704/346122.htm

  目前全球行業(yè)的市場份額有超過70%被英偉達公司占據(jù),而應用在人工智能領域的可進行通用計算的市場則基本被英偉達公司壟斷。

  2016年三季度英偉達營收為20.04億美元,較上年同期的13.05億美元增長54%;凈利潤為5.42億美元,較上年同期的2.46億美元增長120%,營收的超預期增長推動其盤后股價大幅上漲約16%。以面向的市場平臺來劃分,游戲業(yè)務營收12.4億美元,同比增長63%,是創(chuàng)造利潤的核心部門;數(shù)據(jù)中心業(yè)務營收2.4億美元,同比增長193%,成為增長最快的部門;自動駕駛業(yè)務營收1.27億美元,同比增長61%,正在逐步打開市場。



  這樣的業(yè)績創(chuàng)下了英偉達的歷史最好季度收入,但這并非是其股票暴漲的理由,事實上,在過去的六年里,英偉達的業(yè)績基本一直呈現(xiàn)上升趨勢。從2012年財年至2016財年,英偉達的營業(yè)收入實現(xiàn)了從40億美元到50億美元的跨越,而其凈利潤也從2012財年的5.8億美元逐步上升到了2016財年的6.14億美元。但在此期間,英偉達的股價并未出現(xiàn)翻番式的增長。

  真正促成英偉達股價飆升的是人工智能的新市場。在剛剛過去的2016年,英偉達的股價上漲了228%,過去的5年內(nèi)累計上漲500%。500億美元的市值將會持續(xù)給英偉達帶來40倍的市場收入,這幾乎是業(yè)內(nèi)擁有最高收益的公司。

  5.Nvidia的市場定位:人工智能計算公司

  自1999年發(fā)布第一款GPU以來,GPU就成為了英偉達最為核心的產(chǎn)品,占到了英偉達總營業(yè)收入的八成,而英偉達也以顯卡廠商的身份進入人們的視線。這些芯片最初是以板卡的形式出售給游戲玩家的,游戲玩家需要自己動手將芯片裝到PC主板上,從而擁有更快的3D圖形處理速度。他們的產(chǎn)品命名也很有講究,用“GeForce”這樣具有超能力的字眼來開辟市場。

  今日的英偉達,已經(jīng)不再是一家單純的顯卡技術(shù)廠商,他現(xiàn)在很趕時髦地稱自己為“人工智能計算公司”。據(jù)英偉達官網(wǎng)數(shù)據(jù)顯示,2016年,有近兩萬家機構(gòu)將英偉達產(chǎn)品用于深度學習加速計算,相比2014年翻了13倍。醫(yī)療、生命科學、教育、能源、金融、汽車、制造業(yè)以及娛樂業(yè)等諸多行業(yè)均將得益于海量數(shù)據(jù)的分析。

  谷歌、微軟、Facebook 和亞馬遜等技術(shù)巨頭大量購買英偉達的芯片來擴充自己數(shù)據(jù)中心的處理能力;Massachusetts General Hospital等醫(yī)療研究機構(gòu)用英偉達的芯片來標記CT掃描圖片上的病變點;特斯拉將在所有的汽車上安裝英偉達的芯片來實現(xiàn)無人駕駛; June等家電公司用英偉達的芯片制造人工智能驅(qū)動的家用電器。在人工智能到來之前,英偉達從來都沒有處于一個如此巨大的市場的中心,這也充分表明了一個事實,那就是英偉達在GPU的計算處理技術(shù)上無人能及。

  同時,英偉達還在投資不同領域里新興的、需要借助深度學習來構(gòu)建業(yè)務的公司,使這些公司能夠更好地借助其提供的人工智能平臺起步,這類似于以前一些初創(chuàng)公司通過微軟Windows來構(gòu)建服務以及最近通過iTunes來發(fā)布應用。



  6.Nvidia的核心產(chǎn)品:Pascal家族

  英偉達的傳統(tǒng)強項是桌面和移動終端的GPU,但是堅定地向著人工智能大步邁進的英偉達顯然已經(jīng)不滿足于僅僅在單一領域做提高GPU性能的事了。相比于傳統(tǒng)的計算密集型GPU產(chǎn)品來說,英偉達努力的方向是使得GPU芯片不僅僅只針對訓練算法這一項起到作用,更是能處理人工智能服務的推理工作負載,從而加速整個人工智能的開發(fā)流程。目前該公司的核心產(chǎn)品包括基于Pascal架構(gòu)的TeslaP4與Tesla P40深度學習芯片,這兩款芯片均已于2016年第四季度開始投入量產(chǎn)。

  Tesla P4為資料中心帶來最高的能源效率

  其小尺寸及最小50瓦特的低功率設計可安裝于任何服務器內(nèi),讓生產(chǎn)作業(yè)負載推論的能源效率達CPU的40倍。在進行視頻推論作業(yè)負載時,單一服務器裡安裝單顆Tesla P4即可取代13臺僅采用CPU的服務器,而包含服務器及用電量的總持有成本則能節(jié)省達8倍。

  Tesla P40為深度學習作業(yè)負載帶來最大的處理量

  一臺搭載8顆Tesla P40加速器的服務器擁有每秒47兆次運算的推論性能及INT8指令,可取代140臺以上的CPU服務器的性能。若以每臺CPU服務器約5,000美元計算,可節(jié)省65萬美元以上的服務器采購成本。

  基于上述兩種人工智能芯片,英偉達為資料中心提供唯一的端對端深度學習平臺,并能夠?qū)⒂柧殨r間從數(shù)天大幅縮短至數(shù)小時,從而實現(xiàn)資料的立即解析與服務的及時回應。

  7.Nvidia的應用布局:自動駕駛

  不僅僅是底層架構(gòu),英偉達在應用層面上也有非常明確的布局,其中最看重也最有領先優(yōu)勢的就是自動駕駛。早在2014年1月,英偉達就發(fā)布了為移動平臺設計的第一代Tegra系列處理器,適用于智能手機、平板電腦和自動駕駛汽車,四個月后,DRIVE PX自動駕駛計算平臺發(fā)布,可實現(xiàn)包括高速公路自動駕駛與高清制圖在內(nèi)的自動巡航功能。同年10月,搭載了Tegra K1處理器并應用了DRIVEPX計算平臺的特斯拉新款Model S開始量產(chǎn),英偉達成為第一個享受到自動駕駛紅利的廠商。

  2016年英偉達在自動駕駛領域并沒有什么重大突破,基本只是從技術(shù)升級及廠商合作兩個方面入手,除了特斯拉這個老朋友外,百度、沃爾沃也跟英偉達達成了合作,他們都將生產(chǎn)搭載DRIVE PX 2的智能駕駛汽車。恰逢此時,AI概念變得更加火熱,智能駕駛也逐漸成熟,這些客觀因素讓英偉達收割了更多的紅利,也讓公司站在了聚光燈之下。

  從整個自動駕駛行業(yè)來看,Google、蘋果、微軟等科技公司都在建立自己的汽車生態(tài)體系,不過智能汽車對于他們來說都不是核心業(yè)務,更為重要的是,他們并沒有真正進入汽車供應鏈體系。與之相反,英偉達的Drive PX系列自動駕駛解決方案,已經(jīng)進入了汽車的上游供應鏈中,并創(chuàng)造了利潤,這也意味著英偉達將在汽車芯片市場與英特爾、高通、恩智浦、瑞薩電子等做CPU的公司正面碰撞,自動駕駛的風口讓英偉達在汽車市場從“邊緣人”變成了挑戰(zhàn)者。

  隨著特斯拉Model S等備受矚目的車型更加智能化與多媒體化,英偉達有了彎道超車的機會,并有望在汽車產(chǎn)業(yè)的上游供應鏈占據(jù)更有優(yōu)勢的地位。最新款的Tegra系列處理器功耗只有10瓦,幾乎與同等級的產(chǎn)品功耗持平甚至更低,這對于車載移動芯片來說是巨大的優(yōu)勢。

  但同樣的,單移動處理器的架構(gòu)和極低的功耗必然無法支撐起超大規(guī)模的運算,目前英偉達計算平臺的功能定位僅聚焦于高速公路上的自動巡航,而CPU的應用可以拓展至車機娛樂信息系統(tǒng)層面。未來自動駕駛的發(fā)展方向必然是整車的控制中心,從目前英偉達基于Tesla架構(gòu)的主流芯片來看,低功耗、極速運算與邏輯控制是可以同時實現(xiàn)的,英偉達公司在自動駕駛領域的優(yōu)勢非常明顯。

  8.Nvidia的產(chǎn)業(yè)優(yōu)勢:完善的生態(tài)系統(tǒng)

  與其它芯片公司相比,帶有CUDA的重點軟件生態(tài)系統(tǒng)是英偉達占領人工智能市場的關(guān)鍵促成因素。從2006年開始,英偉達發(fā)布了一個名叫CUDA的編程工具包,該工具包讓開發(fā)者可以輕松編程屏幕上的每一個像素。在CUDA發(fā)布之前,給GPU編程對程序員來說是一件極其痛苦的事,因為這涉及到編寫大量低層面的機器碼以實現(xiàn)渲染每一個不同像素的目標,而這樣的微型計算操作通常有上萬個。CUDA在經(jīng)過了英偉達的多年開發(fā)之后,成功將Java或C++這樣的高級語言開放給了GPU編程,從而讓GPU編程變得更加輕松簡單,研究者也可以更快更便宜地開發(fā)他們的深度學習模型。

  四、未來市場:半定制芯片

  技術(shù)世界正在邁向一個全新的軌道,我們對于人工智能的想象已經(jīng)不再局限于圖片識別與聲音處理,機器,將在更多領域完成新的探索。不同領域?qū)τ嬎愕男枨笫遣町惖?,這就要求深度學習的訓練愈發(fā)專業(yè)化與區(qū)別化。芯片的發(fā)展趨勢必將是在每一個細分領域都可以更加符合我們的專業(yè)需求,但是考慮到硬件產(chǎn)品一旦成型便不可再更改這個特點,我們不禁開始想,是不是可以生產(chǎn)一種芯片,讓它硬件可編程。

  也就是說,這一刻我們需要一個更適合圖像處理的硬件系統(tǒng),下一刻我們需要一個更適合科學計算的硬件系統(tǒng),但是我們又不希望焊兩塊板子,我們希望一塊板子便可以實現(xiàn)針對每一個應用領域的不同需求。這塊板子便是半定制芯片,便是未來人工智能硬件市場的發(fā)展方向。



關(guān)鍵詞: GPU FPGA

評論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉