AI時(shí)代 處理器市場(chǎng)群雄爭(zhēng)霸誰能領(lǐng)跑?
后起之秀概率芯片
本文引用地址:http://butianyuan.cn/article/201605/291817.htm2016 年 4月16 日,MIT Techonolgy Review 報(bào)道,DARPA 投資了一款叫做“S1”的概率芯片。模擬測(cè)試中,使用 S1 追蹤視頻里的移動(dòng)物體,每幀處理速度比傳統(tǒng)處理器快了近 100 倍,而能耗還不到傳統(tǒng)處理器的 2%。MIT 媒體實(shí)驗(yàn)室教授、Twitter 首席媒體科學(xué)家 Deb Roy 評(píng)論稱,近似計(jì)算的潮流正在興起。
美國(guó) Singular Computing 公司開發(fā)的“S1”概率芯片,獲得 DARPA 投資,能夠讓計(jì)算機(jī)更好地分析圖像。來源:MIT Techonolgy Review
紐約州立大學(xué)石溪分校終身教授顧險(xiǎn)峰從最基礎(chǔ)的數(shù)學(xué)層面分析了概率芯片的優(yōu)點(diǎn),專用概率芯片可以發(fā)揮概率算法簡(jiǎn)單并行的特點(diǎn),極大提高系統(tǒng)性能。概率芯片所使用的隨機(jī)行走概率方法有很多優(yōu)點(diǎn):算法邏輯異常簡(jiǎn)單,不需要復(fù)雜的數(shù)據(jù)結(jié)構(gòu),不需要數(shù)值代數(shù)計(jì)算;計(jì)算精度可以通過模擬不同數(shù)目的隨機(jī)行走自如控制;不同的隨機(jī)行走相互獨(dú)立,可以大規(guī)模并行模擬;模擬過程中,不需要全局信息,只需要網(wǎng)絡(luò)的局部信息。
顧險(xiǎn)峰最后總結(jié),依隨著英特爾重組,傳統(tǒng) CPU 體系機(jī)構(gòu)獨(dú)霸江山的時(shí)代將一去不復(fù)返,概率芯片和其他更多采用全新架構(gòu)的專用處理器分庭抗禮的時(shí)代即將來臨!
早在 2008 年 MIT Techonolgy Review “十大科技突破”預(yù)測(cè)中,概率芯片就榜上有名。通過犧牲微小的計(jì)算精度,換取能耗明顯降低,概率芯片在歷來追求精準(zhǔn)的芯片領(lǐng)域獨(dú)樹一幟。考慮到 DARPA 投資 S1,概率芯片很可能后來居上。
實(shí)力股 FPGA
2012年,百度決定自主設(shè)計(jì)深度學(xué)習(xí)專有的體系結(jié)構(gòu)和芯片,經(jīng)過深入研究和論證,為讓項(xiàng)目快速落地及迭代,工程師最后決定使用 FPGA 實(shí)現(xiàn)百度第一版自主設(shè)計(jì)的深度學(xué)習(xí)專有芯片。
作為 GPU 在算法加速上強(qiáng)有力的競(jìng)爭(zhēng)者,F(xiàn)PGA 硬件配置靈活且單位能耗通常比 GPU 低。更重要的是,F(xiàn)PGA 相比 GPU 價(jià)格便宜。但是,使用 FPGA 需要具體硬件的知識(shí),而許多研究者和應(yīng)用科學(xué)家并不具備,因此 FPGA 常被視為一種行家專屬的架構(gòu)。
加州大學(xué)計(jì)算機(jī)博士劉少山認(rèn)為,F(xiàn)PGA 具有低能耗、高性能以及可編程等特性,十分適合感知計(jì)算。在能源受限的情況下,F(xiàn)PGA 相對(duì)于 CPU 與 GPU 有明顯的性能與能耗優(yōu)勢(shì)。此外,感知算法不斷發(fā)展意味著感知處理器需要不斷更新,F(xiàn)PGA 具有硬件可升級(jí)、可迭代的優(yōu)勢(shì)。由于 FPGA 的低能耗特性,F(xiàn)PGA 很適合用于傳感器的數(shù)據(jù)預(yù)處理工作??梢灶A(yù)見,F(xiàn)PGA 與傳感器的緊密結(jié)合將會(huì)很快普及。而后隨著視覺、語音、深度學(xué)習(xí)的算法在 FPGA 上的不斷優(yōu)化,F(xiàn)PGA 將逐漸取代 GPU 與 CPU 成為機(jī)器人上的主要芯片。
目前,還沒有任何深度學(xué)習(xí)工具明確支持 FPGA,但顯然它是支實(shí)力股。
GPU:未來市場(chǎng)霸主?
憑借強(qiáng)大的并行計(jì)算能力,在機(jī)器學(xué)習(xí)快速發(fā)展的推動(dòng)下,GPU 目前在深度學(xué)習(xí)芯片市場(chǎng)非常受歡迎,大有成為主流的趨勢(shì)?;ヂ?lián)網(wǎng)巨頭,比如谷歌、Facebook、微軟、Twitter 和百度等公司都在使用 GPU 分析圖片、視頻和音頻文件,改進(jìn)搜索和圖像標(biāo)簽等應(yīng)用功能。GPU 也被大量應(yīng)用于 VR/AR 相關(guān)產(chǎn)業(yè)。此外,很多汽車生產(chǎn)商也在使用 GPU 芯片發(fā)展無人車,主要是用于傳感器。可以說,GPU 是眼下智能產(chǎn)品市場(chǎng)用戶覆蓋率最廣泛的芯片。
半導(dǎo)體研究公司 Tractica LLC 預(yù)計(jì),到 2024 年深度學(xué)習(xí)項(xiàng)目在 GPU 上的花費(fèi)將從 2015 年的 4360 萬增長(zhǎng)到 41 億美元,在相關(guān)軟件上的花費(fèi)將從 1.09 億增長(zhǎng)到 104 億。
但也有人認(rèn)為,通用芯片 GPU 相比深度學(xué)習(xí)專用芯片并不具有優(yōu)勢(shì)。
這有一定道理,但設(shè)計(jì)新的芯片需要很多年,研發(fā)成本可能高達(dá)數(shù)千萬甚至數(shù)億美元。而且,專用芯片比通用芯片更難編程,最重要的是,專用芯片——根據(jù)定義——只提升特定任務(wù)的性能表現(xiàn),這也是為什么谷歌要設(shè)計(jì) TPU 輔助 GPU 和 CPU。
英偉達(dá)工程架構(gòu)副總裁 Marc Hamilton 在接受采訪時(shí)表示,谷歌的 TPU 是一個(gè)非常有意思的技術(shù),但 TPU 的發(fā)布進(jìn)一步印證了他們的觀點(diǎn),那就是人工智能處理器將繼續(xù)從通用的 CPU 轉(zhuǎn)向 GPU 和 TPU 等其他芯片。此外,GPU 的技術(shù)也在不斷發(fā)展。
Hamilton 還提到了百度人工智能科學(xué)家 Bryan Catanzaro 的話:深度學(xué)習(xí)并不是一個(gè)那么窄的領(lǐng)域,從計(jì)算角度看,深度學(xué)習(xí)多樣化而且演化迅速;要是制造一款適用于所有深度學(xué)習(xí)的專用芯片,本質(zhì)上也就成了 GPU。
當(dāng)然,GPU 也不乏競(jìng)爭(zhēng)者。除了 AMD,Nervana、Movidius 等公司都在模仿 GPU 的并行計(jì)算能力制作芯片,但是著眼于把數(shù)據(jù)更快轉(zhuǎn)移和分?jǐn)偨o圖像所需要的功能。
永遠(yuǎn)有更多的選擇
除了采用其他架構(gòu),研究人員很早就開始探索使用新材料制作芯片。2015 年,三星、Gobal Foundries、IBM 和紐約州立大學(xué)等機(jī)構(gòu)組成的研究聯(lián)盟推出了一個(gè) 7 納米的微芯片,其晶體管大約一半都由硅 - 鍺(SiGe)合金制成。石墨烯也是芯片研發(fā)一個(gè)重點(diǎn)。機(jī)器學(xué)習(xí)加速新材料發(fā)現(xiàn),也意味著使用新材料制作的芯片出現(xiàn)幾率大大提高。
總之,谷歌自己打造 TPU 預(yù)示著未來更多非半導(dǎo)體公司或許也將開始生產(chǎn)硬件;硬件制造商必須不斷改進(jìn)自己的產(chǎn)品,貼近用戶越來越多樣化的需求。
評(píng)論