淺談AI芯片設(shè)計(jì)的趨勢(shì)和挑戰(zhàn)

作者：時(shí)間：2019-01-07 來(lái)源：與非網(wǎng)

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫(kù)查詢

編者按：2018年以來(lái)，不少以算法為主的語(yǔ)音、視覺(jué)、自動(dòng)駕駛等公司也開(kāi)始研發(fā)AI芯片，將算法和芯片進(jìn)行更好的結(jié)合，來(lái)針對(duì)多樣化的場(chǎng)景，未來(lái)軟硬結(jié)合將會(huì)是趨勢(shì)。

　　2018年以來(lái)，不少以算法為主的語(yǔ)音、視覺(jué)、自動(dòng)駕駛等公司也開(kāi)始研發(fā)AI 芯片，將算法和芯片進(jìn)行更好的結(jié)合，來(lái)針對(duì)多樣化的場(chǎng)景，未來(lái)軟硬結(jié)合將會(huì)是趨勢(shì)。

本文引用地址：http://butianyuan.cn/article/201901/396388.htm

　　隨著深度學(xué)習(xí)和AI應(yīng)用的不斷演進(jìn)，近兩年AI 芯片廠商不斷涌現(xiàn)，加之貿(mào)易摩擦中芯片概念的普及，2018年的AI芯片領(lǐng)域持續(xù)火熱。在國(guó)內(nèi)，貼上AI芯片標(biāo)簽的公司已經(jīng)超過(guò)40家，其中的佼佼者們獲得不菲融資。

　　盡管目前AI在行業(yè)應(yīng)用方面的滲透有限，但是算力的供需還是不平衡。近日，華為智能計(jì)算業(yè)務(wù)部總裁邱隆就向21世紀(jì)經(jīng)濟(jì)報(bào)道記者表示：“原來(lái)由摩爾定律驅(qū)動(dòng)的計(jì)算產(chǎn)業(yè)，面對(duì)爆發(fā)式的計(jì)算需求無(wú)以為繼。摩爾定律在正常的時(shí)候，以每年1.5倍增長(zhǎng)，50%的算力增長(zhǎng)，在過(guò)去幾年間，每年的算力實(shí)際增長(zhǎng)只有10%。人工智能在過(guò)去幾年間，算力增長(zhǎng)了30萬(wàn)倍，至少每一年我們的算力要增長(zhǎng)10倍?！?/p>

　　這意味著人工智能除了算法外，對(duì)算力也存在強(qiáng)大的需求。面對(duì)增多的B端應(yīng)用場(chǎng)景，也有更多的AI芯片公司加入角逐。從功能角度細(xì)分，AI芯片可分為訓(xùn)練芯片和推理芯片，在訓(xùn)練方面，目前英偉達(dá)獨(dú)樹(shù)一幟，但是在推理方面，可選擇的芯片種類不只是GPU，還有FPGA(現(xiàn)場(chǎng)可編程門(mén)陣列)、ASIC(專用集成電路)等。在各個(gè)分類中，芯片巨頭們各有千秋，接下來(lái)還要考驗(yàn)落地情況。

　　群雄混戰(zhàn)

　　芯片目前主要是提供算力支持，2018年，AI芯片大廠和創(chuàng)業(yè)公司們均有不少新動(dòng)作。

　　最大的玩家當(dāng)屬英偉達(dá)和英特爾。英偉達(dá)的GPU抓住了計(jì)算設(shè)備需求的關(guān)鍵時(shí)機(jī)，在圖形渲染、人工智能和區(qū)塊鏈領(lǐng)域的計(jì)算表現(xiàn)突出，希望成為真正的算力平臺(tái)，其中，英偉達(dá)在訓(xùn)練方面的代表芯片就是Tesla V100。由于英偉達(dá)GPU布局AI的時(shí)間早于英特爾、賽靈思等公司，整體生態(tài)較為完整，產(chǎn)品在IT公司中得到廣泛應(yīng)用。

　　英特爾則通過(guò)收購(gòu)案來(lái)彌補(bǔ)AI芯片的賽道：2015年167億美金收購(gòu)FPGA巨頭Altera。FPGA在云計(jì)算、物聯(lián)網(wǎng)、邊緣計(jì)算等方面有很大的潛力。隨著5G浪潮的到來(lái)，物聯(lián)網(wǎng)的數(shù)據(jù)分析及計(jì)算需求會(huì)暴增，物聯(lián)網(wǎng)的接入節(jié)點(diǎn)至少是數(shù)百億級(jí)的規(guī)模，比手機(jī)規(guī)模要高出1-2個(gè)數(shù)量級(jí)。物聯(lián)網(wǎng)的典型需求是需要靈活使用算法的變化，這是FPGA的強(qiáng)項(xiàng)，F(xiàn)PGA可以通過(guò)自身結(jié)構(gòu)的改變來(lái)適應(yīng)定制化計(jì)算場(chǎng)景的需求，能為不同類型的設(shè)備提供高效芯片。

　　同時(shí)，英特爾還收購(gòu)了Nervana，計(jì)劃用這家公司在深度學(xué)習(xí)方面的能力來(lái)對(duì)抗GPU，Nervana的最新版深度學(xué)習(xí)芯片將在2019年量產(chǎn)。此外，英特爾還收購(gòu)了視覺(jué)處理芯片初創(chuàng)公司 Movidius、自動(dòng)駕駛公司Mobileye。

　　算法巨頭谷歌則另辟蹊徑，以ASIC類型的芯片來(lái)滿足自身需求。具體來(lái)看，谷歌的TPU通過(guò)脈動(dòng)陣列(systolic array)這一核心架構(gòu)來(lái)提升算力，2018年發(fā)布的TPU3.0版本采用8位低精度計(jì)算節(jié)省晶體管，速度能加快最高100PFlops(每秒1000萬(wàn)億次浮點(diǎn)計(jì)算)。

　　再看國(guó)內(nèi)，華為在2018年10月發(fā)布了兩顆AI芯片——昇騰910(max)和昇騰310(mini)。昇騰910主要用于云端計(jì)算，其半精度算力達(dá)到了256 TFLOPS，預(yù)計(jì)將于2019年第二季度量產(chǎn);昇騰310用于終端低功耗場(chǎng)景，擁有8TFLOPS半精度計(jì)算力，目前已經(jīng)量產(chǎn)，但是并不對(duì)外銷售。

　　國(guó)內(nèi)的明星初創(chuàng)企業(yè)也紛紛獲得投資或者收購(gòu)。2018年中，寒武紀(jì)推出面向數(shù)據(jù)中心市場(chǎng)云端智能芯片 MLU100，浪潮、聯(lián)想、曙光的AI服務(wù)器產(chǎn)品將搭載MLU100 芯片。但是在手機(jī)端，華為麒麟芯片將用達(dá)芬奇架構(gòu)代替寒武紀(jì)架構(gòu)。另一家公司地平線選擇自動(dòng)駕駛的場(chǎng)景，奧迪是其合作伙伴。產(chǎn)品包括基于旭日2.0處理器架構(gòu)的XForce邊緣AI計(jì)算平臺(tái)、基于征程(Journey)2.0 架構(gòu)的地平線 Matrix 自動(dòng)駕駛計(jì)算平臺(tái)、核心板旭日X1600、智能攝像機(jī)解決方案等。

　　深鑒科技則在2018年被賽靈思收購(gòu)，價(jià)格約3億美元。深鑒科技一方面提供基于神經(jīng)網(wǎng)絡(luò)深度壓縮技術(shù)和DPU平臺(tái)，為深度學(xué)習(xí)提供端到端的解決方案。另一方面通過(guò)神經(jīng)網(wǎng)絡(luò)與FPGA的協(xié)同優(yōu)化，提供高性價(jià)比的嵌入式端與云端的推理平臺(tái)，已應(yīng)用于安防、數(shù)據(jù)中心、汽車等領(lǐng)域。

　　挑戰(zhàn)與趨勢(shì)

　　整體而言，英偉達(dá)的實(shí)力在第一梯隊(duì)，但是競(jìng)爭(zhēng)者眾多，除了上述企業(yè)外，AMD、高通、聯(lián)發(fā)科、三星等公司均在AI芯片上有所布局，并且戰(zhàn)況愈發(fā)激烈。

　　不過(guò)，目前在AI芯片領(lǐng)域沒(méi)有哪一家占據(jù)絕對(duì)優(yōu)勢(shì)，集邦咨詢向21世紀(jì)經(jīng)濟(jì)報(bào)道記者表示：“初創(chuàng)企業(yè)方面，就我們的觀察，畢竟仍在草創(chuàng)階段，客戶的采用意愿，以及導(dǎo)入后，終端市場(chǎng)的接受狀況，將是未來(lái)需要觀察的地方?？偨Y(jié)來(lái)看，還是國(guó)際芯片大廠的布局速度較快?！?/p>

　　從國(guó)內(nèi)和國(guó)外的角度看，一位AI業(yè)內(nèi)人士告訴21世紀(jì)經(jīng)濟(jì)報(bào)道記者：“國(guó)內(nèi)外主要是技術(shù)結(jié)構(gòu)上的差距，底層技術(shù)科學(xué)上和國(guó)外的差距顯著，但是應(yīng)用層面上差距不大，甚至有創(chuàng)新的應(yīng)用點(diǎn)。不少AI芯片公司通過(guò)定制化服務(wù)小規(guī)?？蛻?，針對(duì)B端場(chǎng)景進(jìn)行開(kāi)發(fā)，比如專門(mén)處理語(yǔ)音、圖像?！?/p>

　　同時(shí)，AI芯片也面臨不少挑戰(zhàn)，杜克大學(xué)教授陳怡然就曾提到，AI芯片在設(shè)計(jì)方面有四大挑戰(zhàn)。

　　其一是大容量存儲(chǔ)和高密度計(jì)算，當(dāng)神經(jīng)深度學(xué)習(xí)網(wǎng)絡(luò)的復(fù)雜度越來(lái)越高的時(shí)候，參數(shù)也會(huì)越來(lái)越多，怎么處理是一大難題;第二個(gè)挑戰(zhàn)是要面臨特定領(lǐng)域的架構(gòu)設(shè)計(jì)，因?yàn)閳?chǎng)景越來(lái)越豐富，這些場(chǎng)景的計(jì)算需求是完全不一樣的。怎么樣通過(guò)對(duì)于不同的場(chǎng)景的理解，設(shè)置不同的硬件架構(gòu)變得非常重要。

　　第三個(gè)挑戰(zhàn)是芯片設(shè)計(jì)要求高，周期長(zhǎng)，成本昂貴。從芯片規(guī)格設(shè)計(jì)、芯片結(jié)構(gòu)設(shè)計(jì)、RTL設(shè)計(jì)、物理版圖設(shè)計(jì)、晶圓制造、晶圓測(cè)試封裝，需要2到3年時(shí)間，正常的時(shí)間里軟件會(huì)有一個(gè)非?？焖俚陌l(fā)展。但是算法在這個(gè)期間內(nèi)將會(huì)快速更新，芯片如何支持這些更新也是難點(diǎn)。

　　第四個(gè)挑戰(zhàn)是架構(gòu)及工藝。隨著工藝不斷的提升，從90納米到10納米，邏輯門(mén)生產(chǎn)的成本到最后變得飽和。也許在速度上、功耗上會(huì)有提升，但單個(gè)邏輯生產(chǎn)的成本不會(huì)再有新的下降。這種情況下如果仍然用幾千甚至上萬(wàn)個(gè)晶體管去做一個(gè)比較簡(jiǎn)單的深度學(xué)習(xí)的邏輯，最后在成本上是得不償失的。

　　在芯片的產(chǎn)業(yè)鏈中，生產(chǎn)環(huán)節(jié)主要依靠臺(tái)積電、格芯等芯片代工廠商。但是國(guó)內(nèi)在設(shè)計(jì)領(lǐng)域逐步前進(jìn)，并且AI專用芯片相對(duì)于CPU、GPU來(lái)說(shuō)難度沒(méi)有那么大，因此不少創(chuàng)業(yè)公司也為自己精通的行業(yè)定制AI芯片。

　　2018年以來(lái)，不少以算法為主的語(yǔ)音、視覺(jué)、自動(dòng)駕駛等公司也開(kāi)始研發(fā)AI芯片，將算法和芯片進(jìn)行更好的結(jié)合，來(lái)針對(duì)多樣化的場(chǎng)景，未來(lái)軟硬結(jié)合將會(huì)是趨勢(shì)。

新聞中心

淺談AI芯片設(shè)計(jì)的趨勢(shì)和挑戰(zhàn)

評(píng)論

相關(guān)推薦

技術(shù)專區(qū)