基于HSA,聯(lián)發(fā)科技用多核異構(gòu)主攻深度學習
“2016年全球異構(gòu)計算HSA峰會”于8月下旬在京拉開帷幕,本次峰會由全球異構(gòu)系統(tǒng)架構(gòu)(HSA)聯(lián)盟和中國半導體行業(yè)協(xié)會(CSIA)共同主辦。聯(lián)發(fā)科技(MTK)公司介紹了其主攻深度學習的十核三叢集架構(gòu)技術(shù),以及對HSA的貢獻。會后,筆者采訪了該公司高級技術(shù)總監(jiān)Roy Ju先生。
本文引用地址:http://butianyuan.cn/article/201609/296605.htmMTK的異構(gòu)技術(shù)歷程
2015年推出了Device Fusion軟件技術(shù),可以自動地根據(jù)應用程序執(zhí)行的特性,觀察適合在CPU、還是在GPU等上面運行,或者在CPU和GPU上同時運行。
公司今年又首創(chuàng)了十核三叢集架構(gòu),采用大中小核技術(shù),可以平衡性能功耗比,并已將該架構(gòu)應用到高端芯片——曦力X20上,再輔以CorePilot3.0,可實現(xiàn)高性能、低功耗和優(yōu)秀的用戶體驗。
展望未來,聯(lián)發(fā)科技將幫助開發(fā)者來進行深度學習方面的應用。深度學習可由HSA(異構(gòu)系統(tǒng)架構(gòu))實現(xiàn),適合多種應用領(lǐng)域,諸如物體辨識,人臉/場景/年齡識別、針對性廣告、活動/手勢識別、情景感知計算等。
深度學習的挑戰(zhàn)
由于深度學習的運算量非常大,需要采用異構(gòu)計算。因為如果只在傳統(tǒng)的CPU上執(zhí)行,可能達不到性能需求。通過放到加速器上面,可以使運行的效率與功耗有顯著提高,即“CPU+”方法。當然選核只是一個開始。
之后,異構(gòu)硬件之間的架構(gòu)要做很多優(yōu)化。由于有了HSA,開發(fā)者就可以用同一個界面,不再會因為下面的硬件不同而做特別的優(yōu)化。HSA能夠很好地將需要大計算量的應用,調(diào)度到諸如GPU和DSP等能效表現(xiàn)更佳的計算單元上去運行,從而避免了總是在能耗更大的CPU上運行。因此,用戶能夠同時獲得高性能和低能耗。另外,HSA注重降低GPU的驅(qū)動過載,而且這個特性近來也被應用到了一些新型圖像API上,從而有助于提升在線游戲體驗。
HSA與聯(lián)發(fā)科技
HSA是在2012年6月正式成立的,由聯(lián)發(fā)科技等六家企業(yè)共同發(fā)起。如果希望不同IP之間能夠有不同的組合,博采眾長,界面就要定義得很清楚。因此,HSA成立之初就廣發(fā)英雄帖,召集天下企業(yè)加盟。因為HSA聯(lián)盟如果一開始就很局限,格局就做不大。
加入HSA聯(lián)盟以后,聯(lián)盟成員可以提供一些代碼幫助研制規(guī)格。運作過程通常是這樣的:在討論的過程中,代碼通常是不對外公開的。但在規(guī)格完成對外公開后,絕大部分代碼內(nèi)容通常都會批準公開,最后一關(guān)由董事會批準。如要得到HSA的LOGO,通常要經(jīng)過測試。
與其他公司相比,聯(lián)發(fā)科技的HSA策略特點是:除了開發(fā)自己的IP外,也集成來自第三方的IP,從系統(tǒng)和平臺層面部署HSA技術(shù)。其實,HSA是一項平臺性技術(shù),需要多個IP模塊的緊密合作以支持平臺上的多個特性,包括共享虛擬內(nèi)存、信號、隊列語言等。因此,聯(lián)發(fā)科技領(lǐng)導著多廠商(Multi-vendor)工作組,定義和標準化來自不同供應商的不同IP模塊間的互操作,通過創(chuàng)造公平的競爭環(huán)境,汲取生態(tài)系統(tǒng)中來自不同IP廠商的技術(shù)精華。
評論