智能手機(jī)AI的下半場(chǎng) 從扁平到立體
自去年以來,手機(jī)行業(yè)最熱的名詞必是“AI”無疑。AI,即人工智能,英文Artificial Intelligence,又稱機(jī)器智能(Machine Intelligence)。顧名思義,這是機(jī)器展現(xiàn)出來的智能,區(qū)別于人或動(dòng)物的自然智能(Natual Intelligence)。
本文引用地址:http://butianyuan.cn/article/201811/394948.htm
AI作為一個(gè)新技術(shù)被世人知曉,可能是源于兩年前。彼時(shí),谷歌的人工智能棋手“Alpha Go”戰(zhàn)勝圍棋世界冠軍李世石而一戰(zhàn)成名,人們開始了解到AI并寄予這項(xiàng)技術(shù)更多的遐想:AI是否是生產(chǎn)力革命的下一個(gè)“風(fēng)口”?而在科技行業(yè)中,嗅覺靈敏的手機(jī)行業(yè)當(dāng)然希望牢牢抓住AI這一風(fēng)口,將這一技術(shù)由前端科研下放到消費(fèi)電子領(lǐng)域,應(yīng)用到智能手機(jī)終端。AI終究更快地走入了人們的生活。
目前看來,AI在智能手機(jī)上的應(yīng)用,分為上半場(chǎng)和下半場(chǎng)。
上半場(chǎng):
自2017年9月2日首款A(yù)I手機(jī)芯片麒麟970芯片正式發(fā)布,支持到硬件級(jí)的AI能力進(jìn)入到手機(jī)行業(yè),正式開啟智能手機(jī)AI化的上半場(chǎng)。在這個(gè)時(shí)間區(qū)間內(nèi),手機(jī)的應(yīng)用主要是各個(gè)手機(jī)廠家在推動(dòng),零散,分裂,水平參差不齊。由于手機(jī)廠商的研發(fā)投入與技術(shù)底蘊(yùn)各不相同,自然對(duì)AI的真實(shí)性與可用性也不一而足。
時(shí)至今日,AI技術(shù)已經(jīng)從理論開始產(chǎn)品化實(shí)踐,進(jìn)而向消費(fèi)電子領(lǐng)域全面普及。在手機(jī)行業(yè)中,上至旗艦,下到千元機(jī),無論是拍照還是玩游戲,整個(gè)行業(yè)渴望搶食AI紅利,乃至AI手機(jī)從擁有技術(shù)底蘊(yùn)的公司辛勤研發(fā)的“風(fēng)口”變成哪怕不具備能力的廠家希望能靠營(yíng)銷上位的“風(fēng)噪”。
首先是華為、蘋果等廠商,憑借專門的AI硬件與軟件的配合實(shí)現(xiàn)了完成度較高的AI功能,促進(jìn)了行業(yè)的發(fā)展和進(jìn)步。例如華為在硬件上采用麒麟970/980等具有獨(dú)立NPU的AI芯片,軟件上通過集成了AI識(shí)別場(chǎng)景、AI翻譯等功能的EUMI系統(tǒng)來實(shí)現(xiàn)AI功能,方便了用戶的使用。在過去的一段時(shí)間里,似乎安卓陣營(yíng)只有華為和榮耀有底氣講自己的產(chǎn)品是名副其實(shí)的AI手機(jī)。
另一方面,有一些廠家,則單單憑借一些軟件算法,就稱自己的手機(jī)為“AI手機(jī)”,甚至一些千元機(jī),也是張口閉口“AI拍照”“AI游戲”。但歸根結(jié)底,他們鮮有技術(shù)積累,遑論實(shí)現(xiàn)真正的AI功能,自然無法讓用戶感覺到手機(jī)變得更加智能;甚至在一定程度上加大了手機(jī)行業(yè)營(yíng)銷過度的“風(fēng)噪”聲量。
那么這里就引入一個(gè)問題,所謂的“手機(jī)AI”,到底是什么呢?
簡(jiǎn)單來說,手機(jī)AI就是用專門的AI芯片識(shí)別特定場(chǎng)景并針對(duì)性地完成任務(wù)。具體的實(shí)現(xiàn)原理則是以AI芯片對(duì)神經(jīng)網(wǎng)絡(luò)模型進(jìn)行深度學(xué)習(xí),進(jìn)而在自然語義理解,圖像識(shí)別等場(chǎng)景下工作。
可以理解為,AI的本質(zhì)是運(yùn)算,當(dāng)前手機(jī)芯片AI運(yùn)算解決方案主要以獨(dú)立處理單元體現(xiàn)。其中獨(dú)立處理單元?jiǎng)t是在手機(jī)處理器中加入深度學(xué)習(xí)專用處理器IP。我們熟知的傳統(tǒng)處理器和圖形處理器一般是面向特定部分的應(yīng)用,不具有向深度學(xué)習(xí)方面的優(yōu)化計(jì)算能力。而專門進(jìn)行AI計(jì)算的專用處理器則能夠顯著提升深度學(xué)習(xí)的處理速度和能效,提升能效比。
目前在端側(cè),手機(jī)AI最常解決的場(chǎng)景在人臉識(shí)別、物體識(shí)別、圖像分割、智能翻譯等場(chǎng)景。舉個(gè)例子,你在使用手機(jī)拍照時(shí),手機(jī)能自動(dòng)識(shí)別藍(lán)天、人像、動(dòng)物這些具體場(chǎng)景,從而針對(duì)不同場(chǎng)景進(jìn)行不同優(yōu)化,都是圖像識(shí)別、圖像分割這些看似“高端”的技術(shù)的落地。而對(duì)于AI,其性能也并非“看不見摸不著”。而在蘇黎世聯(lián)邦理工學(xué)院的AI Benchmark測(cè)試中,麒麟980獲得了目前安卓手機(jī)中的No:1。而在比較經(jīng)典的AI測(cè)試場(chǎng)景中,蘋果A12 Bionic每秒能識(shí)別6000張照片。
因此,在近半年發(fā)布的A12 Bionic、麒麟980,以及三星Exynos9820中都加入了獨(dú)立的神經(jīng)網(wǎng)絡(luò)處理單元,主流移動(dòng)芯片廠商對(duì)于自家的旗艦終端芯片,標(biāo)志著上游供應(yīng)鏈已經(jīng)完成了硬件上對(duì)AI的支持。(在下個(gè)月高通發(fā)布的8150中,據(jù)說也會(huì)搭載獨(dú)立NPU)
從華為開創(chuàng)移動(dòng)端人工智能芯片的先河,到如今幾乎所有的主流旗艦級(jí)芯片都加入硬件級(jí)AI的支持。如果說單個(gè)手機(jī)廠家自己做AI只是自發(fā)的行為,以致于各家所能實(shí)現(xiàn)的AI水平參差不齊;那么全體芯片廠商從上游的芯片供應(yīng)來推動(dòng)手機(jī)AI的發(fā)展,就使得硬件級(jí)AI將覆蓋未來幾乎所有的高端旗艦智能手機(jī)。至此,智能手機(jī)AI的上半場(chǎng)告一段落。
下半場(chǎng):從扁平到立體
盡管得到了上游芯片廠商的支持,但也只是標(biāo)志著手機(jī)AI軍備競(jìng)賽的下半場(chǎng)將正式開始。因?yàn)楫?dāng)大家在硬件層面都處在同一起跑線的時(shí)候,競(jìng)爭(zhēng)會(huì)變得多樣化。
如果說手機(jī)AI 1.0是二維平面,單純依靠智能手機(jī)的終端硬件——AI芯片來在端側(cè)實(shí)現(xiàn);那么如今手機(jī)AI 2.0的時(shí)代業(yè)已成為一種三維的通路:面對(duì)日益復(fù)雜的AI工作場(chǎng)景,需要從芯片、終端再到云端進(jìn)行協(xié)作運(yùn)算。在這方面,華為的HiAI平臺(tái)則跑在了前面。
首先,芯片硬件的AI算力是實(shí)現(xiàn)AI功能的物質(zhì)基礎(chǔ),AI算力的強(qiáng)弱決定了智能手機(jī)執(zhí)行AI任務(wù)的速度。
以風(fēng)靡全球的Prisma軟件為例。作為第一款結(jié)合了人工智能技術(shù)的濾鏡軟件,一經(jīng)問世便走紅全球,它的特點(diǎn)在于將用戶的照片賦予梵高的《星空》等經(jīng)典大作的風(fēng)格。其實(shí)現(xiàn)原理就是AI中的“卷積神經(jīng)網(wǎng)絡(luò)”學(xué)習(xí),在用戶選擇要添加藝術(shù)濾鏡的原照片后,Prisma軟件便開始了“物體識(shí)別--紋理合成--風(fēng)格提取--圖片合成”這一系列的工作流程,這其中最難的工作就是物體識(shí)別。
在一張集成了錯(cuò)綜復(fù)雜的線條、色彩與光影的照片中,如何較為精準(zhǔn)地區(qū)分出物體的輪廓?這就回到了卷積神經(jīng)網(wǎng)絡(luò)技術(shù),通過不斷的訓(xùn)練與學(xué)習(xí),一步步地對(duì)目標(biāo)圖片中物體進(jìn)行“篩選”和“過濾”,最后就會(huì)得到較為清晰的物體輪廓,進(jìn)而用算法生成與經(jīng)典畫作一樣風(fēng)格的照片。因此在進(jìn)行AI任務(wù),如用Prisma軟件修圖時(shí),擁有不同AI算力的智能手機(jī)表現(xiàn)也會(huì)有顯著的差距。華為麒麟980等集成獨(dú)立NPU單元的Soc對(duì)于卷積神經(jīng)網(wǎng)絡(luò)運(yùn)算的支持更加到位,這是由于卷積神經(jīng)網(wǎng)絡(luò)在運(yùn)算時(shí)需要進(jìn)行大量的并行計(jì)算。相比依賴CPU等進(jìn)行AI運(yùn)算的芯片,具有獨(dú)立NPU的芯片有著4倍的速度與僅僅1/50的功耗。
其次,AI功能的落地離不開軟件的支持。華為在軟件上打造了一個(gè)完成度非常高的AI閉環(huán)。從打開手機(jī)開始,用戶可以使用系統(tǒng)層面的智能情景助手和智能語音助手小藝;打開相機(jī),可以用AI攝影大師進(jìn)行場(chǎng)景識(shí)別并自動(dòng)優(yōu)化拍攝參數(shù);打開AI識(shí)物可以識(shí)別食物的卡路里、搜索看到的商品或者進(jìn)行即時(shí)翻譯,等等……用戶隨時(shí)隨地都在使用著真實(shí)可感的AI服務(wù)。
另外,隨著對(duì)于復(fù)雜AI工作場(chǎng)景的不斷開發(fā),必然要實(shí)現(xiàn)終端(智能手機(jī))到云端(服務(wù)器)的協(xié)同計(jì)算。因?yàn)橛布旧淼乃懔Ξ吘故怯邢薜?,只有借力于云端服?wù)器,才能實(shí)現(xiàn)更好的AI運(yùn)算。
譬如當(dāng)用戶將鏡頭對(duì)準(zhǔn)一只不知其種類的小狗,終端和云端的AI接力開始。終端芯片憑借NPU迅速地識(shí)別鏡頭下小狗的各種特征,首先識(shí)別出它是一只狗,但可能儲(chǔ)存在手機(jī)內(nèi)部的算法并不知道具體是一只什么狗。此時(shí)云端存儲(chǔ)的不同品種小狗的特征進(jìn)行對(duì)比和校驗(yàn),最后在屏幕上顯示出小狗的準(zhǔn)確種類讓用戶了解,這只是一個(gè)很小的AI協(xié)同工作的場(chǎng)景,但舉一反三,未來在手機(jī)會(huì)做出更多令人期待的功能。
因此在華為HiAI 2.0中,開發(fā)了基于 “芯、端、云”三層AI生態(tài),HiAI Foundation芯片能力、HiAI Engine應(yīng)用能力與HiAI Service服務(wù)能力,以芯、端、云結(jié)合的三層開放能力滿足開發(fā)者的各種需求。在未來,更多成熟的AI應(yīng)用一定是有賴于完善的AI計(jì)算與開發(fā)平臺(tái)。打通芯片(硬件)—系統(tǒng)及APP(軟件)—云端(計(jì)算)這一完整的通路,才能實(shí)現(xiàn)更好的AI功能。
總結(jié):
如今的智能手機(jī)行業(yè)顯然已經(jīng)到了一個(gè)關(guān)鍵的十字路口。處理器性能的單純提高和硬件上的進(jìn)化,在過去的十年里充當(dāng)了這個(gè)行業(yè)主要的任務(wù),而在這些基礎(chǔ)性能之上,如今AI已經(jīng)成為智能手機(jī)通向未來的一把鑰匙,在算力和數(shù)據(jù)的馬太效應(yīng)之下,會(huì)加速智能手機(jī)AI的進(jìn)化速度。對(duì)于智能手機(jī)來說,隨著上游芯片廠商的推動(dòng),AI的上半場(chǎng)已經(jīng)逐漸塵埃落定,而下半場(chǎng),哨音已響。
評(píng)論