新聞中心

EEPW首頁 > 消費(fèi)電子 > 業(yè)界動態(tài) > 蘋果透漏人工智能研究新方向:圖像識別

蘋果透漏人工智能研究新方向:圖像識別

作者: 時(shí)間:2017-01-19 來源:中國安防展覽網(wǎng) 收藏

  據(jù)外媒報(bào)道,日前發(fā)布首份關(guān)于(AI)的學(xué)術(shù)論文,其中主要描述了在計(jì)算機(jī)視覺系統(tǒng)中提高圖像識別的方法,這標(biāo)志著終于透露了其研究的全新方向。

本文引用地址:http://butianyuan.cn/article/201701/343131.htm

  其實(shí)對于圖像識別技術(shù),大家已經(jīng)不陌生。由于涉及個(gè)人隱私問題,雖然在電視機(jī)和空調(diào)上,無法直接應(yīng)用圖像識別技術(shù),但是在冰箱上的應(yīng)用,卻很早就受到長虹美菱、海爾,以及美的等家電巨頭的認(rèn)可和推動。但目前市場化商用的力度并不大。

  發(fā)布的首份關(guān)于(AI)的學(xué)術(shù)論文,主要描述了在計(jì)算機(jī)視覺系統(tǒng)中提高圖像識別的方法,在機(jī)器學(xué)習(xí)研究中,使用合成圖像進(jìn)行神經(jīng)網(wǎng)絡(luò)訓(xùn)練要比真實(shí)圖像更有效。原因在于合成圖像已經(jīng)被標(biāo)記和注釋,更加省時(shí)省力。舉例來說,眼部或手部的合成圖像都有自動注釋,而描述類似物品的真實(shí)圖片算法并不熟悉,因此需要人類操作員進(jìn)行描述。

  當(dāng)前人工智能軟件在各個(gè)領(lǐng)域,正變得必不可少。它幾乎被應(yīng)用到所有的應(yīng)用程序中。運(yùn)用人工智能技術(shù),無論是圖像識別,還是語音識別,正變得越來越準(zhǔn)確,這包括機(jī)器能準(zhǔn)確識別語音、語義甚至靜態(tài)的圖片以及動態(tài)的視頻。

  如在智能家居領(lǐng)域,通過攝像頭獲取到圖像,然后通過圖像識別技術(shù)識別出圖像的內(nèi)容,從而做出不同的響應(yīng)。舉個(gè)例子,我們在門口安裝了攝像頭,當(dāng)有物體出現(xiàn)在攝像頭范圍內(nèi)的時(shí)候,攝像頭自動拍攝下圖像,對圖像進(jìn)行識別。識別后如果發(fā)現(xiàn)是個(gè)人,并且長時(shí)間在門外并沒有敲門進(jìn)門等行為之后,就可以及時(shí)報(bào)警給戶主?;蛘?,在夜晚的時(shí)候發(fā)現(xiàn)有物體移動,對物體進(jìn)行識別,如果是可疑的物體就主動報(bào)警。

  當(dāng)門口的攝像頭識別到人之后,再進(jìn)一步的對人像在進(jìn)行面部識別。如果能和主人的面部匹配上,就為主人主動開門。還有現(xiàn)在家庭里的智能機(jī)器人,通過圖像識別技術(shù)對物體進(jìn)行識別,并且實(shí)現(xiàn)對人的跟隨。搭配上人工智能系統(tǒng),它能分辨出你是它的哪個(gè)主人,并且能你進(jìn)行一些簡單的互動。比如檢測到是家里的老人,它可能會為你測一測血壓;如果是小孩子,它可能給你講個(gè)故事。

  事實(shí)上圖像識別元不僅如此,圖像識別可分為生物識別、物體與場景識別和視頻識別。據(jù)估算,到2020年生物識別技術(shù)市場規(guī)模將達(dá)到250億美元,5年內(nèi)年均增速約14%。其中,人臉識別增速最快,將從2015年的9億美元增長到2020年的24億美元。

  在物體與場景識別中,機(jī)器視覺是一個(gè)重要的部分。預(yù)計(jì)2018年,全球機(jī)器視覺系統(tǒng)及部件市場規(guī)模達(dá)到50億美元。視頻識別主要用于安防產(chǎn)業(yè),我國未來5年總體年增長率仍將保持在20%左右,到2020年有望達(dá)到萬億元。

  隨著各領(lǐng)域?qū)τ谏矸葑R別和驗(yàn)證的精確度要求的提高,基于圖像識別技術(shù)的人臉識別和視頻識別技術(shù)在金融、安防、醫(yī)療、無人駕駛等領(lǐng)域迎來了發(fā)展機(jī)會。

  而隨著圖像識別技術(shù)的發(fā)展,高性能的AI計(jì)算芯片、深度攝像頭和優(yōu)秀的深度學(xué)習(xí)算法也在為推動圖像識別向更深處發(fā)展提供源源不斷的動力。AI底層架構(gòu)從CPU+GPU到FPGA,再到人工智能專用芯片,運(yùn)行表現(xiàn)不斷刷新。

  深度攝像頭的開發(fā)也加強(qiáng)了前端獲取深度信息的能力,為后端數(shù)據(jù)處理帶來了極大的便利。另外隨著以深度信念網(wǎng)絡(luò)(DBN)和卷積神經(jīng)網(wǎng)絡(luò)(CNN)為代表的深度學(xué)習(xí)算法在圖像識別中的廣泛應(yīng)用,圖像識別的準(zhǔn)確率得到了很大的提升。

  ImageNet比賽圖像識別中對象分類項(xiàng)目準(zhǔn)確率從2010年的72%提升到了今年的97%,可謂實(shí)現(xiàn)飛躍發(fā)展。圖像識別獲得了快速發(fā)展,應(yīng)用產(chǎn)品層出不窮,成為人工智能應(yīng)用的急先鋒。刷臉支付、機(jī)場自助通關(guān)、增強(qiáng)現(xiàn)實(shí)、無人駕駛等都是圖像識別技術(shù)快速普及的一個(gè)縮影。



關(guān)鍵詞: 蘋果 人工智能

評論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉