機(jī)器學(xué)習(xí)不斷接近人腦水平，AI圖像識別未來發(fā)展如何？

作者：時(shí)間：2018-12-26 來源：網(wǎng)絡(luò)

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢

編者按：過去十幾年，人類可以說是在機(jī)器智能面前節(jié)節(jié)退敗，但是機(jī)器的每一點(diǎn)進(jìn)步都依賴于不斷模擬和接近人腦的水平，提升AI在場景應(yīng)用上的工程能力，會(huì)為生活帶來更多的便利。

　　過去十幾年，人類可以說是在機(jī)器智能面前節(jié)節(jié)退敗，屢敗屢戰(zhàn)，而多任務(wù)處理(multi-tasking)幾乎是為數(shù)不多可以讓人類驕傲的事情了。人們可以同時(shí)打開8個(gè)網(wǎng)站、數(shù)份文檔和一個(gè)交友軟件，即使正在專心處理其中一件事，只要突然收到一條回復(fù)或更新提醒，也能夠快速安排。對機(jī)器而言，要在同一時(shí)間完成這樣的任務(wù)顯然有點(diǎn)困難，因此，多任務(wù)處理一直被視為人類獨(dú)有的技能點(diǎn)。

本文引用地址：http://butianyuan.cn/article/201812/396039.htm

　　然而，這個(gè)優(yōu)勢也將失去了。

　　近幾年，Alphago、視頻識別、指紋解鎖、圖片識別、語音轉(zhuǎn)文字、機(jī)器人看病等一系列事件，使我們深刻的感受到人工智能在改變我們的工作方式和認(rèn)知。國內(nèi)人工智能產(chǎn)業(yè)中，就算集視覺與圖像領(lǐng)域公司的數(shù)量已達(dá)數(shù)百家，僅次于自然語言處理類公司，位居第二。其中該領(lǐng)域最為出名的創(chuàng)業(yè)公司包括曠世科技Face++、商湯科技、極鏈科技Video++等。

　　一百多年前，電改變了生產(chǎn)、交通和農(nóng)業(yè)等產(chǎn)業(yè)，而今天，人工智能也像電一樣將改變傳統(tǒng)產(chǎn)業(yè)。人臉識別和圖片識別是人工智能視覺與圖像領(lǐng)域中的兩大熱門應(yīng)用。但將人工智能技術(shù)單純用于圖片識別分析的應(yīng)用企業(yè)數(shù)量并不如預(yù)想的多，可能有以下幾個(gè)方面的原因：目前視頻監(jiān)控方面的盈利空間大，眾多企業(yè)的注意力都放在了視頻監(jiān)控領(lǐng)域，人臉識別屬于圖片識別的一個(gè)應(yīng)用場景，做人臉識別的大多數(shù)企業(yè)同時(shí)也在提供圖片識別服務(wù)，但是銷售效果不佳，主要贏利點(diǎn)還在于人臉識別等。

Video++極鏈科技金明:從文化娛樂產(chǎn)業(yè)看年輕人如何玩轉(zhuǎn)AI

　　識別物體是圖片分類的另一個(gè)比較常見的應(yīng)用，例如一個(gè)簡單的手機(jī)識別模型，我們首先要給計(jì)算機(jī)定義模型，然后準(zhǔn)備大量手機(jī)的照片去訓(xùn)練這個(gè)模型，讓計(jì)算機(jī)能識別出來，輸一張圖片的時(shí)候能識別出圖片是不是手機(jī)。正常情況下計(jì)算機(jī)模型能識別得比較準(zhǔn)確，但是當(dāng)我們輸入了一些有遮擋、形態(tài)多變或者角度多變、光照不易的圖片時(shí)，之前我們建立的模型就識別不出來了。這就是計(jì)算機(jī)視覺在應(yīng)用中尋在的難點(diǎn)問題。機(jī)器學(xué)習(xí)的本質(zhì)其實(shí)就是為了找到一個(gè)函數(shù)，讓這個(gè)函數(shù)在不同領(lǐng)域發(fā)揮不同的作用，像語音識別領(lǐng)域，這個(gè)函數(shù)會(huì)把一段語音識別成一段文字。圖像識別的領(lǐng)域，這個(gè)函數(shù)會(huì)把一個(gè)圖像映射到一個(gè)分類。

　　進(jìn)入21世紀(jì)，計(jì)算機(jī)視覺與計(jì)算機(jī)圖形學(xué)的相互影響日益加深，基于圖像的繪制成為研究熱點(diǎn)，高效求解復(fù)雜全局優(yōu)化問題的算法得到發(fā)展。到現(xiàn)在，通過技術(shù)迭代更新和機(jī)器學(xué)習(xí)，物體的識別率也已經(jīng)達(dá)到了相當(dāng)高的水平。像是極鏈科技Video++自主開發(fā)的文娛人工智能系統(tǒng)「VideoAI」已實(shí)現(xiàn)場景、物體、人臉、品牌、表情、動(dòng)作、地標(biāo)、視覺特征檢索8大維度的數(shù)據(jù)結(jié)構(gòu)化，同步生成軌跡流數(shù)據(jù)，通過復(fù)合推薦算法將元素信息升級為情景信息，直接賦能各種商業(yè)化場景。

　　通過SAS針對企業(yè)人工智能的調(diào)研報(bào)告可以看出，大部分企業(yè)認(rèn)為人工智能還處于初期階段，但我們也可以發(fā)現(xiàn)，正在部署的大量應(yīng)用場景都包含AI板塊。顯而易見我們必須學(xué)習(xí)新的技能來配合AI的發(fā)展，未來也是屬于意識到這一點(diǎn)并立即發(fā)展的企業(yè)。機(jī)器的每一點(diǎn)進(jìn)步都依賴于不斷模擬和接近人腦的水平，提升AI在場景應(yīng)用上的工程能力，會(huì)為生活帶來更多的便利。

新聞中心

機(jī)器學(xué)習(xí)不斷接近人腦水平，AI圖像識別未來發(fā)展如何？

評論

相關(guān)推薦

技術(shù)專區(qū)

新聞中心

機(jī)器學(xué)習(xí)不斷接近人腦水平，AI圖像識別未來發(fā)展如何？

評論

相關(guān)推薦

技術(shù)專區(qū)

機(jī)器學(xué)習(xí)不斷接近人腦水平，AI圖像識別未來發(fā)展如何？