新聞中心

EEPW首頁 > 消費(fèi)電子 > 業(yè)界動態(tài) > 聚焦2016:關(guān)于語音識別、圖像識別及大數(shù)據(jù)

聚焦2016:關(guān)于語音識別、圖像識別及大數(shù)據(jù)

作者: 時間:2016-02-16 來源:智能視頻技術(shù) 收藏
編者按:語音識別和圖像識別讓我們跟智能設(shè)備之間的交互更自然,基于大數(shù)據(jù)的技術(shù)支持,讓識別變得主動而聰明,將走進(jìn)普通人的世界,讓我們的生活更生動。

  深度學(xué)習(xí)

本文引用地址:http://www.butianyuan.cn/article/201602/286964.htm

  沒有基礎(chǔ)的技術(shù)實(shí)力,語音和圖像是好玩不起來的,而高級和低級的門檻就在深度學(xué)習(xí)的研究上。國內(nèi)雖然起步較晚,好歹在去年趕上了這波風(fēng)潮,包括在內(nèi),還有自動駕駛、無人機(jī)、環(huán)境還原、機(jī)器人等項(xiàng)目,前段時間很火的谷歌AlphaGo在圍棋領(lǐng)域擊敗了歐洲二段冠軍,也是歸功于深度學(xué)習(xí)的算法支持。可以說跟用戶有交互行為的產(chǎn)品,都開始進(jìn)行深度學(xué)習(xí)AI的研究了。通過神經(jīng)網(wǎng)絡(luò)的訓(xùn)練學(xué)習(xí),變得更聰明, 實(shí)現(xiàn)快速精準(zhǔn)的識別動作以外,還能對下一句的語境情緒進(jìn)行預(yù)測,模擬真人對話。另外,大量運(yùn)用在翻譯市場,爭取未來十年內(nèi)在專業(yè)翻譯領(lǐng)域完全替代人類。過去大多是建庫識別,深度學(xué)習(xí)釋放了的識別領(lǐng)域,把識別對象的年齡變化記憶下來,實(shí)現(xiàn)動態(tài)、多角度、不同光照變化下的識別。



  應(yīng)用領(lǐng)域

  安防市場是要求語音和圖像識別技術(shù)雙高的行業(yè)之一,未來將不局限在解鎖開門等基礎(chǔ)功能,運(yùn)用圖像識別技術(shù),實(shí)現(xiàn)對象動作識別,根據(jù)威脅等級進(jìn)行危險性判斷,提前發(fā)出警報或報警。語音識別的運(yùn)用領(lǐng)域?qū)⒊叨嘶l(fā)展,近年來語音識別速度屢創(chuàng)新高,在翻譯市場、智能硬件助手、AI輔助,行車幫助等等方面實(shí)現(xiàn)價值。而娛樂領(lǐng)域的玩法變得多元化,像最近大熱的faceu,運(yùn)用了臉部識別跟蹤技術(shù),讓普通的自拍可以DIY。還有video++視頻開放平臺,可以對視頻中的明星、衣服同款進(jìn)行識別搜索,打開了視頻到電商的入口。乘著去年SaaS的風(fēng)口,國內(nèi)外陸續(xù)出現(xiàn)了語音識別、圖像識別的技術(shù)開放平臺,從專業(yè)到普通領(lǐng)域,語音識別和圖像識別將在2016年做到技術(shù)全覆蓋。



  大數(shù)據(jù)

  數(shù)據(jù)收集是一個從被動到主動的過程,語音識別從接受指令變成了對指令使用頻率的分析,進(jìn)而形成用戶的習(xí)慣圖表。圖像識別亦然,針對用戶的識別頻率,分析出用戶的興趣畫像,這將給予廣告主帶來精準(zhǔn)廣告推送的商機(jī)?! ?/p>


上一頁 1 2 下一頁

關(guān)鍵詞: 語音識別 圖像識別

評論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉