從圖像識(shí)別到視頻識(shí)別微軟小冰拿什么和谷歌PK人工智能？

作者：時(shí)間：2016-07-06 來(lái)源：安防知識(shí)網(wǎng)

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫(kù)查詢(xún)

　　1956年的夏天，一場(chǎng)在美國(guó)達(dá)特茅斯(Dartmouth)大學(xué)召開(kāi)的學(xué)術(shù)會(huì)議，多年以后被認(rèn)定為全球人工智能研究的起點(diǎn)。2016年的春天，一場(chǎng)AlphaGo與世界頂級(jí)圍棋高手李世石的人機(jī)世紀(jì)對(duì)戰(zhàn)，把全球推上了人工智能浪潮的新高。

本文引用地址：http://www.butianyuan.cn/article/201607/293647.htm

　　經(jīng)歷了兩次起伏，人工智能現(xiàn)在進(jìn)入了全球爆發(fā)的前夜。僅在中國(guó)就有上億人直接或間接地觀看了AlphaGo與李世石的比賽，而在2016年初，還有IBM在全球大舉推廣基于IBM Watson的認(rèn)知計(jì)算，Watson的前身就是1997年打敗了國(guó)際象棋大師卡斯帕羅夫的“深藍(lán)”。而2014年，微軟的人工智能機(jī)器人小冰也同樣在社交平臺(tái)掀起一股前所未有的“調(diào)戲”熱潮。

　　視頻識(shí)別成人工智能的重要突破

　　當(dāng)AlphaGo戰(zhàn)勝李世石的消息傳來(lái)，有人評(píng)價(jià)說(shuō)：“這是人工智能一個(gè)時(shí)代的開(kāi)始。”

　　兩次人機(jī)大戰(zhàn)時(shí)隔20年，這其中最重要的差別在于象棋與圍棋的復(fù)雜度差異巨大。人工智能之所以能夠先戰(zhàn)勝?lài)?guó)際象棋冠軍，在于國(guó)際象棋可以窮盡接近所有可能的棋局，而圍棋就不一樣了，其運(yùn)算量接近無(wú)窮大。

　　而與谷歌的選擇不同，微軟則將計(jì)算機(jī)視覺(jué)作為主要突破點(diǎn)。因?yàn)槲④浵嘈湃斯ぶ悄芤谌肴祟?lèi)世界，沒(méi)有視覺(jué)識(shí)別能力的機(jī)器人無(wú)法真正與外界交互。2015年，在微軟等大公司的推動(dòng)下，計(jì)算機(jī)視覺(jué)已經(jīng)逼近全面突破的拐點(diǎn)。微軟不僅在ImageNet全球頂級(jí)的計(jì)算機(jī)視覺(jué)挑戰(zhàn)賽奪得冠軍，微軟人工智能機(jī)器人小冰還率先發(fā)布了圖像識(shí)別技能。在準(zhǔn)確的圖像識(shí)別的基礎(chǔ)上，結(jié)合人工智能自己的觀點(diǎn)，對(duì)圖片進(jìn)行人性化的評(píng)論。

　　而就在這幾天，微軟再次對(duì)小冰的視覺(jué)感官進(jìn)行升級(jí)，實(shí)現(xiàn)了對(duì)視頻的識(shí)別和評(píng)論。率先實(shí)現(xiàn)了對(duì)人類(lèi)視覺(jué)感官的模擬。從靜態(tài)圖片到動(dòng)態(tài)視頻，人工智能機(jī)器人小冰率先實(shí)現(xiàn)了對(duì)人類(lèi)視覺(jué)感官的模擬。開(kāi)辟了一條與谷歌不同的人工智能發(fā)展之路。當(dāng)然，從圖片識(shí)別到視頻識(shí)別，這一技術(shù)跨越是巨大的。半年前，Google人工智能的兩位軟件工程師在博客上公布了關(guān)于人工智能的一些研究成果，其中很重要的一個(gè)突破是，能夠初步辨識(shí)出動(dòng)態(tài)視頻的內(nèi)容。他們的最終目標(biāo)不僅要分辨出圖像中的物體或人，還要搞清楚他們?cè)诟墒裁础６谇岸螘r(shí)間召開(kāi)的Facebook開(kāi)發(fā)者大會(huì)上，扎克伯格也透露將會(huì)把人工智能(AI)巧妙的運(yùn)用在視頻播放中，根據(jù)視頻中人物的服飾、身材、發(fā)型等識(shí)別并標(biāo)記人物，方便用戶(hù)日后檢索。小扎也明確表示，相比靜態(tài)圖像的識(shí)別，視頻識(shí)別更為困難，對(duì)技術(shù)的挑戰(zhàn)更大。

　　視頻識(shí)別擴(kuò)展人工智能的想象空間

　　巨頭們極力看好并且大力發(fā)展人工智能，根本目的是讓人工智能幫助人類(lèi)從低效率的重復(fù)勞動(dòng)中解放出來(lái)，幫助我們解決很多依靠自身無(wú)法很好解決的問(wèn)題。

　　在很多經(jīng)典的美國(guó)大片中，我們經(jīng)?？吹骄炜梢酝ㄟ^(guò)全國(guó)的交通及安防攝像頭追蹤疑犯的動(dòng)向，從而幫助警察迅速破案。但實(shí)際上，受于技術(shù)上的限制，現(xiàn)實(shí)生活中對(duì)視頻內(nèi)容的分析依然以人工為主，所以經(jīng)常看到國(guó)內(nèi)新聞媒體報(bào)道，某地警察通過(guò)調(diào)取案發(fā)現(xiàn)場(chǎng)附近監(jiān)控視頻經(jīng)過(guò)數(shù)小時(shí)的分析終于確定疑犯容貌從而成功將其抓獲歸案。除了抓疑犯，通過(guò)調(diào)取監(jiān)控?cái)z像頭數(shù)據(jù)進(jìn)行分析對(duì)于尋找失蹤小孩也是有非常大的幫助，但是目前技術(shù)條件下，通過(guò)人工分析視頻效率非常低下，讓視頻監(jiān)控的價(jià)值大打折扣。

　　如果人工智能在視頻識(shí)別、視頻分析等方面取得重大突破，那么只需要輸入一張照片做參照，即可讓機(jī)器從一個(gè)地區(qū)數(shù)以千計(jì)的視頻監(jiān)控服務(wù)器中快速查找定位到相應(yīng)目標(biāo)，工作效率及準(zhǔn)確度是人工分析根本無(wú)法比擬的。這也是為什么微軟小冰視頻識(shí)別能力發(fā)布后讓許多人感到興奮的重要原因，這代表著人工智能在視頻分析方面再次取得突破，后面將以此為基礎(chǔ)產(chǎn)生很多具備良好想象空間的應(yīng)用案例。微軟對(duì)于人工智能、計(jì)算機(jī)視覺(jué)的投入正不斷加大，小冰自發(fā)布以來(lái)也經(jīng)歷了脫胎換骨的變化。微軟人工智能的下一步走向哪里，十分值得期待。