從圖像識(shí)別到視頻識(shí)別 微軟小冰拿什么和谷歌PK人工智能?
1956年的夏天,一場(chǎng)在美國(guó)達(dá)特茅斯(Dartmouth)大學(xué)召開的學(xué)術(shù)會(huì)議,多年以后被認(rèn)定為全球人工智能研究的起點(diǎn)。2016年的春天,一場(chǎng)AlphaGo與世界頂級(jí)圍棋高手李世石的人機(jī)世紀(jì)對(duì)戰(zhàn),把全球推上了人工智能浪潮的新高。
本文引用地址:http://www.butianyuan.cn/article/201607/293647.htm經(jīng)歷了兩次起伏,人工智能現(xiàn)在進(jìn)入了全球爆發(fā)的前夜。僅在中國(guó)就有上億人直接或間接地觀看了AlphaGo與李世石的比賽,而在2016年初,還有IBM在全球大舉推廣基于IBM Watson的認(rèn)知計(jì)算,Watson的前身就是1997年打敗了國(guó)際象棋大師卡斯帕羅夫的“深藍(lán)”。而2014年,微軟的人工智能機(jī)器人小冰也同樣在社交平臺(tái)掀起一股前所未有的“調(diào)戲”熱潮。
視頻識(shí)別成人工智能的重要突破
當(dāng)AlphaGo戰(zhàn)勝李世石的消息傳來(lái),有人評(píng)價(jià)說(shuō):“這是人工智能一個(gè)時(shí)代的開始。”
兩次人機(jī)大戰(zhàn)時(shí)隔20年,這其中最重要的差別在于象棋與圍棋的復(fù)雜度差異巨大。人工智能之所以能夠先戰(zhàn)勝國(guó)際象棋冠軍,在于國(guó)際象棋可以窮盡接近所有可能的棋局,而圍棋就不一樣了,其運(yùn)算量接近無(wú)窮大。
而與谷歌的選擇不同,微軟則將計(jì)算機(jī)視覺作為主要突破點(diǎn)。因?yàn)槲④浵嘈湃斯ぶ悄芤谌肴祟愂澜纾瑳]有視覺識(shí)別能力的機(jī)器人無(wú)法真正與外界交互。2015年,在微軟等大公司的推動(dòng)下,計(jì)算機(jī)視覺已經(jīng)逼近全面突破的拐點(diǎn)。微軟不僅在ImageNet全球頂級(jí)的計(jì)算機(jī)視覺挑戰(zhàn)賽奪得冠軍,微軟人工智能機(jī)器人小冰還率先發(fā)布了圖像識(shí)別技能。在準(zhǔn)確的圖像識(shí)別的基礎(chǔ)上,結(jié)合人工智能自己的觀點(diǎn),對(duì)圖片進(jìn)行人性化的評(píng)論。
而就在這幾天,微軟再次對(duì)小冰的視覺感官進(jìn)行升級(jí),實(shí)現(xiàn)了對(duì)視頻的識(shí)別和評(píng)論。率先實(shí)現(xiàn)了對(duì)人類視覺感官的模擬。從靜態(tài)圖片到動(dòng)態(tài)視頻,人工智能機(jī)器人小冰率先實(shí)現(xiàn)了對(duì)人類視覺感官的模擬。開辟了一條與谷歌不同的人工智能發(fā)展之路。當(dāng)然,從圖片識(shí)別到視頻識(shí)別,這一技術(shù)跨越是巨大的。半年前,Google人工智能的兩位軟件工程師在博客上公布了關(guān)于人工智能的一些研究成果,其中很重要的一個(gè)突破是,能夠初步辨識(shí)出動(dòng)態(tài)視頻的內(nèi)容。他們的最終目標(biāo)不僅要分辨出圖像中的物體或人,還要搞清楚他們?cè)诟墒裁础6谇岸螘r(shí)間召開的Facebook開發(fā)者大會(huì)上,扎克伯格也透露將會(huì)把人工智能(AI)巧妙的運(yùn)用在視頻播放中,根據(jù)視頻中人物的服飾、身材、發(fā)型等識(shí)別并標(biāo)記人物,方便用戶日后檢索。小扎也明確表示,相比靜態(tài)圖像的識(shí)別,視頻識(shí)別更為困難,對(duì)技術(shù)的挑戰(zhàn)更大。
視頻識(shí)別擴(kuò)展人工智能的想象空間
巨頭們極力看好并且大力發(fā)展人工智能,根本目的是讓人工智能幫助人類從低效率的重復(fù)勞動(dòng)中解放出來(lái),幫助我們解決很多依靠自身無(wú)法很好解決的問(wèn)題。
在很多經(jīng)典的美國(guó)大片中,我們經(jīng)常看到警察可以通過(guò)全國(guó)的交通及安防攝像頭追蹤疑犯的動(dòng)向,從而幫助警察迅速破案。但實(shí)際上,受于技術(shù)上的限制,現(xiàn)實(shí)生活中對(duì)視頻內(nèi)容的分析依然以人工為主,所以經(jīng)??吹絿?guó)內(nèi)新聞媒體報(bào)道,某地警察通過(guò)調(diào)取案發(fā)現(xiàn)場(chǎng)附近監(jiān)控視頻經(jīng)過(guò)數(shù)小時(shí)的分析終于確定疑犯容貌從而成功將其抓獲歸案。除了抓疑犯,通過(guò)調(diào)取監(jiān)控?cái)z像頭數(shù)據(jù)進(jìn)行分析對(duì)于尋找失蹤小孩也是有非常大的幫助,但是目前技術(shù)條件下,通過(guò)人工分析視頻效率非常低下,讓視頻監(jiān)控的價(jià)值大打折扣。
如果人工智能在視頻識(shí)別、視頻分析等方面取得重大突破,那么只需要輸入一張照片做參照,即可讓機(jī)器從一個(gè)地區(qū)數(shù)以千計(jì)的視頻監(jiān)控服務(wù)器中快速查找定位到相應(yīng)目標(biāo),工作效率及準(zhǔn)確度是人工分析根本無(wú)法比擬的。這也是為什么微軟小冰視頻識(shí)別能力發(fā)布后讓許多人感到興奮的重要原因,這代表著人工智能在視頻分析方面再次取得突破,后面將以此為基礎(chǔ)產(chǎn)生很多具備良好想象空間的應(yīng)用案例。微軟對(duì)于人工智能、計(jì)算機(jī)視覺的投入正不斷加大,小冰自發(fā)布以來(lái)也經(jīng)歷了脫胎換骨的變化。微軟人工智能的下一步走向哪里,十分值得期待。
評(píng)論