?？低曆芯吭涸洪L(zhǎng)浦世亮談深度學(xué)習(xí)+安防

作者：時(shí)間：2017-03-28 來源：新智元

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫查詢

　　備受關(guān)注的計(jì)算機(jī)視覺國際大賽——ImageNet 大規(guī)模圖像識(shí)別挑戰(zhàn)賽(ILSVRC2017)已經(jīng)拉開帷幕，今年的比賽分為四個(gè)主要項(xiàng)目：定位、識(shí)別以及視頻中物體識(shí)別和Tester Challenges。去年在比賽中拿下場(chǎng)景分類關(guān)鍵的深度學(xué)習(xí)與安防行業(yè)現(xiàn)狀的10個(gè)問題進(jìn)行了深入解讀。

本文引用地址：http://www.butianyuan.cn/article/201703/345833.htm

　　根據(jù) ImageNet官網(wǎng)的最新消息，今年的 ImageNet 大規(guī)模圖像識(shí)別挑戰(zhàn)賽(ILSVRC2017)已經(jīng)拉開帷幕。

　　今年的比賽項(xiàng)目分為4個(gè)：

　　物體定位

　　物體識(shí)別

　　視頻中物體識(shí)別

　　Tester Challenges

　　官網(wǎng)特別提示：已經(jīng)使用了幾種算法的參與者可以每個(gè)算法提交一個(gè)結(jié)果(最多5個(gè)算法)。算法參數(shù)的變化不構(gòu)成不同的算法(遵循PASCAL VOC中使用的過程)。

　　去年的 ImageNet上，來自中國的團(tuán)隊(duì)大放異彩：CUImage(商湯和港中文)，Trimps-Soushen(公安部三所)，CUvideo(商湯和港中文)，HikVision(

　　其中，

　　另外，在物體探測(cè)任務(wù)上，?？低曇灿辛裂郾憩F(xiàn)：

　　?？低曔@家做安防出身的企業(yè)目前在計(jì)算機(jī)視覺上已在國際上取得領(lǐng)先的地位，除了ImageNet 外，在PASCAL、KITTI和MOT等競(jìng)賽中都有亮眼表現(xiàn)。

　　根據(jù)海康威視首席專家浦世亮介紹，在PASCAL VOC2012目標(biāo)檢測(cè)上，海康威視基于Faster R-CNN 深度學(xué)習(xí)目標(biāo)檢測(cè)算法mAP性能達(dá)到87.9，排名第一，領(lǐng)先盤踞榜首近一年的第二名微軟4.1個(gè)點(diǎn)，刷新紀(jì)錄。

　　新智元最新一期的AI領(lǐng)軍人物專訪采訪到了海康威視首席專家、研究院院長(zhǎng)浦世亮，他分享了?？低晩Z冠 ImageNet 背后的技術(shù)，談到 2017年，深度學(xué)習(xí)在復(fù)雜網(wǎng)絡(luò)設(shè)計(jì)、模型壓縮方向的研究依然是熱點(diǎn)，深度學(xué)習(xí)和LSTM、增強(qiáng)學(xué)習(xí)的結(jié)合進(jìn)一步加強(qiáng)。另外，針對(duì)當(dāng)下安防行業(yè)的智能+現(xiàn)狀，他也提出了獨(dú)特的見解。

　　浦世亮 ?？低曆芯吭涸洪L(zhǎng)

　　浦世亮，法國國家科學(xué)研究院(CNRS)博士，浙江大學(xué)理學(xué)博士，現(xiàn)任?？低暿紫瘜＜?、研究院院長(zhǎng)，負(fù)責(zé)公司在人工智能及大數(shù)據(jù)領(lǐng)域的技術(shù)研究。浦世亮帶領(lǐng)研究院研發(fā)的Smart 265編碼技術(shù)、目標(biāo)結(jié)構(gòu)化算法、車牌識(shí)別算法、人臉識(shí)別算法、視頻檢索引擎、多傳感器融合等技術(shù)，被廣泛應(yīng)用于公共安全、金融、交通、司法、零售、智慧城市等多個(gè)領(lǐng)域。

　　?？低?nbsp;ImageNet 2016 奪冠背后技術(shù)詳解

　　去年 ImageNet 大規(guī)模圖像識(shí)別挑戰(zhàn)賽(ILSVRC)中，?？低?HikVision)拿下場(chǎng)景分類項(xiàng)目的冠軍。你能具體介紹一下這一比賽項(xiàng)目嗎??？低晩Z冠的技術(shù)核心是什么?

　　浦世亮：ImageNet 場(chǎng)景分類任務(wù)采用MIT發(fā)布的 Place2 數(shù)據(jù)集，其目的是對(duì)圖像中存在的場(chǎng)景進(jìn)行識(shí)別。該數(shù)據(jù)集擁有365個(gè)類別的場(chǎng)景目標(biāo)，800多萬張已經(jīng)標(biāo)記的訓(xùn)練樣本。相對(duì)于普通的ImageNet圖像分類任務(wù)，場(chǎng)景分類任務(wù)的難點(diǎn)在于其數(shù)據(jù)分布非常不均衡，每個(gè)類別的數(shù)據(jù)從5000 到 30000不等，每張圖像都可能在不同的場(chǎng)景描述和相對(duì)更模糊的場(chǎng)景標(biāo)簽。

　　場(chǎng)景分類技術(shù)，對(duì)于視頻產(chǎn)業(yè)及其應(yīng)用領(lǐng)域有比較重要的應(yīng)用價(jià)值，基于對(duì)場(chǎng)景的理解有助于我們的系統(tǒng)更好地對(duì)于視頻中的信息進(jìn)行理解和應(yīng)用。

　　海康威視從成立之初就專注于計(jì)算機(jī)視覺領(lǐng)域技術(shù)的研發(fā)，13年就開始深度學(xué)習(xí)的技術(shù)布局，實(shí)現(xiàn)了一整套的深度學(xué)習(xí)訓(xùn)練框架，并探索了深度神經(jīng)網(wǎng)絡(luò)的優(yōu)化算法，包括對(duì)網(wǎng)絡(luò)參數(shù)初始化、超參數(shù)搜索、正則項(xiàng)、損失函數(shù)、流形優(yōu)化理論等的研究。