海康威視研究院院長(zhǎng)浦世亮談深度學(xué)習(xí)+安防
備受關(guān)注的計(jì)算機(jī)視覺(jué)國(guó)際大賽——ImageNet 大規(guī)模圖像識(shí)別挑戰(zhàn)賽(ILSVRC2017)已經(jīng)拉開(kāi)帷幕,今年的比賽分為四個(gè)主要項(xiàng)目:定位、識(shí)別以及視頻中物體識(shí)別和Tester Challenges。去年在比賽中拿下場(chǎng)景分類關(guān)鍵的??低?/em>首席專家浦世亮近日接受新智元專訪,他談到了去年參賽詳情和技術(shù)細(xì)節(jié)。他也對(duì)深度學(xué)習(xí)與安防行業(yè)現(xiàn)狀的10個(gè)問(wèn)題進(jìn)行了深入解讀。
本文引用地址:http://butianyuan.cn/article/201703/345833.htm根據(jù) ImageNet官網(wǎng)的最新消息,今年的 ImageNet 大規(guī)模圖像識(shí)別挑戰(zhàn)賽(ILSVRC2017)已經(jīng)拉開(kāi)帷幕。
今年的比賽項(xiàng)目分為4個(gè):
物體定位
物體識(shí)別
視頻中物體識(shí)別
Tester Challenges
官網(wǎng)特別提示:已經(jīng)使用了幾種算法的參與者可以每個(gè)算法提交一個(gè)結(jié)果(最多5個(gè)算法)。算法參數(shù)的變化不構(gòu)成不同的算法(遵循PASCAL VOC中使用的過(guò)程)。
去年的 ImageNet上,來(lái)自中國(guó)的團(tuán)隊(duì)大放異彩:CUImage(商湯和港中文),Trimps-Soushen(公安部三所),CUvideo(商湯和港中文),HikVision(
另外,在物體探測(cè)任務(wù)上,??低曇灿辛裂郾憩F(xiàn):
??低曔@家做安防出身的企業(yè)目前在計(jì)算機(jī)視覺(jué)上已在國(guó)際上取得領(lǐng)先的地位,除了ImageNet 外,在PASCAL、KITTI和MOT等競(jìng)賽中都有亮眼表現(xiàn)。
根據(jù)??低暿紫瘜<移质懒两榻B,在PASCAL VOC2012目標(biāo)檢測(cè)上,??低暬贔aster R-CNN深度學(xué)習(xí)目標(biāo)檢測(cè)算法mAP性能達(dá)到87.9,排名第一,領(lǐng)先盤踞榜首近一年的第二名微軟4.1個(gè)點(diǎn),刷新紀(jì)錄。
新智元最新一期的AI領(lǐng)軍人物專訪采訪到了??低暿紫瘜<?、研究院院長(zhǎng)浦世亮,他分享了??低晩Z冠 ImageNet 背后的技術(shù),談到 2017年,深度學(xué)習(xí)在復(fù)雜網(wǎng)絡(luò)設(shè)計(jì)、模型壓縮方向的研究依然是熱點(diǎn),深度學(xué)習(xí)和LSTM、增強(qiáng)學(xué)習(xí)的結(jié)合進(jìn)一步加強(qiáng)。另外,針對(duì)當(dāng)下安防行業(yè)的智能+現(xiàn)狀,他也提出了獨(dú)特的見(jiàn)解。
浦世亮 ??低曆芯吭涸洪L(zhǎng)
浦世亮,法國(guó)國(guó)家科學(xué)研究院(CNRS)博士,浙江大學(xué)理學(xué)博士,現(xiàn)任??低暿紫瘜<?、研究院院長(zhǎng),負(fù)責(zé)公司在人工智能及大數(shù)據(jù)領(lǐng)域的技術(shù)研究。浦世亮帶領(lǐng)研究院研發(fā)的Smart 265編碼技術(shù)、目標(biāo)結(jié)構(gòu)化算法、車牌識(shí)別算法、人臉識(shí)別算法、視頻檢索引擎、多傳感器融合等技術(shù),被廣泛應(yīng)用于公共安全、金融、交通、司法、零售、智慧城市等多個(gè)領(lǐng)域。
??低?nbsp;ImageNet 2016 奪冠背后技術(shù)詳解
去年 ImageNet 大規(guī)模圖像識(shí)別挑戰(zhàn)賽(ILSVRC)中,??低?HikVision)拿下場(chǎng)景分類項(xiàng)目的冠軍。你能具體介紹一下這一比賽項(xiàng)目嗎???低晩Z冠的技術(shù)核心是什么?
浦世亮:ImageNet 場(chǎng)景分類任務(wù)采用MIT發(fā)布的 Place2 數(shù)據(jù)集,其目的是對(duì)圖像中存在的場(chǎng)景進(jìn)行識(shí)別。該數(shù)據(jù)集擁有365個(gè)類別的場(chǎng)景目標(biāo),800多萬(wàn)張已經(jīng)標(biāo)記的訓(xùn)練樣本。相對(duì)于普通的ImageNet圖像分類任務(wù),場(chǎng)景分類任務(wù)的難點(diǎn)在于其數(shù)據(jù)分布非常不均衡,每個(gè)類別的數(shù)據(jù)從5000 到 30000不等,每張圖像都可能在不同的場(chǎng)景描述和相對(duì)更模糊的場(chǎng)景標(biāo)簽。
場(chǎng)景分類技術(shù),對(duì)于視頻產(chǎn)業(yè)及其應(yīng)用領(lǐng)域有比較重要的應(yīng)用價(jià)值,基于對(duì)場(chǎng)景的理解有助于我們的系統(tǒng)更好地對(duì)于視頻中的信息進(jìn)行理解和應(yīng)用。
海康威視從成立之初就專注于計(jì)算機(jī)視覺(jué)領(lǐng)域技術(shù)的研發(fā),13年就開(kāi)始深度學(xué)習(xí)的技術(shù)布局,實(shí)現(xiàn)了一整套的深度學(xué)習(xí)訓(xùn)練框架,并探索了深度神經(jīng)網(wǎng)絡(luò)的優(yōu)化算法,包括對(duì)網(wǎng)絡(luò)參數(shù)初始化、超參數(shù)搜索、正則項(xiàng)、損失函數(shù)、流形優(yōu)化理論等的研究。
另外,我們還從信號(hào)調(diào)制方向切入,圍繞信號(hào)在網(wǎng)絡(luò)前向反向傳輸中的保范性(norm-preserving),探索深層網(wǎng)絡(luò)優(yōu)化的可行性與新方向。
評(píng)論