新聞中心

EEPW首頁 > 智能計(jì)算 > 業(yè)界動(dòng)態(tài) > 盤點(diǎn)2018年計(jì)算機(jī)視覺領(lǐng)域技術(shù)突破

盤點(diǎn)2018年計(jì)算機(jī)視覺領(lǐng)域技術(shù)突破

作者: 時(shí)間:2019-01-07 來源:網(wǎng)絡(luò) 收藏
編者按:回顧2018年,是屬于人工智能的一年,不論是Google、Facebook、Intel、阿里巴巴等通過產(chǎn)業(yè)布局進(jìn)入人工智能領(lǐng)域的互聯(lián)網(wǎng)企業(yè),亦或如曠視科技Face++、極鏈科技Video++、優(yōu)必選科技這樣直接以人工智能起家的原生技術(shù)企業(yè),都將AI注入到每個(gè)角落,掀起了一輪又一輪的技術(shù)高潮。

  回顧2018年,是屬于的一年,不論是Google、Facebook、Intel、阿里巴巴等通過產(chǎn)業(yè)布局進(jìn)入領(lǐng)域的互聯(lián)網(wǎng)企業(yè),亦或如曠視科技Face++、極鏈科技Video++、優(yōu)必選科技這樣直接以起家的原生技術(shù)企業(yè),都將AI注入到每個(gè)角落,掀起了一輪又一輪的技術(shù)高潮。

本文引用地址:http://butianyuan.cn/article/201901/396390.htm

  因而,除了NLP研究突破接連不斷,CV領(lǐng)域同樣精彩紛呈,伴隨著各式各樣落地應(yīng)用如此接近人們的生活,技術(shù)也變得越發(fā)成熟。本文整理了在2018年,在CV技術(shù)領(lǐng)域取得的最主要的一些重大技術(shù)突破。

盤點(diǎn)2018年計(jì)算機(jī)視覺領(lǐng)域技術(shù)突破

  BigGAN發(fā)布

  Ian Goodfellow在2014年設(shè)計(jì)了GAN,在之后的幾年中,圍繞這個(gè)概念產(chǎn)生了多種多樣的應(yīng)用程序。

  其中,在ICLR 2019論文中出現(xiàn)的BigGAN,同樣是一個(gè)GAN,只不過更強(qiáng)大,是擁有了更聰明的課程學(xué)習(xí)技巧的GAN,由它訓(xùn)練生成的圖像連它自己都分辨不出真假,因?yàn)槌悄蔑@微鏡看,否則將無法判斷該圖像是否有任何問題,因而,它更被譽(yù)為史上最強(qiáng)的圖像生成器。

盤點(diǎn)2018年計(jì)算機(jī)視覺領(lǐng)域技術(shù)突破

  在計(jì)算機(jī)圖像研究史上,BigGAN帶來的突破是劃時(shí)代的,比如在ImageNet上進(jìn)行128×128分辨率的訓(xùn)練后,它的IS得分能達(dá)到166.3,是之前最佳得分52.52分3倍;除了搞定128×128小圖之外,BigGAN還能直接在256×256、512×512的ImageNet數(shù)據(jù)上訓(xùn)練,生成更讓人信服的樣本。

  英偉達(dá)Video-to-Video Synthesis

  英偉達(dá)在2018年的收獲頗豐,他們的研究焦點(diǎn)從標(biāo)準(zhǔn)的監(jiān)督學(xué)習(xí)轉(zhuǎn)向更具挑戰(zhàn)性的機(jī)器學(xué)習(xí),如半監(jiān)督學(xué)習(xí),領(lǐng)域適應(yīng),主動(dòng)學(xué)習(xí)和生成模型等。其中,由英偉達(dá)在2018年末發(fā)布的最大成果之一便是視頻到視頻生成(Video-to-Video synthesis),它通過精心設(shè)計(jì)的發(fā)生器、鑒別器網(wǎng)絡(luò)以及時(shí)空對(duì)抗物鏡,合成高分辨率、照片級(jí)真實(shí)、時(shí)間一致的視頻,實(shí)現(xiàn)了讓AI更具物理意識(shí),更強(qiáng)大,并能夠推廣到新的和看不見的更多場(chǎng)景。

image.png


上一頁 1 2 下一頁

評(píng)論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉