新聞中心

EEPW首頁(yè) > 智能計(jì)算 > 設(shè)計(jì)應(yīng)用 > DeepMind的TF Hub demo詮釋「史上最強(qiáng) GAN 圖像生成器」

DeepMind的TF Hub demo詮釋「史上最強(qiáng) GAN 圖像生成器」

作者: 時(shí)間:2018-11-21 來(lái)源:網(wǎng)絡(luò) 收藏

  上圖是樣本生成單元格的控制界面,可以控制:生成樣本數(shù)量、截?cái)嘀?、噪聲種子、和類別的參數(shù)。我們可以看看下圖的例子來(lái)說(shuō)明各自的作用。

本文引用地址:http://butianyuan.cn/article/201811/394648.htm

  如上圖所示,很容易看出,生成樣本數(shù)量(10)和類別(芝士漢堡)就是字面的意思,那么截?cái)嘀?、噪聲種子分別有什么作用呢?僅用一張圖看不出來(lái),我們修改一下參數(shù)看看區(qū)別就行了。

  這時(shí),我們只需要拖動(dòng)滑塊來(lái)修改參數(shù),然后 Colab 會(huì)立刻執(zhí)行新參數(shù)設(shè)置下的任務(wù),但這也意味著我們一次只能修改一個(gè)參數(shù)。

  經(jīng)過(guò)多次實(shí)驗(yàn),我們發(fā)現(xiàn),截?cái)嘀翟酱?,生成樣本的多樣性越?實(shí)際上,截?cái)嘀悼刂频氖请[變量分布(一般呈高斯型)的截?cái)嗑嚯x,也就是采樣范圍,因此不難理解其對(duì)多樣性的作用。




  從上到下:截?cái)嘀禐?0.02、0.26、0.58、1.0 的芝士漢堡生成結(jié)果。

  而噪聲種子的值對(duì)生成結(jié)果的影響主要是每次生成樣本的初始條件,從而最終生成結(jié)果也會(huì)不同,可以用它來(lái)改善生成多樣性。

  最后是類別參數(shù)的控制,該 Colab 中提供了 1000 個(gè)類別選項(xiàng),可玩性很足,但要找到自己想要的類別實(shí)在有點(diǎn)困難。可以這樣操作,雙擊這個(gè)單元格,代碼會(huì)顯示在左側(cè),右側(cè)會(huì)出現(xiàn)鉛筆圖標(biāo),點(diǎn)擊該圖標(biāo)后就能查看完整列表,在這個(gè)列表下用 Ctrl+F 搜索類別的編號(hào),再返回修改,這樣就簡(jiǎn)單多了。


  我們嘗試生成了埃及貓(285)和大熊貓(388)的樣本:

  可以發(fā)現(xiàn),埃及貓的眼神不太對(duì),大熊貓有點(diǎn)營(yíng)養(yǎng)不良。論文給出的結(jié)果很真實(shí)自然,但在這個(gè) Colab 實(shí)驗(yàn)中我們也能發(fā)現(xiàn)存在很多「不自然」的生成樣本。

  接下來(lái),我們來(lái)嘗試圖像插值任務(wù)。

  如上圖所示,這個(gè)任務(wù)的可控參數(shù)有:樣本數(shù)量、插值數(shù)量、截?cái)嘀?、噪聲種子、以及用于插值的圖像類別 A 和 B。樣本數(shù)量是指每次插值時(shí)類別 A 和類別 B 的的初始樣本數(shù)量,如下圖所示樣本數(shù)量為 2。下圖展示了一些示例,供大家參考。注意該圖像插值是生成樣本之間的插值,所以左右兩側(cè)的原圖也會(huì)有些不自然。

  圖像插值結(jié)果示例,其中樣本數(shù)量為 2、插值數(shù)量為 5、截?cái)嘀禐?0.2、噪聲種子為 0、類別 A 為金毛、類別 B 為雞。

  其它參數(shù)不變,插值數(shù)量為 10 的插值結(jié)果示例。

  金毛和埃及貓的圖像插值結(jié)果。

  知道怎么用了吧?自己去耍吧~


上一頁(yè) 1 2 下一頁(yè)

關(guān)鍵詞: DeepMind 圖像生成器

評(píng)論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉