DeepMind人工智能學會將平面圖像轉換為3D場景
據(jù)外媒報道,谷歌母公司Alphabet旗下DeepMind最近開發(fā)了一種人工智能技術,它可以在觀察2D平面圖像之后以3D渲染整個場景。目前一些人工智能研究人員正在試圖教機器學習像人類一樣。我們不是以像素為單位看世界,而是環(huán)顧我們的環(huán)境并對其中的一切進行假設。
本文引用地址:http://www.butianyuan.cn/article/201807/382626.htmDeepMind團隊則訓練了一個人工智能如何從其未見的角度猜測事物的樣子。 DeepMind的科學家提出了一個生成查詢網(wǎng)絡(Generative Query Network,GQN),這是一個神經(jīng)網(wǎng)絡,旨在教人工智能如何從不同的角度想象物體的場景會是什么樣子?;旧希斯ぶ悄苡^察場景的2D平面圖像,然后嘗試重新創(chuàng)建它。在這種情況下,重要的是DeepMind的人工智能不使用任何人為標記的輸入等。它只觀察三幅圖像,并開始預測場景的3D版本是什么樣子。
研究人員正在努力實現(xiàn)“完全無監(jiān)督的場景理解”。目前人工智能尚未接受真實世界的圖像訓練,因此下一步將從照片中渲染逼真的場景。未來,DeepMind基于GQN的人工智能可能只使用照片就可以生成與現(xiàn)實世界幾乎完全相同的按需3D場景。
評論