新聞中心

EEPW首頁 > 業(yè)界動態(tài) > 垃圾分類不用愁 機(jī)器人來幫你

垃圾分類不用愁 機(jī)器人來幫你

作者: 時間:2019-11-24 來源:快科技 收藏

從上海,到北京,每個城市都在搞。

本文引用地址:http://www.butianyuan.cn/article/201911/407407.htm

干垃圾、濕垃圾、有害垃圾,豬不能吃、豬能吃、豬吃了會死……你是不是還在為這些垃圾分別是什么而苦惱呢?

要是能自動給就好了。

Alphabet X,就是之前孵化了無人車的Google X,終于造出了。

這些可以把垃圾分類、把分錯類的垃圾放到正確的地方,還能在辦公室里游走撿垃圾。

比如,放錯地方的礦泉水瓶,可以撿起來放到正確的地方去:

放錯地方的易拉罐,也要讓它和別的罐罐在一起:?

他們在Alphabet公司的辦公室測試后,發(fā)現(xiàn)這臺機(jī)器人可以顯著降低垃圾造成的污染,將本能回收利用卻被送去垃圾填埋場的垃圾占比從20%降到不到5%。

怎么做到的

想讓機(jī)器人學(xué)會垃圾分類,需要用到感知、移動和操作,借助計算機(jī)視覺技術(shù)進(jìn)行感知以及幫助機(jī)器人前行的自動駕駛能力都是業(yè)界熟悉的,但如何學(xué)會在復(fù)雜環(huán)境中用“手”拉開柜子、打開抽屜、撿走垃圾則是必須要讓機(jī)器自行學(xué)會的操作。

因此,Alphabet X用到了三個方法來讓機(jī)器人學(xué)會靈活用“手”。

跟人類學(xué)習(xí)

第一種是跟人類學(xué)習(xí),模仿人類的動作和做法。

這里就用到了Play-LMP算法,它在沒有特定數(shù)據(jù)集訓(xùn)練的情況下,讓機(jī)器人跟人類的演示學(xué)習(xí),最終實現(xiàn)平均成功率85.5%。

學(xué)出來的成績,大概是這樣的,左邊是任務(wù)要求,右邊是執(zhí)行過程:

跟其他機(jī)器人學(xué)習(xí)

和其他機(jī)器人學(xué)習(xí)是通過無模型的強(qiáng)化學(xué)習(xí),讓許多個機(jī)器人共享經(jīng)驗。

具體的實現(xiàn)方式是這樣的:

讓機(jī)器人學(xué)習(xí)借助門把手開門這個技巧,一起學(xué)習(xí)的每個機(jī)器人都裝了一份神經(jīng)網(wǎng)絡(luò),并且他們每臺機(jī)器人都連到了一個中央服務(wù)器上。

每個機(jī)器人開始對著這個門和門把手琢磨,摸索著考慮怎么開。

這個過程中,每個機(jī)器人每一步的行動和結(jié)果都被傳輸?shù)奖澈蟮闹醒敕?wù)器上,中央服務(wù)器里的神經(jīng)網(wǎng)絡(luò)就開始借助這些傳輸來的經(jīng)驗,迭代改進(jìn)神經(jīng)網(wǎng)絡(luò)。

這樣整個過程就好像司令部派了幾個士兵出去偵查,再把每個士兵送回來的線索匯總,形成整體的作戰(zhàn)思路,再告訴士兵們應(yīng)該如何如何行動。

所以改進(jìn)之后,機(jī)器人們就都學(xué)會了開門這項技能。

在云端學(xué)習(xí)

機(jī)器人要撿垃圾,必須學(xué)會靈活的使用自己的“手”來抓東西,要不斷的練習(xí),有大量數(shù)據(jù)來訓(xùn)練模型才可以。

現(xiàn)實世界里,機(jī)器人一天只能練習(xí)5000次抓取,數(shù)據(jù)量是遠(yuǎn)遠(yuǎn)不夠的。

而借助隨機(jī)到規(guī)范適應(yīng)網(wǎng)絡(luò)(Randomized-to-Canonical Adaptation Networks,簡稱RCANs),在云中模擬訓(xùn)練的數(shù)據(jù)就可以用在模型的實際訓(xùn)練中,這樣機(jī)器人抓物體的成功率就提升到了70%。

之后,再結(jié)合5000次在現(xiàn)實世界抓取的數(shù)據(jù),對模型進(jìn)行微調(diào),成功率就到了91%。

這個過程,相當(dāng)于在真實世界抓了58萬次的結(jié)果,一下子省了99%的練習(xí)次數(shù)。

這樣,原來需要花3個月的時間來訓(xùn)練機(jī)器人學(xué)習(xí)抓取,現(xiàn)在只要不到一天就可以了。

開發(fā)人員每天觀察機(jī)器人的垃圾分類工作,并標(biāo)注正確和錯誤。AI程序每晚根據(jù)標(biāo)注內(nèi)容,自動模擬更新數(shù)千個模塊的數(shù)據(jù)。第二天,更新的結(jié)果會被重新整合到機(jī)器人軟件中,并再次開啟新的學(xué)習(xí)周期,日復(fù)一日地改善性能。

經(jīng)數(shù)月學(xué)習(xí),分類機(jī)器人的垃圾污染率從20%降至5%。垃圾污染率,即垃圾中混入不正確分類物料的比例。

機(jī)器人頭部的視覺傳感器可掃描環(huán)境并識別物體,內(nèi)部設(shè)有多個攝像頭,可使頭部和雙臂獨(dú)立工作。機(jī)器人還會對掃描到的物品進(jìn)行顏色編碼,并識別可能需要移動、清理或丟棄的物品。




關(guān)鍵詞: 機(jī)器人 垃圾分類

評論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉