博客專欄

EEPW首頁(yè) > 博客 > 認(rèn)真的嗎?讓機(jī)器狗當(dāng)守門(mén)員,還發(fā)了篇論文

認(rèn)真的嗎?讓機(jī)器狗當(dāng)守門(mén)員,還發(fā)了篇論文

發(fā)布人:機(jī)器之心 時(shí)間:2022-10-17 來(lái)源:工程師 發(fā)布文章
機(jī)器狗不僅能跑能跳,踢足球、當(dāng)守門(mén)員都很行。

讓一個(gè)機(jī)器狗擔(dān)當(dāng)足球守門(mén)員,靠譜嗎?靠不靠譜,我們先看看效果在下結(jié)論。


工作人員一次很溫和的進(jìn)攻,機(jī)器狗攔住了球:


圖片

加點(diǎn)難度,來(lái)個(gè)拋物線進(jìn)球,也不再話下:


圖片

用手拋球有作弊嫌疑?用腳試試,機(jī)器狗也能把球門(mén)守的死死的


圖片

有趣的是,該研究還嘗試讓一只機(jī)器狗踢球,另一只當(dāng)守門(mén)員,兩只機(jī)器狗自己也能玩挺好:


圖片

看完效果,感覺(jué)機(jī)器狗當(dāng)守門(mén)員還挺靠譜。這款機(jī)器狗是 MIT 在 2019 年研發(fā)的 Mini Cheetah,現(xiàn)在來(lái)自加州大學(xué)伯克利分校等機(jī)構(gòu)的研究者為 Mini Cheetah 部署了一個(gè)新的強(qiáng)化學(xué)習(xí)框架,讓它完成足球守門(mén)任務(wù),守門(mén)成功率高達(dá) 87.5%。


圖片

論文地址:https://arxiv.org/pdf/2210.04435.pdf


4 米開(kāi)外踢球

Mini Cheetah 僅用不到 1 秒成功守門(mén)


讓 Mini Cheetah 學(xué)會(huì)守門(mén)還是一件比較難的事,因?yàn)檫@涉及物體(例如球)拋出的高度以及動(dòng)態(tài)移動(dòng)的位置,具體而言,一方操縱一個(gè)快速移動(dòng)的球,球的方向和位置不確定,而另一方需要迅速判斷球的位置以阻止進(jìn)球。想要完成這一任務(wù),需要教會(huì)機(jī)器人動(dòng)態(tài)移動(dòng)它的身體,同時(shí)確保它的腳 (或臉) 到達(dá)它們需要及時(shí)阻擋球的地方,這基本上是將兩個(gè)難題結(jié)合在一起。


該研究的解決辦法是將運(yùn)動(dòng)控制器與末端執(zhí)行器軌跡規(guī)劃相結(jié)合,這樣一來(lái)就可以找到最佳的方法讓 Mini Cheetah 在球到達(dá)目標(biāo)不到一秒的時(shí)間內(nèi),進(jìn)行阻擋。


完成上述過(guò)程,還需要訓(xùn)練 Mini Cheetah 掌握一套有用的守門(mén)員技能,例如 Mini Cheetah 需要掌握在地面附近和靠近地面的地方對(duì)球進(jìn)行側(cè)身****、掌握俯沖到達(dá)球門(mén)的下角技術(shù)、跳躍到球門(mén)的頂部和上角。做完這些動(dòng)作,Mini Cheetah 都可以恢復(fù)并最終安全著陸。每個(gè)技能的參考動(dòng)作都是手動(dòng)編程的,在模擬中進(jìn)行訓(xùn)練,然后直接遷移到機(jī)器人上。


Mini Cheetah 防守的球門(mén)寬 1.5m,高 0.9m,球(3 號(hào))從約 4m 外踢出,球被外部跟蹤,然后 Mini Cheetah 攔球。讓這么小的機(jī)器狗完成攔球動(dòng)作,其表現(xiàn)是令人印象深刻的。


圖片

該研究表明,這款機(jī)器狗系統(tǒng)可以將在仿真中學(xué)習(xí)到的動(dòng)態(tài)動(dòng)作和守門(mén)員技能遷移到一個(gè)真正的四足機(jī)器人上,在現(xiàn)實(shí)世界中,對(duì)隨機(jī)射門(mén)的守門(mén)成功率為 87.5%。而人類足球守門(mén)員的平均成功率是 69%。研究人員表示,他們所提出的框架可以擴(kuò)展到其他場(chǎng)景,例如多技能足球。


下面我們來(lái)看看支持這款機(jī)器狗的背后框架。


分層強(qiáng)化學(xué)習(xí)框架


首先,讓四足機(jī)器人做足球守門(mén)員是一個(gè)很有挑戰(zhàn)性的問(wèn)題,因?yàn)樗仨氁瑫r(shí)解決預(yù)測(cè)物體運(yùn)動(dòng)軌跡和機(jī)器人捕獲非抓握物體(球體)兩個(gè)實(shí)際問(wèn)題。機(jī)器人需要在很短的時(shí)間內(nèi)(通常不到一秒)對(duì)空中飛行的球做出反應(yīng)并****。


為了完成這個(gè)挑戰(zhàn),研究團(tuán)隊(duì)提出了一個(gè)分層無(wú)模型強(qiáng)化學(xué)習(xí) (RL) 框架。該框架包含一個(gè)針對(duì)不同運(yùn)動(dòng)技能的多個(gè)控制策略,覆蓋了目標(biāo)的不同區(qū)域。


圖片

這些控制策略讓機(jī)器人能夠跟蹤隨機(jī)參數(shù)化末端執(zhí)行器的軌跡,同時(shí)執(zhí)行特定的運(yùn)動(dòng)技能,例如跳躍攔球、撲球和順勢(shì)攔住地面滾動(dòng)的球。


圖片

RL 框架中包含一個(gè)高級(jí)規(guī)劃器,它幫助機(jī)器人確定所需的運(yùn)動(dòng)技能和規(guī)劃末端執(zhí)行器軌跡,以****飛向不同目標(biāo)區(qū)域的球。


該研究在 MIT 2019 年提出的 Mini Cheetah 四足機(jī)器人上部署了上述 RL 框架,實(shí)驗(yàn)表明這種 RL 框架能夠讓四足機(jī)器人有效****現(xiàn)實(shí)世界中快速移動(dòng)的球。


圖片

此前對(duì)四足機(jī)器人 RL 框架的研究主要集中在低級(jí)運(yùn)動(dòng)控制上,例如讓機(jī)器人按要求速度步行、模仿參考運(yùn)動(dòng)。而該研究提出的框架將學(xué)習(xí)到的運(yùn)動(dòng)技能擴(kuò)展到更高級(jí)別的任務(wù)上,成功使用高級(jí)規(guī)劃讓四足機(jī)器人以敏捷的動(dòng)作精確****快速移動(dòng)的足球。這對(duì)四足機(jī)器人的高級(jí)規(guī)劃控制具有重要意義。


參考鏈接:https://spectrum.ieee.org/football-robot-mini-cheetah


*博客內(nèi)容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀點(diǎn),如有侵權(quán)請(qǐng)聯(lián)系工作人員刪除。



關(guān)鍵詞: AI

相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉