DeepMind為推進機器人研究收購 MuJoCo ，并將其對所有人免費開放

發(fā)布人：深科技時間：2021-10-25 來源：工程師

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢

“接觸”這個看似簡單的動作其實是一個復(fù)雜現(xiàn)象，它可以是柔軟的、僵硬的，光滑的、粘稠的。這種微妙的復(fù)雜性對機器人研究中的模擬身體接觸提出了挑戰(zhàn)。

機器人研究人員很多都會選擇物理模擬引擎 MuJoCo（Multi-Joint Dynamics with Contact）上的接觸模型來進行模擬。而近日 MuJoCo 已被人工智能公司 DeepMind 所收購。DeepMind 表示將會使 MuJoCo 成為對所有人免費的開源軟件。能夠免費使用 MuJoCo，眾多機器人開發(fā)者對此表示歡喜之極。畢竟之前 MuJoCo 的使用費用并不便宜。我們先通過幾個示例，初步了解利用 MuJoCo 能夠做什么，并體驗下它對現(xiàn)實中物理運動的模擬到底有多真實。首先是倒立陀螺在平面之上的翻轉(zhuǎn)運動。再比如牛頓擺（Newton’s Cradle）運動。可以看到，MuJoCo 能夠精確地捕捉到牛頓擺中的脈沖傳播。 MuJoCo 對在失重下的運動模擬也極其真實。此外，MuJoCo 還能對人或者動物的復(fù)雜生物肌肉進行模擬。圖 | 模擬的人腿擺動（來源：DeepMind）
很多模擬器起初是為游戲、電影等設(shè)計，準(zhǔn)確性并不是它們的優(yōu)先考慮事項。對比其他模擬器易失真的情況，MuJoCo 能夠有效捕捉接觸物體的特征，從而準(zhǔn)確模擬現(xiàn)實世界中真實的物理運動。同時 MuJoCo 也很靈活，可通過調(diào)整參數(shù)模擬更廣范圍的接觸現(xiàn)象。而且，MuJoCo 是一個全功能模擬器，不僅能夠擴展計算密集型技術(shù)，還能在物理機器人部署之前測試和驗證控制方案、交互式科學(xué)可視化、虛擬環(huán)境等。據(jù)了解，一開始 MuJoCo 是被用在華盛頓大學(xué)運動控制實驗室，在 2015 年才作為付費商品推出。其在機器人和生物力學(xué)，還有動畫等領(lǐng)域都有著廣泛應(yīng)用。然而，盡管 MuJoCo 足夠優(yōu)秀，但并不能說沒有缺點，或者說沒有模擬器是完美無缺的。現(xiàn)有模擬器，包括 MuJoCo，都存在一些共性問題，比如，模擬環(huán)境并不能完全等同物理現(xiàn)實，與真正的真實仍有差距。模擬計算需要專用的硬件，成本較高。而且，不管多優(yōu)秀的模擬器，都會包含“非決定性”元素，這使得測試無法進行復(fù)制。這些問題是模擬研究需要面臨的挑戰(zhàn)。有些專家認為，在要解決的問題和需要的資源方面，開發(fā)具有百分之百準(zhǔn)確性的模擬器也許和開發(fā)機器人本身同樣多。回到本次收購的問題上。對于 DeepMind 選擇收購 MuJoCo 的原因，也許我們可以從發(fā)表在PNAS 上的一篇論文中窺見一二。相關(guān)論文以《關(guān)于在機器人中使用模擬：機遇、挑戰(zhàn)和前進的建議》（On the use of simulation in robotics: Opportunities, challenges, and suggestions for moving forward）為題發(fā)表在 PNAS 上，第一作者為賓夕法尼亞大學(xué)博士后研究員崔熙順（HeeSun Choi）[1]。
該論文中提到，“經(jīng)過良好驗證的計算機模擬可以提供一個虛擬的試驗場，在許多情況下，它有助于安全、快速、低成本地理解未來的機器人如何設(shè)計和控制，以便安全操作和提高性能?！?/span> 論文進一步討論了模擬如何幫助機器人研發(fā)：一、迅速和低成本地生成大量機器學(xué)習(xí)培訓(xùn)數(shù)據(jù)。機器學(xué)習(xí)在定義控制策略中的激增，以及相關(guān)對大量培訓(xùn)數(shù)據(jù)的需求，為機器人模擬的使用提供了主要動力。經(jīng)過驗證的模擬平臺成為開發(fā)系統(tǒng)的理想試驗場，既能從錯誤中吸取教訓(xùn)，又能進行驗證。二、加快工程設(shè)計周期，降低成本。機器人的設(shè)計有兩個較為耗時的階段，即機械設(shè)計和控制策略設(shè)計。而在模擬中執(zhí)行迭代循環(huán)，可以縮短與設(shè)計過程相關(guān)的時間。三、提供加速、安全、完全控制的虛擬測試和驗證環(huán)境。自主系統(tǒng)驗證的方法還處于起步階段。驗證和“調(diào)試”在線學(xué)習(xí)的自主機器人系統(tǒng)的方法基本上不存在。在此背景下，模擬在對協(xié)作式多機器人系統(tǒng)提供見解方面可以發(fā)揮重要作用。四、促進更智能機器人的發(fā)展和人與機器人相互作用的理解。模擬可以成為智能機器人進化下一階段的催化劑，正如道德概念（設(shè)定規(guī)則）、經(jīng)驗和預(yù)測行為后果的能力塑造了人類的決策過程一樣。而模擬機器人與人之間的相互作用的能力可以減少危險工作環(huán)境中的個人風(fēng)險。對于 MuJoCo 模擬的作用，DeepMind 非常認可，其表示，“我們的機器人團隊一直使用 MuJoCo 作為各種項目的模擬平臺。MuJoCo 緊密地遵循了支配我們世界的方程式?！?/span> 目前，DeepMind 正在為 MuJoCo 完全開源做準(zhǔn)備，并向“對突破現(xiàn)實物理模擬的界限感到興奮”的研究人員們發(fā)出邀請，希望與他們一同將 MuJoCo 打造成一個社區(qū)驅(qū)動的、具有頂尖功能的項目。
-End- 參考： [1] HeeSun Choi et al. PNAS 5, （2021）https://doi.org/10.1073/pnas.1907856118

*博客內(nèi)容為網(wǎng)友個人發(fā)布，僅代表博主個人觀點，如有侵權(quán)請聯(lián)系工作人員刪除。

博客專欄

DeepMind為推進機器人研究收購 MuJoCo ，并將其對所有人免費開放

相關(guān)推薦

技術(shù)專區(qū)

博客專欄

DeepMind為推進機器人研究收購 MuJoCo ，并將其對所有人免費開放

相關(guān)推薦

技術(shù)專區(qū)

DeepMind為推進機器人研究收購 MuJoCo ，并將其對所有人免費開放