DeepMind為推進機器人研究收購 MuJoCo ,并將其對所有人免費開放
機器人研究人員很多都會選擇物理模擬引擎 MuJoCo(Multi-Joint Dynamics with Contact)上的接觸模型來進行模擬。 而近日 MuJoCo 已被人工智能公司 DeepMind 所收購。DeepMind 表示將會使 MuJoCo 成為對所有人免費的開源軟件。 能夠免費使用 MuJoCo,眾多機器人開發(fā)者對此表示歡喜之極。畢竟之前 MuJoCo 的使用費用并不便宜。 我們先通過幾個示例,初步了解利用 MuJoCo 能夠做什么,并體驗下它對現(xiàn)實中物理運動的模擬到底有多真實。 首先是倒立陀螺在平面之上的翻轉(zhuǎn)運動。 再比如牛頓擺(Newton’s Cradle)運動。 可以看到,MuJoCo 能夠精確地捕捉到牛頓擺中的脈沖傳播。 MuJoCo 對在失重下的運動模擬也極其真實。 此外,MuJoCo 還能對人或者動物的復(fù)雜生物肌肉進行模擬。 圖 | 模擬的人腿擺動(來源:DeepMind)
很多模擬器起初是為游戲、電影等設(shè)計,準(zhǔn)確性并不是它們的優(yōu)先考慮事項。對比其他模擬器易失真的情況,MuJoCo 能夠有效捕捉接觸物體的特征,從而準(zhǔn)確模擬現(xiàn)實世界中真實的物理運動。同時 MuJoCo 也很靈活,可通過調(diào)整參數(shù)模擬更廣范圍的接觸現(xiàn)象。 而且,MuJoCo 是一個全功能模擬器,不僅能夠擴展計算密集型技術(shù),還能在物理機器人部署之前測試和驗證控制方案、交互式科學(xué)可視化、虛擬環(huán)境等。 據(jù)了解,一開始 MuJoCo 是被用在華盛頓大學(xué)運動控制實驗室,在 2015 年才作為付費商品推出。其在機器人和生物力學(xué),還有動畫等領(lǐng)域都有著廣泛應(yīng)用。 然而,盡管 MuJoCo 足夠優(yōu)秀,但并不能說沒有缺點,或者說沒有模擬器是完美無缺的。 現(xiàn)有模擬器,包括 MuJoCo,都存在一些共性問題,比如,模擬環(huán)境并不能完全等同物理現(xiàn)實,與真正的真實仍有差距。模擬計算需要專用的硬件,成本較高。而且,不管多優(yōu)秀的模擬器,都會包含“非決定性”元素,這使得測試無法進行復(fù)制。 這些問題是模擬研究需要面臨的挑戰(zhàn)。有些專家認為,在要解決的問題和需要的資源方面,開發(fā)具有百分之百準(zhǔn)確性的模擬器也許和開發(fā)機器人本身同樣多。 回到本次收購的問題上。對于 DeepMind 選擇收購 MuJoCo 的原因,也許我們可以從發(fā)表在PNAS 上的一篇論文中窺見一二。 相關(guān)論文以《關(guān)于在機器人中使用模擬:機遇、挑戰(zhàn)和前進的建議》(On the use of simulation in robotics: Opportunities, challenges, and suggestions for moving forward)為題發(fā)表在 PNAS 上,第一作者為賓夕法尼亞大學(xué)博士后研究員崔熙順(HeeSun Choi)[1]。
該論文中提到,“經(jīng)過良好驗證的計算機模擬可以提供一個虛擬的試驗場,在許多情況下,它有助于安全、快速、低成本地理解未來的機器人如何設(shè)計和控制,以便安全操作和提高性能?!?/span> 論文進一步討論了模擬如何幫助機器人研發(fā): 一、迅速和低成本地生成大量機器學(xué)習(xí)培訓(xùn)數(shù)據(jù)。 機器學(xué)習(xí)在定義控制策略中的激增,以及相關(guān)對大量培訓(xùn)數(shù)據(jù)的需求,為機器人模擬的使用提供了主要動力。經(jīng)過驗證的模擬平臺成為開發(fā)系統(tǒng)的理想試驗場,既能從錯誤中吸取教訓(xùn),又能進行驗證。 二、加快工程設(shè)計周期,降低成本。 機器人的設(shè)計有兩個較為耗時的階段,即機械設(shè)計和控制策略設(shè)計。而在模擬中執(zhí)行迭代循環(huán),可以縮短與設(shè)計過程相關(guān)的時間。 三、提供加速、安全、完全控制的虛擬測試和驗證環(huán)境。 自主系統(tǒng)驗證的方法還處于起步階段。驗證和“調(diào)試”在線學(xué)習(xí)的自主機器人系統(tǒng)的方法基本上不存在。在此背景下,模擬在對協(xié)作式多機器人系統(tǒng)提供見解方面可以發(fā)揮重要作用。 四、促進更智能機器人的發(fā)展和人與機器人相互作用的理解。 模擬可以成為智能機器人進化下一階段的催化劑,正如道德概念(設(shè)定規(guī)則)、經(jīng)驗和預(yù)測行為后果的能力塑造了人類的決策過程一樣。而模擬機器人與人之間的相互作用的能力可以減少危險工作環(huán)境中的個人風(fēng)險。 對于 MuJoCo 模擬的作用,DeepMind 非常認可,其表示,“我們的機器人團隊一直使用 MuJoCo 作為各種項目的模擬平臺。MuJoCo 緊密地遵循了支配我們世界的方程式?!?/span> 目前,DeepMind 正在為 MuJoCo 完全開源做準(zhǔn)備,并向“對突破現(xiàn)實物理模擬的界限感到興奮”的研究人員們發(fā)出邀請,希望與他們一同將 MuJoCo 打造成一個社區(qū)驅(qū)動的、具有頂尖功能的項目。
-End- 參考: [1] HeeSun Choi et al. PNAS 5, (2021)https://doi.org/10.1073/pnas.1907856118
*博客內(nèi)容為網(wǎng)友個人發(fā)布,僅代表博主個人觀點,如有侵權(quán)請聯(lián)系工作人員刪除。