DeepMind為推進(jìn)機(jī)器人研究收購(gòu) MuJoCo ,并將其對(duì)所有人免費(fèi)開(kāi)放
機(jī)器人研究人員很多都會(huì)選擇物理模擬引擎 MuJoCo(Multi-Joint Dynamics with Contact)上的接觸模型來(lái)進(jìn)行模擬。 而近日 MuJoCo 已被人工智能公司 DeepMind 所收購(gòu)。DeepMind 表示將會(huì)使 MuJoCo 成為對(duì)所有人免費(fèi)的開(kāi)源軟件。 能夠免費(fèi)使用 MuJoCo,眾多機(jī)器人開(kāi)發(fā)者對(duì)此表示歡喜之極。畢竟之前 MuJoCo 的使用費(fèi)用并不便宜。 我們先通過(guò)幾個(gè)示例,初步了解利用 MuJoCo 能夠做什么,并體驗(yàn)下它對(duì)現(xiàn)實(shí)中物理運(yùn)動(dòng)的模擬到底有多真實(shí)。 首先是倒立陀螺在平面之上的翻轉(zhuǎn)運(yùn)動(dòng)。 再比如牛頓擺(Newton’s Cradle)運(yùn)動(dòng)。 可以看到,MuJoCo 能夠精確地捕捉到牛頓擺中的脈沖傳播。 MuJoCo 對(duì)在失重下的運(yùn)動(dòng)模擬也極其真實(shí)。 此外,MuJoCo 還能對(duì)人或者動(dòng)物的復(fù)雜生物肌肉進(jìn)行模擬。 圖 | 模擬的人腿擺動(dòng)(來(lái)源:DeepMind)
很多模擬器起初是為游戲、電影等設(shè)計(jì),準(zhǔn)確性并不是它們的優(yōu)先考慮事項(xiàng)。對(duì)比其他模擬器易失真的情況,MuJoCo 能夠有效捕捉接觸物體的特征,從而準(zhǔn)確模擬現(xiàn)實(shí)世界中真實(shí)的物理運(yùn)動(dòng)。同時(shí) MuJoCo 也很靈活,可通過(guò)調(diào)整參數(shù)模擬更廣范圍的接觸現(xiàn)象。 而且,MuJoCo 是一個(gè)全功能模擬器,不僅能夠擴(kuò)展計(jì)算密集型技術(shù),還能在物理機(jī)器人部署之前測(cè)試和驗(yàn)證控制方案、交互式科學(xué)可視化、虛擬環(huán)境等。 據(jù)了解,一開(kāi)始 MuJoCo 是被用在華盛頓大學(xué)運(yùn)動(dòng)控制實(shí)驗(yàn)室,在 2015 年才作為付費(fèi)商品推出。其在機(jī)器人和生物力學(xué),還有動(dòng)畫(huà)等領(lǐng)域都有著廣泛應(yīng)用。 然而,盡管 MuJoCo 足夠優(yōu)秀,但并不能說(shuō)沒(méi)有缺點(diǎn),或者說(shuō)沒(méi)有模擬器是完美無(wú)缺的。 現(xiàn)有模擬器,包括 MuJoCo,都存在一些共性問(wèn)題,比如,模擬環(huán)境并不能完全等同物理現(xiàn)實(shí),與真正的真實(shí)仍有差距。模擬計(jì)算需要專(zhuān)用的硬件,成本較高。而且,不管多優(yōu)秀的模擬器,都會(huì)包含“非決定性”元素,這使得測(cè)試無(wú)法進(jìn)行復(fù)制。 這些問(wèn)題是模擬研究需要面臨的挑戰(zhàn)。有些專(zhuān)家認(rèn)為,在要解決的問(wèn)題和需要的資源方面,開(kāi)發(fā)具有百分之百準(zhǔn)確性的模擬器也許和開(kāi)發(fā)機(jī)器人本身同樣多。 回到本次收購(gòu)的問(wèn)題上。對(duì)于 DeepMind 選擇收購(gòu) MuJoCo 的原因,也許我們可以從發(fā)表在PNAS 上的一篇論文中窺見(jiàn)一二。 相關(guān)論文以《關(guān)于在機(jī)器人中使用模擬:機(jī)遇、挑戰(zhàn)和前進(jìn)的建議》(On the use of simulation in robotics: Opportunities, challenges, and suggestions for moving forward)為題發(fā)表在 PNAS 上,第一作者為賓夕法尼亞大學(xué)博士后研究員崔熙順(HeeSun Choi)[1]。
該論文中提到,“經(jīng)過(guò)良好驗(yàn)證的計(jì)算機(jī)模擬可以提供一個(gè)虛擬的試驗(yàn)場(chǎng),在許多情況下,它有助于安全、快速、低成本地理解未來(lái)的機(jī)器人如何設(shè)計(jì)和控制,以便安全操作和提高性能?!?/span> 論文進(jìn)一步討論了模擬如何幫助機(jī)器人研發(fā): 一、迅速和低成本地生成大量機(jī)器學(xué)習(xí)培訓(xùn)數(shù)據(jù)。 機(jī)器學(xué)習(xí)在定義控制策略中的激增,以及相關(guān)對(duì)大量培訓(xùn)數(shù)據(jù)的需求,為機(jī)器人模擬的使用提供了主要?jiǎng)恿?。?jīng)過(guò)驗(yàn)證的模擬平臺(tái)成為開(kāi)發(fā)系統(tǒng)的理想試驗(yàn)場(chǎng),既能從錯(cuò)誤中吸取教訓(xùn),又能進(jìn)行驗(yàn)證。 二、加快工程設(shè)計(jì)周期,降低成本。 機(jī)器人的設(shè)計(jì)有兩個(gè)較為耗時(shí)的階段,即機(jī)械設(shè)計(jì)和控制策略設(shè)計(jì)。而在模擬中執(zhí)行迭代循環(huán),可以縮短與設(shè)計(jì)過(guò)程相關(guān)的時(shí)間。 三、提供加速、安全、完全控制的虛擬測(cè)試和驗(yàn)證環(huán)境。 自主系統(tǒng)驗(yàn)證的方法還處于起步階段。驗(yàn)證和“調(diào)試”在線(xiàn)學(xué)習(xí)的自主機(jī)器人系統(tǒng)的方法基本上不存在。在此背景下,模擬在對(duì)協(xié)作式多機(jī)器人系統(tǒng)提供見(jiàn)解方面可以發(fā)揮重要作用。 四、促進(jìn)更智能機(jī)器人的發(fā)展和人與機(jī)器人相互作用的理解。 模擬可以成為智能機(jī)器人進(jìn)化下一階段的催化劑,正如道德概念(設(shè)定規(guī)則)、經(jīng)驗(yàn)和預(yù)測(cè)行為后果的能力塑造了人類(lèi)的決策過(guò)程一樣。而模擬機(jī)器人與人之間的相互作用的能力可以減少危險(xiǎn)工作環(huán)境中的個(gè)人風(fēng)險(xiǎn)。 對(duì)于 MuJoCo 模擬的作用,DeepMind 非常認(rèn)可,其表示,“我們的機(jī)器人團(tuán)隊(duì)一直使用 MuJoCo 作為各種項(xiàng)目的模擬平臺(tái)。MuJoCo 緊密地遵循了支配我們世界的方程式?!?/span> 目前,DeepMind 正在為 MuJoCo 完全開(kāi)源做準(zhǔn)備,并向“對(duì)突破現(xiàn)實(shí)物理模擬的界限感到興奮”的研究人員們發(fā)出邀請(qǐng),希望與他們一同將 MuJoCo 打造成一個(gè)社區(qū)驅(qū)動(dòng)的、具有頂尖功能的項(xiàng)目。
-End- 參考: [1] HeeSun Choi et al. PNAS 5, (2021)https://doi.org/10.1073/pnas.1907856118
*博客內(nèi)容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀(guān)點(diǎn),如有侵權(quán)請(qǐng)聯(lián)系工作人員刪除。