他曾是本田ASIMO機器人行走控制團隊唯一中國研究員,今攜十年研發(fā)經(jīng)驗歸國,力爭讓雙足機器人比肩美日德 | 專訪
日前,之江實驗室 PI 研究員、前本田技研先端中心研究員、大阪大學博士 & 特聘研究員付春江,這樣形容自己回國的 “雙足機器人使命”。
今年 36 歲的付春江生于遼寧鞍山,本科畢業(yè)于華東理工大學信息學院及認知神經(jīng)動力學研究所,畢業(yè)后東渡日本來到大阪大學讀博,主要研究雙足行走控制,期間師從日本生體工學權(quán)威專家野村泰伸教授。
畢業(yè)后,先在大阪大學擔任特聘研究員,后出走象牙塔來到日本本田公司阿西莫(ASIMO)仿人機器人,負責新型雙足運動控制研究。
他說,阿西莫小組雙足控制崗位從未招聘過中國人。在波士頓動力的機器狗誕生之前,阿西莫祖機器人動作多樣性一直處于全球領(lǐng)先動態(tài),其驅(qū)動方式為電機驅(qū)動。
1998 年起,本田公司秘密研發(fā)十年,曾誕生過全球首臺獨立行走和獨立奔跑的雙足機器人,一度曾引起轟動。
加入該公司后,付春江在新型控制器方面做了較多貢獻。其中,高維不穩(wěn)定動力學流形是他的代表性工作之一。
從全身高維動力學模型出發(fā),推導出全身高維動力學的非穩(wěn)定流形
傳統(tǒng)的雙足控制基于模板動力學,即雙足機器人會涉及到一個特別高維的非線性動力學過程。
此前,相關(guān)研究人員一般先把它進行降維,用一個線性倒立擺或者一個彈性倒立擺,先對整體高維動力學進行近似,接著先處理比較簡單的模型,然后再使用映射方法映射到全身運動型模型或動力學模型。
在讀博期間的第一篇論文,付春江繞開從模板動力學模型出發(fā)的方法,而是從全身高維動力學模型出發(fā),然后推導出全身高維動力學的非穩(wěn)定流形。
此前,使用低維非穩(wěn)定流形或捕獲點方法非常流行,但之前在高維非穩(wěn)定流形方面并沒有人做。
因此,付春江是首個提出高維不穩(wěn)定動力學流形的學者,通過考察單足支撐和雙足支撐相的可控性,提出在雙足支撐項施加間歇控制,對雙足支撐時的非穩(wěn)定流形施加控制從而實現(xiàn)穩(wěn)定行走。
因為只對非穩(wěn)定流形的部分加以控制,并只在一小段窗口期施加,可大大減少控制能耗,對于穩(wěn)定流形部分則采用放任方式,這樣雙足行走會更自然。
更快的實時計算速度,更少的能量消耗
付春江在本田的很多工作,有些以論文形式發(fā)表,有些則申請為專利。
其中有一個專利涉及到機器人雙足控制方式,他告訴 DeepTech,一種流行的控制機器人雙足的方式叫混合零動力方式,該方法由美國密歇根大學 Jessy Grizzle 教授于 20 世紀 90 年代提出。
在研究早期,付春江相對獨立地提出了一套類似的方法,該方法也是從全身動力學出發(fā),基于任務(wù)空間而非關(guān)節(jié)空間,可實現(xiàn)輕松規(guī)劃腳步經(jīng)過的弧線、身體倒立擺經(jīng)過的長度、以及支撐腿部到身體重心的長度。
經(jīng)過反饋線性化的方法,再用微分幾何的方式,可把全身動力學映射到模型任務(wù)空間,變成在任務(wù)空間當中的全身動力學方式。
然后在任務(wù)空間中再利用它的規(guī)劃,就可方便地達成各種各樣的行走方式。比如,機器人可實現(xiàn)在上下坡、臺階等非平整地面上行走。
這套方法的優(yōu)點在于,其一可在線進行計算,只要前期把微分幾何當中的各階李導數(shù)全部計算好,那么實時計算速度就會很快,因此非常適合機器人;其二由于是全身動力學規(guī)劃,非必要的能量消耗會更少。
但是,對于初值和干擾來說,反饋線性化的方式比較缺乏魯棒性。
為應(yīng)對該問題,付春江聯(lián)合斯坦福大學團隊,開發(fā)出基于采樣的直接策略優(yōu)化法。
其本質(zhì)在于原來做優(yōu)化的時候,優(yōu)化軌跡是一條線,但受干擾的這條線會偏離原來的軌道,這樣系統(tǒng)就不具備魯棒性。
研究中,他們提出在某一個狀態(tài)點周圍進行采樣,借鑒無色卡爾曼濾波器的思想,來對采樣點進行地推。
這樣就能實現(xiàn)在保留非線性的同時,不對系統(tǒng)的動力學特性進行改變,那么最終優(yōu)化出來的是一條管道,而不再限于一條線。
在優(yōu)化出來的這條管道之內(nèi),只要系統(tǒng)狀態(tài)量在管道之內(nèi),就能保證整個系統(tǒng)的魯棒性。
說到這里付春江舉例稱,火箭里面的燃料會產(chǎn)生一定的波動或震動,因此火箭整體質(zhì)量分布就會發(fā)生抖動或變化,這等于只有火箭下部有推動力,這時對其做控制就會比較難。
因此他提出這樣一種優(yōu)化管道的方法,來保證對內(nèi)部擾動、外部空氣擾動都具有魯棒性,因此火箭可以安全順利地著地。
在他的研究中,另一個困難是如何找出在任務(wù)空間的參考軌跡,方法是基于帶接觸的模型預(yù)測控制。
波士頓動力等公司使用的是為基于線性互補條件(LCP)的方法。但是,他們提出了更好的方法,即把 LCP 接觸,看做是一層優(yōu)化,然后把利用模型預(yù)測控制 MPC 作為上層的優(yōu)化,接著基于這兩層優(yōu)化去解決相應(yīng)問題并能達到準實時的計算速度。
開發(fā)可改變阻抗的驅(qū)動器
在工業(yè)機械臂中有位置控制、力矩控制和阻抗控制三種方式,但是在雙足機器人上,目前做出來的只有位置控制和力矩控制的雙足機器人。
這是因為雙足機器人存在本質(zhì)不穩(wěn)定的問題,控制起來也更難。但是與環(huán)境和人相接觸、改變動作吸引子狀態(tài),以及節(jié)約能量注入能量等,都需要阻抗控制,因此改變阻抗十分重要,且會帶來新的應(yīng)用場景。
基于此,付春江與團隊開發(fā)了可以改變阻抗的驅(qū)動器,采取的方式是改變力臂長度,然后對變阻抗驅(qū)動器進行建模,研制和測試。
據(jù)他介紹,以前的變阻抗驅(qū)動器主要用于上肢,輸出力矩較小,這款變阻抗驅(qū)動器的輸出力矩目前是世界最大的,可在 0.1 秒之內(nèi)改變阻抗。未來有望用在雙足機器人中的腿足。
相比輪式機器人,雙足機器人的優(yōu)勢在于可探索不連續(xù)平整的地面比如爬上陡坡,而輪式機器人則很難通過超過 60 度的坡度。
而雙足機器人的占地非常小,因此落腳點也非常小,因此能通過支持反作用力來維持動態(tài)平衡。
另外相比四足機器人,雙足機器人有較高的重心優(yōu)勢,因此能解放雙手來做一些高重性的動作。比如去開一扇門以及端一盤菜。而波士頓動力狗等四足機器人則很難做這樣的動作,因為它的重心比較低。
此外,雙足機器人可利用全身的動作,以投擲的方式來讓雙手集中全身力量,即便它的驅(qū)動器沒有這么大的力量,但是它的輸出比一個單純的機械手臂會有更大的力量輸出。而且,相比于人假如它的零件壞掉,還可進行更換。
雙足機器人的五大潛在實際應(yīng)用
付春江告訴 DeepTech,結(jié)合相關(guān)優(yōu)勢和特點,雙足機器人大概有以下五個落地場景:
第一,用于農(nóng)業(yè)作業(yè)。一般農(nóng)業(yè)工作都是在非鋪裝路面進行,這對于雙足機器人的腳部支撐面非常小,即只能站在兩行稻田的中間,而這恰好符合雙足優(yōu)勢。因此其落地場景之一是農(nóng)業(yè),人口城市化的推進必將帶來農(nóng)業(yè)人口的減少,因此可讓它們來干農(nóng)活。
第二,用于建筑作業(yè)等高重心勞動。建筑是一個高危行業(yè),并且需要高重心勞動,如果使用雙足機器人,其不僅能幫助人類避免可能的危險,且具備高重心作業(yè)能力。
第三,用于照顧老人。老齡化社會會催生更多家庭服務(wù)需求,全球很多國家的年輕人都會到大城市發(fā)展,很多老齡化人口并不能得到子女長期穩(wěn)定的陪護。而雙足機器人可起到照顧老年勞動力的問題,比如給家里買菜、陪老人去散步。此外,還可通過 5G 和 VR 等連接方式,讓老人以非常快的通訊速度連接到自己的專屬機器人上,從而享受被照顧的服務(wù)。
第四,用于科考探索。假如需要在地外行星上的非鋪裝路面作業(yè),雙足機器人不需要像人類宇航員那樣,付出維持生命系統(tǒng)的高昂代價。
第五,用于災(zāi)害救援和響應(yīng)。災(zāi)害救援場景一般是為了救人,美國曾舉辦過 DRC 競賽,就是這個場景。
出國十年,一朝返華
2021 年 3 月,出國十多年的付春江,正式回國入職浙江杭州之江實驗室,目前正在籌建雙足機器人本體項目組。
他們主要研究雙足機器人的新型結(jié)構(gòu)和控制,希望借此打造一個適合多場景落地的雙足機器人。
從事雙足機器人研究工作多年的他,非常熟悉各種雙足控制流派,比如基于模板動力學的、基于非線性控制的、基于優(yōu)化的,以及基于強化學習的,和世界很多高校和公司都有交流或合作。此次回國也是希望能打造出具有中國特色的雙足機器人。
他說,當初出國時日本的博士生拿的工資可能都比國內(nèi)的正式員工待遇要好,但是現(xiàn)在中國經(jīng)濟的發(fā)展給科研提供了強勁動力,而且在國內(nèi)也更方便進行大團隊的創(chuàng)造性工作,因此他很看好中國目前乃至后續(xù)的發(fā)展前景。
-End-
*博客內(nèi)容為網(wǎng)友個人發(fā)布,僅代表博主個人觀點,如有侵權(quán)請聯(lián)系工作人員刪除。