新聞中心

EEPW首頁 > 機(jī)器人 > 設(shè)計(jì)應(yīng)用 > 褚君浩院士:人形機(jī)器人的感知發(fā)展與探索

褚君浩院士:人形機(jī)器人的感知發(fā)展與探索

作者:迎九整理 時(shí)間:2024-06-07 來源:EEPW 收藏

能力是機(jī)器人智能的一個(gè)重要前提。2024 年4月初,“2024 中國生態(tài)大會(huì)”在上海舉行。大會(huì)由中國機(jī)器人網(wǎng)和上海智能谷主辦。會(huì)上,中國科學(xué)院院士褚君浩首先做了“技術(shù)的發(fā)展與探索”的報(bào)告,主要涉及三個(gè)方面:①智能時(shí)代與機(jī)器人,②部分傳感器的研究進(jìn)展,③功能。

本文引用地址:http://www.butianyuan.cn/article/202406/459713.htm

1 智能時(shí)代與機(jī)器人

現(xiàn)在人工智能(AI)大模型發(fā)展很快,通過輸入一段文字,就能自動(dòng)生成相應(yīng)的視頻。那么反過來行不行?一段視頻能否變成文字,并且由語音播報(bào)出來?可能也行。這樣對盲人就很有用處,盲人帶上這種設(shè)備,把視頻拍下來并解說出來,盲人就知道周圍的情況了。

最近還出現(xiàn)了腦機(jī)接口,這意味著什么?會(huì)帶來什么樣的影響?可能帶來很多影響,例如:

1)醫(yī)療能力爆炸。腦機(jī)接口技術(shù)有助于精準(zhǔn)地調(diào)節(jié)大腦的化學(xué)物質(zhì),治療抑郁癥、焦慮癥等心理疾病,甚至在更高級(jí)別上控制和優(yōu)化人類的情感。

2)超感官體驗(yàn)大爆發(fā),人類的感官和認(rèn)知能力可以得到增強(qiáng),例如可以直接從大腦接收和傳遞信息,提高記憶力。

AI與動(dòng)作結(jié)合方面的發(fā)展很快,例如Figure AI公司的機(jī)器人,行動(dòng)可以結(jié)合與人的對話。

可見,現(xiàn)在我們正從信息化時(shí)代向智能化時(shí)代邁進(jìn)。智能時(shí)代的技術(shù)趨勢有5 個(gè):

1)智能化分布式能源系統(tǒng)、低碳技術(shù)、能源互聯(lián)網(wǎng);

2)智能化復(fù)雜體系、AI、智慧城市、ChatGPT、Sora;

3)智能化制造技術(shù)、先進(jìn)材料、智能化升級(jí)傳統(tǒng)工業(yè);

4)智能化診斷、修復(fù)技術(shù)、智慧醫(yī)療;

5)腦機(jī)接口科學(xué)、AI for Science、AI融入物理世界。這5個(gè)方面將來有很多工作將由機(jī)器人/ 人形機(jī)器人取代。

智能化系統(tǒng)涉及多學(xué)科,向多領(lǐng)域應(yīng)用、多方向延展,是科學(xué)與技術(shù)交叉推動(dòng)的。例如同濟(jì)大學(xué)TJArk( 同濟(jì)方舟) 團(tuán)隊(duì)的足球機(jī)器人(注:2014-2023年蟬聯(lián)RoboCup中國賽冠軍)“看”得見球,因?yàn)橛袆?dòng)態(tài)感知的五官;“大腦”能分析球從哪里過來;能采取措施處理球,所以是一種典型的智能化的人形機(jī)器人。一些聊天機(jī)器人也是如此:可以得到信息,經(jīng)過分析再跟人對話。所以智能化的系統(tǒng),諸如AI賦能的工業(yè)機(jī)器人、服務(wù)機(jī)器人、下棋機(jī)器人、手術(shù)機(jī)器人、ChatGPT、Sora等都屬于智能機(jī)器人。

1717756651283234.png

2 部分傳感器的研究進(jìn)展

傳感器有很多種,諸如光、聲、電、磁、熱、機(jī)械、化學(xué)傳感器,將來這些傳感器有望安裝到人形機(jī)器人上。因?yàn)槿诵螜C(jī)器人和機(jī)器人一樣,要有信息感知,此外,還有大腦分析,最后還要有控制。

現(xiàn)代信息傳感器很豐富, 例如紅外、紫外、x 光、γ射線、壓力、振動(dòng)、聲響、電磁、化學(xué)、生物、單光子等,同時(shí)還有多頻譜范圍的傳感技術(shù)。還要發(fā)展單細(xì)胞、單分子、單原子、單光子信息傳感技術(shù)。

有了傳感器以后就得到了大數(shù)據(jù)。大數(shù)據(jù)是做分析的基礎(chǔ)。AI的三個(gè)核心要素是數(shù)據(jù)、算力、算法,可見首先要有數(shù)據(jù)。而數(shù)據(jù)是靠傳感器得到的,不是文本大數(shù)據(jù),而是傳感器實(shí)時(shí)采集的數(shù)據(jù),可見傳感器至關(guān)重要。

2.1 慧眼—光學(xué)傳感器

從光學(xué)/ 紅外的角度來看,要做慧眼——能夠全天候拍照,非接觸測溫,通過光譜設(shè)備,最終希望能有孫悟空、二郎神那樣的慧眼。

以電磁波家族的重要一員——紅外線為例,紅外傳感器有兩種形式:光熱型,光子型。這兩種形式有三大功能,圖像(空間分布),熱像(溫度分布),譜像(光譜分布)。

1)圖像。特點(diǎn)是可以在黑暗背景中識(shí)別圖像,因此可以全天候拍照。在安檢時(shí),可以穿過人體,看人身上是否攜帶違禁物品——盡管x 光也可以做這件事,但是紅外線對人體沒影響。最近發(fā)生的俄烏戰(zhàn)爭,也用到了紅外制導(dǎo)。

如果紅外傳感器放在氣象衛(wèi)星上,就可以白天和夜晚“看”到風(fēng)云變化,使氣象預(yù)報(bào)/ 臺(tái)風(fēng)預(yù)報(bào)很準(zhǔn)確。例如我國的“風(fēng)云4 號(hào)”氣象衛(wèi)星具有寬光譜探測分析系統(tǒng),可在3 萬6 千公里外對大氣層實(shí)現(xiàn)高精度溫度、濕度參數(shù)的垂直結(jié)構(gòu)觀測,相當(dāng)于對大氣層進(jìn)行CT掃描。

2)熱成像。因?yàn)閷囟葴y得非常準(zhǔn)確,而且是非接觸式的,可以穿過煙霧,探測火焰溫度分布。還可以發(fā)現(xiàn)夜里哪里有排污泄漏,哪里有電路短路,哪里的電子元器件失效了。

例如2019年巴黎圣母院失火,我國大疆公司制造的兩架無人機(jī)進(jìn)行了輔助觀測,由于上面有紅外相機(jī),精準(zhǔn)地“看”到哪里著火,從而幫助高效地把火苗滅掉。

3)譜像。光譜特征像指紋特征一樣——每個(gè)人的指紋不一樣,不同的材料/ 物質(zhì)的光譜也是不同的,因此可以識(shí)別很多材料。

就像我們采集指紋一樣,首先要做好數(shù)據(jù)庫,然后就可以分析了。例如稻田的畝產(chǎn)可以達(dá)多少斤,通過光譜收集后,跟數(shù)據(jù)庫一比對就可以預(yù)判。找礦也可以采用同樣的方法,例如找鈾礦,首先讓無人機(jī)飛過,采集的光譜與鈾礦的數(shù)據(jù)庫進(jìn)行對比就可以了。這種探測方法還可以用在月球和火星的勘探上——月球車和火星車上放了紅外探測器,能采集光譜,就可分析星球表面的成分。

在生活中,這種“慧眼”的應(yīng)用場景很多,例如“看”衣服的材質(zhì),知道衣服的棉、麻、滌綸等的比例。如果把目標(biāo)對象改成人體,可以看到人體器官的結(jié)節(jié),用于病理診斷。

機(jī)器人上也可以裝上各種傳感器,來獲得人行動(dòng)的一些信息,例如對抑郁癥的診斷,通過瞳孔、腦電、表情、行為等影像來判定抑郁癥的嚴(yán)重程度。例如北京理工大學(xué)醫(yī)學(xué)技術(shù)學(xué)院的胡斌教授團(tuán)隊(duì)做了一種小設(shè)備“精神狀態(tài)評估與干預(yù)系統(tǒng)設(shè)備”,如果這種小設(shè)備放在人形機(jī)器人上,可以邊走邊看周圍的人是否患有抑郁癥,如果有,嚴(yán)重程度如何。

2.2 狗鼻子—化學(xué)傳感器

現(xiàn)在還有氣體傳感設(shè)備,例如氣體分子傳感器可探測沙林毒氣與炸藥。通過熒光猝滅效應(yīng),正常時(shí)可發(fā)出熒光,但是如果有TNT,熒光就猝滅了,用這個(gè)原理可以做成TNT 報(bào)警器。有 時(shí)狗不能發(fā)現(xiàn)炸藥,但是用“狗鼻子”產(chǎn)品來一照就能發(fā)現(xiàn),這種“狗鼻子”可做得很小。這種嗅覺也是非常重要的。如果人形機(jī)器人能夠有嗅覺,將非常有用。所以嗅覺現(xiàn)在也是一個(gè)研究的熱點(diǎn)。

image.png

image.png

3 傳感器賦能機(jī)器人/人形機(jī)器人

智能時(shí)代的機(jī)器人要有4 種模塊:環(huán)境感知模塊,智能芯片模塊,運(yùn)動(dòng)控制模塊,操作系統(tǒng)模塊。

環(huán)境感知就是靠傳感器。所以真正的人形機(jī)器人應(yīng)該能夠具有人的五官的特點(diǎn),能夠感受圖像、壓力、聲音等。例如機(jī)器人被人推一下,能馬上站穩(wěn),說明上面有傳感器。如果觸碰它的手,它應(yīng)該有觸覺反應(yīng)。

傳感器有很多種。

1)力矩傳感器。

2)觸覺/ 壓力傳感器,其中有壓阻型、壓電型、壓容型的、摩擦電型。MEMS 壓力傳感陣列已成熟,柔彈性的電子皮膚正在新興發(fā)展。

所以人形機(jī)器人中,非常重要的是要研究它的元部件及功能,每個(gè)元部件都要研究的水平很高,再集成起來功能就強(qiáng)大了。例如上海大學(xué)自主設(shè)計(jì)并異質(zhì)集成出首款基于氧化物TFT 的64 通道肌電傳感器陣列,實(shí)現(xiàn)了高信噪比(37.5 dB),多通道手勢識(shí)別率高達(dá)97.4%,可以用在假肢上。

3)視覺傳感器。可以有激光雷達(dá)、深度相機(jī)、雙目視覺,研究的熱點(diǎn)有感算一體、仿生感光、低功耗芯片,市場規(guī)模非??捎^,預(yù)計(jì)國內(nèi)2025 年有347 億元,在國外有1276 億元的市場規(guī)模。

4)慣性傳感器:加速計(jì)+ 陀螺儀是測量加速度、角速度、傾斜角度的重要方法。可以進(jìn)行姿態(tài)控制,是雙足行走的關(guān)鍵部件。集成磁傳感器進(jìn)行定位,發(fā)展了慣導(dǎo)傳感器。機(jī)器人中需要多個(gè)這類傳感器,但產(chǎn)品主要被國際寡頭壟斷,我國頭部企業(yè)在全球市場的份額不足2%。

人形機(jī)器人里需要大量的傳感器,需要產(chǎn)學(xué)研結(jié)合,把每個(gè)部件都能研究好,而且做出來。

進(jìn)博會(huì)有很多機(jī)器人的應(yīng)用案例,例如2022 年美敦力做的機(jī)器人輔助手術(shù)系統(tǒng),波士頓科學(xué)做的植入式腦神經(jīng)刺激系統(tǒng),愛靈必的仿生手,還有歐姆龍第七代乒乓球教練機(jī)器人等。在AI 方面,2019 年英飛凌推出了Roboy機(jī)器人,具有聽視覺和感知的神經(jīng)網(wǎng)絡(luò)系統(tǒng),德國卡赫的AI智能清潔機(jī)器人,還有蔡司的數(shù)字導(dǎo)航手術(shù)顯微鏡ARTEVO 800,2021 年強(qiáng)生推出的數(shù)字化手術(shù)平臺(tái)等很多數(shù)字化手術(shù)平臺(tái)。

機(jī)器人/人形機(jī)器人的發(fā)展方向是要有一定的場景應(yīng)用,把核心、基礎(chǔ)的元器件要做好,然后進(jìn)行集成。場景可以是“服務(wù)機(jī)器人+ChatGPT”的方式。例如“掃地機(jī)器人+ChatGPT”對話,也許很受歡迎,因?yàn)槲覈抢夏晟鐣?huì),年紀(jì)大的人養(yǎng)條狗很麻煩,買個(gè)機(jī)器人,只要價(jià)格在1 萬~10 萬,生意可能很好。

醫(yī)療機(jī)器人的用途更多,可以是手術(shù)機(jī)器人、康復(fù)機(jī)器人等。

教育機(jī)器人:家長買回來以后,小孩不用去培訓(xùn)班了,它跟小孩說話,幫助小孩學(xué)習(xí),一道題做錯(cuò)了,知道小孩哪些知識(shí)點(diǎn)沒掌握好。

所以產(chǎn)品一定要和場景結(jié)合。再例如,消防員的工作很危險(xiǎn),汽車制造廠的噴漆工作辛苦,希望由機(jī)器人替代。消防員機(jī)器人的“衣服”不怕火燒,眼睛是紅外的,在煙霧里能知道火源在哪里,而且在煙霧里也能看見人。

人形機(jī)器人有三大支柱:感官- 識(shí)別,大腦- 分析,四肢- 行動(dòng)。需要把這三大方面的元部件做好,然后把感知、分析、行動(dòng)融合,集成到人形機(jī)器人里。但是不可能做成一個(gè)完人——像我們?nèi)艘粯?,能下象棋,回到家里還能燒飯燒菜——這是完整的智能。人形機(jī)器人希望先做成部分智能,能做好一兩件事。

1) 程序化人形機(jī)器人,從單一的功能擴(kuò)展到多功能。

2)智能化人形機(jī)器人,從單一智能發(fā)展到多智能。要發(fā)展場景牽引的動(dòng)作與對話相結(jié)合的智能化人形機(jī)器人,例如家務(wù)機(jī)器人、教學(xué)機(jī)器人、消防員、交通警、士兵、值班員、駕駛員、操作員、乒乓球教練等。如果針對某一場景,只具有一種功能,就會(huì)帶來可觀的市場需求。所以機(jī)器人行業(yè)在未來的智能時(shí)代里將是非常主流的行業(yè),會(huì)有許多商業(yè)發(fā)展的可能性。

4 結(jié)束語

我國非常重視機(jī)器人/ 人形機(jī)器人的發(fā)展,舉辦生態(tài)大會(huì)可以促進(jìn)元部件/ 硬件、軟件和集成的參與者交流。期望在未來幾年里,通過“政產(chǎn)學(xué)研用”五個(gè)方面的結(jié)合,把機(jī)器人/ 人形機(jī)器人這個(gè)巨大的產(chǎn)業(yè)機(jī)會(huì)/市場做得非常好。

(本文來源于《EEPW》2024.6)



關(guān)鍵詞: 202406 人形機(jī)器人 感知

評論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉