通用機(jī)器人里程碑?谷歌展示全球首個多任務(wù)AI智能體 已學(xué)會套圈、搭積木、抓水果……
人工智能和機(jī)器人,總是不可避免地產(chǎn)生交集:前有人形機(jī)器人Optimus在特斯拉AI日橫空出世,后有OpenAI投資挪威人形機(jī)器人公司1X。如今,谷歌旗下的AI團(tuán)隊(duì)DeepMind也放出大招,當(dāng)?shù)貢r間6月20日,DeepMind展示了用于機(jī)器人的AI智能體“RoboCat”。
谷歌稱之為機(jī)器人智能體(robotic agent),本質(zhì)上是由AI賦能的軟件程序,相當(dāng)于機(jī)器人的“大腦”,由其加持的機(jī)器人與傳統(tǒng)機(jī)器人不同之處在于,RoboCat機(jī)器人更具“通用性”,并可實(shí)現(xiàn)自我改進(jìn)、自我提升。
DeepMind稱,RoboCat是全球第一個可以解決和適應(yīng)多種任務(wù)的機(jī)器人AI智能體,并且它可以在各類真實(shí)的機(jī)器人產(chǎn)品上完成這些任務(wù),“RoboCat的快速學(xué)習(xí)能力減少了對人類監(jiān)督訓(xùn)練的需求,是朝著創(chuàng)建通用機(jī)器人邁出的重要一步。”
▍兩大硬核科技支撐通用機(jī)器人研發(fā)
(1)自生成訓(xùn)練數(shù)據(jù)
據(jù)DeepMind的介紹,只需要通過100次左右的演示,RoboCat就可以學(xué)會操控機(jī)械臂來完成各式各樣的任務(wù),然后通過自生成的數(shù)據(jù)來進(jìn)行迭代改進(jìn)。要知道,構(gòu)建通用機(jī)器人的進(jìn)展速度較慢,部分原因是收集真實(shí)世界的訓(xùn)練數(shù)據(jù)需要時間。
在DeepMind演示視頻中,RoboCat可已經(jīng)以通過自主學(xué)習(xí)操控機(jī)械臂,完成“套圈”“搭積木”“抓水果”等任務(wù)。這些任務(wù)看似簡單,但考驗(yàn)了機(jī)械臂操作的精準(zhǔn)度、理解力以及對于形狀匹配難題的解決能力。目前RoboCat完成一項(xiàng)新任務(wù)的成功率已經(jīng)從初期的36%提升至74%。
值得注意的是,不論是它操控的機(jī)械臂還是它要完成的任務(wù),RoboCat之前從來沒見過。
這種“通用性學(xué)習(xí)能力”對于加快機(jī)器人領(lǐng)域的研究有重要意義。DeepMind認(rèn)為,RoboCat獨(dú)立學(xué)習(xí)技能、快速自我提升的能力,以及對于不同硬件設(shè)備的快速適應(yīng)能力,將對新一代通用機(jī)器人AI智能體的發(fā)展起到重要推動作用。
(2)基于多模態(tài)模型
RoboCat用到的關(guān)鍵技術(shù)之一,是一種多模態(tài)模型Gato,而Gato在西班牙語里意為“貓”(cat),這也是“RoboCat”這一命名的由來之一。
Gato模型可以在模擬環(huán)境和物理環(huán)境中處理語言、圖像和動作,研究人員將Gato的架構(gòu)與一個大型訓(xùn)練數(shù)據(jù)集進(jìn)行了結(jié)合,這個數(shù)據(jù)集包含100-1000個各種機(jī)械臂完成任務(wù)的演示。
基于原始數(shù)據(jù)集和新訓(xùn)練產(chǎn)生的數(shù)據(jù),RoboCat的數(shù)據(jù)集將包含數(shù)百萬次的訓(xùn)練軌跡數(shù)據(jù)。它學(xué)習(xí)的新任務(wù)越多,它就能更好地學(xué)習(xí)和解決額外的新任務(wù)。
依托于多模態(tài)模型,RoboCat完成現(xiàn)實(shí)世界訓(xùn)練任務(wù)的成功率要遠(yuǎn)高于傳統(tǒng)基于視覺的模型方案。
▍科技巨頭同臺比拼 中國產(chǎn)業(yè)鏈凸顯性價比優(yōu)勢
其實(shí),在生成式AI風(fēng)靡全球之前,特斯拉、亞馬遜、英偉達(dá)、騰訊等眾多科技巨頭已經(jīng)劃撥了專門團(tuán)隊(duì)進(jìn)行機(jī)器人研發(fā)。該階段,機(jī)器人智能化水平不足,難以商業(yè)化。
如今,AI加持的機(jī)器人化身具身智能,再次煥發(fā)生機(jī)。一方面,AI大模型的出現(xiàn)以及多模態(tài)技術(shù)的迭代,使得機(jī)器人具備自然語言交互與自動化決策能力,大大提升其智能化水平、增強(qiáng)用戶體驗(yàn)感;另一方面,工程師也可以通過AI對其進(jìn)行肢體的模擬訓(xùn)練,大大降低了其開發(fā)成本。
谷歌RoboCat只是AI賦能機(jī)器人的優(yōu)秀案例之一。僅將視線聚焦在今年:2023年年初,谷歌推出視覺語言模型PaLM-E,并運(yùn)用到工業(yè)機(jī)器人上;4月份阿里巴巴將千問大模型接入工業(yè)機(jī)器人;5月,特斯拉人形機(jī)器人Optimus展示了精準(zhǔn)的控制、感知能力,同月英偉達(dá)發(fā)布全新自主移動機(jī)器人平臺。
再結(jié)合OpenAI投資挪威人形機(jī)器人公司1X,以及三花智控與綠的諧波在墨西哥合資設(shè)立諧波減速器公司,近期多家機(jī)構(gòu)認(rèn)為AI+機(jī)器人已經(jīng)到達(dá)產(chǎn)業(yè)爆發(fā)前夜。
招商證券分析師胡小禹預(yù)計Optimus在未來2-3年內(nèi)會進(jìn)入量產(chǎn)階段。如果以100億臺空間以及2萬美元單機(jī)售價測算,市場空間200萬億美元。另據(jù)高盛的研究報告,人形機(jī)器人市場規(guī)模有望在2035年超過1500億美元。
中銀證券分析師陶波稱,國產(chǎn)機(jī)器人產(chǎn)業(yè)鏈有望在自動化、智能化的浪潮中,憑借產(chǎn)品性價比優(yōu)勢獲得廣闊的發(fā)展空間。
▍發(fā)展初期硬件先行 運(yùn)動模塊價值量最高
中信證券分析師袁健聰表示,OpenAI、騰訊、小米、谷歌、英偉達(dá)等科技企業(yè)持續(xù)加注機(jī)器人領(lǐng)域,推動機(jī)器人技術(shù)創(chuàng)新與降本量產(chǎn)進(jìn)程加快,機(jī)器人目前處發(fā)展初期,存在“硬件先行”規(guī)律。
機(jī)器人硬件主要包括控制、感知、運(yùn)動、動力、散熱和總裝五大模塊,運(yùn)動模塊價值量最高。根據(jù)Ofweek機(jī)器人網(wǎng),工業(yè)機(jī)器人運(yùn)動模塊約占整體成本的47%。
以人形機(jī)器人為代表的AI機(jī)器人相較工業(yè)機(jī)器人結(jié)構(gòu)更為復(fù)雜,運(yùn)動模塊的成本相應(yīng)更高。以特斯拉的人形機(jī)器人Optimus為例,其運(yùn)動模塊和部分感知模塊被整合為一體化關(guān)節(jié),這部分成本占比高達(dá)整機(jī)的50%?;诖?,廣發(fā)證券分析師代川及華泰證券分析師倪正洋均看好一體化關(guān)節(jié)投資價值。
據(jù)不完全梳理,一體化關(guān)節(jié)方面的具體A股公司包括:
減速器:諧波減速器(綠的諧波、豐立智能、漢宇集團(tuán)、雙環(huán)傳動、國茂股份、昊志機(jī)電)、RV減速器(中大力德、雙環(huán)傳動、秦川機(jī)床、巨輪智能、上海機(jī)電)。綠的諧波為國內(nèi)諧波減速器龍頭,市占率達(dá)40%,中大力德、國茂股份等企業(yè)在各自減速機(jī)細(xì)分領(lǐng)域也較為領(lǐng)先;
電機(jī):無框力矩電機(jī)(步科股份、昊志機(jī)電)、空心杯電機(jī)(鳴志電器、鼎智科技、江蘇雷利、偉創(chuàng)電氣)。匯川技術(shù)和禾川科技為國內(nèi)伺服產(chǎn)品主要供應(yīng)商,也有直驅(qū)電機(jī)相關(guān)產(chǎn)品及布局;
絲杠:鼎智科技、秦川機(jī)床、恒立液壓。該領(lǐng)域海外高度壟斷,國內(nèi)處于起步階段,以中國船舶704所、博特精工、思科瑞傳動、仲孚機(jī)械等為代表的非上市公司率先嶄露頭角;上市公司中鼎智科技微型行星滾柱絲桿的研發(fā)與生產(chǎn)上已有里程碑式達(dá)成;
傳感器:漢威科技、柯力傳感、保隆科技。傳感器下游細(xì)分領(lǐng)域多,全球競爭集中,以基恩士為代表的龍頭企業(yè)才易具有規(guī)模效應(yīng)。本土企業(yè)逐漸在汽車、儀器儀表、工業(yè)互聯(lián)網(wǎng)等領(lǐng)域打開工業(yè)領(lǐng)域國產(chǎn)化的大門。
來源:機(jī)器人大講堂
*博客內(nèi)容為網(wǎng)友個人發(fā)布,僅代表博主個人觀點(diǎn),如有侵權(quán)請聯(lián)系工作人員刪除。