讓馬斯克瘋狂的人形機(jī)器人!萬(wàn)億級(jí)新藍(lán)海,揭秘背后產(chǎn)業(yè)
人形機(jī)器人,AI領(lǐng)域的終極形態(tài)。
編輯 | 智東西內(nèi)參
當(dāng)?shù)貢r(shí)間6月3日,特斯拉CEO埃隆·馬斯克在推特上預(yù)告,將在9月30日的特斯拉人工智能日上發(fā)布原型機(jī)。它叫“擎天柱”(Optimus),又被稱(chēng)為“特斯拉人形機(jī)器人”(Tesla Bot),是特斯拉今年最重要的產(chǎn)品。
人形機(jī)器人的出現(xiàn)可以賦能千行百業(yè),是人工智能場(chǎng)景的下一波浪潮,隨著技術(shù)的不斷成熟和商業(yè)化落地,有望帶來(lái)萬(wàn)億級(jí)別的空前藍(lán)海。
我們推薦華西證券的報(bào)告《Tesla Bot: AI的星辰大?!?,解析人形機(jī)器人的市場(chǎng)前景。
來(lái)源 華西證券
原標(biāo)題:
《Tesla Bot: AI的星辰大海》
作者:劉澤晶01.
人形機(jī)器人AI新篇章特斯拉或?qū)⒂?2022年9 月 30日推出首款人形機(jī)器人原型機(jī),并將其命名為 ” OPTIMUS”。早在2021年8月19日,馬斯克在特斯拉人工智能日時(shí)提出推出人形機(jī)器人,旨意是解決從事重復(fù)性高、單調(diào)枯燥的危險(xiǎn)差事。
馬斯克宣布進(jìn)軍AI機(jī)器人領(lǐng)域,意味著特斯拉絕不只是一家電動(dòng)車(chē)公司,而是一家 AI公司。此外馬斯克聲稱(chēng)特斯拉機(jī)器人有朝一日隨著時(shí)間推移將比汽車(chē)公司更加重要。
特斯拉機(jī)器人可以簡(jiǎn)單拆分2個(gè)域,即AI域及技術(shù)域。
AI域 : 采用FSD computer作為算力核心,配備8個(gè)Autopliot Cameras作為傳感器,支持深度學(xué)習(xí)、大數(shù)據(jù)分析,Dojo訓(xùn)練,自動(dòng)標(biāo)記等算法。
技術(shù)域:機(jī)器人頭部包含信息屏幕,用來(lái)展示信息,此外機(jī)器人由輕質(zhì)材料組成,并且四肢包含40個(gè)左右的機(jī)電執(zhí)行器,并通過(guò)力反饋感應(yīng)系統(tǒng)來(lái)實(shí)現(xiàn)平穩(wěn)和敏捷雙腳行走。
據(jù)馬斯克介紹,該機(jī)器人大約1.73米,體重約56.7千克,可抱起約20.4千克的貨物最快行走速度可約達(dá)8KM/時(shí)。
AI域是人形機(jī)器人的核心,因?yàn)闄C(jī)器人只有通過(guò)不斷的機(jī)器學(xué)習(xí)的訓(xùn)練,才能完成指定的任務(wù)。此外特斯拉人形機(jī)器人是特斯拉自動(dòng)駕駛的集大成者,因?yàn)槿诵螜C(jī)器人的核心與智能駕駛共用 FSD系統(tǒng),我們預(yù)計(jì)智能駕駛很多神經(jīng)網(wǎng)絡(luò)系統(tǒng)將會(huì)應(yīng)用在人形機(jī)器人中。
數(shù)據(jù)是實(shí)現(xiàn)智能駕駛和智能機(jī)器人的根基,而算力為機(jī)器學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)提供基礎(chǔ)動(dòng)力,隨著特斯拉所處理的數(shù)據(jù)指數(shù)級(jí)的增長(zhǎng),公司由于耗電問(wèn)題放棄Nvidia A100 GPU作為超級(jí)電腦的陣列去做訓(xùn)練,而是憑借自身強(qiáng)大的垂直整合能力,研發(fā)出專(zhuān)注于深度學(xué)習(xí)訓(xùn)練的Dojo D1芯片,于是特斯拉Dojo超級(jí)電腦應(yīng)運(yùn)而生。
1、大腦:D1芯片D1芯片作為 Dojo超級(jí)計(jì)算機(jī)的關(guān)鍵單元,實(shí)現(xiàn)了超強(qiáng)算力和超高帶寬,實(shí)現(xiàn)了空間和時(shí)間的平衡。該芯片采用分布式結(jié)構(gòu)和7納米工藝,搭載500億個(gè)晶體管、354個(gè)訓(xùn)練節(jié)點(diǎn),僅內(nèi)部的電路就長(zhǎng)達(dá)17.7公里。
Dojo超級(jí)計(jì)算機(jī)實(shí)為 ”性能猛獸 ”,算力高達(dá)s 9PFLOPs 。Dojo超級(jí)計(jì)算機(jī)的訓(xùn)練模塊由1500個(gè)D1芯片組成,共53萬(wàn)余訓(xùn)練節(jié)點(diǎn),相鄰芯片之間延遲較低,配合特斯拉自創(chuàng)高寬帶、低延遲的連接器,算力高達(dá)9PFLOPs,是世界上首屈一指的超級(jí)計(jì)算機(jī)。與業(yè)內(nèi)相比,同成本性能可提升4倍,同能耗性能可提高1.3倍,占比空間節(jié)省五倍。
▲特斯拉DOJO1芯片示意圖特斯拉 Dojo D1芯片主要可以拆解成4個(gè)部分,即CPU、 Switch、 Matmult、 SIMD。
CPU即中央處理器,是計(jì)算機(jī)系列的運(yùn)行和控制核心,是信息處理、程序運(yùn)行的最終指令單元。
Switch即交換器,是計(jì)算機(jī)芯片與芯片之間的橋梁,具有數(shù)據(jù)傳輸功能。
SIMD即單指令流多數(shù)據(jù)流,可以理解成平行計(jì)算,是采用一個(gè)控制器來(lái)控制多個(gè)處理器,介入實(shí)現(xiàn)空間并行性的技術(shù),簡(jiǎn)單來(lái)說(shuō)是一個(gè)指令可以處理多個(gè)數(shù)據(jù)。
Mat mult 即計(jì)算單元,可以專(zhuān)注于神經(jīng)網(wǎng)絡(luò)的計(jì)算,進(jìn)而加速神經(jīng)網(wǎng)絡(luò)的計(jì)算速度,是特斯拉計(jì)算機(jī)實(shí)現(xiàn)算力猛獸的根本原因之一??梢詫⒃撚?jì)算單元可以理解成人工智能芯片,即AI處理器,是一款芯片專(zhuān)門(mén)用于機(jī)器學(xué)習(xí)的算法及神經(jīng)網(wǎng)絡(luò)的運(yùn)算,可用于訓(xùn)練和推理。相較于同期的CPU和GPU相比,可以實(shí)現(xiàn)15-30倍的性能提升,以及30-80倍效率(性能)提升。
▲Dojo D1芯片架構(gòu)2、靈魂:AI機(jī)器視覺(jué)機(jī)器視覺(jué)是 AI深度學(xué)習(xí)的一種應(yīng)用與技術(shù)方向,無(wú)論是人形機(jī)器人還是智能駕駛都是機(jī)器視覺(jué)的落地方向之一。
神經(jīng)網(wǎng)絡(luò)是實(shí)現(xiàn) AI深度學(xué)習(xí)的一種重要算法,覆蓋人形機(jī)器人從識(shí)別到生成指令的全流程。是通過(guò)對(duì)人腦的基本單元神經(jīng)元的建模和鏈接,探索模擬人腦系統(tǒng)功能的模型,并研發(fā)出的一種具有學(xué)習(xí)、聯(lián)想、記憶和模式識(shí)別等具有智慧信息處理功能的人工系統(tǒng)。神經(jīng)網(wǎng)絡(luò)在智能機(jī)器人的應(yīng)用廣泛,主要應(yīng)用在物體識(shí)別、規(guī)劃、假設(shè)、訓(xùn)練/ /測(cè)試等各個(gè)環(huán)節(jié)。
神經(jīng)網(wǎng)絡(luò)最重要的特征是能從環(huán)境中學(xué)習(xí),并把學(xué)習(xí)的結(jié)果分布存儲(chǔ)在網(wǎng)絡(luò)的突觸連接中。神經(jīng)網(wǎng)絡(luò)是學(xué)習(xí)的一個(gè)過(guò)程。在環(huán)境的刺激下,相繼給網(wǎng)絡(luò)輸入一些樣本模式(input layer),按照一定的學(xué)習(xí)算法調(diào)整網(wǎng)絡(luò)各層的權(quán)值矩陣(hidden layer),待網(wǎng)絡(luò)各層權(quán)值收斂到一定值,學(xué)習(xí)過(guò)程會(huì)結(jié)束(output layer)。
特斯拉在智能駕駛和人形機(jī)器人在機(jī)器視覺(jué)的路徑上具有異曲同工之妙。一套完整的訓(xùn)練、測(cè)試( (工作) )運(yùn)動(dòng)包含傳感器、感知、評(píng)估、規(guī)劃、制動(dòng)器五個(gè)部分。
▲特斯拉機(jī)器視覺(jué)全流程示意圖特斯拉最著名的 AI算法是其機(jī)器視覺(jué)中的純視覺(jué)解決方案,該算法在人形機(jī)器人的制造中將其延續(xù)。
基于圖像的目標(biāo)檢測(cè): 目的是確定圖象中是否存在給定類(lèi)別的目標(biāo)實(shí)例,可以是動(dòng)態(tài)或靜態(tài)目標(biāo),如果存在,就返回每個(gè)目標(biāo)實(shí)例的空間位置和覆蓋范圍。目標(biāo)檢測(cè)是解決分割、場(chǎng)景理解、目標(biāo)追蹤、圖像描述、事件檢測(cè)和活動(dòng)識(shí)別等更復(fù)雜更高層次(時(shí)間記憶等)的視覺(jué)任務(wù)的基礎(chǔ)。
2D物體識(shí)別到 3D物體識(shí)別的轉(zhuǎn)換 : 特斯拉通過(guò)在8個(gè)不同位置的攝像頭,得到不同角度的同一物體,在通過(guò)神經(jīng)網(wǎng)絡(luò)(類(lèi)似NeRF算法)渲染出該物體的3D圖像,并記錄該物體的大小及位置;隨后生成一個(gè)3D向量空間,通過(guò)鳥(niǎo)看圖的方式,通過(guò)另一種神經(jīng)網(wǎng)絡(luò)(類(lèi)似LSTM算法)和物體識(shí)別計(jì)算出物體下一時(shí)間點(diǎn)出現(xiàn)的位置,至此人形機(jī)器人完成全部的感知步驟,其中包含三維信息及時(shí)間維度信息,并將該信息存儲(chǔ)在訓(xùn)練集中,并不斷強(qiáng)化學(xué)習(xí)。
▲特斯拉2D物體識(shí)別到3D物體識(shí)別的過(guò)程示意圖
02.
前景廣闊蓄勢(shì)待發(fā)從智慧城市到智能駕駛 AI浪潮的變化,預(yù)計(jì)人形機(jī)器人為人工智能的下一落地應(yīng)用場(chǎng)景。
大數(shù)據(jù)時(shí)代 : 2016年AI戰(zhàn)勝柯潔,同時(shí)隨著基礎(chǔ)算力的提升,我國(guó)開(kāi)啟新一輪人工智能熱潮即大數(shù)據(jù)時(shí)代。政策、資本先行,應(yīng)用場(chǎng)景逐漸豐富。無(wú)人機(jī)、AI翻譯機(jī)等相繼落地。
智能駕駛 : 隨著海量數(shù)據(jù)的陸續(xù)爆發(fā),基礎(chǔ)算力及芯片的陸續(xù)演進(jìn),特斯拉Autopilot憑借完善的功能定義、依靠數(shù)據(jù)不斷學(xué)習(xí)的算法,以及通過(guò)OTA實(shí)現(xiàn)的軟件升級(jí),全球正式進(jìn)入智能駕駛時(shí)代,同時(shí),谷歌、百度、騰訊、華為等互聯(lián)網(wǎng)巨頭相繼入局,推動(dòng)智能駕駛加速發(fā)展。疊加政策持續(xù)推動(dòng)自動(dòng)駕駛商業(yè)化運(yùn)營(yíng)落地。如今,我國(guó)國(guó)內(nèi)廠商在智能座艙、駕駛等發(fā)面都取得實(shí)際性的突破,未來(lái)國(guó)產(chǎn)化的生態(tài)將大有可為。
人形機(jī)器人 : 未來(lái)隨著人形機(jī)器人的落地,枯燥乏味、重復(fù)性高例如買(mǎi)菜、家務(wù)等工作極易被人形機(jī)器人取代,我們認(rèn)為這是人工智能的下一波浪潮,國(guó)內(nèi)公司極大可能復(fù)制在智能駕駛領(lǐng)域取得的成果。
▲人工智能浪潮的變化根據(jù)麥肯錫數(shù)據(jù)稱(chēng),隨著AI的不斷進(jìn)步,預(yù)計(jì)2030年全球約有3.75億人口由于AI的技術(shù)突破將重新就業(yè),從數(shù)量上看,我國(guó)將有1200萬(wàn)至1.02億人口需要重新就業(yè)。全球平均被取代的勞動(dòng)力比率為15%,我國(guó)作為人口大國(guó)基本與世界保持持平為16%。
此外,據(jù)馬斯克透露人形機(jī)器人的實(shí)際成本不會(huì)很高,可能比汽車(chē)還低。安德魯預(yù)測(cè)是25000美元,約人民幣16萬(wàn)元。按照特斯拉MODEL3 最低售價(jià)約為28萬(wàn)元,保守估計(jì)Optimus售價(jià)為20萬(wàn)元。長(zhǎng)期來(lái)看,保守估計(jì),到 2030年全球人形機(jī)器人市場(chǎng)規(guī)??蛇_(dá)萬(wàn)億規(guī)模,是繼智能駕駛電車(chē)后又一 AI的空前藍(lán)海。
人形機(jī)器人的出現(xiàn)可以賦能千行百業(yè),有望取代重復(fù)性高、單調(diào)枯燥的繁瑣工作任務(wù),同時(shí),搜索拯救等一系列危險(xiǎn)問(wèn)題工作有望得到解決,快遞、家政、服務(wù)業(yè)、工業(yè)等一系列場(chǎng)景有望率先得到落地。此外,人形機(jī)器人是 AI場(chǎng)景的下一波浪潮,隨著技術(shù)的不斷成熟和商業(yè)化的落地,有望帶來(lái)萬(wàn)億級(jí)的空前藍(lán)海,在我國(guó)智能駕駛的生態(tài)逐漸突破和成熟的背景下,人形機(jī)器人勢(shì)在必行,國(guó)內(nèi)公司極大可能復(fù)制在智能駕駛領(lǐng)域取得的成果。
具備自研 AI處理器的廠商可以為人形機(jī)器人的神經(jīng)網(wǎng)絡(luò)提供算力支撐。人工智能的本質(zhì)及數(shù)據(jù)的海量運(yùn)算,相較于AI算法,數(shù)據(jù)才是重中之重。算力作為數(shù)據(jù)加速處理的動(dòng)力源泉,其重要性不言而喻。
根據(jù)機(jī)器學(xué)習(xí)的算法步驟,可分為訓(xùn)練和推斷兩個(gè)環(huán)節(jié),訓(xùn)練環(huán)節(jié)需要極為龐大的數(shù)據(jù)輸入才能支持一個(gè)復(fù)雜的神經(jīng)網(wǎng)絡(luò)模型,訓(xùn)練過(guò)程中由于復(fù)雜的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)和海量訓(xùn)練數(shù)據(jù),運(yùn)算量巨大,因此對(duì)于處理器的算力、效率(能耗)要求極大。
AI處理器芯片可以支持深度神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)和加速計(jì)算,相比于 GPU和 CPU擁有成倍的性能提升,和極低的耗電水平。此外,推斷環(huán)節(jié)相較于訓(xùn)練環(huán)節(jié)的計(jì)算量相對(duì)較小,但依然會(huì)涉及大量的矩陣運(yùn)算,因此,人工智能芯片將發(fā)揮大量作用。
人形機(jī)器人的落地需要下游場(chǎng)景的數(shù)據(jù)融合,具備 AI算法落地的廠商具有比較優(yōu)勢(shì)。特斯拉在智能駕領(lǐng)域已經(jīng)實(shí)現(xiàn)了純視覺(jué)的解決方案,相關(guān)FSD系統(tǒng)可以直接用于人形機(jī)器人的機(jī)器視覺(jué)領(lǐng)域。
然而距離人形機(jī)器人的商業(yè)落地,其數(shù)據(jù)需要和下游細(xì)分場(chǎng)景緊密結(jié)合,通過(guò)優(yōu)質(zhì)細(xì)分場(chǎng)景下的數(shù)據(jù)和算法進(jìn)行不斷地迭代訓(xùn)練,最后提供具有價(jià)值的商業(yè)服務(wù)。人形機(jī)器人在細(xì)分場(chǎng)景海量數(shù)據(jù)并不可以直接獲得,而具備AI算法商業(yè)化落地的公司本身具備卡位優(yōu)勢(shì),即與下游細(xì)分場(chǎng)景連接密切,雙方可以通過(guò)合作共同賦能客戶(hù),進(jìn)而加速人形機(jī)器人的商業(yè)化落地。
特斯拉人形機(jī)器人的目標(biāo)是在重復(fù)、枯燥、危險(xiǎn)的環(huán)境和工況下應(yīng)用,最終將走向我們的家庭,以徹底解決人工不斷短缺的趨勢(shì)。雖然特斯拉在AI、機(jī)器人技術(shù)方面有著雄厚的技術(shù)基礎(chǔ),但是馬斯克的??谑欠衲艹烧?,這可能得到9月才能見(jiàn)分曉。
*博客內(nèi)容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀點(diǎn),如有侵權(quán)請(qǐng)聯(lián)系工作人員刪除。
存儲(chǔ)器相關(guān)文章:存儲(chǔ)器原理