【東吳證券】人形機(jī)器人深度報(bào)告之七:海外人形機(jī)器人深度:人形機(jī)器人的GhatGPT時(shí)刻已至_第1頁
【東吳證券】人形機(jī)器人深度報(bào)告之七:海外人形機(jī)器人深度:人形機(jī)器人的GhatGPT時(shí)刻已至_第2頁
【東吳證券】人形機(jī)器人深度報(bào)告之七:海外人形機(jī)器人深度:人形機(jī)器人的GhatGPT時(shí)刻已至_第3頁
【東吳證券】人形機(jī)器人深度報(bào)告之七:海外人形機(jī)器人深度:人形機(jī)器人的GhatGPT時(shí)刻已至_第4頁
【東吳證券】人形機(jī)器人深度報(bào)告之七:海外人形機(jī)器人深度:人形機(jī)器人的GhatGPT時(shí)刻已至_第5頁
已閱讀5頁,還剩67頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

海外人形機(jī)器人深度:人形機(jī)器人的GhatGPT時(shí)刻已至--人形機(jī)器人深度報(bào)告之七

2025年2月10日證券研究報(bào)告·行業(yè)研究·電力設(shè)備與新能源行業(yè)u

美國科技公司具備算力和大模型優(yōu)勢

,

引領(lǐng)人形機(jī)器人發(fā)展

,進(jìn)度看特斯拉

﹥英偉達(dá)

﹥Google﹥OpenAI

從進(jìn)展看

,特斯拉居首

,且從芯片、數(shù)據(jù)訓(xùn)練、大模型到本體制造、運(yùn)控模型均自研自產(chǎn)

,

25年已制定千臺(tái)量

產(chǎn)目標(biāo)。其次為英偉達(dá)

,其具備強(qiáng)大的算力能力+數(shù)據(jù)訓(xùn)練平臺(tái)優(yōu)勢

,利用微軟芯片、數(shù)據(jù)、大模型、開發(fā)平

臺(tái)

,

為人形機(jī)器人公司打造底層開發(fā)生態(tài)

,

已與14家人形公司合作。其次為Google

,從放棄本體聚焦機(jī)器人

大模型

,到再次牽手機(jī)器人公司合作下一代人形機(jī)器人

,具備大模型能力。OpenAI目前通過投資和自己小規(guī)模

研發(fā)機(jī)器人本體

,

尚未All

in。蘋果和Meta目前專注機(jī)器人細(xì)分感知領(lǐng)域

,平臺(tái)推出機(jī)器人感知系統(tǒng)ARMOR可用于機(jī)械臂

,

Meta此前收購Digit觸覺傳感器團(tuán)隊(duì)。u

以美國為首的創(chuàng)業(yè)型公司與科技公司加強(qiáng)大模型合作

,加速商業(yè)化場景落地

,潛力上看Figure

AI>

Agility>

挪威1X>

Apptronik>德國Neura

Robotics

>加拿大Sanctuary

AI。

Figure02已獲得寶馬、亞馬遜等訂單

,公司預(yù)期兩大客戶未來4年訂單需求10萬臺(tái)

,

25年銷量目標(biāo)幾千臺(tái)

,并獲得科技巨頭投資

,股東背景雄厚。Agility專注物流場景

,

已獲得亞馬遜、

GXO訂單

,商業(yè)化放量進(jìn)度最快

,在建1萬臺(tái)產(chǎn)能。

1X專注家庭場景

,

25年目標(biāo)1千臺(tái)產(chǎn)量

。Apptronik計(jì)劃25年底商業(yè)化量產(chǎn)

,

已與google合作下一代機(jī)器人

。

德國NeuraRobotics25年1月在手訂單10億歐。以上公司均加入英偉達(dá)Cosmos

,大模型加持迭代加速。u

25年海外機(jī)器人元年

,大規(guī)模量產(chǎn)后

中國供應(yīng)鏈將充分受益。海外公司均重視落地場景

,25年是量產(chǎn)元年

,

絕大部分公司先落地車間和物流場景

,部分企業(yè)如1X和Neura

Robotics同樣重視家庭場景

,雙足和手部形態(tài)

多樣化。

25年各家目標(biāo)從幾百臺(tái)到幾千臺(tái)不等

,我們預(yù)計(jì)25年海外機(jī)器人產(chǎn)量突破1萬臺(tái)

,其中特斯拉5k臺(tái)

27-28年TOC端突破

,特斯拉銷量達(dá)到100萬臺(tái)。

隨著大規(guī)模量產(chǎn)

,供應(yīng)鏈將切換至中國廠商

,綁定特斯拉的tier1最為受益

,其次為各環(huán)節(jié)核心龍頭。u

投資建議:

機(jī)器人當(dāng)前類比2014年電動(dòng)車

,即將量產(chǎn)

,開啟10年產(chǎn)業(yè)大周期

,強(qiáng)烈看好板塊!

1)特斯拉鏈:

首推確定性龍頭Tier1【三花智控】【拓普集團(tuán)】

,Tier2【鳴志電器】【綠的諧波】【雙環(huán)傳動(dòng)】

,關(guān)注【北特科技】【浙江榮泰】【五洲新春】【震??萍肌俊舅沽夤煞荨俊敬髽I(yè)股份】等;

2)華為及國內(nèi)鏈:推薦【雷賽智能】【匯川技術(shù)】【賽力斯】【富臨精工】

,關(guān)注【兆威機(jī)電】【藍(lán)黛科技】【禾川科技】【豪能股份】【科力爾】【埃夫特】【拓斯達(dá)】等。

3)英偉達(dá)鏈:推薦【偉創(chuàng)電氣】【科達(dá)利】等。4)宇樹科技鏈:推薦【曼恩斯特】

,關(guān)注【長盛軸承】【臥龍電驅(qū)】【奧比中光】。u

風(fēng)險(xiǎn)提示:

量產(chǎn)進(jìn)展不及預(yù)期;產(chǎn)業(yè)鏈降本不及預(yù)期;行業(yè)關(guān)鍵技術(shù)突破不及預(yù)期;

市場競爭加劇2摘要

PART2美國科技公司引領(lǐng)人形機(jī)器人發(fā)展

PART3美國機(jī)器人創(chuàng)業(yè)公司加速商業(yè)化場景落地

PART4歐洲及其他:

1X和Neura為首引領(lǐng)發(fā)展

PART5

日韓:智能化有待提升,商業(yè)化尚早

PART6供應(yīng)鏈

PART7投資建議及風(fēng)險(xiǎn)提示3

PART1海外人形機(jī)器人的ChatGPT時(shí)刻已至目錄PART1海外人形機(jī)器人的ChatGPT時(shí)刻已至4中國美國歐洲全球24年制造業(yè)從業(yè)人員(億)1.20.10.34.0滲透率20%40%40%16%24年生活服務(wù)從業(yè)人員(億)1.20.81.06.0滲透率10%20%20%10%1.5臺(tái)機(jī)器人替代1個(gè)工人1.51.51.51.5其他新增需求(億臺(tái))0.40.30.31.5人形機(jī)器人存量空間(億臺(tái))0.90.60.83.4人形機(jī)器人每年新增空間(億臺(tái))0.230.150.190.84人形機(jī)器人均價(jià)(萬/臺(tái))10141412每年新增市場空間(萬億)2.32.22.610.1u

人形機(jī)器人:

其空間來自對工人的替代

,并可進(jìn)入toc端創(chuàng)造新需求。

24年全球制造業(yè)從業(yè)人員4億人

,生活服

務(wù)從業(yè)人員6億

,按照制造業(yè)機(jī)器人滲透率16%、服務(wù)業(yè)機(jī)器人滲透率10%

,

1.5臺(tái)機(jī)器人替代1個(gè)工位

,且預(yù)計(jì)

其他領(lǐng)域新增1.5億臺(tái)需求

,對應(yīng)全球人形機(jī)器人每年新增需求0.8億臺(tái)

,單臺(tái)價(jià)格12萬/臺(tái)

,對應(yīng)市場空間10萬

,其中中國市場空間為2.3萬億

,對應(yīng)人形機(jī)器人新增需求2300萬臺(tái)。u

歐美勞動(dòng)力成本高

,人形機(jī)器人性價(jià)比突出:放量初期按照一臺(tái)機(jī)器人成本50萬算

3臺(tái)替代一個(gè)工人

,按照美

國人工成本70萬/個(gè)

,對應(yīng)回本周期2年

,而中國回本周期10年。但若成本下降至14萬算

1.5臺(tái)替代一個(gè)工人

,

對應(yīng)美國回本周期0.3年、

中國回本周期1.5年。一個(gè)工位成本(萬元)210.31.5遠(yuǎn)期(27-28年之后)1.5臺(tái)機(jī)器人替代1個(gè)

工人美國回本周期(年)

中國回本周期(年)項(xiàng)目金額美國工人成本(萬元)70中國人工成本(萬元)15短期機(jī)器人成本(萬元)50遠(yuǎn)期機(jī)器人成本(萬元)14一個(gè)工位成本(萬元)150人(

-

)工美國回本周期(年)2中國回本周期(年)

10人3臺(tái)個(gè)年16代2替25機(jī)器短期勞動(dòng)力短缺+經(jīng)濟(jì)性,人形機(jī)器人需求空間廣闊

數(shù)據(jù)來源:各國統(tǒng)計(jì)局,東吳證券研究所測算

5圖人形機(jī)器人市場空間圖:機(jī)器人的經(jīng)濟(jì)性u

人形機(jī)器人的優(yōu)勢在于通用性

,而要實(shí)現(xiàn)通用性需依賴:

一是訓(xùn)練數(shù)據(jù)

,二是AI大模型

,

2022年以來算力、

模型等快速發(fā)展

,人形機(jī)器人智能化大幅提升

,其中特斯拉、英偉達(dá)、Google布局領(lǐng)先。?數(shù)據(jù)訓(xùn)練:

高質(zhì)量的訓(xùn)練數(shù)據(jù)是人形機(jī)器人實(shí)現(xiàn)泛用性的基礎(chǔ),

此前依賴真實(shí)場景采集,效率低,成本高,

而仿真平臺(tái)的發(fā)展指數(shù)級放大數(shù)據(jù)采集和訓(xùn)練規(guī)模,提高效率、降低成本。?具身智能大模型:從語言大模型,到視覺大模型,

到VLA多模態(tài)大模型,強(qiáng)化機(jī)器人交互、任務(wù)拆解、任務(wù)

執(zhí)行能力,和自主學(xué)習(xí)能力,讓機(jī)器人大腦更加智能。圖人形機(jī)器人大模型海外大模型發(fā)展推動(dòng)人形機(jī)器人落地,科技公司引領(lǐng)數(shù)據(jù)來源:特斯拉、英偉達(dá)、谷歌等官網(wǎng),東吳證券研究所

6英偉達(dá)GR001

Project為機(jī)器人提供通用智能的基礎(chǔ)模型Meta和CMU聯(lián)合打造的大模型RoboAgentPhysicalIntelligenceπ0模型使機(jī)器人可自主執(zhí)行復(fù)雜任務(wù)英偉達(dá)Isaac

GR00TBlueprint是一個(gè)數(shù)字孿生訓(xùn)練場googleRT系列和AutoRT收集更多和更多樣化的訓(xùn)練數(shù)據(jù)特斯拉Dojo超級計(jì)算機(jī)及相關(guān)技術(shù)構(gòu)建數(shù)據(jù)仿真訓(xùn)練體系仿真數(shù)據(jù)訓(xùn)

練平臺(tái)具身智能大

模型特斯拉FigureAIAgilityApptronikSanctuaryAI波士頓動(dòng)力1XNeura

Robotics國家美國美國美國美國加拿大韓國挪威德國商業(yè)化場景先落地汽車車間先落地車廠和

物流物流先落地車廠和

物流商超家庭工業(yè)/家庭量產(chǎn)計(jì)劃25年幾千臺(tái),26-27年每年10倍增長2家客戶未來4

年(25-28年)

需求10萬臺(tái)24年內(nèi)產(chǎn)能達(dá)

到數(shù)百臺(tái),未

來幾年將實(shí)現(xiàn)

年產(chǎn)能1萬臺(tái)25年將制造數(shù)

百個(gè)24年7月定下前臺(tái)量產(chǎn)目標(biāo),但量產(chǎn)不順,

創(chuàng)始人離職從液壓轉(zhuǎn)向電

動(dòng),計(jì)劃商用25年制造1000個(gè),在

2028年將制造數(shù)百萬個(gè)

NEO10億歐訂單客戶自用寶馬、亞馬遜亞馬遜GXO奔馳GXOCTC麥格納家用川崎重工、歐

姆龍下肢形態(tài)雙足雙足鴕鳥雙足雙足/輪式雙足(但有可

能改輪式)雙足升級為雙足雙足靈巧手22自由度16自由度電動(dòng)抓夾20自由度三指抓夾20自由度可組裝手/夾大模型自制與OpenAI合作/加入英偉達(dá)Cosmos加入英偉達(dá)

Cosmos與Google合作/加入英偉達(dá)Cosmos自研/加入英偉

達(dá)Cosmos加入英偉達(dá)

Cosmos與OpenAI合作/加入英偉達(dá)Cosmos加入英偉達(dá)

Cosmosu

從商業(yè)化場景看:

海外公司均重視落地場景

,

絕大部分公司先落地車間和物流場景

部分企業(yè)如1X和NeuraRobotics同樣重視家庭場景。并且嘗試用租賃的方式

,

降低客戶使用成本。u

從量產(chǎn)角度看:25年是量產(chǎn)元年

,各家目標(biāo)從幾百臺(tái)到幾千臺(tái)不等。且26年大規(guī)模量產(chǎn)新機(jī)型。

u

從本體和末端執(zhí)行器看:

存在多樣化。但基本以雙足為主

,部分采用輪式。

同時(shí)手部方案多為開放式

,可自由組

裝靈巧手或抓夾。u

從大模型看:

除特斯拉自研外

,

其余主流公司基本加入英偉達(dá)Cosmos生態(tài)

,

同時(shí)部分公司也和OpenAI或Google等科技公司合作。圖海外人形機(jī)器人特點(diǎn)總結(jié)海外人形機(jī)器人重視商業(yè)化落地,車廠和物流先行

數(shù)據(jù)來源:

特斯拉、

figure、

agility等官網(wǎng),東吳證券研究所

7u

特斯拉:大模型+人形本體垂直一體公司。將自動(dòng)駕駛大模型嫁接到人形機(jī)器人

,利用Dojo超級計(jì)算機(jī)平臺(tái)繼續(xù)

數(shù)據(jù)仿真訓(xùn)練

,擁有豐富的制造經(jīng)驗(yàn)和強(qiáng)大的供應(yīng)鏈基礎(chǔ)

,以及汽車車間應(yīng)用場景。u

英偉達(dá)、

Google、

Physical

Intelligence:

具備計(jì)算/大模型優(yōu)勢

,提供人形機(jī)器人大腦。英偉達(dá)依托芯片

,

拓展數(shù)據(jù)

大模型

開發(fā)平臺(tái)

為人形廠商提供底層開發(fā)模型

。

Google依托打造的RT系列模型

并計(jì)劃用Gemini模型控制人形

,與人形廠商聯(lián)手

,開發(fā)新一代機(jī)器人。

PI專門提供人形機(jī)器人具身智能大模型。u

Figure

AI、Agility、

1X等:

產(chǎn)品性能優(yōu)異

,商業(yè)化落地快的人形初創(chuàng)公司。

Figure02已獲得寶馬、亞馬遜等

訂單

,并獲得科技巨頭投資

,股東背景雄厚。

Agility專注物流場景

已獲得亞馬遜、

GXO訂單。

1X專注家庭場

景。圖看好三類人形機(jī)器人公司FigureAIAgilityApptroni

k1X商業(yè)化場

景先落地車

廠和物流物流先落地車

廠和物流家庭量產(chǎn)計(jì)劃2家客戶

未來4年(25-28

年)需求

10萬臺(tái)24年內(nèi)產(chǎn)

能達(dá)到數(shù)

百臺(tái),未

來幾年將

實(shí)現(xiàn)年產(chǎn)

能1萬臺(tái)25年將制

造數(shù)百個(gè)25年制造

1000個(gè),

2028

年將制造

數(shù)百萬個(gè)NEO客戶寶馬、亞

馬遜亞馬遜GXO奔馳GXO家用下肢形態(tài)雙足鴕鳥雙足雙足/輪式升級為雙

足靈巧手16自由度電動(dòng)抓夾20自由度大模型與OpenAI合作/加入英偉達(dá)Cosmos加入英偉達(dá)Cosmos與Google合作/加入英偉達(dá)Cosmos與OpenAI合作/加入英偉達(dá)Cosmos英偉達(dá)

Google

OpenAI人形進(jìn)展★★★★★★★★★產(chǎn)品芯片、大模型、數(shù)據(jù)、開發(fā)平臺(tái)大模型大模型方式出售芯片及開發(fā)平臺(tái)合作開發(fā)

本體投資+小規(guī)模自研本體機(jī)器人14家機(jī)器人加入Cosmos生態(tài)Apptroni

c1XFigureAI優(yōu)勢強(qiáng)大的算

力能力

+

數(shù)據(jù)訓(xùn)練

平臺(tái)+商

業(yè)模式大模型能

力大模型能

力特斯拉商業(yè)化場景先落地汽車車

間量產(chǎn)計(jì)劃25年幾千臺(tái),26-27年每年

10倍增長客戶自用下肢形態(tài)雙足靈巧手22自由度大模型自制看好三類公司,將充分受益人形機(jī)器人產(chǎn)業(yè)大周期

數(shù)據(jù)來源:

特斯拉、英偉達(dá)、谷歌等官網(wǎng),東吳證券研究所

8優(yōu)質(zhì)創(chuàng)業(yè)公司具身智能大模型公司垂直一體化公司PART2美國科技公司引領(lǐng)人形機(jī)器人發(fā)展9特斯拉英偉達(dá)GoogleOpenAI蘋果Meta微軟人形進(jìn)展★★★★★★★★★★★★★★★★★產(chǎn)品人形機(jī)器人本

體芯片、大模型、數(shù)據(jù)、開發(fā)平

臺(tái)大模型大模型機(jī)器人感知系

統(tǒng)ARMORDigit

360的高精度觸覺傳感器方式垂直一體化生

產(chǎn)出售芯片及開

發(fā)平臺(tái)合作開發(fā)本體投資+小規(guī)模自

研本體投資機(jī)器人特斯拉機(jī)器人14家機(jī)器人加

入Cosmos生態(tài)Apptronik1XFigureAIPhysicalIntelligenceFigureAI優(yōu)勢軟件能力+制造

能力強(qiáng)大的算力能

力+數(shù)據(jù)訓(xùn)練平

臺(tái)+商業(yè)模式大模型能力大模型能力和CMU聯(lián)合打造的大模型

RoboAgentu

科技公司均重視人形機(jī)器人的發(fā)展,

其中特斯拉預(yù)計(jì)未來人形機(jī)器人將成為公司主要收入來源。u

特斯拉﹥英偉達(dá)﹥Google﹥OpenAI

:從進(jìn)展看,特斯拉居首,

且從芯片、數(shù)據(jù)訓(xùn)練、大模型到本體制造、

運(yùn)控模型均自研自產(chǎn),

25年已制定千臺(tái)量產(chǎn)目標(biāo)。其次為英偉達(dá),

其具備強(qiáng)大的算力能力+數(shù)據(jù)訓(xùn)練平臺(tái)優(yōu)勢

,利用微軟芯片、數(shù)據(jù)、大模型、開發(fā)平臺(tái),

為人形機(jī)器人公司打造底層開發(fā)生態(tài),已與14家人形公司合作

。其次為Google,從放棄本體聚焦機(jī)器人大模型,

到再次牽手機(jī)器人公司合作下一代人形機(jī)器人,具備大模

型能力。

OpenAI目前通過投資和自己小規(guī)模研發(fā)機(jī)器人本體,

尚未All

in。蘋果和Meta目前專注機(jī)器人細(xì)分

感知領(lǐng)域,平臺(tái)推出機(jī)器人感知系統(tǒng)ARMOR可用于機(jī)械臂,

Meta此前收購Digit觸覺傳感器團(tuán)隊(duì)。圖美國科技公司人形機(jī)器人布局總結(jié):美國科技公司具備算力和大模型優(yōu)勢

數(shù)據(jù)來源:特斯拉、英偉達(dá)、谷歌等公司官網(wǎng),東吳證券研究所

10u

特斯拉FSD純視覺+深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)漸趨成熟

,可嫁接至人形機(jī)器人。與自動(dòng)駕駛類似

,人形機(jī)器人同樣需

利用傳感器(攝像頭、激光雷達(dá)等)感知、采集和處理周圍環(huán)境信息

以便做出決策。特斯拉人形機(jī)器人僅使

用3個(gè)攝像頭(中間魚眼攝像頭、左右各一個(gè)視覺攝像頭)

,直接嫁接FSD成熟的純視覺方案

,再輔之以力/力

矩/聲學(xué)/觸覺/溫度等傳感器。u

利用Dojo超級計(jì)算平臺(tái)進(jìn)行機(jī)器人仿真訓(xùn)練

,擴(kuò)大數(shù)據(jù)集。u

未來端到端訓(xùn)練有望突破

,具身智能未來可期。圖:特斯拉FSD視覺感知圖?基礎(chǔ)結(jié)構(gòu)是由主干、頸部與多個(gè)分支頭部組成?核心特點(diǎn)是多個(gè)子任務(wù)分支共享同一個(gè)特征空間,優(yōu)勢有:同一主干統(tǒng)一提取特征并共享給各任務(wù)頭部使用;不同子任務(wù)類型之間可以實(shí)現(xiàn)解耦

;生成的特征空間可供各任務(wù)需求隨時(shí)調(diào)用?在感知框架中加入了一層“虛擬標(biāo)準(zhǔn)相機(jī)”,將每輛車采集到的圖像數(shù)據(jù)通過去畸變、旋轉(zhuǎn)等方式處理后,確保數(shù)據(jù)一致性,從而實(shí)現(xiàn)各攝像頭原始數(shù)據(jù)的“校準(zhǔn)”,再將數(shù)據(jù)喂養(yǎng)給主干神經(jīng)網(wǎng)絡(luò)訓(xùn)練?自動(dòng)駕駛的仿真是在模擬環(huán)境中,通過調(diào)整各類交通參與物及環(huán)境的模型參數(shù)以構(gòu)建各種虛擬場景,以訓(xùn)練算法應(yīng)對不同場景的性能?引入BEV鳥瞰圖:缺乏高程信息的自車坐標(biāo)系?Transformer神經(jīng)網(wǎng)絡(luò):將車身四周的多個(gè)攝像頭獲得的不同視頻數(shù)據(jù)直接進(jìn)行融合,然后用同一套神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,將坡度、曲線內(nèi)化到神經(jīng)網(wǎng)絡(luò)中,實(shí)現(xiàn)從2D轉(zhuǎn)變?yōu)?D。?通過使用具有時(shí)間維度的視頻片段訓(xùn)練神經(jīng)網(wǎng)絡(luò)

,為自動(dòng)駕駛增加短時(shí)記憶力,更好做預(yù)測?基于時(shí)間維度和空間維度的特征列隊(duì):時(shí)間維度提供時(shí)間上的連續(xù)性,空間維度是防止等待時(shí)間過長導(dǎo)致時(shí)序信息丟失?不考慮這個(gè)物體到底是什么,只考慮體素是否被占用,相較激光雷達(dá),增加了算法的泛化能力和

對現(xiàn)實(shí)世界的認(rèn)知?

18年特斯拉與第三

方合作,人工標(biāo)注

,

自,

標(biāo),?

20年研發(fā)并使用自

動(dòng)標(biāo)注系統(tǒng),通過

大量數(shù)據(jù)訓(xùn)練大模

型,再用大模型訓(xùn)

練車端小模型效注成本高建千人低隊(duì)后率團(tuán)圖片識(shí)別圖片處理對平面圖像進(jìn)行標(biāo)注、處理校準(zhǔn),識(shí)別物體攝像頭采集的圖片為2D,需轉(zhuǎn)為現(xiàn)實(shí)世界的3D空間。同時(shí)需依據(jù)短時(shí)記憶做操作預(yù)判?;谝曨l流數(shù)據(jù)的共享特征多任務(wù)型神經(jīng)網(wǎng)絡(luò)架構(gòu),擁有物體深度識(shí)別能力和短時(shí)記憶能力。特斯拉:軟硬件垂直一體化,

FSD提供具身智能基礎(chǔ)

數(shù)據(jù)來源:特斯拉公司官網(wǎng),東吳證券研究所

11

算法空間理解層:從2D到3D網(wǎng)絡(luò)基礎(chǔ)結(jié)構(gòu):

HydraNet多頭網(wǎng)絡(luò)短時(shí)記憶層:引入時(shí)間軸,做預(yù)判數(shù)據(jù)校準(zhǔn):虛擬相機(jī)構(gòu)建標(biāo)準(zhǔn)化數(shù)據(jù)占用網(wǎng)絡(luò):對BEV升級仿真:訓(xùn)練算法應(yīng)對不同場景的性能手動(dòng)標(biāo)注自動(dòng)標(biāo)注u

特斯拉機(jī)器人采用電驅(qū)動(dòng)方式

,設(shè)計(jì)之初就考慮大規(guī)模量產(chǎn):

區(qū)別于波士頓的液壓方式

,

電驅(qū)動(dòng)方式關(guān)節(jié)更靈

,且核心部件均大規(guī)模量產(chǎn)應(yīng)用(除絲杠)

,成本可控。u

28個(gè)執(zhí)行器組成特斯拉機(jī)器人核心關(guān)節(jié)構(gòu)架

,

電池、

攝像頭、

芯片均為成熟工藝:

Optimus機(jī)電執(zhí)行器系統(tǒng)

含3大類、40個(gè)執(zhí)行器——身體14個(gè)旋轉(zhuǎn)執(zhí)行器、

14個(gè)線性執(zhí)行器

,靈巧手12個(gè)執(zhí)行器方案尚未凍結(jié)

,上述

執(zhí)行器均由“電機(jī)+傳動(dòng)裝置+各類軸承+傳感器”組成。軀干搭載2.3kwh電池

,頭部搭載三個(gè)攝像頭(中間

魚目、兩側(cè)各一普通攝像頭)

,大腦采用FSD芯片。u

26年中特斯拉將推第二代機(jī)器人

,將進(jìn)一步改進(jìn)

,預(yù)計(jì)手部和傳感器等變化較大

,執(zhí)行器方案相對確定。圖特斯拉Optimus身體包含28個(gè)執(zhí)行器(電機(jī)+驅(qū)動(dòng)器+機(jī)械傳動(dòng)部件等)特斯拉:關(guān)節(jié)本體方案基本定型,采用28個(gè)執(zhí)行器

數(shù)據(jù)來源:特斯拉公司官網(wǎng),東吳證券研究所

12

腰髖部:旋轉(zhuǎn)執(zhí)行器

*3*2213大腿:線性執(zhí)行器*2*2大臂:線性執(zhí)行器*1*2小臂:線性執(zhí)行器*2*2小腿:線性執(zhí)行器*2*2手指:空心杯模組*6*2手肘:旋轉(zhuǎn)執(zhí)行器*1*2肩膀:旋轉(zhuǎn)執(zhí)行器*3*21231

2u

22個(gè)自由度為繩驅(qū)方案

,未來仍有變化。2024年11月

Optimus

Gen

3

靈巧手更新并展示

,靈巧手從單

手11個(gè)自由度→

22個(gè)自由度(單手電機(jī)數(shù)從2+1+1+1+1

=6變成3+2+2+2+2

=11)

。我們認(rèn)為結(jié)構(gòu)變

化點(diǎn)有:

1)

電機(jī):從手掌內(nèi)移至手臂小臂里

,一方面手掌可以縮小體積

,一方面對空心杯電機(jī)的直徑限制解開

,而且成本更低的無刷有槽電機(jī)也可能去替代空心杯;

2)傳動(dòng):我們認(rèn)為絲杠由單手不使用、到

使用10根以上;從we,robot發(fā)布的視頻來看

,小臂可看到繩驅(qū)用的繩

,小臂帶動(dòng)手關(guān)節(jié)靈活運(yùn)動(dòng)

,依賴數(shù)量可觀的腱繩;

3)感知:手指增加陣列式觸覺傳感器(每處大概幾十個(gè)觸點(diǎn))

;4)輕量化:從鋁合金金屬3D打印

,改成了塑料3D打印。特斯拉:靈巧手22自由度,方案未完全凍結(jié)圖:特斯拉24年10月“We,robot”發(fā)布會(huì)現(xiàn)場機(jī)器

人與人群互動(dòng)

數(shù)據(jù)來源:特斯拉公司官網(wǎng),東吳證券研究所

13

圖:特斯拉24年11月官推發(fā)布視頻,左手穩(wěn)穩(wěn)接

觸飛來的網(wǎng)球u

量產(chǎn)計(jì)劃明確

,指數(shù)級增長。特斯拉人形機(jī)器人將于2025年量產(chǎn)

,特斯拉預(yù)計(jì)當(dāng)年將有幾千臺(tái)人形機(jī)器人投

入其汽車工廠生產(chǎn)線中

,并繼續(xù)保持迭代

,若一切順利

,

26年量產(chǎn)將放大10倍至5-10萬臺(tái)(

接近26年年中,

第二代機(jī)器人投產(chǎn)

月產(chǎn)量擴(kuò)至1萬臺(tái))

,開始tob外售;

27年進(jìn)一步放大10倍至50-100萬臺(tái)

,進(jìn)入toc端市

場。最終產(chǎn)品成本2萬美金

,價(jià)格隨行就市。

Musk認(rèn)為未來人形機(jī)器人有潛力帶來超過10萬億美元的收入

,

可能成為公司價(jià)值的主要來源。u

先落地汽車車間

,商業(yè)化明確。今年計(jì)劃制造的幾千臺(tái)

,用于特斯拉工廠內(nèi)完成如給料斗上料、車身生產(chǎn)線物

料運(yùn)輸?shù)?/p>

,形成閉環(huán)以改進(jìn)生產(chǎn)設(shè)計(jì)。大概26H2可能會(huì)開始向特斯拉以外的公司交付。中國人工成本(萬元)15短期機(jī)器人成本(萬元)50遠(yuǎn)期機(jī)器人成本(萬元)14一個(gè)工位成本(萬元)150短期(25-26年)3臺(tái)機(jī)器人替代1

個(gè)工人美國回本周期(年)2中國回本周期(年)10一個(gè)工位成本(萬元)21遠(yuǎn)期(27-28年之后)1.5臺(tái)機(jī)器人

替代1個(gè)工人美國回本周期(年)0.3中國回本周期(年)1.5上海工廠19,0001%57020%7,600德國工廠12,0002%72035%8,400德州工廠22,0005%3,30050%22,000加州工廠20,0005%3,00050%20,000特斯拉:

25年預(yù)計(jì)產(chǎn)數(shù)千臺(tái),

26-27年每年10倍增長

數(shù)據(jù)來源:特斯拉公司官網(wǎng),東吳證券研究所測算

14

2025年底

3臺(tái)機(jī)器人替代

機(jī)器人替代比

1個(gè)工人所需機(jī)例

器人

(臺(tái))合計(jì)

73,000

6%7,59040%58,000圖:特斯拉人形機(jī)器人自用銷量預(yù)測圖:特斯拉人形機(jī)器人的經(jīng)濟(jì)性美國人工成本(萬元)

702026年底2臺(tái)機(jī)器人替代1個(gè)工人(臺(tái))機(jī)器人替

代比例工人

(人)金額項(xiàng)目u

特斯拉執(zhí)行器已經(jīng)確定國產(chǎn)兩家供應(yīng)商

,包括三花、拓普

,其中三花可供應(yīng)全部型號(hào)。特斯拉人形機(jī)器人

2025年開始量產(chǎn)

,我們預(yù)計(jì)三花供應(yīng)份額70%左右

,拓普份額30%左右。u

供應(yīng)看,

目前核心零部件基本由特斯拉提供

,交由三花、拓普制作總成

,但總體成本較高(預(yù)計(jì)30-50萬/

臺(tái)),

25年加快國產(chǎn)供應(yīng)商拓展

,我們預(yù)計(jì)26年國產(chǎn)供應(yīng)商將開始放量。三花、拓普均已培養(yǎng)自己的零部

件供應(yīng)商。圖:旋轉(zhuǎn)執(zhí)行器及直線執(zhí)行器結(jié)構(gòu)拆分示意圖特斯拉:執(zhí)行器已經(jīng)鎖定國內(nèi)2家廠商,三花主供供應(yīng)鏈

國產(chǎn)化?自制(絲杠、編

碼器、電機(jī))?

綠的諧波?

北特科技

?

貝斯特特斯拉人形機(jī)器人量產(chǎn)第二階段特斯拉人形機(jī)器人量產(chǎn)第一階段

數(shù)據(jù)來源:特斯拉官網(wǎng),東吳證券研究所

15

特斯拉提供零部件?

新劍傳動(dòng)?

五洲新春預(yù)計(jì)25年產(chǎn)量5000臺(tái)+26年產(chǎn)量放大至5-10萬臺(tái),成本控制要求提升?

舍弗勒?

博世力士樂?

哈默納科三花智控拓普集團(tuán)編碼器控制器電機(jī)諧波拓普集團(tuán)三花智控絲杠70%30%u

黃仁勛定調(diào)機(jī)器人:僅有三種形式的機(jī)器人可實(shí)現(xiàn)大規(guī)模量產(chǎn),一是汽車,因?yàn)槲覀儤?gòu)建了一個(gè)適合汽車的世界;二是無人機(jī),因?yàn)樘炜諞]什么限制;三是人形機(jī)器人,我們?yōu)樽约簶?gòu)建一個(gè)世界。大規(guī)模生產(chǎn)至關(guān)重要,因?yàn)樗茯?qū)動(dòng)技術(shù)飛輪效應(yīng)。高投入的研發(fā)(R&D)能帶來技術(shù)突破,從而生產(chǎn)出更優(yōu)秀的產(chǎn)品,進(jìn)一步推動(dòng)生產(chǎn)規(guī)模的擴(kuò)大。u

在人形機(jī)器人領(lǐng)域做賣鏟子的人:

目標(biāo)是借助芯片等核心產(chǎn)品,圍繞著大模型、數(shù)據(jù)、開發(fā)平臺(tái)三大核心領(lǐng)域展開,為打造機(jī)器人底層開發(fā)生態(tài)。圖

英偉達(dá)機(jī)器人生態(tài)搭建

英偉達(dá)關(guān)于AI的發(fā)展判斷英偉達(dá):搭建人形機(jī)器人開發(fā)生態(tài),做賣鏟子的人

數(shù)據(jù)來源:英偉達(dá)公司官網(wǎng),東吳證券研究所

16

2018推出全新硬件、軟件、虛擬世界機(jī)器人模擬器的NVIDIAIsaac,同時(shí)還推出專為機(jī)器人設(shè)計(jì)的計(jì)算機(jī)平臺(tái)Jetson

Xavier和相關(guān)的機(jī)器人軟件工具包,正式布局智能機(jī)器人領(lǐng)域

2019

推出lsaac軟性開發(fā)套件(SDK),為機(jī)器人提供更新的AI感知和仿真功能

2021

推出Omniverse平臺(tái),支持機(jī)器人的協(xié)作和模擬,對協(xié)作機(jī)器人影響深遠(yuǎn)

2022推出IsaacNova

Orin,其配置的計(jì)算和傳感器參考平臺(tái)旨在幫助AMR(自主移動(dòng)機(jī)器人)制造商縮短開發(fā)時(shí)間并降低成本2022

發(fā)布基于Transformer架構(gòu)的支持多模形態(tài)的(仿真)智能體VIMA

2022

發(fā)布具有互聯(lián)網(wǎng)規(guī)模知識(shí)的開放式具身智能體-MinDojo2023

發(fā)布全新JetsonAGXOrin

工業(yè)級模塊

2023

發(fā)布VOYAGER智能體,這是第一個(gè)由LLM驅(qū)動(dòng)的可以終身學(xué)習(xí)的智能體,

為具身控制生成可執(zhí)行代碼

2023對Jetson平臺(tái)上的Metropolis和Isaac框架進(jìn)行有史以來規(guī)模最大的軟件擴(kuò)展,

用以來滿足邊緣AI的快速部署需求;與此同時(shí),

英偉達(dá)還宣布創(chuàng)建Jetson生成式AI實(shí)驗(yàn)室;另外宣布推出IsaacROS和IsaacSim軟件的全新版本

2023發(fā)布了Eureka(Evolution-driven

Universal

Reward

Kit

for

Agent)

智能機(jī)器人訓(xùn)練工具,本質(zhì)是一種由大模型驅(qū)動(dòng)的算法生成工具u

英偉達(dá)自2018年開始推出機(jī)器人模擬器NVIDIAIsaac、同時(shí)推出計(jì)算機(jī)平臺(tái)Jetson

Xavier和相關(guān)軟件工具包,

正式布局智能機(jī)器人,此后不斷升級芯片、計(jì)算平臺(tái)、機(jī)器人訓(xùn)練工具,

23年至今進(jìn)度顯著加快,

2024年推出

人形機(jī)器人通用基礎(chǔ)模型ProjectGR00T。圖英偉達(dá)智能機(jī)器領(lǐng)域發(fā)展史成立通用具身智能體研究GEAR(Generalist

EmbodiedAgent

Research)團(tuán)隊(duì),目標(biāo)是在虛擬和現(xiàn)實(shí)世界中建立具身智能體基礎(chǔ)模型,致力于實(shí)現(xiàn)跨多模態(tài)、多場景的智能應(yīng)用發(fā)布了人形機(jī)器人通用基礎(chǔ)模型Project

GR00T、

基于Thor

SoC的新型人形機(jī)器人計(jì)算機(jī)Jetson

Tho;

對Isaac機(jī)器人平臺(tái)進(jìn)行了重大

升級,包括生成式AI基礎(chǔ)模型和仿真工具、AI工作流基礎(chǔ)設(shè)施英偉達(dá):人形機(jī)器領(lǐng)域積淀已久,形成完成體系

據(jù)臺(tái)灣聯(lián)合新聞網(wǎng)報(bào)道,英偉達(dá)已接觸多家臺(tái)灣機(jī)床和關(guān)鍵零部件制造商,目標(biāo)包括征求關(guān)鍵零組件的技術(shù)與規(guī)格,并探索合作企業(yè)加入

其人形機(jī)器人供應(yīng)鏈的可能性。2024.12攜帶自家生成式AI時(shí)代的新王牌-升級版“Nvidia

NIM”(Nvidia

Inference

Microservices)

云原生微服務(wù)亮相丹佛SiGGRAPH2024大

會(huì);Nvidia布局的NIM生態(tài)系統(tǒng)已經(jīng)可提供一系列預(yù)訓(xùn)練的AI模型。NVIDIA

CES2025發(fā)布會(huì)上,發(fā)布其構(gòu)建的一套完整的Isaac

GR00T

Blueprint,為通用機(jī)器人的訓(xùn)練提供了一個(gè)數(shù)字孿生訓(xùn)練場。并

宣布了其合作的14個(gè)人形機(jī)器人廠商。數(shù)據(jù)來源:英偉達(dá)公司官網(wǎng),東吳證券研究所

172025.1鴻海正與英偉達(dá)合作,采用后者的軟件技術(shù)和硬件平臺(tái),在中國臺(tái)灣南部的高雄市研發(fā)專注于服務(wù)場景的人形機(jī)器人。2024.32025.12024.22024.7時(shí)間內(nèi)容u

NVIDIA面向物理AI和機(jī)器人訓(xùn)練、仿真、運(yùn)行構(gòu)建了三臺(tái)計(jì)算機(jī),分別為?

超級計(jì)算機(jī)NVIDIA

NeMo:用于AI模型訓(xùn)練。?仿真平臺(tái)Omniverse和Isaac

Sim

:模型訓(xùn)練完后需要測試,用仿真平臺(tái),可大幅縮短時(shí)間,降低成本?計(jì)算平臺(tái)Jetson

Thor:用于機(jī)器人本地部署的計(jì)算平臺(tái),從Jetson

Xavier,升級到Jetson

Orin,算力提升

10倍,并即將推出Jetson

Thor。圖英偉達(dá)人形機(jī)器人軟硬件平臺(tái)布局訓(xùn)練

測試

部署大幅縮短開發(fā)時(shí)間

數(shù)據(jù)來源:英偉達(dá)公司官網(wǎng),東吳證券研究所

18

英偉達(dá):三臺(tái)計(jì)算機(jī)幫助大幅縮短人形機(jī)器開發(fā)時(shí)間

本地部署:安裝在機(jī)器人內(nèi)部,它就是操作物理機(jī)器人的“大腦”。以通過Jetson或AGX這樣的系統(tǒng)來實(shí)現(xiàn)訓(xùn)練AI模型:訓(xùn)練通常在云端、數(shù)據(jù)中心或像NVIDIA

DGX這樣的強(qiáng)

大系統(tǒng)上進(jìn)行。仿真測試:引入一個(gè)“仿真層”,在虛擬環(huán)境中完成測試。大幅縮短測試時(shí)間和降低測試成本。機(jī)器人本地部署的專用計(jì)算

平臺(tái)JetsonThor在NVIDIAOVX服務(wù)器上的Omniverse和IsaacSim超級計(jì)算機(jī)NVIDIA

NeMo三臺(tái)計(jì)算機(jī)u

2025年1月,

NVIDIA發(fā)布IsaacGR00T

Blueprint,為通用機(jī)器人的訓(xùn)練提供了一個(gè)數(shù)字孿生訓(xùn)練場,可幫助開發(fā)者生成海量的合成運(yùn)動(dòng)數(shù)據(jù),以便通過模仿學(xué)習(xí)來訓(xùn)練人形機(jī)器人。u

該模型解決了人形機(jī)器人數(shù)據(jù)短缺、數(shù)據(jù)收集成本高昂等問題。在Blueprint的GR00T-Gen工具流中,NVIDIAOmniverse和NVIDIACosmos是指數(shù)級擴(kuò)增數(shù)據(jù)集的關(guān)鍵。

NVIDIACosmos是NVIDIA在2025年最新發(fā)布的“世界基礎(chǔ)模型”,擁有一系列開放的預(yù)訓(xùn)練世界基礎(chǔ)模型,專為生成具有物理感知的視頻和

物理AI開發(fā)所需的世界狀態(tài)而設(shè)計(jì)。圖英偉達(dá)數(shù)據(jù)孿生訓(xùn)練場流程仿真環(huán)境捕捉動(dòng)作

擴(kuò)展動(dòng)作數(shù)據(jù)集

——數(shù)據(jù)輸入人形機(jī)器人

數(shù)據(jù)來源:英偉達(dá)公司官網(wǎng),東吳證券研究所

19

英偉達(dá):仿真測試平臺(tái)解決人形機(jī)器人數(shù)據(jù)短缺痛點(diǎn)

捕捉人類動(dòng)作:借助AppleVision

Pro在數(shù)字孿生環(huán)境中捕捉人類動(dòng)作,這些人類動(dòng)作被記錄下來作為金標(biāo)準(zhǔn),并在仿真環(huán)境中由機(jī)器人模仿學(xué)習(xí)擴(kuò)展運(yùn)動(dòng)數(shù)據(jù)集:將捕捉到的人類示范動(dòng)作擴(kuò)展為更大的合成運(yùn)動(dòng)數(shù)據(jù)集指數(shù)級擴(kuò)增數(shù)據(jù)集:通過域隨機(jī)化和3D提升技術(shù),指數(shù)級擴(kuò)增這個(gè)數(shù)據(jù)集。

NVIDIAOmniverse和NVIDIACosmos(世界基礎(chǔ)模

型,基于1800萬億個(gè)

數(shù)據(jù)單元進(jìn)行訓(xùn)練)是指數(shù)級擴(kuò)增數(shù)據(jù)集的關(guān)鍵。教會(huì)人形機(jī)器人:擴(kuò)增后的數(shù)據(jù)集作為機(jī)器人策略的輸入,在Isaac

Lab中教會(huì)機(jī)器人如何在其環(huán)境中高效且安全地移動(dòng)和互動(dòng)NVIDIA

IsaacGR00T

Blueprint的仿真工作流

GR00T-Teleop

GR00T-Mimic

GR00T-Gen

Isaac

Lab

u

25年CES大會(huì)上,

NVIDIA已經(jīng)宣布第一批采用NVIDIACosmos的生態(tài)伙伴,包括6家中國人形機(jī)器人公司

,分別是星動(dòng)紀(jì)元、智元、傅利葉智能、銀河通用、宇樹科技、小鵬;以及美國Apptronik、AgilityRobotics、

FigureAI、

Boston

Dynamics(被現(xiàn)代收購),德國NEURA

Robotics,挪威1X,以色列

Mentee,加拿大SanctuaryAI。u

另外,據(jù)臺(tái)灣聯(lián)合新聞網(wǎng)24年12月3日報(bào)道,英偉達(dá)已接觸多家臺(tái)灣機(jī)床和關(guān)鍵零部件制造商,目標(biāo)包括征求關(guān)鍵零組件的技術(shù)與規(guī)格,并探索合作企業(yè)加入其人形機(jī)器人供應(yīng)鏈的可能性。我們認(rèn)為英偉達(dá)自己下場

做機(jī)器人本體可能性較小,更多是測試開發(fā),打通軟硬件,更好為客戶提供整體解決方案。圖英偉達(dá)25年CES大會(huì)宣布合作的14家機(jī)器人英偉達(dá):攜手全球各大機(jī)器人廠加快行業(yè)發(fā)展

數(shù)據(jù)來源:英偉達(dá)公司官網(wǎng),東吳證券研究所

20

BostonDynamicsNew-AtlasAgility

Robotics

Digit星動(dòng)紀(jì)元

Star1ApptronikApollo銀河通用G1MenteeMenteeBotFigureFigure021X

NEOSanctuaryAI

Phoenix小鵬IronNEURA

Robotics

4NE-1智元機(jī)器人

遠(yuǎn)征A2傅利葉

GR-2宇樹

H1收購時(shí)間公司名稱類型國家主要產(chǎn)品2013.12.2SCHAFT人形機(jī)器人日本Schaft機(jī)器人在日本的一次災(zāi)難救援挑戰(zhàn)賽中有著非常不錯(cuò)的表現(xiàn)2013.12.3Industrial

Perception機(jī)器視覺美國擁有先進(jìn)3D視覺技術(shù)可引導(dǎo)機(jī)器人在制造和物流中使用2013.12.4Redwood

Robotics人形機(jī)器人與機(jī)械臂美國主打家庭適用的機(jī)器臂機(jī)器人2013.12.5Meka

Robotics人形機(jī)器人美國致力于打造人形機(jī)器人,用以和人們生活、工作。它的旗艦機(jī)型

M1移動(dòng)操作機(jī)器人具有安全、人性化的機(jī)器人技術(shù),可適用于人們家庭和工作場所,可看作個(gè)人助手2013.12.6Holomni輪式機(jī)器人美國2013.12.7Bot

&

Dolly機(jī)器人攝像系統(tǒng)美國專門從事電影領(lǐng)域制作的自動(dòng)化機(jī)器人,擅長將大型機(jī)械臂和定制軟件相結(jié)合2013.12.8Autofuss廣告設(shè)計(jì)美國2013.12.10Boston

Dynamics人形機(jī)器人美國具備超強(qiáng)的運(yùn)動(dòng)性能的人形機(jī)器人u

2013年底Google一舉收購8家機(jī)器人公司。

2013年3月Google創(chuàng)建機(jī)器人部門Replicant,后這個(gè)部門劃歸

到Google

X門下,即后來的Alphabet

X。

2013年底,

google瘋狂收購機(jī)器人公司,包括波士頓動(dòng)力在內(nèi)的8

家機(jī)器人公司,

目標(biāo)在于發(fā)展商用機(jī)器人技術(shù)。u

主帥離職,

8家各自為政,

商業(yè)化路程艱難。

2014年google機(jī)器人部門主管Andy

Rubin離職,缺乏核心人物

將8家公司團(tuán)結(jié)在一起,各部門缺乏協(xié)作能力,且機(jī)器人訓(xùn)練成本高昂,

缺乏落地場景,商業(yè)化進(jìn)展低于預(yù)期

,

2017年將波士頓動(dòng)力出售給軟銀(購入價(jià)30億美元)

,取消Robot

Project。究其原因,

彼時(shí)算力、大模型

和人工智能尚不足以支持機(jī)器開發(fā)、訓(xùn)練。圖Google收購的8家機(jī)器人公司Google:曾高舉高打布局機(jī)器人,但迅速失敗

數(shù)據(jù)來源:谷歌公司官網(wǎng),東吳證券研究所

21

u

此前Google

Brain和Deepmind分別延兩條技術(shù)路線探索人形機(jī)器人大模型,

2023年4月兩大部門合并為Google

deepmind,追趕OpenAI,此后推出Gemini2.0,該模型為AI

Agent應(yīng)用而設(shè)計(jì)的多模態(tài)大模型,最

重要的是它可以理解和推理物理世界,構(gòu)建代理,操控人形機(jī)器人執(zhí)行任務(wù)。?Google

AI團(tuán)隊(duì):

從RT-1到融合了PalM-E的RT-2,將語言和視覺大模型應(yīng)用到機(jī)器人控制領(lǐng)域,

在推理、

知識(shí)、泛化能力方面更強(qiáng)。?Deepmind:

2014年Google以6億美金收購英國AI公司Deepmind,在合并前,

其獨(dú)立研發(fā)。其主要從智能

體的角度出發(fā)訓(xùn)練機(jī)器人,

開發(fā)Robocat、Autonomous和

DemoStart模型,

訓(xùn)練數(shù)據(jù)大都來自強(qiáng)化學(xué)習(xí)

,模型參數(shù)量控制表現(xiàn)更優(yōu),能夠?qū)崿F(xiàn)更高頻率的機(jī)器人控制。圖Google兩個(gè)團(tuán)隊(duì)機(jī)器人機(jī)器人大模型發(fā)展歷程2023.4月兩部門合并Google:兩大團(tuán)隊(duì)合并,聚焦人形機(jī)器人大模型

Demostart(2024.10)新型自主強(qiáng)化學(xué)習(xí)方法,提高機(jī)器人在仿真環(huán)境中的操作技能學(xué)習(xí)效率,并最終實(shí)現(xiàn)這些技能從仿真到現(xiàn)實(shí)的零樣本遷移PalM-E(2023.3)是在預(yù)訓(xùn)練語言模型的語言嵌入空間中注入連續(xù)的、具身的觀測,如圖像、狀態(tài)估計(jì)或其他傳感器模態(tài)。Robocat(2023.6)僅需要最少100次演示就能完成訓(xùn)練,可通過自我生成的數(shù)據(jù)進(jìn)行優(yōu)化、改進(jìn)AutoRT、SARA-RT

RT-Trajectory(

2024.1)提高數(shù)據(jù)收集、效率和泛化能力RT-2(2023.7)擴(kuò)充數(shù)據(jù)集合RT-X(2023.10)擴(kuò)充動(dòng)作集RT-1(2022.12)構(gòu)建起特定指令、圖片和機(jī)器人任務(wù)輸出

的橋梁,但能力受限于數(shù)據(jù)庫Gato(2022.5)能夠處理多種任務(wù)

:包括少量現(xiàn)實(shí)場

景機(jī)器人任務(wù)

數(shù)據(jù)來源:谷歌公司官網(wǎng),東吳證券研究所

22

Google

BrainDeep

mindu

RT-1構(gòu)建起特定指令、圖片和機(jī)器人任務(wù)輸出的橋梁,但能力受于數(shù)據(jù)庫:

2022年Google把Transformer架構(gòu)應(yīng)用到機(jī)器人的操縱任務(wù)上,提出了RT-1模型。主體是預(yù)訓(xùn)練的視覺模型和用解釋器處理過的語言指令,

一起通過transformer架構(gòu)輸出機(jī)器人的動(dòng)作指令,學(xué)習(xí)范式是模仿學(xué)習(xí),訓(xùn)練數(shù)據(jù)是在google實(shí)驗(yàn)室中的兩

個(gè)廚房環(huán)境記錄的操控移動(dòng)機(jī)械臂完成抓取與放置動(dòng)作時(shí)的記錄,因?yàn)閿?shù)據(jù)相對局限,

RT-1只能接受在數(shù)據(jù)庫

中出現(xiàn)過的指令,指令的基本結(jié)構(gòu)為“動(dòng)作

+

目標(biāo)物體

+

目標(biāo)位置”。u

RT-2拓展對外界認(rèn)知,但動(dòng)作仍受限。

由于機(jī)器人數(shù)據(jù)收集受限,

google直接采用已經(jīng)有的多模態(tài)視覺語言模

型(PalM-E),

數(shù)據(jù)擴(kuò)充至網(wǎng)絡(luò)上海量的圖文數(shù)據(jù),

創(chuàng)造性的輸出機(jī)器人行為字符串。但動(dòng)作仍受限于桌面的

抓取。u

大數(shù)據(jù)集OpenX加持,

RT-X擴(kuò)充動(dòng)作能力。

收集全球60多個(gè)機(jī)器人實(shí)驗(yàn)室機(jī)械臂操作的數(shù)據(jù),

合成數(shù)據(jù)集Open

Embodiment,包括500多個(gè)動(dòng)作。用該數(shù)據(jù)進(jìn)行RT-2的方式的訓(xùn)練。其貢獻(xiàn)在于創(chuàng)造一個(gè)持續(xù)增長的

共享和開源數(shù)據(jù)集。Google:機(jī)器人控制模型RT系列不斷升級

數(shù)據(jù)來源:谷歌公司官網(wǎng),東吳證券研究所

23

RT-2模型概覽u

2024年初在Robotics

Transformers的基礎(chǔ)上,

Google發(fā)布AutoRT、

SARA-RT和

RT-Trajectory,提高機(jī)器

人在現(xiàn)實(shí)世界中的數(shù)據(jù)收集、效率和泛化能力。?AutoRT:機(jī)器人訓(xùn)練系統(tǒng)。利用大型基礎(chǔ)模型(LLM/VLM)和機(jī)器人控制模型(RT-1/RT-2)

,來收集更

多和更多樣化的訓(xùn)練數(shù)據(jù),

可同時(shí)指導(dǎo)多臺(tái)機(jī)器人在不同環(huán)境中執(zhí)行多樣化任務(wù),

并通過VLM理解環(huán)境和物

體,

LLM提出創(chuàng)意任務(wù)并選擇機(jī)器人可以獨(dú)立完成的任務(wù)。?SARA-RT:提升機(jī)器人Transformer模型效率的系統(tǒng)。通過一種稱為“up-training”的模型微調(diào)方法,將

模型的二次復(fù)雜性轉(zhuǎn)換為線性復(fù)雜性,從而顯著減少了計(jì)算需求,同時(shí)保持了模型的質(zhì)量,

無需額外編碼。?RT-Trajectory:實(shí)現(xiàn)機(jī)器人泛化能力的模型。通過在訓(xùn)練視頻中添加描述機(jī)器人動(dòng)作的視覺輪廓,

RT-Trajectory讓機(jī)器人從2D軌跡圖像中學(xué)習(xí)控制策略,大幅提升執(zhí)行未見任務(wù)的成功率。Google:強(qiáng)化RT系列的數(shù)據(jù)收集、效率和泛化能力

數(shù)據(jù)來源:谷歌公司官網(wǎng),東吳證券研究所

24

RT-Trajectory系統(tǒng)構(gòu)架圖AutoRT系統(tǒng)構(gòu)架u

2024年12月,

Google發(fā)布Gemini2.0多模態(tài)大模型,

其專為AI

Agent而設(shè)計(jì),

支持圖像、視頻、音頻等多模

態(tài)輸入,以及原生生成圖像與文本混合、多語言音頻的多模態(tài)輸出;

并能夠原生調(diào)用Google搜索、代碼執(zhí)行以

及第三方用戶定義函數(shù)等工具。

Gemini2.0是真正的統(tǒng)一底層模型,他具備三大能力:

一是感知能力,二是記

憶能力,

三是工具使用能力。u

利用Gemini2.0的空間推理功能,未來可以操控人形機(jī)器人執(zhí)行任務(wù)、低成本訓(xùn)練人形機(jī)器人。

谷歌發(fā)布Gemini2.0的博客提到“除了探索虛擬世界中的代理功能外,

我們還在試驗(yàn)可以通過將Gemini2.0的空間推

理功能應(yīng)用于機(jī)器人技術(shù)來在物理世界中提供幫助的代理。雖然現(xiàn)在還為時(shí)過早,

但我們對可以在物理環(huán)境中

提供幫助的代理的潛力感到興奮?!蓖瑫r(shí),

Gemini2.0的機(jī)器人代理也可以幫助人形機(jī)器人廠商訓(xùn)練自家人形

機(jī)器人,成為一種低成本、實(shí)時(shí)訓(xùn)練的方案。圖Gemini2.0空間理解:精準(zhǔn)的物體識(shí)別與定位圖

Gemini2.0性能大幅提升Google:Gemini2.0有望構(gòu)建人形機(jī)器人的代理

數(shù)據(jù)來源:谷歌公司官網(wǎng),東吳證券研究所

25

u

2024年12月20日,谷歌DeepMind宣布攜手Apptronik,針對動(dòng)態(tài)現(xiàn)實(shí)環(huán)境的復(fù)雜作業(yè)挑戰(zhàn),共同研發(fā)新一

代人形機(jī)器人。此次合作將結(jié)合谷歌的尖端AI技術(shù)與Apptronik的成熟機(jī)器人硬件,進(jìn)一步提升人形機(jī)器人的

功能性和安全性。u

同時(shí),對于谷歌而言,意味著未來可以通過Apptronik的人形機(jī)器人載體(視覺、觸覺、味覺、六維力矩等多種

傳感、以及雙手)采集豐富的現(xiàn)實(shí)數(shù)據(jù),

以此增強(qiáng)其空間物理智能。圖

Apptronik的機(jī)器人Apollo

Apptronik簡介項(xiàng)目內(nèi)容背景Apptronik

由深度參與

NASA

Valkyrie機(jī)器人項(xiàng)目的團(tuán)隊(duì)成立,自

2016年成立以來,已構(gòu)建

13個(gè)機(jī)器人遠(yuǎn)程操作開發(fā)了一種VR遠(yuǎn)程操作方法,用于其上

半身人形機(jī)器人Astra

,支持混合自治,允許在必要時(shí)進(jìn)行遠(yuǎn)程指導(dǎo)模塊化具有高度模塊化設(shè)計(jì),能夠根據(jù)任務(wù)需求進(jìn)行不同配置,如安裝在車輪上或更換傳感器載荷商業(yè)化專注于最基本的任務(wù):移動(dòng)箱子、工業(yè)手提袋、垃圾箱和其他材料的搬運(yùn)。目前已進(jìn)入奔馳工廠,并與物流巨頭GXO達(dá)成合作協(xié)議Google:聯(lián)手Apptronik研發(fā)下一代人形機(jī)器人

數(shù)據(jù)來源:谷歌公司官網(wǎng),東吳證券研究所

26

u

Open

AI曾涉足機(jī)器人,因數(shù)據(jù)不足而解散。

在成立之初,其發(fā)展目標(biāo)就包括制造通用機(jī)器人,由聯(lián)合創(chuàng)始人Wojciech

Zaremba帶隊(duì),但后續(xù)研究只專注于機(jī)器人軟件技術(shù),

最終因缺乏訓(xùn)練數(shù)據(jù),

于2021年解散團(tuán)隊(duì)。其研究成果有兩個(gè),

一是訓(xùn)練機(jī)械手破解魔方(用英國靈巧手公司Shadow的機(jī)械手)

,二是Roboschool

(機(jī)

器人模擬器,用于控制并訓(xùn)練機(jī)器人)。u

2024年底開始組建機(jī)器人團(tuán)隊(duì),

但總體招聘崗位較少。

機(jī)器人硬件由2024年11月入職的前Meta增強(qiáng)現(xiàn)實(shí)眼鏡

項(xiàng)目負(fù)責(zé)人Caitlin

Kalinowski負(fù)責(zé);機(jī)器人軟件由OpenAI的計(jì)算主管Christopher

Berner負(fù)責(zé)。

25年1月,Caitlin宣布OpenAI開放3個(gè)機(jī)器人相關(guān)崗位:

機(jī)器人系統(tǒng)集成電氣工程師(為機(jī)器人設(shè)計(jì)傳感器套件)、機(jī)器

人機(jī)械設(shè)計(jì)工程師(負(fù)責(zé)機(jī)器人本體的硬件配置)

、TMP經(jīng)理(機(jī)器人技術(shù)項(xiàng)目經(jīng)理)。u

OpenAI具備軟件算法優(yōu)勢,機(jī)器人之夢從未褪色。布局人形機(jī)器人具備強(qiáng)大的算法和大模型優(yōu)勢,

其視頻生成

模型Sora可用于數(shù)據(jù)仿真,具備推理能力的語音生成模型Voice

Engine、AI大語言模型o3可用于人機(jī)交互等

。但OpenAI缺乏制造經(jīng)驗(yàn)和供應(yīng)鏈搭建,自制本體步伐相對謹(jǐn)慎,

但堅(jiān)定前進(jìn)。圖OpenAI機(jī)器人模擬器Roboschool

圖OpenAI機(jī)械手單手解魔方,成功率60%OpenAI:重啟團(tuán)隊(duì),小規(guī)模自研人形機(jī)器人

數(shù)據(jù)來源:

OpenAI公司官網(wǎng),東吳證券研究所

27

1XFigureAIPhysicalIntelligence類型人形機(jī)器人本體人形機(jī)器人本體研發(fā)機(jī)器人大腦融資時(shí)間2023.3/2024.12024.22024.11融資金額

2350萬美元/1億美金6.75億美元

4億美元產(chǎn)品聚焦家庭場景的雙足人形機(jī)器人NEO

Beta聚焦工業(yè)場景的雙足人形機(jī)器人Figure02π0模型可以控制不同形態(tài)的機(jī)器人,

使其執(zhí)行多樣化的任務(wù)OpenAI合作2022年1X與OpenAI合作。但1X

目前還未搭載高級語言大模型,其更在意任務(wù)間的泛化能力。從數(shù)據(jù)采集來看,

1X也更傾向于真實(shí)場景采集。接入OpenAI大模型GPT-4o,來識(shí)別

語言,規(guī)劃動(dòng)作。之后再由其自有神經(jīng)策略層執(zhí)行動(dòng)作(端對端)。同時(shí)用自己的身體控制模型來保持機(jī)器人的平衡。創(chuàng)始人Karol

Hausman在google深

度參與RT系列的研發(fā)u

OpenAI投資了機(jī)器人相關(guān)的3家公司,

挪威人形機(jī)器人企業(yè)1X

Technologics、美國人形機(jī)器人公司Figure

AI、研發(fā)人形機(jī)器人大腦的具身智能公司Physical

Intelligence,并為其中Figure

AI提供了模型方面的

技術(shù)支持。?1X:

2023年OpenAI領(lǐng)投1X

,

24年參與B輪融資。

1X作為挪威機(jī)器人公司,

專注家庭場景。?Figure

AI:

2024年在A1輪融資中投資500萬美金,

并為Figure提供大模型,識(shí)別語言和規(guī)劃動(dòng)作。?Physical

Intelligence

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論