【東吳證券】人形機(jī)器人深度報(bào)告之七：海外人形機(jī)器人深度：人形機(jī)器人的GhatGPT時(shí)刻已至

上傳人：緣*** IP屬地：四川上傳時(shí)間：2025-02-22 格式：PPTX 頁數(shù)：72 大?。?.20MB 積分：15 舉報(bào) 版權(quán)申訴

【東吳證券】人形機(jī)器人深度報(bào)告之七：海外人形機(jī)器人深度：人形機(jī)器人的GhatGPT時(shí)刻已至_第2頁

【東吳證券】人形機(jī)器人深度報(bào)告之七：海外人形機(jī)器人深度：人形機(jī)器人的GhatGPT時(shí)刻已至_第3頁

【東吳證券】人形機(jī)器人深度報(bào)告之七：海外人形機(jī)器人深度：人形機(jī)器人的GhatGPT時(shí)刻已至_第4頁

【東吳證券】人形機(jī)器人深度報(bào)告之七：海外人形機(jī)器人深度：人形機(jī)器人的GhatGPT時(shí)刻已至_第5頁

已閱讀5頁，還剩67頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

海外人形機(jī)器人深度：人形機(jī)器人的GhatGPT時(shí)刻已至--人形機(jī)器人深度報(bào)告之七

2025年2月10日證券研究報(bào)告·行業(yè)研究·電力設(shè)備與新能源行業(yè)u

美國科技公司具備算力和大模型優(yōu)勢

，

引領(lǐng)人形機(jī)器人發(fā)展

，進(jìn)度看特斯拉

﹥英偉達(dá)

﹥Google﹥OpenAI

：

從進(jìn)展看

，特斯拉居首

，且從芯片、數(shù)據(jù)訓(xùn)練、大模型到本體制造、運(yùn)控模型均自研自產(chǎn)

，

25年已制定千臺(tái)量

產(chǎn)目標(biāo)。其次為英偉達(dá)

，其具備強(qiáng)大的算力能力+數(shù)據(jù)訓(xùn)練平臺(tái)優(yōu)勢

，利用微軟芯片、數(shù)據(jù)、大模型、開發(fā)平

臺(tái)

，

為人形機(jī)器人公司打造底層開發(fā)生態(tài)

，

已與14家人形公司合作。其次為Google

，從放棄本體聚焦機(jī)器人

大模型

，到再次牽手機(jī)器人公司合作下一代人形機(jī)器人

，具備大模型能力。OpenAI目前通過投資和自己小規(guī)模

研發(fā)機(jī)器人本體

，

尚未All

in。蘋果和Meta目前專注機(jī)器人細(xì)分感知領(lǐng)域

，平臺(tái)推出機(jī)器人感知系統(tǒng)ARMOR可用于機(jī)械臂

，

Meta此前收購Digit觸覺傳感器團(tuán)隊(duì)。u

以美國為首的創(chuàng)業(yè)型公司與科技公司加強(qiáng)大模型合作

，加速商業(yè)化場景落地

，潛力上看Figure

AI>

Agility>

挪威1X>

Apptronik>德國Neura

Robotics

>加拿大Sanctuary

AI。

Figure02已獲得寶馬、亞馬遜等訂單

,公司預(yù)期兩大客戶未來4年訂單需求10萬臺(tái)

，

25年銷量目標(biāo)幾千臺(tái)

，并獲得科技巨頭投資

，股東背景雄厚。Agility專注物流場景

，

已獲得亞馬遜、

GXO訂單

，商業(yè)化放量進(jìn)度最快

，在建1萬臺(tái)產(chǎn)能。

1X專注家庭場景

，

25年目標(biāo)1千臺(tái)產(chǎn)量

。Apptronik計(jì)劃25年底商業(yè)化量產(chǎn)

，

已與google合作下一代機(jī)器人

。

德國NeuraRobotics25年1月在手訂單10億歐。以上公司均加入英偉達(dá)Cosmos

，大模型加持迭代加速。u

25年海外機(jī)器人元年

，大規(guī)模量產(chǎn)后

，

中國供應(yīng)鏈將充分受益。海外公司均重視落地場景

，25年是量產(chǎn)元年

，

絕大部分公司先落地車間和物流場景

，部分企業(yè)如1X和Neura

Robotics同樣重視家庭場景

，雙足和手部形態(tài)

多樣化。

25年各家目標(biāo)從幾百臺(tái)到幾千臺(tái)不等

，我們預(yù)計(jì)25年海外機(jī)器人產(chǎn)量突破1萬臺(tái)

，其中特斯拉5k臺(tái)

，

27-28年TOC端突破

，特斯拉銷量達(dá)到100萬臺(tái)。

隨著大規(guī)模量產(chǎn)

，供應(yīng)鏈將切換至中國廠商

，綁定特斯拉的tier1最為受益

，其次為各環(huán)節(jié)核心龍頭。u

投資建議：

機(jī)器人當(dāng)前類比2014年電動(dòng)車

，即將量產(chǎn)

，開啟10年產(chǎn)業(yè)大周期

，強(qiáng)烈看好板塊！

1）特斯拉鏈：

首推確定性龍頭Tier1【三花智控】【拓普集團(tuán)】

，Tier2【鳴志電器】【綠的諧波】【雙環(huán)傳動(dòng)】

，關(guān)注【北特科技】【浙江榮泰】【五洲新春】【震?？萍肌俊舅沽夤煞荨俊敬髽I(yè)股份】等；

2）華為及國內(nèi)鏈：推薦【雷賽智能】【匯川技術(shù)】【賽力斯】【富臨精工】

，關(guān)注【兆威機(jī)電】【藍(lán)黛科技】【禾川科技】【豪能股份】【科力爾】【埃夫特】【拓斯達(dá)】等。

3）英偉達(dá)鏈：推薦【偉創(chuàng)電氣】【科達(dá)利】等。4)宇樹科技鏈：推薦【曼恩斯特】

，關(guān)注【長盛軸承】【臥龍電驅(qū)】【奧比中光】。u

風(fēng)險(xiǎn)提示：

量產(chǎn)進(jìn)展不及預(yù)期；產(chǎn)業(yè)鏈降本不及預(yù)期；行業(yè)關(guān)鍵技術(shù)突破不及預(yù)期；

市場競爭加劇2摘要

PART2美國科技公司引領(lǐng)人形機(jī)器人發(fā)展

PART3美國機(jī)器人創(chuàng)業(yè)公司加速商業(yè)化場景落地

PART4歐洲及其他：

1X和Neura為首引領(lǐng)發(fā)展

PART5

日韓：智能化有待提升，商業(yè)化尚早

PART6供應(yīng)鏈

PART7投資建議及風(fēng)險(xiǎn)提示3

PART1海外人形機(jī)器人的ChatGPT時(shí)刻已至目錄PART1海外人形機(jī)器人的ChatGPT時(shí)刻已至4中國美國歐洲全球24年制造業(yè)從業(yè)人員（億）1.20.10.34.0滲透率20%40%40%16%24年生活服務(wù)從業(yè)人員（億）1.20.81.06.0滲透率10%20%20%10%1.5臺(tái)機(jī)器人替代1個(gè)工人1.51.51.51.5其他新增需求（億臺(tái)）0.40.30.31.5人形機(jī)器人存量空間（億臺(tái)）0.90.60.83.4人形機(jī)器人每年新增空間（億臺(tái)）0.230.150.190.84人形機(jī)器人均價(jià)（萬/臺(tái)）10141412每年新增市場空間（萬億）2.32.22.610.1u

人形機(jī)器人：

其空間來自對工人的替代

，并可進(jìn)入toc端創(chuàng)造新需求。

24年全球制造業(yè)從業(yè)人員4億人

，生活服

務(wù)從業(yè)人員6億

，按照制造業(yè)機(jī)器人滲透率16%、服務(wù)業(yè)機(jī)器人滲透率10%

，

1.5臺(tái)機(jī)器人替代1個(gè)工位

，且預(yù)計(jì)

其他領(lǐng)域新增1.5億臺(tái)需求

，對應(yīng)全球人形機(jī)器人每年新增需求0.8億臺(tái)

，單臺(tái)價(jià)格12萬/臺(tái)

，對應(yīng)市場空間10萬

億

，其中中國市場空間為2.3萬億

，對應(yīng)人形機(jī)器人新增需求2300萬臺(tái)。u

歐美勞動(dòng)力成本高

，人形機(jī)器人性價(jià)比突出：放量初期按照一臺(tái)機(jī)器人成本50萬算

，

3臺(tái)替代一個(gè)工人

，按照美

國人工成本70萬/個(gè)

，對應(yīng)回本周期2年

，而中國回本周期10年。但若成本下降至14萬算

，

1.5臺(tái)替代一個(gè)工人

，

對應(yīng)美國回本周期0.3年、

中國回本周期1.5年。一個(gè)工位成本（萬元）210.31.5遠(yuǎn)期（27-28年之后）1.5臺(tái)機(jī)器人替代1個(gè)

工人美國回本周期（年）

中國回本周期（年）項(xiàng)目金額美國工人成本（萬元）70中國人工成本（萬元）15短期機(jī)器人成本（萬元）50遠(yuǎn)期機(jī)器人成本（萬元）14一個(gè)工位成本（萬元）150人（

）工美國回本周期（年）2中國回本周期（年）

10人3臺(tái)個(gè)年16代2替25機(jī)器短期勞動(dòng)力短缺+經(jīng)濟(jì)性，人形機(jī)器人需求空間廣闊

數(shù)據(jù)來源：各國統(tǒng)計(jì)局，東吳證券研究所測算

5圖人形機(jī)器人市場空間圖：機(jī)器人的經(jīng)濟(jì)性u

人形機(jī)器人的優(yōu)勢在于通用性

，而要實(shí)現(xiàn)通用性需依賴：

一是訓(xùn)練數(shù)據(jù)

，二是AI大模型

，

2022年以來算力、

大

模型等快速發(fā)展

，人形機(jī)器人智能化大幅提升

，其中特斯拉、英偉達(dá)、Google布局領(lǐng)先。?數(shù)據(jù)訓(xùn)練：

高質(zhì)量的訓(xùn)練數(shù)據(jù)是人形機(jī)器人實(shí)現(xiàn)泛用性的基礎(chǔ)，

此前依賴真實(shí)場景采集，效率低，成本高，

而仿真平臺(tái)的發(fā)展指數(shù)級放大數(shù)據(jù)采集和訓(xùn)練規(guī)模，提高效率、降低成本。?具身智能大模型：從語言大模型，到視覺大模型，

到VLA多模態(tài)大模型，強(qiáng)化機(jī)器人交互、任務(wù)拆解、任務(wù)

執(zhí)行能力，和自主學(xué)習(xí)能力，讓機(jī)器人大腦更加智能。圖人形機(jī)器人大模型海外大模型發(fā)展推動(dòng)人形機(jī)器人落地，科技公司引領(lǐng)數(shù)據(jù)來源：特斯拉、英偉達(dá)、谷歌等官網(wǎng)，東吳證券研究所

6英偉達(dá)GR001

Project為機(jī)器人提供通用智能的基礎(chǔ)模型Meta和CMU聯(lián)合打造的大模型RoboAgentPhysicalIntelligenceπ0模型使機(jī)器人可自主執(zhí)行復(fù)雜任務(wù)英偉達(dá)Isaac

GR00TBlueprint是一個(gè)數(shù)字孿生訓(xùn)練場googleRT系列和AutoRT收集更多和更多樣化的訓(xùn)練數(shù)據(jù)特斯拉Dojo超級計(jì)算機(jī)及相關(guān)技術(shù)構(gòu)建數(shù)據(jù)仿真訓(xùn)練體系仿真數(shù)據(jù)訓(xùn)

練平臺(tái)具身智能大

模型特斯拉FigureAIAgilityApptronikSanctuaryAI波士頓動(dòng)力1XNeura

Robotics國家美國美國美國美國加拿大韓國挪威德國商業(yè)化場景先落地汽車車間先落地車廠和

物流物流先落地車廠和

物流商超家庭工業(yè)/家庭量產(chǎn)計(jì)劃25年幾千臺(tái)，26-27年每年10倍增長2家客戶未來4

年（25-28年）

需求10萬臺(tái)24年內(nèi)產(chǎn)能達(dá)

到數(shù)百臺(tái)，未

來幾年將實(shí)現(xiàn)

年產(chǎn)能1萬臺(tái)25年將制造數(shù)

百個(gè)24年7月定下前臺(tái)量產(chǎn)目標(biāo)，但量產(chǎn)不順，

創(chuàng)始人離職從液壓轉(zhuǎn)向電

動(dòng)，計(jì)劃商用25年制造1000個(gè)，在

2028年將制造數(shù)百萬個(gè)

NEO10億歐訂單客戶自用寶馬、亞馬遜亞馬遜GXO奔馳GXOCTC麥格納家用川崎重工、歐

姆龍下肢形態(tài)雙足雙足鴕鳥雙足雙足/輪式雙足（但有可

能改輪式）雙足升級為雙足雙足靈巧手22自由度16自由度電動(dòng)抓夾20自由度三指抓夾20自由度可組裝手/夾大模型自制與OpenAI合作/加入英偉達(dá)Cosmos加入英偉達(dá)

Cosmos與Google合作/加入英偉達(dá)Cosmos自研/加入英偉

達(dá)Cosmos加入英偉達(dá)

Cosmos與OpenAI合作/加入英偉達(dá)Cosmos加入英偉達(dá)

Cosmosu

從商業(yè)化場景看：

海外公司均重視落地場景

，

絕大部分公司先落地車間和物流場景

，

部分企業(yè)如1X和NeuraRobotics同樣重視家庭場景。并且嘗試用租賃的方式

，

降低客戶使用成本。u

從量產(chǎn)角度看：25年是量產(chǎn)元年

，各家目標(biāo)從幾百臺(tái)到幾千臺(tái)不等。且26年大規(guī)模量產(chǎn)新機(jī)型。

從本體和末端執(zhí)行器看：

存在多樣化。但基本以雙足為主

，部分采用輪式。

同時(shí)手部方案多為開放式

，可自由組

裝靈巧手或抓夾。u

從大模型看：

除特斯拉自研外

，

其余主流公司基本加入英偉達(dá)Cosmos生態(tài)

，

同時(shí)部分公司也和OpenAI或Google等科技公司合作。圖海外人形機(jī)器人特點(diǎn)總結(jié)海外人形機(jī)器人重視商業(yè)化落地，車廠和物流先行

數(shù)據(jù)來源：

特斯拉、

figure、

agility等官網(wǎng)，東吳證券研究所

特斯拉：大模型+人形本體垂直一體公司。將自動(dòng)駕駛大模型嫁接到人形機(jī)器人

，利用Dojo超級計(jì)算機(jī)平臺(tái)繼續(xù)

數(shù)據(jù)仿真訓(xùn)練

，擁有豐富的制造經(jīng)驗(yàn)和強(qiáng)大的供應(yīng)鏈基礎(chǔ)

，以及汽車車間應(yīng)用場景。u

英偉達(dá)、

Google、

Physical

Intelligence：

具備計(jì)算/大模型優(yōu)勢

，提供人形機(jī)器人大腦。英偉達(dá)依托芯片

，

拓展數(shù)據(jù)

、

大模型

、

開發(fā)平臺(tái)

，

為人形廠商提供底層開發(fā)模型

。

Google依托打造的RT系列模型

，

并計(jì)劃用Gemini模型控制人形

，與人形廠商聯(lián)手

，開發(fā)新一代機(jī)器人。

PI專門提供人形機(jī)器人具身智能大模型。u

Figure

AI、Agility、

1X等：

產(chǎn)品性能優(yōu)異

，商業(yè)化落地快的人形初創(chuàng)公司。

Figure02已獲得寶馬、亞馬遜等

訂單

，并獲得科技巨頭投資

，股東背景雄厚。

Agility專注物流場景

，

已獲得亞馬遜、

GXO訂單。

1X專注家庭場

景。圖看好三類人形機(jī)器人公司FigureAIAgilityApptroni

k1X商業(yè)化場

景先落地車

廠和物流物流先落地車

廠和物流家庭量產(chǎn)計(jì)劃2家客戶

未來4年（25-28

年）需求

10萬臺(tái)24年內(nèi)產(chǎn)

能達(dá)到數(shù)

百臺(tái)，未

來幾年將

實(shí)現(xiàn)年產(chǎn)

能1萬臺(tái)25年將制

造數(shù)百個(gè)25年制造

1000個(gè)，

在

2028

年將制造

數(shù)百萬個(gè)NEO客戶寶馬、亞

馬遜亞馬遜GXO奔馳GXO家用下肢形態(tài)雙足鴕鳥雙足雙足/輪式升級為雙

足靈巧手16自由度電動(dòng)抓夾20自由度大模型與OpenAI合作/加入英偉達(dá)Cosmos加入英偉達(dá)Cosmos與Google合作/加入英偉達(dá)Cosmos與OpenAI合作/加入英偉達(dá)Cosmos英偉達(dá)

Google

OpenAI人形進(jìn)展★★★★★★★★★產(chǎn)品芯片、大模型、數(shù)據(jù)、開發(fā)平臺(tái)大模型大模型方式出售芯片及開發(fā)平臺(tái)合作開發(fā)

本體投資+小規(guī)模自研本體機(jī)器人14家機(jī)器人加入Cosmos生態(tài)Apptroni

c1XFigureAI優(yōu)勢強(qiáng)大的算

力能力

數(shù)據(jù)訓(xùn)練

平臺(tái)+商

業(yè)模式大模型能

力大模型能

力特斯拉商業(yè)化場景先落地汽車車

間量產(chǎn)計(jì)劃25年幾千臺(tái)，26-27年每年

10倍增長客戶自用下肢形態(tài)雙足靈巧手22自由度大模型自制看好三類公司，將充分受益人形機(jī)器人產(chǎn)業(yè)大周期

數(shù)據(jù)來源：

特斯拉、英偉達(dá)、谷歌等官網(wǎng)，東吳證券研究所

8優(yōu)質(zhì)創(chuàng)業(yè)公司具身智能大模型公司垂直一體化公司PART2美國科技公司引領(lǐng)人形機(jī)器人發(fā)展9特斯拉英偉達(dá)GoogleOpenAI蘋果Meta微軟人形進(jìn)展★★★★★★★★★★★★★★★★★產(chǎn)品人形機(jī)器人本

體芯片、大模型、數(shù)據(jù)、開發(fā)平

臺(tái)大模型大模型機(jī)器人感知系

統(tǒng)ARMORDigit

360的高精度觸覺傳感器方式垂直一體化生

產(chǎn)出售芯片及開

發(fā)平臺(tái)合作開發(fā)本體投資+小規(guī)模自

研本體投資機(jī)器人特斯拉機(jī)器人14家機(jī)器人加

入Cosmos生態(tài)Apptronik1XFigureAIPhysicalIntelligenceFigureAI優(yōu)勢軟件能力+制造

能力強(qiáng)大的算力能

力+數(shù)據(jù)訓(xùn)練平

臺(tái)+商業(yè)模式大模型能力大模型能力和CMU聯(lián)合打造的大模型

RoboAgentu

科技公司均重視人形機(jī)器人的發(fā)展，

其中特斯拉預(yù)計(jì)未來人形機(jī)器人將成為公司主要收入來源。u

特斯拉﹥英偉達(dá)﹥Google﹥OpenAI

：從進(jìn)展看，特斯拉居首，

且從芯片、數(shù)據(jù)訓(xùn)練、大模型到本體制造、

運(yùn)控模型均自研自產(chǎn)，

25年已制定千臺(tái)量產(chǎn)目標(biāo)。其次為英偉達(dá)，

其具備強(qiáng)大的算力能力+數(shù)據(jù)訓(xùn)練平臺(tái)優(yōu)勢

,利用微軟芯片、數(shù)據(jù)、大模型、開發(fā)平臺(tái)，

為人形機(jī)器人公司打造底層開發(fā)生態(tài)，已與14家人形公司合作

。其次為Google，從放棄本體聚焦機(jī)器人大模型，

到再次牽手機(jī)器人公司合作下一代人形機(jī)器人，具備大模

型能力。

OpenAI目前通過投資和自己小規(guī)模研發(fā)機(jī)器人本體，

尚未All

in。蘋果和Meta目前專注機(jī)器人細(xì)分

感知領(lǐng)域，平臺(tái)推出機(jī)器人感知系統(tǒng)ARMOR可用于機(jī)械臂，

Meta此前收購Digit觸覺傳感器團(tuán)隊(duì)。圖美國科技公司人形機(jī)器人布局總結(jié)：美國科技公司具備算力和大模型優(yōu)勢

數(shù)據(jù)來源：特斯拉、英偉達(dá)、谷歌等公司官網(wǎng)，東吳證券研究所

10u

特斯拉FSD純視覺+深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)漸趨成熟

，可嫁接至人形機(jī)器人。與自動(dòng)駕駛類似

，人形機(jī)器人同樣需

利用傳感器（攝像頭、激光雷達(dá)等）感知、采集和處理周圍環(huán)境信息

，

以便做出決策。特斯拉人形機(jī)器人僅使

用3個(gè)攝像頭（中間魚眼攝像頭、左右各一個(gè)視覺攝像頭）

，直接嫁接FSD成熟的純視覺方案

，再輔之以力/力

矩/聲學(xué)/觸覺/溫度等傳感器。u

利用Dojo超級計(jì)算平臺(tái)進(jìn)行機(jī)器人仿真訓(xùn)練

，擴(kuò)大數(shù)據(jù)集。u

未來端到端訓(xùn)練有望突破

，具身智能未來可期。圖：特斯拉FSD視覺感知圖?基礎(chǔ)結(jié)構(gòu)是由主干、頸部與多個(gè)分支頭部組成?核心特點(diǎn)是多個(gè)子任務(wù)分支共享同一個(gè)特征空間,優(yōu)勢有：同一主干統(tǒng)一提取特征并共享給各任務(wù)頭部使用；不同子任務(wù)類型之間可以實(shí)現(xiàn)解耦

;生成的特征空間可供各任務(wù)需求隨時(shí)調(diào)用?在感知框架中加入了一層“虛擬標(biāo)準(zhǔn)相機(jī)”，將每輛車采集到的圖像數(shù)據(jù)通過去畸變、旋轉(zhuǎn)等方式處理后，確保數(shù)據(jù)一致性，從而實(shí)現(xiàn)各攝像頭原始數(shù)據(jù)的“校準(zhǔn)”，再將數(shù)據(jù)喂養(yǎng)給主干神經(jīng)網(wǎng)絡(luò)訓(xùn)練?自動(dòng)駕駛的仿真是在模擬環(huán)境中，通過調(diào)整各類交通參與物及環(huán)境的模型參數(shù)以構(gòu)建各種虛擬場景，以訓(xùn)練算法應(yīng)對不同場景的性能?引入BEV鳥瞰圖：缺乏高程信息的自車坐標(biāo)系?Transformer神經(jīng)網(wǎng)絡(luò)：將車身四周的多個(gè)攝像頭獲得的不同視頻數(shù)據(jù)直接進(jìn)行融合，然后用同一套神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練，將坡度、曲線內(nèi)化到神經(jīng)網(wǎng)絡(luò)中，實(shí)現(xiàn)從2D轉(zhuǎn)變?yōu)?D。?通過使用具有時(shí)間維度的視頻片段訓(xùn)練神經(jīng)網(wǎng)絡(luò)

,為自動(dòng)駕駛增加短時(shí)記憶力，更好做預(yù)測?基于時(shí)間維度和空間維度的特征列隊(duì)：時(shí)間維度提供時(shí)間上的連續(xù)性，空間維度是防止等待時(shí)間過長導(dǎo)致時(shí)序信息丟失?不考慮這個(gè)物體到底是什么，只考慮體素是否被占用，相較激光雷達(dá)，增加了算法的泛化能力和

對現(xiàn)實(shí)世界的認(rèn)知?

18年特斯拉與第三

方合作，人工標(biāo)注

，

自，

標(biāo)，?

20年研發(fā)并使用自

動(dòng)標(biāo)注系統(tǒng)，通過

大量數(shù)據(jù)訓(xùn)練大模

型，再用大模型訓(xùn)

練車端小模型效注成本高建千人低隊(duì)后率團(tuán)圖片識(shí)別圖片處理對平面圖像進(jìn)行標(biāo)注、處理校準(zhǔn)，識(shí)別物體攝像頭采集的圖片為2D，需轉(zhuǎn)為現(xiàn)實(shí)世界的3D空間。同時(shí)需依據(jù)短時(shí)記憶做操作預(yù)判?；谝曨l流數(shù)據(jù)的共享特征多任務(wù)型神經(jīng)網(wǎng)絡(luò)架構(gòu)，擁有物體深度識(shí)別能力和短時(shí)記憶能力。特斯拉：軟硬件垂直一體化，

FSD提供具身智能基礎(chǔ)

數(shù)據(jù)來源：特斯拉公司官網(wǎng)，東吳證券研究所

算法空間理解層：從2D到3D網(wǎng)絡(luò)基礎(chǔ)結(jié)構(gòu)：

HydraNet多頭網(wǎng)絡(luò)短時(shí)記憶層：引入時(shí)間軸，做預(yù)判數(shù)據(jù)校準(zhǔn)：虛擬相機(jī)構(gòu)建標(biāo)準(zhǔn)化數(shù)據(jù)占用網(wǎng)絡(luò)：對BEV升級仿真：訓(xùn)練算法應(yīng)對不同場景的性能手動(dòng)標(biāo)注自動(dòng)標(biāo)注u

特斯拉機(jī)器人采用電驅(qū)動(dòng)方式

，設(shè)計(jì)之初就考慮大規(guī)模量產(chǎn)：

區(qū)別于波士頓的液壓方式

，

電驅(qū)動(dòng)方式關(guān)節(jié)更靈

活

，且核心部件均大規(guī)模量產(chǎn)應(yīng)用（除絲杠）

，成本可控。u

28個(gè)執(zhí)行器組成特斯拉機(jī)器人核心關(guān)節(jié)構(gòu)架

，

電池、

攝像頭、

芯片均為成熟工藝：

Optimus機(jī)電執(zhí)行器系統(tǒng)

含3大類、40個(gè)執(zhí)行器——身體14個(gè)旋轉(zhuǎn)執(zhí)行器、

14個(gè)線性執(zhí)行器

，靈巧手12個(gè)執(zhí)行器方案尚未凍結(jié)

，上述

執(zhí)行器均由“電機(jī)+傳動(dòng)裝置+各類軸承+傳感器”組成。軀干搭載2.3kwh電池

，頭部搭載三個(gè)攝像頭（中間

魚目、兩側(cè)各一普通攝像頭）

，大腦采用FSD芯片。u

26年中特斯拉將推第二代機(jī)器人

，將進(jìn)一步改進(jìn)

，預(yù)計(jì)手部和傳感器等變化較大

，執(zhí)行器方案相對確定。圖特斯拉Optimus身體包含28個(gè)執(zhí)行器（電機(jī)+驅(qū)動(dòng)器+機(jī)械傳動(dòng)部件等）特斯拉：關(guān)節(jié)本體方案基本定型，采用28個(gè)執(zhí)行器

數(shù)據(jù)來源：特斯拉公司官網(wǎng)，東吳證券研究所

腰髖部：旋轉(zhuǎn)執(zhí)行器

*3*2213大腿：線性執(zhí)行器*2*2大臂：線性執(zhí)行器*1*2小臂：線性執(zhí)行器*2*2小腿：線性執(zhí)行器*2*2手指：空心杯模組*6*2手肘：旋轉(zhuǎn)執(zhí)行器*1*2肩膀：旋轉(zhuǎn)執(zhí)行器*3*21231

22個(gè)自由度為繩驅(qū)方案

，未來仍有變化。2024年11月

Optimus

Gen

靈巧手更新并展示

，靈巧手從單

手11個(gè)自由度→

22個(gè)自由度（單手電機(jī)數(shù)從2+1+1+1+1

=6變成3+2+2+2+2

=11）

。我們認(rèn)為結(jié)構(gòu)變

化點(diǎn)有：

1）

電機(jī)：從手掌內(nèi)移至手臂小臂里

，一方面手掌可以縮小體積

，一方面對空心杯電機(jī)的直徑限制解開

，而且成本更低的無刷有槽電機(jī)也可能去替代空心杯；

2）傳動(dòng)：我們認(rèn)為絲杠由單手不使用、到

使用10根以上；從we,robot發(fā)布的視頻來看

，小臂可看到繩驅(qū)用的繩

，小臂帶動(dòng)手關(guān)節(jié)靈活運(yùn)動(dòng)

，依賴數(shù)量可觀的腱繩；

3）感知：手指增加陣列式觸覺傳感器（每處大概幾十個(gè)觸點(diǎn)）

；4）輕量化：從鋁合金金屬3D打印

，改成了塑料3D打印。特斯拉：靈巧手22自由度，方案未完全凍結(jié)圖：特斯拉24年10月“We,robot”發(fā)布會(huì)現(xiàn)場機(jī)器

人與人群互動(dòng)

數(shù)據(jù)來源：特斯拉公司官網(wǎng)，東吳證券研究所

圖：特斯拉24年11月官推發(fā)布視頻，左手穩(wěn)穩(wěn)接

觸飛來的網(wǎng)球u

量產(chǎn)計(jì)劃明確

，指數(shù)級增長。特斯拉人形機(jī)器人將于2025年量產(chǎn)

，特斯拉預(yù)計(jì)當(dāng)年將有幾千臺(tái)人形機(jī)器人投

入其汽車工廠生產(chǎn)線中

，并繼續(xù)保持迭代

，若一切順利

，

26年量產(chǎn)將放大10倍至5-10萬臺(tái)（

接近26年年中，

第二代機(jī)器人投產(chǎn)

，

月產(chǎn)量擴(kuò)至1萬臺(tái)）

，開始tob外售；

27年進(jìn)一步放大10倍至50-100萬臺(tái)

，進(jìn)入toc端市

場。最終產(chǎn)品成本2萬美金

，價(jià)格隨行就市。

Musk認(rèn)為未來人形機(jī)器人有潛力帶來超過10萬億美元的收入

，

可能成為公司價(jià)值的主要來源。u

先落地汽車車間

，商業(yè)化明確。今年計(jì)劃制造的幾千臺(tái)

，用于特斯拉工廠內(nèi)完成如給料斗上料、車身生產(chǎn)線物

料運(yùn)輸?shù)?/p>

，形成閉環(huán)以改進(jìn)生產(chǎn)設(shè)計(jì)。大概26H2可能會(huì)開始向特斯拉以外的公司交付。中國人工成本（萬元）15短期機(jī)器人成本（萬元）50遠(yuǎn)期機(jī)器人成本（萬元）14一個(gè)工位成本（萬元）150短期（25-26年）3臺(tái)機(jī)器人替代1

個(gè)工人美國回本周期（年）2中國回本周期（年）10一個(gè)工位成本（萬元）21遠(yuǎn)期（27-28年之后）1.5臺(tái)機(jī)器人

替代1個(gè)工人美國回本周期（年）0.3中國回本周期（年）1.5上海工廠19,0001%57020%7,600德國工廠12,0002%72035%8,400德州工廠22,0005%3,30050%22,000加州工廠20,0005%3,00050%20,000特斯拉：

25年預(yù)計(jì)產(chǎn)數(shù)千臺(tái)，

26-27年每年10倍增長

數(shù)據(jù)來源：特斯拉公司官網(wǎng)，東吳證券研究所測算

2025年底

3臺(tái)機(jī)器人替代

機(jī)器人替代比

1個(gè)工人所需機(jī)例

器人

（臺(tái)）合計(jì)

73,000

6%7,59040%58,000圖：特斯拉人形機(jī)器人自用銷量預(yù)測圖：特斯拉人形機(jī)器人的經(jīng)濟(jì)性美國人工成本（萬元）

702026年底2臺(tái)機(jī)器人替代1個(gè)工人（臺(tái)）機(jī)器人替

代比例工人

(人）金額項(xiàng)目u

特斯拉執(zhí)行器已經(jīng)確定國產(chǎn)兩家供應(yīng)商

，包括三花、拓普

，其中三花可供應(yīng)全部型號(hào)。特斯拉人形機(jī)器人

2025年開始量產(chǎn)

，我們預(yù)計(jì)三花供應(yīng)份額70%左右

，拓普份額30%左右。u

供應(yīng)看，

目前核心零部件基本由特斯拉提供

，交由三花、拓普制作總成

，但總體成本較高（預(yù)計(jì)30-50萬/

臺(tái)），

25年加快國產(chǎn)供應(yīng)商拓展

，我們預(yù)計(jì)26年國產(chǎn)供應(yīng)商將開始放量。三花、拓普均已培養(yǎng)自己的零部

件供應(yīng)商。圖：旋轉(zhuǎn)執(zhí)行器及直線執(zhí)行器結(jié)構(gòu)拆分示意圖特斯拉：執(zhí)行器已經(jīng)鎖定國內(nèi)2家廠商，三花主供供應(yīng)鏈

國產(chǎn)化?自制（絲杠、編

碼器、電機(jī)）?

綠的諧波?

北特科技

貝斯特特斯拉人形機(jī)器人量產(chǎn)第二階段特斯拉人形機(jī)器人量產(chǎn)第一階段

數(shù)據(jù)來源：特斯拉官網(wǎng)，東吳證券研究所

特斯拉提供零部件?

新劍傳動(dòng)?

五洲新春預(yù)計(jì)25年產(chǎn)量5000臺(tái)+26年產(chǎn)量放大至5-10萬臺(tái)，成本控制要求提升?

舍弗勒?

博世力士樂?

哈默納科三花智控拓普集團(tuán)編碼器控制器電機(jī)諧波拓普集團(tuán)三花智控絲杠70%30%u

黃仁勛定調(diào)機(jī)器人：僅有三種形式的機(jī)器人可實(shí)現(xiàn)大規(guī)模量產(chǎn)，一是汽車，因?yàn)槲覀儤?gòu)建了一個(gè)適合汽車的世界；二是無人機(jī)，因?yàn)樘炜諞]什么限制；三是人形機(jī)器人，我們?yōu)樽约簶?gòu)建一個(gè)世界。大規(guī)模生產(chǎn)至關(guān)重要，因?yàn)樗茯?qū)動(dòng)技術(shù)飛輪效應(yīng)。高投入的研發(fā)（R&D）能帶來技術(shù)突破，從而生產(chǎn)出更優(yōu)秀的產(chǎn)品,進(jìn)一步推動(dòng)生產(chǎn)規(guī)模的擴(kuò)大。u

在人形機(jī)器人領(lǐng)域做賣鏟子的人：

目標(biāo)是借助芯片等核心產(chǎn)品，圍繞著大模型、數(shù)據(jù)、開發(fā)平臺(tái)三大核心領(lǐng)域展開，為打造機(jī)器人底層開發(fā)生態(tài)。圖

英偉達(dá)機(jī)器人生態(tài)搭建

圖

英偉達(dá)關(guān)于AI的發(fā)展判斷英偉達(dá)：搭建人形機(jī)器人開發(fā)生態(tài)，做賣鏟子的人

數(shù)據(jù)來源：英偉達(dá)公司官網(wǎng)，東吳證券研究所

2018推出全新硬件、軟件、虛擬世界機(jī)器人模擬器的NVIDIAIsaac，同時(shí)還推出專為機(jī)器人設(shè)計(jì)的計(jì)算機(jī)平臺(tái)Jetson

Xavier和相關(guān)的機(jī)器人軟件工具包，正式布局智能機(jī)器人領(lǐng)域

2019

推出lsaac軟性開發(fā)套件(SDK)，為機(jī)器人提供更新的AI感知和仿真功能

2021

推出Omniverse平臺(tái)，支持機(jī)器人的協(xié)作和模擬，對協(xié)作機(jī)器人影響深遠(yuǎn)

2022推出IsaacNova

Orin，其配置的計(jì)算和傳感器參考平臺(tái)旨在幫助AMR(自主移動(dòng)機(jī)器人)制造商縮短開發(fā)時(shí)間并降低成本2022

發(fā)布基于Transformer架構(gòu)的支持多模形態(tài)的(仿真)智能體VIMA

2022

發(fā)布具有互聯(lián)網(wǎng)規(guī)模知識(shí)的開放式具身智能體-MinDojo2023

發(fā)布全新JetsonAGXOrin

工業(yè)級模塊

2023

發(fā)布VOYAGER智能體，這是第一個(gè)由LLM驅(qū)動(dòng)的可以終身學(xué)習(xí)的智能體，

為具身控制生成可執(zhí)行代碼

2023對Jetson平臺(tái)上的Metropolis和Isaac框架進(jìn)行有史以來規(guī)模最大的軟件擴(kuò)展，

用以來滿足邊緣AI的快速部署需求；與此同時(shí)，

英偉達(dá)還宣布創(chuàng)建Jetson生成式AI實(shí)驗(yàn)室；另外宣布推出IsaacROS和IsaacSim軟件的全新版本

2023發(fā)布了Eureka（Evolution-driven

Universal

Reward

Kit

for

Agent）

智能機(jī)器人訓(xùn)練工具，本質(zhì)是一種由大模型驅(qū)動(dòng)的算法生成工具u

英偉達(dá)自2018年開始推出機(jī)器人模擬器NVIDIAIsaac、同時(shí)推出計(jì)算機(jī)平臺(tái)Jetson

Xavier和相關(guān)軟件工具包，

正式布局智能機(jī)器人，此后不斷升級芯片、計(jì)算平臺(tái)、機(jī)器人訓(xùn)練工具，

23年至今進(jìn)度顯著加快，

2024年推出

人形機(jī)器人通用基礎(chǔ)模型ProjectGR00T。圖英偉達(dá)智能機(jī)器領(lǐng)域發(fā)展史成立通用具身智能體研究GEAR(Generalist

EmbodiedAgent

Research)團(tuán)隊(duì)，目標(biāo)是在虛擬和現(xiàn)實(shí)世界中建立具身智能體基礎(chǔ)模型，致力于實(shí)現(xiàn)跨多模態(tài)、多場景的智能應(yīng)用發(fā)布了人形機(jī)器人通用基礎(chǔ)模型Project

GR00T、

基于Thor

SoC的新型人形機(jī)器人計(jì)算機(jī)Jetson

Tho；

對Isaac機(jī)器人平臺(tái)進(jìn)行了重大

升級，包括生成式AI基礎(chǔ)模型和仿真工具、AI工作流基礎(chǔ)設(shè)施英偉達(dá)：人形機(jī)器領(lǐng)域積淀已久，形成完成體系

據(jù)臺(tái)灣聯(lián)合新聞網(wǎng)報(bào)道，英偉達(dá)已接觸多家臺(tái)灣機(jī)床和關(guān)鍵零部件制造商，目標(biāo)包括征求關(guān)鍵零組件的技術(shù)與規(guī)格，并探索合作企業(yè)加入

其人形機(jī)器人供應(yīng)鏈的可能性。2024.12攜帶自家生成式AI時(shí)代的新王牌-升級版“Nvidia

NIM”（Nvidia

Inference

Microservices）

云原生微服務(wù)亮相丹佛SiGGRAPH2024大

會(huì)；Nvidia布局的NIM生態(tài)系統(tǒng)已經(jīng)可提供一系列預(yù)訓(xùn)練的AI模型。NVIDIA

CES2025發(fā)布會(huì)上，發(fā)布其構(gòu)建的一套完整的Isaac

GR00T

Blueprint，為通用機(jī)器人的訓(xùn)練提供了一個(gè)數(shù)字孿生訓(xùn)練場。并

宣布了其合作的14個(gè)人形機(jī)器人廠商。數(shù)據(jù)來源：英偉達(dá)公司官網(wǎng)，東吳證券研究所

172025.1鴻海正與英偉達(dá)合作，采用后者的軟件技術(shù)和硬件平臺(tái)，在中國臺(tái)灣南部的高雄市研發(fā)專注于服務(wù)場景的人形機(jī)器人。2024.32025.12024.22024.7時(shí)間內(nèi)容u

NVIDIA面向物理AI和機(jī)器人訓(xùn)練、仿真、運(yùn)行構(gòu)建了三臺(tái)計(jì)算機(jī)，分別為?

超級計(jì)算機(jī)NVIDIA

NeMo：用于AI模型訓(xùn)練。?仿真平臺(tái)Omniverse和Isaac

Sim

：模型訓(xùn)練完后需要測試，用仿真平臺(tái)，可大幅縮短時(shí)間，降低成本?計(jì)算平臺(tái)Jetson

Thor：用于機(jī)器人本地部署的計(jì)算平臺(tái)，從Jetson

Xavier，升級到Jetson

Orin，算力提升

10倍，并即將推出Jetson

Thor。圖英偉達(dá)人形機(jī)器人軟硬件平臺(tái)布局訓(xùn)練

測試

部署大幅縮短開發(fā)時(shí)間

數(shù)據(jù)來源：英偉達(dá)公司官網(wǎng)，東吳證券研究所

英偉達(dá)：三臺(tái)計(jì)算機(jī)幫助大幅縮短人形機(jī)器開發(fā)時(shí)間

本地部署：安裝在機(jī)器人內(nèi)部，它就是操作物理機(jī)器人的“大腦”。以通過Jetson或AGX這樣的系統(tǒng)來實(shí)現(xiàn)訓(xùn)練AI模型：訓(xùn)練通常在云端、數(shù)據(jù)中心或像NVIDIA

DGX這樣的強(qiáng)

大系統(tǒng)上進(jìn)行。仿真測試：引入一個(gè)“仿真層”，在虛擬環(huán)境中完成測試。大幅縮短測試時(shí)間和降低測試成本。機(jī)器人本地部署的專用計(jì)算

平臺(tái)JetsonThor在NVIDIAOVX服務(wù)器上的Omniverse和IsaacSim超級計(jì)算機(jī)NVIDIA

NeMo三臺(tái)計(jì)算機(jī)u

2025年1月，

NVIDIA發(fā)布IsaacGR00T

Blueprint，為通用機(jī)器人的訓(xùn)練提供了一個(gè)數(shù)字孿生訓(xùn)練場，可幫助開發(fā)者生成海量的合成運(yùn)動(dòng)數(shù)據(jù)，以便通過模仿學(xué)習(xí)來訓(xùn)練人形機(jī)器人。u

該模型解決了人形機(jī)器人數(shù)據(jù)短缺、數(shù)據(jù)收集成本高昂等問題。在Blueprint的GR00T-Gen工具流中，NVIDIAOmniverse和NVIDIACosmos是指數(shù)級擴(kuò)增數(shù)據(jù)集的關(guān)鍵。

NVIDIACosmos是NVIDIA在2025年最新發(fā)布的“世界基礎(chǔ)模型”，擁有一系列開放的預(yù)訓(xùn)練世界基礎(chǔ)模型，專為生成具有物理感知的視頻和

物理AI開發(fā)所需的世界狀態(tài)而設(shè)計(jì)。圖英偉達(dá)數(shù)據(jù)孿生訓(xùn)練場流程仿真環(huán)境捕捉動(dòng)作

擴(kuò)展動(dòng)作數(shù)據(jù)集

——數(shù)據(jù)輸入人形機(jī)器人

數(shù)據(jù)來源：英偉達(dá)公司官網(wǎng)，東吳證券研究所

英偉達(dá)：仿真測試平臺(tái)解決人形機(jī)器人數(shù)據(jù)短缺痛點(diǎn)

捕捉人類動(dòng)作：借助AppleVision

Pro在數(shù)字孿生環(huán)境中捕捉人類動(dòng)作，這些人類動(dòng)作被記錄下來作為金標(biāo)準(zhǔn)，并在仿真環(huán)境中由機(jī)器人模仿學(xué)習(xí)擴(kuò)展運(yùn)動(dòng)數(shù)據(jù)集：將捕捉到的人類示范動(dòng)作擴(kuò)展為更大的合成運(yùn)動(dòng)數(shù)據(jù)集指數(shù)級擴(kuò)增數(shù)據(jù)集：通過域隨機(jī)化和3D提升技術(shù)，指數(shù)級擴(kuò)增這個(gè)數(shù)據(jù)集。

NVIDIAOmniverse和NVIDIACosmos（世界基礎(chǔ)模

型，基于1800萬億個(gè)

數(shù)據(jù)單元進(jìn)行訓(xùn)練）是指數(shù)級擴(kuò)增數(shù)據(jù)集的關(guān)鍵。教會(huì)人形機(jī)器人：擴(kuò)增后的數(shù)據(jù)集作為機(jī)器人策略的輸入，在Isaac

Lab中教會(huì)機(jī)器人如何在其環(huán)境中高效且安全地移動(dòng)和互動(dòng)NVIDIA

IsaacGR00T

Blueprint的仿真工作流

GR00T-Teleop

GR00T-Mimic

GR00T-Gen

Isaac

Lab

25年CES大會(huì)上，

NVIDIA已經(jīng)宣布第一批采用NVIDIACosmos的生態(tài)伙伴，包括6家中國人形機(jī)器人公司

,分別是星動(dòng)紀(jì)元、智元、傅利葉智能、銀河通用、宇樹科技、小鵬；以及美國Apptronik、AgilityRobotics、

FigureAI、

Boston

Dynamics（被現(xiàn)代收購），德國NEURA

Robotics，挪威1X，以色列

Mentee，加拿大SanctuaryAI。u

另外，據(jù)臺(tái)灣聯(lián)合新聞網(wǎng)24年12月3日報(bào)道，英偉達(dá)已接觸多家臺(tái)灣機(jī)床和關(guān)鍵零部件制造商，目標(biāo)包括征求關(guān)鍵零組件的技術(shù)與規(guī)格，并探索合作企業(yè)加入其人形機(jī)器人供應(yīng)鏈的可能性。我們認(rèn)為英偉達(dá)自己下場

做機(jī)器人本體可能性較小，更多是測試開發(fā)，打通軟硬件，更好為客戶提供整體解決方案。圖英偉達(dá)25年CES大會(huì)宣布合作的14家機(jī)器人英偉達(dá)：攜手全球各大機(jī)器人廠加快行業(yè)發(fā)展

數(shù)據(jù)來源：英偉達(dá)公司官網(wǎng)，東吳證券研究所

BostonDynamicsNew-AtlasAgility

Robotics

Digit星動(dòng)紀(jì)元

Star1ApptronikApollo銀河通用G1MenteeMenteeBotFigureFigure021X

NEOSanctuaryAI

Phoenix小鵬IronNEURA

Robotics

4NE-1智元機(jī)器人

遠(yuǎn)征A2傅利葉

GR-2宇樹

H1收購時(shí)間公司名稱類型國家主要產(chǎn)品2013.12.2SCHAFT人形機(jī)器人日本Schaft機(jī)器人在日本的一次災(zāi)難救援挑戰(zhàn)賽中有著非常不錯(cuò)的表現(xiàn)2013.12.3Industrial

Perception機(jī)器視覺美國擁有先進(jìn)3D視覺技術(shù)可引導(dǎo)機(jī)器人在制造和物流中使用2013.12.4Redwood

Robotics人形機(jī)器人與機(jī)械臂美國主打家庭適用的機(jī)器臂機(jī)器人2013.12.5Meka

Robotics人形機(jī)器人美國致力于打造人形機(jī)器人，用以和人們生活、工作。它的旗艦機(jī)型

M1移動(dòng)操作機(jī)器人具有安全、人性化的機(jī)器人技術(shù)，可適用于人們家庭和工作場所，可看作個(gè)人助手2013.12.6Holomni輪式機(jī)器人美國2013.12.7Bot

Dolly機(jī)器人攝像系統(tǒng)美國專門從事電影領(lǐng)域制作的自動(dòng)化機(jī)器人，擅長將大型機(jī)械臂和定制軟件相結(jié)合2013.12.8Autofuss廣告設(shè)計(jì)美國2013.12.10Boston

Dynamics人形機(jī)器人美國具備超強(qiáng)的運(yùn)動(dòng)性能的人形機(jī)器人u

2013年底Google一舉收購8家機(jī)器人公司。

2013年3月Google創(chuàng)建機(jī)器人部門Replicant，后這個(gè)部門劃歸

到Google

X門下，即后來的Alphabet

X。

2013年底，

google瘋狂收購機(jī)器人公司，包括波士頓動(dòng)力在內(nèi)的8

家機(jī)器人公司，

目標(biāo)在于發(fā)展商用機(jī)器人技術(shù)。u

主帥離職，

8家各自為政，

商業(yè)化路程艱難。

2014年google機(jī)器人部門主管Andy

Rubin離職，缺乏核心人物

將8家公司團(tuán)結(jié)在一起，各部門缺乏協(xié)作能力，且機(jī)器人訓(xùn)練成本高昂，

缺乏落地場景，商業(yè)化進(jìn)展低于預(yù)期

2017年將波士頓動(dòng)力出售給軟銀（購入價(jià)30億美元）

，取消Robot

Project。究其原因，

彼時(shí)算力、大模型

和人工智能尚不足以支持機(jī)器開發(fā)、訓(xùn)練。圖Google收購的8家機(jī)器人公司Google：曾高舉高打布局機(jī)器人，但迅速失敗

數(shù)據(jù)來源：谷歌公司官網(wǎng)，東吳證券研究所

此前Google

Brain和Deepmind分別延兩條技術(shù)路線探索人形機(jī)器人大模型，

2023年4月兩大部門合并為Google

deepmind，追趕OpenAI，此后推出Gemini2.0，該模型為AI

Agent應(yīng)用而設(shè)計(jì)的多模態(tài)大模型，最

重要的是它可以理解和推理物理世界，構(gòu)建代理，操控人形機(jī)器人執(zhí)行任務(wù)。?Google

AI團(tuán)隊(duì)：

從RT-1到融合了PalM-E的RT-2，將語言和視覺大模型應(yīng)用到機(jī)器人控制領(lǐng)域，

在推理、

知識(shí)、泛化能力方面更強(qiáng)。?Deepmind：

2014年Google以6億美金收購英國AI公司Deepmind，在合并前，

其獨(dú)立研發(fā)。其主要從智能

體的角度出發(fā)訓(xùn)練機(jī)器人，

開發(fā)Robocat、Autonomous和

DemoStart模型，

訓(xùn)練數(shù)據(jù)大都來自強(qiáng)化學(xué)習(xí)

,模型參數(shù)量控制表現(xiàn)更優(yōu)，能夠?qū)崿F(xiàn)更高頻率的機(jī)器人控制。圖Google兩個(gè)團(tuán)隊(duì)機(jī)器人機(jī)器人大模型發(fā)展歷程2023.4月兩部門合并Google：兩大團(tuán)隊(duì)合并，聚焦人形機(jī)器人大模型

Demostart（2024.10）新型自主強(qiáng)化學(xué)習(xí)方法，提高機(jī)器人在仿真環(huán)境中的操作技能學(xué)習(xí)效率，并最終實(shí)現(xiàn)這些技能從仿真到現(xiàn)實(shí)的零樣本遷移PalM-E（2023.3）是在預(yù)訓(xùn)練語言模型的語言嵌入空間中注入連續(xù)的、具身的觀測，如圖像、狀態(tài)估計(jì)或其他傳感器模態(tài)。Robocat（2023.6）僅需要最少100次演示就能完成訓(xùn)練，可通過自我生成的數(shù)據(jù)進(jìn)行優(yōu)化、改進(jìn)AutoRT、SARA-RT

和

RT-Trajectory(

2024.1）提高數(shù)據(jù)收集、效率和泛化能力RT-2（2023.7）擴(kuò)充數(shù)據(jù)集合RT-X（2023.10）擴(kuò)充動(dòng)作集RT-1（2022.12）構(gòu)建起特定指令、圖片和機(jī)器人任務(wù)輸出

的橋梁，但能力受限于數(shù)據(jù)庫Gato（2022.5）能夠處理多種任務(wù)

：包括少量現(xiàn)實(shí)場

景機(jī)器人任務(wù)

數(shù)據(jù)來源：谷歌公司官網(wǎng)，東吳證券研究所

Google

BrainDeep

mindu

RT-1構(gòu)建起特定指令、圖片和機(jī)器人任務(wù)輸出的橋梁，但能力受于數(shù)據(jù)庫：

2022年Google把Transformer架構(gòu)應(yīng)用到機(jī)器人的操縱任務(wù)上，提出了RT-1模型。主體是預(yù)訓(xùn)練的視覺模型和用解釋器處理過的語言指令，

一起通過transformer架構(gòu)輸出機(jī)器人的動(dòng)作指令，學(xué)習(xí)范式是模仿學(xué)習(xí)，訓(xùn)練數(shù)據(jù)是在google實(shí)驗(yàn)室中的兩

個(gè)廚房環(huán)境記錄的操控移動(dòng)機(jī)械臂完成抓取與放置動(dòng)作時(shí)的記錄，因?yàn)閿?shù)據(jù)相對局限，

RT-1只能接受在數(shù)據(jù)庫

中出現(xiàn)過的指令，指令的基本結(jié)構(gòu)為“動(dòng)作

目標(biāo)物體

目標(biāo)位置”。u

RT-2拓展對外界認(rèn)知，但動(dòng)作仍受限。

由于機(jī)器人數(shù)據(jù)收集受限，

google直接采用已經(jīng)有的多模態(tài)視覺語言模

型（PalM-E），

數(shù)據(jù)擴(kuò)充至網(wǎng)絡(luò)上海量的圖文數(shù)據(jù)，

創(chuàng)造性的輸出機(jī)器人行為字符串。但動(dòng)作仍受限于桌面的

抓取。u

大數(shù)據(jù)集OpenX加持，

RT-X擴(kuò)充動(dòng)作能力。

收集全球60多個(gè)機(jī)器人實(shí)驗(yàn)室機(jī)械臂操作的數(shù)據(jù)，

合成數(shù)據(jù)集Open

Embodiment，包括500多個(gè)動(dòng)作。用該數(shù)據(jù)進(jìn)行RT-2的方式的訓(xùn)練。其貢獻(xiàn)在于創(chuàng)造一個(gè)持續(xù)增長的

共享和開源數(shù)據(jù)集。Google：機(jī)器人控制模型RT系列不斷升級

數(shù)據(jù)來源：谷歌公司官網(wǎng)，東吳證券研究所

圖

RT-2模型概覽u

2024年初在Robotics

Transformers的基礎(chǔ)上，

Google發(fā)布AutoRT、

SARA-RT和

RT-Trajectory，提高機(jī)器

人在現(xiàn)實(shí)世界中的數(shù)據(jù)收集、效率和泛化能力。?AutoRT：機(jī)器人訓(xùn)練系統(tǒng)。利用大型基礎(chǔ)模型（LLM/VLM）和機(jī)器人控制模型（RT-1/RT-2）

，來收集更

多和更多樣化的訓(xùn)練數(shù)據(jù)，

可同時(shí)指導(dǎo)多臺(tái)機(jī)器人在不同環(huán)境中執(zhí)行多樣化任務(wù)，

并通過VLM理解環(huán)境和物

體，

LLM提出創(chuàng)意任務(wù)并選擇機(jī)器人可以獨(dú)立完成的任務(wù)。?SARA-RT：提升機(jī)器人Transformer模型效率的系統(tǒng)。通過一種稱為“up-training”的模型微調(diào)方法，將

模型的二次復(fù)雜性轉(zhuǎn)換為線性復(fù)雜性，從而顯著減少了計(jì)算需求，同時(shí)保持了模型的質(zhì)量，

無需額外編碼。?RT-Trajectory：實(shí)現(xiàn)機(jī)器人泛化能力的模型。通過在訓(xùn)練視頻中添加描述機(jī)器人動(dòng)作的視覺輪廓，

RT-Trajectory讓機(jī)器人從2D軌跡圖像中學(xué)習(xí)控制策略，大幅提升執(zhí)行未見任務(wù)的成功率。Google：強(qiáng)化RT系列的數(shù)據(jù)收集、效率和泛化能力

數(shù)據(jù)來源：谷歌公司官網(wǎng)，東吳證券研究所

圖

RT-Trajectory系統(tǒng)構(gòu)架圖AutoRT系統(tǒng)構(gòu)架u

2024年12月，

Google發(fā)布Gemini2.0多模態(tài)大模型，

其專為AI

Agent而設(shè)計(jì)，

支持圖像、視頻、音頻等多模

態(tài)輸入，以及原生生成圖像與文本混合、多語言音頻的多模態(tài)輸出；

并能夠原生調(diào)用Google搜索、代碼執(zhí)行以

及第三方用戶定義函數(shù)等工具。

Gemini2.0是真正的統(tǒng)一底層模型，他具備三大能力：

一是感知能力，二是記

憶能力，

三是工具使用能力。u

利用Gemini2.0的空間推理功能，未來可以操控人形機(jī)器人執(zhí)行任務(wù)、低成本訓(xùn)練人形機(jī)器人。

谷歌發(fā)布Gemini2.0的博客提到“除了探索虛擬世界中的代理功能外，

我們還在試驗(yàn)可以通過將Gemini2.0的空間推

理功能應(yīng)用于機(jī)器人技術(shù)來在物理世界中提供幫助的代理。雖然現(xiàn)在還為時(shí)過早，

但我們對可以在物理環(huán)境中

提供幫助的代理的潛力感到興奮?！蓖瑫r(shí)，

Gemini2.0的機(jī)器人代理也可以幫助人形機(jī)器人廠商訓(xùn)練自家人形

機(jī)器人，成為一種低成本、實(shí)時(shí)訓(xùn)練的方案。圖Gemini2.0空間理解：精準(zhǔn)的物體識(shí)別與定位圖

Gemini2.0性能大幅提升Google：Gemini2.0有望構(gòu)建人形機(jī)器人的代理

數(shù)據(jù)來源：谷歌公司官網(wǎng)，東吳證券研究所

2024年12月20日，谷歌DeepMind宣布攜手Apptronik，針對動(dòng)態(tài)現(xiàn)實(shí)環(huán)境的復(fù)雜作業(yè)挑戰(zhàn)，共同研發(fā)新一

代人形機(jī)器人。此次合作將結(jié)合谷歌的尖端AI技術(shù)與Apptronik的成熟機(jī)器人硬件，進(jìn)一步提升人形機(jī)器人的

功能性和安全性。u

同時(shí)，對于谷歌而言，意味著未來可以通過Apptronik的人形機(jī)器人載體（視覺、觸覺、味覺、六維力矩等多種

傳感、以及雙手）采集豐富的現(xiàn)實(shí)數(shù)據(jù)，

以此增強(qiáng)其空間物理智能。圖

Apptronik的機(jī)器人Apollo

圖

Apptronik簡介項(xiàng)目內(nèi)容背景Apptronik

由深度參與

NASA

Valkyrie機(jī)器人項(xiàng)目的團(tuán)隊(duì)成立，自

2016年成立以來，已構(gòu)建

13個(gè)機(jī)器人遠(yuǎn)程操作開發(fā)了一種VR遠(yuǎn)程操作方法，用于其上

半身人形機(jī)器人Astra

，支持混合自治，允許在必要時(shí)進(jìn)行遠(yuǎn)程指導(dǎo)模塊化具有高度模塊化設(shè)計(jì)，能夠根據(jù)任務(wù)需求進(jìn)行不同配置，如安裝在車輪上或更換傳感器載荷商業(yè)化專注于最基本的任務(wù)：移動(dòng)箱子、工業(yè)手提袋、垃圾箱和其他材料的搬運(yùn)。目前已進(jìn)入奔馳工廠，并與物流巨頭GXO達(dá)成合作協(xié)議Google：聯(lián)手Apptronik研發(fā)下一代人形機(jī)器人

數(shù)據(jù)來源：谷歌公司官網(wǎng)，東吳證券研究所

Open

AI曾涉足機(jī)器人，因數(shù)據(jù)不足而解散。

在成立之初，其發(fā)展目標(biāo)就包括制造通用機(jī)器人，由聯(lián)合創(chuàng)始人Wojciech

Zaremba帶隊(duì)，但后續(xù)研究只專注于機(jī)器人軟件技術(shù)，

最終因缺乏訓(xùn)練數(shù)據(jù)，

于2021年解散團(tuán)隊(duì)。其研究成果有兩個(gè)，

一是訓(xùn)練機(jī)械手破解魔方（用英國靈巧手公司Shadow的機(jī)械手）

，二是Roboschool

（機(jī)

器人模擬器，用于控制并訓(xùn)練機(jī)器人）。u

2024年底開始組建機(jī)器人團(tuán)隊(duì)，

但總體招聘崗位較少。

機(jī)器人硬件由2024年11月入職的前Meta增強(qiáng)現(xiàn)實(shí)眼鏡

項(xiàng)目負(fù)責(zé)人Caitlin

Kalinowski負(fù)責(zé)；機(jī)器人軟件由OpenAI的計(jì)算主管Christopher

Berner負(fù)責(zé)。

25年1月，Caitlin宣布OpenAI開放3個(gè)機(jī)器人相關(guān)崗位：

機(jī)器人系統(tǒng)集成電氣工程師（為機(jī)器人設(shè)計(jì)傳感器套件）、機(jī)器

人機(jī)械設(shè)計(jì)工程師（負(fù)責(zé)機(jī)器人本體的硬件配置）

、TMP經(jīng)理（機(jī)器人技術(shù)項(xiàng)目經(jīng)理）。u

OpenAI具備軟件算法優(yōu)勢，機(jī)器人之夢從未褪色。布局人形機(jī)器人具備強(qiáng)大的算法和大模型優(yōu)勢，

其視頻生成

模型Sora可用于數(shù)據(jù)仿真，具備推理能力的語音生成模型Voice

Engine、AI大語言模型o3可用于人機(jī)交互等

。但OpenAI缺乏制造經(jīng)驗(yàn)和供應(yīng)鏈搭建，自制本體步伐相對謹(jǐn)慎，

但堅(jiān)定前進(jìn)。圖OpenAI機(jī)器人模擬器Roboschool

圖OpenAI機(jī)械手單手解魔方，成功率60%OpenAI：重啟團(tuán)隊(duì)，小規(guī)模自研人形機(jī)器人

數(shù)據(jù)來源：

OpenAI公司官網(wǎng)，東吳證券研究所

1XFigureAIPhysicalIntelligence類型人形機(jī)器人本體人形機(jī)器人本體研發(fā)機(jī)器人大腦融資時(shí)間2023.3/2024.12024.22024.11融資金額

2350萬美元/1億美金6.75億美元

4億美元產(chǎn)品聚焦家庭場景的雙足人形機(jī)器人NEO

Beta聚焦工業(yè)場景的雙足人形機(jī)器人Figure02π0模型可以控制不同形態(tài)的機(jī)器人，

使其執(zhí)行多樣化的任務(wù)OpenAI合作2022年1X與OpenAI合作。但1X

目前還未搭載高級語言大模型，其更在意任務(wù)間的泛化能力。從數(shù)據(jù)采集來看，

1X也更傾向于真實(shí)場景采集。接入OpenAI大模型GPT-4o，來識(shí)別

語言，規(guī)劃動(dòng)作。之后再由其自有神經(jīng)策略層執(zhí)行動(dòng)作（端對端）。同時(shí)用自己的身體控制模型來保持機(jī)器人的平衡。創(chuàng)始人Karol

Hausman在google深

度參與RT系列的研發(fā)u

OpenAI投資了機(jī)器人相關(guān)的3家公司，

挪威人形機(jī)器人企業(yè)1X

Technologics、美國人形機(jī)器人公司Figure

AI、研發(fā)人形機(jī)器人大腦的具身智能公司Physical

Intelligence，并為其中Figure

AI提供了模型方面的

技術(shù)支持。?1X：

2023年OpenAI領(lǐng)投1X

，

24年參與B輪融資。

1X作為挪威機(jī)器人公司，

專注家庭場景。?Figure

AI：

2024年在A1輪融資中投資500萬美金，

并為Figure提供大模型，識(shí)別語言和規(guī)劃動(dòng)作。?Physical

Intelligence

人人文庫> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

【東吳證券】人形機(jī)器人深度報(bào)告之七：海外人形機(jī)器人深度：人形機(jī)器人的GhatGPT時(shí)刻已至

文檔簡介

溫馨提示

最新文檔

評論

【東吳證券】人形機(jī)器人深度報(bào)告之七：海外人形機(jī)器人深度：人形機(jī)器人的GhatGPT時(shí)刻已至

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔