




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
海外人形機(jī)器人深度:人形機(jī)器人的GhatGPT時(shí)刻已至--人形機(jī)器人深度報(bào)告之七
2025年2月10日證券研究報(bào)告·行業(yè)研究·電力設(shè)備與新能源行業(yè)u
美國科技公司具備算力和大模型優(yōu)勢
,
引領(lǐng)人形機(jī)器人發(fā)展
,進(jìn)度看特斯拉
﹥英偉達(dá)
﹥Google﹥OpenAI
:
從進(jìn)展看
,特斯拉居首
,且從芯片、數(shù)據(jù)訓(xùn)練、大模型到本體制造、運(yùn)控模型均自研自產(chǎn)
,
25年已制定千臺(tái)量
產(chǎn)目標(biāo)。其次為英偉達(dá)
,其具備強(qiáng)大的算力能力+數(shù)據(jù)訓(xùn)練平臺(tái)優(yōu)勢
,利用微軟芯片、數(shù)據(jù)、大模型、開發(fā)平
臺(tái)
,
為人形機(jī)器人公司打造底層開發(fā)生態(tài)
,
已與14家人形公司合作。其次為Google
,從放棄本體聚焦機(jī)器人
大模型
,到再次牽手機(jī)器人公司合作下一代人形機(jī)器人
,具備大模型能力。OpenAI目前通過投資和自己小規(guī)模
研發(fā)機(jī)器人本體
,
尚未All
in。蘋果和Meta目前專注機(jī)器人細(xì)分感知領(lǐng)域
,平臺(tái)推出機(jī)器人感知系統(tǒng)ARMOR可用于機(jī)械臂
,
Meta此前收購Digit觸覺傳感器團(tuán)隊(duì)。u
以美國為首的創(chuàng)業(yè)型公司與科技公司加強(qiáng)大模型合作
,加速商業(yè)化場景落地
,潛力上看Figure
AI>
Agility>
挪威1X>
Apptronik>德國Neura
Robotics
>加拿大Sanctuary
AI。
Figure02已獲得寶馬、亞馬遜等訂單
,公司預(yù)期兩大客戶未來4年訂單需求10萬臺(tái)
,
25年銷量目標(biāo)幾千臺(tái)
,并獲得科技巨頭投資
,股東背景雄厚。Agility專注物流場景
,
已獲得亞馬遜、
GXO訂單
,商業(yè)化放量進(jìn)度最快
,在建1萬臺(tái)產(chǎn)能。
1X專注家庭場景
,
25年目標(biāo)1千臺(tái)產(chǎn)量
。Apptronik計(jì)劃25年底商業(yè)化量產(chǎn)
,
已與google合作下一代機(jī)器人
。
德國NeuraRobotics25年1月在手訂單10億歐。以上公司均加入英偉達(dá)Cosmos
,大模型加持迭代加速。u
25年海外機(jī)器人元年
,大規(guī)模量產(chǎn)后
,
中國供應(yīng)鏈將充分受益。海外公司均重視落地場景
,25年是量產(chǎn)元年
,
絕大部分公司先落地車間和物流場景
,部分企業(yè)如1X和Neura
Robotics同樣重視家庭場景
,雙足和手部形態(tài)
多樣化。
25年各家目標(biāo)從幾百臺(tái)到幾千臺(tái)不等
,我們預(yù)計(jì)25年海外機(jī)器人產(chǎn)量突破1萬臺(tái)
,其中特斯拉5k臺(tái)
,
27-28年TOC端突破
,特斯拉銷量達(dá)到100萬臺(tái)。
隨著大規(guī)模量產(chǎn)
,供應(yīng)鏈將切換至中國廠商
,綁定特斯拉的tier1最為受益
,其次為各環(huán)節(jié)核心龍頭。u
投資建議:
機(jī)器人當(dāng)前類比2014年電動(dòng)車
,即將量產(chǎn)
,開啟10年產(chǎn)業(yè)大周期
,強(qiáng)烈看好板塊!
1)特斯拉鏈:
首推確定性龍頭Tier1【三花智控】【拓普集團(tuán)】
,Tier2【鳴志電器】【綠的諧波】【雙環(huán)傳動(dòng)】
,關(guān)注【北特科技】【浙江榮泰】【五洲新春】【震??萍肌俊舅沽夤煞荨俊敬髽I(yè)股份】等;
2)華為及國內(nèi)鏈:推薦【雷賽智能】【匯川技術(shù)】【賽力斯】【富臨精工】
,關(guān)注【兆威機(jī)電】【藍(lán)黛科技】【禾川科技】【豪能股份】【科力爾】【埃夫特】【拓斯達(dá)】等。
3)英偉達(dá)鏈:推薦【偉創(chuàng)電氣】【科達(dá)利】等。4)宇樹科技鏈:推薦【曼恩斯特】
,關(guān)注【長盛軸承】【臥龍電驅(qū)】【奧比中光】。u
風(fēng)險(xiǎn)提示:
量產(chǎn)進(jìn)展不及預(yù)期;產(chǎn)業(yè)鏈降本不及預(yù)期;行業(yè)關(guān)鍵技術(shù)突破不及預(yù)期;
市場競爭加劇2摘要
PART2美國科技公司引領(lǐng)人形機(jī)器人發(fā)展
PART3美國機(jī)器人創(chuàng)業(yè)公司加速商業(yè)化場景落地
PART4歐洲及其他:
1X和Neura為首引領(lǐng)發(fā)展
PART5
日韓:智能化有待提升,商業(yè)化尚早
PART6供應(yīng)鏈
PART7投資建議及風(fēng)險(xiǎn)提示3
PART1海外人形機(jī)器人的ChatGPT時(shí)刻已至目錄PART1海外人形機(jī)器人的ChatGPT時(shí)刻已至4中國美國歐洲全球24年制造業(yè)從業(yè)人員(億)1.20.10.34.0滲透率20%40%40%16%24年生活服務(wù)從業(yè)人員(億)1.20.81.06.0滲透率10%20%20%10%1.5臺(tái)機(jī)器人替代1個(gè)工人1.51.51.51.5其他新增需求(億臺(tái))0.40.30.31.5人形機(jī)器人存量空間(億臺(tái))0.90.60.83.4人形機(jī)器人每年新增空間(億臺(tái))0.230.150.190.84人形機(jī)器人均價(jià)(萬/臺(tái))10141412每年新增市場空間(萬億)2.32.22.610.1u
人形機(jī)器人:
其空間來自對工人的替代
,并可進(jìn)入toc端創(chuàng)造新需求。
24年全球制造業(yè)從業(yè)人員4億人
,生活服
務(wù)從業(yè)人員6億
,按照制造業(yè)機(jī)器人滲透率16%、服務(wù)業(yè)機(jī)器人滲透率10%
,
1.5臺(tái)機(jī)器人替代1個(gè)工位
,且預(yù)計(jì)
其他領(lǐng)域新增1.5億臺(tái)需求
,對應(yīng)全球人形機(jī)器人每年新增需求0.8億臺(tái)
,單臺(tái)價(jià)格12萬/臺(tái)
,對應(yīng)市場空間10萬
億
,其中中國市場空間為2.3萬億
,對應(yīng)人形機(jī)器人新增需求2300萬臺(tái)。u
歐美勞動(dòng)力成本高
,人形機(jī)器人性價(jià)比突出:放量初期按照一臺(tái)機(jī)器人成本50萬算
,
3臺(tái)替代一個(gè)工人
,按照美
國人工成本70萬/個(gè)
,對應(yīng)回本周期2年
,而中國回本周期10年。但若成本下降至14萬算
,
1.5臺(tái)替代一個(gè)工人
,
對應(yīng)美國回本周期0.3年、
中國回本周期1.5年。一個(gè)工位成本(萬元)210.31.5遠(yuǎn)期(27-28年之后)1.5臺(tái)機(jī)器人替代1個(gè)
工人美國回本周期(年)
中國回本周期(年)項(xiàng)目金額美國工人成本(萬元)70中國人工成本(萬元)15短期機(jī)器人成本(萬元)50遠(yuǎn)期機(jī)器人成本(萬元)14一個(gè)工位成本(萬元)150人(
-
)工美國回本周期(年)2中國回本周期(年)
10人3臺(tái)個(gè)年16代2替25機(jī)器短期勞動(dòng)力短缺+經(jīng)濟(jì)性,人形機(jī)器人需求空間廣闊
數(shù)據(jù)來源:各國統(tǒng)計(jì)局,東吳證券研究所測算
5圖人形機(jī)器人市場空間圖:機(jī)器人的經(jīng)濟(jì)性u
人形機(jī)器人的優(yōu)勢在于通用性
,而要實(shí)現(xiàn)通用性需依賴:
一是訓(xùn)練數(shù)據(jù)
,二是AI大模型
,
2022年以來算力、
大
模型等快速發(fā)展
,人形機(jī)器人智能化大幅提升
,其中特斯拉、英偉達(dá)、Google布局領(lǐng)先。?數(shù)據(jù)訓(xùn)練:
高質(zhì)量的訓(xùn)練數(shù)據(jù)是人形機(jī)器人實(shí)現(xiàn)泛用性的基礎(chǔ),
此前依賴真實(shí)場景采集,效率低,成本高,
而仿真平臺(tái)的發(fā)展指數(shù)級放大數(shù)據(jù)采集和訓(xùn)練規(guī)模,提高效率、降低成本。?具身智能大模型:從語言大模型,到視覺大模型,
到VLA多模態(tài)大模型,強(qiáng)化機(jī)器人交互、任務(wù)拆解、任務(wù)
執(zhí)行能力,和自主學(xué)習(xí)能力,讓機(jī)器人大腦更加智能。圖人形機(jī)器人大模型海外大模型發(fā)展推動(dòng)人形機(jī)器人落地,科技公司引領(lǐng)數(shù)據(jù)來源:特斯拉、英偉達(dá)、谷歌等官網(wǎng),東吳證券研究所
6英偉達(dá)GR001
Project為機(jī)器人提供通用智能的基礎(chǔ)模型Meta和CMU聯(lián)合打造的大模型RoboAgentPhysicalIntelligenceπ0模型使機(jī)器人可自主執(zhí)行復(fù)雜任務(wù)英偉達(dá)Isaac
GR00TBlueprint是一個(gè)數(shù)字孿生訓(xùn)練場googleRT系列和AutoRT收集更多和更多樣化的訓(xùn)練數(shù)據(jù)特斯拉Dojo超級計(jì)算機(jī)及相關(guān)技術(shù)構(gòu)建數(shù)據(jù)仿真訓(xùn)練體系仿真數(shù)據(jù)訓(xùn)
練平臺(tái)具身智能大
模型特斯拉FigureAIAgilityApptronikSanctuaryAI波士頓動(dòng)力1XNeura
Robotics國家美國美國美國美國加拿大韓國挪威德國商業(yè)化場景先落地汽車車間先落地車廠和
物流物流先落地車廠和
物流商超家庭工業(yè)/家庭量產(chǎn)計(jì)劃25年幾千臺(tái),26-27年每年10倍增長2家客戶未來4
年(25-28年)
需求10萬臺(tái)24年內(nèi)產(chǎn)能達(dá)
到數(shù)百臺(tái),未
來幾年將實(shí)現(xiàn)
年產(chǎn)能1萬臺(tái)25年將制造數(shù)
百個(gè)24年7月定下前臺(tái)量產(chǎn)目標(biāo),但量產(chǎn)不順,
創(chuàng)始人離職從液壓轉(zhuǎn)向電
動(dòng),計(jì)劃商用25年制造1000個(gè),在
2028年將制造數(shù)百萬個(gè)
NEO10億歐訂單客戶自用寶馬、亞馬遜亞馬遜GXO奔馳GXOCTC麥格納家用川崎重工、歐
姆龍下肢形態(tài)雙足雙足鴕鳥雙足雙足/輪式雙足(但有可
能改輪式)雙足升級為雙足雙足靈巧手22自由度16自由度電動(dòng)抓夾20自由度三指抓夾20自由度可組裝手/夾大模型自制與OpenAI合作/加入英偉達(dá)Cosmos加入英偉達(dá)
Cosmos與Google合作/加入英偉達(dá)Cosmos自研/加入英偉
達(dá)Cosmos加入英偉達(dá)
Cosmos與OpenAI合作/加入英偉達(dá)Cosmos加入英偉達(dá)
Cosmosu
從商業(yè)化場景看:
海外公司均重視落地場景
,
絕大部分公司先落地車間和物流場景
,
部分企業(yè)如1X和NeuraRobotics同樣重視家庭場景。并且嘗試用租賃的方式
,
降低客戶使用成本。u
從量產(chǎn)角度看:25年是量產(chǎn)元年
,各家目標(biāo)從幾百臺(tái)到幾千臺(tái)不等。且26年大規(guī)模量產(chǎn)新機(jī)型。
u
從本體和末端執(zhí)行器看:
存在多樣化。但基本以雙足為主
,部分采用輪式。
同時(shí)手部方案多為開放式
,可自由組
裝靈巧手或抓夾。u
從大模型看:
除特斯拉自研外
,
其余主流公司基本加入英偉達(dá)Cosmos生態(tài)
,
同時(shí)部分公司也和OpenAI或Google等科技公司合作。圖海外人形機(jī)器人特點(diǎn)總結(jié)海外人形機(jī)器人重視商業(yè)化落地,車廠和物流先行
數(shù)據(jù)來源:
特斯拉、
figure、
agility等官網(wǎng),東吳證券研究所
7u
特斯拉:大模型+人形本體垂直一體公司。將自動(dòng)駕駛大模型嫁接到人形機(jī)器人
,利用Dojo超級計(jì)算機(jī)平臺(tái)繼續(xù)
數(shù)據(jù)仿真訓(xùn)練
,擁有豐富的制造經(jīng)驗(yàn)和強(qiáng)大的供應(yīng)鏈基礎(chǔ)
,以及汽車車間應(yīng)用場景。u
英偉達(dá)、
Google、
Physical
Intelligence:
具備計(jì)算/大模型優(yōu)勢
,提供人形機(jī)器人大腦。英偉達(dá)依托芯片
,
拓展數(shù)據(jù)
、
大模型
、
開發(fā)平臺(tái)
,
為人形廠商提供底層開發(fā)模型
。
Google依托打造的RT系列模型
,
并計(jì)劃用Gemini模型控制人形
,與人形廠商聯(lián)手
,開發(fā)新一代機(jī)器人。
PI專門提供人形機(jī)器人具身智能大模型。u
Figure
AI、Agility、
1X等:
產(chǎn)品性能優(yōu)異
,商業(yè)化落地快的人形初創(chuàng)公司。
Figure02已獲得寶馬、亞馬遜等
訂單
,并獲得科技巨頭投資
,股東背景雄厚。
Agility專注物流場景
,
已獲得亞馬遜、
GXO訂單。
1X專注家庭場
景。圖看好三類人形機(jī)器人公司FigureAIAgilityApptroni
k1X商業(yè)化場
景先落地車
廠和物流物流先落地車
廠和物流家庭量產(chǎn)計(jì)劃2家客戶
未來4年(25-28
年)需求
10萬臺(tái)24年內(nèi)產(chǎn)
能達(dá)到數(shù)
百臺(tái),未
來幾年將
實(shí)現(xiàn)年產(chǎn)
能1萬臺(tái)25年將制
造數(shù)百個(gè)25年制造
1000個(gè),
在
2028
年將制造
數(shù)百萬個(gè)NEO客戶寶馬、亞
馬遜亞馬遜GXO奔馳GXO家用下肢形態(tài)雙足鴕鳥雙足雙足/輪式升級為雙
足靈巧手16自由度電動(dòng)抓夾20自由度大模型與OpenAI合作/加入英偉達(dá)Cosmos加入英偉達(dá)Cosmos與Google合作/加入英偉達(dá)Cosmos與OpenAI合作/加入英偉達(dá)Cosmos英偉達(dá)
OpenAI人形進(jìn)展★★★★★★★★★產(chǎn)品芯片、大模型、數(shù)據(jù)、開發(fā)平臺(tái)大模型大模型方式出售芯片及開發(fā)平臺(tái)合作開發(fā)
本體投資+小規(guī)模自研本體機(jī)器人14家機(jī)器人加入Cosmos生態(tài)Apptroni
c1XFigureAI優(yōu)勢強(qiáng)大的算
力能力
+
數(shù)據(jù)訓(xùn)練
平臺(tái)+商
業(yè)模式大模型能
力大模型能
力特斯拉商業(yè)化場景先落地汽車車
間量產(chǎn)計(jì)劃25年幾千臺(tái),26-27年每年
10倍增長客戶自用下肢形態(tài)雙足靈巧手22自由度大模型自制看好三類公司,將充分受益人形機(jī)器人產(chǎn)業(yè)大周期
數(shù)據(jù)來源:
特斯拉、英偉達(dá)、谷歌等官網(wǎng),東吳證券研究所
8優(yōu)質(zhì)創(chuàng)業(yè)公司具身智能大模型公司垂直一體化公司PART2美國科技公司引領(lǐng)人形機(jī)器人發(fā)展9特斯拉英偉達(dá)GoogleOpenAI蘋果Meta微軟人形進(jìn)展★★★★★★★★★★★★★★★★★產(chǎn)品人形機(jī)器人本
體芯片、大模型、數(shù)據(jù)、開發(fā)平
臺(tái)大模型大模型機(jī)器人感知系
統(tǒng)ARMORDigit
360的高精度觸覺傳感器方式垂直一體化生
產(chǎn)出售芯片及開
發(fā)平臺(tái)合作開發(fā)本體投資+小規(guī)模自
研本體投資機(jī)器人特斯拉機(jī)器人14家機(jī)器人加
入Cosmos生態(tài)Apptronik1XFigureAIPhysicalIntelligenceFigureAI優(yōu)勢軟件能力+制造
能力強(qiáng)大的算力能
力+數(shù)據(jù)訓(xùn)練平
臺(tái)+商業(yè)模式大模型能力大模型能力和CMU聯(lián)合打造的大模型
RoboAgentu
科技公司均重視人形機(jī)器人的發(fā)展,
其中特斯拉預(yù)計(jì)未來人形機(jī)器人將成為公司主要收入來源。u
特斯拉﹥英偉達(dá)﹥Google﹥OpenAI
:從進(jìn)展看,特斯拉居首,
且從芯片、數(shù)據(jù)訓(xùn)練、大模型到本體制造、
運(yùn)控模型均自研自產(chǎn),
25年已制定千臺(tái)量產(chǎn)目標(biāo)。其次為英偉達(dá),
其具備強(qiáng)大的算力能力+數(shù)據(jù)訓(xùn)練平臺(tái)優(yōu)勢
,利用微軟芯片、數(shù)據(jù)、大模型、開發(fā)平臺(tái),
為人形機(jī)器人公司打造底層開發(fā)生態(tài),已與14家人形公司合作
。其次為Google,從放棄本體聚焦機(jī)器人大模型,
到再次牽手機(jī)器人公司合作下一代人形機(jī)器人,具備大模
型能力。
OpenAI目前通過投資和自己小規(guī)模研發(fā)機(jī)器人本體,
尚未All
in。蘋果和Meta目前專注機(jī)器人細(xì)分
感知領(lǐng)域,平臺(tái)推出機(jī)器人感知系統(tǒng)ARMOR可用于機(jī)械臂,
Meta此前收購Digit觸覺傳感器團(tuán)隊(duì)。圖美國科技公司人形機(jī)器人布局總結(jié):美國科技公司具備算力和大模型優(yōu)勢
數(shù)據(jù)來源:特斯拉、英偉達(dá)、谷歌等公司官網(wǎng),東吳證券研究所
10u
特斯拉FSD純視覺+深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)漸趨成熟
,可嫁接至人形機(jī)器人。與自動(dòng)駕駛類似
,人形機(jī)器人同樣需
利用傳感器(攝像頭、激光雷達(dá)等)感知、采集和處理周圍環(huán)境信息
,
以便做出決策。特斯拉人形機(jī)器人僅使
用3個(gè)攝像頭(中間魚眼攝像頭、左右各一個(gè)視覺攝像頭)
,直接嫁接FSD成熟的純視覺方案
,再輔之以力/力
矩/聲學(xué)/觸覺/溫度等傳感器。u
利用Dojo超級計(jì)算平臺(tái)進(jìn)行機(jī)器人仿真訓(xùn)練
,擴(kuò)大數(shù)據(jù)集。u
未來端到端訓(xùn)練有望突破
,具身智能未來可期。圖:特斯拉FSD視覺感知圖?基礎(chǔ)結(jié)構(gòu)是由主干、頸部與多個(gè)分支頭部組成?核心特點(diǎn)是多個(gè)子任務(wù)分支共享同一個(gè)特征空間,優(yōu)勢有:同一主干統(tǒng)一提取特征并共享給各任務(wù)頭部使用;不同子任務(wù)類型之間可以實(shí)現(xiàn)解耦
;生成的特征空間可供各任務(wù)需求隨時(shí)調(diào)用?在感知框架中加入了一層“虛擬標(biāo)準(zhǔn)相機(jī)”,將每輛車采集到的圖像數(shù)據(jù)通過去畸變、旋轉(zhuǎn)等方式處理后,確保數(shù)據(jù)一致性,從而實(shí)現(xiàn)各攝像頭原始數(shù)據(jù)的“校準(zhǔn)”,再將數(shù)據(jù)喂養(yǎng)給主干神經(jīng)網(wǎng)絡(luò)訓(xùn)練?自動(dòng)駕駛的仿真是在模擬環(huán)境中,通過調(diào)整各類交通參與物及環(huán)境的模型參數(shù)以構(gòu)建各種虛擬場景,以訓(xùn)練算法應(yīng)對不同場景的性能?引入BEV鳥瞰圖:缺乏高程信息的自車坐標(biāo)系?Transformer神經(jīng)網(wǎng)絡(luò):將車身四周的多個(gè)攝像頭獲得的不同視頻數(shù)據(jù)直接進(jìn)行融合,然后用同一套神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,將坡度、曲線內(nèi)化到神經(jīng)網(wǎng)絡(luò)中,實(shí)現(xiàn)從2D轉(zhuǎn)變?yōu)?D。?通過使用具有時(shí)間維度的視頻片段訓(xùn)練神經(jīng)網(wǎng)絡(luò)
,為自動(dòng)駕駛增加短時(shí)記憶力,更好做預(yù)測?基于時(shí)間維度和空間維度的特征列隊(duì):時(shí)間維度提供時(shí)間上的連續(xù)性,空間維度是防止等待時(shí)間過長導(dǎo)致時(shí)序信息丟失?不考慮這個(gè)物體到底是什么,只考慮體素是否被占用,相較激光雷達(dá),增加了算法的泛化能力和
對現(xiàn)實(shí)世界的認(rèn)知?
18年特斯拉與第三
方合作,人工標(biāo)注
,
自,
標(biāo),?
20年研發(fā)并使用自
動(dòng)標(biāo)注系統(tǒng),通過
大量數(shù)據(jù)訓(xùn)練大模
型,再用大模型訓(xùn)
練車端小模型效注成本高建千人低隊(duì)后率團(tuán)圖片識(shí)別圖片處理對平面圖像進(jìn)行標(biāo)注、處理校準(zhǔn),識(shí)別物體攝像頭采集的圖片為2D,需轉(zhuǎn)為現(xiàn)實(shí)世界的3D空間。同時(shí)需依據(jù)短時(shí)記憶做操作預(yù)判?;谝曨l流數(shù)據(jù)的共享特征多任務(wù)型神經(jīng)網(wǎng)絡(luò)架構(gòu),擁有物體深度識(shí)別能力和短時(shí)記憶能力。特斯拉:軟硬件垂直一體化,
FSD提供具身智能基礎(chǔ)
數(shù)據(jù)來源:特斯拉公司官網(wǎng),東吳證券研究所
11
算法空間理解層:從2D到3D網(wǎng)絡(luò)基礎(chǔ)結(jié)構(gòu):
HydraNet多頭網(wǎng)絡(luò)短時(shí)記憶層:引入時(shí)間軸,做預(yù)判數(shù)據(jù)校準(zhǔn):虛擬相機(jī)構(gòu)建標(biāo)準(zhǔn)化數(shù)據(jù)占用網(wǎng)絡(luò):對BEV升級仿真:訓(xùn)練算法應(yīng)對不同場景的性能手動(dòng)標(biāo)注自動(dòng)標(biāo)注u
特斯拉機(jī)器人采用電驅(qū)動(dòng)方式
,設(shè)計(jì)之初就考慮大規(guī)模量產(chǎn):
區(qū)別于波士頓的液壓方式
,
電驅(qū)動(dòng)方式關(guān)節(jié)更靈
活
,且核心部件均大規(guī)模量產(chǎn)應(yīng)用(除絲杠)
,成本可控。u
28個(gè)執(zhí)行器組成特斯拉機(jī)器人核心關(guān)節(jié)構(gòu)架
,
電池、
攝像頭、
芯片均為成熟工藝:
Optimus機(jī)電執(zhí)行器系統(tǒng)
含3大類、40個(gè)執(zhí)行器——身體14個(gè)旋轉(zhuǎn)執(zhí)行器、
14個(gè)線性執(zhí)行器
,靈巧手12個(gè)執(zhí)行器方案尚未凍結(jié)
,上述
執(zhí)行器均由“電機(jī)+傳動(dòng)裝置+各類軸承+傳感器”組成。軀干搭載2.3kwh電池
,頭部搭載三個(gè)攝像頭(中間
魚目、兩側(cè)各一普通攝像頭)
,大腦采用FSD芯片。u
26年中特斯拉將推第二代機(jī)器人
,將進(jìn)一步改進(jìn)
,預(yù)計(jì)手部和傳感器等變化較大
,執(zhí)行器方案相對確定。圖特斯拉Optimus身體包含28個(gè)執(zhí)行器(電機(jī)+驅(qū)動(dòng)器+機(jī)械傳動(dòng)部件等)特斯拉:關(guān)節(jié)本體方案基本定型,采用28個(gè)執(zhí)行器
數(shù)據(jù)來源:特斯拉公司官網(wǎng),東吳證券研究所
12
腰髖部:旋轉(zhuǎn)執(zhí)行器
*3*2213大腿:線性執(zhí)行器*2*2大臂:線性執(zhí)行器*1*2小臂:線性執(zhí)行器*2*2小腿:線性執(zhí)行器*2*2手指:空心杯模組*6*2手肘:旋轉(zhuǎn)執(zhí)行器*1*2肩膀:旋轉(zhuǎn)執(zhí)行器*3*21231
2u
22個(gè)自由度為繩驅(qū)方案
,未來仍有變化。2024年11月
Optimus
Gen
3
靈巧手更新并展示
,靈巧手從單
手11個(gè)自由度→
22個(gè)自由度(單手電機(jī)數(shù)從2+1+1+1+1
=6變成3+2+2+2+2
=11)
。我們認(rèn)為結(jié)構(gòu)變
化點(diǎn)有:
1)
電機(jī):從手掌內(nèi)移至手臂小臂里
,一方面手掌可以縮小體積
,一方面對空心杯電機(jī)的直徑限制解開
,而且成本更低的無刷有槽電機(jī)也可能去替代空心杯;
2)傳動(dòng):我們認(rèn)為絲杠由單手不使用、到
使用10根以上;從we,robot發(fā)布的視頻來看
,小臂可看到繩驅(qū)用的繩
,小臂帶動(dòng)手關(guān)節(jié)靈活運(yùn)動(dòng)
,依賴數(shù)量可觀的腱繩;
3)感知:手指增加陣列式觸覺傳感器(每處大概幾十個(gè)觸點(diǎn))
;4)輕量化:從鋁合金金屬3D打印
,改成了塑料3D打印。特斯拉:靈巧手22自由度,方案未完全凍結(jié)圖:特斯拉24年10月“We,robot”發(fā)布會(huì)現(xiàn)場機(jī)器
人與人群互動(dòng)
數(shù)據(jù)來源:特斯拉公司官網(wǎng),東吳證券研究所
13
圖:特斯拉24年11月官推發(fā)布視頻,左手穩(wěn)穩(wěn)接
觸飛來的網(wǎng)球u
量產(chǎn)計(jì)劃明確
,指數(shù)級增長。特斯拉人形機(jī)器人將于2025年量產(chǎn)
,特斯拉預(yù)計(jì)當(dāng)年將有幾千臺(tái)人形機(jī)器人投
入其汽車工廠生產(chǎn)線中
,并繼續(xù)保持迭代
,若一切順利
,
26年量產(chǎn)將放大10倍至5-10萬臺(tái)(
接近26年年中,
第二代機(jī)器人投產(chǎn)
,
月產(chǎn)量擴(kuò)至1萬臺(tái))
,開始tob外售;
27年進(jìn)一步放大10倍至50-100萬臺(tái)
,進(jìn)入toc端市
場。最終產(chǎn)品成本2萬美金
,價(jià)格隨行就市。
Musk認(rèn)為未來人形機(jī)器人有潛力帶來超過10萬億美元的收入
,
可能成為公司價(jià)值的主要來源。u
先落地汽車車間
,商業(yè)化明確。今年計(jì)劃制造的幾千臺(tái)
,用于特斯拉工廠內(nèi)完成如給料斗上料、車身生產(chǎn)線物
料運(yùn)輸?shù)?/p>
,形成閉環(huán)以改進(jìn)生產(chǎn)設(shè)計(jì)。大概26H2可能會(huì)開始向特斯拉以外的公司交付。中國人工成本(萬元)15短期機(jī)器人成本(萬元)50遠(yuǎn)期機(jī)器人成本(萬元)14一個(gè)工位成本(萬元)150短期(25-26年)3臺(tái)機(jī)器人替代1
個(gè)工人美國回本周期(年)2中國回本周期(年)10一個(gè)工位成本(萬元)21遠(yuǎn)期(27-28年之后)1.5臺(tái)機(jī)器人
替代1個(gè)工人美國回本周期(年)0.3中國回本周期(年)1.5上海工廠19,0001%57020%7,600德國工廠12,0002%72035%8,400德州工廠22,0005%3,30050%22,000加州工廠20,0005%3,00050%20,000特斯拉:
25年預(yù)計(jì)產(chǎn)數(shù)千臺(tái),
26-27年每年10倍增長
數(shù)據(jù)來源:特斯拉公司官網(wǎng),東吳證券研究所測算
14
2025年底
3臺(tái)機(jī)器人替代
機(jī)器人替代比
1個(gè)工人所需機(jī)例
器人
(臺(tái))合計(jì)
73,000
6%7,59040%58,000圖:特斯拉人形機(jī)器人自用銷量預(yù)測圖:特斯拉人形機(jī)器人的經(jīng)濟(jì)性美國人工成本(萬元)
702026年底2臺(tái)機(jī)器人替代1個(gè)工人(臺(tái))機(jī)器人替
代比例工人
(人)金額項(xiàng)目u
特斯拉執(zhí)行器已經(jīng)確定國產(chǎn)兩家供應(yīng)商
,包括三花、拓普
,其中三花可供應(yīng)全部型號(hào)。特斯拉人形機(jī)器人
2025年開始量產(chǎn)
,我們預(yù)計(jì)三花供應(yīng)份額70%左右
,拓普份額30%左右。u
供應(yīng)看,
目前核心零部件基本由特斯拉提供
,交由三花、拓普制作總成
,但總體成本較高(預(yù)計(jì)30-50萬/
臺(tái)),
25年加快國產(chǎn)供應(yīng)商拓展
,我們預(yù)計(jì)26年國產(chǎn)供應(yīng)商將開始放量。三花、拓普均已培養(yǎng)自己的零部
件供應(yīng)商。圖:旋轉(zhuǎn)執(zhí)行器及直線執(zhí)行器結(jié)構(gòu)拆分示意圖特斯拉:執(zhí)行器已經(jīng)鎖定國內(nèi)2家廠商,三花主供供應(yīng)鏈
國產(chǎn)化?自制(絲杠、編
碼器、電機(jī))?
綠的諧波?
北特科技
?
貝斯特特斯拉人形機(jī)器人量產(chǎn)第二階段特斯拉人形機(jī)器人量產(chǎn)第一階段
數(shù)據(jù)來源:特斯拉官網(wǎng),東吳證券研究所
15
特斯拉提供零部件?
新劍傳動(dòng)?
五洲新春預(yù)計(jì)25年產(chǎn)量5000臺(tái)+26年產(chǎn)量放大至5-10萬臺(tái),成本控制要求提升?
舍弗勒?
博世力士樂?
哈默納科三花智控拓普集團(tuán)編碼器控制器電機(jī)諧波拓普集團(tuán)三花智控絲杠70%30%u
黃仁勛定調(diào)機(jī)器人:僅有三種形式的機(jī)器人可實(shí)現(xiàn)大規(guī)模量產(chǎn),一是汽車,因?yàn)槲覀儤?gòu)建了一個(gè)適合汽車的世界;二是無人機(jī),因?yàn)樘炜諞]什么限制;三是人形機(jī)器人,我們?yōu)樽约簶?gòu)建一個(gè)世界。大規(guī)模生產(chǎn)至關(guān)重要,因?yàn)樗茯?qū)動(dòng)技術(shù)飛輪效應(yīng)。高投入的研發(fā)(R&D)能帶來技術(shù)突破,從而生產(chǎn)出更優(yōu)秀的產(chǎn)品,進(jìn)一步推動(dòng)生產(chǎn)規(guī)模的擴(kuò)大。u
在人形機(jī)器人領(lǐng)域做賣鏟子的人:
目標(biāo)是借助芯片等核心產(chǎn)品,圍繞著大模型、數(shù)據(jù)、開發(fā)平臺(tái)三大核心領(lǐng)域展開,為打造機(jī)器人底層開發(fā)生態(tài)。圖
英偉達(dá)機(jī)器人生態(tài)搭建
圖
英偉達(dá)關(guān)于AI的發(fā)展判斷英偉達(dá):搭建人形機(jī)器人開發(fā)生態(tài),做賣鏟子的人
數(shù)據(jù)來源:英偉達(dá)公司官網(wǎng),東吳證券研究所
16
2018推出全新硬件、軟件、虛擬世界機(jī)器人模擬器的NVIDIAIsaac,同時(shí)還推出專為機(jī)器人設(shè)計(jì)的計(jì)算機(jī)平臺(tái)Jetson
Xavier和相關(guān)的機(jī)器人軟件工具包,正式布局智能機(jī)器人領(lǐng)域
2019
推出lsaac軟性開發(fā)套件(SDK),為機(jī)器人提供更新的AI感知和仿真功能
2021
推出Omniverse平臺(tái),支持機(jī)器人的協(xié)作和模擬,對協(xié)作機(jī)器人影響深遠(yuǎn)
2022推出IsaacNova
Orin,其配置的計(jì)算和傳感器參考平臺(tái)旨在幫助AMR(自主移動(dòng)機(jī)器人)制造商縮短開發(fā)時(shí)間并降低成本2022
發(fā)布基于Transformer架構(gòu)的支持多模形態(tài)的(仿真)智能體VIMA
2022
發(fā)布具有互聯(lián)網(wǎng)規(guī)模知識(shí)的開放式具身智能體-MinDojo2023
發(fā)布全新JetsonAGXOrin
工業(yè)級模塊
2023
發(fā)布VOYAGER智能體,這是第一個(gè)由LLM驅(qū)動(dòng)的可以終身學(xué)習(xí)的智能體,
為具身控制生成可執(zhí)行代碼
2023對Jetson平臺(tái)上的Metropolis和Isaac框架進(jìn)行有史以來規(guī)模最大的軟件擴(kuò)展,
用以來滿足邊緣AI的快速部署需求;與此同時(shí),
英偉達(dá)還宣布創(chuàng)建Jetson生成式AI實(shí)驗(yàn)室;另外宣布推出IsaacROS和IsaacSim軟件的全新版本
2023發(fā)布了Eureka(Evolution-driven
Universal
Reward
Kit
for
Agent)
智能機(jī)器人訓(xùn)練工具,本質(zhì)是一種由大模型驅(qū)動(dòng)的算法生成工具u
英偉達(dá)自2018年開始推出機(jī)器人模擬器NVIDIAIsaac、同時(shí)推出計(jì)算機(jī)平臺(tái)Jetson
Xavier和相關(guān)軟件工具包,
正式布局智能機(jī)器人,此后不斷升級芯片、計(jì)算平臺(tái)、機(jī)器人訓(xùn)練工具,
23年至今進(jìn)度顯著加快,
2024年推出
人形機(jī)器人通用基礎(chǔ)模型ProjectGR00T。圖英偉達(dá)智能機(jī)器領(lǐng)域發(fā)展史成立通用具身智能體研究GEAR(Generalist
EmbodiedAgent
Research)團(tuán)隊(duì),目標(biāo)是在虛擬和現(xiàn)實(shí)世界中建立具身智能體基礎(chǔ)模型,致力于實(shí)現(xiàn)跨多模態(tài)、多場景的智能應(yīng)用發(fā)布了人形機(jī)器人通用基礎(chǔ)模型Project
GR00T、
基于Thor
SoC的新型人形機(jī)器人計(jì)算機(jī)Jetson
Tho;
對Isaac機(jī)器人平臺(tái)進(jìn)行了重大
升級,包括生成式AI基礎(chǔ)模型和仿真工具、AI工作流基礎(chǔ)設(shè)施英偉達(dá):人形機(jī)器領(lǐng)域積淀已久,形成完成體系
據(jù)臺(tái)灣聯(lián)合新聞網(wǎng)報(bào)道,英偉達(dá)已接觸多家臺(tái)灣機(jī)床和關(guān)鍵零部件制造商,目標(biāo)包括征求關(guān)鍵零組件的技術(shù)與規(guī)格,并探索合作企業(yè)加入
其人形機(jī)器人供應(yīng)鏈的可能性。2024.12攜帶自家生成式AI時(shí)代的新王牌-升級版“Nvidia
NIM”(Nvidia
Inference
Microservices)
云原生微服務(wù)亮相丹佛SiGGRAPH2024大
會(huì);Nvidia布局的NIM生態(tài)系統(tǒng)已經(jīng)可提供一系列預(yù)訓(xùn)練的AI模型。NVIDIA
CES2025發(fā)布會(huì)上,發(fā)布其構(gòu)建的一套完整的Isaac
GR00T
Blueprint,為通用機(jī)器人的訓(xùn)練提供了一個(gè)數(shù)字孿生訓(xùn)練場。并
宣布了其合作的14個(gè)人形機(jī)器人廠商。數(shù)據(jù)來源:英偉達(dá)公司官網(wǎng),東吳證券研究所
172025.1鴻海正與英偉達(dá)合作,采用后者的軟件技術(shù)和硬件平臺(tái),在中國臺(tái)灣南部的高雄市研發(fā)專注于服務(wù)場景的人形機(jī)器人。2024.32025.12024.22024.7時(shí)間內(nèi)容u
NVIDIA面向物理AI和機(jī)器人訓(xùn)練、仿真、運(yùn)行構(gòu)建了三臺(tái)計(jì)算機(jī),分別為?
超級計(jì)算機(jī)NVIDIA
NeMo:用于AI模型訓(xùn)練。?仿真平臺(tái)Omniverse和Isaac
Sim
:模型訓(xùn)練完后需要測試,用仿真平臺(tái),可大幅縮短時(shí)間,降低成本?計(jì)算平臺(tái)Jetson
Thor:用于機(jī)器人本地部署的計(jì)算平臺(tái),從Jetson
Xavier,升級到Jetson
Orin,算力提升
10倍,并即將推出Jetson
Thor。圖英偉達(dá)人形機(jī)器人軟硬件平臺(tái)布局訓(xùn)練
測試
部署大幅縮短開發(fā)時(shí)間
數(shù)據(jù)來源:英偉達(dá)公司官網(wǎng),東吳證券研究所
18
英偉達(dá):三臺(tái)計(jì)算機(jī)幫助大幅縮短人形機(jī)器開發(fā)時(shí)間
本地部署:安裝在機(jī)器人內(nèi)部,它就是操作物理機(jī)器人的“大腦”。以通過Jetson或AGX這樣的系統(tǒng)來實(shí)現(xiàn)訓(xùn)練AI模型:訓(xùn)練通常在云端、數(shù)據(jù)中心或像NVIDIA
DGX這樣的強(qiáng)
大系統(tǒng)上進(jìn)行。仿真測試:引入一個(gè)“仿真層”,在虛擬環(huán)境中完成測試。大幅縮短測試時(shí)間和降低測試成本。機(jī)器人本地部署的專用計(jì)算
平臺(tái)JetsonThor在NVIDIAOVX服務(wù)器上的Omniverse和IsaacSim超級計(jì)算機(jī)NVIDIA
NeMo三臺(tái)計(jì)算機(jī)u
2025年1月,
NVIDIA發(fā)布IsaacGR00T
Blueprint,為通用機(jī)器人的訓(xùn)練提供了一個(gè)數(shù)字孿生訓(xùn)練場,可幫助開發(fā)者生成海量的合成運(yùn)動(dòng)數(shù)據(jù),以便通過模仿學(xué)習(xí)來訓(xùn)練人形機(jī)器人。u
該模型解決了人形機(jī)器人數(shù)據(jù)短缺、數(shù)據(jù)收集成本高昂等問題。在Blueprint的GR00T-Gen工具流中,NVIDIAOmniverse和NVIDIACosmos是指數(shù)級擴(kuò)增數(shù)據(jù)集的關(guān)鍵。
NVIDIACosmos是NVIDIA在2025年最新發(fā)布的“世界基礎(chǔ)模型”,擁有一系列開放的預(yù)訓(xùn)練世界基礎(chǔ)模型,專為生成具有物理感知的視頻和
物理AI開發(fā)所需的世界狀態(tài)而設(shè)計(jì)。圖英偉達(dá)數(shù)據(jù)孿生訓(xùn)練場流程仿真環(huán)境捕捉動(dòng)作
擴(kuò)展動(dòng)作數(shù)據(jù)集
——數(shù)據(jù)輸入人形機(jī)器人
數(shù)據(jù)來源:英偉達(dá)公司官網(wǎng),東吳證券研究所
19
英偉達(dá):仿真測試平臺(tái)解決人形機(jī)器人數(shù)據(jù)短缺痛點(diǎn)
捕捉人類動(dòng)作:借助AppleVision
Pro在數(shù)字孿生環(huán)境中捕捉人類動(dòng)作,這些人類動(dòng)作被記錄下來作為金標(biāo)準(zhǔn),并在仿真環(huán)境中由機(jī)器人模仿學(xué)習(xí)擴(kuò)展運(yùn)動(dòng)數(shù)據(jù)集:將捕捉到的人類示范動(dòng)作擴(kuò)展為更大的合成運(yùn)動(dòng)數(shù)據(jù)集指數(shù)級擴(kuò)增數(shù)據(jù)集:通過域隨機(jī)化和3D提升技術(shù),指數(shù)級擴(kuò)增這個(gè)數(shù)據(jù)集。
NVIDIAOmniverse和NVIDIACosmos(世界基礎(chǔ)模
型,基于1800萬億個(gè)
數(shù)據(jù)單元進(jìn)行訓(xùn)練)是指數(shù)級擴(kuò)增數(shù)據(jù)集的關(guān)鍵。教會(huì)人形機(jī)器人:擴(kuò)增后的數(shù)據(jù)集作為機(jī)器人策略的輸入,在Isaac
Lab中教會(huì)機(jī)器人如何在其環(huán)境中高效且安全地移動(dòng)和互動(dòng)NVIDIA
IsaacGR00T
Blueprint的仿真工作流
GR00T-Teleop
GR00T-Mimic
GR00T-Gen
Isaac
Lab
u
25年CES大會(huì)上,
NVIDIA已經(jīng)宣布第一批采用NVIDIACosmos的生態(tài)伙伴,包括6家中國人形機(jī)器人公司
,分別是星動(dòng)紀(jì)元、智元、傅利葉智能、銀河通用、宇樹科技、小鵬;以及美國Apptronik、AgilityRobotics、
FigureAI、
Boston
Dynamics(被現(xiàn)代收購),德國NEURA
Robotics,挪威1X,以色列
Mentee,加拿大SanctuaryAI。u
另外,據(jù)臺(tái)灣聯(lián)合新聞網(wǎng)24年12月3日報(bào)道,英偉達(dá)已接觸多家臺(tái)灣機(jī)床和關(guān)鍵零部件制造商,目標(biāo)包括征求關(guān)鍵零組件的技術(shù)與規(guī)格,并探索合作企業(yè)加入其人形機(jī)器人供應(yīng)鏈的可能性。我們認(rèn)為英偉達(dá)自己下場
做機(jī)器人本體可能性較小,更多是測試開發(fā),打通軟硬件,更好為客戶提供整體解決方案。圖英偉達(dá)25年CES大會(huì)宣布合作的14家機(jī)器人英偉達(dá):攜手全球各大機(jī)器人廠加快行業(yè)發(fā)展
數(shù)據(jù)來源:英偉達(dá)公司官網(wǎng),東吳證券研究所
20
BostonDynamicsNew-AtlasAgility
Robotics
Digit星動(dòng)紀(jì)元
Star1ApptronikApollo銀河通用G1MenteeMenteeBotFigureFigure021X
NEOSanctuaryAI
Phoenix小鵬IronNEURA
Robotics
4NE-1智元機(jī)器人
遠(yuǎn)征A2傅利葉
GR-2宇樹
H1收購時(shí)間公司名稱類型國家主要產(chǎn)品2013.12.2SCHAFT人形機(jī)器人日本Schaft機(jī)器人在日本的一次災(zāi)難救援挑戰(zhàn)賽中有著非常不錯(cuò)的表現(xiàn)2013.12.3Industrial
Perception機(jī)器視覺美國擁有先進(jìn)3D視覺技術(shù)可引導(dǎo)機(jī)器人在制造和物流中使用2013.12.4Redwood
Robotics人形機(jī)器人與機(jī)械臂美國主打家庭適用的機(jī)器臂機(jī)器人2013.12.5Meka
Robotics人形機(jī)器人美國致力于打造人形機(jī)器人,用以和人們生活、工作。它的旗艦機(jī)型
M1移動(dòng)操作機(jī)器人具有安全、人性化的機(jī)器人技術(shù),可適用于人們家庭和工作場所,可看作個(gè)人助手2013.12.6Holomni輪式機(jī)器人美國2013.12.7Bot
&
Dolly機(jī)器人攝像系統(tǒng)美國專門從事電影領(lǐng)域制作的自動(dòng)化機(jī)器人,擅長將大型機(jī)械臂和定制軟件相結(jié)合2013.12.8Autofuss廣告設(shè)計(jì)美國2013.12.10Boston
Dynamics人形機(jī)器人美國具備超強(qiáng)的運(yùn)動(dòng)性能的人形機(jī)器人u
2013年底Google一舉收購8家機(jī)器人公司。
2013年3月Google創(chuàng)建機(jī)器人部門Replicant,后這個(gè)部門劃歸
到Google
X門下,即后來的Alphabet
X。
2013年底,
google瘋狂收購機(jī)器人公司,包括波士頓動(dòng)力在內(nèi)的8
家機(jī)器人公司,
目標(biāo)在于發(fā)展商用機(jī)器人技術(shù)。u
主帥離職,
8家各自為政,
商業(yè)化路程艱難。
2014年google機(jī)器人部門主管Andy
Rubin離職,缺乏核心人物
將8家公司團(tuán)結(jié)在一起,各部門缺乏協(xié)作能力,且機(jī)器人訓(xùn)練成本高昂,
缺乏落地場景,商業(yè)化進(jìn)展低于預(yù)期
,
2017年將波士頓動(dòng)力出售給軟銀(購入價(jià)30億美元)
,取消Robot
Project。究其原因,
彼時(shí)算力、大模型
和人工智能尚不足以支持機(jī)器開發(fā)、訓(xùn)練。圖Google收購的8家機(jī)器人公司Google:曾高舉高打布局機(jī)器人,但迅速失敗
數(shù)據(jù)來源:谷歌公司官網(wǎng),東吳證券研究所
21
u
此前Google
Brain和Deepmind分別延兩條技術(shù)路線探索人形機(jī)器人大模型,
2023年4月兩大部門合并為Google
deepmind,追趕OpenAI,此后推出Gemini2.0,該模型為AI
Agent應(yīng)用而設(shè)計(jì)的多模態(tài)大模型,最
重要的是它可以理解和推理物理世界,構(gòu)建代理,操控人形機(jī)器人執(zhí)行任務(wù)。?Google
AI團(tuán)隊(duì):
從RT-1到融合了PalM-E的RT-2,將語言和視覺大模型應(yīng)用到機(jī)器人控制領(lǐng)域,
在推理、
知識(shí)、泛化能力方面更強(qiáng)。?Deepmind:
2014年Google以6億美金收購英國AI公司Deepmind,在合并前,
其獨(dú)立研發(fā)。其主要從智能
體的角度出發(fā)訓(xùn)練機(jī)器人,
開發(fā)Robocat、Autonomous和
DemoStart模型,
訓(xùn)練數(shù)據(jù)大都來自強(qiáng)化學(xué)習(xí)
,模型參數(shù)量控制表現(xiàn)更優(yōu),能夠?qū)崿F(xiàn)更高頻率的機(jī)器人控制。圖Google兩個(gè)團(tuán)隊(duì)機(jī)器人機(jī)器人大模型發(fā)展歷程2023.4月兩部門合并Google:兩大團(tuán)隊(duì)合并,聚焦人形機(jī)器人大模型
Demostart(2024.10)新型自主強(qiáng)化學(xué)習(xí)方法,提高機(jī)器人在仿真環(huán)境中的操作技能學(xué)習(xí)效率,并最終實(shí)現(xiàn)這些技能從仿真到現(xiàn)實(shí)的零樣本遷移PalM-E(2023.3)是在預(yù)訓(xùn)練語言模型的語言嵌入空間中注入連續(xù)的、具身的觀測,如圖像、狀態(tài)估計(jì)或其他傳感器模態(tài)。Robocat(2023.6)僅需要最少100次演示就能完成訓(xùn)練,可通過自我生成的數(shù)據(jù)進(jìn)行優(yōu)化、改進(jìn)AutoRT、SARA-RT
和
RT-Trajectory(
2024.1)提高數(shù)據(jù)收集、效率和泛化能力RT-2(2023.7)擴(kuò)充數(shù)據(jù)集合RT-X(2023.10)擴(kuò)充動(dòng)作集RT-1(2022.12)構(gòu)建起特定指令、圖片和機(jī)器人任務(wù)輸出
的橋梁,但能力受限于數(shù)據(jù)庫Gato(2022.5)能夠處理多種任務(wù)
:包括少量現(xiàn)實(shí)場
景機(jī)器人任務(wù)
數(shù)據(jù)來源:谷歌公司官網(wǎng),東吳證券研究所
22
BrainDeep
mindu
RT-1構(gòu)建起特定指令、圖片和機(jī)器人任務(wù)輸出的橋梁,但能力受于數(shù)據(jù)庫:
2022年Google把Transformer架構(gòu)應(yīng)用到機(jī)器人的操縱任務(wù)上,提出了RT-1模型。主體是預(yù)訓(xùn)練的視覺模型和用解釋器處理過的語言指令,
一起通過transformer架構(gòu)輸出機(jī)器人的動(dòng)作指令,學(xué)習(xí)范式是模仿學(xué)習(xí),訓(xùn)練數(shù)據(jù)是在google實(shí)驗(yàn)室中的兩
個(gè)廚房環(huán)境記錄的操控移動(dòng)機(jī)械臂完成抓取與放置動(dòng)作時(shí)的記錄,因?yàn)閿?shù)據(jù)相對局限,
RT-1只能接受在數(shù)據(jù)庫
中出現(xiàn)過的指令,指令的基本結(jié)構(gòu)為“動(dòng)作
+
目標(biāo)物體
+
目標(biāo)位置”。u
RT-2拓展對外界認(rèn)知,但動(dòng)作仍受限。
由于機(jī)器人數(shù)據(jù)收集受限,
google直接采用已經(jīng)有的多模態(tài)視覺語言模
型(PalM-E),
數(shù)據(jù)擴(kuò)充至網(wǎng)絡(luò)上海量的圖文數(shù)據(jù),
創(chuàng)造性的輸出機(jī)器人行為字符串。但動(dòng)作仍受限于桌面的
抓取。u
大數(shù)據(jù)集OpenX加持,
RT-X擴(kuò)充動(dòng)作能力。
收集全球60多個(gè)機(jī)器人實(shí)驗(yàn)室機(jī)械臂操作的數(shù)據(jù),
合成數(shù)據(jù)集Open
Embodiment,包括500多個(gè)動(dòng)作。用該數(shù)據(jù)進(jìn)行RT-2的方式的訓(xùn)練。其貢獻(xiàn)在于創(chuàng)造一個(gè)持續(xù)增長的
共享和開源數(shù)據(jù)集。Google:機(jī)器人控制模型RT系列不斷升級
數(shù)據(jù)來源:谷歌公司官網(wǎng),東吳證券研究所
23
圖
RT-2模型概覽u
2024年初在Robotics
Transformers的基礎(chǔ)上,
Google發(fā)布AutoRT、
SARA-RT和
RT-Trajectory,提高機(jī)器
人在現(xiàn)實(shí)世界中的數(shù)據(jù)收集、效率和泛化能力。?AutoRT:機(jī)器人訓(xùn)練系統(tǒng)。利用大型基礎(chǔ)模型(LLM/VLM)和機(jī)器人控制模型(RT-1/RT-2)
,來收集更
多和更多樣化的訓(xùn)練數(shù)據(jù),
可同時(shí)指導(dǎo)多臺(tái)機(jī)器人在不同環(huán)境中執(zhí)行多樣化任務(wù),
并通過VLM理解環(huán)境和物
體,
LLM提出創(chuàng)意任務(wù)并選擇機(jī)器人可以獨(dú)立完成的任務(wù)。?SARA-RT:提升機(jī)器人Transformer模型效率的系統(tǒng)。通過一種稱為“up-training”的模型微調(diào)方法,將
模型的二次復(fù)雜性轉(zhuǎn)換為線性復(fù)雜性,從而顯著減少了計(jì)算需求,同時(shí)保持了模型的質(zhì)量,
無需額外編碼。?RT-Trajectory:實(shí)現(xiàn)機(jī)器人泛化能力的模型。通過在訓(xùn)練視頻中添加描述機(jī)器人動(dòng)作的視覺輪廓,
RT-Trajectory讓機(jī)器人從2D軌跡圖像中學(xué)習(xí)控制策略,大幅提升執(zhí)行未見任務(wù)的成功率。Google:強(qiáng)化RT系列的數(shù)據(jù)收集、效率和泛化能力
數(shù)據(jù)來源:谷歌公司官網(wǎng),東吳證券研究所
24
圖
RT-Trajectory系統(tǒng)構(gòu)架圖AutoRT系統(tǒng)構(gòu)架u
2024年12月,
Google發(fā)布Gemini2.0多模態(tài)大模型,
其專為AI
Agent而設(shè)計(jì),
支持圖像、視頻、音頻等多模
態(tài)輸入,以及原生生成圖像與文本混合、多語言音頻的多模態(tài)輸出;
并能夠原生調(diào)用Google搜索、代碼執(zhí)行以
及第三方用戶定義函數(shù)等工具。
Gemini2.0是真正的統(tǒng)一底層模型,他具備三大能力:
一是感知能力,二是記
憶能力,
三是工具使用能力。u
利用Gemini2.0的空間推理功能,未來可以操控人形機(jī)器人執(zhí)行任務(wù)、低成本訓(xùn)練人形機(jī)器人。
谷歌發(fā)布Gemini2.0的博客提到“除了探索虛擬世界中的代理功能外,
我們還在試驗(yàn)可以通過將Gemini2.0的空間推
理功能應(yīng)用于機(jī)器人技術(shù)來在物理世界中提供幫助的代理。雖然現(xiàn)在還為時(shí)過早,
但我們對可以在物理環(huán)境中
提供幫助的代理的潛力感到興奮?!蓖瑫r(shí),
Gemini2.0的機(jī)器人代理也可以幫助人形機(jī)器人廠商訓(xùn)練自家人形
機(jī)器人,成為一種低成本、實(shí)時(shí)訓(xùn)練的方案。圖Gemini2.0空間理解:精準(zhǔn)的物體識(shí)別與定位圖
Gemini2.0性能大幅提升Google:Gemini2.0有望構(gòu)建人形機(jī)器人的代理
數(shù)據(jù)來源:谷歌公司官網(wǎng),東吳證券研究所
25
u
2024年12月20日,谷歌DeepMind宣布攜手Apptronik,針對動(dòng)態(tài)現(xiàn)實(shí)環(huán)境的復(fù)雜作業(yè)挑戰(zhàn),共同研發(fā)新一
代人形機(jī)器人。此次合作將結(jié)合谷歌的尖端AI技術(shù)與Apptronik的成熟機(jī)器人硬件,進(jìn)一步提升人形機(jī)器人的
功能性和安全性。u
同時(shí),對于谷歌而言,意味著未來可以通過Apptronik的人形機(jī)器人載體(視覺、觸覺、味覺、六維力矩等多種
傳感、以及雙手)采集豐富的現(xiàn)實(shí)數(shù)據(jù),
以此增強(qiáng)其空間物理智能。圖
Apptronik的機(jī)器人Apollo
圖
Apptronik簡介項(xiàng)目內(nèi)容背景Apptronik
由深度參與
NASA
Valkyrie機(jī)器人項(xiàng)目的團(tuán)隊(duì)成立,自
2016年成立以來,已構(gòu)建
13個(gè)機(jī)器人遠(yuǎn)程操作開發(fā)了一種VR遠(yuǎn)程操作方法,用于其上
半身人形機(jī)器人Astra
,支持混合自治,允許在必要時(shí)進(jìn)行遠(yuǎn)程指導(dǎo)模塊化具有高度模塊化設(shè)計(jì),能夠根據(jù)任務(wù)需求進(jìn)行不同配置,如安裝在車輪上或更換傳感器載荷商業(yè)化專注于最基本的任務(wù):移動(dòng)箱子、工業(yè)手提袋、垃圾箱和其他材料的搬運(yùn)。目前已進(jìn)入奔馳工廠,并與物流巨頭GXO達(dá)成合作協(xié)議Google:聯(lián)手Apptronik研發(fā)下一代人形機(jī)器人
數(shù)據(jù)來源:谷歌公司官網(wǎng),東吳證券研究所
26
u
Open
AI曾涉足機(jī)器人,因數(shù)據(jù)不足而解散。
在成立之初,其發(fā)展目標(biāo)就包括制造通用機(jī)器人,由聯(lián)合創(chuàng)始人Wojciech
Zaremba帶隊(duì),但后續(xù)研究只專注于機(jī)器人軟件技術(shù),
最終因缺乏訓(xùn)練數(shù)據(jù),
于2021年解散團(tuán)隊(duì)。其研究成果有兩個(gè),
一是訓(xùn)練機(jī)械手破解魔方(用英國靈巧手公司Shadow的機(jī)械手)
,二是Roboschool
(機(jī)
器人模擬器,用于控制并訓(xùn)練機(jī)器人)。u
2024年底開始組建機(jī)器人團(tuán)隊(duì),
但總體招聘崗位較少。
機(jī)器人硬件由2024年11月入職的前Meta增強(qiáng)現(xiàn)實(shí)眼鏡
項(xiàng)目負(fù)責(zé)人Caitlin
Kalinowski負(fù)責(zé);機(jī)器人軟件由OpenAI的計(jì)算主管Christopher
Berner負(fù)責(zé)。
25年1月,Caitlin宣布OpenAI開放3個(gè)機(jī)器人相關(guān)崗位:
機(jī)器人系統(tǒng)集成電氣工程師(為機(jī)器人設(shè)計(jì)傳感器套件)、機(jī)器
人機(jī)械設(shè)計(jì)工程師(負(fù)責(zé)機(jī)器人本體的硬件配置)
、TMP經(jīng)理(機(jī)器人技術(shù)項(xiàng)目經(jīng)理)。u
OpenAI具備軟件算法優(yōu)勢,機(jī)器人之夢從未褪色。布局人形機(jī)器人具備強(qiáng)大的算法和大模型優(yōu)勢,
其視頻生成
模型Sora可用于數(shù)據(jù)仿真,具備推理能力的語音生成模型Voice
Engine、AI大語言模型o3可用于人機(jī)交互等
。但OpenAI缺乏制造經(jīng)驗(yàn)和供應(yīng)鏈搭建,自制本體步伐相對謹(jǐn)慎,
但堅(jiān)定前進(jìn)。圖OpenAI機(jī)器人模擬器Roboschool
圖OpenAI機(jī)械手單手解魔方,成功率60%OpenAI:重啟團(tuán)隊(duì),小規(guī)模自研人形機(jī)器人
數(shù)據(jù)來源:
OpenAI公司官網(wǎng),東吳證券研究所
27
1XFigureAIPhysicalIntelligence類型人形機(jī)器人本體人形機(jī)器人本體研發(fā)機(jī)器人大腦融資時(shí)間2023.3/2024.12024.22024.11融資金額
2350萬美元/1億美金6.75億美元
4億美元產(chǎn)品聚焦家庭場景的雙足人形機(jī)器人NEO
Beta聚焦工業(yè)場景的雙足人形機(jī)器人Figure02π0模型可以控制不同形態(tài)的機(jī)器人,
使其執(zhí)行多樣化的任務(wù)OpenAI合作2022年1X與OpenAI合作。但1X
目前還未搭載高級語言大模型,其更在意任務(wù)間的泛化能力。從數(shù)據(jù)采集來看,
1X也更傾向于真實(shí)場景采集。接入OpenAI大模型GPT-4o,來識(shí)別
語言,規(guī)劃動(dòng)作。之后再由其自有神經(jīng)策略層執(zhí)行動(dòng)作(端對端)。同時(shí)用自己的身體控制模型來保持機(jī)器人的平衡。創(chuàng)始人Karol
Hausman在google深
度參與RT系列的研發(fā)u
OpenAI投資了機(jī)器人相關(guān)的3家公司,
挪威人形機(jī)器人企業(yè)1X
Technologics、美國人形機(jī)器人公司Figure
AI、研發(fā)人形機(jī)器人大腦的具身智能公司Physical
Intelligence,并為其中Figure
AI提供了模型方面的
技術(shù)支持。?1X:
2023年OpenAI領(lǐng)投1X
,
24年參與B輪融資。
1X作為挪威機(jī)器人公司,
專注家庭場景。?Figure
AI:
2024年在A1輪融資中投資500萬美金,
并為Figure提供大模型,識(shí)別語言和規(guī)劃動(dòng)作。?Physical
Intelligence
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 第15課 物聯(lián)系統(tǒng)原型的運(yùn)行與調(diào)試 教學(xué)設(shè)計(jì) -初中信息技術(shù)七年級下冊浙教版2023
- 2025至2030年中國民用氙氣燈安定器數(shù)據(jù)監(jiān)測研究報(bào)告
- 2025至2030年中國椰果罐頭數(shù)據(jù)監(jiān)測研究報(bào)告
- 2025至2030年中國柜臺(tái)開發(fā)平臺(tái)數(shù)據(jù)監(jiān)測研究報(bào)告
- 江蘇省啟東市2023-2024學(xué)年高二上學(xué)期期中考試地理試卷(解析版)
- 湖北省云學(xué)名校聯(lián)盟2023-2024學(xué)年高二上學(xué)期12月聯(lián)考地理試題(解析版)
- 2024藥品代理合同(32篇)
- 2025至2030年中國數(shù)字電路實(shí)驗(yàn)儀數(shù)據(jù)監(jiān)測研究報(bào)告
- 《故都的秋》教學(xué)設(shè)計(jì) 2024-2025學(xué)年統(tǒng)編版高中語文必修上冊
- 2025至2030年中國排球中胎數(shù)據(jù)監(jiān)測研究報(bào)告
- 老年重癥患者靜脈血栓栓塞癥預(yù)防中國專家共識(shí)(2023)解讀
- 北師大版四年級數(shù)學(xué)下冊期末測試卷(一)(含答案)
- 2025年云南省曲靖市富源縣能源局公開招聘引進(jìn)煤礦安全監(jiān)管急需緊缺人才筆試高頻重點(diǎn)模擬試卷提升(共500題附帶答案詳解)
- 婦產(chǎn)科學(xué)(甲)知到智慧樹章節(jié)測試課后答案2024年秋浙江大學(xué)
- 八年級上冊英語完形填空、閱讀理解綜合訓(xùn)練100題-含參考答案
- UL489標(biāo)準(zhǔn)中文版-2019斷路器UL標(biāo)準(zhǔn)中文版
- 大學(xué)生創(chuàng)新創(chuàng)業(yè)基礎(chǔ)教程(高職“創(chuàng)新創(chuàng)業(yè)”課程)全套教學(xué)課件
- 霍尼韋爾DDC編程軟件(CARE)簡介
- 論《說文解字》中的水文化
- 德龍自卸車合格證掃描件(原圖)
- 劉友生善人講病
評論
0/150
提交評論