智能汽車(chē)行業(yè)市場(chǎng)前景及投資研究報(bào)告:硬件芯片智能化方案基座軟件算法制約用戶(hù)體驗(yàn)_第1頁(yè)
智能汽車(chē)行業(yè)市場(chǎng)前景及投資研究報(bào)告:硬件芯片智能化方案基座軟件算法制約用戶(hù)體驗(yàn)_第2頁(yè)
智能汽車(chē)行業(yè)市場(chǎng)前景及投資研究報(bào)告:硬件芯片智能化方案基座軟件算法制約用戶(hù)體驗(yàn)_第3頁(yè)
智能汽車(chē)行業(yè)市場(chǎng)前景及投資研究報(bào)告:硬件芯片智能化方案基座軟件算法制約用戶(hù)體驗(yàn)_第4頁(yè)
智能汽車(chē)行業(yè)市場(chǎng)前景及投資研究報(bào)告:硬件芯片智能化方案基座軟件算法制約用戶(hù)體驗(yàn)_第5頁(yè)
已閱讀5頁(yè),還剩46頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

摘要智能駕駛以集中式EE架構(gòu)為依托,未來(lái)走向域融合010203E/E

架構(gòu)從分布式架構(gòu)→域集中式架構(gòu)→中央集中式架構(gòu)發(fā)展。架構(gòu)走向“域融合”是未來(lái)趨勢(shì)。能計(jì)算典型代表是以神經(jīng)網(wǎng)絡(luò)為代表的智能計(jì)算,會(huì)逐漸取代邏輯計(jì)算成為車(chē)載計(jì)算的核心。軟件功能的差異化和快速迭代將成為核心競(jìng)爭(zhēng)力。軟件定義汽車(chē)(SDV)與基于服務(wù)(SOA)的軟件設(shè)計(jì)理念成為系統(tǒng)軟件設(shè)計(jì)的基石。硬件芯片是算力時(shí)代下汽車(chē)智能化方案的基座好的芯片需能夠做到“機(jī)器自編程+應(yīng)用自適應(yīng)”。高性能大算力的芯片是六邊型戰(zhàn)士,一個(gè)復(fù)雜系統(tǒng)通過(guò)系統(tǒng)級(jí)別的軟硬件協(xié)同才能達(dá)到整體最優(yōu)。芯片是智駕方案最低層的數(shù)字基座。芯片廠商通過(guò)與生態(tài)合作伙伴合作的關(guān)系來(lái)為主機(jī)廠提供全棧自研能力,主機(jī)廠來(lái)決定到底是全棧還是半棧。汽車(chē)芯片從MCU進(jìn)化至SoC。車(chē)載芯片前景廣闊,新能源單車(chē)搭載芯片數(shù)從2012年的500-600顆提升至2023年的1000顆+。制約用戶(hù)體驗(yàn)的核心在軟件,目前各主機(jī)廠算法能力未拉開(kāi)差距制約用戶(hù)體驗(yàn)的核心在軟件與算法。算力的確會(huì)帶來(lái)更多的價(jià)值潛力,但算力并不是越高越好,制約用戶(hù)體驗(yàn)的核心在軟件與算法。特斯拉率先證實(shí)BEV+TransFormer方案可行性。算法向NeRF

、TPVFormer

、VoxFormer迭代進(jìn)化。L2+++階段各主機(jī)廠智駕算法難以拉開(kāi)差距,新車(chē)型主要卷補(bǔ)丁產(chǎn)品,未來(lái)2-5年規(guī)劃決策算法將拉開(kāi)車(chē)企智駕能力差距。L

2+++級(jí)的銷(xiāo)量,還是靠座艙域的舒適性/娛樂(lè)性、整車(chē)定價(jià)性?xún)r(jià)比、是否有高速/城市NOA。風(fēng)險(xiǎn)提示04(1)新能源車(chē)場(chǎng)景落地不及預(yù)期;(2)地區(qū)排產(chǎn)計(jì)劃變動(dòng);(3)產(chǎn)品研發(fā)不及預(yù)期等。2/CONTENTS0102030430141.1EE

51.2

E/E→→

DCUSoCECU

ECUECUCANDCUCCP

制約架構(gòu)升級(jí)、影響汽車(chē)安全性能的瓶頸效應(yīng)明顯。ZCU

域內(nèi)算力集中,提高了系統(tǒng)功能

ECU

部署增多,車(chē)內(nèi)的線(xiàn)束也會(huì)隨之延長(zhǎng),整車(chē)質(zhì)量和成本增加,影響整車(chē)布置及裝配集成度,通信速率也有顯著提升。61.2

E/E

E/E統(tǒng)一交互,實(shí)現(xiàn)整車(chē)功能協(xié)同??s短整車(chē)線(xiàn)束長(zhǎng)度和質(zhì)量,降低故障率。算力集中化,算力利用率更高?!鸀檐浻布怦畹於ɑA(chǔ),支撐軟件定義汽車(chē)。車(chē)輛易于平臺(tái)化,擴(kuò)展性增強(qiáng)。71.3

CPU81.4

HypervisorPOSIX91.5

SOA

SOASOA/POSIX/OTA101.5

SOASOASOA12OEMSOASDKSDKOEMOEML2L3+AI3HMI111.5

E/EE/E現(xiàn)有基于經(jīng)驗(yàn)的設(shè)計(jì)流程難結(jié)合車(chē)輛功能設(shè)計(jì)ICV

專(zhuān)用智能控制器,實(shí)現(xiàn)提算力、降能耗;優(yōu)化電源系統(tǒng)與線(xiàn)束系統(tǒng)設(shè)計(jì)理念,降低整車(chē)成本與質(zhì)量。軟件功能的差異化和快速迭代將成為核心競(jìng)爭(zhēng)力。軟件定義汽車(chē)(SDV)與基于服務(wù)(SOA)的軟件設(shè)計(jì)理念成為系統(tǒng)軟件設(shè)計(jì)的基石,設(shè)計(jì)可解耦、可升級(jí)、易配置、高安全、個(gè)性化的軟件將成為整車(chē)企業(yè)角力的主戰(zhàn)場(chǎng)?,F(xiàn)有通信機(jī)制難以適應(yīng)暴漲的數(shù)據(jù)傳輸需求,亟須設(shè)計(jì)高帶寬、強(qiáng)實(shí)時(shí)、低時(shí)延抖動(dòng)的車(chē)載通信機(jī)制,強(qiáng)化通信網(wǎng)絡(luò)的可配置性和多通信協(xié)議的可擴(kuò)展性。以支撐全開(kāi)發(fā)周期高精度設(shè)計(jì),構(gòu)建基于模型的設(shè)計(jì)理論和評(píng)估體系,以多元化需求為導(dǎo)向,強(qiáng)化架構(gòu)軟硬綜合匹配、功能安全、數(shù)據(jù)安全、信息安全設(shè)計(jì)。12特斯拉E/E架構(gòu)難以效仿,HPC+Zonal成為階段性發(fā)展目標(biāo)1.6

特斯拉成為中央計(jì)算+區(qū)域控制架構(gòu)先進(jìn)理念的踐行者。

HPC+Zonal成為本土品牌階段性發(fā)展目標(biāo)。

各家主機(jī)廠規(guī)劃的中央集中式架構(gòu)形式上并不統(tǒng)一。例如上汽零束的整車(chē)計(jì)算平臺(tái)采用2個(gè)HPC;廣汽/長(zhǎng)城的方案采用中央計(jì)算平臺(tái)、智駕域和座艙域三大計(jì)算平臺(tái)。

各家車(chē)企設(shè)計(jì)思路不同,但硬件上采用中央計(jì)算(HPC)+區(qū)域控制(Zonal)的架構(gòu)方案,軟件上采用SOA軟件架構(gòu)的設(shè)計(jì)理念已成為中國(guó)企業(yè)E/E架構(gòu)發(fā)展共識(shí)。

特斯拉智駕模塊的硬件部分采用自研的FSD芯片;軟件模塊的操作系統(tǒng)基于開(kāi)源Linux進(jìn)行定制化裁剪,并自研中間件。特斯拉實(shí)現(xiàn)軟硬件自主可控,既有利于加快車(chē)型功能的的迭代更新速度,同時(shí)降低了整車(chē)開(kāi)發(fā)成本;

軟件架構(gòu)層面,采用SOA架構(gòu),便于SOTA的部署以及云端數(shù)據(jù)的收集和分析;特斯拉E/E架構(gòu)實(shí)現(xiàn)了中央集中式架構(gòu)的雛形,CCM將智能駕駛模塊、影音娛樂(lè)模塊以及車(chē)內(nèi)外網(wǎng)聯(lián)模塊進(jìn)行集成,并共用液冷系統(tǒng)。

特斯拉的軟件架構(gòu)確保所有運(yùn)行在同一車(chē)型上的軟件已整合為一個(gè)單個(gè)的邏輯系統(tǒng),這意味著更少的黑盒,更簡(jiǎn)單的線(xiàn)束,更集成的軟件,更少意外情況的出現(xiàn)。數(shù)據(jù):特斯拉官網(wǎng),億歐智庫(kù),芝能智芯,證券研究13車(chē)企多采用BEV+Transformer+占柵格網(wǎng)絡(luò),個(gè)性部分發(fā)展差異化1.7

數(shù)據(jù)

:廣汽、長(zhǎng)城、上汽、小鵬公司官網(wǎng)公告,特斯拉官網(wǎng),億歐智庫(kù),Multi-camera

3D

Occupancy

Prediction

for

Autonomous

Driving,賽博汽車(chē),九章智駕,證券研究14車(chē)企多采用BEV+Transformer+占柵格網(wǎng)絡(luò),個(gè)性部分發(fā)展差異化1.7

數(shù)據(jù):未來(lái)、阿維塔、吉利、紅旗官網(wǎng),賽博汽車(chē),九章智駕,證券研究15車(chē)企多采用BEV+Transformer+占柵格網(wǎng)絡(luò),個(gè)性部分發(fā)展差異化1.7

域融合中央計(jì)算數(shù)字架構(gòu)+

1602172.1+

CPU

Swin

Transformer,

2021TransformerDETR,

Transformer---InputSizeCompetitor

FPSJourney5

FPSSwinTDETR224*2241653614442800*1333182.1

OS

I/O192.1GPU

FPGA

ASIC

FPGAASICGPU

PAL

GAL

CPLD

GPUAMD

IBM

GPU

ASIC202.1

FPGACPUCPUFPGACPU(FPGA)CPU

212.1PowerPerformanceAeraTOPSFLOPSDMIPSTera

Operation

Per

SecondFloating-PointOperations

Per

SecondDhrystone

Million

Instructions

Per

SecondOPOP

TOPS1MIPS

SoC:

CPU20,000

DMIPS

GPU100

GFLOPSSoCSoC:

TOPSMultiply

Accumulate

MAC

TOPS

=MACAI*

MAC*

2

*TOPSGPU222.2MCUSoC

智能汽車(chē)的發(fā)展對(duì)汽車(chē)的算力提出了更高的要求,傳統(tǒng)的功能芯片已經(jīng)無(wú)法滿(mǎn)足算力需求,應(yīng)運(yùn)而生。MCU

vs.

SoCMCUSoCADASIVICPU+DSP/RAM

ROM)+GPU/+CPU+RAM,ROM)+IO

Pin)NPU8bit

16bit

32bit32bit,64bitMHz-GHzMB-GBMHzMBRAM

(0.1-15/IVI:10ADAS>100FSD)Linux)23數(shù)據(jù):蓋世汽車(chē)研究院2.2

SoCCPUSoCMCU242.2SoC

HW3.0

FSDFSD2111222118215003603202601301105561%7%7%5%5%4%2%1%1%5%1%MarvellGPSMCUPHYU

-

BLOXMarvellUFSFlashCypress5040LPDDR43030252.2

CPU+XPU”SoC

SoCCPUAICPU+GPU+ASICCPU+ASICCPU+FPGAXavier

GPU4CPU

GPUDeep

Learning

AcceleratorProgrammable

VisionASICDLAAccelerator

PVAEyeQ54CPU

ComputerDeep

LearningMultithreadedCVPVision

Processors

CVPAccelerator

DLAAccelerator

MACPU+FPGA”Xeon12ArriaCPUAlteraFPGAASICFSDNPU

ASICCPU

GPUNeural

Processing

Unit

NPUAlASICBrain

ProcessingUnit

BPU262.2

L3CPUAICPUAICPUAIARMAIMCUGPU

FPGA

ASICASIL-DAI272.2

OEM282.3ASILISO26262ASILISO26262ISO26262

ASILAEC-Q100AEC

Automotive

Electronic

CouncilAEC-QAEC-Q100

AEC2023

12AEC-Q100ASILASIL292.4

SoC

2023SoC300025002000150020.50%934100056281355079.5%145020235000438201220172023120%100%80%60%40%20%0%SoCSoCSoC2019-2023%0.10%7.70%300040%30%20%10%0%31%43.30%4.40%20001000090.80%1.50%69.00%52.20%2019

2020

2021

2022

202310-2020-3030-4040-5030數(shù)據(jù):蓋世汽車(chē)研究院,證券研究2.4選配基礎(chǔ)功能36000元選配全面功能60000FSDXNGPBEV+Transiformer+OccupancyModel3/Model

YG6/G9/P7i等自研14nmFSD72

TOPS/枚芯片254TOPS/枚芯片BEV+Transformer+占柵格網(wǎng)絡(luò)7nm

NIVIDOrin-X*2選配9800/年,39800/永久MAX系列7nm

NIVID

Orin-X*2Pro系列

16nm地平線(xiàn)征程5*1254TOPS/枚芯片,128TOPS/枚標(biāo)配AD

pro版-35.98萬(wàn)元標(biāo)配AD

Max版39.98萬(wàn)元AD

MAX

3.0NAD/nop+ADS2.0BEV+Transformer+NPN+TINL7/8/9等芯片BEV+Transformer+占柵格網(wǎng)絡(luò)BEV+Transformer+GOD+RCRBEV+Transformer+DriveGptES6/7/8,ET5/7,EC7等問(wèn)界M5、阿維塔11新摩卡DHT-PHEV集度ROBO-01自研5nm神璣芯片7nm單板MDC6101000TOPS+/枚芯片200TOPS/枚芯片360TOPS/枚芯片254TOPS/枚芯片/選配680/月,7200/年,36000/永久選配26000/永久選配分3000、5000、8000元低中高檔次Hpilot3.0高通4nm

SnapdragonRide7nm

NIVIDOrin-X*2ApolloANP3.0

BEV環(huán)視三維感知+文心大模型絕影領(lǐng)航

環(huán)視感知算法BEVFormer標(biāo)配39.98萬(wàn)元具備對(duì)各類(lèi)主流芯片及異構(gòu)式計(jì)算平臺(tái)適配性與可移植性標(biāo)配ADIGO2.5

28.66萬(wàn)元標(biāo)配ADIGO3.0

33.96萬(wàn)元廣汽埃安AIONLX

Plus等31數(shù)據(jù):汽車(chē)之家,騰訊網(wǎng),億歐智庫(kù),CSDN,證券研究323.1

圖:算力與用戶(hù)體驗(yàn)不成正比2T5T10T20T50T100T200T500T1000T2000T33數(shù)據(jù):知識(shí)分析局,特斯拉官網(wǎng),證券研究3.2BEV+TransFormer

圖:自動(dòng)化訓(xùn)練重建周邊圖圖:神經(jīng)網(wǎng)絡(luò)向量空間34數(shù)據(jù):知識(shí)分析局,特斯拉官網(wǎng),證券研究3.2

FSDRegNetBiFPNHydraNet353.2

BEV–3D

BEVFormer

(Birds-Eye-View)是基于Transformer和可變注意力機(jī)制等等,利用多相機(jī)圖像的空時(shí)域信息對(duì)自動(dòng)駕駛車(chē)輛周邊的場(chǎng)景進(jìn)行統(tǒng)一鳥(niǎo)瞰圖。BEV是一種常用的周?chē)鷪?chǎng)景表示法,顯示了目標(biāo)的位置和尺度,并適用于各種自動(dòng)駕駛?cè)蝿?wù)。

框架包括6個(gè)編碼器層。每個(gè)編碼器基于Transformer標(biāo)準(zhǔn)定義增加鳥(niǎo)瞰圖查詢(xún)、空域交叉注意力、和時(shí)域自注意力模塊。和傳統(tǒng)的圖像空間相比,BEV感知可以將多個(gè)傳感器采集到的數(shù)據(jù)輸入到統(tǒng)一的空間進(jìn)行處理,有效解決了2D圖像視角的遮擋問(wèn)題、避免了誤差疊加。

BEV查詢(xún)是網(wǎng)格形的可學(xué)習(xí)參數(shù),意味通過(guò)注意機(jī)制從多攝像機(jī)視圖中查詢(xún)BEV空域特征。(1)BEVFormer的編碼層包含網(wǎng)格狀的BEV查詢(xún)、時(shí)域自注意和交叉注意。(2)在空域交叉注意中,每個(gè)BEV查詢(xún)只與感興趣區(qū)域的圖像特征交互。(3)在時(shí)域自注意中,每個(gè)BEV查詢(xún)與倆個(gè)特征交互,即當(dāng)前時(shí)間戳的BEV查詢(xún)和前一段時(shí)間戳的BEV特征。

BEV的方法在3D目標(biāo)檢測(cè)方面沒(méi)有顯示出比其他方式更顯著的優(yōu)勢(shì)。因?yàn)锽EV的方法在3D目標(biāo)檢測(cè)任務(wù)需要強(qiáng)大的BEV特征來(lái)支持精確的3D邊框預(yù)測(cè),但從2D平面生成的BEV是不適定的。最新的方案是一種不依賴(lài)3D先驗(yàn)知識(shí)的BEV生成,可以自適應(yīng)地學(xué)習(xí)BEV特征。其中Transformer使用注意機(jī)制動(dòng)態(tài)聚合有價(jià)值的功能,使感知結(jié)果更加連續(xù)、穩(wěn)定,在概念上滿(mǎn)足了需求。圖:BEVFormer空域和時(shí)域結(jié)構(gòu)從多攝像頭輸入生成鳥(niǎo)瞰圖圖:空域和時(shí)域的交叉注意36數(shù)據(jù):arXiv論文“BEVFormer:LearningBirds-Eye-ViewRepresentation

fromMulti-cameraImagesviaSpatiotemporalTransformers”,知識(shí)分析局,證券研究3.2

BEV3D37數(shù)據(jù):arXiv論文“BEVFormer:LearningBirds-Eye-ViewRepresentation

fromMulti-cameraImagesviaSpatiotemporalTransformers”,證券研究3.2

BEVFormer

–+空域交叉注意力參考點(diǎn)計(jì)算

(Deformable

Attention)(Qp)

BEVp(x,y)BEVBEVWorldLocation)。BEV(Qp)(RealBEV(Lift)(Pillar-Like

Query)(Qp)

zNrefz(z')Nref(x'

y'

z’)

Nref(x'

y'

z')時(shí)域自注意力

DeformAttn

P(p,i,j)BEVij

Fttiit

NrefBEV

Vhit

BEV38數(shù)據(jù):arXiv論文“BEVFormer:LearningBirds-Eye-ViewRepresentation

fromMulti-cameraImagesviaSpatiotemporalTransformers”,證券研究3.3

Transformer–

早在2021年,特斯拉就已經(jīng)實(shí)現(xiàn)了純視覺(jué)的BEV檢測(cè)方案,而且效果非常好。

這套BEV方案中將相機(jī)空間的圖像轉(zhuǎn)換到BEV空間的核心組件就是Transformer。Transformer于自然語(yǔ)言處理領(lǐng)域,首先被應(yīng)用于機(jī)器翻譯。后來(lái),大家發(fā)現(xiàn)它在計(jì)算機(jī)視覺(jué)領(lǐng)域效果也很不錯(cuò)。目標(biāo)檢測(cè)領(lǐng)域中,視覺(jué)Transformer不僅可以實(shí)現(xiàn)2D檢測(cè)、3D檢測(cè),還可以實(shí)現(xiàn)多模態(tài)檢測(cè),BEV視角下的檢測(cè),性能也非常出色。

Encoder(編碼器)的作用在于獲取輸入序列各元素之間語(yǔ)義與位置的關(guān)聯(lián)信息。編碼器將網(wǎng)絡(luò)分成了許多塊(block),此處的block不能理解為神經(jīng)網(wǎng)絡(luò)的一層。事實(shí)上,一個(gè)block為神經(jīng)網(wǎng)絡(luò)的幾個(gè)layer,

整個(gè)網(wǎng)絡(luò)為若干個(gè)block的堆疊。

其中一個(gè)block的工作為:先將輸入送入自注意力匯聚機(jī)制,然后將自注意力層的輸出經(jīng)過(guò)全連接(FC)層得到塊的輸出。

Decoder(解碼器)和編碼器的主要區(qū)別就是Encoder-Decoder

Attention,

這也是編碼器和解碼器的連接點(diǎn)。它增加了一個(gè)基于多項(xiàng)注意力模塊的、綜合Encoders的輸出組成輸入信息的解碼層。

Decoders的輸入為預(yù)測(cè)輸出序列嵌像量位置編碼后的向量,輸出為表示輸出元素位置的向量。經(jīng)過(guò)Linear及Softmax層轉(zhuǎn)換為輸出元素概率向量。39數(shù)據(jù):arXiv論文“BEVFormer:LearningBirds-Eye-ViewRepresentation

fromMulti-cameraImagesviaSpatiotemporalTransformers”,證券研究3.4

Occupancy

Network

3D

占據(jù)網(wǎng)絡(luò)(Occupany

Network)

通過(guò)直接學(xué)習(xí)連續(xù)三維占據(jù)函數(shù)實(shí)現(xiàn)目標(biāo)三維幾何重建的方法?;谏疃壬窠?jīng)網(wǎng)絡(luò)對(duì)連續(xù)三維空間點(diǎn)占據(jù)情況進(jìn)行預(yù)測(cè),使目標(biāo)三維表面得以隱式的表示作神經(jīng)網(wǎng)絡(luò)分類(lèi)器的連續(xù)決策邊界。通俗理解就是通過(guò)占據(jù)網(wǎng)絡(luò)映射將環(huán)境劃分成格子,并確定哪些格子是被占據(jù)的、哪些是空閑的。

這種體積占據(jù)信息使自動(dòng)駕駛系統(tǒng)能夠準(zhǔn)確地理解周?chē)沫h(huán)境。系統(tǒng)不僅能識(shí)別物體,還能區(qū)分靜態(tài)和動(dòng)態(tài)物體。在此之前自動(dòng)駕駛攝像頭理解周?chē)h(huán)境是通過(guò)分開(kāi)識(shí)別可行駛區(qū)域、車(chē)道線(xiàn)、行人等,再把他們組合在一起完成的。

傳統(tǒng)的物體檢測(cè)方法通常依賴(lài)于將物體分類(lèi)并放置在固定的邊界框中,忽略了很多幾何細(xì)節(jié)。但是OccupancyNetworks通過(guò)預(yù)測(cè)每個(gè)小立方體是否被占據(jù)能夠提供更精確的物體形狀信息。這對(duì)于理解復(fù)雜的場(chǎng)景和避免碰撞非常重要。并且傳統(tǒng)的物體檢測(cè)算法往往只能識(shí)別他們見(jiàn)過(guò)的物體,但OccupancyNetworks通過(guò)判斷一個(gè)區(qū)域是否被占據(jù)而不是關(guān)心該區(qū)域是什么物體,從而能夠處理未知、不常見(jiàn)的問(wèn)題。減少因未識(shí)別物體導(dǎo)致的意外。

Occupancy

Networks代表的是純視覺(jué)路徑,好處是模型網(wǎng)絡(luò)的數(shù)量在減少,對(duì)算力的需求也降低。并且加上只用攝像頭加毫米波,硬件相對(duì)便宜,但對(duì)模型算法要求很高。特斯拉就是典型代表,推行基于視覺(jué)的系統(tǒng)可以降低成本,從而促進(jìn)特斯拉的銷(xiāo)量。圖:三維空間點(diǎn)占據(jù)情況圖:神經(jīng)網(wǎng)絡(luò)分類(lèi)器的連續(xù)決策邊界40數(shù)據(jù):arXiv論文“BEVFormer:LearningBirds-Eye-ViewRepresentation

fromMulti-cameraImagesviaSpatiotemporalTransformers”,證券研究3.4

Occupancy

Network413.4

Occupancy

Network423.4

TeslaTransformer

BEV

Layer

433.5NeRF–

44數(shù)據(jù):UE4-NeRF:

Neural

Radiance

Field

for

Real-Time

Rendering

of

Large-ScaleScene,3D視覺(jué)工坊,證券研究3.6TPVFormer–

TPV(Tri-Perspective

View)是基于Transformer及三維正交感知視圖平面。并利用多相機(jī)圖像特征到感知視圖平面投影特征和,對(duì)三維場(chǎng)景進(jìn)行建模的視覺(jué)感和占據(jù)網(wǎng)絡(luò)框架。

TPV基于三維空間、三維正交視圖平面與多相機(jī)視圖坐標(biāo)系可相互轉(zhuǎn)換原理,通過(guò)可變注意力機(jī)制計(jì)算相機(jī)視圖特征與三維正交視圖平面特征關(guān)聯(lián)度,利用三維正交視圖平面特征表示實(shí)現(xiàn)三維語(yǔ)義占據(jù)預(yù)測(cè)。453.6TPVFormer–3D三維空間與正交平面圖像交叉注意力th,w,

td,h,

tw,

d,463.7VoxFormer–3D

VoxFormer基于Transformer、可變注意力機(jī)制及遮擋自編碼器,利用圖像及體素特征關(guān)聯(lián)度分倆

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論