




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
第7卷第3期2009年9月南京T程學(xué)院學(xué)報(bào)(自然科學(xué)版)JImmaIofV01.7,No.3FAilion)Sep.,2009Naminghr*litute?訂1h‘hn.h唱,y(Naturals‘‘iem。c文章編號(hào):1672—2558(2009)03—0061—07基于GPU交互式光線跟蹤算法的設(shè)計(jì)與實(shí)現(xiàn)陸建勇1,曹雪虹2,焦良葆2(1.南京郵電大學(xué)通信與信息工程學(xué)院,江蘇2.南京工程學(xué)院通信工程學(xué)院,江蘇南京,210003;1南京,21167)摘要:由于(;Pu并行處理能力和可編程能力的提高,計(jì)算量巨大的光線跟蹤算法在(;Pu上的實(shí)現(xiàn)成為研究熱點(diǎn).在CUDA平臺(tái)上驗(yàn)證了Foley等人所采用的KD—tree加速算法,實(shí)現(xiàn)了交互式光線跟蹤.在圖像分辨率為512X512,跟蹤深度為4時(shí),針對(duì)復(fù)雜場景的渲染速度達(dá)到15f/s,基本實(shí)現(xiàn)交互式光線跟蹤.關(guān)鍵詞:并行計(jì)算;GPU;光線跟蹤;KD-tree;流計(jì)算中圖分類號(hào):TN91l文獻(xiàn)標(biāo)識(shí)碼:ADesignandImplementationofInteractiveRayTracingAlgorithmBasedonGPULUJian-yon91,CAOXue?hon92,JIAOLiang—ba02(1.SchoolofTelecommunicationandInformationEngineering,Nanjing210003,China;UniversityofPostsandTelecommunications,Na-jing2.SchoolofCommunicationEngineering,NanjinInstituteofTechnology,Nanjing211167,China)Abstract:ThanksalgorithmonontotheimprovementsofparallelacomputationpowerandprogrammingabilitiesofGPU,raystructure,atracingGPUhasbecomeheatedareaofresearch.UsingtheKD—treedatamodelsystemisconstructedCUDAplatformandparallelprocessingofraytracingisachieved.Interactiveraytracingancanbeachievedwhenimageresolutionratiois512X512,thetracingdepth4andinteractiverenderingrate15f/s.Keywords:parallelcomputing;GPU;mytracing;KD—tree;streamcomputing光線跟蹤是一種真實(shí)感繪制算法,利用光路可逆原理,通過逆向跟蹤光線,生成栩栩如生漂亮非凡的圖像.光線跟蹤算法需要跟蹤每條從視點(diǎn)出發(fā)的光線,其巾涉及到大量的求交測(cè)試運(yùn)算,計(jì)算量非常龐大,因此這一技術(shù)基本是離線處理.隨著光線跟蹤開始最大程度地利用CPU技術(shù)的最新進(jìn)步成果,通過硬件的支持來實(shí)現(xiàn)真實(shí)感圖形的顯示,能達(dá)到實(shí)時(shí)交互的速率.目前,提高光線跟蹤算法速度的關(guān)鍵在于提高求交的效率、減少求交的次數(shù)、減少光線條數(shù)以及采用加速的數(shù)據(jù)結(jié)構(gòu)等11?!浚陙?,隨著GPU在并行計(jì)算能力、存儲(chǔ)容量和可編程能力方面的發(fā)展,在GPU上實(shí)現(xiàn)交互式光線跟蹤,甚至實(shí)時(shí)光線跟蹤成為研究熱點(diǎn)H。J.本文驗(yàn)證了Foley等人所采用的KD—tree加速算法№].實(shí)驗(yàn)結(jié)果達(dá)到了交互式光線跟蹤的效果.收稿日期:2009—09—02;修回日期:2009—12—01基金項(xiàng)目:西f】子巾圍研究院資助項(xiàng)目;南京T程學(xué)院科研基金項(xiàng)目(KXJ081M2)作者簡介:陸建勇(1984一),男,碩十研究生.研究方向?yàn)樾盘?hào)與信息處理.E?llfllai!:Ijy.ha@163.corn萬方數(shù)據(jù)62南京工程學(xué)院學(xué)報(bào)(自然科學(xué)版)2009年9月1相關(guān)工作Whitted在文獻(xiàn)[7]中指出,渲染方程的計(jì)算時(shí)間中,大于95%的時(shí)間花費(fèi)在光線與幾何體求交計(jì)算的代碼中.這就意味著光線跟蹤算法中,幾乎所有的計(jì)算都發(fā)生在求交中,而從著色函數(shù)中調(diào)用跟蹤光線函數(shù)能夠以任意順序進(jìn)行,都不會(huì)影響最終的結(jié)果.因此,光線跟蹤的一個(gè)重要的特性就是計(jì)算光線與幾何體求交能以并行的方式執(zhí)行.另外,Wald在文獻(xiàn)[8]中指出,原則上,隨著能夠執(zhí)行首次光線計(jì)算的處理器的增加,速度上的提升將隨著所使用的CPU的數(shù)量呈線性增長.因此,GPU上實(shí)現(xiàn)光線跟蹤能大幅度提高運(yùn)算速度.Purcell【93和Carr【l剛等人幾乎同時(shí)提出來第一個(gè)由GPU實(shí)現(xiàn)的光線跟蹤算法框架.Purcell等人提出的光線跟蹤算法將所有的光線跟蹤內(nèi)核都建立在GPU之上,包括視線產(chǎn)生器、遍歷器、求交器和著色器.而Carr等人僅僅把GPU作為一個(gè)光線和三角片求交器,將其它的光線跟蹤工作留給CPU.這兩種方法的不同之處在于,Purcell把光線跟蹤的所有處理過稗都在GPU上完成,而Carr等人把光線跟蹤的不同工作分別交由CPU和GPU處理,所以前者能夠消除岡為CPU與GPU之間頻繁的數(shù)據(jù)傳輸帶來的損失,但這種方法會(huì)使GPU大量處于空閑階段.Cart等人的方法能夠獲得更高的GPU使用率,因?yàn)楣饩€在被發(fā)送到GPU之前,已經(jīng)提前在CPU上被處理成束,所以內(nèi)在的就已經(jīng)獲得了光線的一致性,但是這種方法會(huì)由于CPU—GPU之間大量的數(shù)據(jù)傳輸而帶來性能上的損失.為了提高光線和場景的求交速度,對(duì)于CPU提出了很多的加速結(jié)構(gòu).最近,很多這種加速結(jié)構(gòu)己經(jīng)被引入到GPU上,常用的三種加速結(jié)構(gòu)為:均勻柵格(UniformGrid),KD.tree和包闈體層次(BVH).均勻柵格是在基于GPU光線跟蹤算法中第一個(gè)被使用的加速結(jié)構(gòu),因?yàn)檫@種結(jié)構(gòu)無論是在構(gòu)造還是在遍歷上都非常的簡單,Christen,Karlsson,Ljungstedt等人都用這種加速結(jié)構(gòu)作為基于GPU的光線跟蹤算法的加速結(jié)構(gòu).但是它的性能同CPU上的實(shí)現(xiàn)相比要差.KD—tree被認(rèn)為是CPU上對(duì)于光線跟蹤算法而言最快的加速結(jié)構(gòu),但是GPU卻缺少實(shí)現(xiàn)這個(gè)樹的遍歷的堆棧結(jié)構(gòu).Foley等人【61提出了一個(gè)能夠在GPU上實(shí)現(xiàn)的KD—tree,并且指出KD—tree的性能超過均勻柵格.斯坦福大學(xué)Daniel等人…’在Foley研究的基礎(chǔ)上進(jìn)行了改進(jìn),采用了Packets、Push—Down和shon.Stack,進(jìn)一步提升了光線跟蹤器的性能.Thrane等人¨21提出了GPU上的第一個(gè)BVH實(shí)現(xiàn).2GPU編程架構(gòu)簡介Nvidia公司針對(duì)GPU的通用運(yùn)算,提出的GPU與CUDA(ComputeUnifiedDeviceArchitecture,計(jì)算統(tǒng)~設(shè)備體系結(jié)構(gòu))相結(jié)合進(jìn)行并行運(yùn)算的方法,可以通過片上(On—chip)上百個(gè)處理器同步協(xié)作,從而快速解決復(fù)雜的運(yùn)算問題‘‘3】.CUDA是把GPU作為并行運(yùn)算設(shè)備進(jìn)行程序發(fā)布和管理運(yùn)算,不需要將計(jì)算映射到圖形應(yīng)用程序接口的硬件和軟件的架構(gòu).為了實(shí)現(xiàn)這一功能,CUDA定義了相應(yīng)的邏輯架構(gòu),并于GPU設(shè)備相對(duì)應(yīng),如圖l所示.其中,Thread是最小的邏輯運(yùn)算單位,多個(gè)Thread組成Block.這些Thread可以處理相同或不同的運(yùn)算過程,每個(gè)Thread在Block中有唯一的標(biāo)識(shí)符,通過標(biāo)識(shí)符在程序中進(jìn)行判斷,就可以讓某個(gè)或某些特定位置的數(shù)據(jù)得到相同或不同的運(yùn)算處理.萬方數(shù)據(jù)第7卷第3期陸建勇,等:基于GPU交互式光線跟蹤算法的設(shè)計(jì)與實(shí)現(xiàn)圖lCUDA邏輯架構(gòu)及其與設(shè)備內(nèi)存的對(duì)應(yīng)關(guān)系3算法設(shè)計(jì)3.1架構(gòu)實(shí)驗(yàn)采用如圖2所示的程序架構(gòu).為避免CPU和GPU之間的內(nèi)存倒換,在場景構(gòu)建中將讀人的紋理貼圖數(shù)據(jù)以及光線的參數(shù)和加速結(jié)構(gòu)(KD.tree)這些數(shù)據(jù)寫入到紋理內(nèi)存.然后,將這些數(shù)據(jù)作為渲染引擎的輸入.渲染引擎的主要工作流程如圖2右邊框圖所示,包括光線求交、判斷光源可見、計(jì)算光強(qiáng)貢獻(xiàn)以及生成次級(jí)光線后再次進(jìn)行光線求交等,最終通過openGL生成效果圖.場景構(gòu)建,ill構(gòu)建KI)樹紋理拷貝光線生成.ll1./渲染引擎\上\openGL硅爪圖2基于GPU的光線跟蹤算法流程圖1)光線的生成.在進(jìn)行光線跟蹤渲染時(shí),首先要確定視點(diǎn)、觀察方向和視角,并由此確定生成的圖像平面,如圖3(a)所示.當(dāng)確定了圖像平面后,根據(jù)圖像分辨率確定像素位置,從而得到初始光線,開始進(jìn)行渲染.本文的初始視點(diǎn)位置、觀察方向由程序輸入;視角選?。叮罚常福?。作為缺省值,視點(diǎn)距離圖像平面的距離為l,其余的兩個(gè)數(shù)值符合三角關(guān)系xdirectionlength:0.5。tanf羋1rightl.ength、二,根據(jù)視點(diǎn)位置、觀察方向、視角和圖像分辨率,可以確定像平面上每個(gè)像素點(diǎn)的位置,再根據(jù)視點(diǎn)位置,可以確定每條初始光線的方向,從而確定初始光線,如圖3(b)所示.2)光線求交.光線牛成后,便使光線在KD—tree巾搜索最近的相交i角片,求出交點(diǎn)坐標(biāo)及光線參數(shù)t.萬方數(shù)據(jù)南京T程學(xué)院學(xué)報(bào)(自然科學(xué)版)2009年9月(a)視點(diǎn)、觀察方向和像平面(”光線及其參數(shù)(f為參數(shù))圖3光線的生成3)判斷光源可見性.陰影效果在真實(shí)感圖像的生成和物體位置判斷方面是一個(gè)非常重要的元素,光線跟蹤可以自動(dòng)生成陰影效果.當(dāng)確定光線和i角面的交點(diǎn)后,在光源與交點(diǎn)之問生成探測(cè)光線,并利用KD—tree的求交方法,判斷在交點(diǎn)和光源之間是否有物體遮擋,如有遮擋,則光源對(duì)該像素點(diǎn)的色彩無直接貢獻(xiàn),否則在計(jì)算像素色彩時(shí),需要考慮光源的貢獻(xiàn).由于對(duì)光源貢獻(xiàn)的不同處理,最終渲染的效果自動(dòng)出現(xiàn)陰影.4)計(jì)算光強(qiáng)貢獻(xiàn).像素點(diǎn)的色彩由光線與場景中物體的交點(diǎn)處材質(zhì)的漫反射分量、鏡面反射分量和環(huán)境分量組成.光線每反射一次便需計(jì)算一次交點(diǎn)處的顏色值,這樣經(jīng)過多次反射后,像素點(diǎn)最終色彩便是多次采樣值的累加.3.2KD.tree加速結(jié)構(gòu)KD—tree是一種空間剖分結(jié)構(gòu),用一棵二叉樹將場景表示為一個(gè)層次結(jié)構(gòu),以便于光線快速與j角片求交.KD—tree算法主要包括KD—tree的構(gòu)建和KD—tree的遍歷.3.2.1KD.tree的構(gòu)建一個(gè)KD—tree的創(chuàng)建過程是一個(gè)自頂向下的遞歸的過程:1)輸入整個(gè)場景的三角片集合及包圍盒;2)將整個(gè)場景的所有i角片進(jìn)行預(yù)處理,包括預(yù)先提取和排序,為每個(gè)三角片建立AABB(AxisAlignedBoundingBox即軸對(duì)稱綁定盒);3)月j遞歸的方法從t:N下構(gòu)建KD.tree(重)選擇分割平面,通過計(jì)算最小代價(jià)函數(shù),用SAH找到最佳分割面;②用最佳分割面平面進(jìn)行空間分割;③將圖元對(duì)象分配給左、右子節(jié)點(diǎn).這個(gè)遞歸過程不斷進(jìn)行,直到達(dá)到選擇的最大的深度值,或者在一個(gè)節(jié)點(diǎn)巾的三角形的數(shù)量小于給定的閾值.Harvan【14’等人對(duì)基于CPU的光線跟蹤算法的加速結(jié)構(gòu)進(jìn)行了比較,得…的結(jié)論是對(duì)于眾多不同類型的測(cè)試場景,平均而青,KD—tree是最快的.Harvan還指出,當(dāng)KD—tree的最大深度為16、包含的最小的三角形數(shù)量等于2的時(shí)候,性能最優(yōu).從上述過程可以看f}{,在構(gòu)建KD.tree的過程巾,如何選取分割平面的位置對(duì)KD.tree的遍歷時(shí)間有很大影響.MacDonald提出了基于表面積的最小代價(jià)函數(shù)來評(píng)價(jià)分割平面的SAH算法¨5|,其基本思想是一條光線同一個(gè)子節(jié)點(diǎn)相交的概率,與子節(jié)點(diǎn)中的表面積和父親節(jié)點(diǎn)中的表面積之比成正比.使朋的代價(jià)函數(shù)為萬方數(shù)據(jù)第7卷第3期陸建勇,等:基于GPU交互式光線跟蹤算法的設(shè)計(jì)與實(shí)現(xiàn)C=c-tray+prob(hitL)×cost(L)+prob(hitR)×cost(R)=c?tray+SA(L)×TriCount(L)+SA(R)×TriCount(R)3.2.2KD-tree的遍歷KD—tree的遍歷就是光線在KD.tree中搜索最近的相交的三角片,見圖4,算法的過程為:1)初始化,對(duì)于每條光線,在光線同場景中的包圍體相交的地方,找出參數(shù)范圍[tmin,tmax];2)從根節(jié)點(diǎn)開始求交,并求出光線在該根包圍盒的全局跨度區(qū)間[scene—min,scene—max];3)如果是中間節(jié)點(diǎn),則通過分割片面將跨度區(qū)間分為[t—min,t—split]和[t—split,t—max]兩部分;4)如果光線的跨度區(qū)間橫跨分割片面的兩側(cè),說明該光線同時(shí)穿過兩個(gè)子包圍盒,則先和第一個(gè)子節(jié)點(diǎn)求交,并將第二個(gè)子節(jié)點(diǎn)壓人堆棧;5)否則,光線和相交的子節(jié)點(diǎn)求交;6)如果該節(jié)點(diǎn)是葉子節(jié)點(diǎn),光線和該葉子節(jié)點(diǎn)中的所有三角片求交,如果相交則返回交點(diǎn)坐標(biāo)和光線參數(shù)t;7)否則,將堆棧中的子節(jié)點(diǎn)彈出,返回2).scenerain圖4KD—tree的遍歷4實(shí)驗(yàn)結(jié)果及分析對(duì)3個(gè)復(fù)雜的場景進(jìn)行渲染:Robots、LivingRoom和Kitchen,如圖5所示.實(shí)驗(yàn)環(huán)境為:1)GPU卡采用Nivida公司的Geforce=4;3)光源數(shù)為點(diǎn)光源1個(gè).GTX260;2)每根光線的計(jì)算強(qiáng)度為光線遍歷深度圖5LivingRoom、Robots和Kitchen渲染場景萬方數(shù)據(jù)南京工程學(xué)院學(xué)報(bào)(自然科學(xué)版)2009年9月本文所指GPU上繪制速度,即并行算法所用的渲染時(shí)間,包括了初始光線在KD.tree上的求交時(shí)間、次級(jí)光線的計(jì)算時(shí)間開銷、各次級(jí)光線的求交時(shí)間、初級(jí)及各次級(jí)光線交點(diǎn)的光源可見性判斷開銷、初級(jí)及各次級(jí)光線交點(diǎn)的色彩計(jì)算時(shí)間開銷、各交點(diǎn)的紋理貼圖的時(shí)間等;而Daniel的并行算法中只包含求交運(yùn)算的時(shí)間,因此,本項(xiàng)目并行算法的實(shí)際求交速度要大于48.0Mrays/s.具體繪制速度見表l,算法效率比較見表2.表1不同分辨率、不同場景下光線跟蹤繪制速度表2算法并行效率比較每秒計(jì)算的光線數(shù)GPU跟蹤器Kitchen(Mmys/s)Robots5結(jié)語在Foley等人提出的KD-tree算法的基礎(chǔ)上,通過對(duì)光線跟蹤并行粒度的分析和設(shè)計(jì)。在GPU上實(shí)現(xiàn)了交互式光線跟蹤算法.在Geforce前,在l024×lGTX260上,圖像分辨率為512×512時(shí)場景處理速度約為15£/s.目024分辨率上尚未能達(dá)到實(shí)時(shí)交互的要求,主要瓶頸在于GPU與CPU之間的數(shù)據(jù)通信.這需要對(duì)算法進(jìn)行進(jìn)一步的改進(jìn)和并行粒度的優(yōu)化設(shè)計(jì).參考文獻(xiàn):[1]ANDREWSG.AnIntroductiontoRayTracing[M].London:AcademicrenderingusingPressLid.,1989.[2]BRUCEW,GEORGED,STEVENP.Interactivetherendercache[c]//ACMInternationalConferenceProceeding:10.Aire—la—Ville:Eure目mphicsAssociation.1999:235—2.46.[3】BRUCEW。GEORGED,DONALDPG.EnhancingandAire—la-Ville:EurographiesAssociation.2002:37—42.optimizingtherendercache[c]//ACMInternationalConferencePraceeding:28.[4]STEVENP。MICHAELP.InteractivePayTracingforLargeVolumeVisualization[c]//IEEETransactionsoncomputergraphicsandvisual.ization。2003.5:1—13.[5]INGOW.Real-timeRayTracingandInteractiveGlobalIllumination[D].Sarrland:SaarlandUniversity,2004.[6]FOLEYT,SUGERMANJ.KD.treeaccelerationstructuresfor8GPUraytracer[c]//ProceedingsoftheACMSIGGRAPH/EURO.GRAPHICSconferenceonGraphicshaldwal℃.NewYork:ACMPre∞.2005:15-22.modelfor[7】TURNERW.Animprovedilluminationshadeddisplay[J].CommunACM,1980,23(6):343—349.萬方數(shù)據(jù)第7卷第3期陸建勇,等:基于GPU交互式光線跟蹤算法的設(shè)計(jì)與實(shí)現(xiàn)67[8】INGOW,CARSTENB.Interactiverenderingwithcoherentmytracing[J].ComputerGraphicsFonnn。2001,20(3):153—164.[9】TIMOTHYJP,IANB,WILLIAMBM,eta1.RaytracingonprogrammablegraphicshuldwAl.e[J].ACMTmrmactionsonGrap
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 上海市延安中學(xué)2024-2025學(xué)年高三下學(xué)期2月練習(xí)數(shù)學(xué)試題(原卷版+解析版)
- 質(zhì)量管理制度職責(zé)程序的培訓(xùn)
- 部編版語文教學(xué)建議培訓(xùn)
- 蝦皮培訓(xùn)工作流程
- 2025年丙型肝炎抗原檢測(cè)試劑盒項(xiàng)目合作計(jì)劃書
- 未來賽車概念車試駕活動(dòng)行業(yè)深度調(diào)研及發(fā)展戰(zhàn)略咨詢報(bào)告
- 非機(jī)構(gòu)債券投資企業(yè)數(shù)字化轉(zhuǎn)型與智慧升級(jí)戰(zhàn)略研究報(bào)告
- 咖啡飲料批發(fā)企業(yè)縣域市場拓展與下沉戰(zhàn)略研究報(bào)告
- 物流設(shè)備企業(yè)縣域市場拓展與下沉戰(zhàn)略研究報(bào)告
- 樂器百貨企業(yè)ESG實(shí)踐與創(chuàng)新戰(zhàn)略研究報(bào)告
- 辦公用品供貨服務(wù)計(jì)劃方案
- DB37∕T 5107-2018 城鎮(zhèn)排水管道檢測(cè)與評(píng)估技術(shù)規(guī)程
- 2022新冠疫苗疑似預(yù)防接種異常反應(yīng)監(jiān)測(cè)和處置方案
- 酒精溶液體積濃度、質(zhì)量濃度與密度對(duì)照表
- 主要腸內(nèi)營養(yǎng)制劑成分比較
- 老年人各系統(tǒng)的老化改變
- 小學(xué)五年級(jí)綜合實(shí)踐課教案
- 煤礦井下供電常用計(jì)算公式及系數(shù)
- ISO14001:2015中文版(20211205141421)
- 汽車總裝車間板鏈輸送線的應(yīng)用研究
- 工作日志模板
評(píng)論
0/150
提交評(píng)論