




已閱讀5頁,還剩117頁未讀, 繼續(xù)免費(fèi)閱讀
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
國(guó)防科學(xué)技術(shù)大學(xué)研究生院博十學(xué)1 1 :7 = 論文 流水訪問,有效提高了實(shí)際工作帶寬。 5 為了提高主存數(shù)據(jù)總線的有效周期利用率,提出了一種面向流應(yīng)用的存儲(chǔ) 調(diào)度機(jī)制。這種機(jī)制針對(duì)流數(shù)據(jù)的組織特點(diǎn),在讀寫數(shù)據(jù)通路上分別使用 一個(gè)支持流數(shù)據(jù)存儲(chǔ)模式的二維數(shù)據(jù)緩沖,使部分流數(shù)據(jù)訪存請(qǐng)求可以 進(jìn)入緩沖并和其后的其他請(qǐng)求進(jìn)行合并以最大限度地利用主存帶寬。 6 在對(duì)流應(yīng)用訪存特性進(jìn)行分析的基礎(chǔ)上,提出了一種基于流地址分析的 d r a m 頁策略。該策略通過統(tǒng)計(jì)等待訪存的請(qǐng)求的地址分布情況和分析 流數(shù)據(jù)訪存地址變化的規(guī)律,預(yù)測(cè)每個(gè)d r a m 體未來的訪問情況,并據(jù) 此選擇合適的時(shí)機(jī)對(duì)d r a m 體進(jìn)行p r e c h a r g e 操作來加快訪問速度。 實(shí)驗(yàn)結(jié)果表明,根據(jù)本文提出的設(shè)計(jì)思想和實(shí)現(xiàn)方法設(shè)計(jì)的流存儲(chǔ)系統(tǒng)以及 在此基礎(chǔ)上提出的優(yōu)化方法能有效地降低數(shù)據(jù)訪存時(shí)間,顯著地改善系統(tǒng)性能。 本文的研究成果為進(jìn)一步提高流體系結(jié)構(gòu)存儲(chǔ)系統(tǒng)的性能提供了理論依據(jù)和實(shí)踐 基礎(chǔ)。 主題詞:流體系結(jié)構(gòu),流存儲(chǔ)系統(tǒng),多級(jí)存儲(chǔ)層次,f t 6 4 ,s d r c a c h e ,數(shù) 據(jù)重用,流寄存器文件,虛擬全頻訪問,存儲(chǔ)調(diào)度,頁策略 第i i 頁 國(guó)防科學(xué)技術(shù)大學(xué)研究生院博士學(xué)位論文 a b s t r a c t w i t ht h ep o p u l a r i t yo fs t r e a ma p p l i c a t i o na n dt h ed e v e l o p m e n to fv l s it e c h n o l o g y , as e r i e so fc h a l l e n g e sh a v e b e e nc o n f r o n t e di nt h ef i e l do ft r a d i t i o n a lh i g h - p e r f o r m a n c e p r o c e s s o r a r c h i t e c t u r e s t r e a ma r c h i t e c t u r ei sas t r e a m a p p l i c a t i o n o r i e n t e d h i g h p e r f o r m a n c ep r o c e s s o ra r c h i t e c t u r e s t r e a ma r c h i t e c t u r ec a nf u l l ye x p l o i tt h e p a r a l l e l i s ma n dl o c a l i t yi ns t r e a ma p p l i c a t i o n ,w h i c hc a l lr e s u l ti nt h eh i g h - p e r f o r m a n c e s u p p o r tf o rs t r e a ma p p l i c a t i o n s t r e a ma r c h i t e c t u r eg e n e r a l l ya d o p t ss o f t w a r e m a n a g e ds t r e a mm e m o r ys y s t e m w h i c hi ss u p e r i o rt ot r a d i t i o n a lo n ew h e ni ti so r i e n t e dt os t r e a ma p p l i c a t i o n ,b u tt h e f u r t h e rr e s e a r c hc a r lr a r e l yb ef o u n di nt h ef i e l do fs t r e a mm e m o r ys y s t e m o nt h eb a s i s o fc h a r a c t e r i s t i c so fm e m o r ya c c e s si ns t r e a ma p p l i c a t i o na n dt h er e l e v a n tp r e v i o u s r e s e a r c ha c h i e v e m e n t s ,h o wt od e v e i o pm e m o r ya c c e s sm e c h a n i s ms u p p o r t i n gs t r e a m a p p l i c a t i o ne f f i c i e n t l yi s s t i l lc h a l l e n g i n g t b j sd i s s e r t a t i o nf o c u s e so nas e r i e so f r e s e a r c h e so ns t r e a mm e m o r ys y s t e mi ns t r e a ma r c h i t e c t u r e i nt h i sd i s s e r t a t i o n ,t h em a i nr e s e a r c ho b j e c ti ss t r e a mm e m o r ys y s t e mi ns t r e a m a r c h i t e c t u r e w ee x p l o r et h ee x i s t i n gr e s e a r c h e so ns t r e a mm e m o r ys y s t e mt h o r o u g h l y t h e nw ep r o p o s ean e wt h o u g h to fs t r e a mm e m o r ys y s t e m ,a n di m p l e m e n ti ti nf t 6 4 p r o c e s s o r f u r t h e r m o r e ,a c c o r d i n gt ot h ec h a r a c t e r i s t i c so fd a t aa c c e s s i ns t r e a m a p p l i c a t i o n s ,w ep r o p o s es e v e r a lo p t i m i z a t i o nt e c h n i q u e so fs t r e a mm e m o r ys y s t e m b a s e do nf t 6 4s t r e a mp r o c e s s o r 刀招m a i nc o n t r i b u t i o n si nt h i sd i s s e r t a t i o na r ea sf o l l o w s : 1 m e m o r ys y s t e m si nc u r r e n tc o m p u t e ra r c h i t e c t u r e sa r ea n a l y z e da n dr e l a t e d w o r k sa r ed i s c u s s e d f o c u s i n go nt h ea r c h i t e c t u r e sa n da c c e s sc h a r a c t e r i s t i c s o fh a r d w a r e m a n a g e dc a c h em e m o r ys y s t e ma n ds o f t w a r e - m a n a g e ds t r e a m m e m o r ys y s t e m ,w ea n a l y z et h ed i f f e r e n c e sb e t w e e nt h e mi nb a n d w i d t h r e q u i r e m e n t s ,l a t e n c yc o n c e a l i n g ,e n e r g ye m c i e n c ya n ds o f t w a r ec o m p l e x i t y 2 a i m i n ga tt h ea c c e s sc h a r a c t e r i s t i c so fr e p r e s e n t a t i v es t r e a ma p p l i c a t i o n s ,w e p r o p o s ean e wt h o u g h to fs t r e a mm e m o r ys y s t e ma n di m p l e m e n ti t i nt h e d e s i g no ff t 6 4p r o c e s s o r t h em e m o r ys y s t e mo ff t 6 4p r o c e s s o rc a nb e d i v i d e di n t ot h r e el e v e l s ,i ta d o p t sm e m o r yb a n d w i d t hm a t c h i n gd e s i g nt o i m p r o v ec o m p u t i n gp e r f o r m a n c ea n dt or e d u c eb a n d w i d t hd e m a n d i td i r e c t l y s u p p o r t s t h r e ea c c e s sa d d r e s sg e n e r a t i n gm o d e s :c o n s t a n ts t r i d e ,i n d e x e d ( s c a t t e r g a t h e r ) ,a n db i t - r e v e r s e d 3 a i m i n ga td a t ar e u s ei ns t r e a ma p p l i c a t i o n s ,w ep r o p o s eas t r e a md a t ar e u s e o r i e n t e ds d r - c a c h es t r u c t u r e ,a n do p t i m i z ei t sp e r f o r m a n c eb ya d o p t i n gf m b w r i t e d i r e c t l ya n dl i f e t i m es p e c u l a t i o nt e c h n i q u e s s d r - c a c h e c a l lr e a l i z et h e i t ra n di p c lr e u s eo fs t r e a m - l e v e ld a t ab yc a p t u r i n gt h e mw i t ht h eg u i d a n c e 第i i i 頁 國(guó)防科學(xué)技術(shù)大學(xué)研究生院博十學(xué)位論文 o fc o m p i l e r f i l l i n gc a c h ew i t ht h ec a c h e l i n e st h a tw i l lb et u l l ym o d l t m dc a n b ea v o i d e di fw eu s ef m bw r i t e d i r e c t l yt e c h n i q u e l i f e t i m es p e c u l a t i o n e n a b l e st h ec a c h et oi n v a l i d a t et h ed a t at h a tw o n tb eu s e da n y m o r ei n s t e a do f w r i t i n gt h e mb a c ki n t om e m o r y t h e s et e c h n i q u e sr e d u c e a c c e s sd e l a yi n m a n ys t r e a mp r o g r a m se v i d e n t l y 4 i nc u r r e n tc h i pd e s i g n ,s i n c et h eb i gc a p a c i t yo n 。c h i pm e m o r yc a no n l yb e h a l f - f r e q u e n c ya c c e s s e d ,w ep r o p o s eav i r t u a lf u l l f r e q u e n c ya c c e s sa p p r o a c h , w h i c hd i v i d e ss i n g l em e m o r ys t o r a g ei n t om a n yb a n k sc o n t r o l l e db yc l o c k s w i t hd i f f e r e n tp h a s e s l o w - b i ti n t e r l e a v e dd a t aa c c e s sm o d ea l l o w st h es t o r a g e t or e a l i z ef u l l f r e q u e n c yp i p e l i n e da c c e s s t h e nt h e e f f e c t i v eb a n d w i d t hi s i n c r e a s e d 5 t oe n h a n c et h ea v a i l a b l ec y c l eu t i l i z a t i o ne f f i c i e n c yo fm e m o r yd a t ab u s ,w e p r o p o s e as t r e a ma p p l i c a t i o no r i e n t e dm e m o r ys c h e d u l i n gm e c h a n i s m a c c o r d i n gt ot h ec h a r a c t e r i s t i c so fs t r e a md a t ao r g a n i z a t i o n ,t h em e c h a n i s m t a k e sf u l la d v a n t a g eo fm e m o r yb a n d w i d t hb yu s i n gat w o - d i m e n s i o n a ld a t a b u f f e rt oc o m b i n ea c c e s sr e q u e s t s 6 t h r o u g ht h ea n a l y s i so fa c c e s sc h a r a c t e r i s t i c s o fs t r e a ma p p l i c a t i o n s ,w e p r o p o s ead r a mp a g es t r a t e g y b a s e do ns t r e a ma d d r e s sa n a l y s i s b y r e c o r d i n ga n da n a l y z i n g t h ea d d r e s sd i s t r i b u t i o no fw a i t i n gr e q u e s t s ,t h e s t r a t e g yc a np r e d i c tt h ei n c o m i n ga c c e s ss i t u a t i o no fe a c hb a n k , t h e n e n a b l e d r a mb a n kt op r e c h a r g ea p p r o p r i a t e l y r e s u l t so fe x p e r i m e n t ss h o wt h a tt h ep r o p o s e ds t r e a mm e m o r ys y s t e md e s i g na n d r e l a t e do p t i m i z a t i o nm e c h a n i s m sc a nr e d u c ed a t aa c c e s sd e l a ye f f i c i e n t l y ,a n di m p r o v e s y s t e mp e r f o r m a n c ee v i d e n t l y t l i sd i s s e r t a t i o np r o v i d e sb o t ht h e o r e t i c a la n dp r a c t i c a l f o u n d a t i o n sf o rf u r t h e ri m p r o v e m e n to fs t r e a mm e m o r ys y s t e mp e r t b r m a n c e k e yw o r d s :s t r e a ma r c h i t e c t u r e ,s t r e a mm e m o r ys y s t e m ,m u l t i l e v e lm e m o r y h i e r a r c h y ,f t 6 4 ,s d r c a c h e ,d a t ar e u s e ,r e g i s t e rf i l e ,v i r t u a lf u l l - f r e q u e n c y a c c e s s ,m e m o r ys c h e d u l i n g ,p a g es t r a t e g y 一一一_-_- 第i v 頁 國(guó)防科學(xué)技術(shù)大學(xué)研究生院博士學(xué)能論文 表目錄 表1 1u c a 的訪問延時(shí)7 表3 1s r f 設(shè)計(jì)參數(shù)3 0 表3 2d r a m c 設(shè)計(jì)參數(shù)4 0 表3 3f t 6 4 處理器相對(duì)i t a n i u m 2 的性能加速比4 5 表4 1主機(jī)環(huán)境配置4 9 表4 2f t 6 4 軟件模擬器參數(shù)配置5 0 表6 1單端口s 刪引腳信號(hào)定義。6 9 表6 2s r a m 的延時(shí)參數(shù)定義7 0 表6 3 連續(xù)訪問請(qǐng)求為不同s b 發(fā)出時(shí)的地址沖突比例7 6 表7 1d d r 2s d r a m 不同猝發(fā)長(zhǎng)度時(shí)的傳輸模式8 3 第v 頁 國(guó)防科學(xué)技術(shù)大學(xué)研究生院博十學(xué)位論文 圖目錄 圖1 1 共享和私有c a c h e 的結(jié)構(gòu)6 圖1 2t 附p s 的存儲(chǔ)層次結(jié)構(gòu)8 圖1 3 i m a g i n e 處理器的結(jié)構(gòu)9 圖1 4c e l l 處理器的結(jié)構(gòu)l o 圖1 5v i r a m 的存儲(chǔ)層次結(jié)構(gòu)1 1 圖1 6s m a r tm e m o r y 處理器的結(jié)構(gòu)1 l 圖2 1f t 6 4 體系結(jié)構(gòu)硬件模型1 8 圖2 2f t 6 4 體系結(jié)構(gòu)的兩級(jí)編譯過程2 2 圖3 1f t 6 4 處理器的存儲(chǔ)層次結(jié)構(gòu)一2 3 圖3 2f t 6 4 處理器的總體結(jié)構(gòu)2 6 圖3 3f t 6 4 處理器并行系統(tǒng)3 0 圖3 4s r f 的總體結(jié)構(gòu)3l 圖3 5 流數(shù)據(jù)在s r f 和主存中的放置3 2 圖3 6 數(shù)據(jù)在s b 中的放置3 3 圖3 7s b 的仲裁算法示意圖3 4 圖3 8s r f 的訪問流水線3 5 圖3 9m s c 的總體結(jié)構(gòu)3 6 圖3 1 0d 刪c 的總體結(jié)構(gòu)4 0 圖3 1 l寄存器控制模塊的結(jié)構(gòu)4 1 圖3 1 2 訪存控制模塊的結(jié)構(gòu)4 2 圖3 1 3 接口模塊的結(jié)構(gòu)4 3 圖3 1 4f t 6 4 處理器芯片及系統(tǒng)4 4 圖3 1 5 計(jì)算時(shí)間和訪存時(shí)間占程序總執(zhí)行時(shí)間的比例4 5 圖3 1 6l r f 和s r f 相對(duì)于主存的數(shù)據(jù)吞吐比4 6 圖4 1f t 6 4 處理器的應(yīng)用開發(fā)環(huán)境4 7 圖4 2f t 6 4 處理器模擬器的結(jié)構(gòu)4 8 圖5 1 加入s d r - c a c h e 后的處理器存儲(chǔ)結(jié)構(gòu)圖5 7 圖5 2 讀取序列不同的流數(shù)據(jù)無法重用5 8 圖5 3讀取序列不同的流數(shù)據(jù)在s d r o c a c h e 中得到重用5 9 圖5 4 數(shù)據(jù)生產(chǎn)和消費(fèi)的序列不同導(dǎo)致無法重用_ _ 5 9 圖5 5 生產(chǎn)和消費(fèi)序列不同的數(shù)據(jù)在s d r c a c h e 中得到重用6 0 圖5 6 采用f m b 直寫技術(shù)后的c a c h e l i n e 狀態(tài)轉(zhuǎn)換6 l 第v i i 頁 國(guó)防科學(xué)技術(shù)大學(xué)研究生院博十學(xué)位論文 圖5 ,7 采用生存期預(yù)測(cè)技術(shù)后的c a c h e l i n e 狀態(tài)轉(zhuǎn)換6 2 圖5 8 訪存操作中數(shù)據(jù)重用類型的分布。6 3 圖5 9s t o r e 操作的類型分布圖6 4 圖5 1o訪存操作中無效操作的比例6 4 圖5 1 1使用s d r c a c h e 及優(yōu)化后的性能比較6 5 圖5 1 2 使用s d r c a c h e 并優(yōu)化后計(jì)算時(shí)間和訪存時(shí)間占總執(zhí)行時(shí)間的比例6 6 圖5 1 3s d r c a c h e 不同容量時(shí)的程序執(zhí)行時(shí)間對(duì)比6 7 圖5 1 4s d r - c a c h e 不同相聯(lián)度時(shí)的程序執(zhí)行時(shí)間對(duì)比6 7 圖6 1s r a m 的讀時(shí)序約束7 0 圖6 2s r a m 的寫時(shí)序約束7 0 圖6 3s r f 的訪問流水線7 l 圖6 4s r f 存儲(chǔ)體的訪問時(shí)序7 2 圖6 5v f f a 的實(shí)現(xiàn)機(jī)制7 3 圖6 6 使用v f f a 技術(shù)后的存儲(chǔ)體訪問時(shí)序。7 4 圖7 1m s c 訪存地址序列生成示例8 0 圖7 2 訪存地址序列的d ra m 總線波形8 0 圖7 3改進(jìn)后的m s c 訪存通路和緩沖邏輯結(jié)構(gòu)8 2 圖7 4 利用寫緩沖進(jìn)行請(qǐng)求合并示例8 5 圖7 5 各個(gè)程序中記錄長(zhǎng)度的統(tǒng)計(jì)8 6 圖7 6 存儲(chǔ)調(diào)度優(yōu)化后的主存有效周期利用率8 6 圖7 7 存儲(chǔ)調(diào)度優(yōu)化后的性能提高8 7 圖8 1d r a m 內(nèi)部邏輯結(jié)構(gòu)8 9 圖8 2 關(guān)頁策略下d r a m 讀訪問的狀態(tài)轉(zhuǎn)移及時(shí)序關(guān)系9 0 圖8 3開頁策略下d r a m 讀訪問的狀態(tài)轉(zhuǎn)移及時(shí)序關(guān)系9 1 圖8 4使用開頁策略時(shí)計(jì)算時(shí)間和訪存時(shí)間占總執(zhí)行時(shí)間的比例9 2 圖8 5具有地址遞增或遞減規(guī)律的訪存操作的比例9 3 圖8 6 訪存地址流分布特征9 3 圖8 7 使用基于流地址分析頁策略的d r a m c 結(jié)構(gòu)9 4 圖8 8 單體控制器結(jié)構(gòu)9 4 圖8 9 基于流地址分析的頁策略9 5 圖8 1 0 三種頁策略下的存儲(chǔ)操作c p i 9 6 圖8 1 1基于流地址分析的頁策略相對(duì)開頁策略的性能9 7 圖8 1 2 開頁策略中訪問類型的分布。9 7 圖8 1 3 基于流地址分析的頁策略中訪問類型的分布9 8 第v i i i 頁 國(guó)防科學(xué)技術(shù)大學(xué)研究生院幛十學(xué)何論文 圖8 1 4f t 6 4 處理器使用優(yōu)化技術(shù)前后的性能對(duì)比9 8 圖8 1 5f t 6 4 處理器使用優(yōu)化技術(shù)前后計(jì)算時(shí)間占總執(zhí)行時(shí)問的比例9 9 圖8 1 6f t 6 4 處理器使用優(yōu)化技術(shù)前后訪存時(shí)間占總執(zhí)行時(shí)間的比例9 9 第1 x 頁 國(guó)防科學(xué)技術(shù)大學(xué)研究生院博七學(xué)位論文 縮略語說明 a l u :a r i t h m e t i cl o g i cu n i t ,算術(shù)邏輯單元 a s i c - a p p l i c a t i o ns p e c i f i ci n t e g r a t e dc i r c u i t ,專用集成電路 b l t :b l o c kl e v e lt r a n s f e r ,塊傳輸 b s r :b a n ks t a t u sr e g i s t e r ,體狀念寄存器 c a m :c o n t e n t sa d d r e s s a b l em e m o r y ,內(nèi)容尋址存儲(chǔ)器 c m o s :c o m p l e m e n t a r ym e t a lo x i d es e m i c o n d u c t o r ,互補(bǔ)金屬氧化物半導(dǎo)體 c p i :c y c l ep e ri n s t r u c t i o n ,每條指令執(zhí)行的時(shí)鐘周期數(shù) c p u :c e n t r a lp r o c e s s i n gu n i t ,中央處理器 d d r :d o u b l ed a t ar a t e ,雙倍數(shù)據(jù)傳輸率,在本文指雙倍數(shù)據(jù)傳輸率的d r a m 存儲(chǔ)器 d d r l :d i r t yd a t ar e u s el o a d ,臟數(shù)據(jù)重用l o a d d d r s :d i r t yd a t ar e u s es t o r e ,臟數(shù)據(jù)重用s t o r e d l p :d a t al e v e lp a r a l l e l ,數(shù)據(jù)級(jí)并行 d m a :d i r e c tm e m o r ya c c e s s ,直接存儲(chǔ)器存取 d r a m :d y n a m i cr a n d o ma c c e s sm e m o r y ,動(dòng)態(tài)隨機(jī)存取存儲(chǔ)器 d r a m c :d r a mc o n t r o l l e r ,d ram 控制器 d s p :d i g i t a ls i g n a lp r o c e s s o r ,數(shù)字信號(hào)處理器 e d a :e l e c t r o n i cd e s i g na u t o m a t i c ,電子設(shè)計(jì)自動(dòng)化 e i b :e l e m e n ti n t e r c o n n e c tb u s ,單元互連總線 f f t :f a s tf o u r i e rt r a n s f o r m ,快速傅立葉變換 f i f o :f i r s ti nf i r s to u t ,先入先出隊(duì)列 f l o p s :f l o a t i n gp o i n to p e r a t i o n sp e rs e c o n d ,每秒執(zhí)行的浮點(diǎn)操作數(shù) f m b :f u l l ym o d i f i e db l o c k ,完全修改模塊 f p g a :f i e l dp r o g r a m m a b l eg a t ea r r a y ,現(xiàn)場(chǎng)可編程門陣列 i b m :i n t e r n a t i o n a lb u s i n e s sm a c h i n ec o r p o r a t i o n ,國(guó)際商業(yè)機(jī)器公司 1 2 c :i n t e ri n t e g r a t e dc i r c u i t ,內(nèi)部集成總線 i l p :i n s t r u c t i o nl e v e lp a r a l l e l ,指令級(jí)并行 i p c l :i r r e g u l a rp r o d u c e r - c o n s u m e rl o c a l i t y ,不規(guī)則的生產(chǎn)者消費(fèi)者局部性 i t r :h - r e g u l a rt e m p o r a lr e s u e ,不規(guī)則的時(shí)間重用 i o :i n p u t o u t p u t ,輸入輸出 l l p :l i n kl e v e lp o r t ,鏈路層端口 第1 1 5 頁 國(guó)防科學(xué)技術(shù)大學(xué)研究生院博十學(xué)位論文 l r f :l o c a lr e g i s t e rf i l e ,局部寄存器文件 m a r :m e m o r ya d d r e s sr e g i s t e r ,存儲(chǔ)地址寄存器 m m x :m u l t im e d i ae x t e n s i o n s ,多媒體指令擴(kuò)展 m s c :m e m o r y s c h e d u l ec o n t r o l l e r ,存儲(chǔ)調(diào)度控制器 m s c r :m e m o r ys t r e a mc o n t r o lr e g i s t e r ,存儲(chǔ)流控制寄存器 n l :n o r m a ll o a d ,正常載入 n s - n o r m a ls t o r e ,正常存儲(chǔ) n u c a :n o n u n i f o r mc a c h ea c c e s s ,非一致訪問c a c h e n u m a :n o n u n i f o 衄m e m o r ya c c e s s ,非一致訪問存儲(chǔ)系統(tǒng) o a r :0 f f s e ta d d r e s sr e g i s t e r ,偏移地址寄存器 p i m p r o c e s s o ri nm e m o r y ,存儲(chǔ)器內(nèi)處理器 p l l - p h a s e l o c k e dl o o p ,鎖相環(huán) p p e :p o w e rp r o c e s s i n ge l e m e n t ,主處理單元 r a w :r e a da f t e rw r i t e ,寫后讀 r i s c :r e d u c e di n s t r u c t i o ns e tc o m p u t i n g ,精簡(jiǎn)指令集計(jì)算機(jī) r p c l :r e g u l a rp r o d u c e r c o n s u m e rl o c a l i t y ,規(guī)則的生產(chǎn)者消費(fèi)者局部性 r t r :r e g u l a rt e m p o r a lr e u s e ,規(guī)則的時(shí)間重用 s b - s t r e a mb u f f e r ,流緩沖 s c :s t r e a mc o n t r o l l e r ,流控制器 s c r :s t r e a mc o n t r o lr e g i s t e r ,流控制寄存器 s d r :s t r e a md e s c r i p t o rr e g i s t e r ,流描述符寄存器 s d r c a c h e :s t r e a md a t ar e u s ec a c h e ,流數(shù)據(jù)重用c a c h e s d r a m :s t a t i cd r a m ,靜態(tài)d 蝴 s i m d - s i n g l ei n s t r u c t i o nm u l t i p l ed a t a ,單指令流多數(shù)據(jù)流 s o c :s y s t e m o n c h i p ,片上系統(tǒng) s p e :s y n e r g i s t i cp r o c e s s i n ge l e m e n t ,協(xié)處理單元 s p s :s t r e a mp r o c e s ss y s t e m ,流處理系統(tǒng) s r f :s t r e a mr e g i s t e rf i l e ,流寄存器文件 s r a m :s t a t i cr a n d o ma c c e s sm e m o r y ,靜態(tài)隨機(jī)存取存儲(chǔ)器 s u n :s u nm i c r o s y s t e m s ,s u n 公司 t l p :t a s kl e v e lp a r a l l e l ,任務(wù)級(jí)并行 t ht e x a si n s t r u m e n t s ,德州儀器公司 u c a :u n i f o n nc a c h ea c c e s s ,一致性訪問c a c h e v f f a - v i r t u a lf u l l f r e q u e n c ya c c e s s ,虛擬全頻訪問 第11 6 頁 國(guó)防科學(xué)技術(shù)大學(xué)研究生院博十學(xué)位論文 v l i w :v e r yl o n gi n s t r u c t i o nw o r d ,超長(zhǎng)指令字 v l s hv e r yl a r g es p e c i f i ci n t e g r a t e dc i r c u i t ,超大規(guī)模專用集成電路 w a r :w r i t ea f t e rr e a d ,讀后寫 z r a m - z e r oc a p a c i t o rr a m ,零電容的r a m 存儲(chǔ)位元 第11 7 頁 獨(dú)創(chuàng)性聲明 本人聲明所呈交的學(xué)位論文是我本人在導(dǎo)師指導(dǎo)下進(jìn)行的研究工作及取得 的研究成果盡我所知,除了文中特別加以標(biāo)注和致謝的地方外,論文中不包臺(tái) 其他人已經(jīng)發(fā)表和撰寫過的研究成果,也不包含為獲得國(guó)防科學(xué)披術(shù)大學(xué)戎烈i ,: 教育機(jī)構(gòu)的學(xué)位或證書而使用過的利料。與我一同工作的同志對(duì)本研究所做的任 何貢獻(xiàn)均已在論文中作了明確的說明并表示謝意。 學(xué)位論文題目:速簽歪箜撿壺籃歪統(tǒng)鮑遮過塞堡丞蝗絲選絲墮窒 學(xué)位論文作者簽名:墨曼魚查日期:妒7 年f 2 月2 日 學(xué)位論文版權(quán)使用授權(quán)書 本人完全了解國(guó)防科學(xué)技術(shù)大學(xué)有關(guān)保留、使用學(xué)位論文的規(guī)定。本人授權(quán) 國(guó)防科學(xué)技術(shù)大學(xué)可以保留并時(shí)國(guó)家有關(guān)部門或機(jī)構(gòu)送交論文的復(fù)印件和電子 文檔,允許論文被查閱和借閱;可以將學(xué)位論文的全部或部分內(nèi)容編入有關(guān)數(shù)據(jù) 庫進(jìn)行檢索,可以采用影印、縮印或掃描等復(fù)制手段保存、匯編學(xué)位論文 ( 保密學(xué)位論文在解密后適用本授權(quán)書。) 學(xué)位做作者簽名:墨塑魚日期:御7 日 日 f,吖, z 、) 月 月 z 乞 i 年 年 國(guó)防科學(xué)技術(shù)大學(xué)研究生院博士學(xué)位論文 第一章緒論 在國(guó)家8 6 3 高技術(shù)項(xiàng)目和國(guó)家自然科學(xué)基金項(xiàng)目的資助下,本文對(duì)流體系結(jié) 構(gòu)存儲(chǔ)系統(tǒng)展開研究。 流體系結(jié)構(gòu)是適應(yīng)當(dāng)前應(yīng)用需求和v l s i 技術(shù)發(fā)展的一種面向流應(yīng)用的高性 能處理器體系結(jié)構(gòu)。流體系結(jié)構(gòu)中的流存儲(chǔ)系統(tǒng)在面向流應(yīng)用時(shí)顯現(xiàn)出比傳統(tǒng)體 系結(jié)構(gòu)中的存儲(chǔ)系統(tǒng)更多的優(yōu)勢(shì)。 本文在深入研究當(dāng)前新型體系結(jié)構(gòu)存儲(chǔ)系統(tǒng)的基礎(chǔ)上提出了一種流存儲(chǔ)系統(tǒng) 設(shè)計(jì)思想,并在f t 6 4 處理器上設(shè)計(jì)實(shí)現(xiàn),接著面向流應(yīng)用特點(diǎn),提出了一系列流 存儲(chǔ)系統(tǒng)的性能優(yōu)化技術(shù),為流體系結(jié)構(gòu)的發(fā)展提供理論基礎(chǔ)和實(shí)踐依據(jù)。 1 1 1 流體系結(jié)構(gòu)的產(chǎn)生 1 1 研究背景 1 1 1 1 應(yīng)用對(duì)體系結(jié)構(gòu)提出了新的要求 隨著科技的進(jìn)步和計(jì)算技術(shù)的發(fā)展,流應(yīng)用逐漸成為處理器的主要負(fù)載。流 應(yīng)用主要分為兩類:一類是媒體應(yīng)用,用來實(shí)時(shí)地處理音頻、視頻、靜態(tài)圖像及 其它數(shù)據(jù)密集型計(jì)算,典型的應(yīng)用包括圖形圖像處理、視頻編碼解碼和信號(hào)處理 等;另一類是科學(xué)計(jì)算,主要用于科學(xué)模型的建立和模擬,典型的應(yīng)用包括流體 力學(xué)、氣象、分子動(dòng)力學(xué)、線形代數(shù)計(jì)算、有限元方法問題等【l 】【2 】。 流應(yīng)用具有以下特點(diǎn): 并行性:在流應(yīng)用中存在很多數(shù)據(jù)級(jí)并行,流應(yīng)用需要對(duì)大規(guī)模數(shù)據(jù)集合 中的每個(gè)元素執(zhí)行許多獨(dú)立的計(jì)算操作。流應(yīng)用中還存在很多指令級(jí)并行 和任務(wù)級(jí)并行。 o 計(jì)算密集度:計(jì)算密集度是指計(jì)算操作的數(shù)量與片內(nèi)外通信數(shù)據(jù)量的比 值。計(jì)算密集度決定了應(yīng)用程序是受到訪存帶寬的限制還是受到計(jì)算資源 的限制。計(jì)算密集度與程序的局部性緊密相關(guān)。當(dāng)局部性較高時(shí),數(shù)據(jù)通 信就較少,計(jì)算密集度一般較高。流應(yīng)用程序一般具有較高的計(jì)算密集度。 時(shí)間局部性:時(shí)間局部性可分為數(shù)據(jù)重用局部性和生產(chǎn)者一消費(fèi)者局部 性。數(shù)據(jù)重用局部性是指多個(gè)計(jì)算對(duì)同一批數(shù)據(jù)的重用。生產(chǎn)者一消費(fèi)者 局部性是指一個(gè)計(jì)算輸出的數(shù)據(jù)經(jīng)過一段時(shí)間后被另一個(gè)計(jì)算使用。通 常,流應(yīng)用程序的時(shí)間局部性較強(qiáng)。 s t a n f o r d 大學(xué)的r i x n e r 對(duì)四個(gè)流應(yīng)用( 深度萃取、視頻的編碼與解碼、多邊 第1 頁 國(guó)防科學(xué)技術(shù)大學(xué)研究生院博士學(xué)位論文 形的著色和矩陣的q r 分解) 【3 】的研究表明:深度萃取住卷積過濾與絕對(duì)值求和過 程中對(duì)每個(gè)訪存的數(shù)據(jù)進(jìn)行了4 7 3 3 個(gè)算術(shù)操作,其它流應(yīng)用的計(jì)算密集度在5 7 9 到1 5 5 3 之間。比較而言,在s p e c i n t 2 0 0 0 測(cè)試平臺(tái)上,傳統(tǒng)整數(shù)應(yīng)用的算術(shù)計(jì) 算指令只占全部指令的2 5 0 ,而訪存指令占1 5 8 0 【4 】。這些差別說明,為傳 統(tǒng)整數(shù)計(jì)算而設(shè)計(jì)的體系結(jié)構(gòu)( 例如通用處理器體系結(jié)構(gòu)) 并不適合流應(yīng)用,流 應(yīng)用需要新的體系結(jié)構(gòu)來充分發(fā)揮它的特點(diǎn)。 1 1 1 2v l s i 技術(shù)的發(fā)展對(duì)處理器體系結(jié)構(gòu)的影響 隨著芯片特征尺寸的不斷縮小,單芯片能夠集成的晶體管的數(shù)量按照摩爾定 律不斷增長(zhǎng),這為單片計(jì)算性能的持續(xù)提高提供了可能。一個(gè)6 4 位浮點(diǎn)計(jì)算單元 在1 9 8 9 年工藝條件下所占的芯片面積約為2 0 m m 2 ,而在如今9 0 n m 工藝條件下所 占的芯片面積僅為o 5 m m 2 ,而一個(gè)面積為1 2 m m x l 2 m m 的芯片可以集成數(shù)百個(gè)浮 點(diǎn)計(jì)算單元【5 1 。 在當(dāng)前芯片實(shí)現(xiàn)中,片外通信成為制約處理器性能的一個(gè)重要因素,也成為 處理器功耗的主要組成部分。從可用性和功耗的角度看,通信帶寬的耗費(fèi)與連線 的長(zhǎng)度至少為線性關(guān)系【6 】。由于芯片引腳的數(shù)量并沒有隨著v l s i 技術(shù)的進(jìn)步而顯 著增加,片外通信的功耗也較大,這導(dǎo)致片內(nèi)外通信的帶寬和功耗差距更加明顯。 因此,必須進(jìn)一步開發(fā)程序的局部性來提高計(jì)算密集度和減少片外通信量,從而 獲得較好的性能和功耗結(jié)果。 雖然處理器的時(shí)鐘頻率隨著工藝的發(fā)展每年以1 7 的比例增長(zhǎng),但是片內(nèi)和 片外長(zhǎng)線的延時(shí)幾乎保持不變。為了獲得更高的性能,程序在執(zhí)行時(shí)必須能容忍 很長(zhǎng)的訪問延時(shí)。由于d r a m 訪問需要數(shù)十個(gè)時(shí)鐘周期,延時(shí)容忍這個(gè)問題在 d r a m 訪問時(shí)更為重要。目前,延時(shí)容忍成為現(xiàn)代體系結(jié)構(gòu)設(shè)計(jì)的一個(gè)重要考慮。 應(yīng)用程序可以通過殲發(fā)局部性和并行性來緩解這個(gè)問題,局部性能縮短操作數(shù)傳 輸?shù)木嚯x從而降低延時(shí),并行性能使數(shù)據(jù)訪問和數(shù)據(jù)計(jì)算并行執(zhí)行從而隱藏延時(shí)。 v l s i 技術(shù)的發(fā)展為單片處理器的性能極大提高提供了可能,但是獲得提高的 前提是在應(yīng)用程序級(jí)能開發(fā)出更強(qiáng)的局部性和并行性。開發(fā)更強(qiáng)的并行性才能使 大量的計(jì)算單元處于工作狀態(tài);開發(fā)更強(qiáng)的局部性才能提高程序的計(jì)算密集度, 彌補(bǔ)大量功能單元所需數(shù)據(jù)帶寬和可用通信帶寬之間的差距;同時(shí)開發(fā)局部性和 并行性才能隱藏?cái)?shù)據(jù)的訪問延時(shí),獲得
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 水利水電工程項(xiàng)目管理相關(guān)考題試題及答案
- 2025年中級(jí)經(jīng)濟(jì)師考試復(fù)習(xí)中的時(shí)間節(jié)點(diǎn)設(shè)定與試題及答案
- 企業(yè)財(cái)務(wù)風(fēng)險(xiǎn)管理補(bǔ)充協(xié)議
- 基因編輯技術(shù)數(shù)據(jù)獨(dú)占授權(quán)合同
- 股權(quán)激勵(lì)計(jì)劃績(jī)效評(píng)估及合作協(xié)議書
- 工程項(xiàng)目管理人際關(guān)系試題及答案
- 掌握2025年公文寫作技巧的試題及答案
- 工程項(xiàng)目背景與需求分析的流程試題及答案
- 工程經(jīng)濟(jì)案例分享試題及答案
- 工業(yè)互聯(lián)網(wǎng)平臺(tái)云計(jì)算資源動(dòng)態(tài)分配在智能教育資源共享中的應(yīng)用報(bào)告
- 2025年中級(jí)會(huì)計(jì)師考試試卷及答案
- 2025年入團(tuán)考試知識(shí)點(diǎn)概述與試題及答案
- 2025屆高三下學(xué)期5月青桐鳴大聯(lián)考 英語試卷+答案
- 2025年鑄造工(技師)職業(yè)技能鑒定理論考試題庫(含答案)
- 演出服裝定制合同協(xié)議
- 計(jì)劃生育選擇試題及答案
- 法律文化-形考作業(yè)3-國(guó)開(ZJ)-參考資料
- 分子生物學(xué)基本概念的考核試題及答案
- 2025-2030中國(guó)鈦酸鋰行業(yè)競(jìng)爭(zhēng)分析及發(fā)展前景研究報(bào)告
- 家校共育“心”模式:青少年心理健康教育家長(zhǎng)會(huì)
- 形勢(shì)與政策(貴州財(cái)經(jīng)大學(xué))知到智慧樹章節(jié)答案
評(píng)論
0/150
提交評(píng)論