(電子科學與技術專業(yè)論文)流體系結構存儲系統(tǒng)的設計實現(xiàn)及性能優(yōu)化研究.pdf_第1頁
(電子科學與技術專業(yè)論文)流體系結構存儲系統(tǒng)的設計實現(xiàn)及性能優(yōu)化研究.pdf_第2頁
(電子科學與技術專業(yè)論文)流體系結構存儲系統(tǒng)的設計實現(xiàn)及性能優(yōu)化研究.pdf_第3頁
(電子科學與技術專業(yè)論文)流體系結構存儲系統(tǒng)的設計實現(xiàn)及性能優(yōu)化研究.pdf_第4頁
(電子科學與技術專業(yè)論文)流體系結構存儲系統(tǒng)的設計實現(xiàn)及性能優(yōu)化研究.pdf_第5頁
已閱讀5頁,還剩117頁未讀 繼續(xù)免費閱讀

(電子科學與技術專業(yè)論文)流體系結構存儲系統(tǒng)的設計實現(xiàn)及性能優(yōu)化研究.pdf.pdf 免費下載

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

國防科學技術大學研究生院博十學1 1 :7 = 論文 流水訪問,有效提高了實際工作帶寬。 5 為了提高主存數(shù)據(jù)總線的有效周期利用率,提出了一種面向流應用的存儲 調度機制。這種機制針對流數(shù)據(jù)的組織特點,在讀寫數(shù)據(jù)通路上分別使用 一個支持流數(shù)據(jù)存儲模式的二維數(shù)據(jù)緩沖,使部分流數(shù)據(jù)訪存請求可以 進入緩沖并和其后的其他請求進行合并以最大限度地利用主存帶寬。 6 在對流應用訪存特性進行分析的基礎上,提出了一種基于流地址分析的 d r a m 頁策略。該策略通過統(tǒng)計等待訪存的請求的地址分布情況和分析 流數(shù)據(jù)訪存地址變化的規(guī)律,預測每個d r a m 體未來的訪問情況,并據(jù) 此選擇合適的時機對d r a m 體進行p r e c h a r g e 操作來加快訪問速度。 實驗結果表明,根據(jù)本文提出的設計思想和實現(xiàn)方法設計的流存儲系統(tǒng)以及 在此基礎上提出的優(yōu)化方法能有效地降低數(shù)據(jù)訪存時間,顯著地改善系統(tǒng)性能。 本文的研究成果為進一步提高流體系結構存儲系統(tǒng)的性能提供了理論依據(jù)和實踐 基礎。 主題詞:流體系結構,流存儲系統(tǒng),多級存儲層次,f t 6 4 ,s d r c a c h e ,數(shù) 據(jù)重用,流寄存器文件,虛擬全頻訪問,存儲調度,頁策略 第i i 頁 國防科學技術大學研究生院博士學位論文 a b s t r a c t w i t ht h ep o p u l a r i t yo fs t r e a ma p p l i c a t i o na n dt h ed e v e l o p m e n to fv l s it e c h n o l o g y , as e r i e so fc h a l l e n g e sh a v e b e e nc o n f r o n t e di nt h ef i e l do ft r a d i t i o n a lh i g h - p e r f o r m a n c e p r o c e s s o r a r c h i t e c t u r e s t r e a ma r c h i t e c t u r ei sas t r e a m a p p l i c a t i o n o r i e n t e d h i g h p e r f o r m a n c ep r o c e s s o ra r c h i t e c t u r e s t r e a ma r c h i t e c t u r ec a nf u l l ye x p l o i tt h e p a r a l l e l i s ma n dl o c a l i t yi ns t r e a ma p p l i c a t i o n ,w h i c hc a l lr e s u l ti nt h eh i g h - p e r f o r m a n c e s u p p o r tf o rs t r e a ma p p l i c a t i o n s t r e a ma r c h i t e c t u r eg e n e r a l l ya d o p t ss o f t w a r e m a n a g e ds t r e a mm e m o r ys y s t e m w h i c hi ss u p e r i o rt ot r a d i t i o n a lo n ew h e ni ti so r i e n t e dt os t r e a ma p p l i c a t i o n ,b u tt h e f u r t h e rr e s e a r c hc a r lr a r e l yb ef o u n di nt h ef i e l do fs t r e a mm e m o r ys y s t e m o nt h eb a s i s o fc h a r a c t e r i s t i c so fm e m o r ya c c e s si ns t r e a ma p p l i c a t i o na n dt h er e l e v a n tp r e v i o u s r e s e a r c ha c h i e v e m e n t s ,h o wt od e v e i o pm e m o r ya c c e s sm e c h a n i s ms u p p o r t i n gs t r e a m a p p l i c a t i o ne f f i c i e n t l yi s s t i l lc h a l l e n g i n g t b j sd i s s e r t a t i o nf o c u s e so nas e r i e so f r e s e a r c h e so ns t r e a mm e m o r ys y s t e mi ns t r e a ma r c h i t e c t u r e i nt h i sd i s s e r t a t i o n ,t h em a i nr e s e a r c ho b j e c ti ss t r e a mm e m o r ys y s t e mi ns t r e a m a r c h i t e c t u r e w ee x p l o r et h ee x i s t i n gr e s e a r c h e so ns t r e a mm e m o r ys y s t e mt h o r o u g h l y t h e nw ep r o p o s ean e wt h o u g h to fs t r e a mm e m o r ys y s t e m ,a n di m p l e m e n ti ti nf t 6 4 p r o c e s s o r f u r t h e r m o r e ,a c c o r d i n gt ot h ec h a r a c t e r i s t i c so fd a t aa c c e s s i ns t r e a m a p p l i c a t i o n s ,w ep r o p o s es e v e r a lo p t i m i z a t i o nt e c h n i q u e so fs t r e a mm e m o r ys y s t e m b a s e do nf t 6 4s t r e a mp r o c e s s o r 刀招m a i nc o n t r i b u t i o n si nt h i sd i s s e r t a t i o na r ea sf o l l o w s : 1 m e m o r ys y s t e m si nc u r r e n tc o m p u t e ra r c h i t e c t u r e sa r ea n a l y z e da n dr e l a t e d w o r k sa r ed i s c u s s e d f o c u s i n go nt h ea r c h i t e c t u r e sa n da c c e s sc h a r a c t e r i s t i c s o fh a r d w a r e m a n a g e dc a c h em e m o r ys y s t e ma n ds o f t w a r e - m a n a g e ds t r e a m m e m o r ys y s t e m ,w ea n a l y z et h ed i f f e r e n c e sb e t w e e nt h e mi nb a n d w i d t h r e q u i r e m e n t s ,l a t e n c yc o n c e a l i n g ,e n e r g ye m c i e n c ya n ds o f t w a r ec o m p l e x i t y 2 a i m i n ga tt h ea c c e s sc h a r a c t e r i s t i c so fr e p r e s e n t a t i v es t r e a ma p p l i c a t i o n s ,w e p r o p o s ean e wt h o u g h to fs t r e a mm e m o r ys y s t e ma n di m p l e m e n ti t i nt h e d e s i g no ff t 6 4p r o c e s s o r t h em e m o r ys y s t e mo ff t 6 4p r o c e s s o rc a nb e d i v i d e di n t ot h r e el e v e l s ,i ta d o p t sm e m o r yb a n d w i d t hm a t c h i n gd e s i g nt o i m p r o v ec o m p u t i n gp e r f o r m a n c ea n dt or e d u c eb a n d w i d t hd e m a n d i td i r e c t l y s u p p o r t s t h r e ea c c e s sa d d r e s sg e n e r a t i n gm o d e s :c o n s t a n ts t r i d e ,i n d e x e d ( s c a t t e r g a t h e r ) ,a n db i t - r e v e r s e d 3 a i m i n ga td a t ar e u s ei ns t r e a ma p p l i c a t i o n s ,w ep r o p o s eas t r e a md a t ar e u s e o r i e n t e ds d r - c a c h es t r u c t u r e ,a n do p t i m i z ei t sp e r f o r m a n c eb ya d o p t i n gf m b w r i t e d i r e c t l ya n dl i f e t i m es p e c u l a t i o nt e c h n i q u e s s d r - c a c h e c a l lr e a l i z et h e i t ra n di p c lr e u s eo fs t r e a m - l e v e ld a t ab yc a p t u r i n gt h e mw i t ht h eg u i d a n c e 第i i i 頁 國防科學技術大學研究生院博十學位論文 o fc o m p i l e r f i l l i n gc a c h ew i t ht h ec a c h e l i n e st h a tw i l lb et u l l ym o d l t m dc a n b ea v o i d e di fw eu s ef m bw r i t e d i r e c t l yt e c h n i q u e l i f e t i m es p e c u l a t i o n e n a b l e st h ec a c h et oi n v a l i d a t et h ed a t at h a tw o n tb eu s e da n y m o r ei n s t e a do f w r i t i n gt h e mb a c ki n t om e m o r y t h e s et e c h n i q u e sr e d u c e a c c e s sd e l a yi n m a n ys t r e a mp r o g r a m se v i d e n t l y 4 i nc u r r e n tc h i pd e s i g n ,s i n c et h eb i gc a p a c i t yo n 。c h i pm e m o r yc a no n l yb e h a l f - f r e q u e n c ya c c e s s e d ,w ep r o p o s eav i r t u a lf u l l f r e q u e n c ya c c e s sa p p r o a c h , w h i c hd i v i d e ss i n g l em e m o r ys t o r a g ei n t om a n yb a n k sc o n t r o l l e db yc l o c k s w i t hd i f f e r e n tp h a s e s l o w - b i ti n t e r l e a v e dd a t aa c c e s sm o d ea l l o w st h es t o r a g e t or e a l i z ef u l l f r e q u e n c yp i p e l i n e da c c e s s t h e nt h e e f f e c t i v eb a n d w i d t hi s i n c r e a s e d 5 t oe n h a n c et h ea v a i l a b l ec y c l eu t i l i z a t i o ne f f i c i e n c yo fm e m o r yd a t ab u s ,w e p r o p o s e as t r e a ma p p l i c a t i o no r i e n t e dm e m o r ys c h e d u l i n gm e c h a n i s m a c c o r d i n gt ot h ec h a r a c t e r i s t i c so fs t r e a md a t ao r g a n i z a t i o n ,t h em e c h a n i s m t a k e sf u l la d v a n t a g eo fm e m o r yb a n d w i d t hb yu s i n gat w o - d i m e n s i o n a ld a t a b u f f e rt oc o m b i n ea c c e s sr e q u e s t s 6 t h r o u g ht h ea n a l y s i so fa c c e s sc h a r a c t e r i s t i c s o fs t r e a ma p p l i c a t i o n s ,w e p r o p o s ead r a mp a g es t r a t e g y b a s e do ns t r e a ma d d r e s sa n a l y s i s b y r e c o r d i n ga n da n a l y z i n g t h ea d d r e s sd i s t r i b u t i o no fw a i t i n gr e q u e s t s ,t h e s t r a t e g yc a np r e d i c tt h ei n c o m i n ga c c e s ss i t u a t i o no fe a c hb a n k , t h e n e n a b l e d r a mb a n kt op r e c h a r g ea p p r o p r i a t e l y r e s u l t so fe x p e r i m e n t ss h o wt h a tt h ep r o p o s e ds t r e a mm e m o r ys y s t e md e s i g na n d r e l a t e do p t i m i z a t i o nm e c h a n i s m sc a nr e d u c ed a t aa c c e s sd e l a ye f f i c i e n t l y ,a n di m p r o v e s y s t e mp e r f o r m a n c ee v i d e n t l y t l i sd i s s e r t a t i o np r o v i d e sb o t ht h e o r e t i c a la n dp r a c t i c a l f o u n d a t i o n sf o rf u r t h e ri m p r o v e m e n to fs t r e a mm e m o r ys y s t e mp e r t b r m a n c e k e yw o r d s :s t r e a ma r c h i t e c t u r e ,s t r e a mm e m o r ys y s t e m ,m u l t i l e v e lm e m o r y h i e r a r c h y ,f t 6 4 ,s d r c a c h e ,d a t ar e u s e ,r e g i s t e rf i l e ,v i r t u a lf u l l - f r e q u e n c y a c c e s s ,m e m o r ys c h e d u l i n g ,p a g es t r a t e g y 一一一_-_- 第i v 頁 國防科學技術大學研究生院博士學能論文 表目錄 表1 1u c a 的訪問延時7 表3 1s r f 設計參數(shù)3 0 表3 2d r a m c 設計參數(shù)4 0 表3 3f t 6 4 處理器相對i t a n i u m 2 的性能加速比4 5 表4 1主機環(huán)境配置4 9 表4 2f t 6 4 軟件模擬器參數(shù)配置5 0 表6 1單端口s 刪引腳信號定義。6 9 表6 2s r a m 的延時參數(shù)定義7 0 表6 3 連續(xù)訪問請求為不同s b 發(fā)出時的地址沖突比例7 6 表7 1d d r 2s d r a m 不同猝發(fā)長度時的傳輸模式8 3 第v 頁 國防科學技術大學研究生院博十學位論文 圖目錄 圖1 1 共享和私有c a c h e 的結構6 圖1 2t 附p s 的存儲層次結構8 圖1 3 i m a g i n e 處理器的結構9 圖1 4c e l l 處理器的結構l o 圖1 5v i r a m 的存儲層次結構1 1 圖1 6s m a r tm e m o r y 處理器的結構1 l 圖2 1f t 6 4 體系結構硬件模型1 8 圖2 2f t 6 4 體系結構的兩級編譯過程2 2 圖3 1f t 6 4 處理器的存儲層次結構一2 3 圖3 2f t 6 4 處理器的總體結構2 6 圖3 3f t 6 4 處理器并行系統(tǒng)3 0 圖3 4s r f 的總體結構3l 圖3 5 流數(shù)據(jù)在s r f 和主存中的放置3 2 圖3 6 數(shù)據(jù)在s b 中的放置3 3 圖3 7s b 的仲裁算法示意圖3 4 圖3 8s r f 的訪問流水線3 5 圖3 9m s c 的總體結構3 6 圖3 1 0d 刪c 的總體結構4 0 圖3 1 l寄存器控制模塊的結構4 1 圖3 1 2 訪存控制模塊的結構4 2 圖3 1 3 接口模塊的結構4 3 圖3 1 4f t 6 4 處理器芯片及系統(tǒng)4 4 圖3 1 5 計算時間和訪存時間占程序總執(zhí)行時間的比例4 5 圖3 1 6l r f 和s r f 相對于主存的數(shù)據(jù)吞吐比4 6 圖4 1f t 6 4 處理器的應用開發(fā)環(huán)境4 7 圖4 2f t 6 4 處理器模擬器的結構4 8 圖5 1 加入s d r - c a c h e 后的處理器存儲結構圖5 7 圖5 2 讀取序列不同的流數(shù)據(jù)無法重用5 8 圖5 3讀取序列不同的流數(shù)據(jù)在s d r o c a c h e 中得到重用5 9 圖5 4 數(shù)據(jù)生產(chǎn)和消費的序列不同導致無法重用_ _ 5 9 圖5 5 生產(chǎn)和消費序列不同的數(shù)據(jù)在s d r c a c h e 中得到重用6 0 圖5 6 采用f m b 直寫技術后的c a c h e l i n e 狀態(tài)轉換6 l 第v i i 頁 國防科學技術大學研究生院博十學位論文 圖5 ,7 采用生存期預測技術后的c a c h e l i n e 狀態(tài)轉換6 2 圖5 8 訪存操作中數(shù)據(jù)重用類型的分布。6 3 圖5 9s t o r e 操作的類型分布圖6 4 圖5 1o訪存操作中無效操作的比例6 4 圖5 1 1使用s d r c a c h e 及優(yōu)化后的性能比較6 5 圖5 1 2 使用s d r c a c h e 并優(yōu)化后計算時間和訪存時間占總執(zhí)行時間的比例6 6 圖5 1 3s d r c a c h e 不同容量時的程序執(zhí)行時間對比6 7 圖5 1 4s d r - c a c h e 不同相聯(lián)度時的程序執(zhí)行時間對比6 7 圖6 1s r a m 的讀時序約束7 0 圖6 2s r a m 的寫時序約束7 0 圖6 3s r f 的訪問流水線7 l 圖6 4s r f 存儲體的訪問時序7 2 圖6 5v f f a 的實現(xiàn)機制7 3 圖6 6 使用v f f a 技術后的存儲體訪問時序。7 4 圖7 1m s c 訪存地址序列生成示例8 0 圖7 2 訪存地址序列的d ra m 總線波形8 0 圖7 3改進后的m s c 訪存通路和緩沖邏輯結構8 2 圖7 4 利用寫緩沖進行請求合并示例8 5 圖7 5 各個程序中記錄長度的統(tǒng)計8 6 圖7 6 存儲調度優(yōu)化后的主存有效周期利用率8 6 圖7 7 存儲調度優(yōu)化后的性能提高8 7 圖8 1d r a m 內部邏輯結構8 9 圖8 2 關頁策略下d r a m 讀訪問的狀態(tài)轉移及時序關系9 0 圖8 3開頁策略下d r a m 讀訪問的狀態(tài)轉移及時序關系9 1 圖8 4使用開頁策略時計算時間和訪存時間占總執(zhí)行時間的比例9 2 圖8 5具有地址遞增或遞減規(guī)律的訪存操作的比例9 3 圖8 6 訪存地址流分布特征9 3 圖8 7 使用基于流地址分析頁策略的d r a m c 結構9 4 圖8 8 單體控制器結構9 4 圖8 9 基于流地址分析的頁策略9 5 圖8 1 0 三種頁策略下的存儲操作c p i 9 6 圖8 1 1基于流地址分析的頁策略相對開頁策略的性能9 7 圖8 1 2 開頁策略中訪問類型的分布。9 7 圖8 1 3 基于流地址分析的頁策略中訪問類型的分布9 8 第v i i i 頁 國防科學技術大學研究生院幛十學何論文 圖8 1 4f t 6 4 處理器使用優(yōu)化技術前后的性能對比9 8 圖8 1 5f t 6 4 處理器使用優(yōu)化技術前后計算時間占總執(zhí)行時問的比例9 9 圖8 1 6f t 6 4 處理器使用優(yōu)化技術前后訪存時間占總執(zhí)行時間的比例9 9 第1 x 頁 國防科學技術大學研究生院博七學位論文 縮略語說明 a l u :a r i t h m e t i cl o g i cu n i t ,算術邏輯單元 a s i c - a p p l i c a t i o ns p e c i f i ci n t e g r a t e dc i r c u i t ,專用集成電路 b l t :b l o c kl e v e lt r a n s f e r ,塊傳輸 b s r :b a n ks t a t u sr e g i s t e r ,體狀念寄存器 c a m :c o n t e n t sa d d r e s s a b l em e m o r y ,內容尋址存儲器 c m o s :c o m p l e m e n t a r ym e t a lo x i d es e m i c o n d u c t o r ,互補金屬氧化物半導體 c p i :c y c l ep e ri n s t r u c t i o n ,每條指令執(zhí)行的時鐘周期數(shù) c p u :c e n t r a lp r o c e s s i n gu n i t ,中央處理器 d d r :d o u b l ed a t ar a t e ,雙倍數(shù)據(jù)傳輸率,在本文指雙倍數(shù)據(jù)傳輸率的d r a m 存儲器 d d r l :d i r t yd a t ar e u s el o a d ,臟數(shù)據(jù)重用l o a d d d r s :d i r t yd a t ar e u s es t o r e ,臟數(shù)據(jù)重用s t o r e d l p :d a t al e v e lp a r a l l e l ,數(shù)據(jù)級并行 d m a :d i r e c tm e m o r ya c c e s s ,直接存儲器存取 d r a m :d y n a m i cr a n d o ma c c e s sm e m o r y ,動態(tài)隨機存取存儲器 d r a m c :d r a mc o n t r o l l e r ,d ram 控制器 d s p :d i g i t a ls i g n a lp r o c e s s o r ,數(shù)字信號處理器 e d a :e l e c t r o n i cd e s i g na u t o m a t i c ,電子設計自動化 e i b :e l e m e n ti n t e r c o n n e c tb u s ,單元互連總線 f f t :f a s tf o u r i e rt r a n s f o r m ,快速傅立葉變換 f i f o :f i r s ti nf i r s to u t ,先入先出隊列 f l o p s :f l o a t i n gp o i n to p e r a t i o n sp e rs e c o n d ,每秒執(zhí)行的浮點操作數(shù) f m b :f u l l ym o d i f i e db l o c k ,完全修改模塊 f p g a :f i e l dp r o g r a m m a b l eg a t ea r r a y ,現(xiàn)場可編程門陣列 i b m :i n t e r n a t i o n a lb u s i n e s sm a c h i n ec o r p o r a t i o n ,國際商業(yè)機器公司 1 2 c :i n t e ri n t e g r a t e dc i r c u i t ,內部集成總線 i l p :i n s t r u c t i o nl e v e lp a r a l l e l ,指令級并行 i p c l :i r r e g u l a rp r o d u c e r - c o n s u m e rl o c a l i t y ,不規(guī)則的生產(chǎn)者消費者局部性 i t r :h - r e g u l a rt e m p o r a lr e s u e ,不規(guī)則的時間重用 i o :i n p u t o u t p u t ,輸入輸出 l l p :l i n kl e v e lp o r t ,鏈路層端口 第1 1 5 頁 國防科學技術大學研究生院博十學位論文 l r f :l o c a lr e g i s t e rf i l e ,局部寄存器文件 m a r :m e m o r ya d d r e s sr e g i s t e r ,存儲地址寄存器 m m x :m u l t im e d i ae x t e n s i o n s ,多媒體指令擴展 m s c :m e m o r y s c h e d u l ec o n t r o l l e r ,存儲調度控制器 m s c r :m e m o r ys t r e a mc o n t r o lr e g i s t e r ,存儲流控制寄存器 n l :n o r m a ll o a d ,正常載入 n s - n o r m a ls t o r e ,正常存儲 n u c a :n o n u n i f o r mc a c h ea c c e s s ,非一致訪問c a c h e n u m a :n o n u n i f o 衄m e m o r ya c c e s s ,非一致訪問存儲系統(tǒng) o a r :0 f f s e ta d d r e s sr e g i s t e r ,偏移地址寄存器 p i m p r o c e s s o ri nm e m o r y ,存儲器內處理器 p l l - p h a s e l o c k e dl o o p ,鎖相環(huán) p p e :p o w e rp r o c e s s i n ge l e m e n t ,主處理單元 r a w :r e a da f t e rw r i t e ,寫后讀 r i s c :r e d u c e di n s t r u c t i o ns e tc o m p u t i n g ,精簡指令集計算機 r p c l :r e g u l a rp r o d u c e r c o n s u m e rl o c a l i t y ,規(guī)則的生產(chǎn)者消費者局部性 r t r :r e g u l a rt e m p o r a lr e u s e ,規(guī)則的時間重用 s b - s t r e a mb u f f e r ,流緩沖 s c :s t r e a mc o n t r o l l e r ,流控制器 s c r :s t r e a mc o n t r o lr e g i s t e r ,流控制寄存器 s d r :s t r e a md e s c r i p t o rr e g i s t e r ,流描述符寄存器 s d r c a c h e :s t r e a md a t ar e u s ec a c h e ,流數(shù)據(jù)重用c a c h e s d r a m :s t a t i cd r a m ,靜態(tài)d 蝴 s i m d - s i n g l ei n s t r u c t i o nm u l t i p l ed a t a ,單指令流多數(shù)據(jù)流 s o c :s y s t e m o n c h i p ,片上系統(tǒng) s p e :s y n e r g i s t i cp r o c e s s i n ge l e m e n t ,協(xié)處理單元 s p s :s t r e a mp r o c e s ss y s t e m ,流處理系統(tǒng) s r f :s t r e a mr e g i s t e rf i l e ,流寄存器文件 s r a m :s t a t i cr a n d o ma c c e s sm e m o r y ,靜態(tài)隨機存取存儲器 s u n :s u nm i c r o s y s t e m s ,s u n 公司 t l p :t a s kl e v e lp a r a l l e l ,任務級并行 t ht e x a si n s t r u m e n t s ,德州儀器公司 u c a :u n i f o n nc a c h ea c c e s s ,一致性訪問c a c h e v f f a - v i r t u a lf u l l f r e q u e n c ya c c e s s ,虛擬全頻訪問 第11 6 頁 國防科學技術大學研究生院博十學位論文 v l i w :v e r yl o n gi n s t r u c t i o nw o r d ,超長指令字 v l s hv e r yl a r g es p e c i f i ci n t e g r a t e dc i r c u i t ,超大規(guī)模專用集成電路 w a r :w r i t ea f t e rr e a d ,讀后寫 z r a m - z e r oc a p a c i t o rr a m ,零電容的r a m 存儲位元 第11 7 頁 獨創(chuàng)性聲明 本人聲明所呈交的學位論文是我本人在導師指導下進行的研究工作及取得 的研究成果盡我所知,除了文中特別加以標注和致謝的地方外,論文中不包臺 其他人已經(jīng)發(fā)表和撰寫過的研究成果,也不包含為獲得國防科學披術大學戎烈i ,: 教育機構的學位或證書而使用過的利料。與我一同工作的同志對本研究所做的任 何貢獻均已在論文中作了明確的說明并表示謝意。 學位論文題目:速簽歪箜撿壺籃歪統(tǒng)鮑遮過塞堡丞蝗絲選絲墮窒 學位論文作者簽名:墨曼魚查日期:妒7 年f 2 月2 日 學位論文版權使用授權書 本人完全了解國防科學技術大學有關保留、使用學位論文的規(guī)定。本人授權 國防科學技術大學可以保留并時國家有關部門或機構送交論文的復印件和電子 文檔,允許論文被查閱和借閱;可以將學位論文的全部或部分內容編入有關數(shù)據(jù) 庫進行檢索,可以采用影印、縮印或掃描等復制手段保存、匯編學位論文 ( 保密學位論文在解密后適用本授權書。) 學位做作者簽名:墨塑魚日期:御7 日 日 f,吖, z 、) 月 月 z 乞 i 年 年 國防科學技術大學研究生院博士學位論文 第一章緒論 在國家8 6 3 高技術項目和國家自然科學基金項目的資助下,本文對流體系結 構存儲系統(tǒng)展開研究。 流體系結構是適應當前應用需求和v l s i 技術發(fā)展的一種面向流應用的高性 能處理器體系結構。流體系結構中的流存儲系統(tǒng)在面向流應用時顯現(xiàn)出比傳統(tǒng)體 系結構中的存儲系統(tǒng)更多的優(yōu)勢。 本文在深入研究當前新型體系結構存儲系統(tǒng)的基礎上提出了一種流存儲系統(tǒng) 設計思想,并在f t 6 4 處理器上設計實現(xiàn),接著面向流應用特點,提出了一系列流 存儲系統(tǒng)的性能優(yōu)化技術,為流體系結構的發(fā)展提供理論基礎和實踐依據(jù)。 1 1 1 流體系結構的產(chǎn)生 1 1 研究背景 1 1 1 1 應用對體系結構提出了新的要求 隨著科技的進步和計算技術的發(fā)展,流應用逐漸成為處理器的主要負載。流 應用主要分為兩類:一類是媒體應用,用來實時地處理音頻、視頻、靜態(tài)圖像及 其它數(shù)據(jù)密集型計算,典型的應用包括圖形圖像處理、視頻編碼解碼和信號處理 等;另一類是科學計算,主要用于科學模型的建立和模擬,典型的應用包括流體 力學、氣象、分子動力學、線形代數(shù)計算、有限元方法問題等【l 】【2 】。 流應用具有以下特點: 并行性:在流應用中存在很多數(shù)據(jù)級并行,流應用需要對大規(guī)模數(shù)據(jù)集合 中的每個元素執(zhí)行許多獨立的計算操作。流應用中還存在很多指令級并行 和任務級并行。 o 計算密集度:計算密集度是指計算操作的數(shù)量與片內外通信數(shù)據(jù)量的比 值。計算密集度決定了應用程序是受到訪存帶寬的限制還是受到計算資源 的限制。計算密集度與程序的局部性緊密相關。當局部性較高時,數(shù)據(jù)通 信就較少,計算密集度一般較高。流應用程序一般具有較高的計算密集度。 時間局部性:時間局部性可分為數(shù)據(jù)重用局部性和生產(chǎn)者一消費者局部 性。數(shù)據(jù)重用局部性是指多個計算對同一批數(shù)據(jù)的重用。生產(chǎn)者一消費者 局部性是指一個計算輸出的數(shù)據(jù)經(jīng)過一段時間后被另一個計算使用。通 常,流應用程序的時間局部性較強。 s t a n f o r d 大學的r i x n e r 對四個流應用( 深度萃取、視頻的編碼與解碼、多邊 第1 頁 國防科學技術大學研究生院博士學位論文 形的著色和矩陣的q r 分解) 【3 】的研究表明:深度萃取住卷積過濾與絕對值求和過 程中對每個訪存的數(shù)據(jù)進行了4 7 3 3 個算術操作,其它流應用的計算密集度在5 7 9 到1 5 5 3 之間。比較而言,在s p e c i n t 2 0 0 0 測試平臺上,傳統(tǒng)整數(shù)應用的算術計 算指令只占全部指令的2 5 0 ,而訪存指令占1 5 8 0 【4 】。這些差別說明,為傳 統(tǒng)整數(shù)計算而設計的體系結構( 例如通用處理器體系結構) 并不適合流應用,流 應用需要新的體系結構來充分發(fā)揮它的特點。 1 1 1 2v l s i 技術的發(fā)展對處理器體系結構的影響 隨著芯片特征尺寸的不斷縮小,單芯片能夠集成的晶體管的數(shù)量按照摩爾定 律不斷增長,這為單片計算性能的持續(xù)提高提供了可能。一個6 4 位浮點計算單元 在1 9 8 9 年工藝條件下所占的芯片面積約為2 0 m m 2 ,而在如今9 0 n m 工藝條件下所 占的芯片面積僅為o 5 m m 2 ,而一個面積為1 2 m m x l 2 m m 的芯片可以集成數(shù)百個浮 點計算單元【5 1 。 在當前芯片實現(xiàn)中,片外通信成為制約處理器性能的一個重要因素,也成為 處理器功耗的主要組成部分。從可用性和功耗的角度看,通信帶寬的耗費與連線 的長度至少為線性關系【6 】。由于芯片引腳的數(shù)量并沒有隨著v l s i 技術的進步而顯 著增加,片外通信的功耗也較大,這導致片內外通信的帶寬和功耗差距更加明顯。 因此,必須進一步開發(fā)程序的局部性來提高計算密集度和減少片外通信量,從而 獲得較好的性能和功耗結果。 雖然處理器的時鐘頻率隨著工藝的發(fā)展每年以1 7 的比例增長,但是片內和 片外長線的延時幾乎保持不變。為了獲得更高的性能,程序在執(zhí)行時必須能容忍 很長的訪問延時。由于d r a m 訪問需要數(shù)十個時鐘周期,延時容忍這個問題在 d r a m 訪問時更為重要。目前,延時容忍成為現(xiàn)代體系結構設計的一個重要考慮。 應用程序可以通過殲發(fā)局部性和并行性來緩解這個問題,局部性能縮短操作數(shù)傳 輸?shù)木嚯x從而降低延時,并行性能使數(shù)據(jù)訪問和數(shù)據(jù)計算并行執(zhí)行從而隱藏延時。 v l s i 技術的發(fā)展為單片處理器的性能極大提高提供了可能,但是獲得提高的 前提是在應用程序級能開發(fā)出更強的局部性和并行性。開發(fā)更強的并行性才能使 大量的計算單元處于工作狀態(tài);開發(fā)更強的局部性才能提高程序的計算密集度, 彌補大量功能單元所需數(shù)據(jù)帶寬和可用通信帶寬之間的差距;同時開發(fā)局部性和 并行性才能隱藏數(shù)據(jù)的訪問延時,獲得

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論