(微電子學與固體電子學專業(yè)論文)嵌入式高精度浮點協(xié)處理器設計.pdf_第1頁
(微電子學與固體電子學專業(yè)論文)嵌入式高精度浮點協(xié)處理器設計.pdf_第2頁
(微電子學與固體電子學專業(yè)論文)嵌入式高精度浮點協(xié)處理器設計.pdf_第3頁
(微電子學與固體電子學專業(yè)論文)嵌入式高精度浮點協(xié)處理器設計.pdf_第4頁
(微電子學與固體電子學專業(yè)論文)嵌入式高精度浮點協(xié)處理器設計.pdf_第5頁
已閱讀5頁,還剩111頁未讀 繼續(xù)免費閱讀

(微電子學與固體電子學專業(yè)論文)嵌入式高精度浮點協(xié)處理器設計.pdf.pdf 免費下載

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

論文原創(chuàng)性和授權使用聲明 本人聲明所呈交的學位論文,是本人在導師指導下進行研究工 作所取得的成果。除已特別加以標注和致謝的地方外,論文中不包 含任何他人已經發(fā)表或撰寫過的研究成果。與我一同工作的同志對 本研究所做的貢獻均已在論文中作了明確的說明。 本人授權中國科學技術大學擁有學位論文的部分使用權,即: 學校有權按有關規(guī)定向國家有關部門或機構送交論文的復印件和電 子版,允許論文被查閱和借閱,可以將學位論文編入有關數(shù)據(jù)庫進 行檢索,可以采用影印、縮印或掃描等復制手段保存、匯編學位論 文。 保密的學位論文在解密后也遵守此規(guī)定。 作者簽名:蘭墜毳 z d 多年籮月多汐日 2 0 0 8 年 中國科學技術大學碩士學位論文 摘要 浮點運算是高精度的運算方式,主要應用在科學和多媒體計算中。浮點運算 能力是關系到c p u 的多媒體、3 d 圖形處理的一個重要指標。相對于定點運算來 說,不具備浮點運算單元的主c p u 所從事的浮點運算,都是在許可范圍內盡可 能逼近的近似值。隨著多媒體和互聯(lián)網的高速發(fā)展,更高性能的精確計算對嵌入 式c p u 的浮點運算能力提出更高的要求。雖然一些軟件庫被開發(fā)出來暫時解決 浮點計算問題,但是軟件級別的模擬速度較慢,不能滿足一些嵌入式系統(tǒng)的實時 性要求,因此需要設計一種硬件結構來滿足嵌入式領域的浮點運算需求。 本文給出一種兼容i e e e 7 5 4 標準的嵌入式高性能浮點協(xié)處理器- v f p 的 設計與實現(xiàn)方法。該協(xié)處理器通過主處理器提供的外部協(xié)處理器接口同主處理器 連接,支持浮點標量和向量操作,能夠通過硬件高速執(zhí)行符合i e e e 7 5 4 標準單 精度、雙精度的加、減、乘、除、乘加、平方根等運算,支持從浮點到整字的轉 換,具有分立的6 4 位高帶寬的l o 融t o r e 總線。 使用該協(xié)處理器的嵌入式協(xié)處理器可以得到多方面的性能提高:v f p 可以在 浮點運算方面提高汽車的性能,包括在對精確性和可預測性要求較高的機械傳動 和車體控制應用,汽車中的機械傳動、a b s 系統(tǒng)、牽引控制、靈活性背負系統(tǒng) 等關鍵應用;圖像應用如比例縮放、印刷中的字形產生、3 d 轉換、f f t 、圖形 過濾等;下一代消費產品如網絡應用產品、網關和機項盒可以直接受益于v f p , 等等。 該協(xié)處理器使用自頂向下的基于系統(tǒng)級算法的快速成型設計流程。首先確定 系統(tǒng)的設計目標和關鍵性能參數(shù)。然后在系統(tǒng)級設計階段確定系統(tǒng)流水線劃分和 各運算實現(xiàn)算法,并進行有效性評估及優(yōu)化。進一步在r t l 級設計通過改變底 層實現(xiàn)進行性能優(yōu)化。最終得到符合要求的設計。 本設計著眼于嵌入式的應用領域,力求做到性能和功耗、面積代價的權衡。 該設計的技術特點如下: 數(shù)據(jù)通路上,使用改進的浮點乘累加數(shù)據(jù)通路和浮點單雙精度乘法的舍入 方法,提供完全真正意義上的符合i e e e 7 5 4 舍入標準的乘累加運算,縮短了流 2 0 0 8 年中國科學技術大學碩士學位論文 水線關鍵路徑,減少芯片面積代價。使用改進的恒定周期的迭代算法實現(xiàn)了除法 和開方的復用設計,減少了面積代價,降低了系統(tǒng)功耗。使用分立的l o a 彤s t o r e 總線和主處理器交換數(shù)據(jù),去除了影響系統(tǒng)數(shù)據(jù)吞吐率的性能瓶頸。 流水線技術上,使用共發(fā)射的兩條獨立數(shù)據(jù)處理流水線。使用適合嵌入式設 計的簡化的記分牌技術來解決系統(tǒng)的數(shù)據(jù)和資源沖突,實現(xiàn)不同流水線指令的亂 序執(zhí)行。使用提交隊列保證指令的順序提交。使用緩沖隊列減少寄存器堆的端口, 使用分立迭代單元的方法實現(xiàn)浮點向量迭代運算操作。使用預測技術實現(xiàn)適合嵌 入式的非精確浮點異常處理,給出完全符合i e e e 7 5 4 標準規(guī)定的異常處理結果。 本文的創(chuàng)新之處在于使用改進的浮點乘累加數(shù)據(jù)通路和浮點單雙精度乘法 的舍入方法,提供完全真正意義上的符合i e e e 7 5 4 舍入標準的乘累加運算,縮 短了流水線關鍵路徑,減少芯片面積代價。使用改進的恒定周期的迭代算法實現(xiàn) 了除法和開方的復用設計,減少了面積代價,降低了系統(tǒng)功耗。使用緩沖隊列減 少寄存器堆的端口。 設計采用t s m c 1 3 工藝進行r t l 綜合,系統(tǒng)時鐘達到3 0 0 m h z ,面積約為 1 0 萬門,滿足預定的設計要求??梢宰鳛楠毩⒌膇 p 用于s o c 設計。該設計被國 內知名公司采用,具有很高的實際商用價值。 關鍵詞:向量協(xié)處理器;i e e e 7 5 4 ;記分牌:浮點運算;浮點異常;乘累加;浮 點除法;浮點開方;v l s i 2 2 0 0 8 年中國科學技術大學碩士學位論文 a b s t ra c t t h eh i g h - p r e c i s i o nf 1 0 a t i n g p o i n tp r o c e s s i n g , m a i n l yu s e d i nt h en i e do f s c i e n t i f i ca r l dm u l t i m e d i ac a l c u l a t i o n s ,w h i c hi sd n eo ft h em o s ti m p o r t a n ti n d i c a t i o n o ft h ec e n t r a lp r o c e s s i n gu n i t sc a p a c i t yt op r o c e s s i n gm u l t i m e d i aa n d3dg r a p h i c s a st of i xp o i mp r o c e s s i n g ,a ut h ef l o a t i n g p o i n tc a l c u l a t i o ni nt h ec p uw i t h o u tt h e n o a t i n g p o i n tp r o c e s s i n g u n j ti sa n a p p r o x i m a t e l y s i m u l a t i o n a st h e r a p i d d e v e l o p m e n to fm u l t i m e d i aa n di n t e m a t i o n a ln e t w o r k s ,m o r ea n dm o r ec 以c u l a t i o n s c a nf o ram o r ep r e c i s ea n dp o w e r 矗l lc a p a c i t yi ne m b e d d e df l o a t i n g p o i n tp r o c e s s i n g t h o u g h , s o m es o r w a r el i b r a r yw a sd e v e l o p e dt 0 c a r r y o nt h ef l o a t i n g p o i n t c a l c u l a t i o no nf i xp o i n ts y s t e m ,t h et e r r i b l er e a l t i m er e s p o n s ec o u l dn o tb et o l e r a t e d b ym a n ye m b e d d e ds y s t e m s o ,ah a r d w a r ei m p l e m e n to fn o a t i n g p o i n tc a l c u l a t i o n s i sb a d l yi nn e e di ne n 小e d d e da p p l i c a t i o ne n v i r o n m e n t s a d e s i g na n di m p l e m e n to fah i g hs p e e de n l b e d d e dn o a t i n g p o i n tc o p r o c e s s o r , v f pm l l yc o n l p l i a n c ew i t ht h ei e e e 7 5 4n o a t i n g - p o i n ta r i t h m e t i cs t a n ( 1 a r dw a s p r e s e n t e di n 也i st h e s i s 。t h i sc o p r o c e s s o r 雒a c h e dw “ht h em a i np r o c e s s o rb ya e x t e m a lc o p r o c e s s o ri n t e r f a c e i tc a np e r f o 鋤ss i n g l eo rd o u b l ef i o a t i n g p o i n ta d d , su b t r a c t ,m u l t i p ly d i v i s i o n ,m u l t i p l ya 1 1 da c c u m u l a t i o na n ds q u a r er o o to p e r a t i o n s i t s u p p o r t sc o n v e r s i o n b e t u ,e e nn o a t i n g p o i n tn u m b e ra n di n t e g er i th a ss e p a r a t e d 6 4 b i t sw i d m1 0 a da n ds t o r eb u s t h i sf l o a t i n g p o i n tc o p r o c e s s o rc a np r o v i d eb e n e f i tt ot h ef 0 1 l o w i n gs e v e r a l f i e l d s i tc a ni m p r o v ea c c u r a c ya n dp r e d i c t a b i l j t yo ft 1 1 ea u t o m o t i v ea p p i i c a t i o n sf o r e n g i n em a n a 霉e m e n t a n dp o w e rt r a i nc o m p u t a t i o n s i tc a ni m p r o v et h ep e r f o 肌a n c eo f g r a p h i cp r o c e s s i n gs u c ha si m a g es c a l i n g ,f o n tg e n e r a t i o ni np “n t i n g ,3 dt r a n s f b 加, f f t i m a g e6 l t e r i n g e t c i tc a na l s ob e n e f i tt ot h en e x t g e n e r a t i o nc o n s u m e r e l e c t r o n i c ss u c ha sn e t 、v o r k i n ga p p i i c a t i o n s ,g a t e w a y sa n ds e t t o pb o x e se t c t h i sc o p r o c e s s o rw a sd e s i g n e dw i t hat o p d o w nf a s td e s i g nn o w t h ed e s i g n g o a la n dc r i t i c a lp a r a m e t e rw a ss e tu pi nt h ef i r s ts t e p 。t h e n ,t h es y s t e mp a r t i t i o na j l d d i d e l i n ew a sd e s i 2 n e d ,t h ea l g o r i t h mo fd i 虢r e n tc a l c u l a t i o nw a sw o r k e d0 u ta n dt h e i r v a l i d i t yw a se v a l u a t e da n do p t i m i z e d ,f u r t h e r ,t h ef u l ld e s i g nw a so p t i m i z e di nr t l l e v e l t og a i nah i g h e rp e r f o 瑚l a n c e f i n a l l y ,a ne x p e c t e di m p l e m e n tw a sc o m p l e t e d t h i sd e s i g nw h i c hw a so p t i m i z e dw i t ht h et r a d e o f j fb e t w e e np e r f o r m a n c ea n d p o w e ra r e ac o s tf o re m b e d d e df i e l d sh a ss e v e r a lt e c h n i c a li m p r o v e m e n t s t h e 0 p t i m i z e dn o a t i n g p o i n tm u l t i p l ya n da c c u m u l a t ed a t ap a t ha n ds i n g l e d o u b l ep r e c i s e n o a t i n g - p o i n tr o u n da l g o r i t h mw a sa p p l i e di nt h i s ( 1 e s i g na n dp e r v a d e d af u l l c o m p l j a i l c ew i t hi e e e 7 5 4r o u n da l g o r i l h mi nm u l t i p l ya n da c c u m u l a t eo p e r a t i o n t h i si m p r o v e m e n th e l p st os h o r t e nt h ec r i t i c a lp a t ha n dr e d u c em ea r e ac o s t t h e 矗x c y c l ei t e r a t i o na n dj o g i cr e s o u r c es h a r i n ga l g o r i t h ma p p l i e do nd i v i s i o na n ds q u a r e r o o to p e r a t i o nc a nr e m a r k a b l yr e d u c e dt h ea r e aa n dp o w e rc o s to ft h ew h o l es y s t e m t h es e p a u r a t e dl o 刪s t o r eb u su s e dt oe x c h a n g i n gd a t aw i t hm a i np r o c e s s o rc a nr e m o v e 3 2 0 0 8 年中國科學技術大學碩士學位論文 據(jù)。 第5 項給出了浮點異常分類和相應的處理方法。浮點異常的分類是協(xié)處理器 異常檢測的依據(jù),協(xié)處理器處理異常的方法必須滿足該標準,這樣才能在不同的 情況下得到可重復的精確運算結果。 2 2 1 浮點數(shù)格式 i e e e 浮點數(shù)由三個部分組成:符號,指數(shù),和尾數(shù)。尾數(shù)由小數(shù)部分和隱 含位構成。 表2 1 顯示出了3 2 位單精度和6 4 位雙精度浮點數(shù)的格式。 表2 1 i e e e 7 5 4 浮點數(shù)格式 符號指數(shù)尾數(shù)偏移量 單精度 【3 1 3 0 :2 3 2 2 :0 】 1 2 7 雙精度 【6 3 】 6 2 :5 2 】【5 1 :0 】 1 0 2 3 其中:符號位( s i g n ) :o 代表正數(shù),1 代表負數(shù)。 指數(shù)( e x p o n e n t ) :指數(shù)部分既要能夠代表正指數(shù),又要能夠代表負指數(shù)。為 2 0 0 8 年中闌科學技術火學碩士學位論文 4 n o ta n u m b e r n a n 用來代表一個非真實的數(shù)字。當浮點數(shù)的指數(shù)部分全為l ,而尾數(shù)部 分不全為o 時,該浮點數(shù)代表了一個n a n 。 非數(shù)又分為告警非數(shù)( s n a n ) 和靜態(tài)非數(shù)( q n a n ) 。告警非數(shù)尾數(shù)酋位 為o ,靜態(tài)非數(shù)首位為l 。浮點處理對兩者區(qū)別對待。 表2 3i e e e 定義的特殊數(shù)值 s i 辨g 積嘿玲n e n t e p r a c t i o n留| j 盯露 + o o0 0 0 0 0 0 0 00 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 p 0 3 i t i v ez e r o 一e 土o o o g o 0 0 00 0 0 q o o q 0 0 0 0 0 0 0 0 g o 0 0 0 0 0 0 n q g a t i v ez e r o 一2 1 2 6x o ( 2 一王_ lq 0 0 0 0 q o g1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 q o 一2 一i 2 舂x0 ,s + 2 1 2 6j c 0 2 一z 3 j o0 0 0 0 q 0 0 00 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 王 s m a l l e s tv a l u e ) 手2 玉一土2 7 x 1 。2 2 = 0q 0 0 g 0 0 童 0 王0 0 q 0 0 g 0 0 0 0 0 g o q q g e 0 q 夸2 王一王2 x 1 2 s + 2 1 2 9 1 2 7 x 1 。d = ol o o o o o q 土0 0 0 q o q 0 0 0 0 0 0 0 q 0 0 0 0 0 0 0 0 0 4 + i n f i 髓i t y ol l l l l l l l0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 i n f i n i t y l 王王l 王l l 羔l 9 0 q q o o 0 9 0 0 0 0 0 g o q 0 0 0 0 0 0 q n o tan u m b e r n a n ) 01 1 1 l l l l l1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 x o tan 醢l(fā) 囂b e r k a 楚 羔l l 王王王王王羔王0 0 0 嵇王e 0 0 王g q o g 0 0 0 0 0 王王0 2 2 3 異常 l 囂琶e 7 5 4 標準定義了五靜異常,分別是:無效操作異常、被零除異常、非 精確異常、下溢異常、上溢異常。 l 。無效操作異常 計算中有些操作是無效的,例如負數(shù)開方。無效操作的結果應該是一個靜 態(tài)非數(shù)。 下面給出了一些無效操作的例子: 任何對n 州的操作 加或減:。o + ( 砌) 2 0 0 8 年中國科學技術大學碩士學位論文 被舍入成o k 1 6 2 l + o 0 0 1 。誤差的區(qū)間大致在保護位l s b 位置的1 2 到+ 1 2 。如圖 2 1 所示。 中間狀態(tài)的判斷方法:在執(zhí)行操作的中間步驟設置2 個保護位。其中第1 位是將被去除的尾數(shù)部分的最高有效位。第2 位是尾數(shù)的完整表示中除去最高有 效位的其余各位的邏輯或。對于串行操作此位在操作中初始化為o ,如果有一個 1 從該位置移出,則將該位置1 ,并一直保持。通常稱為黏著位。保護位為1 0 則處于中間狀態(tài)。 圖2 1r o u l l dt on e a r e s t 模式流程圖 有效位 ,、 0 6 1 6 - :6 - 3 6 - 。6 5 6 - 6 6 m k 0 6 1 6 2 6 一, 有效位 圖2 2 r o u i l dt on e a r e s t 模式邏輯結構示意圖 1 6 2 0 0 8 年中國科學技術大學碩士學位論文 柑癯位 攀麓度 雙精度 雙豬皮擴燧( x 8 6 ) 囂鍍穗囊( s 粼) u b ( 1 ) ;2 “之3 一1 1 9 2 0 9 3 囂* 0 7 啦( 1 ) 。2 髭2 2 2 舛4 6 e 1 6 u l p ( 1 ) = 2 “- 6 3 一1 0 8 4 2 0 2 e - 1 9 啦( 1 = 2 1 1 2 一l 。毀5 3 0 。a 4 ( 1 ) i e e e 標準要求精確舍入加、減、乘、除的結果。也就是說,必須先精確 計算結采,然恁舍入為最接近的浮點數(shù)( 或者舍入為偶數(shù)) 。當兩個浮點數(shù)豹指 數(shù)有很大差異時,精確計算這兩個浮點數(shù)的差或和的開銷會非常大。我們引入保 護位,它提供了一種在保證耀對誤差很小的同時計算差值的實用方法。 ( 2 ) 許多問題( 如數(shù)值積分和微分方程的數(shù)值解) 涉及計算多個項的和。因 為每個加法運算都有可能弓l 入大至o 5u l p 的誤差,所以產生數(shù)于頊的求和會具 有相當大的舍入誤差。糾正這一點的簡單方法是將部分被加數(shù)存儲在雙精度變量 中,并使用雙精度執(zhí)行每個加法運算。 ( 3 ) i e e e 標準并不保證同一程序在所有符合該標準的系統(tǒng)上都將提供完全 相同的結果。實際上,潮于種種原因,大多數(shù)程序都會在不同的系統(tǒng)上產生不同 的結果。其中個原因是,大多數(shù)程序都涉及十進制格式和二進制格式之間的數(shù) 字轉換,而i e e e 標準沒有完全指定執(zhí)行這樣的轉換必須使用的準確度。i e e e 標 準要求將每個結果都正確舍入到它的目標的精度,但是標準不要求嘲用戶程序確 定該目標精度。因此,不同的系統(tǒng)可能將其結果提供給不同精度的固標,使網 程序產生不同的結果( 有時差異很大) ,即使那些系統(tǒng)都符合標準亦是如此。 ( 4 ) 按照i e e e 7 5 4 標準規(guī)定,每一步運算的結果都必須舍入到瞬標精度,然 后才能參與到下步運算。這是為了避免累積誤差,便于科學運算的誤差分析1 5 j 。 然而些單精度雙精度系統(tǒng)提供單個指令將兩個數(shù)相乘并與第三個數(shù)相加,只 進行一次最終舍入。此運算稱為合并的乘功疆,會導致同一程序在不同的單精度 雙精度系統(tǒng)上產生不同的結果;與擴展精度一樣,它甚至會導致同一程序在同一 系統(tǒng)上產生不同的結果,這取決于是否使用它和何時使用它。在本處理器設計中 中沒有這種情況,我們將乘累加的結果分兩步運算,首先得到精確舍入的乘法的 結果,再進行累加操作,避免了菲精確的誤差累積。 2 0 0 8 年中國科學技術大學碩士學位論文 2 2 誤差分析的數(shù)學基礎 計算機中的浮點數(shù)f 可以表示為: = ,夕l j u 這里夕是機器的基數(shù),j 表示階碼,w 是尾數(shù),尾數(shù)表示為: w = o 盔吃4 其中t 是字長,o t ,若吐o ,則稱該浮點數(shù)為規(guī)格化的浮點數(shù)。我們 用f 表示一個系統(tǒng)的浮點數(shù)的全體所構成的集合,則有: f = 柳u 廠:廠= 0 盔盔夕,0 z o ( 若x 0 ,證明完全類似) ,即刪x 膨,則x 可以表示為: x = d 堿葛+ l 礦,毽五岱 煲| j : 礦。菇s 多4 對于舍入法,有 雕,= 般麓弘 即: l ( x ) 一x l s 喜”l = 吉4 “卜圭x 卜f l 絲! 二址羔口h 所以 l ( x ) 一x i 邶h 坦盟二趣 工 豳( 4 ) 式和( 5 ) 式從焉得知定理l 成立,定理l 規(guī)定了在浮點數(shù)和實數(shù)轉換時 的舍入誤差。下面研究在浮點數(shù)運算時的舍入誤差定理和分析具體的情況。另外 為了研究方便,有時也會把定理l 中的相對誤差公式寫成下式: ( 磚2 南揶鬈 ( 國 2 0 2 0 0 8 年中國科學技術大學碩士學位論文 2 浮點數(shù)基本運算相對誤差 考慮基本運算的舍入誤差。設口,易f 是兩個給定的浮點數(shù),我們用。表示 + 一x ,中任意一種運算。( 口。6 ) 的意義是先進行運算,得到精確的實數(shù),再按 舍入規(guī)則表示成浮點數(shù)。在運算中,若出現(xiàn)l 口0 6 l 歷,則就是發(fā)生了下 溢或上溢。在不發(fā)生溢出的情況下,由定理l 得到: 證明因為俐“,故有 ( 1 一”) ”兀( 1 + 最) ( 1 + “) ” j = 1 為證明定理結論,我們只需證明以下兩個不等式 ( 1 一“) ”l 一聆“ ( 1 + ) “l(fā) + 1 o l 聆“ 我們考慮考慮函數(shù)( 1 一工) ”( o 工 1 ) 的t a y l o r 展開: ( 1 一力”= 1 一煅+ 叢篙塵( 1 一善r 2 x 2 ,f ( o ,力 所以1 一臟( 卜x ) 8 l l o l 療”l 一療甜( 1 一甜) ” ( 1 0 ) 又由礦的冪級數(shù) 2 l 2 0 0 8 年中國科學技術大學碩士學位論文 礦:l 二工+ + + 2131 一t + x + 熟+ 爭和) l + 蘭+ 壟十 級數(shù) 3 4 1 收斂于: 1 + 蘭+ 堡+ 礦 3 41 所以1 + 工礦1 + x + 量工,又因為e 。, 圳 覘m l j 圖4 1 24 2 壓縮器結構圖 我們實際的乘法器是一個5 4 5 4 b i t 乘法器,這樣的話,經過b o o t h 譯碼 后,5 4 位的乘數(shù)被譯成2 7 位的數(shù)據(jù),這樣相承后的部分積應該是有2 7 個,在 加上最高位補一,還有符號位左邊補一的話,總共部分積應該是有2 8 個部分積。 部分積相加單元采用壓縮器,如上面所說相加,而在實際運算中,我們并不是按 2 8 行的來進行壓縮,而是把這個過程分成了兩個部分分兩次完成的。第一周期 中壓縮部分積的后半部分,對于單精度,前兩行置o :對于雙精度則直接壓縮后 面十五個部分積和為了舍入而加入的一行。第二個周期再把上一個周期壓縮的結 果作為部分積中的兩行,完成全部的壓縮。第一周期的結果,作為第二周期的輸 入與之對齊并進行壓縮。其結果示意圖如圖4 1 3 所示。 4 2 2 0 0 8 顰竄鞫科學技零天學碩圭學使論文 口 工工圈口 工工皿 口口 丁工硇口 1 皿 圖4 1 6 舍入到最近結構示意圖 我們首先說明只舍入雙精度的情況、再說明雙精度和單精度的結合情況。對 于雙精度,將進位保留形式的待舍入數(shù)據(jù)分為四段并行處理。即結果高位 ( s 眥【l :一5 l 】、c a n 了( 1 :一5 l 】) 、l 位( s u i i l c 5 2 j 、c 哪卜5 2 】) 、r 位( s 啪f s 3 】、c 哪( 一5 3 】) 黏著位( s u m 【一5 3 :一1 0 7 】、e a 掣f 一5 3 :1 0 7 p 四段。贏位通過行半加器壓縮。l 位 通過一個半加器壓縮。r 位上的三個數(shù)r s 、r c 、硒n 通過一個全加器壓縮成一 位。黏著位通過超前進位鏈生成向r 位的進位c i n 。使用超前進位鏈生成e i n 的 進位的目的是提高速度,避免生成c i n 的邏輯成為關鍵路徑,同時為集成單精度 及舍入到無窮模式提供便穰;l 健壓縮褥到s 、c 。爻位匿縮矗得到r 。結果高 位壓縮后得到s 啪l 和c a n y l 。將s 啪l 和c a n y l 送入一改進的并行前綴加法器 ( p 凇 e i - p 建歙a 髭e r ) 相加。該加法器可以次性得到s u 疆l c 刪i 靜 s u m l 十c 卿1 + l 。再用s ,c ,r ,r c i n 的不同情況,生成l 位向高位的不周進 4 7 教 一 一 回占 緩 壓吆l工 避 一 一 2 0 0 8 年中闌科學技術大學碩士學位論文 位( o 或者1 ) 。掇據(jù)此進位選擇高位相加的s u m l + e a r r y l 或s u m l + e a 弱了l + l 結果來 做為會入結果的高位部分。同時經過邏輯單獨算出最后一位,即最終結果的l 位。 舍入到最近需要判斷t i e 情況。t i e 情況指的是待舍入結果中丟棄的部分表示 的數(shù)值是其等俄長數(shù)值上限和下限的平均值。此時待舍入數(shù)值位于兩個最接近數(shù) 值的中間。如二進制1 1 0 1 0 0 0 舍入到整數(shù)。1 0 0 0 就等于( o + 1 1 1 1 ) 的二分之一。 i e e e 7 5 4 標準規(guī)定這種情況下結果舍入到最近的偶數(shù)。由于我們合入到最近是通 過舍入到最近的上限實現(xiàn)的。因此僅需要將舍入到最近的上限得到結果的最低位 置o 即可得到舍入到最近的結果。設s u m 卜5 4 :一1 0 7 】+ c a 翻f y 卜5 4 :一1 0 7 】為零的標志是 z 。判斷t i e 情況需要依據(jù)r s u m 、r c 哪、c i n 和z 。分為溢出和不溢出的情況。 不溢出時r s u m 、r c 哪r 為s u m 【_ 5 3 】、c a f r y 卜5 3 】,c i n 為r 位的c a “yi n 即c i n 【一5 3 】, z 為s u m 【- 5 4 :一1 0 7 】+ c 囂拶【- 5 4 :- 1 0 7 】為零標志;溢出時,r s u m 、r e a r r y 為s u m p 5 2 】、 c a n y 卜5 2 】,c i n 為r 位的c a r r yi n 即c i n 卜5 2 】,z 為s u m 卜5 3 :一1 0 7 】+ c a r 巧 5 3 :- 1 0 7 】 為零標志。z 可以通過進位保留形式的s u m n 3 :1 0 7 】+ e a 哪疊5 3 :一1 0 7 】的結果快速 預測得到。對結果各位是否全為零的快速預測邏輯表達式如下: 10 7 b 時a - b = a + b + l 0 ,a + b + 1 必定會 向第m 位進位,所以此時前導零預測可由式求出。當a b 時,a b = a + b + l o ,a + b + l 必定不會向第5 4 位進位,并且所得到的尾數(shù)結果是以絕對值形式 存儲,所以此時前導零預測可由式求出。 ,、i ( a io b i ) ( a “+ b ) i = 1 ,2 ,n 卜1 2 一 捌【( a io b i ) i = o r :黔唑) b i - 1 ) 1 爿

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論