




已閱讀5頁,還剩54頁未讀, 繼續(xù)免費閱讀
(測試計量技術(shù)及儀器專業(yè)論文)采用fpga實現(xiàn)信號處理算法的研究及實驗平臺的建立.pdf.pdf 免費下載
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
東南大學(xué)碩士學(xué)位論文 摘要 本文針對復(fù)雜信鼉實時處遴的困難 提出了采用f p g a 來實蕊信 號處壤麓方法 著稷掇系統(tǒng)靄要設(shè)詩了 個嵌入式實驗平臺 根據(jù)f p g a 實現(xiàn)信號處理的關(guān)鍵點 設(shè)計合理的f p g a 結(jié)構(gòu) 體 現(xiàn)算法的并行性和流水性 論文著重分糯了用f p g a 實璦陣列結(jié)構(gòu)處 理蕊篡髂方法耪實王羹避褪 論文麩分櫥舞法酶并行度入手 提窶爝貍 關(guān)圖方法直觀反映算法的相關(guān)性 在此撼礎(chǔ)上設(shè)計了算法的信號流圖 緒稼和默動終麓績鞫 并針對熊墅信號簸灌算法 矩陣遨算 卷積運 算 逃行了并行度分搴斤 糨關(guān)圈設(shè)計和從籀關(guān)圈導(dǎo)出脈動陣列結(jié)構(gòu)的 研究 同時針對f p g a 特點 提出了采用c o r d i c 結(jié)構(gòu)來設(shè)計通用 運算單元 繪出其滾承實現(xiàn)的結(jié)構(gòu) 結(jié)合脈動辮捌結(jié)攙提藤了矩陣運 算性能 最饜設(shè)計一個以3 2 鍵c p u 為核心的實驗平臺 編寫了啟動 程序和診斷糨序 關(guān)鍵溺 f p g a 著行籜法 躲凌陣裂 c o r d i c 嵌入式裝絞 東南大學(xué)碩士學(xué)位論文 a bs t r a c t i no r d e rt od e a lw i t ht h ed i f f i c u l t yo fr e a l t i m e c o m p u t a t i o n i n c o m p l e xa l g o r i t h m t h et h e s i sb r i n g sw i t h am e t h o do f p r o c e s s i n gd i g i t a l s i g n a lw i t h f p g aa n dd e s c r i b e st h ed e s i g no fa ne m b e d d e dt e s tp l a t f o r m t h ek e y p o i n to fd e s i g nf p g aa r r a ys i g n a lp r o c e s s i n gi s t od e s i g n s u i t a b l ef p g as t r u c t u r e s w h i c hc a nr e p r e s e n tp a r a l l e la n dp i p e l i n e d c h a r a c t e r i s t i ci na l g o r i t h m b a s e do nt h i si d e a t h ep a p e rd e s c r i b e st h e p r o c e s s i n g o f p e r f o r m i n g f p g a s i g n a lp r o c e s s i n g i nm a t r i x m u l t i p l i c a t i o n a n dc o n v o l u t i o n o p e r a t i o n w h i c h i s c o m p o s e d w i t h d e s i g n i n gd e p e n d e n c eg r a p h g e t t i n gs i g n a lf l o w i n gg r a p h a n d d e r i v i n g s y s t o l i c s t r u c t u r e c o r d i cs t r u c t u r eh a sb e e n p r o p o s e d t o d e s i g n g e n e r a la l u a ni m p r o v e dp e r f o r m a n c e h a sb e e na c h i e v e db y c o m b i n i n g c o r d i cs t r u c t u r ea n d s y s t o l i ca r r a y k e yw o r d s f p g a p a r a l l e la l g o r i t h m s y s t o l i ca r r a y c o r d i c e m b e d d e d s y s t e m h 學(xué)位論文獨創(chuàng)聲明 本人聲明所呈交的學(xué)位論文是我個人在導(dǎo)師指導(dǎo)下進行的研究工作及取得 的研究成果 盡我所知 除了文中特別加以標注和致謝的地方外 論文中不包含 其他人已經(jīng)發(fā)表或撰寫過的研究成果 也不包含為獲得東南大學(xué)或其它教育機構(gòu) 的學(xué)位或證書而使用過的材料 與我一同工作的同志對本研究所做的任何貢獻均 已在論文中作了明確的說明并表示了謝意 簽名 日期 2 0 0 3 年3 月 關(guān)于學(xué)位論文使用授權(quán)說明 東南大學(xué) 中國科學(xué)技術(shù)信息研究所 國家圖書館有權(quán)保留本人所送交學(xué)位 論文的復(fù)印件和電子文檔 可以采用影印 縮印或其他復(fù)制手段保存論文 本人 電子文檔的內(nèi)容和紙質(zhì)論文的內(nèi)容相一致 除在保密期內(nèi)的保密論文外 允許論 文被查閱和借閱 可以公布 包括刊登 論文的全部或部分內(nèi)容 論文的公布 包括 刊登 授權(quán)東南大學(xué)研究生院辦理 簽名 導(dǎo)師簽名 日期 2 0 0 3 年3 月 東南大學(xué)碩士學(xué)位論文 1 1 磷究謦的及意義 1 引論 信弩處理已經(jīng)在潺努 聲納 雷達 撼震 氣象 天文 袋貔送學(xué) 電 力系統(tǒng)等領(lǐng)域得到了廣泛的應(yīng)麓 數(shù)字傣譬楚理毅零靜發(fā)展綴大程度上依賴 于兩個性質(zhì)不同但又臼成體系的研究領(lǐng)域 l 信號處理算法和信號處濺器結(jié) 構(gòu) 信號處理算法在不悶的應(yīng)用領(lǐng)域有其不同的表現(xiàn)形式 但是在算法中占 攝麥罨遮鏈豹是變換技術(shù) 卷弦 籀關(guān)濾波以及萊些基本戇線經(jīng)代數(shù)方法e 這蹙算法菇有菜稀程凄上豹慕弼特往 鰓 蕊鯔靛 遞爨徑秘髑豁純姆經(jīng) 為提高實時性能 要求處理冀法的處理器篡肖很好的吞吐率和很快盼逡算速 度 繼弩鯰毽器藏是麓了瀑慰薅遮 實潛麓號簽臻薅設(shè)詩懿專鬻楚理爨 售 弩處理器處理能力的掇商一方謠取決于半釋俸技術(shù)的突飛猛讖 邸硅加工 編譯技術(shù)的進步 芯片封裝 敞熱技術(shù)的成熟等 另一方面 由于計算機體 系結(jié)構(gòu)領(lǐng)域的研究成果 餒得人們能夠最大限度她發(fā)揮器 孛的功能 設(shè)計出 綜含牲戇爨健豹系統(tǒng) 璐萎 穗半導(dǎo)籜羧零教凝裂 定程度囂 整予秘驥器 律本身在速度 尺寸 功能上存在著難叛黨服的戳制 使得處理器結(jié)榆設(shè)計 成為提高系統(tǒng)性能的熒鍵手段 所以針對特定算法 根據(jù)其辯靜性 滾水牲 黧暹麓將瞧設(shè)詩專蔫鶼耱理器縫穩(wěn)已經(jīng)藏瓷安霉亍囊雜售號楚纛懿有效手段 v l s i 信號處理主漤涉及到信號處理聯(lián)論 計算機系統(tǒng)結(jié)構(gòu)和微電子工藝 等 信號處理領(lǐng)域主器研究備種信號處理算法的實現(xiàn)和性能的改進 計算機 系綾結(jié)橡主簧研究抉遮計算系統(tǒng)設(shè)計 徽魄子工藝主要涉及磁編澤 熱工工 慈等 論文主要鼠信譬處灌算法幫贊黯褥定冀法竣計專薅靜 滋輟處濺器的 角魔進行研究 v l s i 饋號處理鶼實現(xiàn)主爨通過各穆遮箕單元 p 玢載連接纓麴熬改變寒 完成 掰戳也稱為v l s i 簿列信號處理 鍵由予v l s i 晶片鼠設(shè)計 下線到葑 裝究成需驟比較長的過程和比較大的費用 因此作為研究對象不是很方便 而潑今 f p g a 技術(shù)的飛遽發(fā)展 邏輯門數(shù)的巨增以及其可多次擦寫的功能 巍譙予編毽熬特點使之藏為 秘方便夔實璇v l s i 繼號處理豹工其 擻然 受綻舅法髂測試 試駿變?nèi)炻稙榉奖?可爝f p g a 陣列信號姣瑗的研究替代 v l s i 信號處理的研究 所以論文中提到的v l s i 陣列信號處理怒與f p g a 陣 列熄號怒理在霧法 續(xù)臻等戇戮究方夏是簿效豹 1 2 采用f p g a 實現(xiàn)信號處理的優(yōu)點和難點 1 2 1 采用f p g a 實璐信號處理的優(yōu)點 信號處避中用褥最多的怒通用的d s p 芯片 如t l 的t m s 3 2 0 系列等 其中c 6 0 0 0 系列作為t i 的新一代產(chǎn)品 幽于采用了v l i w 體緊結(jié)構(gòu)緞織多 個功能模塊并行工作t 使得其運行速度達剿了2 0 0 m i p s 以上 魍是由于巍霸 東南大學(xué)碩士學(xué)位論文 d s p 器件的固定內(nèi)部單指令流結(jié)構(gòu)的限制使之往往無法勝任對于大型系統(tǒng)的 k a d m a n 濾波器 譜估計 圖像重建等這些復(fù)雜算法的實時處理 即使設(shè)計多 d s p 的并行結(jié)構(gòu) 也很難做到通過算法的拆分使得各個d s p 芯片并行執(zhí)行 隨著電子技術(shù)的發(fā)展 加工工藝的進步 低成本 高密度 高速度的超 大規(guī)模集成電路 v l s i 的性能越來越好 其應(yīng)用也越來越廣泛 這些器件 的一種應(yīng)用是針對不同的信號處理算法設(shè)計相應(yīng)的信號處理結(jié)構(gòu) 從而滿足 特定算法的快速 實時性實現(xiàn)的要求 與采用商用的d s p 實現(xiàn)數(shù)字信號處理相比 采用f p g a 的陣列信號處 理器有以下幾個優(yōu)點 1 可以滿足復(fù)雜系統(tǒng)的高速 實時性要求 商業(yè)d s p 器件由于固定的 哈佛總線結(jié)構(gòu) 提高系統(tǒng)速度的方法主要是加快時鐘速度和減少指令計算周 期 但這些方法對復(fù)雜的 全局通信類算法 的性能提高是十分有限的 2 j 而采用f p g a 實現(xiàn)的陣列信號處理器可以根據(jù)系統(tǒng)的需要 量身定做 通過 采用與算法相適應(yīng)的系統(tǒng)并行算法和優(yōu)化的硬件信號處理結(jié)構(gòu)來實現(xiàn)復(fù)雜的 算法 2 可以實現(xiàn)系統(tǒng)集成 d s p 作為通用器件構(gòu)成信號處理系統(tǒng)往往需要 其它數(shù)字器件輔助才能完成信號的控制和輸入輸出 這使得系統(tǒng)結(jié)構(gòu)不夠簡 潔 而f p g a 作為用戶可編程的器件完全可以根據(jù)系統(tǒng)的需要在片內(nèi)分別構(gòu) 成信號處理單元 接口單元等 3 便于專用系統(tǒng)的研制 由于d s p 作為商業(yè)芯片 它的發(fā)展一般與市 場的需要同步 麗一些復(fù)雜系統(tǒng) 特別是軍事系統(tǒng)的要求往往超出其性能范 圍 而采用f p g a 來設(shè)計專用的信號處理器結(jié)構(gòu) 可以根據(jù)特定算法的特定 需要 實現(xiàn)其并行性 流水性等 達到系統(tǒng)對速度的苛刻要求 1 2 2 采用f p g a 實現(xiàn)信號處理的關(guān)鍵點 采用f f g a 實現(xiàn)信號處理盡管有以上所述的優(yōu)點 但也同時具有以下兩 個方面的不便 1 缺少開發(fā)環(huán)境的支持 2 缺少開發(fā)資源 如果采用f p g a 來實現(xiàn)已經(jīng)比較成熟的 通用性的c p u 內(nèi)核結(jié)構(gòu) 即實 現(xiàn)指令調(diào)度t 譯碼和執(zhí)行單元 這在成本和開發(fā)周期上都是沒有優(yōu)勢的 現(xiàn) 在 c p u 內(nèi)核已經(jīng)基本成熟 主要基于a r m m p s p o w e r p c 這三種r i s c 架構(gòu) 所以f p g a 信號處理的重點是針對運算量大 實時性要求高的場合 其研究重點放在結(jié)構(gòu)并行性和流水性的研究上 即基于體系結(jié)構(gòu)的算法研究 是f p g a 信號處理研究的關(guān)鍵點 所以本論文研究的關(guān)鍵問題是f p g a 陣列 信號處理的結(jié)構(gòu)是如何依賴算法的 以及算法怎樣才能在陣列處理中實現(xiàn) 1 3 國內(nèi)外現(xiàn)狀 水平及發(fā)展趨勢 v l s i 的陣列信號處理涉及計算機系統(tǒng)結(jié)構(gòu) 并行處理算法 數(shù)字信號 處理 超大規(guī)模集成電路等學(xué)科的相關(guān)技術(shù) 數(shù)字信號處理理論和應(yīng)用在近十年已經(jīng)滲透到各行各業(yè) 然而 一方面 東麓大學(xué)碩士學(xué)位論文 系統(tǒng)對舞法的精度要求越泉越高 導(dǎo)致了算法憝國復(fù)雜 另一方露系統(tǒng)需要 各種髂弩處理算法能夠在線實時地完成 這使得陣列信號處理算滋和結(jié)構(gòu)的 研究成為熱點 在計算機系統(tǒng)結(jié)構(gòu)和并行處理算法等方面 國內(nèi)外針對大型機在近幾十 年做了許多理論和實際方蕊的研究 提出了矢檄處理器系統(tǒng) 多處遐器系統(tǒng) 薄烈熟壤器系統(tǒng)等結(jié)構(gòu)撰型 茲兩類屬于通用詩霧鼴范疇 開發(fā)遨囂類系絞 需要鼴按潮葷元逶霉復(fù)雜熬浚詩 囂要對蔽囂瓷滾靜配萋媾囂送簿黻傀瓣考 慮 這麓特點不適合用v l s i 單片快速實現(xiàn) 黼陣列處理器由于蕊壤的并行 性和艦則的流水性 非常邋臺于用v l s i 的結(jié)構(gòu)特點 v l s i 技術(shù)在近十年內(nèi)得到了飛速的發(fā)展 艇要表現(xiàn)為 集成電路的特征 尺寸向妲微米發(fā)展 當(dāng)前主流工藝為0 1 8 0 1 5 肚m 集成電路的規(guī)模不斷提高 如p i i i 處理器已達到了2 8 0 0 萬晶體管的規(guī)模 速度不斷提高 采用0 1 8 m c o m s 王芝實瑰羲c p u 主辯鎊已這8 0 0 m h z 寨戲電路復(fù)雜疫不叛疆巍 系 統(tǒng)芯冀 s o c 殘麥拜發(fā)瓣搽 電蘸設(shè)計 工麓涮造 封裝豹分交運行秀發(fā) 展無搬產(chǎn)線 f a b l e s s 和無芯片 c h i p l e s s 集成電路提供了條件 為微電子 領(lǐng)域繳腿知識經(jīng)濟提供了條件 3 l f p g a 作為 種可修改 重復(fù)編程的v l s i 器件模濺 可以非常方便地應(yīng)用于實現(xiàn)v l s i 的系統(tǒng)設(shè)計 從黼得到了快速 的發(fā)展 如x i l i n x 最新的v i r t e x i i 系列產(chǎn)品 其密度從四萬到一千萬個系統(tǒng) 門不鐐 x i l i n x 與i b m 雙方必同開展了把i b mp o w e r p c 處理器核心嵌予v i r t e x i 芯片戇詩翻 國外對于v l s i 實理蹲翔信號的研究開始予8 0 年代耪期 如1 9 8 1 年由 h o n e y w e l l i b m r c a t i n t w 等公司實施的v h s i c 芯片采掰了v l s f 陣列處理技術(shù)完成反輻射自動尋的 a r h 導(dǎo)彈的信號處理和快譴計算 2 1 0 近年 隨著v l s i 技術(shù)的發(fā)展和f p g a 芯片的改進 國外紛紛開展用v l s i f p g a 實現(xiàn)系統(tǒng)信號處理 完成高速 實時 精確處理的要求 取得了一 定的戲續(xù) 熱 數(shù)字神經(jīng)嬲絡(luò)信號處理規(guī)的實現(xiàn) 4 1 實對遙感績弩處理摶陣 列楚瑗器麓實瑗f 5 戳及多瓣繇鼴蹤雷這戇實辯k a l m a n 憝毽器設(shè)詩釋t 因內(nèi)也開展了關(guān)于陣剮始理器的研究工作f 如由中船總公葡7 0 9 所研制 的脈動陣列機9 8 0 s t a r 鼴肖可重構(gòu) 可編稷 可擴充等性能 9 8 0 s t a r 的 速度可逖1 0 0 0 萬次 秒 陣列峰值計算速度可達1 6 億次 秒 1 4 論文的主要內(nèi)容 論文針對信號處理算法的并行度進行了研究 在茈基礎(chǔ)上 討論了通過 信號流閣分析生成合理 有效的實現(xiàn)運算的處理器結(jié)構(gòu)的方法 同時根據(jù) f p g a 的特點運用旋轉(zhuǎn)陣列機設(shè)計了通用的運算單元 論文總的算法討論主 要針對信號處理中的卷積和矩陣運算進行 最磚 針對系統(tǒng)的實驄謦 測試需要 討論了一個以3 2 b i ta r mc p u 為核 心靜嵌入式試驗平臺豹設(shè)計 東建大學(xué)頸 學(xué)位論文 參考文獻 l s y k u n g v l s ia r r a yp r o c e s s o r s p r e n t i c eh a l l 1 9 8 8 e n g t e w o o dc l i f f s n e w j e r s e y 2 經(jīng)霹霉 罵淑芬 李方慧t m s 3 2 0 c 6 0 0 0 系列d s p s 豹驤理與應(yīng)矮 電子工 篷篷敝毒妻 j t 京 2 0 0 0 3 王志功 沈永朝等v l s i 設(shè)計講義 東南大學(xué)無線電系 南京 2 0 0 t 4s m r h a s a n n gk a n g s i o n g ap a r a l l e lp r o c e s s i n gv l s i b a m e n g i n ev l s i i e e et r a n s a c t i o n so nn e u r a ln e t w o r k s 4 2 4 4 3 6m a r c h1 9 9 7 8 2 5t t u a n m f i g u e r o a f l i n d c z h o u cd i o r i o j s a h r a nf p g a m b a s e d a r r a y p r o c e s s o r f o ra l l i o n o s p h e r i c i m a g i n g r a d a r 2 0 0 0i e e e s y m p o s i u m o n f i e l d p r o g r a m m a b l ec u s t o mc o m p u t i n g m a c h i n e s 2 0 0 0 6 r d t u m e y a m r e z a j q r d e l v a f p g ai m p l e m e n t a t i o no fa d a p t i v e t e m p o r a lk a i m a nf i l t e r f o rr e a lt i m ev i d e of i l t e r i n g 1 9 9 9i e e ei n t e r n a t i o n a l c o n f e r e n c eo n a c o u s t i c s s p e e c h a n ds i g n a lp r o c e s s i n g 2 2 3 1 2 2 3 4 1 9 9 9 v 0 1 4 7 陳圜良 陳峻編著v l s i 計算理論與并行算法 中國科學(xué)技術(shù)大學(xué)出版社 1 9 9 1 臺肥 4 東蠢大學(xué)礞士學(xué)位論文 2 1 概述 2 算法的并行性研究 2 l 1 并行縫的凝念 l 無論是數(shù)值計算 數(shù)據(jù)處理 信息處理還照人工智能的問題求解 都有 可能包含可以同時進行遠掉或操作的成分 把問題求解中具有可以同時進行 運算或者攆作的特性稱作弗行性 p a r a l l e l i s m 開發(fā)并行性的目的是為了能 送行勢行跫理 提毫售號處理熬麓力 斃熟 袋羯n 位詩冀器避紓掛位勢孿亍 運算鵑溱發(fā)是一位運算器遴行1 1 位運算的1 1 穰 毽是舞露懿壤念不髑疆于這 種靠資源的簡單重復(fù)上 慕廣義的理解是 只簇在同一時亥4 或是統(tǒng)一時間間 隔內(nèi)究成兩種或者兩種以上的工作 它們時間熬疊 就體現(xiàn)了并行性 所以 并行憔包括同時性和并發(fā)性兩重含義 同時性 s i m u l t a n e i t y 指兩個或者多 個事件同時發(fā)生 并發(fā)性 c o n c u r r e n c y 指兩個或者多個事件在同一時間間 隔內(nèi)發(fā)嫩 2 1 2 并行等級的劉分 從并行性實現(xiàn)的方法來劃分 并行顆粒從小到大可以分為 1 指令內(nèi)部并行 即一條指令內(nèi)部各種微操作的并行 2 指令闖并彳亍 即多祭搔令在菜一對刻域畿閹一對閩間隔魂勢謹執(zhí)季亍 8 任務(wù)逶翟黌行 多個任務(wù)或者程彥段之閹豹蒡霉撬行 4 作業(yè)或者程序闖弗行 多個俸 韭或者多遁程序之聞的并 亍執(zhí)行 作業(yè)或程序的并行性芙鍵在于并行算法 即怎樣將有限的硬件 軟件資 源有效地同時分配給正在求解的算法 任務(wù)或讖程級的并行性主甏討論如何 進行任務(wù)分解 指令之間的并行性主要解決指令問的相互關(guān)聯(lián) 指令內(nèi)部的 并行主臻取決硬件組成結(jié)鞫的設(shè)計 并行算法的表示方式就是在開始設(shè)計時 使嗣著行茲表達方法來撼逑一個算法 為了鑊算法達到最大款薺行凌 鍪須 仔細羲秀突數(shù)疆豹輻關(guān)往 熱萊算法茲冬拿臻 搴鞠互之闖沒有數(shù)據(jù)穗關(guān)往時 則它們程并行計算梳上可以在相同的時亥l 執(zhí)行 在一般情況下 镩個運算聞 存在商一定程度的相關(guān)性 它支配著計算的順序 用相關(guān)圖 d e p e n d e n c eg r a d h l 可以方便地反映出各個算法之間的相關(guān)性 最進行f p g a 實現(xiàn)信號處理研究 的基礎(chǔ) 2 1 3 賽瑗共 虧楚瑾鮑途鐙 實現(xiàn)并行處理的技術(shù)諗徑是各種各樣的 主攔有時間重疊 資源重復(fù)和 資源菇率等方法 時間重疊 t i m ei n t e r l e a v i n g 是在并行性概念中引入時間因素 使多個處 東南大學(xué)碩士學(xué)位論文 理器在時間上錯開 輪滾熏疊圭 奎使用同一資源的不同部分 蔽趣快矮件周轉(zhuǎn) 而贏銜速度 最典型的時聞重疊是流水線工作方式 時間重疊原則上不需要 重復(fù)增加硬件設(shè)備就可摁瀚系統(tǒng)性能 資源重復(fù) r e s o u r c er e p l i c a t i o n 是在并行概念中引入空間因索 通過重復(fù) 設(shè)置硬件瓷源來達到大幅度提高處理速度的目的 如設(shè)置n 個完眾相同的處 理器f p 秘 讓它們受弱一個控裁器控翻 控制器每撬牙一條指令就霹叛同對 譴各令始毽器對各叁分蠹戴黥數(shù)據(jù)寵或同一耱運算 資源共享 r e s o u r c es h a r i n g 是讓多個用戶按照一定時間間隔順序輪流遣 使用同一套資源 以提高t 陡能的整體性能 資源不僅限于硬件資源 同時包 括軟件 信息等 一般來說 這些實現(xiàn)并行的方法并不是孤立存在的 在一個算法并行性 中 穰經(jīng)同時包含著這幾種方法 所以 必須對算法進行并行度的分析 2 2 算法并行度分專囂 辣法是解題方法的精確描述 它是一組商窮規(guī)則 這些規(guī)則艦定了解決 某一特點問題的一系列邀髯 用f p g a 來實現(xiàn)信號處理算法就鼴用具有一定 互聯(lián)形狀的有限p e 的并行計算來解決某一閥題的有窮規(guī)則 所以為了用硬 圣孛鐿擒寐實瓔特定懿算法 必矮分輯數(shù)據(jù)闋的城關(guān)往穩(wěn)著囂度 鼯趲并行算法的主要方法有鞋下囂稚 溺 1 串行算法的矢量化 譙串行的編程語言中醴經(jīng)隱含了一個執(zhí)行的次序 這種次序會妨礙算法 在并行方式下執(zhí)行 但由于目前已經(jīng)有大量的信號處理和科學(xué)計掉的串行代 碼 用戶不希望用并行結(jié)構(gòu)重寫它們 因此采用矢量分析來提取審行代碼中 的并發(fā)燃豹方法得到了廣泛的應(yīng)用 矢量他編譯器將處理以事行謠蠢編制豹 源代弼 盡霹 遺產(chǎn)生勢攙筑器蠹令 主要蠢攀l 公霉豹a s c n x b u r r o u g h s 的b s p 用矢量伍編譯器凌提取算法酶內(nèi)在并發(fā)處理方蟊不是穰蠢散 導(dǎo)致 它得到的并行度一般都不理想 它的主要優(yōu)勢譙于能夠很好地利用串行代碼 2 直接的并行算法液示方式 與矢量編譯器通過提敬算法的內(nèi)在并發(fā)處理米得到算法并行發(fā)相比 用 戶 設(shè)計者在一開始就使用內(nèi)在的并行表達方式米描述 個算法要脊效得多 所以遮媳是算法著彳亍凄分褥豹主滾 有很多秘襲達成可蠲于表達勢毒亍鮑算法 其中憊瑟連續(xù)映照踅 豢露空下標豹遞霆冀瀵 并行程彥找鷂霸鞠關(guān)強f d g 法 由于相關(guān)圖分析能夠詳細研究計算中數(shù)據(jù)的相關(guān)性 同時能方便地將相 關(guān)圖的結(jié)構(gòu)轉(zhuǎn)化為脈動陣列結(jié)構(gòu) 所以相關(guān)圖分析在分析算法并行度 陣列 結(jié)構(gòu)設(shè)計等方面得到了廣泛的應(yīng)用 2 2 1 橇美圖艨瑾 相關(guān)圖 d g 是指能反映出各個計算之間相熒性的圖 它的分析借用了數(shù) 學(xué)中圈論的分析方法 它把具體的運算單元映射成為圖論中的節(jié)點 節(jié)點內(nèi) 的操作在相關(guān)圖中省略掉了 因為當(dāng)d g 用于將算法映射到具體的陣列處理 6 東鴦大學(xué)碩 學(xué)位論文 器時 節(jié)點內(nèi)的操作賦予了相同的處理荸元 節(jié)點之闖的路徑表示了數(shù)據(jù)的 相關(guān)憔 所以當(dāng)且僅當(dāng)d g 中不含環(huán)和環(huán)路時 該算法才是可以計算的 有 關(guān)圖論的術(shù)語定義 如節(jié)點 環(huán)路等在此不作疑體介紹 2 2 2 算法的相關(guān)圖分輯方法 盡管茸前已經(jīng)提出狠多由串行程序代碼擒造d g 的方法 慷藏瓣又自動 的方法仍是目前主要的研究目標 即如何提取 個算法中的所有操作的部分 次序從而得到一個d g 的描述 可以用時一窳下標表示的方法 根據(jù)節(jié)點具 有相同下標的特點 得到 個用于d g 的格形空間 然后算法的數(shù)據(jù)相關(guān)性 可以踟d g 中相互作用的鏹個節(jié)點的連線弧米駐式地進行表達 采閔對 空 下?lián)昧惴ㄋ蛯W(xué)穩(wěn)關(guān)圖分掇主要逶 遵毅下過疆寒實璦 f 1 算法靜遞羯住 從邋論上講 一個可計算函數(shù)本質(zhì)上是遴媧的 而導(dǎo)出一個薜法遞歸的 直接方法是用單賦值公式 即使得算法中的所肖變量在用程序執(zhí)彳亍的時候僅 被賦餓 次 以矩陣一矢凝乘法運算c a b 為例 a 為m 維方陣 b 為r r l 維 向量 可以寫成 毫 焉屯 為了使c 卜 直接依賴于c j n 口j 酢n 上式可以寫成 2 1 c j 一 一c 口y 群力 f 它鷯c 語言表達為 f o r i 鋤 溉l c i 1 0 f o r i 喲 i n i f o r i 0 0 m 0 c u 1 c u a i 0 水b i j 程序中c 的每個元素僅賦慎 次 因此該程序是單賦值代碼程序 將每 個 c y 依賴于一 矗 d 彭n 豹關(guān)系看作是穰予下檬空闖的各招應(yīng)交蘩之閥的 一條瓤 剽可敬獲褥蠶2 l a 所示轂穗關(guān)蠶 了 東南大學(xué)碩士學(xué)位論文 l234 11234 i 2 1 a 2 1 b 蓬2 1 矩薄一矢嫩黎法糖關(guān)圖 凌鬻孛儀表示了節(jié)熹之淘豹耱關(guān)經(jīng) 囊簿一個節(jié)點豹攥 箏翔凌d g 中被 省略 戳為當(dāng)d g 用于將算法映射到陣列處璐器時 節(jié)點內(nèi)部的操作將被賦 予相同的處理單元 當(dāng)然在d g 的計算單元同樣有并行性的研究問題 2 相關(guān)圖的局部化 廣播數(shù)據(jù)指一個數(shù)據(jù)在相關(guān)圖中被 廣播 到所有具有相同下標的點上 這意踩卷當(dāng)穩(wěn)關(guān)圖轉(zhuǎn)化為黲猁處理器時 在陣到處理器中將包含全弱通信 全懇運臻數(shù)器秘存在將侵雩囂浚零線設(shè)詩 程痔強行巍行交褥及其囂潦 弱幫數(shù)據(jù)是指一個變爨僅直接與相幫靜節(jié)患的變量相連 如鬃一個算法 的所有變量都是局部化的數(shù)據(jù) 則稱這個算法為局部化的算法 傳遞數(shù)據(jù)是指在一個變量在相關(guān)圖中不作修改而一直沿著弧線進行傳 播 廣播數(shù)據(jù)通過廣播數(shù)搬等值線 b r o a d c a s tc o n t o u r 相連 局郝化數(shù)據(jù)通 過局部弧線穗連 在楣熒蹋設(shè)計中豹一個重蠢憝廣搔數(shù)據(jù)豹局部化 逶過用 囂部弧線取代廣攆等蓬線 個金屬戇d g 羧 菝轉(zhuǎn)純成為一個建耀豹d g 般豹遞歸算法通露并不是隧局部純的形式繪出 很多裰芙豳都存在廣 播數(shù)據(jù) 如在圖2 l a 中矢麓b 的每個元素假酃 廣播 到所有輿有相同下 標的點上 即b 為廣播數(shù)據(jù) 而在規(guī)范的映射中 要處理的d g 成具有局部 相關(guān)的特性 因為一個非局部化的算法映射到陣列處理時 所得到的陣列很 可能檄求全局性互聯(lián) 為了保證得到一個局部甄聯(lián)的陣列 應(yīng)首先囂如弱部 化茲遴魍霧法 囂褥剜爨幫訖戇d g 蘸藩雖然存在一些嫠濾鵝算法局部往熬方法 毽壺一個 弱郝遞翔冀法 導(dǎo)出 個局部遞歸算法的閽題沒有完全解決 大多數(shù)的算法還帶裔一定的試 探性 如 一個比較簡單的局部化方法是用局部弧線代替全局弧線 來傳遞 廣播數(shù)據(jù) 對于圖2 l a 可以通過把b 修改為傳播數(shù)據(jù)的方法來局部化捅關(guān)圖 局 部化的程序如下所示 f o r 凈0 i n i c i 1 一o f o r 每q n i f o r j o j m 0 b i lj b i j c i j 1 c i j a i j i j 0 州七為旬寂一趲 芍 一 m 域 壤 m l l l j j 4 3 2 l 東南大學(xué)碩士學(xué)位論文 根據(jù)修改后的程序所畫的相關(guān)圖如圖2 1 b 所示 在圖2 1 b 中 b i 一 步一步地 傳播 到所有具有相同下標的節(jié)點上 中問不對其值做任何修改 在廣播數(shù)據(jù)局部化中 以下性質(zhì)和變換方法在算法的局部化中得到了廣 泛的應(yīng)用 f 1 1 移不變性 均勻性 算法的移不變性是指一個算法的d g 相應(yīng)于其下標空間所有節(jié)點的相 關(guān)弧與它們的位置無關(guān) 這意味著對下標矢量i l i 2 和j 若i l 處的變量依賴于 j l j 處的變量 則i 2 處的變量將依賴于i 2 j 處的變量 d g 的移不變性是規(guī) 范映射方法的基本假設(shè)條件 在排序算法中的大部分d g 是移不變的 2 可逆弧 如果所進行的運算是結(jié)合運算 則連接弧的方向是可逆的 在有些運算 中用調(diào)整可逆弧的方法來局部化d g 2 3 典型算法的相關(guān)圖分豐斤 1 2 3 從以上的分析可以得知 對于算法的相關(guān)圖的分析的典型步驟為 1 列出具體算法的數(shù)學(xué)表達式 2 得到表達式的遞歸模型 3 根據(jù)遞歸模型得到相關(guān)圖 4 相關(guān)圖的局部化 下面根據(jù)以上步驟來分析信號處理中非常典型的基本運算 相關(guān)運算和 矩陣相乘 2 3 1 卷積算法的d g 分析 卷積的定義如下 給定兩個序列 和以 j 0 l n 一1 兩個序列的卷 積為 y 圭 w 一女 j o l j 一 n 一1 2 3 即y 圭 刈j o 1 n 1 0 得到遞歸表達式為 y y 女 一 當(dāng)j o 1 n 一1 時 k 0 1 j j n 2 n 1 2 4 2 5 當(dāng)j n n i 2 n 2 時 k j n i 由于式 2 5 已經(jīng)是單賦值形式 因此可以得到d g 如圖2 2 a 所示 可 以看出它是一個全局數(shù)據(jù)相關(guān)的d g 東南大學(xué)碩 學(xué)位論文 u 3 u 2 u 圈2 2 卷援運冀鷦 逶 l 霪黻下的變純 霹疆方便迷我瓢簡鄙弧線取代廣 蠢簿穰線 y u k y 0 2 6 甜j u j l 2 霉 w k 1 磚一 校糖式 2 6 可醵的得到如圖2 2 b 所示稠獲避 由圖可見 w o u o 只與 相鄰節(jié)點進行數(shù)據(jù)傳遞 所以圖2 2 b 所示的周部化的相關(guān)圖 2 3 2 矩陣運算相關(guān)圖分析 兒2 1 簿警瓣矩薄黍法可蔽襲蓮耄洚c a b 汛q d 州b 2 7 k l 從上式可以看出 所有的乘法可以同時運行 因為這些乘法之間沒有任 何的楣美性 為了獲得最大的并行度 需要將蝓入數(shù)據(jù)轉(zhuǎn)播到捋令黎法器上 每個萊法器畜琵援轅入蘩警迄線 瑟以至少霰瑟2 n 3 條逶售連線 這對薄裂 處理器瀚資源要求太高 對予式 2 7 通過變換 可以寫成如下遞歸形式 掣kc a i k b 自 2 8 其中k 是遞歸下標 它躲程序?qū)崿F(xiàn)形式為 f o r i o i n l i f o r j 赫o i n 2 i f o r k o k n 3 k 十 c i j k c o d k 1 a i k b k d 從式中可以看出 a i j 將被廣播到所有具有相同的i 下標的和k 下標的節(jié) 1 0 東南大學(xué)碩 學(xué)位論文 點上 通過與上西相似形式 g l 入中闋交擻 程序改寫成 f o r i 0 i n i f o r j 一0 i n 2 i f o r k 0 k n 3 k a i j 固蝴 強l b 1 b i j p 兩昏1 0 p c i j k c i j k 一1 a i j k b i j k 掇攮這個莫法褥剩期強2 3 掰示款相熒強 么j l ka 廣 b 毪 強2 3 曩予艇簿黍法滋 圖中莊側(cè)所示為蜜璇矩陣乘法的相關(guān)圖 右側(cè)所示為相關(guān)圖其體絮點的 安驄形式 出國可見 翹關(guān)圖中各個節(jié)點必與輻鄰節(jié)點穗連 辨默露2 3 瘊 承鼴憊矩陣相乘酶弱鄢穩(wěn)關(guān)醋 參考文獻 l 糕羞爨 粱澆雯編著井符處瑗系統(tǒng)結(jié)穩(wěn) 中鏊辯攀緩米大學(xué)潦敝聿圭1 9 9 9 2 2s y k u n gv l s i a r r a yp r o c e s s o r s p r e n t i c eh a l l 1 9 8 8 e n g l e w o o dc l i f f s n e w j e r s e y 3 陳蓬良 陳竣編著v l s i 詩算理途與并毒亍算法 中溜秘學(xué)技術(shù)大學(xué)爨舨聿 1 9 9 t 合聰 4 沈緒榜編著數(shù)字傣譬她理計算機 宇航 拈版社 1 9 9 1 北京 5 淀縫耢縭著超丈甄摸袋殘系絞設(shè)計 科學(xué)爨救社 1 9 9 1 l 索 東肖大學(xué)碩士學(xué)位論文 3 脈動陣列處理器設(shè)計 3 1 陳列信號處理器 瞧畿評估參數(shù) 1 在傳統(tǒng)的事霞算法孛 主要贅幢戇評徐參數(shù)楚運霎瑟震茲瓣麓鼓及運算 過程所辯的存儲量 其中計葬時聞?wù)甲钪匾?瞧位 對于單處璜機來說這種 方法鼴含適的 但是對于陣列信號處理器 使用運算單元是具有一定互連的 大量p e 它的計算時間的減少是以增加硬件為代價的 因此 運髀時間不再 是評估陣列處理器算法性能的唯一的主要標凇 陣列信號處理的評估主要在 于算法的執(zhí)行對間與芯片灝積兩個閹題 在p 飄互連規(guī)則且簡單的條件下 芯冀蘸承戇大棗可敬近 毀熄建p e 令數(shù)來衡量 緩浚菜個陣弼處理器慰菜個算法熬藏行辯瀾為f 芯片面較掩a 辯予 算法性熊的評估標準是a 和t 的函數(shù)f a t 檄據(jù)不同的應(yīng)用情況可以設(shè)計 不同的評估函數(shù)f 從而得到不同的評估參數(shù) 以n 表示計算問題的艦?zāi)?p n 表示處理機的數(shù)目 以它近似衡量芯片 面積a 下面給出了從不同角度反映陣列處理算法的性能 1 麴速斃s 櫛 加速眈s 印 的定義憝 s n t l n i t p n 3 i 式中 墨 n 為最快的串行算法在單處理器上運彳亍時間 l n 為并行算法在p 母楚毽囂 運行茲運行露鬻 熱速院 豹意義在于表示勢行霧法魏蠢效瀅 用黻魔豢并行性對計算時閥的改進程度 在理想情況下 一個菸幫算法使用 p n 個處理機應(yīng)該比串行算法使用一個處理機快p n 倍 但除極個別情況外 實際速度的提高要少得多 在一般情況下 有 1 蔓s p n j p 月 2 效率五 n 效率鼢定義為 e p h s n p n 3 2 效率 表示用多少處理機才取得某種速度的提高 可用以度量處理能力發(fā) 揮的穰度 一般情況 有 0 e n l 3 冗余震露 冗余度r 砷 的定義為 衷裔大學(xué)硬 攀位論文 露 q g 珂 3 3 其中q h 為串行算法的總運算次數(shù) g n 為并干亍算法的總運算次數(shù) 冗余 度淡示了姆串雩亍算法潑為勢行冀法輯增期媳數(shù)值穩(wěn)定性豹壤搴越丈 4 速效積膨 n 麴速蹴幫效率褻個參數(shù)雖然酃可以用來評繼勢行算法 綴墩存在不是之 處 因為邋常處理祝數(shù)霹越多 加速就越大 僮簸遐梳的效率綴褂能隧之降 低 而效舉雖然反映了處理機利用率這一因素 但當(dāng)p n l 時 e n 也等 予1 強憩不藐滋效零越大蔥始 一拿蟹戇勢孬霧滾應(yīng)該霞蜃 秘s p 都 比較大 因此定義速效襁為 m p m e p 醇s p 3 4 這個參數(shù)即反映了加濾比 也反映了效率 3 2 陣列信號處理翥蕃設(shè)詩灌剩 麩簿列售號簽理囂熬譯徐參數(shù)霹戳褥剿蓐捌簸毽器熬竣詩建瓣憊繕囂 露 通信 存儲和輸入輸出 凝體來說主戮從以下幾個方面束作竣優(yōu)設(shè)計的 考慮 1 最大并行度 對于襲璐出比較高并行度的算法 用降剿信號處理器 泉寵成是魄較合適懿 溺潛在浚毒 陣礤楚遴耬薅要爨丈疆菠羹蠡德蘩冀滾豹并 行度 最大流水栽力 在計算密集型算法中 流水處理撂到了廣泛的慰題 露整褒簿戮信號簽疆中 勢毒亍穗是逶遙滾承處理褥到豹 困j 逄陣弼僖專處理 必 藏在預(yù)知數(shù)據(jù)相關(guān)髖 得到算法并行度和流水性的基礎(chǔ)上設(shè)計 3 計算 通信和存儲間的平衡 一個好的陣列算法應(yīng)該究分地平衡不 同遴信擺次掰承擔(dān)的不閩帶寬 以避免數(shù)搬消耗 計算和各冪申邋信豢寬之聞 懿平衡對予簿歹l 算法采說極為薰要 輯 數(shù)值特性和爨化效應(yīng) 數(shù)值計算與計算楓的字長 筏瘸簿法肄因素 褰關(guān) 鬈用數(shù)毽量化輯產(chǎn)燮鵑繁位效應(yīng)會對結(jié)巢產(chǎn)生影豌 如農(nóng)求鯔線性方 程縫中 q r 分解諾予l u 分解 僵在薄捌倍號處遐中 q r 要眈l u 分解花 費爨多時間 3 3 脈動薄碉籬余 3 3 1 脈動陣列定義 2 1 從1 9 7 8 年開始 熒國卡內(nèi)熬一梅隆大學(xué) c m u 的h t k u n g 等人在研究 東南大學(xué)碩 學(xué)位論文 冀浚詩冀與專用蔥靖憋髂象終穩(wěn)粒關(guān)系時 姆詩冀 壬務(wù)按照逶麓與計舞豹跑 熏不閽分為受計算限制 c o m p u t a t i o n b o u n d 靜祁受輸入 輸融隈制 i o b o u n d 的兩大獺 脈動陣列主要針對受計算限制的問題而提出的 脈動陣列由一組簡單的 燕復(fù)的p e 構(gòu)成 每個p e 能夠執(zhí)行固定的 簡 蘩瓣襟 每 每個p e 哭與甥鄰弱p e 有援列媳連接 狳了掇少數(shù)遺賽上豹p e 外 所有隨酃的p e 鷯斑部梅遺都是一樣瓣 進入 輸出薛戮的數(shù)擺必須在 邊界上的p e 進行輸入 輸出 脈動陣列中邋避有規(guī)則的 局秘的p e 閱相互 運緩褥裂 這 孛特蛙搜之褥凝逡合藹v l s i 技術(shù)寒實璦 關(guān)于脈動陣列的定義有很多 s y k u n g 給出的定義為 脈動陣列慢一個具有如下特性的計算機網(wǎng)絡(luò) 1 同步性 通過網(wǎng)絡(luò)的數(shù)據(jù)是有節(jié)奏性地被計算 由一個全局時鐘定 黲 纛黃遴 2 禳塊億與援則純 陣捌是由帶有穩(wěn)勻互連拓抒的模塊純處理葷元組 成 計算網(wǎng)絡(luò)可以無鞭擴展 3 空麓局部毪與辯闥兩辯往 簿確內(nèi)辯耪交鱉豁局部逐倍雛形式互連 接成某種結(jié)構(gòu) 即空間局部性 信號從一個節(jié)點傳送到下一個節(jié)點中 至少 具有 個單位時間的延遲 4 加速比 陣列熙霄線投速率的流水熊力 靼處理器逮攀達到o m 豹 鴦蟊邃魄 藪中m 是楚瀵囂萃露個數(shù) 3 3 2 脈動陣裂基本縫穩(wěn) 脈動陣列的原理如圖3 l b 所示 數(shù)據(jù)從存儲器中有規(guī)則地壓入陣列 綴過諍多逡成流水線豹攜 沿途褥到一系列連續(xù)豹處理 a b 圖3 1 鑫 鑄筑瓣詩算秘絡(luò)穩(wěn)泊 稼動陣列綣搗 辣動黲列豹毒效瞧露以逶越以下筑鍘予蠢效圭 羹淡鞠 豳3 l 中 每個p el 蔓2 0 n s 的時鐘周期工作 譙傳統(tǒng)的存儲囂玻b 聯(lián)豐幾結(jié) 構(gòu)圖3 1 a 中 系統(tǒng)最商的運辣性能為5 0 萬次 秒 在同樣的時鐘效率下 脈 動眸列的3 一l b 可以接邋于2 5 0 萬 秒 性跳的提高主要是增加了流水線處理 懿繚祭 一蓬數(shù)疆默存德群中聯(lián)鲞薺塞邊器上懿p 囂送入薄殘 宅就按滾東 線方向治饕陣列從一個p e 傳送到相鄰的p e 并巍所經(jīng)的p e 得到有效 充 分的應(yīng)用 瓤麓薄魏實際上爨巢整冀法豹硬籜囊攘實鞴 它季巴算法中疆含懿搽 乍并 行性用具有同樣邏輯功能的p e 通過簡單 規(guī)則的通信局部互逑起來的陣列 來實現(xiàn) 這樣的陣列除了連接的幾何形狀有所變化外 在陣列內(nèi) 無論數(shù)據(jù) 1 4 東麓大學(xué)碩 學(xué)位論文 轅入數(shù)據(jù)流或者結(jié)粟數(shù)提流的速度與方商都蠢掰變化 這是傳統(tǒng)豹流水線結(jié) 構(gòu)所沒肖的 在功能上 個這樣的陣列相當(dāng)于軟件中含有循環(huán)語句的過程 由于算法被陣列固化了 戴中不含有軟件成份 筵個陣列作為一個功能單元 脈動陣列可以解決一大類基本的計算問題 其中包括絕大部分的矩陣運 算 數(shù)字信號與圖像處理的相關(guān)及其許多數(shù)值遣簿 p e 的內(nèi)部操作與計算可 攫據(jù)冀浚敬不同兩冥 3 3 3 脈動陣列的適用性 脈動陣列實質(zhì)上是一種線性時間陣列 數(shù)據(jù)在陣列內(nèi)相鄰的p e 之間流 動 對時 處處都用相同的聰間單位 即它的數(shù)鍵流動的頻率是繇定的 因 照 蘞l 鱒算法只要 l 夠在代數(shù)空閹撬到一令線瞧表示 就至少存強一釋稼動 陣剄綴構(gòu)采實璦它 由于在脈動陣列中 數(shù)據(jù)從存儲器中有規(guī)則地壓入陣列 經(jīng)避許多連成 流水線的p e 沿途得到一系列連續(xù)的處理 所以它的數(shù)據(jù)運動是周部的 即 在這個p e 中的運算導(dǎo)致的數(shù)據(jù)改變不會影響尉續(xù)的p e 運算 所以對于數(shù)據(jù) 運動具肖全局性的算法 很難找到一種合適的脈動陣列結(jié)構(gòu) 戩饞里時變換為弼 離數(shù)傅立時變換 d e f 的表示是線性的 窀躺數(shù)據(jù)運 動具蠢鯔部經(jīng) 瑟戮綴容器我鍪l 瑟羲簿甍豹繚魏皋實瑗 毽是在捩邃繕立跨 交換中 措薯 它懿數(shù)據(jù)遮凌其有全局性 期拽不妥一萃孛脈動陣列繡構(gòu)來實 現(xiàn) 相必的研究表明 用脈動陣列實現(xiàn)的d e f 的運算速度接近f f t 的運算 速度 這從另一個方面表明了脈動結(jié)構(gòu)的有效性 而且絕大部分的燧算無法 找到一種類似于f f t 一樣性能得到巨大提高的快速算法 在v l s i 計算中 脈動孵列結(jié)構(gòu)發(fā)揮了巨大的作用 歉幼蓐列免豫了形成數(shù)鍵滾蔚器豹控翻開鐓 陣列內(nèi)p e 閩黲趟部連接 方式 餿褥薄鬟辛弱受載均鐲 連接輟短 最大羧度遮藏鄉(xiāng)了系絞癱懿囂逶 信延時 提商了p e 的莉藤率 使整個陣列的系統(tǒng)性能褥到充分的發(fā)揮 醫(yī) 此 這種結(jié)構(gòu)得到了普遍的重視 國外設(shè)計完成的脈動陣列處理機有 美國 c m u 的可編程脈動陣列機w a r p s a x p y 公司設(shè)計的m a t r i x 一1 e s l 公司設(shè)計的 脈動陣列機 其中 c m u 的w a r p 由多個高性能的處理機構(gòu)成 熬個陣列機 的平均處理能力達到l 億次 穢 它可應(yīng)用于數(shù)字圖像處理與識別 數(shù)字信號 處瓔 入王智能等方面 3 4 脈動陣列結(jié)構(gòu)設(shè)計 脈幼陣列的設(shè)計主要是如何設(shè)計一個陣列機構(gòu)用于完全表達隳法內(nèi)部所 固有的并行性和流水性 相關(guān)圖用圖形的形式反映了數(shù)據(jù)的流水性茅n 相關(guān)性 菸競誨對其結(jié)擒作一定修敬 織阻辣動籜列豹浚詩的主要方法熒翔俺通過投 影彝交羧整d g 轉(zhuǎn)證到稼鞠辮列結(jié)茲 脈渤陣列的結(jié)構(gòu)可猷通過相關(guān)圖直接導(dǎo)出 許多文獻論述了從相關(guān)圖導(dǎo) 出脈動陣列的映射方法咧 4j 5 對于比較復(fù)雜的算法 常用的方法魑通過相關(guān) 圖得到信號流目f l s f g 掰從信號流圖映射到脈動陣列結(jié)構(gòu) 表泰大學(xué)硬圭學(xué)位論文 3 4 ld g 弼s f g 映瓣 為了彳導(dǎo)到局部遞歸算法的有效陣列結(jié)構(gòu) 種直接的設(shè)計方法是譙d g 的舔 個節(jié)點安排一個合理的p e 但這樣會使p e 的利用率比較低 因為每 令p e 只巍詩霧對蠢懿少部分聚闥鏈子激活狀態(tài) 為了鬟裹p e 使蠲搴 霰 要道過變抉將d g 的節(jié)點映射辯較少量的p e 上 一個比較菇豹方法楚轉(zhuǎn)化 為饋號流圈 倍號滾鬻 s f g 楚瀣經(jīng)瓔葦點 逶僖邊稻延逡環(huán)縫殘戇 一個s f g 攆 述包括了功能描述和結(jié)構(gòu)描述 功能描述定義了節(jié)點內(nèi)的行為 結(jié)構(gòu)描述定 義了節(jié)點間的互聯(lián)方戲 與d g 相比 s f g 具有如下特征 1 s f g 比d g 簡滾 2 s f g 更接近予癸舔熬琰俘設(shè)詩 窀藏葬重 塾決定了將婺獲繕靜陣捌類 型 0 3 6 公式 3 5 表示所有相關(guān)弧以相同的方向流經(jīng)超平面 公式 3 6 表示超平 面與投影矢量不平行時 調(diào)度才是可允許的 第一個條件表明了如果節(jié)點p 依賴于節(jié)點q 則安排給p 的時間步不能小于安排給q 的時間步 第二條件意 味著在一個等時間超平面上的所有節(jié)點將不會投影到同 個p e 上 3 4 2 典型算法的信號流圖設(shè)計 3 4 2 1 卷積算法的信號流圖設(shè)計 對于圖2 2 所示的卷積相關(guān)圖 考慮到其d g 形狀 采用下面的下標變 換 搠 3 7 如圖3 2 所示 坐標變換后結(jié)果是一個矩形的d g 可以看出沿著各w i 的系數(shù)是保持不變的 這意味著w i 可以當(dāng)作常數(shù)存在第i 個處理器中 所 以可以沿著 o1 方向上的投影得到了如圖3 3 a 所示的卷積s f g 圖 同理 可以沿著 1o 方向投影得到另一個s f g 如圖3 3 b 所示 u 3 u 2 u 1 u 0 吖o 州1 w 2 3 圖3 2 坐標變換后用于卷積的d g 東南大學(xué)碩士學(xué)位論文 掰嬲器項游壁韻 a i l 坤醐醐 霹鷂蒗馨鍪量f 硼卿 1 渤 a r s f gi b 卷積s f gi i 瘸3 3 卷積遴冀s f g 表示 3 嬉 2 2 短陣算法的德芍流麟設(shè)計 對于圖2 3 所示的矩陣桊法d g 通過對 o 0i 方向進行投影 一個單位 延遲袋示k 下標的一個增德 得到如圖3 4 所示的s f g 結(jié)構(gòu) 圖中a b 沿著 正方形簿弼瓣對廣播 兩穰桊褥翻靜積豹瀾透過 個帶廷逡麴繇逶符反餿 毫箱赴 a 2 2a z a 4 4a 4 3a 4 2a 4 閨3 4 矩陣柒滾s f g 的割集 3 碡 3s f g 到陣列緞構(gòu)的映射 s f g 在結(jié)構(gòu)上已經(jīng)非常接近脈沖陣列t 大多數(shù)s f g 的主簧缺陷是他們 不麓懿時藏筠幫健懿澎式繪懣 馨需要羹定瓣序鑊褥s f g 交捺為一個等羧的 時間局部他形式 繇以霹予躲囊終磷鞠髂每浚瓣的關(guān)系可黻鬟蠛 脈渤陣列 s f g 陣列 瀛水踅定時序 熏定辯序楚要穗s f g 疑按為 個等效酌拜雩黼麓韶純形式 鞘 繁定薅黲懿 方法
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 12.1 課時1 分式及其基本性質(zhì) 基礎(chǔ)知識精練
- 15.2 二次根式的乘除運算 基礎(chǔ)知識精練
- 鍍鎳合金套塑柄斜嘴鉗項目投資可行性研究分析報告(2024-2030版)
- 中國滑線輪行業(yè)市場發(fā)展前景及發(fā)展趨勢與投資戰(zhàn)略研究報告(2024-2030)
- 2025年中國飾件行業(yè)市場發(fā)展前景及發(fā)展趨勢與投資戰(zhàn)略研究報告
- 2021-2026年中國增程式電動汽車市場深度分析及投資戰(zhàn)略咨詢報告
- 中國強力磁療貼行業(yè)市場發(fā)展前景及發(fā)展趨勢與投資戰(zhàn)略研究報告(2024-2030)
- 中國海洋石油工程裝備行業(yè)市場調(diào)研及投資戰(zhàn)略規(guī)劃建議報告
- 中國VGA散熱片市場競爭態(tài)勢及行業(yè)投資潛力預(yù)測報告
- 2023-2028年中國夾竹桃行業(yè)市場深度研究及投資戰(zhàn)略規(guī)劃建議報告
- 立式加工中心的基本操作專題培訓(xùn)課件
- 一例慢阻肺病人護理個案
- 建平中學(xué)自招真題解析
- 阿克蘇地區(qū)生態(tài)環(huán)境準入清單
- 產(chǎn)品創(chuàng)新設(shè)計與實踐完整版課件全套ppt教學(xué)教程電子教案講義最全(最新)
- 漢字起源和發(fā)展
- 試運行方案計劃-
- 法蘭規(guī)格尺寸表國標,美標
- 動物疫病流行病學(xué)調(diào)查表診斷送檢用
- 模具技術(shù)要求
- 廣東省公務(wù)員錄用審批表
評論
0/150
提交評論