![基于FPGA的多時鐘片上網(wǎng)絡虛擬直通路由器設計_第1頁](http://file4.renrendoc.com/view/2fdd45f30dde7b49f83f2442712367a0/2fdd45f30dde7b49f83f2442712367a01.gif)
![基于FPGA的多時鐘片上網(wǎng)絡虛擬直通路由器設計_第2頁](http://file4.renrendoc.com/view/2fdd45f30dde7b49f83f2442712367a0/2fdd45f30dde7b49f83f2442712367a02.gif)
![基于FPGA的多時鐘片上網(wǎng)絡虛擬直通路由器設計_第3頁](http://file4.renrendoc.com/view/2fdd45f30dde7b49f83f2442712367a0/2fdd45f30dde7b49f83f2442712367a03.gif)
![基于FPGA的多時鐘片上網(wǎng)絡虛擬直通路由器設計_第4頁](http://file4.renrendoc.com/view/2fdd45f30dde7b49f83f2442712367a0/2fdd45f30dde7b49f83f2442712367a04.gif)
![基于FPGA的多時鐘片上網(wǎng)絡虛擬直通路由器設計_第5頁](http://file4.renrendoc.com/view/2fdd45f30dde7b49f83f2442712367a0/2fdd45f30dde7b49f83f2442712367a05.gif)
下載本文檔
版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
基于FPGA的多時鐘片上網(wǎng)絡虛擬直通路由器設計在FPGA上設計一個高性能、靈活的、面積小的通信體系結構是一項巨大的挑戰(zhàn)。大多數(shù)基于FPGA的片上網(wǎng)絡都是運行在一個單一時鐘下。隨著FPGA技術的發(fā)展,Xilinx公司推出了Virtex-4平臺。該平臺支持同一時間內32個時鐘運行[1],也就是說每個片上網(wǎng)絡的內核可以在一個獨立的時鐘下運行,從而使每個路由器和IP核都運行在最佳頻率上。因此適用于設計多時鐘片上網(wǎng)絡,實現(xiàn)高性能分組交換片上網(wǎng)絡。1多時鐘片上網(wǎng)絡架構的分析片上網(wǎng)絡結構包含了拓撲結構、流量控制、路由、緩沖以及仲裁。選擇合適網(wǎng)絡架構方面的元素,將對片上網(wǎng)絡的性能產生重大影響[2]。(1)網(wǎng)絡拓撲:在設計中,選擇Mesh拓撲結構。Mesh結構擁有最小的面積開銷以及低功耗的特點。此外,Mesh的線性區(qū)的節(jié)點數(shù)量規(guī)模大以及通道較寬。同時,Mesh也能很好地映射到FPGA下的底層路由結構,降低了FPGA邏輯擁塞和路由器的功耗。(2)流控機制:虛擬直通和蟲洞技術(不像存儲轉發(fā))有數(shù)據(jù)包的延時與路徑長度成正比。然而,與復雜的蟲洞路由器相比,虛擬直通的路由器更加適合于設計的實現(xiàn)。因此,選擇虛擬直通流量控制機制作為路由器的流量控制機制。相比較蟲洞機制,它能支持更高的吞吐量,在堵塞時能更有效地釋放緩存。此外,虛擬直通流量控制低延時的高信道利用率,與此同時并不保留物理通道。(3)路由算法:選擇XY算法作為設計所采用的路由算法。該算法中分組的路由只取決于源節(jié)點和目的節(jié)點的地址,而與網(wǎng)絡狀況無關。當使用算法時首先在X維上進行路由,當?shù)竭_與目的節(jié)點同一列時,轉向在Y維上的路由,最后到達目的節(jié)點。該算法對硬件要求簡單和實現(xiàn)容易,在網(wǎng)絡流量不大時,具有較小的時延,能夠有效避免死鎖和活鎖。(4)仲裁機制:輸入端口分配是基于簡單的Roundrobin[3]機制。上次接收或解決接收的端口會放在隊列的末端。切換時到下游的數(shù)據(jù)包。當交換數(shù)據(jù)包時,F(xiàn)IFO的虛擬通道也遵循這種機制。2路由器微節(jié)點結構的設計多時鐘片上網(wǎng)絡的路由器由5個輸入端口、交叉點矩陣和中央的仲裁器三部分組成。除了頭譯碼邏輯,5個輸入端口都是相同的。由于設計中采取了虛擬通道流控機制(VCS),因此輸入端口就必須包含仲裁邏輯。與此同時,輸入端口還應包含輸入緩沖區(qū)來存儲輸入的數(shù)據(jù)包。2.1數(shù)據(jù)包利用XilinxblockRAM,設置深度為16的FIFO(先入先出隊列),數(shù)據(jù)包的大小能在24位與128位之間變化,每個數(shù)據(jù)包header(包頭)占用一個flit(數(shù)據(jù)片)。flit的大小固定在8位。數(shù)據(jù)包頭包含路由目標地址、flit的類型以及部分數(shù)據(jù)包。設計中采用的虛擬直通流量控制需要1位去指定數(shù)據(jù)片的類型。路由器支持可變化大小的數(shù)據(jù)包,通過編碼將數(shù)據(jù)包的大小編譯為字段,作為bRAM所需要的部分,放在數(shù)據(jù)包頭部。每個IP核的網(wǎng)絡接口(NI)起到存儲在數(shù)據(jù)包頭部的信息的作用。當需要更高粒度數(shù)據(jù)包時,部分數(shù)據(jù)包的位數(shù)以及寬度將會相應的增加。增加部分數(shù)據(jù)包的位數(shù)的同時也提高了緩存的利用率。數(shù)據(jù)包首部保留的位數(shù)將用于實現(xiàn)基于優(yōu)先級的流量控制。2.2輸入端口路由器有5個輸入端口,通過端口分別與內核及鄰近的路由器通信,這5個端口按在方位可分為本地(L),北(N),東(E),南(S),西(W)。每個輸入端口可以支持虛擬通道多路復用,相關聯(lián)的仲裁器,以及頭譯碼邏輯,從而作出路由決定。如圖1,輸入端口的3個主要組成部分分別是虛擬通道選擇器、FIFObRAMs以及bRAM仲裁器。虛擬通道選擇器:決定輸入端緩存的使用空間的決定權在虛擬通道選擇器。當數(shù)據(jù)包大小以編碼形式傳播時,虛擬通道選擇器接收數(shù)據(jù)包的首部。當虛擬通道選擇器收到來自上游路由器或者來自自身核心的數(shù)據(jù)時,虛擬通道選擇器就會拿數(shù)據(jù)包的大小跟虛擬通道目前可以容納數(shù)據(jù)包的大小進行比較。這么做的目的是為了能夠使輸入的數(shù)據(jù)能夠符合FIFO中write_count的大小。如果有足夠的空間存在,則虛擬通道選擇器將同意輸入請求,同時反饋信息。在此過程中,虛擬通道選擇器還設置了輸入端解復用器。解復用器的作用是使數(shù)據(jù)包從輸入通道傳輸?shù)秸_的復用器的輸入緩存中。FIFObRAMs:在所設計的路由器中,緩沖區(qū)的深度將參數(shù)化,在試驗時同時將其深度設置為16。這些緩存區(qū)將被作為bRAMFIFO的存儲器,同時起到以下作用:(1)緩沖部分或者全部到來的數(shù)據(jù)包,以及當下游開關可以用時,傳送頭部及緊跟的flit。
(2)劃分路由器核心以及路由器的頻率,從而支持一個多時鐘的網(wǎng)絡設計。
(3)通過仲裁器監(jiān)察write_count端口的信息,來實現(xiàn)支持可變化大小的數(shù)據(jù)包。在緩沖區(qū)有單獨時鐘域的情況時,就需要一種有效的方式實施完整的或者空的邏輯。通過以下方式使控制信號同步:(1)發(fā)送數(shù)據(jù)包粒度作為一小部分FIFO的空間。
(2)在一個時鐘周期內,一個連接終止之前設置flit的尾部位。在所使用的FPGA設計中,由于支持FIFO的最小深度是16,所以它適合于在虛擬直通中緩沖整個數(shù)據(jù)包。write_count的空和滿狀態(tài)信號將集成在FIFO中。在一個多數(shù)據(jù)包的緩沖區(qū)中加大存儲flit的能力,將有助于提高FIFO的利用率。此外,獲得網(wǎng)絡的吞吐量的增益,是由于上游連續(xù)包釋放緩沖區(qū)所促成的。圖1輸入端口設計圖bRAM仲裁器:輸入端口還包含了控制邏輯作出的仲裁決定。當選擇一個非空的bRAM時,簡單的Round-robin的方式仲裁算法將會啟用。當選擇bRAM時,F(xiàn)SM將會送出頭部flit,解碼出它的目的地址,并發(fā)送相應的要求。在所設計的路由器中采用XY路由算法將大大簡化了解碼器的邏輯結構。根據(jù)XY路由算法的通行路徑許可,即將釋放的請求線將會減少。頭譯碼器:在XY路由算法中,頭數(shù)據(jù)片一開始往X軸方向走,當?shù)竭_X軸所在的目標地址時,就會往Y方向走。所有緊隨著的數(shù)據(jù)片將以流水線的方式跟著頭數(shù)據(jù)片移動。這種簡便的XY路由算法適用于減化頭解碼器、交叉點矩陣以及中央仲裁器的邏輯結構。以上簡化得邏輯結構將使FPGA的芯片數(shù)顯著減少。2.3交叉點矩陣設計一個多路交叉點矩陣,目的是為了減少面積的使用。而另一種設計是支持復分解虛擬通道的交叉點連接。后一種方法,產生高網(wǎng)絡吞吐量,但要增加一個重要的復雜性開關。交叉點支持并行連接,以及被用于通過中央仲裁器支持多個信號同時請求。并非所有的交叉點連接都是使用XY路由算法。經過邏輯優(yōu)化,如圖2所示設計中實施簡單的4和2輸入多路復用器開關(分別是L、N、S、E以及W端口)。上述優(yōu)化方案減少了交叉點面積,使其使用的切片只有32片。因此,達到路由器面積顯著減小的目的。圖2交叉點矩陣輸入端口的分配方式將采用簡單的Round-robin仲裁機制。對上一次接收過的或沒有用到的端口將給予最低優(yōu)先級,并排在隊列的最末端。將通過以下的方式提高路由器的性能:(1)降低中央仲裁器的邏輯復雜度;
(2)盡量集中仲裁器,以減少req/grant信號的數(shù)量。在設計中減少邏輯復雜度以及布線,從而減少數(shù)據(jù)堵塞,達到提高性能以及減低功耗的效果。3性能分析利用Virtex-4系列中XC4VLX100-11[4]設備進行設計,利用XilinxISE8.2i進行綜合布局布線。使用ModelSim6.1c[5]驗證所設計的功能。設置了單一時鐘和多時鐘進行了模擬,分析多時鐘片上網(wǎng)絡的性能。由于路由器是直接連接到內核,所以沒必要考慮片與片之間的延時而去估計最高的頻率。所設計是由一個路由功能模塊(RFM)執(zhí)行[6],用以準確地估計工作頻率,基本路由器的單機版工作頻率可到達357MHz。因此8bits通道的路由器的吞吐量最高可達2.85Gbits/s。在所設計的路由器中,頭數(shù)據(jù)片前進到下一個節(jié)點,而剩下的數(shù)據(jù)片以流水線方式流通。在計劃中,網(wǎng)
絡延時僅僅與路徑長度H(跳躍點數(shù)量)有關。在信道爭用的情況下,網(wǎng)絡延時L可以用以下方式計算:L=7×H+B/w(1)公式(1)中,B是數(shù)據(jù)包的字節(jié)數(shù),w是每個時鐘周期轉換的字節(jié)數(shù)。參數(shù)7是在多時鐘片上網(wǎng)絡路由器中安裝在每個路由器跳延遲支付。這個延時是因為基于數(shù)據(jù)包中的頭數(shù)據(jù)片的解碼和仲裁執(zhí)行所導致的。為了評估所設計的多時鐘架構的性能,將利用所設計的路由器的VHDL模型,模擬一個3×3Mesh結構,在本身頻率下執(zhí)行包裝產生的數(shù)據(jù)包。路由器的頻率值會在拓撲結構合成,布局和布線階段完成之后得出。對于不同的配置(資源的可用性、跨路由器的距離、bRAM/dRAMFIFO的版本),路由器的頻率可以降低高達18%[6]。圖3顯示了單一時鐘與多時鐘,在延時與注射速率關系中的曲線圖。在單一時鐘時,網(wǎng)絡的頻率為286MHz。而在多時鐘時,頻率的范圍是從286MHz~357MHz。圖3中,X軸表示的注射率是在一個周期內每個節(jié)點注入flit的數(shù)量。Y軸曲線測量的是每個實例中數(shù)據(jù)包的平均延時。可以看出,所提出的多時鐘片上網(wǎng)絡相比單一時鐘片上網(wǎng)絡的性能顯著增加。4結語本文介紹了一個基于FPGA的高效率多時鐘的虛擬直通路由器,通過優(yōu)化中央仲裁器和交叉點矩陣,以爭取較小面積和更高的性能。同時,擴展路由器運作在獨立頻率的多時鐘NoC架構中,并在一個3×3Mesh的架構下實驗,分析其性能特點,比較得出多時鐘片上網(wǎng)絡具有更高的性能。參考文獻[1]Virtex4PlatformFPGAHandbook,August2006,Xilinx.
[2]JoseDuato,SudhakarYalamanchili,LionelNi.Intercormec-tionNetworks:anEngineeringApproach,MorganKaufmann,2003
[3]A.Jantsch,H.Tenhunen.NetworksonChip.Kluwer
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 醫(yī)藥行業(yè)運輸協(xié)議模板
- 體育館裝修終止合同協(xié)議書
- 商業(yè)街區(qū)改造開發(fā)居間合同
- 水上清潔服務合同范本
- 成品油內河運輸協(xié)議
- 校園食堂裝修工程合同
- 教室環(huán)保石膏吊頂裝修協(xié)議
- 保健食品居間代理協(xié)議
- 路塹石方爆破施工方案
- 合同范例不需審查
- 寧騷公共政策學完整版筆記
- 走進奧運奧運知識簡介
- 項目負責人考試題庫含答案
- 光伏發(fā)電項目屋面作業(yè)安全檢查表
- GB/T 7251.5-2017低壓成套開關設備和控制設備第5部分:公用電網(wǎng)電力配電成套設備
- 2023年湖南高速鐵路職業(yè)技術學院高職單招(數(shù)學)試題庫含答案解析
- 中考語文非連續(xù)性文本閱讀10篇專項練習及答案
- 勇者斗惡龍9(DQ9)全任務攻略
- 經顱磁刺激的基礎知識及臨床應用參考教學課件
- 小學語文人教四年級上冊第四單元群文閱讀“神話故事之人物形象”PPT
- ISO 31000-2018 風險管理標準-中文版
評論
0/150
提交評論