版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、1、若有一靜態(tài)多功能流水線分為6段,如下圖所示,其中乘法流水線由1、2、3、6段組成,加法流水線由1、4、5、6段組成。使用流水線時,要等某種功能(如加法)操作都處理完畢后才能轉(zhuǎn)換成另一種功能(如乘法)。 若要計算:AB=(a1+b1)(a2+b2)(a3+b3) 問:(1)在上述流水方式下,完成AB需多少時間?畫出時空圖并計算此流水線的使用效率和吞吐率。 (2)與順序運算方式相比,加速比為多少?, 2,T,解: (1),1,2,3,4,1,2,3,4,4,5,5,5,1,2,3,1,2,3,19 ,S,6,1,2,3,4,5,4,5,完成A*B需要的時間=19 ,效率為:,吞吐率為:,(2)
2、加速比為:,2、已知某單功能非線性流水線的預(yù)約表如下圖,要求: (1)列出禁止表F和沖突向量C。 (2)畫出該流水線狀態(tài)圖,確定其最小平均延遲以及此時的調(diào)度方案? 當(dāng)按此流水調(diào)度方案共輸入8個任務(wù)時,則其實際吞吐率為多少?,附圖,解:(1)禁止表F=4 沖突向量 C=(1000) (2)最佳調(diào)度策略(1,1,1,5) 吞吐率=8/17t,=5,=5,=5,=5,=5,=5,=5,=5,1,2,3,2,3,3,1,3,2,1,1,2,各種調(diào)度方案及其相應(yīng)的平均延遲:,3、有一個雙輸入端的加-乘雙功能靜態(tài)流水線,由經(jīng)過時間為t、t、2t、t的1、2、3、4四個子過程構(gòu)成。加按1 2 4連接,乘按1
3、 3 4連接,流水線輸出設(shè)有數(shù)據(jù)緩沖器,也可將數(shù)據(jù)直接返回輸入。現(xiàn)要執(zhí)行 A*(B+C*(D+E*F)+G*H 的運算,請調(diào)整計算順序,畫出能獲得吞吐率盡量高的流水時空圖,標(biāo)出流水線入、出端數(shù)據(jù)的變化情況,求出完成全部運算的時間及此期間整個流水線吞吐率,效率,加速比?如對流水線瓶頸子過程再細(xì)分,最少只需多少時間可完成全部運算?若子過程3不能再細(xì)分,只能用并聯(lián)方法改進(jìn),問流水線的效率為多少?,解:根據(jù)題意,對算法經(jīng)調(diào)整后,能使流水吞吐率盡量高的流水時空圖如圖所示。圖中已標(biāo)出了流水線入、出端的數(shù)據(jù)變化情況。,S,1,2,3,4,1,2,1,2,1,2,3,3,3,1,2,3,4,5,6,4,5,4
4、,5,6,6,4,5,6,7,8,7,8,7,8,9,9,9,輸入,輸出,AC,EF,AB,GH,ACD,ACEF,AB ACD,ACEF GH,ACEF+GH ACD+AB,AC,EF,AB,GH,ACD,ACEF,ACD+AB,ACEF+GH,ACEF+GH+ACD+AB,21t,S,1,2,31,32,1,2,1,3,2,4,3,5,6,4,5,6,7,8,7,8,7,8,9,9,9,根據(jù)上圖的流水時空圖,可以看出,完成全部運算的時間為21t。,如果現(xiàn)在將瓶頸子過程3細(xì)分成兩個子過程,則時空圖如下圖所示。,4,1,3,2,4,5,6,1,3,2,4,5,6,16t,S,1,2,31,32
5、,1,2,1,3,1,3,3,5,5,4,5,6,7,8,7,8,7,8,9,9,9,4,2,4,2,4,6,6,1,3,2,4,5,6,16t,由上圖可見,完成全部運算最少需要16t的時間即可。 現(xiàn)在若子過程3不能再細(xì)分了,只能用2個子過程3通過并聯(lián)來改進(jìn),則其時空圖如下圖所示。,完成全部運算時的流水線效率,4、超級標(biāo)量機和超級流水線機都能開發(fā)指令級的并行性,現(xiàn)假定這兩種機器的流水線都為4段,每段均需1個時鐘周期。若在超級標(biāo)量機中,每個時鐘周期可同時啟動3條指令,而超級流水線機中則是每隔1/3時鐘周期啟動一條指令?,F(xiàn)若要執(zhí)行6條指令的代碼序列,問在兩種機器上各需用多少個時鐘周期方可執(zhí)行完畢?
6、 解:超級標(biāo)量機需5個時鐘周期,超級流水線機需5.67個時鐘周期。,5、 在CRAY-1機上,V是向量寄存器,設(shè)向量長度均為32。S是標(biāo)量寄存器,所用浮點功能執(zhí)行部件的執(zhí)行時間分別為:加法需6拍,相乘需7拍,從存儲器讀存數(shù)需6拍,求倒數(shù)近似值及除法需14拍,寫入寄存器及啟動功能部件(包括存儲器)各需1拍。問下列各指令組中的哪些指令可以鏈接?哪些指令不可鏈接?哪些指令可以并行執(zhí)行?試說明其原因并分別計算出各指令組全部完成所需的拍數(shù)。 (1)V0存儲器 (2)V2V0+V1 V1V2+V3 V3存儲器 V4V5*V6 V4V2*V3 (3)V0存儲器 (4) V0存儲器 V3V1+V2 V11/V
7、0 V4V0*V3 V3V1+V2 V6V4+V5 V5V3*V4 (5)V0存儲器 (6) V3存儲器 V1V2+V3 V2V0+V1 V4V5*V6 s0s2+s3 s0s1+s2 V3V1*V4 (7)V3存儲器 (8) V0存儲器 V2V0+V1 V2V0+V1 V4V2*V3 V3V1+V2 存儲器V4 V5V3*V4,解:(1)三條指令可全并行執(zhí)行,需(1+7+1)+(32-1)=40(拍) (2)前兩條并行,和第三條鏈接,需(1+7+1)+(1+6+1)+(32-1)=48拍 (3)前兩條并行和第三條鏈接,而第四條指令與第三條指令串行(因第二條和第四條功能部件沖突),需 (1+6+1)+(1+7+1)+(32-1)+(1+6+1) +(32-1) =87拍 (4)全部鏈接 (1+6+1)+(1+14+1)+(1+6+1)+(1+7+1)+(32-1)=72拍 (5)全并行執(zhí)行,需(1+7+1)+(32-1)=40(拍) (6)前三條指令并行,與第四條指令串行(V1源操作數(shù)沖突),需 (1+6+1)+(32-1)+(1+7+1)+(32-1)=79拍 (7)前兩條指令并行,與第三條鏈接,再與第四條串行(因第一條和第四條沖突),需 (1+6+1)+
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 廣東松山職業(yè)技術(shù)學(xué)院《人力資源戰(zhàn)略與規(guī)劃》2023-2024學(xué)年第一學(xué)期期末試卷
- 廣東生態(tài)工程職業(yè)學(xué)院《材料表界面》2023-2024學(xué)年第一學(xué)期期末試卷
- 廣東青年職業(yè)學(xué)院《抽樣技術(shù)與應(yīng)用(實驗)》2023-2024學(xué)年第一學(xué)期期末試卷
- 七年級上冊《3.2.1 代數(shù)式的值》課件與作業(yè)
- 廣東南華工商職業(yè)學(xué)院《比較公共行政學(xué)》2023-2024學(xué)年第一學(xué)期期末試卷
- 廣東茂名幼兒師范??茖W(xué)校《幼兒美術(shù)基礎(chǔ)》2023-2024學(xué)年第一學(xué)期期末試卷
- 廣東茂名農(nóng)林科技職業(yè)學(xué)院《趣味素描》2023-2024學(xué)年第一學(xué)期期末試卷
- 廣東嶺南職業(yè)技術(shù)學(xué)院《馬克思主義政治經(jīng)濟學(xué)原理》2023-2024學(xué)年第一學(xué)期期末試卷
- -業(yè)務(wù)員月工作總結(jié)簡短
- 大學(xué)生公民素質(zhì)教育(南京師范大學(xué))學(xué)習(xí)通測試及答案
- 金朝的水利與社會經(jīng)濟
- 工程竣工保修期滿移交書
- 急診科烏頭堿中毒課件
- 2013天津中考滿分作文
- 高等數(shù)學(xué)同濟大學(xué)第7版 課后習(xí)題答案解析完整版
- 醫(yī)院安保人員錄用上崗管理辦法
- 單模光纜檢驗報告
- 公共政策分析簡答題
- 加熱爐溫度控制系統(tǒng)_畢業(yè)論文
- 微生物標(biāo)本送檢率低原因分析
- Q∕SY 1829-2015 抽油機用橡膠盤根驗收規(guī)范
評論
0/150
提交評論