版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、計(jì)算機(jī)體系結(jié)構(gòu)習(xí)題三一、(10分)某臺主頻為400MHz的計(jì)算機(jī)執(zhí)行標(biāo)準(zhǔn)測試程序,程序中指令類型、執(zhí)行數(shù)量和平均時(shí)鐘周期數(shù)如下:指令類型指令執(zhí)行數(shù)量平均時(shí)鐘周期數(shù)整數(shù)450001數(shù)據(jù)傳送750002浮點(diǎn)80004分支15002求該計(jì)算機(jī)的有效CPI、MIPS和程序CPU時(shí)間二、(10分)計(jì)算機(jī)系統(tǒng)中有三個(gè)部件可以改進(jìn),這三個(gè)部件的改進(jìn)加速比為:部件加速比1=30;部件加速比2=20;部件加速比3=10(1) 如果部件1和部件2在整個(gè)系統(tǒng)運(yùn)行時(shí)間中所占的比例均為30%,那么當(dāng)部件3的比例為多少時(shí),系統(tǒng)加速比才可以達(dá)到10?(2) 如果三個(gè)部件的所占比例分別為30%、30%和20%,三個(gè)部件同時(shí)改
2、進(jìn),那么系統(tǒng)中不可加速部分的執(zhí)行時(shí)間在總執(zhí)行時(shí)間中占的比例是多少?三、(5分)根據(jù)CPU中保存操作數(shù)的存儲器類型,可以把指令集結(jié)構(gòu)分為哪些類型?四、(10分)在MIPS流水線上運(yùn)行如下代碼序列:LOOP:LWR1,0(R2)DADDIUR1,R1,#1SWR1,0(R2)DADDIUR2,R2,#4DSUBR4,R3,R2BNEZR4,LOOP其中:R3的初值是R2+396。假設(shè):在整個(gè)代碼序列的運(yùn)行過程中,所有的存儲器訪問都是命中的,并且在一個(gè)時(shí)鐘周期中可對同一個(gè)寄存器在前半周期寫,而在后半周期讀。那么:(1) 在沒有任何其它定向(或旁路)硬件的支持下,請畫出該指令序歹U執(zhí)行的流水線時(shí)空圖。
3、假設(shè)采用暫停流水線的策略處理分支指令,且所有的存儲器訪問都命中Cach那么執(zhí)行上述循環(huán)需要多少個(gè)時(shí)鐘周期?(2) 假設(shè)該流水線有通常的定向路徑,請畫出該指令序歹U執(zhí)行的流水線時(shí)空圖。假設(shè)采用預(yù)測分支失敗的策略處理分支指令,且所有的存儲器訪問都命中Caches那么執(zhí)行上述循環(huán)需要多少個(gè)時(shí)鐘周期?(3) 假設(shè)該流水線有通常的定向路徑和一個(gè)時(shí)鐘周期的延遲分支,請對該循環(huán)中的指令進(jìn)行調(diào)度,你可以重新組織指令的順序,也可以修改指令的操作數(shù),但是注意不能增加指令的條數(shù)。請畫出該指令序列執(zhí)行的流水線時(shí)空圖,并計(jì)算執(zhí)行上述循環(huán)所需要的時(shí)鐘周期數(shù)。五、(10分)假設(shè)某程序各種分支指令數(shù)占所有指令數(shù)的白分比如下:
4、條件分支20%(其中的60%是分支成功的)跳轉(zhuǎn)和調(diào)用5%現(xiàn)有一條段數(shù)為4的流水線,無條件分支在第2個(gè)時(shí)鐘周期結(jié)束時(shí)就被解析出來,而條件分支要到第3個(gè)時(shí)鐘周期結(jié)束時(shí)才能夠被解析出來。第一個(gè)流水段是完全獨(dú)立丁指令類型的,即所有類型的指令都必須經(jīng)過第一個(gè)流水段的處理。請問在沒有任何控制相關(guān)的情況下,該流水線相對丁存在上述控制相關(guān)情況下的加速比是多少?六、(10分)假設(shè)有一條長流水線,僅僅對條件分支指令使用分支目標(biāo)緩沖。其中分支預(yù)測錯(cuò)誤的開銷為4個(gè)時(shí)鐘周期,分支目標(biāo)緩沖不命中的開銷為3個(gè)時(shí)鐘周期。分支目標(biāo)緩沖命中率為90%,預(yù)測正確率為90%,分支指令占所有指令的比例為15%,沒有分支的基本CPI為1
5、。(1)求程序執(zhí)行的CPI。(2)相對丁采用固定的2個(gè)時(shí)鐘周期延遲的分支處理,哪種方法程序執(zhí)行速度更快?七、(10分)設(shè)指令流水線由取指令、分析指令和執(zhí)行指令3個(gè)部件構(gòu)成,每個(gè)部件經(jīng)過的時(shí)間為t,連續(xù)流入12條指令,假設(shè)沒有停頓。請分別畫出標(biāo)量流水處理機(jī)以及ILP均為4的超標(biāo)量處理機(jī)、超長指令字處理機(jī)、超流水處理機(jī)的時(shí)空圖,并分別計(jì)算它們相對丁標(biāo)量流水處理機(jī)的加速比。八、(10分)假設(shè)對指令Cache的訪問占全部訪問的75%;而對數(shù)據(jù)Cache的訪問占全部訪問的25%。Cache的命中時(shí)間為1個(gè)時(shí)鐘周期,失效開銷為50個(gè)時(shí)鐘周期,在混合Cache中一次load或store操作訪問Cache的命
6、中時(shí)間都要增加一個(gè)時(shí)鐘周期,32KB的指令Cache的失效率為0.39%,32KB的數(shù)據(jù)Cache的失效率為4.82%,64KB的混合Cache的失效率為1.35%。乂假設(shè)采用寫直達(dá)策略,且有一個(gè)寫緩沖器,并且忽略寫緩沖器引起的等待。試問指令Cache和數(shù)據(jù)Cache容量均為32KB的分離Cache和容量為64KB的混合Cache相比,(1)哪種Cache的失效率更低?(2)兩種情況下平均訪存時(shí)間各是多少?九、(10分)假設(shè)一臺計(jì)算機(jī)具有以下特性:(1)95%的訪存在Cache中命中;(2)塊大小為兩個(gè)字,且失效時(shí)整個(gè)塊被調(diào)入;(3)CPU發(fā)出訪存請求的速率為109字/s;(4)25%的訪存為
7、寫訪問;(5)存儲器的最大流量為109字/s(包括讀和寫);(6)主存每次只能讀或?qū)懸粋€(gè)字;(7) 在任何時(shí)候,Cache中有30%的塊被修改過;(8) 寫失效時(shí),Cache采用按寫分配法?,F(xiàn)欲給該計(jì)算機(jī)增添一臺外設(shè),為此首先想知道主存的帶寬已用了多少。試對于以下兩種情況計(jì)算主存頻帶的平均使用比例。(1) 寫直達(dá)Cache;(2) 寫回法Cach&十、(10分)假設(shè)采用理想存儲器系統(tǒng)時(shí)的基本CPI是1.5,主存訪問的延遲是40個(gè)時(shí)鐘周期,傳輸速率為4字節(jié)/時(shí)鐘周期。Cache中50%的塊是修改過的,每個(gè)塊有32字節(jié),20%的指令是數(shù)據(jù)訪存指令,25%的訪存為寫訪問。同時(shí)假設(shè)沒有寫緩存,在TLB
8、失效的情況下開銷為20時(shí)鐘周期,TLB不會降低Cache命中率。CPU產(chǎn)生的指令地址或數(shù)據(jù)地址有0.2%沒有在TLB中命中。(1) 在理想TLB情況下,計(jì)算均采用寫回法16KB直接映象混合Cacha16KB兩路組相聯(lián)混合Cache和32KB直接映象混合Cache機(jī)器的實(shí)際CPI;(2) 在實(shí)際TLB情況下,用(1)的結(jié)果,計(jì)算均采用寫回法16KB直接映象混合Cacha16KB兩路組相聯(lián)混合Cache和32KB直接映象混合Cache機(jī)器的實(shí)際CPI;另夕卜,假設(shè)16KB直接映象混合Cach816KB兩路組相聯(lián)混合Cache和32KB直接映象混合Cache的失效率分別為2.9%、2.2冊日2.0%
9、。H一、(5分)請簡述Tomasul。算法的基本思想。計(jì)算機(jī)體系結(jié)構(gòu)習(xí)題三答案十二、(10分)某臺主頻為400MHz的計(jì)算機(jī)執(zhí)行標(biāo)準(zhǔn)測試程序,程序中指令類型、執(zhí)行數(shù)量和平均時(shí)鐘周期數(shù)如下:指令類型指令執(zhí)行數(shù)量平均時(shí)鐘周期數(shù)整數(shù)450001數(shù)據(jù)傳送750002浮點(diǎn)80004分支15002求該計(jì)算機(jī)的有效CPI、MIPS和程序CPU時(shí)間。答:(1)CPI=(45000X1+75000X2+8000X4+1500X2)/129500=1.776(或460)259(2) MIPS速率=f/CPI=400M/1.776=225.225MIPS(或180MIPS)259(3) 程序CPU時(shí)間=(45000
10、X1+75000X2+8000X4+1500X2)/400M=575s十三、(10分)計(jì)算機(jī)系統(tǒng)中有三個(gè)部件可以改進(jìn),這三個(gè)部件的改進(jìn)加速比為:部件加速比1=30;部件加速比2=20;部件加速比3=10(3) 如果部件1和部件2在整個(gè)系統(tǒng)運(yùn)行時(shí)間中所占的比例均為30%,那么當(dāng)部件3的比例為多少時(shí),系統(tǒng)加速比才可以達(dá)到10?(4)進(jìn),少?如果三個(gè)部件的所占比例分別為30%、30%和20%,三個(gè)部件同時(shí)改那么系統(tǒng)中不可加速部分的執(zhí)行時(shí)間在總執(zhí)行時(shí)間中占的比例是多答:(1)在多個(gè)部件可改進(jìn)情況下,Amdahl定理的擴(kuò)展:Sn(1GST已知Si=30,S2=20,S3=10,Sn=10,Fi=0.3,
11、F2=0.3,得:1011-(0.30.3F3)(0.3/300.3/20F3/10)得F3=0.36,即部件3的比例為36%。(2)設(shè)系統(tǒng)改進(jìn)前的執(zhí)行時(shí)間為T,則3個(gè)部件改進(jìn)前的執(zhí)行時(shí)間為:(0.3+0.3+0.2)T=0.8T,不可改進(jìn)部分的執(zhí)行時(shí)間為0.2T。已知3個(gè)部件的改進(jìn)加速比分別為Si=30,S2=20,S3=10,因此3個(gè)部件改進(jìn)后的執(zhí)行時(shí)間為:0.3T0.2T0.045T2010Tn=0.045T+0.2T=0.245T0.3TTn30改進(jìn)后整個(gè)系統(tǒng)的執(zhí)行時(shí)間為:那么系統(tǒng)中不可改進(jìn)部分的執(zhí)行時(shí)間在總執(zhí)行時(shí)間中占的比例是:0.2T0.245T0.82十四、(5分)根據(jù)CPU中保
12、存操作數(shù)的存儲器類型,可以把指令集結(jié)構(gòu)分為哪些類型?答:可以分為堆棧型、累加器型、通用寄存器型3種。堆棧型:CPU中存儲操作數(shù)的單元是堆棧的指令集結(jié)構(gòu)。累加器型:CPU中存儲操作數(shù)的單元是累加器的指令集結(jié)構(gòu)。通用寄存器型:CPU中存儲操作數(shù)的單元是通用寄存器的指令集結(jié)構(gòu)。十五、(10分)在MIPS流水線上運(yùn)行如下代碼序列:LOOP:LWR1,0(R2)DADDIUR1,R1,#1SWR1,0(R2)DADDIUR2,R2,#4DSUBR4,R3,R2BNEZR4,LOOP其中:R3的初值是R2+396。假設(shè):在整個(gè)代碼序列的運(yùn)行過程中,所有的存儲器訪問都是命中的,并且在一個(gè)時(shí)鐘周期中可對同一個(gè)
13、寄存器在前半周期寫,而在后半周期讀。那么:(4) 在沒有任何其它定向(或旁路)硬件的支持下,請畫出該指令序歹0執(zhí)行的流水線時(shí)空圖。假設(shè)采用暫停流水線的策略處理分支指令,且所有的存儲器訪問都命中Cach那么執(zhí)行上述循環(huán)需要多少個(gè)時(shí)鐘周期?(5) 假設(shè)該流水線有通常的定向路徑,請畫出該指令序歹U執(zhí)行的流水線時(shí)空圖。假設(shè)采用預(yù)測分支失敗的策略處理分支指令,且所有的存儲器訪問都命中Caches那么執(zhí)行上述循環(huán)需要多少個(gè)時(shí)鐘周期?(6) 假設(shè)該流水線有通常的定向路徑和一個(gè)時(shí)鐘周期的延遲分支,請對該循環(huán)中的指令進(jìn)行調(diào)度,你可以重新組織指令的順序,也可以修改指令的操作數(shù),但是注意不能增加指令的條數(shù)。請畫出該
14、指令序列執(zhí)行的流水線時(shí)空圖,并計(jì)算執(zhí)行上述循環(huán)所需要的時(shí)鐘周期數(shù)。(1)無定向(旁路)硬件支持。暫停流水線處理分支指令12345678910111213141516171819202122LWIFIDEXMWBDADDIUIFSSIDEXMWBSWIFSSIDEXMWBDADDIUIFIDEXMWBDSUBIFSSIDEXMWBBNEZIFSSIDEXMWBLWIFSSIFIDEXMWB(2)第i次迭代(i=0.98)開始周期:1+(ix17)總的時(shí)鐘周期數(shù):(98X17)+18=1684有通常定向路徑,預(yù)測分支失敗。指令123LWIFIDEXDADDIUIFIDSWIFDADDIUDSUBB
15、NEZLW45678910111131415MWBSEXMWBSIDEXMWBIFIDEXMWBIFIDEXMWBIFIDEXMWBIFmissmissIFIDEXMWB(3)1第i次迭代(i=0.98)開始周期:1+(ix10)總的時(shí)鐘周期數(shù):(98X10)+11=991有通常定向路徑。單周期延遲分支。LOOP:LWR1,0(R2)DADDIUR2,R2,#4DADDIUR1,R1,#1DSUBR4,R3,R2BNEZR4,LOOPSWR1,-4(R2)第i次迭代(i=0.98)開始周期:1+(ix6)總的時(shí)鐘周期數(shù):(98X6)+10=598指令1234567891011LWIFIDEXM
16、WBDADDIUIFIDEXMWBDADDIUIFIDEXMWBDSUBIFIDEXMWBBNEZIFIDEXMWBSWIFIDEXMWBLWIFIDEXMWB十六、(10分)假設(shè)某程序各種分支指令數(shù)占所有指令數(shù)的白分比如下:條件分支20%(其中的60%是分支成功的)1跳轉(zhuǎn)和調(diào)用5%現(xiàn)有一條段數(shù)為4的流水線,無條件分支在第2個(gè)時(shí)鐘周期結(jié)束時(shí)就被解析出來,而條件分支要到第3個(gè)時(shí)鐘周期結(jié)束時(shí)才能夠被解析出來。第一個(gè)流水段是完全獨(dú)立丁指令類型的,即所有類型的指令都必須經(jīng)過第一個(gè)流水段的處理。請問在沒有任何控制相關(guān)的情況下,該流水線相對丁存在上述控制相關(guān)情況下的加速比是多少?答:沒有控制相關(guān)時(shí)流水線的
17、平均CPI=1存在控制相關(guān)時(shí):無條件分支在第2個(gè)時(shí)鐘周期結(jié)束時(shí)就被解析出來,而條件分支要到第3個(gè)時(shí)鐘周期結(jié)束時(shí)才能被解析出來,這意味著分支目標(biāo)地址可以在第2個(gè)時(shí)鐘周期計(jì)算出來(因?yàn)闊o條件分支只需要知道分支目標(biāo)即可),而分支條件要到第3個(gè)時(shí)鐘周期才能判斷出來。因?yàn)轭}目未指定控制相關(guān)的解決方法,故假設(shè)采用暫停流水線、預(yù)測分支成功、預(yù)測分支失敗這3種方法。每種方法的分析如下:(1) 若使用暫停流水線的策略,則對于條件分支,有2個(gè)額外的stall,對無條件分支,有1個(gè)額外的stall:CPI=1+20%*2+5%*1=1.45加速比S=CPI/1=1.45(2) 若使用預(yù)測分支成功策略,則對于不成功的
18、條件分支,有2個(gè)額外的stall,對無條件分支和成功的條件分支,有1個(gè)額外的stall1:CPI=1+20%*(60%*1+40%*2)+5%*1=1.33加速比S=CPI/1=1.33(3) 若使用預(yù)測分支失敗策略,則對于成功的條件分支,有2個(gè)額外的stall;對無條件分支,有1個(gè)額外的stall;對不成功的條件分支,其目標(biāo)地址已經(jīng)由PC值給出,不必等待,所以無延遲:CPI=1+20%*(60%*2+40%*0)+5%*1=1.29加速比S=CPI/1=1.29十七、(10分)假設(shè)有一條長流水線,僅僅對條件分支指令使用分支目標(biāo)緩沖。其中分支預(yù)測錯(cuò)誤的開銷為4個(gè)時(shí)鐘周期,分支目標(biāo)緩沖不命中的開
19、銷為3個(gè)時(shí)鐘周期。分支目標(biāo)緩沖命中率為90%,預(yù)測正確率為90%,分支指令占所有指令的比例為15%,沒有分支的基本CPI為1。(3) 求程序執(zhí)行的CPI。(4) 相對于采用固定的2個(gè)時(shí)鐘周期延遲的分支處理,哪種方法程序執(zhí)行速度更快?答:(1)程序執(zhí)行的CPI=沒有分支的基本CPI(1)+分支帶來的額外開銷分支帶來的額外開銷是指在分支指令中,緩沖命中但預(yù)測錯(cuò)誤帶來的開銷與緩沖沒有命中帶來的開銷之和。(通常,在采用了分支目標(biāo)緩沖時(shí),如果發(fā)生了分支目標(biāo)緩沖命中,那么會直接利用緩沖中的分支目標(biāo)地址進(jìn)行取指,即預(yù)測分支轉(zhuǎn)移,所以如果分支預(yù)測正確,那就沒有開銷。如果分支實(shí)際未發(fā)生轉(zhuǎn)移,那么就出現(xiàn)了預(yù)測錯(cuò)誤
20、,需要取消已取來的分支目標(biāo)處指令,重新從分支失敗處取指。根據(jù)題意,這種情況的開銷為4個(gè)時(shí)鐘周期。另一方面,如果分支目標(biāo)緩沖不命中,那么根據(jù)題意,開銷為3個(gè)時(shí)鐘周期)分支帶來的額外開銷=15%*(90%命中X10%預(yù)測錯(cuò)誤X4+10%沒命中X3)=0.099所以,程序執(zhí)行的CPI=1+0.099=1.099(2)采用固定的2個(gè)時(shí)鐘周期延遲的分支處理CPI=1+15%X2=1.3由(1)(2)可知分支目標(biāo)緩沖方法執(zhí)行速度快。十八、(10分)設(shè)指令流水線由取指令、分析指令和執(zhí)行指令3個(gè)部件構(gòu)成,每個(gè)部件經(jīng)過的時(shí)間為久t,連續(xù)流入12條指令,假設(shè)沒有停頓。請分別畫出標(biāo)量流水處理機(jī)以及ILP均為4的超標(biāo)
21、量處理機(jī)、超長指令字處理機(jī)、超流水處理機(jī)的時(shí)空圖,并分別計(jì)算它們相對丁標(biāo)量流水處理機(jī)的加速比。答:標(biāo)量流水處理機(jī)的時(shí)空圖:執(zhí)行完12條指令需Ti=14Ato超標(biāo)量流水處理機(jī)與超長指令字處理機(jī)的時(shí)空圖:超標(biāo)量處理機(jī)時(shí)空圖超長指令字處理機(jī)時(shí)空圖超標(biāo)量流水處理機(jī)中,每一個(gè)時(shí)鐘周期同時(shí)啟動4條指令。執(zhí)行完12條指令需T2=5At,相對丁標(biāo)量流水處理機(jī)的加速比為:T114tT35t52 二2.8T25t超長指令字處理機(jī)中,每4條指令組成一條長指令,共形成3條長指令。執(zhí)行完12條指令需T3=5At,相對丁標(biāo)量流水處理機(jī)的加速比為:cT114tCC53 2.8超流水處理機(jī)的時(shí)空圖:執(zhí)行分析取指I:455.7
22、5時(shí)間超流水處理機(jī)中,每1/4個(gè)時(shí)鐘周期啟動一條指令。執(zhí)行完12條指令需T4=5.75At,(第1條指令通過時(shí)間為3*t,其余11條指令每隔1/4*t完成1條,共2.75*t)相對丁標(biāo)量流水處理機(jī)的加速比為:2.435L14ts44T45.75t十九、(10分)假設(shè)對指令Cache的訪問占全部訪問的75%;而對數(shù)據(jù)Cache的訪問占全部訪問的25%。Cache的命中時(shí)間為1個(gè)時(shí)鐘周期,失效開銷為50個(gè)時(shí)鐘周期,在混合Cache中一次load或store操作訪問Cache的命中時(shí)間都要增加一個(gè)時(shí)鐘周期(即數(shù)據(jù)訪問命中要比指令讀取命中多1個(gè)時(shí)鐘周期,這是結(jié)構(gòu)相關(guān)導(dǎo)致的),32KB的指令Cache的
23、失效率為0.39%,32KB的數(shù)據(jù)Cache的失效率為4.82%,64KB的混合Cache的失效率為1.35%。乂假設(shè)采用寫直達(dá)策略,且有一個(gè)寫緩沖器,并且忽略寫緩沖器引起的等待。試問指令Cache和數(shù)據(jù)Cache容量均為32KB的分離Cache和容量為64KB的混合Cache相比,(1)哪種Cache的失效率更低?(2)兩種情況下平均訪存時(shí)間各是多少?答:(1)根據(jù)題意,約75%的訪存為取指令。因此,分離Cache的總體失效率為:(75%x0.39%)+(25%x4.82%)=1.498%;容量為64KB的混合Cache的失效率略低一些,只有1.35%。(2)平均訪存時(shí)間公式可以分為指令訪問
24、和數(shù)據(jù)訪問兩部分:平均訪存時(shí)間=指令所占的白分比X(讀命中時(shí)間+讀失效率X失效開銷)+數(shù)據(jù)所占的白分比X(數(shù)據(jù)命中時(shí)間+數(shù)據(jù)失效率X失效開銷)所以,兩種結(jié)構(gòu)的平均訪存時(shí)間分別為:分離Cache的平均訪存時(shí)間=75%X(1+0.39%x50)+25%x(1+4.82%X50)=(75%X1.195)+(25%X3.41)=1.7488混合Cache的平均訪存時(shí)間=75%x(1+1.35%x50)+25%x(1+1+1.35%X50)=(75%X1.675)+(25%X2.675)=1.925因此,盡管分離Cache的實(shí)際失效率比混合Cache的高,但其平均訪存時(shí)間反而較低。分離Cache提供了兩
25、個(gè)端口,消除了結(jié)構(gòu)相關(guān)。二十、(10分)假設(shè)一臺計(jì)算機(jī)具有以下特性:(9) 95%的訪存在Cache中命中;(10) 塊大小為兩個(gè)字,且失效時(shí)整個(gè)塊被調(diào)入;(11) CPU發(fā)出訪存請求的速率為109字/s;(12) 25%的訪存為寫訪問;(13) 存儲器的最大流量為109字/s(包括讀和寫);(14) 主存每次只能讀或?qū)懸粋€(gè)字;(15) 在任何時(shí)候,Cache中有30%的塊被修改過;(16) 寫失效時(shí),Cache采用按寫分配法?,F(xiàn)欲給該計(jì)算機(jī)增添一臺外設(shè),為此首先想知道主存的帶寬已用了多少。試對丁以下兩種情況計(jì)算主存頻帶的平均使用比例。(3) 寫直達(dá)Cache;(4) 寫回法Cach&答:采用
26、按寫分配(1)寫直達(dá)cache訪問命中,有兩種情況:讀命中,不訪問主存;寫命中,更新cache和主存,訪問主存1次。訪問失效,有兩種情況:讀失效,將主存中的塊調(diào)入cache中,訪問主存2次;寫失效,將要寫的塊調(diào)入cache,訪問主存2次,再將修改的數(shù)據(jù)寫入cache和主存,訪問主存1次,共3次。上述分析如下表所示。訪問命中訪問類型頻率訪存次數(shù)Y讀95%*75%=71.3%0Y寫95%*25%=23.8%1N讀5%*75%=3.8%2N寫5%*25%=1.3%3一次訪存請求的平均訪存次數(shù)=(71.3%*0)+(23.8%*1)+(3.8%*2)+(1.3%*3)=0.35已用帶寬=0.35X10
27、9/109=35.0%(2)寫回法cache訪問命中,有兩種情況:讀命中,不訪問主存;寫命中,不訪問主存。采用寫回法,只有當(dāng)修改的cache塊被換出時(shí),才寫入主存;訪問失效,有一個(gè)塊將被換出,這也有兩種情況:如果被替換的塊沒有修改過,將主存中的塊調(diào)入cache塊中,訪問主存2次;如果被替換的塊修改過,則首先將修改的塊寫入主存,需要訪問主存2次;然后將主存中的塊調(diào)入cache塊中,需要訪問主存2次,共4次訪問主存。訪問命中塊為臟頻率訪存次數(shù)YN95%*70%=66.5%0YY95%*30%=28.5%0NN5%*70%=3.5%2NY5%*30%=1.5%4所以:一次訪存請求的平均訪存次數(shù)=66
28、.5%*0+28.5%*0+3.5%*2+1.5%*4=0.13已用帶寬=0.13X109/109=13%二十一、(10分)假設(shè)采用理想存儲器系統(tǒng)時(shí)的基本CPI是1.5,主存訪問的延遲是40個(gè)時(shí)鐘周期,傳輸速率為4字節(jié)/時(shí)鐘周期(此處暗示對丁主存訪問時(shí)間的計(jì)算需要根據(jù)數(shù)據(jù)大小和傳輸速率來計(jì)算,即主存訪問時(shí)間=主存延遲+數(shù)據(jù)大小/傳輸速率)。Cache中50%的塊是修改過的,每個(gè)塊有32字節(jié),20%的指令是數(shù)據(jù)訪存指令,25%的訪存為寫訪問。同時(shí)假設(shè)沒有寫緩存,在TLB失效的情況下開銷為20時(shí)鐘周期,TLB不會降低Cache命中率。CPU產(chǎn)生的指令地址或數(shù)據(jù)地址有0.2%沒有在TLB中命中。(3
29、)在理想TLB情況下,計(jì)算均采用寫回法16KB直接映象混合Cacha16KB兩路組相聯(lián)混合Cache和32KB直接映象混合Cache機(jī)器的實(shí)際CPI;(4)在實(shí)際TLB情況下,用(1)的結(jié)果,計(jì)算均采用寫回法16KB直接映象混合Cacha16KB兩路組相聯(lián)混合Cache和32KB直接映象混合Cache機(jī)器的實(shí)際CPI;另夕卜,假設(shè)16KB直接映象混合Cach816KB兩路組相聯(lián)混合Cache和32KB直接映象混合Cache的失效率分別為2.9%、2.2冊日2.0%。答:CPI=CPI執(zhí)行+存儲停頓周期總數(shù)/指令總數(shù)存儲停頓由下列原因引起:TLB失效,從主存中讀取貞表項(xiàng)取指令Cache失效,從主
30、存中取指load和store指令訪問數(shù)據(jù)Cache失效,從主存中讀寫數(shù)據(jù)(注意:采用TLB意味著訪存的過程需要進(jìn)行虛擬-物理內(nèi)存地址轉(zhuǎn)換。我們假設(shè)Cache使用的是物理內(nèi)存地址,那么訪存過程是:首先,CPU發(fā)出的虛擬地址去查找TLB,如果TLB命中,則直接取得貞表項(xiàng),進(jìn)行地址轉(zhuǎn)換,獲得物理地址。否則需要從主存載入貞表項(xiàng),然后轉(zhuǎn)換得到物理地址。然后,利用轉(zhuǎn)換得到的物理地址去訪問Cache,如果Cache命中,則直接返回。如果Cache缺失,則從主存載入數(shù)據(jù)或指令。因此,存儲停頓發(fā)生在TLB失效,取指Cache失效,訪問數(shù)據(jù)Cache失效這三種情況。)以Mem_Stalls表示存儲停頓周期總數(shù),以
31、IC表示指令總數(shù),以Inst_Stalls表示取指停成期總數(shù),以Data_Stalls表示數(shù)據(jù)訪問停頓周期總數(shù),以TLB_Stalls表小TLB失效引起的停頓周期總數(shù)。MemStallsInstStallsDataStallsTLBStallsICICICICInstStallsICAnstMPnstMmstPInst其中,AInst是取指總數(shù)。由丁每條指令都要取指一次,因此AInst=IC。MInst和PInst分別是取指時(shí)Cache缺失率和缺失開銷。11ADataMDataPDataADataICIVIDataPDataICICAData其中,是數(shù)據(jù)訪I可總數(shù)除以指令總數(shù),即平均每指令數(shù)據(jù)
32、訪I可次數(shù)。根據(jù)ICAData題意,指令中有20%是數(shù)據(jù)項(xiàng)可指令,因此,=20%0MData和PData分別是ICPData分別要根據(jù)讀/寫TLBStalls(1)對丁理想TLB,TLB無失效。因此,90IC樣的。數(shù)據(jù)訪問時(shí)Cache缺失率和缺失開銷。在后面,可以看到操作來計(jì)算。IC對丁混合Cache,取指令和數(shù)據(jù)讀/寫的Cache缺失率是PInst=主存延遲+傳輸1個(gè)Cache數(shù)據(jù)塊需要使用的時(shí)間=40+32/4=48(周期)若為讀失效,失效開銷PReadF主存延遲+傳輸1個(gè)Cache數(shù)據(jù)塊需要使用的時(shí)間=40+32/4=48(周期)若為寫失效,且塊是干凈的,失效開銷為PWrite_clean=主存延遲+傳輸1個(gè)Cache數(shù)據(jù)塊需要使用的時(shí)間=40+32/4=48(周期)若為寫失效,且塊是修改過的,需要先把修改過的塊寫到主存,再載入新數(shù)據(jù)塊,失效開銷為PWrite_dirty=主存延遲
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025版美容院美容院品牌保護(hù)與侵權(quán)處理協(xié)議4篇
- 2025版協(xié)議離婚詳細(xì)流程與婚姻調(diào)解服務(wù)合同3篇
- 二零二五年度購房合同書樣本:智能家居配置3篇
- 二零二五版苗木種植基地病蟲害防治合作協(xié)議樣本4篇
- 2025年度醫(yī)療設(shè)施租賃合同合法經(jīng)營保障醫(yī)療服務(wù)質(zhì)量4篇
- 2025年度美容院美容院消防安全檢查與整改合同4篇
- 二零二五版智能電網(wǎng)建設(shè)項(xiàng)目施工協(xié)議3篇
- 浙江中醫(yī)藥大學(xué)《導(dǎo)游服務(wù)英語》2023-2024學(xué)年第一學(xué)期期末試卷
- 2025版汽車專用輪胎批發(fā)代理合作協(xié)議范本4篇
- 租賃合同(二零二五年度):魚池場地租賃、養(yǎng)殖技術(shù)指導(dǎo)及分成6篇
- 四川省成都市武侯區(qū)2023-2024學(xué)年九年級上學(xué)期期末考試化學(xué)試題
- 初一到初三英語單詞表2182個(gè)帶音標(biāo)打印版
- 2024年秋季人教版七年級上冊生物全冊教學(xué)課件(2024年秋季新版教材)
- 2024年共青團(tuán)入團(tuán)積極分子考試題庫(含答案)
- 碎屑巖油藏注水水質(zhì)指標(biāo)及分析方法
- 【S洲際酒店婚禮策劃方案設(shè)計(jì)6800字(論文)】
- 鐵路項(xiàng)目征地拆遷工作體會課件
- 醫(yī)院死亡報(bào)告年終分析報(bào)告
- 中國教育史(第四版)全套教學(xué)課件
- 2023年11月英語二級筆譯真題及答案(筆譯實(shí)務(wù))
- 上海民辦楊浦實(shí)驗(yàn)學(xué)校初一新生分班(摸底)語文考試模擬試卷(10套試卷帶答案解析)
評論
0/150
提交評論