版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、總 復(fù) 習(xí)第一章1. 計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)、組成、實(shí)現(xiàn)的基本概念和包含的內(nèi)容;系統(tǒng)結(jié)構(gòu)與軟硬件功能劃分的關(guān)系;計(jì)算機(jī)系統(tǒng)的多級(jí)層次結(jié)構(gòu);判斷某項(xiàng)內(nèi)容屬于結(jié)構(gòu)、組成、實(shí)現(xiàn)的哪一類;判斷某項(xiàng)內(nèi)容針對(duì)不同程序員的透明性。 2. 促進(jìn)系統(tǒng)結(jié)構(gòu)發(fā)展的因素(軟件、應(yīng)用、器件)。軟件:實(shí)現(xiàn)軟件可移植性的方法;系列機(jī)的概念;軟件兼容的概念(向前、向后、向上、向下兼容);模擬與仿真技術(shù)的概念;應(yīng)用:應(yīng)用對(duì)系統(tǒng)結(jié)構(gòu)的要求。器件:系統(tǒng)結(jié)構(gòu)下移的概念。3. 計(jì)算機(jī)系統(tǒng)的分型與分類的概念。Flynn分類法4. 系統(tǒng)結(jié)構(gòu)設(shè)計(jì)的定量原理(Amdahl定理);加速比的計(jì)算方法;5. 程序訪問的局部性原理(時(shí)間局部性、空間局部性);
2、判斷系統(tǒng)結(jié)構(gòu)中局部性原理的應(yīng)用。6. 系統(tǒng)評(píng)價(jià)的指標(biāo)(響應(yīng)時(shí)間、CPU時(shí)間、MIPS、MFLOPS);運(yùn)用CPU性能公式、平均CPI比較系統(tǒng)性能。7. 并行性的概念;并行性的等級(jí)、粒度;并行性的開發(fā)策略(時(shí)間重疊、資源重復(fù)、資源共享);8. 計(jì)算機(jī)系統(tǒng)的主要設(shè)計(jì)方法部分習(xí)題參考答案:1.6 解:(1)CPI (45000×175000×28000×41500×2) / 1295001.776(2)MIPS速率f/ CPI 400/1.776 225.225MIPS(3)程序執(zhí)行時(shí)間= (45000×175000×28000×
3、41500×2)400×106=5.75×104s=0.575ms=575s1.8 解:(1)在多個(gè)部件可改進(jìn)情況下,Amdahl定理的擴(kuò)展:已知re130,re220,re310,Sp10,fe10.3,fe20.3,得:得fe30.36,即部件3的可改進(jìn)比例為36%。(2)設(shè)系統(tǒng)改進(jìn)前的執(zhí)行時(shí)間為T,則3個(gè)部件改進(jìn)前的執(zhí)行時(shí)間為:(0.3+0.3+0.2)T = 0.8T,不可改進(jìn)部分的執(zhí)行時(shí)間為0.2T。已知3個(gè)部件改進(jìn)后的加速比分別為S130,S220,S310,因此3個(gè)部件改進(jìn)后的執(zhí)行時(shí)間為: 改進(jìn)后整個(gè)系統(tǒng)的執(zhí)行時(shí)間為:Tn = 0.045T+0.2T
4、 = 0.245T那么系統(tǒng)中不可改進(jìn)部分的執(zhí)行時(shí)間在總執(zhí)行時(shí)間中占的比例是:=82%1.9 解:(1)改進(jìn)后,各類操作的加速比re分別是:操作類型各類操作的加速比re操作12/12操作220/151.33操作310/33.33操作44/14(2) 改進(jìn)前系統(tǒng)總執(zhí)行時(shí)間:10×2+30×20+35×10+15×41030 改進(jìn)前各類操作時(shí)間在所有操作時(shí)間中所占的比例fe:操作類型改進(jìn)前各類操作的執(zhí)行時(shí)間在總的執(zhí)行時(shí)間中所占的比例操作110×2/10300.01941.94%操作230×20/10300.582558.3%操作335
5、15;10/10300.339834%操作415×4/10300.05835.83%根據(jù)Amdahl定律可得各類操作單獨(dú)改進(jìn)后,程序獲得的加速比分別是:操作類型改進(jìn)前各類操作的執(zhí)行時(shí)間在總的執(zhí)行時(shí)間中所占的比例各類操作單獨(dú)改進(jìn)后,程序獲得的加速比操作11.94%1.01操作258.3%1.17操作334%1.31操作45.83%1.05(3)在多個(gè)部件可改進(jìn)情況下,Amdahl定理的擴(kuò)展:4類操作均改進(jìn)后,整個(gè)程序的加速比是:1/(1.94%/2+58.3%/1.33+34%/3.33+5.83%/4)1.78補(bǔ)充題1. 確定下列內(nèi)容各屬于哪方面的問題。(1)機(jī)器字長為32位。
6、60; A. B. C. (2)存儲(chǔ)器最大容量為64MB。 A. B. C. (3)存儲(chǔ)器采用31路交叉存儲(chǔ)方式。 A. B.
7、60; C. (4)采用4M×4位的DRAM存儲(chǔ)器芯片,組裝在一塊印刷電路板。 A. B. C. (5)存儲(chǔ)器字長為32位,邏輯地址空間為4GB。 A. B. C.(6)主存儲(chǔ)器的存儲(chǔ)周期設(shè)計(jì)為200ns。
8、; A. B. C. 答案中的符號(hào)的含義:A: 系統(tǒng)結(jié)構(gòu) B: 計(jì)算機(jī)組成 C: 計(jì)算機(jī)實(shí)現(xiàn) 答: AABCAB2. 判斷下列哪些內(nèi)容對(duì)機(jī)器語言(含匯編語言)程序員是透明的。1)指令寄存器
9、 2)程序計(jì)數(shù)器3)數(shù)據(jù)通路的寬度 4)浮點(diǎn)數(shù)據(jù)表示5)行波進(jìn)位加法器
10、; 6)Cache7)控制存儲(chǔ)器 &
11、#160; 8)中斷屏蔽觸發(fā)器9)通用寄存器 10)硬盤11)只讀存儲(chǔ)器使用EPROM芯片 12)微地址寄存器答: 1、3、5、6、7、11、12第二章1. 指令系統(tǒng)的設(shè)計(jì)要求(
12、完備性、有效性、兼容性、規(guī)整性、對(duì)稱性、可擴(kuò)充性、正交性、有利于編譯)。2. 指令系統(tǒng)的分類(堆棧型、累加器型、通用寄存器型);通用寄存器型指令的特點(diǎn)(RR型、RM型、MM型)。3. 操作數(shù)訪問方式(按地址訪問、按內(nèi)容訪問);按地址訪問的編址問題:字編址、字節(jié)編址、位編址;按字節(jié)編址時(shí)的大端排序與小端排序。編址規(guī)定中的訪存越界問題及其解決方法。按內(nèi)容訪問:聯(lián)想存儲(chǔ)器的工作過程。4. 指令格式的設(shè)計(jì)準(zhǔn)則;操作碼的優(yōu)化方法(霍夫曼編碼、擴(kuò)展霍夫曼編碼)。5. 指令系統(tǒng)的兩種設(shè)計(jì)風(fēng)格CISC和RISC。CISC風(fēng)格的特點(diǎn);RISC風(fēng)格的特點(diǎn)。RISC風(fēng)格指令系統(tǒng)的實(shí)現(xiàn)技術(shù):窗口寄存器重疊技術(shù)、優(yōu)化轉(zhuǎn)
13、移技術(shù)。6. 數(shù)據(jù)類型、數(shù)據(jù)表示、數(shù)據(jù)結(jié)構(gòu)的概念和關(guān)系;引入數(shù)據(jù)表示的原則(減少程序執(zhí)行時(shí)間和存儲(chǔ)容量、較好的通用性和較高的效率);數(shù)據(jù)表示與系統(tǒng)結(jié)構(gòu)的關(guān)系。7. 向量數(shù)據(jù)表示的形式;采用向量數(shù)據(jù)表示時(shí),向量指令中應(yīng)給出的內(nèi)容。8. 自定義數(shù)據(jù)表示:帶標(biāo)志符數(shù)據(jù)表示、數(shù)據(jù)描述符表示。部分習(xí)題參考答案:補(bǔ)充題一、 某模型機(jī)的9條指令在程序中的使用頻度經(jīng)統(tǒng)計(jì)如下表所示。指令I(lǐng)i使用頻度piADD43%SUB13%JMP7%JOM6%STO5%SHR1%CIL2%CLA22%STP1%寫出這9條指令操作碼的Huffman編碼、3-4擴(kuò)展編碼、2-7擴(kuò)展編碼,并計(jì)算這3種編碼的平均碼長。答:兩種Huf
14、fman編碼方案指令I(lǐng)i使用頻度piHuffman編碼1Huffman編碼234編碼27編碼ADD43%0000000CLA22%1010000101SUB13%11010101010JMP7%11100110001101100000JOM6%11101110101111100001STO5%11110111010001100010CIL2%1111101111010011100011SHR1%111111011111010101100100STP1%111111111111111101100101平均碼長2.422.423.223.1Huffman編碼1的平均碼長:H0.43×10
15、.22×20.13×3(0.070.060.05)×50.02×6(0.010.01)×72.42Huffman編碼2的平均碼長:H0.43×1(0.220.13)×3(0.070.060.05)×40.02×5(0.010.01)×62.4234編碼的平均碼長:H(0.430.220.13)×3(0.070.060.050.020.010.01)×43.2227編碼的平均碼長:H(0.430.220.13)×2(0.070.060.050.020.010.01)&
16、#215;73.1二、某處理機(jī)的指令系統(tǒng)的指令字長為12位,每個(gè)地址碼的長度為3位,現(xiàn)要求該指令系統(tǒng)中有:三地址指令4條、單地址指令255條、零地址指令16條。問能否用擴(kuò)展編碼的方式為其操作碼編碼?如果要求單地址指令為254條,能否對(duì)其操作碼用擴(kuò)展編碼?說明理由。答:三地址指令格式:3位3位3位3位操作碼地址碼1地址碼2地址碼3(1)3位操作碼,可以表示8條三地址指令,現(xiàn)只需4條,剩余4個(gè)碼點(diǎn)。設(shè)沒有二地址指令,則單地址指令可以使用6位地址碼作為擴(kuò)展操作碼,共可有4×64256條指令,但要求有16條零地址指令,需要單地址指令留出2個(gè)碼點(diǎn),2562254,不能滿足單地址指令的需要,所以
17、不能用擴(kuò)展編碼的方式為該方案的操作碼編碼。(2)如果要求單地址指令為254條,則可以滿足單地址指令的需要,可以用擴(kuò)展編碼的方式為該方案的操作碼編碼。第三章1. 標(biāo)量流水的基本概念和分類;先行控制的概念。會(huì)計(jì)算采用順序方式和不同的重疊方式執(zhí)行指令時(shí)的指令執(zhí)行時(shí)間。2. 利用時(shí)空?qǐng)D進(jìn)行標(biāo)量流水線的性能分析(吞吐率、加速比、效率)3. 非線性流水線的調(diào)度方法(基本調(diào)度方法和優(yōu)化調(diào)度方法)。4. 掌握流水線操作中全局相關(guān)(轉(zhuǎn)移指令引起的相關(guān))和局部相關(guān)(數(shù)據(jù)讀寫引起的相關(guān))問題的解決方法。幾種解決全局相關(guān)的預(yù)測(cè)算法的原理及實(shí)現(xiàn)。5. 向量流水線的特點(diǎn)。向量處理方式(橫向、縱向、縱橫向加工)。6. 增強(qiáng)
18、向量處理性能的方法(并行處理技術(shù)、鏈接技術(shù))的應(yīng)用及向量程序的時(shí)間計(jì)算。7. 向量編隊(duì)的方法,根據(jù)向量編隊(duì)計(jì)算性能參數(shù)的方法。8. 向量訪問步長,解決向量機(jī)的訪存沖突的方法。9. 向量處理性能的評(píng)估參數(shù)(Tvp、 R、n1/2、nv等)的定義。部分習(xí)題參考答案:3.9列舉出下面循環(huán)中的所有相關(guān),包括輸出相關(guān)、反相關(guān)、真相關(guān)。for (i=2; i<100; i=i+1)ai=bi+ai;/* s1 */ci+1=ai+di; /* s2 */ai-1=2*bi; /* s3 */bi+1=2*bi;/* s4 */解:展開循環(huán)兩次:ai = bi + ai; /* s1 */ci+1 =
19、 ai + di; /* s2 */ai-1 = 2 * bi; /* s3 */bi+1 = 2 * bi; /* s4 */ai+1 = bi+1 + ai+1; /* s1*/ci+2 = ai+1 + di+1; /* s2*/ai = 2 * bi+1; /* s3*/bi+2 = 2 * bi+1; /* s4*/在一次循環(huán)中:輸出相關(guān):無;反相關(guān):無;S1&S2:ai真相關(guān) ai = bi + ai與ci+1 = ai + di 展開循環(huán)后可見,由于循環(huán)引入的相關(guān):S4&S4 bi+1:真相關(guān);bi+1 = 2 * bi與bi+2 = 2 * bi+1 S4&am
20、p; S1 bi+1:真相關(guān);bi+1 = 2 * bi與ai+1 = bi+1 + ai+1 S4& S3 bi+1:真相關(guān);bi+1 = 2 * bi與ai = 2 * bi+1 S1&S3 ai:輸出相關(guān):ai = bi + ai 與ai = 2 * bi+1 反相關(guān):ai = bi + ai 與ai = 2 * bi+1 S2&S3 ai:反相關(guān):ci+1 = ai + di 與ai = 2 * bi+1 3.14 解:適合于流水線工作的算法:先計(jì)算A1B1、A2B2、A3B3和A4B4;再計(jì)算(A1B1)×(A2B2)和(A3B3)×(A4
21、B4);最后求總的結(jié)果。完成該計(jì)算的時(shí)空?qǐng)D,圖中陰影部分表示該段在工作。由圖可見,完成7個(gè)運(yùn)算用了18個(gè)t,吞吐率為: 如果不用流水線,由于一次求積需3t,一次求和需5t,則產(chǎn)生上述7個(gè)結(jié)果共需(4×5+3×3)t =29t。所以加速比為: 該流水線的效率可由陰影區(qū)的面積和5個(gè)段總時(shí)空區(qū)的面積的比值求得: 3.17 解:沒有控制相關(guān)時(shí)流水線的平均CPI1存在控制相關(guān)時(shí):由于無條件分支在第二個(gè)時(shí)鐘周期結(jié)束時(shí)就被解析出來,而條件分支要到第3個(gè)時(shí)鐘周期結(jié)束時(shí)才能被解析出來。所以:(1)若使用排空流水線的策略,則對(duì)于條件分支,有兩個(gè)額外的stall,對(duì)無條件分支,有一個(gè)額外的sta
22、ll:CPI = 1+20%*2+5%*1 = 1.45 加速比S=CPI/1 = 1.45(2) 若使用預(yù)測(cè)分支成功策略,則對(duì)于不成功的條件分支,有兩個(gè)額外的stall,對(duì)無條件分支和成功的條件分支,有一個(gè)額外的stall 1:CPI = 1+20%*(60%*1+40%*2) +5%*1 = 1.33 加速比S=CPI/1 = 1.33(3)若使用預(yù)測(cè)分支失敗策略,則對(duì)于成功的條件分支,有兩個(gè)額外的stall;對(duì)無條件分支,有一個(gè)額外的stall;對(duì)不成功的條件分支,其目標(biāo)地址已經(jīng)由PC 值給出,不必等待,所以無延遲:CPI = 1+20%*(60%*2 + 40%*0) +5%*1 =
23、1.29 加速比S=CPI/1 = 1.29補(bǔ)充題1已知有一個(gè)5段的流水線,其預(yù)約表如下: 時(shí)間功能段T1T2T3T4T5T6T7S1S2S3S4S51、試列出流水線的禁止表及原始沖突向量,畫出流水線的狀態(tài)圖,并選擇最佳的無沖突調(diào)度方案。2、按所選擇的調(diào)度方案,連續(xù)輸入6個(gè)任務(wù),畫出流水線的時(shí)空?qǐng)D并求出流水線的最大吞吐率、實(shí)際吞吐率、加速比和效率。3、如果采用非計(jì)算延遲功能段,按最小啟動(dòng)距離進(jìn)行調(diào)度,請(qǐng)畫出采用了預(yù)留非計(jì)算延遲功能段的預(yù)約表
24、,并判斷此時(shí)該流水線的最大吞吐率是多少?在按最小啟動(dòng)距離進(jìn)行調(diào)度時(shí),連續(xù)輸入6個(gè)任務(wù),畫出流水線的時(shí)空?qǐng)D并求出流水線的最大吞吐率、實(shí)際吞吐率、加速比和效率。答:1、 禁止表 F1,3,6,原始沖突向量 C(100101)流水線狀態(tài)圖調(diào)度方案平均延遲時(shí)間2,53.52,2,534,54.54455最佳的無沖突調(diào)度方案為 2,2,5,2、 S5112233445566S4121323454656S3112233445566S2121323454656S11231243564561234567891011121314151617181920設(shè)每個(gè)功能段的時(shí)間為t流水線的最大吞吐率 Tpmax1/3t
25、流水線的實(shí)際吞吐率 Tp6/20t0.3/t流水線的加速比:Sp6×7t/20t2. 1流水線的效率:E6×10/5*203/50.6=60%3、 最小啟動(dòng)距離為2,插入非計(jì)算延遲線D 時(shí)間功能段T1T2T3T4T5T6T7T8S1S2S3S4S5DD123456S5112233445566S4121324354656S3112233445566S2121324354656S1123415263456123456789101112131415161718按最小啟動(dòng)距離進(jìn)行調(diào)度時(shí),流水線的最大吞吐率 Tpmax1/2t 流水線的實(shí)際吞吐率 Tp6/18t1/3t0.333/t
26、流水線的加速比:Sp6×7t/18t7 /32.33流水線的效率:E6×10/5×182 /366.7%3.19 解:(1)設(shè)AB的中間結(jié)果放在V6中,(AB)×C的最后結(jié)果放在V7中,DE的中間結(jié)果放在V8中,(DE)×F的最后結(jié)果放在V9中。具體實(shí)現(xiàn)參考下圖:通過時(shí)間應(yīng)該為前者(AB)×C)通過的時(shí)間:T通過= (1+2+1)+(1+3+1) =9(拍)(2)在做完(AB)×C之后,作(CD)×E就不需要通過時(shí)間了。V6AB V7V6×C V8DE V9V8×F第四章1. 指令級(jí)并行的基本概
27、念。2. 開發(fā)指令級(jí)并行常用的方法3. 超標(biāo)量、超流水、超長指令字的概念。4. 超長指令字的實(shí)現(xiàn)5. 循環(huán)展開和指令調(diào)度的基本方法部分習(xí)題參考答案:4.3分析:產(chǎn)生結(jié)果指令使用結(jié)果指令延遲時(shí)鐘周期數(shù)浮點(diǎn)計(jì)算另外的浮點(diǎn)計(jì)算3浮點(diǎn)計(jì)算浮點(diǎn)數(shù)據(jù)存操作(SD)2浮點(diǎn)數(shù)據(jù)取操作(LD)浮點(diǎn)計(jì)算1浮點(diǎn)數(shù)據(jù)取操作(LD)浮點(diǎn)數(shù)據(jù)存操作(SD)0指令在流水線中執(zhí)行時(shí)需要的延遲:LOOP:L.DF0,0(R1) (空轉(zhuǎn))MUL.DF0,F0,F2L.DF4,0(R2)(空轉(zhuǎn))(空轉(zhuǎn))ADD.DF0,F0,F4(空轉(zhuǎn))(空轉(zhuǎn))S.DF0,0(R2)DSUBIR1,R1,#8DSUBIR2,R2,#8BNEZR1,
28、LOOP(空轉(zhuǎn))解:將循環(huán)展開兩次,進(jìn)行指令調(diào)度,即可以消除延遲,其中增加寄存器F10、F14,對(duì)應(yīng)一次循環(huán)中的F0和F4.代碼如下:LOOP: L.D F0,0(R1)L.D F10,-8(R1)MUL.D F0,F(xiàn)0,F(xiàn)2MUL.D F10,F(xiàn)10,F(xiàn)2L.D F4,0(R2)L.DF14,-8(R2)ADD.D F0,F(xiàn)0,F(xiàn)4ADD.DF10,F(xiàn)10,F(xiàn)14DSUBI R1,R1,#16S.D F0,0(R2)DSUBI R2,R2,#16BNEZ R1,LOOPS.D F10,8(R2)4.9 解:標(biāo)量流水處理機(jī)的時(shí)空?qǐng)D:執(zhí)行完12條指令需T114t。超標(biāo)量流水處理機(jī)與超長指令字處理
29、機(jī)的時(shí)空?qǐng)D:超標(biāo)量流水處理機(jī)中,每一個(gè)時(shí)鐘周期同時(shí)啟動(dòng)4條指令。執(zhí)行完12條指令需T25t,相對(duì)于標(biāo)量流水處理機(jī)的加速比為:超長指令字處理機(jī)中,每4條指令組成一條長指令,共形成3條長指令。執(zhí)行完12條指令需T35t,相對(duì)于標(biāo)量流水處理機(jī)的加速比為:超流水處理機(jī)的時(shí)空?qǐng)D:超流水處理機(jī)中,每1/4個(gè)時(shí)鐘周期啟動(dòng)一條指令。執(zhí)行完12條指令需T45.75t,相對(duì)于標(biāo)量流水處理機(jī)的加速比為:補(bǔ)充題設(shè)系統(tǒng)中有多個(gè)加法器,不存在加法器的資源沖突,有3條連續(xù)指令構(gòu)成的程序代碼段: ADD R1,R2,R4 ADD R2,R1,1 SUB R1,R4,R5請(qǐng)回答:(1) 分析代碼段中的存在的數(shù)據(jù)相關(guān);(2) 采
30、用何種硬件技術(shù)可以解決這些數(shù)據(jù)相關(guān)?要求加以說明。答:I1 ADD R1,R2,R4I2 ADD R2,R1,1I3 SUB R1,R4,R5真數(shù)據(jù)相關(guān)RAW:I1與I2(R1) 先寫后讀名相關(guān)WAW:I1與I3(R1) 先寫后寫 反相關(guān)WAR:I1與I2(R2);I2與I3(R1) 先讀后寫解決方法:(1)I1與I2關(guān)于R1的RAW相關(guān),可以用定向技術(shù)解決。(2)I1與I3關(guān)于R1的WAW相關(guān),I1與I2(R2);I2與I3(R1)的WAR,可以用寄存器換名技術(shù)解決。將R2,R1換名為R2,R1.解決結(jié)果:I1 ADD R1,R2,R4I2 ADD R2,R1,1I3 SUB R1,R4,R
31、5第五章1. 存儲(chǔ)器層次結(jié)構(gòu)的概念;采用存儲(chǔ)器層次結(jié)構(gòu)的目的;程序局部性在存儲(chǔ)器層次結(jié)構(gòu)中的應(yīng)用。2. 設(shè)置Cache主存層次、主存輔存層次的目的;Cache主存層次、主存輔存層次實(shí)現(xiàn)手段的不同之處。3. 命中率(失效率)、平均訪問時(shí)間的概念和計(jì)算方法;如何利用速度、容量、價(jià)格的關(guān)系設(shè)計(jì)存儲(chǔ)器層次結(jié)構(gòu)各級(jí)的參數(shù)。4. Cache的基本概念;主存Cache的三種地址映象方式及實(shí)現(xiàn)方法。能夠根據(jù)給定條件分析設(shè)計(jì)不同地址映象方式下,主存、Cache的地址和塊的映像關(guān)系。5. 各種替換算法的特點(diǎn)和實(shí)現(xiàn)方法;Cache的取算法和更新策略;Cache寫不命中時(shí)的調(diào)塊策略。6. 程序的執(zhí)行時(shí)間與Cache的
32、性能的關(guān)系7. Cache的性能分析,失效率與塊大小、相聯(lián)度、容量之間的關(guān)系8. 提高主存帶寬的方法;并行存儲(chǔ)器的特點(diǎn);高位交叉存取和低位交叉存取的特點(diǎn)和實(shí)現(xiàn)方法。能夠通過計(jì)算分析采用多體交叉技術(shù)后增加的存儲(chǔ)器帶寬和計(jì)算機(jī)性能的提高情況。部分習(xí)題參考答案:補(bǔ)充題 某采用組相聯(lián)映像方式的Cache存儲(chǔ)系統(tǒng)中,主存由M0M7共8塊組成,Cache由C0C3共4塊組成。Cache分為2組,每組2塊。設(shè)在某程序的執(zhí)行過程中,訪存的主存塊地址流為:M6、M2、M4、M1、M4、M6、M3、M4、M0、M5、M3、M7,主存中的內(nèi)容在程序開始時(shí)未裝入Cache。設(shè)Cache采用LRU替換算法。(1) 列表
33、寫出程序執(zhí)行過程中Cache中各塊的調(diào)入、替換和命中情況。(2) 計(jì)算該程序執(zhí)行過程中訪問Cache的命中率。答:主存塊M0、M2、M4、M6映射到Cache的0組中的C0、C1上主存塊M1、M3、M5、M7映射到Cache的1組中的C2、C3上 采用LRU替換算法時(shí)Cache中各塊使用情況:時(shí)刻123456789101112主存塊號(hào)M6M2M4M1M4M6M3M4M0M5M3M7C066*4444*4*44*4*4*4*C122*2*2*666*0000C21111*1*1*55*7*C33333*33調(diào)入調(diào)入替換調(diào)入命中替換調(diào)入命中替換替換命中替換Cache的命中率:H3/121/40.2
34、5 5.10 解:(1)根據(jù)題意,約75%的訪存為取指令。因此,分離Cache的總體失效率為:(75%×0.39%)(25%×4.82%)1.4975%; 容量為64KB的混合Cache的失效率略低一些,只有1.35%。 (2)平均訪存時(shí)間公式可以分為指令訪問和數(shù)據(jù)訪問兩部分: 平均訪存時(shí)間指令所占的百分比×(讀命中時(shí)間讀失效率×失效開銷)數(shù)據(jù)所占的百分比×(數(shù)據(jù)命中時(shí)間數(shù)據(jù)失效率×失效開銷) 所以,兩種結(jié)構(gòu)的平均訪存時(shí)間分別為: 分離Cache的平均訪存時(shí)間75%×(10.39%×50)25%×(14.
35、82%×50)(75%×1.195)(25%×3.41)0.89625+0.85251.74875 混合Cache的平均訪存時(shí)間75%×(11.35%×50)25%×(111.35%×50)(75%×1.675)(25%×2.675)1.256250.668751.925因此,盡管分離Cache的實(shí)際失效率比混合Cache的高,但其平均訪存時(shí)間反而較低。分離Cache提供了兩個(gè)端口,消除了結(jié)構(gòu)相關(guān)。5.11 解:平均訪問時(shí)間命中時(shí)間失效率×失效開銷平均訪問時(shí)間1-路=2.0+1.4% *80=3
36、.12ns平均訪問時(shí)間2-路=2.0*(1+10%)+1.0% *80=3.0ns兩路組相聯(lián)的平均訪問時(shí)間比較低CPUtime=(CPU執(zhí)行+存儲(chǔ)等待周期)*時(shí)鐘周期CPU time=IC(CPI執(zhí)行+總失效次數(shù)/指令總數(shù)*失效開銷)*時(shí)鐘周期=IC(CPI執(zhí)行*時(shí)鐘周期)+(每條指令的訪存次數(shù)*失效率*失效開銷*時(shí)鐘周期)CPU time 1-way=IC(2.0*2+1.2*0.014*80)5.344ICCPU time 2-way=IC(2.2*2+1.2*0.01*80)5.36IC相對(duì)性能比:5.36/5.344=1.003和平均訪存時(shí)間的比較結(jié)果相反,從CPU時(shí)間的角度看,直接映
37、像Cache的平均性能好一些。5.12解:采用按寫分配(1)寫直達(dá)cache訪問命中,有兩種情況:讀命中,不訪問主存;寫命中,更新cache和主存,訪問主存一次。訪問失效,有兩種情況:讀失效,將主存中的塊調(diào)入cache中,訪問主存兩次;寫失效,將要寫的塊調(diào)入cache,訪問主存兩次,再將修改的數(shù)據(jù)寫入cache和主存,訪問主存一次,共三次。上述分析如下表所示。訪問命中訪問類型頻率訪存次數(shù)Y讀95%*75%=71.3%0Y寫95%*25%=23.8%1N讀5%*75%=3.8%2N寫5%*25%=1.3%3一次訪存請(qǐng)求最后真正的平均訪存次數(shù)=(71.3%*0)+(23.8%*1)+(3.8%*2
38、)+(1.3%*3)0.35次已用帶寬=0.35×109/109 =35.0%(2)寫回法cache訪問命中,有兩種情況:讀命中,不訪問主存;寫命中,不訪問主存。采用寫回法,只有當(dāng)修改的cache塊被換出時(shí),才寫入主存;無論讀寫,若訪問失效,則有一個(gè)塊將被換出,這也有兩種情況:讀失效:概率5%*75%=3.75%,70%塊是干凈的,沒有被修改過,直接調(diào)塊,訪存2次,30%塊為臟,cache塊寫回后,再調(diào)塊,訪存4次。寫失效:概率 5%×25%=1.25%,采用按寫分配法:調(diào)塊后寫入Cache。70%塊是干凈的,沒有被修改過,直接調(diào)塊,訪存2次,30%塊為臟,cache塊寫回
39、后,再調(diào)塊,訪存4次??偨Y(jié):如果被替換的塊沒有修改過,將主存中的塊調(diào)入cache塊中,訪問主存2次;如果被替換的塊修改過,則首先將修改的塊寫入主存,需要訪問主存2次;然后將主存中的塊調(diào)入cache塊中,需要訪問主存2次,共4次訪問主存。訪問命中塊為臟頻率訪存次數(shù)YN95%*70%=66.5%0YY95%*30%=28.5%0NN5%*70%=3.5%2NY5%*30%=1.5%4所以:一次訪存請(qǐng)求最后真正的平均訪存次數(shù)=66.5*028.5%*0+3.5%*2+1.5%*4=0.13次已用帶寬0.13×10 9/10 913%第六章1. I/O系統(tǒng)的特點(diǎn);I/O系統(tǒng)對(duì)計(jì)算機(jī)系統(tǒng)性能的
40、影響,利用加速比進(jìn)行量化比較。2. 通道的概念;帶有通道的I/O系統(tǒng)的結(jié)構(gòu);通道的工作過程。字節(jié)多路通道、選擇通道、數(shù)組多路通道的特點(diǎn);根據(jù)給定條件進(jìn)行通道流量分析和主存頻率計(jì)算。部分習(xí)題參考答案:6.8解:(1)通道實(shí)際流量為(2)由于通道的最大流量等于實(shí)際工作流量,即有可得,通道的工作周期Ts+TD = 5s。補(bǔ)充題有8臺(tái)外設(shè)的數(shù)據(jù)傳輸率分別如下表所示。設(shè)備號(hào)12345678數(shù)據(jù)傳輸速率(B/ms)5002401007550401410現(xiàn)要設(shè)計(jì)一種通道,其設(shè)備選擇時(shí)間TS2µs,數(shù)據(jù)傳輸時(shí)間TD2µs。請(qǐng)回答:(1) 如果按字節(jié)多路通道設(shè)計(jì),該通道的最大流量是多少?如果希望從8臺(tái)設(shè)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年海南省安全員知識(shí)題庫
- 2025年貴州省安全員C證考試(專職安全員)題庫附答案
- 中醫(yī)內(nèi)科學(xué)-癭病
- 【大學(xué)課件】建筑設(shè)備工程
- 聲音的產(chǎn)生與傳播+flash課件
- 語文課件-畫蛇添足
- 三年級(jí)語文《炮手》課件
- 建設(shè)工程安全生產(chǎn)管理課件
- 萬科穿插施工與施工計(jì)劃
- 《急腹癥幻燈》課件
- 2024年新技術(shù)、新產(chǎn)品、新工藝、新材料的應(yīng)用培訓(xùn)課件
- 2025新年春節(jié)專用對(duì)聯(lián)蛇年春聯(lián)帶橫批
- 2025年中聯(lián)重科公司發(fā)展戰(zhàn)略和經(jīng)營計(jì)劃
- Unit8 Chinese New Year 第一課時(shí)(說課稿)-2024-2025學(xué)年譯林版(三起)英語六年級(jí)上冊(cè)
- JGJT46-2024《施工現(xiàn)場(chǎng)臨時(shí)用電安全技術(shù)標(biāo)準(zhǔn)》條文解讀
- 半結(jié)構(gòu)化面試題100題
- 服裝廠班組長培訓(xùn)
- 廣東省公立醫(yī)療機(jī)構(gòu)基本醫(yī)療服務(wù)價(jià)格項(xiàng)目修訂表
- 申論公務(wù)員考試試題與參考答案
- 《激光原理及應(yīng)用》全套課件
- 北京市海淀區(qū)2023-2024學(xué)年高三上學(xué)期期末考試+歷史 含答案
評(píng)論
0/150
提交評(píng)論