




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、精選優(yōu)質(zhì)文檔-傾情為你奉上Question 4A single-issue processor uses tomasulos algorithm in its floating-point unit, which has one adder and one multiplier,each with its own set of reservation station,there is only one CDB ,and broadcast on this CDB takes an entire cycle.the processor is executing the following seq
2、uence of instruction and, for each instruction ,we show the cycle in which the instruction is fetched, decoded, issued, begins to execute,and writes result.單發(fā)射處理器在其浮點單元中使用托馬斯算法,其具有一個加法器和一個乘法器,每個具有其自己的一組保留站,只有一個CDB,并且在該CDB上廣播需要整個周期。處理器 正在執(zhí)行以下指令序列,并且對于每個指令,我們示出指令被取出,解碼,發(fā)出,開始執(zhí)行和寫入結(jié)果的周期。instructionfetch
3、decodeissueexecuteWrite resultI1MUL R1,R2,R212348I2ADD R1,R1,R2234910I3MUL R2,R2,R3345813I4ADD R3,R1,R14561112I5MUL R1,R1,R15671216I6ADD R2,R3,R46711?I7ADD R1,R5,?781317181、 what is the latency of the multiplier? 42、 Is the multiplier pipelined? N3、 How many reservation station are there for the add
4、er? 2 4、 In which cycle does I6 begin to execute? 135、 Which register does ? Represent in I7 R16、 If the priory for using CDB depends on the type of instruction,between ADD and MUL the priority for using the CDB goes to _? ADDQuestion 8(書本92頁).Loop: LD R1,0(R2) ;load R1 from address 0+R2DADDI R1,R1,
5、#1 ;R1=R1+1SD R1,0,(R2) ;store R1 at address 0+R2DADDI R2,R2,#4 ;R2=R2+4DSUB R4,R3,R2 ;R4=R3-R2BNEZ R4,Loop ;branch to Loop if R4!=0Assume that the initial value of R3 is R2 + 396.答案:(1)依題意可得,指令序列執(zhí)行的流水線時空圖如下:1234567891011121314151617181920211IFIDEXMEWB2IFIDEXMEWB3IFIDEXMEWB4IFIDEXMEWB5IFIDEXMEWB6IFI
6、DEXMEWB1IFIFIDEXME時鐘周期為:17*98+18 = 1684 (2)依題意可得,指令序列執(zhí)行的流水線時空圖如下:1234567891011121314151IFIDEXMEWB2IFIDSEXMEWB3IFSIDEXMEWB4IFIDEXMEWB5IFIDEXMEWB6IFIDEXMEWB7IFMissMissIFIDEXMEWB 時鐘周期為:10*98+11 = 991 (3) 依題意可得,指令序列執(zhí)行的流水線時空圖如下:12345678910111IFIDEXMEWB2IFIDEXMEWB3IFIDEXMEWB4IFIDEXMEWB5IFIDEXMEWB6IFIDEXME
7、WB1IFIDEXMEWB時鐘周期為:6*98+10 = 598 Question 99a) What is the effective access time of a cache memory system in which there is a 2-way set associative cache, having the following parameters:Parameter: Value:number of sets 1024 setsline size 16 wordscache access time 15 ns/linemain memory access time 70
8、 ns/wordmain memory address space size 256M wordscache hit rate 95%Label the fields of the memory address below used to access the cache and indicate the size of each field (in number of bits). Assume that memory is word-addressed.Tag : _14_ bits Index : _10_ bits Offset : _4_ bits9b) What is the ef
9、fective access time of a cache memory system in which there is a direct mapped level 1 (L1) cache and a fully associative level 2 (L2) cache, having the following parameters:Parameter:Value:L1 number of sets128 setsL1 line size4 wordsL1 cache access time10 ns/lineL2 line size8 wordsL2 cache access t
10、ime20 ns/linemain memory access time70 ns/wordmain memory size256M wordsL1 cache hit rate95%L2 cache hit rate89%Label the fields of the memory address below used to access the L1 cache and indicate the size of each field (in number of bits). Assume that memory is word-addressed.Tag : _19_ bits Index
11、 :_7_ bits Offset :_2_ bitsLabel the fields of the memory address below used to access the L2 cache and indicate the size of each field (in number of bits). Assume that memory is word-addressed.Tag : _25_bits Index : _0_bits Offset : _3_ bitsQuestion 11一個簡單的共享內(nèi)存cache-coherent機(jī)有四個處理器,沒有"虛擬到物理&qu
12、ot;的翻譯和16位(物理)地址。每個處理器有一個L1數(shù)據(jù)緩存,沒有L2高速緩存。每個L1緩存是有四個64字節(jié)的塊(每個緩存的大小是256字節(jié))的直接変換,他們使用MESI一致性協(xié)議來保持一致的。每個緩存的初始狀態(tài)(十六進(jìn)制符號標(biāo)記所示):P0P1P2P3statetagstatetagstatetagstatetagI0FS0FS01S01M01E02M03E04I0FI0FE0FI0FM00E02S04I06如果按順序執(zhí)行下面的內(nèi)存訪問,將會發(fā)生什么?特別是,指定每個其他的緩存發(fā)生在由于總線廣播、數(shù)據(jù)從哪里來(如果在緩存中沒有準(zhǔn)備好),和新狀態(tài)塊的請求者的緩存。P0寫一個字到地址00 fc
13、P1讀一個字到地址0 f8c P2讀一個字到地址0 f8c P3寫一個字到地址0444 答案:P0P1P2P3statetagstatetagstatetagstatetagIOFSOFSOFSOFM01E02M03M04IOFIOFEOFIOFM00E02S04I06Question 13答案:A: P0 B0( S,120,00,20)B: P0 B0 (M,120,00,80) P1 B0 (I,120,00,20)C: P2 B0 (M,120,00,80) P0 B0 (I,120,00,80) P1 B0 (I,120,00,80)D: P1 B2 (S,110,00,30)P2
14、B2 (S,110,00,30) E: P0 B1 (M,108,00,48) P1 B1 (I,108,,0,08) P2 B1(I,108,00,08)F: P0 B2 (M,130,00,78) 1. 處理器中某功能部件占總應(yīng)用程序執(zhí)行時間的比例為40%,先將該功能部件改進(jìn)(加速10倍),則整個應(yīng)用程序的加速比為多少?( D )A. 1.4B. 2.5 C. 2.18D. 1.562. 在計算機(jī)系統(tǒng)設(shè)計中,比較好的方法是:( D )A.從上向下設(shè)計 B.從下向上設(shè)計C.從兩頭向中間設(shè)計 D.從中間開始向上、向下設(shè)計3. 對系統(tǒng)程序員不透明的是:( D )A. Cache存儲器B. 系列機(jī)
15、各檔不同的數(shù)據(jù)通路寬度C. 指令緩沖寄存器 D. 虛擬存儲器4. 系列機(jī)軟件應(yīng)做到:( B )A.向前兼容,并向上兼容B.向后兼容,力爭向上兼容C.向前兼容,并向下兼容 D.向后兼容,力爭向下兼容5. 屬計算機(jī)系統(tǒng)結(jié)構(gòu)考慮的應(yīng)是( C )。A主存采用CMOS還是TTL B主存采用多體交叉還是單體C主存容量和編址方式 D主存頻寬的確定6. 最能確保提高虛擬存儲器訪問主存的命中率的改進(jìn)途徑是( D )。A增大輔存容量 B采用FIFO替換算法并增大頁面C改用LRU替換算法并增大頁面 D改用LRU替換算法并增大頁面數(shù)7. 靜態(tài)流水線是指( C )。A只有一種功能的流水線 B功能不能改變的流水線C同時只
16、能完成一種功能的多功能流水線D可同時執(zhí)行多種功能的流水線8. 假設(shè)用軟件方法在A計算機(jī)上實現(xiàn)B計算機(jī)的指令系統(tǒng),則B稱為( C )。A仿真機(jī)B.宿主機(jī)C虛擬機(jī)D.目標(biāo)機(jī)9. 計算機(jī)中優(yōu)化使用的操作碼編碼方法是( D )。A.哈夫曼編碼 B.ASCII碼 C.BCD碼 D.擴(kuò)展操作碼10. 在采用基準(zhǔn)測試程序來測試評價機(jī)器的性能時,下列方法按照評價準(zhǔn)確性遞增的順序排列是( B )。(1)實際的應(yīng)用程序方法(2)核心程序方法(3)玩具基準(zhǔn)測試程序(小測試程序)(4)綜合基準(zhǔn)測試程序A:(1)(2)(3)(4)B:(2)(3)(4)(1)C:(3)(4)(1)(2)D:(4)(3)(2)(1)11.
17、 10. 在系統(tǒng)結(jié)構(gòu)設(shè)計中,提高軟件功能實現(xiàn)的比例會( C )。A、提高解題速度 B、減少需要的存貯容量C、提高系統(tǒng)的靈活性 D、提高系統(tǒng)的性能價格比12. CPI是量化計算機(jī)性能的一個重要指標(biāo),關(guān)于CPI說法正確的是( C )A .CPI由計算機(jī)的結(jié)構(gòu)決定B. CPI由運(yùn)行在計算機(jī)系統(tǒng)上的應(yīng)用程序決定C. CPI由計算機(jī)的結(jié)構(gòu)和應(yīng)用程序共同決定 D.CPI由計算機(jī)的時鐘周期決定13. 以下不屬于計算機(jī)性能公式的變量是( D )A. IC B. 時鐘周期 C. CPI D. MIPS14. 未曾實現(xiàn)的商業(yè)計算機(jī)結(jié)構(gòu)類型是 ( C ) A. SISD B. SIMD C. MISD D. MIM
18、D15. 關(guān)于近10年CPU從單核轉(zhuǎn)向多核處理器的解釋正確的是 ( D )A. 指令級并行技術(shù)已經(jīng)發(fā)展到極限 B. CPU的工作電壓很難再下降C. 提高時鐘頻率會帶來CPU的散熱極限問題 D. 上述理由全部正確16. 圖像處理器GPU屬于哪種結(jié)構(gòu)( B )A. SISD B. SIMD C. MISD D. MIMD17. 以下不屬于Flynn體系結(jié)構(gòu)類型的是( C )A. SISD B . SIMD C. SIMT D. MISD18. CPI是量化計算機(jī)性能的一個重要指標(biāo),關(guān)于CPI說法正確的是( B )A .CPI由計算機(jī)的結(jié)構(gòu)決定B. CPI由運(yùn)行在計算機(jī)系統(tǒng)上的應(yīng)用程序決定 C. C
19、PI由計算機(jī)的結(jié)構(gòu)和應(yīng)用程序共同決定 D.CPI由計存儲器系統(tǒng)決定分析:CPI=TC/IC19. 與存儲器-存儲器結(jié)構(gòu)指令集結(jié)構(gòu)相比, 寄存器-寄存器結(jié)構(gòu)( D ).A. CPI大 B. 完成同一個算法需要的指令數(shù)更少 C. 指令的功能更復(fù)雜 D. 固定長度的指令編碼方式20. 計算機(jī)系統(tǒng)的執(zhí)行時間的通用公式為: CPUtime = y × 時鐘周期 × CPI, 此處y是 ( B )A. 程序執(zhí)行的周期數(shù)B. 被執(zhí)行的指令總數(shù)C. 包括訪問存缺失在內(nèi)的指令平均執(zhí)行時間D. 每個周期內(nèi)執(zhí)行的指令數(shù)21. RISC 與 CISC 不同處有 ( C ) A. RISC指令復(fù)雜
20、B. CISC 指令效率高C .RISC 指令數(shù)量少 D. 以上說法均錯誤22. 關(guān)于MIPS的指令集結(jié)構(gòu)類型說法正確的是( A )A. 寄存器-寄存器B. 寄存器-存儲器 C. 存儲器-存儲器 D. 以上說法均錯23. 流水線技術(shù)可以( A )A. 提高吞吐率 B. 降低吞吐率C. 降低響應(yīng)時間 D. 增加響應(yīng)時間24. 流水線通過哪種方式提高系統(tǒng)的性能 ( C )A. 減少指令的響應(yīng)時間 B. 消除指令相關(guān)C. 開發(fā)指令級的并行 D. 降低CACHE的缺失率25. 惡化流水線的處理器性能的原因是( D )A .流水線每級處理時間不同B.連續(xù)的指令間的相關(guān)C.流水線的結(jié)構(gòu)相關(guān)D .以上全部正
21、確26. 流水線技術(shù)可以( D )A. 提高吞吐率和不改變響應(yīng)時間B. 提高吞吐率和降低響應(yīng)時間C. 降低吞吐率和降低響應(yīng)時間D. 提高吞吐率和增加響應(yīng)時間27. 在k級單流水線中執(zhí)行n個任務(wù),所消耗的時鐘周期數(shù)( A )A. k+n-1 B. nk+1 C. k D. 以上說法全部錯誤28. 關(guān)于靜態(tài)指令調(diào)度和指令動態(tài)調(diào)度說法錯誤的是( C )A. 編譯器相比于硬件有更多的時間處理復(fù)雜的調(diào)度算法B. 編譯器靜態(tài)調(diào)度的前提是假設(shè)指令間存在比時間更復(fù)雜的沖突C. 編譯器靜態(tài)調(diào)度需要比動態(tài)調(diào)度更多的關(guān)于沖突的精確歷史數(shù)據(jù)D. 以上說法都錯誤29. 保留站項在流水線的哪一級釋放( A )A. 寫結(jié)果
22、 B. 發(fā)射 C. 執(zhí)行 D. 確認(rèn)30. 使用獨立的指令CACHE和數(shù)據(jù)CACHE的理由是( D )A . 數(shù)據(jù)和指令存在在不同的存儲器。B. 每個核的指令不同但數(shù)據(jù)共享 C. 存儲器的方法模式不同D. 減少指令和數(shù)據(jù)訪存的沖突31. 關(guān)于全相聯(lián)CACHE說法正確的是 ( C )A. 等價于一個1組1路組相聯(lián) CACHEB. 等價于一個多組1路組相聯(lián)CACHEC.等價于一個1組多路直接映像CACHED.等價于一個多組1路組直接映像CACHE32. 關(guān)于強(qiáng)制性不命中說法正確的是( A )A .塊第一次被訪存所以不在CACHE中. B. 程序執(zhí)行過程中由于cache容量有限不能保存所有塊C. 因
23、為采用組相聯(lián)和直接映像所以發(fā)生沖突被替換掉D.以上說法全錯33. 在采用單流水線、順序執(zhí)行和順序提交結(jié)果的處理器中,那種情況會導(dǎo)致數(shù)據(jù)冒險( C )A. 寫后寫 B.讀后寫 C.寫后讀 D. 讀后讀34. 為什么亂序執(zhí)行的處理器采用順序方式提交指令執(zhí)行結(jié)果?( D )A. 確保精確異常 B. 確保多CACHE的一致性C. 糾正和恢復(fù)分支預(yù)測錯誤的現(xiàn)場 D. A和C都正確35. 在塊替換策略中,采用替換最近很少使用方法的理由是( A )A. 充分利用了程序的時間和空間局部性原理B. 充分利用了程序的局部性原理C. 充分利用了程序的空間局部性原理D. 沒用充分利用了程序的時間和空間局部性原理36.
24、 在4路組相聯(lián)緩存中,一個新的塊的位置被映像到( C )A. 任何位置B. 塊地址與組數(shù)取余運(yùn)算的結(jié)果選組號,然后固定在組中的固定位置C. 塊地址與組數(shù)取余運(yùn)算的結(jié)果選組號,然后存放在組中的任何位置D. 以上說法都不對37. 關(guān)于最近20年內(nèi)發(fā)生的事情說法正確的是( A )A. 處理器和存儲器性能都提高了,但是處理器提高更多。B. 存儲器性能提高但處理器沒有。C. 處理器和存儲器性能都提高了,但是存儲器提高更多。D. 處理器性能提高但存儲器沒有。38. 相比于寫直達(dá)發(fā),寫回法的優(yōu)勢在于?( A )A. 減少存儲器訪存次數(shù) B. 減少不命中的開銷C.減少命中時間 D.降低缺失率39. 假設(shè)指令的
25、處理必須使用五個功能部件, 這五個部件的執(zhí)行時間分別為 : 10 ns, 8 ns,10 ns,10 ns and 7 ns.如果使用流水線技術(shù),流水線寄存器的時間開銷為1 ns ,采用流水線與非流水線的加速比為( A ) A. 4.1 B. 5 C. 4.5 D. 340. 下列說法錯誤是:( B )A. 分支預(yù)測轉(zhuǎn)移比預(yù)測分支不轉(zhuǎn)移困難,因為需要提前指導(dǎo)分支轉(zhuǎn)移目標(biāo)指令的地址。B. 預(yù)測分支轉(zhuǎn)移和不轉(zhuǎn)移的準(zhǔn)確率都為50%。C. 根據(jù)BTB可以在取指令前判斷該指令是否為分支指令。D. 流水線的深度會增加分支預(yù)測錯誤的開銷時間。41. 寄存器換名技術(shù)可以消除( D )A. 寫后寫冒險B. 讀后
26、寫冒險C. 寫后讀冒險D. A和C全部正確42. 以下說法錯誤的是( D )A. 第一級緩存的容量小于第二級緩存的容量B. 第一級緩存的響應(yīng)時間小于第二級緩存的響應(yīng)時間C. 第一級緩存的被訪問次數(shù)小于第二級緩存的訪問次數(shù)D. 第一級緩存和第二級緩存都采用相同的地址映像方法43. 假設(shè)指令的處理必須使用五個功能部件, 這五個部件的執(zhí)行時間分別為 : 10 ns, 8 ns,10 ns,10 ns and 7 ns.如果使用流水線技術(shù),流水線寄存器的時間開銷為1 ns ,采用流水線與非流水線的加速比為( A ) A. 4.1 B. 5 C. 4.5 D. 344. 為什么亂序執(zhí)行的處理器采用順序方
27、式提交指令執(zhí)行結(jié)果?( D )A. 確保精確異常B. 確保多CACHE的一致性C. 糾正和恢復(fù)分支預(yù)測錯誤的現(xiàn)場D. A和C都正確45. 在前瞻執(zhí)行中,ROB中的項釋放處在那一級( C )A. 譯碼 B. 發(fā)射 C. 執(zhí)行 D. 確認(rèn)46. 以下說法正確的是? ( D )A. 直接映像 cache 與只有1個組多路組相聯(lián)CACHE等價B. 直接映像 cache 與只有1個組的全相聯(lián)CACHE等價C. 直接映像 cache 與只有1個組1路組相聯(lián)CACHE等價D. 以上說法都錯47. 下列哪種地址映像方式不適合使用位預(yù)測技術(shù) ( D ) A. 全相聯(lián) B. 4路組全相聯(lián)C. 8路組全相聯(lián)D. 直
28、接映像48. 在監(jiān)聽協(xié)議中,那種情況下主存的信息不是最新的( C )A. 對共享狀態(tài)數(shù)據(jù)進(jìn)行寫操作后的寫直達(dá) cachesB. 寫回caches有數(shù)據(jù)被標(biāo)記為獨享狀態(tài)C. 寫回 caches有數(shù)據(jù)被標(biāo)記為修改狀態(tài)D. 寫回caches有數(shù)據(jù)被標(biāo)記為共享狀態(tài)49. 下列哪種技術(shù)并沒用通過采用開發(fā)并行度方法提高系統(tǒng)的性能( B ) A. 增加流水線深度提高工作頻率 B. 采用小緩存減少訪存響應(yīng)時間 C . 增加功能部件提高吞吐率D. 采用多核處理器50. 假設(shè)有一單級非流水線處理器其機(jī)器周期為5ns,如果采用4級流水線實現(xiàn)該處理器,其機(jī)器周期為2ns,后者與前者的加速比是( D )A. 3 B.
29、2.5 C. 2 D. 0.551. 流水線寄存器發(fā)射出一條加法指令,同時也沒收到氣泡和停頓信息停頓信號,此時在指令隊列的尾部存在一條XOR運(yùn)算指令,則等待發(fā)射的是( A )A add B xor C 氣泡 D 停頓52. 對于以下代碼:Int sum=0;for (int j = 0; j <1000; j+)sum= sum+arri下列那個變量利用了程序的空間局部性原理( ) 和時間局部性原理( B )A. j B. sum C. elements of arr D.以上都不正確53. 在使用虛擬存儲系統(tǒng)中 ,應(yīng)用程序所使用的地址是( D )A. 主存空間B. 物理地址C. 地址空
30、間D. 虛擬地址54. 某計算機(jī)的Cache-主存層次采用組相聯(lián)映象方式,塊大小為128字節(jié),Cache容量為64塊,按4塊分組,主存容量為4096塊。那么主存地址共需 ( A ) 位。A.19B.18 C.20D.以上都不對55. 基本的MIPS整數(shù)流水線中,訪存地址的計算發(fā)生在流水線的第( C )段。A1 B2 C3 D456. RISC執(zhí)行程序的速度比CISC要快的原因是( C )。A.RISC的指令系統(tǒng)中指令條數(shù)較少B.程序在RISC上編譯生成的目標(biāo)程序較短。C.RISC的指令平均執(zhí)行周期數(shù)較少。D.RISC只允許load和store指令訪存。57. 通過編譯器重新安排指令的執(zhí)行順序以
31、減少流水的停頓方法,稱之為( D )。A線性流水線 B非線性流水線 C動態(tài)調(diào)度 D靜態(tài)調(diào)度判斷題1. A Distributed Memory Multiprocessor is also called a Symmetric Multiprocessor (SMP).分布式內(nèi)存的多處理器也稱為對稱多處理器(SMP)。 ( T )2. Suppose we expect at least an 80X parallel speed up from 100 processors. At most 0.25% of the execution of the original program may
32、 be sequential (i.e., non-parallelizable).假設(shè)我們希望至少一個從80年80 x并行加速處理器。最多0.25%的原始程序的執(zhí)行順序(即。non-parallelizable)。( T )3. Suppose a conditional branch alternates between taken and not taken every time it is executed. A one-bit BHT predictor is likely to have a misprediction rate of 100% on this branch.假設(shè)一
33、個條件分支之間的交替而不是采取每次執(zhí)行時。一個一比特的二叔丁基對甲酚預(yù)測可能會對這個分支的錯誤預(yù)測率為100%。( T )4. Suppose a conditional branch is taken the first 1000 times it is executed, and not taken the second 1000 times. A one-bit BHT predictor is likely to have performance similar to a correlating branch predictor on this branch.假設(shè)條件分支被執(zhí)行第一的1
34、000倍,而不是采取第二個1000次。一比特的二叔丁基對甲酚預(yù)測可能是性能類似于相關(guān)分支預(yù)測在這個分支。( F )5. In Tomasulo's algorithm with speculation, when a branch is mispredicted, the data written to memory and the register file as a result of that branch are rolled back to their previous values.與投機(jī)Tomasulo的算法,當(dāng)一個分支預(yù)測錯誤,數(shù)據(jù)寫入內(nèi)存和寄存器文件的分支被回滾到之前
35、的值。( T )6. A Single-Instruction-Multiple-Data (SIMD) model of computation is characterized by independent threads computing on private memories.單指令多數(shù)據(jù)(SIMD)計算模型計算的特點是獨立的線程在私人記憶。( T )7. A return address predictor is likely to mispredict when there is deep recursion.( F )深度遞歸的時候,返回地址預(yù)測相當(dāng)于誤預(yù)測。8. Comput
36、er architecture design needs to provide support to compiler.計算機(jī)體系結(jié)構(gòu)設(shè)計需要為編譯器提供支持。( T )9. In the MIPS Pipeling, 'Updating the PC' is completed in EX stage.在MIPS Pipeling,“更新電腦”是在前階段完成。( F )10. For forwarding you need only look at the data available in the MEM stage.轉(zhuǎn)發(fā)你只需要看數(shù)據(jù)在MEM階段。( F )11. In
37、the MIPS pipeline, both reading and writing the register file can be done during half a clock cycle period. In particular reading is done in the first half while writing is done in the second half.在MIPS管道,讀寫寄存器文件可以半個時鐘周期期間完成。在上半年完成特定的閱讀寫作是在下半年完成。( F )12. In Tomasulo's algorithm with speculation,
38、 instructions may complete out of order.與投機(jī)Tomasulo的算法,說明可能完成的訂單。( F )13. The reorder buffer enables precise exceptions and interrupts.重新排序緩沖區(qū)支持精確的異常和中斷。( T )14. Critical word first reduce the cache miss penalty.關(guān)鍵字首先減少緩存錯過點球。( T )15. The LRU (least-recently used) replacement policy works because pr
39、ograms exhibit temporal locality. LRU(最近最少使用)替代政策工作,因為項目展覽時間局部性。( T )16. A distributed shared memory (DSM) multiprocessor usually has non-uniform memory access.分布式共享內(nèi)存(DSM)多處理器通常有非一致內(nèi)存訪問。( T )17. Computer architecture is intend to cover three affects of hardware, organization and ISA.計算機(jī)體系結(jié)構(gòu)是打算覆蓋硬件的
40、三個影響,組織和ISA。( T )18. Compared with memory-memory architecture, register-register architecture has higher CPI.與memory-memory架構(gòu)相比,注冊登記體系結(jié)構(gòu)具有較高的CPI。( F )19. For forwarding you need only look at the data available in the WB Stage.轉(zhuǎn)發(fā)你只需要看數(shù)據(jù)在白平衡階段。( F )20. Data hazard rise when an instruction depends on t
41、he results of a previous instruction in a way that is exposed by the overlapping of instructions in the pipeline.數(shù)據(jù)風(fēng)險上升,當(dāng)一個指令的結(jié)果依賴于前一個指令的方式公開的重疊在管道的指令。( T )21. Doubling the associativity of a cache without changing its overall capacity or block size will increase the tag size by one bit.翻倍的結(jié)合性緩存不改變其
42、整體能力或塊大小將增加標(biāo)簽的大小。( T )22. The MIPS CPU has a RISC ISA. ( T )23. CPI is always a number greater than or equal to 1, because an instruction cant be executed in less than one cycle.CPI總是大于或等于1,因為一個指令不能被執(zhí)行在不到一個周期。( F )24. Splitting the shortest stage of a five-stage pipeline will result in a higher cloc
43、k rate.分裂的最短階段五級管道將導(dǎo)致更高的時鐘頻率。( F )25. There are 3 types of pipeline hazards: structure, data, and control hazards.有3種管道危險:結(jié)構(gòu)、數(shù)據(jù)和控制危害。( T )26. In Tomasulo's algorithm with speculation, when a branch is mispredicted , the data written to memory and the register file as a result of that branch are
44、rolled back to their previous values.與投機(jī)Tomasulo的算法,當(dāng)一個分支預(yù)測錯誤,數(shù)據(jù)寫入內(nèi)存和寄存器文件的分支被回滾到之前的值。( T )27. A two-bit predictor performs better than a single bit predictor even if the conditional branch is executed exactly once.低廉的預(yù)測性能優(yōu)于單一位預(yù)測即使條件分支完全執(zhí)行一次。( F )28. A direct-mapped cache of size N has the same miss
45、 rate as a 2-way set-associative cache of size N/2.direct-mapped緩存大小為N的缺頁率具有相同的雙向set-associative緩存的大小為N / 2。( T )29. A CISC architecture has a fixed instruction length.CISC體系結(jié)構(gòu)有一個固定的指令長度。( F )30. Splitting the shortest stage of a five-stage pipeline will result in a higher clock rate.分裂的最短階段五級管道將導(dǎo)致更
46、高的時鐘頻率。( F )31. Data hazards are caused by hardware conflict. 數(shù)據(jù)危害是由硬件引起的沖突。( F )32. Merging write Buffer reduce the cache miss penalty.合并寫緩沖減少緩存錯過點球。( T )33. CPI is always a number greater than or equal to 1, because an instruction cant be executed in less than one cycle.CPI總是大于或等于1,因為一個指令不能被執(zhí)行在不到一
47、個周期。( )34. Suppose a conditional branch alternates between taken and not taken every time it is executed. A one-bit BHT predictor is likely to have a misprediction rate of 100% on this branch.假設(shè)一個條件分支之間的交替而不是采取每次執(zhí)行時。一個一比特的二叔丁基對甲酚預(yù)測可能會對這個分支的錯誤預(yù)測率為100%。( T )35. Register renaming eliminates stalls due
48、to flow (WAR) dependences on registers.寄存器重命名消除攤位由于流(戰(zhàn)爭)依賴性寄存器。( T )36. A dynamic branch predictor is always better than a static one.一個動態(tài)分支預(yù)測總是比靜態(tài)的好。( F )37. Translation look-aside buffers (TLBs) are caches that hold virtual address to physical address translations.轉(zhuǎn)換后援緩沖區(qū)(tlb)緩存,虛擬地址到物理地址的翻譯。( T )
49、簡答題(紅色為A卷試題)1、 RISC機(jī)器的設(shè)計原則答:指令條數(shù)少、指令功能簡單。確定指令系統(tǒng)時,只選取使用頻度很高的指令,在此基礎(chǔ)上補(bǔ)充一些最有用的指令(如支持操作系統(tǒng)和高級語言實現(xiàn)的指令);采用簡單而又統(tǒng)一的指令格式,并減少尋址方式,指令字長都為32位或64位;指令的執(zhí)行在單周期內(nèi)完成(采用流水線技術(shù)后);采用load-store結(jié)構(gòu),即只有l(wèi)oad和store指令才能訪問存儲器,其他指令的操作都是在寄存器之間完成的;大多數(shù)指令都采用硬連接邏輯來實現(xiàn);強(qiáng)調(diào)優(yōu)化編譯器的作用,為高級語言程序生成優(yōu)化的代碼;充分利用流水技術(shù)來提高性能。2、 MIPS機(jī)器五級流水線(哪五級,每級的功能)答:包括:
50、取指令(IF),指令譯碼/讀寄存器(ID),執(zhí)行/有效地址計算(EX),存儲器訪問/分支完成(MEM),寫回(WB)。取指令(IF):以PC中的值作為地址從存儲器中取出一條指令,放入指令寄存器(IR);同時PC值加4,然后放入NPC;指令譯碼/讀寄存器(ID):對指令進(jìn)行譯碼,并以指令中的rs和rt字段作為地址訪問通用寄存器組,把讀出的操作數(shù)分別放入A和B中。同時IR的低16位進(jìn)行符號擴(kuò)展,然后存入Imm。在這一級,ALU對在前一級準(zhǔn)備好的操作數(shù)進(jìn)行計算。存儲器訪問/分支完成(MEM):所有指令都要在該級進(jìn)行更新。除了分支指令,其他指令都是做:PCNPC。在該級處理的指令只有l(wèi)oad、stor
51、e和分支三種指令;寫回(WB):把在前面4級中得到的結(jié)果寫入通用寄存器組。3、 降低Cache命中時間的方法。(任意列出三種,并給出解釋)答:降低Cache的命中時間:采用容量小、結(jié)構(gòu)簡單的Cache:硬件越簡單,速度就越快。應(yīng)使Cache容量足夠小,以便可以與處理器做在同一芯片上,避免因片外訪問而增加時間開銷。還要保持Cache結(jié)構(gòu)的簡單性,例如采用直接映像Cache,優(yōu)點是可以讓標(biāo)識檢測和數(shù)據(jù)傳送同時進(jìn)行,從而有效減少命中時間;采用虛擬Cache:是指直接用虛擬地址進(jìn)行訪問的Cache,其標(biāo)識存儲器中存放的是虛擬地址,進(jìn)行地址檢測用的也是虛擬地址。虛擬Cache的優(yōu)點:在命中時不需要地址轉(zhuǎn)換,因而也就省去了地址轉(zhuǎn)換的時間。另外,即使不命中,地址轉(zhuǎn)換和訪問Cache也是并行進(jìn)行的,其速度比物理Cache快很多。采用蹤跡Cache:蹤跡Cache中存放的是CPU所執(zhí)行過的動態(tài)指令序列,其中包含了由分支預(yù)測展開了的指令。該分支預(yù)測是否正確需要在取到該指令時進(jìn)行確認(rèn)。能夠提高指令Cache的空間利用率,避免因分支成功發(fā)生跳轉(zhuǎn)處于該塊之后的指令用不到,跳轉(zhuǎn)到的塊的位置之前的指令用不到浪費空間。4、 什么是Cache的一
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年酒店管理職業(yè)資格考試試卷及答案
- 2025年口腔醫(yī)學(xué)執(zhí)業(yè)醫(yī)師考試試題及答案
- 售后代運(yùn)營合同協(xié)議
- 正規(guī)購車協(xié)議書范本
- 品牌接手合同協(xié)議
- 2025設(shè)備租賃合同范本內(nèi)容
- 商事場地出租合同協(xié)議
- 周口住房買賣合同協(xié)議
- 2025茶葉區(qū)域總代理合同
- 2025大輕包承包合同
- 睪丸附睪炎護(hù)理
- 卡西歐dh800電吹管說明書
- 3Q設(shè)備驗證文件
- 流式細(xì)胞術(shù)(免疫學(xué)檢驗課件)
- 急危重癥護(hù)理PPT高職完整全套教學(xué)課件
- 2023年06月人民教育出版社在職人員公開招聘筆試題庫含答案解析-1
- 浙江公路技師學(xué)院工作人員招聘考試真題2022
- 《大道之行也》比較閱讀12篇(歷年中考語文文言文閱讀試題匯編)(含答案與翻譯)(截至2020年)
- 螺旋輸送機(jī)的設(shè)計大學(xué)論文
- 政府專職消防隊伍消防員招錄體格檢查表
- 初中生物總復(fù)習(xí) 人體
評論
0/150
提交評論