




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、精選優(yōu)質(zhì)文檔-傾情為你奉上第一章 計算機系統(tǒng)結(jié)構(gòu)的基本概念知識點匯總計算機系統(tǒng)的層次結(jié)構(gòu)、虛擬機、解釋/翻譯、計算機系統(tǒng)結(jié)構(gòu)/組成/實現(xiàn)、馮氏分類法、Flynn分類法、以經(jīng)常性事件為重點原理、Amdahl定律、CPU性能公式、程序局部性原理、計算機系統(tǒng)性能評測指標(執(zhí)行時間、吞吐率)、基準測試程序、馮諾依曼結(jié)構(gòu)、馮諾依曼結(jié)構(gòu)特點及改進、軟件可移植性、系列機、軟件兼容(向上、向下、向前、向后)、兼容機、模擬、仿真、并行性含義、并行性等級、提高并行性的途徑(包括時間重疊、資源重復(fù)、資源共享)、單機系統(tǒng)中的并行性發(fā)展、多機系統(tǒng)中的并行性發(fā)展、耦合度、松散耦合、緊密耦合簡答題1. 簡述計算機系統(tǒng)的層次
2、結(jié)構(gòu)。(知識點: 計算機系統(tǒng)的層次結(jié)構(gòu))答:從下到上分成微程序機器級、機器語言、操作系統(tǒng)虛擬機、匯編語言虛擬機、高級語言虛擬機、應(yīng)用語言虛擬機2. 什么是翻譯?什么是解釋? (知識點:翻譯、解釋)答:翻譯是將L+1級程序全部轉(zhuǎn)成L級程序后,再執(zhí)行產(chǎn)生的L級程序;解釋是每當(dāng)一條L+1級程序被譯碼后執(zhí)行,再解釋下一條L+1級指令。3. 計算機系統(tǒng)結(jié)構(gòu)、計算機組成和計算機實現(xiàn)三者之間的關(guān)系,并舉例說明。(知識點:計算機系統(tǒng)結(jié)構(gòu)/組成/實現(xiàn))答:計算機系統(tǒng)結(jié)構(gòu)是指計算機的軟硬界面,即機器語言程序員看到的傳統(tǒng)機器具有的屬性。計算機組成是計算機系統(tǒng)結(jié)構(gòu)的邏輯實現(xiàn)。計算機實現(xiàn)是計算機組成的物理實現(xiàn)。如, 確
3、定指令集中是否有乘法指令屬于計算機系統(tǒng)結(jié)構(gòu)內(nèi)容,乘法指令是否由專門的乘法部件實現(xiàn)是計算機組成,乘法器的物理實現(xiàn)是計算機實現(xiàn)。4. Flynn分類法將計算機系統(tǒng)結(jié)構(gòu)分成哪四類?請簡述。答:SISD,SIMD,MISD,MIMD5. 請簡述程序局部性原理。(知識點:程序局部性原理)答:包括時間局部性和空間局部性。時間局部性是指:程序即將用到的信息很可能就是目前正在使用的信息;程序的空間局部性是指,程序即將用到的信息很可能與目前正在使用的信息空間上臨近。6. 簡述Amdahl定律。(知識點:Amdahl定律)答:加快某部件執(zhí)行速度所能獲得的系統(tǒng)性能加速比,受限于該部件的執(zhí)行時間戰(zhàn)系統(tǒng)中總執(zhí)行時間的百
4、分比。7. 系列機的概念?(知識點:系列機)答:同一廠家生產(chǎn)的具有相同體系結(jié)構(gòu)、具有不同組成和實現(xiàn)的一系列不同型號的機器。8. 什么是軟件兼容?軟件兼容有幾種?其中哪一種是軟件兼容的根本特征?(知識點:軟件兼容)答:一個軟件可以不加修改或者少量修改,可以由一臺機器上移植到另一臺機器上運行。分成向上、向下、向前、向后兼容,向后兼容是根本特征。9. 簡要說明提高計算機系統(tǒng)并行性的3種技術(shù)途徑,并各舉一例。(知識點:提高并行性途徑)答:時間重疊,如流水線;資源重復(fù),如多處理機;資源共享,如多道程序。選擇題1. 計算機系統(tǒng)的層次結(jié)構(gòu)按照由高到低的順序分別為( C )。(知識點:計算機系統(tǒng)的層次結(jié)構(gòu))A
5、高級語言機器級、匯編語言機器級、傳統(tǒng)機器語言機器級、操作系統(tǒng)機器級、應(yīng)用語言機器級、微程序機器級B高級語言機器級、應(yīng)用語言機器級、操作系統(tǒng)機器級、傳統(tǒng)機器語言機器級、匯編語言機器級、微程序機器級C應(yīng)用語言機器級、高級語言機器級、匯編語言機器級、操作系統(tǒng)機器級、傳統(tǒng)機器語言機器級、微程序機器級D應(yīng)用語言機器級、操作系統(tǒng)機器級、高級語言機器級、匯編語言機器級、微程序機器級、傳統(tǒng)機器語言機器級2. 最早的馮諾依曼體系結(jié)構(gòu)是以( A )為中心的。A 運算器B 控制器C 存儲器D I/O設(shè)備3. 從計算機系統(tǒng)結(jié)構(gòu)來看,機器語言程序員看到的機器屬性是( C )。(知識點:計算機系統(tǒng)結(jié)構(gòu)/組成/實現(xiàn))A 計
6、算機軟件所要完成的功能B 計算機硬件的全部組成C 編程要用到的硬件組織D 計算機各部件的硬件實現(xiàn)4. 用戶CPU時間由哪三個因素決定?( D )(知識點:CPU性能公式)ACPI,IC 和所執(zhí)行的指令條數(shù)BCPI,IC 和執(zhí)行程序所需要的時鐘周期數(shù)CCPI,IC 和系統(tǒng)加速比DCPI,IC 和時鐘頻率5. 根據(jù)Amdahl定律,系統(tǒng)加速比由哪兩個因素決定?( C )(知識點:Amdahl定律)A. 可改進比例和所執(zhí)行的指令條數(shù)B. 可改進比例和執(zhí)行程序所需要的時鐘周期數(shù)C. 可改進比例和部件加速比D. 可改進比例和時鐘頻率6. 實現(xiàn)軟件可移植性的基本途徑不包括( D )。(知識點:軟件可移植性
7、、系列機、軟件兼容、兼容機、模擬、仿真)A. 采用統(tǒng)一的高級語言B. 采用系列機C. 模擬和仿真D. 采用統(tǒng)一的匯編語言7. 利用時間重疊概念實現(xiàn)并行處理的是 ( A )。(知識點:提高并行性的途徑)A 流水處理機B 多處理機C 陣列處理機D 機群系統(tǒng)8. 多處理機實現(xiàn)的并行主要是( A )。(知識點:提高并行性的途徑)A. 任務(wù)級并行 B. 指令級并行C. 線程級并行D. 操作級并行填空題1. 程序的局部性包括( 時間局部性 )和(空間局部性 )兩個方面。(知識點:程序局部性原理)2. 計算機組成指的是計算機系統(tǒng)結(jié)構(gòu)的( 邏輯實現(xiàn) ),計算機實現(xiàn)指的是計算機組成的( 物理實現(xiàn) )。(知識點:
8、計算機系統(tǒng)結(jié)構(gòu)/組成/實現(xiàn))3. 計算機系統(tǒng)結(jié)構(gòu)設(shè)計和分析中最經(jīng)常使用的三條基本原則是(以經(jīng)常性事件為重點 )、( 程序局部性原理 )和Amdahl定律。知識點(以經(jīng)常性事件為重點、程序局部性原理)4. 多機系統(tǒng)的耦合度可以分為最低耦合、( 松散耦合 )和( 緊密耦合 )3類。(知識點:耦合度、松散耦合、緊密耦合)5. CPU性能公式的3個參數(shù)反映了與系統(tǒng)結(jié)構(gòu)相關(guān)的三個因素: ( 周期時間 )取決于計算機實現(xiàn)技術(shù)和計算機組織,( CPI )取決于計算機指令集的結(jié)構(gòu)和指令集的設(shè)計與實現(xiàn)技術(shù),( IC )取決于計算機指令集的結(jié)構(gòu)和編譯技術(shù)。(知識點:CPU性能公式)6. 根據(jù)Amdahl定律可知,
9、對系統(tǒng)進行改進所獲得的加速比取決于( 部件所占比例 )和( 部件加速比 )。(知識點:Amdahl定律)7. 實現(xiàn)程序可移植性的主要途徑有( 采用系列機 )、( 模擬和仿真 )和 統(tǒng)一高級語言。8. 軟件兼容有( 向上 )、( 向下 )、( 向前 )和(向后 )四種,其中( 向后 )是軟件兼容的根本特征。(知識點:軟件兼容)9. 計算機系統(tǒng)中提高并行性的技術(shù)途徑有( 時間重疊 )、( 資源重復(fù) )、( 資源共享 )。(知識點:提高并行性的途徑)10. 從處理數(shù)據(jù)的角度來看,并行性等級從高到低可分為字并位并,(字并位串),(字串位并),字串位串。(知識點: 并行性等級)11. 廣義來說,并行性既
10、包含 ( 同時性 ),又包含( 并發(fā)性 )。12. 從執(zhí)行程序的角度來看,并行性等級從低到高可分為(指令內(nèi)部并行),(指令級并行),(線程級并行),(過程級并行),(作業(yè)級并行)。(知識點:并行性等級)計算題1. 用一臺40MHZ的計算機執(zhí)行標準程序的測試,它包含的指令類型、指令數(shù)和相應(yīng)的時間如下表所示:指令類型指令數(shù)平均時鐘周期數(shù)整數(shù)運算數(shù)據(jù)傳送浮點運算控制傳送45000320001500080001222求: (1) 有效CPI(2) CPU執(zhí)行時間(3) MIPS(知識點: CPU性能公式)答:(1) CPI=(45000×1+32000×2+15000×2
11、+8000×2)/(45000+32000+15000+8000)=1.55(2) MIPS=f/CPI=40/1.55=25.8MIPS(3) CPU時間 =(45000×1+32000×2+15000×2+8000×2)/40=3.875ms2. 某臺主頻為400MHz的計算機執(zhí)行標準測試程序,程序中指令類型、執(zhí)行數(shù)量和平均時鐘周期數(shù)如下:指令類型指令執(zhí)行數(shù)量平均時鐘周期數(shù)整數(shù)450001數(shù)據(jù)傳送750002浮點80004分支15002求該計算機的有效CPI、MIPS和程序執(zhí)行時間。(知識點: CPU性能公式)答:(1)CPI (45000
12、×175000×28000×41500×2) / 1.776(2)MIPS速率f/ CPI 400/1.776 225.225MIPS(3)程序執(zhí)行時間= (45000×175000×28000×41500×2)400=575s3. 假設(shè)在一臺40MHZ處理機上運行200,000條指令的目標代碼(這個數(shù)字好像沒用),程序主要由四種指令組成。根據(jù)程序跟蹤實驗結(jié)果,已知指令混合比和每種指令所需的指令數(shù)如下:指令類型CPI指令混合比算術(shù)和邏輯160%高速緩存命中的加載/存儲218%轉(zhuǎn)移412%高速存儲缺失的存儲器訪問81
13、0%(a) 計算在單處理機上用上述跟蹤數(shù)據(jù)運行程序的平均CPI。(b) 根據(jù)(a)所得的CPI,計算相應(yīng)的MIPS速率。 (知識點: CPU性能公式)答: 4. 某臺處理機的時鐘頻率為15MHz, 執(zhí)行測試程序的速率為10MIPS, 假設(shè)每次存儲器存取需要1個時鐘周期的時間。問: (1) 試從CPU時間公式分析影響CPU性能的因素。(2) 求處理機的CPI值 (3) 假設(shè)將處理機的時鐘頻率提高到30MHz,但存儲器的工作速率不變,這使每次存儲器存取需要2個時鐘周期。如果測試程序中30%的指令需要1次訪存,5%的指令需要2次訪存,其他指令不需要訪存,求該測試程序在改進后的處理機上執(zhí)行的速率(MI
14、PS)。注: MIPS 為 Million Instructions Per Second, 每秒百萬條指令。(知識點: CPU性能公式)答:(1) CPU時間公式為 CPU時間 = 指令條數(shù)(IC) * 平均每條指令的時鐘周期數(shù)(CPI) * 時鐘周期時間其中: 時鐘周期時間取決于硬件實現(xiàn)技術(shù)和計算機組成;指令條數(shù)取決于指令集結(jié)構(gòu)和編譯技術(shù);平均每條指令所需要的時鐘周期數(shù)取決于計算機組成和指令集結(jié)構(gòu)。 (2) CPI = 時鐘頻率/速率 = 15M/10M = 1.5 (3) CPI = 65%*1.5 + 30%*2 + 5%*4 = 1.775 速率= 時鐘頻率/CPI = 30MHZ/
15、1.775 = 16.9MIPS5. 計算機系統(tǒng)中有三個部件可以改進,這三個部件的部件加速比為:部件加速比1=30; 部件加速比2=20; 部件加速比3=10(1) 如果部件1和部件2的可改進比例均為30%,那么當(dāng)部件3的可改進比例為多少時,系統(tǒng)加速比才可以達到10?(2)如果三個部件的可改進比例分別為30%、30%和20%,三個部件同時改進,那么系統(tǒng)中不可加速部分的執(zhí)行時間在總執(zhí)行時間中占的比例是多少?(知識點: Amdahl定律)答:(1)在多個部件可改進情況下,Amdahl定理的擴展:已知S130,S220,S310,Sn10,F(xiàn)10.3,F(xiàn)20.3,得:得F30.36,即部件3的可改進
16、比例為36%。(2)設(shè)系統(tǒng)改進前的執(zhí)行時間為T,則3個部件改進前的執(zhí)行時間為:(0.3+0.3+0.2)T = 0.8T,不可改進部分的執(zhí)行時間為0.2T。已知3個部件改進后的加速比分別為S130,S220,S310,因此3個部件改進后的執(zhí)行時間為: 改進后整個系統(tǒng)的執(zhí)行時間為:Tn = 0.045T+0.2T = 0.245T那么系統(tǒng)中不可改進部分的執(zhí)行時間在總執(zhí)行時間中占的比例是:6. 某計算機要針對其CPU、內(nèi)存、硬盤這三種硬件進行升級。已知:(1)升級前此計算機執(zhí)行某測試程序時,40%的執(zhí)行時間消耗在CPU上,25%的執(zhí)行時間消耗在內(nèi)存訪問,20%的執(zhí)行時間消耗在硬盤訪問。(2)新CP
17、U的運算速度是原CPU的4倍,平均無故障時間是50萬小時。(3)新內(nèi)存的訪問速度是原內(nèi)存的2倍,平均無故障時間是20萬小時。(4)新硬盤的訪問速度是原CPU的5倍,平均無故障時間是10萬小時。(5)假定每個部件的生存期服從指數(shù)分布,且各部件的故障是相互獨立的。問:(1)升級前后使用同一測試程序進行性能測試,在只升級CPU,只升級內(nèi)存,只升級硬盤這三種情況下,系統(tǒng)加速比各為多少?三種硬件同時升級的情況下,系統(tǒng)的速度能不能達到原來的三倍?(2)不考慮CPU,內(nèi)存,硬盤以外的硬件故障,則三種硬件同時升級后,整個計算機系統(tǒng)的平均無故障時間是多少小時? (知識點: Amdahl定律)解:(1)根據(jù)Amd
18、ahl定律可得:只升級CPU,只升級內(nèi)存,只升級硬盤,三種同時升級,不能達到原來的3倍。(2)每種硬件的失效率等于該硬件平均無故障時間的倒數(shù),系統(tǒng)的失效率為所有硬件失效率的和。因此三種硬件同時升級后,整個系統(tǒng)的失效率為:整個系統(tǒng)的平均無故障時間為小時解畢。*第二章 計算機指令集結(jié)構(gòu)知識點匯總:指令集設(shè)計、堆棧型機器、累加器型機器、通用寄存器型機器、CISC、RISC、尋址方式、數(shù)據(jù)表示簡答題1. 增強CISC機器的指令功能主要從哪幾方面著手?(CISC)(1) 面向目標程序增強指令功能。(2) 面向高級語言和編譯程序改進指令系統(tǒng)。(3) 面向操作系統(tǒng)的優(yōu)化實現(xiàn)改進指令系統(tǒng)。2. 簡述CISC存
19、在的主要問題。(知識點:CISC)答:(1)CISC結(jié)構(gòu)的指令系統(tǒng)中,各種指令的使用頻率相差懸殊。(2)CISC結(jié)構(gòu)指令系統(tǒng)的復(fù)雜性帶來了計算機系統(tǒng)結(jié)構(gòu)的復(fù)雜性,這不僅增加了研制時間和成本,而且還容易造成設(shè)計錯誤。(3)CISC結(jié)構(gòu)指令系統(tǒng)的復(fù)雜性給VLSI設(shè)計增加了很大負擔(dān),不利于單片集成。(4)CISC結(jié)構(gòu)的指令系統(tǒng)中,許多復(fù)雜指令需要很復(fù)雜的操作,因而運行速度慢。(5)在CISC結(jié)構(gòu)的指令系統(tǒng)中,由于各條指令的功能不均衡性,不利于采用先進的計算機系統(tǒng)結(jié)構(gòu)技術(shù)來提高系統(tǒng)的性能。3. 簡述RISC的優(yōu)缺點及設(shè)計RISC機器的一般原則。(知識點: RISC)答:(1)選取使用頻率最高的指令,并
20、補充一些最有用的指令。(2)每條指令的功能應(yīng)盡可能簡單,并在一個機器周期內(nèi)完成。(3)所有指令長度均相同。(4)只有l(wèi)oad和store操作指令才訪問存儲器,其它指令操作均在寄存器之間進行。 (5)以簡單、有效的方式支持高級語言。4. 根據(jù)CPU內(nèi)部存儲單元類型,可將指令集結(jié)構(gòu)分為哪幾類?(知識點:堆棧型機器、累加器型機器、通用寄存器型機器)答:堆棧型指令集結(jié)構(gòu)、累加器型指令集結(jié)構(gòu)、通用寄存器型指令集結(jié)構(gòu)。5. 常見的三種通用寄存器型指令集結(jié)構(gòu)是什么?(知識點:通用寄存器型機器)答:(1)寄存器寄存器型。(2) 寄存器存儲器型。(3) 存儲器存儲器型。6. 計算機指令集結(jié)構(gòu)設(shè)計所涉及的內(nèi)容有哪
21、些?(答出4個即可)(知識點:指令集設(shè)計)答:(1)指令集功能設(shè)計:主要有RISC和CISC兩種技術(shù)發(fā)展方向。 (2) 尋址方式的設(shè)計。(3) 操作數(shù)表示和操作數(shù)類型。(4) 尋址方式的表示:可以將尋址方式編碼于操作碼中,也可以將尋址方式作為一個單獨的域來表示。 (5) 指令集格式的設(shè)計:有變長編碼格式、固定長度編碼格式和混合型編碼格式三種。選擇題1. 不需要編址的數(shù)據(jù)存儲空間是(B)。A. CPU中的通用寄存器B. 堆棧C. 主存儲器D. I/O接口中的寄存器2. 指令系統(tǒng)的改進以不刪除原有指令系統(tǒng)為前提,通過增加少量強功能新指令代替常用指令串,保證了軟件( B ),提高了編程效率。(知識點
22、:指令集設(shè)計)A向前兼容 B向后兼容 C向上兼容 D向下兼容3. 通用寄存器型指令集結(jié)構(gòu)可細分為哪三類?( D ) (知識點:通用寄存器型機器)A寄存器寄存器型、Cache存儲器型和存儲器存儲器型B寄存器寄存器型、Cache存儲器型和存儲器輔存型C寄存器寄存器型、寄存器Cache型和存儲器存儲器型D寄存器寄存器型、寄存器存儲器型和存儲器存儲器型4. 在指令字的優(yōu)化設(shè)計中,不需要考慮的因素是( D )。(知識點:指令集設(shè)計)A 多種尋址方式B 多種指令字長C 多種地址制D 多種實現(xiàn)方式5. 以下不同類型的指令集結(jié)構(gòu)中,操作數(shù)的給出方式采用半隱式約定的是(B)。(知識點:堆棧型機器、累加器型機器、
23、通用寄存器型機器)A 堆棧結(jié)構(gòu)B 累加器結(jié)構(gòu)C RR結(jié)構(gòu)D RM結(jié)構(gòu)6. 以下哪種結(jié)構(gòu)不屬于指令集結(jié)構(gòu)(C)。(知識點:堆棧型機器、累加器型機器、通用寄存器型機器)A 堆棧結(jié)構(gòu)B 通用寄存器組結(jié)構(gòu)C Cache結(jié)構(gòu)D 累加器結(jié)構(gòu)7. 指令集設(shè)計的基本要求包括(A)。(知識點:指令集設(shè)計)A 完整性、規(guī)整性、高效率、兼容性B 完整性、規(guī)整性、靈活性、均勻性C 完整性、規(guī)整性、對稱性、兼容性D 完整性、規(guī)整性、對稱性、均勻性8. 操作碼優(yōu)化的主要目的是(D)A 縮短指令字長B 增加指令字表示的信息C 減少程序總位數(shù)D A、B和C9. RISC執(zhí)行程序比CISC要快的主要原因是( C )。A RIS
24、C指令系統(tǒng)中指令條數(shù)少B 程序在RISC上編譯生成的目標程序較短C RISC指令平均執(zhí)行周期數(shù)少D RISC只允許load和store指令訪存*第三章 流水線技術(shù)知識點匯總先行控制、流水線、單功能流水線、多功能流水線、靜態(tài)流水線、動態(tài)流水線、部件級流水線、處理機級流水線、處理機間流水線、線性流水線、非線性流水線、順序流水線、亂序流水線、時空圖、流水線性能評價(吞吐率、加速比、效率)、解決流水線瓶頸問題方法、相關(guān)(數(shù)據(jù)相關(guān)、名相關(guān)、控制相關(guān))、換名技術(shù)、流水線沖突(結(jié)構(gòu)沖突、數(shù)據(jù)沖突、控制沖突)、流水線互鎖機制、定向技術(shù)、指令調(diào)度、預(yù)測分支失敗、預(yù)測分支成功、延遲分支(從前調(diào)度、從失敗處調(diào)度、從
25、成功處調(diào)度)、流水寄存器、3種向量處理方式(橫向、縱向、縱橫)、鏈接技術(shù)。簡答題1. 流水技術(shù)有哪些特點?(答出4個即可)(知識點:流水線)答:1.將處理過程分解為若干子過程,由專門的功能部件來實現(xiàn),2各段的時間盡可能相等,3各部件間都有一個緩沖寄存器,4適用于大量重復(fù)的時序過程,5需要通過時間和排空時間。2. 什么是靜態(tài)流水線?什么是動態(tài)流水線?(知識點:靜態(tài)流水線、動態(tài)流水線)答:同一時間段內(nèi),多功能流水線中的各段只能按同一種功能的連接方式工作;同一時間段內(nèi),多功能流水線中的各段可以按照不同的方式連接同時執(zhí)行多種功能。3. 什么是單功能流水線?什么是多功能流水線?(知識點:單功能流水線、多
26、功能流水線)答:只能完成一種固定功能的流水線。流水線的各段可以進行不同的連接,以實現(xiàn)不同的功能。4. 什么是線性流水線?什么是非線性流水線?(知識點:線性流水線、非線性流水線)答:流水線的各段串行連接,沒有反饋回路。流水線中除了有串行的連接外,還有反饋回路。5. 列舉3種相關(guān)。(知識點:相關(guān))答:數(shù)據(jù)相關(guān),名相關(guān),控制相關(guān)。6. 流水線中有哪三種沖突?各是什么原因造成的?(知識點:流水線沖突)答:結(jié)構(gòu)沖突,硬件資源滿足不了指令重疊執(zhí)行的要求;數(shù)據(jù)沖突,指令在流水線中重疊執(zhí)行時需要用到前面指令的執(zhí)行結(jié)果;控制沖突,流水線遇到分支指令和其他會改變PC值的指令。7. 選擇至少2種解決流水線結(jié)構(gòu)沖突的
27、方法簡述。(知識點:結(jié)構(gòu)沖突)答:流水線停頓一個時鐘周期,推遲后面的指令操作。設(shè)置相互獨立的指令存儲器和數(shù)據(jù)存儲器。8. 選擇至少2種解決流水線數(shù)據(jù)沖突的方法簡述。(知識點:數(shù)據(jù)沖突)答:定向技術(shù),將計算結(jié)果從其產(chǎn)生的地方直接送到其他指令需要的地方。通過編譯時讓編譯器重新組織指令順序來消除沖突。9. 選擇至少2種解決流水線控制沖突的靜態(tài)方法簡述。(知識點:控制沖突)答:預(yù)測分支失敗,預(yù)測分支成功,延遲分支。10. 簡述流水寄存器的作用。(知識點:流水寄存器)答:將各段的工作隔開使得相互不會干擾,保存相應(yīng)各段的處理結(jié)果,向后傳到后面將要用到的數(shù)據(jù)或者控制信息。11. 簡述分支延遲槽的主要思想。(
28、知識點:延遲分支)答:編譯器每當(dāng)遇到分支指令,就在其后連續(xù)生成k個空指令位,稱為延遲槽,并根據(jù)不同的調(diào)度規(guī)則將原始代碼中分支指令附近的指令放進延遲槽中,如果延遲槽沒有填滿,剩余部分用nop指令填充,即氣泡。延遲槽中的指令同分支指令都看做普通的指令順序流水,無論分支指令成功與否,都先按順序執(zhí)行延遲槽中的指令。延遲槽中的指令“掩蓋”了流水線原來必須插入的暫停周期,減少了分支指令帶來的延遲。12. 簡述分支延遲槽的三種調(diào)度策略。(知識點:延遲分支)答:從前調(diào)度:從分支指令之前找一條獨立的指令移動到延遲槽中。從目標處調(diào)度:把分支成功的目標地址指令復(fù)制到延遲槽中,并把分支目標地址改成分支后繼地址。永遠猜
29、測分支是成功的,如果猜錯,則丟棄延遲槽中指令的結(jié)果。從失敗處調(diào)度:把分支失敗的目標地址指令移動到延遲槽中。永遠猜測分支是失敗的。如果猜錯,則丟棄延遲槽中指令的結(jié)果。選擇題1 關(guān)于流水線的下列說法,錯誤的是:( C )(知識點:流水線)A 流水線能夠提高吞吐率;B 流水線提高了器件的利用率;C 流水線提高了單個任務(wù)的處理速度;D 消除流水線瓶頸的方法有“瓶頸段細分方法”和“瓶頸段重復(fù)設(shè)置方法”。2 寄存器換名技術(shù)可以減少如下相關(guān)帶來的暫停:( A )(知識點:換名技術(shù))A 讀后寫相關(guān);B 結(jié)構(gòu)相關(guān);C 寫后讀相關(guān);D 控制相關(guān)。3 假設(shè)對于MIPS流水線,由取指令(IF)、指令譯碼讀寄存器(ID
30、)、執(zhí)行(EX)、存儲器訪問(MEM)、寫寄存器(WB)五段組成。在一個時鐘周期中對同一個寄存器的讀操作和寫操作可以通過寄存器文件“定向”,有正常定向路徑。轉(zhuǎn)移指令在EX段計算目標地址,在MEM段檢測分支條件。指令SUB R4, R3, R2 和 BNEZ R4, LOOP之間應(yīng)暫停的周期數(shù)為:( B )(知識點:數(shù)據(jù)沖突)A 3;B 2;C 1;D 0。4 流水方式是指( D )。(知識點:流水線) A多部件同時執(zhí)行一條指令 B多部件同時取出多條指令 C多部件同時解釋一條指令 D多部件同時解釋多條指令5 評價流水線的性能指標是( D )。(知識點:流水線性能評價)A吞吐率、流水線的加速比和執(zhí)
31、行程序所需要的時鐘周期數(shù)B吞吐率、流水線的加速比和所執(zhí)行的指令條數(shù)C吞吐率、流水線的加速比和CPID吞吐率、流水線的加速比和效率6 在順序流動的MIPS流水線中,可能發(fā)生的沖突有( B )。(知識點:數(shù)據(jù)沖突)A 同一條指令的讀操作和寫操作之間的寫后讀沖突B 先流入的指令的寫操作與后流入的指令的讀操作之間的寫后讀沖突C 后流入的指令的寫操作與先流入的指令的讀操作之間的讀后寫沖突D 兩條指令的寫操作之間的寫后寫沖突7 在具有加、乘法雙功能的靜態(tài)流水線中,功能切換的時間是在( D )。(知識點:多功能流水線、靜態(tài)流水線)A 前一個功能的第一個任務(wù)進入流水線后B 前一個功能的第一個任務(wù)流出流水線后C
32、 前一個功能的最后一個任務(wù)進入流水線后D 前一個功能的最后一個任務(wù)流出流水線后8 非線性流水線的特征是( B )。(知識點:非線性流水線)A 一次運算中使用流水線中的多個段B 一次運算中要多次使用流水線中的某些功能段C 流水線的各個功能段在不同運算中可以有不同的連接D 流水線中某些功能段在各次運算中的作用不同9 以下哪種方法不能用于解決數(shù)據(jù)沖突( A )。(知識點:數(shù)據(jù)沖突)A 鏈接技術(shù)B 定向技術(shù)C 流水線互鎖機制D 編譯器指令調(diào)度10 以下哪種相關(guān)不會導(dǎo)致數(shù)據(jù)沖突( D )。(知識點: 數(shù)據(jù)相關(guān)、名相關(guān)、數(shù)據(jù)沖突)A 數(shù)據(jù)相關(guān)B 反相關(guān)C 輸出相關(guān)D 讀后讀相關(guān)11 與線性流水線最大吞吐率
33、有關(guān)的是(C)A 第一個功能段的執(zhí)行時間B 最快那一段的執(zhí)行時間C 最慢那一段的執(zhí)行時間D 最后的功能段的執(zhí)行時間填空題1. 相關(guān)有三種類型,即( 數(shù)據(jù)相關(guān) ),( 名相關(guān) )和( 控制相關(guān) )。其中 ( )相關(guān)還包括輸出相關(guān)和反相關(guān)兩種。2. 流水線中的沖突主要分為以下3種類型:( 結(jié)構(gòu)沖突 )、( 數(shù)據(jù)沖突 )和( 控制沖突 ),其中數(shù)據(jù)沖突又分為如下3類:(寫后讀沖突 )、( 讀后寫沖突 )和( 寫后寫沖突 )。(知識點: 數(shù)據(jù)沖突)3. 衡量流水線的主要性能指標是( 吞吐率 )、( 加速比 )和( 效率 )。N段不等長的流水線中,其結(jié)果的輸出速度取決于處理時間( 最長 )的子過程。(知
34、識點:流水線性能評價)4. 消除流水線的瓶頸段的方法有( 細分瓶頸段 )和( 重復(fù)設(shè)置瓶頸段 )2種。(知識點:解決流水線瓶頸問題方法)5. 三種通過軟件(編譯器)來減少分支延遲的方法為( 預(yù)測分支失敗 )、( 預(yù)測分支成功 )、( 延遲分支 )。(知識點:控制沖突)計算題1 有一個動態(tài)多功能流水線,該流水線可進行乘法和加法運算,流水線有S1、S2、S3、S4、S5、S6六段,每段是等時的,S1、S4、S5、S6連接時完成加法功能,S1、S2、S3、S6連接時完成乘法功能。試畫出計算Mi=(Xi+Yi)Zi(i=1,2,3,4)的時空圖,并計算實際吞吐率TP、加速比SP和效率E。(知識點:動態(tài)
35、流水線、多功能流水線、流水線性能評價)答:確定算法:Ai=XiYi(i=1,2,3,4) Mi=Ai×Zi(i=1,2,3,4)時空圖如下:輸入:X1 X2 X3 X4 A1 A2 A3 A4 Y1 Y2 Y3 Y4 Z1 Z2 Z 3Z4輸出:A1 A2 A3 A4 M1 M2 M3 M4實際吞吐率:TP=nTk=811t加速比:SP=TsTk=4×(44)t11t=3211效率:E=4×8t6×11t=16332 有如下的指令序列I1: LW R1, 0(R6)I2: LW R2, 4(R6)I3: MUL R5, R1, R2I4: LW R3,
36、8(R6)I5: LW R4, 24(R6)I6: ADD R2, R3, R4I7: ADD R2, R2, R5如何進行指令調(diào)度使其執(zhí)行延遲時間最短?進行指令調(diào)度所獲得的加速比是多少?(注:基于DLX指令處理,每條指令分為5步:IF,ID,EX,MEM,WB,在一個時鐘周期中對同一個寄存器的讀操作和寫操作可以通過寄存器文件“定向”,并且有正常的定向路徑)。(知識點:定向技術(shù)、指令調(diào)度、數(shù)據(jù)沖突)答:答案圖有問題,結(jié)果沒問題調(diào)度后的指令序列為I1 ,I2, I4 ,I5 ,I3 ,I6,I7加速比:SP=13t11t=1311如果只有寄存器定向文件定向,那么答案應(yīng)該是:調(diào)度前17t, 調(diào)度后
37、是14t。該題目是既有正常定向路徑,又有寄存器文件定向路徑。3 若一個動態(tài)浮點乘法流水線(如下圖所示),每個功能段的時間均為Dt,其乘積可直接返回輸入端或暫存于相應(yīng)緩存器中。請畫出實現(xiàn)A´B´C´D的時空圖,并求出該流水線的吞吐率TP、加速比SP和效率E。(知識點:動態(tài)流水線、流水線性能評價)階 加尾數(shù)乘規(guī)格化輸入積答:擬定算法:第一步計算 A´B,C´D,設(shè)M=A´B,N=C´D 第二步計算 A´B´C´D,即G=M´N時空圖:空間規(guī)格化MNG尾數(shù)乘MNG階乘MNG輸入A,BC,DM
38、,N時間輸出MNG吞吐率TP、加速比SP和效率ETP=n/TK=3/7Dt»0.43/DtSP=9/7»1.29E=(3´3Dt)/( 3´7Dt) »42.9%4 假設(shè)一條指令的取指過程分為:取指令、分析和執(zhí)行3段,每一段的時間分別為Dt、2Dt、3Dt。在下列各種情況下,分別計算連續(xù)執(zhí)行n條指令所需的時間。(1)順序執(zhí)行方式;(2)取指令、分析和執(zhí)行重疊。(知識點:流水線,流水線性能評價)答:(1)順序執(zhí)行方式執(zhí)行n條指令的時間:(2)取指令、分析和執(zhí)行重疊執(zhí)行n條指令的時間:5 帶雙輸入端的加、乘雙功能靜態(tài)流水線有1、2、3、4四個功能部
39、件,延時分別為t,t,2t,t,“加”由124組成,“乘”由1 3 4組成,輸出可直接返回輸入或鎖存,現(xiàn)執(zhí)行(1)畫出此流水線時空圖,標出流水線輸入端數(shù)據(jù)變化情況。(2)計算運算全shi部完成所需時間及在此期間流水線的效率。(3)將瓶頸子部件再細分,畫出解此題的時空圖。(4)求出按(3)解此題所需時間及在此期間流水線的效率。(知識點:多功能流水線、靜態(tài)流水線、流水線性能評價)答:(1)流水線時空圖如下圖:(2)全部完的時間是23t。 效率 (3)流水線時空圖如下所示。(4)所需時間為20t。 效率 6 有一條靜態(tài)多功能流水線由5段組成,加法用1、3、4、5段,乘法用1、2、5段,第3段的時間為
40、2t,其余各段的時間均為t,而且流水線的輸出可以直接返回輸入端或暫存于相應(yīng)的流水寄存器中?,F(xiàn)要在該流水線上計算 ,畫出其時空圖,并計算其吞吐率、加速比和效率。(知識點:多功能流水線、靜態(tài)流水線、流水線性能評價)答:首先,應(yīng)選擇適合于流水線工作的算法。對于本題,應(yīng)先計算A1B1、A2B2、A3B3和A4B4;再計算(A1B1) ×(A2B2)和(A3B3) ×(A4B4);然后求總的結(jié)果。其次,畫出完成該計算的時空圖,如圖所示,圖中陰影部分表示該段在工作。由圖可見,它在18個t時間中,給出了7個結(jié)果。所以吞吐率為: 如果不用流水線,由于一次求積需3t,一次求和需5t,則產(chǎn)生上
41、述7個結(jié)果共需(4×5+3×3)t =29t。所以加速比為: 該流水線的效率可由陰影區(qū)的面積和5個段總時空區(qū)的面積的比值求得: 7 一多功能8段動態(tài)流水線,實現(xiàn)乘法經(jīng)過:1-2-3-4-5-6-7-8功能段;實現(xiàn)加法經(jīng)過1-2-3-4-5-8. 每一功能段的延遲時間都為t,流水線的輸出可以直接返回輸入端或暫存于相應(yīng)的流水寄存器中,計算向量點積和:Z=AB+CD+EF+GH。(1)畫出時空圖;(2)計算吞吐率、加速比和效率;(3)分析該流水線的效率不高的原因。(知識點:多功能流水線、動態(tài)流水線、流水線性能評價)答:(1)時空圖:(2)從流水線的時空圖中看到,用23個時鐘周期完
42、成了7個運算。當(dāng)每一功能段的延遲時間都為t時,有Tk=23t,n=7。流水線的吞吐率TP為:TP=n/Tk=7/ (23t)0.304/t如果采用順序方式,完成一次加法要用6t,完成一次乘法要用8t,全部運算要用: T0 =4×6t+3×8t=48t則加速比: S=T0/Tk=48t/(23t) 2. 087整個流水線共有8段,流水線效率為: E=T0/(k×Tk)=48t/(8×23t) 0.261(3)主要原因多功能流水線在做某一種運算時,總有一些段是空閑的。靜態(tài)流水線在進行功能切換時,要等前一種運算全部流出流水線后才能進行后面的運算。運算之間存在關(guān)
43、聯(lián),后面有些運算要用到前面運算的結(jié)果。流水線的工作過程有建立與排空部分。8 有一指令流水線如下所示120ns340ns480ns220ns入出問: (1)求連續(xù)輸入15條指令,該流水線的實際吞吐率和效率,并畫出流水線時空圖。(2)該流水線的瓶頸在哪幾段?請任選一種措施消除瓶頸,且對于你所給出的改進的流水線,連續(xù)輸入15條指令時,其實際吞吐率和效率各是多少? (知識點:流水線性能評價、解決流水線瓶頸問題方法)答:(1)流水線時空圖如圖所示123_13_24_14_4入出20ns20ns20ns20ns20ns20ns(2)瓶頸在3、4段。方案一:采用細分瓶頸段法,變成八級流水線方案二: 重復(fù)設(shè)置
44、部件123-13-24-14-24-34-4 計算結(jié)果與方案一相同。以上兩種方案任意一種給分。*第四章 指令級并行知識點匯總指令級并行、靜態(tài)調(diào)度、動態(tài)調(diào)度、Tomasulo算法、分支歷史表(BHT)、分支目標緩沖器(BTB)、前瞻執(zhí)行、再定序緩存(ROB)、循環(huán)展開計算題1. 有一個采用Tomasulo算法的處理器,有六個Load緩沖器(分別用標號Load1、Load2、Load3、Load4、Load5、Load6表示),有三個加法保留站(分別用標號Add1、Add2、Add3表示),有兩個乘法保留站(分別用標號Mult1、Mult2表示)。對于下列指令序列,L.DF6,32(R2)L.DF
45、2,36(R3)MUL.DF0,F2,F4SUB.DF8,F2,F6DIV.DF8,F0,F6ADD.DF6,F8,F2給出從第一條指令流出開始的第6個時鐘周期時下面各表的內(nèi)容。假設(shè):(1)指令按順序流出,每個時鐘周期流出一條指令。 (2)指令流出1個時鐘周期,寫結(jié)果一個時鐘周期,各種指令的操作延遲為:Load:1個時鐘周期;加法:2個時鐘周期;乘法:10個時鐘周期;除法:40個時鐘周期。 (3)開始時,處理器是完全空閑的,Load緩沖器按Load1、Load2、Load3、Load4、Load5、Load6的順序分配;加法保留站按Add1、Add2、Add3的順序分配;乘法保留站按Mult1
46、、Mult2的順序分配。 (4)程序執(zhí)行前,R2的值為2000,R3的值為3000,內(nèi)存2032單元開始存放浮點數(shù)10,內(nèi)存3036單元開始存放浮點數(shù)20,F(xiàn)4寄存器存放浮點數(shù)5。2. 單流出處理器采用Tomasulo算法進行指令調(diào)度,有一個Load/Store部件,一個浮點乘法部件,一個浮點加法部件。假設(shè):(1)緩沖器/保留站及其服務(wù)的指令類型如下表LOAD1LOAD2LOAD3ADD1MUL1訪存訪存訪存加減法乘除法(2)各個硬件操作及指令執(zhí)行的時鐘周期如下表IssueWriteBackADD.DMUL.DLD.DST.D1141044(3)待執(zhí)行指令序列如下表:指令對應(yīng)變量LD.D F2
47、, 0X00(R0)Rt=F2, Rs=R0, Imm=0X00MUL.D F0, F4, F2Rd=F0, Rs=F4, Rt=F2LD.D F4, 0X04(R0)Rt=F4, Rs=R0, Imm=0X04ADD.D F0, F4, F2Rd=F0, Rs=F4, Rt=F2SD.D F0, 0X08(R0)Rt=F0, Rs=R0, Imm=0X08(4)指令序列執(zhí)行前,指令均未流出,所有緩沖器/保留站均空閑,寄存器和主存狀態(tài)如下表索引R0F0F2F4#0XC6#0XCA#0XCE數(shù)值0XC60X060X0A0XB10X110X220X33注:題目中的地址和立即數(shù)均用16進制表示,以0
48、X作為起始標識。例如,#0XCA表示16進制數(shù)“CA”對應(yīng)的內(nèi)存地址。請給出第二個LD指令完成寫結(jié)果時下列各個狀態(tài)表的內(nèi)容。(1)指令執(zhí)行狀態(tài)時鐘周期表指令流出執(zhí)行寫結(jié)果LD.D F2, 0X00(R0)MUL.D F0, F4, F2LD.D F4, 0X04(R0)ADD.D F0, F4, F2ST.D F0, 0X08(R0)(2)保留站/緩沖器狀態(tài)表LabelBusyOpVj(rs)Vk(rt)Qj(rs)Qk(rt)A(Imm)LOAD1LOAD2LOAD3ADD1MUL1(3)寄存器狀態(tài)表LabelF0F2F4Qi解:(1)指令執(zhí)行狀態(tài)時鐘周期表指令對應(yīng)變量流出執(zhí)行寫結(jié)果LD.D
49、 F2, 0X00(R0)Rt=F2, Rs=R0, Imm=0X00126MUL.D F0, F4, F2Rd=F0, Rs=F4, Rt=F22717LD.D F4, 0X04(R0)Rt=F4, Rs=R0, Imm=0X043610ADD.D F0, F4, F2Rd=F0, Rs=F4, Rt=F241115SD.D F0, 0X08(R0)Rt=F0, Rs=R0, Imm=0X0851016(2)保留站/緩沖器狀態(tài)表LabelBusyOpVj(rs)Vk(rt)Qj(rs)Qk(rt)A(Imm)LOAD1NoLD.D0XC60XC6LOAD2NoLD.D0XC60XCALOAD3YesSD.D0XC6ADD10X08ADD1YesADD.D0X220X11MUL1YesMUL.D0XB10X11(3)寄存器狀態(tài)表LabelF0F2F4QiADD100解畢。站名保留站或Load緩沖器忙操作VjVkQjQkALoad1Load2Add1Add2Mult1Mult2域名寄存器狀態(tài)F0F2F4F6F8F10F12F30Qi答案:站名保留站或Load緩沖器忙操作VjVkQjQkALoad1noLoad2noAdd1yesSUB.D2010Add2yesADD.D20M
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 內(nèi)容豐富的2025年市政工程試題及答案
- 工程經(jīng)濟實戰(zhàn)技巧試題及答案
- 教研學(xué)期工作成果分享計劃
- 五年級心理健康教育
- 營銷行業(yè)安全管理回顧計劃
- 樹立積極職場心態(tài)的實施方案計劃
- 2024年石英電渦流水平傾斜儀項目資金需求報告代可行性研究報告
- 工程經(jīng)濟行業(yè)與市場趨向試題及答案
- 車輛及交通工具采購協(xié)議
- 卡點清晰2025年工程項目管理試題及答案
- 一年級搶答題
- 小學(xué)四年級語文綜合知識競賽(含答案)
- 廣西某高速公路初步設(shè)計階段工程地質(zhì)勘察大綱
- 阿舍勒銅礦-采礦畢業(yè)設(shè)計
- 初中生如何考后試卷分析和總結(jié)寫法
- 思考,快與慢課件完整版
- JJF 1753-2019醫(yī)用體外壓力脈沖碎石機校準規(guī)范
- 體育商業(yè)綜合體規(guī)劃方案
- 防雷和接地安裝施工組織方案
- YY∕T 0617-2021 一次性使用人體末梢血樣采集容器
- 5以內(nèi)的加減法(可直接打印)
評論
0/150
提交評論