《計算機系統(tǒng)結構》(單博煒) 課后習題解答_第1頁
《計算機系統(tǒng)結構》(單博煒) 課后習題解答_第2頁
《計算機系統(tǒng)結構》(單博煒) 課后習題解答_第3頁
《計算機系統(tǒng)結構》(單博煒) 課后習題解答_第4頁
《計算機系統(tǒng)結構》(單博煒) 課后習題解答_第5頁
已閱讀5頁,還剩22頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第一章 計算機系統(tǒng)結構導論透明性:本來存在的事物或屬性,單從某種角度看卻好像不存在的現(xiàn)象。N+1NNN+1N+1NN+1模擬:仿真:用微程序直接解釋另一種機器指令系統(tǒng)實現(xiàn)軟件移植的方法稱為仿真并行性:同時性:并發(fā)性:兩個或多個事件在同一時間間隔發(fā)生的并行性時間重疊:在并行性概念中引入時間因素,即多個處理過程在時間上相互錯開,輪流重疊的使用同一套硬件設備的各個部分,以加快硬件周轉來提高處理速度資源共享:異構型多處理機系統(tǒng):()CPI:每條指令的平均時鐘周期數(shù)CPI(ClockCyclesPerInstruction)MIPS:(MillionInstructionsPerSecond),即百萬條指令每秒MFLOPS(MilioFlatngPontpertiosPSecod)NKns1Nns,KN2nsKN3nsMii-1Mii-1NK解:程在一:間K執(zhí)了IC指則執(zhí)每指的間為?? ????對第二級:要完成同樣功能,需要指令????條?? ???????? ??=??×??????=????2

????

?? ????2??3=??(??)

??3??4=??(??)答:計算機系統(tǒng)結構是計算機系統(tǒng)的軟、硬件的界面;計算機組成是計算機系統(tǒng)結構的邏輯實現(xiàn);計算機實現(xiàn)是計算機組成的物理實現(xiàn)。具有相同系統(tǒng)結構的計算機可因性價比要求不同而采用不同的組成技術。同樣,一種計算機組成也可以采用多種不同的計算機實現(xiàn)。計算機實現(xiàn)是計算機系統(tǒng)結構和計算機組成的基礎。計算機實現(xiàn),尤其是器件技術的發(fā)展對計算機系統(tǒng)結構有著很大的影響。系統(tǒng)結構的設計必須結合應用考慮,為軟件和算法的實現(xiàn)提供更多更好的支持。同時,還要涉及可能采用和準備采用的組成技術。m交叉存取I/OI/OCache答:本來存在的事物或屬性,但從某種角度看卻好像不存在的現(xiàn)象稱為透明性對于計算機系統(tǒng)結構:1)(4)(5)(6)(9)(12(2)(3)(7)(8)(10(11)1-6(匯編)乘法器移位器答:指令緩沖器時標發(fā)生器條件碼寄存器乘法器主存地址寄存器移位器答:在邏輯功能上是等效的。在性能,價格,實現(xiàn)難易上不同。早期圖形加速都通過軟件實現(xiàn),隨著GPU的發(fā)明又通過硬件實現(xiàn)了答:時間重疊:高性能單處理機系統(tǒng);資源重復:多處理機系統(tǒng)資源共享:分時系統(tǒng)Se1=30Se2=20Se3=101230%,那么,部件3Sn10?30%、30%和20%解:3改進前總時間加比S= =改進后總時間解方程得到x=36%

130%÷30+30%÷20+??÷10+(1?30%?30%???)

=10(2)比S= 130%÷30+30%÷20+20%÷10+(1?30%?30%?20%)為改部所比= 1?30%?30%?20%

=4.08=81.63%30%÷30+30%÷20+20%÷10+(1?30%?30%?20%)f40MHzCPI1.5CPIMIPS表1.5指今在程序中出現(xiàn)的條數(shù)和每種指令的CPI指令類型指令條數(shù)CPIALU1200001加載/存儲指令(Cache命中時)360002轉移指令240003訪存指令(Cache不命中時)200008解:CPI是各種類型指令CPI的加權平均120000×1+36000×2+24000×3+20000×8??????=120000+36000+24000+20000

424000=200000

=2.12?? 40×106????????=??????×106=2.12×106=18.9????????40MHz1.6CPI、MIPS表1.6各類指令條數(shù)和指令的平均時鐘周期數(shù)指令類型指令條數(shù)平均時鐘周期數(shù)整數(shù)運算450001數(shù)據(jù)傳送320002浮點運算150002控制傳送80002解:CPI是各種類型指令CPI的加權平均45000×1+32000×2+15000×2+8000×2??????= =45000+32000+15000+8000

155000100000

=1.55?? 40×106 155000????????=??????×106=1.55×106=100000=25.8????????程序執(zhí)行時間=45000×1+32000×2+15000×2+8000×2=155000=0.003875??=3875?????? 40×1061(1)處理機的CPI值是多少?(230MHz230%15%2MIPS。解:(1)10????????= ????????×106

=15×106??????×106解出每條指令的平均CPI=1.5CPI=1.5-1=0.5(2)CPI=30%(0.52)5%(0.54650.5=1.3?? 30×106 155000????????=??????×106=1.3×106=100000=23.08????????加載/存儲/(CPI)1.7表1.7指令比例及指令的平均周期數(shù)指令類型比例CPI算邏指令44%1Load指令20%2Store運算12%2轉移傳送24%2(1)求該指令系統(tǒng)的指令平均周期數(shù)。(2)25LoadR-M)CPI2解:(1)CPI=44120%212%224%2=1.56R-M指令類型比例CPI算邏指令19%1R-M算邏指令25%2Load指令20%2Store運算12%2轉移傳送24%2平均CPI=19%×1+25%×2+20%×2+12%×2+24%×2=1.81第二章 指令系統(tǒng)數(shù)據(jù)表示:是能由機器硬件直接識別和引用的數(shù)據(jù)類型邏輯地址:程序員編寫程序時使用的地址物理地址:程序在主存中的實際地址信息按整數(shù)邊界存儲:信息在主存中存放的地址必須是該信息寬度(字節(jié)數(shù))的整數(shù)倍HuffmanComplexInstructionSetComputerRISC:精簡指令系統(tǒng)計算機ReducedInstructionSetComputer重疊寄存器窗口技術:CPU中都設置有數(shù)量較大的寄存器組,讓每個過程使用一個有限數(shù)量的寄存器窗口,并讓各個過程的寄存器窗口部分重疊指令延遲轉移技術:由編譯程序自動在轉移指令后面都插入一條空操作指令(NOP),或將轉移指令與其前面的一條指令對換位置,讓成功轉移總是在緊跟的指令被執(zhí)行之后發(fā)生,從而使按要求的轉移目的地址預取的指令不作廢,同時可能節(jié)省一個機器周期。答:數(shù)據(jù)表示是數(shù)據(jù)結構的子集?;驹瓌t是得到對應用中遇到的數(shù)據(jù)結構有較高的實現(xiàn)效率。標志符數(shù)據(jù)表示與描述符數(shù)據(jù)表示有何區(qū)別?描述符數(shù)據(jù)表示與向量數(shù)據(jù)表示對向量數(shù)據(jù)結構所提供的支持由4(經(jīng)ROM30ROMROM地址內容地址內容地址內容地址內容地址內容0000000010001010001001100110000100101010111001101110111100100010110011101010111101110011010011110010111101111111111HH解:H的含義是信息所包含的平均信息量。H的作用在于:計算實際編碼的平均碼長值接近H者編碼質量高。答:應根據(jù)系統(tǒng)中指令的使用頻度分布和指令系統(tǒng)的大小來決定選擇何種擴展編碼方法。CISCRISCCISCRISC目標程序的執(zhí)行時間更長?答:據(jù)式 ??????時間=????×??????×??。相能的序然ICCISC<ICRISC,但是CPICISC>CPIRISC,和且TCISC>TRISC,所以總的CPU時間CISC更長。q=6ep=6m用解:對于階碼長度q,階碼基re,尾數(shù)長度p,尾數(shù)基rm,純小數(shù)補碼的范圍,有如下公式,???1×???2??≤??

≤(1??????)×???2???1 -1×???2???1≤??

≤?(???1??????)×???2???? ?? 正

?? ??

?? 負

?? ?? ??代入上述數(shù)據(jù)可以得到16?65≤??正≤(1?16?6)1663 ?16?63≤??負≤?(?16?1?16?6)16?64664答:變址尋址是對數(shù)組等數(shù)據(jù)塊運算的支持,利于循環(huán)程序?;穼ぶ肥菍壿嫷刂房臻g到物理地址空間變換的支持,利于實現(xiàn)程序的動態(tài)再定位。將大地址空間64個地址分塊,用基址寄存器指出程序所在塊號,用指令中6位地址碼表示該塊內64個地址之一,這樣基址和變址相結合可以訪問大地址任意64個地址之一。2-1010p7=0.05,p8=0.04,p9=0.03,p10=0.02。(l)計算這10條指令的操作碼編碼的最短平均碼長。10Huffman解:(1)

Hpilog2pi=0.25*2+0.2*2.322+0.15*2.737+0.1*3.322+0.08*3.644+0.08*3.644+0.05*4.322+0.04*4.644+0.03*5.059+0.02*5.6440.25=2.94位(2)等長操作碼操作碼時,實際長度l=4,信息冗余量1-H12.9410.73526.5%l 4(3)Huffman編碼I1=00, I2=10, I3=010, I4=110,I5=0110, 10平均長l =0.25*2+0.2*2+0.15*3+0.1*3+0.08*4+0.08*4+0.05*4+0.04*5+0.03*6+0.02*6=2.99位i1信息冗余量1-H12.9410.9830.017=1.7%l (4)指令頻率3-5等長碼碼長I10.250003I20.20013I30.150103I40.10113I50.081003I60.081013I70.051103I80.04111005I90.03111015I100.0211110510平均長l =0.25*3+0.2*3+0.15*3+0.1*3+0.08*3+0.08*3+0.05*3+0.04*5+0.03*5+0.02*5=3.18位i1如果是2-5等長碼,l=3.2位答:指令格式優(yōu)化是用最短的位數(shù)來表示指令內容,是程序中執(zhí)行的平均字長最短,以節(jié)省程序的存儲空間。操作碼優(yōu)化:Huffman編碼;擴展操作碼編碼地址碼優(yōu)化:(1)由于指令中操作數(shù)個數(shù)不同可采用多種地址制;(2)同一種地址制可以采用多種地址形式和長度,ADD:43% SUB:13% JMP:7% JOM:6% SHR:l% CIL:2% CLA:22% STP:l%請分別設計這九條指令中操作碼的Huffman編碼、3/3/3擴展編碼和2/7擴展編碼,并計算這三種編碼的平均碼長。解:某計機九指令各令使頻分別為I1:52% I2:14% I3:12% I4:7% I5:6%I6:5% I7:2% I8:1% I9:l%試分別用Huffman編碼和2-4-6等長擴展編碼為其操作碼編碼,并分別計算平均碼長。解:Huffman編碼平均碼長:l=2.24位,2-4-6擴展碼:l=2.52位4(0~9)“_”字符空進統(tǒng)后得出們出頻分為 4527 王 1293李 0247四 李四12930247__:20% 0:17% 1:6%2:8% 4:8%5:5% 6:8% 7:13%8:3% 9:l%16(4Huffman平均碼長l=3.23位(2)每個字符平均長度為:3.23*(4+1)=16.15,傳送106個,則需要傳輸?shù)亩M制位數(shù)為:1.615*107位(3)需要傳輸?shù)亩M制位數(shù)為:4*(4+1)*106位=2*107位。42551612位,每個地址碼長為3位,問能否以擴展操作碼為其編碼?如果其中一地址指令為254條呢?說明其理由。()23位對于三地址指令地址占據(jù)12-3*3=3,三地址指令最多23=8條,現(xiàn)三地址指令需4條,∴可有4條編碼作為擴展碼,∴一地址指令最多為4×23×23=28=256條,現(xiàn)要求單地址指令255條,∴可有一條編碼作擴展碼∴零地址指令最多為1×23=8條不滿足題目要求∴不可能以擴展碼為其編碼。(2)若一地址指令有254條,根據(jù)(1)一地址指令可以用2條編碼作為擴展碼,∴零地址指令最多為2×23=16條∴可以以擴展碼作為編碼166x條,問一地址指令最多可以有多少條?答:雙地址指令最多是2(16-6-6)=24=16條,現(xiàn)雙地址指令有x條,∴可有(16-x)條編碼作為擴展碼,∴單地址指令最多為(16-x)×26ADD:30%SUB:24%LOD:6%STO:7%JMP:7%SHR:2%ROL:3%MOV:20%STP:1%16mHuffman解(1)Huffman編碼指令PiHuffman編碼碼長ADD0.301SUB0.241113MOV0.21103STO0.0710114JMP0.0710104LOD0.0610004ROL0.03100105SHR0.021001106STP0.011001116平均碼長l=2.75指令Pi擴展碼2-5碼長ADD0.3002SUB0.24012MOV0.2102STO0.07110005JMP0.07110015LOD0.06110105ROL0.03110115SHR0.02111005STP0.01111015平均碼長l=2.782位 3位 3位操作碼寄存器1寄存器2長指令5位 3位 3位 5位操作碼寄存器1變址寄存器相對位移通用寄存器8個最大相對位移量2^5=32個字節(jié)。35%25%20%10%5%3%(l)請設計七條指令操作碼的Huffman編碼,并計算操作碼的平均碼長。(2)若要求設計8位長的寄存器一寄存器型指令三條,16位長的寄存器一存儲器型變址尋址指令四條,變址范圍為-127~+127,請設計指令格式,并給出指令各字段的長度和操作碼編碼。()指令PiHuffman編碼I10.3511I20.2510I30.200I40.1010I50.050110I60.0301110I70.0201111平均碼長l=2*(0.35+0.25+0.2)+3*0.1+4*0.05+5*(0.03+0.02)=2.35位三條令作分為10,00四條令作分為0100, 0101, 166位。如果二地址指令有15()154001;一地址指令地址占了6位,操作碼占了10位,其中4位用于和二地址區(qū)分由1111占據(jù),還剩6位一地指條數(shù)26-1=63條操碼其中需留零址零地址指令地址占了0位,操作碼占了16位,其中10位用于和一地址區(qū)分由1111111111占據(jù),還剩6位零地址指令條數(shù)26=64條,操作碼1111111111000000-1111111111111111(2)二址令14條,作碼一地指令63+63=126,操碼+ 零地令64+64=128條.操作碼 +CISCRISC答:一般原則P45P46-P48CPICISCRISC答:

第三章 流水線技術與向量處理技術指令的重疊解釋方式:在解釋第k條指令的操作完成之前,就可開始解釋第k+l條指令。一次重疊:任何時候,指令分析部件和指令執(zhí)行部件都只有相鄰兩條指令在重疊解釋。k+lk“k”k+1、k+l“”。數(shù)相關:如果第k+l條指令的源操作數(shù)地址i正好是第k條指令存放運算結果的地址,在笫k、k+1條指令的數(shù)據(jù)地址之間有了關聯(lián),稱為發(fā)生了“數(shù)相關”。靜態(tài)流水線:是指在同一時間內,多功能流水線中的各個功能段只能按一種功能的連接方式工作。動態(tài)流水線:是指在同一時間內,多功能流水線中的各個功能段可以實現(xiàn)多種連接,同時執(zhí)行多種功能。線性流水線:是指流水線各段串行連接,數(shù)據(jù)順序流經(jīng)流水線各段一次且僅流過一次。非線性流水線:是指在流水線各段之間除有串行連接之外,還有某種反饋回路,使一個任務流經(jīng)流水線時,需多次經(jīng)過某個段或越過某些段流水線的實際吞吐率:流水線的實際吞吐率TP是指從啟動流水線處理機開始到流水線操作結束,單位時間內能流出的任務數(shù)或能流出的結果數(shù)流水線的加速比:是指流水方式與非流水線順序方式工作,完成同樣任務量時的工作速度提高的比值。流水線的效率:是指流水線的設備利用率,即流水線在整個運行時間里,流水線的設備實際使用時間所占的比率“√”是一個n-1局部性相關:指指令相關、主存空間數(shù)相關和通用寄存器組數(shù)相關等全局性相關:指的是已進入流水線的轉移指令(尤其是條件轉移指令)和其后面的指令之間的相關。先寫后讀相關:如果指令j的源操作數(shù)地址與指令h的目的操作數(shù)地址相同,而當指令j到達讀段時,指令h還沒有到達寫段完成寫入操作,則指令j讀出的數(shù)據(jù)就是錯誤的,指令h和j就發(fā)生了先寫后讀的操作數(shù)相關。先讀后寫相關:對同一單元,要求在先的指令先讀出,在后的指令后寫入的關聯(lián)為“先讀后寫”相關寫后寫相關:稱這種對同一單元要求在先的指令先寫入,在后的指令后寫入的關聯(lián)為“寫后寫”相關超標量流水線:在一個時鐘周期內能夠同時發(fā)射多條指令VLIW:超長指令字VeryLongInstructionWord,將多條指令中若干可并行執(zhí)行的操作安排在一個超長指令字中的各指令操作字段上,形成一條可達數(shù)百位的指令,超流水線:指在每個節(jié)拍只發(fā)射一條指令,但每個機器周期內可并發(fā)發(fā)射多條指令并產(chǎn)生多個結果的流水線超標量超流水線:超標量流水與超流水技術的結合答:差別之處:順序方式,指令不分解;“一次重疊”把一條指令的解釋分解為兩個子過程,而“流水”則是分解成更多個子過程。流水相比完全重復增加多套部件:優(yōu)點還是節(jié)省硬件,成本較低;缺點是控制復雜,需要解決好指令相關,數(shù)據(jù)相關以及流水線中斷等問題。t、t分析t執(zhí)行(l)分別計算下列幾種情況下,執(zhí)行完100條指令所需時間的一般關系式。①順序方式。②僅“執(zhí)行k”與“取指k+1”重疊。③僅“執(zhí)行k”、“分析k+1”、“取指k+2”重疊。(2)分別在t取指=t分析=2、t執(zhí)行=1及t取指=t執(zhí)行=5、t分析=2兩種情況下,計算出上述各結果。解:①順序方式t=(t1+t2+t3)*100t1=t2=2,t3=1,t=(2+2+1)*100=500t1=t3=5,t2=2,t=(5+2+5)*100=1200②僅“執(zhí)行k”與“取指k+1”重疊。t=t1+100*t2+99*max(t1,t3)+t3t1=t2=2,t3=1,t=2+100*2+99*2+1=401t1=t3=5,t2=2,t=5+100*2+99*5+5=705③僅“執(zhí)行k”、“分析k+1”、“取指k+2”重疊t=t1+max(t1,t2)+98*max(t1,t2,t3)+max(t2,t3)+t3t1=t2=2,t3=1,t=2+2+98*2+2+1=203t1=t3=5,t2=2,t=5+5+98*5+5+5=510Δt105Δt連續(xù)輸入10個數(shù)據(jù),如此重復。畫出時-空圖,計算流水線的實際吞吐率、加速比和效率。解:時空圖TP

1015t

0.67/t加速比ST0Tm效率

10*E4*10t0.674*15t3.50圖3.50流水線結構其中,段S1和S3的執(zhí)行時間均為200ns,段S2和S4的執(zhí)行時間均為100ns。(l)(2)S1S3別使用公式和時一空圖求連續(xù)流入四條指令的實際吞吐率和效率。()s44321432143214321200ns實際吞吐率TP

4

t0.0033ns1E

24*100

50%(2)時空圖ss4s3bs3as2s12s1112342413123412341234

100nst實際吞吐率TP

4

0.0044ns1E

6*4006*9*100

44%Δt10F i1畫出流水線時-空圖,計算流水線的實際吞吐率、加速比和效率。Δt(1)當在流水線間隔Δt連續(xù)流入任務時,會發(fā)生什么情況?(2)該流水線的最大吞吐率是多少?如果每2Δt輸入一個任務,連續(xù)流入10個任務,流水線的實際吞吐率和效率分別是多少?(3)如何改造該流水線,以提高吞吐率?仍然連續(xù)流入10個任務,改造后的流水線的實際吞吐率相對于改造前的流水線吞吐率提高了多少?(1)答:會發(fā)生流水線阻塞現(xiàn)象(2)解:第三段是瓶頸段占用2Δt,所以最大吞吐率TPmax=1/2Δt如果每2Δt輸入一個任務,連續(xù)流入10個任務時:(3)重復設置部件,并聯(lián)在流水線上,6Δt6F(ii)i1畫出流水線時-空圖,并計算流水線的實際吞吐率、加速比和效率。解:ΔtΔtΔt5ΔtΔtΔt542361因為是靜態(tài)流水線,所以需要乘法完成之后,再啟動加法。Δt。輸入端和輸出端的緩沖器足夠大,且輸出端的數(shù)據(jù)可以直接返回到輸入端。若用流水線按最快的處理方式計算(l)畫出流水線計算f的時一空圖。

44f(ii)i1ΔtΔΔtΔtΔt542361答案略

Δt Δt Δt8ABA·B的時-(l)處理器有一個乘法部件和一個加法部件,不能同時工作,部件內也只能按順序方式工作,完成一次加法或乘法均需5Δt。與(l)Δt。Δt。MOVE、ADD和MUL的執(zhí)行分別需要二個、三個和四個時鐘周期,且都在第一個時鐘周期從通用寄存器中讀取源操作數(shù),在最后一個時鐘周期把目的操作數(shù)寫到通用寄存器中。k: MOVERl, R0 ; R1←(R0)k+l: MUL R0, R2, Rl ; k+2: ADD R0, R2, R3 ; R0←(R2)+(R3)(l)就程序本身而言,哪些指令之間可能發(fā)生何種數(shù)據(jù)相關?(2)畫出按指令序列的順序流水執(zhí)行的時一空圖。共使用了多少個時鐘周期?(2)3.2表3.2預 約 表時間段號t0t1t2t3t4t5t6t7t8S1√√S2√√S3√√√S4√√S5√√(l)分別寫出禁止表F、沖突向量C。(2)狀態(tài)轉移圖(3)最佳調度方案(2,5)TPmax=1/3.5Δt6實際吞吐率3.3F、沖突向量C;畫出流水線狀態(tài)轉移圖;求出最小平均延遲及流水線的最大吞吐率及其調度時的最佳方案。按此流水調度方案,輸入六個任務,求實際的吞吐率。表3.2預 約 表時間段號t1t2t3t4t5t6t7S1√√√S2√√S3√S4√√12別畫出在標量流水處理機及并行度m均為4的超標量處理機、超長指令字處理機、起流水線處理機上工作的時-空圖,分別計算出它們相對標量流水處理機的加速比Sp。解,標量處理機超標量m=4超長指令字m=4超流水線m=4Sp=14/5.75=2.43某VLIWΔt,12、14、16解:任務數(shù)分別為12時,分12/4=3條長指令,執(zhí)行時間為(5+3-1)=7Δt任務數(shù)分別為14時,分4條長指令,執(zhí)行時間為(5+4-1)=8Δt任務數(shù)分別為16時,分4條長指令,執(zhí)行時間為(5+4-1)=8Δt若上題的VLIWΔt12、14、16時,各需要的時間是多少?解:n=2,m=4124 1任務數(shù)分別為12時,執(zhí)行時間為:T5

6t4 2144 1任務數(shù)分別為14時,執(zhí)行時間為:T5

4 2164 1任務數(shù)分別為16時,執(zhí)行時間為:T5

4 23-15題的VLIW12、14、16解:超流水n=41任務分為12,時間:T5 1141任務分為14,時間:T5 141任務分為16,時間:T5 4D=A·(B+C)N令:①V3←存器; 取A送向寄器V3②V2←VO+Vl; B+C→K③V4←V2*V3; K*A→D設啟動存儲器、啟動乘/加流水線、數(shù)據(jù)輸入寄存器各需要時間Δt,向量加流水線完成一次加法需要時間6Δt,訪存一次需要時間6Δt,向量乘流水線完成一次乘法需要時間7Δt。求出分別采用下列三種方式工作時,完成三條向量指令共需的時間。(l)三條指令依序串行。解:(1)T=1+6+N+ 1+6+N+ 1+7+N=(22+3N)ΔtT=1+6+N+ 1+7+N=(15+2N)Δt第三條與一、二條并行執(zhí)行T=1+6+ 1+ 1+7 +N=(16+N)Δtf=200MHz/12VSnV1←存儲器V2←V1×SV3←存儲器V4←V2+V3存儲器←V4(l)處理機順序執(zhí)行各向量指令且不鏈接,若n=64,計算處理機的執(zhí)行時間。MFLOPS()T12++6411+7+1+64-11+12+1+64-1+1+6+1+64-1+1+12+1+64-1=374Δt=374/(200*106)=187*10-8s(2)MFLOPS=2*64/(187*10-8*106)=68(3)5條向量指令在標量處理機上以順序方式處理,各自需要的處理時間分別為:T1=64×12Δt=768ΔtT2=64×7Δt=448ΔtT3=64×12Δt=768ΔtT4=64×6Δt=384ΔtT5=64×12Δt=768Δt標量處理機順序執(zhí)行所需要的時間為:T=T1+T2+T3+T4+T5=3136/(200*106)=1568*10-8s加速比:Sp=1568/187=8.3932,SVΔt/6Δt算需要時間6Δt,完成一對數(shù)據(jù)的乘運算需要時間7Δt。問下列各指令組中,哪些指令可以同時并行?哪些指令可以鏈接?分別計算各指令組的執(zhí)行時間。(1)V0←存儲器V1←V2+V3(2)V3←存儲器V2←V0+V1V4←V5×V6S0←S2+S3(3)S0←S1+S2V3←存儲器(2)V3←V1×V4V0←存儲器V2←V0+V1V2

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論