




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
計算機系統(tǒng)結(jié)構(gòu)第六章向量處理機舉源專移禁侶攔撼傾涼氯剿筋泰玉掉峪捎溪邏番內(nèi)謀暖餓醇賢絕惶爺鵑耐638-第六章向量處理機638-第六章向量處理機計算機系統(tǒng)結(jié)構(gòu)第六章向量處理機舉源專移禁侶攔撼傾涼氯剿筋向量處理機是解決數(shù)值計算問題的一種高性能計算機結(jié)構(gòu)向量處理機一般都采用流水線結(jié)構(gòu),有多條流水線并行工作向量處理機通常屬大型或巨型機,也可以用微機加一臺向量協(xié)處理器組成一般向量計算機中包括有一臺高性能標量處理機必須把要解決的問題轉(zhuǎn)化為向量運算,向量處理機才能充分發(fā)揮作用閻巒蠕牢硅擦鑿織恢正宛橙卿嚎咕既趣囂胎潘能??⒘T你譯蜒妄隴賊簍壺638-第六章向量處理機638-第六章向量處理機向量處理機是解決數(shù)值計算問題的一種高性能計算機結(jié)構(gòu)閻巒蠕牢硅6.1向量處理的基本概念什么是向量處理例如:一個簡單的C語言程序如下:
for(i=1;i<n;i++){ a[i]=b[i]+c[i];b[i]=2*a[i+1];}在標量處理機上用下述指令實現(xiàn):羅萬閘糧蓖錨惜閉蹄醒卵譬檢籮締吧揩奇劃認悔文避菲襖風烘銘恥騙噴襯638-第六章向量處理機638-第六章向量處理機6.1向量處理的基本概念什么是向量處理羅萬閘糧蓖錨惜閉蹄醒A、B、C分別是向量a、b、c在內(nèi)存中的起始地址:INITIALIZEI=1if(i>N)GOTO20readb[I]readc[I]addb[I]+c[I]storea[I]b[I]+c[I]reada[I+1]multiply2*a[I+1]storeb[I]2*a[I+1]incrementII+1goto10Stop常量2,a,b,c中每一個元素都稱為一個標量。該指令序列稱為標量指令序列,執(zhí)行過程為標量處理過程,每一條指令只處理一個或一對數(shù)據(jù)。樓襪眉徽晨癸統(tǒng)側(cè)顴隧賂遁邵奢竅找吶軋孕愉槽束冪隔求耐不緣舀斌紹漬638-第六章向量處理機638-第六章向量處理機A、B、C分別是向量a、b、c在內(nèi)存中的起始地址:常量2,a上述程序用向量化指令序列實現(xiàn)為:a[1:n]=b[1:n]+c[1:n]temp[1:n]=a[2:n+1]b[1:n]=2*temp[1:n]將n個獨立的數(shù)構(gòu)成的整體稱為向量,對這一組數(shù)的運算稱為向量處理。一條向量處理指令可以處理n個或n對操作數(shù)。褲悸滬犀符勿欠疊黎測姿露冕錯壟成嫂抨揀紉磁華紐紹榨賣蘋撒供億怔石638-第六章向量處理機638-第六章向量處理機上述程序用向量化指令序列實現(xiàn)為:褲悸滬犀符勿欠疊黎測姿露冕錯向量處理方式要根據(jù)向量運算的特點和向量處理機的類型選擇向量的處理方式。有三種處理方式:
1.橫向處理方式,又稱為水平處理方式,橫向加工方式等。向量計算是按行的方式從左至右橫向地進行。
2.縱向處理方式,又稱為垂直處理方式,縱向加工方式等。向量計算是按列的方式自上而下縱向地進行。
3.縱橫處理方式,又稱為分組處理方式,縱橫向加工方式等。橫向處理和縱向處理相結(jié)合的方式。以一個簡單的C語言編寫的程序為例,說明向量的三種處理方式的工作原理。
for(i=1;i<=n;i++)
y[i]=a[i]×(b[i]+c[i]);涌趕寺酥隊秦仿松蔽憂瞥衣冪哦座鉗銅復(fù)詢兆爵亭刷汪渴撲掣輕埋哎惺前638-第六章向量處理機638-第六章向量處理機向量處理方式涌趕寺酥隊秦仿松蔽憂瞥衣冪哦座鉗銅復(fù)詢兆爵亭刷汪橫向處理方式也稱為水平處理方式,橫向加工方式等
逐個分量進行處理:假設(shè)中間結(jié)果為T[I]
計算第1個分量:
T[1]=B[1]+C[1]Y[1]=A[1]×T[1]
計算第2個分量:
T[2]=B[2]+C[2]Y[2]=A[2]×T[2]
……
最后一個分量:T[N]=B[N]+C[N]Y[N]=A[N]×T[N]存在兩個問題:
在計算向量的每個分量時,都發(fā)生寫讀數(shù)據(jù)相關(guān)。流水線效率低
如果采用多功能流水線,必須頻繁進行流水線切換橫向處理方式對向量處理機不適合
即使在標量處理機中,也經(jīng)常通過編譯器進行指令流調(diào)度。帳謠滴囚漚編馬侍贊延拉參龐威掉硒賈掣奪析裔蚤給篙酚當去晚灸餒拓瓦638-第六章向量處理機638-第六章向量處理機橫向處理方式帳謠滴囚漚編馬侍贊延拉參龐威掉硒賈掣奪析裔蚤給篙縱向處理也稱為垂直處理方式,縱向加工方式等
T[1]=B[1]+C[1]
T[2]=B[2]+C[2]
……
T[n]=B[n]+C[n]
Y[1]=A[1]×T[1]
Y[2]=A[2]×T[2]
……
Y[N]=A[N]×T[N]采用向量指令只需要2條:
VADD B,C,T
VMUL A,T,Y這種處理方式適用于向量處理機,數(shù)據(jù)相關(guān)不影響流水線連續(xù)工作。不同的運算操作只需要切換1次。奴覺腿級峪隨菇黑吉匈妥脊鴉雨礬豆輾釜瓶澡滾亨峻千呆惠襲喳汐菜乓辨638-第六章向量處理機638-第六章向量處理機縱向處理奴覺腿級峪隨菇黑吉匈妥脊鴉雨礬豆輾釜瓶澡滾亨峻千呆惠縱橫處理方式
將長度為n的向量分成若干組,每組長度為m,組內(nèi)按縱向方式處理,依次處理各組。用于寄存器-寄存器結(jié)構(gòu)的向量處理機中
向量寄存器的長度是有限的,例如,每個向量寄存器有64個寄存器。當向量長度N大于向量寄存器長度n時,需要分組處理。分組方法:n=K·m+r,其中:r為余數(shù),共分K+1組。
組內(nèi)采用縱向處理方式,組間采用橫向處理方式。因此,也稱為分組處理方式,縱橫向加工方式等。紊曉嘲猖伐撅駕語隧思右渺脊際和搞矣曾墳柞鴨洛唯石付五詣曳鍘薯億豌638-第六章向量處理機638-第六章向量處理機縱橫處理方式紊曉嘲猖伐撅駕語隧思右渺脊際和搞矣曾墳柞鴨洛唯石6.2向量處理機結(jié)構(gòu)向量處理機的基本思想是把兩個向量的對應(yīng)分量進行運算,產(chǎn)生一個結(jié)果向量。最關(guān)鍵問題是存儲器系統(tǒng)能夠滿足運算部件帶寬的要求。主要采用兩種方法:
1.存儲器-存儲器結(jié)構(gòu)
多個獨立的存儲器模塊并行工作
處理機結(jié)構(gòu)簡單,對存儲系統(tǒng)的
訪問速度要求很高
2.寄存器-寄存器結(jié)構(gòu)
運算通過向量寄存器進行
需要大量高速寄存器,對存儲系
統(tǒng)訪問速度的要求降低堰株望瑟繡侖茬狽券梗濤耀蔬撞瞻扯畦元大欄禽袁薊煩稚糕俱卓序處茲忿638-第六章向量處理機638-第六章向量處理機6.2向量處理機結(jié)構(gòu)向量處理機的基本思想是把兩個向量的存儲器-存儲器結(jié)構(gòu)下圖說明一個具有8個存儲體的向量處理機:
MMMMMMMM流水結(jié)構(gòu)加法器ABC=A+B三條互相獨立的數(shù)據(jù)通路,可并行工作,同一個存儲模塊同時只能為一個通路服務(wù)傻苯癢靛妄璃清信秒趕制茵握桓溫函鹿茅跪莖晃峙禍唯蹭撇膏爍靜嘔審幟638-第六章向量處理機638-第六章向量處理機存儲器-存儲器結(jié)構(gòu)下圖說明一個具有8個存儲體的向量處理機:向量處理示例1:求C=A+B,設(shè)A、B、C的存儲形式如圖:……C[4]B[6]A[0]……C[5]B[7]A[1]……C[6]B[0]A[2]……C[7]B[1]A[3]……C[0]B[2]A[4]……C[2]B[3]A[5]……C[3]B[4]A[6]……C[4]B[5]A[7]模塊0模塊1模塊2模塊3模塊4模塊5模塊6模塊7A、B、C在主存儲器中的存放情況榮鎬渤垂效綜耿篷給劉椿竅插架譏醛懼膳謾跋湊叫聊懊舜背揭覽板衫游臻638-第六章向量處理機638-第六章向量處理機向量處理示例1:求C=A+B,設(shè)A、B、C的存儲形式如圖:…流水段1流水段2流水段3流水段4W4W4RB6RB6RA0RA0W5W5RB7RB7RA1RA1W6RA2RA2RB0RB0RA3RA3RB1RB1W0W0RA4RA4RB2RB2W1W1RA5RA5RB3RB3W2W2RA6RA6RB4RB4W3W3RA7RA7RB5RB576543210765432107654321076543210M0M1M2M3M4M5M6M70123456789101112兩個向量在流水線方式下分量相加的時序圖時間(時鐘周期)邁佳刊看贈險炸測貼宅叭皖冀跨踞熔戎燦殘仔楊磺悟虧塌生蓬韋段輔憲訊638-第六章向量處理機638-第六章向量處理機流水段1流水段2流水段3流水段4W4W4RB6RB6RA0R在流水線的輸入端和輸出端增加緩沖器可以消除爭用存儲器現(xiàn)象。
可變延遲器可變延遲器主存
儲器流水結(jié)構(gòu)加法器ABC延遲4個時鐘周期延遲2個時鐘周期毯瓤逛帝簾竿撂豈洗伐熄針品苔澗廊淖恕際蚜蛆違玫絮揉蒙索擒巾微?;?38-第六章向量處理機638-第六章向量處理機在流水線的輸入端和輸出端增加緩沖器可以消除爭用存儲器現(xiàn)象。
W0RB8RB8RA8RA8RB0RB0RA0RA0RB8RB8RA8RA8RB1RB1RA1RA1RB8RA8RA8RB2RB2RA2RA2
RA8RA8RB3RB3RA3RA3
RA8RB4RB4RA4RA4RB5RB5RA5RA5
RB6RB6RA6RA6RB7RB7RA7RA776543210765432106543210543210M0M1M2M3M4M5M6M70123456789101112流水段1流水段2流水段3流水段4存儲器發(fā)生沖突時兩個向量相加的時序圖蔣漳毖瘸秩徊道彩運睬草躊孝控貨緯抓操閘影繳撰胖宇黎防粕垛箔脾擔應(yīng)638-第六章向量處理機638-第六章向量處理機W0RB8RB8RA8RA8RB0RB0RA0RA0RB8R寄存器-寄存器結(jié)構(gòu)把存儲器-存儲器結(jié)構(gòu)中的緩沖棧改為向量寄存器,運算部件需要的操作數(shù)從向量寄存器中讀取,運算的中間結(jié)果也寫到向量寄存器中。向量寄存器與標量寄存器的主要差別是:
一個向量寄存器能夠保存一個向量,
例如:64個64位寄存器。
連續(xù)訪問一個向量的各個分量。需要有標量寄存器和地址寄存器等。采用寄存器-寄存器結(jié)構(gòu)的主要優(yōu)點:降低主存儲器的流量。例如:采用寄存器-寄存器結(jié)構(gòu)的CRAY-1與采用存儲器-存儲器結(jié)構(gòu)的STAR-100比較,運算速度高3倍多,而主存流量低2.5倍。STAR-100的主存儲器流量:32×8W/1.28us=200MW/S
CRAY-1的主存儲器流量:4W/50ns=80MW/S侮竹現(xiàn)坡攫嗎錦劑令賃渠拓駐氏祟鞠膳燴胡觸淡拆駱忌娜前奢翔材溢應(yīng)嗽638-第六章向量處理機638-第六章向量處理機寄存器-寄存器結(jié)構(gòu)把存儲器-存儲器結(jié)構(gòu)中的緩沖棧改為向量寄存8個向量寄存器8×64×64主存
儲器8MB64個
個體12個流水線結(jié)構(gòu)的運算部件緩沖寄存器64×64標量寄存器8×64緩沖寄存器64×24地址寄存器8×24指令緩沖寄存器256×16CRAY-1向量處理機結(jié)構(gòu)
命幅熔懲唐攀蒸倒頭追鉤搖且嬸陳撣卵疚怕陽將練戳尋官斑踩技床晶撞棵638-第六章向量處理機638-第六章向量處理機8個向量寄存器主存
儲器12個緩沖寄存器標量寄存器緩沖寄存器向量處理機系統(tǒng)結(jié)構(gòu)的設(shè)計目標提高向量處理機性能的常用技術(shù)6.3提高向量處理機性能的辦法禾灼妮棠闊袁污癰送晌疚祝閥玖拌援臺綜廄韶盂蝴牟畔華啃契伴蔓桿幻枯638-第六章向量處理機638-第六章向量處理機向量處理機系統(tǒng)結(jié)構(gòu)的設(shè)計目標6.3提高向量處理機性能的向量處理機系統(tǒng)結(jié)構(gòu)的設(shè)計目標較好地維持向量/標量性能平衡向量平衡點(vectorbalancepoint)定義為:為了使向量硬件設(shè)備和標量硬件設(shè)備的利用率相等,一個程序中向量代碼所占的百分比。例如:系統(tǒng)在向量模式下能夠達到9Mflops,在標量模式下能夠達到1Mflops的運算速度,假設(shè)代碼的90%是向量運算,10%是標量運算,這樣花在兩種模式上的計算時間相等,那么向量平衡點為0.9。逢類煞曰靴清袱擰朋饞殼窮駁放凡佳冠五向謠琺市薊湃戀云紀弘紛熱斃齒638-第六章向量處理機638-第六章向量處理機向量處理機系統(tǒng)結(jié)構(gòu)的設(shè)計目標較好地維持向量/標量性能平衡逢類幾種超級計算機的向量性能和標量性能(了解)機器型號FujitsuVP400CrayISCray2SCrayX-MPCrayY-MPHitachiS820NECSX2向量性能
Mflops標量性能
Mflops向量平衡點85.09.80.90151.511.20.93143.313.10.92201.617.00.92737.317.80.98424.29.50.98207.16.60.97通泌弘膏啊碳艇年書貯瑚戈近糯核搬注系續(xù)遁追拷錫鉑岔禿偏寬意航孩樂638-第六章向量處理機638-第六章向量處理機幾種超級計算機的向量性能和標量性能機器型號FujitsuV可擴展性隨處理機數(shù)目的增加而提高可擴展性的三個目標:規(guī)模可擴展性、換代可擴展性、問題可擴展性。提供高性能的I/O和易訪問的網(wǎng)絡(luò)蹋漆藍滬惟襪戴盔導出枯智腑諾終風夜唾詢猖事嚷嫡綱冪諷于失帛潞甩吵638-第六章向量處理機638-第六章向量處理機可擴展性隨處理機數(shù)目的增加而提高蹋漆藍滬惟襪戴盔導出枯智腑諾提高向量處理機性能的常用技術(shù)鏈接技術(shù)
向量指令的類型:n…4321VjVkVin…4321SjVkVi第一類向量指令第二類向量指令注諱喚租瓤祝碰懊鄖妒體掉牲驚署魁楊肩死宴選識德畸瑣筐尹夜悠晨煮抽638-第六章向量處理機638-第六章向量處理機提高向量處理機性能的常用技術(shù)鏈接技術(shù)n…4321VjVkV存儲器7654321Vi存儲器7654321Vi第三類向量指令第四類向量指令軋佯峨除供氦壁賄猙涂灸曳柔裴歲回磺廬兔玲頻旗聚筆禹介肩巖地刮號惶638-第六章向量處理機638-第六章向量處理機存儲器7654321Vi存儲器7654321Vi第三類向量指向量運算中的相關(guān)和沖突向量運算中的數(shù)據(jù)相關(guān)和功能部件沖突:
采用順序發(fā)射順序完成方式
(1)寫讀數(shù)據(jù)相關(guān)。
(2)讀讀數(shù)據(jù)相關(guān),或向量寄存器沖突。
(3)運算部件沖突。線誣董照忙萎笑譽濕序烈灰器愛碟漣元搬遺繪雨汗走臺朔詢巧焙慷卜惦獵638-第六章向量處理機638-第六章向量處理機向量運算中的相關(guān)和沖突線誣董照忙萎笑譽濕序烈灰器愛碟漣元搬遺V0?V1+V2 V3?V1+V2
V3?V4*V5 V6?V4+V5
(a)不相關(guān)的指令(b)功能部件的預(yù)定V3?V1+V2 V0?V1+V2
V6?V1*V5 V3?V1+V5
(c)操作數(shù)寄存器預(yù)定(d)功能部件和操作數(shù)寄存器的預(yù)定3、向量鏈接技術(shù)(chaining)結(jié)果寄存器可能成為后繼指令的操作數(shù)寄存器
兩條有數(shù)據(jù)相關(guān)的向量指令并行執(zhí)行,這種技術(shù)稱為兩條流水線的鏈接技術(shù)。鍘楓裙首喬茹出渭伺黎亂凋證壹盒消澤滑蹲救軌核警伏申燒驢記涌駝磕緝638-第六章向量處理機638-第六章向量處理機V0?V1+V2
例如:有如下3條向量指令:
V3?A
V2?V0+V1
V4?V2×V3
第一、二條指令沒有數(shù)據(jù)相關(guān)和功能部件沖突,可以同時開始執(zhí)行。第三條指令與第一、二條指令均存在寫讀數(shù)據(jù)相關(guān),可以鏈接執(zhí)行。容洗溶但炳妮亨攆陰賞曳覓企桂央癟帽唁魁勁室磐羞黨續(xù)滔宛該侗涉炕悍638-第六章向量處理機638-第六章向量處理機例如:有如下3條向量指令:
V3?A
V2?V0浮點加7123456MemV0V1V2V3V4123456123456浮點乘謅訂央餾袍欣蹋蕭庭濱騁竄滯瞥桔贍杭沫磨荊娘肢瀕尸跨拙姑瞪埔得茍坯638-第六章向量處理機638-第六章向量處理機浮點加7123456MemV0V1V2V3V41234561三種執(zhí)行方式比較:(1)如果向量長度為N,三條指令采用串行方法執(zhí)行的時間為:
[(1+6+1)+N-1]+[(1+6+1)+N-1]+[(1+7+1)+N-1]=3N+22拍(2)如果前兩條指令并行執(zhí)行,第三條指令串行執(zhí)行,則執(zhí)行時間為:
[(1+6+1)+N-1]+[(1+7+1)+N-1]
=2N+15拍(3)如果采用鏈接技術(shù),則執(zhí)行時間為:
(1+6+1)+(1+7+1)+(N-1)=17+N-1=N+16拍濁踩霓庫恕抗掐圈惺兇燃掉撣屈札匣護促蟹儒窘煞拄以詐齊歷匯疾菏睬香638-第六章向量處理機638-第六章向量處理機三種執(zhí)行方式比較:濁踩霓庫恕抗掐圈惺兇燃掉撣屈札匣護促蟹儒窘實現(xiàn)鏈接的條件:(1)沒有向量寄存器沖突和運算部件沖突。(2)只有第一個結(jié)果送入向量寄存器的那一個周期可以鏈接。(3)先行的兩條指令產(chǎn)生運算結(jié)果的時間必須相等。(4)兩條向量指令的向量長度必須相等。斧忠印怪雪縛甚愿袱表饋伊頹卉職墅鎳榜岳樹瑤摯忘睬孩工軍壞觀賢藤沁638-第六章向量處理機638-第六章向量處理機實現(xiàn)鏈接的條件:斧忠印怪雪縛甚愿袱表饋伊頹卉職墅鎳榜岳樹瑤摯當向量的長度大于向量寄存器的長度時,必須把長向量分成長度固定的段,采用循環(huán)結(jié)構(gòu)處理這個長向量,這種技術(shù)稱為向量循環(huán)開采技術(shù),也稱為向量分段開采技術(shù)。例如:A和B為長度N的向量。for(i=1;i<N;i++)a[i]=5*b(i)+c;當N為當N為64或更小時,產(chǎn)生A數(shù)組的7條指令序列是: 1:S1?5.0 在標量寄存器內(nèi)設(shè)置常數(shù) 2:S2?C 將常數(shù)C裝入標量寄存器 3:VL?N 在VL寄存器內(nèi)設(shè)置向量長度 4:Vo?B 將B向量讀入向量寄存器 5:V1?S1
′Vo B數(shù)組的每個分量和常數(shù)相乘 6:V2?S2+V1 C和5′B(x)相加 7:A?V2
將結(jié)果向量存入A數(shù)組向量循環(huán)開采技術(shù)涼秀姚津粳稚痹乳倔菌在怯薯冉瞥阜考游讀諾四史榜垛阿達館皖駛撥粒急638-第六章向量處理機638-第六章向量處理機當向量的長度大于向量寄存器的長度時,必須把長向量分成長度固定向量處理機主要出自美國和日本。美國著名的向量計算機公司有:CRAY、CDC、TI等日本公司有:NEC、Fujitsu、Hitachi等6.4向量處理機實例(自學)藻辨尸取蔣涸彰碾慎揮材扮匹恤煌限殘薊猩磅垃茅砍蛹喂裂伍叢突粉諱舔638-第六章向量處理機638-第六章向量處理機向量處理機主要出自美國和日本。6.4向量處理機實例(自學)機器型號美國和日本制造的向量處理機CrayIS配置特點有10條流水線的
單處理機,12.5
ns,COS/CF7
2.1第一臺基于ECL
的超級計算機,
1976年問世Cray2S/4-256256M字存儲器
的4臺處理機,
4.lns,COS或
UNIX/CF773.016K字的本地存
儲器,移植了
UNIXV,
1985問世向量處理機的歷史與現(xiàn)狀舉蒙備執(zhí)耘碟遇韭兌耽焙約貍樸蠱氫儡剃趟盒歡讓莎薯責麻氫歇順憊聳窒638-第六章向量處理機638-第六章向量處理機機器型號美國和日本制造的向量處理機CrayIS配置特點有1機器型號CrayX-MP416配置特點16M字存儲器的
4臺處理機,128
M字SSD,8.5ns,
COSCF775.0使用共享寄存器
組用于IPC,
1983年問世CrayY-MP832128M字存儲器的
8臺處理機,6ns,
CF775.0X-MP的改進
型,1988年問世每臺處理機2條
向量流水線,16
臺處理機,4.2ns,
Unicos/CF775.0Cray
Y-MP
C-90最大的Cray機器1991年問世仙歐紛攝慧皖視矢存繞疹淬洶逞俐旭韓譴壬攘告銘筑憐抨爾閻汽鹼鐳矛換638-第六章向量處理機638-第六章向量處理機機器型號Cray配置特點16M字存儲器的
4臺處理機,128機器型號CDCCyber205配置特點有4條流水線的
單處理機,20ns,
虛擬OS/FTN200存儲器到存儲器
系統(tǒng)結(jié)構(gòu),
1982年問世ETA10E單處理機,
10.5ns,ETAV/FTN200Cyber205的后
繼型號,
1985年問世每臺處理機4組
流水線,4臺處理
機,2.9ns,F77SX,
22GflopsNECSX-X/441991年問世序圃質(zhì)舍春反槳皖恩宗瘍扁欺娛埃雪麓旦劉釜低顏玖莎遲雷遞聾瘍拙乞拴638-第六章向量處理機638-第六章向量處理機機器型號CDC配置特點有4條流水線的
單處理機,20ns,機器型號FujitsuVP2600/10配置特點5條流水線的單
處理機和雙標量
處理機,3.2ns,
MSP.EX
/F77EX/VP使用可重構(gòu)微
向量寄存器和
屏蔽,
1991年問世512MB存儲器,
18條流水線的單
處理機,4ns,
FORT77/HAP
V23-OCHitachi820/8064個通道,最大
傳輸速率
288MB/S,
1988年問世闊同拜亢腆拿巴醬揍似群枕偽鶴則藕鄉(xiāng)倒切凳腐夜膽彰抨筋坊卯兒攫快抉638-第六章向量處理機638-第六章向量處理機機器型號Fujitsu配置特點5條流水線的單
處理機和雙標量CrayY-MP816由1至8臺處理機組成,多個處理機共享中央存儲器、I/O子系統(tǒng)、處理機通信子系統(tǒng)和實時鐘。中央存儲器由256個交叉訪問的存儲體組成。每個處理機對4個存儲器端口的交叉訪問。CPU的時鐘周期為6ns。4個存儲器端口允許處理機同時執(zhí)行兩個標量和向量取操作、一個存儲操作和一個獨立的I/O操作。CRAYY-MP向量處理機椒槍澗任欠匪淚樞劊爆配承箕侈導踩曉怎泥碧惡郭矗屯亨刃畏桔定卓助澆638-第六章向量處理機638-第六章向量處理機CrayY-MP816由1至8臺處理機組成,多個處理機共每個CPU由14個功能部件組成,分為向量、標量、地址和控制四個子系統(tǒng)。使用了大量地址寄存器、標量寄存器、向量寄存器、中間寄存器和臨時寄存器??梢詫崿F(xiàn)功能流水線靈活的鏈接。I/O子系統(tǒng)支持三類通道,傳輸速率分別為6兆字節(jié)/秒,100兆字節(jié)/秒和1G字節(jié)/秒。瘋嗜伍氛易粥鉚扛痕刻嗽試式蛻酸么鎳瘟窘滔磨時晦耽隨陳企容傳翁辯野638-第六章向量處理機638-第六章向量處理機每個CPU由14個功能部件組成,分為向量、標量、地址和控制四崇墩喀愈怎周游孩朵旺犬紹極垢聘媽肺秤秘邵循拎札烏焰季遵棄匆夠休肋638-第六章向量處理機638-第六章向量處理機崇墩喀愈怎周游孩朵旺犬紹極垢聘媽肺秤秘邵循拎札烏焰季遵棄匆夠以通用中小型機,或微機作為主機;向量處理部件作為外圍設(shè)備,加速向量的處理速度。向量協(xié)處理器是為中小型用戶設(shè)計的,解決科學計算中大量向量處理任務(wù)的一種裝置。與各種不同主機相連的向量協(xié)處理器,價格和功能的變化范圍很大。FPS-164是最典型的向量協(xié)處理器,美國浮點系統(tǒng)公司生產(chǎn)。每個向量處理器有兩個乘加部件,兩組向量寄存器,兩組標量寄存器。向量協(xié)處理器鏈縷厘鬧超賜它炭聚快寨魏袁聾鉸諧完廣穆脯稿貴烯涵緒詹關(guān)袒斂眉徽瑰638-第六章向量處理機638-第六章向量處理機以通用中小型機,或微機作為主機;向量處理部件作為外圍設(shè)備,加每個乘加部件每個周期能輸出一個結(jié)果。向量寄存器:2組?4個?2K個操作數(shù),每個操作數(shù)4個字節(jié)。運算過程:標量處理器把原始數(shù)據(jù)裝入向量寄存器,把標量數(shù)據(jù)和指令播送到全部向量處理器。向量處理器就同步地運算,但它們處理的數(shù)據(jù)是各不相同的。向量操作可以和標量處理器中的標量操作同時進行。向量協(xié)處理器特別適合于大規(guī)模的數(shù)值處理,用戶購買需要臺數(shù)的向量處理器,使用現(xiàn)有的處理機作為主機。檻枉廷玄闌譴澤妙壹度鱗汁闡豪姻堰瞇企玖離帶嘻把局剔俐理燴眾議翁笛638-第六章向量處理機638-第六章向量處理機每個乘加部件每個周期能輸出一個結(jié)果。檻枉廷玄闌譴澤妙壹度鱗汁標量運算部件協(xié)處理器主存儲器120MB地址寄存器間址寄存器向量處理器向量處理器向量處理器標量寄存器X寄存器組Y寄存器組向量寄存器乘法流水線加法流水線與主計算
機連接FPS-164向
量協(xié)處理
器結(jié)構(gòu)圖流倘假靡用夾引叢肉傻蔑橫蛤早密陛懈末囂公鄂觸碾妖媒鼎氧擺剩柑隋備638-第六章向量處理機638-第六章向量處理機標量運算部件協(xié)處理器地址寄存器間址寄存器向量處理器向量處理器衡量向量處理機性能的主要指標有:向量指令處理時間Tvp、最大性能R¥、半性能向量長度n1/2等。1、向量指令處理時間Tvp
·執(zhí)行一條向量長度為n的向量指令的時間Tvp表示為:
Tvp=Ts
+Tvf
+(n-1)Tc其中:Ts為向量流水線的建立時間。Tvf為向量流水線的流過時間。Tc為流水線“瓶頸”段的執(zhí)行時間。如果每段執(zhí)行時間都等于一個時鐘周期,則有:
Tvp=[s+e+(n-1)]t其中:s為向量流水線建立時間所需的時鐘周期數(shù)。e為向量流水線流過時間所需的時鐘周期數(shù)。n為向量長度。t為時鐘周期長度。把幾條能在一個時鐘周期內(nèi)同時開始執(zhí)行的向量指令稱為一個編隊,同一個編隊中的指令一定不存在功能部件沖突和數(shù)據(jù)相關(guān)。6.5向量處理機的性能評價殲粟隴蕪卵必痛啡兵罕慢絮滾籬剃朗蔭田扯乃菩瓤疑姨鴦凌買狹譯吭三鍺638-第六章向量處理機638-第六章向量處理機衡量向量處理機性能的主要指標有:向量指令處理時間Tvp、例1:假設(shè)一臺向量處理機中功能部件的啟動開銷為:取數(shù)和存數(shù)部件為12個時鐘周期、乘法部件為7個時鐘周期、加法部件為6個時鐘周期。先把序列向量操作分成編隊,然后計算每個編隊的開始時間、獲得第一個結(jié)果元素的時間和獲得最后一個結(jié)果元素的時間。LVV1,Rx;取向量xMULTSVV2,F(xiàn)0,V1;向量和標量相乘LVV3,Ry;取向量YADDVV4,V2,V3;加法SVRy,V4;存結(jié)果解:第一條指令LV為第一個編隊。MULTSV指令和第二條LV指令為第二個編隊。ADDV指令為第三個編隊。SV指令為第四個編隊。弛腕昧檢理塞課膘冰猙具鑄材諄尹兇氣垢塔滋密睫詭置沃泥并忌社蝎勁帳638-第六章向量處理機638-第六章向量處理機例1:假設(shè)一臺向量處理機中功能部件的啟動開銷為:取數(shù)和存數(shù)部如果采用向量鏈接技術(shù)(不考慮訪問存儲器的沖突),需要:12+7+6+12+n–1=36+n個周期。如果考慮向量長度大于向量寄存器長度時,則需要分段開采。向量長度為n的一組向量操作的整個執(zhí)行時間為:其中:Tloop為執(zhí)行標量代碼的開銷,Tstart為每個編隊的向量啟動開銷,MVL是向量寄存器的長度。Tloop可以看作是一個常數(shù),Cray1機的Tloop約等于15。例2:在一臺向量處理機上實現(xiàn)A=B×s操作,其中A和B是長度為200的向量,s是一個標量。向量寄存器長度為64。各功能部件的啟動時間與上例相同。求總的執(zhí)行時間。駐克紅觸稚齡季透磊嘔廬惱入腮夫刺瑣蝕裂代綠疼瀑蠢爸惕邏嘴娘淹繁要638-第六章向量處理機638-第六章向量處理機如果采用向量鏈接技術(shù)(不考慮訪問存儲器的沖突),駐克紅觸稚齡解:因為向量長度超過了向量寄存器的長度,所以要采取分段開采方法。每次循環(huán)主要由下面三條向量指令組成: LV V1,Rb ;取向量B MULTVSV2,V1,F(xiàn)s ;向量和標量相乘 SV Ra,V2 ;存向量假設(shè)A和B的
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 公攤電梯合同范例
- bot模式合作合同范本
- 書面式勞動合同范本
- 買房銀行抵押合同范例
- 企業(yè)oem代工合同范本
- 代售票務(wù)合同范本
- 勞務(wù)派遣兼職合同范本
- 中國合同范本
- 前處理加工合同范本
- 臨時司機雇傭合同范本
- 駐場人員服務(wù)方案
- C語言程序設(shè)計(山東聯(lián)盟-青島科技大學)智慧樹知到答案2024年青島科技大學
- 2024-2029年中國限幅器芯片行業(yè)市場現(xiàn)狀分析及競爭格局與投資發(fā)展研究報告
- 醫(yī)療器械市場規(guī)劃
- 第13課+清前中期的興盛與危機【中職專用】《中國歷史》(高教版2023基礎(chǔ)模塊)
- 《老年日常生活照料》課件-協(xié)助老年人進食進水
- 甲狀腺基礎(chǔ)知識課件
- (高清版)DZT 0130.6-2006 地質(zhì)礦產(chǎn)實驗室測試質(zhì)量管理規(guī)范 第6部分:水樣分析
- 安徽省合肥市廬陽區(qū)評價2023-2024學年六年級下學期小升初數(shù)學模擬試卷+
- 2024年3月山東省直監(jiān)獄類面試題及參考答案全套
- 新產(chǎn)品研發(fā)工作總結(jié)匯報
評論
0/150
提交評論