版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
多核處理器體系結(jié)構(gòu)及并行程序設(shè)計(jì)天津大學(xué)于策yuce_air@1編輯pptOutline多核處理器簡介并行程序設(shè)計(jì)方法學(xué)(PCAM)科研及技術(shù)(天津大學(xué)SRDC及IBM技術(shù)中心)2編輯pptOutline多核處理器簡介并行程序設(shè)計(jì)方法學(xué)(PCAM)科研及技術(shù)(天津大學(xué)SRDC及IBM技術(shù)中心)3編輯ppt什么是多核處理器?兩個(gè)或多個(gè)獨(dú)立運(yùn)行的內(nèi)核集成于同一個(gè)處理器上面雙核處理器=一個(gè)處理器上包含2個(gè)內(nèi)核多核處理器=一個(gè)處理器上包含2個(gè)或多個(gè)內(nèi)核Core0Core1FrontSideBus4編輯ppt為什么要采用多核技術(shù)?5編輯ppt最終目標(biāo):提升用戶的體驗(yàn)?zāi)柖伞粩喟l(fā)展和改進(jìn)處理器的性能最大限度地利用越來越多的晶體管實(shí)現(xiàn)最優(yōu)的價(jià)值縮減處理時(shí)間,提高計(jì)算能力開發(fā)平臺的新特性和新功能6編輯ppt通過并行方式改進(jìn)處理器的性能2005+Dual-andMulti-core2-waySMPsystem4Cores>4Threads2001Hyper-Threading2-waySMPsystem2Cores4Threads1995Multi-processing2-waySMPsystem2Cores2Threads7編輯ppt多核技術(shù)的發(fā)展CacheExecutionStateStateBusCacheExecutionStateBusCacheExecutionStateBusCacheExecutionStateBusCacheExecutionStateBusPentium4withHTDualXeonProcessorsDualCore2Threads1Package2Threads2Packages2Threads1PackageTwoindependentexecutioncoresinthesameprocessor8編輯ppt幾種不同的技術(shù)HT–HyperThreading:
2threadsrunningonthesameprocessorcore處理器上的某些資源會被共享使用相同的緩存和運(yùn)算器DC–DualCore:
2executioncoresinthesameprocessorpackage共享系統(tǒng)總線與雙處理器的性能相同DP/MP–Dual/Multi-Processing:
2ormoreprocessorsinthesamesystem只共享系統(tǒng)總線,獨(dú)立緩存高性能,資源沖突少9編輯ppt雙核技術(shù)VS.超線程技術(shù)雙核是真正意義上的雙處理器不會發(fā)生資源沖突每個(gè)線程擁有自己的緩存、寄存器和運(yùn)算器一個(gè)3.2GHzSmithfiled在性能上并非等同于3.2GHzP4withHT的2倍HT使處理器的性能至少提升了1/3雙核的性能相當(dāng)于2塊non-HT處理器雙核技術(shù)與HT技術(shù)在性能上的對比Ex1:兩個(gè)floatingpoint線程(Smithfieldclient)每個(gè)線程擁有自己的FPU,沒有資源沖突盡管性能上沒有提升太多,但仍然優(yōu)于HTEx2:一個(gè)integer線程與一個(gè)floatingpoint線程性能大幅度提升沒有資源沖突10編輯pptSinglecore,WithHT(Eg.Pentium4ProcessorWithHT)IntegerandFloatingPointThreadsL2CacheandControlL2CacheandControlL1D-CacheandD-TLBSchedulersIntegerTraceCacheRename/AllocuopQueuesBTBuCodeROM33DecoderBTB&I-TLBFloatingPoint2threadscanbeexecutedatthesametime(perprocessor)ifthey’renotcompetingforthesameexecutionresource11編輯pptSinglecore,WithHT(Eg.Pentium4ProcessorwithHT)TwoFloatingPointThreadsL2CacheandControlL2CacheandControlL1D-CacheandD-TLBSchedulersIntegerTraceCacheRename/AllocuopQueuesBTBuCodeROM33DecoderBTB&I-TLBFloatingPoint2threadsCANNOTbeexecutedatthesametime(perprocessor)ifthey’recompetingforthesameexecutionresource(eg.2floatingpointthreadsinaP4Parchitecture)12編輯pptDualcore,WithoutHT(Eg.PentiumDProcessor)TwoFloatingPointThreadsL2CacheandControlL2CacheandControlL1D-CacheandD-TLBSchedulersIntegerTraceCacheRename/AllocuopQueuesBTBuCodeROM33DecoderBTB&I-TLBFloatingPointL2CacheandControlL2CacheandControlL1D-CacheandD-TLBSchedulersIntegerTraceCacheRename/AllocuopQueuesBTBuCodeROM33DecoderBTB&I-TLBFloatingPointEven2floatingpointthreadscanbeexecutedatthesametimenow(perprocessor)astherearemultiplefloatingpointexecutionunits13編輯pptDualcore,WithHT(Eg.DualCorePentiumProcessorExtremeEdition)SupportsHTMultipleIntegerandFloatingPointThreadsL2CacheandControlL2CacheandControlL1D-CacheandD-TLBSchedulersIntegerTraceCacheRename/AllocuopQueuesBTBuCodeROM33DecoderBTB&I-TLBFloatingPointL2CacheandControlL2CacheandControlL1D-CacheandD-TLBSchedulersIntegerTraceCacheRename/AllocuopQueuesBTBuCodeROM33DecoderBTB&I-TLBFloatingPointWithdualcore&HTtogether,maximum#ofthreadsthatcanbeexecutedatatimeis4perprocessor14編輯ppt多核技術(shù)與超線程技術(shù)的結(jié)合產(chǎn)量…多功能…功效Core0Core1FrontSideBusDualCorewithHyper-Threading4threads/socket
Core0Core1FrontSideBusDualCore2threads/socket
15編輯pptAMD與Intel雙核架構(gòu)的對比AMDOpteron雙核架構(gòu)示意圖
Intel奔騰至尊版雙核架構(gòu)示意圖
16編輯ppt多核面臨的困難如何計(jì)算軟件授權(quán)?按CPU個(gè)數(shù)收取軟件授權(quán)費(fèi)用按芯片個(gè)數(shù)收取軟件授權(quán)費(fèi)用應(yīng)用軟件是否支持?如果應(yīng)用程序是基于多處理器編寫的如果應(yīng)用程序是基于單處理器編寫的雙核發(fā)熱大,散熱是難題17編輯pptDualCore、SMP、Cluster
體系結(jié)構(gòu)特性SMP(對稱多處理機(jī))Cluster(集群)DualCore處理器單一主機(jī),多個(gè)處理器多臺主機(jī),有各自的處理器(一或多)單一主機(jī),單一處理器,多個(gè)核心操作系統(tǒng)單一多個(gè)單一主要并行計(jì)算方式多進(jìn)程,內(nèi)存共享多進(jìn)程,基于消息傳遞多線程18編輯pptOutline多核處理器簡介并行程序設(shè)計(jì)方法學(xué)(PCAM)科研及技術(shù)(天津大學(xué)SRDC及IBM技術(shù)中心)19編輯pptPCAM設(shè)計(jì)方法學(xué)劃分(Partitioning)通訊(Communication)組合(Agglomeration)映射(Mapping)20編輯pptPCAM設(shè)計(jì)方法學(xué)設(shè)計(jì)并行算法的四個(gè)階段劃分(Partitioning)通訊(Communication)組合(Agglomeration)映射(Mapping)劃分:分解成小的任務(wù),開拓并發(fā)性;通訊:確定諸任務(wù)間的數(shù)據(jù)交換,監(jiān)測劃分的合理性;組合:依據(jù)任務(wù)的局部性,組合成更大的任務(wù);映射:將每個(gè)任務(wù)分配到處理器上,提高算法的性能。21編輯pptPCAM設(shè)計(jì)過程22編輯ppt域分解劃分的對象是數(shù)據(jù),可以是算法的輸入數(shù)據(jù)、中間處理數(shù)據(jù)和輸出數(shù)據(jù);將數(shù)據(jù)分解成大致相等的小數(shù)據(jù)片;劃分時(shí)考慮數(shù)據(jù)上的相應(yīng)操作;如果一個(gè)任務(wù)需要?jiǎng)e的任務(wù)中的數(shù)據(jù),則會產(chǎn)生任務(wù)間的通訊;23編輯ppt域分解示例:三維網(wǎng)格的域分解,各格點(diǎn)上計(jì)算都是重復(fù)的。下圖是三種分解方法:24編輯ppt功能分解劃分的對象是計(jì)算,將計(jì)算劃分為不同的任務(wù),其出發(fā)點(diǎn)不同于域分解;劃分后,研究不同任務(wù)所需的數(shù)據(jù)。如果這些數(shù)據(jù)不相交的,則劃分是成功的;如果數(shù)據(jù)有相當(dāng)?shù)闹丿B,意味著要重新進(jìn)行域分解和功能分解;功能分解是一種更深層次的分解。25編輯ppt劃分判據(jù)劃分是否具有靈活性?劃分是否避免了冗余計(jì)算和存儲?劃分任務(wù)尺寸是否大致相當(dāng)?任務(wù)數(shù)與問題尺寸是否成比例?功能分解是一種更深層次的分解,是否合理?26編輯ppt通訊通訊是PCAM設(shè)計(jì)過程的重要階段;劃分產(chǎn)生的諸任務(wù),一般不能完全獨(dú)立執(zhí)行,需要在任務(wù)間進(jìn)行數(shù)據(jù)交流;從而產(chǎn)生了通訊;功能分解確定了諸任務(wù)之間的數(shù)據(jù)流;諸任務(wù)是并發(fā)執(zhí)行的,通訊則限制了這種并發(fā)性;27編輯ppt通訊判據(jù)所有任務(wù)是否執(zhí)行大致相當(dāng)?shù)耐ㄓ?是否盡可能的局部通訊?通訊操作是否能并行執(zhí)行?同步任務(wù)的計(jì)算能否并行執(zhí)行?28編輯ppt組合組合是由抽象到具體的過程,是將組合的任務(wù)能在一類并行機(jī)上有效的執(zhí)行;合并小尺寸任務(wù),減少任務(wù)數(shù)。如果任務(wù)數(shù)恰好等于處理器數(shù),則也完成了映射過程;通過增加任務(wù)的粒度和重復(fù)計(jì)算,可以減少通訊成本;保持映射和擴(kuò)展的靈活性,降低軟件工程成本;29編輯ppt組合判據(jù)增加粒度是否減少了通訊成本?重復(fù)計(jì)算是否已權(quán)衡了其得益?是否保持了靈活性和可擴(kuò)放性?組合的任務(wù)數(shù)是否與問題尺寸成比例?是否保持了類似的計(jì)算和通訊?有沒有減少并行執(zhí)行的機(jī)會?30編輯ppt映射每個(gè)任務(wù)要映射到具體的處理器,定位到運(yùn)行機(jī)器上;任務(wù)數(shù)大于處理器數(shù)時(shí),存在負(fù)載平衡和任務(wù)調(diào)度問題;映射的目標(biāo):減少算法的執(zhí)行時(shí)間并發(fā)的任務(wù)不同的處理器任務(wù)之間存在高通訊的同一處理器映射實(shí)際是一種權(quán)衡,屬于NP完全問題31編輯ppt映射判據(jù)采用集中式負(fù)載平衡方案,是否存在通訊瓶頸?采用動態(tài)負(fù)載平衡方案,調(diào)度策略的成本如何?32編輯pptOutline多核處理器簡介并行程序設(shè)計(jì)方法學(xué)(PCAM)科研及技術(shù)(天津大學(xué)SRDC及IBM技術(shù)中心)33編輯ppt技術(shù)力量天津大學(xué)IBM新技術(shù)中心()共享大學(xué)研究(SUR)軟件技術(shù)培訓(xùn)Lotu
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 裝載機(jī)用車合同(2篇)
- 第24課《愚公移山》八年級語文上冊精講同步課堂(統(tǒng)編版)
- 2024年吉林省長春市中考地理真題卷及答案解析
- 16.1《赤壁賦》-高一語文上學(xué)期同步備課拓展(統(tǒng)編版必修上冊)
- 說課稿課件政治
- 西京學(xué)院《現(xiàn)代教育技術(shù)》2023-2024學(xué)年第一學(xué)期期末試卷
- 西京學(xué)院《企業(yè)級框架基礎(chǔ)》2021-2022學(xué)年期末試卷
- 社區(qū)環(huán)境 課件
- 外研版必修一module2-mynewteachers(reading)課件
- 西華師范大學(xué)《裝飾繪畫》2022-2023學(xué)年第一學(xué)期期末試卷
- GB/T 17892-2024優(yōu)質(zhì)小麥
- 2024-2025學(xué)年七年級上學(xué)期期中考試英語試題
- 調(diào)酒初級基礎(chǔ)理論知識單選題100道及答案解析
- 第5課用發(fā)展的觀點(diǎn)看問題2023-2024學(xué)年中職高教版2023哲學(xué)與人生
- 危廢治理項(xiàng)目經(jīng)驗(yàn)-危廢治理案例分析
- 南京市2024-2025學(xué)年六年級上學(xué)期11月期中調(diào)研數(shù)學(xué)試卷二(有答案)
- 2021大學(xué)生個(gè)人職業(yè)生涯規(guī)劃書6篇
- 汽車防凍液中毒
- 粉條產(chǎn)品購銷合同模板
- 2024至2030年中國自動車配件行業(yè)投資前景及策略咨詢研究報(bào)告
- 2024-2030年中國蔗糖行業(yè)市場深度調(diào)研及發(fā)展趨勢與投資前景研究報(bào)告
評論
0/150
提交評論