




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、 并行粒子模擬程序 粒子模擬 粒子在空面中運動,而電場和電荷電流密度等物理量分配在網(wǎng)格點上。一般的計算步驟如下:首先根據(jù)粒子所在的具體位置求得其對周圍網(wǎng)格點的電荷貢獻,當(dāng)所有粒子的貢獻相加后即得到網(wǎng)格的電荷密度和電流密度,然后求解Maxwell方程即得網(wǎng)格點上的電磁場,再通過插值得到離子和電子處的電磁場,粒子在Lorentz力的作用下運動。不斷循環(huán)以上過程,即可求解物理問題。 粒子模擬的并行化 實現(xiàn)粒子模擬的并行化主要有兩種常用的設(shè)計思想,第一種是將粒子數(shù)均勻的分配到各個CPU上,而將與網(wǎng)格有關(guān)的量存儲到所有的CPU上。另一種并行方法是將整個計算區(qū)域劃分成幾個區(qū)域,初始時盡量讓每個區(qū)域中的粒子
2、數(shù)相同,與每個區(qū)域有關(guān)的電磁場的量和粒子的量存儲在同一個CPU上。 第一種算法適合在節(jié)點少但單節(jié)點性能較高的并行環(huán)境,第二種則適合在具有一定數(shù)量CPU的并行計算。根據(jù)目前我們具有的并行環(huán)境(16臺100 以太網(wǎng)連接的Pentium III 1.6GHz組建的cluster),采用了第二種算法設(shè)計并行程序。 在作并行計算時,將整個計算空間劃分為如圖(圖中以4個為例)所示數(shù)個平行的區(qū)域,這樣把不同區(qū)域的場和粒子分配到不同的處理器上。當(dāng)粒子經(jīng)過場加速后由某一個區(qū)域進入到另外一個區(qū)域時,粒子將相應(yīng)地轉(zhuǎn)交給另一區(qū)域的處理器處理。 并行處理的網(wǎng)格和粒子分區(qū)示意圖 圖 2 PIC粒子模擬程序算法結(jié)構(gòu)圖 除將
3、粒子速度位置等數(shù)據(jù)進行初始化外,由推動粒子,粒子管理、分配電流、電流管理、場的求解、場的管理等六個部分組成,具體描述如下: (1) 推動粒子:每個計算節(jié)點同時推動自己區(qū)域內(nèi)的粒子,由于粒子的電磁場是通過插值網(wǎng)格點處的電磁場得到的,所以不同計算節(jié)點交界處粒子需要用到相鄰計算節(jié)點公共網(wǎng)格點的電磁場。 (2) 粒子管理:部分粒子經(jīng)過場加速后由某一個區(qū)域進入到另外一個區(qū)域時,粒子將相應(yīng)地轉(zhuǎn)交給另一區(qū)域的處理器處理。 (3) 分配電流:粒子電流被分配到相應(yīng)區(qū)域的網(wǎng)格點上。 (4)電流管理:由于在某個區(qū)域中,在上一步中只能將本區(qū)域中的粒子電流分配到網(wǎng)格點上,因此邊界附近網(wǎng)格點處得到的電流是不全面的,需要將
4、上面或下面區(qū)域公共網(wǎng)格上的電流和它疊加得到全面的電流。 (5)計算電磁場:求解每個計算節(jié)點內(nèi)部格點上的Maxwell方程,得到內(nèi)部網(wǎng)格點上的電磁場。 (6) 電磁場處理:將區(qū)域上下邊界處網(wǎng)格點上的電磁場分別傳送給上面和下面區(qū)域的交界網(wǎng)格上。 性能分析 我們的微機機群由16個有Intel Pentium III 1.6 GHz CPU和128Mbyte內(nèi)存的微機通過100Mb/s的以太網(wǎng)連接而成,操作系統(tǒng)為在Redhat Linux版本7.2,F(xiàn)ortran編譯器為pgf77,并行化程序通過MPICH實現(xiàn)。 我們分別在不同數(shù)目的計算節(jié)點上運行此并行程序,測量了它的加速比(S= )和并行效率(E=
5、 ) 我們從兩個方面對二維并行粒子模擬程序進行了性能分析:一是對某一特定物理問題用不同數(shù)目計算節(jié)點運算,測量其加速比和并行效率;二是對不同的物理問題用相同的計算節(jié)點運算測量其加速比和并行效率。 表中是固定網(wǎng)格數(shù)12864,粒子數(shù)73728時用不同的計算節(jié)點運算時測得的加速比和并行效率,程序的運行步數(shù)是2500。 計算節(jié)點數(shù) 運行時間(秒) 加速比 并行效率11532.291.00-2756.332.03102%4398.09 3.8596%8214.857.1389%16163.619.3759%表 用不同數(shù)目的計算節(jié)點計算同一問題時的加速比和并行效率 網(wǎng)格數(shù)運行時間(秒)加速比并行效率32*
6、3238.155.2065%64*3264.625.9274%64*64112.836.9387%128*64214.857.1389%128*128408.227.6996%表 2 8個cpu計算不同工作量的問題時的加速比和并行效率 由以上兩個表格可以看出:對同一規(guī)模的物理問題,加速比在計算節(jié)點數(shù)較少時隨計算節(jié)點數(shù)基本上是線性增加的,但隨節(jié)點數(shù)增加這種增加趨勢會變緩,所以并行效率變低,16個計算節(jié)點時候的并行效率明顯偏低。同時計算節(jié)點數(shù)一定時增加問題的規(guī)模,加速比會提高,同樣并行效率隨之提高。當(dāng)處理規(guī)模比較大的問題時用并行計算可以顯著提高效率,而且問題規(guī)模越大,這個作用越明顯。4. 算例:束流不穩(wěn)定性我們計算的物理問題是等離子體中的束流不穩(wěn)定性,束流和背景等離子體分別包括了質(zhì)子和電子,它們的速度滿足Maxwell分布,其中束流密度占總密度的1.5%,束流相對于背景等離子體的速度為10VA。 5. 小結(jié) 我們用MPI對程序?qū)崿F(xiàn)了并行化并運行在cluster上,最多CPU數(shù)為16個,取得了不錯
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 東城區(qū)節(jié)能供暖合同范例
- 公租房續(xù)審合同范例
- 兄弟間合作建房合同范例
- 買墓地合同范例
- 鄉(xiāng)鎮(zhèn)蔬菜收購合同范例
- 企業(yè)咨詢策劃合同范例
- 供用煤氣合同范例
- 井巷工程施工合同范例
- 入駐農(nóng)莊合同范例
- 代購合同和購買合同范例
- C小學(xué)一起諾如病毒胃腸炎疫情的調(diào)查與處置課件
- 2025年鎵礦采選項目投資可行性研究分析報告
- 歐泰科-吊掛軟件使用教程
- 公安局網(wǎng)安大隊工作總結(jié)
- 2025年裝備制造創(chuàng)新中心北京石油機械有限公司招聘筆試參考題庫附帶答案詳解
- 教科版六年級下冊科學(xué)全冊教學(xué)設(shè)計教案
- 2025年哈爾濱鐵道職業(yè)技術(shù)學(xué)院高職單招高職單招英語2016-2024年參考題庫含答案解析
- 病理學(xué)與病理生理學(xué)考試題
- 《政協(xié)提案學(xué)習(xí)講座》課件
- 年鏈家房屋租賃合同范本
- GB/T 41869.4-2024光學(xué)和光子學(xué)微透鏡陣列第4部分:幾何特性測試方法
評論
0/150
提交評論