




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
GPU加速的SPICE仿真提升了模擬IC設(shè)計電路發(fā)明取得的進步使智能手機和上網(wǎng)本等設(shè)備的生產(chǎn)成為可能。然而,業(yè)內(nèi)專家堅信,需要更多突破才能滿足處理更大電路、更高精度和更快周轉(zhuǎn)時間的需求。他們認為這是電路制造未來的前進方向。自1970年代初推出以來,具有集成電路重點的仿真程序(SPICE)已成為晶體管級電路仿真不可或缺的工具。多年來,已經(jīng)推出了許多SPICE模擬器,并且它們的功能得到了很大的提高。然而,隨著對更深亞微米設(shè)計的改進和電路尺寸的增加,當(dāng)前SPICE仿真器的能力被認為是不夠的。給定一個描述電路拓撲的網(wǎng)表,SPICE仿真作業(yè)由幾個主要任務(wù)組成。網(wǎng)表解析和建庫通常是按順序進行的。然后模擬器可以使用并行處理技術(shù),例如多核和多線程,來加速計算直流(DC)工作點和瞬態(tài)分析的任務(wù)。模型評估是另一項可以輕松并行化的任務(wù),盡管它通常只占總仿真時間的一小部分。所有現(xiàn)代SPICE模擬器都使用并行處理來加速,但它們使用的技術(shù)不同,并且可能導(dǎo)致容量和性能大不相同。EmpyreanALPS?,全稱AccurateLarge-capacityParallelSpice,是一款并行SPICE仿真器,采用先進的分區(qū)和突破性技術(shù)進行矩陣求解,與市場上其他SPICE仿真器相比,具有最佳的容量和性能。九霄軟件EmpyreanALPS?EmpyreanALPS?使用的主要技術(shù)解釋如下。對于給定的電路,ALPS首先使用超圖劃分方法將其劃分為重疊塊。然后,使用BDF(后向微分公式)方法對微分代數(shù)方程組進行離散化。對于每個塊,內(nèi)部矩陣通常非常稀疏,其中LU分解是一種非常有效的解決方法,也適合應(yīng)用并行化技術(shù)。塊耦合節(jié)點的矩陣通常是密集的,其中廣義最小殘差法(GMRES)是最有效的方法。然而,GMRES方法的一個主要缺陷是它需要一個有效的前置條件矩陣。否則它將非常緩慢地收斂或根本無法收斂。選擇一個好的前置條件矩陣并不容易,即使有一個好的前置條件矩陣,也往往需要多次迭代才能成功求解方程。ALPS的一個突破是我們開發(fā)了新技術(shù),不僅可以得到一個有效的前置條件矩陣,而且在大多數(shù)情況下可以使GMRES快速收斂,從而大大減少了求解方程的時間。算法:GMRES–帶有(右)預(yù)處理ALPS的容量和性能使其適用于模擬大型布局后電路。對于此類電路,與其他真正的SPICE仿真器相比,ALPS通常會獲得2-3倍的加速。迄今為止,ALPS在全球擁有數(shù)百名付費客戶。EmpyreanALPS-GT?除了使用多個中央處理器(CPU)內(nèi)核來加速電路仿真之外,使用圖形處理器(GPU)是通過硬件加速進一步加速仿真的另一種方式。對于矩陣求解等任務(wù),這通常是整個仿真過程中的瓶頸,如果我們能夠使用多個GPU有效地完成它,可以獲得非常顯著的加速。然而,GPU上的矩陣求解是一項具有挑戰(zhàn)性的任務(wù),許多SPICE模擬器都嘗試過但都失敗了。以Gilbert-Peierls左視算法為例,它需要將稀疏向量縮放為密集向量,因此需要大緩存。LU分解求解器也需要大緩存。但通常GPU上的緩存大小比CPU上的小得多,因此我們需要特殊的技術(shù)來在GPU上執(zhí)行這些任務(wù),而不受緩存大小和數(shù)據(jù)傳輸開銷的限制。EmpyreanSoftware開發(fā)了許多創(chuàng)新技術(shù),通過使用多個GPU來加速ALPS,并且該公司在2019DAC中發(fā)布了EmpyreanALPS-GT?。下圖說明了一種結(jié)合左視和右視算法以加快矩陣求解的技術(shù)。圖1:U矩陣拓撲排序的依賴樹生成下三角替換作業(yè)筆記:下一級的工作必須等到上一級的工作完成級別1和級別2都有四個并行作業(yè)可以從極稀疏的矩陣中生成大量的左視作業(yè)使用左視方法處理大量并行作業(yè)第3級到第7級只有一個可執(zhí)行作業(yè)矩陣將相對密集,模式節(jié)點被消除由于依賴樹,大多數(shù)左查找作業(yè)將連續(xù)執(zhí)行使用右查找方法為近乎密集的矩陣生成更多并行可執(zhí)行作業(yè)基準(zhǔn)EmpyreanALPS-GT?已被一些頂級SoC設(shè)計公司采用,并顯示出顯著的加速效果,尤其是在16/7/5nm工藝技術(shù)中的深亞微米模擬設(shè)計。在Nvidia的工程團隊[1]最近進行的比較中,正在使用具有2*IntelXeonE5-2698V420核CPU和8*NvidiaTeslaV100GPU的NvidiaDGX-1服務(wù)器。
模擬器中央處理器圖形處理器加速配置EmpyreanALPS?XeonE5-2698V4雙20核IntelXeon
8個CPUEmpyreanALPS-GT?XeonE5-2698V4雙20核IntelXeon英偉達特斯拉V1008個CPU+8個GPU
表1:模擬器數(shù)據(jù)在硬件平臺上使用ALPS和ALPS-GT模擬了幾個布局后設(shè)計塊。下面顯示的是代表整體比較的兩個塊的結(jié)果。圖2:性能比較案例1圖3:性能比較案例2結(jié)論EmpyreanALPS-GT?是第一款由GPU驅(qū)動的商用SPICE模擬器。當(dāng)瞬態(tài)分析和矩陣求解時間占總運行時間時,它可以大大提高仿真性能,這通常是許多大型和布局后電路的情
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 果桑綠色高效栽培技術(shù)
- 淮北地區(qū)耕地質(zhì)量與小麥玉米周年產(chǎn)能協(xié)同提升技術(shù)
- 主要農(nóng)作物化學(xué)農(nóng)藥減量增效技術(shù)
- 生物信息學(xué)的發(fā)展與應(yīng)用前景試題及答案
- 關(guān)鍵考點:2024年CPMM試題及答案
- 2025重癥醫(yī)學(xué)科的血小板減少癥診斷和管理
- 高效學(xué)習(xí)的方法論CPMM試題及答案
- 突圍方案2024年國際物流師試題與答案
- 餐飲美學(xué)基礎(chǔ) 課件 2.2色彩審美
- 考點24電化學(xué)原理的綜合應(yīng)用(核心考點精講精練)-備戰(zhàn)2025年高考化學(xué)一輪復(fù)習(xí)考點幫(新高考)(原卷版)
- 數(shù)學(xué)-廣東省廣州市2025屆高三一模試題和解析
- 2025-2030中國供熱行業(yè)發(fā)展前景及發(fā)展策略與投資風(fēng)險研究報告
- 2025年天津公安警官職業(yè)學(xué)院單招職業(yè)技能測試題庫匯編
- 浙江省精誠聯(lián)盟2024-2025學(xué)年高二下學(xué)期3月月考英語試題(原卷版+解析版)
- 民警進小學(xué)校園安全知識
- 2025屆黑龍江龍東高中十校聯(lián)盟高三下學(xué)期2月適應(yīng)性考試物理試題及答案
- 四川省南充市順慶區(qū)南充高級中學(xué)2024-2025學(xué)年高二下學(xué)期開學(xué)英語試題(原卷版+解析版)
- 2025年廣東省中考模擬數(shù)學(xué)試卷試題及答案詳解
- 肺術(shù)后患者護理查房
- 公安機關(guān)校園安全課程
- 飛行營地項目可行性研究報告
評論
0/150
提交評論