用于結構層動態(tài)熱量管理的快速熱仿真_第1頁
用于結構層動態(tài)熱量管理的快速熱仿真_第2頁
用于結構層動態(tài)熱量管理的快速熱仿真_第3頁
用于結構層動態(tài)熱量管理的快速熱仿真_第4頁
用于結構層動態(tài)熱量管理的快速熱仿真_第5頁
已閱讀5頁,還剩11頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、用于結構層助意熱量管理的恢速熱仿専摘要:由于功耗密度呈指數增長,采用動態(tài)熱量管理的工作溫度的實時調節(jié)成為必須。本文 提出了一種新穎的用于高效動態(tài)熱量管理的芯片結構層熱量分析方法。我們的新方法是基于 以下觀測資料:微處理器在標準工作負載下運行時的結構層模型的功耗呈現很強的自然周期 性??梢岳眠@一特征用頻域譜分析來計算穩(wěn)態(tài)響應。采用了數字穩(wěn)態(tài)瞬態(tài)匹配算法以得到 由初始條件和恒定功率輸入引起的瞬態(tài)溫度變化??偟乃矐B(tài)響應是兩次仿真結果之和。采用 快速熱量分析算法相比傳統(tǒng)的綜合基礎瞬態(tài)分析速度提高了 10倍一100倍而僅僅有少量的 精度損失。1.簡介隨著當今ic技術進入納米時代,非常高的封裝密度和工作

2、頻率將會導致功率密度的急劇 增長。指數級的功率密度增長則相應地導致平均片上溫度快速升高。此外,局部的熱點處, 有著比平均水平高的多的功率密度,造成了更高的局部溫度。高溫對于芯片的性能和可靠性有著明顯的不利影響。過高的片上溫度會導致傳輸速度降 低、漏電流功耗增大、互連電阻增大,并且可靠性降低。有理市相信如今的髙性能微處理器 和嵌入式系統(tǒng)非常需要由動態(tài)熱量管理(dtm)來即時地調節(jié)片上溫度,參考文獻3,12。dtm的基本思路是通過一系列方法,諸如活躍點轉移、局部掛起、動態(tài)電壓頻率縮放, 參考文獻3,12,來動態(tài)地降低芯片中一些過熱單元的溫度。熱量模型和dtm仿真的一個關 鍵問題是通過芯片結構級的d

3、tm技術來高效地計算由于功耗不同引起的溫度變化。先前許多研允工作把注意力集中到電路級或者門級的熱量模型和仿真。由于電路級或門 級大量的熱量器件和功耗源,提出了不同的方案來提高熱量電路仿真的效率,主要可以分為 兩類:笫一種方法是基于離散差分算子(偏微分方法)或者the field quality(限定變量方法)。參 考文獻16,15所示,整個芯片被離散化,差分方程表示的熱量傳輸方程用偏微分或限定變量 法解出。這些方法的主要困難是由大量網絡造成的數量巨大熱量電流的結果。還提出了一些 不同的技術來解決如此巨大數量的的熱量電流,例如參考文獻16中的adi,和參考文獻15 中的模型規(guī)則簡化。第二種方法是

4、基于格林函數的方法,參考文獻14,17,和上面的方法相 比由于簡化了熱量問題的雙空間模型,這一方法提供了一種快速的降低精度的熱量仿真。盡管己經提出了很多電路級或門級熱量分析的有效算法,但是還是很少有人關注芯片結 構級的熱量模型和仿真。在設計時結構級的熱行為無法在電路級或門級看到,因為不同的負 載會產生不同的熱量效果。在結構級釆用dtm的好處時由于它可以捕捉程序運行時的狀態(tài), 并且快速地在程序內部或者跨程序適應不同的特征。此外,最近的研究表明結構級的熱量管理在最壞的情況下,參考文獻12,13,5,可以僅 以微小的性能降低為代價而顯著減少封裝的代價。一種名為hotspot的結構級熱量建模和仿 真工

5、具被開發(fā)來給標準版圖程序開拓和研究調節(jié)微處理器運行溫度的不同的dtm技術。 hotspot提供了一種精確的結構級熱量模型,它基于與微結構塊和封裝各個基本方面相關的 熱電阻和電容的等效熱電流。各個部分溫度由功率仿真產生的功耗得到。然而,hotspot評估不同dtm技術的功效依賴于整個程序運行過程中瞬態(tài)熱量仿真執(zhí)行 的時間。hotspot對熱量行為建模所依靠的等效熱量電路由熱電阻和電容組成。它在每個運 行時間片使用常規(guī)的積分基礎瞬態(tài)仿真進行計算以獲得全部的溫度概況。當一個程序導入到 hotspot時,它的初始的功耗由常規(guī)間隔得出。然后,由最后時間片和前兒個時間片的溫度 計算每個吋|'可片的

6、溫度。為了得到任意一個確定吋間下的該程序溫度,都必須所有之前吋間 點的溫度值,因為每一個時間點都依賴于它前面的時間點。由于現在的版圖程序一般都有上百億甚至上千億的語句,這個算法需要很氏的仿真時間(數周)。因此,需要一個更快并且 精確的瞬態(tài)仿真技術來有效地設計和優(yōu)化芯片結構級溫度測量。在本文中,我們?yōu)閯討B(tài)熱量管理提出了一種在結構級的快速暫態(tài)熱量仿真算法。我們是 從近來關于程序長時間運行行為的發(fā)現得到啟發(fā)。大多數程序的行為并不是隨機的,實際上 rti于循環(huán)和塊的存在而表現出很強的周期性,參考文獻9, 11, 10。許多程序在不同的時 間執(zhí)行不同的塊,這一系列塊表現岀特定程序特征,每一個可能與其他塊

7、完全不同,而各自 乂有非常相似的周期性表現。這也同樣反映了各個運算單元輸出功耗的周期特性?!緢D1】 的快照是spec cpu 2000芯片組內部寄存器運行l(wèi)ucas程序14個周期內的典型的功率曲線。 每個周期包括了20萬個指令周期內得到的20個功率值。這條曲線是由3ghz處理器仿真得到 的,因此,每個周期等于0.26ms,整個曲線代表程序運行的3.6ms。我們可以看出,即便在 這么短的時間內也有非常強的周期性。?-lucas程序中的整型寄存器周期性功耗曲線圖1: lucas程序中的整型寄存器周期性功耗曲線本文研究了許多結構級熱量模型的周期性功率曲線來加快暫態(tài)熱量仿真速度。舉例來 說,大多數的版

8、圖屮,整數寄存器通常是最熱的模塊13。我們所提出的新算法是基于以下 事實:線性熱量系統(tǒng)的瞬時值是零輸入自由響應和零狀態(tài)強迫響應之和。我們采用了兩種有 效的算法來計算這兩種響應:(1)對于周期性的輸入,采用頻域譜分析來計算穩(wěn)態(tài)響應;(2)對于暫態(tài)的溫度變化,考慮初始狀態(tài)和開始時的直流輸入值,采用瞬態(tài)匹配技術。市 于分析完全是在頻率域下進行的,系統(tǒng)暫態(tài)響應的計算結果是用時域閉式表達式,因此運行 的時i'可得到重大改善。本文接下來的內容包括:第二節(jié)主要論述參考文獻13中的結構級建模,以及我們針對 其建模所進行的修正。第三節(jié),闡述了我們的新算法的基礎概念,包括上文所述兩部分,然 后是關于時間效

9、率的理論分析。在第四節(jié)中概述了一下實驗結果并和spice類仿真器作出比 較來驗證我們的方法。第五節(jié)是結論和今后的工作。2.結構級熱量建模一般而言,熱傳導現象由下面的差分方程表示4:其中t(k)是溫度,p(kg/n?)是物質的密度,cp(j/n?k)是特殊熱度,k(w/mk)是熱導 率,g(w/m3)是熱能生成率。由這個差分方程描述的熱流與電流有著類似的形式,它們兩者 z間有著眾所周知的對偶性。流過一個熱電阻的熱流等效于流過它的電流,而溫度差則相當 于電勢差。而熱量被吸收的地方則相當于一個熱電容。在此觀測結果的基礎上,在處理熱流 的吋候可以得到并求解等效的熱量阻容電路。在電路級的熱阻容電路模型屮

10、,大量網格結構被用來分解整個電路結構,用偏微分或者 限定變量法來分解方程(1)。得到的阻容電路結果通常都很龐大。然而,在結構級,由于有 限數量的圖紙設計器件和未知物理特性,相應的阻容模型就十分簡單,而準確地獲取熱電阻 和熱電容對于熱量分析來說則十分關鍵。iiilmaptotqlljifhl問illintaluii-ai.u2fpqldstorrafpfegi-fpregiofpaddifltalusi«a1.u4ihukmbelfkacbelixacbe:曲心l)cacbe4kmttesikacbc5kmtu6dcacbe6dcacbe?圖2: compaq alpha 21364改

11、進結構圖3:最新芯片封裝結構和等效的阻容電路模型在本文中,我們對參看文獻5中的結構級熱量使用了熱量模型的方法,從設計圖紙信 息建立的等效阻容模型,并由其他商業(yè)工具保證具有相當高的精度。對于圖3所示的采用 cbga封裝的新型芯片的散熱器和冷卻系統(tǒng),其中存在兩條主要的熱傳導路徑:硅流片區(qū)產 生的熱量可以散發(fā)到周圍流動空氣,或者傳導到印刷線路板。主要的阻容電路處于硅流片區(qū), 設計圖紙信息用來提供等效的熱電阻和熱電容。我們用的設計圖紙實例如圖2所示。我們所米用的設計圖和參考文獻13屮所米用的設計圖的區(qū)別在于,我們把一些關鍵的運算部件一 諸如整數寄存器(intreg)和浮點寄存器(fdreg)劃分成更具

12、體塊,這樣在運用dtm 時就能從這些重要的熱部件得到更精確的溫度變化量。如圖2所示,兩個相鄰的模塊間的熱 電阻取決于它們之間公共邊的長度。如參考文獻7中所說,雜散電阻也耍被考慮在內。每 個單元對熱量地之間都有一個熱電容,其大小由各個元件自身的面積決定,同時還需要引入 比例縮放因子來折算這個集中式的電容和分布式電容z間的區(qū)別。除了主要的流片區(qū),它的 下面另外還有附加的兩個導熱層和散熱層。模型中有一些與這兩層相關的組成元件,但是沒 有和流片層相同的有效功耗源。最后,為了模擬芯片封裝同空氣的接觸表面,設定了一個等效的對流電阻rconvection,并 且在熱量地(壞境空氣溫度)與芯片封裝的底部之間加

13、上了一個恒定的功率源。為了提供一 個可與其他商業(yè)化工具比較的收斂性結果以及更好地匹配最后實驗結果屮的版圖功能,如參 考文獻13中對結果模型作了校準。熱電流的網表以矩陣形式表示,并由第三節(jié)討論的電路 仿真模塊處理。3 用于快速暫態(tài)熱量仿真的新算法我們從前述的結構級等效熱電路模型出發(fā)。31算法準備對于一般的動態(tài)系統(tǒng)松 ar+ bu ,(2)其中a是系統(tǒng)參數矩陣b是輸入位置矩陣。x和11分別是狀態(tài)值和輸入值向量。系統(tǒng)全響 應是等式(3)屮所示從t()時刻起的零輸入響應和零狀態(tài)響應z和。(八 a(t- t0) i j a(t- t )bu(t )drao- e無0十 0 幺。(3)zo等式右邊第一項是

14、和初始條件有關的零輸入響應,等式右邊第二項是只和輸入源11有 關的零狀態(tài)響應。整數寄存器輸入源的功率譜功率譜(w(og)-1-2° a 0o ooqco°o00.5115225335445頻率(mhz)x io4圖4: lucas程序中整數寄存器的功率譜我們對許多結構級模型的典型電源波形的頻譜分析表明,大多數能量都集屮在直流部 分,如圖4所示(y軸以指數形式表示)。這樣,我們把電源波形u(t)分解成in和i>2(t)兩部分。 111是電源輸入的直流成分,而u2(t)是輸入電源的周期性成分,其中w2(r+ t)= u2 (z) ,(4)而t是電源輸入周期性變化的周期。在

15、這里我們要強調實際電源波形在很長的時間內并 不是嚴格的周期性的。但是通常在一個給定的階段內,不同周期之間的變化非常小,忽略這 -變化把他看作是周期輸入不會引起顯著的誤差。這樣,等式(3)可以寫成:x(t)= ea(l-to)x 螂加+ 1)dr。(5)現在等式右邊的前兩項就只是初始狀態(tài)和電源曲線直流部分的作用。電路的第三個響應 則是由周期性的電源輸入激勵產生。這項工作的主要思路就是,通過高效地用瞬態(tài)匹配法計算前兩項響應,用快速頻譜分析 法在頻率域計算第三項周期性的響應,來利用電源輸入的周期特性。在下面的兩小節(jié)中,我 們將介紹這兩種算法。32考慮初始狀態(tài)和直流輸入的瞬態(tài)匹配對于具有熱電阻電容和輸

16、入電源的等效熱電路,我們可以采用改進的節(jié)點分析法來表 示:gr+ c站 ba、,(6)這里我們只考慮電源波形5的直流部分。c和g是電容和電導的電路矩陣,x是節(jié)點溫度向 量,u是獨立電源向量,b是輸入選通矩陣。在頻率域中,等式(6)的拉普拉斯變換可以寫成gx(s)+ scx(s)- x(0) = -bu.(7)s在傳統(tǒng)的慕于awe的瞬態(tài)匹配算法屮,參考文獻8,需要計算指定電源點或者接口z 間的傳遞函數。結杲就必須計算n個輸入電源在每個節(jié)點的n個瞬態(tài)值,因為每個電源在每個 節(jié)點都產生一個瞬態(tài)值。而在我們的課題中,只需要計算每個節(jié)點上直接關系到瞬態(tài)匹配計 算的由初始狀態(tài)和恒定直流電源輸入產生的一個瞬

17、態(tài)值。這樣,這個方法的運算量就與電源 數量無關。特別地,令散則上述等式變?yōu)間 散 $)+ scs) = scx(o)+ b 叫(8)然后我們在s=0處把散s)展開成泰勒積數,得到g(加°+ "2s+ m2s + k)+ sc("%+ s + m2s + k)=scx(o)+ bu然后我們可以得到如下的遞歸狀態(tài)計算方程:mo= g xbuxm = - g'c(叫.x(0) m2= - g xcmxmmiq= - g xcmlq_,總之狀態(tài)參數可以計算出來,每個節(jié)點的響應可以寫成x(5)= 一叫 + sm2 + s2mi + k + s2q' + k

18、(11)s等式右邊第一項在時域中是階躍響應而其他的部分則可以通過pade逼近來進行合理的近似。為了進行q階padc逼近,需要前2q個狀態(tài)參數。然后我們得到了2q個狀態(tài)匹配式:伙+ £ + l + 心)=m0 - %(0)-(盤+怒+ l +僉)=耳(12)pi pi pqm其中卩和a是節(jié)點朋勺部分分式響應序列中第i個極點和留數xk(5)=-叫 + + + k(13)s s- /?! s p2首先用下一小節(jié)參考文獻6所述的多節(jié)點瞬態(tài)匹配算法計算極點。然后用式(12)中的q 個方程,解出所有的留數©吋域的響應通常由不何進行拉普拉斯反變化得到。還要注意的 是,由于暫態(tài)響應從初始狀

19、態(tài)出發(fā),因此狀態(tài)必須像在式(12)的第一個等式中那樣計算初始 狀態(tài)。由于大多數的功率源是直流輸入的,因此由暫態(tài)匹配計算出的響應可能接近于某個確切 的響應,而且我們試驗發(fā)現,頻譜分析的解通常只是在節(jié)點溫度上增加一些小的瞬態(tài)變化。 33多節(jié)點瞬態(tài)匹配用于極點的數值穩(wěn)態(tài)估計直接瞬態(tài)兀配存在一個問題就是高階的瞬態(tài)值精度會比較低,因為高階瞬態(tài)值是極點的 指數函數,如式(所示。高階極點信息在數字上會很快丟失。為了解決這個問題,我們采 用了多節(jié)點瞬態(tài)匹配(mmm)法來獲得系統(tǒng)節(jié)點穩(wěn)定的數字估計。mmm算法的主要思路是用不同節(jié)點或者不同輸入激勵的瞬態(tài)信息來估算極點,而不是 像傳統(tǒng)的瞬態(tài)匹配算法那樣只是從單一的

20、節(jié)點單一的激勵來訃算,參考文獻8。這個方法 的原理是不同節(jié)點和輸入激勵的極點是相同的。通過采用mmm,計算同樣數量的極點我們 只需要少量的階數的瞬態(tài)值。例如,用多節(jié)點單輸入的瞬態(tài)值,我們可以僅用p+1個瞬態(tài)值 得到p個極點。如果有k個輸入,我們就可以用每個輸入的p/k+1個瞬態(tài)值來計算p個極點, 總的計算量也大致相當。由于極點信息在低階瞬態(tài)分量中數值精度上得到了更好保留,等式 (12)所示,因此我們可以得到極點更穩(wěn)定的數字估計。盡管我們計算的是直接頻域響應x(s)而不是傳遞函數,mmm算法仍然可以使用。因為初始條件和直流輸入不會給響應增加極點。特別地,我們假設需要確圧一個簡化的q階系統(tǒng)我們選擇

21、q節(jié)點以及和它相關的瞬態(tài)值組成瞬態(tài)向量觀,函,帀2,,蔦+i,根據式(10) 我們得到鳳,問,碼卜也觀一班°),%碼,,碼j(aq“ =帀,用2,,碼九一丘(0),岡,弘,,岡j(15)其屮丘(0)是所選的q個節(jié)點的初始狀態(tài)向量。而4網的特征值就是等式(6)川原系統(tǒng)的q個主 極點倒數。注意只需要q+1個瞬態(tài)值來計算q個主極點。34頻譜分析在這小節(jié)中,我們討論熱電路中周期性輸入功率的周期性零狀態(tài)響應的頻譜分析方法。 基木思想是用離散傅立葉變換(dft)把輸入信號變化到頻率域然后計算響應的基波傅立葉 系數或諧波系數。然后把響應的傅立葉系數轉化到時域得到穩(wěn)態(tài)時域響應。在離散傅立葉變換中,在

22、時域進行k點采樣,頻域中得到k次諧波。然后我們如下所示計 算各次諧波在熱電路中的響應:a )x(ej = p)(16)a(0)x(0)= p(02)其中,i=l.k是諧波次數,a(q)是q頻率下標示熱器件特征的mna矩陣,x(q)是 頻率下各個器件溫度的向量,p(co)是從dft計算得到的輸入功率向量的諧波。通過這種轉換,可以顯著減少運算量尤其是對于長周期的仿真。因為我們只要計算一個 周期的穩(wěn)態(tài)值,mna等式的數量就只取決于采樣點數的多少。如果需要更快的仿真速度, 我們可以降低采樣頻率以損失精度為代價來提高運算速度。最后我們用離散傅立葉反變換把 頻域響應轉換成吋域響應。注意,最后穩(wěn)態(tài)溫度是我們

23、從頻譜分析計算得到的溫度和我們的等效熱電路屮作為地電 壓處理的環(huán)境溫度。實際的溫度響應是零輸入響應和零狀態(tài)響應之和。由于頻域譜分析得到的是穩(wěn)態(tài)解,這就意味著是無限時間后系統(tǒng)響應趨于穩(wěn)定時的解, 它對于t=0時的響應并不準確。但是和直流成分相比周期性的能量數入通常都很小造成的誤 差也很小。這從我們的實驗結果上可以看出來。35在動態(tài)熱量管理中的應用我們的方法對于在結構級進行動態(tài)熱量管理有非常大的好處。例如,對一個周期性的程 序段加一個初始的熱量設置,我們的技術可以預測電流是否會達到臨界溫度,如果會,多久 會達到。這樣,在達到這個臨界溫度之前,有效的動態(tài)熱量管理諸如動態(tài)電壓/頻率縮放, 局部鎖定,動

24、態(tài)轉移等方法就可以用來冷卻即將發(fā)熱的模塊,防止他們進入臨界溫度階段。 用我們的兩步算法這將是很容易計算的。在有些情況下,直流部件的周期性紋波能量只是在 總的瞬態(tài)溫度上造成笑的擾動。瞬態(tài)匹配響應法就可以用來做出非常精確時間估計。dtm的另一個重要的問題是一個程序在長吋間的周期性工作后是否會達到臨界溫度, 也就是說,熱穩(wěn)態(tài)是什么。如果穩(wěn)態(tài)溫度遠遠低于溫度極限,那么只要維持同樣的周期運行, 就沒有必要執(zhí)行動態(tài)熱量管理。我們的瞬態(tài)匹配算法可以在周期一開始的時候就直接計算穩(wěn) 態(tài)逼近值,做出快速精確的預測。另一方而,如果穩(wěn)態(tài)值如果非常接近臨界溫度,只需要用 頻譜分析來找出在穩(wěn)態(tài)溫度附近的起伏。這樣的話,只

25、是在溫度脈動超過極限的時候需要 dtmo如果輸入能量中有多項,我們可以用上述方法分別計算每項的響應,然后把它們加起來 得出溫度趨勢。36時間復雜性分析對有n個節(jié)點的熱電路,如果只需要少量瞬態(tài)值(qd川),那么時間瞬態(tài)匹配算法的 時間復雜度接近0(/?5),其中,嚴是一次稀疏矩陣g的lu分解近似代價。因為需要求解k次頻 域方程組,頻譜分析的時間復雜度大約是o伙卅汎 其屮k是等式(16)屮的采樣點數。但是由 于采樣是在一個周期內進行的,所以k與時間段長短無關。要注意的是兩種分析法的時間復雜度都和基于傳統(tǒng)綜合法的瞬態(tài)仿真中用到的時間段 或者時間步數無關,這就是相對與傳統(tǒng)方法的主要優(yōu)勢和提速。4.試驗

26、結果我們在matlab中模擬所提出的算法。我們采用了圖2中改進的compaq alpha 21364微結 構來產生能量曲線以及類似參考文獻13中的等效熱電路模型。為了做出公平的對比,我們 也在matlab中模擬了 hotspot采用的基于傳統(tǒng)綜合法的瞬態(tài)仿真來比較兩種方法的的精確度 和速度差異。我們用spec cpu 2000系列的版圖評估了我們的結果。我們選擇了 3個程序 art,lucas,wupwise運行了 100以條指令并且仿真了周期性的部分。由于最熱的單元是整數寄 存器,我們計算了一個典型整數寄存器的溫度變化作為例證。表1:運行spec cpu2000程序的cpu占用時間對照pro

27、cram#11#scpu (hotspot)cpu (tmmspectruin)lucas2000018183.740.78lucas3000018219.430.77ari1000061472.2315.67art30000614242.4915.55wupwise100002466.31llwupwise3000024515.021()表1總結了三個程序和試驗參數的統(tǒng)計結果。#11欄是是指令時間,大約10“s, #s欄是頻 譜分析用到的采樣點數。cpu (hotspot)欄和cpu (tmmspectrum).分別是hotspot用的傳統(tǒng) 仿真方法和我們所提出的方法的cpu占用時間。cpu

28、占用時間是以秒為單位。仿真的熱電路 包括大約166個節(jié)點。盡管這個熱電路比較小,加很長時間的輸入能量曲線(數十億的指令周 期),hotspot的仿真吋間將如表1所示那么長。在測試情況下,我們用多節(jié)點瞬態(tài)兀配法計 算6個極點來得出瞬態(tài)響應。我們發(fā)現6個極點通??梢越o出相當好的結果。75:><y-c:ee701iiiiiiiii00.020.040.060.0tim© (sgconds)圖5: lucas程序運行溫度變化對照圖5所示是lucas程序的暫態(tài)溫度變化對比,約20000個仿真點,每個點3.3“$。圖6所示 是art程序的

29、暫態(tài)溫度變化對比,約10000個仿真點。圖7所示是wupwise程序的暫態(tài)溫度變 化對比??梢钥闯鑫覀兊男滤惴ǖ慕Y果與hotspot仿真的結果相當吻合,但是從表1可以看出 占用的cpu時間卻短了 10倍??梢宰⒁獾剑黾臃抡鏁r間間隔,速度將會更顯著地增加,因 為這個新方法和仿真的時間間隔數無關。120transient temperature changes in on© integer register for art program10»31(oj anj«一 adeal0.010.02 0.cg 0.040.c60.080.070.080,c«0.

30、1tim© (seconds)圖6: art程序運行溫度變化對照我們還注意到,當溫度隨著時間而增加,用我們提出的方法計算的溫度與hotspot計算的將 會有明顯的區(qū)別。主要的原因是隨著時間推移周期性的能量輸入也會輕微地變化。結果,如 圖5所示直流分量就會偏移我們用于瞬態(tài)匹配t=0時候的值。為了解決這個問題,我們可以把 仿真的時間間隔分成兒個段,侮段都根據自己的起止時間依次仿真。這樣做的目的就是確保 周期性能量軌跡屮的直流分量便宜足夠小而使瞬態(tài)匹配算法足夠精確。分段仿真可以用很小 的計算代價就變得更加精確。1101o5otransient tempelature changes in

31、on© integer register forwupvzis program 1350.010.020.030.040.050.060.070.080.(®tim© (seconds)30!5«2 24 a q) eube 覽 wai圖7: wupwise程序運行溫度變化對照transient temperature changes in on© integer register for art program87.40.01550.0160.01660.0170.01750.0180.01850.0190.01950.02time (sec

32、onds)衛(wèi)®0»»s»8 療 療 g!5ea»dea*l圖8: art程序周期性溫度變化精細對照為了顯示由周期性能量軌跡引起的精細波形,如圖8所示我們放大了圖6。圖中顯示溫度 確實隨時間作周期性的變化。hotspot與我們提出的新算法結果相當一致。5結論以及今后的工作在本文屮,我們提出了一種有效的用于結構級動態(tài)熱量管理的熱量分析技術。這個新方 法利用了微處理器和嵌入式高性能系統(tǒng)結構級模熨功耗的周期性特征。我們提出用頻域譜分 析的方法來計算溫度的周期性響應,用考慮了初始條件和直流功率輸入的數值穩(wěn)定瞬態(tài)兀配 算法來計算暫態(tài)溫度變化??偟臅簯B(tài)響應是

33、兩個仿真值之和。結果,這個快速熱量分析算法 使得運算速度比基于傳統(tǒng)綜合法spice類的h otspot提高了至少10倍而僅僅損失了極小的精 度。今后,我們將如3.5節(jié)所述,把我們的熱仿真方法與dtm優(yōu)化器整合,來完成結構級的dtm框架。6 參考文獻1 http://cpu2000/cfp2000/.2 "international technology roadmap for scmiconductors(itrs), 2004 update/ 2001, .3 d. brooks and m martonosi, “dynamic thermal manag

34、ement for high-performance microprocessors;' in proc, of inti. symp. on high-perfonnance comp. architecture. 2001, pp. 171-182.4 yk cheng, c.-h. tsai, c.-c. teng, and s.-m. kang, electrothermal analysis of vlsi systems. kluwer academic publishers, 2000.5 w. huang, m. stan, k. skadron, k. sankara

35、narayanan, s ghosh, and s vclusamy, "compact thermal modeling for temperature-aware design/' in proc. design automation conf. (dac), 2004, pp. 878-883.6 y. ismail, "efficient model order reduction via multi-node moment matching,' in proc. bit. conf, on computer aideddesign (iccad),

36、 nov. 2002, pp. 767-774.7 s lee, s. song, v. au, and k. moran, uconstricting»zsprcading resistance model for electronics packaging," in proc. asme/jsme thermal engineering conference. mar. 1995, pp. 199-206.8 l. t. pillage and r. a. rohrer, "asymptotic waveform evaluation for timing a

37、nalysis/' ieee trans, on computer-aided design of integrated circuits and systems, pp. 352-366, april 1990.9 t. shenvood, e. perelman, and b. calder, "basic block distribution analysis to find periodic behavior and simulation points in applications/' in the international conference on p

38、arallel architectures and compilation techniques (pact2001), 2001, pp. 3-1410 t. sherwood, e. perelman, g. hamerly, s sair, and b. calder, discovering and exploiting program phases,” inieee micro: micro's top picks from computer architecture conferences, 2003, pp. 8493.11 t. sherwood、s sair, and b. calder, "phase tracking and prediction, in proc. ieee international symposium oncomputer architecture (isca), 2003, pp. 45-57.12 k

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論