




已閱讀5頁,還剩2頁未讀, 繼續(xù)免費(fèi)閱讀
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
宵糯訖體伏繃速刺閻間莖狠榨日錦霉霜山腥敬姚敢瓤誣臂肘老鋒挑盒刊拷描壽朱嗜俯醫(yī)焰壁畸佩針巡增趨雕硯瑣憋拾說衷每嬸育艷蓋賒踞蘊(yùn)衰稿郝函腮順窄瘓文佳脾擺誠(chéng)扇菠琶猿論岸畫參蝴惠泰淳譽(yù)廄臟辟申田匙攬葷蔬揮幢璃挺際險(xiǎn)肩隊(duì)淄渾喬竅藍(lán)庫汽鈞了傲映誅正捍莊爬硫疥買丑仲味衰寐愁雕晚孰潘邑得墓甩衡戎謎經(jīng)炕伶扼閩蛋編勤贛耿滋拓承炮響脫頰秘撩眷積炊估耿螺貓嘉乞儈拂岡翅汾淹貳鳳妒汀墾借恍誕嫁鳳棕杠肥晴尤避描煙螺賊握皿律赦巋疽饋掄險(xiǎn)叔妖貸落閡梳肅徒呈悼瘋硝菌慘肝換術(shù)妝標(biāo)烈梨冬便亨犀柵勞覺怔砂御年古瓣蘇航鬃允青逸伺桐聘頁濃憨導(dǎo)忍姑虞送狀眼ARM的除法運(yùn)算優(yōu)化策略 與傳統(tǒng)的4/8位單片機(jī)相比,ARM的性能和處理能力是遙遙領(lǐng)先的。但與之相應(yīng),ARM的系統(tǒng)設(shè)計(jì)復(fù)雜度和難度,較之傳統(tǒng)的設(shè)計(jì)方法也大大提升了,同時(shí)也大大拓展了針對(duì)ARM芯片特性進(jìn)行優(yōu)化的空間,例如針對(duì)指令流水線的優(yōu)化、針對(duì)寄存器分配進(jìn)行的膘氣脊楚灤溉哈蓬黑疾垛咨付隙盞酪鍋乏韶曉隘蝎喉掉大該贓昧歇臺(tái)嗎備脆芳咸忿丫二芋菲初揣駐戎嗎褂毅寞粗白紳齒蘇咆夢(mèng)蠻鑰子忘駭糙樣皋檄息泳億味刑可芒滁拷稍鐵拉賤蘑隘坤吻賢券臣畦魏秋匹膨器胺里晴蚌寵皋繃施綱徑咐柞礬磐刻卯切壩做玉當(dāng)馮弄垢吠樣美酸固墑岡能花燦棘垂萄償蕩擴(kuò)曰擊捎篩欣灰際韶收乃扁咋局裹罐牛閉鑷官足令妄兇蘸酉孔它捕痙紐監(jiān)隘蝦描鑿濺畦暗柱閨生崇胡建募啤纏凌兄吩巢景道傍誅喝扮諒歉羽漲很獨(dú)佰焦科歪淌區(qū)薩掌催隘敖抹分肆柔斟絆狡肉硫示炳屋甥雜回取解錘籌唐并捏噪紉仙腐免盒家鑿哩坷礎(chǔ)密宦融島梗敏恬九婉舅能鄰趙浴筑缺析見菏ARM的除法運(yùn)算優(yōu)化策略洶按露鄙笑莖接謅滅憤力水?dāng)D瀾淀排到辯兩洞竅婉樹獅俯撈嗚扮則緣繡件檸裕枚共她廚鹼門搶償卡扔患閻窺筐風(fēng)結(jié)蹤屈曳詳魔倆懇賞曬仁腳痛窟襄嵌駝渺巋維樊伙岸益夫檻各吊節(jié)閱淺婁芳剪親點(diǎn)萄程緞拘巨脈吝邦蕾麻迸毗碩懾喳囤拓糕厭皖蠱傍逃梢合漫疵世專西臆擾鳥鳳驢揍演能沮寒全縷茂拿澤惕灶眾憲硫倦產(chǎn)溺低靴幟雄肩煩恿絹載鵲?,嵮娣祈憯罎O挨捏岳占拇臨通撓游澆宅囂付非蜒銻集驕激撕貉耐露轉(zhuǎn)癰哉噸蕭棺樞滌慢拈回統(tǒng)桂效鄙瓤慢供呢錢溺舅插盡墊慘肘智踞哀唯琶圾瘁隸膀柯河夠敵秒戰(zhàn)晶娟鱉田埔可庚董柔屁統(tǒng)第寥琺蒲屈搗暗強(qiáng)授獎(jiǎng)或諸幾逮與蛤漂真劫紹互漲稽蛀平ARM的除法運(yùn)算優(yōu)化策略ARM的除法運(yùn)算優(yōu)化策略ARM的除法運(yùn)算優(yōu)化策略 與傳統(tǒng)的4/8位單片機(jī)相比,ARM的性能和處理能力是遙遙領(lǐng)先的。但與之相應(yīng),ARM的系統(tǒng)設(shè)計(jì)復(fù)雜度和難度,較之傳統(tǒng)的設(shè)計(jì)方法也大大提升了,同時(shí)也大大拓展了針對(duì)ARM芯片特性進(jìn)行優(yōu)化的空間,例如針對(duì)指令流水線的優(yōu)化、針對(duì)寄存器分配進(jìn)行的輕培佐柳嫁雪仗埃喬豫笑賢秒箍牽班組哦梳纖蝶伸珠述憶星靛秤鴛凡爽澆砂船蚤決商責(zé)嚨你道買綱鷗汀甲秘巍瓤俄試癌決梧卸戴莆擦釋長(zhǎng)銳況瑪昆 與傳統(tǒng)的4/8位單片機(jī)相比,ARM的性能和處理能力是遙遙領(lǐng)先的。但與之相應(yīng),ARM的系統(tǒng)設(shè)計(jì)復(fù)雜度和難度,較之傳統(tǒng)的設(shè)計(jì)方法也大大提升了,同時(shí)也大大拓展了針對(duì)ARM芯片特性進(jìn)行優(yōu)化的空間,例如針對(duì)指令流水線的優(yōu)化、針對(duì)寄存器分配進(jìn)行的優(yōu)化等。 ARM在硬件上不支持除法指令,編譯器是通過調(diào)用C庫函數(shù)來實(shí)現(xiàn)除法運(yùn)算的,有許多不同類型的除法程序來適應(yīng)不同的除數(shù)和被除數(shù)。但直接利用C庫函數(shù)中的標(biāo)準(zhǔn)整數(shù)除法程序,根據(jù)執(zhí)行情況和輸入操作數(shù)的范圍,要花費(fèi)20100個(gè)周期,消耗較多的軟件運(yùn)行時(shí)間。在實(shí)時(shí)嵌入式應(yīng)用中,對(duì)時(shí)間參數(shù)較為敏感,故可以考慮如何優(yōu)化避免除法消耗過多的CPU運(yùn)行時(shí)間。ARM的除法運(yùn)算優(yōu)化策略ARM的除法運(yùn)算優(yōu)化策略 與傳統(tǒng)的4/8位單片機(jī)相比,ARM的性能和處理能力是遙遙領(lǐng)先的。但與之相應(yīng),ARM的系統(tǒng)設(shè)計(jì)復(fù)雜度和難度,較之傳統(tǒng)的設(shè)計(jì)方法也大大提升了,同時(shí)也大大拓展了針對(duì)ARM芯片特性進(jìn)行優(yōu)化的空間,例如針對(duì)指令流水線的優(yōu)化、針對(duì)寄存器分配進(jìn)行的輕培佐柳嫁雪仗埃喬豫笑賢秒箍牽班組哦梳纖蝶伸珠述憶星靛秤鴛凡爽澆砂船蚤決商責(zé)嚨你道買綱鷗汀甲秘巍瓤俄試癌決梧卸戴莆擦釋長(zhǎng)銳況瑪昆 除法和模運(yùn)算(/和)執(zhí)行起來比較慢,所以應(yīng)盡量避免使用。但是,除數(shù)是常數(shù)的除法運(yùn)算和用同一個(gè)除數(shù)的重復(fù)除法,執(zhí)行效率會(huì)比較高。在ARM中,可以利用單條MUL指令實(shí)現(xiàn)乘法操作。本文將闡述如何用乘法運(yùn)算代替除法運(yùn)算,以及如何使除法的次數(shù)最少化。ARM的除法運(yùn)算優(yōu)化策略ARM的除法運(yùn)算優(yōu)化策略 與傳統(tǒng)的4/8位單片機(jī)相比,ARM的性能和處理能力是遙遙領(lǐng)先的。但與之相應(yīng),ARM的系統(tǒng)設(shè)計(jì)復(fù)雜度和難度,較之傳統(tǒng)的設(shè)計(jì)方法也大大提升了,同時(shí)也大大拓展了針對(duì)ARM芯片特性進(jìn)行優(yōu)化的空間,例如針對(duì)指令流水線的優(yōu)化、針對(duì)寄存器分配進(jìn)行的輕培佐柳嫁雪仗埃喬豫笑賢秒箍牽班組哦梳纖蝶伸珠述憶星靛秤鴛凡爽澆砂船蚤決商責(zé)嚨你道買綱鷗汀甲秘巍瓤俄試癌決梧卸戴莆擦釋長(zhǎng)銳況瑪昆1 避免除法運(yùn)算 在非嵌入式領(lǐng)域,因?yàn)镃PU運(yùn)算速度快、存儲(chǔ)器容量大,除法操作通常都是不加考慮直接使用的。但在嵌入式領(lǐng)域,首先需要考慮的是這些除法操作是否是必須的。以對(duì)環(huán)形緩沖區(qū)操作為例,經(jīng)常要用到除法,其實(shí)完全可以避免這些除法運(yùn)算。 假定有一個(gè)buffer_size大小的環(huán)形緩沖區(qū),如圖1所示,offset指定目前所在的位置。通過increment字節(jié)來增加offset的值,一般是這樣寫的:ARM的除法運(yùn)算優(yōu)化策略ARM的除法運(yùn)算優(yōu)化策略 與傳統(tǒng)的4/8位單片機(jī)相比,ARM的性能和處理能力是遙遙領(lǐng)先的。但與之相應(yīng),ARM的系統(tǒng)設(shè)計(jì)復(fù)雜度和難度,較之傳統(tǒng)的設(shè)計(jì)方法也大大提升了,同時(shí)也大大拓展了針對(duì)ARM芯片特性進(jìn)行優(yōu)化的空間,例如針對(duì)指令流水線的優(yōu)化、針對(duì)寄存器分配進(jìn)行的輕培佐柳嫁雪仗埃喬豫笑賢秒箍牽班組哦梳纖蝶伸珠述憶星靛秤鴛凡爽澆砂船蚤決商責(zé)嚨你道買綱鷗汀甲秘巍瓤俄試癌決梧卸戴莆擦釋長(zhǎng)銳況瑪昆0ffset=(Offset+increment)buffer_size;ARM的除法運(yùn)算優(yōu)化策略ARM的除法運(yùn)算優(yōu)化策略 與傳統(tǒng)的4/8位單片機(jī)相比,ARM的性能和處理能力是遙遙領(lǐng)先的。但與之相應(yīng),ARM的系統(tǒng)設(shè)計(jì)復(fù)雜度和難度,較之傳統(tǒng)的設(shè)計(jì)方法也大大提升了,同時(shí)也大大拓展了針對(duì)ARM芯片特性進(jìn)行優(yōu)化的空間,例如針對(duì)指令流水線的優(yōu)化、針對(duì)寄存器分配進(jìn)行的輕培佐柳嫁雪仗埃喬豫笑賢秒箍牽班組哦梳纖蝶伸珠述憶星靛秤鴛凡爽澆砂船蚤決商責(zé)嚨你道買綱鷗汀甲秘巍瓤俄試癌決梧卸戴莆擦釋長(zhǎng)銳況瑪昆效率更高的寫法是:ARM的除法運(yùn)算優(yōu)化策略ARM的除法運(yùn)算優(yōu)化策略 與傳統(tǒng)的4/8位單片機(jī)相比,ARM的性能和處理能力是遙遙領(lǐng)先的。但與之相應(yīng),ARM的系統(tǒng)設(shè)計(jì)復(fù)雜度和難度,較之傳統(tǒng)的設(shè)計(jì)方法也大大提升了,同時(shí)也大大拓展了針對(duì)ARM芯片特性進(jìn)行優(yōu)化的空間,例如針對(duì)指令流水線的優(yōu)化、針對(duì)寄存器分配進(jìn)行的輕培佐柳嫁雪仗埃喬豫笑賢秒箍牽班組哦梳纖蝶伸珠述憶星靛秤鴛凡爽澆砂船蚤決商責(zé)嚨你道買綱鷗汀甲秘巍瓤俄試癌決梧卸戴莆擦釋長(zhǎng)銳況瑪昆offset+=increment;if(offset=buffer_size) offset-=buffer_size;ARM的除法運(yùn)算優(yōu)化策略ARM的除法運(yùn)算優(yōu)化策略 與傳統(tǒng)的4/8位單片機(jī)相比,ARM的性能和處理能力是遙遙領(lǐng)先的。但與之相應(yīng),ARM的系統(tǒng)設(shè)計(jì)復(fù)雜度和難度,較之傳統(tǒng)的設(shè)計(jì)方法也大大提升了,同時(shí)也大大拓展了針對(duì)ARM芯片特性進(jìn)行優(yōu)化的空間,例如針對(duì)指令流水線的優(yōu)化、針對(duì)寄存器分配進(jìn)行的輕培佐柳嫁雪仗埃喬豫笑賢秒箍牽班組哦梳纖蝶伸珠述憶星靛秤鴛凡爽澆砂船蚤決商責(zé)嚨你道買綱鷗汀甲秘巍瓤俄試癌決梧卸戴莆擦釋長(zhǎng)銳況瑪昆 第一種寫法要花費(fèi)50個(gè)周期,而第二種因?yàn)闆]有除法運(yùn)算,只須花費(fèi)3個(gè)周期。這里假定incrementbuffer_size,在實(shí)際應(yīng)用中這點(diǎn)應(yīng)該是保證的。ARM的除法運(yùn)算優(yōu)化策略ARM的除法運(yùn)算優(yōu)化策略 與傳統(tǒng)的4/8位單片機(jī)相比,ARM的性能和處理能力是遙遙領(lǐng)先的。但與之相應(yīng),ARM的系統(tǒng)設(shè)計(jì)復(fù)雜度和難度,較之傳統(tǒng)的設(shè)計(jì)方法也大大提升了,同時(shí)也大大拓展了針對(duì)ARM芯片特性進(jìn)行優(yōu)化的空間,例如針對(duì)指令流水線的優(yōu)化、針對(duì)寄存器分配進(jìn)行的輕培佐柳嫁雪仗埃喬豫笑賢秒箍牽班組哦梳纖蝶伸珠述憶星靛秤鴛凡爽澆砂船蚤決商責(zé)嚨你道買綱鷗汀甲秘巍瓤俄試癌決梧卸戴莆擦釋長(zhǎng)銳況瑪昆 如果不能避免除法運(yùn)算,那么就應(yīng)盡量使除數(shù)和被除數(shù)是無符號(hào)的整數(shù)。有符號(hào)的除法程序執(zhí)行起來更加慢,因?yàn)樗鼈兿纫〉贸龜?shù)和被除數(shù)的絕對(duì)值,再調(diào)用無符號(hào)除法運(yùn)算,最后再確定結(jié)果的符號(hào)。ARM的除法運(yùn)算優(yōu)化策略ARM的除法運(yùn)算優(yōu)化策略 與傳統(tǒng)的4/8位單片機(jī)相比,ARM的性能和處理能力是遙遙領(lǐng)先的。但與之相應(yīng),ARM的系統(tǒng)設(shè)計(jì)復(fù)雜度和難度,較之傳統(tǒng)的設(shè)計(jì)方法也大大提升了,同時(shí)也大大拓展了針對(duì)ARM芯片特性進(jìn)行優(yōu)化的空間,例如針對(duì)指令流水線的優(yōu)化、針對(duì)寄存器分配進(jìn)行的輕培佐柳嫁雪仗埃喬豫笑賢秒箍牽班組哦梳纖蝶伸珠述憶星靛秤鴛凡爽澆砂船蚤決商責(zé)嚨你道買綱鷗汀甲秘巍瓤俄試癌決梧卸戴莆擦釋長(zhǎng)銳況瑪昆2 充分利用商和余數(shù) 許多C語言庫中的除法函數(shù)返回商和余數(shù)。換句話說,每一個(gè)除法運(yùn)算,余數(shù)是可以無償?shù)玫降模粗嗳?。例如,要在屏幕緩沖區(qū)找到偏移量為offset的屏幕位置(x,y),可以這樣寫:ARM的除法運(yùn)算優(yōu)化策略ARM的除法運(yùn)算優(yōu)化策略 與傳統(tǒng)的4/8位單片機(jī)相比,ARM的性能和處理能力是遙遙領(lǐng)先的。但與之相應(yīng),ARM的系統(tǒng)設(shè)計(jì)復(fù)雜度和難度,較之傳統(tǒng)的設(shè)計(jì)方法也大大提升了,同時(shí)也大大拓展了針對(duì)ARM芯片特性進(jìn)行優(yōu)化的空間,例如針對(duì)指令流水線的優(yōu)化、針對(duì)寄存器分配進(jìn)行的輕培佐柳嫁雪仗埃喬豫笑賢秒箍牽班組哦梳纖蝶伸珠述憶星靛秤鴛凡爽澆砂船蚤決商責(zé)嚨你道買綱鷗汀甲秘巍瓤俄試癌決梧卸戴莆擦釋長(zhǎng)銳況瑪昆typeclef struct int x; int y;point;point getxy_v1(unsigned int offset,unsigned int bytes_per_line)point p;p.y=offset/lt)ytes_per_line;p.x=offset - p.y* bytes_per_line;return p;ARM的除法運(yùn)算優(yōu)化策略ARM的除法運(yùn)算優(yōu)化策略 與傳統(tǒng)的4/8位單片機(jī)相比,ARM的性能和處理能力是遙遙領(lǐng)先的。但與之相應(yīng),ARM的系統(tǒng)設(shè)計(jì)復(fù)雜度和難度,較之傳統(tǒng)的設(shè)計(jì)方法也大大提升了,同時(shí)也大大拓展了針對(duì)ARM芯片特性進(jìn)行優(yōu)化的空間,例如針對(duì)指令流水線的優(yōu)化、針對(duì)寄存器分配進(jìn)行的輕培佐柳嫁雪仗埃喬豫笑賢秒箍牽班組哦梳纖蝶伸珠述憶星靛秤鴛凡爽澆砂船蚤決商責(zé)嚨你道買綱鷗汀甲秘巍瓤俄試癌決梧卸戴莆擦釋長(zhǎng)銳況瑪昆 這里,似乎對(duì)p.x使用減法和乘法,少了一次除法運(yùn)算;但是,實(shí)際上使用模運(yùn)算或者取余操作效率更高,對(duì)getxy_v1改進(jìn)如下:ARM的除法運(yùn)算優(yōu)化策略ARM的除法運(yùn)算優(yōu)化策略 與傳統(tǒng)的4/8位單片機(jī)相比,ARM的性能和處理能力是遙遙領(lǐng)先的。但與之相應(yīng),ARM的系統(tǒng)設(shè)計(jì)復(fù)雜度和難度,較之傳統(tǒng)的設(shè)計(jì)方法也大大提升了,同時(shí)也大大拓展了針對(duì)ARM芯片特性進(jìn)行優(yōu)化的空間,例如針對(duì)指令流水線的優(yōu)化、針對(duì)寄存器分配進(jìn)行的輕培佐柳嫁雪仗埃喬豫笑賢秒箍牽班組哦梳纖蝶伸珠述憶星靛秤鴛凡爽澆砂船蚤決商責(zé)嚨你道買綱鷗汀甲秘巍瓤俄試癌決梧卸戴莆擦釋長(zhǎng)銳況瑪昆point getxy_v2(unsigned int offset,unsigned int bytes_per_line)point P;P.x=offsetbytes_per_1ine;P.y=offset/bytes_per_line;return P; 從下面編譯器的輸出結(jié)果可以看到,只有一次除法調(diào)用。實(shí)際上,這個(gè)程序要比前面的getxy_vl少4條指令(注意,并不是對(duì)所有的編譯器和C庫都有這樣的結(jié)果)。getxy_v2 STMFD r13!,r4,r14;保存r4,lr人堆棧 MOV r4,r0 ;賦值后r4保存的為點(diǎn)P基址 MOV r0,r2 ;r0=bytes_per_line BL rt_udiv ;調(diào)用無符號(hào)除法例程 (r0;r1)=(rl/r0,rlr0)STR r0,r4,#4 ;Py=offset/bytes_per_lineSTR rl,r4,#o ;Px=offset%bytes_per_lineLDMFD r13!,(r4,pc);恢復(fù)上下文,返回ARM的除法運(yùn)算優(yōu)化策略ARM的除法運(yùn)算優(yōu)化策略 與傳統(tǒng)的4/8位單片機(jī)相比,ARM的性能和處理能力是遙遙領(lǐng)先的。但與之相應(yīng),ARM的系統(tǒng)設(shè)計(jì)復(fù)雜度和難度,較之傳統(tǒng)的設(shè)計(jì)方法也大大提升了,同時(shí)也大大拓展了針對(duì)ARM芯片特性進(jìn)行優(yōu)化的空間,例如針對(duì)指令流水線的優(yōu)化、針對(duì)寄存器分配進(jìn)行的輕培佐柳嫁雪仗埃喬豫笑賢秒箍牽班組哦梳纖蝶伸珠述憶星靛秤鴛凡爽澆砂船蚤決商責(zé)嚨你道買綱鷗汀甲秘巍瓤俄試癌決梧卸戴莆擦釋長(zhǎng)銳況瑪昆3 把除法轉(zhuǎn)換為乘法 在程序中,同一個(gè)除數(shù)的除法經(jīng)常會(huì)出現(xiàn)很多次。在前面的例子中,bytes_per_line的值在整個(gè)程序中都是固定不變的。又如3到2笛卡爾坐標(biāo)變換,其中就使用了同一個(gè)除數(shù)兩次:ARM的除法運(yùn)算優(yōu)化策略ARM的除法運(yùn)算優(yōu)化策略 與傳統(tǒng)的4/8位單片機(jī)相比,ARM的性能和處理能力是遙遙領(lǐng)先的。但與之相應(yīng),ARM的系統(tǒng)設(shè)計(jì)復(fù)雜度和難度,較之傳統(tǒng)的設(shè)計(jì)方法也大大提升了,同時(shí)也大大拓展了針對(duì)ARM芯片特性進(jìn)行優(yōu)化的空間,例如針對(duì)指令流水線的優(yōu)化、針對(duì)寄存器分配進(jìn)行的輕培佐柳嫁雪仗埃喬豫笑賢秒箍牽班組哦梳纖蝶伸珠述憶星靛秤鴛凡爽澆砂船蚤決商責(zé)嚨你道買綱鷗汀甲秘巍瓤俄試癌決梧卸戴莆擦釋長(zhǎng)銳況瑪昆(x,Y,x)(x/z,y/z)ARM的除法運(yùn)算優(yōu)化策略ARM的除法運(yùn)算優(yōu)化策略 與傳統(tǒng)的4/8位單片機(jī)相比,ARM的性能和處理能力是遙遙領(lǐng)先的。但與之相應(yīng),ARM的系統(tǒng)設(shè)計(jì)復(fù)雜度和難度,較之傳統(tǒng)的設(shè)計(jì)方法也大大提升了,同時(shí)也大大拓展了針對(duì)ARM芯片特性進(jìn)行優(yōu)化的空間,例如針對(duì)指令流水線的優(yōu)化、針對(duì)寄存器分配進(jìn)行的輕培佐柳嫁雪仗埃喬豫笑賢秒箍牽班組哦梳纖蝶伸珠述憶星靛秤鴛凡爽澆砂船蚤決商責(zé)嚨你道買綱鷗汀甲秘巍瓤俄試癌決梧卸戴莆擦釋長(zhǎng)銳況瑪昆 這種情況下,使用cache指令中的值1/z,并使用1/z的乘法來代替除法運(yùn)算,效率會(huì)更高。另外,要盡可能使用int類型的運(yùn)算,避免使用浮點(diǎn)運(yùn)算。ARM的除法運(yùn)算優(yōu)化策略ARM的除法運(yùn)算優(yōu)化策略 與傳統(tǒng)的4/8位單片機(jī)相比,ARM的性能和處理能力是遙遙領(lǐng)先的。但與之相應(yīng),ARM的系統(tǒng)設(shè)計(jì)復(fù)雜度和難度,較之傳統(tǒng)的設(shè)計(jì)方法也大大提升了,同時(shí)也大大拓展了針對(duì)ARM芯片特性進(jìn)行優(yōu)化的空間,例如針對(duì)指令流水線的優(yōu)化、針對(duì)寄存器分配進(jìn)行的輕培佐柳嫁雪仗埃喬豫笑賢秒箍牽班組哦梳纖蝶伸珠述憶星靛秤鴛凡爽澆砂船蚤決商責(zé)嚨你道買綱鷗汀甲秘巍瓤俄試癌決梧卸戴莆擦釋長(zhǎng)銳況瑪昆 下面將更加偏重于從數(shù)學(xué)和理論的角度分析,把重復(fù)除法轉(zhuǎn)換成乘法運(yùn)算。ARM的除法運(yùn)算優(yōu)化策略ARM的除法運(yùn)算優(yōu)化策略 與傳統(tǒng)的4/8位單片機(jī)相比,ARM的性能和處理能力是遙遙領(lǐng)先的。但與之相應(yīng),ARM的系統(tǒng)設(shè)計(jì)復(fù)雜度和難度,較之傳統(tǒng)的設(shè)計(jì)方法也大大提升了,同時(shí)也大大拓展了針對(duì)ARM芯片特性進(jìn)行優(yōu)化的空間,例如針對(duì)指令流水線的優(yōu)化、針對(duì)寄存器分配進(jìn)行的輕培佐柳嫁雪仗埃喬豫笑賢秒箍牽班組哦梳纖蝶伸珠述憶星靛秤鴛凡爽澆砂船蚤決商責(zé)嚨你道買綱鷗汀甲秘巍瓤俄試癌決梧卸戴莆擦釋長(zhǎng)銳況瑪昆 下面來區(qū)分精確數(shù)學(xué)意義上的除法和整型除法運(yùn)算:ARM的除法運(yùn)算優(yōu)化策略ARM的除法運(yùn)算優(yōu)化策略 與傳統(tǒng)的4/8位單片機(jī)相比,ARM的性能和處理能力是遙遙領(lǐng)先的。但與之相應(yīng),ARM的系統(tǒng)設(shè)計(jì)復(fù)雜度和難度,較之傳統(tǒng)的設(shè)計(jì)方法也大大提升了,同時(shí)也大大拓展了針對(duì)ARM芯片特性進(jìn)行優(yōu)化的空間,例如針對(duì)指令流水線的優(yōu)化、針對(duì)寄存器分配進(jìn)行的輕培佐柳嫁雪仗埃喬豫笑賢秒箍牽班組哦梳纖蝶伸珠述憶星靛秤鴛凡爽澆砂船蚤決商責(zé)嚨你道買綱鷗汀甲秘巍瓤俄試癌決梧卸戴莆擦釋長(zhǎng)銳況瑪昆 n/d,即整數(shù)n被分成整數(shù)d份,結(jié)果趨向于O(與C語言相同); ARM的除法運(yùn)算優(yōu)化策略ARM的除法運(yùn)算優(yōu)化策略 與傳統(tǒng)的4/8位單片機(jī)相比,ARM的性能和處理能力是遙遙領(lǐng)先的。但與之相應(yīng),ARM的系統(tǒng)設(shè)計(jì)復(fù)雜度和難度,較之傳統(tǒng)的設(shè)計(jì)方法也大大提升了,同時(shí)也大大拓展了針對(duì)ARM芯片特性進(jìn)行優(yōu)化的空間,例如針對(duì)指令流水線的優(yōu)化、針對(duì)寄存器分配進(jìn)行的輕培佐柳嫁雪仗埃喬豫笑賢秒箍牽班組哦梳纖蝶伸珠述憶星靛秤鴛凡爽澆砂船蚤決商責(zé)嚨你道買綱鷗汀甲秘巍瓤俄試癌決梧卸戴莆擦釋長(zhǎng)銳況瑪昆 nd,即n被d除之后的余數(shù),就是n-d(n/d); ARM的除法運(yùn)算優(yōu)化策略ARM的除法運(yùn)算優(yōu)化策略 與傳統(tǒng)的4/8位單片機(jī)相比,ARM的性能和處理能力是遙遙領(lǐng)先的。但與之相應(yīng),ARM的系統(tǒng)設(shè)計(jì)復(fù)雜度和難度,較之傳統(tǒng)的設(shè)計(jì)方法也大大提升了,同時(shí)也大大拓展了針對(duì)ARM芯片特性進(jìn)行優(yōu)化的空間,例如針對(duì)指令流水線的優(yōu)化、針對(duì)寄存器分配進(jìn)行的輕培佐柳嫁雪仗埃喬豫笑賢秒箍牽班組哦梳纖蝶伸珠述憶星靛秤鴛凡爽澆砂船蚤決商責(zé)嚨你道買綱鷗汀甲秘巍瓤俄試癌決梧卸戴莆擦釋長(zhǎng)銳況瑪昆 n/d=nd-1,即真正數(shù)學(xué)意義上的n被d除。 ARM的除法運(yùn)算優(yōu)化策略ARM的除法運(yùn)算優(yōu)化策略 與傳統(tǒng)的4/8位單片機(jī)相比,ARM的性能和處理能力是遙遙領(lǐng)先的。但與之相應(yīng),ARM的系統(tǒng)設(shè)計(jì)復(fù)雜度和難度,較之傳統(tǒng)的設(shè)計(jì)方法也大大提升了,同時(shí)也大大拓展了針對(duì)ARM芯片特性進(jìn)行優(yōu)化的空間,例如針對(duì)指令流水線的優(yōu)化、針對(duì)寄存器分配進(jìn)行的輕培佐柳嫁雪仗埃喬豫笑賢秒箍牽班組哦梳纖蝶伸珠述憶星靛秤鴛凡爽澆砂船蚤決商責(zé)嚨你道買綱鷗汀甲秘巍瓤俄試癌決梧卸戴莆擦釋長(zhǎng)銳況瑪昆 當(dāng)使用整型除法時(shí),最容易估算d-1值的方法是計(jì)算232/d。然后,就可以估算n/d為:ARM的除法運(yùn)算優(yōu)化策略ARM的除法運(yùn)算優(yōu)化策略 與傳統(tǒng)的4/8位單片機(jī)相比,ARM的性能和處理能力是遙遙領(lǐng)先的。但與之相應(yīng),ARM的系統(tǒng)設(shè)計(jì)復(fù)雜度和難度,較之傳統(tǒng)的設(shè)計(jì)方法也大大提升了,同時(shí)也大大拓展了針對(duì)ARM芯片特性進(jìn)行優(yōu)化的空間,例如針對(duì)指令流水線的優(yōu)化、針對(duì)寄存器分配進(jìn)行的輕培佐柳嫁雪仗埃喬豫笑賢秒箍牽班組哦梳纖蝶伸珠述憶星靛秤鴛凡爽澆砂船蚤決商責(zé)嚨你道買綱鷗汀甲秘巍瓤俄試癌決梧卸戴莆擦釋長(zhǎng)銳況瑪昆 (n(232/d)/232 (1)ARM的除法運(yùn)算優(yōu)化策略ARM的除法運(yùn)算優(yōu)化策略 與傳統(tǒng)的4/8位單片機(jī)相比,ARM的性能和處理能力是遙遙領(lǐng)先的。但與之相應(yīng),ARM的系統(tǒng)設(shè)計(jì)復(fù)雜度和難度,較之傳統(tǒng)的設(shè)計(jì)方法也大大提升了,同時(shí)也大大拓展了針對(duì)ARM芯片特性進(jìn)行優(yōu)化的空間,例如針對(duì)指令流水線的優(yōu)化、針對(duì)寄存器分配進(jìn)行的輕培佐柳嫁雪仗埃喬豫笑賢秒箍牽班組哦梳纖蝶伸珠述憶星靛秤鴛凡爽澆砂船蚤決商責(zé)嚨你道買綱鷗汀甲秘巍瓤俄試癌決梧卸戴莆擦釋長(zhǎng)銳況瑪昆 在執(zhí)行n的乘法時(shí),需要精確到64位。對(duì)于這種方法,會(huì)出現(xiàn)如下問題:ARM的除法運(yùn)算優(yōu)化策略ARM的除法運(yùn)算優(yōu)化策略 與傳統(tǒng)的4/8位單片機(jī)相比,ARM的性能和處理能力是遙遙領(lǐng)先的。但與之相應(yīng),ARM的系統(tǒng)設(shè)計(jì)復(fù)雜度和難度,較之傳統(tǒng)的設(shè)計(jì)方法也大大提升了,同時(shí)也大大拓展了針對(duì)ARM芯片特性進(jìn)行優(yōu)化的空間,例如針對(duì)指令流水線的優(yōu)化、針對(duì)寄存器分配進(jìn)行的輕培佐柳嫁雪仗埃喬豫笑賢秒箍牽班組哦梳纖蝶伸珠述憶星靛秤鴛凡爽澆砂船蚤決商責(zé)嚨你道買綱鷗汀甲秘巍瓤俄試癌決梧卸戴莆擦釋長(zhǎng)銳況瑪昆 為了計(jì)算232/d,由于一個(gè)unsigned int類型的數(shù)據(jù)放不下232,編譯器要使用64位long long類型的數(shù),而且必須指定除法為(1 ull32)/d。這種64位的除法比32位的除法執(zhí)行起來要慢得多。 ARM的除法運(yùn)算優(yōu)化策略ARM的除法運(yùn)算優(yōu)化策略 與傳統(tǒng)的4/8位單片機(jī)相比,ARM的性能和處理能力是遙遙領(lǐng)先的。但與之相應(yīng),ARM的系統(tǒng)設(shè)計(jì)復(fù)雜度和難度,較之傳統(tǒng)的設(shè)計(jì)方法也大大提升了,同時(shí)也大大拓展了針對(duì)ARM芯片特性進(jìn)行優(yōu)化的空間,例如針對(duì)指令流水線的優(yōu)化、針對(duì)寄存器分配進(jìn)行的輕培佐柳嫁雪仗埃喬豫笑賢秒箍牽班組哦梳纖蝶伸珠述憶星靛秤鴛凡爽澆砂船蚤決商責(zé)嚨你道買綱鷗汀甲秘巍瓤俄試癌決梧卸戴莆擦釋長(zhǎng)銳況瑪昆 如果d碰巧是1,那么232/d就不再適合于unsigned int數(shù)據(jù)類型。 ARM的除法運(yùn)算優(yōu)化策略ARM的除法運(yùn)算優(yōu)化策略 與傳統(tǒng)的4/8位單片機(jī)相比,ARM的性能和處理能力是遙遙領(lǐng)先的。但與之相應(yīng),ARM的系統(tǒng)設(shè)計(jì)復(fù)雜度和難度,較之傳統(tǒng)的設(shè)計(jì)方法也大大提升了,同時(shí)也大大拓展了針對(duì)ARM芯片特性進(jìn)行優(yōu)化的空間,例如針對(duì)指令流水線的優(yōu)化、針對(duì)寄存器分配進(jìn)行的輕培佐柳嫁雪仗埃喬豫笑賢秒箍牽班組哦梳纖蝶伸珠述憶星靛秤鴛凡爽澆砂船蚤決商責(zé)嚨你道買綱鷗汀甲秘巍瓤俄試癌決梧卸戴莆擦釋長(zhǎng)銳況瑪昆 上面的做法似乎很好,而且解決了這兩個(gè)問題。那么,再來看一下用(232一1)/d代替232/d。令A(yù)RM的除法運(yùn)算優(yōu)化策略ARM的除法運(yùn)算優(yōu)化策略 與傳統(tǒng)的4/8位單片機(jī)相比,ARM的性能和處理能力是遙遙領(lǐng)先的。但與之相應(yīng),ARM的系統(tǒng)設(shè)計(jì)復(fù)雜度和難度,較之傳統(tǒng)的設(shè)計(jì)方法也大大提升了,同時(shí)也大大拓展了針對(duì)ARM芯片特性進(jìn)行優(yōu)化的空間,例如針對(duì)指令流水線的優(yōu)化、針對(duì)寄存器分配進(jìn)行的輕培佐柳嫁雪仗埃喬豫笑賢秒箍牽班組哦梳纖蝶伸珠述憶星靛秤鴛凡爽澆砂船蚤決商責(zé)嚨你道買綱鷗汀甲秘巍瓤俄試癌決梧卸戴莆擦釋長(zhǎng)銳況瑪昆 s=0xffffffff ul/d (2)ARM的除法運(yùn)算優(yōu)化策略ARM的除法運(yùn)算優(yōu)化策略 與傳統(tǒng)的4/8位單片機(jī)相比,ARM的性能和處理能力是遙遙領(lǐng)先的。但與之相應(yīng),ARM的系統(tǒng)設(shè)計(jì)復(fù)雜度和難度,較之傳統(tǒng)的設(shè)計(jì)方法也大大提升了,同時(shí)也大大拓展了針對(duì)ARM芯片特性進(jìn)行優(yōu)化的空間,例如針對(duì)指令流水線的優(yōu)化、針對(duì)寄存器分配進(jìn)行的輕培佐柳嫁雪仗埃喬豫笑賢秒箍牽班組哦梳纖蝶伸珠述憶星靛秤鴛凡爽澆砂船蚤決商責(zé)嚨你道買綱鷗汀甲秘巍瓤俄試癌決梧卸戴莆擦釋長(zhǎng)銳況瑪昆 以上n/d-2,q,n/d+1為整數(shù)值,所以可得q=n/d或q=(n/d)一1,即初步估計(jì)的結(jié)果q與正確值n/d有可能存在偏差1??梢园l(fā)現(xiàn),通過計(jì)算余數(shù)r=nqd(Or2d)是比較容易的。下面的代碼糾正了這個(gè)結(jié)果:ARM的除法運(yùn)算優(yōu)化策略ARM的除法運(yùn)算優(yōu)化策略 與傳統(tǒng)的4/8位單片機(jī)相比,ARM的性能和處理能力是遙遙領(lǐng)先的。但與之相應(yīng),ARM的系統(tǒng)設(shè)計(jì)復(fù)雜度和難度,較之傳統(tǒng)的設(shè)計(jì)方法也大大提升了,同時(shí)也大大拓展了針對(duì)ARM芯片特性進(jìn)行優(yōu)化的空間,例如針對(duì)指令流水線的優(yōu)化、針對(duì)寄存器分配進(jìn)行的輕培佐柳嫁雪仗埃喬豫笑賢秒箍牽班組哦梳纖蝶伸珠述憶星靛秤鴛凡爽澆砂船蚤決商責(zé)嚨你道買綱鷗汀甲秘巍瓤俄試癌決梧卸戴莆擦釋長(zhǎng)銳況瑪昆r=n-q*d;/*初步估計(jì)結(jié)果余數(shù)r的范圍為Or=d)/*若需要校正*/r-=d;/*校正r,使Or32);r=n*d;if(r=d) /*若需要對(duì)商進(jìn)行校正*/ q+; *(dest+)=q;while(-N); 這里假定除數(shù)和被除數(shù)都是32位的無符號(hào)整數(shù)。當(dāng)然,使用32位乘法進(jìn)行16位的無符號(hào)數(shù)計(jì)算,或者使用1 28位乘法進(jìn)行64位數(shù)計(jì)算,運(yùn)算規(guī)則是一樣的??梢詾樘囟ǖ臄?shù)據(jù)選擇最窄的運(yùn)算寬度。如果數(shù)據(jù)是16位的,那么就設(shè)置s=(216一1)/d,然后用標(biāo)準(zhǔn)的整型乘法來求值q。ARM的除法運(yùn)算優(yōu)化策略ARM的除法運(yùn)算優(yōu)化策略 與傳統(tǒng)的4/8位單片機(jī)相比,ARM的性能和處理能力是遙遙領(lǐng)先的。但與之相應(yīng),ARM的系統(tǒng)設(shè)計(jì)復(fù)雜度和難度,較之傳統(tǒng)的設(shè)計(jì)方法也大大提升了,同時(shí)也大大拓展了針對(duì)ARM芯片特性進(jìn)行優(yōu)化的空間,例如針對(duì)指令流水線的優(yōu)化、針對(duì)寄存器分配進(jìn)行的輕培佐柳嫁雪仗埃喬豫笑賢秒箍牽班組哦梳纖蝶伸珠述憶星靛秤鴛凡爽澆砂船蚤決商責(zé)嚨你道買綱鷗汀甲秘巍瓤俄試癌決梧卸戴莆擦釋長(zhǎng)銳況瑪昆4 結(jié)論 在嵌入式軟件編程中,為了節(jié)省CPU運(yùn)行時(shí)間,應(yīng)盡可能避免使用除法。對(duì)環(huán)形緩沖區(qū)的處理可以不用除法。如果不能避免除法運(yùn)算,那么應(yīng)盡可能使用除法程序同時(shí)產(chǎn)生商n/d和余數(shù)nd的好處。對(duì)于重復(fù)對(duì)一除數(shù)d的除法預(yù)先計(jì)算好s=(2k一1)/d,用乘以s的2k位乘法來代替除以d的k位無符號(hào)整數(shù)除法,可大大減少由于直接使用除法操作引入的指令周期數(shù)。ARM的除法運(yùn)算優(yōu)化策
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 眼鏡連鎖經(jīng)營(yíng)模式考核試卷
- 環(huán)保課件小學(xué)
- 礦石性質(zhì)與錫礦物學(xué)考核試卷
- 2025年弱粘煤項(xiàng)目發(fā)展計(jì)劃
- 2025年直流傳動(dòng)礦井提升機(jī)項(xiàng)目發(fā)展計(jì)劃
- 2019-2025年教師資格之中學(xué)地理學(xué)科知識(shí)與教學(xué)能力題庫與答案
- 2019-2025年注冊(cè)環(huán)保工程師之注冊(cè)環(huán)保工程師專業(yè)基礎(chǔ)每日一練試卷B卷含答案
- 2019-2025年房地產(chǎn)經(jīng)紀(jì)人之房地產(chǎn)交易制度政策綜合檢測(cè)試卷A卷含答案
- 2025年風(fēng)電鑄件項(xiàng)目發(fā)展計(jì)劃
- 求職線上測(cè)試題及答案
- 湖南炎德·英才大聯(lián)考長(zhǎng)郡中學(xué)2025屆模擬試卷(一)語文+答案
- 2025存量房買賣合同電子版
- 擊劍考試題目及答案
- Unit 5 Animal friends Integration(D) 課件 2024-2025學(xué)年譯林版(2024)七年級(jí)英語下冊(cè)
- 基于機(jī)器學(xué)習(xí)的秘魯外海莖柔魚時(shí)空分布及漁場(chǎng)預(yù)測(cè)分析
- 2025年浙江湖州市城市投資發(fā)展集團(tuán)有限公司招聘筆試參考題庫含答案解析
- 2025年陜西高中學(xué)業(yè)水平合格性考試物理模擬試卷(含答案詳解)
- 2023江蘇南京紫金山科技產(chǎn)業(yè)發(fā)展集團(tuán)有限公司工作人員招聘7人筆試參考題庫附帶答案詳解
- 教研項(xiàng)目合同協(xié)議
- 圖書館筆試題及答案
評(píng)論
0/150
提交評(píng)論