版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、分位數(shù)回歸在大氣環(huán)境中的應(yīng)用摘要:文中給出了分位數(shù)回歸的方法,并將其應(yīng)用于大氣環(huán)境濃度中進(jìn)行了實(shí)證分析。文中采用紐約市1973年5月到7月三個(gè)月的數(shù)據(jù)對(duì)太陽(yáng)輻射、溫度以及風(fēng)速對(duì)臭氧濃度的影響進(jìn)行了相關(guān)分析,利用用分位數(shù)回歸模型進(jìn)行了求解,得到了多種模型結(jié)果。關(guān)鍵字:臭氧,臭氧濃度,輻射,分位數(shù)回歸現(xiàn)今,大氣中臭氧層對(duì)地球生物的保護(hù)作用已經(jīng)廣為人知,它能夠吸收太陽(yáng)釋放出來(lái)的絕大部分紫外線,使得動(dòng)植物免遭其危害。但是由于工業(yè)的發(fā)展而帶來(lái)的環(huán)境污染等因素,使得地球外圍的臭氧層日益稀薄甚至出現(xiàn)空洞。為了應(yīng)對(duì)臭氧層逐漸遭受破壞,并由此產(chǎn)生的對(duì)動(dòng)植物的廣泛而嚴(yán)重的威脅局面,國(guó)際出臺(tái)多種政策,推廣專門針對(duì)臭
2、氧層保護(hù)的技術(shù)和標(biāo)準(zhǔn),以減少進(jìn)一步破壞甚至彌補(bǔ)日漸稀薄的臭氧層乃至臭氧層空洞。1987年通過(guò),并于1989年生效的蒙特利爾議定書標(biāo)志著世界各國(guó)共同應(yīng)對(duì)臭氧層破壞的開始,此后,世界各國(guó)積極采用先進(jìn)技術(shù),比如推廣使用無(wú)氟制冷劑等措施,以減少氟利昂等物質(zhì)對(duì)臭氧層的破壞。世界上還為此專門設(shè)立國(guó)際保護(hù)臭氧層日。然而,大量的保護(hù)臭氧層保護(hù)環(huán)境的宣傳給人的印象似乎是受到保護(hù)的臭氧應(yīng)該越多越好,其實(shí)并不是這樣,如果大氣中的臭氧,尤其是地面附近的大氣中的臭氧聚集過(guò)多,臭氧濃度過(guò)高,對(duì)人類來(lái)說(shuō)反而是個(gè)禍害。臭氧是地球大氣中一種微量氣體,它是由于大氣中氧分子受太陽(yáng)輻射分解成氧原子后,氧原子又與周圍的氧分子結(jié)合而形成
3、的,含有3個(gè)氧原子。大氣中90以上的臭氧存在于大氣層的上部或平流層,離地面有1050千米,這才是需要人類保護(hù)的大氣臭氧層。還有少部分的臭氧分子徘徊在近地面,仍能對(duì)阻擋紫外線有一定作用。但是,近年發(fā)現(xiàn)地面附近大氣中的臭氧濃度有快速增高的趨勢(shì),也引起了環(huán)境學(xué)家的注意。地面附近越來(lái)越多的臭氧,同鉛污染、硫化物等一樣,來(lái)源于人類活動(dòng),汽車、燃料、石化等是臭氧的重要污染源。在車水馬龍的街上行走,我們常??吹接行┛諝饴詭\棕色,又有一股辛辣刺激的氣味,這就是我們經(jīng)常提到的光化學(xué)煙霧。臭氧就是光化學(xué)煙霧的主要成分,它不是直接被排放的,而是轉(zhuǎn)化而成的,比如汽車排放的氮氧化物,只要在陽(yáng)光輻射及適合的氣象條件下就
4、可以生成臭氧。隨著汽車和工業(yè)排放的增加,地面臭氧污染在歐洲、北美、日本以及我國(guó)的許多城市中成為普遍現(xiàn)象。根據(jù)專家目前所掌握的資料估計(jì),到2005年,近地面大氣臭氧層將成為影響我國(guó)華北地區(qū)空氣質(zhì)量的主要污染物。研究表明,空氣中臭氧濃度在0.012ppm(百萬(wàn)分之一)水平時(shí)這也是許多城市中典型的水平,能導(dǎo)致人皮膚刺癢,眼睛、鼻咽、呼吸道受刺激,肺功能受影響,引起咳嗽、氣短和胸痛等癥狀;空氣中臭氧水平提高到0.05ppm,入院就醫(yī)人數(shù)平均上升710。原因就在于,作為強(qiáng)氧化劑,臭氧幾乎能與任何生物組織反應(yīng)。當(dāng)臭氧被吸入呼吸道時(shí),就會(huì)與呼吸道中的細(xì)胞、流體和組織很快反應(yīng),導(dǎo)致肺功能減弱和組織損傷。對(duì)那些
5、患有氣喘病、肺氣腫和慢性支氣管炎的人來(lái)說(shuō),臭氧的危害更為明顯。本文將通過(guò)分析太陽(yáng)輻射、風(fēng)速和日最高溫度與臭氧濃度的關(guān)系,用統(tǒng)計(jì)學(xué)方法從數(shù)據(jù)中挖掘出可靠的信息,以便在生活中預(yù)測(cè)戶外的地面臭氧濃度,具體而言,就是在一定的溫度、日照、風(fēng)速等氣象條件下為人們提供準(zhǔn)確的預(yù)警信息。一、模型建立1.1分位數(shù)回歸理論統(tǒng)計(jì)學(xué)上“回歸”一詞最初是由高爾頓提出的,高爾頓在研究人類身高遺傳的時(shí)候發(fā)現(xiàn)這么一個(gè)規(guī)律:父母身高高,其子女的身高有低于父母身高的趨勢(shì),父母身高矮,其子女的身高有高于父母身高的優(yōu)勢(shì)。所有身高高、低的人的子女都有“回歸”到平均身高的趨勢(shì)。這樣就解釋了人類身高沒(méi)有出現(xiàn)兩極分化的現(xiàn)象。1886年,高爾頓
6、正式提出了“回歸”的概念,并通過(guò)他的學(xué)生皮爾遜多年的研究和發(fā)展,使得這個(gè)生物學(xué)領(lǐng)域的概念被推廣成為統(tǒng)計(jì)方法中的重要概念。傳統(tǒng)的線性回歸模型描述了因變量的條件分布受到自變量 x 的影響過(guò)程。普通最小二乘法是回歸分析中經(jīng)典的、應(yīng)用最為廣為的回歸方法,其解釋與人們的直觀想象相一致,且易于計(jì)算,它描述了自變量 x 對(duì)于因變量 y 的均值影響。如果模型中的隨機(jī)擾動(dòng)項(xiàng)來(lái)自均值為零而且同方差的分布,那么回歸系數(shù)的最小二乘估計(jì)為最佳線性無(wú)偏估計(jì)(blue) ;如果近一步隨機(jī)擾動(dòng)項(xiàng)服從正態(tài)分布,那么回歸系數(shù)的最小二乘法或極大似然估計(jì)為最小方差無(wú)偏估計(jì)(mvue)。但是在實(shí)際的經(jīng)濟(jì)生活中,能夠滿足上述條件的情況并
7、不多見(jiàn);例如數(shù)據(jù)出現(xiàn)尖峰或厚尾的分布、存在顯著的異方差等情況,這時(shí)的最小二乘法估計(jì)將不再具有上述優(yōu)良性且穩(wěn)健性非常差。最小二乘回歸假定自變量 x 只能影響因變量的條件分布的位置,但不能影響其分布的刻度或形狀的任何其他方面。由于最小二乘的估計(jì)結(jié)果穩(wěn)健性較差,容易受到異常點(diǎn)或缺失點(diǎn)的影響。即使所遇到的問(wèn)題滿足上述情況,大量的寶貴數(shù)據(jù)通過(guò)最小二乘回歸分析方法也只能估計(jì)出一條回歸曲線,得到的信息還比較有限,很不全面。因此,在使用最小二乘回歸的同時(shí),人們也在不斷的尋找更好的、能夠提供更全面數(shù)據(jù)信息的回歸分析方法。1978年,koenker和bassett首次提出了“分位數(shù)回歸”的概念。1818年lapl
8、ace曾提出中位數(shù)回歸理論,他們?cè)诖嘶A(chǔ)上把中位數(shù)回歸推廣到成為一般的分位數(shù)回歸。與最小二乘回歸相比,分位數(shù)回歸的應(yīng)用條件更為寬松,挖掘出的數(shù)據(jù)信息更加豐富,它可以度量回歸變量在分布中心的影響,還可以捕捉整個(gè)條件分布的特征,度量回歸變量在分布上尾和下尾的影響。尤其在假設(shè)誤差為非正態(tài)分布的時(shí)候,分位數(shù)回歸估計(jì)量的有效性要強(qiáng)于最小二乘估計(jì)量,因此,分位數(shù)回歸彌補(bǔ)了最小二乘回歸的不足。在近二、三十年中,koenker,bassett,powell,chernozhukov等人為分位數(shù)理論的發(fā)展做出了巨大的貢獻(xiàn)。koenker和bassett在1978年把響應(yīng)變量作為其他變量的線性函數(shù),推到出分位數(shù)回
9、歸系數(shù)的漸進(jìn)分布,發(fā)展了線性分位數(shù)回歸理論;1982年,他們又研究了分位數(shù)回歸的異方差穩(wěn)健性檢驗(yàn)和線性假設(shè)檢驗(yàn),為分位數(shù)回歸提供了可靠的保證;1986年,bassett等人又研究了分位數(shù)回歸強(qiáng)相合性等性質(zhì);也在這一年,powell基于刪失模型提出了非線性分位數(shù)回歸;kim和white研究了非線性分位數(shù)回歸估計(jì)量的一致性等性質(zhì);1987年,koenker 等人提出了針對(duì)線性模型的 l 估計(jì)法;同年,koenker等人提出了關(guān)于分位數(shù)回歸的有效算法;buchinsky在 1995 年和 1998 年分別討論了分位數(shù)回歸模型漸近協(xié)方差矩陣的估計(jì)方法,和分位數(shù)回歸一些最新發(fā)展,并應(yīng)用它分析了美國(guó)女性薪
10、水結(jié)構(gòu)的變化情況;2000 年,koenker 和 zhijie xiao解決了分位數(shù)回歸過(guò)程中存在的特定推斷問(wèn)題;同年,kim 和 muller二人研究了兩步分位數(shù)回歸的漸近特性;2001 年,tasche對(duì)分位數(shù)回歸的無(wú)偏性進(jìn)行了研究;2002 年,koenker 等人對(duì)線性異方差模型的 l 估計(jì)法進(jìn)行了討論。此外,chernozhukov 和 han hong提出了關(guān)于刪失分位數(shù)回歸的三步評(píng)估的研究方法;吳建南和 bretschneider 等用蒙特卡羅(monte carlo)方法隨機(jī)產(chǎn)生出來(lái)的 100 個(gè)數(shù)據(jù)集合用以來(lái)比較分位數(shù)回歸和顯著加權(quán)分析方法的優(yōu)劣;kottas 和 krnj
11、ajic又提出分位數(shù)回歸中的貝葉斯非參數(shù)模型;chernozhukov提出了極端分位數(shù)的概念,推導(dǎo)出極端分位數(shù)的漸近分布及其在經(jīng)濟(jì)領(lǐng)域的應(yīng)用。至此,人們基本建立了分位數(shù)回歸的理論體系。近 10 多年來(lái),分位數(shù)回歸在國(guó)外得到了迅猛的發(fā)展及應(yīng)用,其研究領(lǐng)域包括經(jīng)濟(jì)、 醫(yī)學(xué)、環(huán)境科學(xué)、生存分析以及動(dòng)植物學(xué)等方面。為了說(shuō)明分位數(shù)回歸的有用性,我們特介紹兩個(gè)分位數(shù)回歸實(shí)證分析的例子。koenker 和 machado 分析了 19651975以及 19751985這兩段時(shí)間內(nèi)世界主要國(guó)家的經(jīng)濟(jì)增長(zhǎng)情況,模型選取了13個(gè)影響經(jīng)濟(jì)增長(zhǎng)的自變量,通過(guò)分位數(shù)回歸得出結(jié)論:對(duì)于起初的單位資本產(chǎn)出這一自變量來(lái)說(shuō),它
12、的全部回歸分位系數(shù)基本保持不變,這就意味著對(duì)于經(jīng)濟(jì)發(fā)展迅速與緩慢的國(guó)家而言,起初的單位資本產(chǎn)出對(duì)于經(jīng)濟(jì)增長(zhǎng)的影響基本相同;但是教育支出占 gdp的比重以及公共消費(fèi)占 gdp 的比重這兩個(gè)自變量對(duì)于經(jīng)濟(jì)發(fā)展緩慢的國(guó)家影響更加的強(qiáng)烈。chen使用分位數(shù)回歸方法深入研究了美國(guó)8250名男性的bmi (身體質(zhì)量指數(shù),一種廣泛用于測(cè)量偏胖還是偏瘦的指標(biāo),bmi=體重/身高2)情況,并得出結(jié)論:在 220 歲這一快速成長(zhǎng)期中,bmi 非常迅速的增加;在中年期間其值保持比較穩(wěn)定;60歲以后,bmi的值開始減少。這對(duì)于如何保持一健康的身體提供了一種非常有效的措施 ,可以在各個(gè)階段中分別采取相應(yīng)的控制體重的方法
13、。在分位數(shù)回歸提出及發(fā)展的早期階段,由于本身計(jì)算的復(fù)雜性,分位數(shù)回歸并沒(méi)能像經(jīng)典的回歸分析那樣迅速普及,但是隨著分位數(shù)回歸理論的完善,關(guān)于分位數(shù)回歸的算法也在不斷地發(fā)展中,現(xiàn)在應(yīng)用最為廣泛的有以下三種:(1)單純形法,即任選一個(gè)頂點(diǎn),然后沿著可行解圍成的多邊形的邊界搜索,直到找到最優(yōu)點(diǎn),這種算法的特點(diǎn)決定其適合樣本量不大和變量不多的情形;(2)預(yù)處理后內(nèi)點(diǎn)法,即對(duì)回歸系數(shù)預(yù)處理后,再用內(nèi)點(diǎn)法,它適合樣本量大于 10 的情形;(3)內(nèi)點(diǎn)法,即從可行解圍成的多邊形一個(gè)內(nèi)點(diǎn)出發(fā),但不出邊界,直到找到最優(yōu)點(diǎn),它對(duì)于處理大樣本問(wèn)題時(shí)效率比較高。而由于計(jì)算機(jī)的輔助功效,分位數(shù)回歸在近幾年逐步成為了經(jīng)濟(jì)、醫(yī)
14、學(xué)、教育等領(lǐng)域的常用分析工具。對(duì)于分位數(shù)理論的應(yīng)用,國(guó)外的研究以及應(yīng)用的文章相對(duì)很多,主要有 barnes 和w.hughes利用分位數(shù)回歸對(duì)跨部門公債市場(chǎng)的回報(bào)率進(jìn)行了分析;buchinsky應(yīng)用分位數(shù)回歸研究了 1963 年至 1987 年美國(guó)工資結(jié)構(gòu)的變化趨勢(shì);bouyé 和salmon應(yīng)用非線性分位數(shù)回歸研究了匯率市場(chǎng)中不同匯率之間尾部區(qū)域的風(fēng)險(xiǎn)相關(guān)性;buhai在回顧分位數(shù)回歸方法的基礎(chǔ)上,研究了它的兩個(gè)主要應(yīng)用,分別是持續(xù)時(shí)期模型和循環(huán)結(jié)構(gòu)等式模型;leggett 和 craighead利用分位數(shù)回歸確定了時(shí)間的分布和特定風(fēng)險(xiǎn)驅(qū)動(dòng)的影響;whittaker 等在信用貸款記
15、賬方面應(yīng)用該技術(shù)進(jìn)行分析。然而,國(guó)內(nèi)關(guān)于分位數(shù)回歸的研究較少,且大多數(shù)都停留在應(yīng)用上。如曾昭玲等利用分位數(shù)回歸模型探討負(fù)債融資及權(quán)益融資在不同分位數(shù)時(shí),受解釋變量影響的差異性,以期對(duì)于不同融資程度的公司受資本結(jié)構(gòu)變量及眾變量影響的差異性進(jìn)行深入了解;蔡明璋利用分位數(shù)回歸模型估計(jì)家務(wù)工作時(shí)間的變異分配;荀鵬程等對(duì)中位數(shù)回歸模型進(jìn)行了介紹,并將其應(yīng)用于北京市sars發(fā)病預(yù)測(cè)中;季莘等對(duì)百分位數(shù)回歸進(jìn)行了介紹,并將其應(yīng)用于制訂正常人群血壓參考值的研究。此外,李育安介紹了分位數(shù)回歸的概念、算法以及在經(jīng)濟(jì)領(lǐng)域的應(yīng)用;吳建南和馬偉把分位數(shù)回歸技術(shù)與顯著加權(quán)法通過(guò)估計(jì)極端行為參數(shù)的能力進(jìn)行了比較??傊?,國(guó)內(nèi)
16、關(guān)于分位數(shù)回歸理論及應(yīng)用的研究在不斷地發(fā)展和完善。1.2分位數(shù)回歸基本概念及定理 2.1分位數(shù)回歸的定義如果在一組規(guī)模為的樣本中,第個(gè)樣本的觀測(cè)值超過(guò)了()個(gè)其他樣本觀測(cè)值,而低于個(gè)樣本的觀測(cè)值,那么,我們就說(shuō)樣本的觀測(cè)值排在全體樣本的第分位。樣本成為分位點(diǎn),樣本觀測(cè)值為分位數(shù)。對(duì)于任意分布函數(shù)為的實(shí)值隨機(jī)變量x,任意的滿足,有則稱是x的分位數(shù),也可記為。當(dāng)時(shí),稱為中位數(shù)。我們可以把分位數(shù)看做是一個(gè)優(yōu)化問(wèn)題的解。仿照最小二乘方法,解下式由此得到為樣本均值。當(dāng)給定時(shí),如果把的條件均值記為,即是的線性函數(shù),則可以由估計(jì)得到,這就是經(jīng)典的最小二乘回歸問(wèn)題。同樣的,求解可以得到,即為樣本的分位數(shù)。當(dāng)是
17、給定的時(shí)候,的條件分布函數(shù)幾座,其反函數(shù)為。定義為樣本條件分位數(shù)函數(shù),其中為維向量。則可以由估計(jì)得到。這個(gè)思想最早是由koenker和bassett提出的。更深一步,我們可以把上式整理為其中,為系數(shù)向量,并且它是的函數(shù),隨的變化而變化。2.2 分位數(shù)回歸的漸進(jìn)理論對(duì)于獨(dú)立隨機(jī)變量,其分布函數(shù)分別是。而的個(gè)觀測(cè)值組成了向量。假設(shè)分位數(shù)函數(shù)關(guān)于協(xié)變量為線性的,其中為參數(shù)向量。變量的條件分布函數(shù)可以寫成。定理1 當(dāng)滿足條件(1) 分布函數(shù)絕對(duì)連續(xù),而且其連續(xù)密度函數(shù)在點(diǎn)的范圍是;(2) 存在正定矩陣,使得 時(shí)有,對(duì)于假設(shè)誤差服從獨(dú)立同分布的模型有,這里。2.3分位數(shù)回歸的適用情況和優(yōu)勢(shì)分位數(shù)回歸主要
18、針對(duì)的對(duì)象是多個(gè)輸入變量、單個(gè)輸出變量的模型,也就是我們常見(jiàn)的多個(gè)自變量,一個(gè)因變量的情況。分位數(shù)回歸同其他大多數(shù)的統(tǒng)計(jì)分析技術(shù)一樣,首先需要選定研究模型,確定諸如自變量和因變量相互關(guān)系、自變量和自變量相互關(guān)系等研究假設(shè)。然后,根據(jù)原始的測(cè)量數(shù)據(jù),繪制散點(diǎn)圖,觀察原始數(shù)據(jù)點(diǎn)的分布,初步判定數(shù)據(jù)分布的類型(線性分布或者非線性分布等)。當(dāng)數(shù)據(jù)分布中存在較多孤立點(diǎn)或者奇異點(diǎn)的時(shí)候,分位數(shù)回歸的應(yīng)用意義比較大,效果相對(duì)于其他回歸分析要較好。在使用分位數(shù)回歸分析的時(shí)候,對(duì)于分位數(shù)的選取也是很重要的??梢赃x取特定一個(gè)分位數(shù),也可以選定一組或者滿足一定變化范圍的分位數(shù),例如0.25、0.5、0.75等。分位
19、數(shù)選取的個(gè)數(shù)由樣本容量的大小來(lái)決定,容量大的樣本選取的分位數(shù)個(gè)數(shù)要多一些,容量小的樣本可以選取較少個(gè)數(shù)的分位數(shù)。除了變量個(gè)數(shù)一定要小于樣本容量以為,分位數(shù)回歸分析中并沒(méi)有對(duì)于關(guān)于自變量個(gè)數(shù)上限的具體規(guī)定。但是,如果分析當(dāng)中的變量個(gè)數(shù)接近樣本容量的時(shí)候,就會(huì)犧牲自由度,函數(shù)模型的預(yù)測(cè)能力會(huì)更多的被多余的變量的影響,這就要求當(dāng)樣本容量較小的時(shí)候適當(dāng)?shù)倪x取自變量。當(dāng)樣本容量較大的時(shí)候,就比較不用考慮這個(gè)問(wèn)題。分位數(shù)回歸是采用最小化加權(quán)殘差絕對(duì)值這和的方法來(lái)估計(jì)參數(shù)的,它的優(yōu)點(diǎn)主要有以下幾點(diǎn):分位數(shù)回歸對(duì)于模型中出現(xiàn)的隨機(jī)誤差項(xiàng)的分布不做要求,這樣就使的分位數(shù)回歸的適用范圍更加廣泛;分位數(shù)回歸具有很好
20、的穩(wěn)健性,其參數(shù)的估計(jì)值不受或很少受到異常點(diǎn)的影響;分位數(shù)回歸的分位點(diǎn)取值不同時(shí),所得到的參數(shù)估計(jì)值也會(huì)不同,也就是取多個(gè)值,就可以挖掘數(shù)據(jù)中相對(duì)全面的信息。二、實(shí)證分析3.2 數(shù)據(jù)分析我們選取紐約市1973年5月9月這111天的臭氧濃度(ppb十億分之一),風(fēng)速(mph每小時(shí)英里數(shù)),日最高溫度(f華氏溫度)和太陽(yáng)輻射(langley蘭利)的日測(cè)數(shù)據(jù)為原始數(shù)據(jù)。樣本容量為444個(gè),對(duì)這些數(shù)據(jù)的基本描述統(tǒng)計(jì)量如表3.1所示:表3.1 基本描述統(tǒng)計(jì)量臭氧濃度太陽(yáng)輻射溫度風(fēng)速均值42.0991184.801877.79289.938739方差1107.298308.74290.8203112.66
21、803標(biāo)準(zhǔn)差33.2759791.15239.529973.559218中位數(shù)31207799.7峰度系數(shù)1.265266-0.4929331-0.22819120.459958偏度系數(shù)1.31654-0.9164162-0.6430780.3500279下表是臭氧濃度,太陽(yáng)輻射,溫度和風(fēng)速原始數(shù)據(jù)得到的關(guān)系系數(shù)矩陣,由此可以看出,臭氧濃度與太陽(yáng)輻射、溫度正相關(guān),與風(fēng)速負(fù)相關(guān),而且太陽(yáng)輻射、溫度和風(fēng)速三個(gè)元素之間也并不是相互獨(dú)立的。表3.2 變量間的相關(guān)系數(shù)ozoneradiationtemperaturewindzone10.34834170.6985414-0.612951radiatio
22、n0.348341710.2940876-0.127366temperature0.69854140.29408761-0.497146wind-0.612951-0.127366-0.4971461 下面是根據(jù)溫度和風(fēng)速的劃分下臭氧濃度關(guān)于太陽(yáng)輻射的散點(diǎn)圖。圖3.1圖3.1中o代表臭氧濃度,r代表太陽(yáng)輻射,w代表風(fēng)速,t代表溫度。本圖講溫度和風(fēng)速劃分為四個(gè)區(qū)間,且為了顯著性,每個(gè)區(qū)間都有重疊。從圖中我們可以看出,在溫度和風(fēng)速的劃分下,臭氧濃度和太陽(yáng)輻射的散點(diǎn)圖呈現(xiàn)了某種線性趨勢(shì)。3.3 建立模型經(jīng)過(guò)分析,我們知道,臭氧濃度和太陽(yáng)輻射呈現(xiàn)某種線性趨勢(shì),因此,我們采用下面的現(xiàn)行條件分位數(shù)回歸模型
23、建模。其中,參數(shù)估計(jì)值有分位數(shù)函數(shù)估計(jì)得到。表3給出了不同的溫度、風(fēng)速條件下,時(shí),和的估計(jì)值。表3.321溫度小于80,風(fēng)速小于102.701298700.051948058.929411760.0470588218.32520325 0.0406504121.55605380.103139062.56451613-0.06989247溫度大于80,風(fēng)速小于102.77777780.1717172-1.00000000.236220513.5291005 0.30687832.53191490.468085118.00000000.4444444溫度小于80,風(fēng)速大于106.276752770
24、.014760158.520.0212.06896552 0.0344827614.116591930.0493273522.513605440.03741497溫度大于80,風(fēng)速大于106.59197320.100334412.810810810.0810810824.92920354 0.0796460245.463768120.0797101444.54545450.0909091從上面的表中可以看出,同一組數(shù)據(jù)在的取值不同時(shí)參數(shù)和的估計(jì)值是不同的,這比只考慮單一方面性質(zhì)的線性回歸更好更全面的反應(yīng)了數(shù)據(jù)各個(gè)局部的信息。以溫度和風(fēng)速為條件,將臭氧作為太陽(yáng)輻射的函數(shù),用分位數(shù)回歸方法擬合,見(jiàn)
25、圖2。圖2各圖中的五條黑色直線依次是分位數(shù)回歸直線,紅色直線是最小二乘回歸直線。圖3.2這樣我們根據(jù)表3,可以得到分位數(shù)回歸直線方程。例如時(shí),溫度小于80f,風(fēng)速小于10mph,臭氧濃度與太陽(yáng)輻射的關(guān)系是(圖2左上圖最下面黑色直線);溫度大于80f,風(fēng)速小于10mph,臭氧濃度與太陽(yáng)輻射的關(guān)系是(圖2右上圖最下面黑色直線);溫度小于80f,風(fēng)速大于10mph,臭氧濃度與太陽(yáng)輻射的關(guān)系是(圖2左下圖最下面黑色直線);溫度大于80f,風(fēng)速大于10mph,臭氧濃度與太陽(yáng)輻射的關(guān)系是。(圖2右下圖最下面黑色直線)由此可知,當(dāng)溫度小于80f,風(fēng)速小于10mph,的時(shí)候,太陽(yáng)輻射每增加100langley
26、,臭氧濃度增加5.19ppb;當(dāng)溫度大于80f,風(fēng)速小于10mph的時(shí)候,如果太陽(yáng)輻射為200langley的時(shí)候,臭氧濃度不超過(guò)37.12ppb的概率為10%。同時(shí)時(shí),溫度小于80f,風(fēng)速小于10,臭氧濃度與太陽(yáng)輻射的關(guān)系是(圖2左上圖最上面黑色直線);溫度大于80f,風(fēng)速小于10mph,臭氧濃度與太陽(yáng)輻射的關(guān)系是(圖2右上圖最上面黑色直線);溫度小于80f,風(fēng)速大于10mph,臭氧濃度與太陽(yáng)輻射的關(guān)系是(圖2左下圖最上面黑色直線);溫度大于80f,風(fēng)速大于10mph,臭氧濃度與太陽(yáng)輻射的關(guān)系是(圖2右下圖最上面黑色直線)。這也就是說(shuō),當(dāng)溫度大于80f,風(fēng)速小于10mph,太陽(yáng)輻射值為300
27、langley時(shí),臭氧濃度不超過(guò)151.33ppb的概率為90%,如果臭氧濃度在短期內(nèi)頻繁超過(guò)了151.33,也就可以說(shuō)明當(dāng)?shù)丨h(huán)境發(fā)生了意外變化,需要當(dāng)?shù)卣兔癖娨鹱⒁?。由上述四個(gè)式子以及圖2可以看出,當(dāng)溫度較高,風(fēng)速較小的時(shí)候,臭氧濃度正比于太陽(yáng)輻射上升的速度最快,達(dá)到的濃度值相對(duì)較高,當(dāng)溫度較低,風(fēng)速較大的時(shí)候,臭氧濃度較低,而且正比于太陽(yáng)輻射上升的速度也較慢。這也說(shuō)明,夏季無(wú)風(fēng)的晴天城市地面臭氧濃度會(huì)出現(xiàn)較高情況,應(yīng)該提醒市民出行時(shí)避開最高溫時(shí)段,以減少地面臭氧濃度高而對(duì)人們身體健康造成的傷害。而冬天的風(fēng)天地面臭氧濃度較低,比較不會(huì)對(duì)戶外出行的人們?cè)斐缮眢w上的影響。表3.4是我們以溫
28、度小于80f,風(fēng)速小于10mph的原始輻射數(shù)據(jù)作為檢驗(yàn)集,列出不同分為數(shù)的分位數(shù)回歸預(yù)測(cè)結(jié)果、最小二乘回歸預(yù)測(cè)結(jié)果與原始臭氧濃度數(shù)據(jù)的對(duì)比。表3.4 兩種方法結(jié)果的對(duì)比輻射原始數(shù)據(jù)最小二乘臭氧濃度原始數(shù)據(jù)19012.571417.870526.048741.142549.284932.2911411188.831114.482323.121933.726454.317227.47503629918.233722.999930.479652.394641.666739.58212325616.000020.976428.731747.959644.672036.70581629017.76622
29、2.576430.113851.466342.295738.980111444.987011.000020.113826.094159.489222.52511183.11689.305815.650422.381762.005220.11711254.000010.105819.341424.134560.817221.2542422314.285719.423527.390244.556046.978534.498411527917.194822.058829.666750.318843.064538.224337374.623310.670519.829225.372259.978522
30、.05692073.06499.258818.609722.278062.075220.050216515.350611.329420.398326.816159.000022.9933591158.675314.341123.00033.417054.526827.27432321213.714218.905826.943043.421547.747333.76264525916.155821.117628.853648.269044.462336.90652423815.064920.129428.000046.103145.930135.50182823715.012920.082327
31、.959346.000046.000035.434946143.42859.588218.894323.000061.586020.51842319312.727218.011726.170741.461849.075232.4917301329.506415.094123.650435.067253.408628.344518結(jié)語(yǔ)文章用分位數(shù)回歸對(duì)模型進(jìn)行了求解分析,得到了多種模型結(jié)果,相對(duì)于單獨(dú)的最小二乘法更能全面的提取數(shù)據(jù)中的信息,可以給決策者提供更全面的信息支持。分位數(shù)回歸對(duì)于異常值不敏感,這點(diǎn)也是最小二乘方法所不具備的,因此得出的結(jié)果穩(wěn)健性更高,可信度也較高。參考文獻(xiàn)1 koenke
32、r,r.and bassett, g. regression quantiles. econometrical, 1978, 46(1): 33-502 laplace, p. s. theorie analytique des probabilites. editions jacques gabay, paris, 18183 koenker,r.and bassett, g. the asymptotic distribution of the least absolute error estimator. journal of the american statistical assoc
33、iation, 1978, 73: 618-6224 koenker,r.and bassett, g. robust tests for heteroscedasticity based on regression quantiles. econometrica, 1982a, 50: 43-615 koenker,r.and bassett, g. tests of linear hypotheses and l1 estimation. econometrica, 1982b, 50:1577-15846 bassett, g. and koenker, r. strong consis
34、tency of regression quantiles and related empirical processes. econometric theory. 1986, 2: 191-2017 powell, j.l. censored regression quantiles. journal econometrics. 1986, 32: 143-1558 kim tae=hwan and halbert white, estimation, inference and specification testing for possibly misspecified quantile
35、 regression. 2002, ucsd economics dept discussion paper9 koenker, r. and s. portnoy. l-estimation for linear models. journal of the american statistical association. 1987, 82: 851-85710 koenker, r. dorey v. computing regression quantiles. applied statistics, 1987, 36: 383-39311 buchinsky,m. estimati
36、ng the asymptotic govariance matrix for quantile regression models;a monte carlo study. journal of econometrics,1995, 68(2):303338.12 buchinsky,m. recent advances in quantile regression models. the journal of human resources,1998,1:8812613 buchinsky,m. the dynamics of changes in the female wage dist
37、ribution in the usa:a quantile regression approach.journal of applied econometrics,1998,13:1-30.14 koenker,r. and z. xiao. inference on the quantile regression process. econometrica. 2002, 70: 1583-161215 tae-hwan kim and christophe muller. double-stage quantile regressions. econometrica journal. 20
38、04, 7(1):218-23116 dirk tasche. unbiasedness in least quantile regression,200117 koenker,r. and q. zhao. l-estimation for linear heterscedastic models. journal of nonparametric statistics. 1994, 3:223-23518 chernozhuko, v. and h. hong. 3 step censored quantile regression. journal of the american sta
39、tistical association. 2002, 97:872-89719 jiannan wu,stuart bretschneider and fredrick marc-aurele. estimating models of extreme behavior:a monte carlo comparison between swat and quantile regression.chinese public administration review,2002,1(2):365387.20 kottas a. and krnjajic m. 2005. bayesian non
40、parametric modeling in quantile regression. technical report 2005-06, ucsc department of applied math and statistics.21 chernozhukov, v. nonparametric extreme regression quantiles.1998,working paper, standford.22 chernozhukov, v. conditional extremes and near extremes: estimation, inference and econ
41、omic applications.2002, ph.d. dissertation, standford23 chernozhukov, v. extremal quantile regression. ann. statist., 2005, 33(2): 806-83924 koenker r, dorey v. a remark on computing regression quantiles. applied statistics,1993(43):410-414.25 portnoy s, koenker r. the gaussian hare and the laplacia
42、n tortoise:computability of squared-error versus absolute-error estimators. statistical science, 1997 (12):279-300.26 koenker and park. an interior point algorithm for nonlinear quantile regression. journal of econometrics,1996,71:265-283.27 barnes, m. and w. hughes. a quantile regression analysis o
43、f the cross section of stock market returns. working paper, 200228 buchinsky,m. changes in the u.s. wage structure 1963-1987:application of quantile regression. econometrical,1994,62(2):405-458.29 bouyé, e. and m. salmon. dynamic copula quantile regressions and tail area dynamic dependence in f
44、orex markets, 2002, manuscript, financial econometrics research center30 i.sebastian buhai. quantile regression: overview and selected application. unpublished work, 200431 leggett, d. and craighead, s. risk drivers revealed: quantile regression.200032 whittaker, j. and whitehead, c., somers, m. the neglog transformation an quantile regression for the analysis of a large credit scoring database. applied statistics-journal of the royal statistical society series c. 2005, 54:863-87833 曾昭玲,郭乃峰,周時(shí)如.
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 現(xiàn)代農(nóng)業(yè)裝備在種植業(yè)中的技術(shù)優(yōu)勢(shì)
- 現(xiàn)代醫(yī)療技術(shù)中的人才培養(yǎng)與團(tuán)隊(duì)建設(shè)
- 校園文化與企業(yè)文化的對(duì)接與互鑒
- 14《母雞》說(shuō)課稿-2023-2024學(xué)年統(tǒng)編版四年級(jí)語(yǔ)文下冊(cè)
- 24 《古人談讀書》說(shuō)課稿-2024-2025學(xué)年語(yǔ)文五年級(jí)上冊(cè)統(tǒng)編版
- 6 傳統(tǒng)游戲我會(huì)玩2023-2024學(xué)年二年級(jí)下冊(cè)道德與法治同步說(shuō)課稿(統(tǒng)編版)
- 14 圓明園的毀滅 說(shuō)課稿-2024-2025學(xué)年語(yǔ)文五年級(jí)上冊(cè)統(tǒng)編版
- 5 樹和喜鵲(說(shuō)課稿)-2023-2024學(xué)年統(tǒng)編版語(yǔ)文一年級(jí)下冊(cè)
- 17《爬天都峰》說(shuō)課稿-2024-2025學(xué)年統(tǒng)編版語(yǔ)文四年級(jí)上冊(cè)
- 2023三年級(jí)英語(yǔ)下冊(cè) Unit 4 Food and Restaurants Lesson 21 In the Restaurant說(shuō)課稿 冀教版(三起)
- 武漢2025年湖北武漢理工大學(xué)管理人員招聘筆試歷年參考題庫(kù)附帶答案詳解
- 第1課 隋朝統(tǒng)一與滅亡 課件(26張)2024-2025學(xué)年部編版七年級(jí)歷史下冊(cè)
- 提高金剛砂地坪施工一次合格率
- 【歷史】唐朝建立與“貞觀之治”課件-2024-2025學(xué)年統(tǒng)編版七年級(jí)歷史下冊(cè)
- 基于護(hù)士主導(dǎo)的MDT肺康復(fù)管理模式改善肺部術(shù)后患者照護(hù)結(jié)局
- 產(chǎn)業(yè)園區(qū)招商合作協(xié)議書
- 2025新譯林版英語(yǔ)七年級(jí)下單詞默寫表
- 2024-2025學(xué)年人教版八年級(jí)上冊(cè)數(shù)學(xué)期末專項(xiàng)復(fù)習(xí):軸對(duì)稱(易錯(cuò)必刷40題)解析版
- 盾構(gòu)標(biāo)準(zhǔn)化施工手冊(cè)
- 天然氣脫硫完整版本
- 中歐班列課件
評(píng)論
0/150
提交評(píng)論