




已閱讀5頁(yè),還剩53頁(yè)未讀, 繼續(xù)免費(fèi)閱讀
版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第一章多元正態(tài)分布及其參數(shù)估計(jì),多元正態(tài)分布的重要性:(1)多元統(tǒng)計(jì)分析中很多重要的理論和方法都是直接或間接地建立在正態(tài)分布基礎(chǔ)上的,許多統(tǒng)計(jì)量的極限分布往往和正態(tài)分布有關(guān)。(2)許多實(shí)際問(wèn)題涉及的隨機(jī)向量服從多元正態(tài)分布或近似服從正態(tài)分布。因此多元正態(tài)分布是多元統(tǒng)計(jì)分析的基礎(chǔ)。,一、多元正態(tài)分布的定義定義1:若p維隨機(jī)向量的密度函數(shù)為:其中,是p維向量是p階正定矩陣,則稱X服從p維正態(tài)分布,記為,定義2:獨(dú)立標(biāo)準(zhǔn)正態(tài)變量的有限線性組合,稱為m維正態(tài)隨機(jī)變量,記為其中但是的分解一般不是唯一的。定義3:若隨機(jī)向量X的特征函數(shù)為:其中t為實(shí)向量,則稱X服從p元正態(tài)分布。特征函數(shù)定義的優(yōu)點(diǎn)在于可以包含的情況。,二元正態(tài)分布曲面(11=1,22=1,12=0),二元正態(tài)分布曲面(11=2,22=4,12=0.75),二、多元正態(tài)分布的性質(zhì)性質(zhì)1:若,是對(duì)角矩陣,則相互獨(dú)立。性質(zhì)2:若則,性質(zhì)3:若,將作剖分:則,特別地,二元正態(tài)分布:,的邊緣密度函數(shù)為:,當(dāng)時(shí)X1與X2不相關(guān),對(duì)于正態(tài)分布來(lái)說(shuō)不相關(guān)和獨(dú)立等價(jià)。因?yàn)椋?為X1和X2的相關(guān)系數(shù)。,三、正態(tài)分布數(shù)據(jù)的變換,若一批多元數(shù)據(jù)不滿足正態(tài)分布時(shí),一般要對(duì)數(shù)據(jù)進(jìn)行正態(tài)變換。一般來(lái)說(shuō)常采用冪變換,如果想使值變小可以采用變換:,如果想使值變大,則采用變換:,不管使用哪種冪變換,還應(yīng)該對(duì)變換后的數(shù)據(jù)的正態(tài)性做檢驗(yàn)(如Q-Q圖方法),2多元正態(tài)分布的參數(shù)估計(jì)一、多元樣本及其樣本數(shù)字特征多元樣本記,2、多元樣本的數(shù)字特征樣本均值,樣本離差陣,樣本協(xié)方差矩陣或,二、多元正態(tài)總體的最大似然估計(jì)及其性質(zhì)利用最大似然法求出和的最大似然估計(jì)為:,求解過(guò)程似然函數(shù)為:,對(duì)數(shù)似然函數(shù)為:,(引理:設(shè)A為p階正定矩陣,則當(dāng)A=I等號(hào)成立。,最大似然估計(jì)的性質(zhì),即是的無(wú)偏估計(jì)。,即不是的無(wú)偏估計(jì)。,即是無(wú)偏估計(jì)。分別是的最小方差無(wú)偏估量。3.分別是的一致估計(jì)。,維斯特(Wishart)分布-一元分布的推廣,定義:設(shè)個(gè)隨機(jī)向量獨(dú)立同分布于,則隨機(jī)矩陣服從自由度為n的非中心維斯特分布,記為,三、正態(tài)總體下的抽樣分布,隨機(jī)矩陣的分布:,將該矩陣的列向量(或行向量)連接起來(lái)組成的長(zhǎng)向量稱為拉直向量,拉直向量的分布定義為該矩陣的分布,如果是對(duì)稱矩陣則只取其下三角的部分拉直即可。,性質(zhì):,(1)若W1和W2獨(dú)立,其分布分別和,則分布為,即維斯特(Wishart)分布有可加性。,(2),C為mp階的矩陣,則的分布為分布。,定理:設(shè)分別是來(lái)自正態(tài)總體的樣本均值和離差陣,則(1)(2)相互獨(dú)立。S為正定矩陣的充分必要條件是np。,11,一元正態(tài)總體:,為來(lái)自一元正態(tài)總體的一組樣本,定理:,證明:構(gòu)造正交矩陣,做變換,第三章多元正態(tài)總體參數(shù)的假設(shè)檢驗(yàn),HotellingT2分布一元t分布的推廣,定義設(shè),且X與S相互獨(dú)立,則稱統(tǒng)計(jì)量的分布為非中心的HotellingT分布,記為,當(dāng)時(shí)稱為中心的HotellingT2分布。記為,一元t分布:,設(shè)總體是一組樣本,則統(tǒng)計(jì)量,其中,與類似,并且,基本性質(zhì):,定理:設(shè)且X與S相互獨(dú)立,令,則,一、多元正態(tài)總體均值向量的假設(shè)檢驗(yàn),1.單個(gè)正態(tài)總體,(1)協(xié)方差矩陣已知時(shí)均值向量的檢驗(yàn),檢驗(yàn)統(tǒng)計(jì)量,設(shè)水平為,查表確定,使得,(當(dāng)H0成立時(shí)),拒絕域?yàn)椋?當(dāng)原假設(shè)成立時(shí),(2)協(xié)方差矩陣未知時(shí)均值向量的檢驗(yàn),檢驗(yàn)統(tǒng)計(jì)量,拒絕域?yàn)椋?2.協(xié)方差陣相等時(shí),兩個(gè)正態(tài)總體均值向量的檢驗(yàn),3.協(xié)方差陣不相等時(shí),兩個(gè)正態(tài)總體均值向量的檢驗(yàn),一元方差分析,一、方差分析的概念及有關(guān)術(shù)語(yǔ)方差分析研究的是分類型自變量對(duì)數(shù)值型因變量的影響,包括它們之間有沒(méi)有關(guān)系、關(guān)系的強(qiáng)度如何等,所采用的方法就是檢驗(yàn)各個(gè)總體的均值是否相等來(lái)判斷分類型自變量對(duì)數(shù)值型因變量是否有顯著影響。,例子:為了對(duì)幾個(gè)行業(yè)的服務(wù)質(zhì)量進(jìn)行評(píng)價(jià),消費(fèi)者協(xié)會(huì)在零售業(yè)、旅游業(yè)、航空公司、家電制造業(yè)分別抽取了不同的企業(yè)作為樣本。每個(gè)行業(yè)中所抽取的樣本在服務(wù)對(duì)象、服務(wù)內(nèi)容、企業(yè)規(guī)模等基本上是相同的,統(tǒng)計(jì)出消費(fèi)者對(duì)23家企業(yè)的投訴次數(shù),現(xiàn)判斷幾個(gè)行業(yè)的服務(wù)質(zhì)量是否有差別。投訴次數(shù)如下表:,4.多個(gè)正態(tài)總體均值向量的檢驗(yàn)(多元方差分析),要分析4個(gè)行業(yè)的服務(wù)質(zhì)量是否有顯著差異,實(shí)際上就是判斷“行業(yè)”對(duì)投訴次數(shù)是否有顯著影響,做出這種判斷最終歸結(jié)為檢驗(yàn)4個(gè)行業(yè)被投訴次數(shù)的均值是否相等。如果相等則認(rèn)為行業(yè)因素對(duì)投訴次數(shù)是沒(méi)有影響的,如果均值不全相等,則意味著行業(yè)因素對(duì)服務(wù)質(zhì)量有影響。方差分析主要用來(lái)對(duì)多個(gè)總體均值是否相等作出假設(shè)檢驗(yàn)。,相關(guān)術(shù)語(yǔ),因素(因子):在方差分析中,所要檢驗(yàn)的對(duì)象稱為因素或因子。例子中的“行業(yè)”水平:因素中的不同表現(xiàn)成為水平。例子中的零售業(yè)、旅游業(yè)、航空公司、家電制造業(yè)是“行業(yè)”因素的具體表現(xiàn),即水平。,單因素方差分析:只針對(duì)一個(gè)因素進(jìn)行分析;多因素方差分析:同時(shí)針對(duì)多個(gè)因素進(jìn)行分析。,(1)每個(gè)總體的相應(yīng)變量(因素的各個(gè)水平)服從正態(tài)分布。也就是說(shuō),對(duì)于因素的每個(gè)水平,其觀測(cè)值是來(lái)自正態(tài)總體的簡(jiǎn)單隨機(jī)樣本上例中每個(gè)行業(yè)的投訴次數(shù)應(yīng)服從正態(tài)分布。(2)所有總體的方差相等2。也就是說(shuō),各組觀測(cè)數(shù)據(jù)來(lái)自相同方差的正態(tài)總體。上例中4個(gè)行業(yè)被投訴次數(shù)的方差相同。(3)不同觀察值相互獨(dú)立。(每個(gè)樣本點(diǎn)的取值不影響其他樣本點(diǎn)的取值)上例中,每個(gè)企業(yè)被投訴的次數(shù)與其他企業(yè)被投訴的次數(shù)是相互獨(dú)立的。,方差分析的三個(gè)基本假定,問(wèn)題的一般提法,設(shè)因素有k個(gè)水平,每個(gè)水平的均值分別為,要檢驗(yàn)k個(gè)水平(總體)的均值是否相等,提出如下假設(shè):,與原來(lái)兩兩總體的假設(shè)檢驗(yàn)方法相比,方差分析不僅可以提高檢驗(yàn)的效率,同時(shí)由于它是將所有的樣本信息結(jié)合在一起,因此增加了分析的可靠性。,上例中如果用一般的假設(shè)檢驗(yàn)方法,需要兩兩組合作6次檢驗(yàn)。,某因素不同水平的影響(系統(tǒng)性影響),其他隨機(jī)因素的影響(隨機(jī)性影響),水平間方差(組間方差),某因素不同水平的影響(系統(tǒng)性影響),方差分析的思想:,組內(nèi)離差平方和:衡量因素的同一水平下(同一總體)樣本數(shù)據(jù)的誤差。(隨機(jī)誤差)組間離差平方和:衡量因素的不同水平下(不同總體)樣本數(shù)據(jù)的誤差。(系統(tǒng)性誤差)總的離差平方和:組內(nèi)+組間,如果原假設(shè)成立:說(shuō)明某因素不同水平的影響不顯著(無(wú)系統(tǒng)性影響),只剩下隨機(jī)性影響,因此組間方差與組內(nèi)方差差別不大,它們的比接近于1。如果原假設(shè)不成立:說(shuō)明某因素不同水平的影響顯著(存在系統(tǒng)性影響),組間方差與組內(nèi)方差差別較大,它們的比遠(yuǎn)超出1構(gòu)造統(tǒng)計(jì)量:,一、單因素方差分析(一)離差平方和的計(jì)算方差分析需考察某因素的影響是否具有系統(tǒng)性,因此,需要將樣本總體離差分解為兩部分:(1)反映系統(tǒng)性影響(因素水平影響)的組間離差(2)反映隨機(jī)性影響(其他隨機(jī)因素影響)的組內(nèi)離差。,為全體樣本合并的大樣本的樣本均值,為第j個(gè)總體的樣本均值,xij=第j個(gè)子樣本中第i個(gè)觀測(cè)值;nj=第j個(gè)子樣本的樣本容量,其中,n=n1+n2+nkk為總體的個(gè)數(shù),于是,大樣本的總離差平方和(SumofSquaresforTotal,SST)為:,設(shè),可以證明:,第一項(xiàng)是各子樣本均值與合并的大樣本的公共均值的離差平方和,它反映了因素(變量)不同水平對(duì)總離差平方和的影響(系統(tǒng)性影響),稱為組間離差平方和(SumofSquaresforFactorA,SSA);第二項(xiàng)是各子樣本內(nèi)部離差平方和之和,反映了隨機(jī)性因素的影響(誤差性影響),稱為組內(nèi)離差平方和(SumofSquaresforError,SSE)。,各誤差平方和的大小與觀測(cè)值的多少有關(guān),為了消除觀測(cè)值多少對(duì)誤差平方和大小的影響,用各個(gè)平方和除以自由度即得到平均平方(MeanSquare):,即SST=SSA+SSE總離差平方和=組間離差平方和+組內(nèi)離差平方和,構(gòu)造F統(tǒng)計(jì)量:,原假設(shè)成立,根據(jù)給定的顯著性水平,查表得到拒絕域:,上例中,經(jīng)計(jì)算,說(shuō)明不同行業(yè)被投訴次數(shù)的均值有顯著差異,這意味著行業(yè)(自變量)與投訴次數(shù)(因變量)之間的關(guān)系是顯著的。,關(guān)系強(qiáng)度的測(cè)量,上述F統(tǒng)計(jì)量只能表明自變量和因變量之間是否有關(guān)系,不能表明關(guān)系的強(qiáng)弱,為了度量相關(guān)強(qiáng)度定義判定系數(shù):,R2越大說(shuō)明關(guān)系越強(qiáng),越小關(guān)系越弱。類似于相關(guān)系數(shù)。,上例中,R2=0.349759。這表明行業(yè)對(duì)投訴次數(shù)的影響效應(yīng)占總效應(yīng)的34.9759%,而殘差效應(yīng)則占65.0241%。,方差分析中的多重比較,上面的分析得出的結(jié)論是不同行業(yè)被投訴次數(shù)的均值是不全相同的,但是究竟哪些均值不相等呢,也就是這種差異究竟出現(xiàn)在哪些行業(yè)之間呢?則需要對(duì)總體均值進(jìn)行兩兩比較。多重比較的方法有很多,我們簡(jiǎn)單介紹一下由Fisher提出的最小顯著差異方法(LSD方法)。檢驗(yàn)步驟為:,第一步:提出原假設(shè):,第二步:計(jì)算檢驗(yàn)統(tǒng)計(jì)量:,第三步:計(jì)算LSD,公式為:,第四步:根據(jù)顯著性水平做出決策:如果則拒絕原假設(shè),否則接受原假設(shè)。,例:對(duì)4個(gè)行業(yè)的均值作多重比較,第一步:提出假設(shè),第二步:計(jì)算檢驗(yàn)統(tǒng)計(jì)量,第三步:計(jì)算LSD,第四步:做出決策,不能拒絕原假設(shè),說(shuō)明零售業(yè)和旅游業(yè)之間的投訴次數(shù)沒(méi)有顯著差異。,.,雙因素方差分析,單因素方差分析只是考慮一個(gè)分類型自變量對(duì)數(shù)值型因變量的影響。如果同時(shí)需考慮兩個(gè)因素A與B的影響,則可進(jìn)行雙因素方差分析。,例:分析影響彩電銷售量的因素,需要考察品牌、銷售地區(qū)等因素的影響?,F(xiàn)有4種品牌的彩電在5各地區(qū)進(jìn)行銷售,為分析彩電的“品牌”因素和“地區(qū)”因素對(duì)銷售量是否有影響,調(diào)查數(shù)據(jù)如下:,在雙因素方差分析中如果兩個(gè)因素,例如“品牌”和“銷售地區(qū)”兩個(gè)因素對(duì)銷售量的影響是相互獨(dú)立的,我們分別判斷兩個(gè)因素對(duì)銷售量的影響,稱為無(wú)交互作用的雙因素方差分析。如果除了兩個(gè)因素的單獨(dú)影響外,兩個(gè)因素的搭配還會(huì)對(duì)銷售量產(chǎn)生新的影響效應(yīng),稱為有交互作用的雙因素方差分析。,無(wú)交互作用的數(shù)據(jù)結(jié)構(gòu),無(wú)交互作用的雙因素方差分析,為了檢驗(yàn)兩個(gè)因素的影響,需要分別對(duì)兩個(gè)因素提出假設(shè)。,對(duì)行因素提出的假設(shè)為:,對(duì)列因素提出的假設(shè)為:,地區(qū)對(duì)銷售量沒(méi)有顯著影響,品牌對(duì)銷售量沒(méi)有顯著影響,離差平方和的分解,其中:,可以證明:,分別構(gòu)造統(tǒng)計(jì)量,關(guān)系強(qiáng)度的測(cè)量,有交互作用的方差分析,例:分別在兩個(gè)路段和高峰期及非高峰期進(jìn)行駕車實(shí)驗(yàn),得到20個(gè)駕車時(shí)間的數(shù)據(jù):,Wilks分布,在一元統(tǒng)計(jì)中,方差是刻畫隨機(jī)變量分散程度的一個(gè)重要特征,而在多元情況下方差變?yōu)閰f(xié)防差矩陣。如何用一個(gè)數(shù)量指標(biāo)來(lái)反映協(xié)方差矩陣所體現(xiàn)的分散程度呢?有的用行列式,有的用跡,目前使用較多的是行列式。,定義1:若,定義2:若,的分布為Wilk
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 自行車騎行與城市青年創(chuàng)業(yè)機(jī)遇考核試卷
- 玉石產(chǎn)業(yè)的政策支持與財(cái)稅優(yōu)惠政策考核試卷
- 玻璃保溫容器生產(chǎn)計(jì)劃與生產(chǎn)組織優(yōu)化方法實(shí)踐探索經(jīng)驗(yàn)考核試卷
- 海洋生態(tài)系統(tǒng)恢復(fù)考核試卷
- 摩托車頭盔內(nèi)部吸汗墊清洗考核試卷
- 玻璃加工過(guò)程中的智能化檢測(cè)技術(shù)考核試卷
- 篷布遮陽(yáng)篷在商業(yè)建筑的節(jié)能貢獻(xiàn)與景觀設(shè)計(jì)效果分析考核試卷
- 抖音短視頻內(nèi)容創(chuàng)作者內(nèi)部晉升及權(quán)益分配協(xié)議
- 精裝現(xiàn)房交付標(biāo)準(zhǔn)及室內(nèi)外裝飾設(shè)計(jì)合同
- 智慧城市項(xiàng)目合作與商業(yè)秘密保密協(xié)議
- 2024年7月27日內(nèi)蒙古阿拉善盟直機(jī)關(guān)遴選筆試真題及解析
- 《長(zhǎng)期主義 關(guān)注短期業(yè)績(jī) 更要投資長(zhǎng)期增長(zhǎng)》讀書筆記思維導(dǎo)圖PPT模板下載
- 故宮博物院筆試試題
- 思政教育融入小學(xué)語(yǔ)文教學(xué)的策略研究
- 供方準(zhǔn)入申請(qǐng)表
- DDI領(lǐng)導(dǎo)力-高績(jī)效輔導(dǎo)課件
- 《煙酒有危害》公開(kāi)課教案
- 高三生物一輪復(fù)習(xí)課件:生物變異類型的判斷與實(shí)驗(yàn)探究
- 先簡(jiǎn)支后連續(xù)T梁橋設(shè)計(jì)計(jì)算書
- (完整word版)樁位偏差驗(yàn)收記錄表
- 電流滯環(huán)跟蹤PWM(CHBPWM)控制技術(shù)的仿真
評(píng)論
0/150
提交評(píng)論