




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、統(tǒng)計學以理解為主,沒有名解第一章 緒論(概念、區(qū)別變量類型和參數(shù)統(tǒng)計量)1.抽樣從研究總體中抽取一部分有代表性的個體。2.同質同一總體的個體具有共性(大同小異)。變異同一總體中不同個體間存在的差異。定量變量離散型變量:只可取整數(shù)值(月份)連續(xù)型變量:可取實數(shù)軸上任何數(shù)值(血壓)3.變量類型(區(qū)別)定性變量分類變量(名義變量):如二分類變量(性別-男女)、多分類變量(職業(yè))有序變量(等級變量):如藥物療效-無效/一般/好轉變量的轉化只能”高級”到”低級”:定量有序分類二值4.參數(shù)描述總體分布數(shù)量特征的統(tǒng)計指標值(總體統(tǒng)計指標值)。其大小是客觀存在的,但往往是未知的,需要通過樣本資料來估計。統(tǒng)計量
2、由觀察資料(樣本資料)計算出來的量(樣本統(tǒng)計指標值)。是對總體參數(shù)的估計。抽樣誤差由抽樣而造成的樣本統(tǒng)計指標(統(tǒng)計量)與總體統(tǒng)計指標(參數(shù))之差。統(tǒng)計學關心的常常是總體參數(shù)的大小,其依據(jù)卻是統(tǒng)計量及其性質。研究設計收集資料5.統(tǒng)計工作的基本步驟整理資料定量資料統(tǒng)計描述平均數(shù)統(tǒng)計描述定性資料統(tǒng)計描述相對數(shù)分析資料 參數(shù)估計統(tǒng)計推斷(由樣本信息對相應總體的特征進行推斷)假設檢驗第2章 定量變量的統(tǒng)計描述1. 頻率分布表(圖)的用途:描述變量的分布類型:對稱,非對稱(偏鋒)揭示變量的分布特征:集中趨勢、離散趨勢集中趨勢與離散趨勢同時存在,是隨機變量分布的兩個重要特征,通過描述變量的平均水平(集中趨勢
3、)和變異程度(離散趨勢)可較全面地揭示數(shù)據(jù)分布的特征(1)集中趨勢的描述- 平均數(shù)是分析定量資料的基本指標。用于描述一組同質觀察值(變量值)的集中位置,反映一組觀察值的平均水平或集中趨勢。應用分類算術平均數(shù)(均數(shù))幾何均數(shù)中位數(shù)適用范圍適用于對稱分布資料,尤其是正態(tài)分布或近似正態(tài)分布資料。1.原始觀察值分布不對稱,但經(jīng)對數(shù)轉換后呈對稱分布(正態(tài)分布)的變量。2.當變量值之間呈倍數(shù)關系(等比數(shù)列)。3.頻率圖呈正偏鋒分布,均數(shù)變量平均水平的代表性較差1.當一組變量值呈偏態(tài)(峰)分布;2.資料的分布類型不清楚時;3.數(shù)據(jù)大部分比較集中,少部分偏向一側;4.資料的一端或兩端無界限(2)離散趨勢的描述
4、-變異指標:極差、四分位數(shù)間距、標準差、變異系數(shù)。其中以標準差最常用。特點:四分位數(shù)間距常與中位數(shù)結合來描述變量的平均水平和變異程度。四分位數(shù)間距的適用范圍即中位數(shù)適用范圍。標準差常與均數(shù)結合起來,從平均水平和變異程度兩方面描述變量的分布特征。標準差適用范圍即均數(shù)適用范圍。2. 描述分布形態(tài)的統(tǒng)計指標:偏度系數(shù)、峰度系數(shù)正態(tài)分布時,偏度系數(shù)與峰度系數(shù)均為0.3. 統(tǒng)計表的結構:表號及標題、標目、線條(三線表:頂線、底線、縱標目分割線)、數(shù)字。第3章 定性變量的統(tǒng)計描述1. 定性資料常用相對數(shù)作為統(tǒng)計描述指標。常用的相對數(shù)有:頻率、強度、相對比。應用相對數(shù)的注意事項:1、防止概念混淆; 2、計算
5、相對數(shù)時分母應有足夠數(shù)量;3、正確計算合計率;4、樣本相對數(shù)的統(tǒng)計推斷;5. 注意資料的可比性;6、頻率型指標的解釋要緊扣總體與屬性(總體不同、屬性不同);2. 應用粗率標準化法的注意事項:標準化法的應用范圍很廣;標準化后的標準化率,已經(jīng)不再反映當時當?shù)氐膶嶋H水平,它只表示相互比較的資料間的相對水平。選擇不同的”標準”,算出的標準化率也會不同,比較的結果也未必相同。兩樣本標準化率是樣本值。存在抽樣誤差。比較兩樣本的標準化率,當樣本含量較小時,還應作假設檢驗。3. 動態(tài)數(shù)列按時間順序將一系列統(tǒng)計指標(可以是絕對數(shù),相對數(shù)或平均數(shù))排列起來,用以觀察和比較該事物在時間上的變化和發(fā)展趨勢。l 常用的
6、動態(tài)數(shù)列分析指標有:絕對增長量、發(fā)展速度與增長速度、平均發(fā)展速度與平均增長速度。l 動態(tài)數(shù)列的分析不僅可以總結過去,而且可以進行預測,即根據(jù)平均發(fā)展速度公式計算幾年后達到的指標。第4章 常用概率分布1. 二項分布l 概念:觀察結果是以兩分類變量來表示的,如果每個觀察對象陽性結果的發(fā)生概率均為,陰性結果的發(fā)生概率均為(1);而且各個觀察對象的結果是相互獨立的,重復觀察n次,發(fā)生陽性結果的次數(shù)X的概率分布為二項分布,記作B(n,)。l 特點:結果只有兩種可能;事件的概率不變;每次事件相互獨立。l 當n相當大(n100),只要不太靠近0或1,特別是當n和n(1)都大于5時,二項分布近似正態(tài)分布。2.
7、 正態(tài)分布(1) 形狀:一條高峰位于中央,兩側逐漸下降并完全對稱,曲線兩端永遠不與橫軸相交的鐘型曲線。(2) 參數(shù):位置參數(shù)即總體均數(shù),描述正態(tài)分布的集中位置。變異度參數(shù)(形狀參數(shù))為總體標準差,描述正態(tài)分布的離散程度。(3) z變換與標準正態(tài)分布l 任意一個服從正態(tài)分布N(,2)的隨機變量,均可以作標準化變換(也稱z變換)。l 變換后的z值仍服從正態(tài)分布,且總體均數(shù)0,總體標準差1。此正態(tài)分布稱為標準正態(tài)分布,用N(0,1)表示。(4)正態(tài)曲線下面積分布規(guī)律:l 1.96范圍內的面積占曲線下總面積的95.00(該范圍內的頻數(shù)占總觀察單位數(shù)的95%)。l 2.58范圍內的面積占曲線下總面積的9
8、9.00(該范圍內的頻數(shù)占總頻數(shù)的99%)。標準正態(tài)分布中(-1.96,1.96)=95%;(-2.58,2.58)=99%(5) 醫(yī)學參考值范圍指特定的“正常”人群(排除了對所研究指標有影響的疾病和有關因素的特定人群)的解剖、生理、生化指標及組織代謝產(chǎn)物含量等數(shù)據(jù)中大多數(shù)個體的取值所在的范圍。l 確定醫(yī)學參考值的方法:百分位數(shù)法:可用于任何分布類型的資料,較適合偏態(tài)分布;正態(tài)分布法:適用于正態(tài)分布。第5章 參數(shù)估計基礎 1.參數(shù)估計根據(jù)樣本統(tǒng)計量估計總體參數(shù)的過程。定量資料的參數(shù)估計:均數(shù)的抽樣誤差、均數(shù)的標準誤、t分布、總體均數(shù)的可信區(qū)間定性資料的參數(shù)估計:率的抽樣誤差、率的標準誤、二項分
9、布、總體率的可信區(qū)間2.抽樣誤差由抽樣而造成的樣本統(tǒng)計量與總體參數(shù)、樣本統(tǒng)計量之間的差異。3.正態(tài)分布總體樣本均數(shù)抽樣分布的特點:各樣本均數(shù)未必等于總體均數(shù)。各樣本均數(shù)間存在差異。樣本均數(shù)圍繞總體均數(shù),中間多、兩邊少,左右基本對稱,呈近似正態(tài)分布;事實上,如果原總體呈正態(tài)分布,樣本均數(shù)圍繞總體均數(shù)亦呈正態(tài)分布。樣本均數(shù)的變異范圍較原變量的變異范圍小。隨著n增加,樣本均數(shù)的變異程度減小。4.當樣本量n較小時,樣本均數(shù)的分布并非正態(tài)分布,而樣本量足夠大時(例如,n50),樣本均數(shù)的分布近似于正態(tài)分布。5.均數(shù)的標準誤樣本均數(shù)的標準差??捎糜诜从尘鶖?shù)的抽樣誤差大小。l 均數(shù)的標準誤可衡量樣本均數(shù)(估
10、計總體均數(shù))的可靠性。l 二項分布中,頻率的標準誤=均數(shù)的標準誤。6. t分布(1)t分布與標準正態(tài)分布(z分布)比較相似:t分布和z分布都是以0為中心,中間高,兩邊低,左右對稱的光滑曲線;不同:t分布是一簇單峰分布曲線。比z分布的離散度更大,其性狀與自由度有關,越小,t值分布越分散。(即t分布離散度大,z分布離散度小)聯(lián)系:隨著自由度的增大,t分布越來越接近z分布,當自由度為無窮大時,t分布即為z分布。t分布不是正態(tài)分布,但標準正態(tài)分布(z分布)為特殊的t分布(2)統(tǒng)計學關心的是t分布曲線下的尾部面積(即概率P)與橫軸t值的關系。自由度相同時,|t|值越大,t分布的尾部概率越小;t臨界值相同
11、時,雙側尾部概率為單側尾部概率的兩倍。(3)t分布的用途:總體均數(shù)的區(qū)間估計;兩均數(shù)差別的假設檢驗t檢驗。7. 總體均數(shù)及總體概率的估計(1) 參數(shù)估計:用樣本指標(統(tǒng)計量)估計總體指標(參數(shù))。包括點估計和區(qū)間估計。點估計難以反映參數(shù)估計值對其真值的代表性,多不用。區(qū)間估計用已知樣本統(tǒng)計量和標準誤,按一定的概率估計可能包含總體參數(shù)在內的一個范圍。而這個范圍稱為總體參數(shù)的置信區(qū)間。l 1稱為置信度,值一般取0.05或0.01,故最常用總體參數(shù)的95%或99%置信區(qū)間。l 估計總體均數(shù)的置信區(qū)間方法:t分布法(當未知且n較小,小樣本)正態(tài)近似法(當已知,或未知但n足夠大,大樣本)8.標準差和標準
12、誤比較標準差(S)標準差(Sx)相似反映觀察值的離散程度反映樣本均數(shù)的離散程度不同意義表示觀察值的變異程度,衡量均數(shù)的代表性表示樣本均數(shù)抽樣誤差的大小,衡量樣本均數(shù)的可靠性應用制定醫(yī)學參考值范圍估計總體均數(shù)可信區(qū)間第6章 假設檢驗基礎1.假設檢驗判斷樣本統(tǒng)計量與總體參數(shù)之間的差別(或兩個或兩個以上樣本統(tǒng)計量之間的差別)是否由于抽樣誤差所致的方法。2.區(qū)別參數(shù)估計和假設檢驗參數(shù)估計假設檢驗同由樣本推總體異已知樣本統(tǒng)計量的值推總體統(tǒng)計量的范圍假設已知樣本統(tǒng)計量的比較,推總體樣本統(tǒng)計量比較結果是否相同。3. 假設檢驗的基本步驟:(1)建立假設零假設(原假設或檢驗假設) :假設差別是由抽樣誤差引起(差
13、別無統(tǒng)計學意義)備擇假設(對立假設) :假設差別是由處理因素所致(差別有統(tǒng)計學意義)(2) 確定檢驗水準一般取= 0.05(3)選擇檢驗方法,計算檢驗統(tǒng)計量 選擇檢驗方法的依據(jù):研究目的、研究設計的類型、資料特點(變量種類、樣本大小)等(4) 確定P值P值的定義:在零假設成立的條件下,出現(xiàn)統(tǒng)計量目前值及更不利于零假設數(shù)值的概率。(5) 作出推論(結果推斷)定量資料假設檢驗4. (小樣本資料兩均數(shù)比較)t檢驗的應用條件:(1)隨機獨立樣本(2)樣本來自正態(tài)分布總體(3)兩樣本均數(shù)比較的t檢驗要求兩樣本所來自的總體方差相等,(即方差齊性)單樣本資料的t檢驗配對設計定量資料的t檢驗兩獨立樣本資料的t
14、檢驗(兩樣本來自正態(tài)分布總體)目的推斷樣本來自的總體均數(shù)與已知的某一總體均數(shù)0(常為理論值或標準值)有無差別。著眼于配對設計(異體配對和自身配對)每一對中兩個觀察值之差,這些差值構成一組資料,用t檢驗推斷差值的總體均數(shù)是否為”0”。判斷兩獨立樣本資料的總體均數(shù)是否相等。分兩種情況(樣本量大可不檢方差齊性):總體方差相等(方差齊性)總體方差不等檢驗方差齊性,用兩獨立樣本資料的方差齊性檢驗(F檢驗)。5. 二項分布資料的z檢驗(大樣本)近似正態(tài)分布,應用條件:n足夠大,不太靠近0和1;或n和n(1-)均大于5。6. 假設檢驗的功效(1)假設檢驗的兩類錯誤第類錯誤:拒絕了實際上成立的H0。第類錯誤的
15、概率大小用表示。第類錯誤:不拒絕實際上不成立的H0。第類錯誤的概率用表示。當樣本例數(shù)n確定時,愈小,愈大;反之,愈大,愈小。要同時減少及,唯一的方法是增加樣本例數(shù)。(2) 假設檢驗的功效又稱為檢驗效能或把握度,用符號1-表示。意義是:當所研究的總體與H0確有差別時,按規(guī)定檢驗水準能夠發(fā)現(xiàn)該差異(拒絕H0)的能力(概率)。影響因素:總體參數(shù)的差異、個體差異(標準差)、樣本量、檢驗水準應用假設檢驗需要注意的問題:a.事先進行嚴密的統(tǒng)計學設計:1、樣本是從同質總體中隨機抽取的一部分2、應注意樣本含量是否合理3、假設檢驗的先決條件是比較組間資料是可比的(組間非處理因素均衡)4、單側檢驗和雙側檢驗的選擇
16、b.應用假設檢驗方法必須符合其適用條件c.權衡兩類錯誤的危害來確定的大小d.正確理解假設檢驗的結論1、 有無差別是相對的2、 正確理解P值的意義3、 結合專業(yè)知識作出推斷結論第7章 方差分析基礎1. 方差分析通過對數(shù)據(jù)變異的分解來判斷不同樣本所代表的總體均數(shù)是否相同,用于比較兩個或兩個以上均數(shù)的差別。(當用于兩兩比較時,同一資料所得結果與t檢驗等價,即t2=F)(1)基本思想:把全部數(shù)據(jù)的總離均差平方和(SS總)分解為若干部分,其總自由度(v總)也作相應的分解。每一部分表示一定意義,其中至少有一個部分表示各組均數(shù)間的變異情況,另一部分表示誤差。l 總變異,組間變異(同時反映處理因素和隨機誤差)
17、,組內變異(只反映隨機誤差)l SS離均差平方和;MS均方(即方差)l F值為MS組間與MS組內之比。如果處理因素不起作用,MS組間與MS組內之比應近于或等于1;如果試驗因素確有作用,則MS組間與MS組內之比應明顯大于1。(2)兩種計算方法:l 完全隨機設計資料方差分析(單一因素方差分析)也適用3種t檢驗l 隨機區(qū)組設計資料的方差分析(雙因素方差分析)適用于除配對設計t檢驗外的另外兩種t檢驗通常是將受試對象按性質(非實驗因素)相同或相近者組成b個區(qū)組(配伍組),每個區(qū)組中的k個受試對象分別隨機分配到k個處理組中去,構成bk個格子。l 隨機區(qū)組設計與完全隨機設計相比,因利用區(qū)組控制了可能的混雜因
18、素,并在進行方差分析時將區(qū)組的變異從原組的變異中分解出來。(3) 多個樣本均數(shù)兩兩比較l SNK法(q檢驗):區(qū)組中每兩組之間比較l Dunnett法:多個實驗組與一個對照組均數(shù)的比較l Bonferroni法:調整值,確定每次比較的檢驗水準=/m。使多次比較后犯第一類錯誤的累計概率較少,適用于所有兩兩比較。(4) 方差分析的前提條件各樣本是相互獨立的隨機樣本樣本來自正態(tài)分布總體各樣本的總體方差相等,即方差齊性(即方差分析前須檢驗方差齊性)(5) 數(shù)據(jù)變換(對于符合方差分析假定條件的資料,可用方法有:1.數(shù)據(jù)變換;2.非參數(shù)統(tǒng)計分析;3采用近似檢驗)對數(shù)變換:(1)對數(shù)正態(tài)分布資料;(2)標準
19、差與均數(shù)成比例,或變異系數(shù)接近甚至等于某一常數(shù)的資料。平方根變換:適用于方差與均數(shù)成比例的資料,如服從Poisson分布的資料。平方根反正弦變換:適用于二項分布(百分比)的數(shù)據(jù)資料。定性資料假設檢驗第八章 1.可用于:(1)檢驗兩個或多個頻率(率或構成比)間的差異;(2)判斷兩種屬性或現(xiàn)象間是否存在關聯(lián)性;(3)了解實際分布與某種理論分布是否吻合;(4)判斷兩個數(shù)列間是否存在差異等。2.獨立樣本22列聯(lián)表資料的 2檢驗:l 條件:n40,T5(四個格子的理論數(shù)均大于5)組別屬性合計Y1Y2甲a(T11)b(T12)n1=a+b乙c(T21)d(T22)n2=c+d合計m1=a+cm2=b+dn
20、=a+b+c+dl 四格表:l 公式:3.22列聯(lián)表資料 2檢驗校正公式:l 條件:n40,任一格理論數(shù):1T5。l 公式:(校正后2值變?。?. Fisher確切概率法:n40或T1,不能用2方檢驗,須用Fisher確切概率法直接計算概率。5. 四格表資料的卡方檢驗注意事項:校正公式僅用于四格表資料;不滿足2檢驗條件時(n40或T1)用Fisher確切概率法直接計算概率;組間比較注意可比性。6. 多個獨立樣本RC列聯(lián)表資料的2檢驗l 條件:T5的格子不超過總格子數(shù)的1/5,且T1l RC列聯(lián)表卡方檢驗的注意事項:(1)在RC列聯(lián)表表資料中,當有1/5以上格子的理論數(shù)小于5或有任一格子內理論數(shù)
21、小于1時,處理的方法有:增大觀察例數(shù)再做研究將T5或T1所在的行或列與性質相同的相鄰行或列合并,刪除T5或T1所在的行或列改用RC表的Fisher確切概率法(2) 注意對比組之間的可比性(3) RC表資料卡方檢驗結果,當P0.05,按=0.05的水準,認為被比較的幾個率之間總的來說有差別,但不能據(jù)此作出任何兩組間均有差別的結論。究竟哪兩組間有差別,還需作兩兩比較。(4) 如果行或列的變量是有序的(單向有序),比較兩組(或幾組)總的程度有無不同,宜用秩和檢驗??ǚ綑z驗比較的是幾組構成比(頻率分布)有無不同。7. 2檢驗用于擬合優(yōu)度檢驗:根據(jù)樣本的頻率分布檢驗其總體分布是否等于某給定的理論分布(泊
22、松分布、二項分布、正態(tài)分布等)第9章 基于秩次的非參數(shù)檢驗參數(shù)檢驗以特定的總體分布為前提,對未知的總體參數(shù)做推斷的假設檢驗方法。非參數(shù)檢驗不以特定的總體分布為前提,也不針對決定總體分布的參數(shù)做推斷的假設檢驗方法,又稱任意分布檢驗。1.秩和檢驗應用條件:l 總體分布類型未知,或資料分布類型已知,但不符合正態(tài)分布的資料。l 某些可能無法精確測量,只能以嚴重程度、優(yōu)劣等級、次序先后等表示的等級資料。l 個別數(shù)據(jù)偏大或數(shù)據(jù)的某一端或兩端為不確定值的資料。l 各總體方差不齊的資料。但符合參數(shù)檢驗應用條件的定量資料,如果選用秩和檢驗進行統(tǒng)計分析,可能會降低檢驗功效。2. 平均秩次:當差值絕對值相等時,若符
23、號相同,可順次編秩也可求平均秩次,若符號不同,求平均秩次并記原來符號。3. 秩和檢驗的方法:(1) 配對設計資料的符號秩和檢驗:混合編秩次,分別求秩和。(2) 兩組獨立樣本比較的秩和檢驗:混合編秩次,分組求秩和。兩組連續(xù)型變量資料的秩和檢驗兩組有序分類變量資料的秩和檢驗(1)和(2)均可查表,或樣本量較大可用正態(tài)近似法z檢驗,但相同秩次(相持現(xiàn)象)超過25%,則要校正。(3) 多組獨立樣本比較的秩和檢驗:混合編秩次,分組求秩和。多組連續(xù)變量資料的秩和檢驗多組有序變量資料的秩和檢驗(3)求統(tǒng)計量H,若超出H界值表則查2界值表。4. 隨機區(qū)組設計資料的秩和檢驗:按區(qū)組編秩次,按區(qū)組求秩和。(M檢驗
24、)5. 多個樣本間的多重比較第10章 兩變量關聯(lián)性分析(兩定量變量間的線性關系)1. 線性相關系數(shù)簡稱相關系數(shù),是定量描述兩個隨機變量間線性關系密切程度和相關方向的統(tǒng)計指標。(總體相關系數(shù),樣本相關系數(shù)r)l 相關系數(shù)無單位,其值變動于-1與+1之間。l 當0,稱X和Y線性相關,簡稱相關;=0,零相關或X和Y無線性相關。l 0,正相關;0,負相關。l |=1,完全相關(函數(shù)關系);|愈接近1,表示兩變量間關系愈密切;|愈接近0,表示兩變量間關系愈不密切 。2. 常用線性相關系數(shù)假設檢驗方法有兩種:(1)直接查相關系數(shù)臨界值表(2)采用回歸系數(shù)t檢驗假設檢驗目的在于定性地回答兩變量之間是否存在線
25、性相關,P值越小并不表示相關性越強。3.線性相關分析應用中應注意的問題;(1)在作直線相關分析前,應先繪散點圖,當散點圖有線性趨勢時,才進行相關分析。(2)線性相關分析要求兩個變量都是隨機變量,且呈二元正態(tài)分布,當兩變量均明顯不呈正態(tài)分布時,最好采用數(shù)據(jù)變換或采用秩相關(等級相關)分析。(3)相關關系不一定是因果關系,需從專業(yè)角度分析(4)出現(xiàn)離群值時慎用相關(5)注意假相關:分層資料盲目合并易出假象。4.秩相關:適用于不服從正態(tài)分布、總體分布未知以及原始數(shù)據(jù)用等級表示的資料。常用Spearman秩相關系數(shù)rs(又稱等級相關系數(shù))描述兩個變量間關聯(lián)的程度與方向。第十一章 簡單線性回歸1.線性相
26、關與線性回歸比較線性相關線性回歸同線性相關與回歸分析研究兩個(定量)變量間的線性關系。異分析研究兩個變量間線性關系的強度和方向分析研究兩個連續(xù)型變量之間線性依存關系以及建立一個線性回歸方程來定量地表達兩變量間的線性關系??捎糜诠烙?、預測。2. 回歸分析研究一個變量如何隨另一些變量變化的常用方法。線性回歸分析研究兩個定量變量X與Y之間線性依存關系,并建立一個線性回歸方程來定量地表達兩變量間依存變化的數(shù)量關系的統(tǒng)計分析方法。3. 回歸系數(shù)為直線的斜率,它表示X每變動一個單位時,Y變動的單位數(shù)。(即相關系數(shù))4. 線性回歸模型的適用條件LINE(1)(L)-線性(linear):X與Y呈直線關系(2
27、)(I)-獨立(independent):每個個體觀察值之間相互獨立(3)(N)-正態(tài)(normal):任意給定X值,對應的隨機變量Y都服從正態(tài)分布(4)(E)等方差(equal variance):不同的X值所對應的隨機變量Y的方差相等5. 遵循最小二乘法則:保證各實測點距回歸直線的縱向距離的平方和為最小。即估計誤差平方和 最小。殘差(剩余值)實測值y與回歸線上的估計值 的縱向距離 6. 總體回歸系數(shù)的統(tǒng)計推斷:t檢驗:檢驗總體回歸系數(shù)是否不為0F檢驗:檢驗回歸方程是否成立(即檢驗回歸系數(shù)是否不全為0)當僅一個自變量時: t2=F7. 決定系數(shù)回歸平方和與總離均差平方和之比,記為R2。通過決
28、定系數(shù)大小反映回歸的實際效果。當X與Y都是正態(tài)隨機變量時,相關系數(shù)的平方在數(shù)值上就等于決定系數(shù) 。8. 線性回歸的應用:(1) 統(tǒng)計預測:Y的總體均數(shù)的置信區(qū)間;給定X=Xp時,Yp的總體均數(shù)的點估計為 。計算出對應于所有X值的Y總體均數(shù)的置信區(qū)間,以相應X為橫坐標,Y為縱坐標,將置信區(qū)間的上下限分別連起來形成兩條弧線間的區(qū)域,稱為回歸直線的置信帶。(1-)置信帶的意義:在滿足線性回歸的假設條件下,可以認為真實的回歸直線落在兩條弧形曲線所形成的區(qū)帶內,其置信度為1-。個體Y值的預測區(qū)間。給定X=Xp時,對應的個體Y值存在一個波動范圍。計算出對應于所有X值的Y的預測范圍,以相應的X橫坐標,Y為縱坐標,將預測區(qū)間的上下限分別連起來形成的兩條弧形線間的區(qū)域,稱為Y值的預測帶。內:Y的總體均數(shù)的置信區(qū)間 外:個體Y值的預測區(qū)間第12章 多重線性回歸與相關1.多重線性回歸與多重相關是研究一個連續(xù)型變量和其他多個變量間線性關系的統(tǒng)計學分析方法。2.j 自變量Xj對Y的偏回歸系數(shù),表示當方程中其它自變量保持不變時,Xj
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 租賃經(jīng)營合同
- 工業(yè)廢水處理技術研發(fā)合作合同
- 井蓋產(chǎn)品購銷合同
- 汽車直租融資租賃合同
- 房地產(chǎn)測量合同年
- 會議展覽活動承辦服務合同
- 房屋修建承包合同
- 合作研究開發(fā)合同
- 1秋天 教學設計-2024-2025學年語文一年級上冊統(tǒng)編版
- 長沙電力職業(yè)技術學院《創(chuàng)意教學法》2023-2024學年第二學期期末試卷
- 網(wǎng)運分離參照德國繼續(xù)推薦京滬高鐵
- 《豐收之歌》精選教學課件
- 【青島版《科學》】四年級下冊第一單元1 《運動與力》 教學設計
- 2022春蘇教版五年級下冊科學全冊單元課件全套
- 小學期末班級頒獎典禮動態(tài)PPT模板
- 液堿生產(chǎn)工序及生產(chǎn)流程敘述
- 圖解調音臺使用說明(共14頁)
- 人民軍隊性質宗旨和優(yōu)良傳統(tǒng)教育課件教案
- 心理抗壓能力測試例題
- 操作系統(tǒng)試題
- 電子秤校驗記錄表
評論
0/150
提交評論