衛(wèi)生統(tǒng)計學(xué)簡答題(3).doc_第1頁
衛(wèi)生統(tǒng)計學(xué)簡答題(3).doc_第2頁
衛(wèi)生統(tǒng)計學(xué)簡答題(3).doc_第3頁
衛(wèi)生統(tǒng)計學(xué)簡答題(3).doc_第4頁
衛(wèi)生統(tǒng)計學(xué)簡答題(3).doc_第5頁
已閱讀5頁,還剩26頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

第四章 常用概率分布一、二項分布的特征二項分布圖的高峰在=n處或附近;為0.5時,圖形是對稱的;當(dāng)不等于0.5時,分布不對稱當(dāng)對同一n,離0.5愈遠(yuǎn),對稱性愈差對同一,隨著n的增大,分布趨于對稱當(dāng)n時,只要不太靠近0或1,特別是當(dāng)n與n(1-)均大于5時,二項分布趨于對稱。當(dāng)n時,且0時,二項分布近似Poisson分布二、二項分布的應(yīng)用條件是什么?實驗總次數(shù)n一定每次試驗只有兩個可能結(jié)果且相互獨立,不予考慮“可疑”等模糊結(jié)果,屬于二分類資料每次試驗只出現(xiàn)一個結(jié)果并且是兩個可能結(jié)果中的一個結(jié)果已知發(fā)生某結(jié)果與概率為且不變,則其對立結(jié)果的概率為(1-)n次試驗在相同條件下進(jìn)行且各次試驗結(jié)果相互獨立三、Possion分布的特征?Possion分布的總體均數(shù)與總體方差相等,均為當(dāng)較小時,圖形呈偏態(tài)分布;當(dāng)較大時,圖形呈正態(tài)分布Poisson分布的觀察結(jié)果具有可加性四、正態(tài)分布的定義若連續(xù)性隨機變量X的概率密度函數(shù)為:其中為均值,為標(biāo)準(zhǔn)差,則隨機變量X服從正態(tài)分布,記為XN(,2 )相應(yīng)的分布函數(shù)(概率密度的累積函數(shù))為:五、正態(tài)曲線的性質(zhì)曲線在x軸的上方,與x軸的上方,與x軸不相交曲線是單峰的,它關(guān)于直線x=對稱 曲線在x=處達(dá)到峰值(最高點),在x=處有拐點曲線與橫軸x所夾面積為1均值反應(yīng)隨機變量的平均水平(位置參數(shù)),向右平移表示逐漸增大,向左平移表示逐漸減少。標(biāo)準(zhǔn)差反映隨機變量的集中趨勢(形狀參數(shù)),越大曲線越“矮胖”,表示分布越分散;越小曲線越“瘦高”,表示分布越集中。當(dāng)n很大,很小時,n=為一常數(shù)時,二項分布近似于Poisson分布P(n)當(dāng)n較大時,不接近0也不接近m時,二項分布近似于正態(tài)分布,N(n,n(1-))當(dāng)20時,Poisson分布漸近正態(tài)分布N(,)六、簡述二項分布、Possion分布、正態(tài)分布的區(qū)別與聯(lián)系區(qū)別:二項分布、Possion分布是離散型概率分布,用概率函數(shù)描述其分布狀況,而正態(tài)分布是連續(xù)型概率分布,用密度函數(shù)和分布函數(shù)描述其分布狀況。聯(lián)系:Possion分布可以視為n很大而很小的二項分布。當(dāng)n很大而和1-都不是很小的時候二項分布漸近正態(tài)分布,當(dāng)20的時候,Possion分布漸近正態(tài)分布。七、對于一組近似正態(tài)分布的資料,除樣本含量n外,還可計算 ,S和 1.96X ,問各說明什么?為算數(shù)均數(shù),說明正態(tài)分布或近似正態(tài)分布資料的集中趨勢S為標(biāo)準(zhǔn)差,說明正態(tài)分布或近似分布資料的離散趨勢 1.96X 可估計正態(tài)指標(biāo)的95%醫(yī)學(xué)參考值范圍,即此范圍在理論上應(yīng)包含總體的95%的個體值。八、正態(tài)分布、標(biāo)準(zhǔn)正態(tài)分布與對數(shù)正態(tài)分布有何異同1、相同點: 隨機變量的類型相同服從這種分布的隨機變量都是連續(xù)型隨機變量 可轉(zhuǎn)化性對數(shù)正態(tài)分布變量記對數(shù)變換后可轉(zhuǎn)化為正態(tài)分布變量正態(tài)分布變量經(jīng)標(biāo)準(zhǔn)化變換后可轉(zhuǎn)化為標(biāo)準(zhǔn)正態(tài)分布2、不同點: 表示不同正態(tài)分布記為N(, 2 ),是曲線族標(biāo)準(zhǔn)正態(tài)分布是一種特殊的正態(tài)分布(均數(shù)為0,標(biāo)準(zhǔn)差為1),記為N(0,1)對數(shù)正態(tài)分布記為N(lgX,2 lgX ),為另一曲線族 概率密度函數(shù)曲線不同正態(tài)曲線、標(biāo)準(zhǔn)正態(tài)曲線均呈對稱性對數(shù)正態(tài)曲線呈非對稱性,為右偏態(tài) 應(yīng)用不同正態(tài)分布和標(biāo)準(zhǔn)正態(tài)分布應(yīng)用廣泛,其資料可直接用于統(tǒng)計分析服從對數(shù)正態(tài)分布的資料一般先記對數(shù)變換后,再進(jìn)行統(tǒng)計處理九、控制圖的基本原理如果某一波動僅僅由個體差異或隨機測量誤差所致,那么觀察結(jié)果服從正態(tài)分布;依據(jù)標(biāo)準(zhǔn)正態(tài)分布曲線下面積的分布規(guī)律性,確定出現(xiàn)概率非常小的若干情況作為異常標(biāo)準(zhǔn)如果出現(xiàn)相應(yīng)結(jié)果則判為異常。十、質(zhì)量控制判斷異常點的8種情況:1. 某點位于控制線3S之外2. 在中心線的一側(cè)連續(xù)有9個點3. 連續(xù)6個點穩(wěn)定地減少或增加4. 連續(xù)14個點交替上下5. 連續(xù)3個點中有2個點位于2S之外6. 連續(xù)5個點中有4個點位于1S之外7. 在中心線一側(cè)或兩側(cè)連續(xù)15個點位于1S之內(nèi)8. 在中心線一側(cè)或兩側(cè)連續(xù)8個點位于1S之外十一、醫(yī)學(xué)參考值范圍(reference range)(一) 定義是指包括絕大多數(shù)“正常人”的各種生理及生化指標(biāo)常數(shù),由于存在個體差異,生物醫(yī)學(xué)數(shù)據(jù)并不是常數(shù),而在一定范圍內(nèi)波動,故采用醫(yī)學(xué)參考值范圍作為判定正常和異常的參考標(biāo)準(zhǔn),但不是“金標(biāo)準(zhǔn)”(二) 制定方法正態(tài)分布法、百分位數(shù)法(三) 確定原則 選定足夠多例的同質(zhì)正常人作為研究對象,所謂“正常人”并不是指任何器官、組織的形態(tài)與功能都健全的人,而是指所有可能影響研究指標(biāo)(確定參考值范圍的指標(biāo))的因素觀察值均處于正常范圍內(nèi),從可行的角度考慮,可以說:原則上應(yīng)是體檢合格者(健康人)并且所有已知對研究指標(biāo)有影響的因素觀察值均處于正常范圍內(nèi);對于某些指標(biāo)為不正?;蚧寄撤N疾病的對象,如果有充分的證據(jù)表明這些不正常指標(biāo)或所患疾病不會對研究指標(biāo)有任何影響,則這些對象仍可以作為制定這個參考值范圍的研究對象 控制檢測誤差 如果有明顯的指標(biāo)(如年齡、性別)影響同質(zhì)性,則應(yīng)考慮進(jìn)行分組分別建立參考值范圍 根據(jù)專業(yè)知識正確選擇單、雙側(cè)參考值范圍 根據(jù)假陽性和假陰性與危險程度合理選擇百分界值 必要時,除計算參考值范圍外,也給出可疑范圍(四) 確定方法參考值范圍是根據(jù)正常人的數(shù)據(jù)估計絕大多數(shù)的正常人所在范圍。這一范圍與確定根據(jù)數(shù)據(jù)分布與特點選擇相應(yīng)的估計方法 正態(tài)分布法:對于正態(tài)分布以及近似正態(tài)分布資料,公式如下:雙側(cè):單側(cè): 百分位數(shù)法當(dāng)資料不服從正態(tài)分布,則利用百分位數(shù)法估計參考值范圍例如,確定95%參考值范圍,相應(yīng)的百分界值為:雙側(cè):P2.5P97.5單側(cè):低側(cè)P5;高側(cè)P95 對數(shù)正態(tài)分布法如果對資料取對數(shù)后y=ln(x)呈近似正態(tài)分布此時以y值按正態(tài)分布法算出參考值范圍,再對其求反對數(shù)(五) 制定參考值范圍與一般步驟: 定義“正常人”,不同的指標(biāo)“正常人”的定義也不同 選定足夠數(shù)量的正常人作為研究對象 用統(tǒng)一和準(zhǔn)確的方法測定相應(yīng)的指標(biāo) 根據(jù)不同的用途選定適當(dāng)?shù)陌俜治粩?shù),常用95% 根據(jù)此指標(biāo)與實際含義,決定用單側(cè)范圍還是雙側(cè)范圍 根據(jù)此指標(biāo)與分布決定計算方法,常用于計算方法:正態(tài)分布法、百分位數(shù)法第五章 參數(shù)估計一、什么是抽樣誤差?抽樣誤差如何減少抽樣誤差?樣本均數(shù)與抽樣分布特點?(一)抽樣誤差是指從一個總體中隨機抽取一個或多個樣本,所得的樣本統(tǒng)計量與相應(yīng)的總體參數(shù)之間的差異,或者各個樣本統(tǒng)計之間的差異稱為抽樣誤差(二)可以通過增加樣本量來減少抽樣誤差(三)樣本均數(shù)抽樣分布的特點 樣本均數(shù)恰好等于總體均數(shù)是極其罕見的 樣本均數(shù)之間存在差異 樣本均數(shù)圍繞總體均數(shù),中間多兩邊少,左右基本對稱,呈近似正態(tài)分布 樣本均數(shù)之間變異明顯小于原始變量值之間的變異二、總體分布形態(tài)和樣本含量對樣本均數(shù)的抽樣分布會產(chǎn)生何種影響?在服從正態(tài)分布的總體中進(jìn)行隨機抽樣,樣本均數(shù)的分布服從近似正態(tài)分布在不服從正態(tài)分布的總體中進(jìn)行隨機抽樣,當(dāng)樣本量較小時,樣本均數(shù)的分布呈非正態(tài)分布,當(dāng)樣本量足夠大時(如n30),樣本均數(shù)的分布近似服從正態(tài)分布三、標(biāo)準(zhǔn)差S與標(biāo)準(zhǔn)誤Sx之間的區(qū)別和聯(lián)系(樣本)區(qū)別:(1)意義:S描述一組變量值的離散程度,并可以作為總體標(biāo)準(zhǔn)差的點估計;Sx描述樣本均數(shù)間的離散程度,并且是樣本均數(shù)標(biāo)準(zhǔn)誤的點估計(2)應(yīng)用:S標(biāo)準(zhǔn)差越小,說明變量值圍繞均值分布越緊密,均數(shù)的代表性越好 估計變量值的分布1-范圍;Sx標(biāo)準(zhǔn)誤越小,說明樣本均數(shù)和總體均數(shù)差異越小,用樣本均屬估計總體均數(shù)的可靠性越大用 估計總體均數(shù)的1-置信區(qū)間(3)與n的關(guān)系:n越大,樣本標(biāo)準(zhǔn)差S越穩(wěn)定;n越大,標(biāo)準(zhǔn)誤Sx越小聯(lián)系:都是描述變異程度的統(tǒng)計指標(biāo)n一定時,同一組資料,S越大,Sx越大控制方法:(S)個體差異或自然差異,不能通過統(tǒng)計方法來控制,(S)增加樣本量可減少 標(biāo)準(zhǔn)誤三、t分布特征t分布為一簇單峰分布曲線,V不同,曲線形狀不同t分布以0為中心,左右對稱t分布與V有關(guān),V越小,t值越分散,t分布的峰部越低,兩側(cè)尾部翹得越高 當(dāng) ,隨著V逐漸增大,t分布逐漸接近標(biāo)準(zhǔn)正態(tài)分布;當(dāng)V趨向時,t分布趨近標(biāo)準(zhǔn)正態(tài)分布四、t分布曲線面積與模糊t值間關(guān)系 t界值表中一側(cè)尾部面積稱為單側(cè)概率() 在相同自由度時|t|值增大,減小 相同時,單尾比雙尾對應(yīng)的值小18.評價可信區(qū)間估計的優(yōu)劣準(zhǔn)確度:可信度,即區(qū)間包含總體參數(shù)的理論概率大小,愈接近1愈好精確度:區(qū)間的寬度,區(qū)間愈窄愈好樣本含量為定值時,上述兩者相互矛盾 若只顧提高可信度,則可信區(qū)間會變寬五、標(biāo)準(zhǔn)正態(tài)分布(分布)和t分布有何不同?t分布為抽樣分布,標(biāo)準(zhǔn)正態(tài)分布(分布)為理論分布t分布比標(biāo)準(zhǔn)正態(tài)分布的峰值低且尾部翹的高隨著自由度的增大,t分布逐漸趨于標(biāo)準(zhǔn)正態(tài)分布,即當(dāng)自由度 時,t分布就會完全成為標(biāo)準(zhǔn)正態(tài)分布六、均數(shù)的可信區(qū)間與參考值范圍有何不同?七、點估計與區(qū)間估計(總體均數(shù)的估計)點估計 區(qū)間估計意義 直接用樣本統(tǒng)計點代替總體參數(shù) 用統(tǒng)計量 和 確定一個有概率的區(qū)間,且該區(qū)間具有較大的置信度包含總體均數(shù)估計方法 以 作為總體均數(shù) 的估計值 已知時,用正態(tài)近似法 未知時,且n較?。ㄈ鏽50時)用t分布法 未知時,但n足夠大時(如n50時)用正態(tài)近似法兩總體均數(shù)差值與置信區(qū)間 八、試說明 與 的區(qū)別 是資料服從正態(tài)分布或近似正態(tài)分布時,95%的參考值范圍與計算公式,該范圍內(nèi)包括了所計算的群體中95%的個體觀察值 是總體均數(shù)95%置信區(qū)間(CI)的計算公式,是按95%的置信度估計總體均數(shù)所在的范圍九、試說明 與 的區(qū)別兩者都是在總體標(biāo)準(zhǔn)差已知的情況下得出的前者是從均數(shù)為,標(biāo)準(zhǔn)差為 的正態(tài)總體中進(jìn)行隨機抽樣,95%的樣本均數(shù)所在的范圍;后者是總體均數(shù)95%的置信區(qū)間的計算公式,是按95%的置信度估計總體均數(shù)所在的范圍前者是概率論的研究內(nèi)容,從已知總體總體進(jìn)行隨機抽樣,研究樣本均數(shù)的抽樣分布規(guī)律,后者是統(tǒng)計學(xué)研究的內(nèi)容,用樣本均數(shù)和標(biāo)準(zhǔn)誤推斷總體均數(shù)十、置信區(qū)間有哪兩個要素,在使用時要注意什么?(一)置信區(qū)間的兩個要素:可信度和精準(zhǔn)性1可靠度:用1-表示,1-越大,置信區(qū)間越寬,說明用此區(qū)間估計總體參數(shù)的可靠度越高2.精確性:反映為置信區(qū)間的寬度,表示區(qū)間估計的精度。區(qū)間越窄,精度越高(二)注意事項1.精確性與變異的變異度大小,樣本含量以及1-的取值有關(guān)2.當(dāng)樣本誤差確定時,可靠度和精準(zhǔn)性是相互制約的,要想提高可靠度,可取較小的值,則必定會使置信區(qū)間變寬導(dǎo)致精準(zhǔn)度下降,故不能籠統(tǒng)的以為98%置信區(qū)間比95%置信區(qū)間好,一般常用95%置信區(qū)間,認(rèn)為它能較好的兼顧可靠度和精確性3.可靠度和精確性是相互矛盾的兩個方面,參數(shù)的置信區(qū)間估計的要旨是:充分利用樣本所提供的信息,做出盡可能可靠而精確的估計。補充:總體均數(shù)的置信區(qū)間的含義:按預(yù)先給定的概率,確定的包含未知總體均數(shù)的可能范圍,實際上一次抽樣算得的置信區(qū)間可能包含總體均數(shù),也可能不包含,但可以說當(dāng)=0.05時,95%CI估計正確的概率為0.95,估計錯誤的概率小于或等于0.05,說明我們對95%CI包含總體均數(shù)的信任程度總體均數(shù)為95%置信區(qū)間的含義可理解為:如果重復(fù)100次抽樣,每次抽樣含量均為n,每個樣本均按 構(gòu)建置信區(qū)間,則在此100個置信區(qū)間中,平均有95個包含總體均數(shù),5個不包含總體均數(shù)。第六章 假設(shè)檢驗一、假設(shè)檢驗的原因和目的原因:由于個體差異的存在,即使從同一總體中嚴(yán)格隨機抽樣,各樣本均數(shù)間會有差異,這種差異產(chǎn)生的原因有且只有兩種可能: 分別所代表的總體均數(shù)相同,由于抽樣誤差造成了樣本的差異,差別無顯著性 分別所代表的總體均數(shù)不同,差別有顯著性目的:假設(shè)檢驗的目的就是通過對樣本均數(shù)的比較來判斷各總體均數(shù)是否相等,通過假設(shè)檢驗,可回答樣本均數(shù)間的差異是由于抽樣誤差造成的還是總體均數(shù)造成的不同二、假設(shè)檢驗的基本思想:反證法:根據(jù)研究目的建立假設(shè) ,先假設(shè) 是正確的再分析樣本提供的信息是否支持 ,即在 成立條件下計算檢驗統(tǒng)計量,獲得相應(yīng)P值,根據(jù)P值大小來判斷。小概率事件原理:小概率事件(P0.05)在一次抽樣中發(fā)生的可能性很小,如果它發(fā)生了,則有理由懷疑 的正確性,認(rèn)為 成立,該結(jié)論的可能犯5%的錯誤。三、假設(shè)檢驗中,一般當(dāng)P0.05時,則拒絕 ,理由根據(jù)是什么?P值是從 規(guī)定的總體隨機抽得等于及大于(或、和等于及小于)現(xiàn)有樣本獲得的檢驗統(tǒng)計量值(如t或)的概率。當(dāng)P值,則不拒絕 ,無統(tǒng)計學(xué)意義,尚不能認(rèn)為不同或不等。五、怎樣正確選用單側(cè)檢驗和雙側(cè)檢驗?單雙側(cè)檢驗首先應(yīng)根據(jù)專業(yè)知識來確定,同時也應(yīng)考慮所要解決問題的目的。若從專業(yè)知識判斷一種方法的結(jié)果可能低于或高于另一種方法的結(jié)果,則用單側(cè)檢驗;若尚不能從專業(yè)知識判斷兩種結(jié)果誰高誰低時,用雙側(cè)檢驗。若研究者對低于或高于兩種結(jié)果都關(guān)心,則用雙側(cè)檢驗;若僅關(guān)心其中一種可能,則取單側(cè)檢驗。一般認(rèn)為雙側(cè)檢驗較保守和穩(wěn)妥,單側(cè)檢驗由于充分利用了另一側(cè)的不可能性,故更能得出有差別的結(jié)論,但應(yīng)慎用。六、假設(shè)檢驗的一般步驟建立檢驗假設(shè):假設(shè)樣本來自某一特定總體,根據(jù)所對應(yīng)實際問題建立原假設(shè) 及備擇假設(shè) 確定檢驗水準(zhǔn):確定最大容許誤差選定檢驗方法與計算檢驗統(tǒng)計量:計算樣本與總體的偏離程度計算與統(tǒng)計量對應(yīng)的P值作出結(jié)論:反證法思想小概率原理,判斷是接受 還是拒絕 。七、假設(shè)檢驗應(yīng)注意的問題要有嚴(yán)密的研究設(shè)計不同資料應(yīng)選用不同的檢驗方法正確理解significance:差別有統(tǒng)計學(xué)意義認(rèn)為兩總體或多個總體參數(shù)有差別 差別無統(tǒng)計學(xué)意義尚不能認(rèn)為兩總體或多個總體參數(shù)有差別結(jié)論不能絕對化:假設(shè)檢驗推斷作出的結(jié)論具有概率性,故不能絕對化在報告結(jié)論時,最好列出檢驗統(tǒng)計量的值,盡量寫出具體P值,而不簡單寫成P60且n260)的兩本均數(shù)的比較PS:當(dāng)樣本含量較大時,兩種檢驗方法計算得到的檢驗統(tǒng)計量t值和Z值 相等十九、什么是假設(shè)檢驗的功效?有什么意義?1-稱為假設(shè)檢驗的功效(Power),其含義是:當(dāng)所研究的總體與 確有差別時,按檢驗水平能夠發(fā)現(xiàn)它(拒絕 )的概率。如果1-=0.90,則意味著當(dāng) 不成立時,理論上在100次抽樣中,在的檢驗水平上平均有90次拒絕 。一般情況下,對于同一檢驗水準(zhǔn),功效大的加鹽方法更可取。影響檢驗功效的因素:總體參數(shù)個體差異(標(biāo)準(zhǔn)差)樣本量檢驗水準(zhǔn)。當(dāng)總體參數(shù)的差異越大,個體差異(標(biāo)準(zhǔn)差)越小,樣本量越大,檢驗水準(zhǔn)越大,檢驗功效越大。二十、配對設(shè)計有哪些形式第一種情況主要在實驗研究中,研究者將受試對象按某些特征(如性別、年齡等可能對研究結(jié)果有影響的因素,也稱混雜因素)配成對子,再隨機分配每個對子中的每個個體至兩個不同的處理因素或統(tǒng)一處理因素兩個不同水平中去第二種情況是將每份被測樣本一分為二,再隨機分配至不同的方法求測第三種情況是自身配對,每個受試對象在因素處理之前和處理后的比較第一種情況又稱異源性配對,第二三種情況又稱同源性配對二十一、擬合優(yōu)度 檢驗注意事項P164(方積乾的) P238(賀佳的)第七章 方差分析一、方差分析是用于研究何種數(shù)據(jù)與統(tǒng)計方法?用于定量變量資料,可用于比較兩個及兩個以上均數(shù)的差別各樣本是相互獨立的隨機變量,均服從正態(tài)分布各樣本的總體方差相等,即方差齊性二、方差分析與基本思想是什么?總離均差平方和以及總自由度怎么算?(一)基本思想是指根據(jù)實驗設(shè)計類型把全部觀察值間的差異(總變異)按設(shè)計和需要分解成兩個或多個組成部分,總自由度也分解成相對應(yīng)的幾個部分再分析。分解的每一部分代表不同的含義,其中至少有一部分代表各均數(shù)間的變異情況,另一部分代表誤差。除隨機誤差作用外,每一個部分的差異可由新因素的作用(或某幾個因素的交互作用)加以解釋,如組間變異SS組間可由處理因素作用加以解釋,通過比較不同變異來源的均方,借助F分布做出統(tǒng)計推斷,從而推斷各種研究因素對試驗結(jié)果有無影響(二)總變異以及總自由度的計算三、t檢驗和方差分析研究與應(yīng)用條件有何異同相同點:各樣本是相互獨立的隨機樣本,均服從正態(tài)分布各樣本的總體方差相等,即方差齊性對同一資料,兩獨立樣本t檢驗等價于完全隨機設(shè)計資料與方差分析且有F= 對同一資料,配對樣本t檢驗等價于隨機 組設(shè)計資料與方差分析且有F= 不同點:T檢驗用于兩樣本的均數(shù)的比較方差分析可對兩個以上的樣本均數(shù)進(jìn)行比較實際應(yīng)用中,兩樣本均數(shù)比較常用t檢驗,多個樣本均數(shù)比較則用方差分析四、完全隨機設(shè)計資料的方差分析中 、 各表示什么意義? 表示組間變異,指各處理組樣本均數(shù)大小不等,是由處理因素(如果有)的和隨機誤差造成的 表示組內(nèi)變異,指各處理組內(nèi)變異值大小不等,是由隨機誤差造成的五、隨機區(qū)組設(shè)計與完全隨機設(shè)計的區(qū)別?(含義不同,總變異的分解不同)(一)完全隨機設(shè)計是指特定完全同質(zhì)的受試對象隨機分配到各個處理組,再觀察其實驗效應(yīng),是最常見的兩水平或多水平的實驗設(shè)計方法,樣本量可以相等也可以不相等。(二)隨機區(qū)組設(shè)計又稱配伍組設(shè)計,是指將受試對象按性質(zhì)(如動物的窩別、年齡等非實驗因素)相同或相近者組成b個區(qū)組(配伍組),再將每個區(qū)組中的受試對象隨機分配到k個處理組中,隨機區(qū)組設(shè)計將資料按區(qū)組和處理組兩個方向進(jìn)行分組,在b個區(qū)組和k個處理組中保證了各組內(nèi)受試對象齊同可比,即減少組間誤差,提高檢驗效率六、數(shù)據(jù)變換在資料處理中起到什么作用?資料不滿足方差分析條件時,處理方法之一就是數(shù)據(jù)變換,對于明顯偏高,正態(tài)性和方差不齊的資料,通過適當(dāng)?shù)臄?shù)據(jù)變換可以近似的滿足假定條件,便于進(jìn)行方差分析。七、對兩組配對設(shè)計資料的比較,如果滿足差值服從正態(tài)分布的條件,則可用配對t檢驗,那么,此時可用隨機區(qū)組的方差分析寫?兩組配對設(shè)計資料,若差值服從正態(tài)分布的條件,則可用配對t檢驗和隨機區(qū)組的方差分析進(jìn)行檢驗它們在雙側(cè)檢驗的時候是等價的,但對于單側(cè)檢驗,配對t檢驗是可以做的,隨機區(qū)組的方差分析則不能配對t檢驗與隨機區(qū)組設(shè)計的方差分析對于滿足條件的同一資料,其檢驗統(tǒng)計量存在如下關(guān)系: =F八、隨機區(qū)組設(shè)計的實驗資料,如果用隨機區(qū)組設(shè)計的方差分析檢驗區(qū)組效應(yīng),其結(jié)果為無統(tǒng)計學(xué)意義,請問:能否用完全隨機設(shè)計的方差分析?隨機區(qū)組設(shè)計的實驗資料,若用隨機區(qū)組設(shè)計的方差分析檢驗區(qū)組效應(yīng),結(jié)果無統(tǒng)計學(xué)意義,對該資料而言是不能用完全隨機設(shè)計的方差分析進(jìn)行統(tǒng)計分析的因為 完全隨機設(shè)計的方差分析要求資料各組獨立,而隨機區(qū)組設(shè)計各組間是不獨立的,所以即便區(qū)組效應(yīng)無統(tǒng)計學(xué)意義,也不能改變其隨機區(qū)組設(shè)計的檢驗方式。九、多組資料樣本均數(shù) 比較能用t檢驗嗎.?(方差分析后為什么不能直接作兩兩比較t試驗?)不能。因為擁擠學(xué)的結(jié)論是在假設(shè) 成立的情況下,根據(jù)現(xiàn)有樣本提供的信息做出的概率性評估,無論拒絕或不拒絕都有可能犯錯誤若有n組樣本均數(shù)進(jìn)行比較,采用兩兩t檢驗,則共需作 次比較,每次比較犯I型錯誤的概率是0.05,每次比較均不犯I型錯誤的概率是 0.05因此,多個均數(shù)兩兩比較不宜用t檢驗做兩兩比較十、為什么在方差分析的結(jié)果為拒絕 ,接受 之后,多個樣本均數(shù)的兩兩比較要用多重比較?方差分析的備擇假設(shè) 是g個總體均數(shù)不全相等,拒絕 ,接受 ,只說明g個總體均數(shù)總的來說有差別,并不說明兩兩總體均數(shù)都有差別。若想進(jìn)一步了解哪兩兩總體均數(shù)不等,則需進(jìn)行多個樣本均數(shù)間的多重比較。十一、方差分析中的F檢驗為何是單側(cè)檢驗?方差分析中檢驗統(tǒng)計量F值的計算通常是用某部分的均方(如處理因素、交互效應(yīng)等)除以誤差的均分,其中,墳?zāi)拐`差部分的均方僅含隨機因素的作用么因此算得的F值從理論上講應(yīng)大于或等于1,而不會小于1,所以方差分析中3F界值采用單側(cè)檢驗的界值。十二、是否一定要方差分析發(fā)現(xiàn)有統(tǒng)計學(xué)意義后,再作均數(shù)間的兩兩比較?一般認(rèn)為,當(dāng)方差分析發(fā)現(xiàn)有統(tǒng)計實際上,這種任意方差分析屬于 計劃的事后比較而LSD-t檢驗,Dunmelt-t檢驗和Tukey HSD檢驗的多重比較就沒有必要事先進(jìn)行方差分析,均數(shù)間兩兩比較的方法很多,在分析實際資料時,有可能出現(xiàn)以下兩種情況:方差分析有統(tǒng)計學(xué)意義,而兩兩比較均無統(tǒng)計學(xué)意義 方差分析無統(tǒng)計學(xué)意義,而兩兩比較中某些均數(shù)間有統(tǒng)計學(xué)意義對于這兩種情況如界值在檢驗水準(zhǔn)附近,則下結(jié)論時應(yīng)特別謹(jǐn)慎,通常應(yīng)增大樣本量后再作分析和推斷十三、SNK-q檢驗與Dunmelt-t檢驗有何聯(lián)系與區(qū)別?(一) 聯(lián)系均為多重比較方法均可用于方差分析后進(jìn)一步進(jìn)行多個樣本均數(shù)間的兩兩比較(二) 區(qū)別SNK-q檢驗主要用于探索性研究適合于多個樣本均數(shù)的事后兩兩比較Dunmelt-t檢驗主要用于事先有明確假設(shè)的證實性研究,適合于多個處理組與對照組的比較十四、若采用兩兩比較的t檢驗,則其檢驗 準(zhǔn)和兩樣本均數(shù)之差標(biāo)準(zhǔn)誤作將何調(diào)整?若直接采用兩兩比較的t檢驗,會增大犯I類錯誤的概率,若比較次數(shù)為m,每次檢驗水準(zhǔn)為,則從理論上講,此時犯第I類錯誤的累計概率為 。明顯高于原有檢驗水準(zhǔn)。若要作兩兩比較的t檢驗,則應(yīng)減小其檢驗水準(zhǔn),可采用Bonfferon方法或Sida-k方法進(jìn)行調(diào)整同時兩樣本均數(shù)之差標(biāo)準(zhǔn)無的計算應(yīng)當(dāng)采用多個樣本的權(quán)據(jù)而不僅僅是被比較兩組的權(quán)據(jù)十五、多個樣本均數(shù)的兩兩比較法LSD-t檢驗:一對或多對專業(yè)上有特殊意義樣本均數(shù)間的比較Dunmelt-t檢驗:各實驗組與一個對照組樣本均數(shù)的多重比較SNK-q檢驗:多個樣本均數(shù)兩兩的全面比較十六、析因設(shè)計的三個效應(yīng)單獨效應(yīng):其他因素的水平固定時,同一因素不同水平間的差別主效應(yīng):某一因素不同水平間的平均差別交互效應(yīng):某因素的各單獨效應(yīng)隨另一變化而變化的情況。沒有交互效應(yīng)時,單獨效應(yīng)等于主效應(yīng)十七、重復(fù)測量資料的變異分解SS總=十八、配對設(shè)計與前后測量設(shè)計的比較配對設(shè)計:兩種處理作用于配對的兩個體可以對兩個個體同時觀測兩個個體的實驗觀測結(jié)果相互獨立對差數(shù)用配對資料t檢驗推論兩種處理有無差別前后測量設(shè)計:一種處理作用于一個個體同一個個體兩個不同時間的觀測兩個不同時間觀測結(jié)果常不互相獨立對差數(shù)用配對資料t檢驗方法處理有無作用,處理前后的相關(guān)與回歸分布十九、重復(fù)測量設(shè)計與隨機區(qū)組設(shè)計重復(fù)測量:處理因素在區(qū)組間隨機分配區(qū)組內(nèi)各時間點固定,不能隨機分配 區(qū)組內(nèi)實驗單位彼此不獨立隨機區(qū)組:處理因素在區(qū)組內(nèi)隨機分配各區(qū)組內(nèi)實驗單位彼此獨立第八章 卡方檢驗一、說明 檢驗的用途推斷兩個總體率或構(gòu)成比之間有無差別推斷多個總體率或構(gòu)成比之間有無差別推斷配對設(shè)計下兩組頻數(shù)分布的概率是否相同多個樣本率比較的 分割多個樣本率比較的趨勢檢驗兩個分類變量之間有無關(guān)聯(lián)性頻數(shù)分布擬合優(yōu)度檢驗兩個率的等效檢驗二、比較兩個獨立樣本頻數(shù)分布的 檢驗和比較兩個配對樣本頻數(shù)分布的 檢驗在設(shè)計、資料整理、假設(shè)檢驗率方面的區(qū)別是什么?(一)設(shè)計方面前者針對的是“兩獨立樣本”,行合計是事先固定的后者實質(zhì)上是一組樣本,即使可以看成兩個樣本,也是“兩個互不獨立的樣本”,樣本量都是n,是固定的,而行合計和列合計都是事先不確定的(二)資料整理四格表形式不同。 書P151表8-2 P157表8-8(三)假設(shè)檢驗前者采用Pearson 檢驗或Fisher確切概率法進(jìn)行檢驗后者采用McNemar配對 檢驗或?qū)?yīng)的確切概率法三、如果實驗效用會導(dǎo)致資料表示,欲比較兩組總體效應(yīng)間差別有無統(tǒng)計學(xué)意義,為什么不能用 檢驗?試舉例說明當(dāng) 檢驗顯示差別有統(tǒng)計學(xué)意義時,只能推斷兩頻率分布不同,而頻率分布不同不能說明兩總體平均水平不同四、為什么有些四格表(或RC表)必須要計算確切概率?因為只有在大樣本時,檢驗統(tǒng)計量 才近似服從 分布,樣本量不夠大時,如果n40,且T1時尚可以進(jìn)行校正,如果樣本量很小, 檢驗量不適用了,只能計算確切概率五、四格表的 檢驗與檢驗有何異同?(一)相同點凡可用檢驗進(jìn)行的兩個率的比較的資料,都可用四格表的 檢驗,兩者是等價的,且有 (二)不同點檢驗可進(jìn)行單側(cè)檢驗,而四格表 檢驗率用于雙側(cè)檢驗兩個率比較的檢驗進(jìn)一步計算可得出兩個率之差的可信區(qū)間,并可以根據(jù)專業(yè)知識判斷兩個率之差是否有實際意義,而四格表的 檢驗不能進(jìn)行兩個率之差的區(qū)間估計四格表的 檢驗可用于配對四格表資料的關(guān)聯(lián)性檢驗檢驗常用于大樣本,而 檢驗可用于大樣本或小樣本六、四格表資料的 檢驗應(yīng)用條件有哪些?當(dāng)n40且所有的T5時,可用非校正的 檢驗公式當(dāng)n40但有1T5時,需要用四格表資料的 檢驗的連續(xù)性校正公式當(dāng)n40或T1時,不能采用四格表資料的 檢驗,應(yīng)用確切概率法當(dāng) 檢驗所得的概率P時,應(yīng)改用Fisher確切概率法絕對權(quán)同質(zhì)(見“十一”)七、分析四格表資料時,通常在什么情況下需使用Fisher確切概率法?當(dāng)四格表資料的n40或T5時,用 檢驗的基本公式 或四格表資料 專用公式 當(dāng)n40但有1T5時,用四格表資料 檢驗的校正公式 或 或改用四格表資料的Fisher確切概率法當(dāng)n40,或T1時,用四格表資料的Fisher確切概率法,若資料滿足兩樣本率檢驗的條件,也可用檢驗3.對配對設(shè)計的四格表資料,若檢驗兩種方法的檢測結(jié)果有無差別時,當(dāng)(b+c)40時, 當(dāng)(b+c)10,n2-n110時采用檢驗,這時檢驗屬于參or非參?為什么?屬于非參數(shù)檢驗因為這時的檢驗是比較例數(shù)較小組秩和與總體均數(shù)n1(n+1)/2的差別,而秩和T不是參數(shù),其比較的仍是總體的分布而不是總體的參數(shù)兩組比較的秩和檢驗,當(dāng)n很大時,可利用秩和T的分布隨n增大漸進(jìn)正態(tài)分布的性質(zhì),進(jìn)行檢驗,此時利用的并不是原始數(shù)據(jù),而是經(jīng)秩變換后的數(shù)據(jù),故仍屬非參五、兩組或多組等級資料平均效能的比較為什么不用 檢驗而應(yīng)用秩和檢驗?若采用 檢驗,則只能說明組間的療效構(gòu)成有無差別,而不能說明組間的平均療效有無差別,因此應(yīng)選用秩和檢驗。 檢驗沒有考慮到有序的因素,有序分類變換順序后,卡方值是不變的,而秩和利用了有序信息通過排秩的方法,可以推斷總體間等級強度差別六、非參數(shù)檢驗的基本思想是什么?當(dāng)總體分布類型未知或總體分布不符合多數(shù)檢驗的應(yīng)用條件時,如何利用數(shù)據(jù)所包含的信息呢?一組數(shù)據(jù)最基本的信息是次序,將數(shù)據(jù)按大小次序排列,每個數(shù)據(jù)在整個數(shù)據(jù)中相應(yīng)的位置和次序,稱為該數(shù)據(jù)的秩在一定假設(shè)下,這些秩和其統(tǒng)計量的分布都是可以求出來的,且與原來的總體分布無關(guān),可以進(jìn)行所需要的統(tǒng)計推斷29.為什么秩和檢驗的編秩在不同對比組間出現(xiàn)相同數(shù)據(jù)要給予“平均秩次”,而同一組的相同數(shù)據(jù)不必計算“平均秩次”?因為在不同對比組,不取平均秩次會加大或減少某一組的秩和;在同一組內(nèi),出現(xiàn)相同數(shù)據(jù)不編平均秩次,該組秩和不受影響。6.隨機區(qū)組設(shè)計多個樣本比較的Friedman M檢驗,備擇假設(shè) 如何寫?為什么? 寫為多個總體分布位置不全相同 不能寫為多個總體分布不全相同。因為Friedman M檢驗對于多個總體分布的形狀 差別不敏感,只對其位置差別敏感4.總體有n個秩次1,2n。若n個秩中有相同秩(如1,2,4,4,4,6,7n),其均數(shù)和方差是否會改變?均數(shù)不改變。方差改變,變小。2.什么是秩轉(zhuǎn)換的參數(shù)檢驗,它適用于哪些情況?秩轉(zhuǎn)換的非參數(shù)檢驗是將數(shù)值變量從小到大或等級從弱到強轉(zhuǎn)換成秩后,再計算檢驗統(tǒng)計量,其特點是:假設(shè)檢驗的結(jié)果對總體分布的形狀差別不敏感,只對總體分布的位置差別敏感。適用于:不滿足正態(tài)性和方差齊性的小樣本計量資料分布不知是否正態(tài)的小樣本資料一端或兩端是不確切數(shù)值的資料等級資料七、參數(shù)檢驗和非參數(shù)檢驗的區(qū)別何在,各有何優(yōu)缺點(一)區(qū)別原理:1.參數(shù)檢驗在理論上要求樣本來自給定分布的總體,且該總體分布依賴于若干參數(shù),它是對總體參數(shù)( )或總體方差( )等總體參數(shù)的比較,計算檢驗統(tǒng)計量時用的是樣本數(shù)據(jù)本身。2.非參數(shù)統(tǒng)計其對總體分布不作嚴(yán)格限定,不受總體分布的限制,又稱任意分布檢驗,其直接對總體分布位置做檢驗,計算檢驗統(tǒng)計量時用的是樣本數(shù)據(jù)的秩次,這樣會損失很多信息PS:一般而言,符合參數(shù)檢驗應(yīng)用條件的資料應(yīng)盡可能用參數(shù)檢驗的方法,只有當(dāng)不符合時,才選用非參數(shù)檢驗的方法適用范圍:1.參數(shù)檢驗要求資料滿足特點性質(zhì),如:相互獨立、正態(tài)、方差齊性等2.非參數(shù)檢驗見“二”(二)優(yōu)缺點1.參數(shù)檢驗優(yōu)點:充分利用原始數(shù)據(jù)信息在符合參數(shù)檢驗條件時,檢驗效能較高可針對參數(shù)進(jìn)行推斷缺點:對數(shù)據(jù)有特定的分布要求,適用范圍較窄分析條件苛刻計算量大2.非參數(shù)檢驗優(yōu)點:適用范圍廣方法簡單,計算簡便易于理解和掌握對資料要求不高缺點:損失了原始數(shù)據(jù)的信息若對符合參數(shù)檢驗條件的資料用非參數(shù)檢驗會降低檢驗效能如需檢驗出同樣大小的差異,非參數(shù)檢驗往往需要更大的樣本含量第十章 兩變量關(guān)聯(lián)性分析一、為什么要做r和b的假設(shè)檢驗?b:即使從總體回歸系數(shù)等于0的總體中作隨機抽樣,由于抽樣誤差的存在,其樣本回歸系數(shù)b也不一定全為0,。因此,求得一個樣本回歸系數(shù)時,首先,需考慮線性方程是否成立?并進(jìn)行回歸系數(shù)是否為0的檢驗。以推斷自變量x與因變量y間是否有直線關(guān)系存在r:假定從總體相關(guān)系數(shù)b=0的總體中隨機抽樣,由于存在抽樣誤差,所得樣本相關(guān)系數(shù)r不一定全為0,因此求得一個樣本相關(guān)系數(shù)r后,仍需進(jìn)行總體相關(guān)系數(shù)b是否為0的假設(shè)補充:因為有兩種可能性會造成樣本相關(guān)系數(shù)r或回歸相關(guān)系數(shù)b不等于0,一種是抽樣誤差,一種是本質(zhì)差,因此,當(dāng)?shù)玫揭粋€不等于0的r或b時,不能立即下結(jié)論說x變量與y變量之間存在直線相關(guān)關(guān)系或直線回歸關(guān)系,必須先做假設(shè)檢驗,再下結(jié)論二、應(yīng)用直線先行相關(guān)分析時應(yīng)注意哪些問題?1.進(jìn)行相關(guān)分析前,應(yīng)繪制散點圖,當(dāng)散點分布有直線趨勢時,才宜作相關(guān)分析,另外散點圖能提示資料有無異常點,當(dāng)有異常點時慎用相關(guān)。2相關(guān)分析要求兩變量為服從正態(tài)分布的隨機變量,因此,當(dāng)有一個變量的數(shù)值為認(rèn)為選定時,莫作

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論