




已閱讀5頁,還剩31頁未讀, 繼續(xù)免費(fèi)閱讀
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
作業(yè)中的一些錯誤情況1:解題過程不完整,沒有明確指出所檢驗的假設(shè)和檢驗統(tǒng)計量。2:算錯檢驗統(tǒng)計量的值,或算錯檢驗的p值。(P27Ex2)解法一:總體總共分3類,要檢驗顧客是否對這三種肉食的喜好程度相同,這是一個分布的擬合優(yōu)度檢驗問題。(1)要檢驗的原假設(shè)為 :顧客對這三種肉食的喜好程度相同,即要檢驗:顧客對這三種肉食的喜好程度的分布為,(2)取檢驗統(tǒng)計量,檢驗分布為; (3)題中,則檢驗統(tǒng)計量的值為(計算過程略)(4)計算P值為: ,故在水平下拒絕,即調(diào)查數(shù)據(jù)不符合該均勻分布.解法二(采用似然比檢驗+p值形式)(1)要檢驗的原假設(shè)為 :顧客對這三種肉食的喜好程度相同,即要檢驗:顧客對這三種肉食的喜好程度的分布為,(2)選取似然比檢驗統(tǒng)計量,檢驗分布為;(3)題中,則檢驗統(tǒng)計量的值為(計算過程略)(4)計算P值為: ,故在水平下拒絕,即顧客對這三種肉食的喜好程度的分布不是均勻分布.注:若顯著性水平取,則臨界值為。(P27Ex3)解法一:總體總共分10類,這是一個分布的擬合優(yōu)度檢驗問題。(1)要檢驗的原假設(shè)為:學(xué)生對這十門課的選擇沒有傾向性,即要檢驗:學(xué)生選擇這十門課的人數(shù)分布為,(2)取檢驗統(tǒng)計量,檢驗分布為; (3)題中,則檢驗統(tǒng)計量的值為(計算過程略)(4)計算P值為: ,故在水平下不能拒絕,即認(rèn)為學(xué)生對這十門課的選擇沒有傾向性.解法二(采用似然比檢驗+ p值形式)(1)要檢驗的原假設(shè)為:學(xué)生對這十門課的選擇沒有傾向性,即要檢驗:學(xué)生選擇這十門課的人數(shù)分布為。(2)選取似然比檢驗統(tǒng)計量,檢驗分布為; (3)題中,則檢驗統(tǒng)計量的值為(計算過程略)(4)計算P值為: ,故在水平下不能拒絕,即認(rèn)為學(xué)生對這十門課的選擇沒有傾向性.注:若采用拒絕域法,臨界值為。(P27Ex4)解法一:(采用卡方擬合優(yōu)度檢驗法+拒絕域形式)(一)總體總共分3類,這是一個不含未知參數(shù)的分布檢驗問題。(1)要檢驗的原假設(shè)為:股票投資的盈虧分布為,統(tǒng)計得到的頻數(shù)分別為1697,1780,2129。(2)取檢驗統(tǒng)計量,拒絕域為,(3)對顯著性水平,臨界值為,(4)題中,則檢驗統(tǒng)計量的值為故在水平下拒絕,即調(diào)查數(shù)據(jù)不符合該偏好分布.(二)總體總共分3類,這是一個不含未知參數(shù)的分布檢驗問題。(1)要檢驗的原假設(shè)仍為:股票投資的盈虧分布為,統(tǒng)計得到的頻數(shù)分別為151+122,240,517+240。(2)取檢驗統(tǒng)計量,拒絕域為,(3)對顯著性水平,臨界值為,(4)題中,則檢驗統(tǒng)計量的值為故在水平下拒絕,即調(diào)查數(shù)據(jù)不符合該偏好分布.解法二:(采用似然比檢驗法+拒絕域形式) (一)總體總共分3類,這是一個不含未知參數(shù)的分布檢驗問題。(1)要檢驗的原假設(shè)為:股票投資的盈虧分布為,統(tǒng)計得到的頻數(shù)分別為1697,1780,2129。(2)選取似然比檢驗統(tǒng)計量,檢驗分布為,拒絕域為(3)對顯著性水平,臨界值為,(4)題中,則檢驗統(tǒng)計量的值為故在水平下拒絕,即調(diào)查數(shù)據(jù)不符合該偏好分布.(二)總體總共分3類,這是一個不含未知參數(shù)的分布檢驗問題。(1)要檢驗的原假設(shè)仍為:股票投資的盈虧分布為,統(tǒng)計得到的頻數(shù)分別為273,240,757。(2)選取似然比檢驗統(tǒng)計量,檢驗分布為,拒絕域為(3)對顯著性水平,臨界值為,(4)題中,則檢驗統(tǒng)計量的值為故在水平下拒絕,即調(diào)查數(shù)據(jù)不符合該偏好分布.注1:有同學(xué)混淆了兩種解法(卡方擬合優(yōu)度檢驗法與似然比檢驗法)的記號與稱呼。注2:本題中兩種方法得到的檢驗統(tǒng)計量的值相差很大。(P28Ex5)解法一:(卡方擬合優(yōu)度檢驗)總體總共分3類,分布中有1個未知參數(shù),這是一個含參數(shù)的分布檢驗問題。(1)要檢驗的原假設(shè)為:紅、白、粉紅色花的分布為,其中。(2)先在為真時,似然函數(shù)為取對數(shù)得求關(guān)于的導(dǎo)數(shù),并令之為0得對數(shù)似然方程為:解得的極大似然估計值為(3)算出的分布列中的極大似然估計值;。(4)取檢驗統(tǒng)計量,拒絕域為,(5)對顯著性水平,臨界值為,(6)題中,則檢驗統(tǒng)計量的值為故在水平下不能拒絕,即調(diào)查數(shù)據(jù)符合該偏好分布.注:有同學(xué)誤認(rèn)為檢驗的臨界值為。解法二:(采用似然比檢驗)(1) (2) (3)步驟同上。(4)算出無假定條件下諸的極大似然估計:,(5)選取似然比檢驗統(tǒng)計量,拒絕域為,(6)對顯著性水平,臨界值為,(7)則檢驗統(tǒng)計量的值為故在水平下不能拒絕,即調(diào)查數(shù)據(jù)符合該偏好分布.注:p值(P28Ex6)解法一:(卡方擬合優(yōu)度檢驗)總體總共分4類,分布中有2個參數(shù),這是一個含參數(shù)的分布擬合檢驗問題。(1)要檢驗的原假設(shè)為:人的血型分布為,其中(2)先在為真時,算出似然函數(shù)在約束條件下,取,化似然函數(shù)為無約束二元函數(shù):取對數(shù)得注意到用微分法很難求出極大似然估計值的精確解,我們考慮近似計算。首先由“O”型和“B”型兩類的矩估計算出參數(shù)向量的初始估計:然后參照課本25頁利用EXCEL算得的極大似然估計值(3)算出諸的極大似然估計值;且在為真時,對數(shù)似然函數(shù)的最大值為。(4)取檢驗統(tǒng)計量,拒絕域為,(5)對顯著性水平,臨界值為,(6)題中,則檢驗統(tǒng)計量的值為(計算過程略)故在水平下不能拒絕,即調(diào)查數(shù)據(jù)符合該偏好分布.解法二:(采用似然比檢驗)(1) (2) (3)步驟同上。(4)算出無假定條件下諸的極大似然估計:,(5)選取似然比檢驗統(tǒng)計量,拒絕域為,(6)對顯著性水平,臨界值為,(7)題中,則檢驗統(tǒng)計量的值為(計算過程略)故在水平下不能拒絕,即調(diào)查數(shù)據(jù)符合該偏好分布.注1:本題中極大似然估計值的精確解很難得到,采用迭代法進(jìn)行近似計算,計算量大,要使用軟件進(jìn)行計算,而且要確定未知參數(shù)向量的迭代初始值。由于實際未知參數(shù)只有兩個,需要建立兩個方程用于給出迭代初始值。一個很自然的考慮是利用諸的矩估計(也就是無假定條件下諸的極大似然估計)可建立四個方程:為方便,關(guān)鍵是選擇哪兩個變量,和選擇哪兩個方程來建立方程組,計算用于迭代的初始值。本題中,我們選擇了變量,選擇了方程。注2: 無假定條件下似然函數(shù)對數(shù)似然函數(shù)的最大值為注:p值(P68Ex1)解:(本題是單邊檢驗,采用四格表的U檢驗法)(1)建立四格表正常數(shù)病例數(shù)合計人數(shù)處理組20068857200745對照組201087142201229合計401775199401974(2)記概率P(正常|處理組),P(正常|對照組),疫苗有效是指,所以本題是要檢驗假設(shè) ,(3)取檢驗統(tǒng)計量,拒絕域為,(4)對顯著性水平,臨界值,(5)由題中數(shù)據(jù)算得檢驗統(tǒng)計量的值為故在水平下拒絕,即疫苗有效.注1:假設(shè)檢驗的第一步是建立假設(shè),要正確建立原假設(shè),并且要正確建立備擇假設(shè)!對于備擇假設(shè),具體場合下要能正確區(qū)分 “雙邊檢驗”與“單邊檢驗”。(P68Ex3)解法一:(本題是單邊檢驗,采用四格表的U檢驗法)(1)建立四格表長勢良好長勢不好合計A種肥料5347100B種肥料783117900合計8361641000(2)記概率P(長勢良好|施A種肥料), P(長勢良好|施B種肥料),B種肥料效果顯著的好是指,所以本題是要檢驗假設(shè) ,(3)取檢驗統(tǒng)計量,拒絕域為,(4)對顯著性水平,臨界值,(5)由題中數(shù)據(jù)算得檢驗統(tǒng)計量的值為故在水平下拒絕,即B種肥料效果顯著的好.解法二:(本題是單邊檢驗,采用修正的四格表的U檢驗法)(1)建立四格表長勢良好長勢不好合計A種肥料5347100B種肥料783117900合計8361641000(2)記概率P(長勢良好|施A種肥料), P(長勢良好|施B種肥料),B種肥料效果顯著的好是指,所以本題是要檢驗假設(shè) ,(3)取檢驗統(tǒng)計量,拒絕域為,(4)對顯著性水平,臨界值,(5)由題中數(shù)據(jù)算得檢驗統(tǒng)計量的值為故在水平下拒絕,即B種肥料效果顯著的好.注1:本題中的樣本量比較大,故是否使用連續(xù)性修正,和似乎差異不大。一般樣本容量比較大時不必使用連續(xù)性修正。注2:本題應(yīng)采用單邊檢驗,所以不能使用卡方檢驗!(P68Ex4)解法一:(本題是雙邊檢驗,采用四格表的U檢驗法)(1)建立四格表有自殺情緒無自殺情緒合計精神病患者32225神經(jīng)病患者91625合計123850(2)記精神病患者有自殺情緒的比例,神經(jīng)病患者有自殺情緒的比例,本題要檢驗兩比例是否相等,即要檢驗假設(shè) ,(3)取檢驗統(tǒng)計量,拒絕域為,(4)對顯著性水平,臨界值,(5)由題中數(shù)據(jù)算得檢驗統(tǒng)計量的值為因為,故在水平下拒絕,即兩比例不相等.解法二:(本題是雙邊檢驗,采用四格表的卡方檢驗法)(1)建立四格表有自殺情緒無自殺情緒合計精神病患者32225神經(jīng)病患者91625合計123850(2)記精神病患者有自殺情緒的比例,神經(jīng)病患者有自殺情緒的比例,本題要檢驗兩比例是否相等,即要檢驗假設(shè) ,(3)取檢驗統(tǒng)計量,拒絕域為,(4)對顯著性水平,臨界值,(5)由題中數(shù)據(jù)算得檢驗統(tǒng)計量的值為故在水平下拒絕,即兩比例不相等.解法三:(本題是雙邊檢驗,采用四格表的似然比檢驗法)(1)建立四格表有自殺情緒無自殺情緒合計精神病患者32225神經(jīng)病患者91625合計123850(2)記精神病患者有自殺情緒的比例,神經(jīng)病患者有自殺情緒的比例,本題要檢驗兩比例是否相等,即要檢驗假設(shè) ,(3)取檢驗統(tǒng)計量,拒絕域為,(4)對顯著性水平,臨界值,(5)由題中數(shù)據(jù)算得檢驗統(tǒng)計量的值為故在水平下拒絕,即兩比例不相等.注1:拒絕域要與假設(shè)配套,主要看備擇假設(shè)!本題是雙邊檢驗,U檢驗的拒絕域也應(yīng)是雙邊形式的,不能再象P68ex1那樣用單邊形式的拒絕域!具體場合下要能正確區(qū)分 “雙邊檢驗”與“單邊檢驗”。注2:考慮到本題中的樣本量比較小,特別有的格子里的值為3(都小于5了?。适褂眠B續(xù)性修正似乎更好些。采用四格表的修正的卡方檢驗法(解法四),則(3)取檢驗統(tǒng)計量,拒絕域為,(4)對顯著性水平,臨界值,(5)由題中數(shù)據(jù)算得檢驗統(tǒng)計量的值為故在水平下不能拒絕,即兩比例相等.有意思的是,這時候得出了相反的結(jié)論!注3:SPSS軟件能很方便地計算四格表獨立性雙邊檢驗的幾種檢驗統(tǒng)計量和p值,下列為本題的SPSS卡方檢驗的程序輸出??ǚ綑z驗值df漸進(jìn) Sig. (雙側(cè))精確 Sig.(雙側(cè))精確 Sig.(單側(cè))Pearson 卡方3.947a1.047連續(xù)校正b2.7411.098似然比4.0911.043Fisher 的精確檢驗.095.048有效案例中的 N50a. 0 單元格(.0%) 的期望計數(shù)少于 5。最小期望計數(shù)為 6.00。b. 僅對 2x2 表計算(P71Ex12)本題是一個著名的心理學(xué)實驗。解:(本題不妨取單邊檢驗,采用四格表的U檢驗法)分兩方面進(jìn)行分析:種口味是否比6種口味更能吸引顧客試吃?種口味是否比6種口味更能吸引顧客購買?另外,數(shù)據(jù)計算上注意到:,。(一)種口味是否比6種口味更能吸引顧客試吃?(1)建立四格表顧客試吃顧客未試吃合計種口味145972426種口味104156260合計249253502(2)記概率P(顧客試吃|種口味),P(顧客試吃|6種口味),現(xiàn)在要檢驗假設(shè) ,(3)取檢驗統(tǒng)計量,拒絕域為,(4)對顯著性水平,臨界值,(5)由題中數(shù)據(jù)算得檢驗統(tǒng)計量的值為故在水平下拒絕,即種口味比6種口味更能吸引顧客試吃.(二)種口味是否比6種口味更能吸引顧客購買?(1)建立四格表顧客購買顧客未購買合計種口味42382426種口味31229260合計35467502(2)記概率P(顧客購買|種口味),P(顧客購買|6種口味),現(xiàn)在要檢驗假設(shè) ,(3)取檢驗統(tǒng)計量,拒絕域為,(4)對顯著性水平,臨界值,(5)由題中數(shù)據(jù)算得檢驗統(tǒng)計量的值為故在水平下接受,即種口味沒能比6種口味更能吸引顧客購買.(三)進(jìn)一步考察種口味是否比6種口味更能吸引顧客購買?考慮改成要檢驗假設(shè) ,(3)取檢驗統(tǒng)計量,拒絕域為,(4)對顯著性水平,臨界值,(5)由題中數(shù)據(jù)算得檢驗統(tǒng)計量的值為故在水平下拒絕,即種口味吸引顧客購買的比例竟然顯著低于6種口味吸引顧客購買的比例.這似乎有點奇怪,不過仔細(xì)想來,符合生活中的實際情況。注1:關(guān)于本題的背景:果醬實驗選擇不是越多越好?有選擇比沒選擇好,選擇多比選擇少好,這幾乎成了人們生活中的常識。但實際情況并非如此。紐約哥倫比亞大學(xué)的研究人員希娜延加開展自己的實驗,研究發(fā)現(xiàn),如果讓消費(fèi)者選擇在6種還是24種果醬中挑選一種時,人們都愿意有更多的選擇??墒钦嬲龥Q定購買的時候,在6種果醬中選擇的人們作出的購買決定,是在24種果醬中選擇的人作出購買決定的10倍。實驗是在加州斯坦福大學(xué)附近的一個以食品種類繁多而聞名的超市中進(jìn)行的。工作人員在超市里設(shè)置了兩個試吃攤位,一個有種口味的果醬,另一個有種口味的果醬。結(jié)果顯示有種口味的攤位吸引的顧客較多:242位經(jīng)過的客人中,60會停下來試吃,而260個經(jīng)過種口味的攤位的客人中,停下來試吃的只有40。不過最終的結(jié)果卻出乎人們的意料:在有種口味的攤位前停下的顧客中有30的人都至少買了一瓶果醬,而在有種口味的攤位前停下試吃者中只有3的人購買了果醬??磥磉^多選項也不見得是一件好事,它會使人們陷入游移不定的狀態(tài)。注2:考察種口味是否比6種口味更能吸引顧客購買時,有同學(xué)采用的假設(shè)檢驗如下:記概率P(顧客購買|試吃種口味),P(顧客購買|試吃6種口味),現(xiàn)在要檢驗假設(shè) (P69Ex5)分析:記左半球中有良性腫瘤的比例,右半球中有良性腫瘤的比例,本題要檢驗假設(shè)注意到四個格子中有三個格子的頻數(shù)小于5,顯然這是一個小樣本的場合,所以題目要求采用Fisher精確檢驗法進(jìn)行檢驗。解:(Fisher精確檢驗法)(1)記左半球中有良性腫瘤的比例,右半球中有良性腫瘤的比例,本題要檢驗假設(shè)(2)采用Fisher精確檢驗法,即取超幾何分布為檢驗分布,檢驗的p值為,(3)題中,并注意到題中,故檢驗的p值為因為,故在水平下不能拒絕,即認(rèn)為兩比例相等.注1:有同學(xué)未按照題目要求解題,題目要求采用Fisher精確檢驗法,但仍有同學(xué)采用單邊的U檢驗法甚至采用雙邊的卡方檢驗。注2:在計算出p值后,有不少同學(xué)給出的檢驗結(jié)論是錯誤的。P值是要和檢驗水平比較的:當(dāng)P值小時,不能拒絕原假設(shè),即認(rèn)為兩比例相等.注3:計算P(HG(N,M,n)=k),可調(diào)用Excel中的函數(shù)HYPGEOMDIST(sample_s,number_sample,population_s,number_population)=HYPGEOMDIST(k;n,M,N)注4:下表中有其他幾種方法的檢驗結(jié)果,由于是小樣本,可以看到,連續(xù)性校正的效果與精確檢驗一致。又問為何下表中精確檢驗的雙側(cè)p值與單側(cè)p值差不多? 卡方檢驗值df漸進(jìn) Sig. (雙側(cè))精確 Sig.(雙側(cè))精確 Sig.(單側(cè))Pearson 卡方3.200a1.074連續(xù)校正b1.4221.233似然比3.1751.075Fisher 的精確檢驗.118.118有效案例中的 N16a. 3 單元格(75.0%) 的期望計數(shù)少于 5。最小期望計數(shù)為 1.50。b. 僅對 2x2 表計算(P69Ex7)解法一:(Fisher精確檢驗法)(1)將這個人隨機(jī)猜測作為原假設(shè),將有品酒能力作為備擇假設(shè)。即記,本題要檢驗假設(shè)(2)采用Fisher精確檢驗法,即取超幾何分布為檢驗分布,檢驗的p值為,(3)題中,并注意到題中,故檢驗的p值為因為,故在水平下拒絕,即認(rèn)為這個人不是隨機(jī)猜測,而是有品酒能力的.注1:不少同學(xué)在如何建立原假設(shè)時有問題,首先應(yīng)該選擇“沒有品酒能力”為原假設(shè)。注2:如何具體表示“沒有品酒能力為原假設(shè)”,將其數(shù)學(xué)化,也存在不同的想法,這個問題的確值得進(jìn)一步探討。聯(lián)系Ex8,大家可以討論下如何建立假設(shè)的問題,這應(yīng)該是一個沒有絕對正確答案的問題,應(yīng)該有一定主觀性。注3:下表中有其他幾種方法的檢驗結(jié)果,由于是小樣本,可以看到,連續(xù)性校正的效果與精確檢驗一致。卡方檢驗值df漸進(jìn) Sig. (雙側(cè))精確 Sig.(雙側(cè))精確 Sig.(單側(cè))Pearson 卡方6.533a1.011連續(xù)校正b4.8001.028似然比6.7941.009Fisher 的精確檢驗.027.013有效案例中的 N30a. 0 單元格(.0%) 的期望計數(shù)少于 5。最小期望計數(shù)為 7.50。b. 僅對 2x2 表計算(P70Ex9)解:(本題應(yīng)該仿照例3.9進(jìn)行統(tǒng)計分析)方法一:采用McNemar檢驗記,(1)要進(jìn)行邊緣齊性檢驗,即檢驗假設(shè) 也就是要進(jìn)行對稱性檢驗 ,(2)采用McNemar卡方檢驗統(tǒng)計量,拒絕域為。(3)題中,則檢驗統(tǒng)計量的值為,故在水平下不能拒絕,即認(rèn)為檢測方法1檢驗為陽性的比例與檢測方法2檢驗為陽性的比例相等.方法二:采用似然比檢驗(1)要進(jìn)行邊緣齊性檢驗,即檢驗假設(shè) 也就是要進(jìn)行對稱性檢驗 ,(2)采用似然比檢驗統(tǒng)計量,拒絕域為。(3)題中,則檢驗統(tǒng)計量的值為,故在水平下不能拒絕,即認(rèn)為檢測方法1檢驗為陽性的比例與檢測方法2檢驗為陽性的比例相等.(P71Ex11)分析:很多同學(xué)對本題也仿照例3.9進(jìn)行統(tǒng)計分析,但也有少數(shù)同學(xué)注意到本題處于Ex10之后,似乎按照Ex10進(jìn)行統(tǒng)計分析更為合理。關(guān)鍵是對文字“競選初期支持民主黨的選民后來支持共和黨的比例”的解讀產(chǎn)生的歧義,究竟是理解成:“選民在競選初期支持民主黨且后來支持共和黨的比例”,還是“在競選初期支持民主黨的選民中后來支持共和黨的比例”。即究竟是積事件的概率,還是條件概率?以下我把兩種分析結(jié)果都羅列出來:理解一:理解為積事件的概率相等:采用McNemar檢驗(1)要進(jìn)行對稱性檢驗,即檢驗假設(shè) (2)采用McNemar卡方檢驗統(tǒng)計量,拒絕域為。(3)題中,則檢驗統(tǒng)計量的值為,故在水平下不能拒絕,即認(rèn)為競選初期支持民主黨且后來支持共和黨的比例與競選初期支持共和黨且后來支持民主黨的比例相等.理解二:理解為兩條件概率的相等:采用Ex10的檢驗方法記(1)要檢驗假設(shè) (考慮交換頻數(shù)與的位置,形成新的四格表,再用U檢驗)(2)采用檢驗統(tǒng)計量,拒絕域為。(3)算得檢驗統(tǒng)計量的值為,故在水平下拒絕,即認(rèn)為“在競選初期支持民主黨的選民中后來支持共和黨的比例”顯著“小于競選初期支持共和黨的選民中后來支持民主黨的比例”.(P71Ex13)解:由題意知:,。則相對危險度為:。又因為,所以優(yōu)比為:。注1:有些同學(xué)在解題時,設(shè)法還原出概率四格表,甚至還原出頻率四格表。但這些表格都是錯的。因為僅根據(jù)題中的已知條件是無法還原出四格表的!由題意可知條件概率,但不知道或的值,所以無法知道積事件的概率:,所以無法還原出概率四格表,更無法知道頻率四格表。注2:本題未要求進(jìn)行顯著性檢驗。(P108Ex1)解:(本題是關(guān)于分布齊性的檢驗,也可以看作是獨立性檢驗,應(yīng)該采用二維列聯(lián)表的卡方檢驗或似然比檢驗,具體可以寫成如下四種不同的解法)(1)要檢驗假設(shè)供應(yīng)商與零件質(zhì)量獨立供應(yīng)商與零件質(zhì)量不相互獨立。(也就是要進(jìn)行齊性檢驗各供應(yīng)商的零件質(zhì)量分布相同供應(yīng)商的零件質(zhì)量分布不全相同)方法一:卡方檢驗+臨界值檢驗法(2)采用卡方檢驗統(tǒng)計量,拒絕域為。(3)題中,臨界值為,(4)檢驗統(tǒng)計量的值為,故在水平下不能拒絕,即認(rèn)為供應(yīng)商與零件質(zhì)量獨立,即各供應(yīng)商的零件的質(zhì)量分布都相同.方法二:似然比檢驗+臨界值檢驗法(2)采用似然比檢驗統(tǒng)計量,拒絕域為。(3)題中,臨界值為,(4)檢驗統(tǒng)計量的值為,故在水平下不能拒絕,即認(rèn)為供應(yīng)商與零件質(zhì)量獨立,即各供應(yīng)商的零件的質(zhì)量分布都相同.方法三:卡方檢驗+p值檢驗法(2)采用卡方檢驗統(tǒng)計量,檢驗分布為,且拒絕域形式為。(3)檢驗統(tǒng)計量的值為,(4)檢驗的p值為,故在水平下不能拒絕,即認(rèn)為供應(yīng)商與零件質(zhì)量獨立,即各供應(yīng)商的零件的質(zhì)量分布都相同.方法四:似然比檢驗+p值檢驗法(2)采用似然比檢驗統(tǒng)計量,檢驗分布為,且拒絕域形式為。(3)檢驗統(tǒng)計量的值為,(4)檢驗的p值為,故在水平下不能拒絕,即認(rèn)為供應(yīng)商與零件質(zhì)量獨立,即各供應(yīng)商的零件的質(zhì)量分布都相同.(P109Ex7)(方表的一致性問題)兩個中醫(yī)對一批病人的診斷結(jié)果如下:醫(yī)生A醫(yī)生B陽虛陰虛陰陽兩虛陽虛2531陰虛190陰陽兩虛1215試計算一致性度量的估計值。(一)一致性度量的計算要檢驗醫(yī)生A與醫(yī)生B的診斷是否真的一致.(1)要檢驗假設(shè)醫(yī)生A與B的診斷偶然一致醫(yī)生A與B的診斷不是偶然一致。(2)采用檢驗統(tǒng)計量,拒絕域為。(3)取,臨界值為,拒絕域為(4)檢驗統(tǒng)計量的值為,故在水平下拒絕,即認(rèn)為醫(yī)生A與B的診斷不是偶然一致。對稱度量值漸進(jìn)標(biāo)準(zhǔn)誤差a近似值 Tb近似值 Sig.一致性度量Kappa.776.0728.142.000有效案例中的 N57a. 不假定零假設(shè)。b. 使用漸進(jìn)標(biāo)準(zhǔn)誤差假定零假設(shè)。(P110Ex8)(聯(lián)系附錄7)解法一:邊際和都給定時,我們按如下方式理解需要解決的問題。個單元中有個單元屬于,記非隨機(jī)示性變量 ()個單元的屬性B看成等可能的隨機(jī)分配,屬于的有個單元,。記隨機(jī)變量 ()則,且01P的分布列為時,的聯(lián)合分布列 010*1從而有,則 所以解法二:給定,將表格壓縮為四格表,;利用超幾何分布處理。 BABj非Bj合計Ai*非Ai*合計則隨機(jī)變量,由課本62頁公式因此(P159Ex1)分析:要確定別嘌呤醇會不會引起皮疹,數(shù)據(jù)是的三維列聯(lián)表的分析,還涉及性別,一個基本思路是如何降維成二維列聯(lián)表的卡方檢驗或似然比檢驗。解:記條件概率P(皮疹|使用別嘌呤醇),P(皮疹|不使用別嘌呤醇),“別嘌呤醇會引起皮疹”是指。(一)將三維列聯(lián)表壓縮成四格表的分析(1)壓縮后得四格表引起皮疹未引起皮疹合計使用別嘌呤醇155267未使用別嘌呤醇9411631257合計10912151324(2)要檢驗假設(shè)別嘌呤醇與皮疹無關(guān)別嘌呤醇會引起皮疹。即要檢驗假設(shè) ,(右側(cè)檢驗)(3)取檢驗統(tǒng)計量,拒絕域為,(4)對顯著性水平,臨界值,(5)由題中數(shù)據(jù)算得檢驗統(tǒng)計量的值為故在水平下拒絕,即別嘌呤醇會引起皮疹.(二)將三維列聯(lián)表按照性別變量分層,分別對兩個四格表分析(1)分層后得 “是否使用別嘌呤醇是否引起皮疹”(男性)四格表引起皮疹未引起皮疹合計使用別嘌呤醇53338未使用別嘌呤醇36645681合計41678719“是否使用別嘌呤醇是否引起皮疹”(女性)四格表引起皮疹未引起皮疹合計使用別嘌呤醇101929未使用別嘌呤醇58518576合計68537605(2)要分別檢驗假設(shè):(對于男性)別嘌呤醇與皮疹無關(guān)別嘌呤醇會引起皮疹。(對于女性)別嘌呤醇與皮疹無關(guān)別嘌呤醇會引起皮疹。(3)取檢驗統(tǒng)計量,拒絕域為,(4)對顯著性水平,臨界值,(5)由題中數(shù)據(jù)分別算得檢驗統(tǒng)計量的值為故在水平下都拒絕,即對于男性和女性,別嘌呤醇都會引起皮疹.(三)上述壓縮和分層兩方面的分析結(jié)果是一致的,綜合來看,可以認(rèn)為別嘌呤醇會引起皮疹。(四)(補(bǔ)充:條件獨立性檢驗)(1)要檢驗假設(shè):性別給定后別嘌呤醇與皮疹條件獨立,性別給定后別嘌呤醇與皮疹不條件獨立。(2)取檢驗統(tǒng)計量,拒絕域為。(3)對顯著性水平,臨界值,(4)由題中數(shù)據(jù)分別算得檢驗統(tǒng)計量的值為故在水平下都拒絕,即性別給定時,別嘌呤醇與皮疹不條件獨立,是有關(guān)系的.注1:由于涉及小樣本,特別要注意對于男性的分層檢驗,連續(xù)性校正應(yīng)該更為合理。注2:可以發(fā)現(xiàn),男性與女性的P值有差異。原因是什么?(P159Ex2)解:(解題思路同Ex1)記條件概率P(死亡|護(hù)理較少),P(死亡|護(hù)理較多),題中關(guān)注的是是否成立。(一)將三維列聯(lián)表壓縮成四格表的分析(1)壓縮后得四格表死亡存活合計較少20373393較多6316322合計26689715(2)要檢驗假設(shè)護(hù)理多少與嬰兒死亡無關(guān)護(hù)理少會引起嬰兒死亡多。即要檢驗假設(shè) ,(右側(cè)檢驗)(3)取檢驗統(tǒng)計量,拒絕域為,(4)對顯著性水平,臨界值,(5)由題中數(shù)據(jù)算得檢驗統(tǒng)計量的值為故在水平下拒絕,即護(hù)理少會引起嬰兒死亡多.(二)將三維列聯(lián)表分層為兩個四格表的分析(1)分層后得 “護(hù)理嬰兒生存情況”(A醫(yī)院)四格表死亡存活合計較少3176179較多4293297合計7469476“護(hù)理嬰兒生存情況”(B醫(yī)院)四格表死亡存活合計較少17197214較多22325合計19220239(2)要分別檢驗假設(shè):(對于A醫(yī)院)護(hù)理多少與嬰兒死亡無關(guān)護(hù)理少會引起嬰兒死亡多。(對于B醫(yī)院)護(hù)理多少與嬰兒死亡無關(guān)護(hù)理少會引起嬰兒死亡多。(3)取檢驗統(tǒng)計量,拒絕域為,(4)對顯著性水平,臨界值,(5)由題中數(shù)據(jù)分別算得檢驗統(tǒng)計量的值為故在水平下都不能拒絕,即對于A醫(yī)院和B醫(yī)院,護(hù)理多少與嬰兒死亡無關(guān).(三)上述壓縮和分層兩方面的分析結(jié)果不一致,由于壓縮會受到混雜因素的干擾,分層分析的結(jié)論是可靠的,所以認(rèn)為護(hù)理多少與嬰兒死亡無顯著關(guān)系。注:本題類似例5.2,和“Simpson悖論”的例子相似。醫(yī)院是混雜因素,兩醫(yī)院中的護(hù)理多與護(hù)理少的嬰兒比例差異很大?!白o(hù)理嬰兒生存情況”(A醫(yī)院)條件分布列死亡存活較少0.016760.98324死亡存活較多0.0134680.986532“護(hù)理嬰兒生存情況”(B醫(yī)院)條件分布列死亡存活較少0.0794390.920561死亡存活較多0.080.92B醫(yī)院的死亡率高于A醫(yī)院,兩個死亡率的差異主要是醫(yī)院因素造成的。壓縮后的四格表中其中,但(P160Ex3)分析:先將屬性B和C合并成一個屬性變量,再采用二維列聯(lián)表的卡方檢驗或似然比檢驗(見教材129-130頁)。解:(1)合并數(shù)據(jù)得城市* 文化程度和看法 交叉表城市1234文化程度和看法1(小學(xué)不同意)23188122(小學(xué)不表態(tài))76693(小學(xué)同意)21314(初中不同意)1061225(初中不表態(tài))23184156(初中同意)52437(高中不同意)52238(高中不表態(tài))20131189(高中同意)131361410(大學(xué)不同意)624611(大學(xué)不表態(tài))1097412(大學(xué)同意)2415713(2)要檢驗假設(shè)城市間文化程度與看法沒有差別 城市間文化程度與看法有差別。即要檢驗假設(shè)屬性A與(B,C)獨立 屬性A與(B,C)不獨立。(3)取檢驗統(tǒng)計量,拒絕域為,(4)顯著性水平,臨界值,(5)由題中數(shù)據(jù)算得檢驗統(tǒng)計量的值為故在水平下不能拒絕,即認(rèn)為城市間文化程度與看法沒有差別.(P160Ex4)分析:參考教材例5.3的解法,建立表格,匯總各獨立性檢驗的結(jié)果。解:用A表示年齡,B表示治療效果,C表示治療方法,獨立性檢驗結(jié)果如下:原假設(shè)自由度臨界值P值(A,B,C)36.45738.372714.0670.000(A,BC)(B,AC)(C, AB)34.29136.4573.80835.57538.3723.78256511.0712.59211.070.0000.0000.577(AB,AC)(BA,BC)(CA, CB)3.8081.64334.2913.7811.64635.5754349.4887.8159.4880.4330.6500.000綜上,治療方法與(年齡,治療效果)相互獨立,即治療方法之間沒有顯著差異。年齡與治療效果之間不獨立,有顯著關(guān)系。接下來可以合并數(shù)據(jù)分析年齡與治療效果之間的關(guān)系。注:相互獨立意味著數(shù)據(jù)合起來看與分開來是一致的,因此合并各層數(shù)據(jù),同一層的兩個變量間的關(guān)系可以看得更為清楚穩(wěn)定。(P160Ex6)(分開看與合起來看)分析:綜合分層分析與壓縮合并數(shù)據(jù)分析,得出合理的結(jié)論。解:記條件概率P(偏好飲料A|男性),P(偏好飲料B|女性),(一)將三維列聯(lián)表壓縮成四格表的分析(1)壓縮后得四格表偏好飲料A偏好飲料B合計男性6769136女性423476合計109103212(2)要檢驗假設(shè)性別與飲料偏好沒有關(guān)系性別與飲料偏好有關(guān)系。即要檢驗假設(shè) ,(雙側(cè)檢驗)(3)取檢驗統(tǒng)計量,拒絕域為,(4)對顯著性水平,臨界值,(5)由題中數(shù)據(jù)算得檢驗統(tǒng)計量的值為故在水平下不能拒絕,即性別與飲料偏好沒有關(guān)系.(二)將三維列聯(lián)表按照年齡變量分層,分別對兩個四格表分析分層后得 “性別飲料偏好”(年輕人)四格表偏好飲料A偏好飲料B合計男性372663女性112334合計484997“性別飲料偏好”(老年人)四格表偏好飲料A偏好飲料B合計男性304373女性311142合計6154115對于年輕人,檢驗性別與飲料偏好是否有關(guān)系:(1)性別與飲料偏好沒有關(guān)系性別與飲料偏好有關(guān)系。即要檢驗假設(shè) ,(雙側(cè)檢驗)(2)取檢驗統(tǒng)計量,拒絕域為,(3)對顯著性水平,臨界值,(4)由題中數(shù)據(jù)算得檢驗統(tǒng)計量的值為故在水平下拒絕,即對于年輕人,性別與飲料偏好是有關(guān)系的.對于老年人,檢驗性別與飲料偏好是否有關(guān)系:(1)性別與飲料偏好沒有關(guān)系性別與飲料偏好有關(guān)系。即要檢驗假設(shè) ,(雙側(cè)檢驗)(2)取檢驗統(tǒng)計量,拒絕域為,(3)對顯著性水平,臨界值,(4)由題中數(shù)據(jù)算得檢驗統(tǒng)計量的值為故在水平下拒絕,即對于老年人,性別與飲料偏好是有關(guān)系的.(三)上述壓縮和分層兩方面的分析結(jié)果是不一致的,應(yīng)該采信分層的結(jié)論。以下分層進(jìn)行相合性檢驗。對于年輕人,計算相合系數(shù),并檢驗性別與飲料偏好是否有相合關(guān)系。(1)要檢驗假設(shè):性別與飲料偏好不相合性別與飲料偏有相合關(guān)系。(2)采用檢驗統(tǒng)計量,拒絕域為。(3)取,拒絕域為(4)根據(jù)SPSS軟件的計算輸出可知,檢驗統(tǒng)計量的值為,故在水平下拒絕,即對于年輕人,性別與飲料偏好有相合關(guān)系。對于老年人,計算相合系數(shù),并檢驗性別與飲料偏好是否有相合關(guān)系。(1)要檢驗假設(shè):性別與飲料偏好不相合性別與飲料偏有相合關(guān)系。(2)采用檢驗統(tǒng)計量,拒絕域為。(3)取,拒絕域為(4)根據(jù)SPSS軟件的計算輸出可知,檢驗統(tǒng)計量的值為,故在水平下拒絕,即對于老年人,性別與飲料偏好有相合關(guān)系。注1:由于對于年輕人,性別與飲料偏好有正相合關(guān)系,即年輕女性比年輕男性更喜歡飲料B。而對于老年人,性別與飲料偏好有負(fù)相合關(guān)系,即老年女性比老年男性更喜歡飲料A。一正一負(fù),數(shù)據(jù)合并后沒有顯著相合性了。注2:記號與稱呼上,要能區(qū)分U檢驗統(tǒng)計量與檢驗統(tǒng)計量:注3:p值的概念要清楚,要能正確地表示與計算p值:首先要明確檢驗分布與拒絕域的形式;然后計算出檢驗統(tǒng)計量的觀察值;最后,以檢驗統(tǒng)計量的值為臨界值定出拒絕域,計算檢驗分布在此區(qū)域的概率。例如本題中,采用檢驗統(tǒng)計量,則檢驗分布為,拒絕域形式為;算出檢驗統(tǒng)計量的觀察值;考慮拒絕域形式為:;基于檢驗分布,計算p值:注4:記號上注意區(qū)分卡方分布與分卡方分布的分位數(shù)。(P161Ex7)分析:聯(lián)系教材例5.6,例5.7。比較“分開來看”與“合起來看”的結(jié)果是否一致。倘若不一致,則是有偏比較。解:將外銷與內(nèi)銷產(chǎn)品合起來看不合格品率:車間主任產(chǎn)品總數(shù)不合格品總數(shù)不合格品率王27032120.078431張17982580.143493李753870.115538王的車間的產(chǎn)品不合格品率最低,其次是李的車間,最高的是張的車間。再分內(nèi)銷產(chǎn)品與外銷產(chǎn)品分別看不合格品率。從內(nèi)銷產(chǎn)品看不合格品率:車間主任產(chǎn)品總數(shù)不合格品總數(shù)不合格品率王23681310.055321張29330.010239李307120.039088王的車間的產(chǎn)品不合格品率最高,其次是李的車間,最低的是張的車間。從外銷產(chǎn)品看不合格品率:車間主任產(chǎn)品總數(shù)不合格品總數(shù)不合格品率王123810.658537張12472550.204491李359750.208914王的車間的產(chǎn)品不合格品率最高,其次是李的車間,最低的是張的車間。綜上,“分開來看”與“合起來看”的結(jié)果不一致,因此是有偏比較。有偏的原因是各車間的內(nèi)銷與外銷的比重不一致,而且總體上內(nèi)銷產(chǎn)品的不合格品率低于外銷產(chǎn)品的不合格品率。無論內(nèi)銷產(chǎn)品還是外銷產(chǎn)品,王的車間產(chǎn)品不合格品率都是最高的,但由于產(chǎn)品大多是內(nèi)銷產(chǎn)品,所以總的不合格品率卻是最低的。因此產(chǎn)品類型(內(nèi)銷還是外銷)是產(chǎn)生偏差的原因,是混雜因素。(P183Ex1)分析:將年齡與體質(zhì)指數(shù)都作為定量變量,用SPSS建立Logistic線性回歸模型。解:要建立Logistic線性回歸模型(1)將原來的三維列聯(lián)表拉直,建立含四個變量的數(shù)據(jù)集,四個變量分別為年齡,體質(zhì)指數(shù),是否患心血管病,人數(shù)。(2)將數(shù)據(jù)集導(dǎo)入SPSS;(3)數(shù)據(jù)=加權(quán)個案=將人數(shù)設(shè)置為頻數(shù);(4)分析=回歸=二元Logistic,用二元Logistic過程建立Logistic線性回歸模型,將是否患心血管病設(shè)置為因變量,將年齡和體質(zhì)指數(shù)設(shè)置為協(xié)變量,其他采用默認(rèn)方式,點選確定,輸出模型擬合結(jié)果:方程中的變量BS.E,WalsdfSig.Exp (B)步驟 1a年齡.054.01026.4201.0001.055體質(zhì)指數(shù).238.0828.4701.0041.269常量-8.2932.23413.7771.000.000a. 在步驟 1 中輸入的變量: 年齡, 體質(zhì)指數(shù).即擬合的Logistic線性回歸方程為由系數(shù)都為正可知:年齡越大越容易患心血管病,體質(zhì)指數(shù)越大也越容易患心血管病。(P184Ex2)分析:將年齡(A)作為定量變量,婚姻狀況作為定性名義變量,包含3個啞變量(M1, M2, M3),以及3個與年齡的交互作用變量(AM1, AM2, AM3),用SPSS建立Logistic線性回歸模型。解:要建立Logistic線性回歸
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 50萬千瓦光伏復(fù)合項目實施方案(模板)
- 火災(zāi)應(yīng)急預(yù)案口號(3篇)
- 火災(zāi)應(yīng)急預(yù)案的培訓(xùn)效果(3篇)
- 醫(yī)院電子病歷系統(tǒng)2025年智能語音輸入與語音識別技術(shù)融合報告
- 2024年水利水電新課題試題及答案
- 工程經(jīng)濟(jì)人力資源管理試題及答案
- 2025年被動式超低能耗建筑技術(shù)原理與施工難點解析報告
- 施工企業(yè)的成本控制策略試題及答案
- 2025年公共關(guān)系學(xué)高頻試題及答案
- 行政管理自考文獻(xiàn)綜述試題及答案
- 燈光音響舞臺機(jī)械施工施工方案和技術(shù)措施方案
- 口腔醫(yī)院與美容院合作讓您的笑容更加燦爛
- 汽車駕駛技術(shù)(勞動版)課件:高原、沙漠及林區(qū)駕駛
- 中建工程質(zhì)量管理制度
- ??坡?lián)盟服務(wù)流程
- 六年級上冊語文第3課《古詩詞三首》同步練習(xí)(含答案)
- 倉庫呆滯庫存處理方法培訓(xùn)課件
- 初中生物教師實驗技能培訓(xùn)1
- 2022-2023小學(xué)五年級美術(shù)期末測試卷及答案
- 常用護(hù)理評估工具-產(chǎn)科VTE風(fēng)險評估
- 圖神經(jīng)網(wǎng)絡(luò)及其應(yīng)用
評論
0/150
提交評論