屬性數(shù)據(jù)分析第五章課后答案_第1頁
屬性數(shù)據(jù)分析第五章課后答案_第2頁
屬性數(shù)據(jù)分析第五章課后答案_第3頁
屬性數(shù)據(jù)分析第五章課后答案_第4頁
屬性數(shù)據(jù)分析第五章課后答案_第5頁
已閱讀5頁,還剩2頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、屬性數(shù)據(jù)分析第五章課后答案屬性數(shù)據(jù)分析第五章課后作業(yè)6.為了解男性和女性對兩種類型的飲料的偏好有沒有差異,分別在年青人和老年人中作調(diào)查。調(diào)查數(shù)據(jù)如下:偏好飲料A偏好飲料B年青人男性3726女性1123老年人男性:30:43女性3111試分析這批數(shù)據(jù),關(guān)于男性和女性對這兩種類型的飲料的偏好有沒有差異的問 題,你有什么看法?為什么?解:(1)數(shù)據(jù)壓縮分析首先將上表中不同年齡段的數(shù)據(jù)合并在一起壓縮成二維22列聯(lián)表1.1,合起來看,分析男性和女性對這兩種類型的飲料的偏好有沒有差異?表1.1 “性別偏好飲料”列聯(lián)表偏好飲料A偏好飲料B合計偏好A比例偏好B比例男性676913649.26%:50.74%女

2、性42347655.26%44.74%二維2 2列聯(lián)表獨立檢驗的似然比檢驗統(tǒng)計量2ln的值為0.7032,P值為P P( 2(1) 0.7032) 0.4017 0.05 ,不應(yīng)拒絕原假設(shè),即認(rèn)為“偏好類型”與“性別”無關(guān)。(2) 數(shù)據(jù)分層分析其次,按年齡段分層,得到如下三維 222列聯(lián)表1.2 ,分開來看,男性和女性對這兩種類型的飲料的偏好有沒有差異?表1.2 三維2 2 2列聯(lián)表偏好飲料A偏好飲料B合計偏好A比 例偏好B比 例年青人男性37266358. 73%41.27%女性112334 32. 35%67.65%老年人男性30437341. 10%58.90%P女性311142P 73

3、. 81%26.19%在上述數(shù)據(jù)中,分別對兩個年齡段(即年青人和老年人)進行飲料偏好的調(diào)查,在“年青人”年齡段,男性中偏好飲料A占58. 73%偏好飲料B占41.27%;女性中偏好飲料A占58. 73%偏好飲料B占41.27%,我們可以得出在這個年 齡段,男性和女性對這兩種類型的飲料的偏好有一定的差異。同理,在“老年 人”年齡段,也有一定的差異。(3) 條件獨立性檢驗 為驗證上述得出的結(jié)果是否可靠,我們可以做以下的條件獨立性檢驗。即由題意,可令C表示年齡段,C1表示年青人,C2表示老年人;D表示性別,D1表示男性,D2表示女性;E表示偏好飲料的類型,E1表示偏好飲料A, E2表 示偏好飲料B。

4、欲檢驗的原假設(shè)為:C給定后D和E條件獨立。2ln 的值按年齡段分層后得到的兩個四格表,以及它們的似然比檢驗統(tǒng)計量如下:E1E2合計D1372663D2112334合計484997CI層2ln2lnE1E2合計D1304373D2311142合 計6154115C2層11.8226.248條件獨立性檢驗問題的似然比檢驗統(tǒng)計量是這兩個似然比檢驗統(tǒng)計量的和,其值為2ln 6.248 11.82218.072分布的自由于r c t 2,所以條件獨立性檢驗的似然比檢驗統(tǒng)計量的漸近由度為r(c 1)(t 1)2 ,也就是上面這2個四格表的漸近2分布的自由度的和。由于P值P( 2(2)18.07)0.000

5、119165很小,所以認(rèn)為條件獨立性不成立,即在年齡段給定的條件下,男性和女性對兩種類型的飲料的偏好是有差異的。(4) 產(chǎn)生偏差的原因a、在(1)中,將不同年齡段的數(shù)據(jù)壓縮在一起合起來后分析發(fā)現(xiàn)男性和女性 在對兩種類型的飲料的偏好上是沒有差異的。但將數(shù)據(jù)以不同的年齡段分層后 并分別分析發(fā)現(xiàn)男性和女性在對兩種類型的飲料的偏好上是有一定差異的。合 起來看和分開來看的結(jié)果不同。b、由此看來,年齡段在此次調(diào)查中屬于混雜因素。由于不同年齡段的人對飲料 的選擇也會有差異,例如現(xiàn)在的年青人偏好喝一些像可口可樂,美年達等這樣 的碳酸飲料,而老年人則偏好喝一些紅茶,綠茶等這樣的非碳酸飲料,在調(diào)查 中,“老年人”

6、年齡段共有115人,所占比例大,從而使整個結(jié)果就傾向于老年 人的觀點,即使得混雜因素“年齡段”起到一定的干擾作用,從而導(dǎo)致整個調(diào) 查結(jié)果產(chǎn)生了偏差。8.某工廠有三個車間。車間主任分別為王、張和李。過去的一年里,該工廠產(chǎn)品的質(zhì)量情況總結(jié)如下:車間主任產(chǎn)品類別產(chǎn)品質(zhì)量情況產(chǎn)品總數(shù)合格產(chǎn)品數(shù)不合格產(chǎn)品數(shù)王內(nèi)銷23681312499外銷12381204張內(nèi)銷2933296外銷12472551502李內(nèi)銷30712319外銷35975434王主任將內(nèi)銷和外銷產(chǎn)品合并在一起, 然后計算各個車間的不合格率。計算結(jié) 果如下:主任產(chǎn)品質(zhì)量情況不合格率合格產(chǎn)品數(shù)不合格產(chǎn)品數(shù)王24912127.84%張154025

7、814.35%李6668711.55%王主任說,我負(fù)責(zé)的車間生產(chǎn)情況最好,其次是李主任負(fù)責(zé)的車間,最差的是張主任負(fù)責(zé)的車間。這樣的比較是不是有偏比較?為什么?解:不是,有偏比較是指將數(shù)據(jù)壓縮后合起來看與分層后分開來看得出的結(jié)果 不一致時所產(chǎn)生的偏差,而此題只是將數(shù)據(jù)壓縮起來后相互間比較, 因此這樣 的比較不是有偏比較。具體分析如下:由題知,分析車間主任與產(chǎn)品的質(zhì)量情況之間的關(guān)系, 則本題是以產(chǎn)品類別為 層,以車間主任為行,產(chǎn)品的質(zhì)量情況為列進行相關(guān)分析。(1) 數(shù)據(jù)壓縮分析首先將上表中不同產(chǎn)品類別的數(shù)據(jù)合并在一起壓縮成二維32列聯(lián)表2.1,合起來看,分析車間主任與產(chǎn)品的質(zhì)量情況兩者之間的關(guān)系?

8、表2.1 “車間主任產(chǎn)品質(zhì)量”列聯(lián)表主任產(chǎn)品質(zhì)量情況不合格率合格產(chǎn)品數(shù)不合格產(chǎn)品數(shù)王24912127.84%張1540258:14.35%李6668711.55%可計算出該表獨立性檢驗的似然比檢驗統(tǒng)計量2ln的值為48.612,P值為P P( 2(2)48.612)0。應(yīng)該拒絕原假設(shè),即認(rèn)為車間主任與產(chǎn)品的質(zhì)量情況兩者是有一定相關(guān)性的。(2) 數(shù)據(jù)分層分析其次,按產(chǎn)品類別分層,得到如下三維 2 3 2列聯(lián)表2.2 ,分開來看,分析車間主任與產(chǎn)品的質(zhì)量情況兩者之間的關(guān)系?表1.2 三維2 2 2列聯(lián)表產(chǎn)品類別車間主任產(chǎn)品的質(zhì)量情況不合格率合格產(chǎn)品數(shù)不合格產(chǎn)品數(shù)內(nèi)銷王23681315. 24%張2

9、9331. 01%李307123. 76%外銷王1238139. 71%張124725516. 98%李3597517. 28%在上述數(shù)據(jù)中,分別對兩個產(chǎn)品類別(即內(nèi)銷和外銷)進行分析,在“內(nèi)銷”類別中,王姓主任車間的產(chǎn)品不合格率最高,即車間生產(chǎn)情況最差,張姓 主任車間的不合格率最低,即車間生產(chǎn)情況最好;在“外銷”類別中,王姓主 任車間的產(chǎn)品不合格率最高,即車間生產(chǎn)情況最差,張姓和李姓主任車間生產(chǎn) 情況差不多。(3)條件獨立性檢驗為驗證上述得出的結(jié)果是否可靠,我們可以做以下的條件獨立性檢驗。即由題意,可令A(yù)表示產(chǎn)品類別,A1表示內(nèi)銷,A2表示外銷;B表示車間主任,Bi表示王姓主任,B2表示張姓

10、主任,B3表示李姓主任;C表示產(chǎn)品的質(zhì)量情況,Ci表示合格產(chǎn)品數(shù),C2表示不合格產(chǎn)品數(shù)。欲檢驗的原假設(shè)為:A給定后B和C條件獨立。按產(chǎn)品類別分層后得到的兩張表格,以及它們的似然比檢驗統(tǒng)計量2ln的值如下:Ai層A?層CIC2合計B123681312499B22933296B330712319合29614311計864CIC2合計B112381204B212425150275Ba35975434合17241214計9102ln 15.2892ln 51.684條件獨立性檢驗問題的似然比檢驗統(tǒng)計量是這兩個似然比檢驗統(tǒng)計量的和,其值為2ln15.289 51.684 66.973由于C t 2,r 3 ,所以條件獨立性檢驗的似然比檢驗統(tǒng)計量的漸近2分布的自由度為r(c 1)(t 1)3 ,也就是上面這2個表格的漸近2分布的自由度的和。由于P值P( 2(3)66.973)0很小,所以認(rèn)為條件獨立性不成立,即在產(chǎn)品類別給定的條件下,車間主任與產(chǎn)品的質(zhì)量情況兩者是有一定相關(guān)性 的。(4) 結(jié)論在(1)中,將不同產(chǎn)品類別的數(shù)據(jù)壓縮在一起合起來后分析發(fā)現(xiàn)車間主任與產(chǎn)品的質(zhì)量情況兩者是有一定相關(guān)性的;在(2)中,將數(shù)據(jù)以不同的產(chǎn)品類 別分層后分析發(fā)現(xiàn)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論