版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、SPSS數(shù)據(jù)分析教程SPSS數(shù)據(jù)分析教程1第4章 概率論初步2目錄4.1離散型隨機(jī)變量的仿真 4.1.1均勻分布的隨機(jī)數(shù)4.1.2正態(tài)分布的隨機(jī)數(shù)4.2理論分布4.2.1二項(xiàng)分布的分布函數(shù)和概率4.2.2連續(xù)分布的隨機(jī)變量正態(tài)分布4.3經(jīng)驗(yàn)分布4.4抽樣分布4.5置信區(qū)間3本章學(xué)習(xí)目標(biāo)用仿真方法從總體中抽取隨機(jī)樣本:生成服從某種分布的隨機(jī)數(shù);得到觀測(cè)值的理論分布、經(jīng)驗(yàn)分布;理解抽樣分布的形狀;掌握如何求置信區(qū)間;學(xué)習(xí)如何從數(shù)據(jù)集中選擇符合條件的個(gè)案。44.1 離散型隨機(jī)變量的仿真 54.1.1 均勻分布的隨機(jī)數(shù) 假設(shè)我們有一個(gè)正方形,它被均勻的分為4個(gè)相同大小的小正方形?,F(xiàn)在從正方形的中心上方
2、隨機(jī)地投擲一顆玉米粒1000次,假設(shè)每次投擲的玉米粒都等可能的落在4個(gè)小正方形中的一個(gè)之中。問題是:落在1號(hào)、2號(hào)、3號(hào)和4號(hào)正方形中的情況如何呢? 1 2 4 36模擬投擲的過程 (1)第1步:設(shè)置隨機(jī)數(shù)種子 選擇【轉(zhuǎn)換】【隨機(jī)數(shù)字生成器】,勾選“設(shè)置起點(diǎn)”,并在“固定值”下的“值”中輸入一個(gè)用戶給定的數(shù)值。 第2步:生成均勻分布的隨機(jī)數(shù),等可能的產(chǎn)生1,2,3和4這四個(gè)數(shù)共計(jì)1000個(gè). 選擇【轉(zhuǎn)換】【計(jì)算變量】,在“目標(biāo)變量”框中輸入變量名“Spinn”,在“數(shù)字表達(dá)式”框中輸入TRUNC(RV.UNIFORM(1,5),然后單擊【確定】按鈕.7模擬投擲的過程 (2)第3步:然后分析這四
3、個(gè)數(shù)出現(xiàn)的次數(shù)和相對(duì)頻率。 選擇【分析】【描述統(tǒng)計(jì)】【頻率】 8隨機(jī)數(shù)分析(1)9隨機(jī)數(shù)分析(2)104.1.2 正態(tài)分布的隨機(jī)數(shù) 正態(tài)分布的隨機(jī)變量是連續(xù)型隨機(jī)變量,它的可能取值是所有實(shí)數(shù)。數(shù)據(jù)分析的許多模型和理論都要求數(shù)據(jù)服從正態(tài)分布,因此正態(tài)分布的隨機(jī)數(shù)在模擬中有廣泛的應(yīng)用。 11一、生成正態(tài)分布的隨機(jī)數(shù)第1步:設(shè)置隨機(jī)數(shù)種子為123456 第2步:選擇【轉(zhuǎn)換】【計(jì)算變量】, 應(yīng)用函數(shù)RV.Normal(0,1)。SET SEED=123456. COMPUTE Rnorm01= RV.NORM(0,1). SAVE OUTFILE=D:SPSSIntrodataSim_norm.sav
4、 /COMPRESSED. EXECUTE12生成隨機(jī)數(shù)示意圖13二、分析這些正態(tài)隨機(jī)數(shù)的性質(zhì)繪制隨機(jī)數(shù)的序列圖,有幾種方法方法1:選擇【圖形】【圖表構(gòu)建程序】,選擇“條” 方法2:選擇【分析】【預(yù)測(cè)】【序列圖】方法3:選擇【圖形】【舊對(duì)話框】【線圖】1415該樣本數(shù)據(jù)的確是從正態(tài)分布的總體中隨機(jī)抽取的呢? 繪制隨機(jī)數(shù)的帶有正態(tài)曲線的直方圖 164.2 理 論 分 布除4.1中的均勻分布和正態(tài)分布外,常見的分布還有二項(xiàng)分布、負(fù)二項(xiàng)分布、泊松分布、指數(shù)分布、t分布等。SPSS軟件中提供了這些常見分布的分布函數(shù)、概率分布函數(shù)和概率密度函數(shù)。SPSS的PDF與非中心PDF函數(shù)族提供了相關(guān)分布的概率分
5、布函數(shù)或者概率密度函數(shù),CDF與非中心CDF函數(shù)族提供了相關(guān)分布的累積概率分布函數(shù)(或簡稱分布函數(shù))。而逆DF函數(shù)族則給出了相應(yīng)分布的分位數(shù)。 174.2.1 二項(xiàng)分布的分布函數(shù)和概率 如果隨機(jī)試驗(yàn)只有兩個(gè)可能的結(jié)果,設(shè)該試驗(yàn)中成功的概率為p。如果將該試驗(yàn)獨(dú)立地重復(fù)進(jìn)行次n次,這一串重復(fù)的獨(dú)立試驗(yàn)稱為重n貝努力試驗(yàn)。如果用X表示在這次試驗(yàn)中成功的次數(shù),則隨機(jī)變量X服從二項(xiàng)分布,其分布函數(shù)為 18CDF.BINOM(x,10,0.25),該函數(shù)用于計(jì)算出x所對(duì)應(yīng)的累計(jì)概率,即: (1)這里x表示不大于的最大整數(shù)。PDF.BINOM(x,10,0.25)計(jì)算而X取某個(gè)特定值i的概率為: (2)19
6、由上面(1)式計(jì)算出的為分布函數(shù)的值;如果是離散隨機(jī)變量,(2)式給出的為概率值,它是隨機(jī)變量X取各個(gè)離散值0,1,2,10的概率 。函數(shù)CDF.BINOM(x,10,0.25)用于計(jì)算n=10,p=0.25的二項(xiàng)分布下x的分布函數(shù)值或者稱為累計(jì)概率。20二項(xiàng)分布的概率分布圖214.2.2 連續(xù)分布的隨機(jī)變量正態(tài)分布 連續(xù)型隨機(jī)變量的任何兩個(gè)可能取值之間都有無限多個(gè)可能的取值,因此所有可能取值是不能列舉的,也不能給隨機(jī)變量的某可能取值賦給一個(gè)唯一的概率值。一般考慮連續(xù)型隨機(jī)變量的分布函數(shù)(即累積概率函數(shù)(Probability Cumulative Function,CDF)和密度函數(shù)(Pro
7、babilitty Density Function,PDF)。22SPSS的CDF函數(shù)族給出的就是分布函數(shù)的值。 CDF.NORMAL(x,0,1)是給出均值為0,標(biāo)準(zhǔn)差為1的正態(tài)分布變量x的累計(jì)概率分布函數(shù)值。PDF.NORMAL(x,0,1)是給出均值為0,標(biāo)準(zhǔn)差為1的正態(tài)分布變量x的密度函數(shù)值。23可以畫出累計(jì)概率分布函數(shù)的線圖24可以畫出正態(tài)分布變量x的密度函數(shù)的線圖25比較不同參數(shù)的正態(tài)分布函數(shù)264.3 經(jīng) 驗(yàn) 分 布把觀測(cè)到的樣本數(shù)據(jù)的相對(duì)頻率分布稱為經(jīng)驗(yàn)分布,根據(jù)概率的頻率定義,當(dāng)樣本量足夠大時(shí),頻率穩(wěn)定到概率。實(shí)際問題中樣本數(shù)據(jù)所服從的分布常常是未知的,我們只能通過樣本數(shù)據(jù)
8、的經(jīng)驗(yàn)分布來了解數(shù)據(jù)的分布情況。SPSS描述性統(tǒng)計(jì)菜單的的頻率過程中把頻率稱為百分比,而把結(jié)果出現(xiàn)的次數(shù)稱為頻率。 27頻率數(shù)據(jù)GSS2004.sav,它記錄了美國2004年社會(huì)調(diào)查的數(shù)據(jù),有調(diào)查對(duì)象的年齡、性別、受教育年限、最高學(xué)歷、子女個(gè)數(shù)等。這里我們考察調(diào)查對(duì)象子女個(gè)數(shù)的分布情況。 28頻率表選擇【分析】【頻率】,把變量“CHILDS”選到右側(cè)的“變量(V)”框中。29相對(duì)頻率直方圖304.4 抽 樣 分 布由于樣本選擇的隨機(jī)性,樣本統(tǒng)計(jì)量也是隨機(jī)變量,不同的樣本,樣本統(tǒng)計(jì)量的取值也可能不同。 每個(gè)隨機(jī)變量都有其分布性質(zhì),例如描述性統(tǒng)計(jì)量均值、方差、分位數(shù)等。樣本統(tǒng)計(jì)量的分布稱為抽樣分布。31模擬從同一個(gè)分布已知的總體中隨機(jī)抽取若干不同的樣本,然后觀察樣本統(tǒng)計(jì)量的分布情況。從一個(gè)均值為50、標(biāo)準(zhǔn)差為10的正態(tài)總體中隨機(jī)抽取80個(gè)容量為50的樣本。32Sample80.sps INPUT PROGRAM. VECTOR X(80). LOOP #I = 1 TO 50. LOOP #J=1 TO 80. COMPUTE X(#J)=RV.NORMAL(50, 10). END LOOP. END CASE. END LOOP. END FILE. END
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度宿舍安全管理宿管員聘用協(xié)議范本3篇
- 二零二五年度ISO 22000食品安全管理體系認(rèn)證咨詢協(xié)議3篇
- 二零二五年度商業(yè)地產(chǎn)項(xiàng)目配套場地租賃服務(wù)協(xié)議2篇
- 二零二五年度外資企業(yè)外籍員工聘用協(xié)議范本3篇
- 2025年度文化旅游項(xiàng)目募集資金三方監(jiān)管合同4篇
- 2025年度豬圈建造與生物安全防護(hù)合同4篇
- 2025年度生物制藥研發(fā)合作協(xié)議
- 二零二五年度城市綠化用地承包合同范本4篇
- 2025年智能車輛識(shí)別一體機(jī)銷售與服務(wù)合同范本4篇
- 2025年度農(nóng)業(yè)專利權(quán)轉(zhuǎn)讓及種植技術(shù)支持合同樣本3篇
- 班級(jí)建設(shè)方案中等職業(yè)學(xué)校班主任能力大賽
- 纖維增強(qiáng)復(fù)合材料 單向增強(qiáng)材料Ⅰ型-Ⅱ 型混合層間斷裂韌性的測(cè)定 編制說明
- 習(xí)近平法治思想概論教學(xué)課件緒論
- 寵物會(huì)展策劃設(shè)計(jì)方案
- 孤殘兒童護(hù)理員(四級(jí))試題
- 梁湘潤《子平基礎(chǔ)概要》簡體版
- 醫(yī)院急診醫(yī)學(xué)小講課課件:急診呼吸衰竭的處理
- 腸梗阻導(dǎo)管在臨床中的使用及護(hù)理課件
- 調(diào)料廠工作管理制度
- 小學(xué)英語單詞匯總大全打印
- 衛(wèi)生健康系統(tǒng)安全生產(chǎn)隱患全面排查
評(píng)論
0/150
提交評(píng)論