第五章抽樣與統(tǒng)計推論_第1頁
第五章抽樣與統(tǒng)計推論_第2頁
第五章抽樣與統(tǒng)計推論_第3頁
第五章抽樣與統(tǒng)計推論_第4頁
第五章抽樣與統(tǒng)計推論_第5頁
已閱讀5頁,還剩69頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

第五章抽樣與統(tǒng)計推論1第一頁,共七十四頁,編輯于2023年,星期五第五章:抽樣與統(tǒng)計推論第六章:參數(shù)值的估計第七章:假設(shè)檢定:均值與百分率第八章:假設(shè)檢定:兩個變量的相關(guān)2第二頁,共七十四頁,編輯于2023年,星期五回顧:內(nèi)容掌握

1、敘述統(tǒng)計部分,主要掌握集中趨勢測量、離散趨勢測量的單變量分析,兩個變量分布及λ、tau_y、Gamma、dy、r、E2等相關(guān)測量法;2、推論統(tǒng)計部分,主要掌握抽樣與統(tǒng)計推論,參數(shù)估計以及Z檢定、χ2檢定、F檢定、t檢定等假設(shè)檢定;3、以上理論課程內(nèi)容,主要要求明確統(tǒng)計方法的適用條件,原理與步驟以及統(tǒng)計值的意義。3第三頁,共七十四頁,編輯于2023年,星期五第一節(jié)抽樣的意義為了研究總體,我們需要從總體中抽出一部分樣本,借此了解總體中的情況。研究的歷程:總體——樣本——總體4第四頁,共七十四頁,編輯于2023年,星期五社會研究的過程一、籌劃二、執(zhí)行三、總結(jié)一、選定研究題目二、初步探索三、成立假設(shè)四、理論解釋與澄清概念五、研究策略1.研究設(shè)計2.測量變量3.測量層次4.界定母體和決定抽樣的步驟5.統(tǒng)計分析訪問法;觀察法;檔案資料;一、統(tǒng)計分析二、解釋研究結(jié)果三、開啟新的研究議題實驗法社會調(diào)查法5第五頁,共七十四頁,編輯于2023年,星期五統(tǒng)計敘述:描述變量或者變量之間的關(guān)系。無論數(shù)據(jù)怎么來的,是樣本還是總體的數(shù)據(jù),無論隨機樣本還是非隨機樣本,統(tǒng)計敘述的方法都可以使用。關(guān)注樣本的情況。統(tǒng)計推論:根據(jù)樣本的情況,來推測總體的情況。關(guān)注總體的情況。6第六頁,共七十四頁,編輯于2023年,星期五兩套話語:樣本與總體。從樣本中計算出來的數(shù)值稱作統(tǒng)計值,在總體中計算出來的數(shù)值稱為參數(shù)值。我們的目標(biāo)是:總體的狀況。我們的手段是:從樣本推論總體,或者從樣本中歸納總體。7第七頁,共七十四頁,編輯于2023年,星期五問題:在對一個變量或者兩個變量的分布狀況,或者相關(guān)關(guān)系的分析中得出的統(tǒng)計值。代表的這種分布或者關(guān)系是不是在總體中也是這樣?8第八頁,共七十四頁,編輯于2023年,星期五第二節(jié)抽樣的歷程抽取有代表性的樣本,盡量減少誤差。9第九頁,共七十四頁,編輯于2023年,星期五總體抽樣框樣本大小決定樣本大小的一般原則:根據(jù)研究能付出的最大代價抽取樣本。抽樣比例設(shè)計抽樣方法,抽取樣本評估樣本:總體分布與樣本分布在基本特征上是否分布一致。10第十頁,共七十四頁,編輯于2023年,星期五第三節(jié)隨機與非隨機抽樣法11第十一頁,共七十四頁,編輯于2023年,星期五一、簡單隨機抽樣二、系統(tǒng)隨機抽樣三、分層隨機抽樣四、集體抽樣法五、多段抽樣六、多期抽樣12第十二頁,共七十四頁,編輯于2023年,星期五第四節(jié)幾率與抽樣分布13第十三頁,共七十四頁,編輯于2023年,星期五社會學(xué)研究抽樣調(diào)查的目的是通過樣本推算總體的情況。歸納法的結(jié)論不可能百分百正確。概率論(幾率論)即是研究我們通過樣本推測總體的時候所犯的錯誤是多少。14第十四頁,共七十四頁,編輯于2023年,星期五通過概率論,可以知道在一定條件下,總體中的各種抽樣結(jié)果所具有的概率特征。統(tǒng)計推論是研究在發(fā)生了某種抽樣結(jié)果的情況下,判斷它來自何種總體更合適。統(tǒng)計推論是概率論研究的逆問題。15第十五頁,共七十四頁,編輯于2023年,星期五一、隨機現(xiàn)象客觀現(xiàn)象可分為確定現(xiàn)象和非確定現(xiàn)象。隨機現(xiàn)象-非確定現(xiàn)象在一定條件下,事物的出現(xiàn)只有可能性但不具有必然性??赡芏植槐厝?,意味著在一定條件下出現(xiàn)的結(jié)果不止一種,其中任何一種情況的出現(xiàn)都具有一定的隨機性。16第十六頁,共七十四頁,編輯于2023年,星期五確定性現(xiàn)象——必然命題,表示為:若……,則……非確定性現(xiàn)象——隨機命題,表示為:若……,可能……社會學(xué)研究多為隨機命題。17第十七頁,共七十四頁,編輯于2023年,星期五二、概率與頻率隨機現(xiàn)象的結(jié)果以及結(jié)果的集合成為隨機事件:可能發(fā)生也可能不發(fā)生的非確定性事件。概率是這些隨機事件發(fā)生可能性大小的數(shù)量表示。隨機事件發(fā)生的概率為:0≦P≦118第十八頁,共七十四頁,編輯于2023年,星期五概率反映隨機事件內(nèi)涵的統(tǒng)計規(guī)律性。統(tǒng)計規(guī)律性:在一定條件下,就其個別一次的結(jié)果來說都具有偶然性,但大量重復(fù)的試驗或者觀察,則結(jié)果就呈現(xiàn)必然的規(guī)律。統(tǒng)計規(guī)律性是事物本身所固有的客觀屬性。19第十九頁,共七十四頁,編輯于2023年,星期五隨機事件的兩重性:一次試驗或者觀察中事件出現(xiàn)與否具有偶然性大量重復(fù)試驗或者觀察時,隨機事件出現(xiàn)的可能性是穩(wěn)定的?!y(tǒng)計規(guī)律性。20第二十頁,共七十四頁,編輯于2023年,星期五頻率:在相同條件下,進行N次試驗,隨機事件出現(xiàn)了n次。隨機事件的頻率是可知:0≦f≦1當(dāng)試驗(觀察)次數(shù)N無限增大的時候,f值趨向于P。21第二十一頁,共七十四頁,編輯于2023年,星期五頻率是實驗值,它隨著試驗或者觀察而變化,具有隨機性,只能近似反映事件出現(xiàn)可能性的大小。概率是理論值,它由事件的本質(zhì)決定,值是唯一的,能精確地反映出事件出現(xiàn)可能性的大小。22第二十二頁,共七十四頁,編輯于2023年,星期五概率,將隨機事件與一個精確反映事件出現(xiàn)可能大小的數(shù)量緊密聯(lián)系在一起。23第二十三頁,共七十四頁,編輯于2023年,星期五三、概率分布頻率分布是實驗值,可以變化,頻率分布又稱作隨機變量的統(tǒng)計分布或者經(jīng)驗分布。概率分布是理論值,是唯一的,概率分布則是隨機變量的理論分布。24第二十四頁,共七十四頁,編輯于2023年,星期五隨機事件隨機變量隨機事件概率隨機變量的分布僅當(dāng)觀測次數(shù)很大時,隨機變量取值的頻率接近于其概率,此時隨機變量的統(tǒng)計分布與理論分布大致相符。25第二十五頁,共七十四頁,編輯于2023年,星期五隨機事件盡管具有隨機性,但是對于一個確定的隨機樣本來說,我們得到的是確定的觀測值,這些值是確定的,根據(jù)這些值計算出來的數(shù)值叫做統(tǒng)計值。而抽樣分布是在概率論的基礎(chǔ)上成立的理論分布,是在假定如果在同一總體中反復(fù)不斷抽取不同樣本時,各個可能出現(xiàn)的樣本統(tǒng)計值的分布狀況。26第二十六頁,共七十四頁,編輯于2023年,星期五概率,將隨機事件與一個精確反映事件出現(xiàn)可能大小的數(shù)量緊密聯(lián)系在一起。假設(shè)試驗或者觀測進行了無限多次。概率分布,假設(shè)進行無數(shù)次抽樣,得到那個最為完美的樣本的分布狀況。將變量取值分布和一個固定的形狀聯(lián)系起來。27第二十七頁,共七十四頁,編輯于2023年,星期五兩個定理:大數(shù)定理和中心極限定理隨機事件的兩重性:隨機性和統(tǒng)計規(guī)律性。大量的隨機現(xiàn)象所構(gòu)成的總體,呈現(xiàn)的規(guī)律有穩(wěn)定性。當(dāng)進行大量觀察時,n趨向于無限時,得出來的定律,叫做極限定律。28第二十八頁,共七十四頁,編輯于2023年,星期五極限定律有兩類:大數(shù)定律:有關(guān)闡明大量隨機現(xiàn)象平均結(jié)果的穩(wěn)定性的一系列定理,研究在什么條件下隨機事件可以轉(zhuǎn)化為不可能事件或者必然事件。中心極限定理:研究在什么條件下隨機變量之和的分布可以近似正態(tài)分布。偶然性與必然性的辯證關(guān)系大數(shù)定理將局部、偶然的影響消除掉,使共同的原因顯現(xiàn)出來。29第二十九頁,共七十四頁,編輯于2023年,星期五最重要的兩個抽樣分布:二項抽樣分布均值抽樣分布30第三十頁,共七十四頁,編輯于2023年,星期五一、二項分布31第三十一頁,共七十四頁,編輯于2023年,星期五一、二點分布變量的取值只有兩類。兩個類別習(xí)慣上用0和1來表示,又叫做0-1分布。在社會調(diào)查中有大量的二分變量。二點分布是二項分布只做一次觀察的概率分布。32第三十二頁,共七十四頁,編輯于2023年,星期五二點分布——是與否“是”的概率為P(取值為1的時候、成功),“否”的概率為Q。(取值為0的時候、失?。┨卣鳎篜(0)>0;Q>0P+Q=1對于性別、拋硬幣等來說,P=Q=0.5其他狀況P不一定等于Q。33第三十三頁,共七十四頁,編輯于2023年,星期五二分變量是社會研究中最常見最普遍的形式,也是多取值變量,其中包括高層次測量變量的簡化研究方式。34第三十四頁,共七十四頁,編輯于2023年,星期五二、二項分布當(dāng)試驗進行n次的時候,成功的次數(shù)呈現(xiàn)一種概率分布。35第三十五頁,共七十四頁,編輯于2023年,星期五拋五次硬幣的概率分布圖36第三十六頁,共七十四頁,編輯于2023年,星期五當(dāng)試驗次數(shù)或者觀測個案n無限大的時候,頻率的分布接近于理論的概率分布37第三十七頁,共七十四頁,編輯于2023年,星期五二項分布的特征:離散型分布,當(dāng)試驗次數(shù)為n時,二項分布共有n+1個取值。這種分布圖可以用分布律來表示,可也以用折線圖來表示。38第三十八頁,共七十四頁,編輯于2023年,星期五二項分布圖39第三十九頁,共七十四頁,編輯于2023年,星期五二項分布有兩個參數(shù):n和P,(Q=1-P)40第四十頁,共七十四頁,編輯于2023年,星期五二項分布圖當(dāng)P=0.5時,是對稱分布。當(dāng)P≠0.5時,是非對稱的。n越大,非對稱性越不明顯。41第四十一頁,共七十四頁,編輯于2023年,星期五二項分布各項概率是可以根據(jù)以上公式計算出來的,也可以相加。42第四十二頁,共七十四頁,編輯于2023年,星期五二項分布概率值的實際意義:二項分布所計算的概率值都是理論值,具有先驗的性質(zhì)。在實踐中大量的重復(fù)二項分布中的獨立試驗,則頻率的分布將趨向于二項分布。43第四十三頁,共七十四頁,編輯于2023年,星期五二項分布在社會學(xué)研究中的統(tǒng)計推論意義。書上的例子(133頁):44第四十四頁,共七十四頁,編輯于2023年,星期五二項分布的經(jīng)典例子就是拋硬幣式的P=Q=0.5的情況,然而只要P+Q=1,P和Q可以是任何數(shù)值。各項分布概率均可以計算出來。P≠Q(mào)時,是不對稱分布。45第四十五頁,共七十四頁,編輯于2023年,星期五例子:人群中同性戀出現(xiàn)的概率是5%,異性戀出現(xiàn)的概率是95%。如果隨機抽取十個人,那么這十個人中出現(xiàn)同性戀取向個人的概率分布為:46第四十六頁,共七十四頁,編輯于2023年,星期五例子:根據(jù)生命表,年齡為60歲的人,可望活到下一年的概率為0.95。某單位有十個60歲的人,問其中有九人活到下年的概率是多少?至少有九人活到下年的概率是多少?根據(jù)公式計算:p(r=9)=0.315P(9≤r≤10)=p(r=9)+p(r=10)=0.91447第四十七頁,共七十四頁,編輯于2023年,星期五二、均值抽樣分布中心極限定理中心極限定理:研究在什么條件下隨機變量之和的分布可以近似正態(tài)分布。中心極限定理:如果從任何一個具有均值M和方差S2的總體中重復(fù)抽取容量為n的隨機樣本,那么當(dāng)n變得很大的時候,樣本均值的抽樣分布接近正態(tài),并具有均值M和方差S2/n。48第四十八頁,共七十四頁,編輯于2023年,星期五理解中央極限定理的含義中央極限定理之所以重要,因為它將具有五花八門分布特征的變量和一個整齊、美麗、易于計算的正態(tài)分布聯(lián)系起來。使我們簡便地認(rèn)識社會現(xiàn)象。無論變量自身的分布如何,其均值抽樣分布都接近于正態(tài)分布。49第四十九頁,共七十四頁,編輯于2023年,星期五總體分布不是正態(tài),為什么抽樣分布是正態(tài)的?50第五十頁,共七十四頁,編輯于2023年,星期五例子:擲骰子51第五十一頁,共七十四頁,編輯于2023年,星期五擲一枚骰子每個面1、2、3、4、5、6出現(xiàn)的概率都是1/6,此時的概率分布為矩形(離散)。52第五十二頁,共七十四頁,編輯于2023年,星期五擲兩枚骰子53第五十三頁,共七十四頁,編輯于2023年,星期五54第五十四頁,共七十四頁,編輯于2023年,星期五擲3枚骰子55第五十五頁,共七十四頁,編輯于2023年,星期五56第五十六頁,共七十四頁,編輯于2023年,星期五例子(134頁)57第五十七頁,共七十四頁,編輯于2023年,星期五58第五十八頁,共七十四頁,編輯于2023年,星期五均值抽樣分布的特點一、如果樣本相當(dāng)大,則均值的抽樣分布接近于正態(tài)分布。在社會學(xué)研究中,樣本量至少是30(n≥30),才能算是滿足大樣本的要求。(一般在n≥100的時候,總是可以認(rèn)為滿足了大樣本的要求,無論總體分布如何。在n≥50的時候,總體分布接近正態(tài)分布時使用比較合適。)59第五十九頁,共七十四頁,編輯于2023年,星期五均值抽樣分布接近正態(tài)分布,則正態(tài)分布的所有特征都具備。單峰、對稱,眾值、中位值和均值相同。60第六十頁,共七十四頁,編輯于2023年,星期五二、抽樣分布的均值就是總體的均值。將各個樣本的均值相加起來,取均值,就會等于總體的均值。抽樣分布的標(biāo)準(zhǔn)差:標(biāo)準(zhǔn)誤差。61第六十一頁,共七十四頁,編輯于2023年,星期五由于不知道總體的情況,所以,以一個樣本的標(biāo)準(zhǔn)差當(dāng)做總體的標(biāo)準(zhǔn)差,這樣標(biāo)準(zhǔn)誤差的計算公式為

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論