




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、統(tǒng) 計抽樣方法1.抽樣方法:(1)簡單隨機抽樣(抽簽法、隨機數表法)常常用于總體個數較少時,它的特征是從總體中逐個抽?。唬?)系統(tǒng)抽樣也叫等距離抽樣,常用于總體個數較多時,它的主要特征是均衡成若干部分,每部分只取一個;(3)分層抽樣,主要特征是分層按比例抽樣,主要用于總體中有明顯差異,它們的共同點:每個個體被抽到的概率都相等,體現(xiàn)了抽樣的客觀性和平等性。如(1)某社區(qū)有500個家庭,其中高收入家庭125戶,中等收入家庭280戶,低收入家庭95。為了調查社會購買力的某項指標,要從中抽取一個容量為100戶的樣本,把這種抽樣記為A;某中學高中一年級有12名女排運動員,要從中選取3人調查學習負擔的情況
2、,把這種抽樣記為B,那么完成上述兩項調查應分別采用的抽樣方法:A為_,B為_。(答:分層抽樣,簡單隨機抽樣);(3)某中學有高一學生400人,高二學生300人,高三學生300人,現(xiàn)通過分層抽樣抽取一個容量為n的樣本,已知每個學生被抽到的概率為0.2,則n= _(答:200);(4)容量為100的樣本拆分成10組,前7組的頻率之和為0.79,而剩下的三組的頻數組成等比數列,且其公比不為1,則剩下的三組中頻數最大的一組的頻率是_(答:0.16);(5)用簡單隨機抽樣的方法從含有10個個體的總體中,抽取一個容量為2的樣本,則某一個體“第一次被抽到的概率”,“第一次未被抽到,第二次被抽到的概率”,“在
3、整個抽樣過程中被抽到的概率”分別是_(答:);2.總體分布的估計:用樣本估計總體,是研究統(tǒng)計問題的一個基本思想方法,即用樣本平均數估計總體平均數(即總體期望值描述一個總體的平均水平);用樣本方差估計總體方差(方差和標準差是描述一個樣本和總體的波動大小的特征數,方差或標準差越小,表示這個樣本或總體的波動越小,即越穩(wěn)定)。一般地,樣本容量越大,這種估計就越精確??傮w估計要掌握:(1)“表”(頻率分布表);(2)“圖”(頻率分布直方圖)。頻率分布直方圖的特征:(1)從頻率分布直方圖可以清楚的看出數據分布的總體趨勢。(2)從頻率分布直方圖得不出原始的數據內容,把數據表示成直方圖后,原有的具體數據信息就
4、被抹掉了。頻率直方圖的作法: (1)算數據極差 (2)決定組距和組數; (3)決定分點; (4)列頻率分布表; (5)畫頻率直方圖。 提醒:直方圖的縱軸(小矩形的高)一般是頻率除以組距的商(而不是頻率),橫軸一般是數據的大小,小矩形的面積表示頻率。組數的決定方法是:設數據總數目為n,時,分為組;時,分為組.如(1)一個容量為20的樣本數據,分組后組距與頻數如下: (10,20,2;(20,30,3;(30,40,4;(40,50,5;(50,60,4;(60,70,2;則樣本在區(qū)間上的頻率為A5% B25% C50% D70%(答:D);(2)已知樣本:10 8 6 10 13 8 10 12
5、 11 7 8 9 11 9 12 9 10 11 12 12 ,那么頻率為0.3的范圍是A5.57.5 B7.59.5 C9.511.5 D11.513.5(答:B);(3)觀察新生兒的體重,其頻率分布直方圖如圖所示,則新生兒的體重在2700,3000的頻率為_(答:0.3);O240027003600330030003900體重(g)0.001(4)如圖,是一次數學考試成績的樣本頻率分布直方圖(樣本容量n=200),若成績不低于60分為及格,則樣本中的及格人數是_(答:120); 分數頻率/組距0204060801000.0180.0120.0090.0060.005(5) 有同一型號的汽
6、車100輛,為了解這種汽車每蠔油1L所行路程的情況,現(xiàn)從中隨即抽出10輛在同一條件下進行蠔油1L所行路程實驗,得到如下樣本數據(單位:km):13.7,12.7,14.4,13.8,13.3,12.5,13.5,13.6,13.1,13.4,其分組如下:分組頻數頻率12.45,12.95)12.95,13.45)13.45,13.95)13.95,14.45)合計101.0(1)完成上面頻率分布表;(2)根據上表,在給定坐標系中畫出頻率分布直線圖,并根據樣本估計總體數據落在12.95,13.95)中的概率;(3)根據樣本,對總體的期望值進行估計解:(1)頻率分布表:分組頻數頻率12.45,12
7、.95)20.212.95,13.45)30.313.45,13.95)40.4:13.95,14.45)10.1合計101.0(2)頻率分布直方圖:估計總體數據落在12.95,13.95)中的概率為0.7(3)13.4因此,總體的期望值進行估計約為13.4.(6)為了了解高一學生的體能情況,某校抽取部分學生進行一分鐘跳繩次數次測試,將所得數據整理后,畫出頻率分布直方圖(如圖),圖中從左到右各小長方形面積之比為2:4:17:15:9:3,第二小組頻數為12.90100110120130140150次數o0.0040.0080.0120.0160.0200.0240.028頻率/組距0.0320
8、.036(1) 第二小組的頻率是多少?樣本容量是多少?(2) 若次數在110以上(含110次)為達標,試估計該學校全體高一學生的達標率是多少?(3) 在這次測試中,學生跳繩次數的中位數落在哪個小組內?請說明理由。分析:在頻率分布直方圖中,各小長方形的面積等于相應各組的頻率,小長方形的高與頻數成正比,各組頻數之和等于樣本容量,頻率之和等于1。解:(1)由于頻率分布直方圖以面積的形式反映了數據落在各小組內的頻率大小,因此第二小組的頻率為:又因為頻率=,所以 (2)由圖可估計該學校高一學生的達標率約為(3)由已知可得各小組的頻數依次為6,12,51,45,27,9,所以前三組的頻數之和為69,前四組
9、的頻數之和為114,所以跳繩次數的中位數落在第四小組內。3、樣本平均數: 。如有一組數據:x1,x2,xn(x1x2xn),它們的算術平均值為20,若去掉其中的xn,余下數據的算術平均值為18,則xn關于n的表達式為 (答:)。4、樣本方差:;樣本標準差:。如(1)甲、乙兩名射擊運動員參加某大型運動會的預選賽,他們分別射擊了5次,成績如下表(單位:環(huán))甲108999乙1010799如果甲、乙兩人中只有1人入選,則入選的應是 (答:甲);(2)已知實數的期望值為,方差為,若,則一定有 A B C D與無法比較大小(答:B);(3)某班40人隨機平均分成兩組,兩組學生一次考試的成績情況如下表: 則
10、全班的平均分為_,方差為_(答:85,51)提醒:若的平均數為,方差為,則的平均數為,方差為。如已知數據的平均數,方差,則數據的平均數和標準差分別為 A15,36 B22,6 C15,6 D22,36 (答:B)5.莖葉圖(1) 莖葉圖的畫法:將每個數據分為莖(高位)與葉(低位)兩部分,將最大莖和最小莖之間的數按大小順序排成一列,將各數據的葉依先后次序寫在其莖的左(右)兩側. 統(tǒng)計量組別平均分方差第1組8016第2組9036 (2)莖葉圖的特征:()用莖葉圖表示數據有兩個優(yōu)點:一是從統(tǒng)計圖上沒有原始數據信息的損失,所有數據信息都可以從莖葉圖中得到;二是莖葉圖中的數據可以隨時記錄,隨時添加,方便
11、記錄與表示。()莖葉圖只便于表示兩位有效數字的數據,而且莖葉圖只方便記錄兩組的數據,兩個以上的數據雖然能夠記錄,但是沒有表示兩個記錄那么直觀,清晰。6. 獨立性檢驗獨立性檢驗是檢定兩個事件間是否獨立的統(tǒng)計方法,是卡方檢驗的一個應用. 卡方檢驗是對樣本的頻數分布所來自的總體分布是否服從某種理論分布或某種假設分布所作的假設檢驗.即根據樣本的頻數分布來推斷總體的分布,卡方獨立性檢驗的零假設是各事件之間相互獨立.卡方值永遠大于零. 2的兩個臨界值分別是3.841,與6.635.3.841時,接受假設即兩事件無關.相關系數是測定變量之間相關密切程度和相關方向的代表性指標。相關系數用符號“r ”表示,其特
12、點表現(xiàn)在:參與相關分析的兩個變量是對等的,不分自變量和因變量,改變兩變量的地位并不影響相關系數的數值,因此相關系數只有一個;相關系數有正負號反映相關系數的方向,正號反映正相關,負號反映負相關; 回歸和相關都是研究兩個變量相互關系的分析方法。相關分析研究兩個變量之間相關的方向和相關的密切程度。但是相關分析不能指出兩變量相互關系的具體形式,也無法從一個變量的變化來推測另一個變量的變化關系?;貧w方程則是通過一定的數學方程來反映變量之間相互關系的具體形式,以便從一個已知量來推測另一個未知量。為估算預測提供一個重要的方法。相關性檢驗的步驟是:(1)做統(tǒng)計假設:x與Y不具備線性相關關系.(2)根據小概率0
13、.05與查出r的一個臨界值.(3)根據樣本相關系數公式計算出r的值.(4)作統(tǒng)計推斷:如果表明95%的把握認為x與Y之間具備線性相關關系,如果接受假設.提醒:A與B有關并不意味著A的發(fā)生必然導致B的發(fā)生.7.回歸分析回歸分析是對具有相關關系的兩個或兩個以上變量之間數量變化的一般關系進行測定,確定一個相應的數學表達式,以便從一個已知量來推測另一個未知量,為估計預測提供一個重要的方法。在回歸分析中,由X推算Y與由Y推算X的回歸方程是不同的,不可混淆: .與相關分析相比,回歸分析的特點是:兩個變量是不對等的,只能用自變量來估計因變量,而不允許由因變量來推測自變量,必須區(qū)分自變量,一般說,事物的原因作
14、自變量X.回歸分析和相關分析是互相補充、密切聯(lián)系的。相關分析需要回歸分析來表明現(xiàn)象數量相關的具體形式,而回歸分析則應該建立在相關分析的基礎上。依靠相關分析表明現(xiàn)象的數量變化具有密切相關,進行回歸分析求其相關的具體形式才有意義。如(1)在研究色盲與性別的關系調查中,調查了男性480人,其中有38人患色盲,調查的520個女性中6人患色盲,(1)根據以上的數據建立一個2×2的列聯(lián)表;(2)若認為“性別與患色盲有關系”,則出錯的概率會是多少解:(1)患色盲不患色盲總計男38442480女6514520總計449561000 (2)假設H :“性別與患色盲沒有關系” 先算出K 的觀測值: 則有 即是H 成立的概率不超過0.001, 若認為“性別與患色盲有關系”,則出錯的概率為0.001(2)一
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 【正版授權】 ISO/IEC GUIDE 21-2:2005 FR Regional or national adoption of International Standards and other International Deliverables - Part 2: Adoption of International Deliverables ot
- 企業(yè)戰(zhàn)略管理模擬試卷
- 各行業(yè)綜合知識總結
- 描述家鄉(xiāng)的景物美景寫景作文5篇范文
- 生物學生態(tài)學知識點總結
- 銀行理論考試試題及答案
- 六一亞運活動方案
- 醫(yī)藥初級考試試題及答案
- 六一商業(yè)活動策劃方案
- 六一學校防疫活動方案
- 汽修企業(yè)安全生產雙重預防機制培訓資料
- 建筑施工企業(yè)特殊過程確認記錄
- 2024年A證(安全員)作業(yè)模擬考試題庫全套
- 簡單咨詢費合同范本英文版
- 2023年山東青島市初中學業(yè)水平考試地理試卷真題(答案詳解)
- 干部思想狀況調查問卷
- 小學德育工作會議記錄文本
- 220kV及以上變壓器組件現(xiàn)場安裝
- 預制混凝土板防滲渠道施工工藝及質量控制
- 公路水運工程土工試驗講義二
- 大學《管理經濟學》期末復習核心知識點及考試真題解析
評論
0/150
提交評論