統(tǒng)計(jì)二輪復(fù)習(xí)教案.doc_第1頁(yè)
統(tǒng)計(jì)二輪復(fù)習(xí)教案.doc_第2頁(yè)
統(tǒng)計(jì)二輪復(fù)習(xí)教案.doc_第3頁(yè)
統(tǒng)計(jì)二輪復(fù)習(xí)教案.doc_第4頁(yè)
統(tǒng)計(jì)二輪復(fù)習(xí)教案.doc_第5頁(yè)
已閱讀5頁(yè),還剩9頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、統(tǒng)計(jì)學(xué)案一隨機(jī)抽樣(一)總體、個(gè)體、樣本把所考察對(duì)象的某一數(shù)值指標(biāo)的全體構(gòu)成的集合看成總體,構(gòu)成總體的每一個(gè)元素為個(gè)體從總體中隨機(jī)抽取若干個(gè)個(gè)體構(gòu)成的集合叫做總體的一個(gè)樣本(二)抽樣方法1簡(jiǎn)單隨機(jī)抽樣(1)定義:設(shè)一個(gè)總體含有N個(gè)個(gè)體,從中不放回地抽取n個(gè)個(gè)體作為樣本(nN),如果每次抽取時(shí),總體內(nèi)的各個(gè)個(gè)體被抽到的機(jī)會(huì)都相等,稱這種抽樣方法為簡(jiǎn)單隨機(jī)抽樣(2)簡(jiǎn)單隨機(jī)抽樣的特點(diǎn)如下:它要求被抽取樣本的總體中個(gè)體數(shù)有限它是從總體中逐個(gè)地進(jìn)行抽取它是一種不放回抽樣它每一次抽取時(shí),總體中的各個(gè)個(gè)體有相同的可能性被抽到(3)常用的簡(jiǎn)單隨機(jī)抽樣方法抽簽法先將總體中的所有N個(gè)個(gè)體編號(hào),并把號(hào)碼寫(xiě)在形狀、

2、大小相同的號(hào)簽上,然后將這些號(hào)簽放在同一個(gè)容器里,攪拌均勻抽簽時(shí),每次從中抽出1個(gè)號(hào)簽,連續(xù)抽取n次,就得到一個(gè)容量為n的樣本抽簽法的優(yōu)點(diǎn)是簡(jiǎn)單易行缺點(diǎn)是當(dāng)總體的容量非常大時(shí),費(fèi)時(shí)、費(fèi)力又不方便況且,如果號(hào)簽攪拌得不均勻,可能導(dǎo)致抽樣的不公平隨機(jī)數(shù)表法a隨機(jī)數(shù)表:隨機(jī)數(shù)表是由0,1,2,9這10個(gè)數(shù)字組成的數(shù)表,并且表中的每一位置出現(xiàn)各個(gè)數(shù)字的可能性相同b用隨機(jī)數(shù)表抽樣的步驟:第一步:將總體中的個(gè)體編號(hào)為了保證抽取樣本有很好的代表性,編號(hào)時(shí)位數(shù)要相同第二步:選定開(kāi)始的數(shù)字為了保證所選定數(shù)字的隨機(jī)性,應(yīng)在面對(duì)隨機(jī)數(shù)表之前就指出開(kāi)始數(shù)字的縱橫位置第三步:獲取樣本號(hào)碼隨機(jī)確定一個(gè)讀數(shù)方向,讀數(shù)的方向

3、可以向右,也可以向左、向上、向下等,重復(fù)的號(hào)碼跳過(guò)2系統(tǒng)抽樣(1)定義:當(dāng)總體元素個(gè)數(shù)很大時(shí),可將總體分成均衡的若干部分,然后按照預(yù)先制定的規(guī)則,從每一部分抽取一個(gè)個(gè)體得到所需要的樣本,這種抽樣方法叫做系統(tǒng)抽樣,也稱作等距抽樣(2)系統(tǒng)抽樣的步驟:編號(hào)采用隨機(jī)的方式將總體中的個(gè)體編號(hào)分段先確定分段的間隔k.當(dāng)(N為總體中的個(gè)體數(shù),n為樣本容量)是整數(shù)時(shí),k;當(dāng)不是整數(shù)時(shí),通過(guò)從總體中隨機(jī)剔除一些個(gè)體使剩下的總體中個(gè)體總數(shù)N能被n整除,這時(shí)k.確定起始個(gè)體編號(hào)在第1段用簡(jiǎn)單隨機(jī)抽樣確定起始的個(gè)體編號(hào)S.按照事先確定的規(guī)則抽取樣本通常是將S加上間隔k,得到第2個(gè)個(gè)體編號(hào)Sk,再將(Sk)加上k,得

4、到第3個(gè)個(gè)體編號(hào)S2k,這樣繼續(xù)下去,獲得容量為n的樣本其樣本編號(hào)依次是:S,Sk,S2k,S(n1)k.3分層抽樣(1)定義:當(dāng)總體由有明顯差別的幾部分組成時(shí),按某種特征在抽樣時(shí)將總體中的各個(gè)個(gè)體分成互不交叉的層,然后按照各層在總體中所占的比例,從各層獨(dú)立地抽取一定數(shù)量的個(gè)體合在一起作為樣本,這種抽樣的方法叫做分層抽樣分層抽樣使用的前提是總體可以分層,層與層之間有明顯區(qū)別,而層內(nèi)個(gè)體間差異較小,每層中所抽取的個(gè)體數(shù)可按各層個(gè)體數(shù)在總體中所占比例抽取分層抽樣要求對(duì)總體的內(nèi)容有一定的了解,明確分層的界限和數(shù)目,分層要恰當(dāng)各層抽取時(shí)采用簡(jiǎn)單隨機(jī)抽樣或系統(tǒng)抽樣(2)分層抽樣的步驟分層;按比例確定每層

5、抽取個(gè)體的個(gè)數(shù);各層抽樣(方法可以不同);匯合成樣本(3)分層抽樣的優(yōu)點(diǎn)分層抽樣充分利用了己知信息,充分考慮了保持樣本結(jié)構(gòu)與總體結(jié)構(gòu)的一致性使樣本具有較好的代表性,而且在各層抽樣時(shí),可以根據(jù)具體情況采取不同的抽樣方法,因此分層抽樣在實(shí)踐中有著非常廣泛的應(yīng)用6三種抽樣方法的比較類別共同點(diǎn)各自特點(diǎn)相互聯(lián)系適用范圍簡(jiǎn)單隨機(jī)抽樣抽樣過(guò)程中每個(gè)個(gè)體被抽取的機(jī)會(huì)均等從總體中逐個(gè)抽取總體中的個(gè)體數(shù)較少系統(tǒng)抽樣將總體均勻分成幾部分,按事先確定的規(guī)則在各部分抽取在起始部分抽樣時(shí)采用簡(jiǎn)單隨機(jī)抽樣總體中的個(gè)體數(shù)較多分層抽樣將總體分成幾層,分層進(jìn)行抽取各層抽樣時(shí)采用簡(jiǎn)單隨機(jī)抽樣或系統(tǒng)抽樣總體由差異明顯的幾部分組成練1

6、.(2010安徽文,14)某地有居民100 000戶,其中普通家庭99 000戶,高收入家庭1 000戶從普遍家庭中以簡(jiǎn)單隨機(jī)抽樣方式抽取990戶,從高收入家庭中以簡(jiǎn)單隨機(jī)抽樣方式抽取100戶進(jìn)行調(diào)查,發(fā)現(xiàn)共有120戶家庭擁有3套或3套以上住房,其中普通家庭50戶,高收入家庭70戶依據(jù)這些數(shù)據(jù)并結(jié)合所掌握的統(tǒng)計(jì)知識(shí),你認(rèn)為該地?fù)碛?套或3套以上住房的家庭所占比例的合理估計(jì)是_練2.將一個(gè)總體為100的個(gè)體編號(hào)為0,1,2,3,99,并依次將其分為10個(gè)小組,組號(hào)為0,1,,9,要用系統(tǒng)抽樣的方法抽取一個(gè)容量為10的樣本,規(guī)定如果在第0組(號(hào)碼為09)隨機(jī)抽取的號(hào)碼為2,則所抽取的10個(gè)號(hào)碼為

7、.練3.2010年高考湖北卷將參加夏令營(yíng)的600名學(xué)生編號(hào)為:001,002,600.采用系統(tǒng)抽樣方法抽取一個(gè)容量為50的樣本,且隨機(jī)抽得的號(hào)碼為003.這600名學(xué)生分住在三個(gè)營(yíng)區(qū),從001到300在第營(yíng)區(qū),從301到495在第營(yíng)區(qū),從496到600在第營(yíng)區(qū),三個(gè)營(yíng)區(qū)被抽中的人數(shù)依次為 ( )A.26,16,8 B.25,17,8 C.25,16,9 D.24,17,9 練4.一個(gè)社會(huì)調(diào)查機(jī)構(gòu)就某地居民的月收入調(diào)查了10000人,并根據(jù)所得數(shù)據(jù)畫(huà)了樣本的頻率分布直方圖(如下圖),為了分析居民的收入與年齡、學(xué)歷、職業(yè)等方面的關(guān)系,要從這10000人中再用分層抽樣方法抽出100人作進(jìn)一步調(diào)查,則

8、在(2500,3000)(元)月收入段應(yīng)抽出的人數(shù)為()A25 B30 C35 D40二用樣本估計(jì)總體1編制頻率分布直方圖的步驟如下:求極差:極差是一組數(shù)據(jù)的最大值與最小值的差決定組距和組數(shù):當(dāng)樣本容量不超過(guò)100時(shí),常分成512組組距.將數(shù)據(jù)分組:通常對(duì)組內(nèi)數(shù)值所在區(qū)間取左閉右開(kāi)區(qū)間,最后一組取閉區(qū)間,也可以將樣本數(shù)據(jù)多取一位小數(shù)分組;列頻率分布表:登記頻數(shù),計(jì)算頻率,列出頻率分布表將樣本數(shù)據(jù)分成若干小組,每個(gè)小組內(nèi)的樣本個(gè)數(shù)稱作頻數(shù),頻數(shù)與樣本容量的比值叫做這一小組的頻率頻率反映數(shù)據(jù)在每組所占比例的大小繪制頻率分布直方圖:把橫軸分成若干段,每一段對(duì)應(yīng)一個(gè)組距,然后以線段為底作一矩形,它的高

9、等于該組的,這樣得出一系列的矩形,每個(gè)矩形的面積恰好是該組上的頻率這些矩形就構(gòu)成了頻率分布直方圖在頻率分布直方圖中,縱軸表示“頻率/組距”,數(shù)據(jù)落在各小組內(nèi)的頻率用小矩形的面積表示,各小矩形的面積總和等于1.2頻率分布折線圖(1)把頻率分布直方圖各個(gè)長(zhǎng)方形上邊的中點(diǎn)用線段連接起來(lái),就得到頻率分布折線圖(2)總體密度曲線如果樣本容量不斷增大,分組的組距不斷縮小,則頻率分布直方圖實(shí)際上越來(lái)越接近于總體的分布,它可以用一條光滑曲線yf(x)來(lái)描繪,這條光滑的曲線就叫總體密度曲線3莖葉圖:統(tǒng)計(jì)中還有一種被用來(lái)表示數(shù)據(jù)的圖叫做莖葉圖莖是指中間的一列數(shù),葉是從莖的旁邊生長(zhǎng)出來(lái)的數(shù)在樣本數(shù)據(jù)較少、較為集中,

10、且位數(shù)不多時(shí),用莖葉圖表示數(shù)據(jù)的效果較好,它較好的保留了原始數(shù)據(jù)信息,方便記錄與表示,但當(dāng)樣本數(shù)據(jù)較多時(shí),莖葉圖就不太方便4平均數(shù)、中位數(shù)和眾數(shù)(1)平均數(shù):一組數(shù)據(jù)的總和除以數(shù)據(jù)的個(gè)數(shù)所得的商就是平均數(shù)(2)中位數(shù):如果將一組數(shù)據(jù)按從小到大的順序依次排列,當(dāng)數(shù)據(jù)有奇數(shù)個(gè)時(shí),處在最中間的一個(gè)數(shù)是這組數(shù)據(jù)的中位數(shù);當(dāng)數(shù)據(jù)有偶數(shù)個(gè)時(shí),處在最中間兩個(gè)數(shù)的平均數(shù),是這組數(shù)據(jù)的中位數(shù)(3)眾數(shù):出現(xiàn)次數(shù)最多的數(shù)(若有兩個(gè)或幾個(gè)數(shù)據(jù)出現(xiàn)得最多,且出現(xiàn)的次數(shù)一樣,這些數(shù)據(jù)都是這組數(shù)據(jù)的眾數(shù);若一組數(shù)據(jù)中,每個(gè)數(shù)據(jù)出現(xiàn)的次數(shù)一樣多,則認(rèn)為這組數(shù)據(jù)沒(méi)有眾數(shù))(4)在頻率分布直方圖中,最高小長(zhǎng)方形的中點(diǎn)所對(duì)應(yīng)的數(shù)

11、據(jù)值即為這組數(shù)據(jù)的眾數(shù)而在頻率分布直方圖上的中位數(shù)左右兩側(cè)的直方圖面積應(yīng)該相等,因而可以估計(jì)其近似值平均數(shù)的估計(jì)值等于頻率分布直方圖中每個(gè)小矩形的面積乘以小矩形底邊中點(diǎn)的橫坐標(biāo)之和5方差、標(biāo)準(zhǔn)差設(shè)樣本數(shù)據(jù)為x1,x2,xn樣本平均數(shù)為,則s2(x1)2(x2)2(xn)2(x12x22xn2)n2叫做這組數(shù)據(jù)的方差,用來(lái)衡量這組數(shù)據(jù)的波動(dòng)大小,一組數(shù)據(jù)方差越大,說(shuō)明這組數(shù)據(jù)波動(dòng)越大 把樣本方差的算術(shù)平方根叫做這組數(shù)據(jù)的樣本標(biāo)準(zhǔn)差 數(shù)據(jù)的離散程度可以通過(guò)極差、方差或標(biāo)準(zhǔn)差來(lái)描述,其中極差反映了一組數(shù)據(jù)變化的最大幅度方差則反映一組數(shù)據(jù)圍繞平均數(shù)波動(dòng)的大小練5(2011青島)一組數(shù)據(jù)20,30,40

12、,50,50,60,70,80的平均數(shù)、中位數(shù)、眾數(shù)的大小關(guān)系是A平均數(shù)中位數(shù)眾數(shù) B平均數(shù)中位數(shù)眾數(shù)C中位數(shù)眾數(shù)r0.05,表明有95%的把握認(rèn)為x與y之間具有線性相關(guān)關(guān)系;如果|r|r0.05,則沒(méi)有理由拒絕原來(lái)的假設(shè)(二)獨(dú)立性檢驗(yàn)1.若變量的不同“值”表示個(gè)體所屬的不同類別,則這些變量稱為分類變量2.兩個(gè)分類變量X與Y的頻數(shù)表,稱作22列聯(lián)表.y1y2合計(jì)x1n11n12n1x2n21n22n2合計(jì)n1n2n在22列聯(lián)表中,隨機(jī)變量2,其中n為樣本容量,2的取值范圍可以判斷“X與Y有關(guān)系”的可信度,如表,用它的大小可以決定是否拒絕原來(lái)的統(tǒng)計(jì)假設(shè)H0 如果算出的2值較大,就拒絕H0,也就

13、是拒絕“事件A與B無(wú)關(guān)”,從而就認(rèn)為它們是有關(guān)的.3.兩個(gè)臨界值:3.841與6.635經(jīng)過(guò)對(duì)2統(tǒng)計(jì)量分布的研究,已經(jīng)得到了兩個(gè)臨界值:3.841與6.635 .當(dāng)根據(jù)具體的數(shù)據(jù)算出的23.841 時(shí),有95%的把握說(shuō)事件A與B有關(guān);當(dāng)26.635 時(shí),有99%的把握說(shuō)事件A與B有關(guān);當(dāng)23.841 時(shí),認(rèn)為事件A與B是無(wú)關(guān)的.(其中頻數(shù)n11、n12、n21、n22都不小于5)P(2k)0.500.400.250.150.100.050.0250.0100.0050.001k0.4550.7081.3232.0722.7063.8415.0246.6357.87910.828練10.(201

14、1山東理,7)某產(chǎn)品的廣告費(fèi)用x與銷售額y的統(tǒng)計(jì)數(shù)據(jù)如下表 廣告費(fèi)用x(萬(wàn)元)4235銷售額y(萬(wàn)元)49263954根據(jù)上表可得回歸方程x中的為9.4,據(jù)此模型預(yù)報(bào)廣告費(fèi)用為6萬(wàn)元時(shí)銷售額大約為()A63.6萬(wàn)元 B65.5萬(wàn)元 C67.7萬(wàn)元 D72.0萬(wàn)元練11. (2011湖南理,4)通過(guò)隨機(jī)詢問(wèn)110名性別不同的大學(xué)生是否愛(ài)好某項(xiàng)運(yùn)動(dòng),得到如下的列聯(lián)表:男女總計(jì)愛(ài)好402060不愛(ài)好203050總計(jì)6050110由K2算得, K27.8.附表:P(K2k)0.0500.0100.001k3.8416.63510.828參照附表,得到的正確結(jié)論是()A在犯錯(cuò)誤的概率不超過(guò)0.1%的前提

15、下,認(rèn)為“愛(ài)好該項(xiàng)運(yùn)動(dòng)與性別有關(guān)”B在犯錯(cuò)誤的概率不超過(guò)0.1%的前提下,認(rèn)為“愛(ài)好該項(xiàng)運(yùn)動(dòng)與性別無(wú)關(guān)”C有99%以上的把握認(rèn)為“愛(ài)好該項(xiàng)運(yùn)動(dòng)與性別有關(guān)”D有99%以上的把握認(rèn)為“愛(ài)好該項(xiàng)運(yùn)動(dòng)與性別無(wú)關(guān)”練12.(2011廣東理,13)某數(shù)學(xué)老師身高176cm,他爺爺、父親和兒子的身高分別是173cm、170cm和182cm.因兒子的身高與父親的身高有關(guān),該老師用線性回歸分析的方法預(yù)測(cè)他孫子的身高為_(kāi)cm.練13.(2011鄭州二次質(zhì)檢)某中學(xué)對(duì)高二甲、乙兩個(gè)同類班級(jí)進(jìn)行“加強(qiáng)語(yǔ)文閱讀理解訓(xùn)練對(duì)提高數(shù)學(xué)應(yīng)用題得分率作用”的試驗(yàn),其中甲班為試驗(yàn)班(加強(qiáng)語(yǔ)文閱讀理解訓(xùn)練),乙班為對(duì)比班(常規(guī)教學(xué),

16、無(wú)額外訓(xùn)練),在試驗(yàn)前的測(cè)試中,甲、乙兩班學(xué)生在數(shù)學(xué)應(yīng)用題上的得分率基本一致,試驗(yàn)結(jié)束后,統(tǒng)計(jì)幾次數(shù)學(xué)應(yīng)用題測(cè)試的平均成績(jī)(均取整數(shù))如下表所示:60分以下6170分7180分8190分91100分甲班(人數(shù))36111812乙班(人數(shù))48131510現(xiàn)規(guī)定平均成績(jī)?cè)?0分以上(不含80分)的為優(yōu)秀(1)試分析估計(jì)兩個(gè)班級(jí)的優(yōu)秀率;(2)由以上統(tǒng)計(jì)數(shù)據(jù)填寫(xiě)下面22列聯(lián)表,并問(wèn)是否有75%的把握認(rèn)為“加強(qiáng)語(yǔ)文閱讀理解訓(xùn)練對(duì)提高數(shù)學(xué)應(yīng)用題得分率”有幫助.優(yōu)秀人數(shù)非優(yōu)秀人數(shù)合計(jì)甲班乙班合計(jì)參考公式及數(shù)據(jù):K2,P(K2k0)0.500.400.250.150.10k00.4550.7081.323

17、2.0722.706P(K2k0)0.050.0250.0100.0050.001k03.8415.0246.6357.87910.828練14.為了比較注射A,B兩種藥物后產(chǎn)生的皮膚皰疹的面積,選200只家兔做實(shí)驗(yàn),將這200只家兔隨機(jī)地分成兩組,每組100只,其中一組注射藥物A,另一組注射藥物B.下表1和表2分別是注射藥物A和藥物B后的試驗(yàn)結(jié)果(皰疹面積單位:mm2)表1:注射藥物A后皮膚皰疹面積的頻數(shù)分布表皰疹面積60,65)65,70)70,75)75,80)頻數(shù)30402010表2:注射藥物B后皮膚皰疹面積的頻數(shù)分布表皰疹面積60,65)65,70)70,75)75,80)80,85

18、)頻數(shù)1025203015(1) 完成下面頻率分布直方圖,并比較注射兩種藥物后皰疹面積的中位數(shù)大小; (2)完成下面22列聯(lián)表,并回答能否有99.9%的把握認(rèn)為“注射藥物A后的皰疹面積與注射藥物B后的皰疹面積有差異”.皰疹面積小于70mm2皰疹面積不小于70mm2合計(jì)注射藥物Aab注射藥物Bcd合計(jì)n附:2P(2k)0.1000.0500.0250.0100.001k2.7063.8415.0246.63510.828練15.(2011九江模擬)某農(nóng)科所對(duì)冬季晝夜溫差大小與某反季節(jié)大豆新品種發(fā)芽多少之間的關(guān)系進(jìn)行分析研究,他們分別記錄了12月1日至12月5日的每天晝夜溫差與實(shí)驗(yàn)室每天每100顆種子中的發(fā)芽數(shù),得到如下資料:日期12月1日12月2日12月3日12月4日12月5日溫差x()101113128發(fā)芽數(shù)y(顆)2325302616該農(nóng)科所確定的研究方案是:先從這五組數(shù)據(jù)中選取2組,用剩下的3組數(shù)據(jù)求線性回歸方程,再對(duì)被選取的2組數(shù)據(jù)進(jìn)行檢驗(yàn)(1)求選取的2組數(shù)據(jù)恰好是不相鄰2天數(shù)據(jù)的概率;(2)若選取的是12月1日與12月5日的兩組數(shù)據(jù)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論