版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、文檔可能無(wú)法思考全面,請(qǐng)瀏覽后下載! 必修3知識(shí)點(diǎn)總結(jié)統(tǒng)計(jì)2.1.1 簡(jiǎn)單隨機(jī)抽樣1簡(jiǎn)單隨機(jī)抽樣,也叫純隨機(jī)抽樣。就是從總體中不加任何分組、劃類、排隊(duì)等,完全隨機(jī)地抽取調(diào)查單位。特點(diǎn)是:每個(gè)樣本單位被抽中的可能性相同(概率相等),樣本的每個(gè)單位完全獨(dú)立,彼此間無(wú)一定的關(guān)聯(lián)性和排斥性。簡(jiǎn)單隨機(jī)抽樣是其它各種抽樣形式的基礎(chǔ)。通常只是在總體單位之間差異程度較小和數(shù)目較少時(shí),才采用這種方法。2簡(jiǎn)單隨機(jī)抽樣常用的方法: (1)抽簽法;隨機(jī)數(shù)表法;計(jì)算機(jī)模擬法;使用統(tǒng)計(jì)軟件直接抽取。在簡(jiǎn)單隨機(jī)抽樣的樣本容量設(shè)計(jì)中,主要考慮:總體變異情況;允許誤差范圍;概率保證程度。3抽簽法: (1)給調(diào)查對(duì)象群體中的每一
2、個(gè)對(duì)象編號(hào); (2)準(zhǔn)備抽簽的工具,實(shí)施抽簽 (3)對(duì)樣本中的每一個(gè)個(gè)體進(jìn)行測(cè)量或調(diào)查 例:請(qǐng)調(diào)查你所在的學(xué)校的學(xué)生做喜歡的體育活動(dòng)情況。4隨機(jī)數(shù)表法: 例:利用隨機(jī)數(shù)表在所在的班級(jí)中抽取10位同學(xué)參加某項(xiàng)活動(dòng)。2.1.2系統(tǒng)抽樣1系統(tǒng)抽樣(等距抽樣或機(jī)械抽樣):把總體的單位進(jìn)行排序,再計(jì)算出抽樣距離,然后按照這一固定的抽樣距離抽取樣本。第一個(gè)樣本采用簡(jiǎn)單隨機(jī)抽樣的辦法抽取。K(抽樣距離)=N(總體規(guī)模)/n(樣本規(guī)模)前提條件:總體中個(gè)體的排列對(duì)于研究的變量來(lái)說(shuō),應(yīng)是隨機(jī)的,即不存在某種與研究變量相關(guān)的規(guī)則分布。可以在調(diào)查允許的條件下,從不同的樣本開始抽樣,對(duì)比幾次樣本的特點(diǎn)。如果有明顯差別
3、,說(shuō)明樣本在總體中的分布承某種循環(huán)性規(guī)律,且這種循環(huán)和抽樣距離重合。2系統(tǒng)抽樣,即等距抽樣是實(shí)際中最為常用的抽樣方法之一。因?yàn)樗鼘?duì)抽樣框的要求較低,實(shí)施也比較簡(jiǎn)單。更為重要的是,如果有某種與調(diào)查指標(biāo)相關(guān)的輔助變量可供使用,總體單元按輔助變量的大小順序排隊(duì)的話,使用系統(tǒng)抽樣可以大大提高估計(jì)精度。2.1.3分層抽樣1分層抽樣(類型抽樣):先將總體中的所有單位按照某種特征或標(biāo)志(性別、年齡等)劃分成若干類型或?qū)哟危缓笤僭诟鱾€(gè)類型或?qū)哟沃胁捎煤?jiǎn)單隨機(jī)抽樣或系用抽樣的辦法抽取一個(gè)子樣本,最后,將這些子樣本合起來(lái)構(gòu)成總體的樣本。10 / 10兩種方法:1先以分層變量將總體劃分為若干層,再按照各層在總體中
4、的比例從各層中抽取。2先以分層變量將總體劃分為若干層,再將各層中的元素按分層的順序整齊排列,最后用系統(tǒng)抽樣的方法抽取樣本。2分層抽樣是把異質(zhì)性較強(qiáng)的總體分成一個(gè)個(gè)同質(zhì)性較強(qiáng)的子總體,再抽取不同的子總體中的樣本分別代表該子總體,所有的樣本進(jìn)而代表總體。分層標(biāo)準(zhǔn):(1)以調(diào)查所要分析和研究的主要變量或相關(guān)的變量作為分層的標(biāo)準(zhǔn)。(2)以保證各層內(nèi)部同質(zhì)性強(qiáng)、各層之間異質(zhì)性強(qiáng)、突出總體內(nèi)在結(jié)構(gòu)的變量作為分層變量。(3)以那些有明顯分層區(qū)分的變量作為分層變量。3分層的比例問題: (1)按比例分層抽樣:根據(jù)各種類型或?qū)哟沃械膯挝粩?shù)目占總體單位數(shù)目的比重來(lái)抽取子樣本的方法。 (2)不按比例分層抽樣:有的層次
5、在總體中的比重太小,其樣本量就會(huì)非常少,此時(shí)采用該方法,主要是便于對(duì)不同層次的子總體進(jìn)行專門研究或進(jìn)行相互比較。如果要用樣本資料推斷總體時(shí),則需要先對(duì)各層的數(shù)據(jù)資料進(jìn)行加權(quán)處理,調(diào)整樣本中各層的比例,使數(shù)據(jù)恢復(fù)到總體中各層實(shí)際的比例結(jié)構(gòu)。例1 某大學(xué)為了支援我國(guó)西部教育事業(yè),決定從2007應(yīng)屆畢業(yè)生報(bào)名的18名志愿者中,選取6人組成志愿小組.請(qǐng)用抽簽法和隨機(jī)數(shù)表法設(shè)計(jì)抽樣方案.解 抽簽法:第一步:將18名志愿者編號(hào),編號(hào)為1,2,3,18.第二步:將18個(gè)號(hào)碼分別寫在18張外形完全相同的紙條上,并揉成團(tuán),制成號(hào)簽;第三步:將18個(gè)號(hào)簽放入一個(gè)不透明的盒子里,充分?jǐn)噭颍坏谒牟剑簭暮凶又兄饌€(gè)抽取6
6、個(gè)號(hào)簽,并記錄上面的編號(hào);第五步:所得號(hào)碼對(duì)應(yīng)的志愿者,就是志愿小組的成員.隨機(jī)數(shù)表法:第一步:將18名志愿者編號(hào),編號(hào)為01,02,03,18.第二步:在隨機(jī)數(shù)表中任選一數(shù)作為開始,按任意方向讀數(shù),比如第8行第29列的數(shù)7開始,向右讀;第三步:從數(shù)7開始,向右讀,每次取兩位,凡不在0118中的數(shù),或已讀過(guò)的數(shù),都跳過(guò)去不作記錄,依次可得到12,07,15,13,02,09.第四步:找出以上號(hào)碼對(duì)應(yīng)的志愿者,就是志愿小組的成員.例2 某工廠有1 003名工人,從中抽取10人參加體檢,試用系統(tǒng)抽樣進(jìn)行具體實(shí)施.解 (1)將每個(gè)人隨機(jī)編一個(gè)號(hào)由0001至1003.(2)利用隨機(jī)數(shù)法找到3個(gè)號(hào)將這3
7、名工人剔除. (3)將剩余的1 000名工人重新隨機(jī)編號(hào)由0001至1000.(4)分段,取間隔k=100將總體均分為10段,每段含100個(gè)工人.(5)從第一段即為0001號(hào)到0100號(hào)中隨機(jī)抽取一個(gè)號(hào)l.(6)按編號(hào)將l,100+l,200+l,,900+l共10個(gè)號(hào)碼選出,這10個(gè)號(hào)碼所對(duì)應(yīng)的工人組成樣本.例3 (14分)某一個(gè)地區(qū)共有5個(gè)鄉(xiāng)鎮(zhèn),人口3萬(wàn)人,其中人口比例為32523,從3萬(wàn)人中抽取一個(gè)300人 的樣本,分析某種疾病的發(fā)病率,已知這種疾病與不同的地理位置及水土有關(guān),問應(yīng)采取什么樣的方法?并寫出具體過(guò)程.解 應(yīng)采取分層抽樣的方法.過(guò)程如下:(1)將3萬(wàn)人分為五層,其中一個(gè)鄉(xiāng)鎮(zhèn)為
8、一層.(2)按照樣本容量的比例隨機(jī)抽取各鄉(xiāng)鎮(zhèn)應(yīng)抽取的樣本.300×=60(人);300×=40(人);300×=100(人);300×=40(人);300×=60(人),因此各鄉(xiāng)鎮(zhèn)抽取人數(shù)分別為60人,40人,100人,40人,60人.(3)將300人組到一起即得到一個(gè)樣本.2.2.2用樣本的數(shù)字特征估計(jì)總體的數(shù)字特征1、本均值:2、樣本標(biāo)準(zhǔn)差:3用樣本估計(jì)總體時(shí),如果抽樣的方法比較合理,那么樣本可以反映總體的信息,但從樣本得到的信息會(huì)有偏差。在隨機(jī)抽樣中,這種偏差是不可避免的。雖然我們用樣本數(shù)據(jù)得到的分布、均值和標(biāo)準(zhǔn)差并不是總體的真正的分布、
9、均值和標(biāo)準(zhǔn)差,而只是一個(gè)估計(jì),但這種估計(jì)是合理的,特別是當(dāng)樣本量很大時(shí),它們確實(shí)反映了總體的信息。4(1)如果把一組數(shù)據(jù)中的每一個(gè)數(shù)據(jù)都加上或減去同一個(gè)共同的常數(shù),標(biāo)準(zhǔn)差不變.(2)如果把一組數(shù)據(jù)中的每一個(gè)數(shù)據(jù)乘以一個(gè)共同的常數(shù)k,標(biāo)準(zhǔn)差變?yōu)樵瓉?lái)的k倍.(3)一組數(shù)據(jù)中的最大值和最小值對(duì)標(biāo)準(zhǔn)差的影響,區(qū)間的應(yīng)用;“去掉一個(gè)最高分,去掉一個(gè)最低分”中的科學(xué)道理.例1 為了解A,B兩種輪胎的性能,某汽車制造廠分別從這兩種輪胎中隨機(jī)抽取了8個(gè)進(jìn)行測(cè)試,下面列出了每一個(gè)輪胎行駛的最遠(yuǎn)里程數(shù)(單位:1 000 km)輪胎A96,112,97,108,100,103,86,98輪胎B108,101,94,
10、105,96,93,97,106(1)分別計(jì)算A,B兩種輪胎行駛的最遠(yuǎn)里程的平均數(shù),中位數(shù);(2)分別計(jì)算A,B兩種輪胎行駛的最遠(yuǎn)里程的極差、標(biāo)準(zhǔn)差;(3)根據(jù)以上數(shù)據(jù)你認(rèn)為哪種型號(hào)的輪胎性能更加穩(wěn)定?解 (1)A輪胎行駛的最遠(yuǎn)里程的平均數(shù)為:=100,中位數(shù)為: =99;B輪胎行駛的最遠(yuǎn)里程的平均數(shù)為:=100,中位數(shù)為:=99.(2)A輪胎行駛的最遠(yuǎn)里程的極差為:112-86=26,標(biāo)準(zhǔn)差為:s=7.43;B輪胎行駛的最遠(yuǎn)里程的極差為:108-93=15,標(biāo)準(zhǔn)差為:s= =5.43.(3)由于A和B的最遠(yuǎn)行駛里程的平均數(shù)相同,而B輪胎行駛的最遠(yuǎn)里程的極差和標(biāo)準(zhǔn)差較小,所以B輪胎性能更加穩(wěn)定
11、.例2(14分)某化肥廠甲、乙兩個(gè)車間包裝肥料,在自動(dòng)包裝傳送帶上每隔30 min抽取一包產(chǎn)品,稱其重量,分別記錄抽查數(shù)據(jù)如下:甲:102,101,99,98,103,98,99;乙:110,115,90,85,75,115,110.(1)這種抽樣方法是哪一種?(2)將這兩組數(shù)據(jù)用莖葉圖表示;(3)將兩組數(shù)據(jù)比較,說(shuō)明哪個(gè)車間產(chǎn)品較穩(wěn)定.解 (1)因?yàn)殚g隔時(shí)間相同,故是系統(tǒng)抽樣.(2)莖葉圖如下:(3)甲車間:平均值:=(102+101+99+98+103+98+99)=100,方差:s12=(102-100)2+(101-100)2+(99-100)23.428 6.乙車間:平均值:=(11
12、0+115+90+85+75+115+110)=100,方差:s22=(110-100)2+(115-100)2+(110-100)2228.571 4.=,s12s22,甲車間產(chǎn)品穩(wěn)定.2.3.2兩個(gè)變量的線性相關(guān)1、概念: (1)回歸直線方程 (2)回歸系數(shù)2最小二乘法3直線回歸方程的應(yīng)用 (1)描述兩變量之間的依存關(guān)系;利用直線回歸方程即可定量描述兩個(gè)變量間依存的數(shù)量關(guān)系 (2)利用回歸方程進(jìn)行預(yù)測(cè);把預(yù)報(bào)因子(即自變量x)代入回歸方程對(duì)預(yù)報(bào)量(即因變量Y)進(jìn)行估計(jì),即可得到個(gè)體Y值的容許區(qū)間。 (3)利用回歸方程進(jìn)行統(tǒng)計(jì)控制規(guī)定Y值的變化,通過(guò)控制x的范圍來(lái)實(shí)現(xiàn)統(tǒng)計(jì)控制的目標(biāo)。如已經(jīng)得
13、到了空氣中NO2的濃度和汽車流量間的回歸方程,即可通過(guò)控制汽車流量來(lái)控制空氣中NO2的濃度。4應(yīng)用直線回歸的注意事項(xiàng) (1)做回歸分析要有實(shí)際意義; (2)回歸分析前,最好先作出散點(diǎn)圖; (3)回歸直線不要外延。5. 回歸直線方程的推導(dǎo) 設(shè)x與y是具有線性相關(guān)關(guān)系的兩個(gè)變量,且相應(yīng)于樣本的一組觀測(cè)值的n個(gè)點(diǎn)的坐標(biāo)分別是:,下面給出回歸方程的推導(dǎo)。 設(shè)所求的回歸方程為,其中是待確定的參數(shù),那么:,(),樣本中各個(gè)點(diǎn)的偏差是 ,()顯然,上面的各個(gè)偏差的符號(hào)有正、有負(fù),如果將他們相加會(huì)相互抵消一部分,因此他們的和不能代表n個(gè)點(diǎn)與回歸直線在整體上的接近程度,而是采用n個(gè)偏差的平方和來(lái)表示n個(gè)點(diǎn)與相應(yīng)
14、直線(回歸直線)在整體上的接近程度。即求出當(dāng)取最小值時(shí)的的值,就求出了回歸方程。 (一) 先證明兩個(gè)在變形中用到的公式:公式(1) 其中 因?yàn)樗怨剑ǎ?因?yàn)樗裕ǘ┩茖?dǎo):將的表達(dá)式的各項(xiàng)先展開,再合并、變形 -展開 -以a,b為同類項(xiàng),合并 -以a,b的次數(shù)為標(biāo)準(zhǔn)整理 -將數(shù)據(jù)轉(zhuǎn)化為平均數(shù) -配方法 -展開 -整理 -用公式(一)、(二)變形 -配方 在上式中,共有四項(xiàng),后兩項(xiàng)與a,b無(wú)關(guān),為常數(shù);前兩項(xiàng)是兩個(gè)非負(fù)數(shù)的和,因此要使得區(qū)的最小值,當(dāng)且僅當(dāng)前兩項(xiàng)的值都為0。所以 或 -用公式(一)、(二)變形得 (三)總結(jié)規(guī)律:上述推倒過(guò)程是圍繞著待定參數(shù)a,b進(jìn)行的,只含有的部分是常數(shù)或系
15、數(shù),用到的方法有(1)配方法,有兩次配方,分別是a的二次三項(xiàng)式和b的二次三項(xiàng)式;(2)變形時(shí),用到公式(一)、(二)和整體思想;(3)用平方的非負(fù)性求最小值。(4)實(shí)際計(jì)算時(shí),通常是分步計(jì)算:先求出,再分別計(jì)算, 或,的值,最后就可以計(jì)算出a,b的值。6相關(guān)系數(shù)r統(tǒng)計(jì)中常用相關(guān)系數(shù)r來(lái)衡量?jī)蓚€(gè)變量之間的線性相關(guān)的強(qiáng)弱,當(dāng)不全為零,yi也不全為零時(shí),則兩個(gè)變量的相關(guān)系數(shù)的計(jì)算公式是:r就叫做變量y與x的相關(guān)系數(shù)(簡(jiǎn)稱相關(guān)系數(shù))說(shuō)明:(1)對(duì)于相關(guān)系數(shù)r,首先值得注意的是它的符號(hào),當(dāng)r為正數(shù)時(shí),表示變量x,y正相關(guān);當(dāng)r為負(fù)數(shù)時(shí),表示兩個(gè)變量x,y負(fù)相關(guān);(2)另外注意r的大小,如果,那么正相關(guān)很
16、強(qiáng);如果,那么負(fù)相關(guān)很強(qiáng);如果或,那么相關(guān)性一般;如果,那么相關(guān)性較弱例1測(cè)得某國(guó)10對(duì)父子身高(單位:英寸)如下:父親身高()60626465666768707274兒子身高()63.565.26665.566.967.167.468.370.170(1)對(duì)變量y與x進(jìn)行相關(guān)性檢驗(yàn);(2)如果y與x之間具有線性相關(guān)關(guān)系,求回歸直線方程;(3)如果父親的身高為73英寸,估計(jì)兒子身高解:(1),所以,所以y與x之間具有線性相關(guān)關(guān)系(2)設(shè)回歸直線方程為,則, 故所求的回歸直線方程為(3)當(dāng)英寸時(shí),所以當(dāng)父親身高為73英寸時(shí),估計(jì)兒子的身高約為69.9英寸點(diǎn)評(píng):回歸直線是對(duì)兩個(gè)變量線性相關(guān)關(guān)系的定量描述,利用回歸直線,可以對(duì)一些實(shí)際問題進(jìn)行分析、預(yù)測(cè),由一個(gè)變量的變化可以推測(cè)出另
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 早教認(rèn)識(shí)形狀課程設(shè)計(jì)
- 山東管理學(xué)院《網(wǎng)絡(luò)營(yíng)銷實(shí)務(wù)》2023-2024學(xué)年第一學(xué)期期末試卷
- 插床機(jī)構(gòu)課程設(shè)計(jì)感想
- 動(dòng)物用藥批發(fā)商談判技巧與策略考核試卷
- 承臺(tái)的強(qiáng)度檢驗(yàn)課程設(shè)計(jì)
- 早教顏色和形狀課程設(shè)計(jì)
- 幼兒園立體粘土課程設(shè)計(jì)
- 幼兒園教師課程設(shè)計(jì)需求
- 握力器鍛煉課程設(shè)計(jì)
- 建院水質(zhì)工程課程設(shè)計(jì)
- 護(hù)理年終個(gè)人工作總結(jié)
- 河北省健康體檢主檢醫(yī)師題庫(kù)2024年12月
- 電力行業(yè)用水管理制度
- 2025年1月“八省聯(lián)考”考前猜想卷數(shù)學(xué)試題01 含解析
- 《論教育》主要篇目課件
- 2022年軍隊(duì)文職統(tǒng)一考試《專業(yè)科目》管理學(xué)類-管理學(xué)試卷(含解析)
- 靜脈輸液治療的風(fēng)險(xiǎn)管理
- 江南大學(xué)《高分子化學(xué)實(shí)驗(yàn)》2022-2023學(xué)年第一學(xué)期期末試卷
- 18古詩(shī)三首《書湖陰先生壁》說(shuō)課稿2024-2025學(xué)年統(tǒng)編版語(yǔ)文六年級(jí)上冊(cè)
- 設(shè)備驗(yàn)證工作年底述職報(bào)告
- 精神病藥物與藥物性肝損傷
評(píng)論
0/150
提交評(píng)論