高中必修三統(tǒng)計知識點整理WORD_第1頁
高中必修三統(tǒng)計知識點整理WORD_第2頁
高中必修三統(tǒng)計知識點整理WORD_第3頁
高中必修三統(tǒng)計知識點整理WORD_第4頁
高中必修三統(tǒng)計知識點整理WORD_第5頁
已閱讀5頁,還剩5頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、文檔可能無法思考全面,請瀏覽后下載! 必修3知識點總結(jié)統(tǒng)計2.1.1 簡單隨機抽樣1簡單隨機抽樣,也叫純隨機抽樣。就是從總體中不加任何分組、劃類、排隊等,完全隨機地抽取調(diào)查單位。特點是:每個樣本單位被抽中的可能性相同(概率相等),樣本的每個單位完全獨立,彼此間無一定的關(guān)聯(lián)性和排斥性。簡單隨機抽樣是其它各種抽樣形式的基礎(chǔ)。通常只是在總體單位之間差異程度較小和數(shù)目較少時,才采用這種方法。2簡單隨機抽樣常用的方法: (1)抽簽法;隨機數(shù)表法;計算機模擬法;使用統(tǒng)計軟件直接抽取。在簡單隨機抽樣的樣本容量設(shè)計中,主要考慮:總體變異情況;允許誤差范圍;概率保證程度。3抽簽法: (1)給調(diào)查對象群體中的每一

2、個對象編號; (2)準(zhǔn)備抽簽的工具,實施抽簽 (3)對樣本中的每一個個體進行測量或調(diào)查 例:請調(diào)查你所在的學(xué)校的學(xué)生做喜歡的體育活動情況。4隨機數(shù)表法: 例:利用隨機數(shù)表在所在的班級中抽取10位同學(xué)參加某項活動。2.1.2系統(tǒng)抽樣1系統(tǒng)抽樣(等距抽樣或機械抽樣):把總體的單位進行排序,再計算出抽樣距離,然后按照這一固定的抽樣距離抽取樣本。第一個樣本采用簡單隨機抽樣的辦法抽取。K(抽樣距離)=N(總體規(guī)模)/n(樣本規(guī)模)前提條件:總體中個體的排列對于研究的變量來說,應(yīng)是隨機的,即不存在某種與研究變量相關(guān)的規(guī)則分布。可以在調(diào)查允許的條件下,從不同的樣本開始抽樣,對比幾次樣本的特點。如果有明顯差別

3、,說明樣本在總體中的分布承某種循環(huán)性規(guī)律,且這種循環(huán)和抽樣距離重合。2系統(tǒng)抽樣,即等距抽樣是實際中最為常用的抽樣方法之一。因為它對抽樣框的要求較低,實施也比較簡單。更為重要的是,如果有某種與調(diào)查指標(biāo)相關(guān)的輔助變量可供使用,總體單元按輔助變量的大小順序排隊的話,使用系統(tǒng)抽樣可以大大提高估計精度。2.1.3分層抽樣1分層抽樣(類型抽樣):先將總體中的所有單位按照某種特征或標(biāo)志(性別、年齡等)劃分成若干類型或?qū)哟?,然后再在各個類型或?qū)哟沃胁捎煤唵坞S機抽樣或系用抽樣的辦法抽取一個子樣本,最后,將這些子樣本合起來構(gòu)成總體的樣本。10 / 10兩種方法:1先以分層變量將總體劃分為若干層,再按照各層在總體中

4、的比例從各層中抽取。2先以分層變量將總體劃分為若干層,再將各層中的元素按分層的順序整齊排列,最后用系統(tǒng)抽樣的方法抽取樣本。2分層抽樣是把異質(zhì)性較強的總體分成一個個同質(zhì)性較強的子總體,再抽取不同的子總體中的樣本分別代表該子總體,所有的樣本進而代表總體。分層標(biāo)準(zhǔn):(1)以調(diào)查所要分析和研究的主要變量或相關(guān)的變量作為分層的標(biāo)準(zhǔn)。(2)以保證各層內(nèi)部同質(zhì)性強、各層之間異質(zhì)性強、突出總體內(nèi)在結(jié)構(gòu)的變量作為分層變量。(3)以那些有明顯分層區(qū)分的變量作為分層變量。3分層的比例問題: (1)按比例分層抽樣:根據(jù)各種類型或?qū)哟沃械膯挝粩?shù)目占總體單位數(shù)目的比重來抽取子樣本的方法。 (2)不按比例分層抽樣:有的層次

5、在總體中的比重太小,其樣本量就會非常少,此時采用該方法,主要是便于對不同層次的子總體進行專門研究或進行相互比較。如果要用樣本資料推斷總體時,則需要先對各層的數(shù)據(jù)資料進行加權(quán)處理,調(diào)整樣本中各層的比例,使數(shù)據(jù)恢復(fù)到總體中各層實際的比例結(jié)構(gòu)。例1 某大學(xué)為了支援我國西部教育事業(yè),決定從2007應(yīng)屆畢業(yè)生報名的18名志愿者中,選取6人組成志愿小組.請用抽簽法和隨機數(shù)表法設(shè)計抽樣方案.解 抽簽法:第一步:將18名志愿者編號,編號為1,2,3,18.第二步:將18個號碼分別寫在18張外形完全相同的紙條上,并揉成團,制成號簽;第三步:將18個號簽放入一個不透明的盒子里,充分?jǐn)噭颍坏谒牟剑簭暮凶又兄饌€抽取6

6、個號簽,并記錄上面的編號;第五步:所得號碼對應(yīng)的志愿者,就是志愿小組的成員.隨機數(shù)表法:第一步:將18名志愿者編號,編號為01,02,03,18.第二步:在隨機數(shù)表中任選一數(shù)作為開始,按任意方向讀數(shù),比如第8行第29列的數(shù)7開始,向右讀;第三步:從數(shù)7開始,向右讀,每次取兩位,凡不在0118中的數(shù),或已讀過的數(shù),都跳過去不作記錄,依次可得到12,07,15,13,02,09.第四步:找出以上號碼對應(yīng)的志愿者,就是志愿小組的成員.例2 某工廠有1 003名工人,從中抽取10人參加體檢,試用系統(tǒng)抽樣進行具體實施.解 (1)將每個人隨機編一個號由0001至1003.(2)利用隨機數(shù)法找到3個號將這3

7、名工人剔除. (3)將剩余的1 000名工人重新隨機編號由0001至1000.(4)分段,取間隔k=100將總體均分為10段,每段含100個工人.(5)從第一段即為0001號到0100號中隨機抽取一個號l.(6)按編號將l,100+l,200+l,,900+l共10個號碼選出,這10個號碼所對應(yīng)的工人組成樣本.例3 (14分)某一個地區(qū)共有5個鄉(xiāng)鎮(zhèn),人口3萬人,其中人口比例為32523,從3萬人中抽取一個300人 的樣本,分析某種疾病的發(fā)病率,已知這種疾病與不同的地理位置及水土有關(guān),問應(yīng)采取什么樣的方法?并寫出具體過程.解 應(yīng)采取分層抽樣的方法.過程如下:(1)將3萬人分為五層,其中一個鄉(xiāng)鎮(zhèn)為

8、一層.(2)按照樣本容量的比例隨機抽取各鄉(xiāng)鎮(zhèn)應(yīng)抽取的樣本.300×=60(人);300×=40(人);300×=100(人);300×=40(人);300×=60(人),因此各鄉(xiāng)鎮(zhèn)抽取人數(shù)分別為60人,40人,100人,40人,60人.(3)將300人組到一起即得到一個樣本.2.2.2用樣本的數(shù)字特征估計總體的數(shù)字特征1、本均值:2、樣本標(biāo)準(zhǔn)差:3用樣本估計總體時,如果抽樣的方法比較合理,那么樣本可以反映總體的信息,但從樣本得到的信息會有偏差。在隨機抽樣中,這種偏差是不可避免的。雖然我們用樣本數(shù)據(jù)得到的分布、均值和標(biāo)準(zhǔn)差并不是總體的真正的分布、

9、均值和標(biāo)準(zhǔn)差,而只是一個估計,但這種估計是合理的,特別是當(dāng)樣本量很大時,它們確實反映了總體的信息。4(1)如果把一組數(shù)據(jù)中的每一個數(shù)據(jù)都加上或減去同一個共同的常數(shù),標(biāo)準(zhǔn)差不變.(2)如果把一組數(shù)據(jù)中的每一個數(shù)據(jù)乘以一個共同的常數(shù)k,標(biāo)準(zhǔn)差變?yōu)樵瓉淼膋倍.(3)一組數(shù)據(jù)中的最大值和最小值對標(biāo)準(zhǔn)差的影響,區(qū)間的應(yīng)用;“去掉一個最高分,去掉一個最低分”中的科學(xué)道理.例1 為了解A,B兩種輪胎的性能,某汽車制造廠分別從這兩種輪胎中隨機抽取了8個進行測試,下面列出了每一個輪胎行駛的最遠(yuǎn)里程數(shù)(單位:1 000 km)輪胎A96,112,97,108,100,103,86,98輪胎B108,101,94,

10、105,96,93,97,106(1)分別計算A,B兩種輪胎行駛的最遠(yuǎn)里程的平均數(shù),中位數(shù);(2)分別計算A,B兩種輪胎行駛的最遠(yuǎn)里程的極差、標(biāo)準(zhǔn)差;(3)根據(jù)以上數(shù)據(jù)你認(rèn)為哪種型號的輪胎性能更加穩(wěn)定?解 (1)A輪胎行駛的最遠(yuǎn)里程的平均數(shù)為:=100,中位數(shù)為: =99;B輪胎行駛的最遠(yuǎn)里程的平均數(shù)為:=100,中位數(shù)為:=99.(2)A輪胎行駛的最遠(yuǎn)里程的極差為:112-86=26,標(biāo)準(zhǔn)差為:s=7.43;B輪胎行駛的最遠(yuǎn)里程的極差為:108-93=15,標(biāo)準(zhǔn)差為:s= =5.43.(3)由于A和B的最遠(yuǎn)行駛里程的平均數(shù)相同,而B輪胎行駛的最遠(yuǎn)里程的極差和標(biāo)準(zhǔn)差較小,所以B輪胎性能更加穩(wěn)定

11、.例2(14分)某化肥廠甲、乙兩個車間包裝肥料,在自動包裝傳送帶上每隔30 min抽取一包產(chǎn)品,稱其重量,分別記錄抽查數(shù)據(jù)如下:甲:102,101,99,98,103,98,99;乙:110,115,90,85,75,115,110.(1)這種抽樣方法是哪一種?(2)將這兩組數(shù)據(jù)用莖葉圖表示;(3)將兩組數(shù)據(jù)比較,說明哪個車間產(chǎn)品較穩(wěn)定.解 (1)因為間隔時間相同,故是系統(tǒng)抽樣.(2)莖葉圖如下:(3)甲車間:平均值:=(102+101+99+98+103+98+99)=100,方差:s12=(102-100)2+(101-100)2+(99-100)23.428 6.乙車間:平均值:=(11

12、0+115+90+85+75+115+110)=100,方差:s22=(110-100)2+(115-100)2+(110-100)2228.571 4.=,s12s22,甲車間產(chǎn)品穩(wěn)定.2.3.2兩個變量的線性相關(guān)1、概念: (1)回歸直線方程 (2)回歸系數(shù)2最小二乘法3直線回歸方程的應(yīng)用 (1)描述兩變量之間的依存關(guān)系;利用直線回歸方程即可定量描述兩個變量間依存的數(shù)量關(guān)系 (2)利用回歸方程進行預(yù)測;把預(yù)報因子(即自變量x)代入回歸方程對預(yù)報量(即因變量Y)進行估計,即可得到個體Y值的容許區(qū)間。 (3)利用回歸方程進行統(tǒng)計控制規(guī)定Y值的變化,通過控制x的范圍來實現(xiàn)統(tǒng)計控制的目標(biāo)。如已經(jīng)得

13、到了空氣中NO2的濃度和汽車流量間的回歸方程,即可通過控制汽車流量來控制空氣中NO2的濃度。4應(yīng)用直線回歸的注意事項 (1)做回歸分析要有實際意義; (2)回歸分析前,最好先作出散點圖; (3)回歸直線不要外延。5. 回歸直線方程的推導(dǎo) 設(shè)x與y是具有線性相關(guān)關(guān)系的兩個變量,且相應(yīng)于樣本的一組觀測值的n個點的坐標(biāo)分別是:,下面給出回歸方程的推導(dǎo)。 設(shè)所求的回歸方程為,其中是待確定的參數(shù),那么:,(),樣本中各個點的偏差是 ,()顯然,上面的各個偏差的符號有正、有負(fù),如果將他們相加會相互抵消一部分,因此他們的和不能代表n個點與回歸直線在整體上的接近程度,而是采用n個偏差的平方和來表示n個點與相應(yīng)

14、直線(回歸直線)在整體上的接近程度。即求出當(dāng)取最小值時的的值,就求出了回歸方程。 (一) 先證明兩個在變形中用到的公式:公式(1) 其中 因為所以公式() 因為所以(二)推導(dǎo):將的表達(dá)式的各項先展開,再合并、變形 -展開 -以a,b為同類項,合并 -以a,b的次數(shù)為標(biāo)準(zhǔn)整理 -將數(shù)據(jù)轉(zhuǎn)化為平均數(shù) -配方法 -展開 -整理 -用公式(一)、(二)變形 -配方 在上式中,共有四項,后兩項與a,b無關(guān),為常數(shù);前兩項是兩個非負(fù)數(shù)的和,因此要使得區(qū)的最小值,當(dāng)且僅當(dāng)前兩項的值都為0。所以 或 -用公式(一)、(二)變形得 (三)總結(jié)規(guī)律:上述推倒過程是圍繞著待定參數(shù)a,b進行的,只含有的部分是常數(shù)或系

15、數(shù),用到的方法有(1)配方法,有兩次配方,分別是a的二次三項式和b的二次三項式;(2)變形時,用到公式(一)、(二)和整體思想;(3)用平方的非負(fù)性求最小值。(4)實際計算時,通常是分步計算:先求出,再分別計算, 或,的值,最后就可以計算出a,b的值。6相關(guān)系數(shù)r統(tǒng)計中常用相關(guān)系數(shù)r來衡量兩個變量之間的線性相關(guān)的強弱,當(dāng)不全為零,yi也不全為零時,則兩個變量的相關(guān)系數(shù)的計算公式是:r就叫做變量y與x的相關(guān)系數(shù)(簡稱相關(guān)系數(shù))說明:(1)對于相關(guān)系數(shù)r,首先值得注意的是它的符號,當(dāng)r為正數(shù)時,表示變量x,y正相關(guān);當(dāng)r為負(fù)數(shù)時,表示兩個變量x,y負(fù)相關(guān);(2)另外注意r的大小,如果,那么正相關(guān)很

16、強;如果,那么負(fù)相關(guān)很強;如果或,那么相關(guān)性一般;如果,那么相關(guān)性較弱例1測得某國10對父子身高(單位:英寸)如下:父親身高()60626465666768707274兒子身高()63.565.26665.566.967.167.468.370.170(1)對變量y與x進行相關(guān)性檢驗;(2)如果y與x之間具有線性相關(guān)關(guān)系,求回歸直線方程;(3)如果父親的身高為73英寸,估計兒子身高解:(1),所以,所以y與x之間具有線性相關(guān)關(guān)系(2)設(shè)回歸直線方程為,則, 故所求的回歸直線方程為(3)當(dāng)英寸時,所以當(dāng)父親身高為73英寸時,估計兒子的身高約為69.9英寸點評:回歸直線是對兩個變量線性相關(guān)關(guān)系的定量描述,利用回歸直線,可以對一些實際問題進行分析、預(yù)測,由一個變量的變化可以推測出另

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論