【高三數(shù)學(xué)知識(shí)點(diǎn)總結(jié)】33:統(tǒng)計(jì)_第1頁(yè)
【高三數(shù)學(xué)知識(shí)點(diǎn)總結(jié)】33:統(tǒng)計(jì)_第2頁(yè)
【高三數(shù)學(xué)知識(shí)點(diǎn)總結(jié)】33:統(tǒng)計(jì)_第3頁(yè)
【高三數(shù)學(xué)知識(shí)點(diǎn)總結(jié)】33:統(tǒng)計(jì)_第4頁(yè)
【高三數(shù)學(xué)知識(shí)點(diǎn)總結(jié)】33:統(tǒng)計(jì)_第5頁(yè)
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、【高三數(shù)學(xué)知識(shí)點(diǎn)總結(jié)】統(tǒng)計(jì)抽樣的方法抽樣一般分為簡(jiǎn)單隨機(jī)抽樣和分層抽樣.簡(jiǎn)單隨機(jī)抽樣 從個(gè)體數(shù)為的總體中逐個(gè)不放回地取出個(gè)個(gè)體作為樣本如果每個(gè)個(gè)體都有相同的機(jī)會(huì)被取到,那么這樣的抽樣方法稱(chēng)為簡(jiǎn)單隨機(jī)抽樣.方式一:抽簽法步驟 = 1 * GB3 * MERGEFORMAT 將總體中的個(gè)個(gè)體編號(hào); = 2 * GB3 * MERGEFORMAT 將這個(gè)號(hào)碼寫(xiě)在形狀、大小相同的號(hào)簽上; = 3 * GB3 * MERGEFORMAT 將號(hào)簽放在同一箱中,并攪拌均勻; = 4 * GB3 * MERGEFORMAT 從箱中每次抽出1個(gè)號(hào)簽,連續(xù)抽取次; = 5 * GB3 * MERGEFORMAT

2、將總體中與抽到的號(hào)簽的編號(hào)一致的個(gè)個(gè)體取出.方式二:隨機(jī)數(shù)表法 = 1 * GB3 * MERGEFORMAT 將總體中的個(gè)體編號(hào)(每個(gè)號(hào)碼位數(shù)一致); = 2 * GB3 * MERGEFORMAT 在隨機(jī)數(shù)表中任選一個(gè)數(shù)作為開(kāi)始; = 3 * GB3 * MERGEFORMAT 從選定的數(shù)開(kāi)始按一定的方向讀下去,若得到的號(hào)碼在編號(hào)中,則取出;若得到的號(hào)碼不在編號(hào)中或前面已經(jīng)取出,則跳過(guò),如此繼續(xù)下去,直到取滿(mǎn)為止; = 4 * GB3 * MERGEFORMAT 根據(jù)選定的號(hào)碼抽取樣本.(2)分層抽樣(按“比例抽樣”)當(dāng)總體由差異明顯的幾個(gè)部分組成時(shí),為了使樣本更客觀地反映總體情況,我們常

3、常將總體中的個(gè)體按不同的特點(diǎn)分成層次比較分明的幾個(gè)部分,然后按各個(gè)部分在總體中所占的比實(shí)施抽樣,這種抽樣方法叫分層抽樣.分層抽樣的步驟: = 1 * GB3 * MERGEFORMAT 將總體按一定標(biāo)準(zhǔn)分層; = 2 * GB3 * MERGEFORMAT 計(jì)算各層的個(gè)體數(shù)與總體的個(gè)體數(shù)的比; = 3 * GB3 * MERGEFORMAT 按各層個(gè)體數(shù)占總體的個(gè)體數(shù)的比確定各層應(yīng)抽取的樣本容量; = 4 * GB3 * MERGEFORMAT 在每一層進(jìn)行抽樣(可用簡(jiǎn)單隨機(jī)抽樣).(3)兩種抽樣的聯(lián)系類(lèi)別特點(diǎn)相互聯(lián)系適用范圍共同點(diǎn)簡(jiǎn)單隨機(jī)抽樣從總體中逐個(gè)抽取總體中的個(gè)體數(shù)較少抽樣過(guò)程中每個(gè)個(gè)

4、體被抽到的可能性相同,均為分層抽樣將總體分成幾層,按各層個(gè)體數(shù)之比抽取各層抽樣時(shí)采用簡(jiǎn)單隨機(jī)抽樣總體由差異明顯的幾部分組成例1-1假設(shè)要考察某公司生產(chǎn)的500克袋裝牛奶的質(zhì)量是否達(dá)標(biāo),現(xiàn)從800袋牛奶中抽取60袋牛奶進(jìn)行檢驗(yàn),利用隨機(jī)數(shù)表抽樣時(shí),先將800袋牛奶按000,001,799進(jìn)行編號(hào),如果從隨機(jī)數(shù)表第8行第7列開(kāi)始向右讀,請(qǐng)你依次寫(xiě)出最先檢測(cè)的5袋牛奶的編號(hào) , , , , .(下面摘取了隨機(jī)數(shù)表第7行至第9行)8442 1753 3157 2455 0688 7704 7447 6721 7633 5025 8392 1206 766301 6378 5916 9556 6719

5、9810 5071 7512 8673 5807 4439 5238 793321 1234 2978 6456 0782 5242 0744 3815 5100 1342 9966 0279 54例1-2某工廠生產(chǎn)三種不同型號(hào)的產(chǎn)品,三種產(chǎn)品數(shù)量之比依次為,現(xiàn)采用分層抽樣的方法從中抽出一個(gè)容量為的樣本,樣本中型號(hào)的產(chǎn)品有件,那么此樣本容量 答:1-1: 785 667 199 507 175; 1-2:72.總體分布的估計(jì) 用樣本估計(jì)總體的方法之一是用樣本的頻率分布估計(jì)總體的分布,二是用樣本的數(shù)字特征估計(jì)總體的數(shù)字特征.頻率分布表制作頻率分布表的步驟如下: = 1 * GB3 * MERGE

6、FORMAT 求全距,決定組數(shù)和組距,組距=.(注:如果取全距時(shí)不利于分組(如不能被組數(shù)整除),那么可以適當(dāng)增大全距,如在左、右兩端各增加適當(dāng)范圍(盡量使兩端增加的量相同)) = 2 * GB3 * MERGEFORMAT 分組,通常對(duì)組內(nèi)數(shù)值所在區(qū)間取左閉右開(kāi)區(qū)間,最后一組取閉區(qū)間. = 3 * GB3 * MERGEFORMAT 登記頻數(shù),計(jì)算頻率,列出頻率分布表.頻率分布直方圖、折線圖、總體密度曲線作頻率分布直方圖的方法:把橫軸分成若干段,每一線段對(duì)應(yīng)1個(gè)組的組距,然后以此線段為底作矩形,它的高等于該組的,這樣得到一系列的矩形,每個(gè)矩形的面積恰好是該組的頻率.這些矩形就構(gòu)成了頻率分布直方

7、圖.性質(zhì):所有矩形的面積之和為1.如果將頻率分布直方圖中各個(gè)相鄰的矩形的上底邊的中點(diǎn)順次連結(jié)起來(lái),那么就得到頻率分布折線圖.(注:取值區(qū)間兩端點(diǎn)須分別向外延伸半個(gè)組距,并取此組距上在軸上的點(diǎn)與折線的首、尾分別相連.)3.總體密度曲線:隨著樣本容量的增加,作圖時(shí)所分的組數(shù)增加,組距減小,相應(yīng)的頻率折線圖會(huì)越來(lái)越接近于一條光滑曲線,統(tǒng)計(jì)中稱(chēng)這條光滑曲線為總體密度曲線例2-1某校從高一年級(jí)學(xué)生中隨機(jī)抽取100名學(xué)生,將他們期中考試的數(shù)學(xué)成績(jī)(均為整數(shù))分成六段: 40,50),50,60),90,100后得到頻率分布直方圖(如下圖所示),則分?jǐn)?shù)在70,80)內(nèi)的人數(shù)是 答:2-1:30. (3)平均

8、數(shù)、方差、標(biāo)準(zhǔn)差如果有個(gè)數(shù)據(jù)則個(gè)數(shù)據(jù)的平均數(shù)為,方差為, 標(biāo)準(zhǔn)差為. 注: = 1 * GB3 * MERGEFORMAT 加權(quán)平均:若取值為的頻率分別為則其平均數(shù)為 = 2 * GB3 * MERGEFORMAT 連續(xù)型分布(區(qū)間)求平均數(shù)問(wèn)題,用“組中值”近似估計(jì). = 3 * GB3 * MERGEFORMAT 方差越小,數(shù)據(jù)越穩(wěn)定; = 4 * GB3 * MERGEFORMAT 其他概念:極差:一組數(shù)據(jù)的最大值與最小值的差; 眾數(shù):一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的數(shù)值;中位數(shù): = 1 * GB3 * MERGEFORMAT 離散型數(shù)據(jù):把所有數(shù)值按大小排序后,當(dāng)變量值的項(xiàng)數(shù)N為奇數(shù)時(shí),處于

9、中間位置的變量值即為中位數(shù);當(dāng)N為偶數(shù)時(shí),中位數(shù)則為處于中間位置的2個(gè)變量值的平均數(shù)。 = 2 * GB3 * MERGEFORMAT 連續(xù)型數(shù)據(jù):在中位數(shù)的左右兩側(cè)頻率均為 = 5 * GB3 * MERGEFORMAT 性質(zhì):如果有個(gè)數(shù)據(jù)其平均數(shù)為,方差為,標(biāo)準(zhǔn)差為,則數(shù)據(jù)的平均數(shù)為,方差為,標(biāo)準(zhǔn)差為 例2-2.【2016江蘇高考】已知一組數(shù)據(jù)4.7,4.8,5.1,5.4,5.5,則該組數(shù)據(jù)的方差是 .例2-3已知一組數(shù)據(jù)的方差為,則數(shù)據(jù)的方差是 答:2-2: 0.1; 2-3: 12.3.回歸分析(1)變量間的相關(guān)關(guān)系1.常見(jiàn)的兩變量之間的關(guān)系有兩類(lèi):一類(lèi)是函數(shù)關(guān)系,另一類(lèi)是相關(guān)關(guān)系與

10、函數(shù)關(guān)系不同,相關(guān)關(guān)系是一種非確定性關(guān)系2.從散點(diǎn)圖上看,點(diǎn)散布在從左下角到右上角的區(qū)域內(nèi),兩個(gè)變量的這種相關(guān)關(guān)系稱(chēng)為正相關(guān),點(diǎn)散布在左上角到右下角的區(qū)域內(nèi),兩個(gè)變量的這種相關(guān)關(guān)系稱(chēng)為負(fù)相關(guān)(2)線性回歸方程1.最小二乘法求回歸直線,使得樣本數(shù)據(jù)的點(diǎn)到它的距離的平方和最小的方法叫做最小二乘法 2.基本步驟 = 1 * GB3 * MERGEFORMAT 由樣本點(diǎn)形成散點(diǎn)圖,判定是否具有線性相關(guān)關(guān)系; = 2 * GB3 * MERGEFORMAT 由最小二乘法,確定回歸系數(shù)和回歸截距,得到線性回歸方程,其中稱(chēng)為樣本中心點(diǎn); = 3 * GB3 * MERGEFORMAT 依據(jù)線性回歸方程作出預(yù)

11、測(cè)為了回答模型的合理性問(wèn)題,我們需要對(duì)變量x與y的線性相關(guān)性進(jìn)行檢驗(yàn)(簡(jiǎn)稱(chēng)相關(guān)性檢驗(yàn))(3)相關(guān)系數(shù)r刻畫(huà)線性相關(guān)程度的參數(shù)1.相關(guān)系數(shù)2.相關(guān)系數(shù)的性質(zhì): = 1 * GB3 * MERGEFORMAT 當(dāng)則和正相關(guān);當(dāng)則和負(fù)相關(guān); = 2 * GB3 * MERGEFORMAT ; = 3 * GB3 * MERGEFORMAT 當(dāng)越接近1,線性相關(guān)程度越高;當(dāng)越接近0,線性相關(guān)程度越低. 3.對(duì)相關(guān)系數(shù)進(jìn)行顯著性檢驗(yàn)的步驟: = 1 * GB3 * MERGEFORMAT 提出統(tǒng)計(jì)假設(shè)變量不具有線性相關(guān)關(guān)系; = 2 * GB3 * MERGEFORMAT 如果以的把握作出推斷,那么可以

12、根據(jù)與(是樣本容量,表示自由度)在教材目錄中查出一個(gè)的臨界值(其中稱(chēng)為檢驗(yàn)水平); = 3 * GB3 * MERGEFORMAT 計(jì)算樣本相關(guān)系數(shù); = 4 * GB3 * MERGEFORMAT 作出統(tǒng)計(jì)推斷;若則否定表明有的把握認(rèn)為變量與之間具有線性相關(guān)關(guān)系;若則就目前數(shù)據(jù)而言,沒(méi)有充分理由認(rèn)為與之間具有線性相關(guān)關(guān)系.說(shuō)明:1.對(duì)相關(guān)系數(shù)進(jìn)行顯著性檢驗(yàn),一般取檢驗(yàn)水平即可靠程度為;2.這里的指的是線性相關(guān)系數(shù),的絕對(duì)值很小,只是說(shuō)明線性相關(guān)程度低,不一定不相關(guān),可能是非線性相關(guān)的某種關(guān)系.(4)相關(guān)指數(shù)刻畫(huà)回歸效果的參數(shù)1.殘差(其中):實(shí)際值與估計(jì)值之間的差,殘差平方和 越小,線性回顧

13、模型的擬合效果越好.2.相關(guān)指數(shù):表示解釋變量對(duì)于響應(yīng)變量變化的貢獻(xiàn)率. 可以看出,越接近于1,表示殘差平方和越小,表示模型的擬合效果越好.(5)非線性回歸分析在實(shí)際問(wèn)題中,有時(shí)兩個(gè)變量之間的關(guān)系并不是線性關(guān)系,這就需要我們選擇適當(dāng)?shù)淖兞看鷵Q,把非線性方程轉(zhuǎn)化為線性回歸方程常見(jiàn)的非線性回歸轉(zhuǎn)化方法有:(1)“yaeq f(b,x)”型:令teq f(1,x),則有yabt;(2)“yaxb”型:令mln y,tln x,則有mln abt;(3)“yaebx”型:令mln y,則有yln abx;(4)“yaeeq f(b,x)”型:令mln y,teq f(1,x),則有yln abt;(5

14、)“yabln x”型:令tln x,則有yabt.4.獨(dú)立性檢驗(yàn) (1)22列聯(lián)表已知分類(lèi)變量X和Y,它們的取值分別為x1,x2,y1,y2,其22列聯(lián)表如下(2)等高條形圖:按列聯(lián)表可制作等高條形圖 = 1 * GB3 * MERGEFORMAT 等高條形圖與表格相比,更能直觀地反映出兩個(gè)分類(lèi)變量間是否相互影響,所以常用等高條形圖展示列聯(lián)表數(shù)據(jù)的頻率特征; = 2 * GB3 * MERGEFORMAT 觀察等高條形圖發(fā)現(xiàn)eq f(a,ab)和eq f(c,cd)(圖中兩段陰影條)相差很大,則判斷兩個(gè)分類(lèi)變量有關(guān)系,且差異越大關(guān)系越強(qiáng)小結(jié):“利用等高條形圖判斷兩個(gè)分類(lèi)變量相關(guān)程度”的步驟:統(tǒng)計(jì)列表畫(huà)圖(3)統(tǒng)計(jì)量2選取2作統(tǒng)計(jì)量,用它的大小檢驗(yàn)變量之間是否相關(guān)(4)獨(dú)立性檢驗(yàn)臨界值表當(dāng)數(shù)據(jù)量較大時(shí),在統(tǒng)計(jì)中,用以下結(jié)果對(duì)變量的獨(dú)立性進(jìn)行判斷 = 1 * GB3 * MERGEFORMAT 當(dāng)22.706時(shí),則沒(méi)有充分的

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論