概率統(tǒng)計(jì)復(fù)習(xí)課件_第1頁
概率統(tǒng)計(jì)復(fù)習(xí)課件_第2頁
概率統(tǒng)計(jì)復(fù)習(xí)課件_第3頁
概率統(tǒng)計(jì)復(fù)習(xí)課件_第4頁
概率統(tǒng)計(jì)復(fù)習(xí)課件_第5頁
已閱讀5頁,還剩48頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、1、隨機(jī)抽樣 常用的隨機(jī)抽樣方法有哪些? 基礎(chǔ)梳理 1簡單隨機(jī)抽樣 (1)定義:設(shè)一個總體含有 N 個個體,從中 抽取 n 個個體作為樣本 (nN),如果每次抽取時總體內(nèi)的各個個體被 抽到的機(jī)會都 ,就把這種抽樣方法叫做簡單隨機(jī)抽樣 (2)最常用的簡單隨機(jī)抽樣的方法: 和 逐個不放回地 相等 抽簽法 隨機(jī)數(shù)法 2系統(tǒng)抽樣的步驟 假設(shè)要從容量為N的總體中抽取容量為n的樣本 (1)編號:先將總體的N個個體 ; (2)分段:確定 ,對編號進(jìn)行 ,當(dāng) N n (n是樣本容 量)是整數(shù)時,取kN n ; (3)確定首個個體:在第1段用 確定第一個個體 編號l(lk); (4)獲取樣本:按照一定的規(guī)則抽取

2、樣本,通常是將 l加上間隔k 得到第2個個體編號 ,再加k得到第3個個體編號 , 依次進(jìn)行下去,直到獲取整個樣本 編號 分段間隔k 分段 簡單隨機(jī)抽樣 (lk) (l2k) 3分層抽樣 (1)定義:在抽樣時,將總體分成 的層,然后按 照 ,從各層獨(dú)立地抽取一定數(shù)量的個體,將各層 取出的個體合在一起作為樣本,這種抽樣方法叫做分層抽樣 (2)分層抽樣的應(yīng)用范圍: 當(dāng)總體是由 組成時,往往選用分層抽 樣 互不交叉 一定的比例 差異明顯的幾個部分 4分層抽樣的步驟 (1)分層:將總體按某種特征分成若干部分; (2)確定比例:計(jì)算各層的個體數(shù)與總體的個體數(shù)的比; (3)確定各層應(yīng)抽取的樣本容量; (4)

3、在每一層進(jìn)行抽樣(各層分別按簡單隨機(jī)抽樣或系統(tǒng)抽樣的 方法抽取),綜合每層抽樣,組成樣本 一條規(guī)律 三種抽樣方法的共同點(diǎn)都是等概率抽樣,即抽樣過程中每個個 體被抽到的概率相等,體現(xiàn)了這三種抽樣方法的客觀性和公平 性若樣本容量為n,總體的個體數(shù)為N,則用這三種方法抽 樣時,每個個體被抽到的概率都是 n N . 三個特點(diǎn) (1)簡單隨機(jī)抽樣的特點(diǎn):總體中的個體性質(zhì)相似,無明顯層 次;總體容量較小,尤其是樣本容量較小;用簡單隨機(jī)抽樣法 抽出的個體帶有隨機(jī)性,個體間無固定間距 (2)系統(tǒng)抽樣的特點(diǎn):適用于元素個數(shù)很多且均衡的總體;各 個個體被抽到的機(jī)會均等;總體分組后,在起始部分抽樣時, 采用簡單隨機(jī)

4、抽樣 (3)分層抽樣的特點(diǎn):適用于總體由差異明顯的幾部分組成的 情況;分層后,在每一層抽樣時可采用簡單隨機(jī)抽樣或系統(tǒng)抽 樣 5、18題 1 老 師 在 班 級50名 學(xué) 生 中 , 依 次 抽 取 學(xué) 號 為 5,10,15,20,25,30,35,40,45,50的學(xué)生進(jìn)行作業(yè)檢查,這種抽樣方 法是( ) A隨機(jī)抽樣 B分層抽樣 C系統(tǒng)抽樣 D以上都不是 解析 因?yàn)樗槿W(xué)生的學(xué)號成等差數(shù)列,即為等距離抽樣, 屬于系統(tǒng)抽樣 答案 C 2將一個總體分為 A、B、C 三層,其個體數(shù)之比為532, 若用分層抽樣方法抽取容量為100 的樣本,則應(yīng)從C 中抽取 _ 個個體 解析 由各 個 個體 數(shù) 之

5、比 可 得, C 中 應(yīng)當(dāng) 抽 取的 個 數(shù)為 100 2 532 20(個) 答案 20 2、用樣本估計(jì)總體 【考查重點(diǎn)】 1考查樣本的頻率分布(分布表、直方圖、莖葉圖)中的有關(guān)計(jì) 算,樣本特征數(shù)(眾數(shù)、中位數(shù)、平均數(shù)、標(biāo)準(zhǔn)差 )的計(jì)算主 要以選擇題、填空題為主 2考查以樣本的分布估計(jì)總體的分布 (以樣本的頻率估計(jì)總體 的頻率、以樣本的特征數(shù)估計(jì)總體的特征數(shù) ) 1頻率分布直方圖 (2)作頻率分布直方圖的步驟 求極差(即一組數(shù)據(jù)中最大值與最小值的差) 決定 與 將數(shù)據(jù)分組 列頻率分布表 畫頻率分布直方圖 (3)在頻率分布直方圖中,縱軸表示 頻率 組距,數(shù)據(jù)落在各小組內(nèi)的 頻率用 表示各小長方

6、形的面積總和等 于 1. 組距 組數(shù) 各小長方形的面積 2頻率分布折線圖和總體密度曲線 (1)頻率分布折線圖:連接頻率分布直方圖中各小長方形上端 的 ,就得頻率分布折線圖 (2)總體密度曲線:隨著樣本容量的增加,作圖時所分組數(shù)增 加, 減小,相應(yīng)的頻率折線圖會越來越接近于一條光滑 曲線,即總體密度曲線 中點(diǎn) 組距 3、莖葉圖、莖葉圖 莖葉圖的優(yōu)點(diǎn) 用莖葉圖表示數(shù)據(jù)有兩個突出的優(yōu)點(diǎn): 一是統(tǒng)計(jì)圖上沒有原始數(shù)據(jù)信息的損失,所有數(shù)據(jù)信息都可以 從莖葉圖中得到; 二是莖葉圖中的數(shù)據(jù)可以隨時記錄,隨時添加,方便記錄與表 示 4樣本方差與標(biāo)準(zhǔn)差 設(shè)樣本的元素為x1,x2,xn,樣本的平均數(shù)為x, (1)樣

7、本方差:s21 n (x 1x) 2(x 2x) 2(x nx) 2 (2)樣本標(biāo)準(zhǔn)差: s 1 n?x 1x? 2?x 2x? 2?x nx? 2. 兩個異同 (1)眾數(shù)、中位數(shù)與平均數(shù)的異同 眾數(shù)、中位數(shù)及平均數(shù)都是描述一組數(shù)據(jù)集中趨勢的量,平 均數(shù)是最重要的量 由于平均數(shù)與每一個樣本數(shù)據(jù)有關(guān),所以,任何一個樣本數(shù) 據(jù)的改變都會引起平均數(shù)的改變,這是中位數(shù)、眾數(shù)都不具有 的性質(zhì). 眾數(shù)考查各數(shù)據(jù)出現(xiàn)的頻率,其大小只與這組數(shù)據(jù)中的部分 數(shù)據(jù)有關(guān)當(dāng)一組數(shù)據(jù)中有不少數(shù)據(jù)多次重復(fù)出現(xiàn)時,其眾數(shù) 往往更能反映問題 某些數(shù)據(jù)的變動對中位數(shù)可能沒有影響中位數(shù)可能出現(xiàn)在 所給數(shù)據(jù)中,也可能不在所給數(shù)據(jù)中當(dāng)

8、一組數(shù)據(jù)中的個別數(shù) 據(jù)變動較大時,可用中位數(shù)描述其集中趨勢 (2)標(biāo)準(zhǔn)差與方差的異同 標(biāo)準(zhǔn)差、方差描述了一組數(shù)據(jù)圍繞平均數(shù)波動的大小標(biāo)準(zhǔn) 差、方差越大,數(shù)據(jù)的離散程度就越大;標(biāo)準(zhǔn)差、方差越小, 數(shù)據(jù)的離散程度則越小,因?yàn)榉讲钆c原始數(shù)據(jù)的單位不同,且 平方后可能夸大了偏差的程度,所以雖然方差與標(biāo)準(zhǔn)差在刻畫 樣本數(shù)據(jù)的分散程度上是一樣的,但在解決實(shí)際問題時,一般 多采用標(biāo)準(zhǔn)差 三個特征 利用頻率分布直方圖 估計(jì)樣本的數(shù)字特征: (1)中位數(shù):在頻率分布直方圖中,中位數(shù)左邊和右邊的直方圖 的面積相等,由此可以估計(jì)中位數(shù)值 (2)平均數(shù):平均數(shù)的估計(jì)值等于每個小矩形的面積乘以矩形底 邊中點(diǎn)橫坐標(biāo)之和

9、(3)眾數(shù):最高的矩形的中點(diǎn)的橫坐標(biāo) ? 6、7、8、9、24、27 3、變量間的相關(guān)關(guān)系 基礎(chǔ)梳理 1相關(guān)關(guān)系的分類 從散點(diǎn)圖上看,點(diǎn)散布在從左下角到右上角的區(qū)域內(nèi),對于兩 個變量的這種相關(guān)關(guān)系,我們將它稱為 ;點(diǎn)散布在從左 上角到右下角的區(qū)域內(nèi), 兩個變量的這種相關(guān)關(guān)系稱為 2線性相關(guān) 從散點(diǎn)圖上看,如果這些點(diǎn)從整體上看大致分布在一條直線附 近,則稱這兩個變量之間具有線性相關(guān)關(guān)系,這條直線 叫 正相關(guān) 負(fù)相關(guān) 回歸直線 3回歸方程 (1)最小二乘法:使得樣本數(shù)據(jù)的點(diǎn)到回歸直線的 最 小的方法叫最小二乘法 (2)回歸方程:兩個具有線性相關(guān)關(guān)系的變量的一組數(shù)據(jù): (x1,y1),(x2,y2)

10、,(xn,yn),其回歸方程為y bxa,則 其中,b 是回歸方程的 ,a 是在 y 軸上的截距 距離平方和 斜率 4樣本相關(guān)系數(shù) r ? i1 n ?xix? yiy? ? i1 n ?xix? 2 ? i1 n ?yiy? 2 ,用它來衡量兩個變量間的線 性相關(guān)關(guān)系 (1)當(dāng) r0 時,表明兩個變量 ; (2)當(dāng) r0 時,表明兩個變量 ; (3)r 的絕對值越接近 1,表明兩個變量的線性相關(guān)性 ;r 的絕對值越接近于 0,表明兩個變量之間幾乎不存在線性相關(guān) 關(guān)系 通常當(dāng)|r|0.8 時, 認(rèn)為兩個變量有很強(qiáng)的線性相關(guān)關(guān)系 正相關(guān) 負(fù)相關(guān) 越強(qiáng) 5線性回歸模型 (1)ybxae 中,a、b

11、 稱為模型的未知參數(shù); e 稱為隨機(jī)誤 差 (2)相關(guān)指數(shù) 用相關(guān)指數(shù) R 2 來刻畫回歸的效果,其計(jì)算公式是: R2的值越大,說明殘差平方和越小,也就是說模型的擬合效 果 在線性回歸模型中, R 2 表示解釋變量對預(yù)報變量變化 的貢獻(xiàn)率,R2越接近于 1,表示回歸效果越好 越好 ? ? ? ? ? ? ? n i ii n i ii yy yy R 1 2 _ 1 2 2 )( )( 1 6獨(dú)立性檢驗(yàn) (1)用變量的不同“值”表示個體所屬的不同類別,這種變量 稱為分類變量例如:是否吸煙,宗教信仰,國籍等 (2)列出的兩個分類變量的頻數(shù)表,稱為列聯(lián)表 (3)一般地,假設(shè)有兩個分類變量 X和Y,

12、它們的值域分別為 x1,x2和y1,y2,其樣本頻數(shù)列聯(lián)表 (稱為22列聯(lián)表)為: 22 列聯(lián)表 y1 y2 總計(jì) x1 a b ab x2 c d cd 總計(jì) ac bd abcd K2 n?adbc? 2 ?ab?ac?cd?bd?(其中 nabcd 為樣本容 量),可利用獨(dú)立性檢驗(yàn)判斷表來判斷“x 與 y 的關(guān)系” 這種利用隨機(jī)變量K2來確定在多大程度上可以認(rèn)為“兩個分類 變量有關(guān)系”的方法稱為兩個分類變量的獨(dú)立性檢驗(yàn) P(K K2 2k0) 0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001 k0 0.455 0.708 1.32

13、3 2.072 2.706 3.841 5.024 6.635 7.879 10.828 4、隨機(jī)事件的概率 基礎(chǔ)梳理 1隨機(jī)事件和確定事件 (1)在條件 S 下,一定會發(fā)生的事件叫做相對于條件 S 的 (2)在條件 S 下,一定不會發(fā)生的事件叫做相對于條件 S 的 (3) 統(tǒng)稱為確定事件 (4) 的事件,叫做隨機(jī)事件 (5) 和 統(tǒng)稱為事件,一般用大寫字母 A,B, C表示 必然事件 不可能事件 必然事件與不可能事件 在條件S下可能發(fā)生也可能不發(fā)生 確定事件 隨機(jī)事件 2頻率與概率 (1)在相同的條件S下重復(fù)n次試驗(yàn),觀察某一事件A是否出現(xiàn), 稱n次試驗(yàn)中事件A出現(xiàn)的次數(shù)nA為事件A出現(xiàn)的頻

14、數(shù),稱事件 A出現(xiàn)的比例fn(A)nA n 為事件A出現(xiàn)的頻率 (2)對于給定的隨機(jī)事件A,如果隨著試驗(yàn)次數(shù)的增加,事件 A 發(fā)生的 fn(A)穩(wěn)定在某個 上,把這個 記作P(A), 稱為事件A的概率,簡稱為A的概率 頻率 常數(shù) 常數(shù) 3互斥事件與對立事件 (1)互斥事件:若AB為不可能事件(AB?),則稱事件A與 事件B互斥,其含義是:事件A與事件B在任何一次試驗(yàn)中不會 同時發(fā)生 (2)對立事件:若AB為不可能事件,而AB為必然事件,那 么事件A與事件B互為對立事件,其含義是:事件 A與事件B在 任何一次試驗(yàn)中有且僅有一個發(fā)生 0P(A)1 P(A)P(B) P(A 1)P(A2)P(An)

15、 1P(A) 一條規(guī)律 互斥事件與對立事件都是兩個事件的關(guān)系,互斥事件是不可能 同時發(fā)生的兩個事件,而對立事件除要求這兩個事件不同時發(fā) 生外,還要求二者之一必須有一個發(fā)生,因此,對立事件是互 斥事件的特殊情況,而互斥事件未必是對立事件 兩種方法 求復(fù)雜的互斥事件的概率一般有兩種方法: (1)直接法:將所求事件的概率分解為一些彼此互斥的事件的 概率的和,運(yùn)用互斥事件的求和公式計(jì)算; (2)間接法:先求此事件的對立事件的概率,再用公式 P(A)1 P( A),即運(yùn)用逆向思維(正難則反),特別是“至多”、“至 少”型題目,用方法二就顯得比較簡便 ? 10、11、12、13、14、25、26 ? 1、

16、2、3、4 5、 古典概型 基礎(chǔ)梳理 1基本事件的特點(diǎn) (1)任何兩個基本事件是 的 (2)任何事件(除不可能事件)都可以表示成基本事件的和 互斥 2古典概型 具有以下兩個特點(diǎn)的概率模型稱為古典概率模型,簡稱古典概 型 (1)試驗(yàn)中所有可能出現(xiàn)的基本事件 (2)每個基本事件出現(xiàn)的可能性 3古典概型的概率公式 P(A)A包含的基本事件的個數(shù) 基本事件的總數(shù) . 只有有限個 相等 【試一試】 從含有兩件正品和一件次品的 3件產(chǎn)品中每次任取 一件 (1)每次取出后不放回,連續(xù)取兩次; (2)每次取出后放回,連續(xù)取兩次 試分別求取出的兩件產(chǎn)品中恰有一件次品的概率 嘗試解答 (1)用a1,a2和b1表示

17、兩件正品和一件次品,則不 放回地抽取兩次,其一切可能的結(jié)果為: (a1,a2),(a1,b1), (a2,a1),(a2,b1),(b1,a1),(b1,a2) 其中小括號內(nèi)左邊的字母表示第一次取出的產(chǎn)品,右邊的字母 表示第二次取出的產(chǎn)品,用A表示“取出的兩件產(chǎn)品中,恰好 有一件次品”這一事件,則A所含的結(jié)果為(a1,b1),(a2, b1),(b1,a1),(b1,a2),即基本事件的總數(shù)n6,事件A包含 的事件總數(shù)m4.故P(A)4 6 2 3. (2)若為有放回的抽取,其基本事件包含的結(jié)果共有 (a1,a1), (a1,a2),(a1,b1),(a2,a1),(a2,a2),(a2,b1),(b1,a1), (b1,a2),(b1,b1),用B表示“恰有一件產(chǎn)品為次品”這一事 件,則

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論