隨機抽樣與正態(tài)分布.ppt_第1頁
隨機抽樣與正態(tài)分布.ppt_第2頁
隨機抽樣與正態(tài)分布.ppt_第3頁
隨機抽樣與正態(tài)分布.ppt_第4頁
隨機抽樣與正態(tài)分布.ppt_第5頁
已閱讀5頁,還剩23頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、1.了解分布的意義和作用,會列頻率分布表,會畫頻率分布直方圖、頻率折線圖、莖葉圖,理解它們各自的特點. 2.理解樣本數據標準差的意義和作用,會計算數據標準差. 3.能從樣本數據中提取基本的數字特征(如平均數、標準差),并做出合理的解釋.,4.會用樣本的頻率分布估計總體分布,會用樣本的基本數字特征估計總體的基本數字特征,理解用樣本估計總體的思想. 5.會用隨機抽樣的基本方法和樣本估計總體的思想,解決一些簡單的實際問題. 6.通過實際問題,借助直觀(如實際問題的直方圖),認識正態(tài)分布曲線的特點及曲線所表示的意義.,1.某初級中學共有30個班,其中初一有12個班,初二有12個班,初三有6個班.現從中

2、抽出5個班進行調查,則應在初三6個班中抽取 個班.,1,2.把數據x1,x2,xn分成若干組,已知某數xi的頻數和頻率分別為4和0.125,則n的值是( ),C,A.16 B.24 C.32 D.64,3.數據5,10,73,1,3,105,111的中位數與極差的差為 .,-100,因為中位數是10,極差是111-1=110,故所求的值為10-110=-100.,4.將一組數據同時減去3.1,得到一組新數據,若原數據的平均數、方差分別為s2,則新數據的平均數是 ,方差是 .,-3.1,s2,設= (x1+x2+xn), 則 = (x1-3.1)+(x2-3.1)+(xn-3.1) =-3.1.

3、 s2= (xi- )2 = (xi-3.1)-(-3.1)2 = (xi- )2=s2.,1.數據的基本數字特征 (1)平均數:一組數據的平均數,記為.設有n個數據x1,x2,xn,則平均數為 = . (2)中位數:一組數據按照從小到大或從大到小的順序進行排列時,處于中間位置的數.當這組數據的個數為奇數時,中位數為中間一個數;當這組數據的個數為偶數時,中位數為中間的兩個數的平均數.,(3)眾數:一組數據中出現次數最多的數. (4)極差:一組數據中最大數與最小數的差. (5)方差:一組數據中所有數與平均數的差的平方和的平均數,記為s2, 即s2= . (6)標準差:方差的算術平方根,記作s.

4、2.主要統(tǒng)計圖表 (1)基本統(tǒng)計圖表:象形、條形、折線、扇形統(tǒng)計圖.,(2)頻率分布直方圖的畫圖步驟: ()求極差;()決定組距與組數;()將數據分組;()列頻率分布表;()畫頻率分布直方圖(以頻率組距為縱坐標). (3)頻率分布折線圖:連接頻率分布直方圖中各小長方形上端的中點所得的折線. (4)總體密度曲線:隨著樣本容量的增加,作頻率分布折線圖時所分的組數增加,組距減小,相應的頻率折線圖會越來越接近于一條光滑曲線,則稱這條光滑曲線為總體密度曲線.,(5)莖葉圖:中間的數字表示數據的十位數字,旁邊的數字分別表示兩組數據中各個數據的個位數字. 3.抽樣方法 (1)簡單隨機抽樣:從含有N個個體的總

5、體中逐個不放回地抽取n個個體作為樣本(nN),如果每次抽取時總體內的各個個體被抽到的機會都相等,就把這種抽樣方法叫做 .有兩種常用方法:,簡單隨機抽樣,() :就是把總體中的N個個體編號,把號碼寫在號簽上,將號簽放在一個容器中,攪拌均勻后,每次從中取出一個號簽,連續(xù)抽取n次,就得到一個容量為n的樣本. () :利用隨機數表、隨機數骰子或計算機產生的隨機數進行抽樣. (2)系統(tǒng)抽樣:按下列步驟進行抽樣: ()先將總體的N個個體編號;()確定分段間隔k,對編號進行分段;()在第1段用簡單隨機抽樣確定第一個個體編號l(lk);()按照一定的規(guī)則抽取樣本.,抽簽法,隨機數表法,(3)分層抽樣:即 .

6、. . .,在抽樣時,將總體分成,互不交叉的層,然后按照一定的比例,從各層,獨立地抽出一定數量的個體,將各層取出的,個體合在一起作為樣本,題型一 抽樣方法,例1,在我國東南沿海有60個人均GDP在3萬元以上的城市,其中人均GDP在34萬元之間的有36個,在45萬元之間的有18個,在5萬元以上的有6個.國家環(huán)保總局欲用分層抽樣從中隨機抽取部分城市進行環(huán)境調查,若抽取的人均GDP在45萬元之間的城市個數為3,則抽取的人均GDP在34萬元之間的城市個數為.,根據分層抽樣的特征,在各層抽取的比例是相同的,故可先依據已知求出這個比例,再求解.,抽取的人均GDP在45萬元之間的城市的比例為 ,故抽取的人均

7、GDP在34萬元之間的城市的比例也是 ,則抽取的城市個數為36 .,分層抽樣在各層抽取樣本的比例是相等的,這是解決分層抽樣計算問題的主要依據.,題型二 頻率分布表與頻率分布直方圖,例2,在生產過程中,測得纖維產品的纖度(表示纖維粗細的一種量)共有100個數據,數據分組如下表,(1)完成頻率分布表,并在給定的坐標系中畫出頻率分布直方圖;,(2)估計纖度落在1.38,1.50)中的概率及纖度小于1.40的概率是多少? (3)統(tǒng)計方法中,同一組數據常用該組區(qū)間的中點值(例如區(qū)間1.30,1.34)的中點值是1.32)作為代表.據此,估計纖度的眾數,平均數,中位數.,(1)頻率分布表為:,(2)纖度落

8、在1.38,1.50)中的概率約為0.30+0.29+0.100.69,纖度小于1.40的概率約為0.04+0.25+120.300.44. (3)總體數據的平均數約為1.320.04+1.360.25+1.400.30+1.440.29+1.480.10+1.520.02=1.4088.,1.解答本題時,第(1)問首先需計算出每組的頻率(利用頻數100);第(2)問注意1.38,1.42)中既有小于1.40,又有大于1.40的,可以認為各一半;第(3)問先計算出中點的概率,然后根據平均數的定義求解. 2.本題主要考查頻率分布直方圖、頻率、期望等概念和用樣本頻率估計整體分布的統(tǒng)計方法,考查運用

9、概率、統(tǒng)計知識解決實際問題的能力.,題型三 樣本的數字特征估計總體,例3,對甲、乙兩名自行車賽手在相同條件下進行了6次測試,測得他們的最大速度(m/s)的數據如下表: (1)畫出莖葉圖,由莖葉圖你能獲得哪些信息? (2)分別求出甲、乙兩名自行車賽手最大速度(m/s)數據的平均數、中位數、標準差,并判斷選誰參加比賽更合適.,(1)畫莖葉圖,中間數為數據的十位數字: 從這個莖葉圖上可以看出,甲、乙的最大速度情況都是分布均勻的,只是乙更好一些;乙的中位數是33.5,甲的中位數是33.因此,乙發(fā)揮比較穩(wěn)定,總體情況比甲好. (2) =33, =33;s甲=3.96,s乙=3.56; 甲的中位數是33,乙的中位數是33.5. 綜合比較,選乙參加比賽較為合適.,1.統(tǒng)計的基本思想方法是用樣本估計總體,即用局部推斷整體,這就要求樣本應具有很好的代表性,而樣本良好客觀的代表性,完全依賴抽樣方法,弄清簡單隨機抽樣和分層抽樣的客觀合理性,從而會在不同的情況下采用適當的抽樣方法.掌握三種抽樣方法的抽樣步驟.,三種抽樣方法的比較:,2.頻率分布直方圖會使樣本的一些數字特征更明顯,繪制頻率分布直方圖時,要合理分組,以便使數據中的特征能更好地反映出來. 總體分布估計中,(1)先確定分組的組數,其方法是:最大數據與最小數據之差除組距得組數.(2)計算每

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論