版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
2.2.1用樣本的頻率分布估計總體分布頻率分布的表示形式有:①樣本頻率分布表②樣本頻率分布圖樣本頻率分布條形圖樣本頻率分布直方圖③樣本頻率分布折線圖
1、初中時我們學(xué)習(xí)過樣本的頻率分布,包括頻數(shù)、頻率的概念,頻數(shù)分布表和頻數(shù)分布直方圖的制作。例1.
為檢測某種產(chǎn)品的質(zhì)量,抽取了一個容量為30的樣本,檢測結(jié)果為一級品5件,二級品8件,三級品13件,次品4件.(1)列出樣本的頻率分布表;(2)畫出表示樣本頻率分布的條形圖;(3)根據(jù)上述結(jié)果,估計此種產(chǎn)品為二級品或三級品的概率約是多少.
解:(1)樣本的頻率分布表為:
0.134次品0.4313三級品0.278二級品0.175一級品頻率頻數(shù)產(chǎn)品解:(2)樣本頻率分布的條形圖為:
0.10.20.30.40.50.60.7一級品二級品產(chǎn)品頻率三級品次品(3)此種產(chǎn)品為二級品或三級品的概率約為0.27+0.43=0.7.
知識探究(一):頻率分布表【問題】
我國是世界上嚴(yán)重缺水的國家之一,城市缺水問題較為突出,某市政府為了節(jié)約生活用水,計劃在本市試行居民生活用水定額管理,即確定一個居民月用水量標(biāo)準(zhǔn)a,用水量不超過a的部分按平價收費,超出a的部分按議價收費.通過抽樣調(diào)查,獲得100位居民2007年的月均用水量如下表(單位:t):3.12.52.02.01.51.01.61.81.91.63.42.62.22.21.51.20.20.40.30.43.22.72.32.11.61.23.71.50.53.83.32.82.32.21.71.33.61.70.64.13.22.92.42.31.81.43.51.90.84.33.02.92.42.41.91.31.41.80.72.02.52.82.32.31.81.31.31.60.92.32.62.72.42.11.71.41.21.50.52.42.52.62.32.11.61.01.01.70.82.42.82.52.22.01.51.01.21.80.62.2顯然:這里的總體可以在一個實數(shù)區(qū)間取值,稱為連續(xù)型總體。樣本的頻率分布表示形式有:
頻率分布表和頻率分布直方圖1.極差:樣本數(shù)據(jù)中的最大值和最小值的差稱為極差2.確定組距,組數(shù):.如果將上述100個數(shù)據(jù)按組距為0.5進行分組,那么這些數(shù)據(jù)共分為多少組?0.2~4.3(4.3-0.2)÷0.5=8.2
3將數(shù)據(jù)分組,決定分點:以組距為0.5進行分組,上述100個數(shù)據(jù)共分為9組,各組數(shù)據(jù)的取值范圍可以如何設(shè)定?4畫頻率分布表:如何統(tǒng)計上述100個數(shù)據(jù)在各組中的頻數(shù)?如何計算樣本數(shù)據(jù)在各組中的頻率?你能將這些數(shù)據(jù)用表格反映出來嗎?[0,0.5),[0.5,1),[1,1.5),…,[4,4.5].
分組頻數(shù)累計頻數(shù)頻率
[0,0.5)40.04[0.5,1)正80.08[1,1.5)正正正150.15[1.5,2)正正正正220.22[2,2.5)正正正正正250.25[2.5,3)正正140.14[3,3.5)正一60.06[3.5,4)40.04[4,4.5]20.02
合計1001.00頻率分布表:知識探究(二):頻率分布直方圖5畫頻率分布直方圖為了直觀反映樣本數(shù)據(jù)在各組中的分布情況,我們將上述頻率分布表中的有關(guān)信息用下面的圖形表示:月均用水量/t頻率組距0.50.40.30.20.10.511.522.533.544.5O上圖稱為頻率分布直方圖,其中橫軸表示月均用水量,縱軸表示頻率/組距.頻率分布直方圖中各小長方形的寬度和高度在數(shù)量上有何特點?月均用水量/t頻率組距0.50.40.30.20.10.511.522.533.544.5O寬度:組距高度:頻率組距2圖形的意義圖形的意義:頻率分布直方圖中各小長方形的面積表示什么?各小長方形的面積之和為多少?各小長方形的面積=頻率各小長方形的面積之和=1月均用水量/t頻率組距0.50.40.30.20.10.511.522.533.544.5O寬度:組距高度:頻率組距3分析例題:你能根據(jù)上述頻率分布直方圖指出居民月均用水量的一些數(shù)據(jù)特點嗎?月均用水量/t頻率組距0.50.40.30.20.10.511.522.533.544.5O(1)居民月均用水量的分布是“山峰”狀的,而且是“單峰”的;(2)大部分居民的月均用水量集中在一個中間值附近,只有少數(shù)居民的月均用水量很多或很少;(3)居民月均用水量的分布有一定的對稱性等.月均用水量/t頻率組距0.50.40.30.20.10.511.522.533.544.5O思考:對一組給定的樣本數(shù)據(jù),頻率分布直方圖的外觀形狀與哪些因素有關(guān)?在居民月均用水量樣本中,你能以1為組距畫頻率分布直方圖嗎?
與分組數(shù)(或組距)及坐標(biāo)系的單位長度有關(guān).月均用水量/t頻率組距0.40.30.20.112345
O1、求極差(即一組數(shù)據(jù)中最大值與最小值的差)
知道這組數(shù)據(jù)的變動范圍4.3-0.2=4.12、決定組距與組數(shù)(將數(shù)據(jù)分組)3、將數(shù)據(jù)分組(8.2取整,分為9組)畫頻率分布直方圖的步驟4、列出頻率分布表.(填寫頻率/組距一欄)5、畫出頻率分布直方圖。組距:指每個小組的兩個端點的距離組數(shù):將數(shù)據(jù)分組,當(dāng)數(shù)據(jù)在100個以內(nèi)時,按數(shù)據(jù)多少常分5-12組。頻率分布的條形圖和頻率分布直方圖的區(qū)別兩者是不同的概念;橫軸:兩者表示內(nèi)容相同思考:頻率分布條形圖和頻率分布直方圖是兩個相同的概念嗎?有什么區(qū)別?縱軸:兩者表示的內(nèi)容不相同頻率分布條形圖的縱軸(長方形的高)表示頻率頻率分布直方圖的縱軸(長方形的高)表示頻率與組距的比值,其相應(yīng)組距上的頻率等于該組距上長方形的面積。頻率分布直方圖如下:月均用水量/t頻率組距0.100.200.300.400.500.511.522.533.544.5連接頻率分布直方圖中各小長方形上端的中點,得到頻率分布折線圖利用樣本頻分布對總體分布進行相應(yīng)估計(2)樣本容量越大,這種估計越精確。(1)上例的樣本容量為100,如果增至1000,其頻率分布直方圖的情況會有什么變化?假如增至10000呢?總體密度曲線頻率組距月均用水量/tab(圖中陰影部分的面積,表示總體在某個區(qū)間(a,b)內(nèi)取值的百分比)。當(dāng)樣本容量無限增大,分組的組距無限縮小,那么頻率分布折線圖就會無限接近一條光滑曲線——總體密度曲線.總體密度曲線
用樣本分布直方圖去估計相應(yīng)的總體分布時,一般樣本容量越大,頻率分布直方圖就會無限接近總體密度曲線,就越精確地反映了總體的分布規(guī)律,即越精確地反映了總體在各個范圍內(nèi)取值百分比。
總體密度曲線反映了總體在各個范圍內(nèi)取值的百分比,精確地反映了總體的分布規(guī)律。是研究總體分布的工具.總體密度曲線莖葉圖某賽季甲、乙兩名籃球運動員每場比賽得分的原始記錄如下:(1)甲運動員得分:13,51,23,8,26,38,16,33,14,28,39(2)乙運動員得分:
49,24,12,31,50,31,44,36,15,37,25,36,39
甲乙
804631253682543893161679449150注:中間的數(shù)字表示得分的十位數(shù)字。
旁邊的數(shù)字分別表示兩個人得分的個位數(shù)。莖葉圖當(dāng)樣本數(shù)據(jù)較少時,用莖葉圖表示數(shù)據(jù)的效果較好,它不但可以保留所有的信息,而且可以隨時記錄,給數(shù)據(jù)的記錄和表示都方便。練習(xí):某中學(xué)高一(2)班甲,乙兩名同學(xué)自高中以來每場數(shù)學(xué)考試成績情況如下:甲的得分:95,81,75,91,86,89,71,65,76,88,94乙的得分:83,86,93,99,88,96,98,98,79,85,97畫出兩人數(shù)學(xué)成績莖葉圖,請根據(jù)莖葉圖對兩人的成績進行比較。
小結(jié)圖形優(yōu)點缺點頻率分布1)易表示大量數(shù)據(jù)丟失一些直方圖
2)直觀地表明分布地情況信息
1)無信息損失只能處理樣本莖頁圖
2)隨時記錄方便記錄和表示容量較小數(shù)據(jù)課堂小結(jié)表示樣本分布的方法:(1)頻率分布表(2)頻率分布圖(包括直方圖和條形圖)(3)頻率分布折線圖(4)莖葉圖一眾數(shù)、中位數(shù)、平均數(shù)的概念中位數(shù):將一組數(shù)據(jù)按大小依次排列,把處在最中間位置的一個數(shù)據(jù)(或最中間兩個數(shù)據(jù)的平均數(shù))叫做這組數(shù)據(jù)的中位數(shù).
眾數(shù):在一組數(shù)據(jù)中,出現(xiàn)次數(shù)最多的數(shù)據(jù)叫做這組數(shù)據(jù)的眾數(shù).
平均數(shù):一組數(shù)據(jù)的算術(shù)平均數(shù),即
問題1:眾數(shù)、中位數(shù)、平均數(shù)這三個數(shù)一般都會來自于同一個總體或樣本,它們能表明總體或樣本的什么性質(zhì)?平均數(shù):反映所有數(shù)據(jù)的平均水平
眾數(shù):反映的往往是局部較集中的數(shù)據(jù)信息
中位數(shù):是位置型數(shù),反映處于中間部位的數(shù)據(jù)信息
1、求下列各組數(shù)據(jù)的眾數(shù)(1)、1,2,3,3,3,5,5,8,8,8,9,9眾數(shù)是:3和8(2)、1,2,3,3,3,5,5,8,8,9,9眾數(shù)是:32、求下列各組數(shù)據(jù)的中位數(shù)(1)、1,2,3,3,3,4,6,8,8,8,9,9(2)1,2,3,3,3,4,8,8,8,9,9中位數(shù)是:5中位數(shù)是:4
3、在一次中學(xué)生田徑運動會上,參加男子跳高的17名運動員的成績?nèi)缦卤硭荆撼煽?米)1.501.601.651.701.751.801.851.90人數(shù)23234111分別求這些運動員成績的眾數(shù),中位數(shù)與平均數(shù)。解:在17個數(shù)據(jù)中,1.75出現(xiàn)了4次,出現(xiàn)的次數(shù)最多,即這組數(shù)據(jù)的眾數(shù)是1.75.上面表里的17個數(shù)據(jù)可看成是按從小到大的順序排列的,其中第9個數(shù)據(jù)1.70是最中間的一個數(shù)據(jù),即這組數(shù)據(jù)的中位數(shù)是1.70;
答:17名運動員成績的眾數(shù)、中位數(shù)、平均數(shù)依次是1.75(米)、1.70(米)、1.69(米)。
這組數(shù)據(jù)的平均數(shù)是二、眾數(shù)、中位數(shù)、平均數(shù)與頻率分布直方圖的關(guān)系頻率組距0.10.20.30.40.5O0.511.522.533.544.5月平均用水量(t)
眾數(shù)在樣本數(shù)據(jù)的頻率分布直方圖中,就是最高矩形的中點的橫坐標(biāo)。如何在頻率分布直方圖中估計眾數(shù)可將眾數(shù)看作直方圖中面積最大長方形的“中心”0.52.521.5143.534.5頻率組距0.040.080.150.220.250.140.060.040.02前四個小矩形的面積和=0.49后四個小矩形的面積和=0.262.02如何在頻率分布直方圖中估計中位數(shù)分組[0,0.5)[0.5,1)[1,1.5)[1.5,2)[2,2.5)[2.5,3)[3,3.5)[3.5,4)[4,4.5]合計頻率0.040.080.150.220.250.140.060.040.021在樣本中中位數(shù)的左右各有50%的樣本數(shù),條形面積各為0.5,所以反映在直方圖中位數(shù)左右的面積相等.,中位數(shù))可將中位數(shù)看作整個直方圖面積的“中心”思考討論以下問題:1、2.02這個中位數(shù)的估計值,與樣本的中位數(shù)值2.0不一樣,你能解釋其中原因嗎?答:2.02這個中位數(shù)的估計值,與樣本的中位數(shù)值2.0不一樣,這是因為樣本數(shù)據(jù)的頻率分布直方圖,只是直觀地表明分布的形狀,但是從直方圖本身得不出原始的數(shù)據(jù)內(nèi)容,直方圖已經(jīng)損失一些樣本信息。所以由頻率分布直方圖得到的中位數(shù)估計值往往與樣本的實際中位數(shù)值不一致.如何在頻率分布直方圖中估計平均數(shù)=2.02=2.02平均數(shù)的估計值等于頻率分布直方圖中每個小矩形的面積乘以小矩形底邊中點的橫坐標(biāo)之和??蓪⑵骄鶖?shù)看作整個直方圖面積的“重心”
思考討論以下問題:2、樣本中位數(shù)不受少數(shù)極端值的影響,這在某些情況下是一個優(yōu)點,但它對極端值的不敏感有時也會成為缺點。你能舉例說明嗎?答:優(yōu)點:對極端數(shù)據(jù)不敏感的方法能夠有效地預(yù)防錯誤數(shù)據(jù)的影響。對極端值不敏感有利的例子:例如當(dāng)樣本數(shù)據(jù)質(zhì)量比較差,即存在一些錯誤數(shù)據(jù)(如數(shù)據(jù)錄入錯誤、測量錯誤等)時,用抗極端數(shù)據(jù)強的中位數(shù)表示數(shù)據(jù)的中心值更準(zhǔn)確。缺點:(1)出現(xiàn)錯誤的數(shù)據(jù)也不知道;(2)對極端值不敏感有弊的例子:某人具有初級計算機專業(yè)技術(shù)水平,想找一份收入好的工作。這時如果采用各個公司計算機專業(yè)技術(shù)人員收入的中位數(shù)作為選擇工作的參考指標(biāo)就會冒這樣的風(fēng)險:很可能所選擇公司的初級計算機專業(yè)技術(shù)水平人員的收入很低,其原因是中位數(shù)對極小的數(shù)據(jù)不敏感。這里更好的方法是同時用平均工資和中位數(shù)作為參考指標(biāo),選擇平均工資較高且中位數(shù)較大的公司就業(yè).例1、下表是七位評委給某參賽選手的打分,總分為10分,你認(rèn)為如何計算這位選手的最后得分才較為合理?評委1號2號3號4號5號6號7號
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 《聊聊品牌那些事》課件
- 《視頻監(jiān)控學(xué)習(xí)資料》課件
- 協(xié)調(diào)科護士工作總結(jié)
- 家居裝飾行業(yè)行政后勤工作總結(jié)
- 銀行行業(yè)保安工作總結(jié)
- 黑龍江省哈爾濱市平房區(qū)2023-2024學(xué)年九年級上學(xué)期期末調(diào)研測試化學(xué)試卷
- 財務(wù)工作項目落實總結(jié)
- 旅游接待員工作總結(jié)
- 溫泉景區(qū)服務(wù)員工作總結(jié)
- 《清華土力學(xué)》課件
- 2025年濟南鐵路局招聘筆試參考題庫含答案解析
- 2025年心內(nèi)科工作計劃
- 質(zhì)量是生產(chǎn)出來課件
- 2024-2025學(xué)年人教版七年級數(shù)學(xué)上冊期末模擬測試卷(含簡單答案)
- 2024-2030年中國家用小家電項目可行性研究報告
- 監(jiān)理對進度控制的目標(biāo)及方法措施
- 2024年內(nèi)科醫(yī)生年終工作總結(jié)參考(2篇)
- xx單位政務(wù)云商用密碼應(yīng)用方案V2.0
- 湖南省懷化市2023-2024學(xué)年七年級上學(xué)期語文期末試卷(含答案)
- 《廊坊市綠色建筑專項規(guī)劃(2020-2025)》
- 2024-2030年中國濕巾行業(yè)發(fā)展趨勢及競爭策略分析報告
評論
0/150
提交評論