用樣本的數(shù)字特征估計總體的數(shù)字特征1-精講版課件_第1頁
用樣本的數(shù)字特征估計總體的數(shù)字特征1-精講版課件_第2頁
用樣本的數(shù)字特征估計總體的數(shù)字特征1-精講版課件_第3頁
用樣本的數(shù)字特征估計總體的數(shù)字特征1-精講版課件_第4頁
用樣本的數(shù)字特征估計總體的數(shù)字特征1-精講版課件_第5頁
已閱讀5頁,還剩16頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

2.2.2用樣本的數(shù)字特征估計總體的數(shù)字特征(一)

一、眾數(shù)、中位數(shù)、平均數(shù)(1)眾數(shù):在樣本數(shù)據(jù)中,頻率分布最大值所對應的樣本數(shù)據(jù)或出現(xiàn)次數(shù)最多的那個數(shù)據(jù)。(2)中位數(shù):樣本數(shù)據(jù)中,累計頻率為0.5時所對應的樣本數(shù)據(jù)或將數(shù)據(jù)按大小排列,位于最中間的數(shù)據(jù)。(3)平均數(shù):樣本數(shù)據(jù)的算術平均數(shù),即例1.從某大型企業(yè)全體員工某月的月工資表中隨機抽取50名員工工資資料如下:

800800800800800100010001000100010001000100010001000100012001200120012001200120012001200120012001200120012001200120012001200120012001200150015001500150015001500150020002000200020002000250025002500計算這50個數(shù)據(jù)的眾數(shù)、中位數(shù)和平均數(shù),并估計這個企業(yè)員工的平均工資。解:眾數(shù)是1200,中位數(shù)是1200,平均數(shù)是這50個數(shù)值的和除以50得1320.

估計這個企業(yè)員工的平均工資是1320元.

所以用樣本的平均數(shù)估計總體的平均數(shù)是1320元。

同樣,再隨機抽取50名員工的工資,計算所得的樣本平均數(shù)一般會與例1中的樣本平均數(shù)不同。所以用樣本的平均數(shù)估計總體的平均數(shù)時,樣本的平均數(shù)只是總體的平均數(shù)的近似值。

下面我們用來看樣本平均數(shù)與樣本頻率直方圖的聯(lián)系。則有nx=x1+x2+……+xn.也就是把每個xi(i=1,2,3,…,n)都用x代替后,數(shù)據(jù)總和保持不變。

所以平均數(shù)x對數(shù)據(jù)有“取齊”的作用,代表一組數(shù)據(jù)的數(shù)值平均水平。

在頻率分布直方圖中,平均數(shù)是直方圖的平衡點,假設橫軸是一塊放置直方圖的蹺蹺板,則支點取在平均數(shù)處時蹺蹺板達到平衡。我們知道,n個樣本數(shù)據(jù)的平均數(shù)例2.某工廠人員及工資構成如下:人員經(jīng)理管理人員高級技工工人學徒合計周工資2200250220200100人數(shù)16510123合計22001500110020001006900(1)指出這個問題中的眾數(shù)、中位數(shù)、平均數(shù);(2)這個問題中,平均數(shù)能客觀地反映該工廠的工資水平嗎?為什么?解:(1)由表格可知:眾數(shù)為200,中位數(shù)為220。平均數(shù)為300(元/周)。(2)雖然平均數(shù)為300元/周,但由表格中所列出的數(shù)據(jù)可見,只有經(jīng)理在平均數(shù)以上,其余的人都在平均數(shù)以下,故用平均數(shù)不能客觀真實地反映該工廠的工資水平.三種數(shù)字特征的比較:(1)樣本眾數(shù)通常用來表示數(shù)據(jù)的中心值,容易計算,但是它只能表達樣本數(shù)據(jù)中的很少一部分信息,通常用于描述分離變量的中心位置;(2)中位數(shù)不受少數(shù)幾個極端數(shù)據(jù)的影響,容易計算,它僅利用了數(shù)據(jù)中排在中間的數(shù)據(jù)的信息。(3)平均數(shù)受樣本中的每一個數(shù)據(jù)的影響,“越離群”的數(shù)據(jù),對平均數(shù)的影響也越大,與眾數(shù)和中位數(shù)相比,平均數(shù)代表了數(shù)據(jù)更多的信息,當樣本數(shù)據(jù)質量比較差時,使用平均數(shù)描述數(shù)據(jù)的中心位置可能與實際情況產生較大的誤差。

在體育、文藝等各種比賽的評分中,使用的是平均數(shù)。計分過程中采用“去掉一個最高分,去掉一個最低分”的方法,就是為了防止個別裁判的人為因素給出過高或過低的分數(shù)對選手的得分造成較大的影響,從而降低誤差,盡量保證公平性。(4)如果樣本平均數(shù)大于樣本中位數(shù),說明數(shù)據(jù)中存在許多較大的極端值;反之,說明數(shù)據(jù)中存在許多較小的極端值。在實際應用中,如果同時知道樣本中位數(shù)和樣本平均數(shù),可以使我們了解樣本數(shù)據(jù)中極端數(shù)據(jù)的信息,幫助我們作出決策。例3.右面是某校學生日睡眠時間的抽樣頻率分布表(單位:h),試估計該校學生的日平均睡眠時間。睡眠時間人數(shù)頻率[6,6.5)50.05[6.5,7)170.17[7,7.5)330.33[7.5,8)370.37[8,8.5)60.06[8.5,9]20.021001解1:總睡眠時間約為6.25×5+6.75×17+7.25×33+7.75×37+8.25×6+8.75×2=739(h)

故平均睡眠時間約為7.39h解2:求各組中值與對應頻率之積的和,6.25×0.05+6.75×0.17+7.25×0.33+7.75×37+8.25×0.06+8.75×0.02=7.39(h)

估計該校學生的日平均睡眠時間約為7.39h例4.某單位年收入在10000到15000、15000到20000、20000到25000、25000到30000、30000到35000、35000到40000及40000到50000元之間的職工所占的比分別為10%,15%,20%,25%,15%,10%和5%,試估計該單位職工的平均年收入。解:估計該單位職工的平均年收入為12500×10%+17500×15%+22500×20%+27500×25%+32500×15%+37500×10%+45000×5%=26125(元)答:估計該單位人均年收入約為26125元.練習題:1.若M個數(shù)的平均數(shù)是x,N個數(shù)的平均

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論