用樣本的數(shù)字特征估計(jì)總體的數(shù)字特征.ppt_第1頁
用樣本的數(shù)字特征估計(jì)總體的數(shù)字特征.ppt_第2頁
用樣本的數(shù)字特征估計(jì)總體的數(shù)字特征.ppt_第3頁
用樣本的數(shù)字特征估計(jì)總體的數(shù)字特征.ppt_第4頁
用樣本的數(shù)字特征估計(jì)總體的數(shù)字特征.ppt_第5頁
已閱讀5頁,還剩47頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

用樣本的數(shù)字特征估計(jì)總體的數(shù)字特征,情境一:,某農(nóng)場種植了甲、乙兩種玉米苗,從中各抽取了10株,分別測得它們的株高如下(單位:厘米):,甲: 25 41 40 37 22 14 19 39 21 42,乙: 27 16 44 27 44 16 40 40 16 40,分析:,欲比較哪種玉米苗長得高,可以比較一下它們的平均高 !,反映了總體的 某種特征,總體特征數(shù),30,31,總體特征數(shù):,通常把能反映總體某種特征的量稱為總體特征數(shù),如何反映總體的特征數(shù)?,用樣本的特征數(shù)估計(jì)總體的特征數(shù)!,情境二:,在利用單擺檢驗(yàn)重力加速度的實(shí)驗(yàn)中,全班同學(xué)在相同的條件下進(jìn)行測試,得到下列數(shù)據(jù)(單位:m/s),9.62 9.54 9.78 9.94 10.01 9.66 9.88 9.68 10.32,9.76 9.45 9.99 9.81 9.56 9.78 9.72 9.93 9.94,9.65 9.79 9.42 9.68 9.70 9.84 9.90,怎樣利用這些數(shù)據(jù)對重力加速度進(jìn)行估計(jì)?,平均數(shù),為什么呢?,問題轉(zhuǎn)化為:,實(shí)驗(yàn)結(jié)果測得一組數(shù)據(jù)為,用 作為重力加速度“最理想的”近似值,依據(jù)是什么呢?,算術(shù)平均數(shù),=,=,讀作: 平均,處理實(shí)驗(yàn)數(shù)據(jù)的原則是使這個(gè)近似值與實(shí)驗(yàn)數(shù)據(jù)之間的離差(偏差)最小、設(shè)近似值為x,則它與n個(gè)實(shí)驗(yàn)值 ai(i1,2,3,n)的離差分別為 x-a1,x-a2,x-an,平均數(shù)最能代表一個(gè)樣本數(shù)據(jù)的集中趨勢,也就是說它與樣本數(shù)據(jù)的離差最小。,稱為這n個(gè)數(shù)的 平均數(shù)或者均值,一 眾數(shù)、中位數(shù)、平均數(shù)的概念,中數(shù):將一組數(shù)據(jù)按大小依次排列,把處在最中間位置的一個(gè)數(shù)據(jù)(或最中間兩個(gè)數(shù)據(jù)的平均數(shù))叫做這組數(shù)據(jù)的中位數(shù),眾數(shù):在一組數(shù)據(jù)中,出現(xiàn)次數(shù)最多的數(shù)據(jù)叫做這組數(shù)據(jù)的眾數(shù),眾數(shù)、中位數(shù)、平均數(shù)都是描述一組數(shù)據(jù)的集中趨勢的特征數(shù),只是描述的角度不同,其中以平均數(shù)的應(yīng)用最為廣泛.,注: 若有兩個(gè)或幾個(gè)數(shù)據(jù)出現(xiàn)的最多,且出現(xiàn)的次數(shù)一樣,這些數(shù)據(jù)都是這組數(shù)據(jù)的眾數(shù);若一組數(shù)據(jù)中,每個(gè)數(shù)據(jù)出現(xiàn)的次數(shù)一樣多,則認(rèn)為這組數(shù)據(jù)沒有眾數(shù)。 樣本數(shù)據(jù)不一定有眾數(shù),有眾數(shù)則不一定只有一個(gè),中位數(shù)怎么求?,1、求下列各組數(shù)據(jù)的眾數(shù),(1)、1 ,2,3,3,3,5,5,8,8,8,9,9,眾數(shù)是:3和8,(2)、1 ,2,3,3,3,5,5,8,8,9,9,眾數(shù)是:3,2、求下列各組數(shù)據(jù)的中位數(shù),(1)1 ,2,3,3,3,4,6,8,8,8,9,9,(2)1 ,2,3,3,3,4,8,8,8,9,9,中位數(shù)是:5,中位數(shù)是:4,平均數(shù): 一組數(shù)據(jù)的算術(shù)平均數(shù),即 x=,練習(xí): 在一次中學(xué)生田徑運(yùn)動(dòng)會(huì)上,參加男子跳高的17名運(yùn)動(dòng)員的成績?nèi)缦卤硭荆?分別求這些運(yùn)動(dòng)員成績的眾數(shù),中位數(shù)與平均數(shù),平均數(shù): 一組數(shù)據(jù)的算術(shù)平均數(shù),即 x=,解:在17個(gè)數(shù)據(jù)中,1.75出現(xiàn)了4次,出現(xiàn)的次數(shù)最多,即這組數(shù)據(jù)的眾數(shù)是1.75 上面表里的17個(gè)數(shù)據(jù)可看成是按從小到大的順序排列的,其中第9個(gè)數(shù)據(jù)1.70是最中間的一個(gè)數(shù)據(jù),即這組數(shù)據(jù)的中位數(shù)是1.70;,這組數(shù)據(jù)的平均數(shù)是,答:17名運(yùn)動(dòng)員成績的眾數(shù)、中位數(shù)、平均數(shù)依次是1.75(米)、1.70(米)、1.69(米).,加權(quán)平均值,(用頻率計(jì)算平均值),一般地,若取值為 , 出現(xiàn)的次數(shù)分別為 ,設(shè)頻率為,則其加權(quán)平均數(shù)為,其中,例3:由下表計(jì)算學(xué)生平均日睡眠時(shí)間,0.5,2.5,2,1.5,1,4,3.5,3,4.5,頻率 組距,思考:小長方形面積、對應(yīng)這個(gè)組的頻率、這個(gè)組占的比例的關(guān)系。,二 、 眾數(shù)、中位數(shù)、平均數(shù)與頻率分布直方圖的關(guān)系,1、眾數(shù)在樣本數(shù)據(jù)的頻率分布直方圖中,就是最高矩形的中點(diǎn)的橫坐標(biāo)。 例如,在上一節(jié)調(diào)查的100位居民的月均用水量的問題中,從這些樣本數(shù)據(jù)的頻率分布直方圖可以看出,月均用水量的眾數(shù)是2.25t.如圖所示:,0.5,2.5,2,1.5,1,4,3.5,3,4.5,頻率 組距,2.25,0.5,2.5,2,1.5,1,4,3.5,3,4.5,頻率 組距,0.04,0.08,0.15,0.22,0.25,0.14,0.06,0.04,0.02,提示:中位數(shù)左邊的數(shù)據(jù)個(gè)數(shù)與右邊的數(shù)據(jù)個(gè)數(shù)是相等的。,0.5,2.5,2,1.5,1,4,3.5,3,4.5,頻率 組距,0.04,0.08,0.15,0.22,0.25,0.14,0.06,0.04,0.02,前四個(gè)小矩形的面積和=0.49,后四個(gè)小矩形的面積和=0.26,2.02,歸納總結(jié)得: 在樣本中,有50的個(gè)體小于或等于中位數(shù),也有50的個(gè)體大于或等于中位數(shù),因此,在頻率分布直方圖中,中位數(shù)左邊和右邊的直方圖的面積應(yīng)該相等,由此可以估計(jì)中位數(shù)的值。在這個(gè)頻率分布直方圖中,左邊的直方圖的面積代表50個(gè)單位,右邊的直方圖也是代表50個(gè)單位,它們的分界線與x軸交點(diǎn)的橫坐標(biāo)就是中位數(shù)。中位數(shù)在樣本數(shù)據(jù)的頻率分布直方圖中,就是把頻率分布直方圖劃分左右兩個(gè)面積相等的分界線與x軸交點(diǎn)的橫坐標(biāo)。,思考討論以下問題: 1、2.02這個(gè)中位數(shù)的估計(jì)值,與樣本的中位數(shù)值2.0不一樣,你能解釋其中原因嗎?,答:2.02這個(gè)中位數(shù)的估計(jì)值,與樣本的中位數(shù)值2.0不一樣,這是因?yàn)闃颖緮?shù)據(jù)的頻率分布直方圖,只是直觀地表明分布的形狀,但是從直方圖本身得不出原始的數(shù)據(jù)內(nèi)容,直方圖已經(jīng)損失一些樣本信息。所以由頻率分布直方圖得到的中位數(shù)估計(jì)值往往與樣本的實(shí)際中位數(shù)值不一致.,0.5,2.5,2,1.5,1,4,3.5,3,4.5,頻率 組距,0.04,0.08,0.15,0.22,0.25,0.14,0.06,0.04,0.02,提示:在頻率分布直方圖中,各個(gè)組的平均數(shù)如何找?,0.5,2.5,2,1.5,1,4,3.5,3,4.5,頻率 組距,0.04,0.08,0.15,0.22,0.25,0.14,0.06,0.04,0.02,.,.,.,.,.,.,.,.,.,0.75,1.75,2.25,2.75,3.25,3.75,4.25,1.25,0.5,提示:與小長方形面積的比例有關(guān)嗎?,總結(jié)歸納得: 平均數(shù)是頻率分布直方圖的“重心”,是直方圖的平衡點(diǎn)。 先找出每個(gè)小長方形的“重心”,即每小組的平均數(shù),再按比例算出直方圖的平均數(shù)。 平均數(shù)在樣本數(shù)據(jù)的頻率分布直方圖中,等于頻率分布圖中每個(gè)小長方形面積乘以小矩形底邊中點(diǎn)的橫坐標(biāo)之和。,思考討論以下問題: 2、樣本中位數(shù)不受少數(shù)極端值的影響,這在某些情況下是一個(gè)優(yōu)點(diǎn),但它對極端值的不敏感有時(shí)也會(huì)成為缺點(diǎn)。你能舉例說明嗎?,答:優(yōu)點(diǎn):對極端數(shù)據(jù)不敏感的方法能夠有效地預(yù)防錯(cuò)誤數(shù)據(jù)的影響。 對極端值不敏感有利的例子:例如當(dāng)樣本數(shù)據(jù)質(zhì)量比較差,即存在一些錯(cuò)誤數(shù)據(jù)(如數(shù)據(jù)錄入錯(cuò)誤、測量錯(cuò)誤等)時(shí),用抗極端數(shù)據(jù)強(qiáng)的中位數(shù)表示數(shù)據(jù)的中心值更準(zhǔn)確。,三 三種數(shù)字特征的優(yōu)缺點(diǎn),1、眾數(shù)體現(xiàn)了樣本數(shù)據(jù)的最大集中點(diǎn),但它對其它數(shù)據(jù)信息的忽視使得無法客觀地反映總體特征.如上例中眾數(shù)是2.25t,它告訴我們,月均用水量為2.25t的居民數(shù)比月均用水量為其它數(shù)值的居民數(shù)多,但它并沒有告訴我們多多少.,2、中位數(shù)是樣本數(shù)據(jù)所占頻率的等分線,它不受少數(shù)幾個(gè)極端值的影響,這在某些情況下是優(yōu)點(diǎn),但它對極端值的不敏感有時(shí)也會(huì)成為缺點(diǎn)。如上例中假設(shè)有某一用戶月均用水量為10t,那么它所占頻率為0.01,幾乎不影響中位數(shù),但顯然這一極端值是不能忽視的。,3、由于平均數(shù)與每一個(gè)樣本的數(shù)據(jù)有關(guān),所以任何一個(gè)樣本數(shù)據(jù)的改變都會(huì)引起平均數(shù)的改變,這是眾數(shù)、中位數(shù)都不具有的性質(zhì)。也正因如此 ,與眾數(shù)、中位數(shù)比較起來,平均數(shù)可以反映出更多的關(guān)于樣本數(shù)據(jù)全體的信息,但平均數(shù)受數(shù)據(jù)中的極端值的影響較大,使平均數(shù)在估計(jì)時(shí)可靠性降低。,思考討論以下問題: 3、“用數(shù)據(jù)說話”,這是我們經(jīng)常聽到的一句話。但是,數(shù)據(jù)有時(shí)也會(huì)被利用,從而產(chǎn)生誤導(dǎo)。例如,一個(gè)企業(yè)中,絕大多數(shù)人是一線工人,他們的年收入可能是一萬元左右,另有一些經(jīng)理層次的人,年收入過到幾十萬元。這時(shí)年收入的平均數(shù)比中位數(shù)大得多。盡管這時(shí)的中位數(shù)比平均數(shù)更合理些,但是這個(gè)企業(yè)的老板到人力市場去招聘工人時(shí),也許更可能用平均數(shù)來回答有關(guān)工次待遇的指問。 你認(rèn)為“我們單位的收入水平比別的單位高”這句話應(yīng)當(dāng)怎么解釋?,答: 我認(rèn)為這句話是這樣解釋的:這個(gè)企業(yè)的老板以員工平均工資收入水平去描述他們單位的收入情況。我覺得這是不合理的,因?yàn)檫@些員工當(dāng)中,少數(shù)經(jīng)理層次的收入與大多數(shù)一般員工收入的差別比較大,所以平均數(shù)不能反映該單位員工的收入水平。這個(gè)老板的話有誤導(dǎo)與蒙騙行為。,課后練習(xí) 假設(shè)你是一名交通部門的工作人員,你打算向市長報(bào)告國家對本市26個(gè)公路項(xiàng)目投資的平均資金數(shù)額,其中一條新公路的建設(shè)投資為2000萬元人民幣,另外25個(gè)項(xiàng)目的投資是20100萬元。中位數(shù)是25萬元,平均數(shù)是100萬元,眾數(shù)是20萬元。你會(huì)選擇哪一種數(shù)據(jù)特征來表示國家對每一個(gè)項(xiàng)目投資的平均金額?你選擇這種數(shù)字特征的缺點(diǎn)是什么?,答: 這里應(yīng)該采用平均數(shù)來表示每一個(gè)國家項(xiàng)目的平均金額,因?yàn)檫@能反映所有項(xiàng)目的信息。但平均數(shù)會(huì)受到極端數(shù)據(jù)2000萬元的影響,所以大多數(shù)項(xiàng)目投資金額都和平均數(shù)相差比較大。,四 眾數(shù)、中位數(shù)、平均數(shù)的簡單應(yīng)用,例 某工廠人員及工資構(gòu)成如下:,(1)指出這個(gè)問題中周工資的眾數(shù)、中位數(shù)、平均數(shù),(2)這個(gè)問題中,工資的平均數(shù)能客觀地反映該廠的工資水平嗎?為什么?,分析:眾數(shù)為200,中位數(shù)為220,平均數(shù)為300。 因平均數(shù)為300,由表格中所列出的數(shù)據(jù)可見,只有經(jīng)理在平均數(shù)以上,其余的人都在平均數(shù)以下,故用平均數(shù)不能客觀真實(shí)地反映該工廠的工資水平。,標(biāo)準(zhǔn)差,平均數(shù)向我們提供了樣本數(shù)據(jù)的重要信息,但是平均有時(shí)也會(huì)使我們作出對總體的片面判斷因?yàn)檫@個(gè)平均數(shù)掩蓋了一些極端的情況,而這些極端情況顯然是不能忽的因此,只有平均數(shù)還難以概括樣本數(shù)據(jù)的實(shí)際狀態(tài),如:有兩位射擊運(yùn)動(dòng)員在一次射擊測試中各射靶10次,每次命中的環(huán)數(shù)如下:,甲: ,乙: ,如果你是教練,你應(yīng)當(dāng)如何對這次射擊作出評價(jià)?,如果看兩人本次射擊的平均成績,由于,兩人射擊 的平均成績是一樣的.那么兩個(gè)人的水平就沒有什么差異嗎?,2.標(biāo)準(zhǔn)差,4,5,6,7,8,9,10,環(huán)數(shù),頻率,0.1,0.2,0.3,(甲),4,5,6,7,8,9,10,0.1,0.2,0.3,0.4,環(huán)數(shù),頻率,(乙),直觀上看,還是有差異的.如:甲成績比較分散,乙成績 相對集中(如圖示).因此,我們還需要從另外的角度來考察這兩組數(shù)據(jù).例如:在作統(tǒng)計(jì)圖,表時(shí)提到過的極差. 甲的環(huán)數(shù)極差=10-4=6 乙的環(huán)數(shù)極差=9-5=4. 它們在一定程度上表明了樣本數(shù)據(jù)的分散程度,與平均數(shù)一起,可以給我們許多關(guān)于樣本數(shù)據(jù)的信息.顯然,極差對極端值非常敏感,注意到這一點(diǎn),我們可以得到一種“去掉一個(gè)最高分,去掉一個(gè)最低分”的統(tǒng)計(jì)策略.,考察樣本數(shù)據(jù)的分散程度的大小,最常用的統(tǒng)計(jì)量是標(biāo)準(zhǔn)差 標(biāo)準(zhǔn)差是樣本平均數(shù)的一種平均距離,一般用s表示,由于上式含有絕對值,運(yùn)算不太方便,因此,通常改用如下公式來計(jì)算標(biāo)準(zhǔn)差,一個(gè)樣本中的個(gè)體與平均數(shù)之間的距離關(guān)系可用下圖表示:,考慮一個(gè)容量為2的樣本:,建構(gòu)數(shù)學(xué),因?yàn)榉讲钆c原始數(shù)據(jù)的單位不同,且 平方后可能夸大了離差的程度,我們 將方差的算術(shù)平方根稱為這組數(shù)據(jù)的 標(biāo)準(zhǔn)差,標(biāo)準(zhǔn)差:,標(biāo)準(zhǔn)差也可以刻畫數(shù)據(jù)的穩(wěn)定程度 方差和標(biāo)準(zhǔn)差的意義: 描述一個(gè)樣本和總體的波動(dòng)大小的特征數(shù), 標(biāo)準(zhǔn)差大說明波動(dòng)大.,例題1:畫出下列四組樣本數(shù)據(jù)的直方圖,說明它們的異同點(diǎn).,解:四組樣本數(shù)據(jù)的直方圖是:,0.1,0.2,0.3,0.4,0.5,0.6,0.7,0.8,0.9,1.0,1,2,3,4,5,6,7,8,四組數(shù)據(jù)的平均數(shù)都是5.0,標(biāo)準(zhǔn)差分別是0.00,0.82, 1.49,2.83.雖然它們有相同的平均數(shù),但是它們有不同的標(biāo)準(zhǔn)差,說明數(shù)據(jù)的分散程度是不一樣的.,標(biāo)準(zhǔn)差還可以用于對樣本數(shù)據(jù)的另外一種解釋.例如,在關(guān)于居民月均用水量的例子中,平均數(shù),標(biāo)準(zhǔn)差s=0.868 ,所以,例2 甲乙兩人同時(shí)生產(chǎn)內(nèi)徑為25.40mm的一種零件.為了對兩人的生產(chǎn)質(zhì)量進(jìn)行評比,從他們生產(chǎn)的零件中各抽出20件,量得其內(nèi)徑尺寸如下(單位:mm),甲 25.46, 25.32, 25.45, 25.39, 25.36 25.34, 25.42, 25.45, 25.38, 25.42 25.39, 25.43, 25.39, 25.40, 25.44 25.40, 25.42, 25.35, 25.41, 25.39,乙 25.40, 25.43, 25.44, 25.48, 25.48 25.47, 25.49, 25.49, 25.36, 25.34 25.33, 25.43, 25.43, 25.32, 25.47 25.31, 25.32, 25.32, 25.32, 25.48,從生產(chǎn)的零件內(nèi)徑的尺寸看,誰生產(chǎn)的質(zhì)量較高?,分析:每一個(gè)工人生產(chǎn)的所有零件的內(nèi)徑尺寸組成一個(gè)總體, 由于零件的生產(chǎn)標(biāo)準(zhǔn)已經(jīng)給出(內(nèi)徑25.40mm),生產(chǎn)質(zhì)量可以從總體的平均數(shù)與標(biāo)準(zhǔn)差兩個(gè)角度來衡量.總體的平均數(shù)與內(nèi)徑標(biāo)準(zhǔn)尺寸25.00mm的差異在時(shí)質(zhì)量低,差異小時(shí)質(zhì)量高;當(dāng)總體的平均數(shù)與標(biāo)準(zhǔn)尺寸很接近時(shí),總體的標(biāo)準(zhǔn)差小的時(shí)候質(zhì)量高,標(biāo)準(zhǔn)差大的時(shí)候質(zhì)量低.這樣比較兩人的生產(chǎn)質(zhì)量只要比較他們所生產(chǎn)的零件內(nèi)徑尺寸所組成的兩個(gè)總體的平均數(shù)與標(biāo)準(zhǔn)差的大小即可.但是這兩個(gè)總體的平均數(shù)與標(biāo)準(zhǔn)差都是不知道的,根據(jù)用樣本估計(jì)總體的思想,我們可以通過抽樣分別獲得相應(yīng)的樣體數(shù)據(jù),然后比較這兩個(gè)樣本的平均數(shù),標(biāo)準(zhǔn)差,以此作為兩個(gè)總體之間的估計(jì)值.,解:用計(jì)算器計(jì)算可得:,從樣本平均數(shù)看,甲生產(chǎn)的零件內(nèi)徑比乙生產(chǎn)的更接近內(nèi)徑標(biāo)準(zhǔn)(25.40mm),但是差異很小;從樣本標(biāo)準(zhǔn)差看,由于,從上述例子我們可以看到,對一名工人生產(chǎn)的零件內(nèi)徑(總體)的質(zhì)量判斷,與我們抽取的內(nèi)徑(樣本數(shù)據(jù))直接相關(guān).顯然,我們可以從這名工人生產(chǎn)的零件中獲取許多樣本(為什么?).這樣,盡管總體是同一個(gè),但由于樣本不同,相應(yīng)的樣本頻率分布與平均數(shù),標(biāo)準(zhǔn)差等都會(huì)發(fā)生

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論