第四章 數(shù)據(jù)的描述性分析(袁軍)_第1頁(yè)
第四章 數(shù)據(jù)的描述性分析(袁軍)_第2頁(yè)
第四章 數(shù)據(jù)的描述性分析(袁軍)_第3頁(yè)
第四章 數(shù)據(jù)的描述性分析(袁軍)_第4頁(yè)
第四章 數(shù)據(jù)的描述性分析(袁軍)_第5頁(yè)
已閱讀5頁(yè),還剩36頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

4第四章數(shù)據(jù)的描述性分析通過(guò)本章的學(xué)習(xí),我們應(yīng)該知道:描述數(shù)據(jù)的集中趨勢(shì)的指標(biāo)及計(jì)算描述數(shù)據(jù)的離散程度的指標(biāo)及計(jì)算了解數(shù)據(jù)分布的偏度與峰度利用Excel進(jìn)行數(shù)據(jù)的描述性統(tǒng)計(jì)分析Statistics本章內(nèi)容概述1本章內(nèi)容是關(guān)于:?jiǎn)巫兞拷孛鏀?shù)據(jù)的特征描述2為了對(duì)統(tǒng)計(jì)分組和簡(jiǎn)單整理后的數(shù)據(jù)的進(jìn)一步認(rèn)識(shí),借助于下面的四類(lèi)指標(biāo)進(jìn)行深入討論:集中趨勢(shì)、離散程度、偏態(tài)與峰度3統(tǒng)計(jì)指標(biāo)的作用

1集中趨勢(shì)的描述集中趨勢(shì)(centraltendency)反映的是一組數(shù)據(jù)向某一中心值靠攏的傾向。數(shù)據(jù)的集中趨勢(shì)通常用平均指標(biāo)來(lái)反映。集中趨勢(shì)指標(biāo)(平均指標(biāo))按計(jì)算方法不同分為:㈠算術(shù)平均數(shù)㈡調(diào)和平均數(shù)㈢幾何平均數(shù)㈣中位數(shù)㈤眾數(shù)數(shù)值平均數(shù)位置平均數(shù)83名女生的身高分布的集中趨勢(shì)、中心數(shù)值算術(shù)平均數(shù)可以反映現(xiàn)象總體的客觀(guān)規(guī)律性;可以對(duì)比同類(lèi)現(xiàn)象在不同的時(shí)間、地點(diǎn)和條件下的一般水平;可以分析現(xiàn)象之間的依存關(guān)系。測(cè)定集中趨勢(shì)的意義:1-1算術(shù)平均數(shù)(arithmeticmean)1概念:算術(shù)平均數(shù)是分析社會(huì)經(jīng)濟(jì)現(xiàn)象一般水平和典型特征的最基本指標(biāo),是統(tǒng)計(jì)中計(jì)算平均數(shù)最常用的方法。2基本公式:注意:公式中分子和分母在經(jīng)濟(jì)內(nèi)容上的從屬關(guān)系:公式中分子和分母在范圍上是一致的,否則不是平均數(shù)例:勞動(dòng)生產(chǎn)率=糧食產(chǎn)量/種糧農(nóng)民人數(shù);全國(guó)平均每人擁有的糧食產(chǎn)量=糧食產(chǎn)量/全國(guó)人口數(shù)。簡(jiǎn)單算術(shù)平均數(shù)與加權(quán)算術(shù)平均數(shù)簡(jiǎn)單算術(shù)平均數(shù)(simplearithmeticmean)特點(diǎn):適于未分組數(shù)列;每個(gè)變量值出現(xiàn)的次數(shù)都是1。加權(quán)算術(shù)平均數(shù)(weightedarithmeticmean)特點(diǎn):適于分組數(shù)列;平均數(shù)的值受權(quán)數(shù)的影響。計(jì)算公式:

其中:原始數(shù)據(jù)分為組,第組變量值為對(duì)應(yīng)的次數(shù)為注意:對(duì)變量值的說(shuō)明單項(xiàng)變量數(shù)列直接對(duì)變量值進(jìn)行加權(quán)平均計(jì)算;組距變量數(shù)列先求出該組變量值的組中值,作為進(jìn)行計(jì)算。權(quán)數(shù)(weight)1概念我們把變量數(shù)列中的次數(shù)看作變量值的權(quán)數(shù)。原因在于:影響平均數(shù)大小的兩個(gè)因素:變量值大小和權(quán)數(shù)。2形式權(quán)數(shù)有兩種形式:絕對(duì)數(shù)形式(頻數(shù))、相對(duì)數(shù)形式(頻率)同一總體資料,用權(quán)數(shù)的兩種形式計(jì)算的平均數(shù)完全相同。X456合計(jì)頻數(shù)頻率(%)10201025.050.025.040100.0X456合計(jì)頻數(shù)頻率(%)20402025.050.025.080100.0X456合計(jì)頻數(shù)頻率(%)20101050.025.025.040100.0成績(jī)(分)人數(shù)(人)甲班乙班丙班603915010013950平均成績(jī)(分)619980起到權(quán)衡輕重的作用權(quán)數(shù)對(duì)算術(shù)平均數(shù)的影響決定平均數(shù)的變動(dòng)范圍組距數(shù)列加權(quán)算術(shù)平均數(shù)計(jì)算舉例某企業(yè)工人日產(chǎn)量的算術(shù)平均數(shù)計(jì)算表(單位:千克)按日產(chǎn)量分組工人數(shù)fi組中值xixifi60以下1060~701970~805080~903690~10027100~11014110以上8合計(jì)164工人平均日產(chǎn)量=13550/164=82.62(千克)算術(shù)平均數(shù)的數(shù)學(xué)性質(zhì)1算術(shù)平均數(shù)與總體單位數(shù)的乘積等于總體各單位標(biāo)志值的總和。2各變量值與算術(shù)平均數(shù)的離差之和等于零。3各變量值與算術(shù)平均數(shù)的離差平方之和最小。優(yōu)點(diǎn):1容易理解,便于計(jì)算2靈敏度高缺點(diǎn):1容易受極端變量值的影響2在開(kāi)口組中,代表性變差1-2調(diào)和平均數(shù)(harmonicmean)概念:由于在社會(huì)經(jīng)濟(jì)統(tǒng)計(jì)中缺乏資料,計(jì)算平均數(shù)時(shí)就需要采用間接的方式,于是產(chǎn)生了調(diào)和平均數(shù)。時(shí)間單價(jià)(元/斤)x所花錢(qián)數(shù)(元)m購(gòu)買(mǎi)量(斤)m/x早市中市晚市0.50.40.2111合計(jì)

3

購(gòu)買(mǎi)3次該蔬菜的平均價(jià)格是多少?已知分子資料未知分母資料調(diào)和平均數(shù)與算術(shù)平均數(shù)的關(guān)系調(diào)和平均數(shù)在實(shí)際應(yīng)用中一般是作為算術(shù)平均數(shù)的變形使用,區(qū)別在于兩者所掌握的原始資料不同。對(duì)于相同的總體,兩者計(jì)算得到的結(jié)果完全相同。9.25

3

—合計(jì)22.2551110.50.40.2早市中市晚市購(gòu)買(mǎi)量(斤)m/x所花錢(qián)數(shù)(元)m單價(jià)(元/斤)x時(shí)間已知資料→調(diào)和平均數(shù)已知資料→算術(shù)平均數(shù)調(diào)和平均數(shù)的特點(diǎn)優(yōu)點(diǎn):1靈敏度高2在某些情況下,代替簡(jiǎn)單平均數(shù)進(jìn)行計(jì)算缺點(diǎn):1不容易理解2容易受極值影響3有標(biāo)志值為0時(shí),不能計(jì)算已知分子資料未知分母資料未知分子資料已知分母資料1-3幾何平均數(shù)(geometricmean)1概念:若干項(xiàng)變量值連乘積開(kāi)其項(xiàng)數(shù)次方的算術(shù)根。當(dāng)各項(xiàng)變量值的連乘積等于總比率或總速度時(shí),適宜使用他計(jì)算平均比率或平均速度。2計(jì)算:簡(jiǎn)單幾何平均數(shù):加權(quán)幾何平均數(shù):3優(yōu)點(diǎn):受極端變量值影響?。贿m宜計(jì)算平均比率和平均速度。缺點(diǎn):有變量值為0或負(fù)值不能計(jì)算;應(yīng)用范圍較窄。1-4中位數(shù)與分位數(shù)1概念總體單位標(biāo)志值按大小順序排列,處于中間位置的那個(gè)標(biāo)志值就是中位數(shù)(median)Me。意義:總體標(biāo)志值中一半比中位數(shù)小,一半比它大。人口普查中應(yīng)用年齡中位數(shù);產(chǎn)品質(zhì)量控制中取中位數(shù)2計(jì)算:先對(duì)數(shù)據(jù)進(jìn)行排序;①未分組數(shù)據(jù)確定中位數(shù):②單項(xiàng)數(shù)列確定中位數(shù):先求;計(jì)算各組的累積次數(shù)(向上或向下累計(jì));根據(jù)中位數(shù)的位置找到中位數(shù)。年齡/歲學(xué)生人數(shù)向上累計(jì)分布次數(shù)1751881926209212合計(jì)50分位數(shù)中位數(shù)的特點(diǎn):優(yōu)點(diǎn):容易理解;不受極端值影響;某些不具有數(shù)學(xué)特點(diǎn)或不能用數(shù)字測(cè)定的現(xiàn)象可以用中位數(shù)求其一般水平。缺點(diǎn):靈敏度差,不宜計(jì)算分位數(shù)概念:四分位數(shù)(Quartiles):把一個(gè)變量數(shù)列分為四等分,形成三個(gè)分割點(diǎn)Q1、Q2、Q3,這三個(gè)分割點(diǎn)的數(shù)值就是四分位數(shù)。Q2=Me計(jì)算:略十分位數(shù)(dectile)百分位數(shù)(percentile)1-5眾數(shù)1概念:眾數(shù)(mode)是總體中出現(xiàn)次數(shù)最多的標(biāo)志值。它能直觀(guān)的說(shuō)明客觀(guān)現(xiàn)象分配中的集中趨勢(shì)。2應(yīng)用舉例:有時(shí)常用眾數(shù)代替算術(shù)平均數(shù)來(lái)說(shuō)明社會(huì)經(jīng)濟(jì)現(xiàn)象的一般水平例:市場(chǎng)上某種商品一天的價(jià)格變動(dòng),成交量最多的那個(gè)價(jià)格大批服裝(鞋)規(guī)格不同,市場(chǎng)需求最多的那個(gè)規(guī)格3計(jì)算:①單項(xiàng)數(shù)列:直接觀(guān)察法—出現(xiàn)次數(shù)最多的②組距數(shù)列:(僅考慮等距數(shù)列)

先觀(guān)察眾數(shù)所在組;然后按照公式近似推算。1-6各種平均指標(biāo)之間的關(guān)系1.三類(lèi)數(shù)值平均數(shù)之間:算術(shù)平均數(shù)、幾何平均數(shù)、調(diào)和平均數(shù)2.數(shù)據(jù)的分布與眾數(shù)、中位數(shù)、算術(shù)平均數(shù)1-7對(duì)各平均指標(biāo)需要說(shuō)明的問(wèn)題1.數(shù)據(jù)的非對(duì)稱(chēng)狀態(tài)越強(qiáng),之間的差別就越大。KarlPearson:當(dāng)分布為適當(dāng)偏態(tài)時(shí),三者關(guān)系:2.正確應(yīng)用平均指標(biāo)的原則(1)平均指標(biāo)只能用于同質(zhì)總體;(2)需要用組平均數(shù)補(bǔ)充總平均數(shù);例子(3)需要用分配數(shù)列補(bǔ)充說(shuō)明平均數(shù);例子組平均數(shù)補(bǔ)充總平均數(shù)沛縣銅山縣播種面積總產(chǎn)量平均畝產(chǎn)量(公斤/畝)播種面積總產(chǎn)量平均畝產(chǎn)量(公斤/畝)旱田1907220038020064000320水田7044800640300186000620合計(jì)260117000450500250000500總平均數(shù)某地區(qū)兩個(gè)縣的農(nóng)業(yè)生產(chǎn)情況表分配數(shù)列補(bǔ)充說(shuō)明平均數(shù)按完成計(jì)劃比例分組企業(yè)數(shù)按完成計(jì)劃比例分組企業(yè)數(shù)85-89.92100-104.94090-94.98105-109.93095-99.910110-114.910合計(jì)均值103.35%100某集團(tuán)下屬企業(yè)計(jì)劃完成情況表3.五值概括法與盒須圖

XminQ1MeQ3Xmax利用上面的5個(gè)數(shù)可以確定數(shù)據(jù)的分布形狀;五值概括法的圖形表現(xiàn)就是盒須圖。盒須圖的例子甲班13個(gè)同學(xué)的體育測(cè)試成績(jī):39322034403331292530313222

乙班12個(gè)同學(xué)的體育測(cè)試成績(jī):333036453428253229343531data2data1aba(c)data1data3兩供貨商的供貨計(jì)劃完成情況0123月份0123月份供貨計(jì)劃完成百分比%供貨商甲供貨商乙概念:離散程度指標(biāo)又稱(chēng)標(biāo)志變異指標(biāo),離中趨勢(shì)指標(biāo)等,它反映變量分布離散趨勢(shì);常與平均指標(biāo)匹配使用。(1)評(píng)價(jià)平均數(shù)的代表性;(2)是對(duì)事物發(fā)展均衡性的量度:供貨計(jì)劃完成的均衡性,協(xié)調(diào)性;產(chǎn)品質(zhì)量的穩(wěn)定性作用:2離散程度的描述種類(lèi)離散程度的絕對(duì)指標(biāo)離散程度的相對(duì)指標(biāo)2-1極差、四分位差、平均差概念:極差(Range)也叫全距,是一組數(shù)據(jù)的最大值與最小值之離差,即:四分位差(Interquartilerange)是指第三四分位數(shù)與第一四分位數(shù)之差,也稱(chēng)為內(nèi)距或四分間距,用Qr表示。平均差(Meandeviation)也稱(chēng)平均離差,是各變量值與其平均數(shù)離差絕對(duì)值的平均數(shù),通常用AD、MD表示。注意:1極差和四分位差的特點(diǎn)2平均差由于采用絕對(duì)值的離差形式加以數(shù)學(xué)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論