![用統(tǒng)計量描述數(shù)據(jù)ppt課件.ppt_第1頁](http://file1.renrendoc.com/fileroot_temp2/2020-4/1/1946c9ba-4aab-4d64-878e-6d86f0629d21/1946c9ba-4aab-4d64-878e-6d86f0629d211.gif)
![用統(tǒng)計量描述數(shù)據(jù)ppt課件.ppt_第2頁](http://file1.renrendoc.com/fileroot_temp2/2020-4/1/1946c9ba-4aab-4d64-878e-6d86f0629d21/1946c9ba-4aab-4d64-878e-6d86f0629d212.gif)
![用統(tǒng)計量描述數(shù)據(jù)ppt課件.ppt_第3頁](http://file1.renrendoc.com/fileroot_temp2/2020-4/1/1946c9ba-4aab-4d64-878e-6d86f0629d21/1946c9ba-4aab-4d64-878e-6d86f0629d213.gif)
![用統(tǒng)計量描述數(shù)據(jù)ppt課件.ppt_第4頁](http://file1.renrendoc.com/fileroot_temp2/2020-4/1/1946c9ba-4aab-4d64-878e-6d86f0629d21/1946c9ba-4aab-4d64-878e-6d86f0629d214.gif)
![用統(tǒng)計量描述數(shù)據(jù)ppt課件.ppt_第5頁](http://file1.renrendoc.com/fileroot_temp2/2020-4/1/1946c9ba-4aab-4d64-878e-6d86f0629d21/1946c9ba-4aab-4d64-878e-6d86f0629d215.gif)
已閱讀5頁,還剩74頁未讀, 繼續(xù)免費(fèi)閱讀
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
第3章用統(tǒng)計數(shù)據(jù)描述數(shù)據(jù),1,第3章用統(tǒng)計數(shù)據(jù)描述數(shù)據(jù),3.1水平(集中趨勢)的測度3.2差異(離散程度)的測度3.3分布形狀(偏態(tài)與峰態(tài))的測度,2,學(xué)習(xí)目標(biāo),1.集中趨勢各測度值的計算方法2.集中趨勢各測度值的特點及應(yīng)用場合3.離散程度各測度值的計算方法4.離散程度各測度值的特點及應(yīng)用場合5.偏態(tài)與峰態(tài)的測度方法用Excel計算描述統(tǒng)計量并進(jìn)行分析,3,數(shù)據(jù)分布的特征,4,數(shù)據(jù)分布特征的測度,5,3.1集中趨勢的測度,3.1.1眾數(shù)3.1.2中位數(shù)和分位數(shù)3.1.3均值3.1.4眾數(shù)、中位數(shù)和均值的比較,6,集中趨勢(Centraltendency),一組數(shù)據(jù)向其中心值靠攏的傾向和程度測度集中趨勢就是尋找數(shù)據(jù)水平的代表值或中心值不同類型的數(shù)據(jù)用不同的集中趨勢測度值低層次數(shù)據(jù)的測度值適用于高層次的測量數(shù)據(jù),但高層次數(shù)據(jù)的測度值并不適用于低層次的測量數(shù)據(jù),7,眾數(shù),8,眾數(shù)(mode),出現(xiàn)次數(shù)最多的變量值不受極端值的影響一組數(shù)據(jù)可能沒有眾數(shù)或有幾個眾數(shù)主要用于分類數(shù)據(jù),也可用于順序數(shù)據(jù)和數(shù)值型數(shù)據(jù),9,眾數(shù)(不唯一性),無眾數(shù)原始數(shù)據(jù):10591268,一個眾數(shù)原始數(shù)據(jù):659855,多于一個眾數(shù)原始數(shù)據(jù):252828364242,10,分類數(shù)據(jù)的眾數(shù)(例題分析),解:這里的變量為“飲料品牌”,這是個分類變量,不同類型的飲料就是變量值在所調(diào)查的50人中,購買可口可樂的人數(shù)最多,為15人,占總被調(diào)查人數(shù)的30%,因此眾數(shù)為“可口可樂”這一品牌,即Mo可口可樂,11,中位數(shù)和分位數(shù),12,中位數(shù)(median),排序后處于中間位置上的值,不受極端值的影響主要用于順序數(shù)據(jù),也可用數(shù)值型數(shù)據(jù),但不能用于分類數(shù)據(jù)各變量值與中位數(shù)的離差絕對值之和最小,即,13,中位數(shù)的計算,n為奇數(shù),n為偶數(shù),14,數(shù)值型數(shù)據(jù)的中位數(shù)(9個數(shù)據(jù)的算例),【例2】:9個家庭的人均月收入數(shù)據(jù)原始數(shù)據(jù):15007507801080850960200012501630排序:75078085096010801250150016302000位置:123456789,中位數(shù)1080,15,數(shù)值型數(shù)據(jù)的中位數(shù)(10個數(shù)據(jù)的算例),【例3】:10個家庭的人均月收入數(shù)據(jù)排序:66075078085096010801250150016302000位置:12345678910,16,四分位數(shù)(quartile),排序后處于25%和75%位置上的值,不受極端值的影響主要用于順序數(shù)據(jù),也可用于數(shù)值型數(shù)據(jù),但不能用于分類數(shù)據(jù),17,四分位數(shù)(位置的確定),18,數(shù)值型數(shù)據(jù)的四分位數(shù)(9個數(shù)據(jù)的算例),【例4】:9個家庭的人均月收入數(shù)據(jù)原始數(shù)據(jù):15007507801080850960200012501630排序:75078085096010801250150016302000位置:123456789,19,數(shù)值型數(shù)據(jù)的四分位數(shù)(10個數(shù)據(jù)的算例),【例5】:10個家庭的人均月收入數(shù)據(jù)排序:66075078085096010801250150016302000位置:12345678910,20,數(shù)值型數(shù)據(jù):平均數(shù)(均值),21,均值(mean),集中趨勢的最常用測度值一組數(shù)據(jù)的均衡點所在體現(xiàn)了數(shù)據(jù)的必然性特征易受極端值的影響用于數(shù)值型數(shù)據(jù),不能用于分類數(shù)據(jù)和順序數(shù)據(jù),22,簡單均值與加權(quán)均值(simplemean/weightedmean),設(shè)一組數(shù)據(jù)為:x1,x2,xn各組的組中值為:M1,M2,Mk相應(yīng)的頻數(shù)為:f1,f2,fk,簡單均值,加權(quán)均值,23,已改至此!,加權(quán)平均數(shù)(例題分析),24,加權(quán)均值(權(quán)數(shù)對均值的影響),甲乙兩組各有10名學(xué)生,他們的考試成績及其分布數(shù)據(jù)如下甲組:考試成績(x):020100人數(shù)分布(f):118乙組:考試成績(x):020100人數(shù)分布(f):811,25,均值(數(shù)學(xué)性質(zhì)),1.各變量值與均值的離差之和等于零,2.各變量值與均值的離差平方和最小,26,調(diào)和平均數(shù)(harmonicmean),均值的另一種表現(xiàn)形式易受極端值的影響計算公式為,原來只是計算時使用了不同的數(shù)據(jù)!,27,調(diào)和平均數(shù)(例題分析),【例】某蔬菜批發(fā)市場三種蔬菜的日成交數(shù)據(jù)如表,計算三種蔬菜該日的平均批發(fā)價格,28,幾何平均數(shù)(geometricmean),n個變量值乘積的n次方根適用于對比率數(shù)據(jù)的平均主要用于計算平均增長率計算公式為,5.可看作是均值的一種變形,29,幾何平均數(shù)(例題分析),【例】某水泥生產(chǎn)企業(yè)1999年的水泥產(chǎn)量為100萬噸,2000年與1999年相比增長率為9%,2001年與2000年相比增長率為16%,2002年與2001年相比增長率為20%。求各年的年平均增長率。,年平均增長率114.91%-1=14.91%,30,幾何平均數(shù)(例題分析),【例】一位投資者購持有一種股票,在2000、2001、2002和2003年收益率分別為4.5%、2.1%、25.5%、1.9%。計算該投資者在這四年內(nèi)的平均收益率,算術(shù)平均:,幾何平均:,31,眾數(shù)、中位數(shù)和均值的比較,32,眾數(shù)、中位數(shù)和均值的關(guān)系,33,眾數(shù)、中位數(shù)和均值的特點和應(yīng)用,眾數(shù)不受極端值影響具有不唯一性數(shù)據(jù)分布偏斜程度較大時應(yīng)用中位數(shù)不受極端值影響數(shù)據(jù)分布偏斜程度較大時應(yīng)用均值易受極端值影響數(shù)學(xué)性質(zhì)優(yōu)良數(shù)據(jù)對稱分布或接近對稱分布時應(yīng)用,34,數(shù)據(jù)類型與集中趨勢測度值,35,3.2差異(離散程度)的測度,3.2.1極差和四分位差3.2.2方差及標(biāo)準(zhǔn)差3.2.3相對位置的測量:標(biāo)準(zhǔn)分?jǐn)?shù)3.2.4相對離散程度:離散系數(shù),36,數(shù)據(jù)的特征和測度(本節(jié)位置),37,離中趨勢,數(shù)據(jù)分布的另一個重要特征反映各變量值遠(yuǎn)離其中心值的程度(離散程度)從另一個側(cè)面說明了集中趨勢測度值的代表程度不同類型的數(shù)據(jù)有不同的離散程度測度值,38,極差,39,極差(range),一組數(shù)據(jù)的最大值與最小值之差離散程度的最簡單測度值易受極端值影響未考慮數(shù)據(jù)的分布,R=max(xi)-min(xi),計算公式為,40,四分位差,41,四分位差(quartiledeviation),對順序數(shù)據(jù)離散程度的測度也稱為內(nèi)距或四分間距上四分位數(shù)與下四分位數(shù)之差QD=QUQL反映了中間50%數(shù)據(jù)的離散程度不受極端值的影響用于衡量中位數(shù)的代表性,42,如根據(jù)例5,計算這10個家庭的人均月收入數(shù)據(jù)的四分位差為:QD=QUQL=1532.5-772.5=760(元),43,方差和標(biāo)準(zhǔn)差,44,方差和標(biāo)準(zhǔn)差(varianceandstandarddeviation),數(shù)據(jù)離散程度的最常用測度值反映了各變量值與均值的平均差異根據(jù)總體數(shù)據(jù)計算的,稱為總體方差或標(biāo)準(zhǔn)差;根據(jù)樣本數(shù)據(jù)計算的,稱為樣本方差或標(biāo)準(zhǔn)差,45,樣本方差和標(biāo)準(zhǔn)差(simplevarianceandstandarddeviation),未分組數(shù)據(jù):,組距分組數(shù)據(jù):,未分組數(shù)據(jù):,組距分組數(shù)據(jù):,方差的計算公式,標(biāo)準(zhǔn)差的計算公式,46,樣本方差自由度(degreeoffreedom),一組數(shù)據(jù)中可以自由取值的數(shù)據(jù)的個數(shù)當(dāng)樣本數(shù)據(jù)的個數(shù)為n時,若樣本均值x確定后,只有n-1個數(shù)據(jù)可以自由取值,其中必有一個數(shù)據(jù)則不能自由取值例如,樣本有3個數(shù)值,即x1=2,x2=4,x3=9,則x=5。當(dāng)x=5確定后,x1,x2和x3有兩個數(shù)據(jù)可以自由取值,另一個則不能自由取值,比如x1=6,x2=7,那么x3則必然取2,而不能取其他值樣本方差用自由度去除,其原因可從多方面來解釋,從實際應(yīng)用角度看,在抽樣估計中,當(dāng)用樣本方差s2去估計總體方差2時,s2是2的無偏估計量,47,樣本標(biāo)準(zhǔn)差(例題分析),48,樣本標(biāo)準(zhǔn)差(例題分析),含義:每一天的銷售量與平均數(shù)相比,平均相差21.58臺,49,相對位置的測量:標(biāo)準(zhǔn)分?jǐn)?shù),50,標(biāo)準(zhǔn)分?jǐn)?shù)(standardscore),1.也稱標(biāo)準(zhǔn)化值2.對某一個值在一組數(shù)據(jù)中相對位置的度量3.可用于判斷一組數(shù)據(jù)是否有離群點4.用于對變量的標(biāo)準(zhǔn)化處理5.計算公式為,51,標(biāo)準(zhǔn)分?jǐn)?shù)(性質(zhì)),均值等于02.方差等于1,52,標(biāo)準(zhǔn)分?jǐn)?shù)(性質(zhì)),z分?jǐn)?shù)只是將原始數(shù)據(jù)進(jìn)行了線性變換,它并沒有改變一個數(shù)據(jù)在改組數(shù)據(jù)中的位置,也沒有改變該組數(shù)分布的形狀,而只是將該組數(shù)據(jù)變?yōu)榫禐?,標(biāo)準(zhǔn)差為1。,53,標(biāo)準(zhǔn)化值(例題分析),54,經(jīng)驗法則,經(jīng)驗法則表明:當(dāng)一組數(shù)據(jù)對稱分布時約有68%的數(shù)據(jù)在平均數(shù)加減1個標(biāo)準(zhǔn)差的范圍之內(nèi)約有95%的數(shù)據(jù)在平均數(shù)加減2個標(biāo)準(zhǔn)差的范圍之內(nèi)約有99%的數(shù)據(jù)在平均數(shù)加減3個標(biāo)準(zhǔn)差的范圍之內(nèi),55,切比雪夫不等式(Chebyshevsinequality),如果一組數(shù)據(jù)不是對稱分布,經(jīng)驗法則就不再使用,這時可使用切比雪夫不等式,它對任何分布形狀的數(shù)據(jù)都適用切比雪夫不等式提供的是“下界”,也就是“所占比例至少和多少”對于任意分布形態(tài)的數(shù)據(jù),根據(jù)切比雪夫不等式,至少有的數(shù)據(jù)落在k個標(biāo)準(zhǔn)差之內(nèi)。其中k是大于1的任意值,但不一定是整數(shù),56,切比雪夫不等式(Chebyshevsinequality),對于k=2,3,4,該不等式的含義是至少有75%的數(shù)據(jù)落在平均數(shù)加減2個標(biāo)準(zhǔn)差的范圍之內(nèi)至少有89%的數(shù)據(jù)落在平均數(shù)加減3個標(biāo)準(zhǔn)差的范圍之內(nèi)至少有94%的數(shù)據(jù)落在平均數(shù)加減4個標(biāo)準(zhǔn)差的范圍之內(nèi),57,相對離散程度:離散系數(shù),58,離散系數(shù)(coefficientofvariation),1.標(biāo)準(zhǔn)差與其相應(yīng)的均值之比2.對數(shù)據(jù)相對離散程度的測度3.消除了數(shù)據(jù)水平高低和計量單位的影響4.用于對不同組別數(shù)據(jù)離散程度的比較5.計算公式為,59,離散系數(shù)(例題分析),【例8】某管理局抽查了所屬的8家企業(yè),其產(chǎn)品銷售數(shù)據(jù)如表。試比較產(chǎn)品銷售額與銷售利潤的離散程度,60,離散系數(shù)(例題分析),結(jié)論:計算結(jié)果表明,v10為右偏分布4.偏態(tài)系數(shù)0為左偏分布,67,偏態(tài)系數(shù)(skewnesscoefficient),根據(jù)原始數(shù)據(jù)計算根據(jù)分組數(shù)據(jù)計算,68,偏態(tài)系數(shù)(例題分析),69,偏態(tài)系數(shù)(例題分析),結(jié)論:偏態(tài)系數(shù)為正值,但與0的差異不大,說明電腦銷售量為輕微右偏分布,即銷售量較少的天數(shù)占據(jù)多數(shù),而銷售量較多的天數(shù)則占少數(shù),70,偏態(tài)與峰態(tài)(從直方圖上觀察),按銷售量分組(臺),結(jié)論:1.為右偏分布2.峰態(tài)適中,某電腦公司銷售量分布的直方圖,71,峰態(tài),72,峰態(tài)(kurtosis),統(tǒng)計學(xué)家Pearson于1905年首次提出數(shù)據(jù)分布扁平程度的測度峰態(tài)系數(shù)=0扁平峰度適中峰態(tài)系數(shù)0為尖峰分布,73,峰態(tài)系數(shù)(kurtosiscoefficient),根據(jù)原始數(shù)據(jù)計算根據(jù)分組數(shù)據(jù)計算,74,峰態(tài)系數(shù)(例題分析),結(jié)論:偏態(tài)系數(shù)為負(fù)值,但與0的差異不大,說明電腦銷售量為輕微扁平分布,75,用Excel計算描述統(tǒng)計量,76
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025項目法律服務(wù)合同
- 2023八年級英語下冊 Unit 4 Why don't you talk to your parents Section A 第1課時(1a-2d)說課稿 (新版)人教新目標(biāo)版
- 7多元文化 多樣魅力《多彩的世界文化》(說課稿)-統(tǒng)編版道德與法治六年級下冊
- 2025合同模板承包合同書(車輛)范本
- 2025中外合資公司勞動合同協(xié)議書
- 直飲水施工方案
- 食堂餐廳售賣設(shè)備施工方案
- 2024年春七年級語文下冊 第4單元 13 葉圣陶先生二三事說課稿 新人教版
- 《1 信息并不神秘》說課稿-2023-2024學(xué)年華中師大版信息技術(shù)三年級上冊
- Unit 2 Expressing yourself Part A Lets spell(說課稿)-2024-2025學(xué)年人教PEP版(2024)英語三年級下冊001
- 河南省鄭州市十校聯(lián)考2024-2025學(xué)年高二上學(xué)期11月期中考試語文試題
- 音樂教學(xué)集訓(xùn)課程設(shè)計
- 山東省濰坊市2024-2025學(xué)年高三上學(xué)期期末 地理試題(含答案)
- 肺切除手術(shù)的術(shù)前評估課件
- 招聘專職人員報名表
- 牛津上海版小學(xué)英語四年級下冊(英語單詞表)
- 《大學(xué)生創(chuàng)新與創(chuàng)業(yè)》課件
- 護(hù)士的護(hù)理職業(yè)生涯規(guī)劃
- 2024年高考語文復(fù)習(xí):古詩文閱讀強(qiáng)化練習(xí)題匯編(含答案解析)
- 不良反應(yīng)事件及嚴(yán)重不良事件處理的標(biāo)準(zhǔn)操作規(guī)程藥物臨床試驗機(jī)構(gòu)GCP SOP
- 勞動合同(模版)4篇
評論
0/150
提交評論