應(yīng)用統(tǒng)計學(xué)全套ppt課件(完整版)_第1頁
應(yīng)用統(tǒng)計學(xué)全套ppt課件(完整版)_第2頁
應(yīng)用統(tǒng)計學(xué)全套ppt課件(完整版)_第3頁
應(yīng)用統(tǒng)計學(xué)全套ppt課件(完整版)_第4頁
應(yīng)用統(tǒng)計學(xué)全套ppt課件(完整版)_第5頁
已閱讀5頁,還剩676頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、1應(yīng)用統(tǒng)計學(xué)2幾種常用的統(tǒng)計軟件典型的統(tǒng)計軟件SASSPSSMINITABSTATISTICAExcel3本章教學(xué)目標(biāo):了解統(tǒng)計學(xué)的基本知識;統(tǒng)計數(shù)據(jù)的收集、調(diào)查; 第1章 統(tǒng)計和統(tǒng)計數(shù)據(jù)收集4本章主要內(nèi)容1.1 統(tǒng)計學(xué)概述1.2 統(tǒng)計數(shù)據(jù)的收集1.3 問卷設(shè)計1.4 變量類型 51.1 什么是統(tǒng)計學(xué)? 統(tǒng)計學(xué)是一門收集、整理和分析數(shù)據(jù)的方法科學(xué),其目的是探索數(shù)據(jù)的內(nèi)在數(shù)量規(guī)律性,以達(dá)到對客觀事物的科學(xué)認(rèn)識6Statistics的定義 Statistics: the science of collecting, analyzing, presenting, and interpreting d

2、ata. Copyright 1994-2000 Encyclopaedia Britannica, Inc. (不列顛百科全書)7統(tǒng)計數(shù)據(jù)的內(nèi)在規(guī)律正常條件下新生嬰兒的性別比為107:100投擲一枚均勻的硬幣,出現(xiàn)正面和反面的頻率各為1/2;投擲一枚骰子出現(xiàn)16點(diǎn)的頻率各為1/6農(nóng)作物的產(chǎn)量與施肥量之間存在相關(guān)關(guān)系8統(tǒng)計學(xué)的應(yīng)用領(lǐng)域統(tǒng)計學(xué)經(jīng)濟(jì)學(xué)管理學(xué)醫(yī)學(xué)工程學(xué)社會學(xué)9 基于統(tǒng)計學(xué)的數(shù)據(jù)轉(zhuǎn)換應(yīng)用 10應(yīng)用統(tǒng)計的領(lǐng)域actuarial work (精算)agriculture (農(nóng)業(yè))animal science (動物學(xué))anthropology (人類學(xué))archaeology (考古學(xué))a

3、uditing (審計學(xué))crystallography (晶體學(xué))demography (人口統(tǒng)計學(xué))dentistry (牙醫(yī)學(xué))ecology (生態(tài)學(xué))econometrics (經(jīng)濟(jì)計量學(xué))education (教育學(xué)) engineering (工程)epidemiology (流行病學(xué))finance (金融)gambling (賭博)genetics (遺傳學(xué))geography (地理學(xué)) geology (地質(zhì)學(xué))election forecasting and projection (選舉預(yù)測和策劃)fisheries research (水產(chǎn)漁業(yè)研究)historica

4、l research (歷史研究)human genetics (人類遺傳學(xué))11應(yīng)用統(tǒng)計的領(lǐng)域(續(xù))hydrology (水文學(xué)) Industry (工業(yè)) linguistics (語言學(xué)) literature (文學(xué))manpower planning (勞動力計劃)management science (管理科學(xué))marketing (市場營銷學(xué)) medical diagnosis (醫(yī)學(xué)診斷)meteorology (氣象學(xué)) military science (軍事科學(xué))nuclear material safeguards (核材料安全管理)ophthalmology (眼

5、科學(xué)) pharmaceutics (制藥學(xué))physics (物理學(xué)) political science (政治學(xué))psychology (心理學(xué)) psychophysics (心理物理學(xué))quality control (質(zhì)量控制) religious studies (宗教研究)sociology (社會學(xué)) survey sampling (調(diào)查抽樣)taxonomy (分類學(xué)) weather modification (氣象改善)12統(tǒng)計研究對象的特點(diǎn)1.數(shù)量性 統(tǒng)計學(xué)研究的對象是客觀現(xiàn)象的數(shù)量特征和規(guī)律性。2.總體性 統(tǒng)計學(xué)研究的是客觀現(xiàn)象總體的數(shù)量特征與規(guī)律性,而不是個體的

6、量。3.具體性 統(tǒng)計的對象是一定時間、地點(diǎn)、條件下事物的量,而不是抽象對象的量,這是統(tǒng)計學(xué)和數(shù)學(xué)的一個重要區(qū)別。4.差異性 組成統(tǒng)計研究對象總體的個體是有差異的,否則就不需要進(jìn)行統(tǒng)計分析。統(tǒng)計研究中需要對總體中大量的個體進(jìn)行觀察并進(jìn)行綜合分析,由此才能獲得總體的數(shù)量分布特征。 13統(tǒng)計學(xué)的分類 統(tǒng)計學(xué)大致有以下兩種主要的分類方法。1.描述統(tǒng)計學(xué)和推斷統(tǒng)計學(xué) 這一分類方法既反映了統(tǒng)計學(xué)發(fā)展的兩個主要階段,同時也反映了各自不同的側(cè)重。 描述統(tǒng)計學(xué)是研究如何對客觀現(xiàn)象進(jìn)行數(shù)量的計量、加工、概括和表示的方法。在二十世紀(jì)之前統(tǒng)計學(xué)基本上處于描述階段。描述統(tǒng)計學(xué)是統(tǒng)計學(xué)的基礎(chǔ)。 推斷統(tǒng)計學(xué)是研究如何根據(jù)樣

7、本數(shù)據(jù)去推斷總體的情況,概率論是其理論基礎(chǔ)。推斷統(tǒng)計學(xué)是近代統(tǒng)計學(xué)的核心,也是統(tǒng)計學(xué)中的主要內(nèi)容。 14統(tǒng)計學(xué)的分科描述統(tǒng)計推斷統(tǒng)計統(tǒng)計學(xué)的分科理論統(tǒng)計應(yīng)用統(tǒng)計15描述統(tǒng)計與推斷統(tǒng)計的關(guān)系反映客觀現(xiàn)象的數(shù)據(jù)總體內(nèi)在的數(shù)量規(guī)律性推斷統(tǒng)計(利用樣本信息和概率論對總體的數(shù)量特征進(jìn)行估計和檢驗(yàn)等)概率論(包括分布理論、大數(shù)定律和中心極限定理等)描述統(tǒng)計(統(tǒng)計數(shù)據(jù)的搜集、整理、顯示和分析等)總體數(shù)據(jù)樣本數(shù)據(jù)統(tǒng)計學(xué)探索現(xiàn)象數(shù)量規(guī)律性的過程16理論統(tǒng)計學(xué)和應(yīng)用統(tǒng)計學(xué)理論統(tǒng)計學(xué) 是研究統(tǒng)計學(xué)的數(shù)學(xué)原理,它基于概率論的原理,還包括不屬于傳統(tǒng)概率論的一些內(nèi)容,如隨機(jī)化原則的理論、各種估計的原理、假設(shè)檢驗(yàn)的原理以及

8、一般決策的原理。 在統(tǒng)計實(shí)踐中經(jīng)常會遇到一些原有的統(tǒng)計方法不能適應(yīng)的新問題,需要創(chuàng)造新的統(tǒng)計模型和統(tǒng)計分析方法,這就需要統(tǒng)計理論的研究與指導(dǎo)。應(yīng)用統(tǒng)計學(xué) 將統(tǒng)計學(xué)的基本原理應(yīng)用于各個領(lǐng)域就形成各種應(yīng)用統(tǒng)計學(xué)的分支。它包括適用于各個領(lǐng)域的一般性的統(tǒng)計方法,如參數(shù)估計、假設(shè)檢驗(yàn)、方差分析、回歸分析等,還包括在某一領(lǐng)域中特定的分析方法,如經(jīng)濟(jì)統(tǒng)計中的時間數(shù)列分析和指數(shù)分析等。 應(yīng)用統(tǒng)計學(xué)側(cè)重于闡明統(tǒng)計學(xué)的基本原理,并將理論統(tǒng)計學(xué)的成果作為工具應(yīng)用于各個領(lǐng)域。17統(tǒng)計基本術(shù)語變量:事物的特征,是運(yùn)用統(tǒng)計方法所分析的對象。例如,在商業(yè)模型中,銷售額、每年的開支和每年的凈利潤都是企業(yè)想要分析的變量。數(shù)據(jù)

9、:是與變量相關(guān)的值。變量可能隨時間變動,如某一公司的期望銷售額、開支和凈利潤每年都有所不同。這些不同的值就是與變量相關(guān)的數(shù)據(jù),或者簡單地說,就是統(tǒng)計所要分析的“數(shù)據(jù)”。注意:變量需賦予可操作定義 ,否則會產(chǎn)生歧義。如:對銷售額的操作性定義可能會發(fā)生這樣錯誤的理解:一個人認(rèn)為年銷售額是指全部連鎖店的年銷售額,而另一個人則認(rèn)為是每家店的年銷售額。 18統(tǒng)計基本術(shù)語總體:所研究對象的全體。個體:指總體中的每個元素或單元??傮w依其所包含的個體總數(shù)分為有限總體和無限總體。樣本:從總體中挑選出來用于分析的一部分。這種挑選通常是相對獨(dú)立的。樣本是進(jìn)行推斷統(tǒng)計的依據(jù)。參數(shù):參數(shù)是描述總體特征的數(shù)值。統(tǒng)計量:是

10、描述樣本特征的數(shù)值19 統(tǒng)計數(shù)據(jù)的收集是統(tǒng)計整理和分析,以及統(tǒng)計推斷和預(yù)測的基礎(chǔ)。社會經(jīng)濟(jì)統(tǒng)計中所需要的數(shù)據(jù)與資料主要來源于統(tǒng)計調(diào)查。 統(tǒng)計數(shù)據(jù)的收集就是根據(jù)統(tǒng)計研究的目的和要求,有組織、有計劃地向調(diào)查對象搜集原始資料的過程。 確定數(shù)據(jù)最合適的來源和收集數(shù)據(jù)的合理方法是非常重要的任務(wù),因?yàn)槿绻占臄?shù)據(jù)有偏差,模糊不清或有其他類型的錯誤時,即使最復(fù)雜的統(tǒng)計方法也無法得到有用的信息,即需要避免“Garbage In Garbage Out(垃圾數(shù)據(jù)產(chǎn)生垃圾統(tǒng)計結(jié)果)”的統(tǒng)計應(yīng)用情況。 1.2 統(tǒng)計數(shù)據(jù)的收集20一.數(shù)據(jù)采集的基本要求準(zhǔn)確性及時性完整性系統(tǒng)性 統(tǒng)計調(diào)查的數(shù)據(jù)資料應(yīng)配套,要能從不同側(cè)

11、面反映所研究總體的特征,才能為科學(xué)的判斷和決策提供依據(jù)。 在實(shí)際應(yīng)用中,我們要依據(jù)特定的研究目的或工作任務(wù),結(jié)合研究對象所具有的性質(zhì)和特點(diǎn),相應(yīng)地選擇適合的調(diào)查方法,必要時也可以幾種調(diào)查方法結(jié)合使用。 21二.普遍調(diào)查普遍調(diào)查簡稱普查,是專門組織的一次性的全面調(diào)查 。如全國的人口普查、能源普查、工業(yè)普查等。 組織方式有兩種:1.建立專門的普查機(jī)構(gòu)2.利用調(diào)查單位的原始記錄和核算資料,發(fā)放調(diào)查表,由登記單位填報。普查時注意的原則:規(guī)定統(tǒng)一的標(biāo)準(zhǔn)時點(diǎn) 規(guī)定統(tǒng)一的普查期限規(guī)定普查的項(xiàng)目和指標(biāo)。 22普遍調(diào)查實(shí)例【例1.1】 2002年在國務(wù)院統(tǒng)一部署下,開展全國“基本單位普查”。關(guān)于這次普查的部分重

12、要要求與規(guī)定如下:調(diào)查目的:統(tǒng)計分析全國和各省市地區(qū)的單位總數(shù)、性質(zhì)、隸屬關(guān)系、分布情況等。標(biāo)準(zhǔn)時間:2001年12月31日。調(diào)查對象:各類法人單位,各類法人單位所屬的產(chǎn)業(yè)活動單位。調(diào)查項(xiàng)目:單位總數(shù); 性質(zhì)分類(企業(yè)法人、事業(yè)法人、社團(tuán)法人、機(jī)關(guān)法人、其他法人); 基本情況 性質(zhì)劃分、隸屬關(guān)系(中央、省市、區(qū)縣、街道等); 主要構(gòu)成(產(chǎn)業(yè)結(jié)構(gòu)、行業(yè)分布、地區(qū)分布、經(jīng)濟(jì)成分、規(guī)模結(jié)構(gòu)); 分布情況。 23三.重點(diǎn)調(diào)查 在總體中選擇部分重點(diǎn)單位進(jìn)行調(diào)查,以了解總體基本情況的一種非全面調(diào)查。重點(diǎn)調(diào)查的特點(diǎn):(1) 重點(diǎn)調(diào)查適用于調(diào)查對象的標(biāo)志值比較集中于某些單位的場合,這些單位的管理比較健全,統(tǒng)計

13、力量比較充實(shí),能夠及時取得準(zhǔn)確資料。(2) 重點(diǎn)調(diào)查的目的在于了解總體現(xiàn)象某些方面的基本情況,而不要求全面準(zhǔn)確地推算總體數(shù)字。(3) 重點(diǎn)調(diào)查比實(shí)際調(diào)查的單位數(shù)目少,在滿足調(diào)查目的所要求的前提下,可以比全面調(diào)查節(jié)省人力、物力和時間。 24四.典型調(diào)查 也是專門組織的一種非全面調(diào)查,在總體中選擇有代表性的典型單位進(jìn)行深入細(xì)致的調(diào)查。典型調(diào)查的作用和目的(1) 研究新事物或某種傾向性的社會問題 通過對典型單位深入細(xì)致的調(diào)查,可以發(fā)現(xiàn)新情況、新問題,探測事物發(fā)展變化的趨勢,形成科學(xué)的預(yù)見。(2) 分析事物的不同類型 通過研究造成它們間差別的原因,總結(jié)經(jīng)驗(yàn)教訓(xùn),研究對策,促進(jìn)事物的轉(zhuǎn)化和發(fā)展。(3)

14、典型調(diào)查可用來研究事務(wù)的變化規(guī)律。(4) 典型調(diào)查的資料可用來補(bǔ)充和驗(yàn)證全面統(tǒng)計的數(shù)字,推論和測算有關(guān)現(xiàn)象的總體。 25六.抽樣調(diào)查 是指按隨機(jī)原則從總體中抽取部分單位組成樣本。目的是利用樣本數(shù)據(jù)推斷(估計)總體的數(shù)量分布特征。 抽樣調(diào)查是現(xiàn)代推斷統(tǒng)計的核心,也是最重要的統(tǒng)計調(diào)查方法。 26抽樣調(diào)查中四種誤差涵蓋誤差 :當(dāng)某一組代表性的樣本被排除在抽樣調(diào)查之外時所引起的選擇偏差。無回應(yīng)誤差 :抽樣時,對樣本個體數(shù)據(jù)收集失敗會導(dǎo)致無回應(yīng)偏差。 抽樣誤差:選擇抽樣調(diào)查是因?yàn)檫@種方法簡單、低成本和有效。但同時也意味著有的個體被抽中,有的個體沒有被抽中。 測量誤差:測量誤差是指由于樣本數(shù)據(jù)測量程序的設(shè)

15、計和應(yīng)用不當(dāng)所引起的誤差。 課堂討論:舉例說明這幾種誤差。 27七.網(wǎng)上調(diào)查 截至2009年6月底,中國網(wǎng)民規(guī)模達(dá)到3.38億人,較2008年底增長13.4%,上網(wǎng)普及率達(dá)到25.5%。網(wǎng)民規(guī)模持續(xù)擴(kuò)大,互聯(lián)網(wǎng)普及率平穩(wěn)上升。其中寬帶網(wǎng)民數(shù)達(dá)到3.2億,占比高達(dá)94.3%,較2008年底上升了3.7個百分點(diǎn)。另外,截至2009年6月底,作為國家域名,CN域名總計達(dá)到1,296萬個。作為我國互聯(lián)網(wǎng)的重要基礎(chǔ)資源,CN域名已經(jīng)廣泛地應(yīng)用在金融、汽車等各個行業(yè)中。截止2009年6月我國互聯(lián)網(wǎng)用戶發(fā)展情況如圖1.2所示。28圖 2008-2009年我國互聯(lián)網(wǎng)用戶發(fā)展情況(資料來源:第23次中國互聯(lián)網(wǎng)絡(luò)

16、發(fā)展?fàn)顩r統(tǒng)計報告)29網(wǎng)上調(diào)查優(yōu)勢及時性和共享性 便捷性和低成本 可靠性和客觀性 更好的接觸性 穿越時空性 30 問卷是一種特殊形式的調(diào)查表。其特點(diǎn)是表中用一系列按照嚴(yán)密邏輯結(jié)構(gòu)組成的問題,向被調(diào)查者調(diào)查具體事實(shí)和個人對某問題的反映、看法,它不要求被調(diào)查者填寫姓名。問卷設(shè)計一般要遵循以下原則。合理性:合理性指的是問卷必須緊密與調(diào)查主題相關(guān)。 一般性:即問題的設(shè)置是否具有普遍意義。 邏輯性:問卷的設(shè)計要有整體感,這種整體感即是問題與問題之間要具有邏輯性,獨(dú)立的問題本身也不能出現(xiàn)邏輯上的謬誤。 明確性:所謂明確性,事實(shí)上是問題設(shè)置的規(guī)范性。 非誘導(dǎo)性:非誘導(dǎo)性指的是問題要設(shè)置在中性位置、不參與提示

17、或主觀臆斷,完全將被訪問者的獨(dú)立性與客觀性擺在問卷操作的限制條件的位置上。 便于整理和分析 1.3 問卷設(shè)計31統(tǒng)計學(xué)中將變量分為分類變量或數(shù)值變量。 分類變量(也稱為定性變量)的值只能按類別分開。數(shù)值變量(也稱為定量變量)的值表示數(shù)量。數(shù)值變量可進(jìn)一步分為離散變量和連續(xù)變量。 1.4 變量類型32四種計量尺度數(shù)據(jù)的計量尺度定類尺度定序尺度定距尺度定比尺度33計量層次最低對事物進(jìn)行平行的分類各類別可以指定數(shù)字代碼表示使用時必須符合類別窮盡和互斥的要求數(shù)據(jù)表現(xiàn)為“類別”具有=或的數(shù)學(xué)特性定類尺度(概念要點(diǎn))34對事物分類的同時給出各類別的順序比定類尺度精確未測量出類別之間的準(zhǔn)確差值數(shù)據(jù)表現(xiàn)為“類

18、別”,但有序具有或的數(shù)學(xué)特性定序尺度(概念要點(diǎn))351.對事物的準(zhǔn)確測度2.比定序尺度精確3.數(shù)據(jù)表現(xiàn)為“數(shù)值”4. 沒有絕對零點(diǎn)5.具有 + 或 - 的數(shù)學(xué)特性定距尺度(概念要點(diǎn))361.對事物的準(zhǔn)確測度2.與定距尺度處于同一層次3.數(shù)據(jù)表現(xiàn)為“數(shù)值”4. 有絕對零點(diǎn)5.具有 或 的數(shù)學(xué)特性定比尺度(概念要點(diǎn))37四種計量尺度的比較四種計量尺度的比較定類尺度定序尺度定距尺度定比尺度 分類(, ) 排序( ) 間距( + ,- ) 比值( ,) 計量尺度數(shù)學(xué)特性“”表示該尺度所具有的特性38數(shù)據(jù)類型與統(tǒng)計方法數(shù)據(jù)類型與統(tǒng)計方法定類數(shù)據(jù)定序數(shù)據(jù)品質(zhì)數(shù)據(jù)數(shù)量數(shù)據(jù)定距數(shù)據(jù)定比數(shù)據(jù)39本章教學(xué)目標(biāo):掌

19、握利用統(tǒng)計圖表整理和表示統(tǒng)計數(shù)據(jù)的基本方法;掌握利用 Office 軟件繪制各種統(tǒng)計圖表、計算各種統(tǒng)計綜合指標(biāo)。掌握分類數(shù)據(jù)圖表的制作方法。掌握數(shù)值數(shù)據(jù)圖表的制作方法。了解圖表匯總和制作原則。 第2章 統(tǒng)計表和統(tǒng)計圖40 在獲得原始數(shù)據(jù)資料之后,需要使用一定的方法對數(shù)據(jù)進(jìn)行整理和綜合,目的是從大量的原始數(shù)據(jù)資料中提煉所需要的信息,使之可以提供概要信息并能反映對象總體的基本數(shù)量特征,便于人們的理解和使用。表格和圖形是整理和反映統(tǒng)計資料的主要工具。 當(dāng)數(shù)據(jù)是分類數(shù)據(jù)時,可以對每一分類數(shù)據(jù)制作頻率或百分比表格和圖表。2.1 分類數(shù)據(jù)的圖表 41 頻數(shù)分布表列出了一系列分類數(shù)據(jù)的頻率、總數(shù)或百分比,可

20、以看出不同類別數(shù)據(jù)間的區(qū)別。 表2-1 1 000美元用途的頻數(shù)分布表用錢做什么百分比/%購買奢侈品、旅游或禮物20向慈善機(jī)構(gòu)捐款2還貸24儲蓄31購買必需品16其他71.頻數(shù)分布表422.條形圖433.圓餅圖44 在帕累托圖中,不同類別的數(shù)據(jù)是按其頻率降序排列的,并在同一張圖中畫出累積百分比圖。帕累托圖可以體現(xiàn)帕累托原則:數(shù)據(jù)的絕大部分存在于很少類別中,極少剩下剩余的數(shù)據(jù)分散在大部分類別中。這兩組經(jīng)常被稱為“至關(guān)重要的極少數(shù)”和“微不足道的大多數(shù)” 4.帕累托圖45 當(dāng)數(shù)據(jù)量很大時,首先可以將數(shù)值數(shù)據(jù)進(jìn)行排序或用莖葉圖描述以獲得初步信息。 (1) 排序 從沒有排序的數(shù)據(jù)中很難看出數(shù)據(jù)的整體范

21、圍。排序是把數(shù)據(jù)從小到大(或從大到小)進(jìn)行排列。 (2) 莖葉圖 莖葉圖就是將數(shù)據(jù)分成幾組(稱為莖),每組中數(shù)據(jù)的值(稱為葉)放置在每行的右邊。結(jié)果可以顯示出數(shù)據(jù)是如何分布的,以及數(shù)據(jù)中心在哪里。 為了制作莖葉圖,可以將整數(shù)作為莖,把小數(shù)(葉)化整。例如,數(shù)值5.40,它的莖(行)是5,葉是4;數(shù)值4.30,它的莖(行)是4,葉是3。也可以將數(shù)據(jù)的十位數(shù)作為莖,個位數(shù)作為葉。 2.2 數(shù)值數(shù)據(jù)的整理 46 當(dāng)數(shù)據(jù)量很大時,排序和莖葉圖都很難得出結(jié)論。此時需要使用圖表。有多種不同類型的圖表可以用來精確描述數(shù)值數(shù)據(jù),包括頻數(shù)分布表、折線圖、面積圖、柱形圖、條形圖、直方圖、頻數(shù)多邊形、圓餅圖、散點(diǎn)圖

22、、時間序列、曲線圖以及對數(shù)圖等等。 2.3 數(shù)值數(shù)據(jù)的圖表 47例:某公司汽車銷售量 (單位:輛) 481.頻數(shù)分布表 分組統(tǒng)計整理后, 將雜亂無章的 60 個原始數(shù)據(jù)壓縮到8組,清晰地反映了更多的有用信息。 49制作頻數(shù)分布表的注意事項(xiàng)分組的數(shù)量 實(shí)際應(yīng)用中分組的數(shù)量和組距應(yīng)根據(jù)對象的特點(diǎn)和分析的需要決定。如果分組是為了揭示數(shù)據(jù)的分布規(guī)律,則分組不能過多和過少。通常應(yīng)在515 之間。在繪制直方圖時可以參照下表: 樣本容量 n 參考分組數(shù) 2050 56 51100 78 101200 89 201500 910 5011000 1011 1000以上 112050制作頻數(shù)分布表的注意事項(xiàng)2)

23、 分組的方法 分組的方法可以有等距分組和不等距分組兩類。采用哪種分組方法應(yīng)根據(jù)數(shù)據(jù)的分布特點(diǎn)而定。通常,當(dāng)數(shù)據(jù)在一定范圍內(nèi)基本呈對稱分布時,宜采用等距分組;而當(dāng)數(shù)據(jù)的分布狀態(tài)極度偏斜時,則宜采用不等距分組。 51例: 按雇工人數(shù)分組的私營企業(yè)規(guī)模統(tǒng)計 52制作頻數(shù)分布表的注意事項(xiàng)3)組限:組限也即各組區(qū)間的上、下限。確定各組區(qū)間的上限和下限時,應(yīng)保證各組之間既不重疊,又不能遺漏任一數(shù)據(jù),使每一個數(shù)據(jù)都屬于某一確定的分組。重疊和組限不重疊組限重疊組限相鄰組的上下限重合。適用于連續(xù)型變量。但各組上、下限中有一個不包含再內(nèi)。通常按“上限不在內(nèi)”處理,即組區(qū)間是 a, b)的形式。注意:Excel在制

24、作頻數(shù)分布表時采用的是“上限在內(nèi)”的規(guī)則。不重疊組限相鄰組的上下限不重合。適用于離散型變量。53例:離散型變量的分組(不重疊組限)某公司某月汽車銷售量的頻數(shù)分布表 54例:連續(xù)型變量的分組(上限不在內(nèi))某企業(yè)職工工資的分組統(tǒng)計55制作頻數(shù)分布表的注意事項(xiàng)4) 組中值組中值是各組的代表值,在計算分組數(shù)據(jù)的許多統(tǒng)計指標(biāo)時要用到。通常取該組上限和下限的平均值為組中值。如表2-7所示,1019的組中值是14.5,2029的組中值是24.5,等等。5) 表格線統(tǒng)計表中的表格線應(yīng)當(dāng)是兩邊開口的表格。56使用 Excel 制作頻數(shù)分布表利用 Excel 的 FREQUENCY 函數(shù)語法規(guī)則:格式:FREQU

25、ENCY(,) 接收區(qū)間各組上限值組成的一列區(qū)域功能:返回各組的頻數(shù)。使用【工具】“數(shù)據(jù)分析”“直方圖”功能 57 統(tǒng)計圖可以形象、直觀、生動、簡潔地顯示數(shù)據(jù)的特征。 常用的統(tǒng)計圖有以下幾種:1.折線圖 通常用來描述時間序列數(shù)據(jù),用以表示某些指標(biāo)的變化趨勢。 制作折線圖時應(yīng)正確選擇坐標(biāo)軸軸的刻度。對同樣的統(tǒng)計資料,延伸或壓縮某一坐標(biāo)軸可能傳達(dá)不同的甚至是誤導(dǎo)的印象。 其它數(shù)值數(shù)據(jù)統(tǒng)計圖58圖1.2 失業(yè)人數(shù)統(tǒng)計圖過分壓縮了Y軸59圖1.3 失業(yè)人數(shù)統(tǒng)計圖過分壓縮了X軸602.面積圖 面積圖可以直觀地表示時間序列各組成部分的變化情況。圖 某地區(qū)各產(chǎn)業(yè)增加值構(gòu)成比例的變化情況613.柱形圖、條形圖

26、和直方圖 柱形圖、條形圖和直方圖是使用的最為廣泛的統(tǒng)計圖表。通常將橫向繪制的柱形圖稱為條形圖,而將各柱形之間沒有間隔的稱為直方圖,但在Office中將直方圖和柱形圖統(tǒng)稱為柱形圖。 (1)柱形圖 主要用于表示時間序列數(shù)據(jù)。 62圖1.4 各類進(jìn)口商品的變化情況柱形圖示例63(2)直方圖用以表示數(shù)據(jù)的頻數(shù)分布規(guī)律。圖1.5 比特公司啤酒銷售量的頻數(shù)分布64未分組數(shù)據(jù)的莖葉圖用于顯示未分組的原始數(shù)據(jù)的分布由“莖”和“葉”兩部分構(gòu)成,其圖形是由數(shù)字組成的以該組數(shù)據(jù)的高位數(shù)值作樹莖,低位數(shù)字作樹葉對于n(20n300)個數(shù)據(jù),莖葉圖最大行數(shù)不超過 L = 10 log 10 n 莖葉圖類似于橫置的直方圖

27、,但又有區(qū)別 直方圖可大體上看出一組數(shù)據(jù)的分布狀況,但沒有給出具體的數(shù)值 莖葉圖既能給出數(shù)據(jù)的分布狀況,又能給出每一個原始數(shù)值,保留了原始數(shù)據(jù)的信息65樹莖樹葉7880223477788890012222333344466777889013344579910111213數(shù)據(jù)個數(shù)3132410莖葉圖類似橫置的直方圖未分組數(shù)據(jù)莖葉圖(莖葉圖的制作)某車間工人日加工零件數(shù)的莖葉圖664.頻數(shù)多邊形 頻數(shù)多邊形是直方圖的另一種表現(xiàn)形式,是由直方圖的頂端中點(diǎn)(各組的組中值)連線而成,其中兩邊都要連接到橫軸上的某點(diǎn),以便通過覆蓋的面積反映總頻數(shù)。當(dāng)希望在一個圖上比較兩種頻數(shù)分布的特征時,就需要使用頻數(shù)多邊

28、形。 男、女學(xué)生的體重分布特征 675.圓餅圖 當(dāng)要表示總體各組成部分的個體數(shù)量在總體中占的比率時,經(jīng)常使用圓餅圖,圓餅中各扇形的大小代表了不同組成部分的相對重要性。 某企業(yè)資產(chǎn)、負(fù)債與所有者權(quán)益的構(gòu)成情況 686.散點(diǎn)圖、時間序列圖和曲線圖Microsoft Office中的曲線圖屬于平滑線散點(diǎn)圖 。散點(diǎn)圖:在回歸分析中,經(jīng)常需要用樣本數(shù)據(jù)的散點(diǎn)圖來分析兩個變量之間大致的曲線關(guān)系,如正相關(guān)關(guān)系,即一個變量的增長引起另一個變量的增長;負(fù)相關(guān)關(guān)系,即一個變量的增長引起另一個變量的減少。時間序列圖:研究數(shù)值變量隨時間變化的趨勢。X軸代表時間,Y軸代表數(shù)值。時間序列圖可用折線圖來實(shí)現(xiàn)。曲線圖:當(dāng)變量

29、是連續(xù)型數(shù)據(jù)時,通常使用曲線圖來描述數(shù)據(jù)的分布情況,如連續(xù)型隨機(jī)變量的密度函數(shù)和分布函數(shù)曲線。 696.散點(diǎn)圖、時間序列圖和曲線圖 Office 中曲線圖的繪制方法一:使用“平滑線散點(diǎn)圖”繪制方法二:將折線圖轉(zhuǎn)換為曲線圖右擊折線后選擇“數(shù)據(jù)系列格式”,在“圖案”標(biāo)簽下選“平滑線”復(fù)選框,就將折線圖轉(zhuǎn)換為曲線圖。 70經(jīng)濟(jì)管理中幾種常見的頻數(shù)分布曲線正態(tài)分布曲線這是客觀事物數(shù)量特征上表現(xiàn)得最為普遍的一類頻數(shù)分布曲線。如人的身高、體重、智商,鋼的含碳量、抗拉強(qiáng)度,某種農(nóng)作物的產(chǎn)量等等。正態(tài)分布曲線71偏態(tài)曲線圖1.8 偏態(tài)曲線右偏(正偏)左偏(負(fù)偏) 例如收入和財富的頻數(shù)分配曲線就是右偏的,大量財

30、富都集中在極少數(shù)富豪手中,而多數(shù)人則是低收入者。 此外,在產(chǎn)品質(zhì)量管理中也普遍存在這種現(xiàn)象,如多數(shù)次品都集中出在少數(shù)工人手中;次品也大都出在少數(shù)幾道工序上。這就要求在管理和控制上需要突出重點(diǎn)、抓住關(guān)鍵因素。 按其長尾拖向哪一方又可分為右偏(正偏)和左偏(負(fù)偏)兩類。72 J 形曲線其典型的應(yīng)用分別是經(jīng)濟(jì)學(xué)中的供給曲線和需求曲線。供給曲線(正 J 形)表現(xiàn)為隨著價格的增加,供給量以更快的速度增加;需求曲線(倒 J 形)表現(xiàn)為隨著價格的增加,需求量以更快的速度減少。供給和需求曲線的交點(diǎn)即供求平衡點(diǎn)。 正 J 形倒 J 形圖1.9 J 形曲線73 U形曲線 人和動物的的死亡率、設(shè)備的故障率等通常都服

31、從于 U 形曲線分布。圖1.10 U形曲線 又稱生命曲線或浴盆曲線747.對數(shù)圖 人們經(jīng)常對時間序列變量的相對變化率而不是絕對數(shù)值的變化感興趣,如各種經(jīng)濟(jì)變量的環(huán)比發(fā)展速度。此時若要用統(tǒng)計圖直觀反映增長率等現(xiàn)象的變動趨勢,就需要使用對數(shù)圖。 對數(shù)圖是以時間為橫軸,以10為底的對數(shù)比率刻度為縱軸的折線圖。可以通過對數(shù)圖中各線段的斜率比較各時期增長率的大小??紤]以下統(tǒng)計數(shù)據(jù):75對數(shù)圖可以直觀反映時間序列的環(huán)比變化趨勢 可以在Office圖表類型中選擇自定義類型中的“對數(shù)圖”,也可通過將一般折線圖縱軸“坐標(biāo)軸格式” 中的“刻度”設(shè)為“對數(shù)刻度”來繪制對數(shù)圖。76例:某公司總成本和勞動成本的增長 該

32、公司總成本和勞動成本每年增加相同的數(shù)量,因而用絕對數(shù)據(jù)作圖時兩條線是平行的,不小心可能會得出勞動成本占總成本固定比例的誤解。實(shí)際上第1年占40%,第6年占60%。使用對數(shù)圖就可以清晰反映勞動成本有更高的增長率。77對數(shù)圖反映了勞動成本增長率大于總成本增長率78交叉表可以由列聯(lián)表和并行條形圖來表示。1.列聯(lián)表列聯(lián)表表示兩類變量的結(jié)果。橫軸表示一類變量,縱軸表示另一類變量。值位于橫縱軸的交叉處,稱為單元。根據(jù)列聯(lián)表的結(jié)構(gòu)類型,每橫縱軸組合單元包含頻率、總值的百分比、橫行的百分比或列的百分比。2.并行條形圖一個更有效的顯示交叉分類數(shù)據(jù)的方式是作并行條形圖。 2.4 交叉表 79分析類型數(shù)據(jù)類型數(shù)值分

33、類單變量值的圖表排序,莖葉圖,頻數(shù)分布表,折線圖,直方圖,面積圖,柱形圖和條形圖,圓餅圖,頻數(shù)多邊形匯總表,條形圖,圓餅圖,帕累托圖兩變量關(guān)系的圖表散點(diǎn)圖,時間序列圖,曲線圖列聯(lián)表,并行條形圖圖表選擇指導(dǎo)2.5 圖表匯總和制作原則 80圖表制作原則 對于分類數(shù)據(jù)和數(shù)值數(shù)據(jù),有些圖表是專用的,如帕累托圖專門用于分類數(shù)據(jù)的單變量值描述;而有些圖表是通用的,如條形圖既可以描述單變量的數(shù)值數(shù)據(jù),也可以描述單變量的分類數(shù)據(jù)。為了提供圖表表述的合理性,在日常的統(tǒng)計數(shù)據(jù)整理中,應(yīng)該遵循下列一些基本原則,以更精確、更形象地抽取統(tǒng)計數(shù)據(jù)中所蘊(yùn)含的特征信息和意義:圖表不能扭曲數(shù)據(jù)。圖表不應(yīng)有不必要的修飾圖(有時是

34、圖表垃圾)。任何兩維圖標(biāo)應(yīng)盡可能地在坐標(biāo)軸上標(biāo)上刻度??v軸的起始點(diǎn)應(yīng)該合理。所有的軸應(yīng)合理布置。圖表應(yīng)包含標(biāo)題。使用最簡單的圖表。81本章主要介紹以下 3類綜合統(tǒng)計指標(biāo):度量中心(集中)趨勢的平均指標(biāo)度量離散程度(變異性)的指標(biāo)度量偏斜程度的指標(biāo)度量兩種數(shù)值變量關(guān)系的指標(biāo) 第3章 統(tǒng)計數(shù)據(jù)的描述度量82 常用的這類指標(biāo)有以下五種:算術(shù)平均數(shù)、中位數(shù)、眾數(shù)、四分位數(shù)、幾何平均數(shù)、五數(shù)匯總和箱線圖。3.1 度量集中趨勢的指標(biāo)83(1)基本公式:1.算術(shù)平均數(shù)84 (1)簡單算術(shù)平均數(shù)(2)算術(shù)平均數(shù)的計算 n 總體單位總數(shù);xi 第 i 個單位的標(biāo)志值。 (2)加權(quán)算術(shù)平均數(shù) xi 第 i 組的代

35、表值(組中值或該組變量值); f i 第 i 組的頻數(shù)。 85使用 Excel 函數(shù)求加權(quán)算術(shù)平均數(shù) 利用 Excel“數(shù)學(xué)和三角函數(shù)”中的SUMPRODUCT 函數(shù)可以方便地計算出分組數(shù)據(jù)的加權(quán)算術(shù)平均數(shù)。 語法規(guī)則: 格式:SUMPRODUCT(,) 功能:返回兩個或多個區(qū)域中對應(yīng)元素乘積之和。 例:利用比特啤酒公司各銷售點(diǎn)分組頻數(shù)分布數(shù)據(jù),求各銷售點(diǎn)的平均銷售量。 862.幾何平均數(shù) 當(dāng)統(tǒng)計資料是各時期的發(fā)展速度等前后期的兩兩比環(huán)數(shù)據(jù),要求每時期的平均發(fā)展速度時,就需要使用幾何平均數(shù)。 幾何平均數(shù)是 n 個數(shù)連乘積的 n 次方根。 (1) 簡單幾何平均數(shù) (2) 加權(quán)幾何平均數(shù)f i 各

36、比率出現(xiàn)的頻數(shù) 87例:某公司原料成本隨時間增長的情況如下表求原料成本的平均年增長率。 解一:解二: 年平均增長率 = 1.0688 - 1 = 6.88% 88(3)使用 Excel 求幾何平均數(shù) 可以使用 Excel 統(tǒng)計函數(shù)中的 GEOMEAN 函數(shù)返回幾何平均數(shù)。 語法規(guī)則: 格式:GEOMEAN(,) 功能:返回所有參數(shù)中數(shù)據(jù)的幾何平均數(shù)。 89 將總體各單位標(biāo)志值按由小到大的順序排列后處于中間位置的標(biāo)志值稱為中位數(shù),記為Me 。 中位數(shù)是一種位置平均數(shù),不受極端數(shù)據(jù)的影響。當(dāng)統(tǒng)計資料中含有異常的或極端的數(shù)據(jù)時,中位數(shù)比算術(shù)平均數(shù)更具有代表性。 比如有 5 筆付款:9元,10元,10

37、元,11元,60元 付款的均值為 20 元,顯然這并不是一個很好的代表值,而中位數(shù) Me = 10 元則更能代表平均每筆的付款數(shù)。3.中位數(shù)90 (1) 使用 Excel 的統(tǒng)計函數(shù)返回未分組數(shù)據(jù)的中位數(shù) 可以使用 Excel 統(tǒng)計函數(shù)中的 MEDIAN 函數(shù)返回未分組數(shù)據(jù)的中位數(shù)。 格式:MEDIAN(,) 功能:返回所有參數(shù)中數(shù)據(jù)的中位數(shù)。 91(2)分組數(shù)據(jù)中位數(shù)的確定 對于分組數(shù)據(jù)的統(tǒng)計資料,中位數(shù)要用插值法來估算。 (1)計算各組的累計頻數(shù); (2)確定中位數(shù)所在的組 是累計頻數(shù)首次包含中位數(shù)位次f /2的組。其中:L 中位數(shù)所在組的下限; Sm-1 中位數(shù)所在組前一組的累計頻數(shù);

38、fm 中位數(shù)所在組的頻數(shù); d 中位數(shù)所在組的組距。 92例:計算下表數(shù)據(jù)的中位數(shù)解:f/2 = 27.5,中位數(shù)在“15-25”的組中, 934.眾數(shù) 是總體中出現(xiàn)次數(shù)最多的標(biāo)志值,記為M 0。 眾數(shù)明確反映了數(shù)據(jù)分布的集中趨勢,也是一種位置平均數(shù),不受極端數(shù)據(jù)的影響。但并非所有數(shù)據(jù)集合都有眾數(shù),也可能存在多個眾數(shù)。 在某些情況下,眾數(shù)是一個較好的代表值。 例如在服裝行業(yè)中,生產(chǎn)商、批發(fā)商和零售商在進(jìn)行生產(chǎn)和存貨決策時,更感興趣的是最普遍的尺寸而不是平均尺寸。 又如,當(dāng)要了解大多數(shù)家庭的收入狀況時,也要用到眾數(shù)。 94(1) 未分組數(shù)據(jù)眾數(shù)的確定在數(shù)據(jù)量很大的時候,可以使用 Excel 統(tǒng)計

39、函數(shù)中的 MODE 函數(shù)返回眾數(shù)。格式:MODE(,)功能:返回所有參數(shù)中數(shù)據(jù)的眾數(shù)。 95(2) 分組數(shù)據(jù)眾數(shù)的確定對于分組數(shù)據(jù)的統(tǒng)計資料,眾數(shù)也要用插值法來估算。(1)確定眾數(shù)所在的組 對于等距分組,眾數(shù)組是頻數(shù)最高的組;(2)使用以下插值公式計算其中:L 眾數(shù)組的下限1 眾數(shù)組與前一組的頻數(shù)之差2 眾數(shù)組與后一組的頻數(shù)之差 d 眾數(shù)組的組距12眾數(shù)Ld96例:計算下表數(shù)據(jù)的眾數(shù)解:眾數(shù)組是“15-25”的組,則 97算術(shù)平均數(shù)、中位數(shù)和眾數(shù)間的關(guān)系 0 xf(Me,M0)0 xfMeM00 xfMeM02.頻數(shù)分布為右偏態(tài) 時,眾數(shù)小于中位數(shù),算術(shù)平均數(shù)大于中位數(shù)。3.頻數(shù)分布為左偏態(tài)時

40、,眾數(shù)大于中位數(shù),算術(shù)平均數(shù)小于中位數(shù)。1.頻數(shù)分布呈完全對稱的單峰分布,算術(shù)平均數(shù)、中位數(shù)和眾數(shù)三者相同。98補(bǔ)充習(xí)題補(bǔ)充題3:某地區(qū)私營企業(yè)注冊資金分組資料如下,求該地區(qū)私營企業(yè)注冊資金的平均數(shù)、中位數(shù)和眾數(shù)。99 補(bǔ)充題3答案f/2=143/2=71.5,中位數(shù)所在組為“100150”的組,眾數(shù)組為“100150”的組,1005.四分位數(shù) (概念要點(diǎn))1.集中趨勢的測度值之一2.排序后處于25%和75%位置上的值 3. 不受極端值的影響 4. 可用于定序數(shù)據(jù),也可用于數(shù)值型數(shù)據(jù),但不能用于定類數(shù)據(jù)QLQMQU25%25%25%25%101未分組數(shù)據(jù):組距分組數(shù)據(jù):下四分位數(shù)(QL)位置

41、=N+14上四分位數(shù)(QU)位置 =3(N+1)4下四分位數(shù)(QL)位置 =N4上四分位數(shù)(QL)位置 =3N4四分位數(shù)位置的確定102數(shù)值型未分組數(shù)據(jù)的四分位數(shù) (7個數(shù)據(jù)的算例)原始數(shù)據(jù): 23 21 30 32 28 25 26排 序: 21 23 25 26 28 30 32位 置: 1 2 3 4 5 6 7 N+1QL= 237+1QL位置 =4=4= 2QU位置 =3(N+1)43(7+1)4 = 6QU = 30103數(shù)值型未分組數(shù)據(jù)的四分位數(shù)(6個數(shù)據(jù)的算例)原始數(shù)據(jù): 23 21 30 28 25 26排 序: 21 23 25 26 28 30位 置: 1 2 3 4 5

42、 6QL= 21+0.75(23-21) = 22. 5QL位置 =N+14=6+14= 1.75QU位置 =3(N+1)43(6+1)4= 5.25QU = 28+0.25(30-28) = 28.5104數(shù)值型分組數(shù)據(jù)的四分位數(shù)上四分位數(shù): 下四分位數(shù): 105數(shù)值型分組數(shù)據(jù)的四分位數(shù)QL位置50/412.5QU位置350/437.5表 某車間50名工人日加工零件數(shù)分組表按零件數(shù)分組頻數(shù)(人)累積頻數(shù)105110110115115120120125125130130135135140358141064381630404650合計50【例】根據(jù)表中的數(shù)據(jù),計算50名工人日加工零件數(shù)的四分位數(shù)

43、106使用Excel統(tǒng)計函數(shù)中的QUARTILE函數(shù) 在數(shù)據(jù)量很大的時候,可以使用Excel統(tǒng)計函數(shù)中的QUARTILE函數(shù)返回四分位數(shù),語法規(guī)則如下:格式:QUARTILE (數(shù)據(jù)集, 第nthquart分位數(shù)) 功能:返回不同nthquart的四分位數(shù)。如果nthquart等于函數(shù)QUARTILE的返回值0最小值1第一四分位數(shù)(第25 個百分點(diǎn)值)2中位數(shù)(第 50個百分點(diǎn)值)3第三四分位數(shù)(第 75 個百分點(diǎn)值)4最大值1076.五數(shù)匯總和箱線圖 五數(shù)匯總包括最小值、第一分位數(shù)、中位數(shù)、第三分位數(shù)和最大值這樣五個數(shù)據(jù),即 箱線圖(亦稱箱須圖)提供了基于五數(shù)匯總的幾何圖形 108箱線圖和四

44、種不同類型分布圖的聯(lián)系 c)右偏分布a)鐘形分布b)左偏分布d)矩形分布109x頻數(shù) 要分析總體的分布規(guī)律,僅了解中心趨勢指標(biāo)是不夠的,還需要了解數(shù)據(jù)的離散程度或差異狀況。幾個總體可以有相同的均值,但取值情況卻可以相差很大。 變異指標(biāo)就是用來表示數(shù)據(jù)離散程度特征的。變異指標(biāo)主要有:極差、平均差、標(biāo)準(zhǔn)差和變異系數(shù)。 3.2 度量離散程度的指標(biāo)110【案例】道格拉斯公司應(yīng)如何選擇供應(yīng)商 道森公司和克拉克公司是道格拉斯公司的兩家供貨商。兩家供貨商都表示大約需要10個工作日交付定貨。下表是兩家供應(yīng)商定貨交付時間的歷史數(shù)據(jù)。今后道格拉斯公司應(yīng)選擇哪家供應(yīng)商供貨?1111.極差 極差也稱全距,是一組數(shù)據(jù)的

45、最大值和最小值之差,通常記為R。顯然,一組數(shù)據(jù)的差異越大,其極差也越大。 極差是最簡單的變異指標(biāo),它廣泛應(yīng)用于產(chǎn)品質(zhì)量管理中控制質(zhì)量的差異,一旦發(fā)現(xiàn)超過控制范圍,就采取措施加以糾正,以保證產(chǎn)品質(zhì)量的穩(wěn)定。 但極差有很大的局限性,它僅考慮了兩個極端的數(shù)據(jù),沒有利用其余數(shù)據(jù)的信息,因而是一種比較粗糙的變異指標(biāo)。 1122.平均差 平均差是各數(shù)據(jù)與其均值離差絕對值的算術(shù)平均數(shù),通常記為A.D。 平均差越大,反映數(shù)據(jù)間的差異越大。 但由于使用了絕對值,其數(shù)學(xué)性質(zhì)很差,因而很少使用。 1133.四分位差1.離散程度的測度值之一2.也稱為內(nèi)距或四分間距3.上四分位數(shù)與下四分位數(shù)之差 QD = QU - Q

46、L4.反映了中間50%數(shù)據(jù)的離散程度不受極端值的影響用于衡量中位數(shù)的代表性1144.方差和標(biāo)準(zhǔn)差 方差和標(biāo)準(zhǔn)差是應(yīng)用得最為廣泛的變異指標(biāo)。標(biāo)準(zhǔn)差是方差的算術(shù)平方根,也稱均方差或根方差。 應(yīng)注意總體方差、標(biāo)準(zhǔn)差與樣本方差、標(biāo)準(zhǔn)差是有區(qū)別的。(1)總體方差和總體標(biāo)準(zhǔn)差 總體方差是各總體數(shù)據(jù)與其均值離差平方的均值,記為 2,總體標(biāo)準(zhǔn)差記為。 115(2)樣本方差與樣本標(biāo)準(zhǔn)差 樣本方差記為 S 2,樣本標(biāo)準(zhǔn)差記為 S,在推斷統(tǒng)計中,它們分別是總體方差和標(biāo)準(zhǔn)差的優(yōu)良估計。其中:n 為樣本容量,Xi 為樣本觀察值為樣本均值。 116未分組數(shù)據(jù)方差和標(biāo)準(zhǔn)差的計算方差和標(biāo)準(zhǔn)差的手工計算非常煩瑣,只要求掌握以下

47、兩種方法。使用計算器的統(tǒng)計功能(SD或STAT功能)使用 Excel 的統(tǒng)計函數(shù)VARP(,) 功能:返回所有參數(shù)中數(shù)據(jù)的總體方差。STDEVP(,) 功能:返回所有參數(shù)中數(shù)據(jù)的總體標(biāo)準(zhǔn)差。VAR(,) 功能:返回所有參數(shù)中數(shù)據(jù)的樣本方差。STDEV(,) 功能:返回所有參數(shù)中數(shù)據(jù)的樣本標(biāo)準(zhǔn)差。 1175.變異系數(shù)當(dāng)需要比較不同總體的離散程度時,如果使用的度量單位不同,或它們在數(shù)量級上相差很大,則用絕對數(shù)值表示的方差和標(biāo)準(zhǔn)差就缺乏可比性,此時就應(yīng)使用相對變異指標(biāo)(變異系數(shù))。例如,對汽車發(fā)動機(jī)的汽缸而言,0.05毫米的標(biāo)準(zhǔn)差就很大了,但對建筑工程而言則可完全忽略不記。相對變異指標(biāo)中最重要的是標(biāo)

48、準(zhǔn)差系數(shù),是標(biāo)準(zhǔn)差與均值之比,記為V。1186.Z值極端值是遠(yuǎn)離均值的量。Z值有助于定義極端值。Z值越大,數(shù)據(jù)遠(yuǎn)離均值的距離越大。Z值記為,是數(shù)據(jù)與均值的差再除以標(biāo)準(zhǔn)差。其計算公式如下:通常,Z值小于3.0或大于+3.0時,認(rèn)為數(shù)據(jù)中含有極端值。 119 總體分布的特征不僅與均值和變異指標(biāo)有關(guān),而且與分布的偏斜程度有關(guān),如對稱分布、右偏分布和左偏分布。這種分布形態(tài)上的數(shù)量特征,往往具有重要的社會經(jīng)濟(jì)意義。偏度系數(shù)是度量偏斜程度的指標(biāo),主要有以下兩種計算方法:一、用標(biāo)準(zhǔn)差為單位計量的偏度系數(shù) 該偏度系數(shù)記為SK,計算公式為 SK是無量綱的量,取值通常在-3+3之間,其絕對值越大,表明偏斜程度越大

49、。當(dāng)分布呈右偏態(tài)時,SK0,故也稱正偏態(tài);當(dāng)分布為左偏態(tài)時,SK0,故也稱負(fù)偏態(tài)。 3.3 度量偏斜程度的指標(biāo)120二、使用三階中心矩計量的偏度系數(shù) 該偏度系數(shù)是用三階中心矩除以標(biāo)準(zhǔn)差的三次方來度量偏斜程度,記為,計算公式為 稱為三階中心矩。偏度系數(shù) 可以適用任何數(shù)據(jù)。 和SK的計算方法 不同,因此根據(jù)同一資料計算的結(jié)果也不相同??梢允褂肊xcel統(tǒng)計函數(shù)中的SKEW函數(shù)返回數(shù)據(jù)的偏度系數(shù),語法規(guī)則如下:格式:SKEW(,)功能:返回所有參數(shù)中數(shù)據(jù)的偏度系數(shù)。 1211. 協(xié)方差:協(xié)方差測試了兩數(shù)值變量(和)的線性聯(lián)系,表示為Cov(X,Y)。其計算用下列公式表示。2. 相關(guān)系數(shù):相關(guān)系數(shù)測定

50、了兩數(shù)值變量間的線性相關(guān)強(qiáng)度。相關(guān)系數(shù)的值從完全負(fù)相關(guān)1到完全正相關(guān)+1。 3.4 度量兩種數(shù)值變量關(guān)系的指標(biāo)122使用 Excel 求各種統(tǒng)計指標(biāo) 當(dāng)數(shù)據(jù)量很大時,手工計算統(tǒng)計指標(biāo)是非常煩瑣的,尤其是標(biāo)準(zhǔn)差、方差數(shù)等的計算量很大。 使用Excel【工具】“數(shù)據(jù)分析”“描述統(tǒng)計”功能,可以方便地計算出各種綜合統(tǒng)計指標(biāo)。123本章教學(xué)目標(biāo):簡要介紹概率的基礎(chǔ)知識,主要供學(xué)員回顧復(fù)習(xí)概率知識的參考,為統(tǒng)計學(xué)內(nèi)容的學(xué)習(xí)提供所需的基礎(chǔ)知識;掌握查各種概率分布表時Excel統(tǒng)計函數(shù)的使用;能運(yùn)用概率知識解決企業(yè)經(jīng)營管理中的實(shí)際問題。運(yùn)用動態(tài)模擬方法驗(yàn)證中心極限定理;項(xiàng)目投資決策的應(yīng)用案例分析。第4章 概

51、率論基礎(chǔ)124本章主要內(nèi)容4.1 隨機(jī)試驗(yàn)與隨機(jī)事件4.2 概 率4.3 隨機(jī)變量及其分布函數(shù)4.4 離散型隨機(jī)變量4.5 連續(xù)型隨機(jī)變量4.6 隨機(jī)變量的數(shù)學(xué)期望和方差4.7 大數(shù)定律和中心極限定理4.8 新產(chǎn)品投資決策案例分析 本章內(nèi)容的重點(diǎn):條件概率、事件的獨(dú)立性、二項(xiàng)分布、正態(tài)分布、Excel統(tǒng)計函數(shù)的使用。125 在市場經(jīng)濟(jì)環(huán)境下,企業(yè)所面臨的是充滿不確定因素的市場經(jīng)濟(jì)環(huán)境,企業(yè)的任何決策都存在不同程度的風(fēng)險。正確的決策可以為企業(yè)帶來巨大的經(jīng)濟(jì)效益和發(fā)展機(jī)遇,但重大的決策失誤也會給企業(yè)造成巨大的經(jīng)濟(jì)損失,并有可能使企業(yè)從此陷入困境甚至破產(chǎn)倒閉。因此,如何提高決策的科學(xué)性,并盡可能降低

52、和規(guī)避決策的風(fēng)險,是所有企業(yè)的高層經(jīng)營管理決策者都面臨的共性問題。 利用概率論的知識,可以幫助決策者進(jìn)行風(fēng)險型決策分析,利用所能獲得的各種信息,還可以大大降低決策的風(fēng)險程度,盡可能避免重大的經(jīng)濟(jì)損失,并為企業(yè)帶來可觀的經(jīng)濟(jì)效益和良好的發(fā)展機(jī)遇。引言126光大電器公司開發(fā)了一種新型洗衣機(jī),生產(chǎn)該洗衣機(jī)的經(jīng)濟(jì)規(guī)模為100萬臺/年,需要投入的生產(chǎn)線設(shè)備、模具、工裝等固定投資費(fèi)用為2000萬元,項(xiàng)目的建設(shè)期為一年,固定投資費(fèi)用在建設(shè)期初一次投入。產(chǎn)品投產(chǎn)時還需投入生產(chǎn)流動資金1000萬元。由于洗衣機(jī)產(chǎn)品的技術(shù)進(jìn)步較快,估計該產(chǎn)品的市場壽命期為5年,5年末固定資產(chǎn)殘值為固定投資額的20%,流動資金可在壽

53、命期末全部收回。由于洗衣機(jī)的市場競爭非常激烈,該新型洗衣機(jī)投入生產(chǎn)后的經(jīng)濟(jì)效益具有很大的不確定性。為了提高產(chǎn)品投資決策的科學(xué)性,該公司在決定是否投資生產(chǎn)該新型洗衣機(jī)之前,進(jìn)行了一些市場調(diào)查預(yù)測和項(xiàng)目的經(jīng)濟(jì)可行性研究。項(xiàng)目投資實(shí)例127 市場調(diào)查和預(yù)測分析估計,產(chǎn)品上市后銷售量將達(dá)到生產(chǎn)能力的80%以上(暢銷)、50%80%(銷售一般)、不足50%(滯銷)的可能性分別為40%、30%、30%。 另經(jīng)財務(wù)部門所作的財務(wù)預(yù)測分析,在產(chǎn)品出現(xiàn)”滯銷”、”一般”和”暢銷”三種銷售狀況下,該項(xiàng)目投產(chǎn)后的年凈現(xiàn)金流量將分別為100萬元、600萬元和1000萬元。 考慮到籌資成本和資金的機(jī)會成本,貼現(xiàn)率應(yīng)取6

54、%。128為使對該新產(chǎn)品項(xiàng)目的投資決策更具科學(xué)性,總經(jīng)理召開了有銷售、生產(chǎn)、財務(wù)、技術(shù)等部門負(fù)責(zé)人參加的會議。會上銷售部經(jīng)理建議,為減小決策風(fēng)險,應(yīng)在決定是否投資生產(chǎn)前先利用原有設(shè)備進(jìn)行少量試生產(chǎn)(100臺),并將試生產(chǎn)的洗衣機(jī)免費(fèi)贈送給不同地區(qū)的一些用戶進(jìn)行為期3個月的試用,以取得用戶的反饋信息。為此,銷售部經(jīng)理還設(shè)計了用戶試用后的信息反饋表,包括功能、使用效果、方便程度、外觀、可靠性五大類共25個指標(biāo),每項(xiàng)指標(biāo)都由用戶按15分打分,加權(quán)平均后的滿分為100分。根據(jù)用戶試用后反饋結(jié)果的總平均分,可將用戶對該洗衣機(jī)的評價分為”不滿意”(低于60分)、”尚可”(6090分)和”滿意”(高于90分

55、)三種可能結(jié)果。銷售部經(jīng)理的建議129 銷售部經(jīng)理認(rèn)為,為減少決策風(fēng)險,應(yīng)根據(jù)對用戶試用反饋情況進(jìn)行分析后再作是否投資生產(chǎn)該洗衣機(jī)的決定。銷售部經(jīng)理還提供了過去許多企業(yè)在產(chǎn)品正式投產(chǎn)之前采用類似試用或試銷方法的用戶反饋結(jié)果與產(chǎn)品正式生產(chǎn)上市后銷售狀況之間的統(tǒng)計數(shù)據(jù),見表1表1 銷售狀況與試用結(jié)果間的統(tǒng)計資料130總經(jīng)理指示財務(wù)部經(jīng)理對銷售部經(jīng)理所提方案的費(fèi)用進(jìn)行估算。在下一次的會議上,財務(wù)部經(jīng)理給出了試生產(chǎn)、分發(fā)用戶試用及收集用戶反饋信息等項(xiàng)工作的總費(fèi)用估算結(jié)果,估計需要100萬元。會上有人提出是否值得花100萬元進(jìn)行試生產(chǎn)并免費(fèi)贈送用戶試用,并展開了激烈的爭論??偨?jīng)理希望能對各種可行方案的風(fēng)

56、險及經(jīng)濟(jì)效益進(jìn)行科學(xué)的分析與評價。如何進(jìn)行科學(xué)決策?131 以上案例屬于“有追加信息的風(fēng)險型決策”問題,案例的分析需要用到一些概率知識,包括條件概率、全概率公式、貝葉斯公式和數(shù)學(xué)期望等,以及項(xiàng)目凈現(xiàn)值等知識。在本章的最后一節(jié),我們將運(yùn)用所學(xué)的概率知識對該例進(jìn)行分析,并且還將討論信息的價值問題。132 一隨機(jī)試驗(yàn) 人們在研究經(jīng)濟(jì)管理以及其他社會問題中,通常總是通過調(diào)查或?qū)ι鐣F(xiàn)象的觀察來獲取所研究問題的有關(guān)數(shù)據(jù);在自然科學(xué)領(lǐng)域中,人們也是通過科學(xué)實(shí)驗(yàn)或?qū)ψ匀滑F(xiàn)象的觀察來獲取所需要的資料。 對社會現(xiàn)象的觀察和對自然現(xiàn)象的科學(xué)實(shí)驗(yàn)在概率論和統(tǒng)計學(xué)中都統(tǒng)稱為試驗(yàn)。如果試驗(yàn)可在相同的條件下重復(fù)進(jìn)行,而且

57、試驗(yàn)的結(jié)果不止一個,每次試驗(yàn)前不能確定將會出現(xiàn)哪一結(jié)果,這樣的試驗(yàn)就稱為隨機(jī)試驗(yàn),簡稱試驗(yàn)。 例如,在一批產(chǎn)品中任意抽取一件進(jìn)行檢驗(yàn);企業(yè)市場調(diào)查人員就本企業(yè)的產(chǎn)品和服務(wù)進(jìn)行的用戶滿意度調(diào)查;對某產(chǎn)品進(jìn)行的壽命試驗(yàn)等等都是隨機(jī)試驗(yàn)。4.1 隨機(jī)試驗(yàn)與隨機(jī)事件1331基本事件試驗(yàn)中每一可能出現(xiàn)的結(jié)果,稱為該試驗(yàn)的一個基本事件或樣本點(diǎn)。2復(fù)合事件由多個基本事件構(gòu)成的集合。 基本事件和復(fù)合事件統(tǒng)稱為隨機(jī)事件,常用字母A,B,C, 表示。3樣本空間由試驗(yàn)E所有基本事件組成的集合,稱為E的樣本空間,常用字母S表示。4必然事件每次試驗(yàn)中必然發(fā)生的事件;樣本空間S是必然事件。5不可能事件試驗(yàn)中不可能發(fā)生的事

58、件;不含任何基本事件的空集是不可能事件;記為。二. 隨機(jī)事件134【例1】擲一枚骰子,觀察出現(xiàn)的點(diǎn)數(shù). 記A1為出現(xiàn)偶數(shù)點(diǎn);A2為小于4的點(diǎn),A3為不超過6的點(diǎn),A4為大于6的點(diǎn)。 則:S =1,2,3,4,5,6; A1=2,4,6; A2=1,2,3; A3=S; A4=【例2】在一批產(chǎn)品中連續(xù)抽取二次,每次任取一件進(jìn)行檢驗(yàn),分別記T、F為抽到正品和次品,并記A1為第一次抽到的是正品,A2為抽到一個正品,A3為兩次抽到的質(zhì)量相同,則: S = (T,T),(T,F(xiàn)),(F,T),(F,F(xiàn)); A1=(T,T),(T,F(xiàn)); A2=(T,F(xiàn)),(F,T); A3=(T,T),(F,F(xiàn))135

59、A BBASABABS1事件的包含若A發(fā)生必然導(dǎo)致B發(fā)生,則稱B包含A或A包含于B,記為BA或AB。 2事件的并 “A與B至少有一個發(fā)生”的事件,稱為A并B,記為AB三. 事件間的關(guān)系和運(yùn)算136A與B互斥AB 3.事件的交“A與B同時發(fā)生”,稱為A交B,記為 AB或AB。ABAB4.互斥(互不相容)事件 若A與B不能同時發(fā)生,即AB=,則稱A與B互斥。 顯然,基本事件都是互斥的。137 5.事件的差“A發(fā)生而B不發(fā)生”的事件,稱為A與B的差,記為A-B。 A-BBA互逆事件A6.互逆(對立)事件 若試驗(yàn)中,A與B必有且僅有一個發(fā)生,即同時滿足AB=S和AB=,則稱A與B互逆(對立), 并稱A

60、是B的逆事件,反之亦然,記為1387事件運(yùn)算的性質(zhì)(1)交換律:AB=BA; AB=BA(2)結(jié)合律:(AB)C=A(BC) (AB)C=A(BC)(3)分配律: (AB)C=(AC)(BC) (AB)C=(AC)(BC)(4)對偶律:ABC(AB)CABC(AB)C139【例3】如何表示復(fù)雜事件 在一批產(chǎn)品中連續(xù)抽檢3個產(chǎn)品,記Ai=第i個是次品,i=1,2,3, 用Ai間的關(guān)系表示以下事件: (1) 至少有一個次品:A1A2A3A1A2A3(4) 至少有一個正品:(3) 3個都是正品:(2) 3個都是次品: 其中(1)與(3)是互逆事件,(2)與(4)也是互逆事件。140課堂練習(xí)1 在一批

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論