商務統(tǒng)計學課件_第1頁
商務統(tǒng)計學課件_第2頁
商務統(tǒng)計學課件_第3頁
商務統(tǒng)計學課件_第4頁
商務統(tǒng)計學課件_第5頁
已閱讀5頁,還剩241頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

商務統(tǒng)計學前言一、商務統(tǒng)計課程的性質(zhì)二、商務統(tǒng)計學習的方法一、商務統(tǒng)計課程的性質(zhì)1、商務統(tǒng)計是全面系統(tǒng)論述商務與經(jīng)濟統(tǒng)計活動全過程中所用統(tǒng)計理論與方法的綜合性課程,在調(diào)查分析師證書系列課程中是具有提綱挈領(lǐng)作用的一門課程。2、商務統(tǒng)計課程的內(nèi)容都是碩士研究生入學考試必考的內(nèi)容,是任何一個統(tǒng)計人員和調(diào)查分析人員都必須掌握的統(tǒng)計學的核心知識。二、商務統(tǒng)計學習的方法1、商務統(tǒng)計是一門應用性統(tǒng)計學課程,在學習過程中應注重各種基本概念的含義和各種方法的基本原理與應用,要掌握每種方法的使用條件、計算步驟、以及結(jié)果的意義與解釋。2、要在理解和領(lǐng)會中記憶和掌握課程的內(nèi)容。如對於各種統(tǒng)計分佈的複雜的密度函數(shù)公式就不需記憶,但卻需要熟練掌握其概念定義以及分佈函數(shù)表的使用方法。第一章緒論

一、統(tǒng)計學的性質(zhì)二、統(tǒng)計學的作用三、統(tǒng)計學的基本概念四、統(tǒng)計指標體系的設計一、統(tǒng)計學的性質(zhì)(一)統(tǒng)計活動的內(nèi)容與階段對各種數(shù)據(jù)資料的搜集、整理、分析和推斷的活動過程稱為統(tǒng)計活動,一項完整的統(tǒng)計活動過程可分為統(tǒng)計資料的搜集整理和統(tǒng)計資料的分析推斷兩大階段。(二)統(tǒng)計學的定義與分科統(tǒng)計學就是關(guān)於數(shù)據(jù)資料的搜集、整理、分析和推斷的科學。關(guān)於統(tǒng)計資料的搜集整理和分析推斷的理論與方法構(gòu)成了統(tǒng)計學的全部內(nèi)容。(1)理論統(tǒng)計學與應用統(tǒng)計學(2)描述統(tǒng)計學與推斷統(tǒng)計學二、統(tǒng)計學的作用(一)統(tǒng)計學在科學研究中的作用——提出假說並判定假說的正確與否(二)統(tǒng)計學在生產(chǎn)中的作用——通過試驗分析找出最佳工藝,並對生產(chǎn)過程進行統(tǒng)計品質(zhì)控制。(三)統(tǒng)計學在管理中的作用——抽樣調(diào)查瞭解社會與市場,為決策提供依據(jù);並可建立各種社會與經(jīng)濟發(fā)展模型,定量地模擬社會與經(jīng)濟的運行,既可分析社會與經(jīng)濟的發(fā)展及其結(jié)構(gòu)變化,又可進行政策效果的評價。三、統(tǒng)計學的基本概念(一)總體和個體

組成統(tǒng)計活動研究對象的全部事物的全體集合,就稱為統(tǒng)計總體,簡稱總體或母體;而總體中的各個事物則稱為個體,總體中個體的數(shù)量稱為總體容量。

1、自然物體總體與人為劃定個體的總體;

2、有限總體與無限總體;

3、具體總體與設想總體(抽象總體)。三、統(tǒng)計學的基本概念(二)統(tǒng)計指標及其測度

用來測度統(tǒng)計活動研究對象某種特徵數(shù)量的概念稱為統(tǒng)計指標,簡稱指標。其中,測度總體特徵數(shù)量的概念稱為總體指標,而測度個體特徵數(shù)量的概念則稱為個體指標。

指標的測度計量尺度有(1)定類尺度,(2)定序尺度,(3)定距尺度,(4)定比尺度。三、統(tǒng)計學的基本概念(三)樣本和統(tǒng)計推斷

1、樣本——從總體中隨機抽出的部分個體所組成的集合稱為樣本或子樣,樣本中所含個體的數(shù)目稱為樣本容量。

2、統(tǒng)計推斷——根據(jù)樣本觀測資料來對總體的分佈狀況和分佈特徵進行推斷。

3、樣本數(shù)據(jù)的分類——(1)橫截面數(shù)據(jù),(2)時間序列數(shù)據(jù)。

四、統(tǒng)計指標體系及其設計(一)統(tǒng)計指標體系的定義

反映總體及其所含個體的各個方面特徵數(shù)量的一系列相互聯(lián)繫、相互補充的統(tǒng)計指標所形成的體系,稱為統(tǒng)計指標體系。(二)構(gòu)建統(tǒng)計指標體系的意義(三)指標體系中指標的分類

1、水準指標——(1)存量指標與流量指標,(2)實物指標與價值指標。

2、比率指標——(1)比例相對指標,(2)比值相對指標,(3)動態(tài)相對指標,(4)彈性相對指標,(5)強度相對指標。(四)指標體系設計的內(nèi)容1、確定統(tǒng)計指標體系的框架;2、確定每一個指標的內(nèi)涵和外延;3、確定每個統(tǒng)計指標的計量單位;

4、確定每個統(tǒng)計指標的計算方法。

(五)指標體系設計的原則1、目的性原則2、科學性原則3、可行性原則4、聯(lián)繫性原則第二章數(shù)據(jù)採集與整理一、數(shù)據(jù)採集的方式與程式二、現(xiàn)場調(diào)查三、試驗觀測四、數(shù)據(jù)的整理顯示一、數(shù)據(jù)採集的方式與程式(一)數(shù)據(jù)採集——根據(jù)統(tǒng)計指標體系的要求,對所研究總體中個體的相應指標進行觀測記錄取得數(shù)據(jù)的活動過程。(二)數(shù)據(jù)採集活動的基本要求——採集到的數(shù)據(jù)資料要具有代表性和真實性。所謂代表性,是要求所觀測到的樣本必須對所研究總體具有代表性;而所謂真實性,則是要求所採集到的數(shù)據(jù)必須是真實的實際數(shù)據(jù)。(三)數(shù)據(jù)採集方式的分類——現(xiàn)場調(diào)查和試驗觀測一、數(shù)據(jù)採集的方式與程式

(四)數(shù)據(jù)採集的程式

1、制定數(shù)據(jù)採集方案——包括(1)採集數(shù)據(jù)的目的,(2)採集總體和觀測單位,(3)觀測指標數(shù)值登記表,(4)採集方式和組織,(5)採集時間和期限。

2、現(xiàn)場觀測登記

3、數(shù)據(jù)整理顯示二、現(xiàn)場調(diào)查(一)調(diào)查的取樣方式

1、隨機抽樣調(diào)查(1)簡單隨機抽樣,(2)系統(tǒng)抽樣,(3)分層抽樣,(4)整群抽樣。

2、非隨機抽樣調(diào)查(1)任意抽樣,(2)立意抽樣,(3)配額抽樣。

3、概率抽樣和非概率抽樣的特點比較二、現(xiàn)場調(diào)查(二)現(xiàn)場調(diào)查的觀測方式

1、訪問法(1)口頭訪問——當面訪問或電話訪問(2)書面訪問——郵局或互聯(lián)網(wǎng)郵件傳遞,以及登門送收

2、觀察法二、現(xiàn)場調(diào)查(三)現(xiàn)場調(diào)查的問卷設計

1、提問方式(1)封閉型提問(2)開放型提問

2、提問次序三、試驗觀測(一)試驗觀測設計的原則

1、均衡分散性原則

2、整齊可比性原則(二)試驗觀測的方法

1、完全隨機試驗觀測

2、隨機區(qū)組試驗觀測

3、拉丁方試驗觀測

4、正交試驗觀測四、數(shù)據(jù)整理與顯示(一)構(gòu)建觀測資料資料庫的意義與方法(二)觀測數(shù)據(jù)的分類顯示

1、觀測個體的分類(1)分類的功能與原則(2)分類的方法

2、統(tǒng)計表的編制(1)統(tǒng)計表的構(gòu)成(2)統(tǒng)計表的編制規(guī)則——內(nèi)容安排科學合理,形式設計簡練美觀。第三章次數(shù)分佈

一、次數(shù)分佈的概念二、次數(shù)分佈表及其編制三、次數(shù)分佈圖四、次數(shù)分佈的理論模型及其表示方法五、離散變數(shù)概率分佈模型六、連續(xù)變數(shù)概率分佈模型一、次數(shù)分佈的概念(一)次數(shù)分佈:觀測變數(shù)的各個不同取值及其出現(xiàn)次數(shù)的順序排列,稱為變數(shù)的次數(shù)分佈。(二)總體次數(shù)分佈和樣本次數(shù)分佈(三)次數(shù)分佈的作用——觀測變數(shù)的次數(shù)分佈包含了觀測變數(shù)取值的全部資訊。根據(jù)觀測變數(shù)的次數(shù)分佈,可以對觀測變數(shù)的各種分佈特徵進行描述和分析。

二、次數(shù)分佈表及其編制(一)次數(shù)分佈表的種類

1、單值分組次數(shù)分佈表

2、組距分組次數(shù)分佈表(二)組距分組次數(shù)分佈表的編制方法

1、確定組數(shù)等距分組的斯特吉斯公式:m=1+3.322lgN2、確定組距

等距分組的參考組距:

3、確定組限

4、計數(shù)各組的次數(shù)

5、列出次數(shù)分佈表三、次數(shù)分佈圖用線和麵等形狀來顯示觀測變數(shù)次數(shù)分佈狀況的幾何圖形,稱為次數(shù)分佈圖。常用的次數(shù)分佈圖主要有柱狀圖、直方圖和折線圖等幾種。四、次數(shù)分佈的理論模型(一)理論分佈模型的概念與意義隨機變數(shù)取某個數(shù)值或在某個區(qū)間取值是一個隨機事件,使用概率理論計算的隨機變數(shù)在各個數(shù)值上或在各個區(qū)間內(nèi)取值的概率分佈,就是隨機變數(shù)的理論分佈,計算此理論分佈的概率理論模型就是其理論分佈模型。在現(xiàn)實生活中,各種觀測變數(shù)的概率分佈都可以用某個理論概論分佈模型去近似描述。因此就可據(jù)此理論分佈模型進行分析推斷。四、次數(shù)分佈的理論模型(二)理論分佈模型的表示方法

1、概率分佈表

2、概率分佈圖

3、概率分佈函數(shù)式五、離散變數(shù)概率分佈模型

記所考察的離散變數(shù)為x,假設該隨機變數(shù)共可取m個不同的值,它取值為xi的概率為pi,並記隨機事件x=xi的概率為P(x=xi),則離散隨機變數(shù)的概率分佈可表示為:

P(x=xi)=pi

;i=1,2…,m.

在統(tǒng)計分析推斷中,常用的離散變數(shù)概率分佈模型主要有兩點分佈、二項分佈、超幾何分佈和泊松分佈等幾種。(一)兩點分佈

假設總體中有兩類共N個個體,其中取值為“是”的有N1個,取值為“非”的有N0個,則有:(二)二項分佈

假設在0-1分佈總體中,取“是”值的個體比例為p,取“非”值的比例為q,現(xiàn)從中有放回地隨機抽取n個個體,記X為取“是”值的個體數(shù)目,則其中恰有n1個個體取“是”值、且有n0=n-n1個個體取“非”值的概率為:(三)超幾何分佈

假設0-1總體中共有N個個體,其中取“是”值的個體有N1個,取“非”值的個體有N0個?,F(xiàn)從不放回地隨機抽取n個個體,記x為取“是”值的個體數(shù)目,則其中恰有n1個個體取“是”值、且有n0=n-n1個個體取“非”值的概率為:(四)泊松分佈

泊松分佈是稀有事件出現(xiàn)次數(shù)的理論分佈模型,如自然災害、意外事故、機器故障等事件出現(xiàn)的次數(shù)都近似地服從泊松分佈。泊松分佈概率模型為:

六、連續(xù)變數(shù)概率分佈模型

連續(xù)型隨機變數(shù)的取值範圍可以是數(shù)軸上的某個區(qū)間,也可以是整個數(shù)軸。由於它可以取無窮多個不同的數(shù)值,所以描述其概率分佈的最完善方法是概率函數(shù)式。在理論分析中,描述連續(xù)變數(shù)概率分佈的最常用的概率函數(shù)式是概率分佈密度函數(shù)。在統(tǒng)計分析推斷中,常用的連續(xù)隨機變數(shù)概率分佈模型主要有均勻分佈、正態(tài)分佈、χ2分佈、t分佈和F分佈等幾種。

(一)均勻分佈

若隨機變數(shù)x在區(qū)間[a,b]上服從均勻分佈,則該隨機變數(shù)的概率密度函數(shù)為:(二)正態(tài)分佈

若隨機變數(shù)x服從正態(tài)分佈,則其概率密度函數(shù)就為:(三)χ2分佈

若隨機變數(shù)z1、z2、…、zn都服從標準正態(tài)分佈N(0,1),且兩兩之間相互獨立,則這些標準正態(tài)變數(shù)的平方和x就服從χ2分佈,其概率密度函數(shù)為:(四)t分佈

若隨機變數(shù)z~N(0,1),x~χ2(n),且二者相互獨立,則:服從學生氏t分佈,概率密度函數(shù)為:

(五)F分佈若隨機變數(shù)xm~χ2(m),xn~χ2(n),旦二者相互獨立,則:

服從F分佈,其概率密度函數(shù)為:

第四章分佈特徵測度一、分佈中心二、離散程度三、偏度與峰度四、相關(guān)程度一、分佈中心測度的意義(一)分佈中心的概念——所謂分佈中心,就是指隨機變數(shù)的一切取值的散佈中心。(二)測度分佈中心的意義

1、隨機變數(shù)的分佈中心是隨機變數(shù)一切取值的一個代表,可以用來反映其數(shù)值的一般水準。

2、隨機變數(shù)的分佈中心可以揭示隨機變數(shù)一切取值的次數(shù)分佈在直角坐標系內(nèi)的集中位置,可以用來反映隨機變數(shù)分佈密度曲線的中心位置,即對稱中心或尖峰位置。

二、分佈中心測度指標

用來測度隨機變數(shù)次數(shù)分佈中心的指標可以有多種,其中在統(tǒng)計分析推斷中常用的主要有算術(shù)平均數(shù)、中位數(shù)和眾數(shù)等幾種。

(一)算術(shù)平均數(shù)

1、定義——算術(shù)平均數(shù)又稱算術(shù)均值,是隨機變數(shù)的所有觀測值總和與觀測值個數(shù)的比值。2、計算方法(1)簡單算術(shù)平均數(shù)——適用於未分組整理的各個單個觀測數(shù)值,其計算公式為:(一)算術(shù)平均數(shù)

(2)加權(quán)算術(shù)平均數(shù)——適用於已分組整理的次數(shù)分佈數(shù)據(jù),其計算公式為:(一)算術(shù)平均數(shù)

(3)算術(shù)平均數(shù)的變形——調(diào)和平均數(shù)。對於由觀測變數(shù)的各個分組和各組變數(shù)總值順序排列所形成的分組數(shù)據(jù)。算術(shù)平均數(shù)的公式需變換成調(diào)和平均數(shù)的形式:當各組的變數(shù)總值mi相等時,就可簡化為:(一)算術(shù)平均數(shù)3、理論分佈的算術(shù)平均數(shù)——數(shù)學期望(1)定義對於離散型隨機變數(shù),假設有n個不同的取值,其中取某個數(shù)值xi的概率為pi,則該隨機變數(shù)的數(shù)學期望可用算術(shù)平均數(shù)公式定義為:

對於連續(xù)型隨機變數(shù),仍可用算術(shù)平均數(shù)定義其數(shù)學期望,不過因為連續(xù)變數(shù)求和要用定積分,所以定義中需要用定積分符號代替總和符號,即:(一)算術(shù)平均數(shù)3、理論分佈的算術(shù)平均數(shù)——數(shù)學期望(2)例子例如,對於服從兩點分佈的隨機變數(shù)x,其不同的取值只有1和0,其中取1的概率為p,取0的概率為q=1-p,則其數(shù)學期望為:

又如,對於服從位置參數(shù)為μ且尺度參數(shù)為σ2的正態(tài)分佈的隨機變數(shù)x,由其概率密度函數(shù)可計算出其數(shù)學期望就是其位置參數(shù)μ。標準正態(tài)分佈隨機變數(shù)的數(shù)學期望為0。

(一)算術(shù)平均數(shù)

(3)數(shù)學期望的性質(zhì)

①若c為常數(shù),則必有:E(c)=c②若c為任意常數(shù),x為隨機變數(shù),則必有:

E(cx)=cE(x)③若x1、x2、…、xm均為隨機變數(shù),則必有:

E(x1+x2+…+xm)=E(x1)+E(x2)+…+E(xm)④若x1、x2、…、xm均為隨機變數(shù),且相互獨立,則:

E(x1x2…xm)=E(x1)E(x2)…E(xm)⑤若x是隨機變數(shù),則必有:

E(∣x∣)≥∣E(x)∣

(二)中位數(shù)1、定義

中位數(shù)是在按觀測變數(shù)值的大小順序排列所形成的變數(shù)值數(shù)列中點位置上的變數(shù)值。對於觀測變數(shù)x,假設共取得n個觀測值,各個觀測值按大小順序排列為x(1)、x(2)、…、x(n),則其中位數(shù)可定義為:(二)中位數(shù)2、組距分組次數(shù)分佈數(shù)據(jù)的中位數(shù)計算(三)眾數(shù)1、定義:眾數(shù)是隨機變數(shù)的觀測值中出現(xiàn)次數(shù)或密度最大的變數(shù)觀測值。2、組距分組次數(shù)分佈數(shù)據(jù)計算眾數(shù)

三、均值、中位數(shù)和眾數(shù)三者之間的關(guān)係

對於對稱分佈,有:對於右偏分佈,有:對於左偏分佈,有:經(jīng)驗關(guān)係式:

四、離散程度測度的意義(一)離散程度的概念——所謂離散程度,即觀測變數(shù)各個取值之間的差異程度。(二)離散程度測度的意義

1、通過對隨機變數(shù)取值之間離散程度的測定,可以反映各個觀測個體之間的差異大小,從而也就可以反映分佈中心指標對各個觀測變數(shù)值代表性的高低。

2、通過對隨機變數(shù)取值之間離散程度的測定,可以反映隨機變數(shù)次數(shù)分佈密度曲線的瘦俏或矮胖程度。五、離散程度測度指標

可用來測度觀測變數(shù)值之間差異程度的指標有很多,在統(tǒng)計分析推斷中最常用的主要有極差、平均差和標準差等幾種。

(一)極差極差又稱全距,是觀測變數(shù)的最大取值與最小取值之間的離差,也就是觀測變數(shù)的最大觀測值與最小觀測值之間的區(qū)間跨度。極差的計算公式為:

R=Max(xi)-Min(xi)(二)平均差平均差是隨機變數(shù)各個取值偏差絕對值的算術(shù)平均數(shù)。由於所掌握數(shù)據(jù)形式的不同,平均差的計算有簡單平均差和加權(quán)平均差兩種不同的方式。(三)標準差標準差是隨機變數(shù)各個取值偏差平方的平均數(shù)的算術(shù)平方根,是最常用的反映隨機變數(shù)分佈離散程度的指標。標準差既可以根據(jù)樣本數(shù)據(jù)計算,也可以根據(jù)觀測變數(shù)的理論分佈計算,分別稱為樣本標準差和總體標準差。

1、樣本標準差的計算

(1)對於未分組整理的各個觀測變數(shù)值數(shù)據(jù),計算標準差應採用簡單平均的方法。

(2)對於已分組整理的分組次數(shù)分佈數(shù)據(jù),計算標準差應採用加權(quán)平均的方法

。2、理論分佈的標準差與方差

(1)定義標準差是最常用的理論分佈模型正態(tài)分佈的參數(shù)之一,在理論分析中最常用來描述隨機變數(shù)分佈的離散程度。標準差的平方稱為方差,與標準差有著同樣的作用。隨機變數(shù)x的理論分佈的方差常記為Var(x)或σ2,其定義為:

σ2=Var(x)=E[x-E(x)]22、理論分佈的標準差與方差

(2)離散隨機變數(shù)的方差對於離散隨機變數(shù)x,假設共有n個不同取值,取值xi的概率為pi,i=1、2、…、n,則方差為:

例如,對於服從兩點分佈的隨機變數(shù)x,其取值為1的概率為p,取值為0的概率為q=1-p,數(shù)學期望為E(x)=p,則其方差為:

Var(x)=(1-p)2p+(0-p)2q=pq2、理論分佈的標準差與方差

(3)連續(xù)隨機變數(shù)的方差對於連續(xù)型隨機變數(shù)x,假設其分佈密度函數(shù)f(x),則其方差的計算公式為:

例如,對於服從位置參數(shù)為μ且尺度參數(shù)為σ2的正態(tài)分佈的隨機變數(shù)x,其數(shù)學期望等於其位置參數(shù)μ,其方差就是其尺度參數(shù)σ2,標準正態(tài)分佈的方差為1。

2、理論分佈的標準差與方差(4)方差的性質(zhì)

①任何隨機變數(shù)的方差均非負。Var(x)≥0②若c為常數(shù),x為隨機變數(shù),則有:

Var(cx)=c2Var(x)③若隨機變數(shù)x1、x2、…、xm均相互獨立,則有:

Var(x1+x2+…+xm)=Var(x1)+Var(x2)+…+Var(xm)④若x為隨機變數(shù),c為任一常數(shù),則有:

E(x-c)2=E[x-E(x)]2+[c-E(x)]2⑤對於任意隨機變數(shù)x,均有:

Var(x)=E(x2)-[E(x)]2(四)離散係數(shù)1、離散係數(shù)的概念——各個衡量隨機變數(shù)取值之間絕對差異的指標與算術(shù)平均數(shù)的比率,通稱為離散係數(shù)。2、計算離散係數(shù)的意義——消除量綱和數(shù)量級的差異,便於不同觀測變數(shù)之間的比較。

3、計算公式六、測度偏度和峰度的意義(一)概念——所謂偏度,就是觀測變數(shù)取值分佈的非對稱程度;所謂峰度,就是觀測變數(shù)取值分佈密度曲線頂部的平坦程度或尖峭程度。(二)意義

1、加深人們對觀測變數(shù)取值的散佈狀況的認識;

2、將觀測變數(shù)的偏度和峰度指標值與某種理論分佈的偏度和峰度指標值進行比較,以判斷觀測變數(shù)的分佈與某種理論分佈的近似程度。

七、偏度的測度(一)直觀偏度係數(shù)1、皮爾遜偏度係數(shù)

2、鮑萊偏度係數(shù)

七、偏度的測度(二)矩偏度係數(shù)

1、矩的定義——原點矩和中心矩

2、矩偏度係數(shù)八、峰度的測度矩峰度係數(shù)——隨機變數(shù)的四階中心矩與其標準差的四次方相除,所得比率就稱為峰度係數(shù),其計算公式為:

九、相關(guān)程度測度的意義

(一)相關(guān)關(guān)係的概念

對於兩個觀測變數(shù),若一個變數(shù)的取值除了受另一個變數(shù)取值的影響外,還受各種隨機因素的影響,則變數(shù)間的這種非確定性關(guān)係就稱為相關(guān)關(guān)係。(二)相關(guān)關(guān)係測度的意義

1、瞭解兩個觀測變數(shù)之間相關(guān)關(guān)係的方向;2、瞭解兩個觀測變數(shù)之間相互依賴關(guān)係的程度,為構(gòu)建觀測變數(shù)之間相互關(guān)係模型奠定基礎(chǔ)。十、相關(guān)程度測度的指標對兩隨機變數(shù)之間的相關(guān)關(guān)係及其密切程度進行測度,需要根據(jù)兩變數(shù)觀測值的複合分組次數(shù)分佈進行,或在理論上根據(jù)兩變數(shù)的聯(lián)合概率分佈模型進行。測度觀測變數(shù)之間相關(guān)關(guān)係的指標主要有協(xié)方差和相關(guān)係數(shù)兩個。

(一)協(xié)方差1、定義——協(xié)方差是兩個隨機變數(shù)成對觀測值偏差乘積的算術(shù)平均數(shù)。2、樣本協(xié)方差(一)協(xié)方差3、總體協(xié)方差——對於兩隨機變數(shù)的理論分佈,也可類似地定義其協(xié)方差。兩隨機變數(shù)x和y的理論分佈的協(xié)方差常記作Cov(x,y)或σxy,其定義公式為:

σxy=Cov(x,y)=E[x-E(x)][y-E(y)]

例如,對於聯(lián)合分佈為二元正態(tài)分佈的隨機變數(shù)x和y,可得二變數(shù)的協(xié)方差為:(一)協(xié)方差4、協(xié)方差的性質(zhì)

①隨機變數(shù)x與y的協(xié)方差和y與x的協(xié)方差相等。

Cov(x,y)=Cov(y,x)②若隨機變數(shù)x和y相互獨立,則有:Cov(x,y)=0③若λ1和λ2為任意常數(shù),則有:

Cov(λ1x,λ2y)=λ1λ2Cov(x,y)④對於任意三個隨機變數(shù),均有:

Cov(x1+x2,y)=Cov(x1,y)+Cov(x2,y)

Cov(x,y1+y2)=Cov(x,y1)+Cov(x,y2)⑤對於任意兩隨機變數(shù),均有:

Cov(x,y)=E(xy)-[E(x)E(y)](二)相關(guān)係數(shù)1、定義——相關(guān)係數(shù)是兩個隨機變數(shù)的協(xié)方差對其兩標準差之積的比率。2、總體相關(guān)係數(shù)3、樣本相關(guān)係數(shù)(二)相關(guān)係數(shù)4、相關(guān)係數(shù)的取值範圍相關(guān)係數(shù)r的數(shù)值介於-1和+1之間,其絕對值介於0和1之間。即有:

-1≤r≤+15、相關(guān)係數(shù)的作用(1)相關(guān)係數(shù)的符號可反映兩隨機變數(shù)相互依存關(guān)係的方向。相關(guān)係數(shù)為正,稱為正相關(guān);相關(guān)係數(shù)為負,稱為負相關(guān)。(2)相關(guān)係數(shù)的絕對值的大小則可反映兩隨機變數(shù)線性相關(guān)關(guān)係的密切程度。第五章參數(shù)估計一、總體參數(shù)及其估計量二、構(gòu)造估計量的方法——矩法估計三、判斷估計量優(yōu)劣的標準四、估計量的標準誤五、抽樣分佈的概念六、基本的抽樣分佈七、區(qū)間估計的概念八、區(qū)間估計的方法九、樣本容量的確定一、總體參數(shù)及其估計量

總體指標又稱為總體參數(shù),根據(jù)樣本數(shù)據(jù)來推斷總體指標數(shù)值就稱為參數(shù)估計。集中了樣本中有關(guān)總體參數(shù)資訊的樣本指標稱為統(tǒng)計量,該統(tǒng)計量就可用來估計所求的總體指標的數(shù)值。用來估計總體指標數(shù)值的統(tǒng)計量又稱為該總體指標的估計量,該估計量的數(shù)值就稱為該總體指標的估計值??傮w參數(shù)值是確定的,但是未知的;樣本估計量是隨機變數(shù),其估計值是某個給定樣本的計算值。二、構(gòu)造估計量的方法—矩法估計

(一)矩法估計的概念——所謂矩法估計,概括來說就是用樣本矩作為總體同一矩的估計量,用樣本矩的函數(shù)作為總體相應矩同一函數(shù)的估計量。(二)常用的總體參數(shù)及其矩法估計量

三、判斷估計量優(yōu)劣的標準

為了保證用於估計總體指標的估計量準確可靠,就必須要求所使用的估計量具備一些優(yōu)良的性質(zhì),這些性質(zhì)就構(gòu)成了判斷一個估計量優(yōu)劣的標準。常用的標準主要有一致性、無偏性、有效性、充分性和穩(wěn)健性等。

(一)一致性對於總體指標的一個估計量,若其取值隨著樣本容量的增大越來越接近於總體指標的真值,即估計誤差越來越小的可能性越來越大直至100%,則該估計量就稱為總體指標的一致估計量,或稱為相合估計量??梢宰C明,由矩估計法所構(gòu)造出的估計量都是所估計總體指標的一致估計量。如樣本均值是總體均值的一致估計量,樣本比例p是總體比例P的一致估計量,樣本方差s2也是總體方差σ2的一致估計量。(二)無偏性對於總體指標的一個估計量,若其估計值的數(shù)學期望等於該總體指標的真值,即其估計誤差的數(shù)學期望為0,則該估計量就稱為是總體指標的無偏估計量??梢宰C明,樣本均值是總體均值的無偏估計量,而常規(guī)樣本方差卻並不是總體方差σ2的無偏估計量,修正樣本方差s2是總體方差σ2的無偏估計量。修正樣本方差即無偏樣本方差為:

(三)有效性對於任一總體指標,若存在兩個無偏估計量,其中一個估計量的估計誤差平均來說小於另一個估計量的估計誤差,則稱前一個估計量比後一個估計量有效。無偏估計量的估計誤差大小可用其方差衡量,所以兩個無偏估計量比較,方差較小者較為有效。對於一個總體指標來說,若在其所有無偏估計量中能夠找到一個估計量,其方差最小,則該估計量就稱為是該總體指標的最佳無偏估計量??梢宰C明,樣本均值是總體均值的最佳無偏估計量。對於有偏估計量,衡量其有效性可用均方誤差代替方差。估計量的均方誤差為:

(四)充分性對於一個總體指標,若其估計量提取了樣本中包含的有關(guān)該總體指標的全部資訊,則此估計量就稱為該總體指標的充分估計量。在多數(shù)情形下,矩法估計給出的總體指標的估計量均是充分的。如在正態(tài)分佈總體之下,樣本均值是總體均值的充分估計量,樣本方差s2也是總體方差σ2的充分估計量。

(五)穩(wěn)健性如果用來估計總體指標的樣本估計量對樣本數(shù)據(jù)的污染不敏感,也就是說估計量的數(shù)值不受被污染數(shù)據(jù)的干擾或受其干擾不大,那麼該估計量就是總體指標的一個穩(wěn)健估計量。

實踐中常用的一種估計總體均值的穩(wěn)健估計量是切尾均值,切尾均值的計算公式為:四、估計量的標準誤

(一)標準誤的概念樣本估計量的標準差通常稱為該估計量的標準誤差,簡稱標準誤。即:

標準誤是衡量一個估計量抽樣估計誤差大小的一個尺度。

(二)標準誤的計算1、樣本均值的標準誤(1)放回抽樣

(2)不放回抽樣(二)標準誤的計算

2、樣本比例的標準誤(1)放回抽樣(2)不放回抽樣

(三)影響標準誤的因素1、總體中各個體之間的差異程度。總體中各個體取值之間的差異程度大即σ2也大,各總體指標估計量的標準誤的數(shù)值也就大,抽樣估計誤差也就大。2、樣本容量的大小。樣本容量大,總體指標估計量的標準誤則小,抽樣估計誤差也就越??;反之,樣本容量越小,抽樣估計誤差及其標準誤也就越大。3、抽取樣本的方式方法。抽樣方式方法不同,總體指標估計量的標準誤就會不同,抽樣估計誤差的大小也就不同。五、抽樣分佈的概念對於給定的總體和抽樣方式以及樣本容量,樣本指標取值的概率分佈就稱為抽樣分佈。確定樣本容量下的抽樣分佈稱為樣本統(tǒng)計量的精確分佈,而樣本容量趨於無窮大時的抽樣分佈則稱為樣本統(tǒng)計量的極限分佈。

六、基本的抽樣分佈

(一)樣本均值的抽樣分佈1、任意總體大樣本2、正態(tài)總體小樣本六、基本的抽樣分佈

(二)樣本比例的抽樣分佈——大樣本六、基本的抽樣分佈(三)樣本方差的抽樣分佈——正態(tài)總體

七、區(qū)間估計的概念

記總體指標為θ,樣本估計量為,事先給定概率為1-α,若根據(jù)樣本估計量的概率分佈可計算出一個區(qū)間,使得該區(qū)間包含總體參數(shù)θ的概率等於事先給定的概率1-α,即有:

成立,則該區(qū)間就稱為總體參數(shù)θ的置信區(qū)間,而概率1-α就稱為是置信概率或置信度。

八、區(qū)間估計的方法(一)均值的區(qū)間估計

1、大樣本下均值的區(qū)間估計由中心極限定理可知,對於大樣本而言,樣本均值的概率分佈總可近似地看作是正態(tài)分佈。若事先給定置信概率為1-α,則查標準正態(tài)分佈概率數(shù)值表,可得標準正態(tài)分佈的上側(cè)分位數(shù)zα/2,就可得出總體均值μ的置信區(qū)間為:(一)均值的區(qū)間估計2、小樣本下正態(tài)總體均值的區(qū)間估計對於來自正態(tài)總體的一個小樣本,在給定的置信概率1-α之下,查自由度為(n-1)的t分佈表,可得t分佈的上側(cè)分位數(shù)tα/2,可得總體均值μ的置信區(qū)間為:

(二)比例的區(qū)間估計總體比例是兩點分佈總體的均值,其估計量樣本比例則是來自該總體的隨機樣本的均值。因此,在大樣本條件下,可根據(jù)中心極限定理用類似於大樣本情形下總體均值區(qū)間估計的方法來對總體比例進行區(qū)間估計。有:(三)方差的區(qū)間估計

由抽樣分佈理論可知,對於來自正態(tài)總體的一個簡單隨機樣本,其修正樣本方差s2與總體方差σ2比值的(n-1)倍服從自由度為(n-1)的χ2分佈。若給定置信概率1-α,查自由度為(n-1)的χ2分佈表可得兩個分位數(shù)χ1-α/2和χα/2,則可得正態(tài)總體方差σ2的置信區(qū)間為:(四)單側(cè)置信區(qū)間

所謂單側(cè)置信區(qū)間,是將待估總體指標的上置信限或下置信限指定在其上界或下界值上,並根據(jù)給定的置信概率求出另一置信限而得到的置信區(qū)間。記待估計總體指標為θ,其取值上界為,取值下界為,樣本估計量為,對於給定的置信概率1-α,若有:

或者,有:

則稱區(qū)間和為總體指標θ的單側(cè)置信區(qū)間。

九、樣本容量的確定若在給定1-α的置信概率之下,要求用樣本均值估計總體均值的抽樣估計誤差不超過δ,則由總體均值的抽樣估計誤差限的計算公式,可計算出必需最小樣本容量。(一)放回抽樣(二)不放回抽樣第六章

假設檢驗

一、假設檢驗的原理二、總體指標假設檢驗三、分佈假設檢驗四、假設檢驗的兩類錯誤及功效一、假設檢驗的原理(一)統(tǒng)計假設和檢驗統(tǒng)計量所謂統(tǒng)計假設,就是關(guān)於總體分佈特徵的某種論斷。關(guān)於總體參數(shù)假設的檢驗,是假設檢驗的核心內(nèi)容。記總體參數(shù)為θ,若要判斷θ是否等於某已知數(shù)值θ0,則該參數(shù)假設可表示為:

H0:θ=θ0,H1:θ≠θ0其中,假設H0:θ=θ0就是所要檢驗的假設,稱為原假設或零假設;而假設H1:θ≠θ0則稱為對立假設或備擇假設。要檢驗某個假設是否正確,需根據(jù)樣本所提供的資訊來進行。包含總體分佈特徵的全部樣本資訊的樣本指標,是進行假設檢驗的依據(jù),稱為檢驗統(tǒng)計量。(二)顯著性水準和拒絕域進行假設檢驗,概率論中關(guān)於小概率事件在一次試驗中是不可能事件的原則是其所遵循的基本原則。通常取小概率事件的概率臨界值為0.05或0.01,用α表示,稱為假設檢驗的顯著性水準。在原假設成立的條件下,由檢驗統(tǒng)計量的概率分佈,對於給定的顯著性水準,就可確定出由抽樣誤差引起的樣本估計值對總體參數(shù)原假設值的可能的最大偏離值,作為判斷原假設正確與否的臨界值。樣本估計量偏離總體參數(shù)原假設值過大的區(qū)域,就是否定原假設的區(qū)域,稱為否定域或拒絕域,而否定域以外的區(qū)域則稱為接受域。(二)顯著性水準和拒絕域

1、雙側(cè)檢驗若要檢驗的假設為:

H0:θ=θ0,

H1:θ≠θ0

則否定域應建立在與原假設值的正負偏離超出給定臨界值的兩邊,這種檢驗方法稱為雙側(cè)檢驗。(二)顯著性水準和拒絕域

2、左側(cè)檢驗若要檢驗的假設為:

H0:θ≥θ0,

H1:θ<θ0

則否定域應建立在與原假設值的負偏離超出給定臨界值的一邊,這種檢驗方法稱為左側(cè)檢驗。(二)顯著性水準和拒絕域

3、右側(cè)檢驗若要檢驗的假設為:

H0:θ≤θ0,

H1:θ>θ0

則否定域應建立在與原假設值的正偏離超出給定臨界值的一邊,這種檢驗方法稱為右側(cè)檢驗。(三)假設檢驗的p值

檢驗統(tǒng)計量的取值落在其實際樣本值之外的概率,就稱為假設檢驗的p值。(四)假設檢驗的程式

(1)提出原假設H0和備擇假設H1;(2)規(guī)定檢驗的顯著性水準α;(3)構(gòu)造用於檢驗的樣本指標,即檢驗統(tǒng)計量;(4)在原假設為真的假定下,根據(jù)檢驗統(tǒng)計量的概率分佈,確定出檢驗統(tǒng)計量的臨界值,並由此臨界值構(gòu)造出檢驗的拒絕域和接受域;或者計算出假設檢驗的p值;(5)比較檢驗統(tǒng)計量的實際樣本值與其臨界值,或者比較檢驗的p值與顯著性水準α,並根據(jù)比較的結(jié)果做出拒絕或不能拒絕原假設的決策。

二、總體指標假設檢驗

(一)均值的檢驗

1、單一總體均值的檢驗

H0:μ=μ0,H1:μ≠μ0或μ<μ0或μ>μ0

(1)大樣本情形——正態(tài)分佈z檢驗

(2)小樣本情形(正態(tài)總體)——t檢驗(一)均值的檢驗

2、兩總體均值的比較

H0:μ1=μ2,H1:μ1≠μ2或μ1>μ2或μ1<μ2

(1)大樣本情形——正態(tài)分佈z檢驗

(2)小樣本情形(正態(tài)總體)——t檢驗其中s2為用自由度加權(quán)的兩樣本方差的平均數(shù)。(二)比例的檢驗

1、單一總體比例的檢驗

——大樣本(1)假設

H0:P=P0,H1:P≠P0

或P>P0

或P<P0

(2)檢驗統(tǒng)計量——正態(tài)分佈z檢驗(二)比例的檢驗

2、兩總體比例的比較

(1)假設

H0:P1=P2,H1:P1≠P2

或P1>P2

或P1<P2

(2)檢驗統(tǒng)計量——正態(tài)分佈z檢驗其中p為兩樣本比例的加權(quán)平均數(shù):(三)方差的檢驗

1、單一總體方差的檢驗(正態(tài)總體)(1)假設或或(2)檢驗統(tǒng)計量——χ2檢驗

(三)方差的檢驗

2、兩總體方差的比較(正態(tài)總體)(1)假設或或(2)檢驗統(tǒng)計量——F檢驗

(四)相關(guān)係數(shù)的檢驗

1、假設H0:ρ=0,H1:ρ≠02、檢驗統(tǒng)計量——t檢驗三、分佈假設檢驗(一)擬合適度檢驗

1、擬合適度檢驗的概念檢驗所考察總體是否服從某種特定的分佈,稱為擬合適度檢驗。

2、擬合適度檢驗的假設

H0:總體服從某分佈,H1:總體不服從某分佈

3、檢驗方法——χ2

檢驗

(二)列聯(lián)表檢驗

1、檢驗的假設

H0:變數(shù)A和B獨立,H1:變數(shù)A和B不獨立

2、檢驗方法——χ2

檢驗

四、假設檢驗的兩類錯誤與功效(一)兩類錯誤的概念

(二)兩類錯誤的概率

第一類錯誤的概率α

,第二類錯誤的概率β

(三)假設檢驗的功效1、功效的概念——備擇假設正確並接受了它的概率為(1-β),此概率就稱為假設檢驗的功效。

2、功效曲線(四)必要樣本容量的確定

1、兩類錯誤發(fā)生概率的關(guān)係假設檢驗中犯第二類錯誤的概率與犯第一類錯誤的概率成反方向關(guān)係,如果既要提高檢驗的功效而又不想使犯第一類錯誤的風險增大,那麼只能是增加樣本容量。

2、必要樣本容量的確定對於總體均值假設H0:μ=μ0,H1:μ=μ1>μ0,使用z檢驗法,可得:第七章

方差分析

一、方差分析的概念二、方差分析的意義三、單因數(shù)數(shù)據(jù)結(jié)構(gòu)模型

四、模型參數(shù)的估計

五、單因數(shù)方差分析表六、各水準效應的多重比較七、隨機區(qū)組試驗與多因素方差分析的特點一、方差分析的概念在科學實驗和生產(chǎn)經(jīng)營活動中,人們常常需要對影響所觀測變數(shù)的各種主要因素進行分析,以便找出各個因素在什麼狀態(tài)下可使所觀測的變數(shù)取得最佳數(shù)值。為此,首先需要在各種主要影響因素的不同狀態(tài)下對所研究變數(shù)的取值進行觀測,然後再對觀測所得數(shù)據(jù)進行比較分析。方差分析就是分析推斷各種因素狀態(tài)對所觀測變數(shù)的影響效應的一種統(tǒng)計分析方法。

二、方差分析的意義首先,需要確定的是一個因數(shù)的各個水準的作用是否相同。如果相同,說明這個因數(shù)不管取哪種水準對觀測變數(shù)無不同影響,那麼這個因數(shù)實際上無關(guān)緊要,可納入平均效應中去,這時稱這個因數(shù)是不顯著的。自然,如果一個因數(shù)的各個水準的作用不同,那麼這時就稱此因數(shù)是顯著的。其次,如果所考察的因數(shù)是顯著的,那麼就要找出該因數(shù)的最佳水準或者各個顯著因數(shù)的各種水準的最佳配合,以指導生產(chǎn)經(jīng)營的實踐活動。

三、單因數(shù)數(shù)據(jù)結(jié)構(gòu)模型

假設所考察的因數(shù)為A,有m個不同的水準A1,A2,…,Am。在各個水準下分別進行了n1,n2,…,nm次獨立實驗觀測,得到變數(shù)觀測值為yij,i=1,2,…,m,j=1,2,…,ni,則有數(shù)據(jù)結(jié)構(gòu)模型為:

yij=μ+αi+εij;i=1,2,…,m;j=1,2,…,ni.

或者寫為:

yij=μi+εij

;i=1,2,…,m;j=1,2,…,ni.

其中μ為平均效應,αi為因數(shù)A的第i個水準Ai對觀測變數(shù)的作用,稱為水準Ai的效應,μi=μ+αi為在水準Ai下觀測變數(shù)的總體平均值,εij仍表示實驗觀測的隨機誤差。

四、模型參數(shù)的估計

(一)總均值和組均值(二)模型參數(shù)的矩估計五、單因數(shù)方差分析表

(一)檢驗的假設

H0:α1=α2=…=αm=0H1:至少αi≠0或

H0:μ1=μ2=…=μmH1:至少μi≠μk

(二)總變動平方和的分解

SST=SSA+SSE即:五、單因數(shù)方差分析表

(三)方差分析表的構(gòu)造(四)檢驗方法——F檢驗(單側(cè))六、各水準效應的多重比較

(一)檢驗假設

H0:αi=αkH1:αi≠αk

或H0:μi=μkH1:μi≠μk

(二)檢驗方法——t檢驗(雙側(cè))

七、多因數(shù)方差分析的特點

一、隨機區(qū)組試驗的特點及其數(shù)據(jù)分析

——試驗單位之間存在較大的差異二、多因數(shù)方差分析的特點

——不同因數(shù)的水準組合可能存在交互作用第八章回歸分析

一、回歸的概念與回歸模型的確定二、樣本觀測模型和樣本回歸函數(shù)三、一元線性回歸分析四、多元線性回歸分析五、回歸診斷一、回歸的概念與模型確定

設隨機變數(shù)y與變數(shù)x1、x2、…、xk之間存在相關(guān)關(guān)係,則y與x1、x2、…、xk的數(shù)學模型可表示為:

y=f(x1,x2,…,xk)+u

其中u為隨機因素影響,若引數(shù)x1、x2、…、xk的值給定時,隨機影響u的期望為0,則因變數(shù)y的條件數(shù)學期望就是唯一確定的,即有:

E(y/x)=f(x1、x2、…、xk)

此條件期望就稱為y的回歸值,表示y的回歸值與引數(shù)關(guān)係的函數(shù)式就稱為y的回歸函數(shù)。若引數(shù)只有一個,則稱為一元回歸函數(shù);若引數(shù)有兩個或多個,則稱為多元回歸函數(shù)。一、回歸的概念與模型確定

回歸模型的確定方法有二:(一)定性分析(二)線性近似——實踐中,常用的回歸函數(shù)為線性函數(shù),相應的數(shù)學模型的形式為:

y=β0+β1x1+β2x2+…+βkxk+u

其中β0、β1、β2、…、βk統(tǒng)稱為回歸係數(shù),因變數(shù)y對引數(shù)x1、x2、…、xk的回歸函數(shù)為:

E(y/x)=β0+β1x1+β2x2+…+βkxk

二、樣本觀測模型和樣本回歸函數(shù)

設樣本觀測值為(yj,x1j,x2j,…,xkj),j=1,2,…,n,則對於線性模型來說,有:

yj=β0+β1x1j+β2x2j+…+βkxkj+uj

,

j=1,…,n.

這n個關(guān)係式稱為因變數(shù)y的觀測模型。由此觀測模型可估計得出模型中各個參數(shù)的估計值,從而得出樣本回歸函數(shù)為:三、一元線性回歸分析

(一)散點圖設樣本觀測值分別為(x1y1)、(x2,y2)、…、(xn,yn),在平面直角坐標系內(nèi)將這n對觀測值用n個點表示出來,所形成的圖形稱為散點圖。通過觀察散點圖的形狀,可輔助判斷回歸函數(shù)的具體形式。一元線性回歸模型的形式為:

y=β0+β1x+u(二)模型參數(shù)的最小二乘估計

1、最小二乘估計的原理所謂最小二乘估計,就是尋找使樣本觀測模型的隨機誤差平方和最小的參數(shù)值作為回歸模型參數(shù)的估計值。

2、求一元線性回歸模型係數(shù)的正規(guī)方程組(二)模型參數(shù)的最小二乘估計

3、回歸係數(shù)的最小二乘估計公式

4、樣本回歸方程(二)模型參數(shù)的最小二乘估計

5、殘差與殘差平方和的計算

6、回歸模型隨機誤差的方差的估計(三)回歸的方差分析

1、因變數(shù)總變動平方和的分解即:SST=SSR+SSE2、判定係數(shù)(三)回歸的方差分析

3、一元線性回歸的方差分析表

4、檢驗假設

H0:ρ=0,H1:ρ≠05、檢驗方法——F檢驗方差來源平方和自由度均方F值p值回歸殘差SSRSSE1n-2SSRSSE/(n-2)Fp總和SSTn-1

(四)回歸係數(shù)的t檢驗

1、檢驗的假設

H0:β1=0,

H1:β1≠0

H0:β0=0,

H1:β0≠02、檢驗的方法——t檢驗(五)利用回歸直線進行預測

所謂預測就是在給定引數(shù)x的數(shù)值的條件下,估計因變數(shù)y的數(shù)值,有點預測和區(qū)間預測兩種。

1、點預測

2、區(qū)間預測

(六)一元線性回歸模型的推廣

實踐中,有時用線性模型來描述變數(shù)x和y之間的關(guān)係並不恰當,這時就需要考慮各種曲線模型。對於有些曲線模型來說,容易將它們化成下麵的形式:

g(y)=β0+β1h(x)+u

若仍假定隨機誤差u服從正態(tài)分佈即u~N(0,σ2),則y對x的曲線回歸問題就可化為函數(shù)g(y)對函數(shù)h(x)的直線回歸問題,從而就可用一元線性回歸的方法來處理,這實際上是一元線性回歸模型和方法的推廣。

四、多元線性回歸分析(一)多元線性回歸模型的設定

(二)模型參數(shù)的最小二乘估計

(三)多元線性回歸模型的假設檢驗

(四)偏相關(guān)係數(shù)和複相關(guān)係數(shù)(五)利用多元線性回歸模型進行預測(六)多元線性回歸模型的推廣

五、線性回歸診斷

(一)回歸診斷的內(nèi)容

1、線性回歸分析的基本假定——對於線性回歸模型,通常假定隨機誤差uj滿足下列假定:

(1)數(shù)學期望為0,即E(uj)=0;

(2)具有同一方差σ2,即Var(uj)=σ2;

(3)相互獨立,即Cov(ui,uj)=0;

(4)服從正態(tài)分佈,即uj~N(0,σ2)。

2、回歸診斷的內(nèi)容——所謂回歸診斷,主要就是診斷樣本觀測數(shù)據(jù)是否滿足回歸分析的基本假定,以及樣本觀測數(shù)據(jù)中是否存在不同於絕大部分數(shù)據(jù)的異常數(shù)據(jù),等等。

(二)回歸診斷的方法

1、殘差圖進行回歸診斷,通??捎脷埐顖D進行。所謂殘差圖就是以因變數(shù)的觀測值yj或引數(shù)值x1j、x2j、…、xkj或因變數(shù)回歸值等為橫坐標,且以殘差或其標準化數(shù)值為縱坐標所作出的散點圖。(二)回歸診斷的方法

2、異方差與方差穩(wěn)定性變換所謂異方差,就是指因變數(shù)的方差不是常數(shù),而是隨著自身取值的變化而變化,或者隨著某個或某些引數(shù)取值的變化而變化。對於具有這種異方差性的樣本數(shù)據(jù),其殘差圖通常表現(xiàn)為在因變數(shù)回歸值較小的一端殘差點的散佈範圍窄,而在因變數(shù)回歸值較大的一端殘差點的散佈範圍寬,因而就可以用殘差圖來診斷是否存在異方差性。如果樣本數(shù)據(jù)具有異方差性,那麼可通過對因變數(shù)或一些引數(shù)作變換,來改善方差的非齊性。這些變換統(tǒng)稱為方差穩(wěn)定化變換,

(三)異常數(shù)據(jù)的診斷

1、異常數(shù)據(jù)的概念所謂異常數(shù)據(jù)是指相對於多數(shù)觀測數(shù)據(jù)而言殘差絕對值較大的個別觀測數(shù)據(jù),通常稱為奇異值或奇異點。

2、異常數(shù)據(jù)的檢測異常數(shù)據(jù)在樣本的散點圖上表現(xiàn)為遠離絕大多數(shù)觀測點的孤立點,在殘差圖上則表現(xiàn)為殘差值很大而遠離大多數(shù)殘差點的孤立點,因此也可以用殘差圖來進行診斷樣本數(shù)據(jù)中是否有異常點,以及判斷哪些觀測數(shù)據(jù)點可能是異常點。

第九章時間序列分析

一、時間序列的採集與分類二、時間序列特徵指標測度三、時間序列構(gòu)成分析四、時間序列自回歸分析一、時間序列的採集與分類

所謂時間序列,就是按照時間順序觀測取得的某個統(tǒng)計指標的一系列觀測值,也稱為時間數(shù)列。時間序列是對某個事物的發(fā)展過程按照時間順序觀測所取得的一個樣本,而人們所研究事物的發(fā)展過程就是所要研究的總體。樣本作為總體的代表,可以反映出事物發(fā)展過程的一些特點和規(guī)律。因此,類似於截面數(shù)據(jù),時間序列作為一種重要的統(tǒng)計數(shù)據(jù)在統(tǒng)計分析中也具有重要的作用。

(一)時間序列的採集

1、瞬間採樣。若所考察的統(tǒng)計指標是事物的存量指標,則可以每隔一定的時間,觀測登記一次其在當時的現(xiàn)存數(shù)量,稱為瞬間採樣。

2、累積採樣。若所考察的統(tǒng)計指標是事物的流量指標,則可以每隔一定的時間,計算登記一次其在以前某段時間內(nèi)的累積發(fā)生數(shù)量,稱為累積採樣。

3、特徵採樣。對於所考察的事物,也可每隔一定的時間,計算登記一次其在以前某段時間內(nèi)的特徵值,稱為特徵採樣。(二)時間序列的分類

1、按指標性質(zhì)分類(1)時點序列。由瞬間採樣方法得到的時間序列即存量指標的一系列順序觀測值序列,稱為時點序列。(2)時期序列。由累積採樣方法得到的時間序列即流量指標的一系列順序觀測值序列,稱為時期序列。(3)特徵序列。由特徵採樣方法得到的時間序列即特徵指標的一系列順序觀測值序列,稱為特徵序列。(二)時間序列的分類

2、按指標數(shù)值變化特徵分類(1)平穩(wěn)序列。如果一個時間序列中的指標數(shù)值不存在持續(xù)增長或下降的趨勢,並且其波動的幅度在不同的時間也沒有明顯的差異,那麼該時間序列就是一個平穩(wěn)序列。(2)非平穩(wěn)序列。如果一個時間序列中的指標數(shù)值存在著持續(xù)增長或下降的趨勢,或者其波動的幅度在不同的時間有明顯的差異,那麼該時間序列就是一個非平穩(wěn)序列。(三)時間序列分析的意義

首先,揭示事物發(fā)展變化過程中的各種特徵和特點,認識事物的運動方式,把握事物的發(fā)展方向,掌握其發(fā)展變化的趨勢和規(guī)律。其次,運用已經(jīng)掌握的事物發(fā)展變化的特點和規(guī)律,對事物未來的發(fā)展變化進行有效的推斷和預測。再次,揭示各種事物變動之間的相互關(guān)係和相互作用方式,以便利用這些已經(jīng)掌握的事物之間的作用方式,對某些事物的發(fā)展變化實施有效的控制。

二、時間序列特徵指標測度

一、時間序列均值的測度

二、時間序列的波動性與自相關(guān)性測度

一、時間序列特徵指標測度

(一)時間序列均值的測度

1、趨勢平穩(wěn)序列均值的計算對於不存在持續(xù)增長或下降趨勢的時間序列即趨勢平穩(wěn)序列,其各個數(shù)值均圍繞著一個固定的數(shù)值上下波動,其均值就代表了各個數(shù)值的波動中心,因此計算其均值是有意義的。設給定的均值平穩(wěn)時間數(shù)列為x1、x2、…、xn,則其均值就為:(一)時間序列均值的測度

2、趨勢非平穩(wěn)序列的平穩(wěn)化變換

(1)差分變換

xt=Δyt=yt-yt-1

(2)環(huán)比變換(3)對數(shù)差分變換

xt=Δlog(yt)=log(yt)-log(yt-1)(一)時間序列均值的測度

3、平均增長率的兩種計算方法

(1)幾何平均法

假設所給定的具有等比或近似等比增長趨勢的時間序列為y0、y1、y2、…、yn,則通過環(huán)比變換,就可以得到一個環(huán)比發(fā)展速度序列為x1、x2、…、xn,則平均發(fā)展速度為:

(一)時間序列均值的測度3、平均增長率的兩種計算方法

(2)代數(shù)平均法

從最初水準出發(fā),用平均發(fā)展速度等比增長推算,令各期推算水準之和等於各期實際水準之和,則有方程式為:(二)時間序列的波動性與

自相關(guān)性測度

1、自協(xié)方差記給定的時間序列為x1、x2、…、xn,則其自協(xié)方差可定義為:

2、自相關(guān)係數(shù)三、時間序列構(gòu)成分析

(一)時間序列的構(gòu)成因素與構(gòu)成模型

1、趨勢變動T(t)2、季節(jié)變動S(t)3、迴圈變動C(t)4、隨機變動I(t)

加法模型:Y(t)=T(t)+S(t)+C(t)+I(t)

乘法模型:Y(t)=T(t)·S(t)·C(t)·I(t)

(二)長期趨勢的測定

1、常用的長期趨勢模型

(1)直線趨勢模型:T(t)=a+bt(2)指數(shù)曲線趨勢:T(t)=abt(3)二次曲線趨勢:T(t)=a+bt+ct2(4)修正指數(shù)曲線:T(t)=k+abt(5)邏輯曲線模型:T(t)=k/(1+abt)(6)龔珀茨曲線模型:(7)雙指數(shù)曲線模型:T(t)=k+ae-αt+be-βt

(二)長期趨勢的測定

2、趨勢模型參數(shù)的估計方法

(1)最小二乘法

例如,對於直線趨勢模型:

T(t)=a+bt使用最小二乘法可得參數(shù)a和b估計值為:

(二)長期趨勢的測定

2、趨勢模型參數(shù)的估計方法

(2)分段總和法例如,對於修正指數(shù)曲線趨勢模型:

T(t)=k+abt

將時間序列等分為三段,各段分別求和,則得方程組為:(三)季節(jié)變動的測定

1、同期直接平均法

(1)計算各季(月)平均數(shù)(2)計算總平均數(shù)

(3)計算季節(jié)指數(shù)(三)季節(jié)變動的測定

2、同期移動平均法

(1)計算各期移動平均數(shù)(2)計算各期季節(jié)隨機值(3)計算季節(jié)指數(shù)(4)分攤計算誤差(四)迴圈變動的測定

1、直接測定法

(1)計算各期的年距環(huán)比發(fā)展速度

(2)使用移動平均法計算迴圈指數(shù)(四)迴圈變動的測定

2、剩餘測定法

(1)計算各期的迴圈隨機值

(2)使用移動平均法計算迴圈指數(shù)(五)隨機變動的測定

對於一個時間序列,若已分別測定得出其長期趨勢,季節(jié)變動和迴圈變動,則將這三種變動逐一分離出去,所餘即為隨機變動。即:

四、時間序列自回歸分析(一)時間序列自回歸模型的構(gòu)建

1、平穩(wěn)時間序列自回歸模型

2、非平穩(wěn)時間序列自回歸模型(1)差分自回歸模型(2)帶趨勢項的自回歸模型(一)時間序列自回歸模型的構(gòu)建3、季度或月份時間序列自回歸模型(1)季節(jié)差分自回歸模型(2)帶季節(jié)虛擬變數(shù)的自回歸模型(二)時間序列自回歸模型的

估計與檢驗

1、時間序列自回歸模型階數(shù)的選擇

——從最低階開始進行比較

2、時間序列自回歸模型的估計

——最小二乘法

3、時間序列自回歸模型的檢驗

——回歸係數(shù)t檢驗(三)應用時間序列自回歸模型進行預測

根據(jù)時間序列自回歸模型進行預測,也就是將時間序列變數(shù)的現(xiàn)在和過去的實際值代入自回歸模型得出未來的估計值,將現(xiàn)在和過去的實際值以及未來的估計值代入自回歸模型,得出更遠的未來的估計值。第十章統(tǒng)計決策分析

一、統(tǒng)計決策的要素和程式二、非概率型決策三、先驗概率型決策四、後驗概率型決策

一、統(tǒng)計決策的要素和程式(一)決策的概念——針對面臨的問題和客觀環(huán)境,做出某種行動決定的過程,就是決策。如果決策過程中所使用的分析推斷方法主要是統(tǒng)計分析推斷方法,那麼這種決策就被稱為統(tǒng)計決策。(二)決策的類型劃分

1、確定性決策

2、非確定性決策——(1)概率型決策(2)非概率型決策一、統(tǒng)計決策的要素和程式(三)統(tǒng)計決策三要素——決策者面對的客觀環(huán)境具有不確定性,需要使用統(tǒng)計分析推斷方法對決策的行動結(jié)果進行分析,這是統(tǒng)計決策的主要特徵。進行統(tǒng)計決策,必須具有以下三個基本要素。(1)客觀環(huán)境的可能狀態(tài)集——Θ={θi}(2)決策者的可行行動集——A={aj}(3)決策行動的收益函數(shù)或損失函數(shù)

——收益函數(shù)Q(θi,aj)或損失函數(shù)L(θi,aj)

一、統(tǒng)計決策的要素和程式(四)常用的損失函數(shù)

1、線性損失函數(shù)

2、平方誤差損失函數(shù)

一、統(tǒng)計決策的要素和程式(五)收益矩陣表和損失矩陣表

當客觀環(huán)境的狀態(tài)集和決策者的行動集都只包含有限個元素時,決策行動的收益函數(shù)或損失函數(shù)也可用收益矩陣表和損失矩陣表來表示。

一、統(tǒng)計決策的要素和程式一個完整的統(tǒng)計決策過程包括有下列四個步驟:(1)確定決策目標(2)擬定各種可行的行動方案(3)通過比較分析選出最佳的行動方案(4)決策的執(zhí)行統(tǒng)計決策的這四個步驟,又分別稱為統(tǒng)計決策的參謀活動階段,設計活動階段,抉擇活動階段和任務執(zhí)行階段。二、非概率型決策

(一)非概率型決策的條件非概率型決策就是決策者在僅僅知道客觀環(huán)境可能有哪幾種狀態(tài)、但卻不知道每一種可能狀態(tài)出現(xiàn)概率的條件下的決策。這也就是說,非概率決策也就是在僅僅具備決策的三個基本要素的條件下的決策。(二)非概率型決策的準則

1、大中取大準則大中取大準則也稱為樂觀準則,決策者按照對客觀環(huán)境狀態(tài)的最樂觀的設想,尋求取得最大的收益。按照這種準則進行決策,首先可找出每個行動方案下收益函數(shù)的最大值,然後再找出這些最大值中的最大值,並將此最大值所屬的行動方案作為最終選擇出的行動方案。如果記大中取大準則下的最佳行動方案為a*,則有:

(二)非概率型決策的準則

2、小中取大準則小中取大準則也稱為悲觀準則,決策者按照對客觀環(huán)境狀態(tài)的最悲觀的設想,尋求取得最大的收益。按照這種準則進行決策,首先可找出每個行動方案下收益函數(shù)的最小值,然後再找出這些最小值中的最大值,並將此最大值所屬的行動方案作為最終選擇出的行動方案。如果記小中取大準則下的最佳行動方案為a*,則有:

(二)非概率型決策的準則

3、折中準則折中準則又稱為赫維茨準則,決策者可以根據(jù)知識和經(jīng)驗選取一個係數(shù)值α,0<α<1,作為對客觀環(huán)境的樂觀判斷與悲觀判斷的折中係數(shù),然後用此折中係數(shù)計算每一個行動方案的最大收益和最小收益的折中值,最後選出折中值最大的行動方案作為最終選定的行動方案。記行動方案a的折中值為H(a),則其計算公式可表示為:

(二)非概率型決策的準則

4、大中取小準則

大中取小準則就是從損失函數(shù)的角度出發(fā)給出的決策準則,也稱為薩維奇(Savage)準則。按照這種準則進行決策,首先可找出每個行動方案下?lián)p失函數(shù)的最大值,然後再找出這些最大值中的最小值,並將此最小值所屬的行動方案作為最終選擇出的行動方案。如果記大中取小準則下的最佳行動方案為a*,則有:

三、先驗概率型決策(一)先驗概率型決策的條件如果決策者除了掌握有客觀環(huán)境的可能狀態(tài)集、決策者的可行行動集和決策行動的收益函數(shù)或損失函數(shù)這三個進行決策分析的基本要素之外,還掌握有客觀環(huán)境的各種可能狀態(tài)出現(xiàn)的先驗概率分佈,那麼就可以使用先驗概率型決策分析方法進行分析。(二)先驗概率型決策的準則

1、期望損益準則所謂期望損益準則,就是以每個行動方案的期望收益或期望損失為標準,選出期望收益最大或者期望損失最小的行動方案,作為最終確定的行動方案。仍記決策者選中的行動方案為a*,則按照期望損益準則進行決策就必須有:或者有:(二)先驗概率型決策的準則

2、最大可能準則可以看出,期望損益準則無疑是進行重複性決策的一個不錯的準則,但是在經(jīng)濟管理和商務活動中,也有許多決策問題並不能重複出現(xiàn),而只是一種一次性決策問題。對於一次性決策問題來說,期望損益準則就不見得仍是一個不錯的決策準則。實際上,對於一次性決策來說,平均意義的期望收益和期望損失根本就無從談起,所以期望損益準則並不合適。在一次性決策中,一個可用的決策準則就是最大可能準則。所謂最大可能準則,就是選擇在最可能出現(xiàn)的客觀狀態(tài)下收益最大或損失最小的行動方案作為最終選定的行動方案。

(二)先驗概率型決策的準則

3、渴望水準準則所謂渴望水準準則,就是以決策者的渴望收益值為標準,選取最大可能取得此渴望收益值的行動方案作為所選擇的行動方案。若記決策者的渴望收益值為Q*,決策者採取行動方案a可取得的收益大於決策者的渴望收益值的概率為P[Q(θ,a)≥Q*],則按照渴望水準準則,決策者的最佳行動方案a*就是滿足下式的那個行動方案:

(三)決策樹技術(shù)

統(tǒng)計決策還可以用圖的形式進行,決策實踐中常用的圖形是決策樹,其名稱來源於圖的形狀像棵樹。

四、後驗概率型決策

(一)後驗概率型決策的概念決策者事先對客觀環(huán)境各種可能狀態(tài)的概率分佈的估計或判斷,就是先驗概率分佈,而通過樣本調(diào)查觀測所取得的有關(guān)客觀環(huán)境的資訊,就是樣本資訊,根據(jù)樣本資訊對原有的先驗概率分佈加以修正,所得到的修正後的有關(guān)客觀環(huán)境各種可能狀態(tài)出現(xiàn)的概率分佈,稱為後驗概率分佈。後驗概率分佈既包含了先驗概率分佈中有關(guān)客觀環(huán)境可能狀態(tài)的資訊,也綜合了樣本中這方面的資訊。因此,利用客觀環(huán)境可能狀態(tài)的後驗概率分佈進行決策,必然會使決策的可靠性更高,效果更佳。利用後驗概率分佈進行的決策,也稱為貝葉斯決策。(二)後驗概率分佈的計算

假設客觀環(huán)境共有N種可能的狀態(tài),第i種可能狀態(tài)記為Ai,該狀態(tài)出現(xiàn)的先驗概率記為P(Ai),在該狀態(tài)出現(xiàn)的條件之下事件B發(fā)生的概率記為P(B/Ai),則由概率論中的貝葉斯法則可知,在觀察到事件B發(fā)生的條件下,客觀狀態(tài)Ai出現(xiàn)的概率即後驗概率為:

(三)後驗概率型決策的準則

類似於先驗概率型決

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論