幾種統(tǒng)計分析模型介紹_第1頁
幾種統(tǒng)計分析模型介紹_第2頁
幾種統(tǒng)計分析模型介紹_第3頁
幾種統(tǒng)計分析模型介紹_第4頁
幾種統(tǒng)計分析模型介紹_第5頁
已閱讀5頁,還剩48頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、幾種統(tǒng)計分析模型介紹第1頁,共53頁,2022年,5月20日,9點17分,星期一張業(yè)圳福建師范大學經濟學院副教授、博士、財金系副主任主要教學研究方向:數(shù)量經濟學與金融實證分析聯(lián)系電話:87369087 Email: Q Q: 107345901地址:福建師范大學經濟學院郵編:350108第2頁,共53頁,2022年,5月20日,9點17分,星期一經濟統(tǒng)計分析 統(tǒng)計學研究如何測定、收集、整理、歸納和分析反映客觀現(xiàn)象總體數(shù)量的數(shù)據(jù),以便給出正確認識的方法論科學。 經濟統(tǒng)計分析就是用統(tǒng)計方法來分析經濟現(xiàn)象數(shù)量特征和經濟變量之間的關系。主要的工作有:1)分析經濟現(xiàn)象中變量之間相互關系2)經濟預測3)政

2、策評價第3頁,共53頁,2022年,5月20日,9點17分,星期一什么是經濟統(tǒng)計分析模型模型 對現(xiàn)實的描述和模擬。 用不同方法對現(xiàn)實進行描述和模擬,就構成不同的模型。語義模型、物理模型、幾何模型、數(shù)學模型和計算機模擬模型。 經濟數(shù)學模型:用數(shù)學方法描述經濟活動。采用的數(shù)學方法不同,對經濟活動提示的程度不同,構成各類不同的經濟數(shù)學模型。數(shù)理經濟模型計量經濟學模型 第4頁,共53頁,2022年,5月20日,9點17分,星期一本次培訓主要模型1、聚類分析2、回歸分析3)因子分析和主成分分析4)時間序列分析第5頁,共53頁,2022年,5月20日,9點17分,星期一第一部分:預備知識第6頁,共53頁,

3、2022年,5月20日,9點17分,星期一樣本與統(tǒng)計量 總體與樣本 在數(shù)理統(tǒng)計中,把研究對象的全體稱為總體(population)或母體,而把組成總體的每個單元稱為個體。 抽樣 要了解總體的分布規(guī)律,在統(tǒng)計分析工作中,往往是從總體中抽取一部分個體進行觀測,這個過程稱為抽樣。 第7頁,共53頁,2022年,5月20日,9點17分,星期一樣本與統(tǒng)計量 子樣 子樣 是n個隨機變量,抽取之后的觀測數(shù)據(jù) 稱為樣本值或子樣觀察值。 在抽取過程中,每抽取一個個體,就是對總體X進行一次隨機試驗,每次抽取的n個個體 ,稱為總體X的一個容量為n的樣本(sample)或子樣;其中樣本中所包含的個體數(shù)量稱為樣本容量。

4、第8頁,共53頁,2022年,5月20日,9點17分,星期一隨機抽樣方法的基本要求 獨立性即每次抽樣的結果既不影響其余各次抽樣的 結果,也不受其它各次抽樣結果的影響。 滿足上述兩點要求的子樣稱為簡單隨機子樣.獲得簡單隨機子樣的抽樣方法叫簡單隨機抽樣. 從簡單隨機子樣的含義可知,樣本 是來自總體 、與總體 具有相同分布的隨機變量.代表性即子樣( )的每個分量 與總體 具有相同的概率分布。 第9頁,共53頁,2022年,5月20日,9點17分,星期一簡單隨機抽樣 例如:要通過隨機抽樣了解一批產品的次品率,如果每次抽取一件產品觀測后放回原來的總量中,則這是一個簡單隨機抽樣。 但實際抽樣中,往往是不再

5、放回產品,則這不是一個簡單隨機抽樣。但當總量N很大時,可近似看成是簡單隨機抽樣。 例如:為了分析福建省居民家庭收入狀況,對福建省居民家庭收入進行調查。第10頁,共53頁,2022年,5月20日,9點17分,星期一統(tǒng)計量 則 例如: 設 是從正態(tài)總體 中抽取的一個樣本,其中 為已知參數(shù), 為未知參數(shù),是統(tǒng)計量 不是統(tǒng)計量 定義 設( )為總體X的一個樣本, 為不含任何未知參數(shù)的連續(xù)函數(shù),則稱 為樣本( )的一個統(tǒng)計量。第11頁,共53頁,2022年,5月20日,9點17分,星期一幾個常用的統(tǒng)計量 樣本均值(sample mean)設 是總體 的一個樣本,樣本方差(sample variance)

6、 第12頁,共53頁,2022年,5月20日,9點17分,星期一樣本均方差或標準差 它們的觀測值用相應的小寫字母表示.反映總體X取值的平均,或反映總體X取值的離散程度。幾個常用的統(tǒng)計量 設 是總體 的一個樣本,第13頁,共53頁,2022年,5月20日,9點17分,星期一子樣的K階(原點)矩幾個常用的統(tǒng)計量 設 是總體 的一個樣本,子樣的K階中心矩第14頁,共53頁,2022年,5月20日,9點17分,星期一它包括兩個方面數(shù)據(jù)整理 計算樣本特征數(shù)數(shù)據(jù)的簡單處理 為了研究隨機現(xiàn)象,首要的工作是收集原始數(shù)據(jù).一般通過抽樣調查或試驗得到的數(shù)據(jù)往往是雜亂無章的,需要通過整理后才能顯示出它們的分布狀況。

7、數(shù)據(jù)的簡單處理是以一種直觀明了方式加工數(shù)據(jù)。第15頁,共53頁,2022年,5月20日,9點17分,星期一計算樣本特征數(shù): 數(shù)據(jù)的簡單處理 數(shù)據(jù)整理:將數(shù)據(jù)分組 計算各組頻數(shù) 作頻率分布表 作頻率直方圖(1)反映趨勢的特征數(shù) 樣本均值中位數(shù):數(shù)據(jù)按大小順序排列后,位置居中的那個數(shù) 或居中的兩個數(shù)的平均數(shù)。眾數(shù):樣本中出現(xiàn)最多的那個數(shù)。 第16頁,共53頁,2022年,5月20日,9點17分,星期一數(shù)據(jù)的簡單處理 (2)反映分散程度的特征數(shù):極差、四分位差 極差樣本數(shù)據(jù)中最大值與最小值之差, 四分位數(shù)將樣本數(shù)據(jù)依概率分為四等份的3個數(shù)椐, 依次稱為第一、第二、第三四分位數(shù)。第一四分位數(shù)Q1: 第

8、二四分位數(shù)Q2: 第三四分位數(shù)Q3: 第17頁,共53頁,2022年,5月20日,9點17分,星期一第二部分:參數(shù)估計第18頁,共53頁,2022年,5月20日,9點17分,星期一第一節(jié) 參數(shù)的點估計 一、點估計問題 設總體 X 的分布函數(shù)的形式為已知的F ( x, ) ,其中 x 是自變量,為未知參數(shù)(它可以是一個數(shù),也可以是一個向量)借助于總體 X 的一個樣本(X 1, X 2, , X n ),來估計未知參數(shù)的值的問題,稱為參數(shù)的點估計問題 點估計的問題就是要構造一個適當?shù)慕y(tǒng)計量 ( X1, X2, ,Xn ),用樣 本的一組觀察值( x1, x2, ,xn ),得到 的觀察值 ( x1

9、, x2, ,xn ), 以此來估計未知參數(shù) 稱統(tǒng)計量 ( X 1, X 2, , X n )為的估計量,稱( x1, x2, ,xn )為的估計值第19頁,共53頁,2022年,5月20日,9點17分,星期一二、矩估計法 的函數(shù),記作l=l( ) 即 ,l=1,2,,k 設總體 X 的分布函數(shù)為 , 其中 為 k 個未知參數(shù). 假設總體 X 的各階原點矩 存在, 則E (X l )是 對于總體 X 的樣本( X1, X2, ,Xn ),樣本的 l 階原點矩為 ,l = 1, 2, ,k 令l = Al , l=1,2,,k,第20頁,共53頁,2022年,5月20日,9點17分,星期一即 從

10、上述方程組中解出 ,分別記作以此作為未知參數(shù) 的估計量,稱為矩估計量第21頁,共53頁,2022年,5月20日,9點17分,星期一 如果樣本觀察值為( x1, x2, ,xn ),則得未知參數(shù) 的矩估計值為上述估計未知參數(shù)的方法就叫做矩估計法第22頁,共53頁,2022年,5月20日,9點17分,星期一解此方程組得到 與 的矩估計量為令即解 例1 設總體 X 的均值為,方差為 ,且 ,但與 均未知,又設總體 X 的一個樣本為(X1, X2 , , Xn),求與 的矩估計量第23頁,共53頁,2022年,5月20日,9點17分,星期一 解 由例4可得 例2 某廠生產一批鉚釘,現(xiàn)要檢驗鉚釘頭部直徑

11、,從這批產品中隨機抽取12只,測得頭部直徑(單位:mm)如下: 13.3013.3813.4013.4313.3213.48 13.5413.3113.3413.4713.4413.50設鉚釘頭部直徑這一總體 X 服從正態(tài)分布 ,試求 與 的矩估計值 注 此例說明,無論總體 X 服從什么分布,樣本均值 都是總體均值 的矩估計量,樣本二階中心矩就是總體方差 的矩估計量第24頁,共53頁,2022年,5月20日,9點17分,星期一三、極大似然估計法 1設總體X為離散型隨機變量,其分布律為其中為未知參數(shù),取值范圍為 設 X1, X2, , Xn為來自 X 的樣本,則 X1, X2, ,Xn 的聯(lián)合分

12、布律為 又設 x1, x2, , xn 為一組樣本值,令 稱 L()為樣本的似然函數(shù)(1) 若有 ,使得對一切 ,有成立,則稱 為的極大( 或最大 )似然估計值,相應的統(tǒng)計量 稱為的極大( 或最大 )似然估計量第25頁,共53頁,2022年,5月20日,9點17分,星期一 我們規(guī)定,使得 的 就是的極大似然估計值由于ln x是單增函數(shù),所以 與 有相同的駐點,因此只需從 中解出 就是的極大似然估計值,稱方程(2)(2)為極大似然方程第26頁,共53頁,2022年,5月20日,9點17分,星期一 例3 設總體 , 與 未知,( X1, X2 , , Xn )為總體 X 的樣本,求 與的極大似然估

13、計量 解 X 的概率密度為設 x1, x2, xn 為樣本值,似然函數(shù)為第27頁,共53頁,2022年,5月20日,9點17分,星期一令解得 與 的極大似然估計值為因此, 與 的極大似然估計量為第28頁,共53頁,2022年,5月20日,9點17分,星期一四、估計量的評選標準 1無偏性 估計量是樣本的函數(shù),它是一個隨機變量,由不同的方法得到的估計量可能相同也可能不同而對同一估計量,由不同的樣本觀察值得到參數(shù)的估計值也可能不同我們很自然地要求估計量的期望等于參數(shù)的真值,即無偏性 定義 設 是未知參數(shù)的估計量,若 ,則稱 為的無偏估計(量)第29頁,共53頁,2022年,5月20日,9點17分,星

14、期一 例4 設總體 X 的均值為 ,( X1, X2, X3 )是總體 X 的樣本,證明下列兩個估計量都是 的無偏估計 證 由于 所以 與 都是 的無編估計(只需 k1+ k2 + + kn =1,則 = k1 X1 + k2 X2 + + kn Xn 就是 的無偏估計)第30頁,共53頁,2022年,5月20日,9點17分,星期一 設 為參數(shù)的估計量,若當 時, 按概率收斂于 ,即對于任意正數(shù),有 ,則稱 為的一致估計(量) 3一致性 根據(jù)大數(shù)定律可知,樣本均值 是總體均值 的一致估計量 設 與 是參數(shù)的兩個無偏估計量,若 ,則稱 比 有效.2有效性第31頁,共53頁,2022年,5月20日

15、,9點17分,星期一第二節(jié) 參數(shù)的區(qū)間估計 點估計是通過構造統(tǒng)計量 (X1, X2, , Xn)來對總體 X 中的未知參數(shù)進行估計,由一個樣本值( x1, x2, , xn )可得到的估計值 ( x1, x2, , xn ) 這種估計值是無法知道誤差的我們要定出一個范圍,并要求以一定的概率保證這個范圍包含著的真值這個范圍通常以區(qū)間的形式給出,我們把這個區(qū)間稱為置信區(qū)間 定義 設總體 X 的分布中含有一個未知參數(shù) ,(X1, X2, , Xn )是來自總體 X 的一個樣本如果對于給定的常數(shù) ,統(tǒng)計量 1= 1 (X1, X2, , Xn )與2= 2(X1, X2, , Xn )滿足 (1)則稱

16、隨機區(qū)間(1 ,2 )是的置信度為 的置信區(qū)間,分別稱1與2為的置信下限與置信上限第32頁,共53頁,2022年,5月20日,9點17分,星期一 例1 設總體 , 為已知, 未知,( X1, X2, ,Xn )為來自總體 X 的一個樣本,求 的置信度為 的置信區(qū)間 解 由于 是 的無偏估計,且有由正態(tài)分布表可查得 ,使 1 稱為置信度或置信水平(1)式的含義是,隨機區(qū)間(1 ,2 )以 的概率包含著 , 也就是說,對每一個樣本值 ( x1, x2, , xn )可求得一個具體的區(qū)間(1(x1, x2, , xn ),2 (x1, x2, , xn )在這些眾多的區(qū)間中,包含的有100 ( )

17、%個,不包含的有100 %個第33頁,共53頁,2022年,5月20日,9點17分,星期一即有取 ,于是得到 的置信度為 的置信區(qū)間為第34頁,共53頁,2022年,5月20日,9點17分,星期一 求未知參數(shù)的置信區(qū)間的一般方法: 1對于給定的樣本X1, X2, , Xn,構造樣本函數(shù) ,它包含待估參數(shù) ,而不含其它未知參數(shù),并且 Z 的分布已知,在 Z 的分布中不依賴任何未知參數(shù) 2對于給定的置信度 ,定出兩個常數(shù) a,b(一般地,按 Z 所服從的分布的上 分位點來確定),使 3從 a Z (X1, X2, , Xn ) b 得到等價的不等式1(X1, X2, , Xn ) 68引例2中的備

18、擇假設是雙側的如果根據(jù)以往的生產情況,0=68現(xiàn)采用了新工藝,關心的是新工藝能否提高螺釘強度, 越大越好此時,可作如下的假設檢驗:第48頁,共53頁,2022年,5月20日,9點17分,星期一當原假設H0 : = 0 = 68為真時,取較大值的概率較小當備擇假設H1: 68為真時,取較大值的概率較大給定顯著性水平 ,根據(jù)可確定拒絕域第49頁,共53頁,2022年,5月20日,9點17分,星期一因而,接受域稱這種檢驗為右邊檢驗備擇假設H1: 68另外,可設原假設H0: 68;若原假設正確,則第50頁,共53頁,2022年,5月20日,9點17分,星期一但現(xiàn)不知 的真值,只知 0 = 68 小概率事件故取拒絕域顯著性水平不超過第51頁,共53頁,2022年,5月20日,9點17分,星

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論