第四章仿真輸入與輸出數(shù)據(jù)分析_第1頁
第四章仿真輸入與輸出數(shù)據(jù)分析_第2頁
第四章仿真輸入與輸出數(shù)據(jù)分析_第3頁
第四章仿真輸入與輸出數(shù)據(jù)分析_第4頁
第四章仿真輸入與輸出數(shù)據(jù)分析_第5頁
已閱讀5頁,還剩82頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

第四章仿真輸入與輸出數(shù)據(jù)分析第一頁,共八十七頁,編輯于2023年,星期一問題的緣起第二頁,共八十七頁,編輯于2023年,星期一模擬問題的數(shù)據(jù)要求在模擬工作開始前,必須獲得滿足要求的數(shù)據(jù)(一般指的是隨機分布特征)來作為輸入數(shù)據(jù)。另外,由于模擬的特性,必須要求輸入數(shù)據(jù)數(shù)量足夠多。單次模擬就要需要許多滿足同樣分布特性的數(shù)據(jù);由于模擬結(jié)果具有隨機性,因此需要基于同樣分布特性的數(shù)據(jù)進行多次模擬才能得到可靠解。問題背景在實際模擬過程中,很難獲取實際的實驗數(shù)據(jù)或者是壓根找不到。在實際系統(tǒng)中很難找到足夠多的數(shù)據(jù):進行一次模擬的數(shù)據(jù)相對容易得到,進行多次模擬的數(shù)據(jù)則難以獲得。例子回顧炸彈投擲問題理發(fā)店排隊服務問題第三頁,共八十七頁,編輯于2023年,星期一解決思路通過少數(shù)的輸入數(shù)據(jù)來合成大量數(shù)據(jù)一個基本假設一類輸入數(shù)據(jù)應滿足一定規(guī)律:解析規(guī)律/隨機規(guī)律解決思路:

利用一種方法來確定輸入數(shù)據(jù)是否滿足某個隨機分布規(guī)律,如果滿足,則利用該分布規(guī)律來產(chǎn)生大量的數(shù)據(jù)。根據(jù)能得到的少量實際數(shù)據(jù)進行分析,得出數(shù)據(jù)的分布規(guī)律;根據(jù)該分布規(guī)律來生成足夠多的隨機數(shù)。第四頁,共八十七頁,編輯于2023年,星期一理發(fā)店例子:在所研究的理發(fā)店蹲點或者去調(diào)查已有數(shù)據(jù);收集兩類數(shù)據(jù);顧客達到時間間隔數(shù)據(jù)理發(fā)師服務時間數(shù)據(jù)對收集到的數(shù)據(jù)進行擬合,看更加適合于哪種概率分布;選取最適合的概率分布函數(shù),如到達時間間隔數(shù)據(jù)滿足一定參數(shù)的泊松分布F,理發(fā)師服務時間數(shù)據(jù)滿足一定參數(shù)的泊松分布G;根據(jù)概率分布函數(shù)F和G生成足夠多的隨機數(shù)據(jù);利用這些數(shù)據(jù)進行模擬。第五頁,共八十七頁,編輯于2023年,星期一模型的輸入數(shù)據(jù)哪里來?

輸入數(shù)據(jù)分析第六頁,共八十七頁,編輯于2023年,星期一生產(chǎn)仿真結(jié)果的準確性生產(chǎn)模型的準確建立仿真數(shù)據(jù)的準確性輸入數(shù)據(jù)是仿真模型的動力第七頁,共八十七頁,編輯于2023年,星期一系統(tǒng)名稱典型的輸入數(shù)據(jù)排隊系統(tǒng)

顧客到達的間隔時間顧客被服務時間的分布自動化物流系統(tǒng)

貨物到達間隔時間裝載時間卸載時間生產(chǎn)系統(tǒng)

作業(yè)到達的間隔時間作業(yè)類型的概率每種作業(yè)每道工序服務時間的分布可靠性系統(tǒng)

生產(chǎn)無故障作業(yè)時間

系統(tǒng)的仿真依靠這些原型系統(tǒng)的運行數(shù)據(jù),缺乏這些數(shù)據(jù)的實驗和實驗值的提取,仿真也就毫無意義。第八頁,共八十七頁,編輯于2023年,星期一

對系統(tǒng)進行認真的調(diào)查和分析后,可初步確定輸入數(shù)據(jù)的種類和大致特性,接下來便是數(shù)據(jù)的采集。數(shù)據(jù)的采集可以在所模擬的現(xiàn)實系統(tǒng)中進行,也可以在所模擬系統(tǒng)的相近系統(tǒng)中進行。當然,采集數(shù)據(jù)的環(huán)境與所模擬的系統(tǒng)環(huán)境越相似越好。第九頁,共八十七頁,編輯于2023年,星期一4.1仿真輸入數(shù)據(jù)收集什么是數(shù)據(jù)收集?數(shù)據(jù)收集的意義?數(shù)據(jù)收集的基本態(tài)度?數(shù)據(jù)收集是針對實際問題,經(jīng)過系統(tǒng)分析或經(jīng)驗的總結(jié),以系統(tǒng)的特征為目標,收集與此有關的資料、數(shù)據(jù)、信息等反映特征的相關數(shù)據(jù)。數(shù)據(jù)的收集是一項工作量很大的工作,也是在仿真中最重要、最困難的問題。即使一個模型結(jié)構(gòu)是正確的,但若收集的輸入數(shù)據(jù)數(shù)據(jù)不正確,或數(shù)據(jù)分析不對,或這些數(shù)據(jù)不能代表實際情況,那么利用這樣的數(shù)據(jù)作為決策的依據(jù)必將導致錯誤,造成損失和浪費。數(shù)據(jù)收集工作應該具有科學的態(tài)度、忠于現(xiàn)實的工作作風。應該將數(shù)據(jù)收集工作、仿真工作的意義讓參與者明確,得到參與者的支持和理解。第十頁,共八十七頁,編輯于2023年,星期一4.1仿真輸入數(shù)據(jù)收集收集輸入數(shù)據(jù)的主要方法:1.通過實際觀測獲得系統(tǒng)的輸入數(shù)據(jù)。2.由系統(tǒng)管理人員提供實際系統(tǒng)的運行數(shù)據(jù)。3.從公開發(fā)表的研究成果、論文中收集類似系統(tǒng)的輸入數(shù)據(jù)模型。第十一頁,共八十七頁,編輯于2023年,星期一4.1仿真輸入數(shù)據(jù)收集1.按系統(tǒng)研究的目的和模型確定輸入數(shù)據(jù)項目

譬如:對于單窗口排隊系統(tǒng)顧客到達間隔時間顧客服務時間

對于汽車轉(zhuǎn)運站系統(tǒng)汽車到達間隔時間調(diào)度等待時間裝車時間汽車故障間隔時間及處理時間數(shù)據(jù)的收集的內(nèi)容和步驟:12第十二頁,共八十七頁,編輯于2023年,星期一6.粗略地分析,對不規(guī)范的數(shù)據(jù)要進行處理或重新收集2.分析每個輸入數(shù)據(jù)的特性,環(huán)境,研究采集方法,

編制采集計劃3.設計和繪制數(shù)據(jù)采集表格4.確定采集地點和時間5.按計劃分組采集,整理例:某銀行汽車顧客到達間隔時間數(shù)據(jù)7.采集的數(shù)據(jù)經(jīng)整理后要認真存檔134.1仿真輸入數(shù)據(jù)收集第十三頁,共八十七頁,編輯于2023年,星期一14第十四頁,共八十七頁,編輯于2023年,星期一4.1仿真輸入數(shù)據(jù)收集

做好仿真計劃,詳細規(guī)劃仿真所需要收集的數(shù)據(jù)在收集數(shù)據(jù)過程中要注意分析數(shù)據(jù)數(shù)據(jù)的均勻組合收集的數(shù)據(jù)要滿足獨立性的要求數(shù)據(jù)自相關性的檢驗根據(jù)問題的特征,進行仿真的前期研究。分析影響系統(tǒng)的關鍵因素。從相關事物的觀察入手,盡量收集相關的數(shù)據(jù)。為此可以事先設計好調(diào)研表格,并注意不斷完善和修改調(diào)研方式,使收集的數(shù)據(jù)更符合仿真對象的數(shù)據(jù)需要。數(shù)據(jù)的收集與仿真的試運行是密切相關的,應當是邊收集數(shù)據(jù)、邊進行仿真的試運行。然而系統(tǒng)仿真是一項專業(yè)性很強的工作,要正確認識“仿真”的含義,抓住仿真研究的關鍵,避免求全、求精。確信所收集的數(shù)據(jù)足以確定仿真中的輸入分量,而對仿真無用或影響不顯著的數(shù)據(jù)就沒有必要去多加收集。針對仿真所收集的各個數(shù)據(jù)需要進行相關性檢驗。為了確定在兩個變量之間是否存在相關。通過統(tǒng)計方法確定相關的顯著性。盡量把均勻數(shù)據(jù)組合在一組里。校核在相繼的時間周期里以及在相繼日子內(nèi)的一時間周期里的數(shù)據(jù)的均勻性。當校核均勻性時,初步的檢驗是看一下分布的均值是相同??疾煲粋€似乎是獨立的觀察序列數(shù)據(jù)存在自相關的可能性。自相關可能存在于相繼的時間周期或相繼的顧客中。例如,第i個顧客的服務時間與(i+n)個顧客的服務時間相關。數(shù)據(jù)收集過程中的注意事項第十五頁,共八十七頁,編輯于2023年,星期一

收集數(shù)據(jù),目的是分析數(shù)據(jù)的規(guī)律性(即分布)。以找出這些數(shù)據(jù)變化的統(tǒng)計規(guī)律,并最終確定輸入數(shù)據(jù)的擬合概率分布。如何了解數(shù)據(jù)的規(guī)律呢?1.看看數(shù)據(jù)是否符合某個理論分布。為此,可先按科學的方法假設一個理論分布,再利用統(tǒng)計檢驗的手段來判斷其是否符合這一分布。2.如果找不到一個合適的理論分布,可以利用已有的數(shù)據(jù)建立一個經(jīng)驗分布?;驹瓌t164.2仿真輸入數(shù)據(jù)分析第十六頁,共八十七頁,編輯于2023年,星期一采用理論分布的優(yōu)點不僅可以表現(xiàn)已知數(shù)據(jù)的基本特性,更重要的是可以表現(xiàn)沒有采集到的所有數(shù)據(jù)的特性現(xiàn)實世界中大多數(shù)管理系統(tǒng)內(nèi)的各類隨機過程都有一定的概率分布規(guī)律幾乎可以產(chǎn)生無限量的數(shù)據(jù),從而滿足長時間模擬的需要4.2仿真輸入數(shù)據(jù)分析第十七頁,共八十七頁,編輯于2023年,星期一對具有隨機變量的系統(tǒng)進行仿真,首先必須確定其隨機變量的概率分布,以便在仿真模型中對這些不確定性進行模擬取樣,以得到需要的隨機變量。4.2仿真輸入數(shù)據(jù)分析第十八頁,共八十七頁,編輯于2023年,星期一為X的分布函數(shù)。設X是一個隨機變量,定義1的函數(shù)值的含義:上的概率.分布函數(shù)分布函數(shù)的概念是任意實數(shù),則稱函數(shù)表示X落在第十九頁,共八十七頁,編輯于2023年,星期一∴可以使用分布函數(shù)值描述隨機變量落在區(qū)間里的概率。(1)(2)同理,還可以寫出第二十頁,共八十七頁,編輯于2023年,星期一一般地,設離散型隨機變量的分布律為由概率的可列可加性得的分布函數(shù)為第二十一頁,共八十七頁,編輯于2023年,星期一定義1.

設F(x)是隨機變量

X的分布函數(shù),若存在非負,使對任意實數(shù)則稱

X為連續(xù)型隨機變量,稱為

X的概率密度函數(shù),簡稱概率密度或密度函數(shù)。函數(shù)概率密度第二十二頁,共八十七頁,編輯于2023年,星期一概率密度的性質(zhì)⑴非負性⑵由于(3)f(x)在點x處連續(xù),則第二十三頁,共八十七頁,編輯于2023年,星期一3、連續(xù)性隨機變量的特點(1)(2)(3)F(x)連續(xù)。f(x)x第二十四頁,共八十七頁,編輯于2023年,星期一2023/6/5ManagementInformationSimulation25輸入數(shù)據(jù)常見的概率分布只能采取匹配法,來選取最佳匹配的概率分布函數(shù)。第二十五頁,共八十七頁,編輯于2023年,星期一§2.7

均勻分布?指數(shù)分布設連續(xù)隨機變量的一切可能值充滿某一且在該區(qū)間內(nèi)任一點概率密度相同,即密度函數(shù)在區(qū)間上為常量,個有限區(qū)間稱此分布為均勻分布(或等概率分布).理論分布一:均勻分布

(Uniformdistribution)

第二十六頁,共八十七頁,編輯于2023年,星期一均勻分布的意義§2.7

均勻分布?指數(shù)分布第二十七頁,共八十七頁,編輯于2023年,星期一§2.7

均勻分布?指數(shù)分布第二十八頁,共八十七頁,編輯于2023年,星期一

均勻分布的概率密度與分布函數(shù)(1)概率密度§2.7

均勻分布?指數(shù)分布第二十九頁,共八十七頁,編輯于2023年,星期一(2)分布函數(shù)§2.7

均勻分布?指數(shù)分布第三十頁,共八十七頁,編輯于2023年,星期一§2.7

均勻分布?指數(shù)分布第三十一頁,共八十七頁,編輯于2023年,星期一§2.7

均勻分布?指數(shù)分布理論分布三:指數(shù)分布(Exponentialdistribution)

第三十二頁,共八十七頁,編輯于2023年,星期一§2.7

均勻分布?指數(shù)分布第三十三頁,共八十七頁,編輯于2023年,星期一§2.7

均勻分布?指數(shù)分布第三十四頁,共八十七頁,編輯于2023年,星期一§2.7

均勻分布?指數(shù)分布第三十五頁,共八十七頁,編輯于2023年,星期一一、正態(tài)分布的定義及其特征(一)定義若連續(xù)性隨機變量X的概率分布密度函數(shù)為:

其中,μ為平均數(shù),σ2

為方差,則稱隨機變量χ服從正態(tài)分布,記為χ~N(μ,σ2).相應的概率分布函數(shù)為理論分布三:正態(tài)分布normaldistribution第三十六頁,共八十七頁,編輯于2023年,星期一(二)特征正態(tài)分布密度曲線是以χ=μ

為對稱軸的單峰、對稱的懸鐘形;f(x)在χ=μ處達到極大值,極大值為f(x)是非負數(shù),以x軸為漸進線;曲線在χ±

σ處各有一個拐點;正態(tài)分布密度函數(shù)曲線

第三十七頁,共八十七頁,編輯于2023年,星期一正態(tài)分布有兩個參數(shù),即平均數(shù)μ和標準差σ。μ是位置參數(shù),σ是變異度參數(shù)。分布密度曲線與橫軸所夾的面積為1,即:正態(tài)分布密度函數(shù)曲線

特征第三十八頁,共八十七頁,編輯于2023年,星期一

μ相同而σ不同的三個正態(tài)總體

σ相同而μ不同的三個正態(tài)總體特征第三十九頁,共八十七頁,編輯于2023年,星期一二、標準正態(tài)分布standardnormaldistribution(一)定義由于正態(tài)分布是依賴于參數(shù)

μ和(或σ)的一簇分布,造成研究具體正態(tài)總體時的不便。因此將一般的(μ,σ2)轉(zhuǎn)換為μ=0,σ2=1的正態(tài)分布,則稱μ=0,σ2=1的正態(tài)分布為標準正態(tài)分布。標準正態(tài)分布的概率密度函數(shù)及分布函數(shù)如下:若隨機變量U服從標準正態(tài)分布,記作U~(0,1)第四十頁,共八十七頁,編輯于2023年,星期一標準正態(tài)分布概率密度函數(shù)

第四十一頁,共八十七頁,編輯于2023年,星期一理論分布四:泊松分布Possiondistribution

泊松分布是一種可以用來描述和分析隨機地發(fā)生在單位空間或時間里的稀有事件的分布。所謂稀有事件即為小概率事件。要觀察到這類事件,樣本含量n必須很大。在生物、醫(yī)學研究中,服從泊松分布的隨機變量是常見的。由于泊松分布是描述小概率事件的,二項分布中p很小,n很大時,可使用泊松分布第四十二頁,共八十七頁,編輯于2023年,星期一泊松分布常用于描述在某一指定時間內(nèi)或在某一指定范圍內(nèi),源源不斷出現(xiàn)的稀有事件個數(shù)的分布。例如,120急救中心每天接到要求服務的呼叫次數(shù);每天到達機場的飛機數(shù);在早上(7:00–8:00)交通高峰期間通過某一道口的機動車數(shù);紡織品在單位面積上的疵點數(shù)等等。第四十三頁,共八十七頁,編輯于2023年,星期一一、泊松分布的意義(一)定義

若隨機變量X(X=x)只取零和正整數(shù)值,且其概率分布為

其中x=0,1,…;μ>0;e=2.7182…是自然對數(shù)的底數(shù),則稱X服從參數(shù)為μ的泊松分布記為X~P(μ)。(二)特征泊松分布作為一種離散型隨機變量的概率分布有一個重要的特征。這就是它的平均數(shù)和方差相等,都等于常數(shù)μ,即μ=σ2=μ。利用這一特征,可以初步判斷一個隨機變量是否服從泊松分布第四十四頁,共八十七頁,編輯于2023年,星期一泊松分布μ

=4第四十五頁,共八十七頁,編輯于2023年,星期一二、泊松分布的概率計算

μ是泊松分布所依賴的唯一參數(shù)。泊松分布的概率計算,只要參數(shù)μ確定了,問題就解決了。把x=0,1,2,…代入公式即可求得各項的概率。

但是在大多數(shù)服從泊松分布的實例中,分布參數(shù)μ往往是未知的,只能從所觀察的隨機樣本中計算出相應的樣本平均數(shù)作為μ的估計值。第四十六頁,共八十七頁,編輯于2023年,星期一

除理論概率分布外,還有一種由已知數(shù)據(jù)建立的經(jīng)驗分布。其公式如下:

這是一條非減、右連續(xù)函數(shù).47第四十七頁,共八十七頁,編輯于2023年,星期一收集原始數(shù)據(jù)

基本統(tǒng)計分布的辨識參數(shù)估計

擬合度檢驗

可信否?否是是輸入數(shù)據(jù)分析的基礎,需要分析的經(jīng)驗,對收集的方法、數(shù)據(jù)需要做預先的設計和估算。因此這是一個關鍵的、細致的工作。通過統(tǒng)計的數(shù)學手段(計數(shù)統(tǒng)計、頻率分析、直方圖制作等),得出統(tǒng)計分布的假設函數(shù)(如:正態(tài)分布、指數(shù)分布等)根據(jù)(樣本的已知)統(tǒng)計特征,計算確定(總體未知的)系統(tǒng)的假設分布參數(shù)。擬合優(yōu)度檢驗的基本思路是將得到的擬合分布函數(shù)用原始數(shù)據(jù)進行統(tǒng)計假設檢驗。運用統(tǒng)計分布的檢驗方法,對假設的分布函數(shù)進行可信度檢驗。通常采用的是2檢驗。正確輸入數(shù)據(jù)

輸入數(shù)據(jù)模型確定的基本過程4.2仿真輸入數(shù)據(jù)分析第四十八頁,共八十七頁,編輯于2023年,星期一第4章4.2.1隨機變量分布類型的辯識1.連續(xù)隨機變量分布類型的辯識1)點統(tǒng)計法

基本原理是:基于連續(xù)隨機變量的偏差系數(shù),根據(jù)偏差系統(tǒng)的特征尋求與其相近的理論分布,并假設隨機變量的分布為這一理論分布。偏差系數(shù)是均方差與均值的比,即

,其中

為隨機變量分布的方差;

為隨機變量的均值(在點統(tǒng)計法中計算的似然估計,即用樣本均值和方差代替隨機變量的總體期望和方差計算偏差系數(shù)的估計值)。根據(jù)連續(xù)隨機變量分布的偏差系數(shù)表4-1,如果能夠找到與的似然估計的值相同的偏差系數(shù),則可以近似假設所收集的數(shù)據(jù)服從該種理論分布。第四十九頁,共八十七頁,編輯于2023年,星期一第4章4.2.1隨機變量分布類型的辯識1.連續(xù)隨機變量分布類型的辯識第五十頁,共八十七頁,編輯于2023年,星期一特點簡單,但不能唯一確定分布的類型。4.2.1隨機變量分布類型的辯識1.連續(xù)隨機變量分布類型的辯識第五十一頁,共八十七頁,編輯于2023年,星期一第4章4.2.1隨機變量分布類型的辯識

2)直方圖法直方圖法的基本思路是:首先用觀測到的樣本數(shù)值建立隨機變量的概率密度直方圖,然后將得到的直方圖與理論分布的密度函數(shù)曲線圖進行比較,從圖形上直觀的判斷該隨機變量是否滿足某種理論分布。具體步驟如下:(1)將觀測的數(shù)據(jù)

的取值范圍分成

個斷開的相鄰區(qū)間

,每個區(qū)間的寬度相等;記。(2)對任意區(qū)間,設

為第

個區(qū)間上觀測點的個數(shù),記(3)定義函數(shù)

(4)做出函數(shù)

的直方圖。

(5)將直方圖與理論分布的密度函數(shù)曲線圖進行比較,確定被測函數(shù)服從哪種理論分布。只要找到與其直方圖相近似的密度函數(shù)圖,就可以假設隨機變量服從該理論分布。1.連續(xù)隨機變量分布類型的辯識第五十二頁,共八十七頁,編輯于2023年,星期一4.2仿真輸入數(shù)據(jù)分析直方圖1直方圖的構(gòu)造方法如下:取值區(qū)間劃分水平區(qū)坐間標標軸注的計區(qū)算間確內(nèi)定的每發(fā)一生數(shù)垂直標坐注標頻軸數(shù)上繪上制的各發(fā)個生區(qū)頻間數(shù)繪制直方圖第五十三頁,共八十七頁,編輯于2023年,星期一直方圖分組區(qū)間數(shù)量的選取1分組區(qū)間的組數(shù)依賴于觀察次數(shù)以及數(shù)據(jù)的分散或散布的程度。一般分組區(qū)間組數(shù)近似等于樣本量的平方根。即:

如果區(qū)間太寬(m太?。瑒t直方圖太粗或呈短粗狀,這樣,它的形狀不能良好地顯示出來。如果區(qū)間太窄,則直方圖顯得凹凸不平不好平滑

合適的區(qū)間選擇(m值)是直方圖制作,分布函數(shù)分析的基礎。4.2仿真輸入數(shù)據(jù)分析第五十四頁,共八十七頁,編輯于2023年,星期一4.2仿真輸入數(shù)據(jù)分析第五十五頁,共八十七頁,編輯于2023年,星期一離散數(shù)據(jù)—汽車數(shù)量(p215)第五十六頁,共八十七頁,編輯于2023年,星期一連續(xù)數(shù)據(jù)—電子元器件壽命(p217)第五十七頁,共八十七頁,編輯于2023年,星期一例4-2注意選擇適當?shù)姆侄螀^(qū)間4.2仿真輸入數(shù)據(jù)分析第五十八頁,共八十七頁,編輯于2023年,星期一第4章4.2.1隨機變量分布類型的辯識2.離散型隨機變量分布類型的辯識

1)點統(tǒng)計法離散情況下的點統(tǒng)計法與連續(xù)的情況下的點統(tǒng)計方法相同,即同樣采用計算偏差系數(shù)的方法,先得到偏差系數(shù)

的似然估計,再尋找偏差系數(shù)相近的理論分布。

2)線圖法線圖法是把采集到的數(shù)據(jù)進行統(tǒng)計并與假設的理論分布的質(zhì)量函數(shù)曲線進行比較,如果存在相近的理論分布,則可以假設其為該理論分布。其具體做法為:采集數(shù)據(jù)為

,將其按遞增順序排列,由于可能有相同的值的數(shù)據(jù),設共有

個取值(

),分別記為

;是取值

的數(shù)據(jù)個數(shù)占到總采集數(shù)據(jù)個數(shù)的比例數(shù)。以

作為自變量,以

的值作為函數(shù)的值;由函數(shù)值向相應的變量作垂線,所得到的圖稱為線圖;再將得到的線圖與假設的理論分布的質(zhì)量函數(shù)進行比較,確定隨機變量的分布。第五十九頁,共八十七頁,編輯于2023年,星期一第4章4.2.1隨機變量分布類型的辯識3.實驗分布第六十頁,共八十七頁,編輯于2023年,星期一樣本總體總體均值、比例、方差等4.2.2參數(shù)估計樣本統(tǒng)計量例如:樣本均值、比例、方差第六十一頁,共八十七頁,編輯于2023年,星期一分布函數(shù)族確定后,但是必須確定具體的參數(shù)值,才能真正得到一個可以應用的擬合分布。主要的方法即采用:參數(shù)的點估計。其理論根據(jù)是“極大似然法”,其原理是:

認為所觀測到的數(shù)據(jù)是系統(tǒng)中所產(chǎn)生的概率最大的一組數(shù)據(jù)。4.2.2參數(shù)估計第六十二頁,共八十七頁,編輯于2023年,星期一設某一個隨機過程X,其n個抽樣樣本為x1,x2,…,xn,該樣本的均值為該樣本的方差為如果離散數(shù)據(jù)已按頻數(shù)分組,則k是X中不相同數(shù)值的個數(shù)即分組數(shù),fi是X中數(shù)值Xj的觀察頻數(shù)4.2.2參數(shù)估計樣本均值和樣本方差第六十三頁,共八十七頁,編輯于2023年,星期一第4章4.2.2參數(shù)估計用直方圖或線圖確定所收集的樣本數(shù)據(jù)服從某種理論分布之后,還要由觀測到的樣本值計算出理論分布的參數(shù)。在數(shù)理統(tǒng)計中有許多參數(shù)估計的方法,如矩估計法、極大似然估計法等。因本書的重點在于參數(shù)估計的應用,故僅給出常用的理論分布參數(shù)及其估計值,如表4-7所示:第六十四頁,共八十七頁,編輯于2023年,星期一在確定了參數(shù)后,并不意味著擬合分布已經(jīng)得到和確定了。這是因為上述所采用的擬合分布的方法是試探法,它的結(jié)果只能被認為是一種可能的結(jié)果。為了檢驗所選分布是否正確,必須要對所選分布進行擬合優(yōu)度檢驗,以便最后對所選分布做出結(jié)論。檢驗選定的分布是否與觀測的數(shù)據(jù)相吻合第六十五頁,共八十七頁,編輯于2023年,星期一理論分布和實際分布的差異程度?

擬合度檢驗第六十六頁,共八十七頁,編輯于2023年,星期一什么是假設檢驗?事先對總體參數(shù)或分布形式作出某種假設,然后利用樣本信息來判斷原假設是否成立采用邏輯上的反證法,依據(jù)統(tǒng)計上的小概率原理第六十七頁,共八十七頁,編輯于2023年,星期一什么小概率?1. 在一次試驗中,一個幾乎不可能發(fā)生的事件發(fā)生的概率2. 在一次試驗中小概率事件一旦發(fā)生,我們就有理由拒絕原假設3. 小概率由研究者事先確定第六十八頁,共八十七頁,編輯于2023年,星期一假設檢驗的步驟1提出假設(原假設H0,備擇假設H1)2確定適當?shù)臋z驗統(tǒng)計量3規(guī)定顯著性水平4作出統(tǒng)計決策第六十九頁,共八十七頁,編輯于2023年,星期一設總體參數(shù)為,L和U為由樣本確定的兩個統(tǒng)計量,對于給定的,有則稱(L,U)為參數(shù)的置信水平為的置信區(qū)間。該區(qū)間的兩個端點L,U分別稱為置信下限和置信上限,通稱為置信限。為顯著性水平,則稱為置信水平。顯著性水平第七十頁,共八十七頁,編輯于2023年,星期一將構(gòu)造置信區(qū)間的步驟重復很多次,置信區(qū)間包含總體參數(shù)真值的次數(shù)所占的比例稱為置信水平表示為(1-為是總體參數(shù)未在區(qū)間內(nèi)的比例常用的置信水平值有99%,95%,90%相應的為0.01,0.05,0.10置信水平第七十一頁,共八十七頁,編輯于2023年,星期一由樣本統(tǒng)計量所構(gòu)造的總體參數(shù)的估計區(qū)間稱為置信區(qū)間統(tǒng)計學家在某種程度上確信這個區(qū)間會包含真正的總體參數(shù),所以給它取名為置信區(qū)間用一個具體的樣本所構(gòu)造的區(qū)間是一個特定的區(qū)間,我們無法知道這個樣本所產(chǎn)生的區(qū)間是否包含總體參數(shù)的真值我們只能是希望這個區(qū)間是大量包含總體參數(shù)真值的區(qū)間中的一個,但它也可能是少數(shù)幾個不包含參數(shù)真值的區(qū)間中的一個置信區(qū)間

第七十二頁,共八十七頁,編輯于2023年,星期一置信區(qū)間與置信水平均值的抽樣分布(1-)%區(qū)間包含了

%的區(qū)間未包含1-aa/2a/2第七十三頁,共八十七頁,編輯于2023年,星期一用統(tǒng)計量決策抽樣分布H0臨界值臨界值a/2a/2

拒絕H0拒絕H01-置信水平第七十四頁,共八十七頁,編輯于2023年,星期一20/2=.025第七十五頁,共八十七頁,編輯于2023年,星期一由阿貝(Abbe)

于1863年首先給出,后來由海爾墨特(Hermert)和卡·皮爾遜(K·Pearson)

分別于1875年和1900年推導出來設,則令,則y服從自由度為1的2分布,即對于n個正態(tài)隨機變量y1

,y2

,yn,則隨機變量稱為具有n個自由度的2分布,記為c2-分布第七十六頁,共八十七頁,編輯于2023年,星期一c2-分布(性質(zhì)和特點)1.期望為:E(2)=n,方差為:D(2)=2n(n為自由度)2.可加性:若U和V為兩個獨立的2分布隨機變量,U~2(n1),V~2(n2),則U+V這一隨機變量服從自由度為n1+n2的2分布3.當時,2分布的極限分布是正態(tài)分布第七十七頁,共八十七頁,編輯于2023年,星期一不同自由度的c2-分布c2n=1n=4n=10n=20第七十八頁,共八十七頁,編輯于2023年,星期

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論