上海財經(jīng)大學(xué)應(yīng)用統(tǒng)計學(xué)_第1頁
上海財經(jīng)大學(xué)應(yīng)用統(tǒng)計學(xué)_第2頁
上海財經(jīng)大學(xué)應(yīng)用統(tǒng)計學(xué)_第3頁
上海財經(jīng)大學(xué)應(yīng)用統(tǒng)計學(xué)_第4頁
上海財經(jīng)大學(xué)應(yīng)用統(tǒng)計學(xué)_第5頁
已閱讀5頁,還剩191頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

應(yīng)用統(tǒng)計學(xué)管理科學(xué)與工程學(xué)科綜合水平考試應(yīng)用統(tǒng)計學(xué)考試大綱考試要求:經(jīng)濟管理中常用的基本統(tǒng)計原理和方法熟悉統(tǒng)計計算方法和公式,并能正確地解釋計算結(jié)果初步具有應(yīng)用定量的統(tǒng)計模型以及科學(xué)的統(tǒng)計方法進行現(xiàn)代化管理和決策的能力應(yīng)用統(tǒng)計學(xué)考試大綱(續(xù))考試內(nèi)容:數(shù)據(jù)的整理與圖形常用隨機變量的分布以及抽樣分布參數(shù)估計假設(shè)檢驗回歸分析時間序列分析考試時間:每年五月份第3個星期日下午應(yīng)用統(tǒng)計學(xué)教學(xué)進度表日期教學(xué)內(nèi)容教學(xué)方法3月3下午第一章數(shù)據(jù)的整理與圖形課堂與上機3月4上午第二章常用隨機變量的分布以及抽樣分布課堂與上機3月17下午第二章常用隨機變量的分布以及抽樣分布(續(xù))課堂與上機3月18上午第三章參數(shù)估計課堂與上機3月31下午第四章假設(shè)檢驗課堂與上機4月1上午第五章回歸分析課堂與上機4月7下午第五章回歸分析(續(xù))課堂與上機4月8上午第六章時間序列分析課堂與上機4月14下午總復(fù)習(xí)模擬試卷AB5月12上午考試筆試2小時應(yīng)用統(tǒng)計學(xué)目錄第一章數(shù)據(jù)的整理與圖形--------------------------------------10第一節(jié)數(shù)據(jù)的整理與圖形表示-------------------------------------12一.餅形圖----------------------------------------------------------18二.組距分組法與頻率直方圖----------------------------------19三.條形圖與柱狀圖----------------------------------------------20四.并列條形圖或柱狀圖----------------------------------------21五.莖葉圖----------------------------------------------------------22第二節(jié)數(shù)據(jù)的描述性指標-------------------------------------------18一.數(shù)據(jù)集中趨勢的度量----------------------------------------24二.數(shù)據(jù)離散趨勢的度量----------------------------------------25應(yīng)用統(tǒng)計學(xué)目錄第二章隨機變量以及抽樣分布-----------------25第一節(jié)隨機變量概念和隨機變量的數(shù)字特征-------------------12一.隨機變量的數(shù)學(xué)期望----------------------------------------18二.隨機變量的方差和標準差----------------------------------19第二節(jié)常用隨機變量以及分布-------------------------------------18一.0-1分布------------------------------------------------------24二.二項分布------------------------------------------------------25三.正態(tài)分布與標準正態(tài)分布---------------------------------26第三節(jié)總體與樣本----------------------------------------------------27一.總體------------------------------------------------------------28二.樣本------------------------------------------------------------29三.聯(lián)合分布函數(shù)和聯(lián)合概率密度---------------------------30應(yīng)用統(tǒng)計學(xué)目錄第二章常用隨機變量的分布以及抽樣分布-----------------25第四節(jié)抽樣方法-------------------------------------------------------30一.簡單隨機抽樣------------------------------------------------31二.分層抽樣------------------------------------------------------32三.整群抽樣------------------------------------------------------33四.系統(tǒng)抽樣------------------------------------------------------34第五節(jié)樣本統(tǒng)計量的分布------------------------------------------18一.統(tǒng)計量---------------------------------------------------------35二.常用統(tǒng)計量---------------------------------------------------36三.三大分布(卡方分布、t分布、F分)-----------------37四.正態(tài)總體的樣本均值和樣本方差分布------------------38五.獨立同分布的中心極限定理------------------------------40應(yīng)用統(tǒng)計學(xué)目錄第三章參數(shù)估計--------------------------------------------------41第一節(jié)參數(shù)的點估計-------------------------------------------------42一.參數(shù)點估計的一般提法-------------------------------------42二.參數(shù)點估計的求法-------------------------------------------43三.點估計量的評價標準----------------------------------------44第二節(jié)參數(shù)的區(qū)間估計----------------------------------------------44一.參數(shù)區(qū)間估計的一般提法---------------------------------44二.單側(cè)置信區(qū)間---------------------------------------45三.關(guān)于一個正態(tài)總體均值和方差的區(qū)間估計------------46四.關(guān)于兩個正態(tài)總體的均值差的區(qū)間估計---------------47五.關(guān)于比率p的區(qū)間估計-------------------------------------48應(yīng)用統(tǒng)計學(xué)目錄第四章假設(shè)檢驗--------------------------------------------------51第一節(jié)假設(shè)檢驗的原理----------------------------------------------42一.假設(shè)檢驗的基本思想----------------------------------------42二.原假設(shè)和備選假設(shè)-------------------------------------------43第二節(jié)假設(shè)檢驗的基本概念----------------------------------------44一.兩類錯誤------------------------------------------------------44二.顯著性水平α的確定---------------------------------------45三.原假設(shè)與備選假設(shè)的選擇---------------------------------46四.雙側(cè)檢驗與單側(cè)檢驗---------------------------------------47五.假設(shè)檢驗的一般步驟---------------------------------------48應(yīng)用統(tǒng)計學(xué)目錄第四章假設(shè)檢驗--------------------------------------------------51第三節(jié)關(guān)于總體均值與方差的假設(shè)檢驗-------------------------52一.關(guān)于一個正態(tài)總體均值的假設(shè)檢驗----------------------52二.關(guān)于一個正態(tài)總體方差的假設(shè)檢驗----------------------53三.關(guān)于兩個正態(tài)總體均值差的假設(shè)檢驗-------------------54四.關(guān)于比率p的假設(shè)檢驗--------------------------------------55五.關(guān)于兩個總體比率差的假設(shè)檢驗-------------------------56第四節(jié)假設(shè)檢驗與區(qū)間估計的關(guān)系-------------------------------44應(yīng)用統(tǒng)計學(xué)目錄第五章回歸分析--------------------------------------------------62第一節(jié)簡單線性回歸分析-------------------------------------------62一.散點圖----------------------------------------------------------62二.簡單線性回歸模型及基本理論假設(shè)----------------------63三.簡單線性回歸模型的基本特征----------------------------66四.回歸參數(shù)的最小二乘估計----------------------------------67五.方差σ2的估計、可判定系數(shù)R2與相關(guān)系數(shù)R---------68六.回歸效果的顯著性檢驗與方差分析表-------------------69七.回歸參數(shù)的假設(shè)檢驗與區(qū)間估計-------------------------70八.預(yù)測-------------------------------------------------------------71

應(yīng)用統(tǒng)計學(xué)目錄第五章回歸分析--------------------------------------------------61第二節(jié)多元線性回歸分析-------------------------------------------74一.多元線性回歸模型及基本理論假設(shè)---------------------74二.回歸參數(shù)的最小二乘估計---------------------------------75三.方差σ2的估計、復(fù)可判定系數(shù)R2----------------------76四.多元線性回歸模型的假設(shè)檢驗---------------------------77五.估計與預(yù)測---------------------------------------------------78六.多項式回歸模型---------------------------------------------79應(yīng)用統(tǒng)計學(xué)目錄第五章回歸分析--------------------------------------------------61第三節(jié)線性回歸模型的適宜性評價------------------------------81一.非線性---------------------------------------------------------82二.異方差性------------------------------------------------------83三.序列相關(guān)性---------------------------------------------------84四.非正態(tài)性------------------------------------------------------85五.多重共線性---------------------------------------------------86應(yīng)用統(tǒng)計學(xué)目錄第六章時間序列分析--------------------------------------------92第一節(jié)時間序列的組成因素----------------------------------------92一.影響時間序列的四個因素----------------------------------92二.時間序列的三個分解模型----------------------------------93第二節(jié)長期趨勢的測定----------------------------------------------96一.長期趨勢的測定——滑動平均法-------------------------97二.直線趨勢的測定——最小二乘法-------------------------98三.曲線趨勢的測定----------------------------------------------99應(yīng)用統(tǒng)計學(xué)目錄第六章時間序列分析--------------------------------------------92第三節(jié)季節(jié)變動因素的測定---------------------------------------100一.按月(季)平均法-----------------------------------------------101二.滑動平均趨勢剔除法----------------------------------------102三.季節(jié)調(diào)整-------------------------------------------------------103第四節(jié)循環(huán)波動因素的測定---------------------------------------104一.剩余測定法----------------------------------------------------104二.循環(huán)波動相關(guān)數(shù)圖-------------------------------------------105

應(yīng)用統(tǒng)計學(xué)希臘字母表大寫小寫讀音主要用途和用法Ααalpha顯著水平;分布參數(shù)Ββbeta分布參數(shù);第二類錯誤的概率Γγgamma分布參數(shù)Δδdelta差分;誤差Εεepsilon無窮小的總體誤差及樣本誤差Ηηeta分布參數(shù)Θθtheta待估分布參數(shù)Λλlambda普阿松分布參數(shù);待估分布參數(shù)Μμmu分布均值Ξξxi待估分布參數(shù)Ππpi圓周率Ρρrho相關(guān)系數(shù);比率待估分布參數(shù)Σσsigma分布標準差Ττtau待估分布參數(shù)Φφphi待估分布參數(shù)Χχchi卡方分布Ψψpsi待估分布參數(shù)Ωωomega樣本空間及樣本點第一章數(shù)據(jù)的整理與圖形第一節(jié)數(shù)據(jù)的整理與圖形表示數(shù)據(jù)整理——一般來說數(shù)據(jù)整理的一項初步工作是對數(shù)據(jù)進行統(tǒng)計分組。統(tǒng)計分組——一般按照數(shù)據(jù)的品質(zhì)標志或數(shù)量標志分組。不同的分組標志反映總體的不同特征,因此,必須從統(tǒng)計研究任務(wù)的需要出發(fā),選擇能夠反映現(xiàn)象本質(zhì)特征的標志。品質(zhì)標志——從事物的性質(zhì)或?qū)傩蕴卣魃蠀^(qū)分各種類型組。如性別、顏色、產(chǎn)品等級、生產(chǎn)廠家等。數(shù)量標志——從事物的數(shù)量差異程度上來區(qū)分各種類型組。如溫度、產(chǎn)量、年齡、銷售量等。頻數(shù)——分配在某統(tǒng)計分組內(nèi)的數(shù)據(jù)個數(shù)稱為該組的頻數(shù)。頻率——某組頻數(shù)與全部組的頻數(shù)之和的比值稱為該組的頻率。頻率分布——按數(shù)據(jù)的某種標志分組,把全部數(shù)據(jù)在各組中的分配狀況稱為頻率分布。頻數(shù)頻率分布表——將分組標志、各組頻數(shù)及頻率列成表格。反映總體的分布規(guī)律和性質(zhì),在定量統(tǒng)計分析中有廣泛的用途。第一節(jié)數(shù)據(jù)的整理與圖形表示頻數(shù)頻率分布表標準樣式:按品質(zhì)標志或數(shù)量標志頻數(shù)頻率(%)A1X1=X1/TA2X2=X2/T………AnXn=Xn/T總計T=X1+X2+…+Xn100.00一.餅形圖適用于分組數(shù)少用于描述和表現(xiàn)各成分或某一成分占全部的百分比各成分總和=100%用圓代表全體,用扇形區(qū)域代表各成分,扇形區(qū)域面積占整個圓面積的百分比等于該成分占全部的百分比例1.1某公司工作人員的性別頻數(shù)頻率分布表如下:按性別分組頻數(shù)(人數(shù))頻率(%)男12060.00女8040.00總計200100.00二.組距分組法與頻率直方圖數(shù)據(jù)標志取值個數(shù)較小(單項數(shù)列)——采用品質(zhì)分組法。例如5分制的學(xué)生成績。數(shù)據(jù)標志取值個數(shù)較多或連續(xù)變量(組距數(shù)列)——采用組距分組法(等距數(shù)列和異距數(shù)列)。例如百分制的學(xué)生成績。異距數(shù)列——制作直方圖時,要先計算出各組的頻數(shù)密度=頻數(shù)/組距,然后以組距為寬,以頻數(shù)密度為高畫直方圖。組距分組法(等距數(shù)列)的操作步驟如下:例1.2從一批電阻中抽取30只,測得各只電阻的電阻值如下表。對這組數(shù)據(jù)適當分組,并建立頻數(shù)頻分布表和繪制頻率直方圖。4.34.64.73.73.83.24.04.42.83.43.73.24.12.64.64.94.13.43.82.73.54.43.63.24.03.83.54.24.63.9二.組距分組法與頻率直方圖(續(xù))第一步:找出最大值L,最小值l,計算極差R=L-l。本例中L=4.9,l=2.6,R=4.9-2.6=2.3。第二步:確定分組個數(shù)k,計算組距h。分組個數(shù)一般由下表確定(根據(jù)美國統(tǒng)計學(xué)家斯特吉斯提出的經(jīng)驗公式:組數(shù)=1+3.322LogN得出,其中N為數(shù)據(jù)個數(shù))。本例選取k=5。則組距k=R/h=2.3/5=0.46,為計算方便可取h=0.5。樣本容量N分組各數(shù)k50以下5~650~1006~10100~2507~12250以上10~20二.組距分組法與頻率直方圖(續(xù))第三步:決定各組界限值,確定分點。第一組的下限值=l-h/2,上限值=l+h/2。本例中也可取第一組下限值為2.5,上限值為2.5+h=2.5+0.5=3;依此類推第五組下限值為4.5,上限值為5.0。第四步:數(shù)出各組頻數(shù),計算頻率,作出頻數(shù)頻率分布表如下。要特別注意:數(shù)據(jù)正好是界限值時,則該數(shù)據(jù)應(yīng)被計數(shù)在以它為下限的組中。組序分組界限頻數(shù)頻率1[2.5,3.0)30.1002[3.0,3.5)50.1653[3.5,4.0)90.3004[4.0,4.5)80.2705[4.5,5.0)50.165合計301.000二.組距分組法與頻率直方圖(續(xù))第五步:由頻數(shù)頻率分布表可以畫出頻率直方圖。在平面直角坐標系的橫坐標X軸上標出各組界限值在各組下限值與上限值之間畫出高為該組頻率的矩形直方圖的特點:簡單、直觀,能夠反映數(shù)據(jù)是否呈對稱分布,數(shù)據(jù)的平均水平及散布情況。三.條形圖與柱狀圖條形圖與柱狀圖本質(zhì)上沒有太大區(qū)別,都是用來對各項信息進行比較。主要區(qū)別:數(shù)據(jù)是對事物在時間序列上的度量,一般用橫坐標表示時間,這樣可以直接地觀察事物隨時間變化的情況——采用柱狀圖。如果數(shù)據(jù)不是按時間排列的且各項信息的標識過長時——采用條形圖。例1.3某電視機生產(chǎn)廠家2006年市場占有率及其主要競爭對手的市場占有率資料如下表所示。請分別用條形圖和柱狀圖表示該組數(shù)據(jù)。該廠商競爭對手A競爭對手B競爭對手C競爭對手D15%10%14%12%8%三.條形圖與柱狀圖(續(xù))四.并列條形圖或并列柱狀圖并列條形圖或并列柱狀圖有利于對兩組或兩組以上的并列數(shù)據(jù)進行對比。(還有一種堆積條形圖)例1.4某電視機生產(chǎn)廠家2005和2006年市場占有率及其主要競爭對手的市場占有率資料如下表所示。請用并列柱狀圖表示該組數(shù)據(jù)。該廠商競爭對手A競爭對手B競爭對手C競爭對手D200511%7%15%11%10%200615%10%14%12%8%三.并列條形圖或并列柱狀圖(續(xù))三.莖葉圖莖葉圖——也是一種條形圖,它是把每個數(shù)分成莖和葉兩部分,同莖的數(shù)排成一列,然后按莖和葉的大小排列成圖。一般取數(shù)據(jù)的最后一位數(shù)為葉,前幾位數(shù)為莖。分為一般莖葉圖和有序莖葉圖。莖葉圖——它直觀地顯示了數(shù)據(jù)所在的范圍以及數(shù)據(jù)的總體水平(集中或分散情況),它的優(yōu)點是可以清楚地看到落在每一直方形中的具體數(shù)據(jù),而且可以較容易地找出有用的分位數(shù),如中位數(shù)等。例1.5某班級(40人)應(yīng)用統(tǒng)計學(xué)期末考試成績?nèi)缦卤硭?。請畫出莖葉圖。67658575707275586983827396698583787480706584858170889086777886929385727670838875三.莖葉圖(續(xù))以十位數(shù)為莖,個位數(shù)為葉,畫出的莖葉圖如下:586759957502538400782605853253045186653896023三.莖葉圖(續(xù))還可以把各莖葉上的葉按大小排序,得到有序莖葉圖如下:586557997000022345556788801233345555668890236第二節(jié)數(shù)據(jù)的描述性指標測定每個觀察單位某項指標值的大小,所得的資料稱為計量資料又稱測量資料,這類資料一般具有計量單位。計量資料的統(tǒng)計指標分成兩大類:數(shù)據(jù)集中趨勢的度量——表達計量資料集中位置的指標,用以描述觀察值的平均水平,如算術(shù)均值、幾何均值、調(diào)和均值、中位數(shù)、眾數(shù)、百分位數(shù)。數(shù)據(jù)離散趨勢的度量——表達計量資料變異的指標,又稱離散指標,用以描述觀察值間參差別不齊的程度,即離散度或稱變異度,如全距、標準差、方差、標準誤差、變異系數(shù)、四分位數(shù)間距等。設(shè)原始觀察值為第組頻數(shù)(有時可以是出現(xiàn)的頻率)記為,組中值記為

一.數(shù)據(jù)集中趨勢的度量表示數(shù)據(jù)的集中點或中心點。根據(jù)不同的實際需要,可以采用下列指標之一來對數(shù)據(jù)的集中趨勢進行度量:算術(shù)平均值簡稱為均值總體均值用希臘字母表示,樣本均值用表示。算術(shù)平均值的具體計算方法分為簡單算術(shù)平均和加權(quán)算術(shù)平均兩種:簡單算術(shù)平均加權(quán)算術(shù)平均算術(shù)平均值有兩個重要的數(shù)學(xué)性質(zhì):①各個變量值與平均值離差之和等于零。②各個變量值與平均值的離差平方之和為最小值。一.數(shù)據(jù)集中趨勢的度量(續(xù))中位數(shù)(或稱中數(shù))中位數(shù)用M表示,它將總體或樣本的全部觀察值分成兩部分,每部分各有50%個觀察值,其計算方法為:先將原始觀察值按由小到大順序排列后,位次處于中間的那個觀察值為中位數(shù)。觀察值為奇數(shù)時,處于中間的那個數(shù)為中位數(shù)。偶數(shù)時處于中間的兩個數(shù)的均值為中位數(shù)。中位數(shù)是位置平均值,它不受極端值的影響,在具有個別極大或極小值的分布數(shù)列中,中位數(shù)比算術(shù)平均值更具有代表性。一.數(shù)據(jù)集中趨勢的度量(續(xù))眾數(shù)頻數(shù)最大的變量值稱為眾數(shù),列為頻數(shù)表的資料,頻數(shù)最大的組的組中值為眾數(shù)。當數(shù)據(jù)個數(shù)較少時,眾數(shù)就是出現(xiàn)次數(shù)最多的那個數(shù)據(jù)。對于一組數(shù)據(jù),眾數(shù)可以不止一個,也可能沒有眾數(shù)。適用于粗略地表示呈單峰分布資料的集中趨勢。一.數(shù)據(jù)集中趨勢的度量(續(xù))百分位數(shù)百分位數(shù)以表示,它將總體或樣本的全部觀察值分成兩個部分,其中有個觀察值小于,(100-)%個觀察值大于。如百分之25分位數(shù)或稱第25百分位數(shù),表示有25%個觀察值小于;75%個觀察值大于。中位數(shù)就是百分之50分位數(shù)。常用的有上四分位數(shù)和下四分位數(shù)一.數(shù)據(jù)集中趨勢的度量(續(xù))上四分位數(shù)的計算將數(shù)據(jù)由小到大排列,記排列后的數(shù)據(jù)為令:其中表示向上取整,如。則上四分位數(shù)就是,即約有1/4的數(shù)據(jù)比大,3/4的數(shù)據(jù)比比小。一.數(shù)據(jù)集中趨勢的度量(續(xù))下四分位數(shù)的計算將數(shù)據(jù)由小到大排列,記排列后的數(shù)據(jù)為令:其中表示向上取整,如。則下四分位數(shù)就是,即約有3/4的數(shù)據(jù)比大,1/4的數(shù)據(jù)比比小。一.數(shù)據(jù)集中趨勢的度量(續(xù))例1.6某班30名MBA學(xué)生的年齡按上升順序排列如下表。請計算這組數(shù)據(jù)的眾數(shù)、中數(shù)、平均數(shù)、上四分位數(shù)和下四分位數(shù)。眾數(shù)為27和28;分別出現(xiàn)5次中數(shù)為(27+28)/2=27.5平均數(shù)為27.67上四分位數(shù)為x23=30,下四分位數(shù)x8=26242425252525262626262727272727282828282829293030303031313132一.數(shù)據(jù)集中趨勢的度量(續(xù))中位數(shù)、眾數(shù)、平均數(shù)的運用比較中位數(shù)對極端值不像平均數(shù)那么敏感,因此對于有極端值的數(shù)據(jù)集來說,采用中位數(shù)描述其集中趨勢一般比平均數(shù)更合適。眾數(shù)的主要缺點是可能沒有眾數(shù)或不惟一,而平均數(shù)和中數(shù)都是存在并且惟一的。它的優(yōu)點是反映了數(shù)據(jù)集中最常見的數(shù)值,即最普遍的數(shù)值,當數(shù)據(jù)多且有明顯集中趨勢時,計算眾數(shù)既方便且有意義,并且它不僅對數(shù)量型數(shù)據(jù)有意義,對分類型數(shù)據(jù)集也有意義。平均數(shù)的優(yōu)點在于它容易理解和計算。它的一個主要缺點是它對極端值特別敏感;它的另一個缺點是它不考慮數(shù)據(jù)在數(shù)據(jù)集中的重要性,一律平等對待。加權(quán)平均數(shù)克服了平均數(shù)不考慮數(shù)據(jù)在數(shù)據(jù)集中的重要性的缺陷,采用權(quán)重反映數(shù)據(jù)在數(shù)據(jù)集中的重要性,并且具有容易計算的優(yōu)點。一.數(shù)據(jù)集中趨勢的度量(續(xù))運用中位數(shù)、眾數(shù)、平均數(shù)的數(shù)量關(guān)系判別總體分布特征(*)次數(shù)分布呈對稱分布曲線時,算術(shù)平均數(shù)、眾數(shù)、中位數(shù)三者完全相等。次數(shù)分布呈右偏態(tài)時,算術(shù)平均>中位數(shù)>眾數(shù)。次數(shù)分布呈左偏態(tài)時,算術(shù)平均<中位數(shù)<眾數(shù)。一.數(shù)據(jù)集中趨勢的度量(續(xù))利用位置平均數(shù)與算術(shù)平均數(shù)的關(guān)系進行推算(*)根據(jù)經(jīng)驗,在分布偏斜程度不大的情況下,不論右偏態(tài)還是左偏態(tài),三者存在一定比例關(guān)系,中位數(shù)居中,眾數(shù)Me與中位數(shù)Mo距離約為算術(shù)平均數(shù)與中位數(shù)的2倍,即有公式:一.數(shù)據(jù)集中趨勢的度量(續(xù))例如:某城市住戶家庭月收入的抽樣調(diào)查資料計算資料計算得到眾數(shù)為1040元,中位數(shù)為1128.57,問算術(shù)平均數(shù)約為多少?其分布呈何形態(tài)?算術(shù)平均數(shù)=(3*1128.57-1040)/2=1172.86所以有算術(shù)平均>中位數(shù)>眾數(shù),呈現(xiàn)右偏態(tài)分布,也說明收入分配中算術(shù)平均數(shù)偏向高端,多數(shù)居民收入低于算術(shù)平均數(shù)。二.數(shù)據(jù)離散趨勢的度量全距——也稱極差是一種離散指標,是最大與最小觀察值之差。用極差反映總體分布的離散程度雖然簡便,但它只從兩端數(shù)值考察,忽略了中間數(shù)據(jù)的變動情況,不能說明整體的差異程度,尤其是存在極端值情況下,使用極差往往會造成錯誤的結(jié)論。二.數(shù)據(jù)離散趨勢的度量(續(xù))四分位差——即上四分位數(shù)與下四分位數(shù)的差數(shù)。它一般不受極端值的影響。方差——是一種常用的離散指標,樣本的方差計算公式為:

,標準差——,與數(shù)據(jù)具有相同的單位。二.數(shù)據(jù)離散趨勢的度量(續(xù))變異系數(shù)——是一種離散指標,簡記為CV,它是標準差與均值之比,用百分數(shù)表示:由于CV無量度單位,而且消除了原始資料的平均水平的影響,因此常用于比較量度單位不相同的指標或者平均水平相差懸殊的指標的變異程度。二.數(shù)據(jù)離散趨勢的度量(續(xù))各種離散趨勢度量的適用場合比較分析極差——最簡單、最直觀、最容易計算。但特別容易受極端值的影響。四分布差——不像極差那么容易受極端值的影響,但仍然存在沒有充分利用數(shù)據(jù)所有信息的缺陷。方差和標準差——最常用的度量數(shù)據(jù)離散程度的指標,它用數(shù)據(jù)自身與平均數(shù)之差的大小加權(quán),因而區(qū)別對待了大小不同的數(shù)據(jù),距離平均數(shù)遠的數(shù)據(jù)權(quán)重比較大,距離平均數(shù)近的數(shù)據(jù)權(quán)重比較小,比較合理地反映了不同數(shù)據(jù)對離散度量的作用。缺點是計算比較繁瑣,且方差的單位常常沒有意義。變異系數(shù)——比較兩組或兩組以上數(shù)據(jù)集的離散趨勢度量時,應(yīng)采用無量度單位的變異系數(shù)CV。二.數(shù)據(jù)離散趨勢的度量(續(xù))數(shù)據(jù)離散趨勢度量——方差的作用衡量數(shù)據(jù)的穩(wěn)定性——例如:產(chǎn)品的質(zhì)量評價事物的風險——例如:投資的風險數(shù)據(jù)的方差分析——例如:數(shù)據(jù)的挖掘第二章隨機變量以及抽樣分布第一節(jié)隨機變量概念和隨機變量的數(shù)字特征隨機變量是描述隨機事件的數(shù)學(xué)模型。學(xué)習(xí)和掌握隨機變量的概念是學(xué)習(xí)統(tǒng)計學(xué)的前提。隨機試驗的每一個可能結(jié)果稱為樣本點,用ω表示,樣本點全體組成的集合稱為樣本空間,用Ω表示。隨機事件是由若干個樣本點組成的集合,或者說是樣本空間的某個子集。隨機變量是定義在樣本空間上的函數(shù),即對于隨機試驗的每一個可能結(jié)果ω,隨機變量X取值X(ω)也不同,并且以確定的概率取這些不同的值。隨機變量一般用X,Y,Z表示。按照隨機變量的取值情況,把隨機變量分成兩類:離散型隨機變量——用概率函數(shù)描述。連續(xù)型隨機變量——用概率密度函數(shù)描述。對于任意實數(shù)x,隨機變量X的分布函數(shù)為:即隨機變量X的取值不大于x的概率。第一節(jié)隨機變量概念和數(shù)字特征一.隨機變量的數(shù)學(xué)期望E(X)一個隨機變量的數(shù)學(xué)期望是對該隨機變量分布中心的度量,它反映了隨機變量的(加權(quán))平均取值,因此數(shù)學(xué)期望也稱為隨機變量的均值。數(shù)學(xué)期望也常常用希臘字母μ表示,即μ=E(X)。離散型隨機變量的數(shù)學(xué)期望設(shè)離散型隨機變量X的概率函數(shù)為則根據(jù)概率函數(shù)的性質(zhì)有離散型隨機變量X的數(shù)學(xué)期望為第一節(jié)隨機變量概念和數(shù)字特征一.隨機變量的數(shù)學(xué)期望E(X)連續(xù)型隨機變量的數(shù)學(xué)期望設(shè)連續(xù)型隨機變量X的概率密度函數(shù)為則根據(jù)概率函數(shù)的性質(zhì)有連續(xù)型隨機變量X的數(shù)學(xué)期望為第一節(jié)隨機變量概念和數(shù)字特征二.隨機變量的方差D(X)和標準差σ離散型隨機變量X的方差定義為連續(xù)型隨機變量X的方差定義為方差的概念我們稱為隨機變量X關(guān)于它期望的離差。由方差定義,方差就是離散平方的數(shù)學(xué)期望,即離散平方的平均值。因此,方差D(X)小,說明隨機變量X的分布比較集中;方差D(X)大,說明隨機變量X的分布比較分散。隨機變量X的標準差。標準差和原隨機變量具有相同的度量單位。隨機變量的方差也可以記為,即。第一節(jié)隨機變量概念和數(shù)字特征例2.1已知隨機變量X的分布列為試求:隨機變量的均值E(X)和方差D(X)解法1:E(X)=1×0.2+2×0.1+3×0.4+4×0.3=2.8D(X)=(1-2.8)2×0.2+(2-2.8)2×0.1+(3-2.8)2×0.4+(4-2.8)2×0.3=1.16X1234P0.20.10.40.3第一節(jié)隨機變量概念和數(shù)字特征解法2:E(X)=1×0.2+2×0.1+3×0.4+4×0.3=2.8E(X2)=1×0.2+4×0.1+9×0.4+16×0.3=9由于有證明:隨機變量平方的數(shù)學(xué)期望不小于其數(shù)學(xué)期望的平方。D(X)=9-2.82=1.16第二節(jié)常用隨機變量以及分布一.0-1分布只取兩個不同數(shù)值的隨機變量X稱為0-1分布。定義:設(shè)0<p<1,如果X的概率函數(shù)為則稱X服從參數(shù)為p的0-1分布,記為B(1,p)。0-1分布的概率函數(shù)也可以表示為X01P1-pp第二節(jié)常用隨機變量以及分布一.0-1分布0-1分布的數(shù)學(xué)期望為0-1分布的方差為任何一個只有兩種可能結(jié)果的隨機試驗,都可以用一個服從0-1分布的隨機變量來描述。有時也稱0-1分布為兩點分布或貝努利分布。第二節(jié)常用隨機變量以及分布二.二項分布定義:若隨機變量X的所有可能取值為0,1,┄,n,且它的概率函數(shù)為則稱X服從參數(shù)為n和p的二項分布。其中0<p<1。記為X~B(n,p)。當n=1時,二項分布就是0-1分布。n無限大時,趨向正態(tài)分布。二項分布的性質(zhì)二項分布的數(shù)學(xué)期望二項分布的方差第二節(jié)常用隨機變量以及分布二.二項分布應(yīng)用:對產(chǎn)品有放回地做n次檢驗,每一次檢驗一個產(chǎn)品是否合格,n次檢驗中正好有k個產(chǎn)品合格的概率,其中每一次檢驗得到合格的概率為p。證明:由貝努利概型(在重復(fù)獨立試驗中,每次試驗的結(jié)果只有兩個可能)知,在指定k次檢驗中出現(xiàn)合格,而在其余n-k次檢驗中出現(xiàn)不合格的概率為例如:在前k次檢驗中出現(xiàn)合格,而后面n-k次檢驗中出現(xiàn)不合格個概率由于事件合格在n次檢驗中的任k次出現(xiàn),共有種情況,而這么多種情況所對應(yīng)的這么多個事件是不相容的。因此由概率的有限可加性得到:第二節(jié)常用隨機變量以及分布三.正態(tài)分布與標準正態(tài)分布設(shè)連續(xù)型隨機變量X的密度函數(shù)為正態(tài)分布的分布函數(shù)為其中是正態(tài)分布隨機變量的均值,是方差,我們稱X服從均值為方差為的正態(tài)分布,記為第二節(jié)常用隨機變量以及分布三.正態(tài)分布與標準正態(tài)分布正態(tài)分布的概率密度函數(shù)曲線為第二節(jié)常用隨機變量以及分布三.正態(tài)分布與標準正態(tài)分布正態(tài)分布的密度函數(shù)性質(zhì)p(x)與x軸之間的面積都是1。曲線關(guān)于x=μ對稱,因此μ是正態(tài)分布的位置參數(shù)。方差σ2的大小決定了密度曲線的高矮胖瘦:σ2越大,曲線越矮越胖;σ2越小,曲線越高越瘦。標準正態(tài)分布期望值為0和標準差為1的正態(tài)分布N(0,1)稱為標準正態(tài)分布,即μ=0,σ=1。常用U表示。第二節(jié)常用隨機變量以及分布三.正態(tài)分布與標準正態(tài)分布標準正態(tài)分布概率密度函數(shù)為分布函數(shù)為標準正態(tài)分布關(guān)于縱軸對稱,對任意實數(shù)x,有第二節(jié)常用隨機變量以及分布三.正態(tài)分布與標準正態(tài)分布正態(tài)變量的線性變換標準化變換——把隨機變量X減去自己的均值μ,再除以自己的標準差σ,所得到的新變量Z=(X-μ)/σ,稱為原變量X的標準化變換,或簡稱標準化。一般正態(tài)分布與標準正態(tài)分布之間的關(guān)系是:若則Z=(X-μ)/σ~N(0,1)分布函數(shù)之間的關(guān)系:第二節(jié)常用隨機變量以及分布四.正態(tài)分布的計算設(shè),則例2.1設(shè),試求:解:第二節(jié)常用隨機變量以及分布四.正態(tài)分布的計算設(shè),則第二節(jié)常用隨機變量以及分布四.正態(tài)分布的計算設(shè),若知,求c第三節(jié)總體與樣本一.總體總體——研究對象的全體稱為總體。通常我們研究對象某項數(shù)量指標,即總體就是研究對象的某項數(shù)量指標X的值的全體。一般,X的取值在客觀上有一定的分布F,故X是一個隨機變量。因此,對總體的研究就是對相應(yīng)的隨機變量X的分布F(x)的研究。X的分布函數(shù)和數(shù)字特征分別稱為總體的分布函數(shù)F(x)和數(shù)字特征。p維總體——在有些問題中,研究對象可能要觀測兩個或多個指標,則可用多維隨機變量去描述總體,也可用其聯(lián)合分布函數(shù)去描述總體。個體——組成總體的每一個基本元素稱為個體。有限總體和無限總體——根據(jù)總體包含個體總數(shù)的多少分為有限總體和無限總體。當有限總體所包含的個體總數(shù)很大時,可以近似地將它看成是無限總體。第三節(jié)總體與樣本二.樣本樣本——總體中抽取若干個體所組成的集合稱為一個樣本。樣本容量——樣本中所包含個體的個數(shù)稱為樣本容量。從總體中抽出的容量為n的樣本記為,這里每個Xi都看成是隨機變量,因為第i個被抽到個體具有隨機性,在觀察前是不知其值的。樣本的觀察值記為。n次不重復(fù)抽樣——抽樣時,每次從總體中抽取一個不放回去,再抽取第二個,連續(xù)抽取n次。重復(fù)抽樣——抽樣時,每次從總體中抽取一個進行觀察后放回去,再抽取第二個,連續(xù)抽取n次。重復(fù)抽樣的特例:對于無限總體,抽取有限個n后不會影響總體的分布,在這種情況下,不重復(fù)抽樣等價于重復(fù)抽樣。在實際應(yīng)用時,如果總體所包含的個體個數(shù)很大,而樣本容量很小,可認為總體是無限的,抽樣時可以認為是重復(fù)抽樣。第三節(jié)總體與樣本二.樣本簡單隨機樣本——設(shè)X是具有分布函數(shù)F(x)的隨機變量,若是具有同一分布函數(shù)F(x)的相互獨立的隨機變量,則稱是來自總體X(或總體F(x))的容量為n的簡單隨機樣本,簡稱樣本。即抽取的樣本滿足以下要求:代表性——每一個體都有同等機會被選入樣本,這便意味著每一樣品Xi與總體X有相同的分布。獨立性——樣本中每一樣品取什么值不受其它樣品取值的影響,這意味著相互獨立。第三節(jié)總體與樣本三.聯(lián)合分布函數(shù)和聯(lián)合概率密度若是來自總體F的一個容量為n的簡單隨機樣本(獨立同分布樣本),則的聯(lián)合分布函數(shù)為若X具有概率密度f,則的聯(lián)合概率密度為第四節(jié)抽樣方法統(tǒng)計調(diào)查與整理——根據(jù)研究的目的和要求,有組織、有計劃地搜集資料和對這些資料進行去偽存真、去粗取精的分類整理、濃縮簡化的工作過程。統(tǒng)計調(diào)查的方式——按其組織方式可分為:統(tǒng)計報表制度專門組織的統(tǒng)計調(diào)查;專門組織的調(diào)查可分為:普查重點調(diào)查典型調(diào)查抽樣調(diào)查其中抽樣調(diào)查方法已經(jīng)發(fā)展為現(xiàn)代統(tǒng)計科學(xué)的一個分支系列。抽樣的目的——我們抽取樣本的目的是為了對總體進行推斷。為了能從樣本正確推斷總體就要求所抽取的樣本能很好地反映總體的信息,所以要有一個正確的抽取樣本的方法。第四節(jié)抽樣方法抽樣調(diào)查方法的重要特點:隨機原則(機會均等原則)——按照隨機原則從總體中抽取樣本單位。調(diào)查者不帶任何主觀傾向,完全憑偶然性抽取樣本單位,使總體的每個單位有均等機會被抽中。推斷總體——以樣本的指標即統(tǒng)計量為依據(jù)推斷總體的參數(shù)或檢驗總體的某種假設(shè)。抽樣調(diào)查的目的就是要對總體的數(shù)量特征作出估計或作出某種判斷,而且它是以概率論闡明的有關(guān)分布規(guī)律為依據(jù)的估計,可以計算其可靠性和精確度。誤差事先控制——抽樣調(diào)查方法的誤差可以事先計算并加以控制。用樣本指標推斷總體,不可避免地會產(chǎn)生誤差,即抽樣誤差。抽樣誤差也是隨機變量,其分布具有一定的規(guī)律性,可以依據(jù)這種分布規(guī)律和具體的抽樣條件計算抽樣誤差的大小。影響抽樣誤差大小的因素主要有三個方面:總體內(nèi)部的差異程度;樣本容量的大??;抽樣的方式方法。第四節(jié)抽樣方法進行抽樣調(diào)查時,必須事前根據(jù)研究對象的特點和具體條件,對抽取樣本的程序和具體方法進行周密的設(shè)計,選擇最合適的組織方式?;镜某闃咏M織方式有簡單隨機抽樣、分層抽樣、整群抽樣和系統(tǒng)抽樣。一.簡單隨機抽樣簡單隨機抽樣——也稱完全隨機抽樣,對總體單位不作任何分類或排隊,完全按隨機原則逐個地抽取樣本單位。它是在無限總體中進行的無放回獨立抽樣或在有限總體中進行的有放回隨機抽樣。隨機抽樣特點:理論上最易處理,但實施時較困難;可用樣本平均數(shù)來估計總體均值;限于總體規(guī)模不大,內(nèi)部差異也不很大的情況第四節(jié)抽樣方法二.分層抽樣分層抽樣——也稱類型抽樣,它將總體的成員按某種原則劃分成若干個子總體(類型組),每個子總體稱為一個層。在每層中獨立進行簡單隨機抽樣或其他抽樣。分層抽樣特點:先對各層進行估計,然后再綜合成總體參數(shù)估計;因為子總體的差異必定小于總體差異,因此,分層抽樣的抽樣誤差比簡單隨機抽樣小,抽樣推斷的效果好。;適用于既需要對總體進行估計,也需要對局部進行估計的情況。當層內(nèi)成員差異較小,而層間成員差異較大時,分層抽樣可以提高估計的精度。第四節(jié)抽樣方法三.整群抽樣整群抽樣——它將總體的成員分成若干群(或組),從這些群(或組)中抽取部分群(或組),調(diào)查對象是被抽中的這些群(或組)中的所有成員。整群抽樣特點:優(yōu)點是當被調(diào)查單位地理位置比較集中時,實施起來比較方便,可以節(jié)省人力和財力;缺點是由于調(diào)查單位集中在若干群或組中,而不能均勻地分布在總體的各部分。因此,它的準確性較差;但可以通過適當?shù)囟喑槿∫恍┤簛韽浹a。第四節(jié)抽樣方法四.系統(tǒng)抽樣系統(tǒng)抽樣——又稱為等距抽樣或機械抽樣,它將總體中的調(diào)查單位按某種次序排列,隨機地選定初始單位,然后按相等的間距抽取其他樣本單位。例如總體共有N個單位,從中抽取n個單位, N/n=k便是等距抽樣的間隔距離,然后在第一組中先抽取一個單位,再每隔k個單位抽取一個,直到抽滿n個單位。系統(tǒng)抽樣特點:優(yōu)點是總體各部分都能在一定程度上被包含到樣本中,實施方便。缺點是當初始單位決定后,樣本只有一種組合,不再具有隨機性。當次序排列具有周期性時,容易產(chǎn)生嚴重的偏差。因此,必須對排列次序進行細致的研究。第五節(jié)樣本統(tǒng)計量的分布一.統(tǒng)計量統(tǒng)計量定義:設(shè)是來自總體X的一個樣本,是的函數(shù)。若g是連續(xù)函數(shù),且g中不含任何未知參數(shù),則稱是一個統(tǒng)計量。統(tǒng)計量是樣本的函數(shù),它是一個隨機變量。觀察值定義:設(shè)是相應(yīng)于樣本的樣本值,則稱是的觀察值抽樣分布:統(tǒng)計量的分布稱為抽樣分布。第五節(jié)樣本統(tǒng)計量的分布一.統(tǒng)計量例2.5.1設(shè)總體,其中未知,已知,設(shè)為來自X的一個樣本,則是統(tǒng)計量是統(tǒng)計量不是統(tǒng)計量(含有未知參數(shù))是統(tǒng)計量不是統(tǒng)計量第五節(jié)樣本統(tǒng)計量的分布二.常用統(tǒng)計量設(shè)是來自總體X的一個樣本,是這一樣本的觀測值,則樣本平均值:樣本方差:樣本標準差:樣本k階原點矩:樣本k階中心矩:樣本觀測值的計算將上面公式全部改寫為小寫即可。第五節(jié)樣本統(tǒng)計量的分布三.三大分布(分布、t分布、F分布)卡方分布設(shè)是來自總體N(0,1)且相互獨立的樣本,則隨機變量

服從自由度為n的分布,記為。其中,自由度是指上式右端包含的獨立變量的個數(shù)。第五節(jié)樣本統(tǒng)計量的分布卡方分布的概率密度為f(y)的圖形如下所示:第五節(jié)樣本統(tǒng)計量的分布卡方分布的性質(zhì)可加性:設(shè),且它們相互獨立,則數(shù)學(xué)期望和方差若,則α分位點對于給定的正數(shù)α,0<α<1,稱滿足條件的點為分布的上α分位點。例如:,第五節(jié)樣本統(tǒng)計量的分布卡方分布的上α分位點如下圖所示:第五節(jié)樣本統(tǒng)計量的分布三.三大分布(分布、t分布、F分布)t分布設(shè),并且X和Y相互獨立,則稱隨機變量

服從自由度為n的t分布,記為。第五節(jié)樣本統(tǒng)計量的分布

t分布的概率密度為h(t)的圖形如下所示:第五節(jié)樣本統(tǒng)計量的分布t分布的性質(zhì)t分布與正態(tài)分布比較:t分布類似于標準正態(tài)分布,兩者都是均值為0的對稱的鐘形曲線,取值范圍也都在負無窮大到正無窮大。但t分布的方差大于1,與標準正態(tài)分布相比中心部分較低,兩個尾部較高。自由度n越小,這些差別就越明顯,隨著自由度n不斷增大,t分布越來越趨近于標準正態(tài)分布,并以其為極限。數(shù)學(xué)期望和方差α分位點對于給定的正數(shù)α,0<α<1,稱滿足條件的點為分布的上α分位點。由對稱性知:例如:,第五節(jié)樣本統(tǒng)計量的分布

t分布的上α分位點如下圖所示:第五節(jié)樣本統(tǒng)計量的分布三.三大分布(分布、t分布、F分布)F分布設(shè),并且U和V相互獨立,則稱隨機變量

服從自由度為

的F分布,記為。第五節(jié)樣本統(tǒng)計量的分布

F分布的概率密度為ψ(t)的圖形如下所示:第五節(jié)樣本統(tǒng)計量的分布F分布的性質(zhì)F分布的性質(zhì):

由定義可知,若,則數(shù)學(xué)期望:α分位點對于給定的正數(shù)α,0<α<1,稱滿足條件的點為分布的上α分位點。重要性質(zhì):例如:,第五節(jié)樣本統(tǒng)計量的分布

F分布的上α分位點如下圖所示:第五節(jié)樣本統(tǒng)計量的分布四.正態(tài)總體的樣本均值和樣本方差分布設(shè)總體的X的均值為μ,方差為σ2,是X的一個樣本,則樣本均值有定理一:相互對立的正態(tài)分布的線性組合還是正態(tài)分布。推論:設(shè)為來自總體的一個樣本,則有定理二:

第五節(jié)樣本統(tǒng)計量的分布四.正態(tài)總體的樣本均值和樣本方差分布定理三:設(shè)為來自總體的一個樣本,則有

第五節(jié)樣本統(tǒng)計量的分布四.正態(tài)總體的樣本均值和樣本方差分布定理四:設(shè)與分別是具有相同方差的兩個正態(tài)總體的樣本,且這兩個樣本相互獨立。則有

其中第五節(jié)樣本統(tǒng)計量的分布五.獨立同分布的中心極限定理設(shè)隨機變量相互獨立,服從同一分布,且具有相同的數(shù)學(xué)期望和方差:則標準化隨機變量有的極限分布是標準正態(tài)分布——即n很大時,Yn近似地服從標準正態(tài)分布第五節(jié)樣本統(tǒng)計量的分布五.獨立同分布的中心極限定理即有這表明:當n較大時,可用正態(tài)分布近似計算與n個相互獨立、同分布隨機變量的算術(shù)平均值

有關(guān)事件的概率和各階距,這在應(yīng)用中是有重要意義的。第三章參數(shù)估計第一節(jié)參數(shù)的點估計一.參數(shù)點估計的一般提法設(shè)總體的分布函數(shù)的形式已知,θ是待估參數(shù)。是X的一個樣本,是相應(yīng)的一個樣本觀測值。點估計問題就是要構(gòu)造一個適當?shù)慕y(tǒng)計量用它的觀測值來估計未知參數(shù)θ。

為θ

的估計量,稱為θ的估計值。估計量與估計值統(tǒng)稱為估計,簡記為。

第一節(jié)參數(shù)的點估計二.參數(shù)點估計的求法矩估計法——用樣本各階原點矩的函數(shù)來估計總體各階原點矩的同一個函數(shù)的方法稱為矩估計法。這是參數(shù)點估計的最常用方法。矩估計法的優(yōu)點——不要求知道總體的分布,因而矩估計獲得廣泛的應(yīng)用。例3.1某燈炮廠某天生產(chǎn)了一批燈泡,從中隨機地抽取10只,測得壽命(小時)如下:試用矩估計法估計該批燈泡的平均壽命及標準差。1050110010801120120012501040113013001200第一節(jié)參數(shù)的點估計二.參數(shù)點估計的求法解:總體的k階原點矩為:當k=1時存在,則可以用樣本的一階矩去估計總體的一階矩

,有同樣,當k=2時,總體二階矩存在,總體的標準差為:分別用樣本二階矩A2估計,樣本一階矩A1

估計,因此它的矩估計值為

第一節(jié)參數(shù)的點估計三.點估計量的評價標準對一個未知參數(shù)θ,人們可以構(gòu)造多個估計量去估計它,從而產(chǎn)生一個問題:究竟用哪一個估計量去估計為好呢?為此需要有評價估計好壞的標準,標準不同答案也會有所不同。無偏性若估計量的數(shù)學(xué)期望存在,且對于任意,這里是θ

的參數(shù)空間,有,則稱是θ的無偏估計量。估計的系統(tǒng)誤差——通常,稱為以作為θ

估計的系統(tǒng)誤差。無偏估計的實際意義就是無系統(tǒng)誤差。樣本均值的矩估計量是總體均值矩估計量的無偏估計量。樣本方差的矩估計量是總體方差矩估計量有偏估計量。因為:因此,是的無偏估計量。第一節(jié)參數(shù)的點估計三.點估計量的評價標準有效性設(shè)與都是θ

的無偏估計量,若有則稱比有效。有效性的意義——在樣本容量相同的情況下,的方差比的方差小,即的觀察值比的觀測值更集中在真值θ

的附近。因此,我們認為,作為θ

的無偏估計,比更理想。第一節(jié)參數(shù)的點估計三.點估計量的評價標準有效性例3.2設(shè)為來自總體X的一個樣本,試比較總體均值的兩個無偏估計量誰更有效?解:因為n>3,故,因此比更有效。第一節(jié)參數(shù)的點估計三.點估計量的評價標準一致性設(shè)為參數(shù)θ

的估計量,若對于任意,當時,依概率收斂于于θ

,則稱為θ

的一致估計量。例如,樣本的K(>=1)階矩是總體X的K階矩的一致估計量。更進一步,若g是連續(xù)函數(shù),總體參數(shù)估計量則樣本參數(shù)估計量是θ

的一致估計量。第一節(jié)參數(shù)的點估計矩估計法例3.3設(shè)是來自均勻分布U(a,b)的一個樣本,試求a,b的矩估計法。解:第一節(jié)參數(shù)的點估計矩估計法解:從上面兩個方程可解得a與b,由得用,則得a與b矩估計法為第二節(jié)參數(shù)的區(qū)間估計參數(shù)估計有兩種形式:點估計和區(qū)間估計。點估計值能給出一個明確,未知參數(shù)θ

是多少,不能給出精度。而區(qū)間估計彌補了這種不足。所以點估計與區(qū)間估計是互為補充、各有各的用途。一.參數(shù)區(qū)間估計的一般提法設(shè)總體X的分布函數(shù)含有一個未知參數(shù)θ

。對于給定的值,若由樣本確定的兩個統(tǒng)計量滿足則稱隨機區(qū)間是θ

的置信度為的置信區(qū)間,和分別稱為置信度的雙側(cè)置信區(qū)間的置信下限和置信上限,稱為置信度。第二節(jié)參數(shù)的區(qū)間估計一.參數(shù)區(qū)間估計的一般提法求解未知參數(shù)θ的置信區(qū)間尋找一個樣本的函數(shù)它包含待估參數(shù)θ,但不包含其他未知參數(shù)。并且Z的分布已知且不依賴于任何未知參數(shù)(其中也包含待估參數(shù))對于給定的置信度,定出兩個常數(shù)a,b,使若能從得到等價的不等式其中,都是統(tǒng)計量,那么就是θ

的一個置信度為的置信區(qū)間。第二節(jié)參數(shù)的區(qū)間估計一.參數(shù)區(qū)間估計的一般提法區(qū)間估計的含義置信度為的置信區(qū)間不是惟一的。置信區(qū)間會隨著樣本觀察值的不同而不同。當對X進行多次抽樣(容量為n)。設(shè)抽樣N次,每一個抽樣都給出一個區(qū)間一共有N個不同的區(qū)間。根據(jù)大數(shù)定律,這N個區(qū)間中大約有個區(qū)間包含真值θ

個區(qū)間不包含真值θ第二節(jié)參數(shù)的區(qū)間估計二.單側(cè)置信區(qū)間對于某些實際問題,例如設(shè)備、元件的壽命來說,一般只關(guān)心平均壽命的“下限”;而對于產(chǎn)品的廢品率p來說,一般只關(guān)心p的上限。對于給定的值,若由樣本確定的統(tǒng)計量滿足稱隨機區(qū)間是θ

的置信度的單側(cè)置信區(qū)間,稱為置信度為的單側(cè)置信下限。若統(tǒng)計量滿足稱隨機區(qū)間是θ

的置信度為的單側(cè)置信區(qū)間,稱為置信度的單側(cè)置信上限。第二節(jié)參數(shù)的區(qū)間估計三.關(guān)于一個正態(tài)總體均值和方差的區(qū)間估計設(shè)為來自總體的一個樣本,樣本均值,樣本方差為。給定的置信度為。均值的置信區(qū)間

為已知時,則有

因此,的置信度的置信區(qū)間是第二節(jié)參數(shù)的區(qū)間估計三.關(guān)于一個正態(tài)總體均值和方差的區(qū)間估計均值的置信區(qū)間總體方差為已知時如果總體不是正態(tài)分布,但樣本容量n充分大時,根據(jù)中心極限定理,漸近地服從正態(tài)分布。一般情況下,n>=30時,就可以認為總體方差未知時如果樣本容量n充分大(n>=30)時,可用S代替,對均值進行近似的區(qū)間估計。注意:掌握樣本容量與置信水平及區(qū)間長度之間的關(guān)系。能夠在給定置信水平和區(qū)間長度下,求出所需要的最小樣本容量。第二節(jié)參數(shù)的區(qū)間估計三.關(guān)于一個正態(tài)總體均值和方差的區(qū)間估計均值的置信區(qū)間例3.4設(shè)一個物體的重量未知,為估計其重量可用天平去稱量。由于稱量是有誤差的,因而所得稱量結(jié)果是一個隨機變量,通常服從正態(tài)分布,當天平稱量的誤差標準差為0.1克時,可認為稱量結(jié)果服從現(xiàn)對該物體稱了五次,結(jié)果如下(單位克)可將其看成來自該總體的一個容量n為5的樣本觀測值。試對

作置信水平為0.95的區(qū)間估計。5.525.485.645.515.45第二節(jié)參數(shù)的區(qū)間估計三.關(guān)于一個正態(tài)總體均值和方差的區(qū)間估計均值的置信區(qū)間解:=(5.52+5.48+5.64+5.51+5.45)/5=5.521-α=0.95,α=0.05,α/2=0.025z0.025=1.96

第二節(jié)參數(shù)的區(qū)間估計三.關(guān)于一個正態(tài)總體均值和方差的區(qū)間估計均值的置信區(qū)間例3.5已知一批產(chǎn)品的長度指標。問至少應(yīng)抽取多大容量的樣本,才能使樣本均值與總體均值的絕對誤差,在置信度不低于95%的條件下小于0.1?第二節(jié)參數(shù)的區(qū)間估計三.關(guān)于一個正態(tài)總體均值和方差的區(qū)間估計解:根據(jù)題意,應(yīng)有即應(yīng)抽取容量至少為97的樣本。第二節(jié)參數(shù)的區(qū)間估計三.關(guān)于一個正態(tài)總體均值和方差的區(qū)間估計設(shè)為來自總體的一個樣本,樣本均值,樣本方差為。給定的置信度為。均值的置信區(qū)間

為未知時,則有

因此,的置信度的置信區(qū)間是第二節(jié)參數(shù)的區(qū)間估計三.關(guān)于一個正態(tài)總體均值和方差的區(qū)間估計均值的置信區(qū)間例3.6對某型號飛機的最大飛行速度進行15次試驗,測得樣本的平均最大飛行速度,樣本方差。根據(jù)長期經(jīng)驗可以認為最大飛行速度服從正態(tài)分布,試求平均最大飛行速度的95%的置信區(qū)間。在置信水平條件下,飛機的平均最大飛行速度不低于多少?第二節(jié)參數(shù)的區(qū)間估計三.關(guān)于一個正態(tài)總體均值和方差的區(qū)間估計均值的置信區(qū)間解:這是一個正態(tài)總體方差未知,求均值的置信區(qū)間的問題。根據(jù)題意有:即:有95%的把握認為飛機的平均最大飛行速度在420.3到429m/s之間。第二節(jié)參數(shù)的區(qū)間估計三.關(guān)于一個正態(tài)總體均值和方差的區(qū)間估計均值的置信區(qū)間解:這是一個這是一個正態(tài)總體方差未知,對均值求的單側(cè)置信下限的問題。即:有95%的把握認為飛機的平均最大飛行速度不低于421.1m/s。第二節(jié)參數(shù)的區(qū)間估計三.關(guān)于一個正態(tài)總體均值和方差的區(qū)間估計設(shè)為來自總體的一個樣本,樣本均值,樣本方差為。給定的置信度為。方差的置信區(qū)間

為未知時,則有

因此,的置信度的置信區(qū)間是第二節(jié)參數(shù)的區(qū)間估計四.關(guān)于兩個正態(tài)總體的均值差的區(qū)間估計設(shè)為來自總體的樣本,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論