版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、第_章導(dǎo)論統(tǒng)計(jì)學(xué):收集、處理、分析、解釋數(shù)據(jù)并從數(shù)據(jù)中得出結(jié)論的科學(xué)。其目的是探索數(shù)據(jù)的內(nèi)在數(shù)量規(guī)律 性,以達(dá)到對(duì)客觀事物的科學(xué)認(rèn)識(shí)。1.2數(shù)據(jù)統(tǒng)計(jì)的類型按計(jì)量尺度劃分:定類尺度(分類數(shù)據(jù))、定序尺度(順序數(shù)據(jù))、定居尺度&定比尺度(數(shù)值型數(shù)據(jù))【品質(zhì)數(shù)據(jù)(定性數(shù)據(jù)):分類數(shù)據(jù)、順序數(shù)據(jù);數(shù)量數(shù)據(jù)(定量數(shù)據(jù)):數(shù)值型數(shù)據(jù)】按搜集方法劃分:觀測(cè)數(shù)據(jù)、實(shí)驗(yàn)數(shù)據(jù)按時(shí)間狀況劃分:截面數(shù)據(jù)、時(shí)序數(shù)據(jù)變量:說(shuō)明現(xiàn)象某種特征的概念,從一次觀察到下一次觀察,結(jié)果會(huì)呈現(xiàn)出變化。變量值:變量的具體取值分類變量順序變量數(shù)值型變量(離散型變量&連續(xù)型變量)例:一項(xiàng)調(diào)查表明,消費(fèi)者每月在網(wǎng)上購(gòu)物的平均花費(fèi)是200元,他
2、們選擇在網(wǎng)上購(gòu)物的主要原因是“價(jià) 格便宜”。要求:(1)這一研究的總體是什么? (2) “消費(fèi)者在網(wǎng)上購(gòu)物的原因”是分類變量、順序變量還是數(shù)值型 變量?(3)研究者所關(guān)心的參數(shù)是什么? (4) “消費(fèi)者每月在網(wǎng)上購(gòu)物的平均花費(fèi)是200元”是參數(shù)還是 統(tǒng)計(jì)量?(5)研究者所使用的主要是描述統(tǒng)計(jì)方法還是推斷統(tǒng)計(jì)方法?第二章數(shù)據(jù)的搜集數(shù)據(jù)的直接來(lái)源| 一手資料調(diào)查調(diào)查數(shù)據(jù)實(shí)驗(yàn)實(shí)驗(yàn)數(shù)據(jù)調(diào)查的方式:普查、抽樣調(diào)查、統(tǒng)計(jì)報(bào)表數(shù)據(jù)的間接來(lái)源I 二手資料(統(tǒng)計(jì)公報(bào)、統(tǒng)計(jì)年鑒、網(wǎng)上資料、期刊、雜志、報(bào)紙)2.2抽樣調(diào)查概率抽樣、非概率抽樣概率抽樣:也稱隨機(jī)抽樣,指遵循隨機(jī)原則進(jìn)行的抽樣,總體中每個(gè)單位都有一定的
3、機(jī)會(huì)被選入樣。特點(diǎn):以隨機(jī)原則抽取樣本每個(gè)單位被抽中的概率是已知的用樣本估計(jì)總體時(shí),要考慮入樣概率(概率抽樣乏等概率抽樣)1)簡(jiǎn)單隨機(jī)抽樣:從包括總體N個(gè)單位的抽樣框中隨機(jī)地、一個(gè)一個(gè)地抽取n個(gè)單位作為樣本,每個(gè)單位入樣的概率是相等的。2)分層抽樣:將抽樣單位按某種特征或某種規(guī)則劃分為不同的層,然后從不同的層中獨(dú)立、隨機(jī)地抽取 樣本。3)整群抽樣:將總體中若十個(gè)單位合并為組,這樣的組稱為群,抽樣時(shí)直接抽取群,然后對(duì)中選群中的所有單位全部實(shí)施調(diào)查。4)系統(tǒng)抽樣:將總體中的所有單位按一定順序排列,按照擬抽樣數(shù),將其劃分成相同的段,然后在每一段中的固定位置抽取一個(gè)調(diào)查單位。5)多階段抽樣:先按整群抽
4、樣的方法,抽取群,再?gòu)倪x中的群中隨機(jī)抽取若干單位進(jìn)行調(diào)查,這是二階段抽樣。多階段抽樣以此類推。非概率抽樣方便抽樣容易實(shí)施、自行確定、成本低判斷抽樣根據(jù)經(jīng)驗(yàn)、判斷、對(duì)研究對(duì)象的了解抽樣自愿樣本自愿參加滾雪球抽 樣針對(duì)特定稀少群體的研究配額抽樣先分類,在每類中用方便抽樣或判斷抽樣選取 樣本非概率抽樣概率抽樣不依據(jù)隨機(jī)原則樣本無(wú)法對(duì)總體估計(jì),不計(jì)算估計(jì)誤差、置信區(qū) 間.操作簡(jiǎn)便時(shí)效快成本低前期發(fā)現(xiàn)問(wèn)題隨機(jī)原則樣本可以對(duì)總體進(jìn)行估計(jì),計(jì)算估計(jì)誤差、置信區(qū)間.技術(shù)含量高*成本較高適合用于驗(yàn)證問(wèn)題作進(jìn)步的數(shù)量分析搜集數(shù)據(jù)的基本方法:自填式,面訪式,電話式數(shù)據(jù)的誤差:(1)抽樣誤差:由于抽樣的隨機(jī)性引起的樣
5、本結(jié)果與總體真值之間的誤差只在概率抽樣中非抽樣誤差:除抽樣誤差之外的,由于其他原因引起的樣本觀察結(jié)果與總體真值之間的 差異。存在于任何抽樣或調(diào)查中第三章 數(shù)據(jù)的圖標(biāo)展示3.1數(shù)據(jù)的預(yù)處理:是在隊(duì)數(shù)據(jù)分類或分組之前所做的必要處理,內(nèi)容包括數(shù)據(jù)的審核、篩選、排序等。數(shù)據(jù)審核(發(fā)現(xiàn)數(shù)據(jù)中的錯(cuò)誤)2.數(shù)據(jù)篩選(找出符合條件的數(shù)據(jù))3.數(shù)據(jù)排序(發(fā)現(xiàn)數(shù)據(jù)基本特征、 升序和降序)分類數(shù)據(jù)的排序:字母型數(shù)據(jù),排序有升序降序之分,但習(xí)慣上用升序漢字型數(shù)據(jù),可按漢字的首位拼音字母排列,也可按筆畫(huà)排序,其中也有筆畫(huà)多少的升 序降序之分?jǐn)?shù)值型數(shù)據(jù)的排序:遞增排序:設(shè)一組數(shù)據(jù)為XI,X2,XN,遞增排序后可表示為:X
6、(1)X(2).X(2).X(N)數(shù)據(jù)透視表功能:簡(jiǎn)化數(shù)據(jù)分析人員的工作量,使其能快速準(zhǔn)確地從各個(gè)角度查看數(shù)據(jù)。在利用數(shù)據(jù) 透視表時(shí),數(shù)據(jù)表的首行必須有列標(biāo)題。3.2品質(zhì)數(shù)據(jù)的整理與展示3.2.1分類數(shù)據(jù)的整理與圖示列出各類別2.計(jì)算各類別的頻數(shù)3.制作頻數(shù)分布表4.用圖形展示分類數(shù)據(jù)中需要計(jì)算的指標(biāo)1頻數(shù):落在各類別中的數(shù)據(jù)個(gè)數(shù)頻數(shù)分布:把各個(gè)類別及落在其中的相應(yīng)頻數(shù)全部列出,并用表格形式表現(xiàn)出來(lái)。比例:某一類別數(shù)據(jù)占全部數(shù)據(jù)的比值百分比:將對(duì)比的基數(shù)作為100而計(jì)算的比值 比 率:不同類別數(shù)值的比值 如何利用Excel計(jì)算頻數(shù)(插入一函數(shù) 一countif)分類數(shù)據(jù)的圖示條形圖:條形圖是用
7、寬度相同的條形的高度或長(zhǎng)短來(lái)表示數(shù)據(jù)多少的圖形各類別可以放在縱軸,稱為條形圖,也可以放在橫軸,稱為柱形圖對(duì)比條形圖 顯示分類變量在不同時(shí)間或不同空間上的差異或變化餅圖:用圓形及圓內(nèi)扇形的面積來(lái)表示數(shù)值大小的圖形。主要用于表示總體中各組成部分所占的比例,對(duì) 于研究結(jié)構(gòu)性問(wèn)題十分有用,在繪制圓形圖時(shí),總體中各部分所占的百分比用圓內(nèi)的各個(gè)扇形面積 表示,這些扇形的中心角度,是按各部分百分比占3600的相應(yīng)比例確定的3.2.2順序數(shù)據(jù)的整理與圖示累積頻數(shù):將各有序類別的頻數(shù)逐級(jí)累加起來(lái)得到的頻數(shù)。向上累積:從類別順序的開(kāi)始一方,向類別順序的最后一方累加頻數(shù);向下累積:從類別順序的最后一方,向類別順序的
8、開(kāi)始一方累加頻數(shù)。累積頻率:將各類別的百分比逐級(jí)累加3.3數(shù)值型數(shù)據(jù)的整理與顯示3.3.1數(shù)據(jù)的分組:?jiǎn)巫兞恐捣纸M&組距分組(等距分組&異距分組)單變量值分組(要點(diǎn)) 適合于離散變量 適合于變量值較少的情況步驟:1.排序 2將一個(gè)變量值作為一組組距分組(要點(diǎn)):1.適合于連續(xù)變量,適合于變量值較多的情況;2.將變量值的一個(gè)區(qū)間作為一組;3.必 須遵循“不重不漏”的原則;4.可采用等距分組,也可采用不等距分組1. 下3. 組1. 下3. 組組中值=組距分組距:上限與下限之差4.組中值:下限與上限之間的中點(diǎn)值下限值+上限值2(步驟) 第1步:排序,確定組數(shù)(K) 5K15能夠顯示數(shù)據(jù)的分布特征和規(guī)
9、律第2步:確定組距 組距=(最大值一最小值):組數(shù) 組距宜取5或10的倍數(shù)第3步:根據(jù)分組整理成頻數(shù)分布表等距分組與不等距分組等距分組各組頻數(shù)的分布不受組距大小的影響可直接根據(jù)絕對(duì)頻數(shù)來(lái)觀察頻數(shù)分布的特征和規(guī)律不等距分組各組頻數(shù)的分布受組距大小不同的影響各組絕對(duì)頻數(shù)的多少不能反映頻數(shù)分布的實(shí)際狀況需要用頻數(shù)密度(頻數(shù)密度=頻數(shù)/組距)反映頻數(shù)分布的實(shí)際狀況分組數(shù)據(jù)一直方圖用矩形的寬度和高度來(lái)表示頻數(shù)分布的圖形,實(shí)際上是用矩形的面積來(lái)表示各組的頻數(shù)分布在直角坐標(biāo)中,用橫軸表示數(shù)據(jù)分組,縱軸表示頻數(shù)或頻率,各組與相應(yīng)的頻數(shù)就形成了一個(gè)矩形, 即直方圖(Histogram)直方圖與條形圖的區(qū)別條形圖
10、是用條形的長(zhǎng)度(橫置時(shí))表示各類別頻數(shù)的多少,其寬度(表示類別)則是固定的。直方圖是用面積表示各組頻數(shù)的多少,矩形的高度表示每一組的頻數(shù)或百分比,寬度則表示各組的 組距,其高度與寬度均有意義。直方圖的各矩形通常是連續(xù)排列,條形圖則是分開(kāi)排列。第4章 數(shù)據(jù)的概括性度量數(shù)據(jù)分布特征的測(cè)度集中趨勢(shì)的度量一一反映數(shù)據(jù)向其中心值靠攏或聚集的程度離散程度的度量一一反映數(shù)據(jù)遠(yuǎn)離其中心值的趨勢(shì)分布的形狀 反映數(shù)據(jù)分布的偏態(tài)和峰態(tài)4.1集中趨勢(shì):是指一組數(shù)據(jù)向其中心值靠攏的傾向和程度,它反映了一組數(shù)據(jù)中心點(diǎn)的位置所在。大測(cè)度集中趨勢(shì)就是尋找數(shù)據(jù)一般水平的代表值或中心值;大不同類型的數(shù)據(jù)用不同的集中趨勢(shì)測(cè)度值分類
11、數(shù)據(jù)一一眾數(shù)順序數(shù)據(jù)一一中位數(shù)和分位數(shù)數(shù)值型數(shù)據(jù)一一平均數(shù)4.1.1分類數(shù)據(jù):眾數(shù)眾數(shù)(MODE): 組數(shù)據(jù)中出現(xiàn)次數(shù)最多的變量值,用Mo表示;(1)主要用于測(cè)度分類數(shù)據(jù)的集中趨勢(shì),也可用于順序數(shù)據(jù)和數(shù)值型數(shù)據(jù);(2)眾數(shù)是位置代表值,不受極端值影響;(3)可能沒(méi)有眾數(shù)、有一個(gè)眾數(shù)或幾個(gè)眾數(shù)數(shù)值型分組數(shù)據(jù)的眾數(shù)眾數(shù)的值與相鄰兩組頻數(shù)的分布有關(guān)相鄰兩組的頻數(shù)相等時(shí),眾數(shù)組的組中值即為眾數(shù)相鄰兩組的頻數(shù)不相等時(shí),眾數(shù)采用下列近似公式計(jì)算f fM 0 = L +f _-1x i1+1(L為眾數(shù)組的下限值,i為眾數(shù)組的組距,f為眾數(shù)組的頻數(shù),f-1為眾數(shù)組前一組的頻數(shù),f+1為眾數(shù)組 后一組的頻數(shù)。4
12、.1.2順序數(shù)據(jù):中位數(shù)和分位數(shù)中位數(shù):是一組數(shù)據(jù)排序后處于中間位置上的變量值,用Me表示排序后處于中間位置上的變量值不受極端值的影響主要用于順序數(shù)據(jù),也可用數(shù)值型數(shù)據(jù),但不能 用于分類數(shù)據(jù)計(jì)算中位數(shù)的步驟山廣來(lái)冒呼_ N +1排序 2.確定中位數(shù)的位置:中位數(shù)位置-(N為數(shù)據(jù)的個(gè)數(shù))數(shù)值型分組數(shù)據(jù)的中位數(shù)計(jì)算累積頻數(shù)確定中位數(shù)所在組3.采用下列近似公式計(jì)算:M 三L +皇一-x im(L為中位數(shù)所在組的下限值,N為數(shù)據(jù)的個(gè)數(shù);Sm-1為中位數(shù)所在組以前各組的累積頻數(shù),fm為中位 數(shù)所在組的頻數(shù),i為中位數(shù)所在組的組距)四分位數(shù):也稱四分位點(diǎn),他是一組數(shù)據(jù)排序后處于25%和75%位置上的值。(
13、1)排序后處于25%和75%位置上的值(2)不受極端值的影響(3)主要用于順序數(shù)據(jù),也可用于數(shù)值型數(shù)據(jù),但不能用于分類數(shù)據(jù)四分位數(shù)的計(jì)算排序確定四分位數(shù)的位置下四分位數(shù)為QL,上四分位數(shù)為QU,公式為:QL位置=n/4 QU位置=3n/4大如果位置是整數(shù),四分位數(shù)就是該位置對(duì)應(yīng)的值;大如果是在0.5位置上,則取該位置兩側(cè)值的平均數(shù);大如果是在0.25或0.75的位置上,則取該位置的下側(cè)值加上按比例分?jǐn)偽恢脙蓚?cè)數(shù)值的差值4.1.3數(shù)值型數(shù)據(jù):平均數(shù)平均數(shù)(均值):它是一組數(shù)據(jù)相加后除以數(shù)據(jù)的個(gè)數(shù)得到的結(jié)果。平均數(shù)是一組數(shù)據(jù)相加后除以數(shù)據(jù)個(gè)數(shù)得到的結(jié)果。集中趨勢(shì)的最主要測(cè)度值易受極端值的影響用于數(shù)
14、值型數(shù)據(jù),不能用于分類數(shù)據(jù)和順序數(shù)據(jù)。簡(jiǎn)單平均數(shù)(對(duì)未分組數(shù)據(jù)計(jì)算的平均數(shù))公式為:X公式為:X = X1 + X2 N+ X、注Xi-i1N加權(quán)平均數(shù):對(duì)分組數(shù)據(jù)計(jì)算的平均數(shù),設(shè)原始數(shù)據(jù)被分成k組,各組的組中值為M1,M2,,Mk,各 組頻數(shù)為f1,f2,fk,則加權(quán)平均數(shù)為,簡(jiǎn)單平均數(shù),其數(shù)值的大小只與變量值的大小有關(guān); 加權(quán)平均數(shù),其數(shù)值的大小不僅受各組變量值大小的影響,而且受各組變量值出現(xiàn)的頻數(shù)即權(quán)數(shù)(fi) 大小的影響。如果某一組的權(quán)數(shù)較大,說(shuō)明該組的數(shù)據(jù)較多,那么該組數(shù)據(jù)的大小對(duì)均值的影響就越大,反之則越 小。幾何平均數(shù):N個(gè)變量值乘積的N次方根,用GM表示G = N x = Jn
15、N X 其計(jì)算公式為: M 勺12N N 1 i主要用于計(jì)算平均比率和平均發(fā)展速度眾數(shù)、中位數(shù)和平均數(shù)的比較p94眾數(shù)、中位數(shù)和平均數(shù)的關(guān)系如果數(shù)據(jù)分布是對(duì)稱的,則Mo = Me = x如果數(shù)據(jù)是左偏分布,則x Me Mo如果數(shù)據(jù)是右偏分布,則Mo Me x4.2離散程度的測(cè)度離散程度:它反映的是各變量值遠(yuǎn)離其中心值的程度。離散程度越大,表示集中趨勢(shì)的測(cè)度值對(duì)數(shù)據(jù)的代表性越差;離散程度越小,表示集中趨勢(shì)的測(cè)度值對(duì)數(shù)據(jù)的代表性越好。方差和標(biāo)準(zhǔn)差分類數(shù)據(jù)一一異眾比率順序數(shù)據(jù)一一四分位差數(shù)值型數(shù)據(jù)方差和標(biāo)準(zhǔn)差4.2.1分類數(shù)據(jù):異眾比率:是離散程度的測(cè)度值之一,非眾數(shù)組的頻數(shù)占總頻數(shù)的比率,其計(jì)算公
16、式為=i - F m = 1 -瑚 m.rAF L F ,用于衡量眾數(shù)的代表性。4.2.2順序數(shù)據(jù):四分位差1.離散程度的測(cè)度值之一 2.也稱為內(nèi)距或四分間距上四分位數(shù)與下四分位數(shù)之差QD = QU - QL反映了中間50%數(shù)據(jù)的離散程度不受極端值的影響6.用于衡量中位數(shù)的代表性4.2.3數(shù)值型數(shù)據(jù):方差和標(biāo)準(zhǔn)差極差平均差 淤方差標(biāo)準(zhǔn)差極 差(range):.一組數(shù)據(jù)的最大值與最小值之差,用R表示 計(jì)算公式:未分組數(shù)據(jù)R = max(Xi) - min(Xi)組距分組數(shù)據(jù)R=最高組上限-最低組下限 離散程度的最簡(jiǎn)單測(cè)度值3.易受極端值影響4.未考慮數(shù)據(jù)的分布平均差(Md):也稱平均絕對(duì)離差,他
17、是各變量值與其平均數(shù)離差絕對(duì)值的平均數(shù)。1.以平均數(shù)為中心,反映每個(gè)數(shù)據(jù)與平均數(shù)的平均差異程度,能全面準(zhǔn)確地反映一組數(shù)據(jù)的離散程度。2平均差越大,離散程度越大;平均差越小,離散程度越小。方差:各變量值與其均值離差平方的平均數(shù)。標(biāo)準(zhǔn)差:方差的平方根反映了各變量值與均值的平均差異反映出數(shù)據(jù)的分布狀況最常用的離散程度測(cè)度值根據(jù)總體數(shù)據(jù)計(jì)算的,稱為總體方差或標(biāo)準(zhǔn)差;根據(jù)樣本數(shù)據(jù)計(jì)算的,稱為樣本方差或標(biāo)準(zhǔn)差總體方差和標(biāo)準(zhǔn)差 方差的計(jì)算公式 未分組數(shù)據(jù)標(biāo)準(zhǔn)差的計(jì)算公式總體方差和標(biāo)準(zhǔn)差 方差的計(jì)算公式 未分組數(shù)據(jù)標(biāo)準(zhǔn)差的計(jì)算公式未分組數(shù)據(jù)分組數(shù)據(jù)分組數(shù)據(jù)分組數(shù)據(jù)樣本方差和標(biāo)準(zhǔn)差方差的計(jì)算公式2 = i=1N
18、標(biāo)準(zhǔn)差的計(jì)算公式未分組數(shù)據(jù)未分組數(shù)據(jù)分組數(shù)據(jù)分組數(shù)據(jù)分組數(shù)據(jù)自由度(degree Ofeidota)川1一組數(shù)據(jù)中可以自由取值的數(shù)據(jù)的個(gè)數(shù)2.當(dāng)樣本數(shù)據(jù)的個(gè)數(shù)為n時(shí),若樣本均值X確定后,則附加給n個(gè)觀測(cè)值1個(gè)約束條件,只有n-1個(gè)數(shù)據(jù)可以自由取值,其中必有一個(gè)數(shù)據(jù)不能自由取值。標(biāo)準(zhǔn)分?jǐn)?shù):變量值與其平均數(shù)的離差除以標(biāo)準(zhǔn)差后的值,也稱標(biāo)準(zhǔn)分?jǐn)?shù)或z分?jǐn)?shù)。.計(jì)算公式為Z 二苴二或Z 二壽三 ez Sn-11)給出某一個(gè)值在一組數(shù)據(jù)中的相對(duì)位置2)可用于判斷一組數(shù)據(jù)是否有離群點(diǎn)3)用于對(duì)變量的標(biāo)準(zhǔn)化處理經(jīng)驗(yàn)法則:當(dāng)一組數(shù)據(jù)對(duì)稱分布時(shí),經(jīng)驗(yàn)法則表明:約有68%的數(shù)據(jù)在平均數(shù)1個(gè)標(biāo)準(zhǔn)差的范圍之內(nèi)約有95%的
19、數(shù)據(jù)在平均數(shù)堅(jiān)2個(gè)標(biāo)準(zhǔn)差的范圍之內(nèi),約有99%的數(shù)據(jù)在平均數(shù)3個(gè)標(biāo)準(zhǔn)差的范圍之內(nèi)(離群點(diǎn):在3個(gè)標(biāo)準(zhǔn)差范圍之外的數(shù)據(jù))n -1切比雪夫不等式(適用于任何分布形狀的數(shù)據(jù))根據(jù)切比雪夫不等式,至少有(1-1/k2)的數(shù)據(jù)落在k個(gè)標(biāo)準(zhǔn)差之內(nèi),k是大于1的任意值。約有75%的數(shù)據(jù)在平均數(shù)2個(gè)標(biāo)準(zhǔn)差的范圍之內(nèi)約有89%的數(shù)據(jù)在平均數(shù)3個(gè)標(biāo)準(zhǔn)差的范圍之內(nèi)約有94%的數(shù)據(jù)在平均數(shù)4個(gè)標(biāo)準(zhǔn)差的范圍之內(nèi)離散系數(shù)(變異系數(shù)):標(biāo)準(zhǔn)差與其相應(yīng)的平均數(shù)之比1.消除了數(shù)據(jù)水平高低和計(jì)量單位的影響 2.計(jì)算公式為匕=無(wú)測(cè)度了數(shù)據(jù)的相對(duì)離散程度用于對(duì)不同組別數(shù)據(jù)離散程度的比較4.3偏態(tài)與峰態(tài)的度量 對(duì)分布形狀的測(cè)度偏態(tài):數(shù)
20、據(jù)分布偏斜程度的測(cè)度偏態(tài)系數(shù)(SK) 測(cè)度偏態(tài)的統(tǒng)計(jì)量(1)偏態(tài)系數(shù)=0為對(duì)稱分布(2)偏態(tài)系數(shù)0為右偏分布(3)偏態(tài)系數(shù)0時(shí),為尖峰分布(3)K0(i=1,2, i ,n),則對(duì)任意事件 B,有 p ( b ) = E p (A) P (B A)i=1貝葉斯公式(逆概率公式)與全概公式解決的問(wèn)題相反,貝葉斯公式是建立在條件概率的基礎(chǔ)上尋找事件發(fā)生的原因 設(shè)n個(gè)事件氣,A2,,An兩兩互斥,*+人2+.+ An=Q (滿足這兩個(gè)條件的事件組稱為一個(gè)完備事件組),且 P(A.)0(i=1,2, .,n),則 P(A I B) = P(A)組),且 P(A.)0(i=1,2, .,n), U p
21、(A ) P (B I A )jjj=1隨機(jī)變量及其分布一、隨機(jī)變量的概念 二、離散型隨機(jī)變量的概率分布 三、連續(xù)型隨機(jī)變量的概率分布隨機(jī)變量1. 一次試驗(yàn)的結(jié)果的數(shù)值性描述2.一般用X、Y、Z來(lái)表示在同一組條件下,把每次試驗(yàn)的結(jié)果都列舉出來(lái),即把X所有可能值x1,x2,.,xn都列舉出來(lái),其有確定概率P(X),P(x2),.,P(xn)。則X稱為P(X)的隨機(jī)變量,P(X)稱為隨機(jī)變量X的概率函 數(shù)。n根據(jù)取值情況不同,分為離散型隨機(jī)變量和連續(xù)型隨機(jī)變量離散型隨機(jī)變量的概率分布列出離散型隨機(jī)變量X的所有可能取值列出隨機(jī)變量取這些值的概率3.通常用下面的表格來(lái)表示X = xix1 , x2,.
22、,xnP(X =xi)=pip1,p2,.,pnP(X =xi)=pi稱為離散型隨機(jī)變量的概率函數(shù)(P,藝 片=1)i =1離散型隨機(jī)變量的概率分布0-1分布:離散型隨機(jī)變量X只可能取0和1兩個(gè)值。均勻分布:一個(gè)離散型隨機(jī)變量取各個(gè)值的概率相同離散型隨機(jī)變量的數(shù)字特征(1)數(shù)學(xué)期望:在離散型隨機(jī)變量X的一切可能取值的完備組中,各可能取值與其取相對(duì)應(yīng)的概率p. 乘積之和描述離散型隨機(jī)變量取值的集中程度E ( X ) = xpi ( X取有限個(gè)值) i = 1E ( X ) = x p i ( X取無(wú)窮個(gè)值) i = 1(2)方差與標(biāo)準(zhǔn)差方差:隨機(jī)變量X的每一個(gè)取值與期望值的離 差平方和的數(shù)學(xué)期望
23、,記為D(X)b 2 = D (X ) = E X - E (X )2 若X是離散型隨機(jī)變量,則b 2 = D (X ) = x - E (X )L - pi=1b 2 = D(x) = E(X2) -E(X)2標(biāo)準(zhǔn)差:隨機(jī)變量方差的平方根期望值或平均數(shù)衡量平均回報(bào)率或收益率方差或標(biāo)準(zhǔn)差反映每一個(gè)可能出現(xiàn)的回報(bào)率與平均回報(bào)率的平均差異方差或標(biāo)準(zhǔn)差越大,回報(bào)率的變化越大,風(fēng)險(xiǎn)越高;方差或標(biāo)準(zhǔn)差越小,回報(bào)率的變化越小,風(fēng)險(xiǎn)越 低;當(dāng)投資回報(bào)率相等時(shí),風(fēng)險(xiǎn)較小的項(xiàng)目為最佳選擇當(dāng)投資回報(bào)率不相等時(shí),通過(guò)離散系數(shù)來(lái)衡量風(fēng)險(xiǎn)。常見(jiàn)的離散型概率分布二項(xiàng)分布泊松分布:用于描述在一指定時(shí)間范圍內(nèi)或在一定的長(zhǎng)度、
24、面積、體積之內(nèi)某一事件出現(xiàn)次數(shù)的分布。Eg 一個(gè)城市在一個(gè)月內(nèi)發(fā)生的交通事故次數(shù)&消費(fèi)者協(xié)會(huì)一個(gè)星期內(nèi)收到的消費(fèi)者投訴次數(shù)泊松分布的公式為P& =展=(x = ,1,2,n)X!入一給定的時(shí)間間隔、長(zhǎng)度、面積、體積內(nèi)“成功”的平均數(shù)e = 2.71828x 給定的時(shí)間間隔、長(zhǎng)度、面積、體積內(nèi)“成功”的次數(shù)泊松分布的期望和方差E (X)=入D(X)=入泊松分布(作為二項(xiàng)分布的近似)1當(dāng)試驗(yàn)的次數(shù)n很大,成功的概率p很小時(shí),可用泊松分布來(lái)近似地計(jì)算二項(xiàng)分布的概率,即人e 一人C x p x q n _ x 牝 .2實(shí)際應(yīng)用中,當(dāng)PV0.25,n20,np5時(shí),近似效果良好連續(xù)型隨機(jī)變量的概率分布:
25、如果對(duì)于隨機(jī)變量X的分布函數(shù)F(x),存在非負(fù)函數(shù)f(x),使得對(duì)于任意實(shí) 數(shù)x有F(x) = P(X x) = jx f (t)dtg x 0(2) j+8 f (x)dx = 1一8(4)若f(x)在點(diǎn)x處連續(xù)概率密度函數(shù)fx)表示X的所有取值x及其頻數(shù)f(x)在平面直角坐標(biāo)系中畫(huà)出fx)的圖形,則對(duì)于任何實(shí)數(shù)a b,P(a X b)是該曲線下從a到b的面積P(a X b) = jb f (x)dx a密度函數(shù)曲線下的面積等于 分布函數(shù)F (x0)是曲線下小于x0的面積P(x1 X x2) = F (x2) 一 F (x1) = j x f (x)dxxi連續(xù)型隨機(jī)變量的期望和方差連續(xù)型隨
26、機(jī)變量的數(shù)學(xué)期望為E(X )=尸8葉(x)dx = R8方差為D(X)=吐E(X)f (x)dx =a 28連續(xù)型隨機(jī)變量的概率分布均勻分布若隨機(jī)變量X的概率密度函數(shù)為f (X) = baa - X - b稱X在區(qū)間a力上均勻分布0 其他數(shù)學(xué)期望和方差分別為E(X) = Q ; D(X)=212正態(tài)分布:如果隨機(jī)變量X的概率密度為f (x)正態(tài)分布:如果隨機(jī)變量X的概率密度為f (x)=2。2一8 X 8則稱X服從正態(tài)分布,記作XN(M ,。2) f(x)=隨機(jī)變量,X的頻數(shù)2。=總體方差,兀=3.14159; e = 2.71828, x =隨機(jī)變量的取值(-x x x)R=總體均值(最重要
27、的一種連續(xù)型分布;在實(shí)際中應(yīng)用廣泛)正態(tài)分布函數(shù)的性質(zhì)f (X) N0,即概率密度曲線在x軸的上方正態(tài)曲線的最高點(diǎn)在均值R,它也是分布的中位數(shù)和眾數(shù)每一特定 正態(tài)分布通過(guò)均值R和標(biāo)準(zhǔn)差。來(lái)區(qū)分。四決定曲線的中心位置,。決定曲線的陡緩程度。曲線fx)相對(duì)于 均值R對(duì)稱,尾端向兩個(gè)方向無(wú)限延伸,且理論上永遠(yuǎn)不會(huì)與橫軸相交隨機(jī)變量的概率由曲線下的面積給出P(a x b) = jb f (x)dxa標(biāo)準(zhǔn)正態(tài)分布函數(shù)1.任何一個(gè)一般的正態(tài)分布,可通過(guò)下面的線性變換轉(zhuǎn)化為標(biāo)準(zhǔn)正態(tài)分布Z =蘭二凹N(0,1)。2-標(biāo)準(zhǔn)正態(tài)分布的概率密度函數(shù)中(x) = 2e一22,83.標(biāo)準(zhǔn)正態(tài)分布的分布函數(shù)中(x3.標(biāo)準(zhǔn)
28、正態(tài)分布的分布函數(shù)中(x)=jx 頓x)dt = jx881eJ2兀122dt標(biāo)準(zhǔn)正態(tài)分布將一般正態(tài)分布轉(zhuǎn)換為標(biāo)準(zhǔn)正態(tài)分布,再查表 對(duì)于負(fù)的x,可由中(-x)=l-(x)得到對(duì)于標(biāo)準(zhǔn)正態(tài)分布,即XN(0,1),有P (a X b)=(b) -(a)P (IXI a)= 2(a) 1對(duì)于一般正態(tài)分布,即XN對(duì)于一般正態(tài)分布,即XN(R,。),有 P(a X b) = O一中二項(xiàng)分布的正態(tài)近似當(dāng)n很大時(shí),二項(xiàng)隨機(jī)變量X近似服從正態(tài)分布N np , np(1-p) (通常是當(dāng)np和nq都大于5 時(shí))對(duì)于一個(gè)二項(xiàng)隨機(jī)變量X,當(dāng)n很大時(shí),求P(x1Xx2)時(shí)可用正態(tài)分布近似為P %1 X x=2C x
29、p P %1 X 30),樣本均值的抽樣分布逐漸趨于正態(tài)分布i=標(biāo)準(zhǔn)誤差抽樣誤差:樣本統(tǒng)計(jì)量與總體參數(shù)之間的平均差異所有可能的樣本均值的標(biāo)準(zhǔn)差,測(cè)度所有樣本均值的離散程度小于總體標(biāo)準(zhǔn)差b3.計(jì)算公式為b x6.3由正態(tài)分布導(dǎo)出的幾個(gè)重要分布卡方(x2)分布X =頃X n 1 i=1定義:設(shè)隨機(jī)變量X1,X2, Xn相互獨(dú)立,且Xi服從標(biāo)準(zhǔn)正態(tài)分布N(0,1),則它們的平方和服從自由度為n的x2分布。當(dāng)自由度n足夠大時(shí),x2分布的概率密度曲線趨于對(duì)稱;當(dāng)n+8時(shí),x2分布的極限分布是正態(tài)分布。x2分布的數(shù)學(xué)期望為:E ( x2) = nx2分布的方差為:D ( x2) = 2nv n1 旗 Xt
30、分布和T統(tǒng)計(jì)量t分布:設(shè)隨機(jī)變量XN(0,1), Yc2 (n),且 X與Y獨(dú)立,貝U其分布稱為t分布,記為t(n),其中n為自由度。(X )T統(tǒng)計(jì)量:設(shè)X1, X2,,Xn是來(lái)自正態(tài)總體N(p ,O 2 )的一個(gè)樣本,稱T = 一為統(tǒng)計(jì)量,XS I 2n 2D ( X) = 2 n (m + n 2), n 4m (n 2) (n 4)第7章參數(shù)估計(jì):用樣本統(tǒng)計(jì)量去估計(jì)總體參數(shù)。估計(jì)量:用來(lái)估計(jì)總體參數(shù)的統(tǒng)計(jì)量估計(jì)值:一個(gè)具體樣本計(jì)算出的統(tǒng)計(jì)量的數(shù)值 參數(shù)估計(jì)的方法點(diǎn)估計(jì):從總體中抽取一個(gè)樣本,根據(jù)該樣本的統(tǒng)計(jì)量對(duì)總體的未知參數(shù)作出一個(gè)數(shù)值點(diǎn)的估計(jì)。1點(diǎn)估計(jì)的可靠性用標(biāo)準(zhǔn)誤差來(lái)衡量。n2點(diǎn)估
31、計(jì)無(wú)法衡量估計(jì)值接近總體未知參數(shù)程度區(qū)間估計(jì):在點(diǎn)估計(jì)的基礎(chǔ)上,給出總體參數(shù)估計(jì)取值的一個(gè)區(qū)間范圍。 1.置信區(qū)間:由樣本統(tǒng)計(jì)量對(duì)總體參數(shù)進(jìn)行估計(jì)時(shí)的估計(jì)區(qū)間。在某種程度上確信置信區(qū)間中包含總 體參數(shù)的真a.總體參數(shù)的真值是未知的、固定的,構(gòu)造出的置信區(qū)間可能包含真值,也可能不包含真值;b.設(shè)置信水平為95%,則說(shuō)明有95%的置信區(qū)間包含總體真值,有5%的置信區(qū)間不包含總體真值。 2.置信水平(置信度、置信系數(shù)):包含總體參數(shù)真值的置信區(qū)間占所有置信區(qū)間的比例。常用1-a表示置信水平。置信水平aa I2Za I290%0.100.051.64595%0.050.0251.9699%0.010.0052.58評(píng)價(jià)估計(jì)量的標(biāo)準(zhǔn)無(wú)偏性:是指估計(jì)量抽樣分布的數(shù)學(xué)期望等于被估計(jì)的總體參數(shù)。有效性:對(duì)同一總體參數(shù)的兩個(gè)無(wú)偏估計(jì)量,標(biāo)準(zhǔn)差越小的估計(jì)量估計(jì)效果越好,稱估計(jì)量越有效。一致性:隨著樣本量的增大,點(diǎn)估計(jì)量的值越來(lái)越接近被估總體的參數(shù)。總體均值的區(qū)間估計(jì)總體均值的置信區(qū)間=樣本均值邊際誤差總體是否為正態(tài)分布總體方差是否已知樣本是大樣本還是小樣本1.正態(tài)總體,方差已知樣本均值XN(p ,O 2/n),總體均值在1-a的置信水平下的置信區(qū)間為2.方差未知,大樣本(nN30)x
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 《材料失效分析》教學(xué)大綱
- 玉溪師范學(xué)院《社會(huì)政策》2023-2024學(xué)年第一學(xué)期期末試卷
- 玉溪師范學(xué)院《美國(guó)社會(huì)與文化》2022-2023學(xué)年第一學(xué)期期末試卷
- 函數(shù)定義域求法教案
- 人力培訓(xùn) -績(jī)效面談溝通技巧及改進(jìn)方案
- 2019粵教版 高中美術(shù) 選擇性必修6 現(xiàn)代媒體藝術(shù)《第三單元 中期的設(shè)定與拍攝》大單元整體教學(xué)設(shè)計(jì)2020課標(biāo)
- 2024屆河北省衡水中學(xué)高三下學(xué)期三校五測(cè)數(shù)學(xué)試題試卷
- 2024屆貴州省都勻一中高考原創(chuàng)信息試卷數(shù)學(xué)試題(三)
- 財(cái)務(wù)咨詢商業(yè)計(jì)劃書(shū)合同
- 被褥購(gòu)買協(xié)議書(shū)范本
- 洗潔精質(zhì)量安全管理手冊(cè)
- 勞動(dòng)用工法律風(fēng)險(xiǎn)防范與控制——宣講稿(中1)doc
- TDS3054B示波器使用說(shuō)明.ppt
- 教師資格證報(bào)名登記表
- 房建試驗(yàn)檢測(cè)項(xiàng)目(共1頁(yè))
- 公司發(fā)文簽批單模板
- 《腦血管疾病概述》PPT課件.ppt
- 基礎(chǔ)工程設(shè)計(jì)-橋梁樁基(修改)
- 《農(nóng)村醫(yī)療改革》PPT課件.ppt
- 膝關(guān)節(jié)骨性關(guān)節(jié)炎(膝痹病)病程模板
- 概述卡諾循環(huán)
評(píng)論
0/150
提交評(píng)論