第五章數(shù)據(jù)統(tǒng)計(jì)分析1_第1頁
第五章數(shù)據(jù)統(tǒng)計(jì)分析1_第2頁
第五章數(shù)據(jù)統(tǒng)計(jì)分析1_第3頁
第五章數(shù)據(jù)統(tǒng)計(jì)分析1_第4頁
第五章數(shù)據(jù)統(tǒng)計(jì)分析1_第5頁
已閱讀5頁,還剩15頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

5放射性測量數(shù)據(jù)的統(tǒng)計(jì)分析

放射性測量的對象——放射性物質(zhì)放射性物質(zhì)的衰變是一種隨機(jī)過程,每個(gè)原子的衰變是完全獨(dú)立的,是無法預(yù)測的嚴(yán)格地說,并不存在“真正的”或“準(zhǔn)確的”衰變率,只能應(yīng)用統(tǒng)計(jì)學(xué)的方法來估計(jì)在一段時(shí)間內(nèi)最可能發(fā)生衰變的放射性原子數(shù)目環(huán)境放射性水平低,常受到本底的干擾,使得環(huán)境監(jiān)測數(shù)據(jù)的處理更為復(fù)雜5.1數(shù)理統(tǒng)計(jì)基礎(chǔ)知識(shí)數(shù)理統(tǒng)計(jì)方法:以概率論為基礎(chǔ),對大量的偶然現(xiàn)象的統(tǒng)計(jì)資料進(jìn)行分析研究,得出這種現(xiàn)象概率的規(guī)律性,給與科學(xué)的解釋數(shù)理統(tǒng)計(jì)方法,是以樣本為依據(jù),運(yùn)用數(shù)學(xué)模型來推斷總體的一門科學(xué)5.1.1總體和樣本

總體(母體)——研究對象的特征表征量的全體

樣本(子樣)——從總體中抽取出來的一部分樣品x1、x2、……、xn的測量值樣本容量——樣本中的樣品個(gè)數(shù)(n),即樣本的大??;

n>30

——大樣本一組數(shù)據(jù)——表征自總體中隨機(jī)抽出的一組樣本用樣品的分析結(jié)果說明被研究對象的整體——用樣本說明總體(母體)

分析學(xué):以樣品的分析結(jié)果說明被研究對象

統(tǒng)計(jì)學(xué):以樣本的分析結(jié)果說明總體5.1.2數(shù)據(jù)的特性及其分布環(huán)放監(jiān)測數(shù)據(jù)特性:①具有一定分散性(不可能完全相同)

②具有集中性的趨勢常遇到的三種分布:(1)泊松分布(浦阿松分布):離散型變量的一種分布

p(x)

P(x)——計(jì)數(shù)x出現(xiàn)的概率μ——泊松分布的均值(數(shù))μ>16時(shí),泊松分布正態(tài)分布σ2=μ

σ=√μ

X(2)正態(tài)分布(Gauss分布)實(shí)驗(yàn)的隨機(jī)差通常服從此分布

P(x)

標(biāo)準(zhǔn)正態(tài)分布μ——曲線最高點(diǎn)對應(yīng)的橫坐標(biāo)值測值的集中趨勢σ——測值的離散特性(大精密度差,分散,小精密度高)μ——正態(tài)分布中以σ為單位的離均差(x-μ)

N(μ,σ)N(0,1)(3)對數(shù)正態(tài)分布檢驗(yàn)方法:在正態(tài)概率紙或?qū)?shù)概率紙上作圖,看能否得出一條直

線。(4)正態(tài)分布特征量與樣本特征量總體平均值μ——正態(tài)變量x的集中性樣本均值x——μ的估計(jì)值總體標(biāo)準(zhǔn)差σ——正態(tài)變量x的離散程度樣本標(biāo)準(zhǔn)差S——σ的估計(jì)量5.1.3統(tǒng)計(jì)量及其分布統(tǒng)計(jì)量——由樣本數(shù)據(jù)構(gòu)造出來的隨機(jī)變量,如樣本特征量x,S由x,S構(gòu)造的新量也是隨機(jī)變量由樣本總體的估計(jì):建立相應(yīng)的統(tǒng)計(jì)量統(tǒng)計(jì)量本身的分布確定統(tǒng)計(jì)量超出某個(gè)限值或臨界值的概率提出各種統(tǒng)計(jì)假設(shè)的檢驗(yàn)方法對于正態(tài)分布N(μ,σ)來說,常用的統(tǒng)計(jì)量:x、S、u、t、ⅹ2、F其中x、S是樣本特征量,u、t、ⅹ2、F是新構(gòu)造出的統(tǒng)計(jì)量(1)樣本均值x的概率分布①若x~N(μ,σ2)x1、x2……X~N(μ,σ2/n)②n>30的大樣本,不管總體是何分布,X~N(μ,σ2/n)③樣本均數(shù)分布的均數(shù)等于原總體的分布μ④樣本均數(shù)分布的標(biāo)準(zhǔn)差σ被√n除所得的商:

多次測量的平均值比一次測量值更精確∴x估計(jì)μ(x=μ)(2)樣本標(biāo)準(zhǔn)差S的概率分布①通常S2=σ2,S=σ②標(biāo)準(zhǔn)差的標(biāo)準(zhǔn)差:σσ=σ/√2n

若X~N(μ,σ2),則S~N(σ,σ2/2n)。當(dāng)n較大時(shí),可把S當(dāng)作σ的估計(jì)值

(3)統(tǒng)計(jì)量u及其分布①若總體~N(μ,σ),X~N(μ,σ/√n)作出統(tǒng)計(jì)量:②u~N(0,1)③對于大樣本,用來檢驗(yàn)u=u0的假設(shè),單總體u檢驗(yàn)④臨界值Uα,置信水平1-α,在正態(tài)分布函數(shù)表上可查出對應(yīng)于α的Uα⑤構(gòu)造統(tǒng)計(jì)量~N(0,1)對于大樣本,用于檢驗(yàn)μ1=μ2的假設(shè),雙總體檢驗(yàn),臨界值也是Uα(4)統(tǒng)計(jì)量t及其分布(學(xué)生分布)英化學(xué)家Gosset用student①測定次數(shù)有限,其隨機(jī)誤差不完全服從N(μ,σ2),而是服從類似正態(tài)分布的t分布

統(tǒng)計(jì)量

自由度為1、5及∞的t分布②t與置信概率和自由度df=n-1有關(guān),其數(shù)值稱為置信因子t。③當(dāng)df∞,t=u,兩分布曲線一致。④小樣本時(shí),t用來檢驗(yàn)μ=μ0的假設(shè)——單總體t檢驗(yàn),查表臨界值tα⑤小樣本時(shí),t也可用來檢驗(yàn)μ1=μ2的假設(shè)——雙總體t檢驗(yàn)注意:雙總體u檢驗(yàn)、雙總體t檢驗(yàn)都是以σ1

=σ2為前提條件(5)統(tǒng)計(jì)量X2及其分布①

服從自由度

df=n-1的X2分布②X2由正態(tài)分布導(dǎo)出的一個(gè)重要的抽樣分布,具有以下重要特征:?X2無定值,X2所取值自0——∞;?分布曲線左右不對稱,呈左偏;?X2分布曲線隨自由度df而變化。隨自由度逐漸增大,曲線漸趨對稱;?X2分布的總體平均值或期望值為n-1,總體標(biāo)準(zhǔn)差為。若各Xi的σi相等,即σi

=σ0則有③?檢驗(yàn)在σ已知的特定實(shí)驗(yàn)中得到的S值究竟是合理還是例外。

?檢驗(yàn)一組n個(gè)觀測值是否和正態(tài)分布或其他分布一致。④查表,臨界值X2α(6)統(tǒng)計(jì)量F及其分布①要檢驗(yàn)兩個(gè)總體方差是否一致,是否屬于同一正態(tài)分布,往往要進(jìn)行F檢驗(yàn)。②F服從自由度分別為n-1和n-2的F分布③F檢驗(yàn)的臨界值Fα④F統(tǒng)計(jì)量值與Fα比較,判斷兩個(gè)測量的方差是否有顯著的差別。F分布5.1.4統(tǒng)計(jì)檢驗(yàn)

先假設(shè)某一種總體具有某種參數(shù)或遵從某種分布等統(tǒng)計(jì)特性,然后再檢驗(yàn)這個(gè)假設(shè)是否可信,這種方法稱為統(tǒng)計(jì)檢驗(yàn),或統(tǒng)計(jì)假設(shè)檢驗(yàn)。

例:某測量裝置檢修前后的兩組本底;年均值m1,m2;有無變化?m1,m2~兩個(gè)泊松分布的總體,假設(shè)m1-m2=0;采用樣本來推斷是否拋棄該假設(shè)。(1)統(tǒng)計(jì)假設(shè)考兩類錯(cuò)誤①統(tǒng)計(jì)檢驗(yàn)步驟?先作出某種假設(shè)——原假設(shè)H0

,除H0外

,提出另一假設(shè)——備擇假設(shè)H1?根據(jù)樣本數(shù)據(jù)是否拒絕原假設(shè)H0?當(dāng)拒絕H0時(shí),就接受H1

②兩類錯(cuò)誤:樣本數(shù)據(jù)是帶有隨機(jī)性的,根據(jù)樣本作出拒絕或接受某一假設(shè),難免犯錯(cuò)。?第一類錯(cuò)誤(拒真)——假設(shè)H0為真,拒絕;接受H1;概率α表示?第二類錯(cuò)誤(存?zhèn)危僭O(shè)H0為偽,接受;拒絕H1;概率β表示?希望α、β均小,但二者是相矛盾的,要壓小α值,β值勢必上升例:同時(shí)間t測量CB,CS+B。判斷CS+B至少大CB多少才能判斷樣品含放射性,而拒真概率<α(例如α=0.05)令,X~N(0,1),μ是X的期望值(真值),σ標(biāo)準(zhǔn)差(未知),可用

作為它的估計(jì)值。原假設(shè)H0:μ=0(不含放射性)備樣假設(shè)H1:μ>0(含放射性)若觀測值X≥Xα,則接受H0,拒受H1

X≤Xα,則拒受H0,接受H0α——顯著性水平;1-α——置信度1-β——實(shí)驗(yàn)的撿出力∴預(yù)定了α值,β就不能任意指定β值取決于α值和樣品實(shí)際所含的放射性。

α選擇視具體問題而定犯兩類錯(cuò)誤的示意圖Lc——判斷限LD——探測限LQ——測定限③統(tǒng)計(jì)檢驗(yàn)分為單側(cè)檢驗(yàn)和雙側(cè)檢驗(yàn)單側(cè)檢驗(yàn)——專門檢查μ是否顯著地大于(或小于)μ0,其否定為μ>μ0

(或μ<μ0)雙側(cè)檢驗(yàn)——只關(guān)心μ是否等于μ0,其原假設(shè)為μ=μ0,否定假設(shè)為μ≠μ0④常用α及時(shí)對應(yīng)的Uα值和Uα/2值

α=0.05U0.05=1.64U0.025=1.96

α=0.01U0.01=2.33U0.005=2.58(2)顯著性檢驗(yàn)與顯著性水平①顯著性檢驗(yàn)——只提出一個(gè)原假設(shè)H0,不提備用假設(shè)

U≥Uα,拒絕H0;U<Uα,無顯著性差異,不適宜否定H0②顯著性水平——上述犯第一類錯(cuò)誤的概率α③用途關(guān)于總體參數(shù)的檢驗(yàn)關(guān)于分布類型的檢驗(yàn)(“吻合度”檢驗(yàn))④(1-α)稱為置信水平,表示可以有多大的把握去否定一個(gè)假設(shè)(3)實(shí)例①總體均值與一已知值相等的統(tǒng)計(jì)檢驗(yàn)測量值均值=已知值?檢驗(yàn)方法:u,t檢驗(yàn)法?μ檢驗(yàn)法(已知真值,已知總體方差)[例1]已知:土壤中239Pu含量(μ0)4.47Bq/g,n=5次測量均值x=4.364Bq/g,試分析是否存在系統(tǒng)誤差?取α=0.05

原假設(shè)H0:“μ是否等于μ0”

雙側(cè)檢驗(yàn)查U表U0.025=1.96U=2.19>1.96,∴否定原假設(shè)H0μ≠4.47Bq/g,該分析中存在系統(tǒng)誤差(1-α)=95%?t檢驗(yàn)法

(測量的總體方差未知用樣本方差S2來估計(jì)總體方差σ2

用t檢驗(yàn))[例2]已知:土壤中鈾含量~N(μ,σ2),以往大量樣品分析得到μ0=1.23μg/g;現(xiàn)取樣分析,n=20個(gè),x=1.35μg/g,S=0.24μg/g;

現(xiàn)在水平≥以往水平?試進(jìn)行顯著性檢驗(yàn)(取α=0.05)解:原假設(shè)H0:μ≤μ0(單側(cè)檢驗(yàn))

構(gòu)造統(tǒng)計(jì)量:df=n-1=19,查t表得:tα(19)=1.729∵t=2.23

>tα(19)

=1.729,故拒絕μ≤μ0的假設(shè)結(jié)論為目前該土壤中鈾含量的水平顯著地大于以往的本底水平(1-α)=95%②兩總體均值之差等于一已知值和兩總體均值相等的統(tǒng)計(jì)檢驗(yàn)常用來比較不同條件下的兩組測量數(shù)據(jù)之間是否存在差異。?μ檢驗(yàn)法(總體方差已知)[例3]茶葉樣Ⅰ、Ⅱ中90Sr的含量:XⅠ=66.64Bq/kg,nⅠ=4;XⅡ=66.6Bq/kg,nⅡ=6;已知兩樣本標(biāo)準(zhǔn)都和總體標(biāo)準(zhǔn)差σ=0.061無顯著差別。問:Ⅰ、Ⅱ號(hào)茶葉中90Sr是同一種茶葉分別裝在兩個(gè)瓶里,還是兩種不同的茶葉樣(α=0.05)解:原假設(shè)H0:μ1=μ2(雙側(cè)檢驗(yàn))∵σ總體已知且不變,∴兩平均值差的方差為令α=0.05,查μ表得:μ0.05/2=1.96。μ<1.96故接受原假設(shè)。無顯著性差別,沒有理由認(rèn)為兩樣本不是同一種。?t檢驗(yàn)法(總體方差未知),σ12與σ22未知,只能用S12和S22估計(jì)之[例4]例2中,X=1.23μg/g,S=0.25μg/g,n=22個(gè),試進(jìn)行顯著性檢驗(yàn)(取α=0.1,雙測檢驗(yàn))[解]構(gòu)造統(tǒng)計(jì)量:查t0.05,40=2.201

t>t0.05(tα/2)

拒絕原假設(shè)H0即現(xiàn)在水平不同于原水平[例5]在A、B兩點(diǎn)采集大氣沉降物樣品25個(gè),測量樣品α放射性活度(×10-12Ci/m2天)

兩批數(shù)據(jù)均~N(μ,σ2):

A:n=25,X=24.0,S=13.0B:n=25,X=16.7,S=7.7試比較A、B放射性水平有無顯著性差別(取α=0.05)

首先檢驗(yàn)總體方差是否相等,即σ12=σ22,構(gòu)造統(tǒng)計(jì)量F:雙測檢驗(yàn):查F臨界值表中Fα/2,當(dāng)自由度df1=df2=25-1=24,F(xiàn)0.025=2.269

本例的F>F0.025,拒絕σ12=σ22的假設(shè),∵不具備方差齊性的條件

∴不能用下面公式構(gòu)造的統(tǒng)計(jì)量:

而應(yīng)選用

Aspin-Welch檢驗(yàn)公式:查t分布的雙測分位表,當(dāng)df=39時(shí),t0.05/2=2.023本例t>t0.05/2,拒絕原假設(shè)μ1=μ2,即兩采樣點(diǎn)上平均水平差異顯著(置信水平95%)[例6]兩實(shí)驗(yàn)室共同分析就批數(shù)據(jù),分析成對進(jìn)行,是比較兩實(shí)驗(yàn)室結(jié)果之間有無差異

批數(shù)123456789A93.0892.5991.3691.6091.9193.4992.0392.8091.03B92.9792.8591.8692.1792.

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論