定量分析中的數(shù)據(jù)處理_第1頁
定量分析中的數(shù)據(jù)處理_第2頁
定量分析中的數(shù)據(jù)處理_第3頁
定量分析中的數(shù)據(jù)處理_第4頁
定量分析中的數(shù)據(jù)處理_第5頁
已閱讀5頁,還剩49頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

定量分析中的數(shù)據(jù)處理第一頁,共五十四頁,2022年,8月28日1、數(shù)據(jù)處理中的幾個術(shù)語及其意義在實際的分析測試工作中,測試所得的數(shù)據(jù)總是參差不齊,誤差是客觀存在的。如何對所得的數(shù)據(jù)進行處理和評價,找出其規(guī)律,判斷分析結(jié)果的可靠性,并用于指導(dǎo)實踐。數(shù)理統(tǒng)計法是處理與評價數(shù)據(jù)的科學(xué)方法。先介紹有關(guān)的的幾個術(shù)語:(1)總體、樣本和個體(2)平均值和中位數(shù)(3)精密度的表示方法

第二頁,共五十四頁,2022年,8月28日(1)總體、樣本、個體和樣本容量總體:研究對象的全體稱為總體(或母體);樣本:(或子樣):自總體中隨機抽出的一部分樣品稱為樣本(或子樣);個體:組成總體的每一個單元稱之為個體;樣本容量:樣本中所含個體的數(shù)目稱為樣本大?。ɑ驑颖救萘浚┑谌?,共五十四頁,2022年,8月28日舉例說明對某一批軟錳礦中二氧化錳含量的測定。分析人員按分析標準規(guī)定,對物料進行處理(取樣、粉碎、過篩和縮分等前處理的過程),最后得到約500g供分析用的試樣,這就是總體。從500g的試樣(總體)中取12份軟錳礦樣品來進行分析,得到12個測定值,這一組測定值(12個數(shù)據(jù))稱為本軟錳礦試樣總體的隨機樣本,樣本容量為12。由于不可能對總體中的每一個個體都進行研究,應(yīng)用統(tǒng)計學(xué)的方法對樣本(有限的個體)的研究來研究總體。如上例中,通過12次的測定的數(shù)值,來確定該批軟錳礦中二氧化錳的含量。第四頁,共五十四頁,2022年,8月28日(2)平均值和中位數(shù)平均值總體平均值:當(dāng)測量次數(shù)和測量數(shù)據(jù)無限多時,其平均值稱為總體平均值或均值,即為真值μ。真值:樣本算術(shù)平均值(也稱平均值、均值,測定有限次,在分析測試工作中一般n<20),將所得數(shù)據(jù)的總和除于測定次數(shù)而得:第五頁,共五十四頁,2022年,8月28日中位數(shù)中位數(shù):位于一系列按遞增或遞減排列數(shù)據(jù)中間的數(shù)據(jù)稱為中位數(shù)。(1)數(shù)據(jù)的數(shù)目n為奇數(shù)時,居于中間的數(shù)值僅一個;(2)數(shù)據(jù)的數(shù)目n為偶數(shù)時,居于中間的數(shù)值有兩個,此時中位數(shù)為它們的平均值;(3)采用中位數(shù)的優(yōu)點是:計算簡便,它與兩端極值的變化無關(guān),當(dāng)測量次數(shù)較少、而且又有大誤差出現(xiàn),數(shù)據(jù)處理有困難時,采用中位數(shù)較好。小結(jié):平均值和中位數(shù)表示數(shù)據(jù)的集中趨勢,即數(shù)據(jù)集中在平均值或中位數(shù)附近。第六頁,共五十四頁,2022年,8月28日(3)精密度的表示法在誤差概念的討論中己知,可用誤差和偏差來表示測定數(shù)據(jù)的準確度和精密度。而精密度是對有限次測定數(shù)據(jù)的離散程度。d、、、R(極差)和公差來表示。根據(jù)對數(shù)據(jù)處理的要求不同,數(shù)據(jù)的精密度還常用以下幾種方法表示。第七頁,共五十四頁,2022年,8月28日方差總體方差:測定值與真值的差的平方和除以測定次數(shù)n。樣本方差:第八頁,共五十四頁,2022年,8月28日標準差標準差:方差的平方根為標準偏差??傮w的標準差也稱標準誤差,對真值言。由于真值不知道,所以標準誤差少用。第九頁,共五十四頁,2022年,8月28日樣本標準差(標準偏差)與變異系數(shù)樣本標準差也稱為標準偏差:對平均值而言。

-相對標準偏差也稱變異系數(shù)。在要求較嚴格的測定數(shù)據(jù)時,一般用變異系數(shù)來表示誤差。第十頁,共五十四頁,2022年,8月28日標準誤差與標準偏差的特點標準誤差相對真值而言,測定次數(shù)為n→∞標準偏差相對平均值而言,計算公式中的n-1稱為自由度(通俗的理解可為:做了n次實驗,有n-1次可以做對比)。第十一頁,共五十四頁,2022年,8月28日精密度表示法小結(jié)測定結(jié)果數(shù)據(jù)精密度的表示法有:偏差(d)平均偏差()相對平均偏差(即精密度)標準偏差(s)相對標準偏差(即:變異系數(shù))工業(yè)生產(chǎn)中還常用極差和公差來表示,具體采用哪一種表示法、由分析結(jié)果的要求決定。另外:表示誤差的數(shù)值時,用1-2位有效數(shù)字即可。第十二頁,共五十四頁,2022年,8月28日例用標準偏差比用平均偏差更能顯示數(shù)據(jù)的離散性,因而更科學(xué)更準確。例:有兩位分析人員對同一樣品進行分析,都平行做了8次,得到以下兩組數(shù)據(jù),計算兩組數(shù)據(jù)的平均偏差()與標準偏差(s):

1.:0.11,-0.73,0.24,0.51,-0.14,0.00,0.30,-0.21,

n=8=0.28s1=0.382:0.18,0.26,-0.25,-0.37,0.32,-0.28,0.31,-0.27

n=8=0.28s2=0.29

=

,

s1>s2第十三頁,共五十四頁,2022年,8月28日2.隨機誤差的分布隨機誤差(偶然誤差)是由一些偶然因素造成的誤差,它的大小和方向難以估計,似乎沒有什么規(guī)律,但如果用統(tǒng)計學(xué)方法處理,就會發(fā)現(xiàn)它服從一定的統(tǒng)計規(guī)律。為了弄清隨機誤差的統(tǒng)計規(guī)律,下面我們來討論以下兩個問題。

(1)頻數(shù)分布(2)正態(tài)分布第十四頁,共五十四頁,2022年,8月28日測定數(shù)據(jù)表

有一礦石試樣,在相同條件下用吸光光度法測定其中銅的百分含量,共有100個測量值。這些測量值屬隨機變量1.361.491.431.411.371.401.321.421.471.391.411.361.401.341.421.421.451.351.421.391.441.421.391.421.421.301.341.421.371.361.371.341.371.461.441.451.321.481.401.451.391.461.391.531.361.481.401.391.381.401.461.451.501.431.451.431.411.481.391.451.371.461.391.451.311.411.441.441.421.471.351.361.391.401.381.351.421.431.421.421.421.401.411.371.461.361.371.271.471.381.421.341.431.421.411.411.441.481.551.37第十五頁,共五十四頁,2022年,8月28日頻數(shù)分布對上表100個數(shù)據(jù)的分析:有兩個極值,最小為1.27,最大為1.55。R(極值)=1.55-1.27=0.28≈0.30(方便處理)把數(shù)據(jù)分為10組則組距為0.03,將各測量值對號編入。制頻數(shù)分布表。第十六頁,共五十四頁,2022年,8月28日

分組頻數(shù)相對頻數(shù)1.265~1.29510.011.295~1.32540.041.325~1.35570.071.355~1.385170.171.385~1.415240.241.415~1.445240.241.445~1.475150.151.475~1.50560.061.505~1.53510.011.535~1.56510.011001頻數(shù)分布表(圖表)第十七頁,共五十四頁,2022年,8月28日數(shù)據(jù)頻數(shù)分布規(guī)律由以上數(shù)據(jù),我們可以發(fā)現(xiàn)位于中間數(shù)值1.36~1.44之間的數(shù)據(jù)多一些,其他范圍的數(shù)據(jù)少一些,小于1.27或大于1.55的數(shù)據(jù)更少一些。這就是說測量數(shù)據(jù)中有明顯的集中趨勢。測量數(shù)據(jù)的這種既分散又集中的特性,就是其規(guī)律性。第十八頁,共五十四頁,2022年,8月28日頻數(shù)分布圖在位于中間數(shù)值1.36~1.44之間的數(shù)據(jù)多一些,其他范圍的數(shù)據(jù)少一些,小于1.27或大于1.55的數(shù)據(jù)更少一些。測量數(shù)據(jù)有明顯的集中趨勢。第十九頁,共五十四頁,2022年,8月28日2.隨機誤差的正態(tài)分布定量分析的隨機測量值或偶然誤差的分布都符合正態(tài)分布規(guī)律,正態(tài)分布就是數(shù)學(xué)上的高斯分布,可用高斯方程描述:

X是隨機測量值,y稱為概率密度。第二十頁,共五十四頁,2022年,8月28日高斯方程曲線(1)分析測定中的隨機誤差都遵從正態(tài)分布,從曲線中可以看到:偏差大小相等,符號相反的測定值出現(xiàn)的概率大致相等;偏差小的測定值比偏差大的測定值出現(xiàn)的概率多、偏差很大的測定值出現(xiàn)的概率極小;曲線呈兩頭小,中間大的勢態(tài)。第二十一頁,共五十四頁,2022年,8月28日高斯方程曲線(2)曲線中的兩個參數(shù):μ(真值)和σ(標準差),當(dāng)μ確定后,則:σ越小,落在μ附近的概率越大,測定值的精密度越好,曲線半寬度越小;相反,則數(shù)據(jù)離散性更大;第二十二頁,共五十四頁,2022年,8月28日高斯方程曲線(3)由于正態(tài)分布方程中μ和σ都是變量,計算不便,采用變量轉(zhuǎn)換的辦法將平均值的偏差(x-μ

)以σ為單位,令:則原高斯方程轉(zhuǎn)換成只有一個變量μ的方程,即此時變?yōu)椋害蹋?和σ=1的正態(tài)分布曲線,稱為標準正態(tài)分布曲線,以N(0,1)表示,其概率就容易求出。人們經(jīng)過計算并制成了各種形式的正態(tài)分布概率表供使用者查閱。第二十三頁,共五十四頁,2022年,8月28日第二十四頁,共五十四頁,2022年,8月28日第二十五頁,共五十四頁,2022年,8月28日3.少量數(shù)據(jù)的統(tǒng)計處理分析化學(xué)中通過樣本研究總體,由于測量次數(shù)有限,σ和μ無從知道。如何處理和評價有限次數(shù)測定結(jié)果的數(shù)據(jù)?而對多次測定的結(jié)果平均值又如何評價?在前面己討論的基礎(chǔ)上,討論下面的問題:第二十六頁,共五十四頁,2022年,8月28日3.少量數(shù)據(jù)的統(tǒng)計處理分析化學(xué)中通過樣本研究總體,由于測量次數(shù)有限,σ和μ無從知道。英國化學(xué)家Gosset提出用t分布解決了這一問題。

(1)t分布和t分布曲線統(tǒng)計量t,定義為:

稱為平均值的標準偏差,

與樣本容量n有關(guān),即:第二十七頁,共五十四頁,2022年,8月28日圖115頁圖平均值標準偏差與測量次數(shù)的關(guān)系第二十八頁,共五十四頁,2022年,8月28日3.少量數(shù)據(jù)的統(tǒng)計處理t分布曲線與橫坐標t某區(qū)間所夾面積,與正態(tài)分布曲線一樣,表示測量值落在該區(qū)間的概率。顯然,若選定某一概率和一定的自由度f,則t值也就一定。表2-2是最常用的t值,表中的P稱為置信度,表示隨機測定值落在(μ±ts)區(qū)間內(nèi)的概率,稱為顯著性水準,用a表示,即a=1-P。應(yīng)用表時須加腳注,注明顯著性水準和自由度,例如:t0.05,9是指置信度為95%(顯著性水準為0.05),自由度為9時的t值。第二十九頁,共五十四頁,2022年,8月28日3.表2-2值(雙邊)f=n-1置信度P,顯著性水準α

f=n-1置信度P,顯著性水準αP=0.90α=0.10P=0.95α=0.05P=0.99α=0.01P=0.90α=0.10P=0.95α=0.05P=0.99α=0.0116.3112.1763.6671.902.363.5022.924.309.9281.862.313.3632.353.185.8491.832.263.2542.132.784.60101.812.233.1752.022.574.03201.722.092.8461.942.453.71∞1.641.962.58第三十頁,共五十四頁,2022年,8月28日(2)平均值的置信區(qū)間用樣本研究總體時,樣本均值x并不等于總體均值μ,但可以肯定,只要消除了系統(tǒng)誤差,在某一置信度下,一定存在著一個以樣本均值x為中心,包括總體均值μ在內(nèi)的某一范圍,稱為平均值的置信區(qū)間.由t的定義式得:

式中稱為置信區(qū)間,其大小取決于測定的標準偏差測定次數(shù)和置信度的選擇,置信區(qū)間愈小,平均值x愈接近總體平均值.第三十一頁,共五十四頁,2022年,8月28日3.少量數(shù)據(jù)的統(tǒng)計處理(3)可疑數(shù)據(jù)的取舍一組數(shù)據(jù)中,可能有個別數(shù)據(jù)于其他數(shù)據(jù)差異較大,稱為可疑值.除確定是由于過失所造成的可疑值可以舍棄外,可疑值還是要保留,應(yīng)用統(tǒng)計學(xué)的方法來判斷,不能任憑主觀意愿決定取舍.常用的可疑值取舍方法有:4法Q檢驗法格魯布斯法第三十二頁,共五十四頁,2022年,8月28日4法若一總體服從正態(tài)分布,x-μ大于的測量值出現(xiàn)的概率很小,其誤差往往不是隨機誤差所致,應(yīng)舍去,當(dāng)然,其條件是在校正了系統(tǒng)誤差之后.又總體的標準偏差σ于總體平均偏差δ

兩者的關(guān)系是

,用樣本平均偏差代替δ,則,這樣,便可將可疑值與之差是否大于作為可疑值取舍的根據(jù).

應(yīng)用法時,可先把可疑值處外,求出余下測量值的和,若可疑值與之差的絕對值大于,可疑值舍棄,否則保留.第三十三頁,共五十四頁,2022年,8月28日Q檢驗法此法是將數(shù)據(jù)從小到大排列,如設(shè)為可疑值,按下式求統(tǒng)計量Q,Q稱為舍棄商.

上式的分母是極差,分子是可疑值與最臨近值之差,把Q與值比較,若,可疑值應(yīng)舍棄,否則保留,若是可疑值,Q從下式求出:

值與置信度和測量次數(shù)有關(guān),如表2-3所示第三十四頁,共五十四頁,2022年,8月28日Q檢驗法(表2-3)

表2-3Q值表測定次數(shù),n345678910置信度90%()0.940.760.640.560.510.470.440.4196%()0.980.850.730.640.590.540.510.4899%()0.990.930.820.740.680.630.600.57第三十五頁,共五十四頁,2022年,8月28日格魯布斯法該法用到正態(tài)分布中反映測量值集中與波動的兩數(shù)和S,因而可靠性較高.應(yīng)用此法時,在計算了和S后,將測量值從小到大排列,同Q檢驗法一樣,應(yīng)按測量次數(shù)多少,確定檢驗或,若兩個都做檢驗,設(shè)x為可疑值,由下式求統(tǒng)計量T:

把T與表值比較,若,可疑值舍棄,否則保留,若為可疑值,T由下式求出:

值與測定次數(shù)和顯著性水準有關(guān),如表2-4第三十六頁,共五十四頁,2022年,8月28日格魯布斯法(表2-4)

表2-4值表測定次數(shù),n顯著性水準α測定次數(shù),n顯著性水準α0.050.0250.010.050.0250.0131.151.151.1582.032.132.2241.461.481.4992.112.212.3251.671.711.75102.182.292.4161.821.891.94152.412.552.7171.942.022.10202.562.712.88第三十七頁,共五十四頁,2022年,8月28日4.數(shù)據(jù)的評價---顯著性檢驗分析工作者常常用標準方法與自己所用的分析方法進行對照試驗,然后用統(tǒng)計學(xué)方法檢驗兩種結(jié)果是否存在顯著性差異.若存在顯著性差異而又肯定測定過程中沒有錯誤,可以認定自己所用的方法有不完善之處,即存在較大的系統(tǒng)誤差.

因此結(jié)果的差異需進行統(tǒng)計檢驗或顯著性檢驗.

顯著性檢驗的一般步驟是:1,做一個假設(shè),即假設(shè)不存在顯著性差異,或所有樣本來源于同一體.2,確定一個顯著性水準,通常=0.1,0.05,0.01等值,分析工作中則多取0.05的顯著性水準.3,統(tǒng)計量計算何作出判斷.

下面介紹F檢驗法和t檢驗法.第三十八頁,共五十四頁,2022年,8月28日F檢驗法和t檢驗法(1)(1)F檢驗法該法用于檢驗兩組數(shù)據(jù)的精密度,即標準偏差s存在顯著性差異.F檢驗是將兩組數(shù)據(jù)的s求得方差,把方差大的記為,方差小的記為,按下式求出統(tǒng)計量F:

把F值于表2-5的F表比較,若FF標值,則兩組數(shù)據(jù)的精密度不存在顯著性差異,若大小相反,則存在顯著性差異.第三十九頁,共五十四頁,2022年,8月28日F檢驗法和t檢驗法(2)(2)t檢驗法t檢驗法用于判斷樣本平均值是否存在系統(tǒng)誤差,以計算所得的t統(tǒng)計量和選定的置信度與表2-2的值比較,若存在顯著性差異,則被檢驗方存在較大的系統(tǒng)誤差.分析化學(xué)中的置信度常用95%.a,平均值與置信度的比較.b,兩組數(shù)據(jù)平均值的比較.c,配對比較試驗.第四十頁,共五十四頁,2022年,8月28日5.誤差的傳遞分析過程各個步驟產(chǎn)生大或小,或正或負的誤差,它們分散于各個步驟的物理量測量值中,并最終集合于這些物理量計算的結(jié)果上,這就是誤差的傳遞.

分析結(jié)果計算式多數(shù)是加減式和乘除式,另外是指數(shù)式.誤差傳遞包括系統(tǒng)誤差的傳遞和偶然誤差的傳遞1,系統(tǒng)誤差的傳遞

2,偶然誤差的傳遞第四十一頁,共五十四頁,2022年,8月28日(1)系統(tǒng)誤差的傳遞a.加減運算計算結(jié)果的絕對誤差等于各個測量值的絕對誤差的代數(shù)和或差,若算式是R=A+B-C,則:b,乘除運算在乘法運算中,計算結(jié)果的相對誤差是各個測量值的相對誤差的和,而除法則是它們的差.如計算式是R=A*B/C,則:

第四十二頁,共五十四頁,2022年,8月28日(2)偶然誤差的傳遞a.加減運算計算結(jié)果的方差(標準偏差的平方)是各測量值方差的和,如R=A+B-C,則:b.乘除運算計算結(jié)果的想的偏差的平方是各測量值相對平均偏差平方的和,對于算式R=A*B/C,則c.指數(shù)運算對于,結(jié)果的相對偏差是測量值相對偏差的n倍,即第四十三頁,共五十四頁,2022年,8月28日6.提高分析結(jié)果準確度的方法要提高分析結(jié)果準確度,首先要發(fā)現(xiàn)和消除系統(tǒng)誤差,然后盡量減少偶然誤差.(1)消除與校正系統(tǒng)誤差系統(tǒng)誤差來源于確定因素,為發(fā)現(xiàn)并消除或校正系統(tǒng)誤差,可選用下面幾種方法

a.對照實驗b.回收實驗

c.空白實驗d.儀器校正(2)減少偶然誤差---------增加測定次數(shù)在消除或校正了系統(tǒng)誤差前提下,減少偶然誤差可以提高測定的準確度,這從平均值置信的區(qū)間可以說明.第四十四頁,共五十四頁,2022年,8月28日a.對照實驗要檢查一個分析方法是否存在誤差可以這樣做:(1)稱取一定純試劑進行測定,看測定結(jié)果與理論計算值是否相符.(2)對于實際的樣品(比較復(fù)雜,除了被測定組分,還存有其他組分),則采用已知含量的標準試樣(試樣中的各組分含量已知)進行對照實驗更合理.第四十五頁,共五十四頁,2022年,8月28日b.回收實驗多用于確定低含量測定的方法或條件是否存在系統(tǒng)誤差.實驗方法是在被測試樣中加入已知的被測組分,與原試樣同時進行平行測定,按下式計算回收率:

一般來說,回收率在95%~105%之間認為不存在系統(tǒng)誤差,即方法可靠.第四十六頁,共五十四頁,2022年,8月28日c.空白實驗由于試劑,蒸餾水或?qū)嶒炂髅蠛斜粶y組分或干擾物質(zhì),致使測定時觀測值增加(如滴定分析中多消耗標準溶液)導(dǎo)致系統(tǒng)誤差時,常用空白實驗進行校正.進行空白實驗時一般用蒸餾水代替試樣溶液,進行相同條件步驟的測定,所得結(jié)果稱為空白值.在試樣測定中摳除空白值,可消除此類系統(tǒng)誤差.第四十七頁,共五十四頁,2022年,8月28日d.儀器校正在嚴格的測定中,儀器讀數(shù)刻度,量器刻度,砝碼等標出值與實際值的細小差異也會影響測定的準確度,應(yīng)進行校正并求出校正值,在測定值中加入校正值,可消除此類系統(tǒng)誤差.第四十八頁,共五十四頁,2022年,8月28日2-3工作曲線與回歸分析法在許多儀器分析方法中,常利用濃度(或含量)與一可測物理量的線形關(guān)系來測定組分含量.測定時,先配制準確已知但濃度不同的一組溶液,在直角坐標上繪出工作曲線.應(yīng)用時,用試樣測定值在工作曲線上可直接查出組分含量.

由此,利用已知濃度與該物理量測量值,用回歸分析法求得回歸方程,就可從回歸方程求得濃度.在分析測定中兩個變量的一元線形回歸方程用的最為普遍.第四十九頁,共五十四頁,2022年,8月28日a.一元線形回歸方程

以X表示濃度,Y表示物理量測量值,若兩變量存在線性相關(guān)關(guān)系,則一元線性回歸方程為:

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論