IVD性能評估的統(tǒng)計學基礎分析_第1頁
IVD性能評估的統(tǒng)計學基礎分析_第2頁
IVD性能評估的統(tǒng)計學基礎分析_第3頁
IVD性能評估的統(tǒng)計學基礎分析_第4頁
IVD性能評估的統(tǒng)計學基礎分析_第5頁
已閱讀5頁,還剩214頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

IVD性能評估的統(tǒng)計學基礎楊宗兵/BIMT/2023/2/4性能評估&統(tǒng)計學性能指標的建立性能指標的確認、驗證、評價涉及不同機構統(tǒng)計學基礎知識在IVD性能評估中的應用(前提是測量的隨機誤差小,可靠性高,系統(tǒng)概念要加強),如均勻性、穩(wěn)定性、比對、互換性、線性等什么是統(tǒng)計學?收集、處理、分析、解釋數(shù)據(jù)并從數(shù)據(jù)中得出結論的科學收集數(shù)據(jù):取得數(shù)據(jù)處理數(shù)據(jù):圖表展示分析數(shù)據(jù):利用統(tǒng)計方法分析數(shù)據(jù)數(shù)據(jù)解釋:結果的說明得到結論:從數(shù)據(jù)分析中得出客觀結論統(tǒng)計學應用統(tǒng)計學經濟學管理學醫(yī)學工程學社會學…統(tǒng)計學是什么?統(tǒng)計學是一門科學統(tǒng)計方法是通用的數(shù)據(jù)分析方法。這些方法不是為某個特定的問題領域而構造的統(tǒng)計學是什么?統(tǒng)計學是什么?統(tǒng)計學是一門藝術不同的人對同一組數(shù)據(jù)的分析可能得到不同的結論。使用數(shù)字講故事取決于統(tǒng)計學家的技巧和他們的經驗統(tǒng)計學是一門技術統(tǒng)計方法是為保證產品達到所希望的質量和保持其穩(wěn)定性的管理系統(tǒng)中建立起來的統(tǒng)計名言

統(tǒng)計思維總有一天會像讀與寫一樣成為一個有效率公民的必備能力

—HerbertGeorgeWells統(tǒng)計思維

談到統(tǒng)計大家都認為統(tǒng)計是一種抽象、復雜、邏輯性強的概念其實,我們大家每天都在用統(tǒng)計

統(tǒng)計基礎知識大家都學過,現(xiàn)在我們再次溫習一遍,加深印象

現(xiàn)在學統(tǒng)計不要有太多的為什么,而是“能不能用”,對結果的解釋程度能到多少,是否合理?假設?

統(tǒng)計方法統(tǒng)計分析描述統(tǒng)計推斷統(tǒng)計參數(shù)估計假設檢驗描述統(tǒng)計研究數(shù)據(jù)收集、整理和描述的統(tǒng)計學方法x=55s2=33目的描述數(shù)據(jù)特征找出數(shù)據(jù)的基本規(guī)律內容搜集數(shù)據(jù)整理數(shù)據(jù)展示數(shù)據(jù)描述性分析

推斷統(tǒng)計研究如何利用樣本數(shù)據(jù)來推斷總體特征的統(tǒng)計學方法內容參數(shù)估計假設檢驗

目的對總體特征做出判斷定量變量(quantitativevariable)

或數(shù)值變量(metricvariable)可以用阿拉伯數(shù)據(jù)來記錄其觀察結果如“葡萄糖濃度”、“酶的催化活性”、“血細胞的個數(shù)”、“核酸擴增的CT值?”定量變量的觀察結果稱為定量數(shù)據(jù)或數(shù)值型數(shù)據(jù)(metricdata)如何獲得統(tǒng)計數(shù)據(jù)?分類變量(categoricalvariable)表現(xiàn)為不同的類別如“藥敏實驗結果”、“干化學尿液分析結果”等分類變量的觀察結果就是分類數(shù)據(jù)(categoricaldata)順序變量(rankvariable)或有序分類變量具有一定順序的類別變量如氨基酸序列(測序)順序變量的觀察結果就是順序數(shù)據(jù)或有序分類數(shù)據(jù)(rankdata)如何獲得統(tǒng)計數(shù)據(jù)?數(shù)據(jù)來源抽取樣本總體:包含所研究的全部個體(數(shù)據(jù))的集合樣本:從總體中抽取的一部分元素的集合樣本量:構成樣本的元素的數(shù)目概率抽樣方法概率抽樣根據(jù)一個已知的概率來抽取樣本單位,也稱隨機抽樣特點按一定的概率以隨機原則抽取樣本抽取樣本時使每個單位都有一定的機會被抽中每個單位被抽中的概率是已知的,或是可以計算出來的當用樣本對總體目標量進行估計時,要考慮到每個樣本單位被抽中的概率簡單隨機抽樣從總體N個單位(元素)中隨機地抽取n個單位作為樣本,使得總體中每一個元素都有相同的機會(概率)被抽中(抽簽法、隨機數(shù)表法)抽取元素的具體方法有重復抽樣和不重復抽樣特點簡單、直觀,在抽樣框完整時,可直接從中抽取樣本用樣本統(tǒng)計量對目標量進行估計比較方便局限性當N很大時,不易構造抽樣框抽出的單位很分散,給實施調查增加了困難沒有利用其他輔助信息以提高估計的效率簡單隨機樣本由簡單隨機抽樣形成的樣本從總體N個單位中隨機地抽取n個單位作為樣本,使得每一個容量為n樣本都有相同的機會(概率)被抽中參數(shù)估計和假設檢驗所依據(jù)的主要是簡單隨機樣本分層抽樣(分類抽樣)將總體單位按某種特征或某種規(guī)則劃分為不同的層,然后從不同的層中獨立、隨機地抽取樣本優(yōu)點保證樣本的結構與總體的結構比較相近,從而提高估計的精度組織實施調查方便既可以對總體參數(shù)進行估計,也可以對各層的目標量進行估計系統(tǒng)抽樣(等距抽樣)將總體中的所有單位(抽樣單位)按一定順序排列,在規(guī)定的范圍內隨機地抽取一個單位作為初始單位,然后按事先規(guī)定好的規(guī)則確定其他樣本單位先從數(shù)字1到k之間隨機抽取一個數(shù)字r作為初始單位,以后依次取r+k,r+2k…等單位優(yōu)點:操作簡便,有時可提高估計的精度缺點:對估計量方差的估計比較困難整群抽樣將總體中若干個單位合并為組(群),抽樣時直接抽取群,然后對中選群中的所有單位全部實施調查特點抽樣時只需群的抽樣框,可簡化工作量調查的地點相對集中,節(jié)省調查費用,方便調查的實施缺點是估計的精度通常較差幾種抽樣方法的關系類別特點相互聯(lián)系適用范圍共同點簡單隨機抽樣逐一抽取

小樣本等概率系統(tǒng)抽樣總體分成幾部分每部分簡單隨機抽樣大樣本分布均勻分層抽樣總體分成幾層(差異大、?。┟繉佑煤唵坞S機抽樣或系統(tǒng)抽樣總體由差異明顯的幾部分組成樣本分布與總體分布的關系總體分布正態(tài)分布非正態(tài)分布樣本均值正態(tài)分布樣本均值正態(tài)分布樣本均值非正態(tài)分布大樣本小樣本大樣本小樣本描述數(shù)據(jù)(圖表-分布)數(shù)據(jù)類別定性數(shù)據(jù)定量數(shù)據(jù)圖表類別頻數(shù)分布頻數(shù)分布條形圖直方圖餅形圖莖葉、箱線垂線、誤差環(huán)形圖散點圖雷達圖輪廓圖描述數(shù)據(jù)(頻數(shù)分布)某地區(qū)不同年齡段男女血清ALT活性測量(95%)描述數(shù)據(jù)(條形圖)描述數(shù)據(jù)(餅圖)描述數(shù)據(jù)(環(huán)形圖)描述數(shù)據(jù)(直方圖-分組)描述數(shù)據(jù)(莖葉圖、箱線圖)男Stem-and-LeafPlotFrequencyStem&Leaf

1.001.2

2.002.59

.003.

1.004.5Stemwidth:100Eachleaf:1case(s)描述數(shù)據(jù)(垂線圖、誤差圖)描述數(shù)據(jù)(散點圖)描述數(shù)據(jù)(雷達圖)描述數(shù)據(jù)(輪廓圖)數(shù)據(jù)類型與顯示數(shù)值型數(shù)據(jù)分類數(shù)據(jù)分組數(shù)據(jù)總計表莖葉圖條形圖圓形圖環(huán)形圖直方圖箱線圖折線圖原始數(shù)據(jù)時序數(shù)據(jù)線圖雷達圖多元數(shù)據(jù)用途描述數(shù)據(jù)-統(tǒng)計量集中趨勢(位置)離中趨勢

(分散程度)偏態(tài)和峰度(形狀)描述數(shù)據(jù)(統(tǒng)計量)數(shù)據(jù)特性水平差異分布統(tǒng)計量平均數(shù)方差偏態(tài)眾數(shù)極差四分位差峰態(tài)中位數(shù)Zi標準分數(shù)分位數(shù)離散系數(shù)描述統(tǒng)計(眾數(shù))集中趨勢的描述之一出現(xiàn)次數(shù)最多的變量值不受極端值的影響可能沒有眾數(shù)或有幾個眾數(shù)主要用于分類數(shù)據(jù),也可用于定序數(shù)據(jù)和數(shù)值型數(shù)據(jù)描述統(tǒng)計(中位數(shù)和分位數(shù))集中趨勢的描述之一排序后處于中間位置上的值不受極端值的影響主要用于定序數(shù)據(jù),也可用數(shù)值型數(shù)據(jù),但不能用于定類數(shù)據(jù)各變量值與中位數(shù)的離差絕對值之和最小Me50%50%描述統(tǒng)計(中位數(shù)和分位數(shù))計算公式:描述統(tǒng)計(中位數(shù)和分位數(shù))集中趨勢的描述之一排序后處于25%和75%位置上的值不受極端值的影響主要用于定序數(shù)據(jù),也可用于數(shù)值型數(shù)據(jù),但不能用于定類數(shù)據(jù)QLQMQU25%25%25%25%描述統(tǒng)計(均值)集中趨勢的描述之一最常用的統(tǒng)計量一組數(shù)據(jù)的均衡點所在易受極端值的影響用于數(shù)值型數(shù)據(jù),不能用于定類數(shù)據(jù)和定序數(shù)據(jù)描述統(tǒng)計(均值)簡單均值加權均值幾何平均值(平均發(fā)展速度)描述統(tǒng)計(水平)對稱分布

均值=

中位數(shù)=

眾數(shù)左偏分布均值

中位數(shù)

眾數(shù)右偏分布眾數(shù)

中位數(shù)

均值眾

數(shù)

不受極端值影響

具有不惟一性

數(shù)據(jù)較多時有意義,且有明顯峰值時應用

中位數(shù)

不受極端值影響

數(shù)據(jù)分布偏斜程度較大時應用

平均數(shù)

易受極端值影響

利用了全部數(shù)據(jù)信息,數(shù)學性質優(yōu)良數(shù)據(jù)對稱分布或接近對稱分布時應用較好

當要用樣本信息對總體進行推斷時,平均數(shù)就更顯示出它的各種優(yōu)良特性

描述統(tǒng)計(水平-統(tǒng)計量)描述統(tǒng)計(水平-統(tǒng)計量)

SPSS定義EXCEL11.2511.75233.7533.254四分位差2.521.5描述統(tǒng)計(四分位差)離散程度的描述之一也稱為內距或四分間距上四分位數(shù)與下四分位數(shù)之差

QD

=QU–QL反映了中間50%數(shù)據(jù)的離散程度不受極端值的影響用于衡量中位數(shù)的代表性描述統(tǒng)計(極差)一組數(shù)據(jù)的最大值與最小值之差離散程度的最簡單描述易受極端值影響未考慮數(shù)據(jù)的分布描述統(tǒng)計(方差和標準差)離散程度的描述之一最常用的描述值反映了數(shù)據(jù)的分布反映了各變量值與均值的平均差異根據(jù)總體數(shù)據(jù)計算的,稱為總體方差或標準差;根據(jù)樣本數(shù)據(jù)計算的,稱為樣本方差或標準差描述統(tǒng)計(方差和標準差)計算公式描述統(tǒng)計(標準化值)也稱標準分數(shù)給出某一個值在一組數(shù)據(jù)中的相對位置可用于判斷一組數(shù)據(jù)是否有離群點用于對變量的標準化處理計算公式為描述統(tǒng)計(離散系數(shù))我們叫變異系數(shù)標準差與其相應的均值之比消除了數(shù)據(jù)水平高低和計量單位的影響描述了數(shù)據(jù)的相對離散程度用于對不同組別數(shù)據(jù)離散程度的比較描述統(tǒng)計(分布)扁平分布尖峰分布偏態(tài)峰度左偏分布右偏分布與標準正態(tài)分布比較!描述統(tǒng)計(偏態(tài))數(shù)據(jù)分布偏斜程度的描述偏態(tài)系數(shù)=0為對稱分布偏態(tài)系數(shù)>0為右偏分布偏態(tài)系數(shù)<0為左偏分布計算公式為描述統(tǒng)計(峰態(tài))數(shù)據(jù)分布扁平程度的測度峰度系數(shù)=3扁平程度適中偏態(tài)系數(shù)<3為扁平分布偏態(tài)系數(shù)>3為尖峰分布計算公式為概率分布

數(shù)學定律不能百分之百確切的用在現(xiàn)實生活里;能百分之百確切的用數(shù)學定律描述的就不是現(xiàn)實生活

—AlbertEinstein概率分布舉例,不同的應用2^n2%事件的概率事件A的概率是對事件A在試驗中出現(xiàn)的可能性大小的一種度量表示事件A出現(xiàn)可能性大小的數(shù)值事件A的概率表示為P(A)概率的定義有:古典定義、統(tǒng)計定義和主觀概率定義事件的概率古典定義事件的概率統(tǒng)計的定義

在相同條件下進行n次隨機試驗,事件A出現(xiàn)m次,則比值m/n稱為事件A發(fā)生的頻率。隨著n的增大,該頻率圍繞某一常數(shù)P上下擺動,且波動的幅度逐漸減小,取向于穩(wěn)定,這個頻率的穩(wěn)定值即為事件A的概率,記為概率分布期望值:描述隨機變量集中程度的統(tǒng)計量離散型概率分布:Binomdist、Poisson、Hypergeometric連續(xù)型概率分布均勻、正態(tài)、指數(shù)、其他分布離散型概率分布二項分布與貝努里試驗有關貝努里試驗具有如下屬性試驗包含了n

個相同的試驗每次試驗只有兩個可能的結果,即“成功”和“失敗”出現(xiàn)“成功”的概率p對每次試驗結果是相同的;“失敗”的概率q也相同,且p+q=1試驗是相互獨立的試驗“成功”或“失敗”可以計數(shù)離散型概率分布進行n

次重復試驗,出現(xiàn)“成功”的次數(shù)的概率分布稱為二項分布設X為n次重復試驗中事件A出現(xiàn)的次數(shù),X取x

的概率為離散型概率分布泊松分布用于描述在一指定時間范圍內或在一定的長度、面積、體積之內每一事件出現(xiàn)次數(shù)的分布泊松分布的例子1mL溶液中粒子計數(shù)離散型概率分布—給定的時間間隔、長度、面積、體積內“成功”的平均數(shù)e=2.71828x—給定的時間間隔、長度、面積、體積內“成功”的次數(shù)連續(xù)型概率分布密度函數(shù)曲線下的面積等于1分布函數(shù)是曲線下小于x0

的面積f(x)xx0F(x0

)連續(xù)型概率分布若隨機變量X的概率密度函數(shù)為稱X在區(qū)間[a,b]上均勻分布數(shù)學期望和方差分別為xf(x)ba連續(xù)型概率分布描述連續(xù)型隨機變量的最重要的分布可用于近似離散型隨機變量的分布例如:二項分布經典統(tǒng)計推斷的基礎xf(x)連續(xù)型概率分布

和對正態(tài)曲線的影響xf(x)CAB連續(xù)型概率分布任何一個一般的正態(tài)分布,可通過下面的線性變換轉化為標準正態(tài)分布連續(xù)型概率分布xms一般正態(tài)分布=1Z標準正態(tài)分布正態(tài)分布數(shù)據(jù)正態(tài)性評估直方圖、莖葉圖、P-P、Q-Q其他分布樣本均值標準化(兩個樣本)樣本方差除以總體方差(分類變量)兩個樣本方差相比(多個樣本)t分布

設X1,X2,…,Xn1是來自正態(tài)總體N~(μ1,σ12)的一個樣本,稱為統(tǒng)計量,它服從自由度為(n-1)的t分布Xt

分布與正態(tài)分布的比較正態(tài)分布t分布t不同自由度的t分布標準正態(tài)分布t(df=13)t(df=5)Zt分布ExcelTDIST(2,10,2)=0.073TINV(0.073,10)=2自由度趨于無限大時,接近標準的Z分布用途:均值差異

ExcelCHIDIST(8,10)=0.073CHIINV(0.073,8)=1.20(右尾概率)獨立正態(tài)變量的平方和,自由度無限大時接近對稱分布用途:總體方差估計、非參數(shù)檢驗(單樣本、雙樣本)

統(tǒng)計量(H0:獨立)2032.8258.907/2=.05

列聯(lián)表的獨立性檢驗

【例】如表所示頻數(shù)分布,以95%顯著水平,檢驗ALT異常與肝炎是否有關患者ALT指標肝炎正常合計ALT異常ALT正常620345354246974591合計9656001565對表1所示頻數(shù)分布表,以95%顯著水平,檢驗色覺與性別是否有關。表

1色覺與性別聯(lián)合分布頻數(shù)(fij)

對表1所示頻數(shù)分布表,以95%顯著水平,檢驗色覺與性別是否有關。表

1色覺與性別聯(lián)合分布頻數(shù)(fij)P0.04拒絕原假設,即ALT異常和肝炎相互不獨立患者ALT指標肝炎正常合計ALT異常ALT正常601364373227974591合計9656001565F分布ExcelFDIST(3,10,8)=0.066FINV(0.05,10,8)=3.35CHI分布的比用途:方差差異aF(k-1,n-k)0拒絕H0不能拒絕H0F參數(shù)估計統(tǒng)計量估計參數(shù)置信區(qū)間置信水平(置信度、置信系數(shù))置信下限置信上限置信水平1-α置信區(qū)間置信水平與顯著性水平(1-)%區(qū)間包含了

%的區(qū)間未包含1-aa/2a/2一個總體參數(shù)估計待估參數(shù)均值大樣本Z分布小樣本

Z分布

T分布比例大樣本Z分布方差

大、小樣本兩個總體參數(shù)估計待估參數(shù)均值差

Z分布配對樣本

t分布

t分布比例差獨立大樣本Z分布方差比

獨立大樣本獨立小樣本正態(tài)總體

t分布

Z分布

Z分布單個樣本量的估計樣本量的估計樣本均值與總體均值【例】用某藥治療矽肺患者可增加尿矽的排出量,標準差為89.0mmol/L,取α=0.05,β=0.10,能辨別出尿矽排出量平均增加35.6mmol/L,需觀察多少例矽肺患者(66)?樣本量的估計兩樣本均值【例】為研究某地正常成年男、女末稍血液的紅細胞的差別,已知男性紅細胞均數(shù)為465萬/μL,女性紅細胞均數(shù)為422萬/μL,標準差為52萬/μL,取雙側α=0.05,把握度(1-β)=0.9,問要抽查多少人才能發(fā)現(xiàn)男女間紅細胞的差別(31)?樣本量的估計兩樣本率【例】用舊試劑對肝炎的檢出率為30%,如更換新方法試劑,檢出率必須達到50%才認為有更換價值,問每組各需要多少例患者(單側,103)?樣本量的估計配對樣本(定量)

樣本量的估計配對樣本(定性)

假設檢驗MurielBristolFisher假設檢驗提出原假設和備擇假設什么是原假設?(NullHypothesis)待檢驗的假設,又稱“0假設”,表示為H0什么是備擇假設?(AlternativeHypothesis)與原假設對立的假設,表示為H1確定統(tǒng)計量,基本形式為:假設檢驗什么顯著性水平?是一個概率值原假設為真時,拒絕原假設的概率被稱為抽樣分布的拒絕域表示為(alpha)常用的值有0.01,0.05,0.10由研究者事先確定假設檢驗假設檢驗中的小概率原理什么小概率?在一次試驗中,一個幾乎不可能發(fā)生的事件發(fā)生的概率在一次試驗中小概率事件一旦發(fā)生,我們就有理由拒絕原假設小概率由研究者事先確定假設檢驗假設檢驗中的兩類錯誤(提供推翻原假設的證據(jù),不提供原假設正確與否的證據(jù))第一類錯誤(棄真錯誤)原假設為真時拒絕原假設會產生一系列后果第一類錯誤的概率為被稱為顯著性水平第二類錯誤(取偽錯誤)原假設為假時不拒絕原假設第二類錯誤的概率為(Beta)假設檢驗你不能同時減少兩類錯誤!和的關系就像翹翹板,小就大,大就小兩個總體均值之差的t檢驗

(12、22未知)檢驗具有等方差的兩個總體的均值假定條件兩個樣本是獨立的隨機樣本兩個總體都是正態(tài)分布兩個總體方差未知但相等12=22(?)檢驗統(tǒng)計量其中:兩個總體均值之差的t檢驗

(配對樣本的t

檢驗)檢驗兩個相關總體的均值配對或匹配重復測量(前/后)利用相關樣本可消除項目間的方差假定條件兩個總體都服從正態(tài)分布如果不服從正態(tài)分布,可用正態(tài)分布來近似(n1

30,n230)配對樣本的t

檢驗樣本均值樣本標準差自由度df=nD-1t檢驗-不同情況獨立性-配對性是否考慮方差齊性獨立樣本計算合并方差-配對樣本計算標準差單樣本與配對樣本t檢驗-不同情況獨立樣本t檢驗t檢驗-不同情況配對樣本t檢驗

【例】A、B兩個廠家的ALT試劑盒分別測量10份血清樣本,結果如下:請問取顯著性水平=0.05時,A、B兩個廠家的測量結果是否存在顯著差異廠家12345678910A2245385218964369600870106B2550405518067360590860110t檢驗-舉例解:結果為一組樣本的不同試劑測量結果,配對關系明確設原假設H0:兩種試劑測量結果之間無差異備擇假設H1:兩種試劑測量結果之間有差異方差分析SST=SSE+SSA方差分析檢驗多個總體均值是否相等(樣本是否來自同一總體)通過對各觀察數(shù)據(jù)誤差來源的分析來判斷多個總體均值是否相等變量(分類變量與數(shù)值變量的關系)一個分類變量2個或多個(k個)處理水平或分類一個因變量用于分析完全隨機化試驗設計假設:正、齊、立方差分析每個總體都應服從正態(tài)分布對于因素的每一個水平,其觀察值是來自服從正態(tài)分布總體的簡單隨機樣本各個總體的方差必須相同對于各組觀察數(shù)據(jù),是從具有相同方差的總體中抽取的觀察值是獨立的之間不相關方差分析公式方差分析正態(tài)性:P-P、Q-Q方差齊性:單因素方差分析t檢驗與方差分析2.t檢驗適用于兩個變量均數(shù)間的差異檢驗,多于兩個變量間的均數(shù)比較要用方差分析1.方差分析與成組設計t檢驗的前提條件是相同的,即正態(tài)性和方差齊性3.分析因素間的交互作用、方差齊性檢驗相關與回歸相關關系非線性相關線性相關正相關正相關負相關負相關完全相關不相關相關與回歸不相關負線性相關正線性相關非線性相關完全負線性相關完全正線性相關相關與回歸樣本相關系數(shù)的計算公式或化簡為相關與回歸

r

的取值范圍是[-1,1]|r|=1,為完全相關r=1,為完全正相關r=-1,為完全負正相關

r=0,不存在線性相關關系相關-1r<0,為負相關0<r1,為正相關|r|越趨于1表示關系越密切;|r|越趨于0表示關系越不密切相關與回歸計算檢驗的統(tǒng)計量:檢驗兩個變量之間是否存在線性相關關系等價于對回歸系數(shù)b1的檢驗采用t檢驗檢驗的步驟為提出假設:H0:;H1:0一元線性回歸一元線性回歸平方(差)絕對(差)差回歸方法一元線性回歸普通回歸-Y存在隨機誤差LSD(普通)LSD(加權)回歸-X、Y存在隨機誤差Deming線性回歸的假設條件:立、正、齊(方程式的隨機誤差)一元線性回歸對于只涉及一個自變量的簡單線性回歸模型可表示為

y=b0+b1x+e模型中,y是x的線性函數(shù)(部分)加上誤差項線性部分反映了由于x的變化而引起的y的變化誤差項

是隨機變量反映了除x和y之間的線性關系之外的隨機因素對y的影響是不能由x和y之間的線性關系所解釋的變異性0和1稱為模型的參數(shù)一元線性回歸提出假設

H0:線性關系不顯著計算檢驗統(tǒng)計量F確定顯著性水平,并根據(jù)分子自由度1和分母自由度n-2找出臨界值F作出決策:若FF,拒絕H0;若F<F,接受H0一元線性回歸提出假設H0:b1=0(沒有線性關系)計算檢驗的統(tǒng)計量確定顯著性水平,并進行決策t>t,拒絕H0;t<t,接受H0一元線性回歸估計標準誤差Sy一元線性回歸-LSD斜率、截距一元線性回歸-y預測區(qū)間

預測區(qū)間(個別值)與置信區(qū)間(平均值)包括平均值和個別值一元回歸:線性關系檢驗和回歸系數(shù)檢驗的關系一元線性回歸-y區(qū)間xpyxx預測上限置信上限預測下限置信下限一元線性回歸-LSDxy(xn,yn)(x1,y1)(x2,y2)(xi,yi)}ei=yi-yi^根據(jù)最小二乘法的要求,可得求解各回歸參數(shù)的標準方程如下使因變量的觀察值與估計值之間的離差平方和達到最小來求得

。即一元線性回歸-LSD一元線性回歸-LSD一元線性回歸-顯著性檢驗

一元線性回歸-顯著性檢驗回歸系數(shù)(線性關系)t檢驗,斜率95%置信區(qū)間為(3~5),含義性能評估-校準曲線常用校準結果的擬合方式有:LoB-測定一般情況下,空白樣本的測量結果呈正態(tài)分布呈G分布不呈G分布但部分儀器將陰性信號值自動轉換為零或一個低的陽性濃度或不顯示結果顯著性水平α=β=5%LoB=μ+1.645σ(單尾)Nb(95/100)+0.5考慮基質效應60個數(shù)據(jù)(4~6)LoB-驗證一般針對大樣本量,當樣本量小于1000時,應按照95%的置信下限進行判定呈G分布不呈G分布20個數(shù)據(jù)LoB-應用

LoB-應用不建議使用信號值(數(shù)據(jù)不轉換)的原因(舉例說明):

LoB-應用LOB信號值

0M±2SD多個樣本:目的是不同基質可能會產生信號的干擾LODLoB~4*LoD4~6(60個數(shù)據(jù))確定過程LOD-驗證20個數(shù)據(jù)(可能時這些測量包括來自樣本和不同時間段的變異)LoD的計算,不應按照信號進行處理(代入公式)統(tǒng)計的判定同LoBLoD-應用LoD樣本

0LoB樣本LoDLoDLoDLoD多個不同濃度樣本:目的是評估真實的LoDLoB±1.645SD=LoD-1.645SDLoB±1.645SD<LoD-1.645SDLoB±1.645SD>LoD-1.645SDLOQ40個數(shù)據(jù)(5次試驗)(3~5)LoQ是建立在特定的性能要求之下的,如偏移和不精密度或不確定度等。如果不符合該水平目標值,那么必須進行略高水平的測試。應使用參考物質或類似的物質。LOQ-驗證25個數(shù)據(jù)(無明確樣本數(shù)量)統(tǒng)計的判定同LoB使用最少25次重復是可接受的。每一樣本重復值與該樣本參考值差值和誤差目標值比較。超出誤差目標結果的數(shù)量是該水平方法適合的一個測量。LoB-LoD-LoQLoB:maxLoD:minLoQ:min定量測量結果報告結果≤LoB報告“未檢測到,濃度<LoD”LoB<結果<LoD報告“分析物已檢測到,濃度<LoQ”LoD≤結果<LoQ報告“分析物已檢測到,濃度<LoQ”準確度效能函數(shù)En表達(13528:2005)不準確度表達(現(xiàn)在以偏差形式體現(xiàn),包含在En中)比對試驗試驗方法:100(40)個樣本,測量2次(降低隨機誤差),回歸分析2.繪制散點圖結果散點圖濃度與偏差散點圖1.離群值的檢查(相對&絕對):方法內:極差進行評價(x、y),以4倍均值作為可接受限評價方法-對照方法:逐一進行比較,判定標準同上比對試驗

比對試驗

比對試驗思考?合理建立指標基礎:離群值檢查確定系數(shù)95%置信區(qū)間在此基礎上還應結合技術因素進行判定,在做判斷時,技術因素要放在第一位,不要單憑統(tǒng)計做判定。因此,比對試驗時回歸系數(shù)的要求非常重要。比對試驗離群值檢驗一元回歸分析比對試驗EP9-A3中關于一元直線回歸的方法介紹LSDWLSDeimng比對試驗-定性回收試驗

回收試驗回收試驗的理解:1.不完全是真實反應準確度的指標,但他是建立方法學的基礎2.回收:指的是對已知量值的分析物添加到基質樣本中后,測得所添加分析物的量與添加量的比值誤用:1.標準溶液的誤解(校準物)2.統(tǒng)計方面的考慮回收試驗

濃度吸光度零點00.1高值1000.5曲線Y=0.004X+0.1樣本0.2251:1添加0.3562.5回收率100%高值1000曲線Y=0.0004X+0.1樣本0.22501:1添加0.35625回收率100%結論:用校準物質做回收試驗的標準溶液,理論上是一個恒等式(不用做試驗就能證明)精密度&重復性主要是用于評價測量結果之間的一致性程度的指標,通常用表達數(shù)據(jù)離散程度的標準偏差來表示,當測量結果的離散性和量值具有相關性時,用表示數(shù)據(jù)離散程度和集中程度統(tǒng)計量的比值表示注意:重復性(離散系數(shù))需同某一濃度或濃度范圍共同使用時才具有合理性例如,ALT試劑的CV<5%,如果不注明性能評估時的濃度或其范圍值,就不能真實的反應試劑性能特征統(tǒng)計量離散系數(shù)表示差異時,應明確其量值水平

均勻性單因素方差分析進行回歸(線性)顯著性檢驗t檢驗進行回歸系數(shù)(斜率)顯著性檢驗F值進行均勻性檢驗:分析內精密度足以檢出組間差異

假設:S1沒有隨機因素、S2為隨機因素均勻性項目\次數(shù)123174.074.374.6273.974.174.6373.774.574.0473.574.174.2573.673.974.7673.873.974.4773.874.374.5874.074.374.4973.573.974.21073.774.174.41173.574.174.51273.473.674.31373.473.874.71474.074.274.11573.474.174.01673.873.974.21774.274.274.51874.074.174.61973.973.774.72073.774.274.2對20瓶ALT校準物進行均勻性檢驗,每瓶測量3次,測量結果如下:均勻性單因素方差分析進行回歸(線性)顯著性檢驗t檢驗進行回歸系數(shù)(斜率)顯著性檢驗均勻性瓶間均勻性檢驗線性線性回歸相關術語相關系數(shù)回歸系數(shù)確定系數(shù)殘差(線性偏差)回歸標準誤線性線性?評價指標?系數(shù)和非線性的誤差目標曲線回歸談線性:存在兩個系數(shù)誤差:線性和回歸樣本:等距原則線性

相關系數(shù)只是表示變量之間變化趨勢的指標,其代表的是觀測值,不代表可靠程度,如下圖因此,確定系數(shù)越接近1(沒有其他指標)時,不能聲稱線性良好線性A、B兩個制造商的ALP試劑,測量已知比例樣本的結果制造商AB12510249193743049939512450線性A、B兩個制造商的ALP試劑,測量已知比例樣本的結果線性幾點思考1.在(0~1000)范圍內,線性偏差在±10%范圍內?/濃度點2.多點定標方:使用定標液進行相關系數(shù)的測量,在統(tǒng)計上不代表任何意義(亦為恒等式)3.選擇曲線擬合是因為量值與信號值不是直接呈線性,目的也是使得測量值無限接近真實值(相關系數(shù)非線性相關系數(shù))4.只規(guī)定相關系數(shù)的線性要求不具有實際意義(擬合優(yōu)度)5.不同擬合會產生截然不同的結果,主要考慮側重于哪方面考慮線性兩種最小二乘法的線性回歸線性回歸(SLOPE、INTERCEPT、CORREL):1.絕對偏差最?。↙SD)-簡單的線性擬合缺點,容易受最大值的影響。如線性范圍較寬時,高值的貢獻占比重較大,在高端相對偏差小、絕對偏差大,在低端相對偏差大原因:離均差平方和原理2.相對偏差較?。╓LS)-加權線性回歸公式如下:線性-WLS兩種最小二乘法的線性回歸

線性兩種最小二乘法的線性回歸線性線性回歸xiyi普通回歸-最小二乘法權重回歸-最小二乘法濃度響應值預期值相對偏差預期值相對偏差10.219574110.14110.0%2032.893.9%20.550816651.4430.9%4752.54-6.5%31.0962810886.9413.1%9285.29-3.6%42.02000519357.94-3.2%18350.79-8.3%55.04458144770.930.4%45547.292.2%610.09345287125.91-6.8%90874.79-2.8%720.0171291171835.880.3%181529.786.0%840.0340000341255.820.4%362839.776.7%截距2415.942截距219.791斜率8470.997斜率9065.499r1.000r0.998線性測量范圍下限(LMR)指在規(guī)定條件下的最低水平,該特定條件包括方法聲稱的所有特征,包括偏倚和不精密度,不確定度,以及其他特征。線性范圍下限(LLR)指方法的響應值與真實濃度有線性關系的最低濃度。也要求附有一個關于線性任何聲明的非線性誤差目標。線性?測量范圍下限(LMR)從其定義看,類似于定量限(對應關系明確)線性范圍下限(LLR)除了規(guī)定明確的線性要求外,還要求有一個非線性誤差目標:真實濃度

<LoD時報告<LoQ,只有≥LoQ時,才報告測量結果,因此可以得到LLR≥LoQ兩條直線斜率差異的檢驗直線平行的檢驗1.計算每條線的回歸標準誤2.計算斜率差值的標準誤3.計算斜率差值與標準誤的比4.查t(0.05,n1-2+n2-2)

穩(wěn)定性統(tǒng)計處理趨勢分析:對分類變量和數(shù)值變量進行趨勢分析P≥0.05時,認為趨勢不顯著P<0.05時,一元回歸確定95%的預測區(qū)間,結合區(qū)間判定穩(wěn)定性單因素方差分析進行回歸(線性)顯著性檢驗t檢驗進行回歸系數(shù)(斜率)顯著性檢驗ALP12個月穩(wěn)定性試驗結果如下:月第1次第2次第3次第4次第5次第6次0175.5176.2175.7175.5175.5173.13176.7175.8174.8174.5175.2176.06175.1175.9175.2176.5176.3175.49175.0176.5176.8176.1176.6176.912175.0174.7175.9176.4176.5175.2穩(wěn)定性(單因素方差分析)回歸(線性)顯著性檢驗(t檢驗)回歸系數(shù)(斜率)顯著性檢驗穩(wěn)定性關于穩(wěn)定性的思考1.穩(wěn)定不穩(wěn)定應建立在趨勢分析的基礎上;從統(tǒng)計考慮,允許10%的量值變化,這種方式是不穩(wěn)定的表現(xiàn)2.加速穩(wěn)定性可以被接受作為確立產品說明的最初失效期的基礎,對于有些試劑,可能不適宜(組分復雜)3.加速穩(wěn)定性不宜用于推斷效期穩(wěn)定性4.穩(wěn)定性和準確度是兩種特性,不要用準確度指標評價穩(wěn)定性基質效應不考慮權重的LSD-TP互換性試驗結果如下:測量結果(單位:g/L)測量方法對照方法(參考方法)評估方法(常規(guī)方法)臨床樣本123平均值123平均值#159.559.558.659.260.359.960.460.2#250.950.850.350.749.048.848.848.9#371.471.971.271.567.767.167.867.5#465.466.165.765.863.062.863.563.1#567.067.267.367.265.565.666.365.8#653.253.253.053.150.651.151.251.0#773.073.173.273.171.271.271.771.3#857.357.757.757.657.657.557.757.6#973.073.173.073.172.672.673.172.8#1071.371.871.071.469.168.568.768.8#1167.968.268.268.166.466.466.766.5#1251.451.451.451.449.249.149.249.1#1373.974.674.174.272.672.973.072.9#1480.880.580.580.673.874.174.674.2#1556.957.157.257.055.255.555.855.5#1665.064.864.564.862.362.362.462.3#1759.459.159.259.256.456.856.856.7#1874.274.974.474.570.169.770.570.1#1977.077.777.377.372.773.073.373.0#2086.987.487.187.183.883.884.183.9基質效應統(tǒng)計處理確認是否為線性關系,并進行2次方回歸系數(shù)的檢驗進行一元回歸,確定95%的置信區(qū)間樣本結果與區(qū)間比較,進行結果判定用t檢驗進行二次回歸方程系數(shù)與0的顯著性檢驗,二次項系數(shù)與0沒有顯著性差異使用線性回歸進行,單位:g/L項目對照方法(參考方法)評估方法(常規(guī)方法)123平均值123平均值理論值質控物質61.0261.0760.9161.062.3462.4662.2962.459.2標準物質58.5958.7558.6958.754.2553.7953.9554.057.195%的預測區(qū)間單位:g/L項目下限上限質控物質56.062.4標準物質53.860.3結論標準物質無基質效應基質效應思考簡單一元回歸,未考慮對照方法存在隨機誤差大部分的測量沒有可選擇的參考方法作為對照方法互換性考慮X、Y都存在隨機誤差的一元回歸的應用系統(tǒng)A和系統(tǒng)B上對多個RM進行互換性研究A1A2A3B1B2B3Sample126.526.827.432.128.330.5Sample212.313.814.715.217.516.5Sample314.913.015.918.119.613.9Sample438.235.336.041.136.637.5Sample510.65.810.012.510.214.5Sample621.425.123.727.929.422.5Sample721.825.125.728.427.626.5Sample813.211.56.511.213.614.5Sample915.014.618.118.020.224.2Sample1019.024.122.928.428.426.3Sample1137.137.041.439.335.539.2Sample1235.633.438.739.335.538.3Sample1314.614.721.722.219.321.8Sample147.810.28.78.09.715.0Sample156.111.29.710.38.712.5Sample1611.313.57.311.411.816.4Sample1722.922.318.427.326.022.6Sample1848.943.146.044.446.450.5Sample1910.010.812.511.610.417.6Sample2018.114.418.220.318.824.8Sample219.513.410.410.913.816.7Sample2215.113.518.817.416.922.7Sample2343.540.939.241.345.344.5Sample2431.531.736.733.633.439.5Sample2510.511.613.613.913.418.6互換性Deming回歸方程(斜率、截距)95%置信區(qū)間回歸標準誤預測值及其殘差結果判定回歸特點:對隨機誤差進行了考慮互換性互換性A1A2A3B1B2B3RM113.412.81114.313.914.7RM223.122.326.925.126.728.9RM337.933.434.938.236.036.8RM444.939.342.443.639.142.4RM514.915.815.218.217.421.4RM620.818.423.822.422.615.0RM717.515.518.019.819.024.5

A平均值

相對殘差B平均值預測值預測值標準差RM112.4-1.0514.315.62.0RM224.10.0626.926.82.0RM335.4-0.5837.037.72.0RM442.2-2.0941.744.22.1RM515.30.5219.018.42.0RM621.0-3.1720.023.82.0RM717.00.9121.120.02.0回歸標準誤1.215回歸方程:Y=0.962X+3.650Deming回歸結果互換性95%預測區(qū)間不確定度A類評定:測量結果用統(tǒng)計的方法進行的分類的評定標準、相對、合成、擴展不確定度傳播率不確定度不確定度解釋(概率):(x-U,x+U)以“95%的概率”套住真值不應說真值以95%的概率落入該區(qū)間,真值不變(僅有一個),每n次測量構造出一個區(qū)間(結果和不確定度),測量了m組(每組測n次),共得到m個區(qū)間,當m充分大時,大約有95%m個區(qū)間套住了真值。U和置信水平的關系不確定度不確定度不要理解為不確定度有兩類不確定度評定方法介紹理想的不確定度評定表設計GrubbsCochran檢驗(6379.2)

公式的來源舉例

公式的應用Norms、t、F、Binom、Chisq、Poisson、HypgeomDistribution(Xdist)Inverse(Xinv)Steyx、Slope、Intercept、Correl、ForecastSS(xx)=Devsq、SS(xy)=Var*nF、t檢驗建議使用軟件計算試驗設計統(tǒng)計是對數(shù)據(jù)的統(tǒng)計,數(shù)據(jù)主要來源于試驗,因此試驗的設計非常重要。好的設計事半功倍,差的設計事倍功半。例,2.5試驗設計單因素優(yōu)化設計正交試驗設計均勻設計穩(wěn)健化設計特點:均勻分散性、整齊可比性保證試驗結果可靠,應考慮交互作用正交表與正交設計

正交表的一般記法為Ln(ap),其中p是表的列數(shù),n是表的行數(shù),表中的數(shù)字都由1到a這a個整數(shù)構成。字母L表示正交表,實際上是引用了拉丁方(Latin)的名稱。

常見的正交表有L4(23)、L8(27)、L16(215)、

L9(34)、

L27(313)、L16(45)、L25(56),以及

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論