版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、多水平模型簡(jiǎn)介公共衛(wèi)生與家庭醫(yī)學(xué)學(xué)院公共衛(wèi)生與家庭醫(yī)學(xué)學(xué)院 郭秀花郭秀花2011.4.25 傳統(tǒng)的統(tǒng)計(jì)學(xué)分析是建立在個(gè)體測(cè)量值相傳統(tǒng)的統(tǒng)計(jì)學(xué)分析是建立在個(gè)體測(cè)量值相互獨(dú)立的假設(shè)上。如:多元回歸模型的估互獨(dú)立的假設(shè)上。如:多元回歸模型的估計(jì)方法是建立在個(gè)體測(cè)量值要相互獨(dú)立,計(jì)方法是建立在個(gè)體測(cè)量值要相互獨(dú)立,當(dāng)假設(shè)不成立時(shí),回歸模型中的各參數(shù)估當(dāng)假設(shè)不成立時(shí),回歸模型中的各參數(shù)估計(jì)值的有效性和統(tǒng)計(jì)特征均會(huì)受到影響,計(jì)值的有效性和統(tǒng)計(jì)特征均會(huì)受到影響,從而最終的統(tǒng)計(jì)推斷結(jié)論將可能偏倚。估從而最終的統(tǒng)計(jì)推斷結(jié)論將可能偏倚。估計(jì)值的標(biāo)準(zhǔn)誤會(huì)有偏差。計(jì)值的標(biāo)準(zhǔn)誤會(huì)有偏差。 。多元回歸數(shù)據(jù)結(jié)構(gòu)多元回歸數(shù)據(jù)
2、結(jié)構(gòu) Data and ExamplesChildren within families: Children with same biological parents tend to be more alike than children chosen at random from the general population. They are more alike because Genetics Environment Both實(shí)驗(yàn)研究:如致畸試驗(yàn) 層次結(jié)構(gòu):層次結(jié)構(gòu):孕鼠1子鼠m子鼠1 子鼠2。孕鼠2子鼠m子鼠1 子鼠2。子鼠m子鼠1 子鼠2。孕鼠p窩別效應(yīng)窩別效應(yīng)Observatio
3、nal Studies Multi-stage sampling is cost effective.1. Take random sample from population (e.g. schools).2. Take random sample from sub-population (e.g. classes).3. Take random sample from sub-population (e.g. students). 某省調(diào)查其農(nóng)村居民的衛(wèi)生服務(wù)某省調(diào)查其農(nóng)村居民的衛(wèi)生服務(wù) 隨機(jī)抽取隨機(jī)抽取30個(gè)鄉(xiāng)鎮(zhèn),每個(gè)鄉(xiāng)鎮(zhèn)分別抽取個(gè)鄉(xiāng)鎮(zhèn),每個(gè)鄉(xiāng)鎮(zhèn)分別抽取2個(gè)個(gè)行政村,每個(gè)村再隨機(jī)抽取行政
4、村,每個(gè)村再隨機(jī)抽取33戶(家庭),對(duì)戶(家庭),對(duì)每個(gè)家庭前半年內(nèi)的常住人口進(jìn)行問(wèn)卷調(diào)查。每個(gè)家庭前半年內(nèi)的常住人口進(jìn)行問(wèn)卷調(diào)查。 調(diào)查研究 具有明顯的層次結(jié)構(gòu)(鄉(xiāng)鎮(zhèn)具有明顯的層次結(jié)構(gòu)(鄉(xiāng)鎮(zhèn)行政村行政村戶戶個(gè)體);個(gè)體); 在經(jīng)濟(jì)水平、生活方式、生活習(xí)慣上都在經(jīng)濟(jì)水平、生活方式、生活習(xí)慣上都具有某種程度上的相似性或聚集性;個(gè)具有某種程度上的相似性或聚集性;個(gè)體的數(shù)據(jù)是非獨(dú)立的體的數(shù)據(jù)是非獨(dú)立的 。Examples of HierarchiesLongitudinal DataSame individuals measured on multiple occasions. Strong hie
5、rarchies. Much more variations between individuals than between occasions within individuals.A Hypothetical Example - Two measurement occasions 多水平模型(多水平模型(Multilevel ModelsMultilevel Models)又稱隨)又稱隨機(jī)效應(yīng)模型(機(jī)效應(yīng)模型(Random Effect ModelsRandom Effect Models),它是在),它是在二十世紀(jì)八十年代,由英美教育統(tǒng)計(jì)學(xué)家基于方二十世紀(jì)八十年代,由英美教育統(tǒng)計(jì)學(xué)家基
6、于方差成分分析而提出的統(tǒng)計(jì)模型。差成分分析而提出的統(tǒng)計(jì)模型。 多水平模型理論是國(guó)外近些年發(fā)展起來(lái)的處多水平模型理論是國(guó)外近些年發(fā)展起來(lái)的處理系統(tǒng)結(jié)構(gòu)數(shù)據(jù)的多元統(tǒng)計(jì)方法,是將理系統(tǒng)結(jié)構(gòu)數(shù)據(jù)的多元統(tǒng)計(jì)方法,是將型方差型方差分析理論與多元統(tǒng)計(jì)分析相結(jié)合的新技術(shù)。分析理論與多元統(tǒng)計(jì)分析相結(jié)合的新技術(shù)。多水平統(tǒng)計(jì)模型概念多水平統(tǒng)計(jì)模型概念Definition of Multilevel AnalysisSnijders & Bosker (1999):Multilevel analysis is a methodology forthe analysis of data with complex
7、patterns of variability, with a focus onnested sources of variability.多水平模型的不同稱謂:多水平模型的不同稱謂: 層次線性模型(層次線性模型(hierarchical linear model) 混合效應(yīng)模型(混合效應(yīng)模型(mixed-effects model) 混合模型(混合模型(mixed model) 這些模型或許在算法或應(yīng)用領(lǐng)域的普及這些模型或許在算法或應(yīng)用領(lǐng)域的普及程度上有差別,但是都是處理具有層次結(jié)構(gòu)程度上有差別,但是都是處理具有層次結(jié)構(gòu)的數(shù)據(jù)或非獨(dú)立數(shù)據(jù)的。的數(shù)據(jù)或非獨(dú)立數(shù)據(jù)的。常規(guī)數(shù)據(jù)的特征常規(guī)數(shù)據(jù)的特征
8、: :相互獨(dú)立相互獨(dú)立,等方差等方差由由y yi i構(gòu)成的觀測(cè)向量服從正態(tài)分布構(gòu)成的觀測(cè)向量服從正態(tài)分布具有這種結(jié)構(gòu)的數(shù)據(jù)叫獨(dú)立結(jié)構(gòu)數(shù)據(jù)具有這種結(jié)構(gòu)的數(shù)據(jù)叫獨(dú)立結(jié)構(gòu)數(shù)據(jù) 當(dāng)應(yīng)變量的協(xié)方差陣不滿足對(duì)稱條件(當(dāng)應(yīng)變量的協(xié)方差陣不滿足對(duì)稱條件(2 2 )時(shí))時(shí), ,大多為系統(tǒng)結(jié)構(gòu)數(shù)據(jù)(大多為系統(tǒng)結(jié)構(gòu)數(shù)據(jù)(hierarchical structure data)。)。 多水平統(tǒng)計(jì)模型用于研究具有層次結(jié)構(gòu)或嵌套式多水平統(tǒng)計(jì)模型用于研究具有層次結(jié)構(gòu)或嵌套式結(jié)構(gòu)的數(shù)據(jù)結(jié)構(gòu)的數(shù)據(jù), ,此類數(shù)據(jù)的主要特征是反應(yīng)變量的此類數(shù)據(jù)的主要特征是反應(yīng)變量的分布在個(gè)體間不具備獨(dú)立性分布在個(gè)體間不具備獨(dú)立性, ,但存在某些范
9、圍內(nèi)但存在某些范圍內(nèi)的聚集性的聚集性, , 如分層抽樣或整群抽樣的數(shù)據(jù)。如分層抽樣或整群抽樣的數(shù)據(jù)。多水平模型主要種類多水平模型主要種類 重復(fù)測(cè)量資料的多水平模型重復(fù)測(cè)量資料的多水平模型 二分類資料的多水平模型二分類資料的多水平模型 PoissonPoisson分布資料的多水平模型分布資料的多水平模型 多水平多水平MetaMeta分析模型分析模型 多水平生存時(shí)間的統(tǒng)計(jì)模型多水平生存時(shí)間的統(tǒng)計(jì)模型 多元重復(fù)測(cè)量資料的多水平模型實(shí)例新藥臨床試驗(yàn)資料數(shù)據(jù)庫(kù)變量編碼新藥臨床試驗(yàn)資料數(shù)據(jù)庫(kù)變量編碼 指標(biāo)變量變量取值醫(yī)院編號(hào)hosp115患者編號(hào)no1456觀察時(shí)間time13周組別group試驗(yàn)組1,對(duì)
10、照組0患者年齡age1875歲患者性別gender女性0,男性1療前ESS評(píng)分ess04080 (評(píng)分高病情輕)療前ADL評(píng)分adl0095 (評(píng)分高病情輕)療后ESS評(píng)分ess0100療后ADL評(píng)分adl0100新藥臨床試驗(yàn)原始資料格式新藥臨床試驗(yàn)原始資料格式醫(yī)院編號(hào)患者編號(hào)組別 年齡 性別療前療后1周療后2周療后3周ESS0 ADL0 ESS1 ADL1 ESS2 ADL2 ESS3 ADL311160069 50 73 50 86 90 85 10012043176 75 82 75 84 100 90 10013161140 30 42 35 55 35 72 4514171178 8
11、0 90 95 92 100 93 10015071172 75 75 75 82 82 16167180 80 93 85 100 95 二分類多水平模型實(shí)例二分類多水平模型實(shí)例 某省進(jìn)行了農(nóng)村貧困居民的家庭衛(wèi)生服務(wù)調(diào)查。先隨機(jī)抽取鄉(xiāng)鎮(zhèn),每個(gè)鄉(xiāng)鎮(zhèn)分別抽取2個(gè)行政村,每個(gè)村再隨機(jī)抽取一定數(shù)量的家庭進(jìn)行調(diào)查。共調(diào)查了30個(gè)鄉(xiāng)鎮(zhèn),832戶貧困家庭戶,共計(jì)2369名15歲及以上的居民。 現(xiàn)擬探討該省農(nóng)村貧困居民衛(wèi)生服務(wù)需要的影響因素。 以兩周是否患病作為應(yīng)變量。結(jié)以兩周是否患病作為應(yīng)變量。結(jié)合資料的層次結(jié)構(gòu)特點(diǎn),采用二分合資料的層次結(jié)構(gòu)特點(diǎn),采用二分類多水平類多水平logistic回歸模型探討農(nóng)回歸
12、模型探討農(nóng)村貧困居民兩周是否患病的影響因村貧困居民兩周是否患病的影響因素。素。 變量賦值表(1)變量名稱定義及賦值應(yīng)變量?jī)芍芑疾?uncomfor0 否 1 是人口學(xué)特征性別 gender0 男 1 女民族 ethnic0 漢族 1 其他年齡(歲) agegroup0 15 1 45 2 65 婚姻狀況 marriage0 未婚 1 已婚 2 離婚 3 喪偶文化程度 edu0 文盲半文盲 1 小學(xué) 2 初中及以上職業(yè) occupy0 非農(nóng)業(yè)勞動(dòng)者 1 農(nóng)業(yè)勞動(dòng)者 2 學(xué)生 3 離退休 4 無(wú)業(yè)、失業(yè)、半失業(yè)者醫(yī)療保險(xiǎn) insure0 無(wú) 1 有變量賦值表(2)健康相關(guān)因素健康相關(guān)因素自身健康狀
13、況評(píng)價(jià)自身健康狀況評(píng)價(jià) self_assess hea_stat0 好好 1 中中 2 差差吸煙吸煙 smoke0 否否 1 吸吸飲酒飲酒 drink0 否、少量否、少量 1 經(jīng)常飲經(jīng)常飲家庭一般情況家庭一般情況家庭飲水類型家庭飲水類型 water0 自來(lái)水自來(lái)水 1 非自來(lái)水非自來(lái)水家庭戶廁類型家庭戶廁類型 bathroom0 衛(wèi)生廁所衛(wèi)生廁所 1 非衛(wèi)生廁所非衛(wèi)生廁所易得的最快方式去最近醫(yī)療點(diǎn)易得的最快方式去最近醫(yī)療點(diǎn)時(shí)間時(shí)間(分鐘分鐘) tim_hosp年人均收入年人均收入(元元) income0 637 1 6381000變量賦值表(變量賦值表(3)鄉(xiāng)鎮(zhèn)特征鄉(xiāng)鎮(zhèn)特征鄉(xiāng)鎮(zhèn)地理地貌鄉(xiāng)鎮(zhèn)地理
14、地貌 geography0 山區(qū)山區(qū) 1 非山區(qū)非山區(qū)個(gè)體水平個(gè)體水平id戶水平戶水平family鄉(xiāng)鎮(zhèn)水平鄉(xiāng)鎮(zhèn)水平rural家庭人均居住面積和鄉(xiāng)鎮(zhèn)人均可耕地面積以連續(xù)性變量形式中心家庭人均居住面積和鄉(xiāng)鎮(zhèn)人均可耕地面積以連續(xù)性變量形式中心化之后納入模型;化之后納入模型;無(wú)序多分類變量婚姻狀況和職業(yè)以啞元形式納入;無(wú)序多分類變量婚姻狀況和職業(yè)以啞元形式納入;有序多分類變量年齡、文化程度和自身健康狀況評(píng)價(jià),是以分組有序多分類變量年齡、文化程度和自身健康狀況評(píng)價(jià),是以分組線性變量或啞元的形式納入,依據(jù)似然比檢驗(yàn)結(jié)果加以判斷。線性變量或啞元的形式納入,依據(jù)似然比檢驗(yàn)結(jié)果加以判斷。 啞變量名定義啞變量名定
15、義 age1:45,age2:65 ; marriage1:已婚,marriage2:離婚, marriage3:?jiǎn)逝迹?education1:小學(xué),education2:初中及以上; occupation1:農(nóng)業(yè)勞動(dòng)者,occupation2:學(xué)生, occupation3:離退休 occupation4:無(wú)業(yè)、失業(yè)、半失業(yè) 多水平多水平Poisson回歸模型實(shí)例回歸模型實(shí)例Poisson回歸(Poisson regression) 單位時(shí)間、面積、空間內(nèi)某事件發(fā)生數(shù)(count)的影響因素的分析 對(duì)于以人群為基礎(chǔ)的稀有疾病發(fā)病率、衛(wèi)生事件資料的分析例 收集英格蘭和威爾士收集英格蘭和威爾士1
16、5個(gè)地區(qū)個(gè)地區(qū)1959至至1991年按年齡、性別分組的逐年人口年按年齡、性別分組的逐年人口數(shù)和肺癌死亡人數(shù)。數(shù)和肺癌死亡人數(shù)。 肺癌死亡資料數(shù)據(jù)庫(kù)變量肺癌死亡資料數(shù)據(jù)庫(kù)變量編碼編碼指標(biāo)變量變量取值年份Year year=年份年份1959-1991地區(qū)region115年齡ageage=0,年齡,年齡50歲;歲;age=1,年齡,年齡50歲歲性別gendergender=0,女性;,女性; gender=1,男性,男性年觀察人口數(shù) population年肺癌死亡數(shù)death資料特點(diǎn) 兩水平層次結(jié)構(gòu) 地區(qū)(水平2單位) 15 各地區(qū)內(nèi)逐年重復(fù)觀察(水平1單位) 1980 資料按性別、年齡分組 反應(yīng)
17、變量是肺癌死亡人數(shù) 定性反應(yīng)變量的多水平模型定性反應(yīng)變量的多水平模型重點(diǎn):二分類反應(yīng)變量的兩水平模型重點(diǎn):二分類反應(yīng)變量的兩水平模型 某省調(diào)查其農(nóng)村居民的衛(wèi)生服務(wù)某省調(diào)查其農(nóng)村居民的衛(wèi)生服務(wù) 隨機(jī)抽取30個(gè)鄉(xiāng)鎮(zhèn),每個(gè)鄉(xiāng)鎮(zhèn)分別抽取2個(gè)行政村,每個(gè)村再隨機(jī)抽取33戶(家庭),對(duì)每個(gè)家庭前半年內(nèi)的常住人口進(jìn)行問(wèn)卷調(diào)查。 具有明顯的層次結(jié)構(gòu)層次結(jié)構(gòu)(鄉(xiāng)鎮(zhèn) 行政村 戶 個(gè)體) ; 在經(jīng)濟(jì)水平、生活方式、生活習(xí)慣上都具有某種程度上的相似性或聚集性 ;個(gè)體的數(shù)據(jù)是非獨(dú)非獨(dú)立立的 。固定效應(yīng)和隨機(jī)效應(yīng)固定效應(yīng)和隨機(jī)效應(yīng) 固定效應(yīng):某研究中有多個(gè)不同的處理因素,固定效應(yīng):某研究中有多個(gè)不同的處理因素,若研究者感
18、興趣的各種處理因素都設(shè)計(jì)在研若研究者感興趣的各種處理因素都設(shè)計(jì)在研究當(dāng)中,則認(rèn)為這一因素具有固定效應(yīng)。究當(dāng)中,則認(rèn)為這一因素具有固定效應(yīng)。 隨機(jī)效應(yīng):若處理包含的各個(gè)組別是從更大隨機(jī)效應(yīng):若處理包含的各個(gè)組別是從更大的總體中得到的隨機(jī)樣本,則認(rèn)為該處理因的總體中得到的隨機(jī)樣本,則認(rèn)為該處理因素具有隨機(jī)效應(yīng)。素具有隨機(jī)效應(yīng)。二分類反應(yīng)變量?jī)伤侥P投诸惙磻?yīng)變量?jī)伤侥P?優(yōu)勢(shì)優(yōu)勢(shì) 處理具有層次結(jié)構(gòu)特征的數(shù)據(jù)資料,可將處理具有層次結(jié)構(gòu)特征的數(shù)據(jù)資料,可將傳統(tǒng)模型中的隨機(jī)誤差項(xiàng)分解到與數(shù)據(jù)層次結(jié)傳統(tǒng)模型中的隨機(jī)誤差項(xiàng)分解到與數(shù)據(jù)層次結(jié)構(gòu)相應(yīng)的水平上,使得個(gè)體的隨機(jī)誤差更純構(gòu)相應(yīng)的水平上,使得個(gè)體的
19、隨機(jī)誤差更純 。普通Logistic回歸模型l 令:令: y=1 發(fā)病(陽(yáng)性、死亡、治愈等)發(fā)?。?yáng)性、死亡、治愈等)l y=0 未發(fā)病(陰性、生存、未治愈等)未發(fā)病(陰性、生存、未治愈等)l 將發(fā)病的概率記為將發(fā)病的概率記為P,它與自變量,它與自變量x1, x2,xp之之間的間的Logistic回歸模型為:回歸模型為:l可知,不發(fā)病的概率為:可知,不發(fā)病的概率為:l )exp(1)exp(110110ppppXXXXp )exp(111110ppXXp )1/(ln)(logpppitppXXpLogit 110)(兩水平logit模型 001logit()()ijjijPux000jju0
20、20(0,)()(1)/juijijijijuNVar Pn, 為處理因素的效應(yīng)參數(shù),又稱固定效應(yīng)為處理因素的效應(yīng)參數(shù),又稱固定效應(yīng)(fixed effectfixed effect)參數(shù))參數(shù) 為水平為水平2 2單位的單位的logitlogit均值均值 與總均值與總均值 之差,又稱為隨機(jī)效應(yīng)(之差,又稱為隨機(jī)效應(yīng)(random effectrandom effect)或高水平的殘差?;蚋咚降臍埐?。10 ju0 j0 的 方 差的 方 差 又 稱 為 隨 機(jī) 參 數(shù) (又 稱 為 隨 機(jī) 參 數(shù) ( r a n d o m r a n d o m coefficientcoefficient
21、),反映了高水平單位間的比數(shù)),反映了高水平單位間的比數(shù)( (率率) )的差別。的差別。 越大說(shuō)明數(shù)據(jù)在高水平單位內(nèi)的聚集性越強(qiáng)。越大說(shuō)明數(shù)據(jù)在高水平單位內(nèi)的聚集性越強(qiáng)。 為為0 0時(shí),該模型演變?yōu)橐话愕臅r(shí),該模型演變?yōu)橐话愕膌ogisticlogistic回歸?;貧w模型。型。0 ju20u20u20u判斷是否存在高水平效應(yīng)判斷是否存在高水平效應(yīng) 密切結(jié)合專業(yè)知識(shí)和具體情況進(jìn)行判斷密切結(jié)合專業(yè)知識(shí)和具體情況進(jìn)行判斷 對(duì)隨機(jī)參數(shù)對(duì)隨機(jī)參數(shù) 的估計(jì)值做檢驗(yàn)的估計(jì)值做檢驗(yàn)02u例:探討高血壓的影響因素例:探討高血壓的影響因素 在全市共抽取在全市共抽取159個(gè)社區(qū)(個(gè)社區(qū)(53個(gè)生活社區(qū)和個(gè)生活社區(qū)和
22、106個(gè)功能社區(qū))作為調(diào)查社區(qū),每個(gè)社區(qū)個(gè)功能社區(qū))作為調(diào)查社區(qū),每個(gè)社區(qū)抽取抽取100人左右,共抽取人左右,共抽取16000例社區(qū)常住例社區(qū)常住居民作為調(diào)查對(duì)象。居民作為調(diào)查對(duì)象。 分別調(diào)查其性別、年齡、文化程度、職業(yè)、分別調(diào)查其性別、年齡、文化程度、職業(yè)、吸煙、飲酒、體育鍛煉及飲食情況等。吸煙、飲酒、體育鍛煉及飲食情況等。由于該資料具有明顯的層次結(jié)構(gòu),每個(gè)由于該資料具有明顯的層次結(jié)構(gòu),每個(gè)群體在經(jīng)濟(jì)水平、生活方式、飲食習(xí)慣上都群體在經(jīng)濟(jì)水平、生活方式、飲食習(xí)慣上都具有某種程度上的相似性或聚集性,每個(gè)個(gè)具有某種程度上的相似性或聚集性,每個(gè)個(gè)體的數(shù)據(jù)是非獨(dú)立的,因此我們選用社區(qū)和體的數(shù)據(jù)是非獨(dú)
23、立的,因此我們選用社區(qū)和居民構(gòu)成兩個(gè)水平,居民是基本水平,即水居民構(gòu)成兩個(gè)水平,居民是基本水平,即水平平1單位,社區(qū)是水平單位,社區(qū)是水平2單位,來(lái)擬合兩水平模單位,來(lái)擬合兩水平模型。型。 以調(diào)查對(duì)象是否患有高血壓為應(yīng)變量,將可能影以調(diào)查對(duì)象是否患有高血壓為應(yīng)變量,將可能影響血壓的居民個(gè)人特征參量的若干因素作為自變響血壓的居民個(gè)人特征參量的若干因素作為自變量,采用二水平量,采用二水平logistic模型探討對(duì)血壓可能具有模型探討對(duì)血壓可能具有影響作用的因素以及因素作用的大小。影響作用的因素以及因素作用的大小。 資料的統(tǒng)計(jì)分析過(guò)程均在資料的統(tǒng)計(jì)分析過(guò)程均在SAS9.0SAS9.0中完成,兩水平中
24、完成,兩水平模型采用模型采用SAS MIXED COVTESTSAS MIXED COVTEST過(guò)程進(jìn)行擬合。變量過(guò)程進(jìn)行擬合。變量的賦值方法見(jiàn)表的賦值方法見(jiàn)表1 1。 logisticlogistic模型的結(jié)果中得到代表居民差異的常數(shù)模型的結(jié)果中得到代表居民差異的常數(shù)項(xiàng)估計(jì)值為項(xiàng)估計(jì)值為0.32480.3248,P0.0001P0.0001,說(shuō)明居民的差異,說(shuō)明居民的差異在社區(qū)水平上的確存在聚集性,其層次結(jié)構(gòu)不能在社區(qū)水平上的確存在聚集性,其層次結(jié)構(gòu)不能忽 略 , 故 進(jìn) 一 步 引 入 解 釋 變 量 擬 合 兩 水 平忽 略 , 故 進(jìn) 一 步 引 入 解 釋 變 量 擬 合 兩 水 平
25、logisticlogistic模型。模型。 由表由表2 2可知,影響血壓組分異常的主要因素包括:可知,影響血壓組分異常的主要因素包括:性別、年齡、文化程度、職業(yè)、吸煙、飲酒、中性別、年齡、文化程度、職業(yè)、吸煙、飲酒、中心型肥胖、零食、食用油攝入、食鹽攝入。心型肥胖、零食、食用油攝入、食鹽攝入。 在控制其他因素不變的情況下,女性患病率低于在控制其他因素不變的情況下,女性患病率低于男性。年齡在男性。年齡在40405959歲組和歲組和6060歲及以上組患病率歲及以上組患病率均高于均高于18183939歲人群。文化程度為初中、高中或歲人群。文化程度為初中、高中或中專、大專及大專以上的患病率均低于小學(xué)
26、及小中專、大專及大專以上的患病率均低于小學(xué)及小學(xué)以下者。農(nóng)民、居民的患病率均高于工人、商學(xué)以下者。農(nóng)民、居民的患病率均高于工人、商服單位及其他企業(yè),機(jī)關(guān)事業(yè)、衛(wèi)生事業(yè)、教師服單位及其他企業(yè),機(jī)關(guān)事業(yè)、衛(wèi)生事業(yè)、教師及公安警察與工人、商服單位及其他企業(yè)比較差及公安警察與工人、商服單位及其他企業(yè)比較差異無(wú)統(tǒng)計(jì)學(xué)意義。異無(wú)統(tǒng)計(jì)學(xué)意義。經(jīng)常吸煙的患病率低于不吸煙或偶爾經(jīng)常吸煙的患病率低于不吸煙或偶爾吸煙者。經(jīng)常飲酒的患病率高于不飲酒者,吸煙者。經(jīng)常飲酒的患病率高于不飲酒者,偶爾飲酒與不飲酒者比較差異無(wú)統(tǒng)計(jì)學(xué)意偶爾飲酒與不飲酒者比較差異無(wú)統(tǒng)計(jì)學(xué)意義。中心型肥胖的患病率高于非中心型肥義。中心型肥胖的患病率
27、高于非中心型肥胖者。經(jīng)常吃零食的患病率低于不吃或很胖者。經(jīng)常吃零食的患病率低于不吃或很少吃零食者。攝入食用油少的患病率低于少吃零食者。攝入食用油少的患病率低于攝入食用油適量者,攝入食用油過(guò)量與攝攝入食用油適量者,攝入食用油過(guò)量與攝入食用油適量者比較差異無(wú)統(tǒng)計(jì)學(xué)意義。入食用油適量者比較差異無(wú)統(tǒng)計(jì)學(xué)意義。攝入食鹽過(guò)量的患病率高于攝入食鹽少或攝入食鹽過(guò)量的患病率高于攝入食鹽少或適量者。適量者。 研究對(duì)象研究對(duì)象 肺小結(jié)節(jié)患者的肺小結(jié)節(jié)患者的CT圖像。圖像。 肺小結(jié)節(jié)的分割肺小結(jié)節(jié)的分割肺小結(jié)節(jié)紋理特征的提取肺小結(jié)節(jié)紋理特征的提取多水平統(tǒng)計(jì)模型的建立和分析多水平統(tǒng)計(jì)模型的建立和分析研究方法研究方法肺小
28、結(jié)節(jié)紋理特征的提取肺小結(jié)節(jié)紋理特征的提取 紋理特征是從紋理圖像中計(jì)算出來(lái)的一個(gè)值紋理特征是從紋理圖像中計(jì)算出來(lái)的一個(gè)值,它對(duì)紋理內(nèi)部灰度級(jí)變化的特征進(jìn)行量化。它對(duì)紋理內(nèi)部灰度級(jí)變化的特征進(jìn)行量化。 灰度共生矩陣紋理特征參量有:灰度共生矩陣紋理特征參量有:能量(角二階距,能量(角二階距,Angular Second Moment) , 慣性距慣性距(inertia moment),相關(guān)性相關(guān)性(correlation) 熵(熵(entropy),),局部平穩(wěn)性(局部平穩(wěn)性(local equability),),逆差矩逆差矩(Inverse Diffence Moment),和的均值和的均值(S
29、um Average) ,差的均值差的均值(Difference Average),等等。等等。多水平模型的建立多水平模型的建立 選取的研究對(duì)象是分屬于肺小結(jié)節(jié)患者選取的研究對(duì)象是分屬于肺小結(jié)節(jié)患者的的CT圖像,每一位患者具有多張圖像,每一位患者具有多張CT圖像,圖像,即圖像之間不具有完全的獨(dú)立性即圖像之間不具有完全的獨(dú)立性 ,但是,但是分屬于某一患者的分屬于某一患者的CT圖像具有聚集性。圖像具有聚集性。 即本次研究中的肺小結(jié)節(jié)患者和即本次研究中的肺小結(jié)節(jié)患者和CT圖像就構(gòu)成兩水平模型中的兩個(gè)水平圖像就構(gòu)成兩水平模型中的兩個(gè)水平: CT圖像是基本水平,即水平圖像是基本水平,即水平1單位單位;
30、肺小結(jié)節(jié)患者是水平肺小結(jié)節(jié)患者是水平2單位。單位。 故根據(jù)數(shù)據(jù)特點(diǎn):故根據(jù)數(shù)據(jù)特點(diǎn): 1)首先擬和)首先擬和最簡(jiǎn)單的多水平模型最簡(jiǎn)單的多水平模型,即方差即方差成成分分模型模型(零模型,零模型,不含任何協(xié)變量不含任何協(xié)變量) : Yij = 0 j+ 1 jX0 ij + eoij 其中其中0 j= 0+u0j,u0j(0, 2u0 ), eoij (0, 2e0 ) 0為平均截距,即當(dāng)所有的解釋變量為為平均截距,即當(dāng)所有的解釋變量為0時(shí),時(shí),所有的所有的yij的總平均估計(jì)值的總平均估計(jì)值;1表示解釋變量表示解釋變量X的固定效應(yīng)估計(jì)值,它表明的固定效應(yīng)估計(jì)值,它表明每個(gè)肺小結(jié)節(jié)患者間每個(gè)肺小結(jié)節(jié)
31、患者間Y的變異與解釋變量的變異與解釋變量X的變化無(wú)關(guān)的變化無(wú)關(guān);u0j為隨機(jī)變量,相當(dāng)于水平為隨機(jī)變量,相當(dāng)于水平2單位(患者水平)的單位(患者水平)的殘差項(xiàng),反映了第殘差項(xiàng),反映了第j個(gè)患者對(duì)個(gè)患者對(duì)y的隨機(jī)效應(yīng)的隨機(jī)效應(yīng);eoij為隨機(jī)誤差項(xiàng),即為水平為隨機(jī)誤差項(xiàng),即為水平1單位(單位(CT圖像水平)圖像水平)的殘差的殘差。即該模型也可表示為:即該模型也可表示為: Yij = (0 + 1 jX0 ij )+ (u0j eoij )0 + 1 jX0 ij為固定部分,回歸系數(shù)為固定部分,回歸系數(shù)0 和和1描述模型的描述模型的固定效應(yīng);固定效應(yīng);u0j eoij為隨機(jī)部分,其方差為隨機(jī)部分,其方差2u0 和和2e0 描述模型的描述模型的隨機(jī)效應(yīng)。隨機(jī)效應(yīng)。 2)由于協(xié)變量,即
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025版農(nóng)戶土地承包流轉(zhuǎn)合同中包含農(nóng)村電商合作條款范本4篇
- 2025版木枋行業(yè)綠色生產(chǎn)與節(jié)能減排合同4篇
- 2025年度配電室電氣設(shè)備安裝與調(diào)試合同4篇
- 2025年度智能煤場(chǎng)租賃與運(yùn)營(yíng)管理合同
- 避孕套婦產(chǎn)科學(xué)講解
- 二零二五年度農(nóng)產(chǎn)品電商平臺(tái)數(shù)據(jù)分析及用戶行為研究合同
- 2025年度農(nóng)產(chǎn)品電商運(yùn)營(yíng)托管服務(wù)合同4篇
- 二零二五版木結(jié)構(gòu)建筑項(xiàng)目管理與咨詢服務(wù)合同3篇
- 二零二五年度木門安裝與售后服務(wù)合同規(guī)范范本2篇
- 二零二五年度公務(wù)用車全生命周期維護(hù)服務(wù)合同3篇
- 圖像識(shí)別領(lǐng)域自適應(yīng)技術(shù)-洞察分析
- 個(gè)體戶店鋪?zhàn)赓U合同
- 禮盒業(yè)務(wù)銷售方案
- 術(shù)后肺炎預(yù)防和控制專家共識(shí)解讀課件
- 二十屆三中全會(huì)精神學(xué)習(xí)試題及答案(100題)
- 中石化高級(jí)職稱英語(yǔ)考試
- 小學(xué)五年級(jí)英語(yǔ)閱讀理解(帶答案)
- 2024二十屆三中全會(huì)知識(shí)競(jìng)賽題庫(kù)及答案
- 仁愛(ài)版初中英語(yǔ)單詞(按字母順序排版)
- (正式版)YS∕T 5040-2024 有色金屬礦山工程項(xiàng)目可行性研究報(bào)告編制標(biāo)準(zhǔn)
- 小學(xué)一年級(jí)拼音天天練
評(píng)論
0/150
提交評(píng)論