![大數(shù)據(jù)探索性分析版課件第5章_第1頁(yè)](http://file4.renrendoc.com/view/1834473e862fbe889e89eeeca671270b/1834473e862fbe889e89eeeca671270b1.gif)
![大數(shù)據(jù)探索性分析版課件第5章_第2頁(yè)](http://file4.renrendoc.com/view/1834473e862fbe889e89eeeca671270b/1834473e862fbe889e89eeeca671270b2.gif)
![大數(shù)據(jù)探索性分析版課件第5章_第3頁(yè)](http://file4.renrendoc.com/view/1834473e862fbe889e89eeeca671270b/1834473e862fbe889e89eeeca671270b3.gif)
![大數(shù)據(jù)探索性分析版課件第5章_第4頁(yè)](http://file4.renrendoc.com/view/1834473e862fbe889e89eeeca671270b/1834473e862fbe889e89eeeca671270b4.gif)
![大數(shù)據(jù)探索性分析版課件第5章_第5頁(yè)](http://file4.renrendoc.com/view/1834473e862fbe889e89eeeca671270b/1834473e862fbe889e89eeeca671270b5.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、第五章 時(shí)空數(shù)據(jù)分析本章的主要內(nèi)容第1節(jié) 空間數(shù)據(jù)基本知識(shí)第2節(jié) 空間統(tǒng)計(jì)介紹第3節(jié) 探索性空間數(shù)據(jù)分析第4節(jié) 空間自相關(guān)分析第5節(jié) 時(shí)空掃描統(tǒng)計(jì)分析第6節(jié) 空間回歸分析第7節(jié) 空間面板分析第8節(jié) 貝葉斯時(shí)空模型第9節(jié) 空間估算第10節(jié) 空間分析的綜合應(yīng)用發(fā)病率數(shù)據(jù)第11節(jié)空間分析的綜合應(yīng)用企業(yè)創(chuàng)新數(shù)據(jù)第1節(jié) 空間數(shù)據(jù)基本知識(shí)空間數(shù)據(jù)定義(場(chǎng),對(duì)象概念模型)有空間坐標(biāo)或相對(duì)位置的數(shù)據(jù)通稱空間數(shù)據(jù)。如發(fā)病率在縣區(qū)、鄉(xiāng)村的分布;氣象臺(tái)監(jiān)測(cè)的氣溫、降水;大氣污染物分布;土壤重金屬在區(qū)域各抽樣點(diǎn)的數(shù)值;全國(guó)各省、直轄市、自治區(qū)的GDP,區(qū)域社會(huì)經(jīng)濟(jì)調(diào)查(抽查或普查數(shù)據(jù))等。用來(lái)描述來(lái)自于現(xiàn)實(shí)的目標(biāo),將
2、數(shù)據(jù)統(tǒng)一化,從而來(lái)表明空間實(shí)體的形狀大小以及位置和分布特征。定位是指在已知的坐標(biāo)系里空間目標(biāo)都具有唯一的空間位置;定性是指有關(guān)空間目標(biāo)的自然屬性,它伴隨著目標(biāo)的地理位置;空間數(shù)據(jù)定義(場(chǎng),對(duì)象概念模型)時(shí)間是指空間目標(biāo)是隨時(shí)間的變化而變化;空間關(guān)系通常一般用拓?fù)潢P(guān)系表示。空間數(shù)據(jù)是一種用點(diǎn)、線、面以及實(shí)體等基本空間數(shù)據(jù)結(jié)構(gòu)來(lái)表示人們賴以生存的自然世界的數(shù)據(jù)。是數(shù)字地球的基礎(chǔ)信息,數(shù)字地球功能的絕大部分將以空間數(shù)據(jù)為基礎(chǔ)。矢量數(shù)據(jù)結(jié)構(gòu)和柵格數(shù)據(jù)結(jié)構(gòu)矢量數(shù)據(jù)結(jié)構(gòu)就是通過記錄坐標(biāo)的方式,將抽象的點(diǎn)、線、面等地理實(shí)體精確地表達(dá)為計(jì)算機(jī)可以識(shí)別、存儲(chǔ)和處理的格式。柵欄數(shù)據(jù)結(jié)構(gòu)是指將地理實(shí)體表面劃分為均勻
3、分布、大小相等、緊密相鄰的網(wǎng)格陣列,每個(gè)網(wǎng)格作為一個(gè)像元或柵格,由行、列號(hào)確定其位置,即用二維坐標(biāo)中的(x,y)來(lái)表示,并包含一個(gè)代碼,表示該像元的屬性類型??臻g數(shù)據(jù)類型點(diǎn)數(shù)據(jù)(piont data)連續(xù)數(shù)據(jù)(continuous data)面數(shù)據(jù)(areal data),也稱格數(shù)據(jù)(lattice data)線數(shù)據(jù)空間數(shù)據(jù)特性空間數(shù)據(jù)的分析還必須研究空間數(shù)據(jù)的特殊性質(zhì)。研究表明,空間數(shù)據(jù)的特殊性質(zhì)是多方面的,包括空間異質(zhì)性、空間自相關(guān)、可塑性面積單元問題、不確定性等,這些性質(zhì)直接影響了空間數(shù)據(jù)分析和建模的方法??臻g依賴性空間依賴性由于空間數(shù)據(jù)的聚集性及空間相互作用的存在,一個(gè)空間位置上的樣本
4、數(shù)據(jù)會(huì)依賴于其他位置上的觀測(cè)值??臻g依賴程度是通過空間自相關(guān)測(cè)度的,可以認(rèn)為空間自相關(guān)就是空間依賴性概念的數(shù)學(xué)表達(dá),空間自相關(guān)的指標(biāo)多樣,可分為兩種類型:全局測(cè)度和局部測(cè)度。全局方法對(duì)研究區(qū)域的整體給出一個(gè)參數(shù)或指數(shù),而局部方法提供數(shù)據(jù)觀測(cè)點(diǎn)等量的參數(shù)或指標(biāo)。空間異質(zhì)性異質(zhì)性源于各地方的獨(dú)特性質(zhì),表示空間數(shù)據(jù)的變化缺少平穩(wěn)性??臻g異質(zhì)性與空間上行為關(guān)系缺乏穩(wěn)定性有關(guān),這一特征也成為空間非平穩(wěn)性,意味著功能形式和參數(shù)所研究領(lǐng)域的不同個(gè)地方是不一樣的,但在區(qū)域局部,變化是一致的??臻g非平穩(wěn)性是空間數(shù)據(jù)這一特征的數(shù)學(xué)表達(dá),對(duì)大部分空間數(shù)據(jù)而言,假設(shè)空間過程非平穩(wěn)和各向異質(zhì)性能更為真實(shí)地反映地理問題的
5、實(shí)質(zhì)??臻g異質(zhì)性空間異質(zhì)性可塑性面積問題數(shù)據(jù)分析的結(jié)果隨著面積單元的定義不同而發(fā)生變化,就是所謂的可塑性面積單元問題。面積單元對(duì)于分析結(jié)果的影響來(lái)源于兩類效應(yīng):其一是尺度效應(yīng),即當(dāng)空間單元經(jīng)過聚合而變化改變其尺度大小時(shí),空間數(shù)據(jù)的統(tǒng)計(jì)分析結(jié)果也會(huì)相應(yīng)發(fā)生變化,由于從精細(xì)空間尺度聚集到大的空間單元的組合途徑通常很多不同聚集到大的空間單元的組合途徑通常很多,不同聚集方案得到的結(jié)果是不同的。其二是劃區(qū)效應(yīng),即在同一粒度或聚合水平上,由于聚合方式的不用或劃分方案的不同導(dǎo)致的分析結(jié)果的變化??伤苄悦娣e問題概而言之,可塑性面積單元問題(MAUP)是由區(qū)域的數(shù)量、規(guī)模、形狀對(duì)空間數(shù)據(jù)分析的結(jié)果所產(chǎn)生的不確定
6、性影響。不確定性問題空間數(shù)據(jù)的不確定性關(guān)心的主要問題是空間數(shù)據(jù)的質(zhì)量因?yàn)榭臻g數(shù)據(jù)的質(zhì)量對(duì)于建模分析、表示、結(jié)果以及決策的正確性等都有十分重要的影響。空間數(shù)據(jù)質(zhì)量的特殊性在于它包括兩個(gè)方面:屬性數(shù)據(jù)的質(zhì)量和空間對(duì)象的質(zhì)量,而兩者之間又是相互依賴的。由于數(shù)據(jù)還具有時(shí)間坐標(biāo),記錄的時(shí)間誤差也隱含在數(shù)據(jù)集中,因此空間數(shù)據(jù)包括空間和時(shí)間坐標(biāo)上的屬性值,三者之間相互影響。不確定性分類至少有4種類型:空間不確定性對(duì)象定義的不確定性關(guān)系不確定性分區(qū)問題空間不確定性當(dāng)對(duì)象不具有離散、確定的范圍時(shí),就會(huì)產(chǎn)生空間的不確定性這種不確定性是因?yàn)閷?duì)象定義的主觀性而產(chǎn)生的,可能存在不清晰的邊界(例如濕地在哪里精確終止),其
7、影響超出了它們的邊界,或者空間對(duì)象僅僅是統(tǒng)計(jì)上的實(shí)體。對(duì)象定義的不確定性當(dāng)不能清晰或嚴(yán)格定義對(duì)象時(shí),就會(huì)導(dǎo)致模糊性的產(chǎn)生,如在治安管理中,管區(qū)犯罪發(fā)生率為多少時(shí)才能定義為高犯罪地域,這些都依賴于一些人為的規(guī)定。關(guān)系不確定性地理要素之間通常具有各種關(guān)系,當(dāng)y被用作x的替代或指示器時(shí),因?yàn)閤不可用,此時(shí)就會(huì)產(chǎn)生模糊性,可分為直接指示器或間接指示器兩種情況。直接指示器表明現(xiàn)象之間的聯(lián)系是直接的和相當(dāng)清晰的,例如土壤的養(yǎng)分水平(y)是作物產(chǎn)量(x)的直接指示器。非直接的指示器趨向于更加模糊和不透明,例如濕地(y)是動(dòng)物多樣性(x)的非直接指示器。分區(qū)問題區(qū)域是為了識(shí)別地理現(xiàn)象,分析研究或管理的需要而進(jìn)
8、行的定義,所以產(chǎn)生了分區(qū)問題,例如氣候類型區(qū)的劃分問題,專家對(duì)于哪些特征的組合定義一個(gè)類型區(qū)域的觀點(diǎn)并不一致,這些特征如何加權(quán)生成一個(gè)復(fù)核指標(biāo),以及確定區(qū)域最小規(guī)模的閾值是多少,都會(huì)影響類型的劃分。在GIS中涉及空間數(shù)據(jù)的獲取,表示和分析等系列過程,而在這個(gè)過程的各個(gè)階段都會(huì)產(chǎn)生不確定性。從來(lái)源上看可歸結(jié)為測(cè)量的不確定性,空間數(shù)據(jù)表示的不確定性和空間數(shù)據(jù)分析的不確定性,其中分析的不確定性主要是和空間尺度依賴有關(guān)的MAUP問題。分區(qū)問題地理現(xiàn)象刻度的不確定性主要是空間數(shù)據(jù)和屬性數(shù)據(jù)獲取過程中產(chǎn)生的誤差,包括對(duì)象的物理測(cè)量誤差、社會(huì)經(jīng)濟(jì)屬性記錄誤差,數(shù)字化數(shù)據(jù)的誤差,以及不同來(lái)源數(shù)據(jù)集整合時(shí)的誤差
9、。地理現(xiàn)象的表示的不確定性表示與測(cè)量之間密切相關(guān),表示絕非僅僅是分析的輸入,而且還是分析的結(jié)果,主要包括柵欄數(shù)據(jù)表示的不確定性和矢量數(shù)據(jù)表示的不確定性。第2節(jié) 空間統(tǒng)計(jì)介紹空間統(tǒng)計(jì)由來(lái)應(yīng)用空間統(tǒng)計(jì)分析思想最早可以追溯到150多年前一次重大的公共衛(wèi)生事件,1854年英國(guó)倫敦霍亂大流行。在這次事件中,John Snow博士利用基于地圖的空間分析原理,將死亡病例標(biāo)注在倫敦地圖上,同時(shí)還將水井的信息也標(biāo)注在地圖上,通過相關(guān)分析,最后將污染源鎖定在城中心的一個(gè)水井的抽水機(jī)上。在他的建議下市政府將該抽水機(jī)停用,此后霍亂大幅度下降,并得到有效的控制??臻g統(tǒng)計(jì)由來(lái)John Snow利用空間分析思想控制疫情這件
10、事具有重要的里程碑意義,它被看成了空間統(tǒng)計(jì)分析和流行病學(xué)兩個(gè)學(xué)科的共同起源;但是此后相當(dāng)長(zhǎng)的一段時(shí)間內(nèi)由于缺乏刻畫數(shù)據(jù)的空間相關(guān)性和異質(zhì)性的方法,人們?cè)诜治隹臻g屬性的數(shù)據(jù)時(shí),往往把所涉及的數(shù)據(jù)自身空間效應(yīng)作為噪聲或者誤差來(lái)處理,這種缺乏對(duì)空間自相關(guān)和異質(zhì)性的刻畫,限制了以地圖為基礎(chǔ)的空間屬性數(shù)據(jù)在公共衛(wèi)生領(lǐng)域中應(yīng)用的深入研究??臻g統(tǒng)計(jì)由來(lái)直到1950年Moran首次提出空間自相關(guān)測(cè)度來(lái)研究二維或更高維空間隨機(jī)分布的現(xiàn)象,1951年南非學(xué)者Krige提出了空間統(tǒng)計(jì)學(xué)萌芽思想,后經(jīng)法國(guó)數(shù)學(xué)家Matheron完善,于1963年和1967年提出了地統(tǒng)計(jì)學(xué)和克里金技術(shù)。1973年, Cliff和Ord發(fā)
11、表了空間自相關(guān)(Spatial Autocorrelation)的分析方法,1981年出版了Spatial Process:Model and Application專著,形成了空間統(tǒng)計(jì)理論體系,以及GetisG和Lisa提出的空間異質(zhì)性的局部統(tǒng)計(jì)使空間統(tǒng)計(jì)理論日趨成熟??臻g統(tǒng)計(jì)由來(lái)近年來(lái)隨著空間分析技術(shù)以及空間分析軟件(如GIS、Geoda、SaTScan、Winbugs等)的迅速發(fā)展,與疾病分布有關(guān)的空間統(tǒng)計(jì)分析也得以較快發(fā)展??臻g統(tǒng)計(jì)與經(jīng)典統(tǒng)計(jì)區(qū)別空間統(tǒng)計(jì)具有明顯的多學(xué)科交叉特征,其顯著特點(diǎn)是思想多源、方法多樣、技術(shù)復(fù)雜,并隨著相關(guān)學(xué)科如計(jì)算機(jī)軟硬件技術(shù)的發(fā)展而發(fā)展??臻g統(tǒng)計(jì)分析是以地理
12、實(shí)體為研究對(duì)象,空間統(tǒng)計(jì)模型為工具,以地理實(shí)體空間相關(guān)性和空間變異性為出發(fā)點(diǎn),來(lái)分析地理對(duì)象空間格局、空間關(guān)系、時(shí)空變化規(guī)律,進(jìn)而揭示其成因的一門新科學(xué)。從研究變量類型來(lái)看首先從研究變量類型來(lái)看,經(jīng)典統(tǒng)計(jì)學(xué)研究的是純隨機(jī)變量,該隨機(jī)變量的取值遵循某種概率分布變化而空間統(tǒng)計(jì)學(xué)研究的是區(qū)域化變量,該區(qū)域化變量根據(jù)其在一個(gè)區(qū)域內(nèi)的空間位置不同而取不同的值,即隨機(jī)變量是與位置有關(guān)的隨機(jī)函數(shù)。因此,空間統(tǒng)計(jì)學(xué)研究的變量具有隨機(jī)性和結(jié)構(gòu)性特點(diǎn)。從假設(shè)前提來(lái)看在經(jīng)典統(tǒng)計(jì)學(xué)中,待分析的變量一般應(yīng)具有獨(dú)立性。而空間統(tǒng)計(jì)學(xué)的區(qū)域化變量是在不同空間位置上的抽樣,因而鄰近的樣本之間通常不獨(dú)立,存在某種程度的空間相關(guān)性
13、。從研究樣本來(lái)看經(jīng)典統(tǒng)計(jì)學(xué)以頻率分布圖為基礎(chǔ),研究樣本的各種數(shù)字特征(如均值、方差),并對(duì)總體進(jìn)行推斷。而空間統(tǒng)計(jì)學(xué)主要考慮變量空間分布理論和估算方法。從研究結(jié)果來(lái)看經(jīng)典統(tǒng)計(jì)學(xué)與GIS結(jié)合不緊密,而空間統(tǒng)計(jì)學(xué)能與GIS有效結(jié)合,很容易實(shí)現(xiàn)空間可視化。此外,試驗(yàn)次數(shù)不同,經(jīng)典統(tǒng)計(jì)學(xué)所研究的變量理論上可以無(wú)限次重復(fù)或進(jìn)行大量重復(fù)觀測(cè)試驗(yàn)。而空間統(tǒng)計(jì)學(xué)所研究的區(qū)域化變量一旦在某一空間位置上取得樣品后,就不可能再在同一位置取得該樣品,即區(qū)域化變量取值只有一次。當(dāng)然空間統(tǒng)計(jì)并不是拋棄所有的經(jīng)典統(tǒng)計(jì)學(xué)理論,而是對(duì)這些理論加以完善,以便更適用于空間數(shù)據(jù)統(tǒng)計(jì)分析??臻g統(tǒng)計(jì)學(xué)應(yīng)用綜述目前空間統(tǒng)計(jì)學(xué)技術(shù)主要基于3
14、S技術(shù),即GIS(Geographic Information System)、RS(Remote Sensing )、GPS(Global Positioning System)。3S技術(shù)就好比人的兩只眼睛和一個(gè)大腦,一只眼睛GPS進(jìn)行定位,另外一只眼睛RS采集周邊環(huán)境信息,GIS對(duì)采集過來(lái)的數(shù)據(jù)進(jìn)行統(tǒng)一存儲(chǔ)、加工與處理。GIS具有功能完善空間分析模塊,可以進(jìn)行疾病的探索性和證實(shí)性分析,進(jìn)行疾病或傳播媒介與潛在地理、氣候、社會(huì)、經(jīng)濟(jì)等因素之間的關(guān)聯(lián)分析。空間統(tǒng)計(jì)學(xué)應(yīng)用綜述例如通過環(huán)境因素與疾病的疊加分析、空間相關(guān)分析和空間回歸分析、疾病的遙感模型、傳染病模型等來(lái)探索和描述疾病的傳播規(guī)律和尋求
15、病因,評(píng)估潛在的環(huán)境和特定時(shí)空交互行為對(duì)疾病發(fā)生的影響這一方面對(duì)決策人員制定科學(xué)的防治策略、確定防范重點(diǎn)、分配有限醫(yī)療資源等具有重要的指導(dǎo)意義另一方面,也有助于衛(wèi)生領(lǐng)域的研究人員設(shè)計(jì)合理的科學(xué)實(shí)驗(yàn)進(jìn)行傳染病的病毒學(xué)和分子流行病學(xué)研究,加速?gòu)氐讘?zhàn)勝傳染病的進(jìn)程。疾病的空間插值分析在疾病預(yù)防研究中,疾病空間樣點(diǎn)資料是有限的,如何利用有限的空間樣點(diǎn)資料去掌握整個(gè)區(qū)域的全局流行特征,突破人為行政區(qū)劃的限制,從一種整體宏觀全局角度來(lái)把握疾病和健康的空間分布格局,從而為公共衛(wèi)生資源的配置和防控策略的制定提供依據(jù)??臻g插值數(shù)據(jù)是根據(jù)相鄰樣點(diǎn)的相似原理來(lái)生成表面,即用已知的樣點(diǎn)的值生成表面來(lái)預(yù)測(cè)整個(gè)研究區(qū)域內(nèi)
16、每個(gè)位置的值,并評(píng)估預(yù)測(cè)表面的誤差和變異性。疾病的空間插值分析克里金插值又稱之為地統(tǒng)計(jì)學(xué),以空間自相關(guān)為前提,區(qū)域化變量理論為基礎(chǔ),以變異函數(shù)為主要工具的一門新學(xué)科。其實(shí)質(zhì)是利用區(qū)域化變量的原始數(shù)據(jù)和變異函數(shù)的結(jié)構(gòu)特點(diǎn),對(duì)未采樣點(diǎn)的區(qū)域化變量的取值進(jìn)行線性無(wú)偏、最優(yōu)估計(jì)。半變異函數(shù)主要塊金值、變程、基臺(tái)值、偏基臺(tái)值幾部分組成。半變異函數(shù)圖詳解塊金基臺(tái)比塊金基臺(tái)比C0C0+C1,其大小反映空間自相關(guān)部分引起疾病空間異質(zhì)性程度的大小。如果塊金基臺(tái)比較大,說明隨機(jī)部分引起的疾病空間異質(zhì)性起主要作用,空間自相關(guān)弱。反之,塊金基臺(tái)比較小,說明空間自相關(guān)部分引起的疾病空間異質(zhì)程度起主要作用,空間自相關(guān)性強(qiáng)
17、。疾病的空間插值分析描述污染物空間分布是風(fēng)險(xiǎn)評(píng)估的一個(gè)重要組成部分Cattle等人采用指示克里金技術(shù)基于已知抽樣點(diǎn)污染物濃度去估計(jì)非抽樣點(diǎn)污染物濃度。Asmarian等人采用泊松克里金插值對(duì)2003-2007年336個(gè)縣食道癌發(fā)病數(shù)據(jù)進(jìn)行分析,得出了Ardebil、 Mazandaran 、 Kordestan三省與其他省相比有較高的風(fēng)險(xiǎn)。Adhikar等人采用指標(biāo)和概率克里格方法描述印度德里市Najafgarh街區(qū)地下水銅、鐵、錳污染情況。疾病空間聚集性研究疾病的聚集性分析目的在于研究潛在危險(xiǎn)因素的時(shí)空聚集性,從整體上檢驗(yàn)疾病的空間分布是隨機(jī)還是聚集?如果是聚集分布,進(jìn)一步回答:聚集在什么地
18、方?疾病聚集程度高低及與周邊地區(qū)關(guān)系如何?聚集在多大的空間尺度才有效?這些與地點(diǎn)相關(guān)的聚集因素可以是未知的感染因子、地方污染物等。疾病空間聚集性研究Xiao等人采用局部GetisG熱點(diǎn)探測(cè)發(fā)現(xiàn)了中國(guó)大陸2008-2011年在縣區(qū)水平上手足口病空間聚集性及隨時(shí)間的變化趨勢(shì)。于石成等利用時(shí)空掃描技術(shù)對(duì)全國(guó)重癥手足口病例進(jìn)行了時(shí)空聚集性分析,發(fā)現(xiàn)重癥病例聚集區(qū)域,為進(jìn)一步研究重癥病例成因奠定了基礎(chǔ)。Wang等采用Satscan時(shí)空掃描工具探測(cè)北京2008-2012年手足口病時(shí)空聚集模式。同時(shí)在其他傳染病分析中也得到廣泛應(yīng)用,如細(xì)菌性痢疾、丙型肝炎、出血熱病 、HFRS 、H7N9等疾病分析。疾病空間
19、聚集性研究同樣在癌癥研究中,研究人員使用空間聚集分析確定地理區(qū)域的高危人群,然后篩選人群疾病可以改善癌癥控制。疾病時(shí)空預(yù)警分析通過時(shí)空模型分析不同時(shí)期疾病或媒介的空間動(dòng)態(tài)變化,了解疾病隨時(shí)間的變化規(guī)律,對(duì)疾病未來(lái)的發(fā)展趨勢(shì)做出分析、預(yù)測(cè)和評(píng)估,從而在疾病的預(yù)警系統(tǒng)中發(fā)揮作用。在這些時(shí)空模型中,Kulldorff于1998年提出了時(shí)空掃描統(tǒng)計(jì)量,以及在2001年提出的前瞻性時(shí)空重排掃描統(tǒng)計(jì)量,在傳染病暴發(fā)預(yù)警中具有較好的應(yīng)用前景。疾病時(shí)空預(yù)警分析前瞻性時(shí)空重排掃描統(tǒng)計(jì)量以動(dòng)態(tài)變化的掃描窗口對(duì)不同的時(shí)間和區(qū)域進(jìn)行掃描,可以有效地對(duì)未知的時(shí)空聚集性進(jìn)行探索性分析,達(dá)到早期預(yù)警的目的。該方法最大的優(yōu)勢(shì)
20、在于,由于采用了重排算法,該模型在建模過程中不需要使用人口數(shù)據(jù)。而基于Poisson分布的時(shí)空掃描統(tǒng)計(jì)量,在計(jì)算過程中需要各區(qū)域的人口數(shù)據(jù),但確切的人口數(shù)據(jù)常常很難獲得。疾病時(shí)空預(yù)警分析Mostashari等利用死禽數(shù)據(jù)進(jìn)行空間統(tǒng)計(jì)掃描分析對(duì)西尼羅病毒暴發(fā)進(jìn)行早期預(yù)警。Mugglin等采用貝葉斯時(shí)空模型通過對(duì)蘇格蘭流行性感冒病例資料進(jìn)行分析和預(yù)測(cè),可以讓醫(yī)院在應(yīng)診能力準(zhǔn)備上做得更好。疾病制圖和病因探索疾病制圖是空間統(tǒng)計(jì)學(xué)的基本功能其目的是將疾病的危險(xiǎn)的空間變異或時(shí)空變異在地圖上呈現(xiàn)出來(lái),為進(jìn)一步病因?qū)W研究或其他研究提供線索。地理環(huán)境相關(guān)性研究是研究與環(huán)境有關(guān)的地理變量(如空氣、水體、土壤等)或
21、生活方式等因素與健康之間的相互關(guān)系,能夠環(huán)境危險(xiǎn)因素的研究提供必要的信息。自然與社會(huì)環(huán)境、營(yíng)養(yǎng)、基因、行為、病媒生物等是許多疾病的致病因子,通常具有空間分布。疾病制圖和病因探索疾病分布如同自然景觀的概念一樣,不同疾病的分布結(jié)構(gòu)來(lái)自于不同的病因分布結(jié)構(gòu),這種結(jié)構(gòu)的變化同樣影響著疾病的發(fā)生、傳播和消長(zhǎng)的變化。通過分析這些要素和疾病空間分布之間的關(guān)系,可以探測(cè)是否存在威脅健康的環(huán)境危險(xiǎn)因素,這些危險(xiǎn)因素是否存在交互作用地理探測(cè)器“地理探測(cè)器”(GeoDetector)方法基于空間方差分析來(lái)分析來(lái)探測(cè)環(huán)境風(fēng)險(xiǎn)因子。主要包括四個(gè)方面的功能:風(fēng)險(xiǎn)探測(cè)器可以指示風(fēng)險(xiǎn)區(qū)域;因子探測(cè)器可以定量評(píng)價(jià)不同的環(huán)境因子
22、的風(fēng)險(xiǎn)程度;生態(tài)探測(cè)器可以分析不同的環(huán)境因子的影響是否有顯著差異;交互探測(cè)器可以分析環(huán)境因子是獨(dú)立作用還是多種因子交互作用的結(jié)果。自從地理探測(cè)器問世以來(lái),在公共衛(wèi)生領(lǐng)域得到了廣泛的應(yīng)用。地理探測(cè)器Wang等利用了地理探測(cè)器發(fā)現(xiàn)了引起山西省和順縣神經(jīng)管畸形的環(huán)境致病因子以及致病因子之間的相互關(guān)系。Wu等(2004)等人通過空間探索分析為獲得導(dǎo)致出生缺陷的環(huán)境致病因子,為進(jìn)一步分析致病因子奠定了基礎(chǔ)。HU等利用地理加權(quán)回歸分析了氣象因子對(duì)我國(guó)手足口病影響在地理空間上的異質(zhì)性。Deng等采用空間面板模型分析廣東氣象因素對(duì)手足口病的影響。層次貝葉斯時(shí)空模型方法在疾病制圖及分析疾病的影響因素方面取得較好
23、的效果,獲得了疾病危險(xiǎn)的空間及時(shí)空變異的信息。第3節(jié) 空間模型應(yīng)用實(shí)例探索性空間數(shù)據(jù)分析探索性空間數(shù)據(jù)分析指基于數(shù)據(jù)的空間屬性,利用空間統(tǒng)計(jì)學(xué)原理和圖表相結(jié)合,對(duì)空間數(shù)據(jù)的性質(zhì)進(jìn)行探索性分析。ESDA提供直方圖、QQ圖、變異云圖、趨勢(shì)圖、地區(qū)分布圖、泰森多邊型(voroni map),對(duì)數(shù)據(jù)的離群值、正態(tài)性、趨勢(shì)性及變異性進(jìn)行分析。通過地區(qū)分布圖和三維趨勢(shì)分析,可直觀描述疾病分布的趨勢(shì)性及不均勻性。疾病地區(qū)分布圖疾病地區(qū)分布圖是一種常用的空間數(shù)據(jù)可視化方法。將疾病數(shù)據(jù)根據(jù)區(qū)域進(jìn)行統(tǒng)計(jì),使每個(gè)區(qū)域得到一個(gè)描述疾病發(fā)生的聚合信息;然后根據(jù)該信息通過不同的填充顏色或圖案對(duì)各個(gè)地區(qū)進(jìn)行渲染,最后得到的
24、圖即為疾病地區(qū)分布圖。疾病地區(qū)分布圖用不同的顏色或圖案把疾病高發(fā)區(qū)、低發(fā)區(qū)直觀描述出來(lái),揭示空間分布趨勢(shì),為疾病進(jìn)一步研究提供線索。趨勢(shì)分析趨勢(shì)分析生成數(shù)據(jù)的三維趨勢(shì)圖,可識(shí)別數(shù)據(jù)的全局趨勢(shì)。x軸、y軸分別代表疾病采樣點(diǎn)對(duì)應(yīng)的經(jīng)度和緯度,z軸表示采樣點(diǎn)的疾病指標(biāo)。三維趨勢(shì)圖中與y軸對(duì)應(yīng)的線條表示在南北方向上趨勢(shì)值的變化,與x軸對(duì)應(yīng)的線條表示在東西方向上趨勢(shì)值的變化。三維趨勢(shì)圖可直觀展示疾病的空間分布趨勢(shì)。三維趨勢(shì)圖第4節(jié) 空間自相關(guān)分析空間自相關(guān)分析空間自相關(guān),指一個(gè)區(qū)域單位上的某種屬性值(如發(fā)病率)與鄰近區(qū)域單位上的同一屬性值間的相關(guān)程度,其基本度量指標(biāo)是空間自相關(guān)系數(shù),用空間自相關(guān)系數(shù)來(lái)檢
25、驗(yàn)區(qū)域單位的某一屬性值是否高高相鄰,低低相鄰或者高低間錯(cuò)分布,即有無(wú)聚集性??臻g自相關(guān)分為三種情況一種是正相關(guān),指鄰近區(qū)域有相同或相似的屬性值。如果某變量屬性值在空間分布上呈現(xiàn)出高的地方周圍也高,低的地方周圍也低,稱為空間正相關(guān),表明此變量屬性值具有空間擴(kuò)散特性;另一種是負(fù)相關(guān),指鄰近區(qū)域有不同的屬性值。如果在空間分布上呈現(xiàn)出高的地方周圍低,低的地方周圍高,則稱為空間負(fù)相關(guān),表明此變量屬性值具有空間極化特性;第三種是無(wú)相關(guān),指變量屬性值在空間分布上呈現(xiàn)出隨機(jī)性,表明空間自相關(guān)不明顯,是一種隨機(jī)分布的現(xiàn)象。I0,正相關(guān), INew,即打開一個(gè)空白的窗口(如下圖6-8所示)。在這個(gè)窗口中可以通過編
26、寫代碼的方式建立模型、導(dǎo)入數(shù)據(jù)和設(shè)置迭代初始條件。(三)通過事例學(xué)習(xí)使用WinBugs WinBUGS中自帶很多事例,可供初學(xué)者學(xué)習(xí)。在這里我們提供一個(gè)處理空間數(shù)據(jù)的事例,該事例屬于GeoBUGS模塊。點(diǎn)擊菜單欄中的Map-Manual,進(jìn)入如下界面(該界面是GeoBUGS的手冊(cè),界面中可能有少量亂碼,但一般不影響閱讀): 在Contents下的目錄中,點(diǎn)擊Examples,進(jìn)入以下界面:WinBUGS代碼 要在WinBUGS建立并求解模型,首先通過輸入必要的代碼。代碼分為三部分:建立模型的代碼、導(dǎo)入數(shù)據(jù)的代碼和設(shè)定迭代初始條件的代碼。首先輸入建立模型的代碼。在蘇格蘭唇癌發(fā)病率的事例中,找到建
27、立模型的代碼(下圖紅框中),將其復(fù)制到之前新建的空白窗口中。以下解釋上述代碼的含義。首行的model表示建立模型。模型的內(nèi)容全部寫在model下的大括號(hào)中。for (i in 1 : N) Oidpois(mui) log(mui)-log(Ei)+alpha0+alpha1*Xi/10+bi RRiSpecification高亮代碼首行的model,然后點(diǎn)擊對(duì)話框中check model,此時(shí)程序界面左下角會(huì)出現(xiàn)“model is syntactically correct”。再高亮代碼中表示數(shù)據(jù)的list,然后點(diǎn)擊對(duì)話框中的load data,此時(shí)程序界面左下角會(huì)出現(xiàn)“data loade
28、d”。 再點(diǎn)擊對(duì)話框中的compile,程序界面左下角會(huì)出現(xiàn)“model compiled”。對(duì)話框中的num of chains表示抽樣時(shí)馬爾科夫鏈的數(shù)量,這里保持默認(rèn)值1。再高亮代碼中表示迭代初始條件的list,然后點(diǎn)擊對(duì)話框中的load inits,程序界面左下角會(huì)出現(xiàn)“model is initialized”。然后關(guān)閉對(duì)話框。迭代抽樣點(diǎn)擊菜單欄中的Inference-Samples,彈出如下對(duì)話框。上述步驟執(zhí)行完畢后,關(guān)閉目前的對(duì)話框。再點(diǎn)擊菜單欄中的Model-Update對(duì)話框中的updates表示迭代次數(shù),可以將其改為更大的數(shù),比如10000。確定迭代次數(shù)后,點(diǎn)擊update按
29、鈕,軟件開始執(zhí)行迭代。執(zhí)行完畢后,關(guān)閉該對(duì)話框。查看結(jié)果點(diǎn)擊菜單欄中的Inference-Samples,再次彈出下圖所示的對(duì)話框。點(diǎn)擊node旁文本框右端的下拉鍵,這樣就可以選擇待估的參數(shù),以查看估計(jì)結(jié)果。比如我們選擇alpha1,然后點(diǎn)擊history,可以查看其迭代計(jì)算的過程點(diǎn)擊density,可以看到估計(jì)出的alpha1的概率密度函數(shù)圖點(diǎn)擊stats,可以看到alpha1的期望、標(biāo)準(zhǔn)差等數(shù)值從這個(gè)估計(jì)結(jié)果,我們可以看出農(nóng)林漁業(yè)從業(yè)人口比例對(duì)唇癌發(fā)病率有顯著正影響(2.5%分位數(shù)大于0)。說明農(nóng)林漁業(yè)生產(chǎn)可能易引發(fā)唇癌。當(dāng)然,通過上述模型能得出的結(jié)論不止這一條,需要研究者仔細(xì)分析。而分析
30、可能需要更多的工具。而WinBUGS的GeoBUGS模塊可以是進(jìn)一步分析中所用的工具之一。GeoBUGS專門用于分析空間數(shù)據(jù),通過GeoBUGS可以借助地圖工具進(jìn)一步分析模型結(jié)果,比如分析變量的空間分布。使用GeoBUGS分析變量的空間分布點(diǎn)擊菜單欄中的Map-Mapping Tool,彈出如下圖所示的對(duì)話框。第9節(jié)空間估算空間估算疾病區(qū)域化變量當(dāng)一個(gè)變量在空間上與其位置有關(guān)時(shí)稱為區(qū)域化變量。在醫(yī)學(xué)領(lǐng)域,諸如疾病發(fā)病率、地理危險(xiǎn)因子、某地微量元素的本底值等指標(biāo)都與地位位置有關(guān),稱之為疾病區(qū)域化變量。疾病區(qū)域化變量與普通隨機(jī)化變量不同,它是隨機(jī)變量在地理空間內(nèi)某確定位置上的特定取值,是與位置有關(guān)
31、的隨機(jī)函數(shù)。疾病變異函數(shù)疾病變異函數(shù)以疾病區(qū)域化變量理論為基礎(chǔ),分析變量的空間變異性及空間關(guān)聯(lián)性的統(tǒng)計(jì)學(xué)方法。它指當(dāng)點(diǎn)x在空間上變化時(shí),疾病區(qū)域化變量Z(x)在點(diǎn)x和x+h處的值 Z(x)與Z(x+h)之差的方差的一半,記為:疾病變異函數(shù)參數(shù)及流行病學(xué)意義疾病變異函數(shù)模型的擬合實(shí)際工作中,需要根據(jù)疾病變異云圖及數(shù)據(jù)特性來(lái)擬合疾病變異函數(shù)模型。常用模型分為三類:一是有基臺(tái)值模型,包括球狀模型、指數(shù)模型、高斯模型、線型有基臺(tái)模型和純塊金效應(yīng)模型;二是無(wú)基臺(tái)模型,包括冪函數(shù)模型、線性無(wú)基臺(tái)模型、拋物線模型;三是孔穴模型。擬合這些模型的基本步驟是確定曲線類型,通過一定的變量變換將曲線線性化,用距離加權(quán)
32、最小二乘法進(jìn)行參數(shù)估計(jì)。其中,球狀模型和指數(shù)模型為最常用模型。球狀模型實(shí)際應(yīng)用中,對(duì)變異函數(shù)模型的選擇依據(jù)變異函數(shù)云圖的特征:有基臺(tái)而且在ha時(shí)半方差云圖的形狀是完全水平的則用球狀模型,否則用指數(shù)模型。兩者變異云圖如下:球狀模型變異云圖 指數(shù)模型變異云圖疾病變異函數(shù)的向異性如大氣污染物的擴(kuò)散,在不同風(fēng)向上其濃度大小和擴(kuò)散距離也不同。順風(fēng)方向上表現(xiàn)出高濃度大范圍聚集性;其它方向上可能表現(xiàn)出離散性分布,沒有明顯的聚集性。又比如生物地球化學(xué)性疾病的空間異質(zhì)性常常是各向異性的,疾病地理危險(xiǎn)因素在不同方向上控制著不同程度的疾病空間變異性,明顯地影響疾病的空間結(jié)構(gòu);例如,克山病由于受地理環(huán)境中微量元素硒的
33、影響,其空間異質(zhì)性常常各向異性的。向異性分為結(jié)構(gòu)向異性、幾何向異性、完全向異性,三類向異性的變異函數(shù)曲線見下圖如果不同方向上的疾病區(qū)域化變量表現(xiàn)出基臺(tái)值相同,自相關(guān)閾值不同時(shí),疾病區(qū)域化變量具有幾何向異性(上圖中的r與r2)。如果不同方向上的疾病區(qū)域化變量表現(xiàn)出自相關(guān)閾值相同,而基臺(tái)值不同時(shí),疾病區(qū)域化變量具有帶狀向異性(上圖中的r1和r3)。如果不同方向上的疾病區(qū)域化變量表現(xiàn)出自相關(guān)閾值和基臺(tái)值都不同時(shí),疾病區(qū)域化變量具有完全向異性(上圖中的r2與r3)。實(shí)際工作中,當(dāng)疾病空間采樣點(diǎn)較少(n100)時(shí),不宜做疾病變異函數(shù)向異性分析。第10節(jié) 空間分析的綜合應(yīng)用-發(fā)病率數(shù)據(jù)動(dòng)態(tài)地圖繪制打開Ar
34、cMap軟件,創(chuàng)建新的空白地圖,將全國(guó)區(qū)縣圖拖入空白地圖中變量選擇選擇區(qū)縣圖層,右鍵打開屬性表,選擇文件按屬性選擇,由于長(zhǎng)三角地區(qū)的區(qū)縣行政編碼在310000340000之間,因此我們給屬性CNTY_CODE賦予條件310000,34000,選擇長(zhǎng)三角地區(qū)的區(qū)縣數(shù)據(jù)導(dǎo)出右鍵選擇導(dǎo)出數(shù)據(jù),并將數(shù)據(jù)形成的新圖層導(dǎo)入到地圖中,取消選中全國(guó)區(qū)縣地圖,我們得到了單獨(dú)的長(zhǎng)三角區(qū)縣地圖數(shù)據(jù)連接將疾病數(shù)據(jù)與長(zhǎng)三角地圖連接,“動(dòng)態(tài)數(shù)據(jù)”中二月、五月、八月、十一月的數(shù)據(jù)應(yīng)依次分別與長(zhǎng)三角地圖連接將疾病數(shù)據(jù)進(jìn)行區(qū)域可視化在changsanjiao2圖層上,右鍵圖層屬性選擇符號(hào)系統(tǒng),可以對(duì)于數(shù)量設(shè)置不同顏色,對(duì)于范圍
35、可以設(shè)置格式化,自定義設(shè)置范圍的數(shù)位、對(duì)齊方式等地圖合并及動(dòng)態(tài)地圖制作合并四張地圖數(shù)據(jù)在菜單欄,地理處理中選擇“合并”進(jìn)入合并對(duì)話框,將之前導(dǎo)出的4個(gè)月份的疾病數(shù)據(jù)選入框內(nèi),合并處理后輸出新的數(shù)據(jù)集為hebing25811.shp,并將數(shù)據(jù)導(dǎo)入圖層中。啟用時(shí)間在合并成的hebing25811.shp圖層中,右鍵設(shè)置屬性,在符號(hào)系統(tǒng)中設(shè)置顏色以表示數(shù)量,同時(shí)啟用時(shí)間屬性創(chuàng)建動(dòng)態(tài)地圖選擇工具欄時(shí)間滑塊按鈕,啟用合并圖層的時(shí)間滑塊,選項(xiàng)中可以設(shè)置切換速度等,即得到動(dòng)態(tài)地圖。點(diǎn)擊播放按鍵鈕,我們可以看到長(zhǎng)三角地區(qū)各區(qū)縣4個(gè)時(shí)間戳的疾病變化情況。美化地圖及導(dǎo)出視頻空間自回歸分析及熱點(diǎn)探測(cè)1.地圖導(dǎo)入2.
36、創(chuàng)建權(quán)重文件3.繪制權(quán)重直方圖4.分析全局自相關(guān)5.分析局部自相關(guān)6.繪制其他三季度第11節(jié)空間分析的綜合應(yīng)用企業(yè)創(chuàng)新數(shù)據(jù)數(shù)據(jù)說明本節(jié)數(shù)據(jù)源于2014年的全國(guó)企業(yè)創(chuàng)新調(diào)查項(xiàng)目,以其中長(zhǎng)江三角洲城市群的數(shù)據(jù)為分析對(duì)象。長(zhǎng)江三角洲城市群共包括上海、南京、無(wú)錫、常州、蘇州、南通、鹽城、揚(yáng)州、鎮(zhèn)江、泰州、杭州、寧波、嘉興、湖州、紹興、金華、舟山、臺(tái)州、合肥、蕪湖、馬鞍山、銅陵、安慶、滁州、宣城26市,舟山是島嶼城市,經(jīng)濟(jì)結(jié)構(gòu)與其他地區(qū)差異很大,因此不作為分析對(duì)象模型假設(shè)模型假設(shè)空間統(tǒng)計(jì)方法的R實(shí)現(xiàn)要運(yùn)用R軟件實(shí)行空間分析,首先我們應(yīng)該建立適用于R語(yǔ)言環(huán)境的空間數(shù)據(jù)集。對(duì)一般的研究需求來(lái)說,主要是將已有的經(jīng)濟(jì)社會(huì)數(shù)據(jù)與地理空間數(shù)據(jù)合并。#1.設(shè)置合并數(shù)據(jù)集時(shí)的匹配列city$NAME_2chr-as.character(city$NAME_2)#字符city$NAME_2chr14-SuzhouA#安徽宿
溫馨提示
- 1. 本站所有資源如無(wú)特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 未來(lái)電商模式探索與展望
- 現(xiàn)代企業(yè)財(cái)務(wù)管理的倫理與責(zé)任
- 生產(chǎn)管理策略與工藝優(yōu)化技術(shù)
- 災(zāi)害預(yù)防教育學(xué)校防災(zāi)減災(zāi)的必由之路
- 環(huán)保節(jié)能建筑的設(shè)計(jì)與實(shí)施案例分享
- 2024年重陽(yáng)節(jié)活動(dòng)策劃方案-11
- 現(xiàn)代物流與科技融合的商業(yè)模式
- 國(guó)慶節(jié)房地產(chǎn)促銷方案
- 2024年五年級(jí)英語(yǔ)上冊(cè) Unit 6 In a nature park Part A 第三課時(shí)說課稿 人教PEP
- 2024-2025學(xué)年新教材高中語(yǔ)文 第二單元 5 雷雨(節(jié)選)(1)說課稿 部編版必修下冊(cè)
- 2025年1月浙江省高考政治試卷(含答案)
- 教體局校車安全管理培訓(xùn)
- 湖北省十堰市城區(qū)2024-2025學(xué)年九年級(jí)上學(xué)期期末質(zhì)量檢測(cè)綜合物理試題(含答案)
- 導(dǎo)播理論知識(shí)培訓(xùn)班課件
- 空氣能安裝合同
- 中國(guó)人婚戀狀況調(diào)查報(bào)告公布
- 早產(chǎn)兒視網(wǎng)膜病變
- GB 10665-1997碳化鈣(電石)
- 《中小學(xué)教育懲戒規(guī)則》重點(diǎn)內(nèi)容學(xué)習(xí)PPT課件(帶內(nèi)容)
- 板帶生產(chǎn)工藝5(熱連軋帶鋼生產(chǎn))課件
- 2022年同等學(xué)力英語(yǔ)考試真題及詳解
評(píng)論
0/150
提交評(píng)論