第九屆生物多樣性會議,R 統(tǒng)計在生態(tài)學(xué)和生物多樣性研究中的應(yīng)用專題摘要(暫短)_第1頁
第九屆生物多樣性會議,R 統(tǒng)計在生態(tài)學(xué)和生物多樣性研究中的應(yīng)用專題摘要(暫短)_第2頁
第九屆生物多樣性會議,R 統(tǒng)計在生態(tài)學(xué)和生物多樣性研究中的應(yīng)用專題摘要(暫短)_第3頁
第九屆生物多樣性會議,R 統(tǒng)計在生態(tài)學(xué)和生物多樣性研究中的應(yīng)用專題摘要(暫短)_第4頁
第九屆生物多樣性會議,R 統(tǒng)計在生態(tài)學(xué)和生物多樣性研究中的應(yīng)用專題摘要(暫短)_第5頁
已閱讀5頁,還剩3頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、R 統(tǒng)計在生態(tài)學(xué)和生物多樣性研究中的應(yīng)用專題召集人: 賴江山 ??瞬?、報告人報告題目時間報告人報告時間單位R語言歷史、發(fā)展和現(xiàn)狀15分鐘賴江山3日晚6:30-6:45中科院植物所R的基本用法與做圖50分鐘牛克昌3日晚6:45-7:35北京大學(xué)用R做貝葉斯分析50分鐘儲成進3日晚7:35-8:25蘭州大學(xué)R語言在地統(tǒng)計學(xué)中的應(yīng)用50分鐘原作強3日晚8:25-9:15中科院沈陽生態(tài)所基于R的多元統(tǒng)計分析50分鐘賴江山4日晚6:30-7:20中科院植物所基于R的混合效應(yīng)模型的應(yīng)用50分鐘陳磊4日晚7:20-8:10中科院植物所基于R的系統(tǒng)發(fā)育分析50分鐘張金龍4日晚8:10-9:00中科院植物所8

2、二、摘要: R語言歷史、發(fā)展和現(xiàn)狀 賴江山 (中國科學(xué)院植物研究所生物多樣性與生物安全研究組) R語言是一個用于統(tǒng)計計算和統(tǒng)計制圖的優(yōu)秀軟件,與著名的統(tǒng)計編程語言S有著密切的關(guān)系。20世紀90年代早期,新西蘭奧克蘭大學(xué)統(tǒng)計系的Robert Gentleman和Ross Ihaka兩位學(xué)者按照S語言的規(guī)范開始開發(fā)R,并將R作為一個自由軟件進行發(fā)布。盡管R語言歷史不長,但以其開源、自由、免費等特點已經(jīng)風靡全球。目前用R作為統(tǒng)計工具的科技論文成指數(shù)級增長。從2004年起至今(2005年除外),R開發(fā)團隊每年都會舉辦一次R的國際會議,參會者和報告人數(shù)不斷增加。R也有其刊物“R News”,創(chuàng)辦于200

3、1年,自2009年起,“R News”將更名為“The R Journal”。 中國人民大學(xué)統(tǒng)計系就R語言在國內(nèi)推廣做了很多貢獻,比如多次舉辦R的全國會議,開辦統(tǒng)計之都論壇(/cn/)R的版塊,翻譯多本R的中文教程并免費放在網(wǎng)站供下載。 國內(nèi)生態(tài)學(xué)及生物多樣性研究人員認識R和使用R歷史并不長。普蘭塔論壇及中國科學(xué)院生物多樣性委員會為R在生態(tài)學(xué)界的推廣應(yīng)用做了不少工作。曾多次舉辦R的培訓(xùn)班,包括在本屆研討會設(shè)立R的專題等等。R語言也逐步受到國內(nèi)生態(tài)學(xué)工作者,特別是青年學(xué)者和研究生們的青睞。希望本專題的推廣,讓更多參會者了解R語言,并利用它在統(tǒng)計分析上的優(yōu)勢為自己的專業(yè)

4、問題提供靈活的解答。R軟件在生態(tài)學(xué)和生物多樣性研究中的應(yīng)用簡介??瞬ū本┐髮W(xué) 城市與環(huán)境學(xué)院生態(tài)學(xué)系)近年來隨著數(shù)據(jù)分析方法和數(shù)學(xué)模型在生態(tài)學(xué)和生物多樣性研究中的迅速發(fā)展,傳統(tǒng)的統(tǒng)計軟件已經(jīng)很難滿足迅速發(fā)展的數(shù)據(jù)分析要求。R 軟件發(fā)展十年,以其靈活、開放、易于掌握、免費等諸多優(yōu)點,在生態(tài)學(xué)和生物多樣性研究領(lǐng)域,迅速贏得研究者們的青睞。然而,R軟件在國內(nèi)生態(tài)學(xué)和生物多樣性研究中的應(yīng)用還相對較少。很多初學(xué)者因R需要輸入命令并做些簡單編程,而望而卻步。為此,本文從R軟件的發(fā)展入手,深入淺出地簡單介紹了R的常用命令、失量賦值和運算、數(shù)據(jù)錄入和管理以及結(jié)果輸出等基本操作。進而用R軟件舉例介紹了生態(tài)學(xué)和

5、生物多樣性研究中常用的數(shù)據(jù)分布、方差分析、線性模型和最大似然估計等數(shù)據(jù)分析方法。并重點介紹了生態(tài)學(xué)和生物多樣性研究中常用的sem、smatr、ade4、vegan、ape、untb、bidiversityR等一些程序包的命令、用法和應(yīng)用前景。R軟件的迅速流行不僅僅是因為它在數(shù)據(jù)分析上的強大和靈活,更重要的是它可以將數(shù)據(jù)分析和作圖展現(xiàn)集成于一體,輸出高質(zhì)量圖片。為此,本文以Paul Murrell的R Graphics書為籃本,重點介紹了 R的基本作圖命令、方法和個性化拓展。并進一步簡單介紹了用ggplot、lattice和grid等一些程序包進行高級作圖方法。最后,本文也介紹了國外一些學(xué)習(xí)R的

6、網(wǎng)上資源,組織結(jié)構(gòu)和會議活動等。并呼吁在國內(nèi)生態(tài)學(xué)和生物多樣性研究中積極應(yīng)用R軟件。 貝葉斯推斷在生態(tài)學(xué)中的應(yīng)用及R2WinBUGS包介紹儲誠進(蘭州大學(xué)生命科學(xué)學(xué)院生態(tài)系)自然系統(tǒng)是復(fù)雜的,統(tǒng)計之目的就是要從復(fù)雜的現(xiàn)象中發(fā)現(xiàn)規(guī)律,探索機制。而我們常見的頻度(frequentist)統(tǒng)計手段盡管在生態(tài)學(xué)的發(fā)展歷史上功不可沒,但是許多時候都不能很好的解決自然系統(tǒng)復(fù)雜性問題,其將多種不確定性因子作為“噪音”(noise)包含在模型的殘差中,這導(dǎo)致一些情況下不可解釋的殘差太大,嚴重影響了對生態(tài)學(xué)現(xiàn)象的深入理解。貝葉斯層次模型是近年來興起的處理生態(tài)學(xué)復(fù)雜性的統(tǒng)計方法,與傳統(tǒng)的統(tǒng)計手段如線性回歸與方差分

7、析相比,能夠非常好在數(shù)據(jù)分析中包含多個不確定性因子,如個體間、物種間差異與空間異質(zhì)性等。通過超參數(shù),構(gòu)建不同層次的統(tǒng)計模型。對于某一參數(shù),綜合先驗知識(未獲取數(shù)據(jù)之前對參數(shù)的認識)與實驗數(shù)據(jù)(似然函數(shù)形式),從而得到該參數(shù)的后驗估計(經(jīng)過實驗數(shù)據(jù)校正后的參數(shù)值)。本文首先系統(tǒng)介紹了貝葉斯統(tǒng)計的基礎(chǔ),然后以Niklas等生物量分配數(shù)據(jù)為例,介紹了WinBUGS軟件進行貝葉斯分析的一般步驟,最后介紹了R2WinBUGS包,闡述如何綜合BUGS與R進行相關(guān)數(shù)據(jù)分析。模型中參數(shù)以概率分布的形式給出,因而很方便也很自然地得到參數(shù)的平均值和中位數(shù)以及對應(yīng)的區(qū)間估計等。不同于傳統(tǒng)統(tǒng)計中采用p值來觀察某實驗處

8、理的效果是否明顯,貝葉斯統(tǒng)計主要依賴于參數(shù)的可信區(qū)間(credible interval)進行相關(guān)的判斷?;趘egan包的多元統(tǒng)計分析 賴江山 (中國科學(xué)院植物研究所生物多樣性與生物安全研究組) 多元統(tǒng)計分析是群落生態(tài)學(xué)最常用分析方法,其核心部分是排序(ordination)。從群落學(xué)角度將,排序的過程是將樣方或植物種排列在一定的空間,使得排序軸能夠反映一定的生態(tài)梯度,從而,能夠解釋植被或植物種的分布與環(huán)境因子間的關(guān)系,也就是說排序是為了揭示植被-環(huán)境間的生態(tài)關(guān)系。能夠做排序的軟件比較多,其中使用最廣泛的是荷蘭著名生物統(tǒng)計學(xué)家TerBraak 編寫的CANOCO軟件。CANOCO容易操作,熟

9、悉過程比較快,為廣大的研究人員熟悉,估計90%用到排序的文章都是引用這個軟件。筆者曾經(jīng)編譯了Multivariate Analysis of Ecological Data using CANOCO(Jan Leps和 Petr Smilauer 著)部分章節(jié),并放在網(wǎng)上供下載,受到廣泛的關(guān)注。盡管CANOCO使用廣泛,操作簡單,但其最大的缺點就是本身是商業(yè)軟件,而且價格不菲,版本更新速度很慢。盡管有破解版或是過期版的可以用,但使用過程容易出問題,幫助內(nèi)容也不容易理解。這些缺點造就了R的Vegan包將可以取代CANOCO 的可能。Vegan是”Vegetation

10、 analysis”的縮寫, 專門是植被群落分析的軟件包(作者 Jari Oksanen )。Vegan 軟件包內(nèi)函數(shù)囊括了常用的排序方法,如PCA、CA、RDA和CCA等 ,還有很多方法是CANCO軟件里面沒有的,比如更多數(shù)據(jù)標準化的方法,顯示更多排序軸內(nèi)容,可以做三維排序圖等等。本報告將CANOCO里面的分析與Vegan里的函數(shù)做了對比,讓熟悉CANOCO的人能也能盡快熟悉R的函數(shù)?;贚me4包的混合效應(yīng)模型陳磊 (中國科學(xué)院植物研究所生物多樣性與生物安全研究組) 由于混合效應(yīng)模型在分析大量復(fù)雜數(shù)據(jù)方面具有較大優(yōu)勢,因此其在最近幾年受到了生態(tài)學(xué)研究者的關(guān)注。作為一個自由、免費、源代碼開放

11、的軟件,大量的軟件包被數(shù)學(xué)家開發(fā)并植入了R這個開放的平臺,其中Lme4 軟件包就是其中的一個專門用于分析混合效應(yīng)模型的特色軟件包。該軟件包由威斯康星大學(xué)麥迪遜分校的Douglas Bates教授牽頭組建,目前的最新版本是2010年8月19日發(fā)布的lme4_0.999375-35。該軟件包不僅能夠進行線性混合效應(yīng)模型的計算還能對廣義線性混合效應(yīng)模型以及非線性混合效應(yīng)模型進行參數(shù)估計。另外,該軟件還將MCMC(Markov Chain Monte Carlo)方法整合到了線性混合效應(yīng)模型的參數(shù)估計中,使用者能夠通過非常簡單的操作就能準確對待估參數(shù)的置信區(qū)間以及顯著度進行計算。與其他的混合效應(yīng)模型計

12、算軟件(如:SAS,SPASS等)相比,lme4軟件包無論在計算方法的多樣性、前沿性還是在可操作性方面都具有較大的優(yōu)勢?;赗的物種生態(tài)位進化分析摘要張金龍(中國科學(xué)院植物研究所生物多樣性與生物安全研究組)隨著標本數(shù)字化及文獻數(shù)字化的進行,物種的分布資料被陸續(xù)整理成物種分布數(shù)據(jù)庫。生態(tài)學(xué)家已經(jīng)開發(fā)出多種分布模型,以預(yù)測物種的潛在分布區(qū),包括Bio-Climate, GARP, Maxent等。以往的物種分布模型多沒有考慮到物種之間的進化關(guān)系。最近發(fā)展出的方法使得人們可以利用物種分布記錄和物種之間的系統(tǒng)發(fā)育關(guān)系,對物種的適應(yīng)性進化進行推斷。首先基于物種分布記錄,獲得該物種的潛

13、在分布區(qū),以獲得該種的適應(yīng)性范圍。獲得每個種的適應(yīng)性范圍后,即可利用系統(tǒng)發(fā)育比較方法中的祖先狀態(tài)重建來推斷各節(jié)點的狀態(tài),即相應(yīng)節(jié)點的適應(yīng)性范圍,從而獲得物種對各氣候因子的適應(yīng)性的分化情況。R的phyloclim程序包基于ape、adehabitat、ade4等程序包,可以完成上述分析,從而使得人們對物種進化過程的了解更加全面和深入。  R語言在地統(tǒng)計學(xué)中的應(yīng)用原作強 中科院沈陽應(yīng)用生態(tài)研究所地統(tǒng)計學(xué)是以區(qū)域化變量理論為基礎(chǔ),以變異函數(shù)為主要工具,研究那些在空間分布上既有隨機性又有結(jié)構(gòu)性,或空間相關(guān)和依賴性的自然現(xiàn)象的科學(xué)。如今,地統(tǒng)計學(xué)已經(jīng)被廣泛用于地理學(xué)、生態(tài)學(xué)、環(huán)境科學(xué)、土壤學(xué)等諸多領(lǐng)域。與傳統(tǒng)的地統(tǒng)計(如ArcGIS,GS+,ISATIS)軟件相比,R軟件具有免費、靈活、交互、可控性強等特點。本文以geoR和gstat包為基礎(chǔ),系統(tǒng)介紹了在地統(tǒng)計分析過程的幾個常見步驟(1)數(shù)據(jù)的建立及正態(tài)性檢驗,當數(shù)據(jù)不符合正態(tài)分布時如何進行Box-Cox轉(zhuǎn)換(2)模型建立過程中如何使用4種不同的方法,方便地從15個理論模型中選擇最優(yōu)的模型,并介紹如何通過轉(zhuǎn)置計算,得到半方差函數(shù)的包跡線(envelop),從而直觀的判斷數(shù)據(jù)點之間是否存在空間自相關(guān)關(guān)系(3)如何根據(jù)要求,任意選擇空間點差值(point interpolation)或面差值(areal interpolation

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論