環(huán)境數理統(tǒng)計-緒論_第1頁
環(huán)境數理統(tǒng)計-緒論_第2頁
環(huán)境數理統(tǒng)計-緒論_第3頁
環(huán)境數理統(tǒng)計-緒論_第4頁
環(huán)境數理統(tǒng)計-緒論_第5頁
已閱讀5頁,還剩16頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、 環(huán)境與生態(tài)統(tǒng)計-R語言的應用 Song S. Qian著曾思育譯 高等教育出版社2011年 環(huán)境統(tǒng)計學與MATLAB應用 聶慶華 Keith C. Clarke編著 高等教育出版社 2010年 環(huán)境統(tǒng)計分析 楊曉華 劉瑞民 曾勇編著 北京師范大學出版社 環(huán)境數據統(tǒng)計分析基礎 程子峰等編著 化學工業(yè)出版社 2006年 數據的收集、整理和描述 概率論基本概念和統(tǒng)計學基礎 總體參數的估計 總體參數的假設性檢驗 非參數檢驗方法 方差分析 回歸分析(一元線性與非線性回歸) 時間序列分析初步* 你想過下面的問題嗎? 如何通過問卷調查來得到性別、年齡、職業(yè)、收入等各種因素與公眾對建設項目的環(huán)境保護的態(tài)度的

2、關系呢? 如何通過已有的環(huán)境監(jiān)測的歷史數據對環(huán)境質量未來的發(fā)展趨勢進行預測呢? 如何才能客觀地反映我們所居住的環(huán)境的質量的優(yōu)劣呢? 通過對比國民經濟和社會發(fā)展數據和環(huán)境質量數據,如何尋找兩者(或多者)之間的聯系? 統(tǒng)計是什么? 其實,這些都是統(tǒng)計應用的例子。這樣的例子太多了,無法一一列舉。因為統(tǒng)計學可以應用于幾乎所有的領域。 上面的例子并沒有明確說出什么是統(tǒng)計。其實很簡單。上面的所有例子都要通過各種直接或間接的手段來收集數據(data);都要利用一些方法來整理和分析數據;最后通過分析得到結論。 因此,統(tǒng)計學(statistics)是用以收集數據分析數據和由數據得出結論的一組概念、原則和方法。

3、現實中的隨機性和規(guī)律性 從中學起,我們就知道自然科學的許多定律,例如物理中的牛頓三定律,物質不滅定律以及化學中的各種定律等。 但是在許多領域,很難用如此確定的公式或論述來描述一些現象。比如,人的壽命是很難預先確定的。一個吸煙、喝酒、不鍛煉的人可能比一個很少得病、生活習慣良好的人活得長。因此,可以說,活得長短有一定的隨機性(randomness)。這種隨機性可能和人的經歷、基因、習慣等無數不易說清的因素都有關系。 但是從總體來說,我國公民的平均預期壽命卻是非常穩(wěn)定的,而且由于生活水平提高在逐步增長;比如1996年平均預期壽命為70.80歲,而2000年為71.40歲。這就是規(guī)律性。一個人可能活過

4、這個平均年齡,也可能活不到這個年齡,這是隨機的。但是總體來說,預期壽命的穩(wěn)定性,卻說明了隨機之中有規(guī)律性。這種規(guī)律就是統(tǒng)計規(guī)律。 概率和機會 你可能經常聽到概率(probability)這個名詞。最常見的是在天氣預報中提到的降水概率。大家都明白,如果降水概率是百分之九十,那就很可能下雨;但如果是百分之十,就不大可能下雨。因此,從某種意義說來,概率描述了某件事情發(fā)生的機會。顯然,這種概率不可能超過百分之百,也不可能少于百分之零。換言之,概率是在0和1之間(也可能是0或1)的一個數,說明某事件發(fā)生的機會有多大。 有些概率是無法精確推斷的。比如你對別人說你下一個周末去公園的概率是百分之八十。有些概率

5、是可以大體知道的。比如擲骰子。這也說明隨機結果也具有規(guī)律;而且有可能通過試驗等方法來推測其規(guī)律。 變量和數據 比如一個班上注冊的學生有200人,這是一個固定的數目,稱為常數(constant)或者常量。但是,如果猜測今天這個班有多少人會來上課,那就沒準了。這有隨機性??赡苡姓埐〖倩蚴录俚模部赡苡刑诱n的。這樣,就要來上課的人數是個變量(variable)。 當變量按照隨機規(guī)律所取的值是數量時該變量稱為定量變量或數量變量(quantitative variable);因為是隨機的,也稱為隨機變量(random variable)。 象性別,觀點之類的取非數量值的變量就稱為定性變量或屬性變量或分類

6、變量(qualitative variable,categorical variable)。 什么是數據 有了變量的概念,什么是數據呢?拿擲骰子來說,擲骰子會得到什么值,是個隨機變量;而每次取得1至6點中任意某點數的概率在理論上都是六分之一(如果骰子沒有作假)。這依賴于在擲骰子背后的理論或假定;而在實際擲骰子過程中,如果擲100次,會得到100個由1至6點組成的數字串;再擲100次,又得到一個數字串,和前一次的結果多半不一樣。這些試驗結果就是數據。 所以說數據是關于變量的觀測值。 通過數據可以驗證有關的理論或假定。 定量變量間的關系 19892000年成都市經濟增長和水環(huán)境污染水平時間1989

7、19901991199219931994經濟增長(元)171519242232278938834854水環(huán)境污染水平0.0770.3110.8180.6921.2800.417時間199519961997199819992000經濟增長(元)7388890610224111031189713020水環(huán)境污染水平0.624-0.192-0.040-1.638-0.882-1.470成都市地表水環(huán)境庫茲涅茨曲線水質污染程度 人均國民生產總值(元)02000400060008000100001200014000-2.0-1.5-1.0-0.50.00.51.01.5 Y =0.03693+3.014

8、86E-4 X-3.35826E-8 X2R2=0.8014觀測值折線圖擬合的環(huán)境庫茲涅茨曲線 可以看到的: 兩個變量是否有關系? 如果有關系,它們的關系是否顯著? 它是一個什么關系?(線性/非線性) 這個關系是否帶有普遍性? 這個關系是否為因果關系? 關系一詞是沒有嚴格的統(tǒng)計定義的,一個類似的描述術語叫“相關”。 定性變量間的關系 下面是對123人進行關于某項政策調查所得結果的一個簡單的三維表,它顯示了人們的收入和性別對該項政策的觀點。 不同收入和不同性別人群對某項政策的觀點觀點:反對觀點:支持性別低收入中收入高收入低收入中收入高收入男581020105女27925157 統(tǒng)計、計算機與統(tǒng)計

9、軟件 現代生活越來越離不開計算機了。最早使用計算機的統(tǒng)計當然更離不開計算機了。事實上,最初的計算機僅僅是為科學計算而設計和建造的。 計算機的最早一批用戶就包含統(tǒng)計?,F在,統(tǒng)計仍然是進行數字計算最多的用戶。 當然計算機現在早已脫離了僅有數字計算功能的單一模式,而成為百姓生活的一部分。計算機的使用,也從過去必須學會計算機語言到只需要“傻瓜式”地點擊鼠標。結果也從單純的數字輸出到包括漂亮的表格和圖形在內的各種形式。 統(tǒng)計、計算機與統(tǒng)計軟件 統(tǒng)計軟件的發(fā)展,也使得統(tǒng)計從統(tǒng)計學家的圈內游戲變成了大眾的游戲。只要輸入你的數據,點幾下鼠標,做一些選項,馬上就得到令人驚嘆的漂亮結果了。人們可能會問,是否傻瓜式

10、統(tǒng)計軟件的使用可以代替統(tǒng)計課程了?當然不是。 數據的整理和識別,方法的選用,計算機輸出結果的理解都不象使用傻瓜相機那樣簡單可靠。有些諸如法律和醫(yī)學方面的軟件都有不少警告,不時提醒你去咨詢專家。但統(tǒng)計軟件則不那么負責。只要數據格式無誤、選項不矛盾而且不用零作為除數就一定給你結果,而且?guī)缀鯖]有任何警告。 統(tǒng)計、計算機與統(tǒng)計軟件 另外,統(tǒng)計軟件輸出的結果太多;即使是同樣的方法,不同軟件輸出的內容還不一樣,有時同樣的內容名稱也不一樣。這就使得使用者大傷腦筋。 即使是統(tǒng)計學家也不一定能解釋所有的輸出。因此,就應該特別留神,明白自己是在干什么。不要在得到一堆毫無意義的垃圾之后還沾沾自喜。 統(tǒng)計、計算機與統(tǒng)

11、計軟件 統(tǒng)計軟件的種類很多。有些功能齊全,有些價格便宜;有些容易操作,有些需要更多的實踐才能掌握。還有些是專門的軟件,只處理某一類統(tǒng)計問題。面對太多的選擇往往給決策帶來困難。這里介紹最常見的幾種。 SPSS: 這是一個很受歡迎的統(tǒng)計軟件;它容易操作,輸出漂亮,功能齊全,價格合理。它也有自己的程序語言,但基本上已經“傻瓜化”。它對于非專業(yè)統(tǒng)計工作者是很好的選擇。 Excel: 它嚴格說來并不是統(tǒng)計軟件,但作為數據表格軟件,必然有一定統(tǒng)計計算功能。而且凡是有Microsoft Office的計算機,基本上都裝有Excel。 但要注意,有時在裝Office時沒有裝數據分析的功能,那就必須裝了才行。當

12、然,畫圖功能是已經具備的了。對于簡單分析,Excel還算方便,但隨著問題的深入,Excel就不那么“傻瓜”,需要使用宏命令來編程;這時就沒有相應的簡單選項了。 多數專門一些的統(tǒng)計推斷問題還需要其他專門的統(tǒng)計軟件來處理。 SAS: 這是功能非常齊全的軟件;盡管價格相當不菲,許多公司,特別是美國制藥公司都在使用,這多半因為其功能眾多和某些美國政府機構一些人的偏愛。盡管現在已經盡量“傻瓜化”,但仍然需要一定的訓練才可以進入。也可以對它編程;但對于基本統(tǒng)計課程則不那么方便。 MATLAB: 這也是應用于各個領域的以編程為主的軟件,在工程上應用廣泛。不僅由于其功能齊全,而且由于其強大而又方便的編程功能,使得研究人員可以編制他們的程序來實現其自己創(chuàng)造的理論和方法。但是統(tǒng)計函數不多。 R語言 這是一款專用于數理統(tǒng)計和數據處理的自由軟件,由專業(yè)人員維護。 不僅由于其功能齊全,而且由于其強大而又方便的編程功能,使得研究人員可以編制他們的程序來實現其自己創(chuàng)造的理論和方法。 使用上對R語言有一定要求,比商業(yè)軟件的使用復雜,有難度。 下載地址:/ 這一章主要描述了統(tǒng)計領域的輪廓,還說明了隨機性所可能包含的規(guī)律性。概率是對不確定性的度量。統(tǒng)計研究的對象是變量。有了變量,特別是隨機變量,才能夠有目的地收集與該變量有關的數據,對數據進行分析,并且得到人們感興趣

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論