統(tǒng)計概念及基本統(tǒng)計量_第1頁
統(tǒng)計概念及基本統(tǒng)計量_第2頁
統(tǒng)計概念及基本統(tǒng)計量_第3頁
統(tǒng)計概念及基本統(tǒng)計量_第4頁
統(tǒng)計概念及基本統(tǒng)計量_第5頁
已閱讀5頁,還剩80頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

統(tǒng)計學(xué)是什么?統(tǒng)計學(xué)是對令人困惑費解的問題作出數(shù)字設(shè)想的藝術(shù)?!洞笥倏迫珪分赋觯骸敖y(tǒng)計學(xué)是一門收集數(shù)據(jù)、分析數(shù)據(jù)、并根據(jù)數(shù)據(jù)進行推斷的藝術(shù)和科學(xué)〞。案例1當你告訴他們你已經(jīng)交上一個新朋友時,他們決不會問你任何有關(guān)根本領(lǐng)宜的問題。他們不會對你說:“他的聲音像誰?最喜歡什么游戲?他收集蝴蝶嗎?〞,取而代之,他們會問:“他有多大年齡?有幾個兄弟?體重有多少?他的父親掙多少錢?〞

僅僅從這些數(shù)字,他們才認為已經(jīng)了解了有關(guān)他的一切。身高?體重?錢?案例2吸煙導(dǎo)致肺癌,抗生素治療胃潰瘍,鍛煉有助于預(yù)防心臟病……我們怎么知道這些?因為科學(xué)家有統(tǒng)計數(shù)據(jù)證明。案例3市場調(diào)查和分析人才依托自己的市場學(xué)知識,通過自己掌握的調(diào)查工具和手段,對所關(guān)注的行業(yè)進行調(diào)查,并依據(jù)調(diào)查的結(jié)果進行分析。整個工作過程涵蓋了統(tǒng)計學(xué)、經(jīng)濟學(xué)等多方面的知識。因此,統(tǒng)計學(xué)的獨特之處在于,它能對不確定性進行量化,使其精確。統(tǒng)計的含義統(tǒng)計一詞通常有三種含義:即統(tǒng)計工作、統(tǒng)計資料、統(tǒng)計學(xué)。統(tǒng)計工作是對社會、經(jīng)濟以及自然現(xiàn)象的總體數(shù)量方面進行搜集、整理和分析過程的總稱;統(tǒng)計資料是統(tǒng)計工作的成果,即是通過統(tǒng)計工作所取得的各種數(shù)字資料及與之相關(guān)的其它資料的總稱;統(tǒng)計資料也即統(tǒng)計信息,包括人口信息、根本單位信息、固定資產(chǎn)信息、宏觀經(jīng)濟信息等,是國家和地區(qū)的最根底、最重要的信息資源。統(tǒng)計學(xué)是一門系統(tǒng)地論述統(tǒng)計理論和方法的科學(xué);它們既有區(qū)別又有聯(lián)系:統(tǒng)計學(xué)與統(tǒng)計工作是理論與實踐的關(guān)系,而統(tǒng)計工作的成果便是統(tǒng)計資料。統(tǒng)計研究的基本方法大量觀察法統(tǒng)計分組法綜合指標法420-2-4-6-8-10400,000300,000200,000100,0000年距今溫度距平(℃)目前的CO2濃度是42萬年的最大值南極東方站〔Vostok〕測量的大氣CO2濃度變化300275250225200175150325濃度CO2(ppmv)氣候變化與人類活動相關(guān)南極LawDome冰芯資料顯示近1000年大氣CO2濃度,工業(yè)化〔1750年〕以來,明顯增加10001200140016001800年2000280300320340360濃度(ppmv)CO2氣候變化與人類活動相關(guān)近年來,CO2持續(xù)增加:1970-2004年增加了70%預(yù)計2030年將比2000年增加45-110%氣候變暖與人類活動相關(guān)379ppmv夏威夷MaunaLoa觀象臺測量的大氣CO2濃度變化(KeelingandWhorf,2004)增溫氣候變化與人類活動有關(guān)(IPCCAR4,2007)最近100年是過去1000年中最暖的最近20年是過去100年中最暖的

2006年中國的極端天氣氣候事件5.春季森林火險等級高雷擊引發(fā)大興安嶺特大森林火災(zāi)3.強熱帶風(fēng)暴“碧利斯”橫掃我國南方七?。▍^(qū))

2.百年一遇超強臺風(fēng)“桑美”登陸

10.

12月太陽連續(xù)強烈爆發(fā)8.夏季暴雨洪澇福建高考延期

4.重慶、四川歷史罕見高溫伏旱

9.北方出現(xiàn)14年來最嚴重的酸雨

7.暴雪阻旅客春節(jié)返鄉(xiāng)6.強沙塵暴頻襲我國北方北京一夜降塵33萬噸6969R691.2006年是我國1951年以來最暖的一年氣候變化是什么?平均值離差值四川近50年來氣候變化情況

—2006年全省年平均氣溫17.1℃,比常年值偏高1.1℃,是氣象記錄以來最高的一年—年平均氣溫已連續(xù)10年高于常年—1997年全省降水量795mm,是1961年最少年份—2006年全省年平均降水量807mm,較常年偏少16%,是1961年以來次少年份

2006年重慶、四川遭遇歷史罕見高溫伏旱

2006年夏季,重慶遭遇了百年一遇特大伏旱,四川出現(xiàn)1951年以來最嚴重伏旱。6月1日-8月21日,重慶、四川平均降水量為345.9mm,是1951年以來歷史同期最小值年均氣溫變化曲線與演變趨勢線、5次多項式擬合線〔a九寨溝;b松潘縣;c假設(shè)爾蓋;d紅原〕概率統(tǒng)計的認識思想認識世界的思想方法哲學(xué)的認識和描述,文學(xué)的描述,經(jīng)驗認識數(shù)學(xué)的認識和描述數(shù)學(xué)認識世界研究世界的兩種主要方法微積分式確實定性認識方法大數(shù)的概率統(tǒng)計方法這兩種方法是氣象研究和氣象預(yù)報中都需要的,本質(zhì)上說,由于大氣及其氣象要素場時空變化的隨機性特征,可能概率統(tǒng)計方法更為根本些概率統(tǒng)計是許多氣象專業(yè)課程的根底,(也是其他許多專業(yè)問題的認識根底)統(tǒng)計天氣預(yù)報,中長期天氣預(yù)報,天氣學(xué),氣候?qū)W等概率統(tǒng)計認識問題的思路大量隨機現(xiàn)象(無序數(shù)據(jù))出現(xiàn)的概率(頻率)局部數(shù)據(jù)的統(tǒng)計推斷(推斷全體特征)推斷結(jié)果的檢驗(點估計,假設(shè)檢驗)建立方程(確定性)注釋:混沌-確定性和隨機性的橋梁氣象實踐:集合預(yù)報統(tǒng)計天氣學(xué)的學(xué)習(xí)目標氣象統(tǒng)計分析-氣象數(shù)據(jù)的規(guī)律統(tǒng)計天氣預(yù)報-對未來天氣的預(yù)測大綱第一章氣象資料及其整理§1、氣象資料的表示〔了解〕§2、根本統(tǒng)計量〔掌握〕§3、統(tǒng)計量的檢驗〔掌握〕§1、氣象資料的表示一、氣象資料根本理念氣象問題的分析和預(yù)報需要依據(jù)大量的氣象觀測資料某個氣象要素及其變化可看成一個變量或隨機變量要素資料全部稱為全體,能收集到的局部資料稱為樣本統(tǒng)計學(xué)的根本內(nèi)容利用統(tǒng)計學(xué)方法對樣本進行分析,估計和推測總體的規(guī)律性§1、氣象資料的表示二、單個變量的表示單個氣象要素(研究總體),x樣本〔某一時間段或空間的資料〕n樣本容量時間序列(隨時間變化的數(shù)據(jù)序列)t=1,2,……n…變量類型連續(xù)型隨機變量如T,P等離散型隨機變量如冰雹,暈,華,云等,可用0,1或分級數(shù)值化變量類型可互相轉(zhuǎn)化連續(xù)—離散規(guī)定臨界值T0,如大于臨界值記為1,小于那么記為0離散—連續(xù)將有,無等記為1,0或0,1,2,3,…

§1、氣象資料的表示二、單個變量的表示三、多個變量的表示§1、氣象資料的表示多個變量:多個氣象要素資料多個變量資料:多個要素某段時間的資料向量表示矩陣表示資料陣向量表示——p個變量,n個樣本第i個變量第j個時刻矩陣表示——橫資料陣,豎資料陣資料陣——北京氣溫資料〔可構(gòu)成各種形式的資料陣〕第一章氣象資料及其整理§1、氣象資料的表示〔了解〕§2、根本統(tǒng)計量〔掌握〕§3、統(tǒng)計量的檢驗〔掌握〕幾類根本統(tǒng)計量概況平均值-總趨勢標準差和方差協(xié)方差和相關(guān)系數(shù)峰度系數(shù)和偏度系數(shù)§2、根本統(tǒng)計量一、平均值-總趨勢平均值的含義統(tǒng)計描述:描述資料數(shù)字平均狀態(tài)的統(tǒng)計量。變量〔要素〕總體數(shù)學(xué)期望的一個估計值。無偏估計〔量〕值。意義描述:總趨勢,集中度,集中性意義理解:大多數(shù),中位§2、根本統(tǒng)計量平均值的計算考慮樣本的權(quán)重:權(quán)重平均值樣本的權(quán)重相同:算術(shù)平均值根據(jù)意義計算:中位數(shù),眾數(shù)一、平均值-總趨勢§2、根本統(tǒng)計量一般平均值〔權(quán)重〕算術(shù)平均值統(tǒng)計中平均值的表示單個要素向量表示橫資料陣n個元素為1組成的列向量例如對12月、1月、2月北京氣溫,其平均向量可利用表1.1的資料組成的矩陣算得要素資料增加時平均值的計算其中xn+1為增加一個資料時變量的實測值。因為據(jù)平均值定義有距平:異常,對平均值的正常情況的偏差。資料計算中表示某一數(shù)值與平均值之差。距平公式單變量樣本(序列)中每個樣品資料點的距平值組成的序列稱為距平序列,某一變量距平序列也可以用距平向量記為:距平變量為:由p個要素(變量)的距平值的資料用橫的次序排列組成的資料陣稱為橫距平資料陣,記為距平性質(zhì):距平變量的平均值為0對于使用距平變量,其平均值為0的證明如下:距平變量的意義可濾去平均值,使各變量在同一水平上進行比較;各變量的平均值為0,可帶來研究上的方便和計算上的方便;可作為預(yù)報值,其偏高或偏低值更加直觀。二、標準差和方差-差異的平均差異的含義最大、最小,最大-最小與平均趨勢的差異:距平差異的總趨勢:差異的平均意義差異的標準或標準的差異:標準差和方差差異的表示最大差異個別差異:距平差異的趨勢:總體差異,即差異的總和問題:總和為0解決方法:首先認為正負差異都是差異,都不能忽略;然后所有的差異都應(yīng)該相加并不能抵消標準差:描述樣本中資料與平均值差異的平均狀況的統(tǒng)計量,衡量了資料圍繞平均值的平均變化幅度。標準差的平方,稱之為方差。標準差和方差的計算:例多個變量第k個變量的方差〔距平向量〕xdk=(xdk1xdk2…xdkn)。x’dk為xdk的轉(zhuǎn)置。12月氣溫隨時間變化幅度比1月大要素資料增加時方差的計算方差的無偏估計量作為總體方差的無偏估計量氣象中常用作為總體的方差估計量,但在顯著性檢驗中無偏估計量亦常用。標準化變量:能在同一水平上比較的變量變量性質(zhì)標準化變量的平均值為0,即標準化變量的方差為1例三、協(xié)方差與相關(guān)系數(shù)意義:衡量任意兩個氣象要素或變量之間關(guān)系的統(tǒng)計量。——協(xié)方差和相關(guān)系數(shù)協(xié)方差數(shù)學(xué)及統(tǒng)計含義數(shù)學(xué)公式協(xié)方差亦可記為兩個變量距平向量的內(nèi)積,即為協(xié)方差的統(tǒng)計意義:反映兩個氣象要素異常關(guān)系的平均狀況。用距平的正負反映要素的變化方向用不同要素距平的乘積的正負符號反映兩者之間的聯(lián)系方向或趨勢xk如果代表前冬某一個月平均溫度;xl代表后冬其一個月平均溫度,前冬溫度出現(xiàn)負距平的時候,后冬就出現(xiàn)正距平;前冬溫度出現(xiàn)正距平的時候,后冬就出現(xiàn)負距平。相反變化的關(guān)系相反,兩個序列距平乘積值之平均必為一個正值。增加一個樣本時協(xié)方差的計算公式協(xié)方差表征了兩個變量變化的正、負相互關(guān)系。變量自身對自身的協(xié)方差就是該變量的方差。相關(guān)系數(shù)數(shù)學(xué)及統(tǒng)計意義數(shù)學(xué)公式消去常數(shù)1/n即得用距平向量形式可表示為性質(zhì):〔1〕變量自身對自身的相關(guān)系數(shù)為1〔2〕相關(guān)系數(shù)絕對值變化在0~1之間如果已經(jīng)計算第k個變量與第l個變量的協(xié)方差對兩個變量距平交叉積之和時標準化變量的方差〔3〕增加一個樣本時的相關(guān)系數(shù)計算協(xié)方差及相關(guān)系數(shù)的計算協(xié)方差陣和相關(guān)系數(shù)陣skl元素表示第k個變量與第l個變量的協(xié)方差rk1為第k個變量與第l個變量的相關(guān)系數(shù)協(xié)方差陣和相關(guān)系數(shù)陣協(xié)方差陣還可以用橫距平資料陣表示為協(xié)方差陣和相關(guān)系數(shù)陣的計算分級相關(guān)系數(shù)實際需要分級相關(guān)系數(shù)三類公式分級相關(guān)系數(shù)數(shù)據(jù)分級的方法分為n級四、自協(xié)方差和自相關(guān)系數(shù)含義公式衡量氣象要素不同時刻之間的關(guān)系密切程度的量是自協(xié)方差和自相關(guān)系數(shù)。時間間隔τ(τ=t2一t1,設(shè)t2>t1)的自協(xié)方差為

τ亦稱時間落后步長。當τ為正整數(shù)時,稱為落后相關(guān)系數(shù);反之那么為超前相關(guān)系數(shù)。對應(yīng)的自相關(guān)系數(shù)為12月的方差五、峰度系數(shù)和偏度系數(shù)意義公式峰度系數(shù),偏度系數(shù)K階中心距二階中心矩就是上面提到的方差;三階中心矩是用來描述變量概率密度分布非對稱性的,如果其計算值為正值,說明密度分布曲線的峰點在平均值的左方,反之亦然;四階中心矩用來描述分布曲線的陡度,如果其計算值小,反映觀測值與平均值靠近,分布曲線就比較陡,反之,那么說明分布曲線平緩。對遵從正態(tài)分布的變量而言,對應(yīng)的偏度和峰度值應(yīng)為零。因此,可以通過計算某一氣象要素的偏度和峰度值,考察它們偏離零的程度,以便確定它們是否遵從正態(tài)分布。K階中心距第一章氣象資料及其整理§1、氣象資料的表示〔了解〕§2、根本統(tǒng)計量〔掌握〕§3、統(tǒng)計量的檢驗〔掌握〕§3、統(tǒng)計量的檢驗統(tǒng)計結(jié)果是否具有普遍意義?會不會是隨機抽樣的偶然性的結(jié)果?顯著性檢驗一、平均值的顯著性檢驗大樣本檢驗(統(tǒng)計量近似遵從正態(tài)分市)小樣本檢驗(統(tǒng)計量遵從t分布)在氣象上,大多使用t分布統(tǒng)計量?!?、統(tǒng)計量的檢驗一、平均值的顯著性檢驗統(tǒng)計量§3、統(tǒng)計量的檢驗遵從自由度為n-1的t分布,其中假設(shè)t>tα,就拒絕原假設(shè),認為x0與其它年份有顯著差異。一、平均值的顯著性檢驗例如 對北京1月氣溫,要檢驗1976年的月平均氣溫值是否與其它年份有顯著不同。計算其余年份樣本平均值及標準差,據(jù)(1.6)與(1.9)式有§3、統(tǒng)計量的檢驗一、平均值的顯著性檢驗例如

§3、統(tǒng)計量的檢驗一、平均值的顯著性檢驗 即sn=1.06。將此代入(1.23)式,計算得 從附表(t分布)中查得在5%顯著水平、自由度為30-1時的臨界值tα

=,§3、統(tǒng)計量的檢驗|t|>tα

,故認為1976年1月氣溫與其它年份有顯著差異。2.045一、平均值的顯著性檢驗用標準化值進行直接比較來檢驗對上面一例,計算得§3、統(tǒng)計量的檢驗顯然||>tza、故認為1976年1月氣溫是異常的。二、兩組樣本平均值差異的顯著性檢驗

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論