R語言中的概率論和數(shù)理統(tǒng)計_第1頁
R語言中的概率論和數(shù)理統(tǒng)計_第2頁
R語言中的概率論和數(shù)理統(tǒng)計_第3頁
R語言中的概率論和數(shù)理統(tǒng)計_第4頁
R語言中的概率論和數(shù)理統(tǒng)計_第5頁
已閱讀5頁,還剩3頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、語中的概率論和數(shù)理統(tǒng)計錄1. 隨機變量2. 隨機變量的數(shù)字特征3. 極限定理、隨機變量隨機變量(random variable)表隨機現(xiàn)象各種結果的實值函數(shù)。隨機變量是定義在樣本空間S上,取值在實數(shù)域上的函數(shù),由于它的變量是隨機試驗的結果,隨機實驗結果的出現(xiàn)具有隨機性,因此,隨機變量的取值具有定的隨機性。#sample(x=x,size=5,replace=T)size“replace”就是重復的意思。即可以重復對元素進抽樣,也就是所謂的有放回抽樣。如果隨機變量X的全部可能的取值只有有限多個或可列窮多個,則稱X為離散型隨機變量。 S X S names(which.max(table(S)1

2、7#table()names()as.numeric()分別得到名稱和頻數(shù)x Freq1 a 422 b 253 c 33 table(S)S1 2 3 7 9 10 211 1 3 4 1 1 1在給定情形下可以達到的最數(shù)量或最數(shù)值在給定情形下可以達到的最數(shù)量或最數(shù)值是指將統(tǒng)計總體當中的各個變量值按順序排列起來,形成個數(shù)列,處于變量數(shù)列中間位置的變量值就稱為中位數(shù)于描述任何類型的數(shù)據(jù),尤其是偏態(tài)數(shù)據(jù)的離散程度,即將全部數(shù)據(jù)從到排列,正好排列在上1/4位置叫上四分位數(shù),下1/4位置上的數(shù)就叫做下四分位數(shù)R程序:計算樣本(1,2,3,4,5,6,7,8,9)的四分位數(shù)0% 25% 50% 75%

3、 100%13579fivenum(S)1 1 3 5 7 9R程序:計算樣本(1,2,3,4,5,6,7,8,9)的統(tǒng)計函數(shù)135579協(xié)差于衡量兩個變量的總體誤差。差是協(xié)差的種特殊情況,即當兩個變量是相同的情況。設X,Y為兩個隨機變量,稱EX-E(X)Y-E(Y)為X和Y的協(xié)差,記錄Cov(X,Y)。R程序:計算X(1,2,3,4)和Y(5,6,7,8)的協(xié)差1 1.666667(Correlationcoefficient)相關系數(shù)是以反映變量之間相關關系密切程度的統(tǒng)計指標。相關系數(shù)是按積差法計算,同樣以兩變量與各平均值的離差為基礎,通過兩個離差相乘來反映兩變量之間相關程度。當Var(X

4、)0,Var(Y)0時,稱Cov(X,Y)/sqrt(Var(X)*Var(Y)為X與Y的相關系數(shù)。R程序:計算X(1,2,3,4)和Y(5,7,8,9)的相關系數(shù)1 0.9827076 均值和差分別就是階原點矩和階中矩,具體定義和概念,可詳見陳希孺概率論與數(shù)理統(tǒng)計P132-133是統(tǒng)計數(shù)據(jù)分布偏斜向和程度的度量,是統(tǒng)計數(shù)據(jù)分布對稱程度的數(shù)字特征。設分布函數(shù)F(x)有中矩2=E(XE(X)2, 3 = E(XE(X)3,則Cs=3/2(3/2)為偏度系數(shù)。當Cs0時,概率分布偏向均值右則,Cs library(PerformanceAnalytics) S skewness(S)#hist()

5、 函數(shù):繪制直圖 表征概率密度分布曲線在平均值處峰值低的特征數(shù)。峰度刻劃不同類型的分布的集中和分散程序。設分布函數(shù)F(x)有中矩2=E(XE(X)2, 4=E(X E(X)4,則Ck=4/(u22-3)為峰度系數(shù)。R語:計算10000個正態(tài)分布的樣本的峰度,(同偏度的樣本數(shù)據(jù))1 -0.02443549hist(S,breaks=100) matrix)可以理解成不同維度上的協(xié)差V1V2V1V2V1 1.13470650 -0.09292042V2 -0.09292042 1.03172261V1V2V1 1.13470650 -0.09292042V2 -0.09292042 1.03172

6、261三、極限定理引:我們知道,隨機現(xiàn)象的統(tǒng)計性規(guī)律是在相同條件下進量重復試驗時呈現(xiàn)出來的,常見的兩種統(tǒng)計規(guī)律性為:頻率的穩(wěn)定性,即在量重復試驗中,事件發(fā)的頻率總是在它的概率附近擺動,且隨著試驗次數(shù)的增多,該頻率總是越來越明顯地穩(wěn)定在其概率附近;平均值的穩(wěn)定性,即在多次重復測量中,測量平均值總是在它的真實值附近擺動,且隨著測量次數(shù)的增加,測量平均值總是越來越明顯地穩(wěn)定在其真實值附近。對以上兩種規(guī)律,們不僅研究觀測值趨向于哪個穩(wěn)定值,且還分析了觀測值在穩(wěn)定值周圍的擺動形式(分布情況)。針對觀測值趨向于哪個穩(wěn)定值,數(shù)學語及理論來分析研究,就引出了數(shù)定律。其中關于頻率穩(wěn)定性的數(shù)定律稱為伯努利數(shù)定律,

7、關于均值穩(wěn)定性的數(shù)定律稱為欽數(shù)定律。針對觀測值在穩(wěn)定值周圍的擺動形式,數(shù)學理論進研究,就得出了中極限定理所謂的中極限定理,就是把和的分布收斂于正態(tài)分布的那些定理的個統(tǒng)稱。注在概率論中,“定律”與“定理”是樣的意思“定理”般于指那些能數(shù)學具嚴格證明的結論;“定律”是指們通過觀察分析得出來種經(jīng)驗結論,如頓三定律,熱學定律等因為概率論中的“數(shù)定律”不僅是在實踐中總結出來的經(jīng)驗結論,且也可以數(shù)學具嚴格地去證明,所以叫“數(shù)定律”或叫“數(shù)定理”都可以。R語:假設投硬幣,正概率是0.5,投4次時,計算得到2次正的概率?根據(jù)數(shù)定律,如果投是10000次,計算5000次正的概率?#2次正的的概率 choose(

8、4,2)/24 #choose42個1 0.375#pbinom5000100000.5(central 中極限定理是概率論中的組定理。中極限定理說明,量相互獨的隨機變量,其均值的分布以正態(tài)分布為極限。是棣莫佛拉普拉斯定理的擴展,討論獨同分布隨機變量序列的中央極限定理。它表明,獨同分布、且數(shù)學期望和差有限的隨機變量序列的標準化和以標準正態(tài)分布為極限:-棣莫佛-拉普拉斯(de Moivre - Laplace)定理是中央極限定理的最初版本,討論了服從項分布的隨機變量序列。它指出,參數(shù)為n,p的項分布以n為均值、n(1-)為差的正態(tài)分布為極限。R語:中極限定理模擬,從指數(shù)分布到正態(tài)分布clt.ani()#1.libraryrequirelibraryrequire則會繼續(xù)執(zhí)。ervala positive number to set the time interval of the animation (unit in seconds); default to be 1.3.nmaxmaximum number of steps in a loop (e.g. iterations) to create animation frames. Note: the actual number of fra

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論