版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、目錄1. 基本計(jì)算2. 三角函數(shù)計(jì)算3. 復(fù)數(shù)計(jì)算4. 方程計(jì)算1 基本計(jì)算四則運(yùn)算: 加減乘除, 余數(shù), 整除, 絕對(duì)值, 判斷正負(fù)> a<-10;b<-5# 加減乘除> a+b;a-b;a*b;a/b1 151 51 501 2# 余數(shù),整除> a%b;a%/%b1 01 2# 絕對(duì)值> abs(-a)1 10# 判斷正負(fù)> sign(-2:3)1 -1 -1 0 1 1 1數(shù)學(xué)計(jì)算: 冪, 自然常用e的冪, 平方根, 對(duì)數(shù)> a<-10;b<-5;c<-4# 冪> cb;c-b;c(b/10)1 10241 0.00
2、097656251 2# 自然常數(shù)e> exp(1)1 2.718282# 自然常數(shù)e的冪> exp(3)1 20.08554# 平方根> sqrt(c)1 2# 以2為底的對(duì)數(shù)> log2(c)1 2# 以10為底的對(duì)數(shù)> log10(b)1 0.69897# 自定義底的對(duì)數(shù)> log(c,base = 2)1 2# 自然常數(shù)e的對(duì)數(shù)> log(a,base=exp(1)1 2.302585# 指數(shù)對(duì)數(shù)操作> log(ab,base=a)1 5> log(exp(3)1 3比較計(jì)算: =, >, <, !=, <=, &
3、gt;=, isTRUE, identical> a<-10;b<-5# 比較計(jì)算> a=a;a!=b;a>b;a<B;A<=B;A>=c1 TRUE1 TRUE1 TRUE1 FALSE1 FALSE1 TRUE# 判斷是否為TRUE> isTRUE(a)1 FALSE> isTRUE(!a)1 FALSE# 精確比較兩個(gè)對(duì)象> identical(1, eger(1)1 FALSE> identical(NaN, -NaN)1 TRUE> f <- function(x) x> g <
4、;- compiler:cmpfun(f)> identical(f, g)1 TRUE邏輯計(jì)算: &, |, &&, |, xor> x<-c(0,1,0,1)> y<-c(0,0,1,1)# 只比較第一個(gè)元素 &&, |> x && y;x | y1 FALSE1 FALSE# S4對(duì)象的邏輯運(yùn)算,比較所有元素 &, |> x & y;x | y1 FALSE FALSE FALSE TRUE1 FALSE TRUE TRUE TRUE# 異或> xor(x,y)1 FA
5、LSE TRUE TRUE FALSE> xor(x,!y)1 TRUE FALSE FALSE TRUE約數(shù)計(jì)算: ceiling,floor,trunc,round,signif# 向上取整> ceiling(5.4)1 6# 向下取整> floor(5.8)1 5# 取整數(shù)> trunc(3.9)1 3# 四舍五入> round(5.8)# 四舍五入,保留2位小數(shù)> round(5.8833, 2)1 5.88# 四舍五入,保留前2位整數(shù)> signif(5990000,2)1 6e+06數(shù)組計(jì)算: 最大, 最小, 范圍, 求和, 均值, 加權(quán)平
6、均, 連乘, 差分, 秩,,中位數(shù), 分位數(shù), 任意數(shù),全體數(shù)> d<-seq(1,10,2);d1 1 3 5 7 9# 求最大值,最小值,范圍range> max(d);min(d);range(d)1 91 11 1 9# 求和,均值> sum(d),mean(d)1 251 5# 加權(quán)平均> weighted.mean(d,rep(1,5)1 5> weighted.mean(d,c(1,1,2,2,2)1 5.75# 連乘> prod(1:5)1 120# 差分> diff(d)1 2 2 2 2# 秩> rank(d)1 1 2
7、 3 4 5# 中位數(shù)> median(d)1 5# 分位數(shù)> quantile(d)0% 25% 50% 75% 100%1 3 5 7 9# 任意any,全體all> e<-seq(-3,3);e1 -3 -2 -1 0 1 2 3> any(e<0);all(e<0)1 TRUE1 FALSE排列組合計(jì)算: 階乘, 組合, 排列# 5!階乘> factorial(5)1 120# 組合, 從5個(gè)中選出2個(gè)> choose(5, 2)1 10# 列出從5個(gè)中選出2個(gè)的組合所有項(xiàng)> combn(5,2) ,1 ,2 ,3 ,4 ,5
8、 ,6 ,7 ,8 ,9 ,101, 1 1 1 1 2 2 2 3 3 42, 2 3 4 5 3 4 5 4 5 5# 計(jì)算0:10的組合個(gè)數(shù)> for (n in 0:10) print(choose(n, k = 0:n)1 11 1 11 1 2 11 1 3 3 11 1 4 6 4 11 1 5 10 10 5 11 1 6 15 20 15 6 11 1 7 21 35 35 21 7 11 1 8 28 56 70 56 28 8 11 1 9 36 84 126 126 84 36 9 11 1 10 45 120 210 252 210 120 45 10 1# 排
9、列,從5個(gè)中選出2個(gè)> choose(5, 2)*factorial(2)1 20累積計(jì)算: 累加, 累乘, 最小累積, 最大累積# 累加> cumsum(1:5)1 1 3 6 10 15# 累乘> cumprod(1:5)1 1 2 6 24 120> e<-seq(-3,3);e1 -3 -2 -1 0 1 2 3# 最小累積cummin> cummin(e)1 -3 -3 -3 -3 -3 -3 -3# 最大累積cummax> cummax(e)1 -3 -2 -1 0 1 2 3兩個(gè)數(shù)組計(jì)算: 交集, 并集, 差集, 數(shù)組是否相等, 取唯一,
10、 查匹配元素的索引, 找重復(fù)元素索引# 定義兩個(gè)數(shù)組向量> x <- c(9:20, 1:5, 3:7, 0:8);x 1 9 10 11 12 13 14 15 16 17 18 19 20 1 2 3 4 518 3 4 5 6 7 0 1 2 3 4 5 6 7 8> y<- 1:10;y1 1 2 3 4 5 6 7 8 9 10# 交集> intersect(x,y)1 9 10 1 2 3 4 5 6 7 8# 并集> union(x,y) 1 9 10 11 12 13 14 15 16 17 18 19 20 1 2 3 4 518 6 7
11、0 8# 差集,從x中排除y> setdiff(x,y) 1 11 12 13 14 15 16 17 18 19 20 0# 判斷是否相等> setequal(x, y)1 FALSE# 取唯一> unique(c(x,y) 1 9 10 11 12 13 14 15 16 17 18 19 20 1 2 3 4 518 6 7 0 8# 找到x在y中存在的元素的索引> which(x %in% y) 1 1 2 13 14 15 16 17 18 19 20 21 22 24 25 26 27 2818 29 30 31> which(is.element(x
12、,y) 1 1 2 13 14 15 16 17 18 19 20 21 22 24 25 26 27 2818 29 30 31# 找到重復(fù)元素的索引> which(duplicated(x) 1 18 19 20 24 25 26 27 28 29 302 三角函數(shù)計(jì)算2.1 三角函數(shù) 在直角三角形中僅有銳角(大小在0到90度之間的角)三角函數(shù)的定義。給定一個(gè)銳角,可以做出一個(gè)直角三角形,使得其中的一個(gè)內(nèi)角是。設(shè)這個(gè)三角形中,的對(duì)邊、鄰邊和斜邊長(zhǎng)度分別是a、b和h。三角函數(shù)的6種關(guān)系:正弦,余弦,正切,余切,正割,余割。· 的正弦是對(duì)邊與斜邊的比值:sin = a/h
13、83; 的余弦是鄰邊與斜邊的比值:cos = b/h· 的正切是對(duì)邊與鄰邊的比值:tan = a/b· 的余切是鄰邊與對(duì)邊的比值:cot = b/a· 的正割是斜邊與鄰邊的比值:sec = h/b· 的余割是斜邊與對(duì)邊的比值:csc = h/a三角函數(shù)的特殊值:函數(shù) 0 pi/12 pi/6 pi/4 pi/3 5/(12*pi) pi/2sin 0 (sqrt(6)-sqrt(2)/4 1/2 sqrt(2)/2 sqrt(3)/2 (sqrt(6)+sqrt(2)/4 1cos 1 (sqrt(6)+sqrt(2)/4 sqrt(3)/2 sqrt(
14、2)/2 1/2 (sqrt(6)-sqrt(2)/4 0tan 0 2-sqrt(3) sqrt(3)/3 1 sqrt(3) 2+sqrt(3) NAcot NA 2+sqrt(3) sqrt(3) 1 sqrt(3)/3 2-sqrt(3) 0sec 1 sqrt(6)-sqrt(2) sqrt(3)*2/3 sqrt(2) 2 sqrt(6)-sqrt(2) NAcsc NA 2 sqrt(2) sqrt(3)*2/3 sqrt(6)-sqrt(2) 1 NA三角基本函數(shù): 正弦,余弦,正切# 正弦> sin(0);sin(1);sin(pi/2)1 01 0.8414711 1
15、# 余弦> cos(0);cos(1);cos(pi)1 11 0.54030231 -1# 正切> tan(0);tan(1);tan(pi)1 01 1.5574081 -1.224647e-16接下來(lái),我們用ggplot2包來(lái)畫出三角函數(shù)的圖形。# 加載ggplot2的庫(kù)> library(ggplot2)> library(scales)三角函數(shù)畫圖# x坐標(biāo)> x<-seq(-2*pi,2*pi,by=0.01)# y坐標(biāo)> s1<-data.frame(x,y=sin(x),type=rep('sin',length(
16、x)# 正弦> s2<-data.frame(x,y=cos(x),type=rep('cos',length(x)# 余弦> s3<-data.frame(x,y=tan(x),type=rep('tan',length(x)# 正切> s4<-data.frame(x,y=1/tan(x),type=rep('cot',length(x)# 余切> s5<-data.frame(x,y=1/sin(x),type=rep('sec',length(x)# 正割> s6<
17、;-data.frame(x,y=1/cos(x),type=rep('csc',length(x)# 余割> df<-rbind(s1,s2,s3,s4,s5,s6)# 用ggplot2畫圖> g<-ggplot(df,aes(x,y)> g<-g+geom_line(aes(colour=type,stat='identity')> g<-g+scale_y_continuous(limits=c(0, 2)> g<-g+scale_x_continuous(breaks=seq(-2*pi,2*p
18、i,by=pi),labels=c("-2*pi","-pi","0","pi","2*pi")> g2.1 反三角函數(shù) 基本的反三角函數(shù)定義:反三角函數(shù) 定義 值域arcsin(x) = y sin(y) = x - pi/2 <= y <= pi/2arccos(x) = y cos(y) = x 0 <= y <= pi,arctan(x) = y tan(y) = x - pi/2 < y < pi/2arccsc(x) = y csc(y) =
19、 x - pi/2 <= y <= pi/2, y!=0arcsec(x) = y sec(y) = x 0 <= y <= pi, y!=pi/2arccot(x) = y cot(y) = x 0 < y < pi反正弦,反余弦,反正切# 反正弦asin> asin(0);asin(1)1 01 1.570796 # pi/2=1.570796# 反余弦acos> acos(0);acos(1)1 1.570796 # pi/2=1.5707961 0# 反正切atan> atan(0);atan(1)1 01 0.7853982 #
20、pi/4=0.7853982反三角函數(shù)畫圖# x坐標(biāo)> x<-seq(-1,1,by=0.005)# y坐標(biāo)> s1<-data.frame(x,y=asin(x),type=rep('arcsin',length(x)> s2<-data.frame(x,y=acos(x),type=rep('arccos',length(x)> s3<-data.frame(x,y=atan(x),type=rep('arctan',length(x)> s4<-data.frame(x,y=1/a
21、tan(x),type=rep('arccot',length(x)> s5<-data.frame(x,y=1/asin(x),type=rep('arcsec',length(x)> s6<-data.frame(x,y=1/acos(x),type=rep('arccsc',length(x)> df<-rbind(s1,s2,s3,s4,s5,s6)# 用ggplot2畫圖> g<-ggplot(df,aes(x,y)> g<-g+geom_line(aes(colour=typ
22、e,stat='identity')> g<-g+scale_y_continuous(limits=c(-2*pi,2*pi),breaks=seq(-2*pi,2*pi,by=pi),labels=c("-2*pi","-pi","0","pi","2*pi")> g3 復(fù)數(shù)計(jì)算復(fù)數(shù),為實(shí)數(shù)的延伸,它使任一多項(xiàng)式都有根。復(fù)數(shù)中的虛數(shù)單位i,是-1的一個(gè)平方根,即i2 = -1。任一復(fù)數(shù)都可表達(dá)為x + yi,其中x及y皆為實(shí)數(shù),分別稱為復(fù)數(shù)之“實(shí)部”和“虛部
23、”。3.1 創(chuàng)建一個(gè)復(fù)數(shù)# 直接創(chuàng)建復(fù)數(shù)> ai<-5+2i;ai1 5+2i> class(ai)1 "complex"# 通過(guò)complex()函數(shù)創(chuàng)建復(fù)數(shù)> bi<-complex(real=5,imaginary=2);bi1 5+2i> plex(bi)1 TRUE# 實(shí)數(shù)部分> Re(ai)1 5# 虛數(shù)部分> Im(ai)1 2# 取模> Mod(ai)1 5.385165 # sqrt(52+22) = 5.385165# 取輻角> Arg(ai)1 0.3805064# 取軛> Conj(a
24、i)1 5-2i3.2 復(fù)數(shù)四則運(yùn)算· 加法公式:(a+bi)+(c+di) = (a+c)+(b+d)i· 減法公式:(a+bi)-(c+di)= (a-c)+(b-d)i· 乘法公式:(a+bi)(c+di) = ac+adi+bci+bidi=ac+bdi2+(ad+bc)i=(ac-bd)+(ad+bc)i· 除法公式:(a+bi)/(c+di) = (ac+bd)+(bc-ad)i)/(c2+d2)# 定義系數(shù)a<-5;b<-2;c<-3;d<-4# 創(chuàng)建兩個(gè)復(fù)數(shù)ai<-complex(real=a,imagina
25、ry=b)bi<-complex(real=c,imaginary=d)expect_that(complex(real=(a+c),imaginary=(b+d),equals(ai+bi)expect_that(complex(real=(a-c),imaginary=(b-d),equals(ai-bi)expect_that(complex(real=(a*c-b*d),imaginary=(a*d+b*c),equals(ai*bi)expect_that(complex(real=(a*c+b*d),imaginary=(b*c-a*d)/(c2+d2),equals(ai/
26、bi)3.3 復(fù)數(shù)開平方根# 在實(shí)數(shù)域,給-9開平方根> sqrt(-9)1 NaN# 在復(fù)數(shù)域,給-9開平方根> sqrt(complex(real=-9)1 0+3i4 方程計(jì)算方程計(jì)算是數(shù)學(xué)計(jì)算的一種基本形式,R語(yǔ)言也可以很方便地幫助我們解方程,下面將介紹一元多次的方程,和二元一次方程的解法。解一元多次方程,可以用uniroot()函數(shù)!4.1 一元一次方程一元一次方程:a*x+b=0,設(shè)a=5,b=10,求x?# 定義方程函數(shù)> f1 <- function (x, a, b) a*x+b# 給a,b常數(shù)賦值> a<-5;b<-10# 在(-1
27、0,10)的區(qū)間,精確度為0.0001位,計(jì)算方程的根> result <- uniroot(f1,c(-10,10),a=a,b=b,tol=0.0001)# 打印方程的根x> result$root1 -2一元一次方程非常容易解得,方程的根是-2!以圖形展示方程:y = 5*x + 10# 創(chuàng)建數(shù)據(jù)點(diǎn)> x<-seq(-5,5,by=0.01)> y<-f1(x,a,b)> df<-data.frame(x,y)# 用ggplot2來(lái)畫圖> g<-ggplot(df,aes(x,y)> g<-g+geom_lin
28、e(col='red') #紅色直線> g<-g+geom_point(aes(result$root,0),col="red",size=3) #點(diǎn)> g<-g+geom_hline(yintercept=0)+geom_vline(yintercept=0) #坐標(biāo)軸> g<-g+ggtitle(paste("y =",a,"* x +",b)> g4.2 一元二次方程一元二次方程:a*x2+b*x+c=0,設(shè)a=1,b=5,c=6,求x?> f2 <- fun
29、ction (x, a, b, c) a*x2+b*x+c> a<-1;b<-5;c<-6> result <- uniroot(f2,c(0,-2),a=a,b=b,c=c,tol=0.0001)> result$root1 -2把參數(shù)帶入方程,用uniroot()函數(shù),我們就解出了方程的一個(gè)根,改變計(jì)算的區(qū)間,我們就可以得到另一個(gè)根。> result <- uniroot(f2,c(-4,-3),a=a,b=b,c=c,tol=0.0001)> result$root1 -3方程的兩個(gè)根,一個(gè)是-2,一個(gè)是-3。由于uniroot
30、()函數(shù),每次只能計(jì)算一個(gè)根,而且要求輸入的區(qū)間端值,必須是正負(fù)號(hào)相反的。如果我們直接輸入一個(gè)(-10,0)這個(gè)區(qū)間,那么uniroot()函數(shù)會(huì)出現(xiàn)錯(cuò)誤。> result <- uniroot(f2,c(-10,0),a=a,b=b,c=c,tol=0.0001)Error in uniroot(f2, c(-10, 0), a = a, b = b, c = c, tol = 1e-04) : 位于極點(diǎn)邊的f()值之正負(fù)號(hào)不相反這應(yīng)該是uniroot()為了統(tǒng)計(jì)計(jì)算對(duì)一元多次方程而設(shè)計(jì)的,所以為了使用uniroot()函數(shù),我們需要取不同的區(qū)別來(lái)獲得方程的根。以圖形展示方程:y
31、 = x2 + 5*x + 6# 創(chuàng)建數(shù)據(jù)點(diǎn)> x<-seq(-5,1,by=0.01)> y<-f2(x,a,b,c)> df<-data.frame(x,y)# 用ggplot2來(lái)畫圖> g<-ggplot(df,aes(x,y)> g<-g+geom_line(col='red') #紅色曲線> g<-g+geom_hline(yintercept=0)+geom_vline(yintercept=0) #坐標(biāo)軸> g<-g+ggtitle(paste("y =",a,
32、"* x 2 +",b,"* x +",c)> g我們從圖,并直接的看到了x的兩個(gè)根取值范圍。4.3 一元三次方程一元二次方程:a*x3+b*x2+c*x+d=0,設(shè)a=1,b=5,c=6,d=-11,求x?> f3 <- function (x, a, b, c,d) a*x3+b*x2+c*x+d> a<-1;b<-5;c<-6;d<-11> result <- uniroot(f3,c(-5,5),a=a,b=b,c=c,d=d,tol=0.0001)> result$root1 0
33、.9461458如果我們?cè)O(shè)置對(duì)了取值區(qū)間,那么一下就得到了方程的根。以圖形展示方程:y = x2 + 5*x + 6# 創(chuàng)建數(shù)據(jù)點(diǎn)> x<-seq(-5,5,by=0.01)> y<-f3(x,a,b,c,d)> df<-data.frame(x,y)# 用ggplot2畫圖> g<-ggplot(df,aes(x,y)> g<-g+geom_line(col='red') # 3次曲線> g<-g+geom_hline(yintercept=0)+geom_vline(yintercept=0) #坐標(biāo)軸
34、> g<-g+ggtitle(paste("y =",a,"* x 3 +",b,"* x 2 +",c,"* x + ",d)> g4.4 二元一次方程組R語(yǔ)言還可以解二次的方程組,當(dāng)然計(jì)算方法,其實(shí)是利用于矩陣計(jì)算。假設(shè)方程組:是以x1,x2兩個(gè)變量組成的方程組,求x1,x2的值以矩陣形式,構(gòu)建方程組# 左矩陣> lf<-matrix(c(3,5,1,2),nrow=2,byrow=TRUE)# 右矩陣> rf<-matrix(c(4,1),nrow=2)# 計(jì)算結(jié)果&
35、gt; result<-solve(lf,rf)> result ,11, 32, -1得方程組的解,x1, x2分別為3和-1。接下來(lái),我們畫出這兩個(gè)線性方程的圖。設(shè)y=X2, x=X1,把原方程組變成兩個(gè)函數(shù)形式。# 定義2個(gè)函數(shù)> fy1<-function(x) (-3*x+4)/5> fy2<-function(x) (-1*x+1)/2# 定義數(shù)據(jù)> x<-seq(-1,4,by=0.01)> y1<-fy1(x)> y2<-fy2(x)> dy1<-data.frame(x,y=y1,type=p
36、aste("y=(-3*x+4)/5")> dy2<-data.frame(x,y=y2,type=paste("y=(-1*x+1)/2")> df <- rbind(dy1,dy2)# 用ggplot2畫圖> g<-ggplot(df,aes(x,y)> g<-g+geom_line(aes(colour=type,stat='identity') #2條直線> g<-g+geom_hline(yintercept=0)+geom_vline(yintercept=0) #坐
37、標(biāo)軸> g我們看到兩條直線交點(diǎn)的坐標(biāo),就是方程組的兩個(gè)根。多元一次方程,同樣可以用這種方法來(lái)解得。通過(guò)R語(yǔ)言,我們實(shí)現(xiàn)了對(duì)于初等數(shù)學(xué)的各種計(jì)算,真的是非常方便!下一篇文章將介紹,用R語(yǔ)言來(lái)解決高級(jí)數(shù)學(xué)中的計(jì)算問(wèn)題。目錄1. 隨機(jī)變量2. 隨機(jī)變量的數(shù)字特征3. 極限定理1. 隨機(jī)變量· 什么是隨機(jī)變量?· 離散型隨機(jī)變量· 連續(xù)型隨機(jī)變量1). 什么是隨機(jī)變量?隨機(jī)變量(random variable)表示隨機(jī)現(xiàn)象各種結(jié)果的實(shí)值函數(shù)。隨機(jī)變量是定義在樣本空間S上,取值在實(shí)數(shù)載上的函數(shù),由于它的自變量是隨機(jī)試驗(yàn)的結(jié)果,而隨機(jī)實(shí)驗(yàn)結(jié)果的出現(xiàn)具有隨機(jī)性,因此,隨機(jī)
38、變量的取值具有一定的隨機(jī)性。R程序:生成一個(gè)在(0,1,2,3,4,5)的隨機(jī)變量> S<-1:5> sample(S,1)1 2> sample(S,1)1 3> sample(S,1)1 52). 離散型隨機(jī)變量如果隨機(jī)變量X的全部可能的取值只有有限多個(gè)或可列無(wú)窮多個(gè),則稱X為離散型隨機(jī)變量。R程序:生成樣本空間為(1,2,3)的隨機(jī)變量X,X的取值是有限的> S<-1:3> X<-sample(S,1);X1 23). 連續(xù)型隨機(jī)變量隨機(jī)變量X,取值可以在某個(gè)區(qū)間內(nèi)取任一實(shí)數(shù),即變量的取值可以是連續(xù)的,這隨機(jī)變量就稱為連續(xù)型隨機(jī)變量R
39、程序:生成樣本在空間(0,1)的連續(xù)隨機(jī)函數(shù),取10個(gè)值> runif(10,0,1) 1 0.3819569 0.7609549 0.6692581 0.6314708 0.5552201 0.8225527 0.7633086 0.4667188 0.188355310 0.37416532. 隨機(jī)變量的數(shù)字特征· 數(shù)學(xué)期望· 方差· 標(biāo)準(zhǔn)差· 各種分步的期望和方差· 常用統(tǒng)計(jì)量(最大,最小,中位數(shù),四分位數(shù))· 協(xié)方差· 相關(guān)系數(shù)· 矩(原點(diǎn)矩,中心矩,偏度,峰度)· 協(xié)方差矩陣1). 數(shù)學(xué)期
40、望(mathematical expectation)離散型隨機(jī)變量:的一切可能的取值xi與對(duì)應(yīng)的概率Pi(=xi)之積的和稱為該離散型隨機(jī)變量的數(shù)學(xué)期望,記為E(x)。數(shù)學(xué)期望是最基本的數(shù)學(xué)特征之一。它反映隨機(jī)變量平均取值的大小。R程序:計(jì)算樣本(1,2,3,7,21)的數(shù)學(xué)期望> S<-c(1,2,3,7,21)> mean(S)1 6.8連續(xù)型隨機(jī)變量:若隨機(jī)變量X的分布函數(shù)F(x)可表示成一個(gè)非負(fù)可積函數(shù)f(x)的積分,則稱X為連續(xù)性隨機(jī)變量,f(x)稱為X的概率密度函數(shù),積分值為X的數(shù)學(xué)期望,記為E(X)。2). 方差(Variance)方差是各個(gè)數(shù)據(jù)與平均數(shù)之差的
41、平方的平均數(shù)。在概率論和數(shù)理統(tǒng)計(jì)中,方差用來(lái)度量隨機(jī)變量和其數(shù)學(xué)期望(即均值)之間的偏離程度。設(shè)X為隨機(jī)變量,如果EX-E(X)2存在,則稱EX-E(X)2為X的方差,記為Var(X)。R程序:計(jì)算樣本(1,2,3,7,21)的方差> S<-c(1,2,3,7,21)> var(S)1 68.23). 標(biāo)準(zhǔn)差(Standard Deviation)標(biāo)準(zhǔn)差是方差的算術(shù)平方根sqrt(var(X)。標(biāo)準(zhǔn)差能反映一個(gè)數(shù)據(jù)集的離散程度。平均數(shù)相同的,標(biāo)準(zhǔn)差未必相同。R程序:計(jì)算樣本(1,2,3,7,21)標(biāo)準(zhǔn)差> S<-c(1,2,3,7,21)> sd(S)1 8
42、.2583294). 各種分步的期望和方差· 離散型分布:兩點(diǎn)分布,二項(xiàng)分布,泊松分布等· 連續(xù)型分布:均勻分布,指數(shù)分布,正態(tài)分布,伽馬分布等對(duì)于某一特定場(chǎng)景,其所符合的分布規(guī)律一般先驗(yàn)給出請(qǐng)參考文章:http:/blog.fens.me/r-density/5). 常用統(tǒng)計(jì)量眾數(shù)(Mode): 一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的數(shù)值,叫眾數(shù),有時(shí)眾數(shù)在一組數(shù)中有好幾個(gè)。R程序:計(jì)算樣本(1,2,3,3,3,7,7,7,7,9,10,21)的眾數(shù)> S<-c(1,2,3,3,3,7,7,7,7,9,10,21)> names(which.max(table(S)1
43、 "7"最小值(minimum): 在給定情形下可以達(dá)到的最小數(shù)量或最小數(shù)值R程序:計(jì)算樣本(2,3,3,3,7,7,7,7,9,10,21)的最小值> S<-c(2,3,3,3,7,7,7,7,9,10,21)#最小值> min(S)1 2#最小值的索引> which.min(S)1 1最大值(maximum): 在給定情形下可以達(dá)到的最大數(shù)量或最大數(shù)值R程序:計(jì)算樣本(2,3,3,3,7,7,7,7,9,10,21)的最大值> S<-c(2,3,3,3,7,7,7,7,9,10,21)#最大值> max(S)1 21#最大值的索
44、引> which.max(S)1 11中位數(shù)(Medians): 是指將統(tǒng)計(jì)總體當(dāng)中的各個(gè)變量值按大小順序排列起來(lái),形成一個(gè)數(shù)列,處于變量數(shù)列中間位置的變量值就稱為中位數(shù)。R程序:計(jì)算樣本(1,2,3,4,5)的中位數(shù)> S<-c(1,2,3,4,5)> median(S)1 3四分位數(shù)(Quartile): 用于描述任何類型的數(shù)據(jù),尤其是偏態(tài)數(shù)據(jù)的離散程度,即將全部數(shù)據(jù)從小到大排列,正好排列在上1/4位置叫上四分位數(shù),下1/4位置上的數(shù)就叫做下四分位數(shù). R程序:計(jì)算樣本(1,2,3,4,5,6,7,8,9)的四分位數(shù)> S<-c(1,2,3,4,5,6,
45、7,8,9)> quantile(S) 0% 25% 50% 75% 100% 1 3 5 7 9 > fivenum(S)1 1 3 5 7 9通用的計(jì)算統(tǒng)計(jì)函數(shù):R程序:計(jì)算樣本(1,2,3,4,5,6,7,8,9)的統(tǒng)計(jì)函數(shù)> S<-c(1,2,3,4,5,6,7,8,9)> summary(S) Min. 1st Qu. Median Mean 3rd Qu. Max. 1 3 5 5 7 9 6). 協(xié)方差(Covariance)協(xié)方差用于衡量?jī)蓚€(gè)變量的總體誤差。而方差是協(xié)方差的一種特殊情況,即當(dāng)兩個(gè)變量是相同的情況。設(shè)X,Y為兩個(gè)隨機(jī)變量,稱EX-E(
46、X)Y-E(Y)為X和Y的協(xié)方差,記錄Cov(X,Y)。R程序:計(jì)算X(1,2,3,4)和Y(5,6,7,8)的協(xié)方差> X<-c(1,2,3,4)> Y<-c(5,6,7,8)> cov(X,Y)1 1.6666677). 相關(guān)系數(shù)(Correlation coefficient)相關(guān)系數(shù)是用以反映變量之間相關(guān)關(guān)系密切程度的統(tǒng)計(jì)指標(biāo)。相關(guān)系數(shù)是按積差方法計(jì)算,同樣以兩變量與各自平均值的離差為基礎(chǔ),通過(guò)兩個(gè)離差相乘來(lái)反映兩變量之間相關(guān)程度。當(dāng)Var(X)>0, Var(Y)>0時(shí),稱Cov(X,Y)/sqrt(Var(X)*Var(Y)為X與Y的相關(guān)系
47、統(tǒng)。R程序:計(jì)算X(1,2,3,4)和Y(5,7,8,9)的相關(guān)系數(shù)> X<-c(1,2,3,4)> Y<-c(5,7,8,9)> cor(X,Y)1 0.98270768). 矩原點(diǎn)矩(moment about origin): 對(duì)于正整數(shù)k,如果E|Xk|存在,稱Vk=E(Xk)為隨機(jī)變量X的k階原點(diǎn)矩。X的數(shù)學(xué)期望是X的一階原點(diǎn)矩,即E(x)=v1.R程序:計(jì)算S(1,2,3,4,5)的一階原點(diǎn)矩(均值)> S<-c(1,2,3,4,5)> mean(S)1 3中心矩(moment about centre): 對(duì)于正整數(shù)k,如果EX存在,
48、且E(|X - EX|k)也存在,則稱EX-EXk為隨機(jī)變量X的k階中心矩。如X的方差是X的二階中心矩,即D(X)=EX-E(X)2R程序:計(jì)算S(1,2,3,4,5)的二階中心矩(方差)> S<-c(1,2,3,4,5)> var(S)1 2.5距是廣泛應(yīng)用的一類數(shù)學(xué)特征,均值和方差分別就是一階原點(diǎn)矩和二階中心矩。偏度(skewness): 是統(tǒng)計(jì)數(shù)據(jù)分布偏斜方向和程度的度量,是統(tǒng)計(jì)數(shù)據(jù)分布非對(duì)稱程度的數(shù)字特征。設(shè)分布函數(shù)F(x)有中心矩u2=E(X E(X)2, u3 = E(X E(X)3,則Cs=u3/u2(3/2)為偏度系數(shù)。當(dāng)Cs>0時(shí),概率分布偏向均值右則
49、,Cs<0時(shí),概率分布偏向均值左則。R語(yǔ)言:計(jì)算10000個(gè)正態(tài)分布的樣本的偏度> library(PerformanceAnalytics)> S<-rnorm(10000)> skewness(S)1 -0.00178084> hist(S,breaks=100)峰度(kurtosis): 又稱峰態(tài)系數(shù)。表征概率密度分布曲線在平均值處峰值高低的特征數(shù)。峰度刻劃不同類型的分布的集中和分散程序。設(shè)分布函數(shù)F(x)有中心矩u2=E(X E(X)2, u4=E(X E(X)4,則Ck=u4/(u22-3)為峰度系數(shù)。R語(yǔ)言:計(jì)算10000個(gè)正態(tài)分布的樣本的峰度,
50、(同偏度的樣本數(shù)據(jù))> library(PerformanceAnalytics)> kurtosis(S)1 -0.02443549> hist(S,breaks=100)8). 協(xié)方差矩陣(covariance matrix)協(xié)方差矩陣是一個(gè)矩陣,其每個(gè)元素是各個(gè)向量元素之間的協(xié)方差。是從標(biāo)量隨機(jī)變量到高維度隨機(jī)向量的自然推廣。設(shè)X = (X1,X2, . ,Xn), Y = (Y1, Y2, ., Ym) 為兩個(gè)隨機(jī)變量,則Cov(X,Y)為X,Y的協(xié)方差矩陣.R語(yǔ)言:計(jì)算協(xié)方差矩陣> x=as.data.frame(matrix(rnorm(10),ncol=2
51、)> x V1 V21 -2.11315384 -2.551898402 -0.96631271 -1.361483553 -0.02835058 -0.823287744 -1.86669567 -0.072013535 0.27324957 -2.23835218> var(x) V1 V2V1 1.13470650 -0.09292042V2 -0.09292042 1.03172261> cov(x) V1 V2V1 1.13470650 -0.09292042V2 -0.09292042 1.031722613. 極限定理· 大數(shù)定律· 中心極限
52、定理1). 大數(shù)定律大數(shù)定律(law of large numbers),又稱大數(shù)定理,是判斷隨機(jī)變量的算術(shù)平均值是否向常數(shù)收斂的定律,是概率論和數(shù)理統(tǒng)計(jì)學(xué)的基本定律之一。設(shè)X1,X2,.,Xk, 是隨機(jī)變量序列且E(Xk)存在(k=1,2,3.), Yn = 1/n * (X1 +X2+ . + Xk),對(duì)于任意給定的 > 0, 有則稱隨機(jī)變量序列Xk服從大數(shù)定律。三個(gè)重要定律· Bernoulli大數(shù)定律· Chebyshev(切比雪夫)大數(shù)定律· Khintchin(辛欽)大數(shù)定律Bernoulli(貝努力)大數(shù)定律設(shè)Na是n次獨(dú)立重復(fù)試驗(yàn)中A發(fā)生的次
53、數(shù),p是事件A在每次試驗(yàn)中發(fā)生的概率,則對(duì)任意的正數(shù) > 0,有Bernoulli大數(shù)定律揭示了“頻率穩(wěn)定于概率”說(shuō)法的實(shí)質(zhì)。Chebyshev(切比雪夫)大數(shù)定律設(shè)隨機(jī)變量X1,X2,.Xk相互獨(dú)立,且具有相同的期望與方差:E(Xk)=, Var(Xk) = 2, (k = 1, 2, .), 則對(duì)于任意的正數(shù) > 0, 有Khintchin(辛欽)大數(shù)定律設(shè)隨機(jī)變量X1,X2.Xk相互獨(dú)立,服從相同的分布,且其期望E(Xk) = , (k = 1, 2,.), 則對(duì)于任意的正數(shù) > 0, 有若對(duì)隨機(jī)變量序列X1, X2, .Xk存在常數(shù)a, 使得對(duì)于任意的正數(shù) >
54、0, 有成立,則稱Xk依概率收斂于a,則Chebyshev大數(shù)定律和Khintchin大數(shù)定律有大數(shù)定律定理設(shè)隨機(jī)變量X具有期望E(X)=,方差Var(X) = 2, 則對(duì)于任意 > 0, 有R語(yǔ)言:假設(shè)投硬幣,正面概率是0.5,投4次時(shí),計(jì)算得到2次正面的概率?根據(jù)大數(shù)定律,如果投是10000次,計(jì)算5000次正面的概率?#計(jì)算2次正面的的概率> choose(4,2)/24 #choose組合數(shù)的計(jì)算:從4中選擇2個(gè)1 0.375#計(jì)算5000次正面的的概率> pbinom(5000, 10000, 0.5) #pbinom二向分布,5000為分位數(shù),產(chǎn)生10000個(gè)隨機(jī)
55、數(shù),每個(gè)概率0.51 0.50398932). 中心極限定理(central limit theorem)中心極限定理是判斷隨機(jī)變量序列部分和的分布是否漸近于正態(tài)分布的一類定理。在自然界及生產(chǎn)科學(xué)實(shí)踐中,一些現(xiàn)象受到許多相互獨(dú)立的隨機(jī)因素的影響,如果每個(gè)因素的影響都很小,那么部的影響可以看作是服從正太分布。中心極限定理正是從數(shù)學(xué)上論證了這一現(xiàn)象。設(shè)從均值為、方差為2;(有限)的任意一個(gè)總體中抽取樣本量為n的樣本,當(dāng)n充分大時(shí),樣本均值的抽樣分布近似服從均值為、方差為2/n的正態(tài)分布。兩個(gè)最著名的中心極限宣· 列維定理(Lindburg-Levy)· 拉普拉斯定理(de Mo
56、vire - Laplace)列維定理(Lindburg-Levy)即獨(dú)立同分布隨機(jī)變量序列的中心極限定理。它表明,獨(dú)立同分布、且數(shù)學(xué)期望和方差有限的隨機(jī)變量序列的標(biāo)準(zhǔn)化和以標(biāo)準(zhǔn)正態(tài)分布為極限。設(shè)隨機(jī)變量X1,X2,.Xn,.相互獨(dú)立,服從同一分布,且具有數(shù)學(xué)期望和方差:E(Xk)=,D(Xk)=2>0(k=1,2.),則隨機(jī)變量之和的標(biāo)準(zhǔn)化變量的分布函數(shù)Fn(x)對(duì)于任意x滿足limFn(x)=(x),n其中(x)是標(biāo)準(zhǔn)正態(tài)分布的分布函數(shù)。拉普拉斯定理(de Movire - Laplace)即服從二項(xiàng)分布的隨機(jī)變量序列的中心極限定理。它指出,參數(shù)為n, p的二項(xiàng)分布以np為均值、np(1-p)為方差的正態(tài)分布為極限。R語(yǔ)言:中心極限定理模擬,從指數(shù)分布到正態(tài)分布if (!require(animation) install.packages("animation")library(animation)ani.options(interval = 0.1, nmax = 100)par(mar = c(4, 4, 1, 0.5)clt.ani()掌握R語(yǔ)言,就可以快速的把概率的知識(shí),用R語(yǔ)言進(jìn)行現(xiàn)實(shí),非常有利于幫助我們解決生活中遇到的問(wèn)題
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 電子課課程設(shè)計(jì)代做
- 程序設(shè)計(jì)課程設(shè)計(jì)mfc
- 研學(xué)課程設(shè)計(jì)依據(jù)標(biāo)準(zhǔn)
- 樓道走廊燈課程設(shè)計(jì)
- 精壓機(jī)課程設(shè)計(jì)標(biāo)準(zhǔn)
- 幼兒園賽事班課程設(shè)計(jì)
- 煉鐵課程設(shè)計(jì)cad
- 旗袍美術(shù)創(chuàng)意課程設(shè)計(jì)
- 灌溉排水課程設(shè)計(jì)總結(jié)
- 社區(qū)職業(yè)培訓(xùn)課程設(shè)計(jì)
- 湖南省名校聯(lián)考聯(lián)合體2023-2024學(xué)年高一上學(xué)期期末考試 生物 含解析
- 中建“大商務(wù)”管理實(shí)施方案
- 電力系統(tǒng)全環(huán)節(jié)實(shí)時(shí)精準(zhǔn)碳計(jì)量方法及其應(yīng)用展望
- DB14-T 2392-2021 燃?xì)忮仩t能效指標(biāo)與測(cè)試規(guī)則
- 中藥表格完整版本
- 四川省成都市2023-2024學(xué)年七年級(jí)上學(xué)期期末數(shù)學(xué)試題(含答案)
- 海底撈崗位晉升流程
- 小學(xué)英語(yǔ)詞匯表(滬牛津版)
- 貴州大學(xué)新型智庫(kù)建設(shè)實(shí)施方案
- 小學(xué)三年級(jí)信息技術(shù)考核方案
- 熱工設(shè)備安全操作和維護(hù)
評(píng)論
0/150
提交評(píng)論