简单介绍一下R中的几种统计分布及常用模型

简单介绍一下R中的几种统计分布

统计学上分布有很多,在R中基本都有描述。因能力有限,我们就挑选几个常用的、比较重要的简单介绍一下每种分布的定义,公式,以及在R中的展示。

统计分布每一种分布有四个函数:d――density(密度函数),p――分布函数,q――分位数函数,r――随机数函数。比如,正态分布的这四个函数为dnorm,pnorm,qnorm,rnorm。下面我们列出各分布后缀,前面加前缀d、p、q或r就构成函数名:norm:正态,t:t分布,f:F分布,chisq:卡方(包括非中心) unif:均匀,exp:指数,weibull:威布尔,gamma:伽玛,beta:贝塔 lnorm:对数正态,logis:逻辑分布,cauchy:柯西, binom:二项分布,geom:几何分布,hyper:超几何,nbinom:负二项,pois:泊松 signrank:符号秩,wilcox:秩和,tukey:学生化极差

下面先列举各种分布:

rnorm(n, mean=0, sd=1) 高斯(正态)分布
rexp(n, rate=1) 指数分布
rgamma(n, shape, scale=1) γ分布 

rpois(n, lambda) Poisson分布
rweibull(n, shape, scale=1) Weibull分布 
rcauchy(n, location=0, scale=1) Cauchy分布 
rbeta(n, shape1, shape2) β分布 
rt(n, df) t分布 
rf(n, df1, df2) F分布 
rchisq(n, df) χ 2 分布
rbinom(n, size, prob)二项分布 ‘
rgeom(n, prob)几何分布
rhyper(nn, m, n, k) ‡超几何分布
rlogis(n, location=0, scale=1) logistic分布
rlnorm(n, meanlog=0, sdlog=1)对数正态
rnbinom(n, size, prob)负二项分布
runif(n, min=0, max=1)均匀分布
rwilcox(nn, m, n), rsignrank(nn, n) Wilcoxon分布
注意了,上面的分布都有一个规律,就是所有的函数前面都有r开始,所以呢,如果想获得概率密度,就用替换

如果想获取累计概率密度,就用替换

如果想获取分位数,就用替换

 

 

二项分布:

即重复n次独立的伯努利试验。在每次试验中只有两种可能的结果,两种结果发生与否互相对立,并且相互独立,与其它各次试验结果无关,事件发生与否的概率在每一次独立试验中都保持不变,则这一系列试验总称为n重伯努利实验,当试验次数为1时,二项分布服从0-1分布。

公式:P(ξ=K)= C(n,k) * p^k * (1-p)^(n-k)

其中,P是成功的概率,n是n次独立重复实验,k是n次实验k次发生的概率

期望:Eξ=np

方差:Dξ=np(1-p)

二项分布在R中展现:

p=.4

K=200 

n=10000 

x=rbinom(n,k,p)

hist(x)

简单介绍一下R中的几种统计分布及常用模型


进行标准化处理:

mean=k*p

var=k*p*(1-p)

z=(x-mean)/sqrt(var)

hist(z)

简单介绍一下R中的几种统计分布及常用模型


绘制密度图

mean=k*p

var=k*p*(1-p)

z=(x-mean)/sqrt(var)

hist(z)

内容版权声明:除非注明,否则皆为本站原创文章。

转载注明出处:https://www.heiqu.com/zyxxfy.html