在一些随机试验中,结果可以用数值来表示,此时样本空间S的元素是数字;但是,有些试验,当样本空间S的元素不是数字时,就需要引入随机变量的概念了。
设S是样本空间,把随机试验的每一个结果,即把S的每个元素e与实数对应起来,从而便于对S进行描述和研究。
一,随机变量定义 设随机试验的样本空间为S={e},X=X(e)是定义在样本空间S上的单值函数,称X=X(e)为随机变量。
(1),有许多随机试验,结果本身是一个数,即样本点e本身是一个数,令X=X(e)=e,那么X就是一个随机变量。
(2),把一枚硬币抛掷三次,把出现正面记作A,把出现反面记作B,那么样本空间S={e}={AAA,AAB,ABA,ABB,BAA,BAB,BBA,BBB},
设随机变量X是出现正面的次数,那么随机变量X=X(e)={0,1,2,3},
由此,可以计算出:随机变量X=2发生的的概率是 P{X=2}=P{AAB, ABA, BAA}=3/8。
因为随机变量是元素的单值函数,所以随机变量对应样本空间的一个或多个元素。
如何计算随机变量的概率,下文给出了三种方式:
分布律:适用于离散型随机变量
分布函数:适用于离散型随机变量和连续型随机变量
概率密度函数:适用于连续型随机变量
注意:连续型随机变量取任意指定的实数值的概率都等于0,即P{X=a} =0,但是,概率为0并不意味着,{X=a}是不可能事件,只是事件{X=a}发生的概率非常小,小到几乎不可能发生。
二,离散型随机变量有些随机变量,它全部可能取到的值是有限多个或可列无线多个,这种随机变量称为离散型随机变量。
要掌握一个离散型随机变量X的统计规律,只需要直到X的所有可能取值,以及取每一个可能值得概率。
设离散型随机变量X所有可能取值为xk(k=1,2,...),X取各个可能值得概率,即事件{X=xk}的概率为:
P{X=xk}=pk,k=1,2,...
离散型随机变量常用的分布规律是:0-1分布律,二项分布率,泊松分布律,读者需要知道分布律的特性。
1,0-1分布律
对于一个随机变量,如果样本空间只包含两个元素,即S={e1,e2},可以定义随机变量X来描述随机试验的结果:
随机变量X只可能取值0和1两个值,分布律是:
P{X=k}=pk(1-p)1-k, k=0,1 (0<p<1)
2,二项分布律
设试验E只有两个可能结果A和B,设P(A)=p( 0<p<1),此时P(B)=1-p,把试验E独立重复地进行n次,则称这一串重复的独立试验服从二项分布律:
随机变量X只可能取值0和1两个值,把分布律是:
对于固定的n和p,二项分布b(n,p)的概率分布是:当k增加时,概率P{X=k}先是随之增加,直至达到最大值,随后单调减少。
3,泊松分布律
设随机变量X所有可能取得值是0,1,2,...,而取各个值得概率是:
其中参数λ>0,是常数,泊松分布的参数λ是单位时间内随机事件平均发生的次数。泊松分布的图形大概是
可以看到,泊松分布的特点是概率先随着k值的增加而增加,再达到顶点后,随着k值的增加而减少。
泊松分布和二项分布得图形很相似,实际上,可以使用泊松分布来逼近二项分布:
设λ>0 是常数,n是任意正整数,设np=λ,以n,p为参数得二项分布得概率值,可以有参数为λ=np得泊松分布概率值近似,可以用作二项分布概率的近似计算。
三,随机变量的分布函数为了研究随机变量取值落在一个区间(x1, x2]的概率: P{x1<X<=x2}
引入随机变量的分布函数:
定义 设X是一个随机变量,x是任意实数,函数
F(x)=P{X<=x}
称作X的分布函数,对于任意实数x1,x2 (x1<x2),如何计算随机变量X落在区间(x1, x2]的概率?
P{x1<X<=x2}=P{X<=x2}-P{x<=x1}=F(x2)-F(x1)
因此,如果已知X的分布函数,就知道X落在任一区间(x1, x2]的概率,从这个意义上说,分布函数完整地描述了随机变量的统计规律性。