离散型随机变量的概率分布律和连续型随机变量的概率密度函数是两个研究随机变量的工具,它们都可以描述一个随机变量的统计规律性。
一、离散型随机变量的概率分布律
对离散型随机变量,它的取值是有限个或无限可列个,概率分布律就是给出它的所有可能取值和在这些点的概率。
如下图:X-b(30,0.1)横坐标就是X的取值,纵坐标是X取不同值处的概率。
显然有
二、概率密度函数
当随机变量取值连续时,因取值的不可列,故无法求其在某一点的概率,只能从分布函数入手,求累积概率,从而引出了一个研究连续型随机变量的独特工具-概率密度函数,其定义如下:
来看几个分布的密度函数:
例1:正态分布N(0,1)
可以看到连续变量是什么意思,f(x)的最大值在0.4处
例2:同样是正态分布N(0,0.3),可以看出,f(x)在x=0处的值已经超过1.
所以对于连续型的随机变量来讲,其密度函数f(x)可不是在X=x处取值的概率,事实上连续变量是什么意思,在任一点x,都有P{X=x}=0.
因此对于密度函数f(x),它刻画的是连续型随机变量在某个区间上取值的可能性大小的,比如
三、理解分布律和概率密度函数的要点
1.离散型看点,连续型看区间
如果是离散型随机变量,只能考察在某点处的概率,如果在所有可能取值处的概率为零,则样本空间的概率为零,所以要考察在所有可能取值处概率;
对连续型随机变量,如果某点处的概率都不为零,则不管在各点处取值的概率多小,总能找出足够的点概率之和大于1,故只能考察在区间上的概率。
2.f(x)是概率密度而不是概率
为什么要叫概率密度,因为它和物理上密度的定义本质上是一样的,一个物体的密度再大,如果它只是一个点,则其质量也是零,同样,在一点处的概率密度再大,在这点处的概率也是零,只有讨论X落在区间内的概率才有意义。
3.f(x)代表在这一点的分布函数的变化率
设f(x)在x连续,概率密度函数就是概率分布函数的导数,从导数的角度理解概率密度函数比较容易理解:概率密度函数表现的是概率分布函数在某一点的变化率,分布函数是一个累积函数,是增函数,所以这个变化只是增加的快慢的变化,当f(x)较大时,说明在x附近增加快,故在x这点附近取值概率大。