分布函数(英文Cumulative Distribution Function, 简称CDF),是概率统计中重要的函数,正是通过它,可用数学分析的方法来研究随机变量。分布函数是随机变量最重要的概率特征,分布函数可以完整地描述随机变量的统计规律,并且决定随机变量的一切其他概率特征。
中文名
分布函数
外文名
Cumulative Distribution Function
又称
累积分布函数
作用
描述随机变量的概率分布
定义域
全体实数
定义
设X是一个随机变量,x是任意实数,函数

称为X的分布函数。有时也记为

。
对于任意实数

,



因此,若已知X的分布函数,就可以知道X落在任一区间上的概率,在这个意义上说,分布函数完整地描述了随机变量的统计规律性。
如果将X看成是数轴上的随机点的坐标,那么,分布函数F(x)在x处的函数值就表示X落在区间

上的概率。
分布函数的性质
F(x)为随机变量X的分布函数,其充分必要条件为:[1]
1非降性
(1)F(x)是一个不减函数
对于任意实数

2有界性
(2)

从几何上说明,将区间端点x沿数轴无限向左移动(即

),则“随机点X落在点x左边”这一事件趋于不可能事件,从而其概率趋于0,即有

;又若将点x无限右移(即

),则“随机点X落在点x左边”这一事件趋于必然事件,从而趋于概率1,即有

[2]
3右连续性
(3)

;
证明:因为 F(x)是单调有界非减函数,所以其任一点x0的右极限F(x0+0)必存在。
为证明右连续,由海涅定理,只要对单调下降的数列

当

时,
证明

成立即可。 因为 :


所以得,

经验分布函数的优缺点:
1、经验分布函数的优点,每个观测值都能直接可视化,这意味着不需要调整化分块数或平滑参数。也有助于直接“比较多个变量的分布情况”。
2、经验分布函数的缺点,图的外观和分布的基本属性(如其中心趋势、方差)之间的关系不是那么直观。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)