正态分布(Normal distribution),也称“常态分布”,又名高斯分布(Gaussian distribution),最早由棣莫弗(Abraham de Moivre)在求二项分布的渐近公式中得到。CF高斯在研究测量误差时从另一个角度导出了它。PS拉普拉斯和高斯研究了它的性质。是一个在数学、物理及工程等领域都非常重要的概率分布,在统计学的许多方面有着重大的影响力。
正态曲线呈钟型,两头低,中间高,左右对称因其曲线呈钟形,因此人们又经常称之为钟形曲线。
若随机变量X服从一个数学期望为μ、方差为σ^2的正态分布,记为N(μ,σ^2)。其概率密度函数为正态分布的期望值μ决定了其位置,其标准差σ决定了分布的幅度。当μ = 0,σ = 1时的正态分布是标准正态分布。
中文名
正态分布
外文名
normal distribution
别名
高斯分布
发现者
棣莫弗(Abraham de Moivre)
所属学科
概率论
快速
导航
定理定义性质分布曲线研究过程曲线应用
历史发展
正态分布概念是由德国的数学家和天文学家棣莫弗(Abraham de Moivre)于1733年首次提出的,但由于德国数学家Gauss率先将其应用于天文学研究,故正态分布又叫高斯分布,高斯这项工作对后世的影响极大,他使正态分布同时有了“高斯分布”的名称,后世之所以多将最小二乘法的发明权归之于他,也是出于这一工作。但现今德国10马克的印有高斯头像的钞票,其上还印有正态分布的密度曲线。这传达了一种想法:在高斯的一切科学贡献中,其对人类文明影响最大者,就是这一项。在高斯刚作出这个发现之初,也许人们还只能从其理论的简化上来评价其优越性,其全部影响还不能充分看出来。这要到20世纪正态小样本理论充分发展起来以后。拉普拉斯很快得知高斯的工作,并马上将其与他发现的中心极限定理联系起来,为此,他在即将发表的一篇文章(发表于1810年)上加上了一点补充,指出如若误差可看成许多量的叠加,根据他的中心极限定理,误差理应有高斯分布。这是历史上第一次提到所谓“元误差学说”——误差是由大量的、由种种原因产生的元误差叠加而成。后来到1837年,海根(GHagen)在一篇论文中正式提出了这个学说。
其实,他提出的形式有相当大的局限性:海根把误差设想成个数很多的、独立同分布的“元误差” 之和,每只取两值,其概率都是1/2,由此出发,按棣莫弗的中心极限定理,立即就得出误差(近似地)服从正态分布。拉普拉斯所指出的这一点有重大的意义,在于他给误差的正态理论一个更自然合理、更令人信服的解释。因为,高斯的说法有一点循环论证的气味:由于算术平均是优良的,推出误差必须服从正态分布;反过来,由后一结论又推出算术平均及最小二乘估计的优良性,故必须认定这二者之一(算术平均的优良性,误差的正态性) 为出发点。但算术平均到底并没有自行成立的理由,以它作为理论中一个预设的出发点,终觉有其不足之处。拉普拉斯的理论把这断裂的一环连接起来,使之成为一个和谐的整体,实有着极重大的意义。
定理
由于一般的正态总体其图像不一定关于y轴对称,对于任一正态总体,其取值小于x的概率。只要会用它求正态总体在某个特定区间的概率即可。
为了便于描述和应用,常将正态变量作数据转换。将一般正态分布转化成标准正态分布。[1]
若
服从标准正态分布,通过查标准正态分布表就可以直接计算出原正态分布的概率值。故该变换被称为标准化变换。(标准正态分布表:标准正态分布表中列出了标准正态曲线下从-∞到X(当前值)范围内的面积比例。)
定义
一维正态分布
若随机变量
服从一个位置参数为
、尺度参数为
的概率分布,且其概率密度函数为[2]
则这个随机变量就称为正态随机变量,正态随机变量服从的分布就称为正态分布,记作
,读作
服从
,或
服从正态分布。
μ维随机向量具有类似的概率规律时,称此随机向量遵从多维正态分布。多元正态分布有很好的性质,例如,多元正态分布的边缘分布仍为正态分布,它经任何线性变换得到的随机向量仍为多维正态分布,特别它的线性组合为一元正态分布。
本词条的正态分布是一维正态分布,此外多维正态分布参见“二维正态分布”。
标准正态分布
当
时,正态分布就成为标准正态分布
性质
正态分布的一些性质:[2]
(1)如果
且a与b是实数,那么
(参见期望值和方差)。
(2)如果
与
是统计独立的正态随机变量,那么:
它们的和也满足正态分布
它们的差也满足正态分布
U与V两者是相互独立的。(要求X与Y的方差相等)。
(3)如果
和
是独立常态随机变量,那么:
它们的积XY服从概率密度函数为p的分布
其中
是修正贝塞尔函数(modified Bessel function)
它们的比符合柯西分布,满足
(4)如果
为独立标准常态随机变量,那么
服从自由度为n的卡方分布。
C(u)=E(juX)=1/√(2π)∫{-∞,+∞}e^(jux-x²/2)dx,直接积分较困难
由于d[e^(jux-x²/2)]/dx=(ju-x)e^(jux-x²/2),因此先考察下列积分:
1/√(2π)∫{-∞,+∞}(ju-x)e^(jux-x²/2)dx
=1/√(2π)∫{-∞,+∞}e^(jux-x²/2)d[e^(jux-x²/2)]
=1/√(2π)e^(jux-x²/2)|{-∞,+∞}
=1/√(2π)[cos(ux)/e^(x²/2)+jsin(ux)/e^(x²/2)]| {-∞,+∞}
=0 ①
①式为零是因为有界函数与无穷小量的乘积仍为无穷小量
而1/√(2π)∫{-∞,+∞}jue^(jux-x²/2)dx
= ju1/√(2π)∫{-∞,+∞}e^(jux-x²/2)dx
= juC(u) ②
注意到C(u)对u求导得
C’(u) =1/√(2π)∫{-∞,+∞} jxe^(jux-x²/2)dx,
故1/√(2π)∫{-∞,+∞}xe^(jux-x²/2)dx
=(-j)1/√(2π)∫{-∞,+∞} jxe^(jux-x²/2)dx
=(-j)C’(u) ③
由①②③式得
juC(u)+jC’(u)=0,即
C’(u)+uC(u)=0 ④
将微分方程④分离变量d[C(u)]/C(u)=-udu
两边积分lnC(u)=-1/2u²+lnC
整理得C(u)=Ce^(-1/2u²)
将初始条件C(0)=1代入上式得,C=1
故C(u)=e^(-1/2u²)
正态分布的内容很丰富。首先,一维正态分布的概率密度,期望,方差,特征函数要记住。其次,一维正态分布的平方是独立平方和分布,也是伽马分的特殊情形。多元正态分布的话,记住用协方差矩阵来写它的密度函数。值得注意的是,多元正态分布的边缘分布还是正态分布,条件概率也服从正态分布。这些是基础,可参看杨振明的概率论
μ随机变量X服从正态分布,一般记作N(μ,σ方),其中μ为X的数学期望,σ为标准差,所以正态分布中的μ就是随机变量X的均值。
若随机变量X服从一个数学期望为μ、方差为σ^2的正态分布,记为N(μ,σ^2)。其概率密度函数为正态分布的期望值μ决定了其位置,其标准差σ决定了分布的幅度。
由于一般的正态总体其图像不一定关于y轴对称,对于任一正态总体,其取值小于x的概率。只要会用它求正态总体在某个特定区间的概率即可。
扩展资料:
服从标准正态分布,通过查标准正态分布表就可以直接计算出原正态分布的概率值。标准正态分布表:标准正态分布表中列出了标准正态曲线下从-∞到X(当前值)范围内的面积比例。
多元正态分布的边缘分布仍为正态分布,它经任何线性变换得到的随机向量仍为多维正态分布,特别它的线性组合为一元正态分布。
正态分布
normal distribution
一种概率分布。正态分布是具有两个参数μ和σ2的连续型随机变量的分布,第一参数μ是遵从正态分布的随机变量的均值,第二个参数σ2是此随机变量的方差,所以正态分布记作N(μ,σ2 )。 遵从正态分布的随机变量的概率规律为取 μ邻近的值的概率大 ,而取离μ越远的值的概率越小;σ越小,分布越集中在μ附近,σ越大,分布越分散。正态分布的密度函数的特点是:关于μ对称,在μ处达到最大值,在正(负)无穷远处取值为0,在μ±σ处有拐点。它的形状是中间高两边低 ,图像是一条位于x轴上方的钟形曲线。当μ=0,σ2 =1时,称为标准正态分布,记为N(0,1)。μ维随机向量具有类似的概率规律时,称此随机向量遵从多维正态分布。多元正态分布有很好的性质,例如,多元正态分布的边缘分布仍为正态分布,它经任何线性变换得到的随机向量仍为多维正态分布,特别它的线性组合为一元正态分布。
正态分布最早由A棣莫弗在求二项分布的渐近公式中得到。CF高斯在研究测量误差时从另一个角度导出了它。PS拉普拉斯和高斯研究了它的性质。
生产与科学实验中很多随机变量的概率分布都可以近似地用正态分布来描述。例如,在生产条件不变的情况下,产品的强力、抗压强度、口径、长度等指标;同一种生物体的身长、体重等指标;同一种种子的重量;测量同一物体的误差;d着点沿某一方向的偏差;某个地区的年降水量;以及理想气体分子的速度分量,等等。一般来说,如果一个量是由许多微小的独立随机因素影响的结果,那么就可以认为这个量具有正态分布(见中心极限定理)。从理论上看,正态分布具有很多良好的性质 ,许多概率分布可以用它来近似;还有一些常用的概率分布是由它直接导出的,例如对数正态分布、t分布、F分布等。
正态分布应用最广泛的连续概率分布,其特征是“钟”形曲线。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)