概率论中二维正太分布的一道题目

概率论中二维正太分布的一道题目,第1张

系数行列式不为0,所以存在可逆矩阵T,使得(U,V)=T (X,Y)

(U,V)服从二维正态分布,所以(X,Y)的概率密度函数可由(U,V)的概率密度函数经非退化变换得到,也是二维正态分布的密度函数。

X,Y服从正态分布的话,那么只要变化系数行列式不为0,那么新的线性变化依然服从二维正态分布。因为,如果变化系数不为零,那么所以存在可逆矩阵T,使得(U,V)=T (X,Y)

(U,V)服从二维正态分布,所以(X,Y)的概率密度函数可由(U,V)的概率密度函数经非退化变换得到,也是二维正态分布的密度函数。

证明该函数是一个概率密度函数,其应该满足概率密度函数的基本性质:一是大于零,二是全空间上的积分等于1。

扩展资料:

若随机变量X服从一个数学期望为μ、方差为σ^2的正态分布,记为N(μ,σ^2)。其概率密度函数为正态分布的期望值μ决定了其位置,其标准差σ决定了分布的幅度。当μ = 0,σ = 1时的正态分布是标准正态分布。

服从标准正态分布,通过查标准正态分布表就可以直接计算出原正态分布的概率值。故该变换被称为标准化变换。(标准正态分布表:标准正态分布表中列出了标准正态曲线下从-∞到X(当前值)范围内的面积比例。)

多元正态分布有很好的性质,例如,多元正态分布的边缘分布仍为正态分布,它经任何线性变换得到的随机向量仍为多维正态分布,特别它的线性组合为一元正态分布。

--二维正态分布

P(X/Y<0)=05

本题使用正态分布与独立性分析:

(x,y)~N(0,0,1,1,0)

说明X~N(0,1),Y~N(0,1)

且X与Y独立

X/Y<0,即X与Y反号

所以 P(X/Y<0)=P(X>0,Y<0)+P(X<0,Y>0)

=P(X>0)P(Y<0)+P(X<0)P(Y>0)

=05×05+05×05

=05

二维随机变量( X,Y)的性质不仅与X 、Y 有关,而且还依赖于这两个随机变量的相互关系。因此,逐个地来研究X或Y的性质是不够的,还需将(X,Y)作为一个整体来研究。

扩展资料:

在一定区间内变量取值为有限个或可数个。例如某地区某年人口的出生数、死亡数,某药治疗某病病人的有效数、无效数等。离散型随机变量通常依据概率质量函数分类,主要分为:伯努利随机变量、二项随机变量、几何随机变量和泊松随机变量。

随机事件数量化的好处是可以用数学分析的方法来研究随机现象。例如某一时间内公共汽车站等车乘客人数,电话交换台在一定时间内收到的呼叫次数,灯泡的寿命等等,都是随机变量的实例。

在实际问题中通常用它来表征多个独立 *** 作的随机试验结果或多种有独立来源的随机因素的概率特性,因此它对于概率统计的应用是十分重要的。

——二维随机变量

二元正态分布的特征函数求法:联合密度函数对x积分就可以,这个积分指数配方后直接就有结果了。

设(X,Y)服从二维正态分布,且X与Y独立,fX(x),fY(y)分别是X,Y的概率密度,则在Y=y条件下,分布函数为f(x,y)的积分,积分范围(-∞,-∞)到(x,y)。对于相关系数为零的情况,分布函数又可以写成F(x,y)=FX(x)FY(y),等于两个正态分布函数的乘积。

函数性质

特征函数具有以下基本性质:如果两个随机变量具有相同的特征函数,那么它们具有相同的概率分布; 反之, 如果两个随机变量具有相同的概率分布, 它们的特征函数也相同(显然)。独立随机变量和的特征函数等于每个随机变量特征函数的乘积。

二维正态分布与正态分布差别1 二维正态分布的值就是原来的假设是错误的概率。

2、 正态分布中的值主要用来检验一组数据是否服从正态分布的标准。

3、 正态分布的密度函数的特点是:关于对称性,在处达到最大值,在正(负)无穷处取值为0,在 处有拐点。

4、 正态分布又称高斯分布,是数学、物理和工程领域中一种非常重要的概率分布,在统计学的许多方面都有很大的影响。

5、 如果随机变量服从位置参数和尺度参数的概率分布,则记为:其概率密度函数为正态分布的数学期望值或期望值等于位置参数,决定分布的位置;方差的平方根或标准差等于比例参数,它决定了分布的大小

1 方法

  性质1: 设X是一个随机变量,其分布函数为F(x),则Y=F(X)服从在〔0,1〕的均匀分布。

  性质2: 设X1,K,Xn是某个分布的一个简单样本,其分布函数为F(x),由性质1可知,在概率意义下,F(X1),F(X2),K,F(Xn)在(0,1)上呈均匀分布,按从小到大依次排序,记为F(X1),F(X2),K,F(Xn),其相应理论值应为ri=i-0,5[]n,i=1,2,…,n,对应分布函数的反函数值F-1(r1),F-1(r2),K,F-1(rn)(在卡方分布中即为卡方分数)应非常接近X1,X2K,Xn,故在概率意义下,这些散点(X1,F-1(r1)),(X2,F-1(r2)),L,(Xn,F-1(rn))应在一条直线上。

  根据性质2,如果X服从正态分布,则散点理论上应落在一直线上,可以用Pearson系数刻画这种分布。但由于随机变异的存在,Pearson系数并不等于1,所以通过随机模拟的方法,制定出Pearson系数的95%界值下限。

  性质3: 由条件概率公式P(X,Y)=P(Y|X)P(X)可知:(X,Y)服从二元正态分布的充分必要条件是固定X,Y服从正态分布(条件概率分布)并且X的边际分布为正态分布。由线性回归的性质ε=Y-(α+βX)可知,固定X,Y的条件概率分布为正态分布的充分必要条件是线性回归的残差ε服从正态分布,由此可得:(X,Y)服从二元正态分布的充分必要条件是X的边际分布为正态分布以及线性回归模型Y=α+βX+ε中的残差服从正态分布。

设X来自于正态总体,从正态总体中随机模拟抽样5000次,每次抽样样本含量分别为7至50,对F(x)求秩,求出排序后的F(x)和排序后的X的Pearson相关系数。表1 随机模拟5000次得到的检验正态分布的Pearson相关系数的界值(略)

  类似地,我们也可以用同样的方法得到检验卡方分布的Pearson相关系数的界值表(简化表)表2 相关系数界值表(略)

  2 随机模拟验证

  21 Pearson相关系数界值表的随机模拟验证

  设X来自于正态总体,从正态总体中随机模拟抽样5000次,每次抽样样本含量分别为10,20,30,40,50,并计算相应的Pearson卡方系数,以及落在界值外面的比例,即拒绝比例,再在同一批数据的前提下用McNemar检验比较本方法和Swilk法的差别。表3 (一元正态分布)模拟次数(略)表4(一元偏态分布,χ2)模拟次数(略)

  以上方法拒绝比例在样本量为7的可信区间为[7837%,9412%],在其余样本量时都接近100%,可以证实是正确的。

  22 卡方分布界值表的随机模拟验证 

  表5 卡方分布:模拟5000次(略)

  

  23 马氏距离的随机模拟验证

  根据马氏距离的定义,从正态分布总体中随机抽取样本量分别为10,20,30,40,50的样本模拟5000次,根据上面提到的方法以卡方分数对X1,X2K,Xn求Pearson系数,并根据以上的相关系数界值表,计算相应的统计量,即拒绝比例。表6 马氏距离落在Pearson系数界值表外的比例(略)

  24 二元正态分布资料的随机模拟验证

  设定一个二维矩阵A,分别求出特征值P和特征向量Z,设X的元素均来自于正态总体分布,则Y=Z′×X必服从二元正态分布,随机模拟5000次,根据性质三介绍的方法验证的拒绝比例如下。表7 (二元正态分布)模拟次数(略)表8 (二元偏态分布,χ2)模拟次数(略)

  25 三元正态分布资料的随机模拟验证

  类似地,随机模拟5000次,用同样方法进行验证,得到对于三元正态分布数据的拒绝比例。表9 (三元正态分布)模拟次数:5000次

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/langs/12178203.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-21
下一篇 2023-05-21

发表评论

登录后才能评论

评论列表(0条)

保存