设X~N(1,2),Y~N(-1,3),且X与Y相互独立,则
2X ~ N(1×2,2×4)
2X-Y ~ N(2-(-1),8+3),即2X-Y ~ N(3,11)
X与Y都服从正态分布,且相互独立时,X+Y服从正态分布,且均值和方差分别为两正态分布均值和方差之和,可以通过比较特征函数来推导,随便找本概率论应该都会找得到。
可以用定义证,这里给出一个更简单的证法,用特征函数证:
N(a,σ²)的特征函数为exp(iat-σ²t²/2)
因为X,Y独立
所以有f_(aX+bY)(t)
=f_(aX)(t)f_(bY)(t)
=f_(X)(at)f_(Y)(bt)
=exp(iμ1at-σ1²a²t²/2)exp(iμ2bt-σ2²b²t²/2)
=exp(i(aμ1+bμ2)t-(a²σ1²+b²σ2²)t²/2)
这就是N(aμ1+bμ2,a²σ1²+b²σ2²)的特征函数。
由特征函数的唯一性知aX+bY~N(aμ1+bμ2,a²σ1²+b²σ2²)
正态曲线呈钟型,两头低,中间高,左右对称因其曲线呈钟形,因此人们又经常称之为钟形曲线。
若随机变量X服从一个数学期望为μ、方差为σ^2的正态分布,记为N(μ,σ^2)。其概率密度函数为正态分布的期望值μ决定了其位置,其标准差σ决定了分布的幅度。当μ = 0,σ = 1时的正态分布是标准正态分布。
扩展资料:
由于一般的正态总体其图像不一定关于y轴对称,对于任一正态总体,其取值小于x的概率。只要会用它求正态总体在某个特定区间的概率即可。
为了便于描述和应用,常将正态变量作数据转换。将一般正态分布转化成标准正态分布。
服从标准正态分布,通过查标准正态分布表就可以直接计算出原正态分布的概率值。故该变换被称为标准化变换。(标准正态分布表:标准正态分布表中列出了标准正态曲线下从-∞到X(当前值)范围内的面积比例。)
--正态分布
正态分布的分布函数:若随机变量X服从一个位置参数为μ、尺度参数为σσ的概率分布,且其概率密度函数为f(x)=12π√σe(xμ)22σ2。
若随机变量X服从一个数学期望为μ、方差为σ^2的正态分布,记为N(μ,σ^2)。其概率密度函数为正态分布的期望值μ决定了其位置,其标准差σ决定了分布的幅度。当μ = 0,σ = 1时的正态分布是标准正态分布。
正态分布特征函数特性:
1)集中性:曲线的最高峰位于正中央,且位置为均数所在的位置。
2)对称性:正态分布曲线以均数所在的位置为中心左右对称且曲线两段无线趋近于横轴。
3)均匀变动性:正态分布曲线以均数所在的位置为中心均匀向左右两侧下降。
4)曲线与横轴间的面积总等于1。
取 X 表示柯西分布随机变量,则柯西分布的特性函数表示为:
Φx(t;X0,γ)=exp(iX0t-γt的绝对值)
如果 U 与 V 是期望值为 0、方差为 1 的两个独立正态分布随机变量的话,那么比值 U/V 为柯西分布。
柯西分布是一个数学期望不存在的连续型分布函数,它同样具有自己的分布密度,满足
分布函数F(X)=1/2+1/πarctanx,-∞<x<+∞
密度函数ф(x)=1/[π(1+x^2)],-∞<x<+∞
的称为标准柯西分布。
记为C(θ,α)。
对X有柯西分布C(θ,α), 令Y=(X-θ)/α, 则称Y有C(0,1)分布。对于C(0,1)分布称为标准的柯西分布。正态分布也有类似的性质。
柯西分布有两个参数θ、a, 概率密度函数pdf的图形亦为钟形,不仔细看, 还不容易与正态分布pdf的图形区别。插图中,我们把柯西分布和正态分布的pdf之图形放在一起比较。可发现,,柯西分布pdf之图形下降至0的速度慢很多。
泊松分布的特征函数如下:
泊松分布概率密度函数是P{X=k}=λ^k/(k!e^λ)k=0,1,2……k代表的是变量的值。泊松分布的参数λ是单位时间(或单位面积)内随机事件的平均发生次数。 泊松分布适合于描述单位时间内随机事件发生的次数。泊松分布的期望和方差相等,当二项分布的n很大而p很小时,泊松分布可作为二项分布的近似,其中λ为np。
分布函数:
分布函数(英文Cumulative Distribution Function, 简称CDF),是概率统计中重要的函数,正是通过它,可用数学分析的方法来研究随机变量。分布函数是随机变量最重要的概率特征,分布函数可以完整地描述随机变量的统计规律,并且决定随机变量的一切其他概率特征。
若已知X的分布函数,就可以知道X落在任一区间上的概率,在这个意义上说,分布函数完整地描述了随机变量的统计规律性。如果将X看成是数轴上的随机点的坐标,那么,分布函数F(x)在x处的函数值就表示X落在区间上的概率。
数学1大纲
1)微积分(分数比例:60%)
①函数、极限、连续
函数的概念及性质 反函数 复合函数 隐函数 分段函数 基本初等函数的性质 初等函数 数列极限与函数极限的概念 函数的左、右极限 无穷小和无穷大的概念及其关系 无穷小的比较 极限的四则运算
函数连续与间断的概念 初等函数的连续性 闭区间上连续函数的性质
②一元函数微积分
导数的概念 函数可导性与连续性之间的关系 导数的四则运算 基本初等函数的导数 复合函数、反函数和隐函数的导数 高阶导数 微分的概念和运算法则 微分在近似计算中的应用 中值定理及其应用 洛必达(L’Hospital)法则 函数的单调性 函数的极值 函数图形的凹凸性、拐点及渐近线 函数的最大值和最小值
原函数与不定积分的概念 不定积分的基本性质 基本积分公式 定积分的概念和基本性质 定积分中值定理 变上限定积分及导数 不定积分和定积分的换元积分法和分部积分法 广义积分的概念及计算 定积分的应用
③多元函数微积分
多元函数的概念 二元函数的极限与连续性 有界闭区间上二元连续函数的性质 偏导数的概念与计算 多元复合函数及隐函数的求导法 高阶偏导数 全微分 多元函数的极值和条件极值、最大值和最小值 二重积分的概念、基本性质和计算 无界区域上的简单二重积分的计算 曲线的切线方程和法线方程
④级数
常数项级数收敛与发散的概念 级数的基本性质与收敛的必要条件 几何级数与p级数的收敛性 正项级数收敛性的判断 任意项级数的绝对收敛与条件收敛 交错级数 莱布尼茨定理 幂级数的概念 收敛半径和收敛区间 幂级数的和函数 幂级数在收敛区间内的基本性质 简单幂级数的和函数的求法 初等函数的幂级数展开式 泰勒级数与马克劳林级数
⑤常微分方程
微分方程的概念 可分离变量的微分方程 齐次微分方程 一阶线性微分方程 二阶常系数线性微分方程 的求解 特解与通解
(2)线性代数(分数比例:30%)
①行列式
n级排列 行列式的定义 行列式的性质 行列式按行(列)展开 行列式的计算 克莱姆法则
②矩阵
矩阵的定义及运算 矩阵的初等变换 初等矩阵 矩阵的秩 几种特殊矩阵 可逆矩阵及矩阵的逆的求法 分块矩阵
③线性方程组
求解线性方程组的消元法 n维向量及向量间的线性关系 线性方程组解的结构
④向量空间
向量空间和向量子空间 向量空间的基与维数 向量的内积 线性变换及正交变换 线性变换的核及映像
⑤特征值和特征向量
矩阵的特征值和特征向量的概念及性质 相似矩阵 一般矩阵 相似于对角阵的条件 实对称矩阵的特征值及特征向量 若当标准形
⑥二次型
二次型及其矩阵表示 线性替换 矩阵的合同 化二次型为标准形和规范形 正定二次型及正定矩阵
(3)运筹学(分数比例:10%)
①线性规划
线性规划问题的标准形 线性规划问题的解的概念 单纯形法(包括大M法和两阶段法) 单纯形法的矩阵形式 对偶理论 影子价格 对偶单纯形法 灵敏度分析
②整数规划
③动态规划
多阶段决策问题 动态规划的基本问题和基本方程 动态规划的基本定理 离散确定性动态规划模型的求解 离散随机性动态规划模型的求解
5、参考书:
①《高等数学讲义》(第二篇 数学分析) 樊映川编著 高等教育出版社
②《线性代数》 胡显佑 四川人民出版社
③《运筹学》(修订版) 1990年 《运筹学》教材编写组 清华大学出版社
除以上参考书外,也可参看其他同等水平的参考书
数学2大纲
(1)概率论(分数比例:50%)
事件、样本空间、概率空间的含义 典型概率类型的计算方法 条件概率的计算方法 运用全概率公式和贝叶斯公式求解概率问题 统计独立性的含义 事件的独立性及利用独立条件求解概率问题 随机变量及分布函数 随机变量数字特征(数学期望、方差、协方差,矩) 随机变量特征函数阶性质 能够利用特征函数求解随机变量的各阶矩 常用的离散型随机变量的分布列 连续型随机变量的分布函数及其数学期望、方差(连续型:均匀分布、指数分布、Г-分布、正态分布、t-分布、F分布、χ2分布等)联合分布律 联合分布函数及联合密度函数 边际分布律 边际分布函数及边际概率密度等 条件概率密度及求解条件概率 大数定律及中心极限定理 契比雪夫不等式 运用随机变量的变换得出新的变量的密度函数及概率 条件期望和条件方差 混合型分布的分布函数、期望和方差
(2)数理统计(分数比例:35%)
数理统计的基本概念 样本(子样) 总体(母体) 统计量 样本矩 顺序统计量和经验分布函数 求估计量的两个常用方法(矩方法、最大似然估计方法) 无偏估计概念 正态总体样本线性函数的分布及其数学特征 χ2分布、t-分布、F-分布的密度函数及其期望、方差 正态总体样本均值及样本方差的分布 柯赫伦定理 假设经验 正态总体的参数(均值、方差)的检验方法 多项分布的χ2检验方法及联立表的独立性检验 广义似然比检验 线性模型及参数β的最小二乘法估计 剩余平方和的概念及其相关性质 参数β的假设检验方法及其置信区间构造和Y的预测 Y关于x的线性回归函数的性质 单因素方差分析及方差分析表的构造 估计中的一些概念及有效估计的概念 无偏估计的(有)效率 充分统计与完备统计 最大似然估计的性质及参数估计的贝叶斯方法的基本步骤 在二次损失函数下参数的贝叶斯估计量及其计算方法 假设检验的一些基本概念及奈曼一皮尔逊基本引理 顺序统计量及其分布
(3)应用统计(分数比例:15%)
多元线性回归模型参数的最小二乘法估计 多元线性回归模型参数的假设检验及置信区间 多元线性回归模型的拟合度及F检验 异方差性问题 序列相关性问题 多重共线性问题 非线性回归模型 指数平滑模型 移动平均模型 自回归模型 ARMA模型 自相关函数及偏自相关函数 回归模型预测 时间序列模型预测 预测区间
5、参考书:来源:wwwexamdacom
①《概率论第一册》 复旦大学编 人民教育出版社 1979年4月第1版
②《概率论第二册》(第一、二分册) 复旦大学编 人民教育出版社 1979年8月第1版
③《概率论与数理统计》 陈希孺编著 中国科学技术大学出版社 2000年3月第1版
④《应用线性回归》(美)SWeisberg著 王静龙、梁小筠等译 中国统计出版社 1998年3月第1版
最大熵模型(maximum entropy model, MaxEnt) 是很典型的分类算法,它和逻辑回归类似,都是属于对数线性分类模型。在损失函数优化的过程中,使用了和支持向量机类似的凸优化技术。而对熵的使用,让我们想起了决策树算法中的ID3和C45算法。
理解了最大熵模型,对逻辑回归,支持向量机以及决策树算法都会加深理解。
我们知道熵定义的实际上是一个随机变量的不确定性,熵最大的时候,说明随机变量最不确定。也就是随机变量最随机,对其行为做准确预测最困难。最大熵原理的实质就是,在已知部分知识的前提下,关于未知分布最合理的推断就是符合已知知识最不确定或最随机的推断。这是我们可以作出的唯一不偏不倚的选择,任何其它的选择都意味着我们增加了其它的约束和假设,这些约束和假设根据我们掌握的信息无法作出。(在已知若干约束的情况下,我们建模时应该让模型满足这些约束,而对其它则不作任何假设。)
将最大熵原理应用于分类问题,得到的就是最大熵模型。对于这样的一个问题:给定一个训练数据集:
其中 表示输入, 表示输出, X 和 Y 表示输入和输出空间, N 为样本的个数。
我们的目标是:利用最大熵原理选择一个最好的分类模型,即对于任意给定的输出入 , 可以以概率 输出 。
按照最大熵原理,我们应该优先保证模型满足已知的所有约束。这些约束该如何定义呢?我们的思路是:从训练数据 T 中抽取若干特征,然后要求这些特征在 T 上关于经验分布 的数学期望与它们在模型中关于 的数学期望相等。这样,一个特征就对应一个约束。
有了上面定义的特征函数和经验分布,就可以进一步定义我们所需的约束条件了。
几何分布的期望和方差公式分别是E(n)等于1/p、E(m)等于(1-p)/p,
几何分布是离散型概率分布。其中一种定义为:在n次伯努利试验中,试验k次才得到第一次成功的机率。详细地说,是:前k-1次皆失败,第k次成功的概率。几何分布是帕斯卡分布当r=1时的特例。
数学期望,在概率论和统计学中是指试验中每次可能结果的概率乘以其结果的总和,是最基本的数学特征之一。它反映随机变量平均取值的大小。
方差是在概率论和统计方差衡量随机变量或一组数据时离散程度的度量。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)