GMM估计分析步骤及结果解读_软件运维

GMM估计是用于解决内生性问题的一种方法，除此之外还有TSLS两阶段最小二乘回归。

如果存在异方差则GMM的效率会优于TSLS，但通常情况下二者结论表现一致，很多时候研究者会认为数据或多或少存在异方差问题，因而可直接使用GMM估计。

内生变量是指与误差项相关的解释变量。对应还有一个术语叫‘外生变量’，其指与误差项不相关的解释变量。产生内生性的原因通常在三类，分别说明如下：

内生性问题的判断上 ，通常是使用Durbin-Wu-Hausman检验（SPSSAU在两阶段最小二乘回归结果中默认输出），当然很多时候会结合自身理论知识和直观专业性判断是否存在内生性问题。如果假定存在内生性问题时，直接使用两阶段最小二乘回归或者GMM估计即可。一般不建议完全依照检验进行判断是否存在内生性，结合检验和专业理论知识综合判断较为可取。

内生性问题的解决上 ，通常使用工具变量法，其基本思想在于选取这样一类变量（工具变量），它们的特征为：工具变量与内生变量有着相关(如果相关性很低则称为弱工具变量)，但是工具变量与被解释变量基本没有相关关系。寻找适合的工具变量是一件困难的事情，解决内生性问题时，大量的工作用于寻找适合的工具变量。

关于 引入工具变量的个数上 ，有如下说明：

过度识别和恰好识别是可以接受的，但不可识别这种情况无法进行建模，似想用一个工具变量去标识两个内生变量，这是不可以的。

工具变量引入时，有时还需要对工具变量外生性进行检验（过度识别检验），针对工具变量外生性检验上，SPSSAU提供Hansen J检验。特别提示，只有过度识别时才会输出此两个检验指标。

GMM估计类型参数说明如下：

本案例引入Mincer(1958)关于工资与受教育年限研究的数据。案例数据中包括以下信息，如下表格：

数据共有12项，其中编号为1，5，7，8，12共五项并不在考虑范畴。

本案例研究‘受教育年限’对于‘Ln工资’的影响。明显的，从理论上可能出现‘双向因果关系’即‘受教育年限’很可能是内生变量。那么可考虑使用‘母亲受教育年限’和‘成绩’这两项数据作为工具变量。同时研究时纳入3个外生变量，分别是‘婚姻’，‘是否大城市‘和’当前单位工作年限’。使用两阶段最小二乘TSLS回归进行解决内生性问题。

本案例研究时，工具变量为2个，内生变量为1个，因而为过度识别，可以正常进行TSLS回归。

关于内生性的检验Durbin-Wu-Hausman检验(SPSSAU在两阶段最小二乘回归TSLS结果中默认输出)，其用于检验是否真的为内生变量；如果说检验不通过（接受原假设），那么说明没有内生变量存在，可直接使用OLS回归即可。当然即使没有内生性，一般也可以使用TSLS回归或GMM估计，没有内生性问题时，OLS回归和TSLS回归，或GMM估计结论通常一致；

关于过度识别检验上，SPSSAU提供Hansen J检验，原理上此过度识别检验仅在‘过度识别’时才会输出，即工具变量个数>内生变量个数时，才会输出。

本案例分别将被解释变量，内生变量，工具变量和外生变量纳入对应的模型框中，如下：

SPSSAU共输出5类表格，分别是研究变量类型表格，GMM估计模型分析结果表格，GMM估计模型分析结果-简化格式表格，模型汇总(中间过程)表格和过度识别检验(overidentifying restrictions)。说明如下：

上一表格展示本次研究时涉及的各变量属性，包括被解释变量，内生变量，工具变量和外生变量组成情况。

上表格列出GMM估计的最终结果，首先模型通过Wald 卡方检验(Wald χ² =272.418，p=0.000<0.05)，意味着模型有效。同时R方值为0.341，意味着内生和外生变量对于工资的解释力度为34.1%。具体查看内生和外生变量对于被解释变量‘工资’的影响情况来看：

受教育年限的回归系数值为0.112(p=0.000<0.01)，意味着受教育年限会对工资产生显著的正向影响关系。

婚姻(已婚为1)的回归系数值为0.168(p=0.000<0.01)，意味着相对未婚群体来讲，已婚群体的工资水平明显会更高。

是否大城市(1为大城市)的回归系数值为0.145(p=0.000<0.01)，意味着相对来讲，大城市样本群体，他们的工资水平明显会更高。

当前单位工作年限的回归系数值为0.036(p=0.000<0.01)，意味着当前单位工作年限会对工资产生显著的正向影响关系。

总结分析可知： 受教育年限, 婚姻，是否大城市, 当前单位工作年限全部均会对工资产生显著的正向影响关系。

上表格展示模型的基础指标值，包括模型有效检验wald卡方值（此处提供wald卡方非F检验），R值，Root MSE等指标值。

过度识别检验用于检验工具变量是否为外生变量，本次研究涉及工具变量为2个，分别是‘母亲受教育年限’和‘成绩’。从上表可知，过度识别Hansen J检验显示接受原假设（p=0.868>0.05），说明无法拒绝‘工具变量外生性’这一假定，模型良好。

特别提示：

就是为语音信号建模<也可以理解为分布模型>。

GMM就是Gaussian Mixture Model的缩写。

其实就是不同方差的高斯分布叠加在一块。

在实际产品中，例如speech ehancement一般不怎么会用GMM。原因是太复杂了。

还有一个叫HMM模型，Hidden Markov Model。这个在语音识别中常常用到。

欢迎分享，转载请注明来源：内存溢出

原文地址: https://outofmemory.cn/yw/12100067.html

GMM估计分析步骤及结果解读

发表评论

评论列表（0条）