回归方程中交互项的作用

回归方程中交互项的作用,第1张

(1)如果解释变量的边际效应不是常数,此时可考虑引入交互项,使得某解释变量的边际效应依赖于另一解释变量。当然,也可以考虑加入平方项(仍可通过求偏导数来解释其经济含义)。

(2)如果真实模型(true model)为包含交互项的非线性模型,则简单的线性模型将遗漏此交互项,从而导致“遗漏变量偏差”(omitted variable bias):

(3)通常线性模型所说的“故事”(story)过于简单,可能文献中早已做过。而如果在模型中加入交互项 ,则会使得你的故事变得更为深入而微妙。

扩展资料

具有两个预测变量(x1和x2)之间的相互作用的多元线性回归方程可以写成如下:

y = b0 + b1*x1 + b2*x2 + b3*(x1*x2)

考虑到我们的例子,它变成:

sales = b0 + b1*youtube + b2*facebook + b3*(youtube*facebook)

这也可以写成:

sales = b0 + (b1 + b3*facebook)*youtube + b2*facebook

或作为:

sales = b0 + b1*youtube + (b2 +b3*youtube)*facebook

b3 可以解释为YouTube广告中单位增加的YouTube广告效果的增加(反之亦然)。

参考资料来源:百度百科-回归方程

交互项是指你的几个变量一块生成了一个新的影响,比如不同性别的不同专业可能会对成绩有不同的影响,性别影响成绩,专业影响成绩,但是性别和专业和在一起又产生新影响。这时候就需要交互项。具体用不用看你的方程。一般不用。ppv课学习网站

一个小案例告诉你为什么要在回归模型中加入交互项

回归模型是工作中非常常见的模型,它可以用来预测未来的房价、植物的高度等。回归模型是一种预测模型,它预测的是连续变量的结果。即给定某些因素来预测某一个与之相关的结果,例如基于户型、位置、城市、过去的房价等,预测某个房子的价格。但是,简单的回归模型并不完全满足我们的需求,而在回归模型中加入交互项是一种非常常见的处理方式。它可以极大的拓展回归模型对变量之间的依赖的解释。这里举一个例子,来自于

假设我们要为一个灌木丛的高度(变量名为Height)建模,考虑的条件是土壤中细菌的数量(变量名为Bacteria)以及灌木丛所在的位置是充满阳关,还是只能收到部分阳光照射(变量名为Sun)。灌木丛高度按照厘米单位计算,细菌是以每千立方厘米的土壤中包含的细菌数量计算,如果在充满阳光的条件下,则Sun=1,在部分光照条件下,Sun=0。那么灌木丛高度的回归模型我们可以表示如下:

一个简单的回归模型

一种根据实际数据估计的结果是(举个例子):

一个实际估算的结果

现在,如果我们要检验一个假设,即土壤中细菌的数量在充满阳光和只有部分光照下是不同的。那么加入交互项就是一个非常好的方法。

一种可能性是充满阳光的条件下,土壤中有更多的细菌,植物一般也会可能长得更高。而在部分光照条件下,土壤中有更多的细菌,植物可能会长得更矮。另一种可能的假设是在有更多细菌的土壤中,不管关照条件如何,植物都会长得更高。但是在光照充分的条件下,这种关系可能更明显。

交互项的出现可以表明一个预测变量对一个相应变量的影响在其他预测变量有不同值的时候,是不同的。它的测试方式是将两个预测变量相乘的项放入模型中。也就是上述回归模型就变成了如下形式:

加入了交互项之后的回归模型

将一个交互项放到模型中会极大的改善所有相关系数的可解释性。例如,在这个例子中,如果没有交互项,那么B1就被解释成细菌对高度的单独的影响。但是有了交互项之后,细菌对高度的影响也与光照的情况有关系。细菌对高度的影响不再是局限于B1,也依赖于B3和Sun。那么细菌的影响应当表示成B1+B3×Sun。B1的含义是当Sun=0的时候,细菌的单独的影响。在这个例子中,加入了交互项之后,我们的模型最终是:

加入了回归向之后估算的结果

在加了交互项之后,B1和B2的结果也变了。现在细菌对高度的影响变成了4.2+3.2×Sun。当光照不充分,即Sun=0的时候,细菌的影响是4.2。因此,对于光照不充分的情况下,如果一种植物的土壤中每千立方厘米的细菌含量比另一种多1000的话,那么这个植物可能比另一个高4.2cm。同样的,在光照充分的条件下,这个细菌的影响变成了7.4。也就是说,对于光照充分的情况下,如果一种植物的土壤中每千立方厘米的细菌含量比另一种多1000的话,那么这个植物可能比另一个高7.4cm。

由于相互项的存在,植物处于完全或部分的阳光下,土壤中的细菌含量对植物高度的影响是不同的。 另一种说法是,不同类别的光照条件,植物高度和细菌数之间回归线的斜率是不同的。 B3表示这些斜率有多不同。

在这里,对B2的解释要更加困难。B2是指土壤细菌含量为0的情况下,光照的影响。由于细菌含量是一个连续变量,它也不可能为0。因此,B2本身并没有特别实际的含义。光照的影响是B2+B3×Bacteria,这也是一个连续变量,在每一种不同的细菌含量上都有不同的值。因此,对于光照本身的理解可以考虑将几个不同的细菌含量的值放到模型中,去看看植物高度和响应变量是如何变化的。

从这个案例我们可以看出,在实际中,如果我们的变量之间有关系的话,那么加入回归项能更好地是模型反映变量之间的关系。


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/bake/11625932.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-17
下一篇 2023-05-17

发表评论

登录后才能评论

评论列表(0条)

保存