1、首先打开软件之后,我们导入需要设置虚拟变量的数据,就以体检数据中的血型来设置虚拟变量为例,因为这个血型是无序多分类的,所以适合创建为虚拟变量。
2、下一步我们找到软件界面上方的转换图标,选择点击之后,在出现的菜单选项中,找到创建虚变量这个选项并点击。
3、点击创建虚变量之后,我们在右边选择针对的变量,其中可以看到血型,选择血型之后,在下方的名称中设置好名称之后点击确定。
4、点击确定之后即可进行创建,创建之后会出现一个结果展示界面,告诉我们根据血型变量生成了几个虚变量,名称会自动进行改变的。
gen year1=1 if time==2008replace year1=0 if time!=2008
对年份为2008年的观测生成一个为1的虚拟变量
其他类推。
虚拟变量(DummyVariables)又称虚设变量、名义变量或哑变量,用以反映质的属性的一个人工变量,是量化了的自变量,通常取值为0或1。引入哑变量可使线形回归模型变得更复杂,但对问题描述更简明,一个方程能达到两个方程的作用,而且接近现实。
模型中引入虚拟变量的作用
1、分离异常因素的影响,例如分析我国GDP的时间序列,必须考虑“**”因素对国民经济的破坏性影响,剔除不可比的“**”因素。
2、检验不同属性类型对因变量的作用,例如工资模型中的文化程度、季节对销售额的影响。
3、提高模型的精度,相当于将不同属性的样本合并,扩大了样本容量(增加了误差自由度,从而降低了误差方差)
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)