1、首先将数据录入到SPSS软件中,也可以是Excel表格直接导入,不要忘记把“变量视图”设置成数值型。
2、选择你要处理的值,进行“相关性分析”,观察两者间有没有存在相关性。因为有了相关性才能做回归分析。
3、如果检验得出存在相关性,就可以做回归分析了。SPSS软件上方选择“分析”-“回归分析”-“线性”,点击确定。
4、在相应的框中输入X和Y轴对应的内容,其他都不需要管。
5、最后就是结果分析了,在输出的文档中一共有四张表,其中系数表就是所求出来的模型。在查看回归的水平为Y,然后输入X预测Y的值。
以office07版为例;新建并打开excel表格,如图首先添加数据分析插件,点击左上角按钮,出现菜单页面,选中右下角“EXCEL选项”按钮,点击,如图然后点击“加载项”选项,选中“分析工具库”,点击下方"转到"按钮,如图然后出现excel加载宏界面,在”分析工具库“前方框内打勾,点击确定。经过上一步已经成功添加”数据分析插件“,在”数据“-”数据分析“下可以找到,如图然后点击”数据分析“,可以找到相关的分析方法,如回归分析,方差分析,相关分析等。回归分析(regressionanalysis)是确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法。
步骤
1确定变量
明确预测的具体目标,也就确定了因变量。如预测具体目标是下一年度的销售量,那么销售量Y就是因变量。通过市场调查和查阅资料,寻找与预测目标的相关影响因素,即自变量,并从中选出主要的影响因素。
2建立预测模型
依据自变量和因变量的历史统计资料进行计算,在此基础上建立回归分析方程,即回归分析预测模型。
3进行相关分析
回归分析是对具有因果关系的影响因素(自变量)和预测对象(因变量)所进行的数理统计分析处理。只有当变量与因变量确实存在某种关系时,建立的回归方程才有意义。因此,作为自变量的因素与作为因变量的预测对象是否有关,相关程度如何,以及判断这种相关程度的把握性多大,就成为进行回归分析必须要解决的问题。进行相关分析,一般要求出相关关系,以相关系数的大小来判断自变量和因变量的相关的程度。
4计算预测误差
回归预测模型是否可用于实际预测,取决于对回归预测模型的检验和对预测误差的计算。回归方程只有通过各种检验,且预测误差较小,才能将回归方程作为预测模型进行预测。
5确定预测值
利用回归预测模型计算预测值,并对预测值进行综合分析,确定最后的预测值。用linest函数
帮助文件如下:
LINEST
请参阅
使用最小二乘法对已知数据进行最佳直线拟合,并返回描述此直线的数组。因为此函数返回数值数组,所以必须以数组公式的形式输入。
直线的公式为:
y = mx + b or
y = m1x1 + m2x2 + + b(如果有多个区域的 x 值)
式中,因变量 y 是自变量 x 的函数值。M 值是与每个 x 值相对应的系数,b 为常量。注意 y、x 和 m 可以是向量。LINEST 函数返回的数组为 {mn,mn-1,,m1,b}。LINEST 函数还可返回附加回归统计值。
语法
LINEST(known_y's,known_x's,const,stats)
Known_y's 是关系表达式 y = mx + b 中已知的 y 值集合。
如果数组 known_y's 在单独一列中,则 known_x's 的每一列被视为一个独立的变量。
如果数组 known-y's 在单独一行中,则 known-x's 的每一行被视为一个独立的变量。
Known_x's 是关系表达式 y = mx + b 中已知的可选 x 值集合。
数组 known_x's 可以包含一组或多组变量。如果只用到一个变量,只要 known_y's 和 known_x's 维数相同,它们可以是任何形状的区域。如果用到多个变量,则 known_y's 必须为向量(即必须为一行或一列)。
如果省略 known_x's,则假设该数组为 {1,2,3,},其大小与 known_y's 相同。
Const 为一逻辑值,用于指定是否将常量 b 强制设为 0。
如果 const 为 TRUE 或省略,b 将按正常计算。
如果 const 为 FALSE,b 将被设为 0,并同时调整 m 值使 y = mx。
Stats 为一逻辑值,指定是否返回附加回归统计值。
如果 stats 为 TRUE,则 LINEST 函数返回附加回归统计值,这时返回的数组为 {mn,mn-1,,m1,b;sen,sen-1,,se1,seb;r2,sey;F,df;ssreg,ssresid}。
如果 stats 为 FALSE 或省略,LINEST 函数只返回系数 m 和常量 b。
对模型整体情况进行分析:包括模型拟合情况(R²),是否通过F检验等。
回归的检验首先看anova那个表,也就是F检验,那个表代表的是对你进行回归的所有自变量的回归系数的一个总体检验,如果sig<005,说明至少有一个自变量能够有效预测因变量,这个在写数据分析结果时一般可以不报告。
分析X的显著性(P值),如果呈现出显著性,则说明X对Y有影响关系。如果不显著,则应剔除该变量。结合回归系数B值,对比分析X对Y的影响程度。B值为正数则说明X对Y有正向影响,为负数则说明有负向影响。
回归分析研究的主要问题是:
(1)确定Y与X间的定量关系表达式,这种表达式称为回归方程;
(2)对求得的回归方程的可信度进行检验;
(3)判断自变量X对因变量Y有无影响;
(4)利用所求得的回归方程进行预测和控制。
百度百科-回归分析
可以使用在线spss平台SPSSAU进行分析,结果比较容易解读。
B值:用于判断X对Y的影响关系方向及影响程度
回归系数B值大于0说明正向影响,反之负向影响,以及通过B值大小对比X对Y的影响程度大小。
P值:如果P<005,则说明具有影响关系,反之无影响关系。
R方:用于判断模型情况
VIF值:判断模型共线性问题
F检验:用于判定是否X中至少有一个对Y产生影响,如果呈现出显著性,则说明所有X中至少一个会对Y产生影响关系。
具体说明可查看spssau输出的智能文字分析结果。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)