多元线性回归怎么做??

如题所述

多元线性回归怎么做??

多元线性回归考察的是多个自变量对因变量的影响,一元线性回归模型考察的是一个自变量对因变量的影响。

线性回归分析模型效果的结果如下:

从上表可以看出,离差平方和为162.149,残差平方和为152.062,而回归平方和为10.086。回归方程的显著性检验中,统计量F=2.574,对应的p值小于0.05,被解释变量的线性关系是显著的,可以建立模型。建立模型后,需要查看模型拟合优度是否可以,其中就可以查看R方与调整R方值。

拟合优度:

从上表可知,将社会资源, 教育水平, 科技发展作为自变量,而将创业可能性作为因变量进行线性回归分析,从上表可以看出,模型R方值为0.062,调整R方为0.038,其中R方是决定系数,模型拟合指标。反应Y的波动有多少比例能被X的波动描述。调整R方也是模型拟合指标。当x个数较多是调整R²比R²更为准确。意味着社会资源, 教育水平, 科技发展可以解释创业可能性的6.2%变化原因。可见,模型拟合优度一般,说明被解释变量可以被模型解释的部分较少。接下来查看变量是否具有多重共线性。

VIF值用于检测共线性问题,一般VIF值小于10即说明没有共线性(严格的标准是5),有时候会以容差值作为标准,容差值=1/VIF,所以容差值大于0.1则说明没有共线性(严格是大于0.2),VIF和容差值有逻辑对应关系,因此二选一即可,一般描述VIF值。在【线性回归】分析时,SPSSAU会智能判断共线性问题并且提供解决建议。 结果中可以看出,变量的VIF值均小于5,所以此案例不存在多重共线性的问题。

从上表可知,将教育水平,社会资源,科技发展,性别,年龄作为自变量,而将创业可能性作为因变量进行线性回归分析,从上表可以看出,模型公式为:创业可能性=2.114 + 0.251*教育水平 + 0.026*社会资源 + 0.013*科技发展-0.172*性别 + 0.024*年龄。

最终分析可知:教育水平的回归系数值为0.251(t=2.934,p=0.004<0.01),意味着教育水平会对创业可能性产生显著的正向影响关系。社会资源的回归系数值为0.026(t=0.271,p=0.787>0.05),意味着社会资源并不会对创业可能性产生影响关系。科技发展的回归系数值为0.013(t=0.140,p=0.889>0.05),意味着科技发展并不会对创业可能性产生影响关系。
性别的回归系数值为-0.172(t=-1.212,p=0.227>0.05),意味着性别并不会对创业可能性产生影响关系。年龄的回归系数值为0.024(t=0.297,p=0.767>0.05),意味着年龄并不会对创业可能性产生影响关系。
总结分析可知:教育水平会对创业可能性产生显著的正向影响关系。但是社会资源, 科技发展, 性别, 年龄并不会对创业可能性产生影响关系。

如果说自变量X已经对因变量Y产生显著影响(P< 0.05),还想对比影响大小,建议可使用标准化系数值的大小对比影响大小,Beta值大于0时正向影响,该值越大说明影响越大。Beta值小于0时负向影响,该值越小说明影响越大。上图所示,回归方程的常数项约为2.114,教育水平,社会资源,科技发展,性别,年龄的标准化系数分别为0.218、0.022、0.011、-0.085、0.021。可以看出模型中教育水平对创业可能性影响较大。

温馨提示:答案为网友推荐,仅供参考
第1个回答  2023-09-03

多元线性回归本身是不会自动剔除变量的。剔除变量,是因为你的选择方法是向前纳入、向后纳入或者其他自动筛选方法。

既然不存在相关,那就不要进入方程,就不用考虑虚拟变量,如果你一定要考虑虚拟变量,那就不用管它是否与因变量相关。

回归分析用于解释变量之间的因果关系的,研究的是自变量和因变量之间关系的方法。比方说研究企业所得税优惠额、净资产收益率、企业规模、年份对于对企业专利产出的影响是否显著,以及影响的大小。通过回归分析就可以研究出来。

线性回归的方式还有输入,步进,除去,后退,前进几种不同的方法,其中最常用的方法是输入和步进的方法,两种方法的区别是输入的方法是一次性的把所有的自变量纳入到回归分析的模型中,去构建一个回归分析模型。步进的方法是用来通过spss自动构建回归方程,把自变量依次一个一个的放入到回归方程中,这样会生成多个回归模型。

相似回答