您现在的位置:主页 > 讲座动态 >
 
 

Logistic二元回归模型中逐步回归的结果中为什么会有变量不显著

时间:2020-05-17 14:21:47

谢邀,我这里就尽量大白话给你说下。这里是因为你的自变量之间不是绝对相互独立的。(具体是协变量相关,还是共线性,还是因子非线性这个要深入分析)。然后再说下你这种做法为什么会导致p值大于0.05还能进入模型。因为向前选择(Wald).逐步选择方法,其中进入检验是基于得分统计量的显著性,移去检验是基于Wald统计的概率。而模型在何处停止纳入参数是通过似然比检验(likelihoodratiotest)决定的,也就是说模型的损失函数并不是由单个变量的Wald统计量决定的。因为对于损失函数来说,系数检验不显著的变量纳入方程中后,通过似然比检验发现模型与数据的拟合结果改善了,所以这些自变量就被纳入模型了。另外展开说点,Logistic二元回归虽然简单,但是还是有很多方面要注意:1、做之前可以先做个单因素分析,自变量的相关性也要分析一下,但是也不能唯单因素,因为单因素有意义,不代表进入模型就有意义。单因素的分析没意义,也不代表进入模型就没有意义。因为单因素解析会受到样本中混杂因素的影响。最好还是结合专业知识,进行自变量的筛选。2、前进法或stepwise或者back法最好都做一下,对结果进行比较。但是如果基础比较扎实的话,可以一个自变量一个自变量的加入模型,然后再随机组合,这样能分析出来更多信息,但是比较麻烦,新手还是算了。3、做研究,不要唯模型,一个方程搞到底,说白了,模型只是辅助我们理解现实世界的工具,对于同样的数据,一千个人有一千个做法,所以永远没有最真的模型,只有更好的模型,关键是看你如何解释,一定要结合理论,活学活用。
共有评论 11相关评论
发表我的评论
  • 大名:
  • 内容: