logistic回归又称logistic回归分析,是一种广义的线性回归分析模型,常用于数据挖掘,疾病自动诊断,经济预测等领域。
操作方法
logistic回归用途较为广泛,先来介绍下这种回归模型!
【分析】-【回归】-【二元logistic】得到分析结果
模型价值的指标:-2倍的对数似然值越小,模型越好;Cox&Snell?R方和Nagelkerke?R方是伪决定系数;比数比的发生概率不是很高的时候,才能那么理解
用Logistic模型进行预测可以看到在数据视图窗口中出现了预测概率值,说明了低出生重儿与吸烟与否的概率关系,0.25217与0.40541
自动筛选方法并不可靠,稳妥的策略:先是通过各种方法对模型进行拟合,然后再分析比较各个方法做出来的结果之间的差别,对那几个变化比较大的变量利用专业上的知识进行取舍。【整体总统计量】的意思是说:在现有的模型基础之上把所有的候选变量一齐纳入模型中,模型是否有改善。H0:模型没有改善。这里P值小于0.05,认为有改善在具体分析时,应该先看总统计量
对低出生重儿的预测比例有所上升。P值大于0.05没有统计学意义,尚不能确认在其他变量保持不变的情况下该变量发生所导致的低出生重儿是概率是这个变量不发生所导致低出生重儿的Exp倍。Wals用于自变量的筛选是不太准确的
【向后】法筛选。首先【向后】:LR
依次除去P值最大的那个,这个表格的意思是剔除了某个变量之后的模型是否与原模型有差异
同样的道理,【向前】法