stata做回归分析时,有变量提示由于共线性被忽略,求大神指导如何处理?是将其剔除再回归吗?
来源:学生作业帮助网 编辑:作业帮 时间:2024/07/04 22:39:29
![stata做回归分析时,有变量提示由于共线性被忽略,求大神指导如何处理?是将其剔除再回归吗?](/uploads/image/z/9469677-21-7.jpg?t=stata%E5%81%9A%E5%9B%9E%E5%BD%92%E5%88%86%E6%9E%90%E6%97%B6%2C%E6%9C%89%E5%8F%98%E9%87%8F%E6%8F%90%E7%A4%BA%E7%94%B1%E4%BA%8E%E5%85%B1%E7%BA%BF%E6%80%A7%E8%A2%AB%E5%BF%BD%E7%95%A5%2C%E6%B1%82%E5%A4%A7%E7%A5%9E%E6%8C%87%E5%AF%BC%E5%A6%82%E4%BD%95%E5%A4%84%E7%90%86%3F%E6%98%AF%E5%B0%86%E5%85%B6%E5%89%94%E9%99%A4%E5%86%8D%E5%9B%9E%E5%BD%92%E5%90%97%3F)
stata做回归分析时,有变量提示由于共线性被忽略,求大神指导如何处理?是将其剔除再回归吗?
stata做回归分析时,有变量提示由于共线性被忽略,求大神指导如何处理?是将其剔除再回归吗?
stata做回归分析时,有变量提示由于共线性被忽略,求大神指导如何处理?是将其剔除再回归吗?
不一定,首先变量提示由于共线性被剔除有两种原因,一种是正常的,不用管,一种是不正常的,需要处理,不过总的来说无论你是否处理,它都不会进入回归(stata会自动忽略),要处理的都是你的模型假设.
正常的,就是说例如这样:我们假设我们分析的群体是51~80岁的,我们想把年龄分成三组,变量1是虚拟变量代表在50~60岁间(是=1,否=0),变量2是虚拟变量代表在61~70岁间,变量3是虚拟变量代表在71~80岁间.那么当你回归时加入这三个虚拟变量控制年龄的时候,因为这三个变量的和一定为1(共线性),所以系统会自动忽略其中一个,但是这个时候你不用在模型中删除那个被忽略的变量,因为这是正常的,这代表那个变量被自动选为基准组.我们在解释其他组的变量的系数上,也是解释为“相对于被忽略的那个基准组,这个变量所代表的组如何影响因变量,这个组是有平均比起基准组更多还是更少的因变量“.
不正常的,就是说明明不是分组的虚拟变量,但也有共线性.比如说可能是这样,你想看丈夫和妻子的年龄差,然后又希望控制丈夫和妻子的年龄,这时由于(年龄差=年龄相减)产生了共线性,这说明你的模型本身就设定失误,我们只需要控制丈夫的年龄就可以达到都控制的效果.
也可能是这样:你想看”是否退休“对因变量的影响,但是因为你的样本比较窄,比如是”20~50“岁的样本,导致所有人都没有退休,”是否退休“变量对所有人都是0(没退休),所以被忽略掉,这时就意味着你的样本不支持做你想要的模型,此时也只得删掉这个变量了.