新闻中心
深圳沙盘模型公司:准确建立统计模型的实用指南!
如果你运行的是纯预测模型,而变量之间的关系不是重点,那就容易多了。继续运行逐步回归模型。让数据给你最好的预测。
一、记住回归系数是边际结果。
这意味着每个预测因子的系数是该预测因子对响应变量的独特影响。除非所有的预测器都是独立的,否则这不是完全的效果。这是在控制模型中其他变量后的效果。所以模型中的其他内容很重要。系数可能会发生很大的变化,这取决于模型中的其他因素。
如果两个或两个以上的预测因子在解释一个结果时重叠,那么这两个重叠都不会反映在回归系数中。它在整体模型F统计和r平方中,但不是系数。
二、从单变量描述和图表开始。
它将帮助您查找在清理过程中丢失的任何错误。但更重要的是,你必须知道你在做什么。首先要做的是单变量描述,或者更好的是,图形。你不仅仅是在寻找钟形曲线。你要在发行版中间寻找有趣的休息。具有大量点的值。令人惊讶的值,通常比您预期的高得多或变化较小。一旦将这些变量放入模型中,它们可能表现得很有趣。如果你知道他们进去时是什么样子,你就会更好地理解为什么。
三、接下来,运行双变量描述,再次包括图。
你还需要了解每一个潜在的预测器是如何独立地与结果和其他预测器相关的。因为回归系数是边际结果,了解变量之间的双变量关系将使您了解为什么某些变量在更大的模型中失去显著性。
四、在集合中考虑预测器。
许多模型中,预测因子在理论上是不同的。通过首先在这些集合中构建模型,我们能够看到相关变量是如何一起工作的,然后在我们把它们放在一起之后发生了什么。
通常情况下一个集合中的变量是相关的,但在集合之间没有太多的关联。如果你把所有东西都放在一起,很难找到任何关系。这是一个巨大的,压倒性的混乱。
通过首先单独构建每一个集合,您可以构建理论上有意义的模型,并对各个部分是如何组合在一起有一个扎实的理解。
五、模型构建和解释结果是同步进行的。
你运行的每一个模型都会告诉你一个故事。停下来听听。看看系数。看看R平方。它变了吗?有控制变量的模型到没有控制变量的模型,系数的变化有多大?当您暂停执行此操作时,可以对下一个运行的模型做出更好的决策。
六、交互中涉及的任何变量都必须单独存在于模型中。
当你决定留在模型中的什么和从模型中启动什么时,很容易去掉所有不在模型中的东西。