收集数据的频繁目的是允许从样本中绘制群体的推论。在这种情况下,推动统计数据提供了借鉴超出所观察到的数据的结论的基础。共同推理的示例是评估观察到的效果(例如,组装置的差异)不归因于机会的可能性。与简单地总结所观察到的数据的描述性统计数据不同,推断统计用于制定更多关于数据超出数据的更大陈述。大多数经常报告的推理统计来自一般线性模型。一些示例是T测试,方差分析(ANOVA),线性回归分析和因子分析。
推理统计基于采样和概率的概念。在进行研究中要克服的问题是通常从较大的感兴趣群体所采取的样本中收集数据。如果从样本中收集的数据不代表与群体相关的数据,则不需要从样本数据汲取的推断。例如,考虑研究人员对员工如何感受到新的组织政策,并选择从由1000名员工组成的较大组织来示出20个人的人。从该样品中汲取的推迟可能不如样品更大(例如,100)。除了样品大小外,样品的特性也很重要。使用前一个例子,20个随机选择的个体可以更具代表性于100个以上的个人,他们分享一些独特的特征(例如,夜班的所有工作),因此可以为借鉴员工态度的推断提供更强的基础。
概率是与推论统计有关的另一个重要概念。概率理论为接受或拒绝假设提供了基础。传统的假设检测将推理统计数据赋予了二分法决策的基础。简而言之,如果零假设是真的(即,没有影响),观察效果的可能性是什么?在这个问题的答案是低值(通常小于5%)的范围内,拒绝零假设,并且推断观察到的效果不太可能是偶然的结果。相反,效果被认为是真实的。
作为零假假设意义测试的替代方案,可以使用置信区间作为吸引推断的基础。基本思想置信区间的基本思想是在特定研究中可能会过度归因或低估给定的效果。置信区间来自观察到的效果的点估计,并且间隔的宽度由效果的估计的标准误差确定。与传统二分法假设试验相比,使用置信区间的利益是它们提供更多信息(即,估计参数的一系列合理值)。
通常,推动统计需要四条信息。首先,需要测量观察到的效果的尺寸。这种效果大小估计可以采用观察到的组(例如,D)之间观察到的形式,或者可以以变量(例如,r)之间的关系的大小表达。这些效应被称为感兴趣的人口参数的估计。这种估计值为更强的推论,在某种程度上是无偏见的程度。所有其他相同的,观察到的效果越大,越容易被绘制,效果是真实的。其次,样本大小会影响从数据中汲取的推断。通常,较大的样品允许比较小的样品拉伸更强的推论。第三,与观察到的效果的统计测试相关的I型错误率(即p)影响从观察结果中汲取的推论。最后,统计测试的力量影响了推论的契约程度。 Greater power leads to stronger inferences.
参考:
- Gelman,A.,&Nolan,D。(2002)。教学统计:一袋技巧。牛津,英国:牛津大学出版社。
- Kranzler,G.,&Moursund,J.(1999)。恐怖的统计数据(第2号)。上部马鞍河,NJ:Prentice Hall。