统计力(SP)是指当一个零假设(没有差异的假设)实际上是错误的时候,拒绝它的概率。当一个组织研究者保留(没有拒绝)一个错误的零假设时,他或她可能会得出这样的结论,例如,组织干预没有积极地影响生产力,或者选择测试不能有效地预测未来的工作绩效。因为一个错误的决定可能有重要的实际意义,研究人员希望有足够的SP,以便能够在零假设是错误的时候拒绝它。SP的数量现在在测试,两个之间的区别意味着或两组值的关系,是受三个因素的影响:(a)α水平(或概率值),采用统计检验,(b)样本的大小用来获取或相关性,和(3)效应的大小(ES;或者差异或关系的大小)。在讨论这些因素之前,我们必须对假设检验中的第一类和第二类错误说几句话。
类型I和类型II错误
图1显示了接受或拒绝一个实际为真或假的零假设的相互作用。当一个零假设(例如,两个不相关的变量或两个没有不同的子组)被拒绝为真时,就会出现I型错误,但它实际上是真的。当零假设被保留为真时,就会出现II型错误,但实际上它不是真。第一类错误的概率用alpha (a)表示,第二类错误的概率用beta (B)表示。统计幂-拒绝错误的零假设的概率-等于1减去第二类错误的概率(1 - P)。
在统计分析中,可以通过调整统计检验的概率或水平来操纵出现第一类和第二类错误的可能性。最典型的值是。05。当a = .05时,犯第一类错误的比率是每100个可以进行比较的独立样本的5倍。如果为a选择一个较小的值(例如,0.01),提交第一类错误的可能性减少,但第二类错误的可能性增加。类似地,通过增加a(到大于0.05的值),我们减少了第二类错误的概率。
影响统计能力的因素
如前所述,一、样本大小和ES扮演了一个重要的角色在决定SP。根据图1中,SP的匡威是II型错误的概率(SP = 1 - P)。一个方法降低II型错误的可能性增加。虽然没有什么神圣的常用的一个水平,我们应该小心不要过度增加a水平。很少有组织干预,其中治疗效果真正为零;许多治疗方法可能收效甚微,但很少会毫无效果。根据原假设检验,I型错误只有在治疗效果为零时才会发生。因此,不建议在没有良好理论基础的情况下提高a水平,因为a越高,对效果的检验就越不严格,而且犯第一类错误的可能性就越大。
在其他条件相同的情况下,样本量越大,SP就越大。因此,为了确保检测到显著效应,应该在普遍的实际约束条件下获得尽可能大的样本量。通常,获得一个更大的样本是更费时和昂贵的。如果总体相关性是.10,那么需要1000个病例的样本具有足够的SP(例如,SP = .80,这通常被认为是可以接受的),以检测出a = .01,或者一个超过600个病例的样本,以a = .05。
效应量是一种量化组织干预有效性的方法。在给定的样本量和水平下,ES越大,检测组织干预效应的SP越大。常用的ES是标准化的平均差值d,通过将(干预组和对照组之间的)平均差值除以合并标准差计算得到。另一个常用的ES是相关系数r, r可以转换为d。按照现行惯例,ds分别为0.20、0.50和0.80,表示ESs小、中、大。类似地,。10、。30和。50的rs分别被认为是小、中、大ESs。
当已知其他三个因素时,有统计公式来估计样本量、a、SP或ES。(对于给定的a、SP和ES值,也有用于估计所需样本大小的表格。)例如,在实施新的组织干预或新的选择测试之前,研究人员可能想知道需要多少样本来检测给定的显著差异水平。
使用这个公式,研究者可能会得出这样的结论:a = .05和SP = .80就足够了。假设干预应该导致较小的ES,则需要对给定的SP集和值进行较大的样本。相反,假设干预将导致更大的ES需要更小的样本量。通常,诱惑是假设一个较大的ES,从而一个较小的样本量估计。如果假设的ES比预期的要小,研究人员可能无法检测到显著差异时,它实际上存在。来自以前的调查或元分析的信息在估计给定条件的ES时是有帮助的。
我们回顾了影响SP的主要因素及其在设计研究中的作用。关于SP及其估计的其他信息可以在参考文献中找到。
引用:
- 科恩,j .(1988)。行为科学的统计功率分析(第二版)。希尔斯代尔,新泽西州:劳伦斯·埃尔鲍姆。
- 科恩,j .(1994)。地球是圆的(p < .05)。美国心理学家,49,997 -1003。
- Kraemer, H. C., & Thiemann, S.(1987)。有多少课程?纽伯里公园,CA: Sage。
- 墨菲,K. R.(1990)。如果零假设是不可能的,为什么要检验它?美国心理学家,45,403-404。
- Murphy, K. R., & Myors, B.(1998)。统计功率分析:传统和现代假设检验的一个简单和一般的模型。新泽西州莫沃:劳伦斯·埃尔鲍姆。