“有三种谎言:谎言、该死的谎言和统计数字。”这句名言常被认为出自马克•吐温之口,但实际上(至少根据吐温本人的说法)是英国首相本杰明•迪斯雷利(Benjamin Disraeli)的作品。不管是谁说的,这句话依然为人熟知,因为它抓住了一种普遍的怀疑,即在多大程度上可以用统计数据来支持任何立场,并进行充分的操纵。对于心理科学家来说,这是一个特别大的公共关系问题,他们的大部分研究结论都是通过统计分析得出的。
在各种可用的统计技术中,可能没有一种比相关系数更经常被滥用,这也是最常见的处理心理学观察性(非实验性)研究数据的方法。相关系数是表明两组数字之间关系的性质和强度的单一数字。取值范围为−1.0 ~ 1.0。
一个正的数字意味着一个因素的高分伴随着另一个因素的高分——当一个因素上升时,另一个也会上升。负相关表示反向关系——一个上升,另一个下降。相关性越接近绝对值(正或负)1.0,测量的关系就越强。例如,鞋码和裤子码之间有很强的正相关关系,至少在童年时期是这样的——一个数字越高,另一个数字也越高。气温与人们穿的衣服层数呈负相关——随着气温上升,穿的衣服越来越少。
不幸的是,在日常生活和统计分析中,一个常见的错误是假定相关性代表因果关系。有时这是一个合理的假设——例如,吸烟总数与患肺癌的可能性之间存在强烈的正相关——但有时则不然。例如,一个城市中教堂的数量和酒吧的数量之间有很强的正相关关系。在国际上,一个数字增加,另一个也会增加。一个因果的解释可能会诱惑我们:宗教驱使人们喝酒,或者相反,饮酒可能导致更大的宗教狂热。请注意,数据本身并没有指出因果关系或这种关系的方向(如果存在一个因果关系的话)。事实上,这两个数字之间的关系可以用第三个变量来解释,这就是人口膨胀。较大的城镇有更多的教堂和酒吧。
因果关系显然是对上述例子不恰当的解释。一个重要的警告:因果关系的解释对于相关数据总是不合适的。有时数据可能实际上代表了一种因果关系,但没有办法只从相关系数来说明。唯一允许得出因果推论的心理学研究是实验。
尽管如此,因果推理一直在进行。政客是罪魁祸首。例如,过去的五任总统(可能还有他们的前任),都通过将这些数据与他们执政的月份相关联,来获取某些经济指标改善的信贷。政府跟踪许多经济指标,在任何给定的时期,有些指标会上升,有些指标会下降。很简单的一件事就是检查一下总统执政的头100天的统计数据,然后挑出一个上升的,然后指出总统执政期间的情况。然而,与其他相关数据一样,相关数据中没有包含足够的信息来假设因果关系。要警惕这种事情——它无处不在,这是一种聪明的说谎方式。
将相关性与因果关系混淆的倾向是一种完全自然的倾向,它具有自适应功能,尽管有时是错误的。认识到连续发生的两件事可能共享一个因果关系并不是一个坏的生存价值thing-consider注意到某种类型的云通常预示着一个危险的雷雨或某一类型的活动由鸟类经常发现一只老虎的到来几秒钟。它也可以引导我们看到这种不存在的关系,然而,一种被称为幻觉共变的现象。这也许可以解释为什么许多未经证实的感冒药如此流行。尽管一些临床试验已经证明紫锥菊对免疫系统或感冒症状没有任何作用,但它仍因这种所谓的作用而广受欢迎。感冒通常持续一周左右,可能短一点,也可能长一点。如果我们服用药物几天后开始感觉好一些,这似乎是相当明显的治疗导致改善。然而,作为科学家,我们必须警惕显而易见的情况——不管有没有治疗方法,感冒都可能会好转。
尽管存在这些缺陷,相关性仍然是一种非常有用的统计技术,因为问题在于解释,而不是数字本身。相关性的真正目的是表明两个变量是否以某种方式相关,以及这种关系有多强——它不能告诉我们其他任何关于这种关系性质的东西。当我们从相关性中得到有希望的结果时,我们可以使用这些数据来计划实验,以测试是否存在任何类型的因果关系。
引用:
- 杜尼,A. K.一无所有的200%。纽约:威利,1993;
- Huff, D. How to Lie with Statistics。纽约:W.W.诺顿,1954年,1993年。