描述性统计信息 - IresearchNet

测量提供了一种用于量化感兴趣的重要现象的方法。在许多测量环境中，研究人员仅对有效地描述数据感兴趣。描述性统计数据是可以实现这些数据摘要的索引。与研究人员有兴趣绘制数据的概括的上下文不同，描述性统计不用于吸引更大人口的推论。

例如，考虑一下教师最近管理考试的情况。从根本上说，老师已经建立了测试，希望有更多了解课程材料的人，比课程材料更少的知识更好（接受更高的分数）。在评分考试后，教师记录了教师成绩书中的每个学生的成绩，这是按字母顺序组织的。虽然这些数据可以很容易地用于识别任何个别学生的性能，但是字母组织不提供整个分数的简单解释。

使用描述性统计信息来理解这些数据的一种方法是构建一个频率表，其中分数是从最大到最小的排序的等级以及接收每个分数的个人数量。该信息也可以以图形方式以频率分布形式呈现，其中沿X轴绘制测试得分并且沿y轴绘制频率。对这些数据的这种表示的检查可以快速揭示观察到的分数分布的一般形状（例如，正常，双峰，倾斜）。

虽然数据的图形表示是有用的，但对这种表现的解释在很大程度上。因此，通常用于理解一组数据的特征来定量描述。频率分布通常沿两个尺寸定量地描述：中央趋势和可变性。中央趋势是指最能捕获观察到的分数的中心的分数，并且可以通过三种替代指标描述：模式，中位数和平均值。重要的是，这些值仅在观察到的数据通常分布时都是相同的。结果，应根据测量规模和数据的最终使用，选择要解释的统计数据。

类似于中央趋势，可以通过几个统计来评估可变性，包括范围，方差和标准偏差。一组得分的范围表示最高和最低分数之间的差异。方差量化通过平方偏差的得分之间的分数之间的差异，并且标准偏差被计算为方差的平方根，并且可以被解释为从平均值的个体分数的可变性指标。

可用于描述一组数据定量的描述性统计数据是歪斜和峰氏症。歪斜表示观察到的分数在分布的极端发生的程度。正面数据是那些在测试得分尺度的下端下降的数据，并且具有负面倾斜的数据的特征在于高分性更频繁地发生。Kurtosis基本上描述了频率分布的尾部的长度。PlatyKurtic数据是尾巴的尾部短于预期的数据，所以数据是正常的，而喉部数据是尾部比通常分布式数据预期的尾声数据。

描述性数据不限于与单变量数据一起使用。在许多情况下，例如，有兴趣与一种测量相关的可变性的程度与第二次数中的可变性相关联。与单变量数据一样，描述性统计可以用于图形上并定量评估此问题。图形方式，这种关系可以在接合分配表或通过散点图中描绘，其中在二维空间中绘制两个变量的分数。因为对这些图形描绘的解释很大程度上是主观的，所以相关系数通常被计算为量化观察到的关系的索引。

参考：

Gelman，A.，＆Nolan，D。（2002）。教学统计：一袋技巧。牛津，英国：牛津大学出版社。
Kranzler，G.，＆Moursund，J.（1999）。恐怖的统计数据（第2号）。上部马鞍河，NJ：Prentice Hall。