人事心理学的一个核心兴趣是对选择、培训或动机的干预是否与某种标准有关。标准是一种评价标准,用来衡量员工在工作上的成功或失败。在许多情况下,兴趣标准将是工作表现,但标准也可以是一个特定的态度,能力,或动机,反映了一个可操作的陈述的目标或期望的结果的组织。这一定义隐含的是,标准是一个社会结构定义的组织领导人,谁负责制定和翻译有价值的组织成果。
最终的标准
最终,我们有兴趣预测最终标准,即员工绩效的完整领域,包括最终定义工作成功的一切。鉴于本定义的整体,最终标准仍然是无法测量或观察到的严格概念构建体。然而,接近它,并描述了组织重视的结果与导致这些结果的员工行为之间的联系,J.F. Binning和G. Barrett介绍了行为的概念。在实践中,这些链接应该基于彻底的工作分析,以讨论实际的工作要求或揭示良好性能所需的构造的工作规范的职位描述的形式。
操作标准
最终标准的概念性要求从业者演绎和发展标准测度或操作性测度,一种尽可能反映概念性标准的实证测度。使用这个操作标准作为兴趣的概念标准的代理,人事心理学中通常的方法是在预测器上的表现和操作标准上的表现之间建立联系,作为预测器的标准相关效度的指示。业务准则可包括下列各项:
- 客观的输出度量(例如,售出的物品数量)
- 质量措施(例如,投诉人数,错误数量)
- 员工失去的时间(例如,缺席或迟到的场合)
- 培训性和促销性(例如,时间达到绩效标准或促销)
- 性能的主观评级(例如,知识,技能,能力,个人特征或特征,工作样本的表现,或行为期望的评级)
- 反弱行为的迹象(例如,纪律侵犯,个人侵略,药物滥用或自愿财产损失)
在实践中,操作标准应满足至少三个独立的要求。
- 运营标准必须与组织的主要目标相关。虽然这可能在理论上听起来很明显,但在实践中,标准选择通常基于方便(例如,使用来自“围绕任何方式”的性能记录的数据),习惯或复制其他人所使用的数据。Though recorded output data such as sales volume might be easily accessible, they may represent a more suitable criterion measure for some organizations (e.g., car dealers striving for high momentary sales figures) than for others (e.g., car dealers living on good word-of-mouth propaganda resulting from superior customer service).
- 操作标准在区分有效员工和无效员工时必须敏感。这就要求(a)在业务标准上的业绩和雇员在工作上的实际业绩之间建立联系(即,业务标准和概念标准之间的联系),以及(b)雇员之间的差异。例如,在速度受到装配线节奏限制的情况下,生产速度可能是一个不合适的标准;同样,所有核电站工程师的放射性事故数量可能都很低,这使得这个理论上相关的标准实际上毫无用处。
- 如果管理层面临广泛的数据录制和报告,则最佳设计的评估系统需要可行的操作标准,因为当管理层面临着广泛的数据记录和报告,而不看到他们的额外努力均匀返回。
标准问题
标准问题描述了概念化和度量感兴趣的概念性标准(一个多维的、动态的构造)所涉及的困难,它可以被操作标准最好地捕获。根据宾宁和巴雷特的说法,如果标准所依据的职业分析质量很差,如果操作标准和概念标准之间的联系没有得到充分的理性化,那么这个问题就会更严重。
标准不足与污染
任何操作标准都会遭受至少两个困难中的一个:首先,标准不足是一个可怕和普遍的问题,因为操作标准衡量通常不能评估员工在工作上成功或失败的所有真正相关的方面。第二,操作标准可能受到污染,因为许多措施还受到个人无法控制的其他外部因素的影响。衡量标准存在缺陷的一个最持久的原因是最终标准的多维度,它结合了静态、动态和个体维度。造成污染和缺陷的另外两个原因是性能和性能观察的不可靠性。最后,主要与标准污染相关的原因是影响标准评价的稳定偏差。
静态维度意味着同一个人可能在某一方面表现高,但同时在另一方面表现低。因此,尽管一名员工可能在经典任务绩效方面(即,将原材料转化为组织生产的商品和服务或帮助这一过程的活动)做得很好,但同一名员工可能会表现出相对较差的情境或组织公民行为(即,通过提供一个可以执行任务的良好环境来提高组织效率的行为,如志愿服务、帮助、与他人合作,或在外部支持和保护组织)。甚至,同一个人可能会从事适得其反的行为或工作偏差(即违反组织规范、威胁组织及其成员福祉的自愿行为,如偷窃、逃避工作或散布有关组织的谣言)。
Another aspect of static dimensionality addresses whether performance is observed under typical performance conditions (i.e., day-in, day-out, when employees are not aware of any unusual performance evaluation and when they are not encouraged to perform their very best) or under maximum performance conditions (i.e., short-term evaluative situations during which the instruction to maximize efforts is plainly obvious, such as work samples). The distinction is important because performance on the exact same task can differ dramatically between situations, not only in absolute terms but also in terms of employee ranking of performance. A likely reason is that typical versus maximum performance situations influence the relative impact of motivation and ability on performance.
时间或动态维度意味着标准随时间变化。这种变化可能采取三种形式中的任何一种。首先,标准的平均值可能会改变,因为表演者作为一个组可能会随着工作时间而变得更好或更糟。其次,标准上分数的等级顺序可能会随着一些表演者在其性能方面仍然相对稳定而变化,而其他表演高度增加或随着时间的推移降低性能。第三,由于改变任务或改变科目,任何性能预测者的有效性可能会随着时间而变化。改变任务模型假定由于技术发展,有效性能的不同标准可能重要性变化,而个人的相对能力保持稳定(例如,PUB开始接受新的计费方法,并希望员工知道如何处理员工)。或者,改变主题模型假定这不是任务的要求,而是每个人的能力水平随时间变化(例如,因为增加了经验和工作知识或降低了物理健身)。
个人维度意味着表现相同工作的个人可能被认为是同样的好处,但他们对组织的贡献的性质可能是完全不同的。例如,在同一栏中工作的两个非常不同的个体可能最终有相同的整体性能评估,例如,如果其中一个人在家里让客户感到愉快的工作,而另一个在保持书籍方面做得更好按顺序和支付的账单。
标准可靠性,可以随着时间的推移测量标准的一致性或稳定性,是人力资源干预中的基本考虑因素。但是,并不总是给出这种可靠性。更准确地说,有两个主要的不可靠性来源。Intrinsic unreliability results from personal inconsistency in performance, whereas extrinsic unreliability results from variability that is external to job demands or the individual, such as machine downtimes, the weather (e.g., in construction work), or delays in supplies, assemblies, or information (in the case of interdependent work) that may contaminate ratings at some times but not necessarily at others. Practically, there is little remedy for criterion unreliability except to search for its causes and sample and aggregate multiple observations over the time and over the domain to which one wants to generalize.
除了标准本身缺乏信度之外,Jack的观察信度也是概念标准和操作化标准之间存在差异的另一个原因——也就是说,根据对标准的评价方式和评价对象的不同,标准测量可能会导致非常不同的结果。因此,主管、同事、直接报告、客户或员工的客观数据和评级可能会因不同的原因对员工的表现作出巨大的评价。虽然员工的直接主管似乎是判断绩效与组织目标相违背的最佳人选,但他或她实际上可能很少观察员工,因此缺乏做出准确判断的基础。这种直接观察在同龄人中更为常见,但同龄人之间的关系(例如,友谊、联盟、内群体与外群体)可能会影响评分。相比之下,直接报告主要是观察被评估者在等级等级的情况下,这可能不能代表被评估者的整体工作情况,而且,如果他们担心自己的匿名,他们也可能会给出有偏见的评级。对于有大量客户互动的工作,客户可能有足够大的观察基础来进行评估,但他们可能缺乏对组织目标的洞察力,需要评估员工达到这些目标的程度。
由于错误和偏差不同,可污染操作标准。误差或测量中的随机变化,降低了标准可靠性,并且最好通过重复的标准数据集合来解决。然而,偏差表示观察到的标准评分的系统偏差来自同一个人的真实分数。由于它们可能持续措施,因此偏差甚至可能增加操作标准的可靠性的统计指示。If the same biases are equally related to the measure used to predict the criterion (e.g., performance in a specific personnel selection procedure), they may also increase the predictor’s statistical criterion-related validity, even though this validity is not based on the actual criterion of interest but on the bias persisting across measurements.
在各种可能的偏见中,由预测器信息或群体成员资格和偏差的知识产生的偏见尤其突出。例如,如果主管已经参与选择候选人,在选择过程中的印象可能会影响对工作的后期适合或性能的评估。组成员可能会产生偏见,如果组织为某些群体提供支持但不是其他人(例如,仅适用于妇女的管理培训)或者为不同的群体建立不同的标准(例如,配额促销)。最后,标准额定值中的偏差可能来自额定额定倾向(宽度,中央倾向或严重程度)的个人偏差或偏见,或者从评估者无法区分标准的不同方面(晕圈)。随着员工的熟练程度变得更加不平等,这些效果将变得更加严重,并且当评估者的观察变得更加不准确。
引用:
- Binning,J.F.,&Barrett,G. V.(1989)。人事决策的有效性:对推论和证据基础的概念分析。应用心理学杂志,74,478-494。
- Cascio,W. F.(1998)。人力资源管理中的应用心理学(第5次)。上部马鞍河,NJ:Prentice Hall。
- Guion,R. M.(1998)。对人员决策的评估,测量和预测。马瓦,新泽:劳伦斯·埃尔巴姆。