从最严格的意义上说,工作样本是对工作的实际表现测试或模拟,用于估计当前或预测未来在类似任务上的表现。工作样本的使用包括以下内容:
- 选择工作样本可以用来决定雇佣哪个应聘者。这是工作样例最典型的用法。
- 绩效测量与评估:工作样本有时被用来估计一个人当前的工作表现水平,当其他的衡量标准不可用时。这将在下一节中详细讨论。
- 残疾人职业评估:工作样本常被用来确定残疾申请人能否胜任不同类型的工作。这些类型的工作样本用于为残疾工人提供职业咨询和职业指导。
- 可训练性测量:工作样本有时会在短暂的培训后被使用,以决定是否应该选择这个人继续进行更长时间的培训计划。在这些情况下,工作样本旨在衡量可培训性,以预测此人将在培训计划中取得多大的成功。
- 培训评估:工作样本通常用于培训计划完成时,以确定培训是否有效地提高绩效。
工作样本的定义特征是工作中执行的关键任务的物理复制;然而,许多其他不复制工作环境的选择工具也可以被视为工作示例。因此,某些类型的模拟比其他类型更适合工作样本的标签。从最广泛的意义上说,任何评估对工作表现至关重要的特定技能、知识或能力倾向的测试在某些情况下可以作为工作样本。
工作样本特征
所有的工作样本都是基于这样的概念,即测试样本的行为,而不是衡量类似特质的结构,并且这些样本的行为与工作中产生的行为相似。因此,工作样本是特定于工作的。虽然一个工作样本可以用于预测多个组织的相同工作,但如果用于预测不同类型的工作,相同的测试可能不再符合工作样本的资格。举例说明:一个测量识别数字转录错误的速度和准确性的测试可以作为数据录入人员的工作样本。然而,同样的测试不是糖果工厂质量控制职位的工作样本,即使该测试是对两份工作的有效预测。在第一个例子中,测试测量的行为与工作中要求的行为相似(检查数字);在第二个例子中,测试很可能是一个对细节的构念注意的指示器。因此,研究人员在不了解要预测的工作的情况下,无法确定测试是否是工作样本。
忠于工作
工作示例的范围可以从高保真度(工作任务的精确重复)到低保真度(具有与工作任务不同的度量格式)。来自各种工作的高保真工作样本包括飞行模拟器、拖消防水龙带和爬梯子、阅读蓝图测试、打字和归档测试、牙科雕刻测试、缝纫测试、显微镜使用测试、驾驶测试、评估中心模拟(即篮内测试、无领导的小组讨论、商业游戏,下属模拟),警察报告写作测试,计算机编程测试,等等。
低保真度工作样本分为两大类:
- 身体能力测试,如手灵巧性测试,光学测试和力量测试
- 纸笔测试,如工作知识测试(如农业知识测试)、情景判断测试、工作特定技能或能力倾向测试(如数学测试)
因此,一些研究人员使用术语工作样本来指代工业/组织(I/O)心理学家通常使用的各种选择工具。
工作样本的缺点
虽然工作样本通常是有用的工具,但在三种情况下它们的用处可能会受到限制:
工作样本成本
第一个缺点与工具的成本或效用有关。仿真的开发和维护可能是昂贵的。高保真工作模拟必须针对工作中执行的任务进行裁剪,必须培训人员管理和评分工作样本。在某些情况下,工作样本的费用可能超过工作样本相对于其他测试的潜在增量有效性。例如,当雇佣一个木匠时,让30个申请人来实际建造一个橱柜可能是不划算的。高保真造柜模拟的时间和材料开销可能过多。相反,低保真度的工作模拟,如情景判断测试或工作知识测量可能更实用。然而,根据仿真的复杂性,高保真度仿真的成本可能会有很大的不同。例如,在组装电脑芯片等低复杂度的重复性工作中,一个高保真的工作样本焊丝连接可能是相当划算的。
工作样本作为当前绩效的衡量标准
工作样本有时被用来估计当前员工的工作表现,当其他措施,如主管评级不可用时。在这些情况下,工作样本不再作为预测指标,而是作为各种人力资源(HR)实践的代理标准衡量标准,包括:确认其他选择工具,评估培训结果,评估个人或员工的培训需求,进行绩效评估,甚至做出晋升和薪酬决定。然而,对使用工作样本作为标准措施的警告是有充分理由的。即使是与工作点对点对应的工作样本也可能与日常表现不同。工作样本的动机水平很高。然而,日常表现的典型动机水平可能因人而异。这意味着工作样本衡量的是一个人可以做什么(最大性能),但不一定是一个人通常会做什么(典型性能)。换句话说,直接决定工作表现的工作动机不一定要通过工作样本来衡量。因此,在假定工作样本是当前工作表现的准确衡量标准时,应小心谨慎。
可培训的知识和技能
当工作样本度量容易培训的知识或技能时,使用工作样本作为选择工具可能是不可行或不合适的。在初级职位上,申请人需要在工作中学习。此外,一些申请人可能有经验,使他们看起来比那些没有经验的人表现更好。但是,如果少量的训练会改变一个人在工作样本上的分数,那么许多没有经验但未来表现优秀的人在使用工作样本时就会被错误地拒绝。这限制了工作样例的有用性,原因有两个。首先,它降低了工作样本的标准相关效度。第二,受保护阶层的成员获得某些工作经验的机会可能不同(例如,妇女从事建筑工作)。如果是这种情况,工作样本将导致不利的影响,工作样本的意识可能会进一步对那些本应申请的人产生寒蝉效应。虽然工作样本的负面影响通常可以在内容有效性的基础上进行辩护,但如果技能对组织来说很容易以低成本培训,工作样本可能会受到法律挑战。
工作样本的优势
尽管有刚才提到的缺点,但与其他常用的选择工具相比,评估申请人在工作中不容易获得的技能的工作样本可以提供一些优势,包括良好的法律辩护、现实的工作预览和积极的申请人反应。设计良好的工作样本与工作有明确的内容重叠;因此,它们通常仅在内容有效性的基础上进行法律辩护。这种有效性证据往往为法院所接受。另外,大部分的工作样本也都是面对有效的,或者看起来像工作的。虽然表面效度不是一种法律上可以辩护的效度类型,但与其他常见的选择测试相比,它确实会导致申请者更积极的反应和感知到的公平。工作样本还提供了对工作的现实预览,让求职者更好地判断自己对该职位的资格和兴趣。由于公平感和自我评估能力,申请人可能不太可能在雇佣后不久就辞职。工作样本的内容效度和面效度使工作样本在所有常用的选择工具中,通常是法律上最不受挑战和最受法律支持的。
除了积极反应和法律辩护,研究还表明,工作样本可以具有与标准相关的积极效度,与其他选择工具相匹配,甚至超过它们。平均而言,工作样本效度预测工作绩效的元分析估计为0.46,培训绩效的元分析估计为0.42。为什么他们预测得这么好?一种解释是,工作样本是基于这样的原则:过去的业绩是未来业绩的最佳预测器。然而,适当的工作样本设计在工作样本是否符合这一原则方面起着核心作用。关键设计特征包括强调行为和任务的工作分析、内容效度(即带宽和工作保真度)、提高准确性和减少偏见(即宽容、严厉和光晕)的评分员培训、管理和评分的标准化、评分员间信度评估、强调对行为的评级。工作样本中这些特征的存在增加了显著的标准相关效度的可能性,但并不保证。此外,因为有些工作比其他人更容易模仿,工作样本可能更好的预测性能与明确的工作和短期任务,不随时间变化(例如,文书或制造业岗位)比工作更少结构化和长期持续的任务做随时间变化(例如,项目经理和工程师)。
工作样本:过去,现在和未来
对作品样本发表的研究早在20世纪30年代就开始了;然而,过去30年来,对工作样本的研究兴趣已经放缓。相反,研究转向了更具体类型的工作样本,包括情境判断测试和评估中心。但是,尽管学术研究处于停滞状态,所有类型的工作样本的实际使用仍在应用环境中继续。技术创新不断使模拟变得更便宜、更真实。虚拟现实、语音识别软件和计算机评分只是工作样本设计中纳入的一些新技术。然而,对工作样本的研究并没有跟上这些变化的步伐。关于这项新技术能否提高工作样本预测效度的问题仍然没有答案。因为技术限制了我们创建复杂模拟的能力,未来工作样本的效用是未知的。然而,有一件事是确定的——工作样本既是过去的工具,也是未来的工具。
引用:
- 阿舍,J. J.,和夏里诺,J. A.(1974)。实际工作样例测试:回顾。人事心理学,27,519-533。
- Callinan, M., & Robertson, i.t.(2000)。工作样本测试。国际选择与评估杂志,8,248-260。
- 哈德森,c.m., Kim, d.j., & Sackett, P. R.(2005)。工作样本标准相关效度的元分析:再访异常发现。论文发表于工业组织心理学协会第二十届年会,洛杉矶。
- 罗伯逊和坎多拉(1982)。工作样本测试:有效性、不良影响和申请人反应。职业心理学杂志,55,171-183。
- 史密斯(1991)。工作样本作为绩效的衡量标准。A. K. Wigdor & B. F. Green, Jr.(主编),《工作场所绩效评估:第2卷》。技术问题(第27-52页)。华盛顿特区:国家科学院出版社。
- Terpstra, D. E., Mohamed, A. A., & Kethley, R. B.(1999)。对涉及9种选择装置的联邦法院案件的分析。国际选择与评估杂志,7,26-34。