面试测评的有效性研究述评

2009-09-16 10:00潘持春盛宇华

现代管理科学 2009年5期

关键词：面试

潘持春　盛宇华

摘要：面试是一种重要人事测评工具，被广泛应用于各类人员招聘及选拔中，因此测评的有效性有着重要的理论与实践意义。文章从面试的信度与效度及提高面试测评有效性的方法与途径的角度，阐述了已往研究的发现。

关键词：面试：面试的信度；面试的效度

作为一种重要的人员选拔方法，面试测评已被广泛使用于各类企事业单位人员招聘及国家公务员选拔中。由于面试评价具有主观性的特点，其有效性一直受到重点关注。早期的观点认为面试的有效性较低(Sohmitt，1976；Ulrich & Tmmbo，1965)，但随后的一系列面试综述和元分析表明，面试具有中等程度的效度，且面试方式的改变可以提高面试的信度和效度(Arvey & Campion，1982；MoDa-nlel et al，1994；Campion，Pursell，&Brown;，1988)。考虑到选拔手段与工具的有效性常常以信度与效度进行评价，本文拟从面试测评的信度与效度及提高面试测评有效性的方法与途径方面，阐述以往的研究发现。

一、面试测评的信度研究

面试信度指不同评委面试同一个被试得出结论的一致性程度。面试信度低，意味着评委评价的一致性低，这样的面试就没有可靠性，所以。面试信度是有效面试的必要条件(刘远我，2007)。面试信度主要包括两个方面，一是面试要素内部信度，指面试测评要素之间的一致性。二是评委间信度。既评委之间评价的一致性。

早期有关面试综述一致认为面试的信度较低(May，field，1964)。然而，近年来研究表明，面试是具有一定信度的，只是不同面试研究的测量信度差异很大，信度从O.15-0.80不等(刘远我，2007)。尤其是Conway等(1995)对111个评委间信度系数和49个面试要素内部信度系数进行元分析，发现评委间信度为0.70。结构化面试要素内部信度为0.59，无结构面试要素内部信度为0.37。他们的研究还表明，研究设计(单独面试和小组面试)、评委培训和面试结构化程度(问题的标准化、评分的标准化等)是影响评委间信度的缓冲变量，而面试要索内部一致性系数受到问题标准化和评定项目数等缓冲变量影响。研究一致地发现面试结构化水平是面试信度的缓冲变量，一般随着结构化程度提高，信度也提高，尤其是评委间信度。总的来说，如果不考虑面试形式的差异，面试只有中等信度水平；如果考虑结构化的影响，结构化面试比无结构面试具有更高的信度。

二、面试测评的效度研究

面试的效度是指面试测量的准确性，即面试所测评到的结果与所要考察的内容相符合的程度。与传统普遍认为面试缺乏效度的观点不同，众多的研究证据表明面试至少有中等水平的效度，Anderson和shackleton(1993)、Clark(1992)以预测结果与实际工作绩效的相关系数作为效度指标，比较了各种测评技术的效度(刘远我，2007)。数据表明，与其它测评工具相比，面试特别是结构化面试具有一定的效度。

Wiesner和Cronshaw(1988)分析了150个效度系数。发现平均的效度系数为0.26：对信度和区间限制进行矫正后，效度系数达到0.47。面试的结构化程度、职务分析类型及小组面试与单独面试是影响面试效度的缓冲变量，非结构化和结构化面试的矫正效度系数分别为0.31和0.62：运用正式职务分析的面试比运用非正式职务分析的面试有更高的效度；在无结构面试的情况下，小组面试比单独面试有更高的效度。McDaniel等(1994)分析了245个面试效度系数，发现面试效度与面试内容(情景的、工作相关的或心理的)、面试方法(结构化与非结构化、小组与单独面试)、以及效标性质(工作绩效、培训绩效、工作年限、研究目的与行政管理目的)有关。研究表明。情景面试比工作相关面试具有更高的效度，分别为0.50和0.39；结构化面试比非结构面试有更高的效度，分别为0.44与0.33；面试对工作绩效和培训绩效有类似的效度，各为0.37和0.36。可见，面式具有较好的效度，即使无结构面试，效度也达到0.33。Schmidt和Hunter(1998)综合分析了1985年以来人事选拔中经常运用的19种测评工具。如一般能力测验、工作样本、诚信测验、责任意识测验、面试和工作知识考试等。结果发现结构化面试效度系数与认知能力测验和工作样本的效度基本相同，都在0.50的水平。非结构面试的效度系数为0.38。

在20世纪70年代以前，人们认为效度强调的是预测指标的效用属性(Guion，1980)，它是选拔工具的特征。是既定不变的，这样面试测评的效度差异应归因于随机误差。事实上，效度是根据测量到的信息而作出的测评有效性的推理，推理所依照的外部标准被称为效标(谢小云。2005)。这样，面试测评效度不稳定不仅是测量误差的原因，还涉及到效标的选择问题。由于效标的选择较为困难。以往的很多面试效度研究选用不同的效标，这往往会导致同一测验在不同应用情景下的效度差异，如以上级评定的工作绩效为效标与以培训绩效为效标会有很大的差异(McDaniel et a1.，1994)。因此，面试测评中除了面试得分信息影响其效度以外，选拔中所使用的效标特征，也对其有效性有较大的影响。20世纪70年代-20世纪80年代各种效标下5个面试效度方面的元分析研究结果(Mc，Daniel et a1.，1994)。

三、提高面试有效性的方法与途径

作为一种广泛使用的测评工具，面试测评的有效性得到了众多研究的肯定。包括职务分析类型、面试的结构化程度、面试评委的结构与组成及面试评委的培训及效标的类型等在内的众多因素，都会对面试测评有效性产生影响(洪自强，2002)。

目前，对面试测评有效性的研究已不再仅仅关注信度和效度的大小，而是越来越关注提高信度和效度的方法与途径。通常，通过对工作进行全面地分析，对面试评委进行充分培训，以及采用结构化面试的方法，可有效地提高面试的有效性。Campion等(1988)认为，通过以下措施：(1)面试问题在工作分析基础上形成；(2)对每个被试问同样的问题；(3)使用例子和说明；(4)有一个小组记录和评定被试的回答；(5)对所有的被试实施这一过程：(6)强调与工作的关联性、公平性和记录，可以提高面试的评委间信度和预测效度。

国内学者盛宇华、方志军及王平(2003)的研究认为。面试要素特征、面试的模式及评委的测评能力三者之间的有效匹配，可以提高面试测评的有效性。非结构化面试适宜测评高层次岗位的要素特征且用纯经验型的主试：结构化面试适宜测评低层次岗位的要素特征且用纯技术型的主试。