对于教师来说,教育测量与评价在教学活动中是必不可少的。在“传道授业解惑”过程中,要对学生的能力、倾向、成就、态度、兴趣、潜能及发展等进行较全面的了解,这就需要教师作出一系列决策和判断,采用教育测量与评价多种方法,以弥补教师非正式观察之不足。这种情况下教育测量与评价的技术手段不再是唯一的书面考试,而是涉及到测量与非测量的一整套评价技术。测量与评价的内容,不再是应该牢记和不该死记硬背的内容,而是涉及更广泛的教育目标。我们知道学生的发展是生动活泼、多样性的,因此,测量与评价的方法及其结论也应当是丰富多彩、多样化的、个别化的;测量与评价的目的,不再局限于给学生分等级排名次,而是对学生的发展和潜能进行系统的调查,发现学生的优点与长处,指出学生的缺点与不足,尤其重要的是要促进学生确立信心,认识自己的相对优势与弱势,明确自己的努力方向。测量与评价的目的是创造适合学生发展的教育环境,而不仅仅是为了选拔适合精英教育的学生。因此,现代教育测量与评价的思想方法对于教师创造性地教学、因材施教、提高教学质量具有重要的作用。教育测量与评价的知识是教师必备的专业知识修养;评价学生的能力是教师职业能力的重要组成部分。在教育教学过程中,掌握科学的教育测量与评价的有关技术方法,是所有成功教学的基础。
教育测量与评价的主要类型
对教育测量与评价的分类,不同学者不仅角度不同,而且看法不一。但格朗兰德的分类具有代表性和启发性。格朗兰德在《教学测量与评价》一书中指出,根据测量的性质,我们可把测验和其他评价方法粗略地分成最大成就和典型行为两大类;从课堂教学中运用的角度,可把测验和评价方法分成安置性测验(评价)、形成性测验(评价)、诊断性测验(评价)和终结性测验(评价)四类;根据怎样解释测验的结果或评价的结果,可把测验和评价方法分成常模参照和标准参照两类。此外,他认为,还可以用一些成对的术语或两极词语,把测验分成诸如个体测验与集体测验、掌握测验与综合评估测验、速度测验与能力测验、客观性测验与主观性测验等。本书参照格朗兰德对测验与评价的分类,结合当前我国实际,对教育测量与评价的类型,简要地作一梳理。
一、按教学中运用的时机分类
我国在学校课堂教学过程中,教师们经常用到的教育测量与评价,按运用的时机来分主要有三种:形成性、诊断性和总结性测量与评价。
(一)形成性测量与评价
教学过程中经常实施的形成性测量与评价,在性质上大致相当于现在的中小学单元测验。形成性测量与评价的目的,对教师而言是藉此获得教学过程中连续性的反馈,了解学生的学习效果、学习历程、学习特点、学习困难等信息,作为随时修正自己教学的参考。同时,形成性测量与评价对学生的学习,也可提供反馈信息,学生根据反馈的结果获知自己学习后的表现情况,从而肯定或修正自己以后的学习方式。因此,在教学过程中,形成性测量与评价是不可缺少的。教师根据自己预订的教学目标,核对形成性测量与评价的结果,然后才能针对全班或个别学生的学习成绩情况,分别给予辅导。
(二)诊断性测量与评价
诊断性多半是在形成性测评后实施,对经常表现出学习困难的学生所作的测量与评价。它的目的是对个人的问题行为及其原因进行诊断,实施之后如发现学生有学习困难的情形,随时给予个别辅导,在辅导中帮助学生改善方法或习惯,从而克服学习困难,并跟上班级教学的进度。如果辅导之后学生学习困难情形依旧,甚至日益严重,那可能就不是单纯的读书方法或学习习惯的问题。长期表现学习困难的学生,很可能在心理上另有内存原因。在这种情形下就需要对他实施诊断性测量与评价。
(三)总结性测量与评价
学期教学结束后使用总结性测量与评价,其性质上相当于现在中小学所举行的期末考试。其目的有两个:其一是根据教学目标,检查学生一学期来的学业达到了什么程度,从而判断教学效果的得失。其二是根据总结性测量与评价的结果,评定学生的学习情况,并将评定结果通知学生家长。
二、按解释测量结果或评价结果时的参照点分类
人们总是要选择某种参照点,来分析与解释教育测量和评价的结果。这样,教育测量与评价可大致分成常模参照、标准参照和潜力参照三类。
(一)常模参照测量与评价
常模参照测量与评价是将被试水平与测验常模相比较,以评价被试在团体中的相对地位的一种测量与评价类型。它对学生学习成绩的解释,是采用了相对的观点。学生在试卷上得到分数要跟他所在团体的常模比较后,才所显示该生的实力。由于命题标准、试题难易和评分宽严的不同,有时单凭卷面分数本身不能客观地评价学生的成就与能力的高低。例如,某生在一次英语测试中得了75分,只看其分数并不能确定其水平的高低,必须结合全班学生分数的情形才能确定。如全班平均分为65分,标准差为10分,那么该生的成绩就位居前列。如全班平均分为75,该生的成绩刚好中等。如全班平均分为90分,标准差为15分,那该生的成绩就属于较差的成绩了。这种评价方法不仅在一些选拔性考试中得到广泛应用,而且在学校教育评价呈现多元化的改革趋势下也有存在的价值。
(二)标准参照测量与评价
标准参照测量与评价是将被试的表现与既定的教育目标或行为标准相比较,以评价被试在多大程度上达到该标准。由于这种测量与评价常常和教育目标连在一起,故也称目标参照测量与评价。通常情况下学校的教学测量与评价,主要目的是为了考查学生达到教学目标的程度,检验学生对知识技能的掌握程度,因此,一般都采用标准参照测量和评价的方法。
(三)潜力参照测量与评价
潜力参照测量与评价是将被试实际水平与其自身潜在水平(潜力)相比较,以评价被试有无充分发挥自身潜力为目的。例如,同班同学一人考了90分,另一同学考了80分,老师表扬了考80分的同学,没有表扬考90分的同学。老师之所以这样做,就是因为对学生的评价是参照学生潜力而言的。考90分的同学本应考得更好,而考80分的同学已经是很努力了,其当前实际水平已达到或接近该生的“最近发展区”。在强调人性化、动态化和个别化的教育评价潮流下,潜力参照测量与评价理应发挥更大的作用。
三、按测量与评价被试行为表现的性质分类
有心理学家曾把人的行为表现按其性质分成两大类:最大成就和典型行为。受这种分类的启发,我们把教育测量与评价所指向的被试的行为表现,按其性质分成:最佳行为和典型行为两类。
(一)最佳行为测量与评价
最佳行为测量与评价是以测量被试的最佳行为表现为目的的。凡是以成绩或能力的高低作为评价基础的,都属于最佳行为测量与评价。例如,在学校教学后的考试与升学考试,性质上都属于最佳行为测量。因为在这种以能力为基础的评价情境下,被试者都将有强烈的求胜动机,对面对的问题全力以赴,希望自己有着最佳的表现得到最佳的成绩此种测量与评价所以称为“最佳行为”。在一般情形下,学生参加竞争性的考试都会如此。因此,学生们在学科测验上得到的分数,均可视为他们的最佳行为表现。教师对学生成绩高低的评定,自然也是根据他的最佳行为表现。
(二)典型行为测量与评价
同最佳行为测量与评价相比,典型行为测量与评价所关心的不是被试能不能尽其所能地表现出其最佳水平,而是要求被试按通常的习惯方式作出反应(即典型行为)。如对被试的态度、情感、人格、兴趣测量等等,都属于典型行为测量。这些测量过程,希望被试以其平常的典型状况来回答,无所谓能力高低之分。在当今重视学生个性发展和全人教育的理念下,典型行为测量与评价方法,具有特殊意义。
四、按测量与评价的内容分类
想要把教育测量与评价的内容一一分类实非易事,因为它的内容极其丰富。但从基本内容来看,主要有能力倾向测量与评价、成就测量与评价、智力测量与评价、人格测量与评价四类。
(一)能力倾向测量与评价
测量并评价个人的潜在的才能,预测个人的能力发展倾向是进行能力倾向测量与评价的目的。常见的有两种类型:一种是关于一般能力倾向的测量与评价,旨在对个人多方面的潜能进行测量与评价;另一种是关于特殊能力倾向测量与评价,旨在对个人某方面的特殊潜在能力,如音乐能力倾向、机械能力倾向、美术能力倾向等进行探测与评价。
(二)成就测量与评价
测量并评价个人在接受教育或训练后的成就是测量与评价目的。一般情况下可分为两种:一是学科成绩测验,旨在测量与评价被试在某一科目上的学习成绩;二是综合成就测验,旨在测量与评价被试在多个学科或综合学科上的学习成绩。综合成就测验既可以是单个测验,也可以是整体的测验。
(三)智力测量与评价
测量被试的智力并对被试的智力发展水平和特点作出评价是智力测量与评价目的。我们用于智力测量与评价的标准量具,常见的有“斯坦福——比纳智力量表”、“韦克斯勒智力量表”、“瑞文推理测验”等。
(四)个性测量与评价
以测量与评价被试的个性心理特征为目的的个性测量与评价,也称为人格测量与评价。由于人格的概念十分地宽泛,因此,人格测量与评价所涉及的内容层面也很多,人格测量与评价方法也是丰富多彩的。为了更好地把“因材施教”的原则落到实处,教育人员应当掌握测量与评价人格的一些基本原理和方法。
五、教育测量与评价的其他分类
(一)按测量对象分
1.个别测量与评价
个别测量与评价是指同一主试在同一时间内只能测量一个被试,例如“其坦福——比纳量表”、“韦克斯勒智力量表”、“罗夏克墨迹测验”、“主题统觉测验”等一些著名的心理测验,都属于个别测验。采取这种形式的测量与评价有利于主试对被试的行为反应有较多的观察和控制机会,主试能与被试有更多的交流机会,这可以让主试获得更多的信息,也可以建立较融洽的主被试合作关系,有利测量与评价的进行。尤其对于一些特殊的被试,如幼儿、文盲等,只能采用个别测量与评价的办法。但是个别测量也有它的不足之处,比如费时、费力,特别是主试必须经过严格的训练才能胜任。
2.团体测量与评价