(4)注重教育评价的教育性和发展性功能。在以往的应试教育中,教育评价注重的往往是区分和选拔性功能,往往只注重教育的结果而关注教育的过程,是一种单纯的结果评价和终结性评价,一般适用于对教师的奖惩和选拔学生。素质教育则更加重视教育评价的教育性和发展性功能,力图通过过程评价和形成性评价,及时向教师和学生提供反馈信息,使他们能够全面了解教育活动中存在的缺陷和不足,从而促使教师和学生能够不断地改善自己的教育活动和学习活动,使教育活动更好地为学生的发展服务。
西方教育评价观的演进及启示
教育评价是一门古老而又年轻的学科,其渊源可追溯至中国隋朝开始的科举考试制度。但是,作为一门独立的分支学科,并逐步向科学化方向发展,却主要是在19世纪末和20世纪的美国。在这段历史中,教育评价理论体系从简单到完善,评价模式从单一到多样,发生了一系列嬗变。笔者认为这些嬗变至少应包括:一、教育评价观的演进;二、教育评价基本范畴侧重点的异动;三、教育评价理论基础的变化。开展以上方面的研究是十分有价值的。因为变化本身预示着这门学科的发展趋势,也显示出教育评价作为教育科学的一个分支学科与其他基础学科之间的呈现出千丝万缕的联系。因而研究西方教育评价理论的嬗变,有助于我们从哲学的高度上把握学科发展的脉搏,以历史、现实与未来相结合的眼光来全面地加以考察,探究教育评价的本质和发展规律,对解决现实存在的问题有所借鉴和启示。
一、教育评价观的变异
(1)泰勒的评价观。19世纪下半叶和20世纪最初三十年,教育工作者对学力测验的研究和教育成就客观化、定量化、标准化方面取得了非常大成绩。但是因为当时的课程和测验都是围绕着教科书进行的,以教科书为中心加以编制,测验内容只是要求学生记诵教材的知识内容,因而显得十分片面。在这种情况下,美国俄亥俄州立大学教育科学研究所教授泰勒主持了课程与评价的研究,提出了一套以教育目标为核心的编制原则,试图以此把社会的要求、学生的需要反映在课程与测验中。为了把这一思想与早期的测量运动区别开来,泰勒和他的同事正式提出了教育评价的概念。泰勒把评价理解为“确定教育目标在实际上被理解到何种程度的过程”,也即“评价过程在本质上,乃是一种测量课程和教学方案在多大程度上达到了教育目标的过程”。以目标为中心,通过具体的行为变化进行判断教育目标实现的程度是泰勒教育评价的主旨。
(2)克龙巴赫的评价观。泰勒模式在历史上占了很长一段时期的统治地位之后,开始遭致众多的批评和反对。因为仅以目标为评价的出发点和最终归宿,出现了有悖于教育评价的初衷的现象。为使人们注意到评价的重要作用,克龙巴赫(Cronbach)把评价广义地定义为:“为作出关于教育方案的决策,收集和使用信息。”他认为评价并不是只调查某一教程有效还是无效,而是要确定教程需要改进的方面。根据克龙巴赫的观点,评价的重点应该放在教育过程之中,对教育决策给予必要的改进,而不是只关心教育过程结束之后,目标到达的程度。克龙巴赫的观点,在教育评价界产生了广泛的影响。
(3)斯塔弗尔比姆的评价观。斯塔弗尔比姆(Stufflebeam)同样对泰勒评价模式提出一些异议,他和克龙巴赫的观点有着很大的一致性。他认为“教育者需要一个较广义的评价定义,而不只是局限于确定目标是否达到”,评价应“有助于更好地执行和改进我们的方案”。作为替代泰勒评价的定义,斯塔弗尔比姆将评价定义为:“为决策提供有用信息的过程”。他强调:“评价最重要的意图不是为了证明(prove),而是为了改进(improve)。”这一看法不久就受到了教育界的广泛支持。1985年,他进一步提出:“评价是一种划定,获取和提供叙述性和判断性信息的过程。这些信息涉及研究对象的设计、目标、实施和影响的价值及优缺点,以便指导如何决策,满足教学效能核定的需要,并增加对研究对象的了解。”与这些观点相对应,斯塔弗尔比姆提出了CIPP模式,它把评价只看作是一种教学工具,对教育活动的背景、信息的输入、活动过程及结果给予全面的评价,使方案更有效地为使用者服务。
(4)比贝的评价观。1975年,比贝(Beeby.C.E.)把评价定义为:“系统地收集信息和解释证据的过程,在此基础上价值判断,其主要的目的在于行动。”他认为,评价在收集系统而非零散的资料,并将这些资料加以精心地整理和解释,引入评判性的思考。在这里,比贝首次提示了教育评价的本质,即价值判断。他强调评价要对教育活动的价值做出判断,包括对教育目标本身作出判断,使评价活动有助于决策的科学化,对实际工作具有指导意义。比贝关于“价值判断”的提出,深化了教育评价的内涵,使评价的另一主要特征“价值判断”越受到人们的关注。
(5)斯塔克的评价观。斯塔克(Stake,R.E)在肯定了评价是一种价值判断的基础上,提出了应答评价模式。他提出:“如果教育评价更直接地指向方案的活动而非方案的内容,如果它能满足评价听取人对信息的需求,或者在反映方案得失长短的评价报告中更能反映人们不同的价值观念,那么,这种评价即可称为‘应答评价’”。他认为,要使评价结果能真正产生效用,评价人必须关心这一活动所有参与者的需要,通过信息反馈,使活动结果能满足各种人的需要。斯塔克强调“多元现实性”,他认为以前的预定式评价对正在进行的方案缺乏敏感,难以察觉学生在与教师和其他同学接触中获得的收益,或反映对方案抱有的不同观点。他赞成斯克里文的观点:与其评价相当难以捉摸的收益,还不如评价经验的内在价值。
(6)第四代教育评价观。80年代,以古巴(EgongGuba)和林肯(Y.S.Lincoln)等人为代表创立了“第四代教育评价理论”。他们认为评价就是对被评事物赋予价值,评价本质上是一种心理建构。他们进一步强调“价值多元性”,提倡在评价中充分听取不同方面的意见,并把评价看作是一个由评价者不断协调各种价值标准间的分歧、缩短不同意之间的距离、最后形成公认的一致看法的过程。
二、教育评价观的比较
经过教育研究者半个多世纪的发展和研究,西方教育评价流派林立,对教育评价本质的认识至今还歧义互见,没有形成系统的定论。各种理论指导下的评价模式种类繁多,各有千秋。这里,我们试图把几种颇具代表性的观点加以比较,以认识其分歧所在,以便深刻地理解教育评价的本质和发展趋势。
1.行为目标模式与CIPP模式行为目标模式,亦即泰勒模式,即是在泰勒评价思想的指导下,以目标作为评价过程的核心和关键,通过对学生行为的考察来找出实际活动与教育目标的偏离,从而通过信息反馈,促进教育活动能够尽可能地逼近教育目标。这一模式结构紧凑,逻辑脉络简洁清晰,容易实施,在教育评价理论中占有非常重要的地位。
CIPP模式是由背景(Context)评价、输入(Input)评价、过程(Process)评价和成果(Procluct)评价这四种评价组成的一种综合评价模式。它以决策为中心,为决策的不同方面提供信息。背景评价形成计划决策,输入评价为组织决策服务,过程评价指导实施决策,成果评价为再循环评价效力。CIPP模式的主要特点是把背景、输入、过程和结果综合加以评判,突出了评价的“改进功能”。