评分标准是事先确定的评分规则,例如各题的得分比重,并在评分者中统一要求;此外还有分数的意义。
三、测量与测验的关系
(一)测量与测验的联系
凭借测量,人们对客体和事物做出客观的、数量化的描述;测量多以测验为工具,在校本研究中,测量通常以测验的方式进行。
(二)测量与测验的区别
测量和测验也有区别:测验是施测的一种形式,而测量却是施测的过程;测验是引起某种行为的工具,是一种测量工具或测量量表,测量则是用数量方法对人的行为的描述。
综合各方面的研究看,测量的范围大,含义广;测验的范围小,含义窄。心理测验一般也可称为心理测量,教育测验一般也可称为教育测量,如不作专门性的区分,测验和测量两者的含义应该是可以相通的。
所谓的教育测验法就是通过心理或教育测验来测定、研究心理与教育现象及其规律的研究方法。
教育测验在校本研究中的应用
教育测验既是学校常规工作(教育评价)的重要形式,又是校本研究中的一种必要方法,无论是确定研究前对象的各方面的表现,研究过程中对象的发展变化,还是认定研究结果的有效性,都要诉诸于教育测验。
一、教育测验的一般功能
测验作为检查教学效果的手段、测定学生学业成绩的工具以及进行教育科研的方法,具有如下功能:
(一)反馈信息
教育是一个连续的长期过程,对于教与学双方都需要通过获得反馈,及时了解情况,及时作出补救。学生可以根据反馈情况,进一步自律;教师可以根据反馈情况,作出诊断与调整。
(二)激励自我
通过测验对前段教学效果作出测定,对教师的教育实践与研究,对学生的学习都具有极大的激励作用,可以增加师生的精神动力,使成绩优异者获得成功的喜悦,从而更加奋发上进,向更高目标攀登;使成绩不良者,克服盲目骄傲的情绪,更加清醒地认识自己,从而发奋教与学,争取下一阶段的成功。
(三)指明导向
一次良好的测验,尤其是国家级的测验,客观上起着指挥棒作用,它引导教者与学者进一步明确教学目标、重点与难点,克服教学实践与教育研究中的偏差与弊端,使教育实践与研究沿着正确的航向前进。
(四)评价标准
测验是对师生教和学的情况作出客观测定,是评价教学水平与学生成绩的主要依据;测验支持者总是根据某种特定的目的,依据自己的价值观念,对被试作出价值评定,从而作出处置。所以测验成绩常是分班编班、招生招工的依据,也是评价教育水平高低,教育研究成败的依据。
二、校本研究中常用的测验类型
测验是教育测量的工具,标准化的测验也称为量表。根据分类的标准不同,可把测验分为不同的类型。校本研究中要根据需要和可能进行灵活的选择。
(一)根据测验的功能分类
1.学绩测验
学绩测验又称成就测验,目的在于测量经过学习和训练之后学生所获得的知识和技能情况。根据测验内容,学绩测验可分为综合学绩测验和单科学绩测验。综合学绩测验涉及的内容广泛,通过对各学科基本知识和技能的测量,可以概括地了解学生的学习成就;单科学绩测验用来考查某一学科的学习成就。
2.能力测验
能力测验可以分为一般能力测验和特殊能力测验两类。一般能力测验又称为智力测验,主要测量人的观察、想象、思维、判断、推理等一般能力;特殊能力测验主要用于测量人的某种特殊能力,它又可以分为能力水平测验和能力倾向测验。能力水平测验是测量一个人在某方面已有的能力;能力倾向测验主要用于测量、发现人们潜在的能力,能用来预测人们从事某种活动获得成功的可能性。
3.人格测验
人格测验主要用于测量人的能力以外的包括人的态度、情绪、兴趣、品德、动机、意志、性格、美感等方面的行为以及引起行为的内在的个性心理特性。人格测验的方法有自陈法、评定法、投射法、情景法等多种。
(二)根据测验误差的控制程度分类
1.标准化测验
标准化测验是指全过程都标准化的测验,即由试题、试卷的编拟到施测、评分记分、分数的合成与解释等全过程标准化。标准化测验的试题、试卷由专家精心周密编制,有一定的质量指标要求,施测误差受到严格控制,评分记分、合成、解释等都有详细明确的规定。标准化测验一般以大规模测验结果为基础,求出常模、建立量表,以此作为说明分数的标准。标准化测验的根本目的在于尽量减少误差,使测量结果真实地反映客观实际。
2.教师自编测验
教师自编测验是由教师个人或集体编制试卷,由教师个人或学校组织施测,并由教师本人评分,合成,解释分数。教师自编测验在客观性和标准化程度上没有标准化测验高。但是教师自编测验和标准化测验相比,省时,省力,灵活方便,测验内容与教学内容联系紧密,针对性强,据此教师可及时准确了解教学情况,是标准化测验所不及的。
(三)根据解释分数的标准分类
1.常模参照测验
常模参照测验是以常模作为标准来解释分数意义的测验。所谓常模是指对被测对象具有代表性团体的平均水平。此种测验是将每个人的分数与所要比较的团体中的其他人相比,看其在团体中的相对位置,以决定其成绩的优劣,如各种选拔考试。
2.目标参照测验
目标参照测验是以预先确定的目标作为标准来解释分数意义的测验,也就是将每个人的分数与预定的标准比较,看其是否达标或达到什么程度,如高中会考及各种水平考试就属于这种。
(四)根据题目的难度和时限分类
1.难度测验
难度测验的目的主要是考查被试掌握知识的深度和水平。其试题由易到难排列,其中有些特别难的题。几乎所有的被试都答不了,但被试有机会做所有的题。
2.速度测验
速度测验的目的在于考查被试掌握知识和技能的熟练程度。测验题目都比较容易,都没有超过被试的能力水平。但是题目数量很多,并且时间限制严格,几乎所有被试都不能在限定的时间内做完全部题目。
三、校本研究运用测验法应注意之点
(一)发挥教育测验法的特殊作用
测量和测验作为获取资料的一种手段,在校本研究中起着重要的作用。其作用主要表现在三个方面。
1.诊断作用
可以通过测量,对教师的教学行为、学生的发展状况和学习水平等进行诊断,找出其真正问题和原因之所在,以便采取针对性的教育措施。例如学生学业不良,可通过对其进行智力测量、注意力测量、学习方法测量等,从而找出问题是出在智力方面,注意力方面,还是学习方法等方面,甚或几方面都有。
2.搜集数据作用
在学校教育研究中,要了解学校教育、教学的状况与改革试验的效果,这就要通过测量对研究变量做出量的描述。像学生的学习情况,学生心理素质的情况,学生的心理行为表现等都是教育研究中常常需要测量的变量。
3.评价作用
测量结果提供了关于事物某一特征的度量,使人们能够对事物进行纵向和横向的比较,做出评价,确定其中的关系,对研究的结果和效能做出可信的解释。
(二)清楚教育测量方法的适用性
认清教育测量法在什么条件、什么情况下可以解决什么问题,其实就是考察其适用性。很重要的是要分析它的优点和缺点。
测验法的优点在于:
第一,测验工具的科学性和有效性。由于测验的工具一般均经严格程序的编制并经科学论证,使用这样的测验工具,可保证测验结果的权威性,为学术界及教育领域所承认。
第二,使用的方便性及实用性。因标准化的测验均有一整套规范化的程序,使操作较易掌握,较之其他研究方法更为实用、更为省力,结果也易于解释。测验的结果一般均可数量化,因而使分析、比较更为精确可行。教师自编的测验在保证效度和信度的情况下也更便于使用。
测验法的缺点在于:
第一,测验功能具有单一性。测验工具所测得的往往是人的某一方面的心理特性,要对人作出全面的整体的评价,则需结合多种测验或其他研究方法,至今还未有能较全面测评人的测验工具。且测验所得的往往只能是“结果”,而很少能反映被试在测验过程中的特点,同时测验法也较难对被试进行定性分析。
第二,测验实施误差比较大。虽然测验有规范的程序可供遵照实行,较为方便,但对主试仍有严格的要求,且测验过程中的一些主客观条件也不可能做到完全一致,从而就会影响到测验结果的客观性。对主试的严格培训和对客观条件的严格控制,才可力求避免或降低测验的误差。
(三)多种方法的相互结合
在校本研究中,为了获取相关的信息资料,经常要用到测量。广义而言,诸如测验、调查、观察等方法都可以成为测量的手段。在具体的研究项目中,多种方法之间有着相通之处,关键在于这些方法是否符合研究需要,而不在于它们之间形式上的严格区分。不过,当把教育测量与调查、观察等并列为实证研究方法时,我们显然采用了狭义上的理解。其实,在校本研究的过程里,测验方法同其他方法相互结合、相互参照,才能使获得的信息更真实、更全面、更准确。
(四)提高主测人员素质,遵守测试道德
主测人员的素质不佳,或是由于使用测验不当甚至滥施测验,都会造成不良甚至严重的后果,所以对于测验的使用,切不可掉以轻心。
教育测验的实施步骤
一般来说,测验主要有如下几个步骤:
一、明确测验目的
在编制测验时,主要的工作是确定测验内容和选择测验形式。而确定内容与测验形式的依据却是测验的目的,因此,编制测验的首要工作就是确定测验目的。其中,应先明确测验对象,这时需考虑的因素主要有性别、年龄、民族、受教育水平、社会文化背景等。在此基础上,需要明确测验的用途、测验目标。
测验可被用于描述对象的发展现状、评价和诊断发展中的进展和问题,还可以用于选拔人才、预测对象未来的发展状况。此外,还可以用于建立进一步研究的假设或者检验某一研究假设(如实验假设)。同一用途的测验,也可能针对不同的目标,如有的是用于测量学生的创造能力,有的则是用来测量其认知能力,还有的是用来测量其性格特征。
针对不同的对象、用途和目标,应考虑选择不同的测验类型。例如,若测验目的在于了解初中生在平面几何这一领域中的知识技能,就需要对所涉及的知识技能进行分析;所测验的目的在于预测高中生是否拥有将来从事某一领域工作的能力优势(如空间想象能力),就需要对所预测的行为特征、能力结构等进行分析。在这些分析的基础上,再确定测验的内容。
二、确定测验的内容
教育科研常常需要考察学生或教师某一方面的知识技能。在确定知识技能等方面的测验内容时,一般采用双向细目表,以作为测验计划。其中包括需要测量的知识技能的内容分类(一个方向或维度的区分),各部分内容的掌握程度(另一个方向或维度的区分),还包括每一部分内容在某一种掌握程度上的相对重要程度(以该部分内容占测验总分的比例表示)。
在一般情况下,主要是依据课程标准、教学时间等来确定测验题目的数目、分数比例;由此形成的双向细目表,可以提供编题的依据,也可以在筛选题目、修订测验、经过标准化过程(见后文)之后用来检查测验是否遗漏了内容。在编制标准化的成就测验(学业成绩测验)时,这种双向细目表应有学科专家和有经验的教师参与设计,在仔细分析课程标准、教材内容和学生学习情况的基础上,经过集体研究决定。
三、确定测验形式
此时主要需要在如下几个方面作出选择:
①纸笔测验、口头测验或操作测验。对于陈述性知识,可以采用纸笔测验的形式;但若要考察学生及时辨析和重组信息的能力,可能口头测验更合适。此外,若要测量学生的实验能力,则操作测验更具优势。
②团体测验或个别测验。一般来说,个别测验结果更准确,但其花费更大。这需要根据研究目的、实际条件等来决定;例如,有的研究者在团体测验的同时,选择一些有代表性的对象进行个别测验。
③速度测验或难度测验。若要考察灵活性、敏捷性,如解答数学题、改错、翻译短文,可以采用速度测验;若要考察学生的思维深度、对相关知识技能掌握的程度,则宜采用难度测验。
④选择题或问答题(各自又可细分为更多形式,如多重选择题和是非选择题,简答题和论述题)。这就要根据测量的内容、目标等因素来具体考虑。
四、编制测验题目
这可分为如下几个步骤:
①写出题目初稿。一般应有题目计划数目的2倍~3倍数量;②预测。将题目施测于跟预期测量对象同质的其他对象,然后根据施测结果,考察测验题目的难度、区分度;如有可能,还应考察测验整体的信度、效度;③修订。根据对预测情况的分析,选出难度合适、有足够区分度的题目,删去那些质量不高的题目。
编制测验题目,一定要注意其难度与区分度。
①难度。难度是题目难易程度的指标。在计算客观题的难度时,它就是受测者在回答该题目时正确回答的人数在全体受测者中所占的比例;当题目的分数为多值时(包括主观题或一些分步骤解答的题目),难度就是全体平均分与题目满分的比例。
②区分度。区分度是指测验题目能够鉴别受测者水平的程度,也就是指测验对不同水平的被测者能“拉开距离”,显示出其区别。测试题的区分度同测试的信度、难度相关。
五、标准化过程
这一过程的目的就是要控制与测验目的无关的因素对测验分数的影响。对于一组接受测验的学生或教师来说,分数的差异可能由种种因素引起,包括受测、施测者、指导语、时间、评分过程等差异。一般来说,标准化过程就是使所有的受测者在完全相同的条件下获取测验分数的过程。标准化过程通常涉及如下几个方面:
①内容。内容一致是实现标准化测量的最基本前提,多数测验的内容一致性是不言而喻的。但也有两种情况需要注意,其一,对受测者实行个别抽签式考察,此时,每个受测者的测验内容若不一致,就不能算是标准化测验;其二,在一次测验中采用不同的测验版本,包括A、B卷的形式,此时,对每个版本应进行等值性检验,确保它们具有较高的一致性。
②施测。为使所有受测者处于相同的条件,需要有相同的指导语和时限。
③评分。为保证评分的一致性,应注意准确、完整地记录受测者的反应或回答,同时要根据明确的标准进行评分。例如,词语解释,达到什么情况就可以记为满分、一半的分数或0分,应有明确的规定和示例。