书城社会科学教育统计与测量研究(教师继续教育丛书)
8814400000007

第7章 编制测验的一般原理与方法(1)

本章主要介绍客观性试题的类型及其编写技巧、主观性试题的类型及其编写要领、测验蓝图设计与命题双向细目表、测验编制与组织要领等。

学习本章内容时要注意结合实际,注重理解和应用,自己要善于归纳与分类,提纲挈领地掌握有关原则或注意事项。学完本章后,你应当能够了解各类测验题目的功能;掌握各类测验题目的编制要求;掌握编制测验的基本要领;掌握测验蓝图设计的基本要领。

本章的重点内容是客观题、主观题的优缺点,编写选择题的技术要领,论述题的编写原则,操作测验题的编写原则、编制测验的命题双向细目表。

测验题目类型与测量功能

测验题目是测验的基本构成元素,题目编制恰当与否直接关系到整个测验的质量。只有正确地掌握不同类型试题的测试功能及命题方法,才能根据考试的目的和要求,正确地选择合适的题型并编制出高质量的试题,组成高质量的测验试卷。

测验题目基本上分为两大类:选择型和供答型。前者一般要求被试在几个选项中选择正确的答案,如是非题、匹配题、选择题等,后者要求被试自己提供答案,如论述题、简答题、填空题等。若根据被试作答的范围和评分方法不同,又可分为主观性试题和客观性试题。

客观性试题主要是因为评分客观而得名,它的正确答案在测验前就已准备好,不同评分者各自独立评分,所得结果基本上是相同的。客观性试题一般适用于测量知识的掌握、理解、应用、分析几个层次的教学目标。客观性试题的答案明确,作答简便,因而在限定的时间内测验可以包含足够数量的试题,能保证对知识内容的覆盖。

主观性试题主要包括论述题、操作题和作文题等。它们适合于测量较高层次的教学目标,尤其是适合于测量综合和评价等目标层次。主观性试题鼓励被试积极地组织所学的资料,表达自己的观点。被试在作答时,耗费的时间较长,在限定的时间内,试题数量不可能太多,对知识的覆盖面较小。由于没有明确统一的标准答案,评分易受评阅者的主观因素影响,因而误差较大。本节仅就主观性试题与客观性试题的类型、功能及编制要求作具体介绍。

一、客观性试题类型及其编写技巧

客观性试题主要包括选择题、填空题、简答题等。

(一)选择题

1.选择题结构

客观性试题中运用最多的是选择题。选择题是由一个“题干”和几个“选项”所组成。“题干”一般是提出问题,或是待完成的句子,“选项”是供被试选择的几个真假不明的答案,让被试从中选出正确的答案。应选的答案可以是一个,也可以是多个,可以是正确答案,也可以是最优答案。

例23:1使用选择题试卷进行测量,最大的困难是什么?

A.试卷的编制

B.试卷的印刷

C.试卷的评阅

D.考场的安排

例题24:函数y=ax2+bx+c是偶函数的条件是:

A.c=0,B.b=0,C.a≠0,D.b.c≠0

2.选择题优点

选择题是所有客观性试题中最灵活的一种,其优点体现为:

(1)可以用来测量学生各种不同层次的学习结果,不仅可以测量学生掌握所学习的知识的程度,而且可以用来测量学生对所学知识的理解、分析、判断、应用和综合的能力。所以这种类型试题的应用最广泛。

(2)评分标准统一、客观,不受评分人主观因素和答卷人提出意想之外的答案等影响,并且可以利用电脑迅速评卷,从而大大提高测验的信度,提高评卷的速度和自动化水平。

(3)可以加大试题容量,抽取广泛有效的代表性样本,使试题覆盖的知识范围广,可以克服传统考试中主观题由于试题量少、抽样窄而造成的测量效度不高的缺点。

(4)有利于考查被试思维的敏捷性和准确的判断力。

(5)采用大量的似真选择项使得结果易于诊断,通过对学生错误选项的选择反应这个线索,教师便于发现、分析学生在学习中存在的问题,以便及时纠正。

3.选择题的缺点

事物是一分为二的,选择题也有一些缺点,主要是:

(1)由于选择题的数量多,每一个试题中除正确答案外,还要有足够多的干扰答案,而且要求这些干扰答案与题干应有相当的逻辑联系和似真性,因此编制良好的选择题较花费时间,且要有专门的命题技巧。

(2)难以考核被试完全的推理能力、综合运用所学知识的能力、有效的总结能力、严密的表述能力和写作能力,对于被试的发散思维(或求异思维)能力则更是如此。

(3)无法测量被试的思维(解题)过程。

(4)被试者有可能凭猜测而选中正确答案。例如,在有4个备选答案的选择题中,仅凭猜测的成功率就达到25%,这对于考试的信度有一定的影响。

选择题的优点使其日益受到重视,但它的缺点,又使我们无法在教育过程中以单纯的选择题来考查学生。

4.选择题类型

根据不同的特点,对选择题可以作进一步的分类,常用的选择题主要有以下几种类型。

(1)辨识选择。常用于辩识字词的形音义、文化常识、公式定理、名词术语等。

(2)阅读选择。前面给出一篇短文,后面提供备选答案,要求被试阅读后,给出正确的选项。

(3)最佳选择。要求被试从几个备选答案中,通过比较和分析,选择出一个最佳的答案。

(4)图解选择。将文字材料画成几幅示意图,要求被试选出符合文字材料所显示的情景或关系的示意图。

(5)归类选择。列出一组事物,并将事物分成若干类,要求被试按一定标准选出归类正确的选项。

(6)承接选择。给定一个或几个待续的句子,然后列出几个承接句子,要求被试选出其中衔接恰当的承接句子。

(7)排序选择。将几个事物,列出几种排列顺序,要求被试选出排列顺序正确的一种。

(8)填空选择。在一句话中空缺一些字、词、句或标点,要求被试在备选的几个答案中选出恰当的填补项。

5.选择题编写原则

为使选择题的普遍适用性和优良性能得到实现,在编制选择题时,应遵循以下原则:

(1)试题的题干本身意义完整并能表达一个确定的问题。

(2)题干要尽可能简明,尽量不要使用过于复杂的字词与语句结构,也不要使用过长的语句。

(3)题干中尽量不要滥用否定结构,要尽可能采用正面陈述。过多采用否定结构,往往给被试带来阅读上的困难;同时否定结构也不利于使教师了解被试到底掌握多少正确知识。另外肯定结构比否定结构从某种程度上来说更富有教育意义。

(4)所有选项都应与题干有一定的逻辑联系,选项中的干扰答案(诱答项)应具有很高的似真性或似乎合理性,不能错得太明显。

(5)不能对正确答案有任何暗示。一般来说,无意提供暗示主要表现为如下几个方面:语法结构上的不一致,如正确答案语法正确,诱答项语法结构错误等;各选项在逻辑上不同,如正确答案中加以“如”、“有时”、“通常”等修饰词,诱答项中加以“总是”、“从未”、“所有”、“绝对”、“准”等修饰词,或正确答案使用与题干相同的词;答案的长度有明显差异,如正确答案叙述得特别详细,比诱答项要长得多;各题正确答案在选项中有一定的规律等。

(6)同一测验中每一个测验试题之间应相互独立避免牵连。有时,某一个试题的题干中所提供的资料,刚好可以帮助学生回答别的问题,此种情形只要在组合测验前仔细检查每道试题就可以避免。但有时被试需要知道前一题的正确答案,才能回答下一个问题,即若某被试无法回答第一题,则无法回答第二题,此种连锁题应尽量避免,每道题均应成为一个独立的记分单位。

(7)选项的文字表述,力求简短精炼,尽可能将各项中共同的用词(字)放在题干中,在每个选项中要避免重复的材料,这样不仅可以使题意清楚,而且可以减少学生阅读选项所需的时间。

(8)应尽量避免“以上皆是”、“以上皆非”的选项。当测验编制人员很难找出足够的选项时,常用“以上皆是”、“以上皆非”来作为最后一个选项。这种特殊选项的应用绝大部分场合均不恰当,不仅无法达到预期的功能,反而会降低题目的有效性。这是因为:第一,学生只要知道在选项中有两个是正确的,则他就会选择“以上皆是”;第二,学生只要发现有一个选项是错误的,则马上就可以排除“以上皆是”项,从而提高猜测成功的机会。第三,不少学生只要看出第一个答案是正确的,他马上就选中作答,而不再阅读其余选项而丢分,从而降低测验的信度。另外在“最佳答案型”的选择测验中,所有答案只是适合程度的不同,而绝无一个“绝对正确”的答案,所以在使用“以上皆非”项时,可能引起很大争论。

(二)是非题

1.是非题特点

是非题又叫做二项选择题,它通常是给被试一个句子要被试作出正误的判断。这类试题通常用于测量被试对基本概念、性质、原理、原则的认识和判断区别事实与观点、认识事物因果关系,以及一些简单的逻辑关系推理的能力。

例25:判断下列命题的正误,正确的在括号内画“√”,错误的画“×”。

①三角形的内角之和等于360度。()

②是非题是一种“供答型”试题。()

有时候,我们可以要求被试先判断每一个陈述的真伪,然后再要求被试将错误之处加以改正。此时,应需要在改正部分的底下画线或加以引导,以突出重点。

通常有人认为是非题最容易编制,其实并非如此。因为此类试题要求被试作绝对正误的判断,所以每一个叙述必须绝对正确或完全错误。在绝大多数知识领域中,为确保绝对正确或完全错误,就需要对较重要的叙述予以特别修饰,而这种修饰却是一种很明显的猜答线索。因此,编制者通常被迫以较不重要且更具体的事实来编题,以确保试题的科学性,但这样的试题对于测量目标来说是不太适合的。

是非题的优点体现在以下两点:第一,编制容易,可适用于各种教材。事实上,说编制容易,可能是因为可以照教材的原句子抄下来或稍作正反改正,但这种试题品质不良,不是答案明显、就是无法判断。而编制出题意清楚,且能测量到重要学习结果的是非题,则需要高度的命题经验与技巧。第二,记分客观,取样广泛。因为是非题的作答时间短,可以在短时间之内作答很多问题,所以试题有较大的覆盖面,且评分不受主观因素的影响。

是非题的局限性主要表现为:其一,仅能测量知识层次中最基本的结果,而无法测量高层次的学习结果。其二,受猜测因素的影响很大。由于只有两种可能的选择,因此学生仅凭猜测都有50%的机会获取正确答案。由于设计是非题很难排除无关线索,实际上被试猜对的可能性远高于50%。即使采用校正公式,即倒扣分的方法,也难以排除猜测因素的影响。

由于是非题的上述缺陷,通常只是用它来测量其他类型测验无法测量的学习结果。

2.设计是非题几个原则

设计是非题要遵循如下几个原则:

(1)考核的内容应是重要的知识,应有考核价值。不要为了设计试题方便而考核一些无关紧要、细微末节的内容。

(2)题目应多是测量理解能力,而不应测验记忆性的知识,更不要直接抄录教科书中的句子,以免引导被试死记硬背而不求理解。

(3)一个题目中只能有一个中心问题,或一个重要概念,避免两个以上的概念在同一题中出现。否则将会导致“半对半错”或“似是而非”的情形。

(4)试题应做到是非界限分明,用词准确,避免模棱两可的语句,不致引起对正确答案的争议。

(5)题目陈述应简单明了,避免使用复杂的句子结构,以减少因被试的阅读能力而对测量产生的不良影响,应尽量采用正面叙述,避免用否定和双重否定的语句。

(6)正句和误句的排列要随机化,且数量应大致相等。

(三)填空题

填空题就是提出一个陈述,其中缺少一个或几个关键词语,要求被试将其补充上去。

例26:我国古代的四大发明是、造纸、指南针和。

我国长江发源于山,流入海。

填空题可用来考查被试对知识的记忆和理解能力,在诊断性测验中特别适用。受被试猜测的影响小,评分比较客观。但填空题偏重于测量知识记忆程度,使用过多,容易养成死记硬背的习惯。

为了使填空题能更好地发挥它的作用,在编制的时候,一般应注意以下几点。

(1)题意要明确、限定要严密,使空白处应填的答案是惟一的。填空题属于封闭型的一种,题干的逻辑性要求很高,从而使被试按照形式逻辑的思维去推理、判断。此外,题干的表述还应使众多被试按照同一个思维路径进行趋向思维,否则被试不知道填什么或填什么都成立,就会引起争议,达不到测量目的,不利于记分。

例27:(不妥试题)只有,才能在考试中获得好成绩。

本题的限定不严密,所填的答案不惟一,被试也不知道到底是考核哪些方面的知识。

(2)空白中所填写的应是关键的词语,并且要和上下文有密切的关系,使被试不至于填写困难。

例题28(不妥试题)1996年我国科技界有新发明。

(3)题目中空白地方不能太多,以免句子变得支离破碎,不利于被试理解题意。

例29:(不妥试题)连接市与的是河。

这样的试题易导致题意不完整,无法填写,即使勉强填上,也难于判断对与错,无法评分。通常一个填空题不应超过两个空白。

(4)尽量将空白放在句子的后面或中间,而不要放在句子开头。因为按照人们的思维过程,应该是先提供充分的证据,然后再要求被试做什么或怎么做。

例30:(不妥试题)发明了蒸汽机。

本题应改为“发明蒸汽机的是。”

(5)所有空白处的线段长度应当一致,不能随正确答案文字的多少而长短不一,以免产生暗示作用。

(6)若答案是数字,应指明单位和数字的精确程度。

(四)简答题

简答题是要求被试对所提问的问题用几个字或几句话来回答的一种问题类型。

例31:①“七·七”事变爆发在哪一年?

②“七·七”事变爆发在什么地方?

简答题虽然是需要被试自己主动提供答案,但仍然可以是客观性测验题,它是供答题中最简单的一种,被试只需填上几个简短的词或句即可解答。

简答题较适合于测量被试对基本知识、概念和原理的掌握、记忆情况。和填空题一样,简答题编制较为简单、灵活,在出题时,可以从不同角度、不同方向考虑,增大对知识考核的准确度和深度,并且不受猜测因素的影响。但由于其特有的特征,无法用来考核综合、分析、评价等高层次的教学目标;且评分也不够客观,除非问题的叙述非常清楚,否则将会有不同程度的正确或部分正确的答案而影响评分的客观性。即使没有这些问题,错别字是否扣分问题仍无法避免,若扣分,则被试的实际得分无法代表其获得知识的多少,若不扣分,则又无法确定错别字是否代表正确答案,即是错别字还是被试尚未具备的足够测量所欲测的知识。鉴于此,一般测验中,简答题所占比例不大。