书城社会科学[当代]学习理论流派发展与教育论著选读
24011800000009

第9章 斯金纳操作性条作用学习理论(1)

B·F·斯金纳(BurrhusFredericSkinner,1904-1990)1904年月20日出生在美国宾夕法尼亚州的萨斯奎汉纳镇上。像许多心理学先驱者一样,斯金纳在1922年进汉密尔顿学院读书时,并未打算成为一名心理学家,而是专修英文,打算成为一名作家。在毕业后的两年内,从事于写作,结果感到没有什么可写的,于是攻读生物学。

在这个过程中,他读了华生和巴甫洛夫的着作,从而开始对人类和动物的行为感兴趣,就进了哈佛大学攻读心理学。1930年获心理学硕士学位.1931年获哲学博士学位。接着留校从事研究工作。

年至1944年在明尼苏达大学任讲师和副教授,1945年任印第安纳大学心理系教授和系主任,1948年返回哈佛大学任心理学教授,直到1974年退休。在这期间,他于1958年获美国心理学会授予的杰出科学奖;1968年获美国政府颁发的最高科学奖--国家科学奖;1971年获美国心理学会基金会颁发的金质奖章。

斯金纳的实验和学说最早是在1938年出版的《有机体的行为:

一种实验分析(TheBehaviorofOrganisms:AnExperi一》一书中发表的,该书主要是通过对白鼠和鸽子的观察,经验性地描述学习的法则,从而为操作性条件作用原理奠定了基础。他的另一本代表着作《科学与人类行为(ScienceandHumanBehavior)》

(1953)着重探讨了人类行为的一些重要方面,如思维、自我和社会化等。1968年出版的《教学技术学(TheTec一hnologyofTeaching)》

则探讨了他的基本原理在人类学习中的运用。另外,他在1948年出版的小说《沃登第二(WaldenTwo)》和1971年出版的《超越自由与尊严(BeyondFreedomandDigni一ty)》在社会上反响很大。前者是根据人类行为的科学原理,试图形成一种以积极控制的方法加以管理的理想社会;后者则是对他自己观点的总结,并驳斥了他人的种种批评。除此之外,他的主要代表着作还有:《言语行为》(1957)、《强化的相倚关系:一种理论分析(ContingenciesofReinforcement:

ATheoreticalAnalysis)》(1969)和《关于行为主义Behav一iorism)》(1974)。

斯金纳从他专业生涯一开始,就用他自己的程序来研究行为,用他自己设计的仪器来观察行为,用他自己的方法来分析行为,并用他自己的观点来解释行为。

斯金纳把行为作为基本的研究对象。研究行为,并不是因为它有助于解决心理学的问题,而是由于行为本身就是人类生活的一个基本方面。行为是由于其本身的原因而值得研究。所以,斯金纳对通常所说的“理论”不感兴趣。在他担任中西部心理学会主席的献辞--《学习理论是必要的吗?(Aretheoriesoflearningnec一essary? )》一文中,他对学习理论持否定态度。有人因此称他是一个“伟大的反理论者(GrandAnti一Theorist)”(Skinner,1969)。而事实上,斯金纳对“理论”一词有不同的理解。他反对当时流行的赫尔的“假设-演绎”的理论体系,认为理论必须以事实和材料为依据。当然,他也意识到,事实如果不与其它信息结合在一起,只能具有有限的价值,实验研究的最终目的是要构建理论。这样,我们就遇到了一种与众不同的学习理论。

(一)行为的实验分析

斯金纳主义者、操作条件作用论者、激进的行为主义者,都被看作是同义词,重点都放在对行为的实验分析上。

斯金纳认为,“学习”即反应概率的变化;“理论”是对所观察到的事实的解释;“学习理论”所要做的,是指出引起反应概率变化的条件。所以,研究行为的目的,是要形成一种分析各种环境刺激的功能的方法,以决定和预测有机体的行为。为此,斯金纳设计了一种特殊的仪器,即一个阴暗的隔音箱,箱子里有一个开关(如用白鼠为被试,即是一小根杠杆或一块木板;如以鸽子为被试,就是一个键盘)。

开关连接着箱外的一个记录系统,用线条方式准确地记录动物按或啄开关的次数与时间(见图1)。斯金纳早期都用白鼠作试验,后来大多以鸽子为被试。在实验时,并不是动物每一次按杠杆或啄键盘都给食物,食物的释放方式由实验者决定。除此之外,实验者还可以控制灯光、声音、电击、温度与湿度等。

斯金纳箱的一个特点是,动物可以反复作出斯金纳称为“自由操作的反应(free一operantresponding)”。所谓“自由”,即动物的行为不像在迷津里那样受到限制;所谓“操作”,是因为动物的反应是主动作用于(或操作)环境。

在斯金纳看来,行为的实验分析关注的是环境事件(刺激)与有机体行动(反应)之间的关系,即要考察实验操作是如何引起行为变化的。斯金纳认为,可以用三种基本的实验操作来控制环境:呈现刺激、安排结果、信号刺激。

呈现刺激是一种最简单的实验操作。当我们呈现刺激时,就可以观察到它们促使有机体产生的反应。斯金纳认为,呈现刺激的主要效果是要引起特定的反应。例如,给白鼠食物可以引起唾液分泌,如果接着给予电击,就可以使它停止唾液分泌,代之以跳跃反应。

然而,有机体环境中的事件并不始终是自发产生的,有时是有机体促使它们发生的。斯金纳认为,可以安排各种环境,使有机体的反应具有效果或结果。因为,人类与动物的行为,可能取决于前提性事件(antecedentevents),也可能取决于结果性事件(conse一。所以,我们可以安排各种各样的反应结果。反应结果不仅可以是获得刺激(如给予食物),也可以是消除刺激(如停止电击)。

有机体的反应一旦具有某种结果,有些反应就会增加,有些反应则会减少,这取决于每一种反应的具体结果。如果有机体由于某种反应的结果,作出这种反应越来越多,那就是说这种反应被强化过了;如果有机体由于某种反应的结果,作出这种反应越来越少,那就是说这种反应被惩罚过了。

但是,如果我们在呈现刺激或安排结果时再给予其它的刺激,那事情就会复杂得多。有机体不是不加区别地对刺激作出反应的。有机体会知道:某些环境刺激是一种信号,它预示着将会发生什么情况,或者说,如果在这时作出反应会带来什么结果。在这类实验中,一种刺激被用来作为预示另一种刺激即将来临的信号,或预示反应是否会得到特定结果的信号。例如,我们可以在铃声响时给予食物,或在灯亮时给予电击,这类实验安排类似于巴甫洛夫的实验。但是,我们也可以为反应结果安排这类信号刺激。例如,白鼠只有在灯亮时站起来才给食物,这样,白鼠就会只在灯亮时站起来,灯不亮时不站起来。又如,我们只在铃响时对白鼠舔尾巴的动作给予电击,这样,白鼠就会在铃响时不舔尾巴,而在没有铃响时照样舔尾巴。

斯金纳认为,这些方法为分析学习过程提供了有效的基础。而这类实验分析也使他得出了与经典行为主义不同的观点。

(二)两种类型的学习

斯金纳在解释学习时,已看到了巴甫洛夫、华生和格思里等人对学习的解释。但他认为,经典条件作用只是解释了人类与动物的数量非常有限的行为。具体地说,他坚持认为,这些早期的学习理论只能用来解释这样一种习得行为:用某种刺激可以引发某种反应,这种刺激一反应的联结是该刺激与另一种刺激多次配对的结果。没有刺激便没有反应,这成了传统的刺激一反应理论的一句名言。

斯金纳承认这种模式在解释某些行为时是确切的,但他认为,人类与动物显示出来的许多反应并不是明显的刺激引发的。因而,刺激--无论是观察得到的还是观察不到的--并不是在任何情况下都是可以对学习作出精确有效的解释的核心。

斯金纳把由刺激引发的反应称为“应答性反应”;把有机体发出的反应称为“操作性反应”。前者往往是一种不随意的行为;后者大多是随意的或有目的的行为。在大多数情况下,被动引出的反应在重要性程度上比主动发出的反应要逊色得多。因为,在应答性行为中,有机体是被动地对环境作出反应;而在操作性行为中,有机体是主动地作用于环境。经典条件作用只能用来解释基于应答性行为的学习,斯金纳把这类学习称为“S(刺激)类条件作用”。另一种学习模式,即操作性或工具性条件作用的模式,则可用来解释基于操作性行为的学习,他称为“R(强化)类条件作用”。

斯金纳认为,人类从事的绝大多数有意义的行为都是操作性的。

例如,步行上学、读书写字、回答问题等,都是操作性行为的例子。当然,也许有人会说,事实上存在着许多引发这些反应的刺激。对此,斯金纳并不想否认,但他坚持认为,即便存在引出这些反应的刺激,它们在学习中也并不占主要地位。

操作条件作用的模式认为,如果一种反应--不管有没有引起这种反应的刺激--之后伴随一种强化物,那么,在类似环境里发生这种反应的概率就增加。而且,强化物与实施强化的环境一起,都是一种刺激,我们可以以此来控制反应。这样,任何作为强化的结果而习得的行为,都可以被看作是操作条件作用的例子。人们由此把斯金纳的理论称为强化理论。在斯金纳看来,重要的刺激是跟随反应之后的刺激(强化物),而不是反应之前的刺激。若用公式来表示,那就是:s一R一S。

(三)强化原理

为了简便起见,我们可以把斯金纳所观察的对象分为两类:自变量(即在实验中可以直接控制的因素)和因变量(即实验者无法直接控制、受自变量影响的因素)。与赫尔和托尔曼不同,斯金纳不关心中介变量。他认为中介变量是无效的,而且常常是有害的,因为它们把我们的焦点放在想象的构成上,而不是放在现实上。所以他醉心于发现因变量与自变量之间的各种特定关系,目的是为了加强对因变量的控制。我们可以把斯金纳体系的基本要素概括如下:

自变量因变量强化的类型习得的速度强化的安排反应的速度消退的速度斯金纳体系试图回答的中心问题是:自变量(强化的类型和强化的安排)是如何影响学习的。

1.强化的类型斯金纳用条件作用的原理来解释学习,是基于这样一种观点:人们通常都是以一种增加愉快、减少痛苦的方式来行事的。但是,“愉快”和“痛苦”都是一种主观性的东西,这在强调客观性和科学性的斯金纳体系中是没有地盘的。斯金纳是以一种相当操作性的方式来界说强化的。

强化物是指“使反应发生概率增加、或维持某种反应水平的任何刺激”。

也就是说,凡是提高反应概率的任何事件都可以起强化作用。这样,强化物并不一定是一种令人愉快的刺激。而且,在一种情境中起强化作用的刺激,在另一种情境中并不一定起强化作用。同样,对某一个人起强化作用的刺激,对另一个人并不一定起强化作用。

斯金纳区别了两种强化类型:正强化(positivereinforce一ment,又译积极强化)和负强化(negativereinforcement,又译消极强化)。

当在环境中增加某种刺激,有机体反应概率增加,这种刺激就是正强化物。例如,当饥饿的白鼠按开关时给予食物,食物便是正强化物。

当某种刺激在有机体环境中消失时,反应概率增加,这种刺激便是负强化物。负强化物即厌恶刺激,是有机体力图避开的那种刺激。例如,当处于电击状态下的白鼠按开关时停止电击,停止电击就是负强化物。需要注意的是,无论是正强化物还是负强化物,它们的结果都是增加反应概率。由此可见,是刺激对反应的结果,而不是刺激本身的性质,决定这种刺激是否是一种强化物。

值得一提的是,在操作性条件作用原理中,强化(reinforce)和惩罚(Punish)这两个动词后面所跟的宾语,是反应而不是有机体。也就是说,不能说白鼠被强化了,而应说白鼠按杠杆的反应被强化了。

斯金纳认为,这样使用术语的好处是可以防止人们对实验程序作含糊的描述。

我们知道,强化的概念在桑代克效果律中已有阐述。但在斯金纳的行为分析中,强化所扮演的角色发生了重大变化。首先,在桑代克那里,强化是用来解释刺激一反应联结加强的一条主要原理,而在斯金纳体系中,强化只是一个用来描述反应概率增加的术语,如何安排强化才是核心所在。其次,其他学习理论家(如巴甫洛夫)把消退看作是一个主动的抑制过程,而斯金纳认为不能把消退看作是一种与强化无关的独立的过程。事实上,强化可用于消退行为,停止强化可以使反应概率下降。消退过程可用来表明强化效果持续的时间。

除了对正强化与负强化作出区分外,斯金纳还区分了强化的两个来源:一级强化物和二级强化物。一级强化物包括所有在没有任何学习发生的情况下也起强化作用的刺激,如食物和水等满足生理基本需要的东西。二级强化物包括那些在开始时不起强化作用,但后来作为与一级强化物或其它强化物配对的结果而起强化作用的刺激,如斯金纳箱里的灯光。斯金纳认为,对于人类来说,二级强化物包括对大量行为起强化作用的许多刺激,诸如特权、社会地位、权力、财富、名声等,这些大多是由社会文化所决定的,它们构成了决定人类行为的极有力的二级强化物。

2.强化的安排斯金纳从事实验和研究的主要目的,是要论述和澄清强化的类型和强化的安排对学习测度的影响。学习测度主要包括习得速度、反应速度和消退速度。从某种意义上说,斯金纳在强化安排方面的实验,是他对心理学的最大贡献。

斯金纳认为,在行为实验分析中,最容易控制的、最有效的变量是给予强化的方式。在一种仔细控制的实验情境中,实验者可以精确地决定使用什么类型的强化,以及怎样给予、何时给予强化。也就是说,实验者完全可以控制强化程序。

一般说来,实验者可以有两种选择:(1)连续强化,即每一次正确反应之后都给予强化;(2)间歇强化,即并不是每一次正确反应之后都给予强化(如表1所示)。

如果实验者选择连续强化,那就没有其他选择了,只要每次正确反应之后都给予强化便是了。如果实验者选择间歇强化,那么他还要进一步作出选择:是根据反应的次数还是根据时间间隔给予强化。