强化程序是指在特定行为发生后给予奖励或惩罚的方式和频率。它包括连续强化程序和断续强化程序两类。其中,连续强化程序是在每一次正确行为后都给予奖励,而断续强化程序则是在某些情况下才给予奖励。
断续强化程序(Intermittent Reinforcement Schedule),即只有在某些而不是所有的反应后才会提供强化刺激。断续强化程序又可分为间隔程序和比率程序。
间隔程序(Interval Schedule)是根据两次强化之间的间隔时间来安排强化。它可以是固定的(Fixed Interval Schedule),即强化出现在预定的时间间隔内;也可以是变化的(Variable Interval Schedule),即强化出现的时间间隔是随机的。
比率程序(Ratio Schedule)是根据两次强化之间学习者的适当反应数量来安排强化。同样地,比率程序也可以是固定的(Fixed Ratio Schedule),即强化出现在学习者达到预定的反应次数后;或者是变化的(Variable Ratio Schedule),即强化出现的反应次数是随机的。
- 固定时间间隔(Fixed
时间 Interval)。在这种强化程序中,强化会在确定的时间间隔后出现,比如每20秒一次。被强化的对象通常会在这段时间内停止反应,随后反应速度逐渐加快,直到下一个强化的到来前达到峰值。这种类型的强化适用于定期检查等情境。
- 不固定时间间隔(Variable Time Interval)。在这种强化程序中,强化出现的时间没有规律性。由于无法预测强化的出现时间,被强化对象的反应速度相对稳定,不会出现明显的停顿现象。例如,不定期的卫生检查就属于这一类别。
- 固定比率间隔(Fixed Ratio Interval)。在这种强化程序中,每当被强化对象做出一定的次数的反应后就会获得强化,例如每30次反应后就会获得强化。在这种情况下,被强化对象可以通过自己的反应来控制强化的获取,因此反应速度较快。研究显示,当强化比率为1/4时,反应速度最快。例如,让孩子完成一定量的作业就可以玩耍,这就是一种固定比率间隔的强化程序。
- 不固定比率间隔(Variable Ratio Interval)。在这种强化程序中,强化是由反应次数决定的,但是每次强化所需的反应次数不同。尽管被强化对象不知道强化的标准是什么,但他们仍然能够通过更多的反应来获得更多强化,因此反应速度也很快。在生活中,父母和老师对孩子表现的赞扬和批评大多属于这种类型的强化程序。