先前與大家淺談了Reinforcement Theory(重溫一下,例如正向強化、負向懲罰、消弱),理論內容龐多,今再續前文。此理論除了有前文提及的狗隻實驗,還包括另一個更為著名、更為不思議的實驗--白鴿實驗。
平日在街上,大家或許會見過一些不識泰山的白鴿,總在人前班門弄斧,肆意接近,毫無懼色。但這不是很奇怪嗎?為甚麼牠們不怕我們一手把牠們捉來吃掉?而實驗人員的想法更為大膽--他們要訓練白鴿自轉一圈。
轉與不轉 在於獎勵
實驗人員首先把實驗用的白鴿餓一餓,藉以將食物成為牠們的正向強化之獎勵,然後把牠們放到實驗箱去。當牠們喙一下按鈕,機關就會開啟,予以糧食(這個跟先前的狗狗實驗一樣)。再然後,實驗人員先將白鴿放在實驗台上,觀察牠的行為。若此實驗想讓牠順時針自轉一圈,則在牠有稍稍順著方向轉的時候,開啟機關,給予食物;如果牠逆方向轉,則不獲食物。
鴿子慢慢發現只要右轉90度時便會獲獎,於是每次進食完,牠都會馬上右轉,然後又獲獎。如是者,待其習慣後,便在牠右轉90度時不予獎勵,而待牠多轉少許時,馬上予獎。於是乎,逐步逐步地,在牠自轉一圈之後,才給予獎勵。自此,牠便成功「畢業」。
獎罰理論用於兒童教育
實驗完畢,我們發現,實驗人員們大體上使用了正向獎勵來塑造白鴿的行為。而這次值得留意的是,實驗人員介入並改變鴿子的行為的方法。此實驗能總結出一系列的增強方式:一為連續增強,二為部分增強;此中又有固定或變動時距,與固定或變動比例。
而我們不難發現,在訓練白鴿之初,實驗人員使用了連續增強--凡完成目標即有獎勵,以作反饋。而及後,在後續的實驗影片中,大家留意到即使白鴿未能完成要求,牠都不會再獲任何即時且又相應的獎勵,亦估計到實驗後期,牠已然對要求瞭如指掌,實驗人員亦將獎勵方式改成部分增強一類之中。
獎罰理論其實可應用於小朋友的教育上。
在教育剛起步的階段,每當他們完成任務,便即時給予獎勵,以在其苦心勤力之時回報他們。而在中後期,或可考慮按時間、或按份務的份量來給予獎勵。他們必然會覺得不值(以本人的經驗,學成某事之後便會忘記學習時的辛酸,甚或視之為簡單),但家長可告之原委:你已學會了,理應做得得心應手才對。
而工具上,Mellow專設的「Challenge」功能可讓你自行設定不同任務、獎勵,例如倒垃圾(五元)、洗碗(十分鐘玩樂時間)等,又或者改動一些已有的範本任務,來寓獎勵於家務。這方面的理論與教育心理學息息相關,留待下文再談。