以「白鴿自轉實驗」看親子獎罰機制

先前與大家淺談了Reinforcement Theory（重溫一下，例如正向強化、負向懲罰、消弱），理論內容龐多，今再續前文。此理論除了有前文提及的狗隻實驗，還包括另一個更為著名、更為不思議的實驗－－白鴿實驗。

平日在街上，大家或許會見過一些不識泰山的白鴿，總在人前班門弄斧，肆意接近，毫無懼色。但這不是很奇怪嗎？為甚麼牠們不怕我們一手把牠們捉來吃掉？而實驗人員的想法更為大膽－－他們要訓練白鴿自轉一圈。

轉與不轉在於獎勵

實驗人員首先把實驗用的白鴿餓一餓，藉以將食物成為牠們的正向強化之獎勵，然後把牠們放到實驗箱去。當牠們喙一下按鈕，機關就會開啟，予以糧食（這個跟先前的狗狗實驗一樣）。再然後，實驗人員先將白鴿放在實驗台上，觀察牠的行為。若此實驗想讓牠順時針自轉一圈，則在牠有稍稍順著方向轉的時候，開啟機關，給予食物；如果牠逆方向轉，則不獲食物。

鴿子慢慢發現只要右轉90度時便會獲獎，於是每次進食完，牠都會馬上右轉，然後又獲獎。如是者，待其習慣後，便在牠右轉90度時不予獎勵，而待牠多轉少許時，馬上予獎。於是乎，逐步逐步地，在牠自轉一圈之後，才給予獎勵。自此，牠便成功「畢業」。

接下來的實驗更是令人咋舌！有實驗人員將前後兩個訓練結合，令鴿子在看「Peck」時喙，見「turn」時轉，可謂訓練有素。

獎罰理論用於兒童教育

實驗完畢，我們發現，實驗人員們大體上使用了正向獎勵來塑造白鴿的行為。而這次值得留意的是，實驗人員介入並改變鴿子的行為的方法。此實驗能總結出一系列的增強方式：一為連續增強，二為部分增強；此中又有固定或變動時距，與固定或變動比例。

而我們不難發現，在訓練白鴿之初，實驗人員使用了連續增強－－凡完成目標即有獎勵，以作反饋。而及後，在後續的實驗影片中，大家留意到即使白鴿未能完成要求，牠都不會再獲任何即時且又相應的獎勵，亦估計到實驗後期，牠已然對要求瞭如指掌，實驗人員亦將獎勵方式改成部分增強一類之中。

獎罰理論其實可應用於小朋友的教育上。

在教育剛起步的階段，每當他們完成任務，便即時給予獎勵，以在其苦心勤力之時回報他們。而在中後期，或可考慮按時間、或按份務的份量來給予獎勵。他們必然會覺得不值（以本人的經驗，學成某事之後便會忘記學習時的辛酸，甚或視之為簡單），但家長可告之原委：你已學會了，理應做得得心應手才對。

而工具上，Mellow專設的「Challenge」功能可讓你自行設定不同任務、獎勵，例如倒垃圾（五元）、洗碗（十分鐘玩樂時間）等，又或者改動一些已有的範本任務，來寓獎勵於家務。這方面的理論與教育心理學息息相關，留待下文再談。

打開APP閱讀全文