4. Nagrody i kary a teoria uczenia się

Osobną uwagę należy poświęcić problemom związanym z czwartą z wymienionych poprzednio grup czynników, od których zależy uspołecznienie, tzn. z wychowaniem, czyli – jak wspomniano – z oddziaływaniem celowo organizowanym dla uzyskania określonych efektów, w tym przypadku predyspozycji do uspołecznionego postępowania.
O wychowaniu mówi się często, że jest to “kształtowanie” osobowości i porównuje się je poetycko do rzeźbienia, a wychowawców do “rzeźbiarzy dusz”. Nie bardzo trafne to porównanie, skoro wiadomo, że organizm ludzki nie jest martwą materią poddającą się biernie oddziaływaniom zewnętrznym, ale układem żywym, samoregulującym się, a czynnikiem kształtującym go nie są – jak w posągu – bezpośrednie wpływy zewnętrzne, lecz własne działania, za pomocą których reaguje on na otoczenie (por. Rubinsztejn S. L., 1962, s. 819). Dlatego iteż wychowanie polega w gruncie rzeczy na takim organizowaniu otoczenia, aby ono prowokowało dziecko do działań pożądanych, a hamowało działania z wychowawczego punktu widzenia niepożądane. Niewątpliwie zamysłem pedagogicznym nie da się objąć całego otoczenia dziecka i dlatego tak ważny jest omówiony przed chwilą problem wpływów nie zamierzonych. W itym miejscu zajmiemy się jednak tylko celowymi działaniami wychowawczymi.
Wychowanie – to z jednej strony stawianie dziecku określonych wymagań, z drugiej – stosowanie pewnych nacisków mających zapewnić spełnienie tych wymagań. Wśród nacisków wychowawczych najczęściej wymienia się kary i nagrody, one też – a szczególnie kary – są dziś przedmiotem szeregu dyskusji wśród psychologów i pedagogów. Ponieważ sprawy te wiążą się ściśle z problematyką resocjalizacji (samo więzienie uważane jest przecież za karę), zajmę się nimi obszerniej, pomijając w tym miejscu inne kwestie związane z tym tematem.
W praktyce wychowawczej, np. wśród rodziców czy nauczycieli dość rozpowszechniony jest pogląd, że kary i nagrody działają mechanicznie, same przez się: nagroda ma wytwarzać i wzmacniać motywy postępowania pożądanego wychowawczo i dlatego nagradzanego, natomiast kara ma wywołać strach, który hamuje działania niepożądane. Sądzi się przy tym, że tą drogą można wytworzyć trwałe nawyki, tzn. że dziecko kiedy dorośnie będzie tak właśnie postępowało nawet wówczas, gdy już nie będzie wychowawcy, który by je karał czy nagradzał. Wychowanie jest tu więc pojmowane jako pewnego rodzaju tresura.
Właśnie w związku z tym, że w tresurze zwierząt stosuje się z powodzeniem kary i nagrody, wielu teoretyków usiłuje dziś wyjaśniać wpływ karania i nagradzania jako środka wychowawczego w świetle “teorii uczenia się”, tj. twierdzeń o uczeniu się wynikających głównie z badań nad zwierzętami (Skinner, Mowrer i in.). Badania te zapoczątkowały przede
wszystkim pawłowowskie doświadczenia nad “klasycznymi” odruchami warunkowymi, jednakże eksperymentalne modele uczenia się pod wpływem nagród i kar biorą pod uwagę zasadniczo “uczenie się instrumentalne” Thorndike’a 7.
Doświadczenia z nagradzaniem polegają na tym, że zwierzę ma wykonać pewną czynność, za którą otrzymuje nagrodę dostosowaną do swych potrzeb. Na przykład, w klatce Skinnera głodny szczur uczy się w ten sposób naciskać małą dźwignię, która automatycznie wyrzuca pastylkę proszku mięsnego, w labiryntach różnego kształtu zwierzę uczy się znajdować drogę do miejsca, w którym znajduje się pokarm itd. Eksperymenty z karaniem mogą mieć charakter dwojaki, zależnie od tego, czy za, pomocą kary chce się wytworzyć nową reakcję (kara za niewykonanie | działania), czy też zahamować jakąś inną reakcję (kara za wykonanie działania). Jako przykład pierwszego typu doświadczeń można przytoczyć eksperyment Cullera i współpracowników (1935; por. Woodworth R. S., Schlosberg H., 1967, II, s. 226). Pies umieszczony na stojaku uczył się podnosić nogę na sygnał dźwiękowy, po którym po 2 sekundach otrzymywał uderzenie w nogę prądem elektrycznym. Reakcja podniesienia nogi miała tu charakter czynności zapobiegającej karze, niewykonanie jej było karane bolesnym bodźcem elektrycznym.
Model karania za wykonanie czynności stanowi pewna odmiana eksperymentu z klatką Skinnera: zwierzę najpierw uczy się naciskać dźwignię wyrzucającą pastylkę pokarmu, w drugiej fazie zaś doświadczenia naciskanie dźwigni karze się uderzeniem prądu elektrycznego z siatki na podłodze (Estes W. K., 1944, por. Woodworth R. S., Schlosberg H., 1967, II, s. 226). Można więc powiedzieć, że mamy tu umodelowanie sytuacji, w której osobnik jest przez ubiegłe doświadczenie umotywowany do wykonania pewnej czynności, a tę motywację chce się wygasić za pomocą kary.
Interpretacja wyników tego rodzaju doświadczeń w terminach mechanizmu uczenia się nie jest jednolita i ciągle jeszcze istnieją na ten temat spory wśród badaczy. Nie wdając się w te mocno zawiłe teoretycznie dyskusje (por. np. przegląd niektórych problemów z tej dziedziny w Psychologii eksperymentalnej R. S. Woodwortha i H. Schlosberga, 1967, II, s. 33 – 46), zauważę tylko, że zwierzę uczy się tu nie tylko pewnego nawyku, tzn. reagowania czy niereagowania określoną czynnością na taki albo inny bodziec. Nabywa ono również nowej orientacji w otoczeniu, poznając zarówno nowe wskaźniki wartości, jak i wskaźniki działania (por.
7 Istnieją też próby wyzyskania “klasycznego” uczenia się dla wyjaśnienia niektórych faktów socjalizacji. Eksperyment Watsona i Rayner (por. s. 128) pokazał, że według tego schematu można wyjaśnić, jak powstają u człowieka lęki i antypatie, zapewne również społeczne. Niektórzy sądzą, że jest to mechanizm uczenia się wszelkich w ogóle, niębiologicznych wartości. Sprawa wymagałaby jednak oddzielnego omówienia (por. Baley S., 1959, s. 190).
Lewicki A. 1960, s. 153-56). W cytowanym eksperymencie z nagrodą szczur zdobywa informację, że urządzenie tego typu daje – podobnie jak restauracja dla ludzi – perspektywy zdobycia pokarmu, a dźwignia w klatce jest instrumentem, którego naciśnięcie wyrzuca pokarm. Można powiedzieć, że eksperyment ten “kanalizuje” potrzebę pokarmową zwierzęcia, podobnie jak czyni to socjalizacja z potrzebami człowieka (por. Baley S., 1959 s. 190).
Analogicznie ma się sprawa przy uczeniu się działań obronnych zapobiegających karze. W eksperymentach tego typu zwierzę uczy się przede wszystkim tego, że sygnał zapowiada uderzenie prądem, a po tym – czynności zapobiegającej bolesnemu uderzeniu. W pierwszej fazie bodziec dźwiękowy wywołuje więc ostre reakcje stressowe: w eksperymencie N. E. Millera, w którym szczury uczyły się otwierać na sygnał dźwiękowy drzwiczki prowadzące z pomieszczenia białego, gdzie dostawały uderzenie prądem, do “bezpiecznego” pomieszczenia czarnego, na dźwięk zapowiadający uderzenie prądem reagowały najpierw ostrym podnieceniem:
drapały drzwiczki, gryzły siatkę na podłodze, biegały, kuliły się, oddawały mocz i kał (Woodworth R. S., Schlosberg H., 1967, II, s. 228). Była to “klasyczna” warunkowa reakcja lękowa, zapewne o mechanizmie podobnym do tego, który u małego dziecka wytwarzał Watson (por. Woodworth R. S., Schlosberg H., 1967, II, s. 228). Gdy jednak szczur nauczył się już otwierać drzwiczki prowadzące do pomieszczenia czarnego, tzn. opanował czynność umożliwiającą mu zabezpieczenie się przed prądem, objawy stressu znikały, a sygnał dźwiękowy wywoływał spokojne wykonanie czynności zabezpieczającej, tzn. otwarcie drzwiczek do czarnego pomieszczenia. I tutaj więc zwierzę uczyło się nowej orientacji w otoczeniu: zdobyło informację, że sygnał dźwiękowy zapowiada bolesne uderzenie prądem i zaczęło nań reagować lękowo, przypadkowe otwarcie drzwiczek poinformowało je, że w ten sposób da się uciec przed prądem w miejsce bezpieczne, w rezultacie zaś czynność ita nagradzana utrwaliła się jako działanie instrumentalne. Motywem uczenia się był tu więc strach wywołany przez sygnał kary.
Strach odgrywa też rolę w mechanizmie, dzięki któremu kara zahamowuje wyuczone poprzednio działanie. Można go sobie wyobrazić następująco: Dla szczura, który poprzednio nauczył się zdobywać jedzenie w klatce Skinnera przez naciskanie dźwigni, widok klatki i widok dźwigni ma wartość dodatnią, stanowi pobudkę do wykonania działania. Jeśli jednak działanie to zaczniemy karać przez uderzenie prądem (szczególnie – jak w niektórych wersjach tego eksperymentu – prądem przepuszczanym przez samą dźwignię), dźwignia nabiera również wartości ujemnej, staje sle sygnałem zagrożenia. U zwierzęcia powstaje w ten sposób konflikt dwóch tendencji, wyuczonej poprzednio tendencji do naciskania dźwigni i obecnej, do unikania dźwigni. Konsekwentne karanie bardzo szybko pro’ wadzi do tego, że strach przed dźwignią narastając zatrzymuje reakcję dodatnią. Zjawisko konfliktu występuje bardzo wyraźnie w eksperymencie przeprowadzonym przez J. S. Browna (1940, por. Hunt Mc. V., 1944, I, s. 436 i nast.). Szczury uczono najpierw szukać jedzenia w miejscu oznaczonym przez sygnał świetlny, a potem w tym samym miejscu zadawano im uderzenie prądem. U zwierząt występowało wówczas charakterystyczne zjawisko oscylacji (vacillation) przejawiające się w tym, że najpierw zbliżały się one do miejsca oznaczonego światłem, a potem zatrzymywały się się lub nawet cofały. Punkt, w którym następowała oscylacja, zależał od wielkości wygłodzenia, od stopnia utrwalenia reakcji dodatniej itd.
Już eksperymenty nad zwierzętami wskazują, że strach przed karą nie zawsze daje wyniki zamierzone przez eksperymentatora, W. K. Estes (1944, por. Woodworth, Schlosberg, 1967, II, s. 226) stwierdził, że wygaszanie za pomocą kary czynności, do których osobnik jest umotywowany przez poprzednie doświadczenie, daje wprawdzie szybkie, doraźne zahamowanie działania, ale nie wygasza tendencji, motywu do jego dalszego wykonywania. Szczur, karany w klatce Skinnera uderzeniem prądu za naciśnięcie dźwigni, przestał wprawdzie w danym dniu wykonywać tę czynność, ale w następnym dniu znów dźwignię naciskał i trzeba było nowego karania, aby go od tego powstrzymać. Najwidoczniej motyw do naciskania dźwigni nie został wygaszony, a strach tylko chwilowo go zahamował. Woodworth i Schlosberg wysnuwają stąd wniosek, że “kara raczej chwilowo tłumi dobrze utrwaloną reakcję, a nie eliminuje jej w ogóle” (1967, II, s. 226), inotyw do wykonywania czynności można zaś wygasić jedynie przez nie-nagradzanie czynności, a nie przez karanie jej jakimiś bolesnymi dla osobnika konsekwencjami8. “Podobny fakt – mówią dalej ci autorzy – ijest dość znany, choć często przeoczany, u dzieci i ludzi dorosłych: wielokrotnie karanie jakiegoś czynu nie czyni go wcale mniej atrakcyjnym” (loc. cit.).
Psychologowie zajmujący się badaniem rozwoju dziecka rzeczywiście doszli do podobnych wniosków na podstawie obserwacji w toku wychowania. W podręczniku psychologii rozwojowej pod redakcją M. Żebrowskiej czytamy (1966, s. 296); “Przy stosowaniu kar należy… pamiętać, że ich skutki są krótkotrwałe. Poprawa zachowania na ogół nie jest trwała, gdyż najczęściej niepożądane czyny zostają jedynie na krótko zahamowane. Może też dojść do tego, że dziecko zacznie się tylko kryć z nimi, a w rzeczywistości jego zachowanie bynajmniej się nie poprawi”.
Analogia pomiędzy tresurą zwierząt (a eksperymenty nad uczeniem się są przecież tylko pewną formą naukowo kontrolowanej tresury) a zjawiskami obserwowanymi w wychowaniu pozwalają przypuszczać, że zapewne istnieją pewne podstawowe prawa uczenia się wspólne dla zwie-
8 Wynika stąd, że brak nagrody działa inaczej niż bolesna stymulacja; stawia to pod znakiem zapytania jednolite traktowanie obu tych konsekwencji działania jako kar”, co czyni na przykład-za Hilgardem i Marquisem-A. Malewski (1964,
rząt i człowieka. Jednakże przenoszenie “teorii uczenia się” ze zwierząt na człowieka wydaje się nadmiernym uproszczeniem. Człowiek dość znacznie różni się od innych zwierząt, a wychowawcze sytuacje nagradzania i karania są tak specyficzne, że nie można ich porównywać z karami i nagrodami stosowanymi w laboratorium wobec zwierząt. Należałoby więc raczej postulować, żeby dla faktów obserwowanych w wychowaniu człowieka konstruować osobną teorię uczenia się. Dopiero jej porównanie z teorią uczenia się zwierząt pozwoli ustalić, czy istnieją ogólne prawa, z których można wyprowadzić obie te teorie, ale chyba nie należałoby z góry zakładać, że prawa stwierdzane głównie u szczurów muszą stosować się też do człowieka.

Artykuł dotyczy następujących zagadnień:

  • psychologia ogolna
  • doświadczenie skinnera
  • artykuł psychologia-uczenia się
  • eksperyment skinera
  • próby wykonywane na zwierzętach odnośnie kar i nagród
  • rola kary w uczeniu sie