|
Marco Baranello
|
| Apprendimento: il
condizionamento operante (o strumentale) |
| psicologia sperimentale - il
paradigma del condizionamento operante di Skinner |
|
Così come esposto da tutti i manuali di
psicologia generale, iniziamo la trattazione del paradigma
teorico del condizionamento operante descrivendo i limiti
del modello pavloviano, ovvero il paradigma del
condizionamento rispondente (o classico).
Ci si rese ben presto conto che il modello Stimolo-Risposta
(S-R) di Pavlov non riusciva a spiegare l'ampia gamma
dell'apprendimento degli organismi, sopratutto non includeva
il ruolo attivo dell'essere vivente sull'ambiente
circostante.
Ogni comportamento produce un effetto,
l'effetto prodotto a sua volta è in grado di produrre delle
conseguenze sull'individuo.
L'effetto del comportamento sull'ambiente è stato studiato
per primo da Thorndike che definì una ormai nota situazione
sperimentale: un gatto veniva chiuso in una gabbia dotata di
un meccanismo (un chiavistello) che ne permetteva
l'apertura. Il gatto veniva posto in una situazione di problem
solving. Quando l'animale riusciva, per tentativi ed
errori, a risolvere il problema "uscire dalla
gabbia" si notò un incremento delle azioni finalizzate
e una riduzione esponenziale delle attività inutili allo
scopo. Questo tipo di apprendimento venne definito
"strumentale" in quanto il comportamento
dell'animale poteva essere considerato strumentale alla
risoluzione del problema e alla ricerca di una ricompensa.
Si ipotizzarono quindi due leggi legate
all'apprendimento:
1) la legge dell'effetto, secondo la
quale l'organismo tende a ripetere i comportamenti che
producono effetti benefici mentre tende ad abbandonare i
comportamenti inutili o che producono effetti deleteri.
2) la legge dell'esercizio, secondo
la quale una risposta è più probabilmente ripetibile nella
misura in cui essa è stata ripetuta.
Una lettura integrata delle due leggi
permette di prevedere, ad esempio, che comportamenti in
grado di produrre maggiori risposte benefiche hanno una
maggiore probabilità di essere appresi.
Gli studi di Thorndike hanno permesso a F.B.
Skinner di sviluppare il modello del condizionamento
operante. Una risposta può essere attivata senza la
necessità di uno stimolo in quanto essa diviene subordinata
alla possibilità di una ricompensa (o rinforzo oppure
rinforzatore) in grado di sollecitare un
comportamento volontario acquisito in seguito ad un
rinforzo.
La situazione sperimentale è la seguente:
una cavia viene messa in una gabbia (nota a tutti come la
Skinner Box) dotata di un dispositivo erogatore di cibo
collegato ad una leva che ne permette l'attivazione.
La cavia è lasciata "libera" di muoversi
all'interno della gabbia senza "condizionamenti
sperimentali". La cavia incontra la leva casualmente e
vede che l'effetto prodotto è la comparsa del cibo.
Esponenzialmente si vede che la cavia aumenta le pressioni
della leva e finalizza sempre di più le proprie azioni
verso l'erogazione di cibo.
video
esplicativo
L'Operante è l'insieme delle risposte
simili dal punto di vista della funzione attivate dalle
conseguenze che esse stesse producono (cioè una
modificazione dell'ambiente). La tipologia delle conseguenze
prodotte da un comportamento volontario determina la
probabilità che esso si ripeta.
Il rinforzo (o rinforzatore) è
definibile come quella specifica condizione in grado di
aumentare la probabilità che una risposta di verifichi.
Il rinforzo è definibile in termini di valenza come rinforzo
positivo, cioè che produce una risposta la cui
conseguenza sarà la ricompensa, oppure come rinforzo
negativo, in grado cioè di produrre una risposta che
avrà come conseguenza l'eliminazione dello stimolo nocivo
(es. un shock).
E' da sottolineare che la punizione non è
sinonimo di rinforzo negativo.
La punizione non è un rinforzo in quanto essa ha come
conseguenza l'indebolimento di un comportamento (anche se
temporaneo).
Una delle principali caratteristiche del
rinforzo è la sua natura. Si definiscono rinforzatori
naturali o primari tutti gli eventi che
fungono da rinforzo per loro natura, cioè intrinsecamente,
senza necessità di un addestramento specifico.
Sono invece definiti rinforzatori secondari quelli
legati alla storia del soggetto ovvero la cui connotazione
come rinforzo avviene successivamente. I soldi sono un
ottimo esempio di rinforzatore secondario in quanto non
legati a necessità di base dell'individuo ma alla sua
storia socio-culturale.
Altra importante caratteristiche del
rinforzo è il contesto nel quale avviene. Ricordiamo
che il contesto può essere ambientale esterno o interno
all'organismo che interagisce con l'evento-stimolo. I
concetti di interno ed esterno non verranno discussi in
questa sede. Sappiamo bene infatti che alcuni comportamenti
sono rinforzati in specifici contesti mentre puniti in
altri. Ad esempio sul ring di un incontro di boxe ci si può
prendere a pugni e viene rinforzato dall'approvazione del
pubblico (rinforzatore generalizzato) oppure
da un premio al vincitore, mentre tale comportamento è
perseguibile dalla legge, cioè punito, in un contesto di
vita ordinario.
Esiste una classe di rinforzi definibili
come rinforzi dinamici che sono legati non a stimoli
ambientali ma ad altri nostri comportamenti. Accade così
che un comportamento "preferito" ovvero più
frequente in contesti in cui ci sia libertà di azione,
divenga rinforzo per comportamenti meno frequenti (Moderato,
Rovetto, 1997).
Dott.
Marco Baranello
Baranello, M. (2002)
Psicologia sperimentale: l'apprendimento. Il condizionamento
operante.
SRM Psicologia Rivista (www.psyreview.org).
Roma, 16 maggio 2002.
|