Psicología del Aprendizaje Tema 4
Principios básicos del
condicionamiento operante.
Primera parte
Antecedentes históricos
Influencia de
Darwin
Teoría de la evolución
Skinner
The behavior of Organisms
Relaciona los mecanismos de selección con la conducta
El reforzador actúa como elemento seleccionador
de las respuestas más apropiadas en una
determinada ocasión
Thorndike
Estudio científico del condicionamiento instrumental tanto teórico como metodológico
Denominó el condicionamiento instrumental como
Aprendizaje por ensayo y error
Aciertos y fracasos afectan a la conducta de los organismos
El aprendizaje ocurre porque se fortalecen las conexiones entre estímulos y respuestas
Cuando se da lugar un estado de satisfacción para el animal
Denominado Conexionismo
Experimentos
Con gatos introducidos en "cajas problema"
Para la evaluación de la ejecución del aprendizaje
Medía la latencia de escape del animal
Tiempo transcurrido
entre el comienzo del
ensayo hasta que el
sujeto conseguía salir de
la caja
Este tiempo disminuía a lo
largo de los ensayos
Estableció que
La entrega de comida fortalecía la conexión entre
La situación (estímulos en el entorno de la caja)
La respuesta del animal
Ley del efecto
De las muchas respuestas dadas en la misma situación,
las que vayan acompañadas o inmediatamente seguidas
de satisfacción para el animal, en igualdad de condiciones,
se conectarán más firmemente con la situación
De manera que
Cuando esta vuelva a presentarse
Volverán a presentarse con gran probabilidad
Conductas con resultado placentero serán por tanto fortalecidas
Conductas de resultado desagradable serán
eliminadas
Skinner
Análisis
experimental
del
comportamiento
Desarrolla la idea de que los reflejos podrían ser estudiados como
conducta más que como un reflejo del sistema nervioso
Distingue entre
Condicionamiento de los reflejos (Pavlov)
Conexionismo (Thorndike)
Formuló que
La conducta se regula tanto por el condicionamiento de los reflejos (condicionamiento respondiente)
como por el condicionamiento operante
Ambos condicionamientos debían solo prestar
atención al estudio de las relaciones entre
Eventos observables
Conducta
Se centró en las relaciones funcionales entre
La conducta
Sus consecuencias
Describió los procedimientos con los términos
Condicionamiento
operante
El término operante refleja la capacidad que
tiene el individuo para operar sobre su
ambiente
Condicionamiento
instrumental
El termino instrumental tiene en cuenta el
hecho de que la conducta es el instrumento
para obtener el reforzador
Experimentos
Caja de Skinner
El sujeto podía ejecutar la respuesta
repetidamente sin intervención del
experimentador
Ratas: presión de una palanca
Palomas: picoteo de una tecla
Estos procedimientos son conocidos como
De operante libre
La respuesta puede ocurrir en cualquier momento y de forma repetida
Variable dependiente
Tasa de respuesta
Respuestas por
unidad de tiempo
Definición del
condicionamiento
operante
Se considera el proceso que da lugar
a que la probabilidad de una
respuesta se vea modificada por sus
consecuencias
Es decir
Por los efectos que tiene el ambiente sobre ella
Ejemplo
Una rata en una caja de
Skinner dispone de una
palanca conectada al
contenedor de comida
La caja representa las circunstancias o el ambiente
Si la rata da por casualidad a la palanca se liberará alimento
Esto hace que aumente la probabilidad de que el animal
accione de nuevo la palanca para conseguir más comida
Por lo tanto
El CO dispone al sujeto
en unas circunstancias
en las que alguna de sus
conductas da lugar a la
aparición de un evento
Lo que produce un cambio de la probabilidad de emisión
de esa conducta en el futuro
El término "operante" se utiliza porque a diferencia de en el CC el sujeto
interviene u "opera" en el medio
Con el CO los organismos aprenden a
Obtener consecuencias
favorables
Eliminar consecuencias desfavorables
Responder ante una nueva circunstancia con una respuesta
que formaba parte de su repertorio y dar lugar a la
aparición de nuevas respuestas
Contingencia de tres términos
La descripción de la CO requiere de estos
términos y sus interrelaciones funcionales
La contingencia se define como
En presencia de un estímulo específico, el reforzador se presentará si y solo si
la respuesta operante sucede
La contingencia de estos tres términos constituye la unidad fundamental de análisis en el estudio de la conducta operante
1. El estímulo discriminativo
Se debe considerar la conducta
como
La ejecución que ocurre después de un estímulo que en un momento
determinado tiene como resultado una consecuencia específica
Por lo tanto
Los estímulos antecedentes tienen gran importancia en el CO
Las claves contextuales en el
CO reciben el nombre de
Estímulos discriminativos (Eds)
Estos señalan la ocasión para que si la conducta se presenta sea seguida
por una consecuencia
Es decir
Un estímulo, en principio neutro, puede indicar si el reforzador está disponible
Y por tanto
Indica al sujeto cuándo
ha de responder
Esto implica
Reforzar una
respuesta en una
situación pero no en
otra
La probabilidad de emitir una operante en presencia de un Ed puede ser muy
alta
Esto quiere decir que el estímulo ejerce un control sobre esa respuesta
Pero NO que el Ed provoque la
respuesta
Las consecuencias de las Respuestas Operantes (RO) establecen el control que ejercen los
Eds.
Cuando un Ed va seguido de una respuesta cuya consecuencia es
apetitiva se ve reforzada
Por lo tanto
La probabilidad de que ocurra aumenta si dicho estímulo está presente posteriormente
Cuando una RO no es seguida de una
conducta reforzante
El estímulo precedente se conoce como
Estímulo Delta
(EA)
En su presencia la probabilidad de emitir la operante
diminuye
Control por estímulo
Se refiere a cómo los
estímulos que
preceden una
conducta pueden
controlar la ocurrencia
de ésta
Ejemplo
Una máquina de bebidas con luz verde (disponible) y luz roja (agotado)
RO: apretar el botón de selección de bebida
La P de que pulsemos el botón si la luz verde está
encendida será mucho más alta que si lo está la roja
Ed : luz verde
Señala la disponibilidad del reforzador en el caso de que se emita la RO
EA ( Estímulo delta) :
luz roja
Señala la ausencia del reforzador en el caso de que la operante ocurra
2. La respuesta
La respuesta operante
se define por
Los efectos que provoca
en el ambiente
Cuando una respuesta produce el mismo efecto que otra respuesta diferente estaremos hablando de la misma operante
Porque producen los mismos efectos sobre el ambiente
La operante se define por tanto por
su función y no por su forma
Ejemplo
En el caso de la presión de una palanca, esta puede
hacerse con la pata o con el morro, pero ambas
respuestas dan como resultado la obtención de comida,
por ello son la misma operante
Skinner
El término se usará como adjetivo (conducta operante) y como sustantivo que designa la conducta definida por una consecuencia dada
Conducta
Puede ser compleja y adoptar distintas formas (topografía) teniendo la misma función
Clase de respuesta
Se refiere a cualquier forma de ejecutar una conducta con una función similar
EJ. Obtención de comida
Pueden ser físicamente parecidas o no
Ej: podemos hacer algo nosotros
mismos o pedirle a otro que lo haga
Esta serían la misma clase de respuesta pero con
una topografía o forma muy diferente
3. El reforzador
Para el CO el término reforzador da cabida a la gran variedad de estímulos y eventos que poseen la capacidad de
reforzamiento de una conducta
Se define en función de los efectos que tiene sobre la conducta
Un reforzador es cualquier suceso o evento que al hacerse contingente con una respuesta cambia la
probabilidad de aparición de esa respuesta en el futuro
Reforzamiento
condicionado
La conducta a menudo no es controlada por reforzadores primarios (como la comida) sino por eventos cuyos efectos dependen de la historia del reforzamientos
Elogios, críticas, juicios sobre el comportamiento o el dinero son consecuencias que pueden fortalecer o debilitar la ocurrencia de una conducta
Este tipo de eventos adquieren los efectos que producen debido a las experiencias pasadas
Esto hace que la misma consecuencia pueda tener distintos
efectos dependiendo de la experiencia personal del sujeto
Un reforzador puede ser definido como
Un evento cuya entrega aumenta la frecuencia de una
respuesta con la que es contingente
Por lo tanto
El componente crítico es la influencia en la tasa de respuesta,
no lo que el estímulo o evento es en realidad
También llamado
Reforzamiento secundario
Un estímulo o evento que originalmente no es
reforzante puede adquirir capacidad de
reforzamiento mediante la asociación repetida con
otro que era previamente reforzante
Es decir
Cuando una conducta se fortalece debido a sucesos que tiene un efecto
que depende de la historia de reforzamiento de ese sujeto
Implica una correspondencia entre
Un evento arbitrario
Cuando este evento arbitrario es capaz de aumentar la frecuencia o la
tasa de respuesta se da el Reforzamiento condicionado o secundario
Un reforzador efectivo en el momento actual
Resultados de laboratorio
Son contradictorios
en algunos casos
La extinción hace que los
reforzadores condicionados
pierdan efectividad
En ocasiones se mantienen en situaciones de muchas repeticiones
La experiencia en
la vida diaria
sugiere que
Eventos de este tipo
pueden reforzar gran
cantidad de conductas
sin extinguirse
Aclaraciones
Reforzador - Reforzamiento
Reforzador
Evento
Consecuencia apetitiva
Hace que el reforzamiento produzca
incrementos en la conducta
Consecuencia aversiva
Castigo
Los eventos utilizados cuando la conducta se presenta son de naturaleza aversiva
Reforzamiento
Procedimiento o proceso
Produce incrementos en la conducta
Castigo
El procedimiento hace
que disminuya la
conducta
Respuesta discreta - Operante libre
Experimentos de ensayo discreto
Variable dependiente
Latencia de repuesta
Duración del ensayo
Desde que el sujeto es dispuesto en el
aparato hasta que emite la respuesta
únicamente se puede emitir y por lo tanto registrar una
respuesta por ensayo
Experimentos de operante libre
Introducidos por Skinner
Variable dependiente
Tasa de respuesta
TR = Ra / Ra + Rb
Se puede emitir la respuesta de forma constante y
repetidamente sin la intervención del experimentador
Topografía - Función
Topografía
Forma, propiedad o característica física de una respuesta
Secuencia de movimientos que ocurren en el tiempo
Las consecuencias de una respuesta pueden modificar su topografía
Por lo que es una función de las
contingencias de reforzamiento
Dos respuestas con distinta topografía
pueden tener la misma función
El control ejercido por un reforzador sobre una CO puede estar limitado por la topografía de la respuesta
Función
Relación de la respuesta con
Los estímulos
antecedentes
Las
consecuencias
de la misma
Es por lo tanto
La ejecución de una respuesta que sigue a un estímulo específico
Y que tiene como resultado
algún tipo de consecuencia
Dos respuestas con la
misma forma pueden
tener función diferente
Instancia de respuesta
- Clase de respuesta
La CO se define por las
relaciones funcionales
entre clases de
respuestas y las
consecuencias
ambientales
Clase de respuesta
Se refiere a todas las
formas en las que la
ejecución de la respuesta
puede llevar a una
función similar
Ej. Presión de la
palanca (
independientemente
del momento y la
topografía )
Instancia de respuesta
Unidad mínima de conducta
Referida a la ocurrencia particular y específica de
una respuesta teniendo en cuenta además su
topografía
Ej . Presión de la palanca
de la caja de
condicionamiento con la
pata delantera derecha a
las 10:50 pm
Interacciones clásicas -
Operantes en el control
de la conducta
Para llevar a cabo un CO es
necesario que el sujeto sea
"activo"
Es decir: que emita algún
tipo de respuesta
Para poder reforzar o castigar
una conducta es necesario que
esta se presente con cierta
probabilidad
Si la probabilidad de ocurrencia
es baja (ej picotear una luz) se
puede recurrir al
automoldeamiento
Procedimiento (ejemplo)
1. Mediante CC se empareja un EN (tecla iluminada) con un EI+ (comida)
2. Tras varios ensayos el EN pasa a ser EC y provoca la RC en solitario
3. Se somete a CO haciendo que solo aparezca el EI cuando se presiona la tecla
4. El EC se convierte en un estímulo discriminativo (Ed) que correlaciona con el
reforzador (EI) cuando se presiona la tecla (RO)
En este caso la luz tiene doble función
Es un Ed
Señala la ocasión
para el refuerzo
Es un EC
Elicita una conducta
condicionada
clásicamente
Habitualmente se dan
relaciones de interacción entre
CC y CO
Aunque analicemos de forma
separada las respuestas
condicionadas clásicamente
de las operantes, la influencia
de estas contingencias tiene
lugar sobre todo el organismo
Diferenciar ambos tipos de
aprendizaje,aunque
artificial, es necesario par la
investigación
Se cree que a nivel
neurobiológico ambos tipos de
aprendizaje podrían estar
mediados por diferentes
mecanismos a nivel celular
Lo que señala que el cerebro los procesa de forma diferente