Zusammenfassung der Ressource
Psicología del Aprendizaje Tema 4
Principios básicos del
condicionamiento operante.
Primera parte
- Antecedentes históricos
- Influencia de
- Darwin
- Teoría de la evolución
- Skinner
- The behavior of Organisms
- Relaciona los mecanismos de selección con la conducta
- El reforzador actúa como elemento seleccionador
de las respuestas más apropiadas en una
determinada ocasión
- Thorndike
- Estudio científico del condicionamiento instrumental tanto teórico como metodológico
- Denominó el condicionamiento instrumental como
- Aprendizaje por ensayo y error
- Aciertos y fracasos afectan a la conducta de los organismos
- El aprendizaje ocurre porque se fortalecen las conexiones entre estímulos y respuestas
- Cuando se da lugar un estado de satisfacción para el animal
- Denominado Conexionismo
- Experimentos
- Con gatos introducidos en "cajas problema"
- Para la evaluación de la ejecución del aprendizaje
- Medía la latencia de escape del animal
- Tiempo transcurrido
entre el comienzo del
ensayo hasta que el
sujeto conseguía salir de
la caja
- Este tiempo disminuía a lo
largo de los ensayos
- Estableció que
- La entrega de comida fortalecía la conexión entre
- La situación (estímulos en el entorno de la caja)
- La respuesta del animal
- Ley del efecto
- De las muchas respuestas dadas en la misma situación,
las que vayan acompañadas o inmediatamente seguidas
de satisfacción para el animal, en igualdad de condiciones,
se conectarán más firmemente con la situación
- De manera que
- Cuando esta vuelva a presentarse
- Volverán a presentarse con gran probabilidad
- Conductas con resultado placentero serán por tanto fortalecidas
- Conductas de resultado desagradable serán
eliminadas
- Skinner
- Análisis
experimental
del
comportamiento
- Desarrolla la idea de que los reflejos podrían ser estudiados como
conducta más que como un reflejo del sistema nervioso
- Distingue entre
- Condicionamiento de los reflejos (Pavlov)
- Conexionismo (Thorndike)
- Formuló que
- La conducta se regula tanto por el condicionamiento de los reflejos (condicionamiento respondiente)
como por el condicionamiento operante
- Ambos condicionamientos debían solo prestar
atención al estudio de las relaciones entre
- Eventos observables
- Conducta
- Se centró en las relaciones funcionales entre
- La conducta
- Sus consecuencias
- Describió los procedimientos con los términos
- Condicionamiento
operante
- El término operante refleja la capacidad que
tiene el individuo para operar sobre su
ambiente
- Condicionamiento
instrumental
- El termino instrumental tiene en cuenta el
hecho de que la conducta es el instrumento
para obtener el reforzador
- Experimentos
- Caja de Skinner
- El sujeto podía ejecutar la respuesta
repetidamente sin intervención del
experimentador
- Ratas: presión de una palanca
- Palomas: picoteo de una tecla
- Estos procedimientos son conocidos como
- De operante libre
- La respuesta puede ocurrir en cualquier momento y de forma repetida
- Variable dependiente
- Tasa de respuesta
- Respuestas por
unidad de tiempo
- Definición del
condicionamiento
operante
- Se considera el proceso que da lugar
a que la probabilidad de una
respuesta se vea modificada por sus
consecuencias
- Es decir
- Por los efectos que tiene el ambiente sobre ella
- Ejemplo
- Una rata en una caja de
Skinner dispone de una
palanca conectada al
contenedor de comida
- La caja representa las circunstancias o el ambiente
- Si la rata da por casualidad a la palanca se liberará alimento
- Esto hace que aumente la probabilidad de que el animal
accione de nuevo la palanca para conseguir más comida
- Por lo tanto
- El CO dispone al sujeto
en unas circunstancias
en las que alguna de sus
conductas da lugar a la
aparición de un evento
- Lo que produce un cambio de la probabilidad de emisión
de esa conducta en el futuro
- El término "operante" se utiliza porque a diferencia de en el CC el sujeto
interviene u "opera" en el medio
- Con el CO los organismos aprenden a
- Obtener consecuencias
favorables
- Eliminar consecuencias desfavorables
- Responder ante una nueva circunstancia con una respuesta
que formaba parte de su repertorio y dar lugar a la
aparición de nuevas respuestas
- Contingencia de tres términos
- La descripción de la CO requiere de estos
términos y sus interrelaciones funcionales
- La contingencia se define como
- En presencia de un estímulo específico, el reforzador se presentará si y solo si
la respuesta operante sucede
- La contingencia de estos tres términos constituye la unidad fundamental de análisis en el estudio de la conducta operante
- 1. El estímulo discriminativo
- Se debe considerar la conducta
como
- La ejecución que ocurre después de un estímulo que en un momento
determinado tiene como resultado una consecuencia específica
- Por lo tanto
- Los estímulos antecedentes tienen gran importancia en el CO
- Las claves contextuales en el
CO reciben el nombre de
- Estímulos discriminativos (Eds)
- Estos señalan la ocasión para que si la conducta se presenta sea seguida
por una consecuencia
- Es decir
- Un estímulo, en principio neutro, puede indicar si el reforzador está disponible
- Y por tanto
- Indica al sujeto cuándo
ha de responder
- Esto implica
- Reforzar una
respuesta en una
situación pero no en
otra
- La probabilidad de emitir una operante en presencia de un Ed puede ser muy
alta
- Esto quiere decir que el estímulo ejerce un control sobre esa respuesta
- Pero NO que el Ed provoque la
respuesta
- Las consecuencias de las Respuestas Operantes (RO) establecen el control que ejercen los
Eds.
- Cuando un Ed va seguido de una respuesta cuya consecuencia es
apetitiva se ve reforzada
- Por lo tanto
- La probabilidad de que ocurra aumenta si dicho estímulo está presente posteriormente
- Cuando una RO no es seguida de una
conducta reforzante
- El estímulo precedente se conoce como
- Estímulo Delta
(EA)
- En su presencia la probabilidad de emitir la operante
diminuye
- Control por estímulo
- Se refiere a cómo los
estímulos que
preceden una
conducta pueden
controlar la ocurrencia
de ésta
- Ejemplo
- Una máquina de bebidas con luz verde (disponible) y luz roja (agotado)
- RO: apretar el botón de selección de bebida
- La P de que pulsemos el botón si la luz verde está
encendida será mucho más alta que si lo está la roja
- Ed : luz verde
- Señala la disponibilidad del reforzador en el caso de que se emita la RO
- EA ( Estímulo delta) :
luz roja
- Señala la ausencia del reforzador en el caso de que la operante ocurra
- 2. La respuesta
- La respuesta operante
se define por
- Los efectos que provoca
en el ambiente
- Cuando una respuesta produce el mismo efecto que otra respuesta diferente estaremos hablando de la misma operante
- Porque producen los mismos efectos sobre el ambiente
- La operante se define por tanto por
su función y no por su forma
- Ejemplo
- En el caso de la presión de una palanca, esta puede
hacerse con la pata o con el morro, pero ambas
respuestas dan como resultado la obtención de comida,
por ello son la misma operante
- Skinner
- El término se usará como adjetivo (conducta operante) y como sustantivo que designa la conducta definida por una consecuencia dada
- Conducta
- Puede ser compleja y adoptar distintas formas (topografía) teniendo la misma función
- Clase de respuesta
- Se refiere a cualquier forma de ejecutar una conducta con una función similar
- EJ. Obtención de comida
- Pueden ser físicamente parecidas o no
- Ej: podemos hacer algo nosotros
mismos o pedirle a otro que lo haga
- Esta serían la misma clase de respuesta pero con
una topografía o forma muy diferente
- 3. El reforzador
- Para el CO el término reforzador da cabida a la gran variedad de estímulos y eventos que poseen la capacidad de
reforzamiento de una conducta
- Se define en función de los efectos que tiene sobre la conducta
- Un reforzador es cualquier suceso o evento que al hacerse contingente con una respuesta cambia la
probabilidad de aparición de esa respuesta en el futuro
- Reforzamiento
condicionado
- La conducta a menudo no es controlada por reforzadores primarios (como la comida) sino por eventos cuyos efectos dependen de la historia del reforzamientos
- Elogios, críticas, juicios sobre el comportamiento o el dinero son consecuencias que pueden fortalecer o debilitar la ocurrencia de una conducta
- Este tipo de eventos adquieren los efectos que producen debido a las experiencias pasadas
- Esto hace que la misma consecuencia pueda tener distintos
efectos dependiendo de la experiencia personal del sujeto
- Un reforzador puede ser definido como
- Un evento cuya entrega aumenta la frecuencia de una
respuesta con la que es contingente
- Por lo tanto
- El componente crítico es la influencia en la tasa de respuesta,
no lo que el estímulo o evento es en realidad
- También llamado
Reforzamiento secundario
- Un estímulo o evento que originalmente no es
reforzante puede adquirir capacidad de
reforzamiento mediante la asociación repetida con
otro que era previamente reforzante
- Es decir
- Cuando una conducta se fortalece debido a sucesos que tiene un efecto
que depende de la historia de reforzamiento de ese sujeto
- Implica una correspondencia entre
- Un evento arbitrario
- Cuando este evento arbitrario es capaz de aumentar la frecuencia o la
tasa de respuesta se da el Reforzamiento condicionado o secundario
- Un reforzador efectivo en el momento actual
- Resultados de laboratorio
- Son contradictorios
en algunos casos
- La extinción hace que los
reforzadores condicionados
pierdan efectividad
- En ocasiones se mantienen en situaciones de muchas repeticiones
- La experiencia en
la vida diaria
sugiere que
- Eventos de este tipo
pueden reforzar gran
cantidad de conductas
sin extinguirse
- Aclaraciones
- Reforzador - Reforzamiento
- Reforzador
- Evento
- Consecuencia apetitiva
- Hace que el reforzamiento produzca
incrementos en la conducta
- Consecuencia aversiva
- Castigo
- Los eventos utilizados cuando la conducta se presenta son de naturaleza aversiva
- Reforzamiento
- Procedimiento o proceso
- Produce incrementos en la conducta
- Castigo
- El procedimiento hace
que disminuya la
conducta
- Respuesta discreta - Operante libre
- Experimentos de ensayo discreto
- Variable dependiente
- Latencia de repuesta
- Duración del ensayo
- Desde que el sujeto es dispuesto en el
aparato hasta que emite la respuesta
- únicamente se puede emitir y por lo tanto registrar una
respuesta por ensayo
- Experimentos de operante libre
- Introducidos por Skinner
- Variable dependiente
- Tasa de respuesta
- TR = Ra / Ra + Rb
- Se puede emitir la respuesta de forma constante y
repetidamente sin la intervención del experimentador
- Topografía - Función
- Topografía
- Forma, propiedad o característica física de una respuesta
- Secuencia de movimientos que ocurren en el tiempo
- Las consecuencias de una respuesta pueden modificar su topografía
- Por lo que es una función de las
contingencias de reforzamiento
- Dos respuestas con distinta topografía
pueden tener la misma función
- El control ejercido por un reforzador sobre una CO puede estar limitado por la topografía de la respuesta
- Función
- Relación de la respuesta con
- Los estímulos
antecedentes
- Las
consecuencias
de la misma
- Es por lo tanto
- La ejecución de una respuesta que sigue a un estímulo específico
- Y que tiene como resultado
algún tipo de consecuencia
- Dos respuestas con la
misma forma pueden
tener función diferente
- Instancia de respuesta
- Clase de respuesta
- La CO se define por las
relaciones funcionales
entre clases de
respuestas y las
consecuencias
ambientales
- Clase de respuesta
- Se refiere a todas las
formas en las que la
ejecución de la respuesta
puede llevar a una
función similar
- Ej. Presión de la
palanca (
independientemente
del momento y la
topografía )
- Instancia de respuesta
- Unidad mínima de conducta
- Referida a la ocurrencia particular y específica de
una respuesta teniendo en cuenta además su
topografía
- Ej . Presión de la palanca
de la caja de
condicionamiento con la
pata delantera derecha a
las 10:50 pm
- Interacciones clásicas -
Operantes en el control
de la conducta
- Para llevar a cabo un CO es
necesario que el sujeto sea
"activo"
- Es decir: que emita algún
tipo de respuesta
- Para poder reforzar o castigar
una conducta es necesario que
esta se presente con cierta
probabilidad
- Si la probabilidad de ocurrencia
es baja (ej picotear una luz) se
puede recurrir al
automoldeamiento
- Procedimiento (ejemplo)
- 1. Mediante CC se empareja un EN (tecla iluminada) con un EI+ (comida)
- 2. Tras varios ensayos el EN pasa a ser EC y provoca la RC en solitario
- 3. Se somete a CO haciendo que solo aparezca el EI cuando se presiona la tecla
- 4. El EC se convierte en un estímulo discriminativo (Ed) que correlaciona con el
reforzador (EI) cuando se presiona la tecla (RO)
- En este caso la luz tiene doble función
- Es un Ed
- Señala la ocasión
para el refuerzo
- Es un EC
- Elicita una conducta
condicionada
clásicamente
- Habitualmente se dan
relaciones de interacción entre
CC y CO
- Aunque analicemos de forma
separada las respuestas
condicionadas clásicamente
de las operantes, la influencia
de estas contingencias tiene
lugar sobre todo el organismo
- Diferenciar ambos tipos de
aprendizaje,aunque
artificial, es necesario par la
investigación
- Se cree que a nivel
neurobiológico ambos tipos de
aprendizaje podrían estar
mediados por diferentes
mecanismos a nivel celular
- Lo que señala que el cerebro los procesa de forma diferente
- Por lo que se trataría de fenómenos distintos