Condicionamiento instrumental, Programas de reforzamiento y
conducta de elección
La conducta que ocurre, porque antes fue decisiva para producir ciertas
consecuencias, se denomina conducta instrumental.
Thorndike
Inftencion original fue la inteligencia
animal, realizaba experimentos en los que
metia al animal en una caja y dejaba la
comida afuera, los animales debian
aprender como salir de la caja para
obtener el alimento.
Ley del efecto, propone que las
recompensas motivan el aprendizaje,
es decir: si una respuesta (R)
ejecutada en presencia de un
estímulo (E) va seguida de una
consecuencia satisfactoria
(Reforzador positivo), la asociación
entre la E-R se fortalecerá. Por el
contrario, si la R va seguida de una
consecuencia no deseada (Reforzador
negativo), la asociación E-R no se
fortalecerá, sino que se debilitará.
Procedimientos de ensayo discreto
W. S. Small (1899,
1900) a comienzos
del siglo xx. Small
estaba interesado en
el estudio de las
ratas y creo
laberintos para
estudiar su
conducta, uno tenia
forma de T para
estudiar su conducta
de eleccion y otro era
simplemente
alargado con forma
de l.
Procedimientos de operante libre
Skinner propone que los
animales adquieren
conductas en función de
las consecuencias. Es
decir, que dependiendo
de las consecuencias
(positivas o negativas) de
cada acción, estas serán
repetidas en un futuro o
no. Por ejemplo, Skinner
demuestra que una rata
aprende a darle a una
palanca cuando dicha
acción tiene la
consecuencia de obtener
alimento.
Procedimientos del
condicionamiento instrumental
Reforzamiento
positivo
Castigo
Reforzamiento
negativo
Entrenamiento
de omisión
Elementos fundamentales
Respuesta
Variabilidad
Pertinencia
Limitaciones
Consecuencia o reforzador
Cantidad y naturaleza
Cambios
Contraste
Relación entre la
respuesta y la
consecuencia
Relación temporal
Tiempo que transcurre
entre respuesta y reforzador
Relación Causal
La respuesta
instrumental es
necesaria y suficiente
para ocurrencia del
reforzador
Programas de reforzamiento y conducta son una pauta o una regla que determina cuando y
cómo se va a entregar un reforzador tras realizar una respuesta determinada.
Programas simples de Reforzamiento
Programas de razon
El reforzamiento solo
depende del número de
respuestas realiadas por
el organismo
Programa de razón fija
Consiste en la administración de
una recompensa tras un número
determinado de respuestas.
Programa de intervalo fijo
Consiste en que la respuesta es
recompensada después de haber
transcurrido un determinado intervalo fijo
de tiempo
Programas de reforzamiento continuo
Los organismos suelen responder a una
tarea estable y moderada en la que solo ocurren
pausas breves e impredecibles
Programa de razón variable
Consiste en que la recompensa está
determinada por el número de
respuestas emitidas. Pero este
número de respuestas emitidas
puede variar de un momento a otro
Programa de intervalo variable
Consiste en que la respuesta es
reforzada después de haber
transcurrido un cierto periodo de
tiempo. Este período de tiempo es
variable, por lo que puede variar
de un momento a otro
Programas de intervalo y disponivilidad limitada
Es la restricción en el tiempo que permanece
asequible un reforzador.
Reforzamiento de los TER
La primera explicación de las tasas
más altas de respuesta que se
observan en los programas de razón
se enfoca en el espacio o intervalo
entre una respuesta y la siguiente. Ese
intervalo se conoce como el tiempo
entre respuestas (TER).
Funciones de retroalimentación
Programa concurrente que
permite la medición continua
de la elección.
Ley de igualación
Afirma que la tasa
relativa de respuestas en
una alternativa es igual a
la tasa relativa de
reforzamiento para esa
alternativa.