Loading presentation...

Present Remotely

Send the link below via email or IM

Copy

Present to your audience

Start remote presentation

  • Invited audience members will follow you as you navigate and present
  • People invited to a presentation do not need a Prezi account
  • This link expires 10 minutes after you close the presentation
  • A maximum of 30 users can follow your presentation
  • Learn more about this feature in our knowledge base article

Do you really want to delete this prezi?

Neither you, nor the coeditors you shared it with will be able to recover it again.

DeleteCancel

PROGRAMAS DE REFORAZMIENTO Y CONDUCTA DE ELECCIÓN

No description
by

on 26 September 2016

Comments (0)

Please log in to add your comment.

Report abuse

Transcript of PROGRAMAS DE REFORAZMIENTO Y CONDUCTA DE ELECCIÓN

PROGRAMAS SIMPLES DE REFORZAMIENTO INTERMITENTE
II. Programas de intervalo
Programa de intervalo fijo
* Factores necesarios para que se presente un reforzador:
La entrega del reforzador depende de:

a)
Que suceda cierto número de respuestas.
b)
Tiempo transcurrido.
c)
Presencia de ciertos estimulos.
d)
Ocurrencia de otras respuestas.

CONCLUSIONES
¿Qué tipo de programa de reforzamiento esta presente?
PPFJKDSF.KSDFKSD
Hay un número infinito de formas en que podría establecerse este programa:
Relación entre respuesta y reforzador
¿Qué es un programa de reforzamiento?
Es la regla o criterio
que determina que
ocurrencia de una
respuesta sera seguida
por la entrega del reforzador.
PROGRAMAS DE REFORZAMIENTO Y CONDUCTA DE ELECCIÓN
Camila Cárdenas y María Paula Medina
Grupo: 403 - Picología
Aprendizaje III:
Universidad de Cundinamarca

... Para tener en cuenta ...
*
Los programas de reforzamiento tienen una meta conductual
y para su obtención requiere que se ajuste dicho programa para producir resultado esperado.

*
Los programas de reforzamiento predominan
en la forma en que se da la respuesta instrumental y la manera en que es mantenida.
I. Programa
de razón
Programa
de razón fija (RF)
Reforzamiento continuo (RFC)
Es un programa de reforzamiento en que debe ocurrir un número fijo de respuestas para que la siguiente respuesta sea reforzada.
Reforzamiento continuo
, también es un programa de RF, los organismos suelen responder a una tasa estable en la que pueden ocurrir pausas moderadas.
Patrón típico delos programas de razón fija
Una vez que se inicia la conducta, la tasa de respuesta es fija y estable, pero puede haber una pausa antes de iniciar el numero requerido de respuestas.
Registro acumulativo
Forma de representar la manera en que la respuesta se repite a lo largo del tiempo.
Primera
respuesta
No responde
<----Dirección del papel
<----- Direccion de la pluma
Pausa
Entrega
reforzamiento
Reanuda
respuesta
Mayor
respuesta
Respuesta
lenta
Tambor
Elementos tasa de respuesta:

Pausa
posreforzamiento
Tasa cero de respuestas que ocurre después de cada reforzamiento.
Carrera de la razón
Tasa elevada y estable de respuestas que completa cada requisito de razón.
Tensión de la razón
Interrupción de la respuesta que ocurre cuando se incrementa demasiado rápido el requisito de respuesta de RF la respuesta.
Programa de razón variable (RV)
Programa en que el número de respuestas necesario para producir reforzamiento varia de un ensayo a otro
El valor del programa
es el número promedio de respuestas que se necesitan para obtener el reforzamiento
Festón de intervalo fijo:
Patrón de respuestas respuestas que se desarrolla en los programas de IF.
Es el aumento gradual en la tasa respuesta que ocurre entre reforzamientos sucesivos.
Cada 4´
Programa de intervalo variable (IV)
Las respuestas solo se refuerzan
si ocurren después de que han
transcurrido un lapso variable
desde en el inicio del ensayo.
El tiempo es impredescible
, pero si en un procedimiento el intervalo promedio que transcurre antes de los reforzadores sucesivos es de unos 2 minutos, el programa sera -->
IV 2 min.
Programas de intervalo y disponibilidad limitada
La disponibilidad limitada
, es la restricción en el tiempo que permanece asequible un reforzador.
Hay programas donde los reforzadores están disponibles solo por periodos limitados.
Ejm: Cafetería
de colegio
III. Comparación de los programas de razón y de intervalo
Reforzamiento de los TER
Tiempo entre respuestas:
Funciones de retroalimentación
Relación entre las tasas de respuestas y las tasas de reforzamiento calculadas para una sesión experimental completa o un periodo prolongado
Reforzamiento es la consecuencia de la respuesta.
Programas de razón
Programas de intervalo
Único requisito para dar refuerzo es dar cierto
numero de respuestas.
Se establece un
número de reforzadores

que puede obtener un sujeto.
10 picoteos
para
reforzador
10 dulces por rta hecha
CONDUCTA DE ELECCIÓN: PROGRAMAS CONCURRENTES
A
B
¿?
Los organismos realizan diversas actividades y continuamente
eligen
entre alternativas posibles
* ¿Que factores controlan las elecciones de un individuo?
Investigaciones experimentales simples:
Alternativas de respuestas seguida por reforzador.
Programa concurrente:
Permiten la medición continua de la elección, pues el organismo pude cambiar las alternativas de respuesta en cualquier momento.
I. Medidas de la
conducta de elección
La elección de un individuo en un programa concurrente se refleja en la distribución de su conducta entre las dos alternativas de respuestas.
¿En este caso
como se pueden
medir la conducta?
Tasa relativa de respuestas,
en da alternativa.
Tasa relativa de reforzamiento,
en cada alternativa.
C

(C + C )
D
r
I
(r + r )
I
D
II. La ley de igualación
CI

C
D
=
r
1
(r + r )
I
D
=
r
I
r
D
Subigualación
Subigualación, sobreigualación
y sesgo de respuesta
Menor sensibilidad a la tasa relativa de reforzamiento de lo que predice la ley de igualación.
C1 / C = p(r /r )
D
1
D
s
s
--> Sensibilidad de la conducta.
r
--> Reforzador
C
--> Conducta.
p
--> Sesgo o preferencia de la respuesta.

La ley de igualación y los programas simples de reforzamiento
=
Cx

(Cx + Co)
r
x
(r + r )
x
o
CI

(CI + C )
D
=
(Cx + Co)
r
x
(r + r )
x
o
Cx
=
Kr
x
(r + r )
x
o
Cx
III. Mecanismos de la ley de igualación
Maximización molecular
Maximización molar
Mejoramiento
Igualación y maximización de las tasas de reforzamiento
Supone que los organismos distribuyen sus respuestas entre varias alternativas, para que se maximice la cantidad de reforzamiento que obtienen a largo plazo.
*Características de la teoría molar:
--> Se orienta en conglomerado de conducta emitida en el curso de algun periodo.

--> Explica el porque los animales responden de manera exclusiva en el componente de razon que requiera menos respuestas.
--> Predice los resultados de los procedimientos de elección.
--> En un programa RV-IV los sujetos se concentrarian en las alternativas de RV y responden de manera ocasional a las de IV.
Este se refiere a la meta mas modesta (inocente) de lograr que la situación mejore.
Opera entre los mecanismos moleculares y molares.

Es hacer que algo sea mejor que el pasado reciente
y no es elegir la mejor alternativa en ese momento
* Tasa local de respuesta y razón total:
Se calculan solo para el periodo que el sujeto dedica a una alternativa de elección particular.
=
TLR
t
A
A
fR
A
Ejm: Si la situacion implica dos opciones (A y B)
La tasa local de una respuesta es mayor que su tasa total
R a A =
75 veces/20 min
(tecla A)

TTRA =
75 respuestas/hr
(resto del tiempo respondio en tecla B)

TLRA -->
225/hr (75 cada 20 min).
ELECCIÓN COMPLEJA
1. Programas
encadenados concurrentes
Programa de reforzamiento encadenado-concurrente
Etapas o eslabones
Eslabón de elección
Eslabón terminal
2. Estudios sobre el "autocontrol"
Prueba de la conducta de elección en dos condiciones diferentes:
A) Procedimiento de elección directa
B) Procedimiento encadenado concurrente
Reducción del valor y explicaciones del autocontrol
V = M/(1+KD)
Funciones de descuento del valor e impulsividad en la conducta humana
K
Rapidez con que disminuye el valor de la recompensa en función de la demora
Función de descuento de la recompensa
mide una característica de la conducta pertinente para el autocontrol.

* Entre mas pronunciada sea la función, mas dificil es mostrar autocontrol y se manifiesta impulsividad.
Experimento:
Dependientes de heroína,
valor de la función mayor
y mostraron un
descuento rápido del valor de la recompensa.
¿Puede enseñarse el autocontrol?
Autocontrol
Componente crucial de la socialización y el ajuste emocional.
* Una persona que
no tolera el tiempo de espera
para obtener recompensa, tiene que
renunciar
a la obtención de esos
reforzadores
.
Experimento:
Medir autocontrol en niños de primaria
¿Quieren recibir 2 centavos de inmediato o 3 centavos al final del día?
Tareas de poco esfuerzo el
entrenamiento con recompensa demorada
aumento la
preferencia por recompenza mayor y demorada.
Autocontrol generalizado
DF
Principio básico del condicionamiento instrumental

Reforzamiento (castigo ) la probabilidad futura de una respuesta instrumental.
*Organismo puede tener acceso a mas de un programa de reforzamiento al mismo tiempo.
Reforzamiento puede depender de cuantas respuestas hayan ocurrido, del tiempo, o de ambas.

*Patrón de la conducta instrumental y las elecciones de respuesta, están determinadas por el programa de reforzamiento que este en función.
Condiciona a la gente para que no espere nada y tendrás a todos excitados con la misma cosa que les ofrezcas (Pávlov).
El reforzamiento sólo depende del número de respuestas realizadas por el organismo.
A diferencia del programa de razón fija en los programas de intervalo las respuestas únicamente se refuerzan si ocurren después de que ha trascurrido cierto tiempo.
Una respuesta se refuerza únicamente si ocurre luego de que ha transcurrido una cantidad establecida de tiempo después de un punto de referencia,
l
a última entrega del reforzador o el inicio del ensayo.
Los programas de intervalo fijo se encuentran en situaciones donde se necesita una cantidad fija de tiempo para preparar el reforzador.
Ejemplos:

1.
Recibir un salario cada dos semanas.
2.
Trabajar con una editorial y recibir una comisión cada cinco ventas.
3.
Realizar una fiesta de integración cada año.
Se enfoca en el espacio o intervalo entre una respuesta y la siguiente.
¿Cómo determinan los programas de razón y de intervalo el reforzamiento de los tiempos entre respuestas?
Con un programa de razón

no existen restricciones temporales y entre más rápido complete el participante la razón requerida, más pronto recibirá el reforzador. En consecuencia, un programa de razón favorece que no se espere demasiado entre respuestas y apoya tiempos entre respuestas cortos.

En contraste con los
programas de intervalo,
no les resulta provechosos los TER cortos; de hecho, estos programas favorecen el TER largo.
Los programas de intervalo refuerzan diferencialmente TER largos y de este modo producen tasas de respuestas más bajas que los programas de razón.
En una formulación,
la tasa de respuestas o de conducta (C)
y la
tasa de reforzamiento (r)
en una alternativa se expresan como una proporción de las tasas totales de respuestas y de reforzamiento.
La tasa de una respuesta particular no depende únicamente de la tasa de reforzamiento de esa respuesta.
La ley de igualación se plantea en términos de tasas de respuesta y de reforzamiento promediadas a lo largo de toda la sesión experimental, pero ignora cuándo se realizan respuestas individuales. Algunas teorías de la igualación son similares en el hecho de que ignoran lo que podría ocurrir a nivel de las respuestas individuales.
La ley de igualación se plantea en términos de tasas de respuesta y de reforzamiento promediadas a lo largo de toda la sesión experimental, pero ignora cuándo se realizan respuestas individuales. Algunas teorías de la igualación son similares en el hecho de que ignoran lo que podría ocurrir a nivel de las respuestas individuales.
La ley de igualación se plantea en términos de tasas de respuesta y de reforzamiento promediadas a lo largo de toda la sesión experimental, pero ignora cuándo se realizan respuestas individuales. Algunas teorías de la igualación son similares en el hecho de que ignoran lo que podría ocurrir a nivel de las respuestas individuales.
Teorías molares y moleculares:
Tienen que ver con la
distribución total de respuestas y de reforzadores en las situaciones de elección.

(Teorías molares).

Los organismos distribuyen sus actividades entre las alternativas de respuesta de modo que puedan recibir la mayor cantidad posible de reforzamiento en la situación.
Los organismos siempre eligen la alternativa de respuesta que tenga mayor probabilidad de ser reforzada en el momento.
Tanto en los programas de razón fija como en los de intervalo fijo hay una pausa posreforzamiento después de cada entrega del reforzador. Además, tanto RF como IF producen tasas altas de respuesta justo antes de la entrega del siguiente reforzador
En un programa estándar de
reforzamiento concurrente
se dispone al mismo tiempo de dos (o más) alternativas de respuesta, pudiéndose cambiar, en cualquier momento, de una a la otra.
El autocontrol frecuentemente es una cuestión para elegir una recompensa grande demorada sobre otra inmediata y pequeña.
Modalidad de programa de razón, en la que una sola respuesta provoca la entrega del reforzador.
Así, por ejemplo si el numero que se emite es 1, cada respuesta instrumental resulta en la entrega del reforzador.
Reforzamiento parcial o intermitente
Situaciones en las que la respuesta solo es reforzada algunas veces.

Ejemplo:
Abrir la llave correcta permite tener agua caliente, pero siempre y cuando el calentador este funcionando bien.
Si el sujeto es reforzado por una respuesta que ocurre poco después de la precedente
, entonces se refuerza un TER corto que se hace más probables en el futuro.

Si el sujeto es reforzado por una respuesta que termina un TER largo,
entonces se refuerza un TER largo y este tipo de TER se hace más probable en el futuro.
Incluso las situaciones de respuesta única pueden involucrar una elección entre involucrar la
respuesta especifica

(picotear)
u
ocuparse de otras actividades

(caminar).
1. Maximización molecular
2. Maximización molar
3. Mejoramiento
En contraste, otras explicaciones de la relación de igualación se concentran en lo que sucede a nivel de las
respuestas individuales y consideran que la relación de igualación es el resultado neto de esas elecciones individuales.
A esas explicaciones se les denomina
teorías moleculares.
Programa complejo de reforzamiento en que se permite que
el primer eslabón el participante elija cual de varios programas simples de reforzamiento estara en efecto del segundo eslabón.
Una vez que se ha hecho la elección las alternativas rechazadas dejaran de estar disponibles hasta el siguiente ensayo.
Se permite al sujeto elegir entre dos programas alternativos realizando una de dos respuestas.
Una vez que el sujeto ha elegido uno de los eslabones, ira al eslabón terminal, formado por 2 programas de reforzamiento dependiendo la primera elección.
No existe eslabón de elección , se accede directamente a la recompensa.
Componentes terminales demorados después de que el sujeto realiza la elección.
-------->
El valor de un reforzador se reduce según el tiempo que tenga que esperarse para recibirlo.
La función matemática que describe esta disminución en el valor se conoce como función de descuento del valor.


El valor de un reforzador
(V)
se relaciona directamente con la magnitud de la recompensa
(M)
e inversamente con la demora de la recompensa
(D)
de acuerdo con la siguiente fórmula:
=
TTR
t
T
A
fR
A
I
I
Full transcript