¿Mide lo que afirma medir?
* Validez *
Es posible hacer interpretaciones:
Demostrar que el instrumento cumple con los propósitos para los cuales fue diseñado
Numerosos estudios sobre la relación entre
Generar evidencias sobre la adecuación de la medición que hace la prueba del atributo que desea medir
Inferir características conductuales a partir de las puntuaciones
Grado en que las preguntas, tareas o reactivos son representativos del universo de la conducta o rasgo para los cuales fueron diseñados.
Generar un # infinito de reactivos
Escala de 2 puntos
Método estadístico para evaluar el juicio de expertos
Extraer una muestra de reactivos potenciales
Elaboración de una prueba
Matriz de calificaciones
Comparación entre las respuestas de cada 2 expertos
Especificar un universo de respuestas relevantes
Realizar combinaciones
+ de 2 jueces
Teoría valida
Obtener coeficiente promedio
Tener conocimientos acerca del rasgo a medir
Juicio de expertos
D
Validez de contenido
=
A + B + C + D
87 / (4+5+4+87) = 0.87
Conducta esperada
Prueba
Criterio
Prueba de conducir
# de infracciones recibidas
Prueba de ventas
Cantidad de $ en bienes vendidos
Reajuste social
# de días de estancia en el área de psiquiatría
Confiables
Apropiados
Criterio
No debe incluir reactivos similares a lo de la prueba pues se obtendría una correlación artificial
rxy
=
(rxx)
(ryy)
Enfermedad física y/o psicológica
Prueba para medir el índice de eventos estresantes
rxy : Coeficiente de validez
rxx : Confiabilidad de la prueba
ryy : Correlación del criterio
"A menor confiabilidad, menor validez"
Los expertos (personas encargadas de emitir una calificación al criterio) no deben conocer las puntuaciones de la prueba
Comprobar que la prueba sea eficaz para estimar el desempeño posterior de un examinado
La puntuación es útil siempre que proporcione bases para la predicción exacta del criterio
Ayudar a la toma de decisiones
Propósito de la medición
Examen de ingreso
Promedio del primer grado
Determinar quien "aprueba o reprueba" en la tarea que sirve de criterio
Medida de resultado
Alta probabilidad
Puntuación de la prueba
Medida del criterio
Obtención de la correlación en poco tiempo
Prueba de aprovechamiento en matemáticas
Posición actual en el curso
Inventario de personalidad
Opiniones de psiquiatras
"Grado en que las puntuaciones de la prueba estiman con exactitud la posición ACTUAL de un individuo en un criterio pertinente."
Validez concurrente
Prueba nueva
Correlación
Otras pruebas existentes
2 condiciones
Las pruebas existentes han sido validadas por correlaciones con datos conductuales del mundo real.
El instrumento nuevo debe medir el mismo constructo que las pruebas que sirven de criterio.
Calificación mínima / de corte
Aciertos
Tasa de aciertos =
Aciertos + Errores
Falsos positivos / negativos
Predicciones inexactas
Buena validez predictiva
Predicción correcta
2 enfoques para generar evidencias de validez de criterio
+ 1.00
- 1.00
" A mayor coeficiente de validez, mayor predicción del criterio por parte de la prueba"
Puntuación de la prueba
Medida del criterio
Obtención de la correlación a futuro
Éxito en un trabajo
Prueba de aptitud para las relaciones sociales
"Identificar individuos con probabilidades de alcanzar el criterio en un lapso de tiempo largo"
Validez predictiva
Ecuación de regresión
y = 0.7x + 0.2
Describe la linea recta de mejor ajuste para estimar el criterio de la prueba
0
10
Baja probabilidad
"Rasgo o cualidad intangible que poseen los individuos en diferente grado"
Conducta antisocial
Falta de culpa / vergüenza
Se manifiesta a través de la conducta
Liderazgo
Hostilidad
Depresión
Inteligencia
Impulsividad
Características
Psicopatía
... + características conductuales
Es subyacente (inferencia)
Es necesario validad su existencia por medio de multitud de referentes
Teoría
Problema fundamental
Usar una teoría comprobada de la cual derivar las suposiciones acerca del constructo
Deficiencia en la capacidad de sentir activación emocional
Eje rector
Acumular evidencia de diferentes fuentes (procedimientos)
Se usa con pruebas cuyo objetivo es medir cualidades psicológicas complejas, multifaceticas y ligadas a teorías
Comprobar la consistencia interna de los reactivos en una prueba
Demostrar que las puntuaciones de una prueba cambian en la dirección y cantidad apropiada en respuesta a intervenciones.
Constructos que muestran cambios regulares acorde con la edad
Demostrar las diferencias individuales entre individuos con antecedentes y características particulares
Seleccionar reactivos que midan lo mismo
Aumento con la edad
Vocabulario
Postest
Pretest
Percepción espacial
Memoria
Puntuaciones elevadas
Individuo con un nivel alto en el rasgo
Entrenamiento
Usar el análisis estadístico (correlación)
Personas con mayor edad obtendrán mejores puntuaciones que los mas jóvenes.
Escala de interés social
Puntuación total
Cada reactivo
Cada subprueba
Puntuacion total
Cuidado y preocupación por los demás
Uso de pruebas
Exploración para identificar personas que cumplen (o no) con criterios diagnósticos.
Técnica estadística especializada
Encontrar correlaciones nulas con pruebas que deben diferir en constructos)
Encontrar correlaciones elevadas con pruebas con las que comparte una superposición de constructo.
Identificar el numero mínimo de determinantes que se requieren para explicar las intercorrelaciones entre una prueba (batería)
Interés social
Raven
Investigar dos características psicométricas
Raven
Beta
Identificación exacta de personas que presentan un trastorno
Sensibilidad
Mini - examen del estado mental (MMSE)
Establecer teóricamente una calificación de corte
Aplicar el examen a individuos con el trastorno y sin él
Obtener el % de individuos que fueron detectados con la prueba
Funcionamiento cognoscitivo
Aplicar una batería a varios individuos
r = 0.0
Identificación precisa de individuo normales
Especificidad
Puntuación de corte: 23 puntos
79% de 100 personas con demencia obtuvieron una puntuación de 23 puntos o menos
83% de 100 personas normales obtuvieron 24 puntos o mas.
A mayor sensibilidad y especificidad mayor validez.
Identificar ancianos que pueden experimentar demencia
Calcular una matriz de correlación entre todos los pares de pruebas posibles
Método
Observar los agrupamientos de pruebas que miden rasgos comunes
r = < 0.5
La correlación en la carga factorial puede ir de -1.0 a +1.0
Desempeño
Conducta