Introducing 

Prezi AI.

Your new presentation assistant.

Refine, enhance, and tailor your content, source relevant images, and edit visuals quicker than ever before.

Loading content…
Loading…
Transcript

ANALISIS DE CORRESPONDENCIA

Analisis de correspondencia

ANALISIS DEL PROBLEMA

Es una técnica descriptiva o exploratoria cuyo objetivo es resumir una gran cantidad de datos en un

número reducido de dimensiones, con la menor pérdida de información posible.

En esta línea, su objetivo es similar al de los métodos factoriales, salvo que en el caso del análisis de

correspondencias el método se aplica sobre variables categóricas u ordinales.

Análisis de Correspondencias Simple y Múltiple

La extensión del análisis de correspondencias simples al caso de varias variables nominales (tablas de contingencia multidimensionales) se denomina Análisis de Correspondencias Múltiples, y utiliza los mismos principios generales que la técnica anterior. En general se orienta a casos en los cuales una variable representa ítems o individuos y el resto son variables cualitativas u ordinales que representan cualidades.

objetivos básicos

El Análisis de Correspondencias tiene dos objetivos básicos

Asociación entre categorías de columnas o filas: Medir la asociación de solo una fila o columna, para

ver, por ejemplo, si las modalidades de una variable pueden ser combinadas.

Asociación entre categorías de filas y columnas: Estudiar si existe relación entre categorías de las filas

y columnas.

El análisis de correspondencias solo requiere que los datos representen las respuestas a una serie de

preguntas y que estén organizadas en categorías. Dependiendo si existen dos o más variables el

análisis será simple o múltiple.

Planteamiento

PLANTEAMIENTO DEL PROBLEMA

El Análisis de Correspondencias es una técnica estadística que se utiliza para analizar, desde un

punto de vista gráfico, las relaciones de dependencia e independencia de un conjunto de variables

categóricas a partir de los datos de una tabla de contingencia.

analisis

1.-

Se comienza analizando el problema bidimensional que es el que analiza el Análisis de

Correspondencias propiamente dicho. Posteriormente se trata, brevemente, del problema

n‐dimensional (n≥3) que es el problema que analiza el Análisis de Correspondencias Múltiples.

Sea X e Y dos variables categóricas, respectivamente, con valores {x1, ...,xk} e {y1, ... ,ym}. Se observan

dichas variables en N elementos de una población. La intersección entre una fila y una columna da

lugar a una celda o casilla, cuya frecuencia observada es nij

Perfiles marginales

Los PERFILES MARGINALES describen la distribución marginal de las variables X e Y, respectivamente,

se reflejan en las siguientes tablas:

2.-

Perfiles condicionales

SOCIAL IMPACT

Los PERFILES CONDICIONALES describen las distribuciones condicionadas asociadas a la Tabla de Correspondencias.

Los perfiles fila describen las distribuciones condicionadas de la variable Y por las distintas modalidades de la variable X. Se obtienen a partir de la Tabla de Correspondencias y el perfil marginal de X mediante las siguientes expresiones:

Dependencia e independencia

DEPENDENCIA E INDEPENDENCIA EN TABLAS DE CORRESPONDENCIAS

La existencia o no de algún tipo de relación entre las variables X e Y se analiza mediante contrastes

de hipótesis sobre la independencia de dichas variables. El test de hipótesis habitualmente utilizado

es el de la Chi-cuadrado de Pearson.

Se contrasta la hipótesis nula que presupone la independencia entre ambas variables, mediante el

estadístico X2

1.-

2.-

ANALISIS DE RESIDUOS

Cuanto mayor sea el valor de los residuos mayor es la probabilidad de que una determinada

combinación de valores de las variables, esto es, una casilla, sea significativa.

Para que el análisis de los residuos resulte adecuado es necesario que previamente éstos hayan sido

ajustados y estandarizados, para lo cual se suele aplicar la fórmula propuesta por Haberman (1978),

que consiste en dividir el valor del residuo en cada casilla por su error típico.

ANALISIS E INTERPRETACION

Con los perfiles de filas y columnas descritos se elabora la matriz de coordenadas (distancias) utilizando la distancia chi-cuadrado, que permitirá calibrar la magnitud de las diferencias entre la tabla de datos analizada y una tabla de datos sin relación entre las variables.

Análisis de Correspondencias Santiago de la Fuente Fernández El método consiste en encontrar la descomposición en valores singulares de la matriz

ANÁLISIS DE CORRESPONDENCIAS CLASICO

INTERPRETACION BARICENTRICA

INTERPRETACION BARICENTRICA

Las coordenadas de los puntos fila (columna) son medias ponderadas de las coordenadas de los puntos columna (fila) salvo un factor dado por los valores singulares, es decir, los puntos fila (columna) son, salvo un factor de dilatación (1/μj), el baricentro de los puntos columna (fila)

INTERPRETACIÓN RESULTADOS

INTERPRETACIÓN RESULTADOS

  • La interpretación de los resultados estadísticos es un elemento crucial para la comprensión de los avances en las ciencias médicas. Las herramientas que nos ofrece la estadística nos permiten transformar la incertidumbre y aparente caos de la naturaleza en parámetros medibles y aplicables a nuestra práctica clínica.

LOGICA

LÓGICA DEL ANÁLISIS DE CORRESPONDENCIAS

  • Partiendo de esta concepción se trata de mostrar la lógica del análisis de correspondencias utilizando un ejemplo de una supuesta investigación comercial.
  • Un fabricante de producto de limpieza desea conocer las características más importantes de cada uno de sus productos, para ello realiza una encuesta entre sus clientes. La tabla adjunta muestra las frecuencias de asociación de cada producto con las características analizadas.

MEDIDA

MEDIDA

. La media de las distancias al cuadrado de cada punto de fila al centro de gravedad se conoce como inercia de filas, o inercia de columnas cuando se trata de las columnas, e inercia total de la nube de puntos cuando se consideran todos los elementos de la tabla. Una inercia baja significa que todos los puntos están situados muy cerca del centro de gravedad y que por tanto son muy similares; mientras que altos valores de la inercia en determinadas categorías implican grandes diferencias del perfil medio de las filas o las columnas

PROCESO

PROCESO INTERPRETACIÓN DEL GRÁFICO:

1. Localización de las modalidades con mayores contribuciones absolutas, diferenciando mediante el signo de las coordenadas las que se sitúan en el lado positivo y en el lado negativo del factor.

2. Análisis de la calidad de representación (contribución relativa) del resto de modalidades. Cuando una modalidad tiene una baja contribución relativa

3. Búsqueda de aquellas modalidades que, aunque no contribuyen a la formación del factor, se encuentran bien representadas.

4. . Considerando todos estos elementos se procede con la denominación de cada factor, analizando por separado la variable fila y columna

5. Se procede al análisis gráfico con el fin de detectar similitudes entre las modalidades de fila (o columna).

6. Interpretación conjunta de ambas variables

7. Proyección de modalidades ilustrativas o suplementarias

TITLE

MEDIDAS DE DISTANCIA

distancia

Distancia chi-cuadrado

1. Distancia chi-cuadrado: Las modalidades se ponderan en función de la masa de las filas o columnas. Utilizada para el análisis de correspondencias estándar.

distancia

2. Distancia euclídea: Raíz cuadrada de la suma cuadrática de las diferencias entre pares de filas y entre pares de columnas. Joaristi y Lizasoain desaconsejan la utilización de esta diferencia porque considera a todos los elementos con el mismo peso, llegando a desvirtuar el análisis de correspondencias.

Distancia euclidea

Metodo

Metodo de estanderizacion

3. Método de estandarización: Cuando se realiza la distancia chi-.cuadrado el programa centra las filas y las columnas al presentar únicamente la opción Se eliminan las medias de filas y columnas. Con la distancia euclídea se activan todas las opciones disponibles.

Metodo

Metodo de normalizacion

4. Método de normalización: La normalización se utiliza para distribuir la inercia de la tabla por filas y/o columnas, de modo que el método elegido únicamente afectará a las puntuaciones y a las varianzas de las filas y columnas. El resto de los resultados no cambian (autovalores, inercia explicada por cada factor y el porcentaje de inercia explicada). El SPSS contempla cinco métodos de distribución de inercia

Simetrico

• Simétrico (canónico): En cada dimensión las puntuaciones de fila son el promedio ponderado de las puntuaciones de columna divididas por el autovalor correspondiente, mientras que las puntuaciones de columna son el promedio ponderado de las puntuaciones de fila divididas por el autovalor. Se aconseja utilizar este método cuando se desean examinar las diferencias (o similitudes) entre las dos variables. Es el método elegido para nuestro ejemplo

Principal por fila

• Principal por fila: Las puntuaciones de la fila son la media ponderada de la puntuación de las columnas, maximizando así las distancias entre las categorías de la variable fila. Método aconsejable cuando el objetivo es analizar las diferencias entre las categorías de la variable situada en las filas.

Principal por fila

Principal por columna

• Principal por columna: Cuando el objetivo es analizar las diferencias o similitudes entre las categorías de la variable columna se utiliza este método, que considera las puntuaciones de las columnas como la media ponderada de la puntuación de las filas, llegando así a maximizar las distancias entre las columnas.

Principal

• Principal: Las distancias obtenidas con este método representan la distancia existente entre cada fila (o columna) a la distancia promedio del perfil fila (o columnas). Este método se utiliza cuando se desean examinar las diferencias entre las categorías de la variable fila y las diferencias entre las categorías de la variable columna, pero no las diferencias entre variables. Con este método no es posible representar el Diagrama de dispersión biespacial (submenú Estadísticos).

Personalizado

• Personalizado: Introduciendo un valor entre –1 y 1 en la ventana situada a la derecha de esta opción. El valor –1 realiza un análisis principal por columna, el 1 un análisis principal por fila, y el 0 un análisis simétrico. Dentro de estos limites, el valor elegido dispersará la inercia sobre las puntuaciones de fila o columna en grados diversos. Una de las ventajas de este método es que permite crear diagramas de dispersión biespaciales a medida.

Learn more about creating dynamic, engaging presentations with Prezi