Introducing
Your new presentation assistant.
Refine, enhance, and tailor your content, source relevant images, and edit visuals quicker than ever before.
Trending searches
Es una técnica descriptiva o exploratoria cuyo objetivo es resumir una gran cantidad de datos en un
número reducido de dimensiones, con la menor pérdida de información posible.
En esta línea, su objetivo es similar al de los métodos factoriales, salvo que en el caso del análisis de
correspondencias el método se aplica sobre variables categóricas u ordinales.
La extensión del análisis de correspondencias simples al caso de varias variables nominales (tablas de contingencia multidimensionales) se denomina Análisis de Correspondencias Múltiples, y utiliza los mismos principios generales que la técnica anterior. En general se orienta a casos en los cuales una variable representa ítems o individuos y el resto son variables cualitativas u ordinales que representan cualidades.
Asociación entre categorías de columnas o filas: Medir la asociación de solo una fila o columna, para
ver, por ejemplo, si las modalidades de una variable pueden ser combinadas.
Asociación entre categorías de filas y columnas: Estudiar si existe relación entre categorías de las filas
y columnas.
El análisis de correspondencias solo requiere que los datos representen las respuestas a una serie de
preguntas y que estén organizadas en categorías. Dependiendo si existen dos o más variables el
análisis será simple o múltiple.
El Análisis de Correspondencias es una técnica estadística que se utiliza para analizar, desde un
punto de vista gráfico, las relaciones de dependencia e independencia de un conjunto de variables
categóricas a partir de los datos de una tabla de contingencia.
Se comienza analizando el problema bidimensional que es el que analiza el Análisis de
Correspondencias propiamente dicho. Posteriormente se trata, brevemente, del problema
n‐dimensional (n≥3) que es el problema que analiza el Análisis de Correspondencias Múltiples.
Sea X e Y dos variables categóricas, respectivamente, con valores {x1, ...,xk} e {y1, ... ,ym}. Se observan
dichas variables en N elementos de una población. La intersección entre una fila y una columna da
lugar a una celda o casilla, cuya frecuencia observada es nij
Los PERFILES MARGINALES describen la distribución marginal de las variables X e Y, respectivamente,
se reflejan en las siguientes tablas:
Los PERFILES CONDICIONALES describen las distribuciones condicionadas asociadas a la Tabla de Correspondencias.
Los perfiles fila describen las distribuciones condicionadas de la variable Y por las distintas modalidades de la variable X. Se obtienen a partir de la Tabla de Correspondencias y el perfil marginal de X mediante las siguientes expresiones:
La existencia o no de algún tipo de relación entre las variables X e Y se analiza mediante contrastes
de hipótesis sobre la independencia de dichas variables. El test de hipótesis habitualmente utilizado
es el de la Chi-cuadrado de Pearson.
Se contrasta la hipótesis nula que presupone la independencia entre ambas variables, mediante el
estadístico X2
Cuanto mayor sea el valor de los residuos mayor es la probabilidad de que una determinada
combinación de valores de las variables, esto es, una casilla, sea significativa.
Para que el análisis de los residuos resulte adecuado es necesario que previamente éstos hayan sido
ajustados y estandarizados, para lo cual se suele aplicar la fórmula propuesta por Haberman (1978),
que consiste en dividir el valor del residuo en cada casilla por su error típico.
Con los perfiles de filas y columnas descritos se elabora la matriz de coordenadas (distancias) utilizando la distancia chi-cuadrado, que permitirá calibrar la magnitud de las diferencias entre la tabla de datos analizada y una tabla de datos sin relación entre las variables.
Análisis de Correspondencias Santiago de la Fuente Fernández El método consiste en encontrar la descomposición en valores singulares de la matriz
Las coordenadas de los puntos fila (columna) son medias ponderadas de las coordenadas de los puntos columna (fila) salvo un factor dado por los valores singulares, es decir, los puntos fila (columna) son, salvo un factor de dilatación (1/μj), el baricentro de los puntos columna (fila)
. La media de las distancias al cuadrado de cada punto de fila al centro de gravedad se conoce como inercia de filas, o inercia de columnas cuando se trata de las columnas, e inercia total de la nube de puntos cuando se consideran todos los elementos de la tabla. Una inercia baja significa que todos los puntos están situados muy cerca del centro de gravedad y que por tanto son muy similares; mientras que altos valores de la inercia en determinadas categorías implican grandes diferencias del perfil medio de las filas o las columnas
1. Localización de las modalidades con mayores contribuciones absolutas, diferenciando mediante el signo de las coordenadas las que se sitúan en el lado positivo y en el lado negativo del factor.
2. Análisis de la calidad de representación (contribución relativa) del resto de modalidades. Cuando una modalidad tiene una baja contribución relativa
3. Búsqueda de aquellas modalidades que, aunque no contribuyen a la formación del factor, se encuentran bien representadas.
4. . Considerando todos estos elementos se procede con la denominación de cada factor, analizando por separado la variable fila y columna
5. Se procede al análisis gráfico con el fin de detectar similitudes entre las modalidades de fila (o columna).
6. Interpretación conjunta de ambas variables
7. Proyección de modalidades ilustrativas o suplementarias
1. Distancia chi-cuadrado: Las modalidades se ponderan en función de la masa de las filas o columnas. Utilizada para el análisis de correspondencias estándar.
2. Distancia euclídea: Raíz cuadrada de la suma cuadrática de las diferencias entre pares de filas y entre pares de columnas. Joaristi y Lizasoain desaconsejan la utilización de esta diferencia porque considera a todos los elementos con el mismo peso, llegando a desvirtuar el análisis de correspondencias.
3. Método de estandarización: Cuando se realiza la distancia chi-.cuadrado el programa centra las filas y las columnas al presentar únicamente la opción Se eliminan las medias de filas y columnas. Con la distancia euclídea se activan todas las opciones disponibles.
4. Método de normalización: La normalización se utiliza para distribuir la inercia de la tabla por filas y/o columnas, de modo que el método elegido únicamente afectará a las puntuaciones y a las varianzas de las filas y columnas. El resto de los resultados no cambian (autovalores, inercia explicada por cada factor y el porcentaje de inercia explicada). El SPSS contempla cinco métodos de distribución de inercia
• Simétrico (canónico): En cada dimensión las puntuaciones de fila son el promedio ponderado de las puntuaciones de columna divididas por el autovalor correspondiente, mientras que las puntuaciones de columna son el promedio ponderado de las puntuaciones de fila divididas por el autovalor. Se aconseja utilizar este método cuando se desean examinar las diferencias (o similitudes) entre las dos variables. Es el método elegido para nuestro ejemplo
• Principal por fila: Las puntuaciones de la fila son la media ponderada de la puntuación de las columnas, maximizando así las distancias entre las categorías de la variable fila. Método aconsejable cuando el objetivo es analizar las diferencias entre las categorías de la variable situada en las filas.
• Principal por columna: Cuando el objetivo es analizar las diferencias o similitudes entre las categorías de la variable columna se utiliza este método, que considera las puntuaciones de las columnas como la media ponderada de la puntuación de las filas, llegando así a maximizar las distancias entre las columnas.
• Principal: Las distancias obtenidas con este método representan la distancia existente entre cada fila (o columna) a la distancia promedio del perfil fila (o columnas). Este método se utiliza cuando se desean examinar las diferencias entre las categorías de la variable fila y las diferencias entre las categorías de la variable columna, pero no las diferencias entre variables. Con este método no es posible representar el Diagrama de dispersión biespacial (submenú Estadísticos).
• Personalizado: Introduciendo un valor entre –1 y 1 en la ventana situada a la derecha de esta opción. El valor –1 realiza un análisis principal por columna, el 1 un análisis principal por fila, y el 0 un análisis simétrico. Dentro de estos limites, el valor elegido dispersará la inercia sobre las puntuaciones de fila o columna en grados diversos. Una de las ventajas de este método es que permite crear diagramas de dispersión biespaciales a medida.