Loading presentation...

Present Remotely

Send the link below via email or IM

Copy

Present to your audience

Start remote presentation

  • Invited audience members will follow you as you navigate and present
  • People invited to a presentation do not need a Prezi account
  • This link expires 10 minutes after you close the presentation
  • A maximum of 30 users can follow your presentation
  • Learn more about this feature in our knowledge base article

Do you really want to delete this prezi?

Neither you, nor the coeditors you shared it with will be able to recover it again.

DeleteCancel

Make your likes visible on Facebook?

Connect your Facebook account to Prezi and let your likes appear on your timeline.
You can change this under Settings & Account at any time.

No, thanks

Correlación (descriptiva)

Desarrollo de la clase sobre correlación lineal
by

Sergio Jurado

on 2 June 2015

Comments (0)

Please log in to add your comment.

Report abuse

Transcript of Correlación (descriptiva)

Gráfica de Dispersión
Que exista correlación no significa que exista causalidad
Si el coeficiente de correlación r es cercano a a 1 o a -1
Coeficiente de Correlación
El
coeficiente de correlación lineal r
es una medida numérica de la fuerza de la relación entre dos variables que representan datos cuantitativos.
Concepto Clave
Este capítulo presenta métodos importantes para hacer inferencias sobre una correlación entre dos variables.
Panorama General
LINEAL
CORRELACIÓN Y REGRESIÓN

Preguntas frecuentes
¿Si r=0 eso quiere decir que las variables son
independientes?
Calculo del coeficiente de correlación:
Entrenando el ojo: correlaciones negativas

Entrenando el ojo: correlaciones positivas

Una
correlación
existe entre dos variables cuando una de ellas está relacionada con la otra de alguna manera.
Definiciones
Función
¿Relación entre variables?
¿Diagrama de dispersión?
¿Correlación lineal?
¿Relación directa, inversa?
¿incorrelación?
¿Qué hemos visto?
Tenemos las alturas y los pesos de 30 individuos representados en un diagrama de dispersión.
Relación entre variables.
Parece que

el peso

aumenta

con la altura
A la derecha tenemos una posible manera de recoger los datos observando dos variables en varios individuos de una muestra.
Estudio conjunto de dos variables Variables Estadísticas
RESUELVE
Ejemplo de Correlación Lineal Simple
0
+1
-1
Propiedades de r
Es a dimensional
Sólo toma valores en [-1 ; 1 ]
Las variables son incorrelacionadas r = 0
Relación lineal perfecta entre dos variables r = +1 o r = -1
El valor de no cambia si se intercambian los lugares de X por Y .
Cuanto más cerca esté r de +1 o de -1 mejor será el grado de relación lineal.
Siempre que no existan observaciones anómalas.
Solo mide la correlación lineal.
La coeficiente de correlación lineal de Pearson (r) de dos variables, es útil para determinar si hay relación lineal entre dos variables, pero no servirá para otro tipo de relaciones (cuadrática, logarítmica,...)
Coef. de correlación lineal de Pearson
Relación:
10 kg.
10 cm.
Predicción de una variable en función de la otra
Aparentemente el peso aumenta 10Kg por cada 10 cm de altura... o sea, el peso aumenta en una unidad por cada unidad de altura.
Pesa 50 kg.
Pesa 76 kg.
Mide 161 cm.
Mide 187 cm.
Diagramas de dispersión o nube de puntos
Tenemos las alturas y los pesos de 30 individuos representados en un diagrama de dispersión.
Para los valores de X mayores que la media le corresponden valores de Y menores. Esto es relación inversa o decreciente.
Relación directa e inversa
Para los valores de X mayores le corresponden valores de Y mayores también.
Para los valores de X menores corresponden valores de Y menores también.
Esto se llama relación directa.

Relación matemática entre los elementos de dos conjuntos.
Se llama Relación P(x:y) a los pares ordenados que en el plano cartesiano dibujan puntos cumplen con la condición
y =
5x+6
3
= f(x)
En cada fila tenemos los datos de un individuo
Cada columna representa los valores que toma una variable sobre los mismos.
Las individuos no se muestran en ningún orden particular (muestra aleatoria).
Dichas observaciones pueden ser representadas en un diagrama de dispersión. En ellos, cada individuo es un punto cuyas coordenadas son los valores de las variables.
Nuestro
objetivo
será intentar
reconocer
a partir de este diagrama de dispersión si hay
relación
entre las variables, de qué tipo, y si es posible predecir el valor de una de ellas en función de la otra.
Nos interesa saber si de alguna manera los datos de una variable están relacionados con los de otra u otras variables
Para valores de X por encima de la media tenemos valores de Y por encima y por debajo en proporciones similares. Incorrelación.
En esta unidad nos referiremos a un tipo de correlación en la que la inspección de los puntos en un diagrama de dispersión nos indiquen una tendencia lineal.
o coeficiente de correlación de Pearson nos indica si
dos variables cuantitativas
tienen datos que en un diagrama de dispersión
tiene una tendencia
a acomodarse a una forma
lineal
Si Los valores de la variable "x" están relacionados con los de "y"
de alguna manera
Si existe correlación, la relación entre los datos Y y X es aleatoria, es decir por cada valor de "x" pueden existir infinitos posibles resultados en la variable "y" que cumplan con el valor de r
Existe correlación Lineal
entre los datos de "X" e "Y" en la muestra . . .
Una aerolínea desea probar si existe alguna relación entre la inversión en publicidad y la cantidad de pasajeros que transporta
Al nivel del 5% se puede decir que ¿existe una relación lineal?
N° de pasajeros (miles)
Inversión en Publicidad (US$ miles)
Observamos que existe un patrón en la gráfica de puntos que nos dice que existe correlación lineal entre los datos muestrales.
Calculamos r
Los datos se pueden trabajar manualmente usando la formula:
o con ayuda de una cacluladora
Calculadoras Casio
mode
3
1
Ingrese los datos en pares
.
.
.
Resultados
Shift
Clic hacia la derecha
hasta encontrar r
2
2
.
.
.
Resultados
Shift
mode
Ingrese los datos:
10
12
8
Conclusión:
Por tanto
Existe correlación lineal directa en la muestra, entre inversión en publicidad y numero de pasajeros captados.
Me ha salido r=1,2 ¿la relación es “súperlineal”?
En la práctica, casi siempre sí, pero no tiene
por qué ser cierto en todos los casos.
Lo contrario si es cierto: Independencia implica incorrelación.
¿Súper qué? Eso es un error de cálculo. Siempre debe tomar un valor entre -1 y +1.
En todo caso el análisis de correlación inicia con un diagrama de dispersión
¿Existe correlación?
Pesos de automóviles y rendimiento en consumo de combustible.
¿Existe algún tipo de relación entre estas dos variables?
¿Cuan fuerte es la relación entre ellas?
Relación directa perfecta
Relación inversa perfecta
Objetivos de clase:
Comprender el concepto de correlación
Desarrollar el calculo del coeficiente de Pearson
Comprender el significado del valor de "r"
¿Los ingresos y el nivel educativo tienen alguna relación entre los sujetos de nuestra ciudad?
Una mirada Descriptiva de la correlación
NO se trata de una función matemática en la que los datos se comportan de manera determinística, y los valores de la variable "Y" depende de los valores de la variable "X" exactamente
y =
5x+6
3
= f(x)
Por cada valor de "x" existe exactamente un valor de "y"
Se supone que a mayor peso, debería existir menor recorrido (Km) por cada galón de combustible
Repaso
Los puntos parecen alinearse de una forma lineal
y
x
¿Que tan fuerte es la relación entre "x" e "y"?
0.5
-0.5
A medida que el gráfico se hace lineal
El valor de r se acerca más a 1
A medida que el gráfico se hace lineal
El valor de r se acerca más a -1
Cuando es 0 o cercano a cero se dice que no existe correlación (Incorrelación)
r = 0.9684
N° de pasajeros (miles)
Inversión en Publicidad (US$ miles)
Incorrelación efectivamente
Incorrelación lineal, pero existe una correlación no lineal (curvilinea)
3
7
Obtenido de: Baron F.
http://www.bioestadistica.uma.es/baron/apuntes/tema3/index.html
Full transcript