Loading presentation...

Present Remotely

Send the link below via email or IM

Copy

Present to your audience

Start remote presentation

  • Invited audience members will follow you as you navigate and present
  • People invited to a presentation do not need a Prezi account
  • This link expires 10 minutes after you close the presentation
  • A maximum of 30 users can follow your presentation
  • Learn more about this feature in our knowledge base article

Do you really want to delete this prezi?

Neither you, nor the coeditors you shared it with will be able to recover it again.

DeleteCancel

Make your likes visible on Facebook?

Connect your Facebook account to Prezi and let your likes appear on your timeline.
You can change this under Settings & Account at any time.

No, thanks

Regresión (Continuación)

Desarrollo de la clase sobre correlación lineal
by

Sergio Jurado

on 11 November 2013

Comments (0)

Please log in to add your comment.

Report abuse

Transcript of Regresión (Continuación)

Prueba Formal de Hipótesis

Prueba Formal de Hipótesis

Coeficiente de Correlación
El
coeficiente de correlación lineal r
es una medida numérica de la fuerza de la relación entre dos variables que representan datos cuantitativos.
Concepto Clave
LINEAL
CORRELACIÓN Y REGRESIÓN

Una
correlación
existe entre dos variables cuando una de ellas está relacionada con la otra de alguna manera.
Definiciones
¿Relación entre variables?
¿Diagrama de dispersión?
Correlación lineal
Relación directa, inversa e incorrelación
Grado de relación lineal entre variables
¿Qué hemos visto?
Tenemos las alturas y los pesos de 30 individuos representados en un diagrama de dispersión.
Relación entre variables.

Parece que
el peso
aumenta
con la altura
10 kg.

10 cm.
Predicción de una variable en función de la otra
Aparentemente el peso aumenta 10Kg por cada 10 cm de altura... o sea, el peso aumenta en una unidad por cada unidad de altura.

Para los valores de X mayores que la media le corresponden valores de Y menores. Esto es relación inversa o decreciente.

Relación directa e inversa
Para valores de X por encima de la media tenemos valores de Y por encima y por debajo en proporciones similares. Incorrelación.
Para los valores de X mayores le corresponden valores de Y mayores también.

Para los valores de X menores corresponden valores de Y menores también.

Esto se llama relación directa.

En esta unidad nos referiremos a un tipo de correlación en la que la inspección de los puntos en un diagrama de dispersión nos indiquen una tendencia
lineal.
o coeficiente de correlación de Pearson nos indica si
dos variables cuantitativas
tienen datos que en un diagrama de dispersión
tiene una tendencia
a acomodarse a una forma
lineal

Calcule r y luego calcule el:
Estadístico de Prueba
o
r es el valor de prueba
Valores críticos en la tabla A3
Valores críticos en la tabla A6
r
si |r| es mayor o igual al valor crítico, rechace Ho como verdadera
No existe correlación Lineal
Existe correlación Lineal
En todo caso el análisis de correlación inicia con un diagrama de dispersión
¿Existe correlación?
El análisis de regresión sirve para predecir una medida en función de otra medida (o varias).
Regresión
En el modelo de regresión lineal simple, dado dos variables
Y (dependiente)
X (independiente, explicativa, predictora).
Modelo de regresión lineal simple

Relación entre dos variables
Francis Galton primo de Darwin, Estadístico y aventurero Fundador (con otros) de la estadística moderna para explicar las teorías de Darwin.

El término regresión fue introducido por Galton en su libro “Natural inheritance” (1889) refiriéndose a la “ley de la regresión universal”:

“Cada peculiaridad en un hombre es compartida por sus descendientes, pero en media, en un grado menor.”
Regresión a la media
Su trabajo se centraba en la descripción de los rasgos físicos de los descendientes (una variable) a partir de los de sus padres (otra variable).
(Francisco Javier Baron, 2004)
¿Es posible descubrir una relación?

= f(X) + error
f(x) es una función de un tipo determinado
(Lineal ahora)
f(x) = bo + b1x
El error es aleatorio, pequeño, y no depende de X (puede despreciarse)

= bo + b1x
Y = Variable dependiente
predicha
explicada
X = Variable independiente
predictora
explicativa
El ejemplo del estudio de la altura en grupos familiares de Pearson es del tipo que desarrollaremos en el resto del tema.

= b0 + b1 X
Es decir nos interesamos en un modelo de:

Regresión Lineal Simple
Regresión:
Altura del hijo = 85cm + 0,5 altura del padre .

= 85 + 0,5 X
Si el padre mide 200cm ¿cuánto mide el hijo?

Se espera (predice) 85 + 0,5x200=185 cm.

Alto, pero no tanto como el padre. Regresa a la media.
Si existe Correlación:
1. Las variables se relacionan de alguna manera
2. Una de ellas depende de alguna forma y medida de la otra
Entonces
¿Cuál es la relación entre esta dos variables?
¿Cómo se puede lograr un pronóstico?
buscamos encontrar una función de X muy simple (lineal) que nos permita aproximar Y mediante
= b0 + b1X
b0 (ordenada en el origen, constante)
b1 (pendiente de la recta)
y e rara vez coincidirán por muy bueno que sea el modelo de regresión. A la cantidad
e= y - se le denomina residuo o error residual.
Modelo de Regresión Lineal Simple:
Dado que el modelo es = bo + b1 x
La constante bo y la pendiente b1 se pueden calcular con:
o
Modelo de regresión lineal simple
El modelo .

= b0 + b1 x
Modelo de Regresión Lineal Simple:
Pesos de automóviles y rendimiento en combustible.
¿Existe algún tipo de relación entre estas dos variables?
¿Cuan fuerte es la relación entre ellas?
Calcule el mejor rendimiento predicho en carretera (en mi/gal), para un automóvil que pesa 3000 libras.
RESUELVE
Ejemplo:
Al nivel del 5% se puede decir que existe una relación lineal
Una aerolínea desea probar si existe alguna relación entre la inversión en publicidad y la cantidad de pasajeros que transporta
Calculo del coeficiente de correlación:
Calculadoras Casio
mode
3
1
Ingrese los datos en pares
.
.
.
Resultados
Shift
Clic hacia la derecha
hasta encontrar r
2
2
.
.
.
Shift
mode
Ingrese los datos:
10
12
8
Resultados
Gráfico de dispersión
El gráfico y la prueba de Hipótesis nos confirman la
correlación lineal
que existe entre esta dos variables
Calculamos la constante y pendiente con:
Calculadoras Casio
Con los datos introducidos en el modelo lineal:
Pronóstico de pasajeros para una inversión de US$24 mil
Shift
Clic hasta encontrar r
1
=
Shift 2 (buscar r) --> 2
=
Con los datos introducidos en el modelo lineal:
Shift
1
=
=
7: Reg
Shift 1 --> 7
Modelo de regresión lineal simple
El modelo .

= b0 + b1 x
Modelo de Regresión Lineal Simple:
Calculo del coeficiente de correlación:
Calculadoras Casio
mode
3
1
Ingrese los datos en pares
.
.
.
Resultados
Shift
Clic hacia la derecha
hasta encontrar r
2
2
.
.
.
Shift
mode
Ingrese los datos:
10
12
8
Resultados
Calculamos la constante y pendiente con:
Calculadoras Casio
Con los datos introducidos en el modelo lineal:
Shift
Clic hasta encontrar r
1
=
Shift 2 (buscar r) --> 2
=
Con los datos introducidos en el modelo lineal:
Shift
1
=
=
7: Reg
Shift 1 --> 7
Pronóstico de pasajeros para una inversión de US$24 mil
Pronósticos:
¿Cuál será el N° de pasajeros si se invierte en publicidad $24 mil?
= 4.3863+1.0813x
= 4.3863+1.0813(24)
=30.3379
¿Cuál será la inversión en publicidad si se logró captar 30 mil pasajeros?
= 4.3863+1.0813x
30 = 4.3863+1.0813x
x = 23.6876
Peso y combustible
X
Y
r = -0.9439
Estadístico de prueba
t = -6.391
Valores críticos
gl =5 y alfa = 0.05
-2.571
2.571
Se rechaza Ho
Calcule la mejor cantidad predicha de combustible consumido en carretera (en mi/gal), para un automóvil que pesa 3000 libras.
= 54.69503 - 0.00797x
= 54.69503 - 0.00797(3000)
= 30.79
X
Y
Full transcript