Loading presentation...

Present Remotely

Send the link below via email or IM

Copy

Present to your audience

Start remote presentation

  • Invited audience members will follow you as you navigate and present
  • People invited to a presentation do not need a Prezi account
  • This link expires 10 minutes after you close the presentation
  • A maximum of 30 users can follow your presentation
  • Learn more about this feature in our knowledge base article

Do you really want to delete this prezi?

Neither you, nor the coeditors you shared it with will be able to recover it again.

DeleteCancel

Make your likes visible on Facebook?

Connect your Facebook account to Prezi and let your likes appear on your timeline.
You can change this under Settings & Account at any time.

No, thanks

Estadistica

No description
by

jose jaime saenz tabares

on 17 May 2011

Comments (0)

Please log in to add your comment.

Report abuse

Transcript of Estadistica

Regresión Lineal Simple Presentado por:
Giovanna Peñaranda Rosales
José Sáenz Tabares
Jeimmy Valero Martínez Anova para la regresion lineal ANALISIS DE VARIANZA PARA LA REGRESION LINEAL En un análisis de regresión la respuesta y se relaciona con la variable independiente x. De aquí que la variación total en la variable de respuesta y, dada por: SSE Suma de cuadrados debido al error (SSE): determina el cuadrado de los errores entre el dato y la estimación con la línea de regresión. SST Suma total de cuadrados: suma de los cuadrados de los errores entre la observación dependiente y el promedio de la variable dependiente. SSR Suma de cuadrados para la regresión (SSR): mide la cantidad de variación explicada al usar la recta de regresión con una variable independiente x. De modo que: Para construir la ANOVA, se debe tener en cuenta el cuadrado medio para el error: Análisis de varianza para la regresión lineal Ahora, construye la ANOVA del ejercicio de puntuaciones de la prueba de aprovechamiento de matemáticas. Los cálculos serían los siguientes De tal forma que la ANOVA quedaría de la siguiente manera: PRUEBA DE LA UTILIDAD DEL MODELO DE REGRESIÓN LINEAL Para saber si hay una relación lineal entre x y y se puede realizar una prueba de hipótesis o un intervalo de confianza para ß. El estimador b tienen una distribución normal en el muestreo repetido con media: E(b) = ß El error estándar esta dado por: Donde σ2 es la varianza del error aleatorio £. Puesto que σ2 se estima con s2 = MSE. Estadístico de Prueba: Este estadístico tiene una distribución t con gl = (n-2), los grados de libertad relacionados con MSE. Prueba de Hipótesis Relativa a la pendiente de una recta Intervalo de Confianza de (1-α)100% para ß Prueba F del Análisis de Varianza El estadístico F esta dado por: F = MSR/MSE = 19.14 Con 1 grado de libertad en el numerador y (n-2) = 8 grados de libertad en el denominador. Resulta de que el cuadrado de un estadístico t con gl grados de libertad tiene la misma distribución que un estadístico F con un grado de libertad en el numerador y gl grados de libertad en el denominador. Coeficiente de Determinación R2 se interpreta como la reducción porcentual en la variación total en el experimento obtenida al usar la recta de regresión. SSR/SStotal = 1450/2056 = 0.705 o 70.5% Para los datos de las calificaciones de cálculo, una reducción de r2 = 705 es sustancial. El modelo de regresión funciona muy bien!. ESTIMACIÓN Y PREDICCIÓN MEDIANTE LA RECTA AJUSTADA La recta tiene dos propósitos: Estimar el valor promedio de y para un valor dado de x. Predecir un valor particular de y para un valor dado de x. ESTIMACIÓN DE LA RECTA DE REGRESIÓN La recta de regresión estimada es obtenida por el método de los mínimos cuadrados y está dada por: El valor estimado de Y cundo X = X0, es un estimador insesgado de la recta de medias, α + β x0, y que ŷ está distribuido normalmente con el error estandar de ŷ estimado por Ejemplo:
Para estimar la calificación promedio en calculo de alumnos cuya puntuación de aprovechamiento es 50, con un intervalo de confianza de 95 %. Solución: La estimación puntual de E(y|X0 = 50), la calificación promedio de calculo para alumnos cuya puntuación de aprovechamiento es 50, es Ŷ = 40.78424 + 0.76556(50) = 79.06 El error estándar de ŷ es = 2840 Y el intervalo de confianza de 95% es 79.06 + - 2.306 (2.840)
79.06 +- 6.55 Los resultados indican que la calificacion promedio de calculo para alumnos cuya puntuacion es 50 en la prueba de aprovechamiento quedará entre 72.51 y 85.61. Predicciones a Partir de la Recta Mediante la ecuación de regresión podemos predecir o pronosticar valores de la variable Y. Una vez estimado y validado el modelo, una de sus aplicaciones más importantes consiste en poder realizar predicciones acerca del valor que tomaría la variable dependiente en el futuro o para una unidad extramuestral. ANALISIS DE CORRELACION Es la medida de la fuerza de la relación lineal de dos variables: El coeficiente de correlación tienen las siguientes propiedades: Cuando r =0, la pendiente es 0, y no hay relación lineal entre x y y. Cuando r es positivo, también lo es b, y hay una relación lineal positiva entre x y y. Si no hay variación aleatoria y todo los puntos caen en la recta de regresión entonces SSE = 0 y r² = 1 Si los puntos están dispersados de manera aleatoria y no hay variación explicada por la regresión entonces SSR = 0 y r² = 0. Modelo de Regresión Lineal Simple El objetivo es crear una ecuación de predicción que expresa a y como función de estas variables independientes. Se usa la ecuación de una línea recta para describir la relación entre x y y, y que describimos la consistencia de la relación por medio del coeficiente de correlación r. Un modelo probabilístico simple Se empieza por suponer que la variable de interés, y, se relaciona linealmente con una variable independiente x. Para describir la relación lineal, se puede usar el modelo determinista: y = α +ßx Donde α es la ordenada al origen y – el valor de y cuando x=0 ß es la pendiente de la recta, definida como el cambio en y para un cambio unitario en x. Una manera simple de modificar el modelo determinista es agregar un componente de error aleatorio para explicar las desviaciones de los puntos con respecto a la recta. Una respuesta particular y se describe por medio del modelo probabilístico. Permite establecer la relación que existe entre dos variables. Supuestos respecto al error aleatorio Suponga que los valores de E satisfacen estas condiciones: Son independientes en el sentido probabilístico Tienen una media de 0 y una varianza común de σ2 Poseen una distribución de probabilidad normal Estas estimaciones se usan para formar la recta del mejor ajuste para un conjunto dado de datos denominada recta de mínimos cuadrados. Método de mínimos cuadrados La suma de desviaciones cuadradas se llama suma de cuadrados del error (SSE) y se define como: Ejemplo: Puntuaciones de la prueba de aprovechamiento en matemáticas y calificaciones finales de cálculo para estudiantes universitarios de primer año
Full transcript