Loading presentation...

Present Remotely

Send the link below via email or IM

Copy

Present to your audience

Start remote presentation

  • Invited audience members will follow you as you navigate and present
  • People invited to a presentation do not need a Prezi account
  • This link expires 10 minutes after you close the presentation
  • A maximum of 30 users can follow your presentation
  • Learn more about this feature in our knowledge base article

Do you really want to delete this prezi?

Neither you, nor the coeditors you shared it with will be able to recover it again.

DeleteCancel

Pruebas de hipótesis

No description
by

Estefania Arredondo

on 21 May 2017

Comments (0)

Please log in to add your comment.

Report abuse

Transcript of Pruebas de hipótesis

Comparación de medias de K Muestras
Pruebas de hipótesis
Eligiendo una prueba estadística
Prueba de hipótesis: Eligiendo una prueba estadística
Prueba de hipótesis.
Conceptos:
Riesgos en la toma de decisiones al utilizar la metodología de prueba de hipótesis.
Test exacto de Fisher
Es una prueba de significación estadística utilizada en el análisis de tablas de contingencia.
Análisis de Varianza (ANOVA)
La ANOVA es un método de prueba de hipótesis en la que comprueba que la media de tres o más poblaciones son iguales.
Prueba estadística utilizada para determinar si existe suficiente evidencia en una muestra de datos para deducir que cierta condición es válida para toda la población.
Técnica para analizar diferencias y tomar decisiones evaluando los riesgos implicados al tomar tales decisiones.

Lleva el nombre de su inventor, Ronald Fisher, y es una de una clase de pruebas exactas , llamadas así porque el significado de la desviación de la hipótesis nula se puede calcular con exactitud, en lugar de basarse en una aproximación que se hace exactamente en el límite el tamaño de la muestra crece hasta el infinito, como con muchos otros análisis estadísticos.

Se pueden presentar dos tipos diferentes de error cuando se aplica la metodología de prueba de hipótesis:
Error del tipo I: Se presenta si la hipótesis nula H0, es rechazada cuando, de hecho, es verdadera y debía ser aceptada.
Error del tipo II: Se presenta si la hipótesis nula H0, es aceptada cuando, de hecho, es falsa y debía ser rechazada.

Pasos de la prueba de hipótesis
1.- Establezca la hipótesis nula, (H0)
2.- Establezca la hipótesis alternativa, (H1)
3.- Seleccione el nivel de significación, ( )
4.- Seleccione el tamaño de la muestra, (n)
5.- Determine la técnica estadística apropiada y la correspondiente estadística de prueba que va a utilizar.
6.- Establezca los valores críticos que separan la región de rechazo de la de no rechazo.
7.- Recolecte los datos y calcule el valor de muestra de la estadística de prueba apropiada.
8.- Determine si la estadística de prueba cae en la región de rechazo o en la de no rechazo.
9.- Tome la decisión estadística.
10.- Exprese la decisión estadística en términos del problema.


Coeficiente de confianza, (1-α):
Es la probabilidad de que la hipótesis nula, no sea rechazada cuando, de hecho, es verdadera y debería ser aceptada.
La probabilidad de cometer un error de tipo II, se le conoce como nivel del consumidor.
Potencia de una prueba, (1-β):
Es la probabilidad de rechazar la hipótesis nula cuando, de hecho, es falsa y debería ser rechazada.
Riesgo de la toma de decisiones: Un delicado equilibrio
Controlar probabilidad de cometer Error de Tipo II: Para un nivel α dado, aumentar el tamaño de la muestra, disminuirá β y, por consiguiente aumentara la potencia de la prueba para detectar si la hipótesis es falsa.
Controlar riesgos de cometer Error Tipo I: Reducir a un nivel más bajo de α, aumentara β, de modo que disminuirá los riesgos de cometer este error.
“La opción es tener valores razonables α y β dependiendo de los costos inherentes a cada tipo de error.”
El análisis unidireccional tradicional de la varianza basado en la relación F Tiene al menos tres limitaciones importantes:
1.- Su nivel de significación depende en gran medida del supuesto de normalidad.
2. La relación F es óptima para las pérdidas que son proporcionales al cuadrado del error y es sub óptima en caso contrario.
3. La relación F es una estadística que ofrece una potencia total contra muchas alternativas pero ninguna ventaja particular contra ninguna de ellas.
PRUEBA DE PERMUTACION
Una prueba de permutación basada en las observaciones originales sólo es apropiada si se puede asumir que bajo la hipótesis nula las observaciones están distribuidas de forma idéntica en cada una de las poblaciones de las que se extraen las muestras. Si no podemos hacer esta suposición, tendremos que transformar las observaciones, arrojando parte de la información sobre ellas para que las distribuciones de las observaciones transformadas sean idénticas.
HIPÓTESIS NULA
Se prefiere una prueba de permutación para el análisis de k-muestras. Estas pruebas están libres de distribución (aunque las varianzas deben ser las mismas para todos los tratamientos).
Y puede elegir la estadística de prueba que es óptima para una función de pérdida y pérdida dada y no estar limitada por la disponibilidad de tablas.

Tablas de contingencia
Una tabla de contingencia es una tabla que cuenta las observaciones por múltiples variables categóricas. Las filas y columnas de las tablas corresponden a estas variables categóricas.

Por ejemplo, después de una elección reciente entre dos candidatos, una encuesta de salida registró el sexo y el voto de 100 electores seleccionados de manera aleatoria y los datos se tabularon de la siguiente manera:
Observaciones

Totales marginales
Las tablas de contingencia también pueden revelar asociaciones entre las dos variables. Utilice una prueba de chi-cuadrado o una prueba exacta de Fisher para determinar si los conteos observados difieren significativamente de los conteos esperados bajo la hipótesis nula de que no existe asociación.
Por ejemplo, usted podría probar si existe una asociación entre sexo y voto.
Una fuente importante de error en el análisis de las tablas de contingencia es asociar la estadística chi-cuadrado de Pearson, una medida bastante útil de la diferencia entre los valores observados y esperados, con la distribución del chi cuadrado.
Los errores principales en la práctica consisten en no informar de todo lo siguiente:
• Si usamos una prueba de una cola o dos colas y por qué.
• Si las categorías están ordenadas o no.
• Qué estadística se empleó y por qué.
Este método no analiza las medias, analiza la varianzas muéstrales
Este tipo de método estadístico se utiliza con la distribución F como estadístico de prueba
La distribución F prueba si dos varianzas son iguales o no

El análisis de varianza será útil en situaciones tales como la comparación del kilometraje logrado por cinco clases diferentes de gasolina; la prueba de cuál de cuatro métodos de capacitación produce el aprendizaje más rápido; o en la comparación de los ingresos del primer año de los graduados de una media docena de escuelas de administración. En cada caso, se pueden comparar las medias de más de dos muestras.
ANOVA de un solo Factor
Es el Primer tipo de análisis de varianza o diseño completamente aleatorio
La ANOVA de una entrada examina solo una variable, propiedad o característica para determinar si esta propiedad o característica es igual.
Requisitos necesarios para realizar el análisis de varianza de un factor:
• Todas las poblaciones involucradas son normales
• Todas las poblaciones tienen la misma varianza
• Las muestras deben ser aleatorias simples
• Las muestras deben ser independientes
• Las muestras provienen de poblaciones que están categorizadas de una sola forma

La hipótesis que se prueba en este método es:
• Hipótesis nula prueba que las medias poblacionales son iguales, esto es:
H0: μ1 = μ2 = μ3

• Hipótesis alterna dice que al menos una de las poblaciones es diferente a las otras
Ha: No todas las medias poblacionales son iguales


Si el valor p es menor que el nivel de significancia, entonces usted concluye que al menos una media de durabilidad es diferente.
Si p es mayor p al nivel de significancia entonces no se rechaza la hipótesis nula de medias iguales
El estadístico de prueba a utilizar es la distribución F donde vamos a relacionar la varianza entre las muestras y la varianza dentro de las muestras
En resumen los tres pasos del análisis de varianza son:

1. Determinar una estimación de la varianza de la población a partir de la varianza entre las medias de las muestras.
2. Determinar una segunda estimación de la varianza de la población a partir de la varianza dentro de las muestras.
3. Comparar estas dos estimaciones. Si su valor es aproximadamente igual, se acepta la hipótesis nula
Diseños balanceado y no balanceado en los modelos ANOVA
En ANOVA y DOE, un diseño balanceado tiene un número de observaciones que es igual para todas las combinaciones posibles de los niveles de los factores. Un diseño no balanceado tiene un número desigual de observaciones.
Diseño balanceado
Usted tiene exactamente una observación para todas las combinaciones posibles de los niveles de los factores para los factores A, B y C: (0, 0, 0); (0, 0, 1); (0, 1, 0); (0, 1, 1); (1, 0, 0); (1, 0, 1); (1, 1, 0); y (1, 1, 1).
C1 C2 C3
A B C
0 0 0
0 0 1
0 1 0
0 1 1
1 0 0
1 0 1
1 1 0
1 1 1

Diseño no balanceado
En este caso, faltaría la combinación de niveles de factor (1, 0, 0) y usted tiene dos observaciones de la combinación (0, 1, 0). Cualquiera de estas condiciones, por sí solas, hacen que el diseño sea no balanceado.
C1 C2 C3
A B C
0 0 0
0 1 0
0 1 0
0 0 1
0 1 1
1 1 0
1 0 1
1 1 1

Ejercicio de Prueba de hipótesis.
1. Un gerente de producción está preocupado por evaluar si el proceso está funcionando o no, de manera que se quiere asegurar que se esté depositando la cantidad adecuada de cereal en cada caja.
Decide seleccionar una muestra aleatoria de 25 cajas y examinar su peso para determinar que tanto se acerca cada caja a la especificación de la compañía. (368 grs.)

Ϭ
=15 grs. n=25 µx=368 grs. ̅x=372.5
Por lo cual se tomara una decisión basada en la información de la muestra y llegara a una de las siguientes conclusiones:
El contenido promedio en las cajas de cereal es de 368 grs. No es necesario realizar acciones correctivas.
El contenido promedio no es de 368 grs, es menor a esta cantidad o es mayor. Se necesitan acciones correctivas.
1.Establecer la hipótesis nula.
Hipótesis Nula:
H0: µ=368
µ=Parámetro de población.
2.Establecer la hipótesis alterna:
Hipótesis Alternativa:
H1: µ ≠368
3.Seleccione el nivel de significación, α:
Se especifica de acuerdo a la importancia relativa (costos) de los riesgos de cometer errores del tipo I y II. (Justo con el tamaño de la muestra determina el valor β). Se escoge:
α=0.05
 4.Seleccione el tamaño de la muestra, n.
El tamaño de la muestra se determina después de tomar en cuenta los riesgos especificados de cometer un error del tipo I o uno del tipo II y considerar las restricciones de presupuesto para efectuar el estudio. En este caso:
Se seleccionaron al azar 25 cajas de cereal.
 5.Determine la técnica estadística apropiada y la correspondiente estadística de prueba que va a utilizar.
Puesto que Ϭ (desviación estándar de la población) se conoce, es decir está especificado por la compañía en 15 grs. Se eligió:
Prueba Z.

6.Establezca los valores críticos que separan la región de rechazo de la de no rechazo.

 En este caso se utilizaron los valores +1.96 y -1.96 para definir tales regiones, ya que la estadística de prueba Z se refiere a la distribución estándar.

 7.Recolecte los datos y calcule el valor de muestra de la estadística de prueba apropiada.

Se reúne los datos y se calcula el valor de la estadística de prueba.


Aquí es ̅x=372.5 gramos de modo que Z=+1.5
𝑍=( ̅x− µx)/(Ϭ /√n)
𝑍=( 372.5− 368)/(15/√25)
Z=+1.5
8.Determine si la estadística de prueba cae en la región de rechazo o en la de no rechazo.

El valor calculado de la estadística de prueba se comprobara con los valores críticos de la distribución de muestreo apropiada para determinar si el primero cae en la región de rechazo o no.

 En este caso, Z=+1.5 se encuentra en la región de no rechazo ya que:
-1.96 < Z=+1.5 < +1.96
9.Tome la decisión estadística.

Si la estadística cae en la región de no rechazo, no se puede rechazar la hipótesis nula.
Si la estadística de prueba cae en la región de rechazo, entonces se rechaza la teoría nula. En este caso, H0 no es rechazada.

10.Exprese la decisión estadística en términos del problema.

Se llegó a la conclusión de que no había evidencia de que la cantidad promedio del contenido de cereal es diferente de 368 grs.
¿QUÉ SON LAS MÚLTIPLES PRUEBAS?
Las múltiples pruebas permiten evaluar la significancia estadística de las diferencias que existen entre medias utilizando un conjunto de intervalos de confianza.
La selección del método de comparación múltiple apropiado depende de la inferencia que desee.
Las características y ventajas de cada método se resumen en la tabla siguiente:
El método de Bonferroni
Método para controlar el nivel de confianza simultáneo para un conjunto completo de intervalos de confianza. El método de Bonferroni ajusta el nivel de confianza de cada intervalo individual, de modo que el nivel de confianza simultáneo resultante sea igual al valor que especifique.
El método de Tukey para comparaciones múltiples
El método de Tukey se utiliza en ANOVA para crear intervalos de confianza para todas las diferencias en parejas entre las medias de los niveles de los factores mientras controla la tasa de error por familia que especifique.

Para contrapesar esta mayor tasa de error, el método de Tukey ajusta el nivel de confianza de cada intervalo individual, de modo que el nivel de confianza simultáneo resultante sea igual al valor que especifique.
El método de Dunnett para comparaciones múltiples.
El método de Dunnett se utiliza en ANOVA para crear intervalos de confianza para las diferencias entre la media de cada nivel de los factores y la media de un grupo de control.

El método de Dunnett determina los intervalos de confianza para cada comparación individual, según el caso.
Comparaciones múltiples con (MCB) de Hsu?
El método MCB de Hsu es un método de comparaciones múltiples diseñado para identificar los mejores niveles de los factores, los que son insignificativamente diferentes del mejor y los que son significativamente diferentes del mejor.
El método MCB de Hsu crea un intervalo de confianza para la diferencia entre cada media de nivel y la mejor de las restantes medias de los niveles.
El valor p ajustado en las comparaciones
múltiples
El valor p ajustado, que se utiliza para las comparaciones múltiples en el ANOVA de modelo lineal general, indica cuáles comparaciones entre los niveles de los factores dentro de una familia de comparaciones (pruebas de hipótesis) son significativamente diferentes.

Si el valor p ajustado es menor que el nivel de significancia, usted rechaza la hipótesis nula.



Es importante considerar la tasa de error por familia al realizar comparaciones múltiples, porque las probabilidades de cometer un error de tipo I para una serie de comparaciones son mayores que el nivel de significancia para cualquier comparación individual.
EQUIPO
“AZUL”
LILIANA RAMIREZ RODRIGUEZ
ADRIANA CALLEJA RODRIGUEZ
IVONNE ELIZABETH SERRANO ROLDAN
CARLOS MAYA MONROY
DAVID ARREDONDO RANGEL
22 DE MAYO 2017

Conceptos – Medidas de Tendencia Central
Conceptos
Conceptos – Medidas de Dispersión
¿Por qué se le llaman Medidas de Dispersión?
Porque miden el grado de distanciamiento de un conjunto de valores
El Rango es el intervalo entre el valor máximo y el valor mínimo de un conjunto de datos.
Conceptos – Medidas de Dispersión
La Varianza es la medida de variabilidad que indica que tan homogéneo es un grupo de observaciones

La varianza es la medida de mayor utilidad en todos los análisis estadísticos, sin ser propiamente de utilidad directa
Conceptos – Medidas de Dispersión
La Desviación Estándar es una medida del grado de dispersión de los datos con respecto al valor promedio. Dicho de otra manera, la desviación estándar es simplemente el "promedio" con respecto a la media. Por Ejemplo: Dos poblaciones (0, 0, 14, 14) y (6, 6, 8, 8) cada una tiene una media de 7. Sus desviaciones estándar poblacionales son 8 y 1, respectivamente. La segunda población tiene una desviación mucho menor que la primera porque sus valores están más cerca de 7

Conceptos – Medidas de Dispersión
El Coeficiente de Variación describe la cantidad de variabilidad en relación con la media. No se basa en unidades, por lo que se puede utilizar en lugar de la desviación estándar para comparar la dispersión de los conjuntos de datos que tienen diferentes unidades (dólares con días) o diferentes medias.
Conceptos – Medidas de Forma
El Sesgo de una distribución también llamada Simetría hace referencia al grado en que valores de la variable, son equidistantes a un valor que se considere centro de la distribución
La Curtosis es una medida que sirve para analizar el grado de concentración que presentan los valores de una variable analizada alrededor de la zona central de la distribución
Otros Conceptos
La Distribución de probabilidad es la lista de todos los resultados de un conjunto de variables aleatorias. Es una función que asigna a cada suceso definido sobre la variable aleatoria la probabilidad de que dicho suceso ocurra.
El Intervalo de Confianza es el rango de valores que se construye a partir de los datos de la muestra de modo que el parámetro ocurre dentro de dicho rango con una probabilidad específica. Dicha probabilidad especifica es el Nivel de Confianza.

Otros Conceptos
El Estadístico de Prueba es un valor estandarizado que se calcula a partir de los datos de la muestra durante una prueba de hipótesis. Se utiliza para determinar si es posible rechazar la hipótesis nula o no a partir del cálculo del Valor P.
El Valor P es la probabilidad de que la hipótesis nula sea cierta.
La regla de aplicación es:
Si el valor p es menor que o igual a α, rechazar Ho
Si el valor p es mayor que el nivel de significancia (α), no se puede rechazar Ho

En las diferentes pruebas de hipótesis se utilizan diferentes estadísticos de prueba según el modelo de probabilidad asumido en la hipótesis nula. Las pruebas más comunes y sus respectivos estadísticos de prueba incluyen:
Tipos de Pruebas
Se hace una división entre las pruebas estadísticas, ya que unas pertenecen a las pruebas paramétricas y otras a las no paramétricas.

Las pruebas paramétricas son aquellas que están sujetas a parámetros. Un parámetro es una variable que se comporta de una manera más o menos estable (Normalidad) y que se convierte en un punto de referencia para valorar y tomar decisiones en materia de evaluación.
Las pruebas no-paramétricas comprenden las pruebas estadísticas cuya ley de probabilidad que sigue la población de la que ha sido extraída la muestra difiere de la normal. Por ello es común visualizarlas como de libre distribución.
Nivel de significación α:
Probabilidad de cometer un error del tipo I, nivel de riesgo α que estaría dispuesto a permitir, en términos de rechazar la hipótesis nula cuando es verdadera.
Prueba de hipótesis respecto a la igualdad de dos varianzas poblacionales.
Varianza:
Mide qué tan dispersos están los datos alrededor de su media. La varianza es igual a la desviación estándar al cuadrado.

Otros Conceptos
Valor Crítico
En las pruebas de hipótesis, un valor crítico es un punto en la distribución de la prueba que se compara con el estadístico de prueba (z, t, etc.) para determinar si puede rechazarse la hipótesis nula.
Si el valor absoluto del estadístico de prueba es mayor que el valor crítico, usted puede declarar significancia estadística y rechazar la hipótesis nula.
Los valores críticos están asociados con el nivel de significancia (α), así que sus valores se fijan cuando se elige el α de la prueba.
La forma más común para determinar si se rechaza o no H0 es comparando el valor p con un valor pre-especificado de α, donde α es la probabilidad de rechazar H0 cuando H0 es verdadera
Los
valores críticos
los podemos encontrar en tablas que ya tienen realizados los cálculos de éstos mismos

¿Qué es una prueba de chi-cuadrado?
Tipos de
prueba de chi-cuadrado

DISTRIBUCION UNIFORME

Comparando medias de dos poblaciones
Para este tipo de análisis, se pueden realizar diversas comparaciones como por ejemplo:
Las calificaciones promedio del examen de admisión para la Facultad de Medicina para estudiantes cuya especialización fuera bioquímica, y para aquellos cuya especialización fuera biología
Las producciones promedio en una planta química que usa materias primas suministradas por dos proveedores diferentes
El promedio de diámetros de tallos de plantas crecidas con dos tipos diferentes de nutrientes.
Para cada uno de estos ejemplo, se pueden calcular:

Comparando medias de dos poblaciones
Cuando muestras aleatorias independientes de n1 y n2 observaciones han sido seleccionadas de entre poblaciones con medias µ1 y µ2 y varianzas al cuadrado σ1 y σ2, respectivamente, la distribución muestral de la diferencia
(X1 - X2) tiene las siguientes propiedades:

1.-La media de ( X1 - X2) es (µ1 - µ2)

2.-Si las poblaciones están
distribuidas normalmente
, entonces la
distribución muestral de (X1 - X2) está distribuida normalmente
exactamente, cualquiera que sea el tamaño muestral

3.-Si las poblaciones no están distribuidas normalmente, entonces la
distribución muestral de (X1 - X2) está distribuida normalmente

aproximadamente
cuando n1 y n2 son > a 30, debido al teorema del
límite central.

Cuando la muestra es > a 30, se utiliza el estadístico de prueba Z
Cuando la muestra es < a 30 , se utiliza el estadístico de prueba t

Comparando medias de dos poblaciones
Se encuentran alternativas para la distribución No-normal como la prueba de permutación que puede obtener un resultado más preciso que la prueba t.
La prueba de permutación
nos permite confirmar que los centros de las distribuciones son los mismos
lo que hace que su nivel de confiabilidad sea mayor para muestras de libre distribución.
Ejemplo de Prueba de Hipótesis comparando medias de dos poblaciones:
La calidad de pintura latex depende, entre otras cosas, del tamaño de la partícula. Para medir esta característica se utilizan dos centrifugadoras, y se sospecha que éstas reportan mediciones distintas para la misma pintura. Entonces, se decide hacer un estudio que permita comparar las medias y las varianzas reportadas por los dos equipos; para ello, de un mismo lote de pintura se tomaron 13 lecturas con cada centrifugadora. Se obtuvieron los siguientes datos:
Hipótesis:
Full transcript