Loading presentation...

Present Remotely

Send the link below via email or IM

Copy

Present to your audience

Start remote presentation

  • Invited audience members will follow you as you navigate and present
  • People invited to a presentation do not need a Prezi account
  • This link expires 10 minutes after you close the presentation
  • A maximum of 30 users can follow your presentation
  • Learn more about this feature in our knowledge base article

Do you really want to delete this prezi?

Neither you, nor the coeditors you shared it with will be able to recover it again.

DeleteCancel

Make your likes visible on Facebook?

Connect your Facebook account to Prezi and let your likes appear on your timeline.
You can change this under Settings & Account at any time.

No, thanks

Inferencia estadística

No description
by

Victor Haro

on 30 September 2013

Comments (0)

Please log in to add your comment.

Report abuse

Transcript of Inferencia estadística

Si suponemos que la distribución de la que proviene la muestra aleatoria tiene media y varianza se puede mostrar que la media muestral tiene las siguientes propiedades:
Supongamos que son una muestra aleatoria de una distribución Normal con
media desconocida y varianza también desconocida. Ahora utilizaremos el estadístico T como cantidad pivotal.
Supongamos que una señal se emite en un punto A con una intensidad . La señal emitida se mide en el punto B, y la medición sigue una distribución normal con media y una desv. estándar de 3, provocada por factores externos. Se mide 10 veces la señal recibida:

17, 21, 20, 18, 19, 22, 20, 21, 16, 19

Calcular el intervalo del 95% de confianza para .
Supongamos que son una muestra aleatoria de una distribución Normal con media desconocida y varianza conocida. Sabemos que la media muestral sigue una distribución Normal con media y varianza .

Así podemos utilizar la cantidad pivotal




que sigue una distribución Normal
estándar
Sea una muestra aleatoria de una distribución con varianza desconocida, se puede estimar la varianza poblacional como:

Si la media de la distribución es conocida


Si la media de la distribución no es conocida.

ó
Sea una muestra aleatoria de una distribución con media desconocida. La media muestral, calculada como:



Es uno de los mejores estimadores para .
Para encontrar la distribución de la varianza muestral, en el caso Normal, se debe utilizar el siguiente resultado.

Si son una muestra aleatoria de una distribución Normal con media y varianza , entonces la v.a.
Para conocer la distribución de la varianza muestral, debemos conocer la distribución Xi cuadrada.

Sean v.a. independientes con distribución Normal estándar, entonces la suma de sus cuadrados
Inferencia estadística
Distribución de estadísticos muestrales
Estimación puntual
Estimación
por intervalo

Introducción
Victor Hugo Haro
Pruebas de hipótesis
Diplomado en metodología de la investigación social
No todas las inferencias ofrecen resultados completamente verdaderos. En la mayoría de las ocasiones sólo se puede ofrecer una respuesta con cierta probabilidad.

Ejemplo. Todos los perros son animales de cuatro patas, pero no todos los animales de cuatro patas son perros.
Estadística inferencial
Algunas cuestiones previas
Supongamos que cada miembro de la población tiene un valor numérico asociado. Para hacer inferencia sobre la población, utilizando una muestra, se deben hacer algunos supuestos sobre la distribución de los datos, los parámetros y la relación que existe entre la población y la muestra.
La relación entre la población y la muestra estará determinada por el tipo de muestreo que se haya efectuado. Existen distintos tipos de muestreo, entre los que destacan:

Probabilístico y no probabilístico
Aleatorio y sistemático
Simple y multiple
Estratificada, por cuotas y por racimos o coglomerados.
Sobre la distribución de los datos
Relación entre población y muestra
Muestreo aleatorio simple
Una muestra aleatoria simple está formada por un grupo de variables aleatorias independientes e idénticamente distribuidas.
Inferencia
Es un proceso en el que se utiliza información ya conocida para aprender de lo que no conocemos.

Se obtiene una conclusión a partir de la información que ya tenemos.
Se encarga de analizar e interpretar la información obtenida de una muestra, para sacar conclusiones sobre un grupo más grande.
Población
Conjunto de elementos con alguna característica de interés en común.
Muestra
Subconjunto representativo de la población
Generalmente la distribución de la población no se conoce completamente.
Además de las propiedades teóricas de las distribuciones, se deben utilizar los datos para inferirla. Se pueden utilizar distintas herramientas como histogramas, ojivas, polígonos de frecuencia, tablas de frecuencia y métodos no paramétricos para elegir el mejor modelo de distribución para nuestros datos.
Parámetros
Como vimos en sesiones anteriores, un parámetro es una cantidad fija, conocida o desconocida, que otorga información sobre un modelo de probabilidad.

Una vez que se supone una distribución o modelo para los datos, es necesario hacer inferencia sobre los parámetros de dicho modelo. Para ello, utilizaremos estadísticos.
Nosotros utilizaremos resultados asintóticos que nos permiten prescindir, hasta cierto punto, de la distribución de los datos.
Estadístico
Un estadístico es una función que captura y resume los datos de la muestra a través de un valor numérico.
Media muestral
Sean una muestra aleatoria, es decir v.a.´s independientes e idénticamente distribuidas. La media muestral se define como:
Media muestral
Teorema del límite central (TLC)
Distribución de la media muestral vía TLC
Varianza muestral
Sean una muestra aleatoria, es decir v.a.´s independientes e idénticamente distribuidas. La varianza muestral se define como:
Distribución de la varianza muestral (caso Normal)
Continuación
Al ser una suma de v.a.´s, divididas entre una constante, la media muestral también es una v.a.
Al igual que la media muestral, la varianza muestral también es una v.a.
sigue una distribicón Xi cuadrada con n grados de libertad
Sigue una distribución Xi cuadrada con n-1 grados de libertad
Estimador
Un estimador es una función de una muestra aleatoria.



Al evaluar el estimador en la muestra, se obtiene el valor estimado, un estadístico que se utiliza para predecir el valor del parámetro poblacional.
Métodos de estimación
Existen distintos métodos para obtener estimadores puntuales. Algunos de ellos son:

Método de momentos
Máxima verosimilitud
Estimador Bayesiano
Mínima desviación absoluta
Mínimos cuadrados
Funciones de pérdida y ganancia
Propiedades y evaluación de estimadores
Los distintos tipos de estimadores pueden tener distintas propiedades. Esas propiedades nos ayudan a establecer criterios para su evaluación. Algunas de esas propiedades son:

Error cuadrático medio
Estimadores insesgados
Consistencia
Suficiencia
Estimador para la media poblacional
Supongamos que nos interesa el costo esperado por los daños provocados por un incendio en un complejo de departamentos. Para ello obtenemos una muestra con el costo de 10 incidentes.

121, 55, 63, 12, 8, 141, 42, 51, 66, 103

¿Cuanto esperaríamos que se gasté en el próximo incidente?
Estimador para la media poblacional
Propiedades de la media muestral
Es un estimador insesgado para la media poblacional.

Su varianza es directamente proporcional al tamaño de muestra.

Es el estimador máximo verosimil para la mayoría de las distribuciones.
Es el estimador de momentos.
Para el caso normal, es un estimador suficiente y es el estimador de varianza uniformemente mínima.
Estimador para la varianza poblacional
Propiedades
S² es un estimador insesgado para la varianza poblacional.

En el caso normal, es el estimador máximo verosimil.

tiene una varianza menor a la de S²

Son estimadores consistentes.
Ejemplo
Suponga que la presión sistólica de un trabajador se distribuye Normal con parámetros desconocidos. Se obtuvo la siguiente muestra de 13 trabajadores:

129, 134, 142, 114, 120, 116, 133, 142,
138, 148, 129, 133, 141

Calcule la proporción de los mineros cuya presión sobrepasa los 150.
Definición
Un estimador de intervalo para un parámetro poblacional, es un intervalo en el que se predice caerá el parámetro.

El nivel de confianza de un estimador de intervalo, es la probabilidad de que dicho intervalo contenga al parámetro real.

Un intervalo al 95% de confianza nos indica que de cada 100 muestras de las que se obtiene el intervalo, aproximadamente 95 de dichos intervalos contendrán al parámetro.
Cantidad pivotal
Una cantidad pivotal es un estadístico, o una función de un estadístico, cuya distribución incluye de alguna forma al parámetro a estimar, pero que no depende directamente de dicho parámetro. Es decir, se pueden calcular probabilidades sobre la cantidad pivotal sin conocer el valor real del parámetro.
Intervalo de confianza para la media de una Normal
Intervalo de confianza para la media de una Normal
Así, el intervalo al de confianza para la media de una Normal, con varianza conocida, es:
Ejemplo
Intervalo para la media con var. desconocida
Intervalo para la media con var. desconocida
Ejemplo
En una fabrica de productos químicos, están interesados en saber si la sobre exposición de sus empleadas a los productos de la fabrica, pueden afectar a sus hijos recién nacidos por medio de la lactancia. Para ello se tomó una muestra de 20 empleadas y se midió la concentración de uno de los químicos en la leche materna. La media muestral obtenida fue de 5.8 partes por millón, y la desv. estándar muestral fue de 5.085. Se requiere calcular un intervalo de confianza para la media al 99% de confianza.
Donde es el cuantil de una
normal estándar
Este estadístico sigue una distribución T de Student con n-1 grados de libertad.
Así, el intervalo al de confianza para la media de una Normal, con varianza desconocida, es:
Donde es el cuantil de una
T de Student con n-1 grados de libertad.
Determinar el tamaño de muestra
En algunas ocasiones nos interesa que el intervalo de confianza tenga un tamaño determinado. En este caso, se puede obtener el tamaño de muestra necesario haciendo un sencillo despeje. En este caso el tamaño de muestra necesario para que el intervalo tenga una longitud b, o menor, es:
cuando la varianza es conocida, o desconocida, respectivamente.
ó
Fisher y la dama inglesa
Definición
Una hipótesis estadística es una declaración sobre la naturaleza de la población. Generalmente, dicha hipótesis se plantea a través de la distribución o los parámetros de la misma.

Una prueba de hipótesis, a veces llamada contraste de hipótesis, es un método estadístico por medio del cual se puede juzgar, de acuerdo a una muestra, si una hipótesis es viable o no.
Ejemplo
Supongamos que una compañía tabacalera dice que descubrió una nueva forma de curar las hojas de tabaco, de tal forma que la media del contenido de nicotina en cada uno de sus cigarrillos es menor o igual a 1.5 miligramos. Un investigador se dispone a comprobar esta hipótesis.
Hipótesis nula y alternativa
La hipótesis que se quiere comprobar es llamada hipótesis nula, y se denota por Ho.

La hipótesis alternativa es otra declaración con la que se quiere contrastar la hipótesis nula.
Estadísticos de prueba y región crítica
Un estadístico de prueba es un estadístico de cuyo valor depende si se rechaza, o no, la hipótesis nula.

La región crítica, también llamada región de rechazo, es un subconjunto de posibles valores del estadístico de prueba, para los que la hipótesis nula será rechazada.
Tipos de error
Al contrastar hipótesis se pueden cometer distintos tipos de error.
Prueba para la media de una normal con var. conocida
Supongamos que tenemos una muestra aleatoria Normal, con varianza conocida, y nos interesa probar una hipótesis del siguiente tipo:
Sería intuitivo proponer una región de rechazo como esta:
De esta forma sabemos que
La hipótesis nula se rechazará si ésta parece ser inconsistente con los datos de la muestra; en otro caso no se rechazará
Cuando se establecen el estadístico de prueba, y la región de rechazo, la prueba de hipótesis queda completamente especificada
Rechazar la hipótesis nula es una conclusión bastante "fuerte", no rechazar la hipótesis nula es una conclusión más "ligera".
El método clásico para probar una hipótesis consiste en fijar el nivel de significancia de la prueba y buscar una prueba que cumpla con que ese nivel de significancia sea igual a la probabilidad de cometer el error tipo 1.
Debido a esto la única forma de comprobar una hipótesis realmente es cuando se rechaza la hipótesis nula, es decir, la hipótesis alternativa es verdadera.
Así, si estamos tratando de acreditar una hipótesis, ésta debe colocarse como la hipótesis alternativa; si queremos desacreditar una hipótesis, esta debe usarse como hipótesis nula.
De esta forma, la hipótesis nula no se rechazará si la media muestral cae en el intervalo
Pruebas de una cola
De la misma forma que se obtuvo la prueba anterior (de dos colas) se pueden obtener pruebas para hipótesis como:
p-valor
En la actualidad, los software estadísticos pueden realizar pruebas de hipótesis, pero no lo hacen a través de niveles de significancia. En su lugar utilizan el p-valor.

El p-valor es el valor de significancia más pequeño para el que los datos permiten que la hipótesis nula se rechace.
Es intuitivo pensar que la prueba dependerá de la media muestral (como estadístico de prueba) y de una región de rechazo que dependa del valor de .
Lo importante es obtener la constante c, de acuerdo al nivel de confianza de la prueba. Para esto se debe considerar la siguiente ecuación.
Podemos utilizar el hecho de que la media muestral sigue una distribución Normal.
Sigue una distribución normal estandar, y se puede utilizar este hecho para calcular la constante c.
En otro caso, se rechaza la hipótesis nula.
Ejemplo
En un observatorio se necesita calcular la velocidad a la que se mueve un meteorito cuya trayectoría podría cruzarse con la tierra. Para esto se debe medir la intensidad de la luz que refleja. Se cree que la intensidad es de 10, pero al hacer 20 mediciones se obtuvo un promedio de 11.6. Se sabe que las mediciones contienen un error con una desv. estándar de 4. Realice un contraste de hipótesis al 5% de significancia.
ó
Y también se pueden obtener pruebas para muestras con varianza desconocida.
Un p-valor muy pequeño (0.05 o menos) es un fuerte indicador de que la hipótesis nula no es verdadera.
66.2
Prom: 132.23
Desv. est: 10.49
Prom: 19.3
Desv. est: 1.88
Full transcript