Loading presentation...

Present Remotely

Send the link below via email or IM

Copy

Present to your audience

Start remote presentation

  • Invited audience members will follow you as you navigate and present
  • People invited to a presentation do not need a Prezi account
  • This link expires 10 minutes after you close the presentation
  • A maximum of 30 users can follow your presentation
  • Learn more about this feature in our knowledge base article

Do you really want to delete this prezi?

Neither you, nor the coeditors you shared it with will be able to recover it again.

DeleteCancel

Make your likes visible on Facebook?

Connect your Facebook account to Prezi and let your likes appear on your timeline.
You can change this under Settings & Account at any time.

No, thanks

Estadistica Inferencial

Población, Muestreo, Docima de Hipotesis, Intervalos de Confianza
by

Antonio Avendaño

on 2 April 2013

Comments (0)

Please log in to add your comment.

Report abuse

Transcript of Estadistica Inferencial

ESTADÍSTICA INFERENCIAL

Nace por:

1.- No disponer de un listado completo de los individuos. (Estrategia)

2.- No poder estudiar a todos los individuos de una población debido al alto costo. (Economía)

3.- No disponer de la información en forma rápida Ej: en un sondeo preelectoral. (Temporal)

4.- Cuando las observaciones pueden ocasionar alteración o daño en los elementos Ej: control de calidad. (intrínsecos al estudio) Parte de los conceptos de la teoría del muestreo han sido discutidos con anterioridad. Aquí los repasaremos y ampliaremos.

La población ideal que se pretende estudiar se denomina población objetivo.

No es fácil estudiarla por completo. Aproximamos mediante muestras que den idealmente la misma probabilidad a cada individuo de ser elegido.
Tampoco es fácil elegir muestras de la población objetivo:
Si llamamos por teléfono excluimos a los que no tienen.
Si elegimos indiv. en la calle, olvidamos los que están trabajando...

El grupo que en realidad podemos estudiar (v.g. los que tienen teléfono) se denomina población de estudio. Fuentes de sesgo

Las poblaciones objetivo y de estudio pueden diferir en cuanto a las variables que estudiamos.
Existen fuentes de error/sesgo ERROR

Es toda determinación que no representa el valor real del objeto medido.

Existen 2 tipos de errores:

Error Aleatorio: recibe el nombre de imprecisión o dispersión y, supone que los valores encontrados tienen la misma probabilidad de ser superiores o inferiores al valor real.

Error Sistémico: o llamado sesgo, es aquel que siempre proporciona valores desviados en el mismo sentido. (mas o menos) REPRESENTATIVIDAD DE LA MUESTRA

La representatividad óptima de una muestra supone la capacidad de esta para proporcionar estimaciones iguales a los valores que los parámetros a estudiar toman en la población.

ALEATORIEDAD

Probabilidad distinta 0. Técnicas de muestreo

Cuando elegimos individuo de una población de estudio para formar muestras podemos encontrarnos en las siguientes situaciones:

Muestreos probabilistas
Conocemos la probabilidad de que un individuo sea elegido para la muestra.
Interesantes para usar estadística matemática con ellos.

Muestreos no probabilistas
No se conoce la probabilidad.
Son muestreos que seguramente esconden sesgos.
En principio no se pueden extrapolar los resultados a la población. Vamos a tratar exclusivamente con muestreos con la menor posibilidad de sesgo (probabilistas): aleatorio simple, sistemático, estratificado y por grupos. Muestreo aleatorio simple

Se eligen individuos de la población de estudio, de manera que todos tienen la misma probabilidad de aparecer, hasta alcanzar el tamaño muestral deseado.

Se puede realizar partiendo de listas de individuos de la población, y eligiendo individuos aleatoriamente con un ordenador.

Normalmente tiene un coste bastante alto su aplicación.

En general, las técnicas de inferencia estadística suponen que la muestra ha sido elegida usando muestreo aleatorio simple, aunque en realidad se use alguna de las que veremos a continuación. Cada elemento de la población tiene igual OPORTUNIDAD de ser seleccionado. EJ: EURO-SIDA Muestreo aleatorio sistemático

Se tiene una lista de los individuos de la población de estudio. Si queremos una muestra de un tamaño dado, elegimos individuos igualmente espaciados de la lista, donde el primero ha sido elegido al azar.

CUIDADO: Si en la lista existen periodicidades, obtendremos una muestra sesgada.

Un caso real: Se eligió una de cada cinco casas para un estudio de salud pública en una ciudad donde las casas se distribuyen en manzanas de cinco casas. Salieron con mucha frecuencia las de las esquinas, que reciben más sol, están mejor ventiladas,… Ej: Grupos Ejercito Muestreo aleatorio estratificado

Se aplica cuando sabemos que hay ciertos factores (variables, subpoblaciones o estratos) que pueden influir en el estudio y queremos asegurarnos de tener cierta cantidad mínima de individuos de cada tipo: Hombres y mujeres, Jovenes, adultos y ancianos…
Se realiza entonces una muestreo aleatorio simple de los individuos de cada uno de los estratos.
Al extrapolar los resultados a la población hay que tener en cuenta el tamaño relativo del estrato con respecto al total de la población. Muestreo por conglomerados

Se aplica cuando es difícil tener una lista de todos los individuos que forman parte de la población de estudio, pero sin embargo sabemos que se encuentran agrupados naturalmente en grupos.

Se realiza eligiendo varios de esos grupos al azar, y ya elegidos algunos podemos estudiar a todos los individuos de los grupos elegidos o bien seguir aplicando dentro de ellos más muestreos por grupos, por estratos, aleatorios simples,… Para conocer la opinión de los médicos del sistema nacional de salud, podemos elegir a varias regiones de Chile, dentro de ellas varias comunas, y dentro de ellas varios centros de salud, y…

Al igual que en el muestreo estratificado, al extrapolar los resultados a la población hay que tener en cuenta el tamaño relativo de unos grupos con respecto a otros.
Regiones con diferente población pueden tener probabilidades diferentes de ser elegidas, comunas, hospitales grandes frente a pequeños,… Estimación

Un estimador es una cantidad numérica calculada sobre una muestra y que esperamos que sea una buena aproximación de cierta cantidad con el mismo significado en la población (parámetro).

En realidad ya hemos trabajado con estimadores cada vez que hacíamos una práctica con muestras extraídas de una población y suponíamos que las medias, etc… eran próximas de las de la población. Ejemplos:

Para la media de una población:
“El mejor” es la media de la muestra.

Para la frecuencia relativa de una modalidad de una variable:
“El mejor” es la frecuencia relativa en la muestra. ¿Es útil conocer la distribución de un estimador?

Es la clave para hacer inferencia.

Si de una variable conocemos μ (media poblacional) y r (Desviación poblacional) , sabemos que para muestras “grandes”, la media muestral es:
aproximadamente normal,
con la misma media y,
desviación típica mucho menor (error típico/estándar). Es decir si por ejemplo μ=60 y r=5, y obtenemos muestras de tamaño n=100,
La desv. típica de la media muestral (error estándar) es EE=5/raiz(100)=0,5
como la media muestral es aproximadamente normal, el 95% de los estudios con muestras ofrecerían estimaciones entre 60±1
Dicho de otra manera, al hacer un estudio tenemos una confianza del 95% de que la verdadera media esté a una distancia de ±1 En el ejemplo anterior la situación no era muy realista, pues como de todas maneras no conozco la desviación poblacional, desconoceré el intervalo exacto para μ (media poblacional).

Sin embargo también hay estimadores para y puedo usarlo como aproximación.

Para tener una idea intuitiva, analicemos el siguiente ejemplo. Nos servirá como introducción a la estimación puntual y por intervalos de confianza. DOCIMA DE HIPÓTESIS

Objetivos

Conocer el proceso para contrastar hipótesis y su relación con el método científico.

Diferenciar entre hipótesis nula y alternativa

Nivel de significación

Significación

Toma de decisiones, tipos de error y cuantificación del error. ¿Qué es una hipótesis?

Una creencia sobre la población, principalmente sus parámetros:
Media
Varianza
Proporción/Tasa

OJO: Si queremos contrastarla, debe establecerse antes del análisis. Identificación de hipótesis

Hipótesis nula Ho
La que contrastamos
Los datos pueden refutarla
No debería ser rechazada sin una buena razón.

Hip. Alternativa H1
Niega a H0 (y creemos que es ‘mejor’).
Los datos pueden mostrar evidencia a favor
No debería ser aceptada sin una gran evidencia a favor. Región crítica y nivel de significación

Región crítica
Valores ‘improbables’ si...
Es conocida antes de realizar el experimento: resultados experimentales que refutarían H0

Nivel de significación: a
Número pequeño: 1% , 5%
Fijado de antemano por el investigador
Es la probabilidad de rechazar H0 cuando es cierta Contrastes: unilateral y bilateral

La posición de la región crítica depende de la hipótesis alternativa Significación: p Significación: p

Es la probabilidad que tendría una región crítica que comenzase exactamente en el valor del estadístico obtenido de la muestra.
Es la probabilidad de tener una muestra que discrepe aún más que la nuestra de H0.
Es la probabilidad de que por puro azar obtengamos una muestra “más extraña” que la obtenida.
p es conocido después de realizar el experimento aleatorio
El contraste es no significativo cuando p>a Significación : p

El contraste es estadísticamente significativo cuando p<a
Es decir, si el resultado experimental discrepa más de “lo tolerado” a priori. Resumen: a, p y criterio de rechazo

Sobre a (alfa)
Es número pequeño, preelegido al diseñar el experimento
Conocido a sabemos todo sobre la región crítica

Sobre p
Es conocido tras realizar el experimento
Conocido p sabemos todo sobre el resultado del experimento

Sobre el criterio de rechazo
Contraste significativo = p menor que a Riesgos al tomar decisiones

Ejemplo : Se juzga a un individuo por presunto consumo de drogas.

H0: Hipótesis nula
Es inocente
Los datos pueden refutarla
La que se acepta si las pruebas no indican lo contrario.
Rechazarla por error tiene graves consecuencias. Riesgos al tomar decisiones

H1: Hipótesis alternativa
Es culpable
No debería ser aceptada sin una gran evidencia a favor.
Rechazarla por error tiene consecuencias consideradas menos graves que la anterior. Ejemplo 2: Se cree que un nuevo tratamiento ofrece buenos resultados

H0: Hipótesis nula
El nuevo tratamiento no tiene efecto
H1: Hipótesis alternativa
El nuevo tratamiento es útil Ejemplo 3: Parece que hay una incidencia de enfermedad más alta de lo normal

H0: Hipótesis nula
No hay nada que destacar

H1: Hipótesis alternativa
Hay una situación anormal

Hipotesis Nula (No Especulativa)
Hipotesis Alternativa (Especulativa) Tipos de error al tomar una decisión

Ejemplo 1 Tipos de error al tomar una decisión

Ejemplo 2 No se puede tener todo

Para un tamaño muestral fijo, no se pueden reducir a la vez ambos tipos de error.

Para reducir b (beta), hay que aumentar el tamaño muestral. TIPOS PRUEBA DE HIPOTESIS

HIPOTESIS NULA (Ho): postula que la relación causa efecto se debe al azar y no es una relación causal.
HIPOTESIS ALTERNATIVA (H1): la relación causa- efecto se debe a la causalidad y no al azar, es una frase positiva PRESENTACION BASADA EN LOS APUNTES DEL PROFESOR:

Francisco Javier Barón Lopez
Universidad de Malaga http://www.bioestadistica.uma.es/baron/apuntes/
Full transcript