Introducing 

Prezi AI.

Your new presentation assistant.

Refine, enhance, and tailor your content, source relevant images, and edit visuals quicker than ever before.

Loading…
Transcript

Estimación puntual

La estimación puntual consiste en atribuir un valor (la estimación) al parámetro poblacional. Si la muestra es representativa de la población, podemos esperar que los estadísticos calculados en las muestras tengan valores semejantes a los parámetros poblacionales, y la estimación consiste en asignar los valores de los estadísticos muestrales a los parámetros poblacionales. Los estadísticos con que obtenemos las estimaciones se denominan estimadores.

Ejemplo

Se desea estimar la Media de las puntuaciones del curso 2003/4, pero solo se dispone de 50 puntuaciones seleccionadas aleatoriamente. La Media de la muestra (el estimador), es igual a 5.6 y atribuimos este valor (la estimación) a la Media del curso completo.

Resumiendo:

Podemos utilizar como estimadores de la Media de la población otros estadísticos de tendencia central como la Moda o la Mediana, pero NO todos los estimadores son apropiados. Los estimadores deben satisfacer ciertos requisitos, y por esta razón, interesa conocer sus propiedades a fin de utilizar los que sean adecuados según las circunstancias de la estimación.

La estimación de parámetros tiene por finalidad asignar valores a los parámetros poblacionales a partir de los estadísticos obtenidos en las muestras. Dicho de otra manera, la finalidad de la estimación de parámetros es caracterizar las poblaciones a partir de la información de las muestras (por ejemplo, inferir el valor de la Media de la población a partir de los datos de la muestra).

Estimación por intervalos

La estimación por intervalos consiste en establecer el intervalo de valores donde es más probable se encuentre el parámetro. La obtención del intervalo se basa en las siguientes consideraciones:

a) Si conocemos la distribución muestral del estimador podemos obtener las probabilidades de ocurrencia de los estadísticos muestrales.

b) Si conociéramos el valor del parámetro poblacional, podríamos establecer la probabilidad de que el estimador se halle dentro de los intervalos de la distribución muestral.

c) El problema es que el parámetro poblacional es desconocido, y por ello el intervalo se establece alrededor del estimador. Si repetimos el muestreo un gran número de veces y definimos un intervalo alrededor de cada valor del estadístico muestral, el parámetro se sitúa dentro de cada intervalo en un porcentaje conocido de ocasiones. Este intervalo es denominado "intervalo de confianza".

Ejemplo

Se generan 100000 muestras aleatorias (n=25) de una población que sigue la distribución Normal, y resulta:

Propiedades de los estimadores puntuales

La distribución de las Medias muestrales aproxima al modelo Normal:

En consecuencia, el intervalo dentro del cual se halla el 95% de las Medias muestrales es

(Nota: Los valores +-1.96 que multiplican la Desviación Típica de la distribución muestral son los valores cuya función de distribución es igual a 0.975 y 0.025 respectivamente y se pueden obtener en las tablas de la distribución Normal estandarizada o de funciones en aplicaciones informáticas como Excel). Seguidamente generamos una muestra de la población y obtenemos su Media, que es igual a 4.5. Si establecemos el intervalo alrededor de la Media muestral, el parámetro poblacional (5.1) está incluido dentro de sus límites:

Ejemplo

La siguiente imagen muestra la distribución de las Medias muestrales obtenidas de 100000 muestras aleatorias y los intervalos alrededor de cada una de las Medias obtenidas de diez de las muestras:

Ahora bien, la distancia de un punto A a un punto B es la misma que de B a A. Por esa razón, la distancia desde m a la Media muestral es la misma que va de la Media muestral a m. En consecuencia, si hacemos un muestreo con un número grande de muestras observamos que el 95% de las veces (aproximadamente) el valor de la Media de la población (m) se encuentra dentro del intervalo definido alrededor de cada uno de los valores de la Media muestral. El porcentaje de veces que el valor de m se halla dentro de alguno de los intervalos de confianza es del 95%, y es denominado nivel de confianza.

Si queremos establecer un intervalo de confianza en que el % de veces que m se halle dentro del intervalo sea igual al 99%, la expresión anterior es:

Eficiencia.

Diremos que un estimador es más eficiente que otro si la Varianza de la distribución muestral del estimador es menor a la del otro estimador. Cuanto menor es la eficiencia, menor es la confianza de que el estadístico obtenido en la muestra aproxime al parámetro poblacional.

Ejemplo

La Varianza de la distribución muestral de la Media en un muestreo aleatorio (número de muestras: 1000, n=25) ha resultado igual a 0.4. La Varianza de la distribución de Medianas ha resultado, en el mismo muestreo, igual a 1.12, (este resultado muestra que la Media es un estimador más eficiente que la Mediana).

donde ls y le simbolizan los límites superior e inferior del intervalo de confianza al 95%.

Sesgo.

Nueve de los diez intervalos (salvo el definido alrededor de la Media muestral igual a 3.7) incluyen el valor del parámetro dentro sus límites.

Se dice que un estimador es insesgado si la Media de la distribución del estimador es igual al parámetro.

Estimadores insesgados son la Media muestral (estimador de la Media de la población) y la Varianza (estimador de la Varianza de la población):

Ejemplo

En una población de 500 puntuaciones cuya Media (m) es igual a 5.09 han hecho un muestreo aleatorio (número de muestras= 10000, tamaño de las muestras= 100) y hallan que la Media de las Medias muestrales es igual a 5.09, (la media poblacional y la media de las medias muestrales coinciden). En cambio, la Mediana de la población es igual a 5 y la Media de las Medianas es igual a 5.1 esto es, hay diferencia ya que la Mediana es un estimador sesgado.

La Varianza es un estimador sesgado. Ejemplo: La Media de las Varianzas obtenidas con la Varianza

Consistencia.

Un estimador es consistente si aproxima el valor del parámetro cuanto mayor es n (tamaño de la muestra).

Algunos estimadores consistentes son:

En un muestreo de 1000 muestras (n=25) en que la Varianza de la población es igual a 9.56 ha resultado igual a 9.12, esto es, no coinciden. En cambio, al utilizar la Cuasivarianza

la Media de las Varianzas muestrales es igual a 9.5, esto es, coincide con la Varianza de la población ya que la Cuasivarianza es un estimador insesgado.

Ejemplo

En una población de 500 puntuaciones cuya Media (m) es igual a 4.9 han hecho tres muestreos aleatorios (número de muestras= 100) con los siguientes resultados:

vemos que el muestreo en que n=100 la Media de las Medias muestrales toma el mismo valor que la Media de la población.

INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE MEDIAS DE DOS DISTRIBUCIONES NORMALES, VARIANZAS DESCONOCIDAS

El caso en donde se tienen dos poblaciones con medias y varianzas desconocidas, y se desea encontrar un intervalo de confianza para la diferencia de dos medias 1- 2. Si los tamaños de muestras n1 y n2 son mayores que 30, entonces, puede emplearse el intervalo de confianza de la distribución normal. Sin embargo, cuando se toman muestras pequeñas se supone que las poblaciones de interés están distribuidas de manera normal, y los intervalos de confianza se basan en la distribución t.

Learn more about creating dynamic, engaging presentations with Prezi