Loading presentation...

Present Remotely

Send the link below via email or IM

Copy

Present to your audience

Start remote presentation

  • Invited audience members will follow you as you navigate and present
  • People invited to a presentation do not need a Prezi account
  • This link expires 10 minutes after you close the presentation
  • A maximum of 30 users can follow your presentation
  • Learn more about this feature in our knowledge base article

Do you really want to delete this prezi?

Neither you, nor the coeditors you shared it with will be able to recover it again.

DeleteCancel

Make your likes visible on Facebook?

Connect your Facebook account to Prezi and let your likes appear on your timeline.
You can change this under Settings & Account at any time.

No, thanks

MUESTREO ESTADÍSTICA III

No description
by

César Zapata

on 26 October 2013

Comments (0)

Please log in to add your comment.

Report abuse

Transcript of MUESTREO ESTADÍSTICA III


MUESTREO
Estadística III

Objetivo fundamental
Propósito
Conceptos
Generales

Importancia de
muestrear

Muestrear es una forma de evaluar la calidad de un producto, la opinión de los consumidores, la eficacia de un medicamento o de un tratamiento. Hacer una conclusión sobre la población (total de resultados de un experimento) basados en información estadística obtenida de un pequeña muestra (parte de la población) es hacer una inferencia estadística.


Ofrecer los procedimientos para recolectar y transformar los datos de manera que sean útiles a quienes toman decisiones.
Elemento:
Es el objeto del cual se toman las observaciones y es indivisible.

Unidad de muestreo:
Es divisible y se compone de elementos de observación, sin embargo, de acuerdo al tipo de muestreo o a la población objetivo, el elemento puede ser la misma unidad.

Población:
Es aquel conjunto de individuos o elementos que le podemos observar, medir una característica o atributo. EJ:Todos los estudiantes universitarios en Colombia, el conjunto de personas fumadoras de la región. Son características medibles u observables de cada elemento su estatura, su peso, edad, sexo, etc.


Marco muestral:
Es una lista que contiene las unidades de la población. Por ejemplo, los estudiantes matriculados de la UTP en el primer semestre de 2011; el listado de votantes registrados en una zona puede servir de marco para una encuesta de opinión pública.

Muestra:
Es una colección de unidades o elementos seleccionados del marco muestral mediante alguna técnica estadística, sobre esta se realiza la inferencia respectiva para la toma de decisiones.
La muestra debe ser obtenida a través de una buena selección de ésta y un trabajo cuidadoso y de alta calidad en la recogida de los datos.



Parámetro:
Son las medidas o datos que se obtienen sobre la distribución de probabilidades de la población, tales como la media, la varianza, la proporción, etc.

Estadístico:
Los datos o medidas que se obtienen sobre una muestra y por lo tanto una estimación de los parámetros.

Error muestral, de estimación o standard:
Es la diferencia entre un estadístico y su parámetro correspondiente. Es una medida de la variabilidad que da una noción clara de hasta dónde y con qué probabilidad una estimación basada en una muestra se aleja del valor que se hubiera obtenido por medio de un censo completo.



Nivel de confianza:
Cualquier información a recoger está distribuida según una ley de probabilidad (Gauss o Student), por tanto se llama nivel de confianza a la probabilidad de que el intervalo construido en torno a un estadístico capte el verdadero valor del parámetro.

Varianza poblacional:
Corresponde a la variabilidad de las mediciones en una población. Cuando una población es más homogénea la varianza es menor y el número de entrevistas necesarias para construir un modelo de la población, será más pequeño. Generalmente es un valor desconocido y hay que estimarlo a partir de datos de estudios previos.

Inferencia estadística:
Trata el problema de la extracción de la información sobre la población contenida en las muestras. Por tanto, , la muestra debe ser representativa de la población en lo que se refiere a la característica en estudio,.
Repaso Estadística
Descriptiva
El propósito de los procedimientos de la estadística descriptiva es explicar de forma breve una amplia colección de medidas, con unos cuantos valores fundamentales. El resumen más común se obtiene al promediar los valores.
TIPOS DE MUESTREO
Muestreo No probabilístico
Muestreo
probabilístico
Muestreo No probabilístico:

Se utiliza cuando no existe o es muy difícil de conseguir un marco muestral bien definido o cuando se requiere una gran rapidez en los resultados.


Muestreo por conveniencia:
Es aquel en el que el investigador reúne una cantidad de elementos con base a un resultado especifico.


Muestreo por juicio:
Los elementos seleccionados son expertos en el objeto de la investigación.

Muestreo probabilístico:

Para este se debe obtener o crear un marco muestral tratando que contenga la mayor parte de los elementos que conforman la población y se debe aplicar el principio de aleatoriedad para la conformación de la muestra. A continuación se mencionan cada uno de los muestreos probabilísticos:

MUESTREO ALEATORIO


Población finita:
Consta de un número finito o fijo de elementos, medidas u observaciones. Ejemplo las calificaciones de todos los estudiantes de la universidad.

Poblaciones infinitas:
contienen una infinidad de elementos. Este es el caso del lanzamiento indefinido de dos dados.




Una muestra de tamaño n de una población infinita es aleatoria si consta de valores de variables aleatorias independientes que tienen la misma distribución.Por ejemplo si lanzamos un dado 12 veces y obtenemos 2, 5, 5, 3, 3, 3, 5, 1, 6, 1,4, 1. Estos números constituyen una variable aleatoria si son valores aleatoria independientes que tienen la misma distribución de probabilidad f(x) = 1/6 para x= 1, 2, 3, 4, 5, 6.

Una muestra de tamaño n de una población finita de tamaño N es una variable aleatoria si se selecciona de manera tal que cada una de las muestras posibles tienen la misma probabilidad de ser seleccionada.
Por ejemplo si una población de N= 5 elementos a,e,i, o, u (que podrían ser los ingresos anuales de cinco personas), hay muestras posibles de tamaño n = 3, que constan de los siguientes elementos:
aei aeo aeu aio aiu aou eio eiu eou iou
Sin embargo, describir todas las posibles muestras sería complicado si N y n son grandes. Por ejemplo si n=4 y N=200 se tendrían 64,684,950 muestras distintas. Por tanto, podemos realizar una muestra aleatoria, sin necesidad de describirlas todas. Basta con numerar los N elementos de la población y retirar una a una hasta completar los n-elementos de la muestra, lo que da también una probabilidad de que la muestra sea aleatoria.
MUESTREO ALEATORIO SIMPLE
Es cuando una muestra es formulada de tal manera que cada elemento en la población tiene la misma oportunidad de ser incluido.
FÓRMULAS DE MUESTREO ALEATORIO
Varianza Estimada:
donde:
Límite para el Error de estimación:
2.TOTAL POBLACIONAL
Estimador del Total Poblacional :
Varianza Estimada:
Límite para el Error de estimación:
3.SELECCIÓN DEL TAMAÑO DE MUESTRA
Tamaño de muestra requerido para estimar μ con un limite B para el error de estimación:
donde:
4.PROPORCIÓN POBLACIONAL
Estimador de la proporción poblacional:
Varianza Estimada
Límite para el Error de estimación:
1. MEDIA POBLACIONAL
Estimador de la media poblacional
MÉTODOS DE SELECCIÓN
Un procedimiento de extraer una muestra aleatoria de una población finita es el de enumerar todos los elementos que conforman la población, escribirlos en bolas o papeles e introducirlos en una bolsa, y finalmente mezclarlos para sacar uno a uno tantos como lo indique el tamaño de la muestra. Los elementos de la muestra lo constituirán los elementos de la población cuyos números coincidan con los extraídos de la bolsa.
Otro procedimiento para obtener una muestra de una población ya sea el muestreo con reemplazo o sin reemplazo es mediante la utilización de la tabla de números aleatorios pero solamente para poblaciones finitas, la utilización de estas tablas puede realizarse de diferentes modos .
Para la utilización de la tabla consideremos que se desea extraer de una población de tamaño N una muestra de tamaño n. Se selecciona el bloque, la fila y la columna de la tabla que se va a comenzar, a partir de esta selección se toman tantas columnas como dígitos tiene N.


Comenzando por el primer número de las columnas seleccionadas se irán incluyendo en la muestra aquellos individuos que en la lista de la población ocupa la posición de los n números de las columnas seleccionadas que resultan menores que N, en los casos que al seleccionar un número en la tabla sea mayor que N, puede continuarse con el siguiente numero aleatorio.
Implica sumar todos los valores y dividirlos entre el número de valores.
1. MEDIA:
2. DESVIACIÓN ESTÁNDAR:
3.VARIANZA MUESTRAL:
Donde:
X es la media de la muestra X
"∑ X" = suma de todos los valores de la muestra
n = tamaño de la muestra

Mide la dispersión de los datos en torno a la media.
donde el numerador representa la suma de las diferencias al cuadrado entre los valores medidos y su media.
Es el cuadrado de la desviación estándar de un conjunto de medidas.
Se utilizan para indicar el número de datos que son independientes unos de otros, en el sentido de que no pueden calcularse a partir de los demás y, por lo tanto, llevan piezas únicas de información.
Grados de libertad
Ejemplo. Suponga que se hacen las siguientes tres declaraciones:
Estoy pensando en el número 4. Estoy pensando en el número 6. La suma de los dos números en mi mente es 10.
A primera vista, se presentan tres piezas de información. Sin embargo, si se conocen dos de estas afirmaciones, se puede determinar la otra, por lo que podría decirse que sólo hay dos piezas únicas de información lo que significa estadísticamente que solo hay dos grados de libertad puesto que sólo dos de los valores tienen libertad para variar, el tercero no.

MUESTREO SISTEMÁTICO
El Muestreo Sistemático se utiliza cuando el universo o población es de gran tamaño, o ha de extenderse en el tiempo. Primero hay que identificar las unidades y relacionarlas con el calendario (cuando proceda). Luego hay que calcular la constante K= N/n. Después determinar en qué fecha se producirá la primera extracción, para ello hay que elegir al azar un número entre 1 y K; de ahí en adelante tomar uno de cada K a intervalos regulares.
MUESTREO ESTRATIFICADO
El Muestreo Estratificado se presenta cuando la Población se encuentra particionada en L grupos y en todos y cada uno de estos grupos se aplica en forma independiente un diseño muestral, no necesariamente igual en todos ellos. En tal caso, los grupos de la partición se llaman Estratos y la partición de dice que es una Estratificación.
Una muestra obtenida al seleccionar aleatoriamente un elemento de los primeros k elementos en el marco y después cada k-ésimo elemento se denomina muestra sistemática de 1-en-k.

k=N/n
(Coeficiente de elevación), donde N es el tamaño del universo y n el tamaño de la muestra.
MUESTREO POR CONGLOMERADOS
Aunque las estimaciones basadas en el muestreo por conglomerados, por lo general no son tan fiables como las obtenidas por muestreos aleatorios simples del mismo tamaño, son más baratas. Volviendo al ejemplo anterior, es mucho más económico visitar a familias que viven en el mismo vecindario, que ir visitando a familias que viven en un área muy extensa.


En este tipo de muestreo, se divide la población total en un número determinado de subdivisiones relativamente pequeñas y se seleccionan al azar algunas de estas subdivisiones o conglomerados, para incluirlos en la muestra total. Si estos conglomerados coinciden con áreas geográficas, este muestreo se llama también muestreo por áreas.
Para ilustrar esta clase de muestreo, supongamos que una gran empresa quiere estudiar los patrones variables de los gastos familiares de una ciudad como Sevilla. Al intentar elaborar los programas de gastos de una muestra de 1200 familias, nos encontramos con la dificultad de realizar un muestreo aleatorio simple, (es complicado tener una lista actualizada de todos los habitantes de una ciudad). Una manera de tomar una muestra en esta situación es dividir el área total (Sevilla en este caso) en áreas más pequeñas que no se solapen. En este caso seleccionaríamos algunas áreas al azar y todas las familias (o muestras de éstas) que residen en estos distritos postales o manzanas, constituirían la muestra definitiva.

Ejemplos de Estratificaciones en función de los objetivos del estudio son, por ejemplo, las divisiones político administrativas (los Estratos pueden ser Regiones, Provincias, Departamentos o Distritos, etc.) en una Encuesta Nacional, Ramas de Actividad Económica en una Encuesta Industrial; Publico y Privado en una Encuesta sobre Educación.
Ejemplos de Estratos creados para obtener una mayor homogeneidad en cada uno de ellos son: Empresas Grandes, Medianas, Pequeñas y Micro, en una Encuesta Industrial: Manzanas con hogares de ingresos mayoritariamente altos, medios y bajos, etc.
Definición
“Una muestra aleatoria estratificada es la obtenida mediante la separación de dos elementos de la población en grupos que no presenten traslapes, llamados estratos, y la selección posterior de una muestra irrestricta aleatoria simple de cada estrato”

L
=Numero de Estratos
Ni
=Numero de unidades muestrales en el estrato i.
N
= Numero de unidades muestrales en la población.

Donde: N=N1+N2+…+NL

FÓRMULAS DE MUESTREO ESTRATIFICADO
1. Media poblacional
Estimador de la media poblacional
Varianza estimada
Límite para el error de estimación
2. Total poblacional
Estimador del total poblacional
Varianza estimada
Límite para el error de estimación
3. Tamaño de muestra
Selección del tamaño de muestra para estimar las medias (μ) y totales poblacionales con un limite para el error de estimación de B:
donde Wi es la fracción de observaciones asignadas al estrato i, es la varianza poblacional para el estrato i, así:
Para poder usar esta ecuación se necesita conocer los valores de las varianzas poblacionales de cada estrato ,pero se puede aproximar usando las varianzas muestrales de cada estrato . .
para estimar μ
para estimar
3. Proporcion poblacional
Estimador de la proporción poblacional
Varianza estimada
Límite para el error de estimación
1. MEDIA POBLACIONAL
Estimador de la media poblacional
Varianza Estimada:
Límite para el Error de estimación:
donde el subíndice
sy
significa que se utilizo muestreo sistemático.
donde
2.TOTAL POBLACIONAL
La estimación de un total poblacional requiere de conocimiento del numero total de elementos (N) en la población:
Estimador del Total Poblacional :
Varianza Estimada:
Límite para el Error de estimación:
3.PROPORCIÓN POBLACIONAL
Estimador de la proporción poblacional
Varianza estimada
Límite para el error de estimación


Se definen:
p = Proporción poblacional

=Estimador de la proporción poblacional del muestreo sistemático.

Sea
Yi=0 No posee la característica
Yi=1 Si posee la característica

Total de elementos que poseen la característica
donde
donde
3.SELECCIÓN DEL TAMAÑO DE MUESTRA
Tamaño de muestra requerido para estimar μ con un limite de para el error de estimación B:
donde
Tamaño de muestra requerido para estimar con un limite de para el error de estimación B:
y
donde
Si p y q son desconocidas, entonces se pueden aproximar a 0.5.
CARACTERÍSTICAS
El muestreo por conglomerados proporciona más información por unidad de costo que los demás muestreos.

En el muestreo por conglomerados cuando se toma un tamaño de muestra la unidad muestral es el conglomerado y se debe encuestar a todos los elementos que se encuentran dentro del conglomerado.

El muestreo por conglomerados es un muestreo aleatorio simple, con cada unidad de muestreo conteniendo un número de elementos.


FÓRMULAS PARA EL MUESTREO POR CONGLOMERADOS
Estimador de la media poblacional
Varianza estimada
Si no se conoce M se puede estimar por medio de m
Límite para el error de estimación
1. MEDIA POBLACIONAL
2. TOTAL POBLACIONAL
Estimador del total poblacional
Varianza estimada
Límite para el error de estimación
Total poblacional cuando no se cuenta con M
Estimador del total poblacional
Varianza estimada
Límite para el error de estimación
3. Tamaño de muestra
Encaminar al ingeniero en:
Conocer el aparato conceptual necesario desde el punto de vista estadístico para emprender de forma sólida y científica una investigación.
Mostrar algunas de las formas científicas de obtener una muestra.
Tipo de muestreo a utilizar según el interés del profesional.
Como determinar el tamaño de muestra necesario para el desarrollo de la investigación.

Las estadísticas descriptivas pueden definirse para las poblaciones. A fin de distinguir las estadísticas de población de las estadísticas de la muestra, se usa una notación diferente.
La media y la desviación estándar son las formas más comunes de describir, de forma breve y significativa, los datos de muestras. Sin embargo, en ocasiones también se utiliza la mediana, con el fin de indicar un valor central de los datos.
Tamaño de muestra para estimar μ con un limite B para el error de estimación:
donde
es estimado por:
y
Tamaño de muestra para estimar , usando
con un limite B para el error de estimación:
donde
es estimado por:
4. PROPORCIÓN POBLACIONAL
Estimador de la proporción poblacional
Varianza estimada
Límite para el error de estimación
A menudo no es factible estudiar la población entera. Algunas de las razones por lo que es necesario muestrear son:

La naturaleza destructiva de algunas pruebas
La imposibilidad física de revisar todos los elementos de la población.
El costo de estudiar a toda la población es muy alto.
El resultado de la muestra es muy similar al resultado de la población.
El tiempo para contactar a toda la población es inviable.


El muestreo por conglomerados
es una muestra aleatoria en la que cada unidad de muestreo es un conjunto o conglomerado de elementos. Se usa cuando el costo de conseguir una observación se incrementa con la distancia que separa los elementos.

y
donde
donde:
Para estimar el tamaño de muestra requerido para ,
el valor de D es:
Se definen:
p = Proporción poblacional

Estimador de la proporción poblacional.
Sea :
Yi=0 No posee la característica
Yi=1 Si posee la característica

Total de elementos que poseen la característica
Esto quiere decir que si se tiene un determinado número de personas que es la población (N) y se quiere escoger de esa ella un número más pequeño el cual es la muestra (n), dividimos el número de la población por el número deseado de la muestra y el resultado de esta operación será el intervalo, entonces escogemos un número al azar desde uno hasta el número del intervalo, y a partir de este número escogemos los demás siguiendo el orden.
GRACIAS
Si no se conoce M se puede estimar por medio de m
SELECCIÓN DEL TAMAÑO DE MUESTRA:
Si se desconoce M
donde
Full transcript