Loading presentation...

Present Remotely

Send the link below via email or IM

Copy

Present to your audience

Start remote presentation

  • Invited audience members will follow you as you navigate and present
  • People invited to a presentation do not need a Prezi account
  • This link expires 10 minutes after you close the presentation
  • A maximum of 30 users can follow your presentation
  • Learn more about this feature in our knowledge base article

Do you really want to delete this prezi?

Neither you, nor the coeditors you shared it with will be able to recover it again.

DeleteCancel

Make your likes visible on Facebook?

Connect your Facebook account to Prezi and let your likes appear on your timeline.
You can change this under Settings & Account at any time.

No, thanks

EB 2015

No description
by

Isabel Andrade

on 24 October 2016

Comments (0)

Please log in to add your comment.

Report abuse

Transcript of EB 2015

Los datos obtenidos con cualquiera de estos métodos nos permiten hacer inferencias sobre la población de estudio.
ESTADÍSTICA BÁSICA
¿Qué es la Estadística?
Estadística es la ciencia que se ocupa de recolectar, organizar, presentar, analizar e interpretar datos para ayudar a una toma de decisiones más efectiva.
Tipos de variables
Los obtenidos a partir de una población
cualitativa
El nivel de medición de un dato, determina los cálculos que se pueden realizar para resumir y presentar la información, y las pruebas estadísticas que pueden desarrollarse.
Tipos de Estadística
es el conjunto de métodos para organizar, resumir y presentar los datos de manera informativa.
es el conjunto de métodos utilizados para saber algo acerca de una población, basándose en una muestra.
Descripción de los datos
Agrupamiento de datos en categorías mutuamente excluyentes y colectivamente exhaustivas, que indican el número de observaciones en cada categoría
También llamadas tablas de contingencias, son aquellas tablas de datos referentes a dos variables, formada, en las cabeceras de las filas, por las categorías o valores de una variable y en las de las columnas por los de la otra, y en las casillas de la tabla, por las frecuencias o número de elementos que reúnen a la vez las dos categorías o valores de las dos variables que se cruzan en cada casilla.
Nominal
De intervalo
De razón
Muestreo
¿Por qué muestrear?
La
naturaleza destructiva
de ciertas pruebas.
La
imposibilidad física
de revisar todos los integrantes de la población.
El
costo
de estudiar a todos los integrantes de una población, frecuentemente es prohibitivo.
En ocasiones se necesitaría mucho
tiempo
para entrevistar a toda la población.
Este se debe a que hemos extraído una muestra en vez de un censo. Este error es inevitable en el proceso de muestreo.
Pasos de muestreo
1
Determinar la población y los parámetros pertinentes
Habitantes de la zona conurbada de Colima - Villa de Álvarez posibles usuarios de las tiendas Kiosko
2
Escoger el marco apropiado de muestreo
Lista de personas (o unidades taxonómicas) a ser encuestadas (medidas).
3
Escoger entre el muestreo probabilístico y no-probabilístico
4
Escoger un método de muestreo
5
Relación entre dos variables cualitativas
Hipótesis:

Es un enunciado acerca de una población elaborado con el propósito de poner a prueba.
Prueba de hipótesis:
Es el procedimiento basado en la evidencia muestral y la teoría de probabilidad; se emplea para determinar si la hipótesis es una afirmación razonable.
Se plantean las hipótesis nula y alternativa
La H0 es una afirmación que no se rechaza a menos que los datos muestrales proporcionen evidencia convincente de que es falsa.
Se selecciona el nivel de significancia
Es la probabilidad de rechazar la hipótesis nula cuando es verdadera.
Se identifica el estadístico de prueba
Valor determinado a partir de la información muestral, que se utiliza para determinar si se rechaza la hipótesis nula
Se formula la regla de decisión
Una regla de decisión establece las condiciones específicas en las que se rechaza la hipótesis nula y las condiciones en las que no se rechaza.
Se toma una muestra y se decide
Cuando se trata de pruebas comparativas suelen ser:

H0: Las variables son independientes

H1: Las variables no son independientes
Error tipo 1:

Rechazar la hipótesis nula, cuando es verdadera.

Error tipo 2:
Aceptar la hipótesis nula cuando es falsa.
El nivel de significancia se denota por alfa.

A veces también se denomina nivel de riesgo. Ya que es el riesgo que se corre de rechazar la hipótesis nula cuando, en realidad es verdadera.
La prueba Chi cuadrado de independencia es particularmente útil para analizar datos de variables cualitativas nominales
El valor crítico es el punto de división entre la región en la que se rechaza la hipótesis nula y la región en la que no.
Significancia < 0.10
Descriptiva
Inferencial
Los que resultan de una población

cuantitativa
Niveles de medición
Ordinal
Distribución de frecuencias
Las categorías deben ser mutuamente excluyentes y colectivamente exhaustivas
Tablas de tres entradas (tablas cruzadas o cross tabs)
Representaciones de tallo y hoja
Representaciones Gráficas
Medidas de tendencia central
Es un valor único que resume un conjunto de datos. Señala el centro de los valores
Media aritmética
Moda
Mediana
Edad
20
21
22
20
19
Media =
(20+21+22+20+19)/5
= 20.4
Calificaciones
8
10
7
7
8
muestra
muestra
Propiedades de la media aritmética
Todo conjunto de datos de intervalo tiene un valor medio.
Para evaluar la media se consideran todos los valores.
Un conjunto de datos sólo tiene una media, la cual es un valor único.
Es muy útil para comparar dos o más poblaciones.
Es la única medida de tendencia central donde la suma de las desviaciones de cada valor, respecto de la media, siempre es igual a cero.
Puede considerarse como un punto de equilibrio de un conjunto de datos.
Media ponderada
Es un caso especial de la media común. Se presenta cuando hay varias observaciones con un mismo valor, lo cual puede ocurrir si los datos se han agrupado en una distribución de frecuencias.
9+9+10+10+10+10+10+10+10+10+10+10+10+10+10+10+10+10+11+11+11+11+11+11+11+11+11+11+11+12+12+12+12+12+12+12 =
383
2+16+11+7 =
36
383/36 =

10.63
=
10.63
Es el valor de la observación que aparece con mayor frecuencia.
Es especialmente útil para describir los niveles de medición nominales y ordinales.
Es el valor que corresponde al punto medio de los valores después de ordenarlos de menor a mayor o viceversa. 50 % de las observaciones son mayores que la mediana, y 50 % menores que ella.
Desventajas
Para su cálculo se utiliza el valor de cada elemento de una muestra, o de una población. Si algún elemento es muy grande o muy pequeño, la muestra podría no ser un promedio adecuado para representar los datos.
La media también es inadecuada si hay una clase de extremos abiertos en el caso de datos agrupados en una distribución de frecuencias
Media geométrica
Es útil para encontrar el promedio de porcentajes, razones, índices o tasas de crecimiento.
Siempre será menor que o igual a (nunca mayor que) la media aritmética.
Todos los valores de datos deben ser positivos.
Suponga que recibe un aumento de sueldo de 5 % este año, y recibirá uno de 15 % el año próximo ¿Cuál es el aumento promedio de mi suelo?
media = (5 + 15) ÷ 2 = 10
Aumento porcentual promedio en un periodo determinado
Suponga que la población Haarlan, Alaska, en 1990 era de 2 personas, y en 2001 eran 22 ¿Cuál fue la tasa de incremento porcentual anual promedio para el periodo?
De modo que la tasa de aumento anual es 27.1 %. Esto significa que la tasa de crecimiento de la población es de 27.1 % al año
Medidas de Dispersión
Amplitud de Variación
Varianza
Desviación Estándar
¿Por qué estudiar la dispersión?
El promedio no es representativo cuando la dispersión es amplia
Una medida de dispersión se puede utilizar para evaluar la confiabilidad de dos o más promedios.
Es la medida de dispersión más sencilla.
Amplitud de variación = Valor más grande - Valor más pequeño
Un defecto importante es que se basa sólo en dos valores, el máximo y el mínimo; no considera todos los datos.

Es la media de las diferencias con la media elevadas al cuadrado.
La media aritmética de las desviaciones cuadráticas con respecto a la media.

1. Calcula la media (el promedio de los números)
2. Ahora, por cada número resta la media y eleva el resultado al cuadrado (la diferencia elevada al cuadrado).
3. Ahora calcula la media de esas diferencias al cuadrado.
En otras palabras, sigue estos pasos
:
Las alturas (de los hombros) son:
600mm, 470mm, 170mm, 430mm y 300mm
Mide cuánto se separan los datos.
Mide del grado de dispersión de los datos con respecto al valor promedio.
Desviación estándar de una población
Desviación estándar de una muestra
Diagramas de caja
Es una representación gráfica basada en los cuartiles, que ayuda a ilustrar un conjunto de datos.
Para elaborar tal diagrama solamente se necesitan cinco valores estadísticoe: el valor mínimo; Q1 (el primer cuartil); la mediana; Q3 (el tercer cuartil), y el valor máximo.
Una muestra es un medio utilizado para inferir algo acerca de población.
Muestra que se selecciona de modo que cada integrante de la población en estudio tenga una probabilidad conocida (pero distinta de cero) de ser incluido en la muestra.
Probabilístico
No probabilístico
Aleatorio simple
Aleatorio sistemático
Aleatorio estratificado
Por conglomerados
Por áreas
Polietápico
No existe un método que sea "el mejor" para tomar una muestra probabilística de una población. Un método que se usa para tomar una muestra de facturas de un archivo, puede no ser al más adecuado para tomar una muestra de votantes a nivel nacional.
Muestra seleccionada de manera que cada integrante de la población tenga la misma probabilidad de quedar incluido.
Constituye la base de los métodos más complejos.
Los integrantes o elementos de la población se ordenan en alguna forma -por ejemplo, alfabéticamente- en un archivo según la fecha en que se reciben, o por algún otro método. Se selecciona al azar un punto de partida, y después se elige para la muestra cada
k
-ésimo elemento de la población.
No debe utilizarse una muestra sistemática si hay un patrón predeterminado en la población.
En un muestreo sistemático el primer elemento se elige al azar.
Una población se divide en subgrupos, denominados estratos, y se selecciona una muestra de cada uno.
Una muestra estratificada garantiza la representación de cada grupo.
Se utiliza cuando la población está agrupada en conglomerados naturales.
Se utiliza con bastante frecuencia para reducir el costo de muestrear una población dispersa en una área geográfica grande.
Se seleccionan algunos conglomerados al azar (todos los conglomerados deben tener las mismas probabilidades de ser seleccionados) y utilizarlos en representación de la población.
Una vez seleccionados los conglomerados, el estudio se simplifica puesto que hay menos individuos en el análisis.
1
2
El muestreo por área es un procedimiento de listado que enmarca viviendas seleccionadas. En este caso, las viviendas funcionan como las unidades de muestreo.
Cuando el investigador tiene como objetivo hacer un
estudio cualitativo, piloto o exploratorio
.
Cuando la investigación
no tiene como objetivo
generar resultados que se utilicen para hacer
generalizaciones respecto de toda la población
.
También es útil cuando el investigador tiene un
presupuesto, tiempo y mano de obra limitados
.
¿Cuándo utilizar el muestreo no probabilístico?
Las muestras se recogen en un proceso que no brinda a todos los individuos de la población iguales oportunidades de ser seleccionados.
Los resultados de la investigación no pueden ser utilizados en generalizaciones respecto de toda la población.
Por conveniencia
Las muestras son seleccionadas porque son accesibles para el investigador.
Los sujetos son elegidos simplemente porque son fáciles de reclutar.
Esta técnica es considerada la más fácil, la más barata y la que menos tiempo lleva.
Consecutivo
Muy similar al muestreo por conveniencia, excepto que intenta incluir a TODOS los sujetos accesibles como parte de la muestra.
Puede ser considerada la mejor muestra no probabilística, ya que incluye a todos los sujetos que están disponibles, lo que hace que la muestra represente mejor a toda la población.
Por cuotas
El investigador asegura una representación equitativa y proporcionada de los sujetos, en función de qué rasgo es considerado base de la cuota.
Las bases de la cuota generalmente son la edad, el género, la educación, la etnia, la religión y el nivel socioeconómico.
Bola de nieve
Se lleva a cabo generalmente cuando hay una población muy pequeña o difícil de localizar.
El investigador le pide al primer sujeto que identifique a otro sujeto potencial que también cumpla con los criterios de la investigación.
La desventaja de usar una muestra de bola de nieve es que difícilmente sea representativa de la población.
Error no muestral
A veces denominado “sesgo” o tendencia a un error direccional (estimación hacia arriba o hacia abajo del parámetro poblacional). Puede presentarse aún cuando no hayamos tomado una muestra, sino hayamos hecho un censo completo.
Error muestral
Escoger el tamaño necesario de la muestra
Población infinita o desconocida
Población finita y conocida
La H0 se plantea con el objetivo de realizar una prueba.
1
2
3
4
5
Relación entre dos variables cuantitativas
El
análisis de correlación
es el estudio de la relación que existe entre las variables.
Conjunto de técnicas estadísticas empleado para medir la intensidad de la asociación entre dos variables.
Gráfica de dispersión
Gráfica que representa la relación entre dos variables.
Variable independiente
Variable dependiente
La variable que proporciona las bases para el cálculo. Es la variable de predicción.
La variable que se calcula.
Coeficiente de correlación
Medida de la intensidad de la relación lineal entre dos variables.
r, puede tomar cualquier valor de -1.00 a +1.00.
Coeficiente de determinación
La porción de la variación total en la variable dependiente Y, que se explica por la variación en la variable independiente X.
Se calcula elevando al cuadrado el coeficiente de correlación.
Cuando se encuentran dos variables con una correlación fuerte, es que existe una relación entre las dos variables, y no que un cambio en una origine una modificación en la otra.
Full transcript