Loading presentation...

Present Remotely

Send the link below via email or IM

Copy

Present to your audience

Start remote presentation

  • Invited audience members will follow you as you navigate and present
  • People invited to a presentation do not need a Prezi account
  • This link expires 10 minutes after you close the presentation
  • A maximum of 30 users can follow your presentation
  • Learn more about this feature in our knowledge base article

Do you really want to delete this prezi?

Neither you, nor the coeditors you shared it with will be able to recover it again.

DeleteCancel

Estadistica Ambiental

Estadística Descriptiva e Inferencial
by

Enrique EzBi

on 2 November 2014

Comments (0)

Please log in to add your comment.

Report abuse

Transcript of Estadistica Ambiental

Análisis
Estadístico
de una Base de Datos
Ejemplo Práctico
Base de Datos: NEONATOS
Descripción variable: PESO
Estudiar la distribución de frecuencias con un histograma
Descripción variables: Tabaco - Sexo
Tabla de contingencias:
Columnas = var. dependiente
Filas = var. independiente
Contraste de Hipótesis
Para averiguar si es determinante la condición de madre fumadora en el sexo del neonato.
Estadística Ambiental
Master de
Ingenieria Ambiental

Enrique Ezpeleta
Estructura
Base de Datos
Estructura de las 9 variables
Registros
Base de Datos
320 observaciones
Las varibles cualitativas están codificadas con números
Objetivos
Análisis Estadístico
Tres estudios diferenciados:
Descriptiva Univariante
Descriptiva Bivariante
Contraste de Hipótesis
Descriptiva
Univariante
Se describen diferentes tipos de variables:
Descriptiva
Bivariante
Diferentes tipos de combinaciones:
Contraste de
Hipótesis
Se plantean posibles relaciones entre dos variables o diferencias entre dos grupos.
Cualitativa Binaria: SEXO
Cualitativa Ordinal: PULSO
Cuantitativa Discreta: CIGARROS
Cuantitativa Discreta: APGAR1
Cuantitativa Contínua: PESO
Descripción variable: CIGARROS
Media NO es representativa
Descripción variable: APGAR1
Descripción variables Cualitativas
Descripción de las frecuencias de las variables
Descripción variables: Edad - Fumadora
Para ver la posible relación entre dos variables, se crea una tabla de doble entrada y se colocan los recuentos y los porcentajes.
Descripción variables: Peso - Fumadora
1º Filtrar los datos de la variable cuantitativa por las opciones de la cualitativa.

2º Explorar por separado.

3º Comparar resultados.
Contraste de Hipótesis
El ritmo cardíaco se clasifica en tres tipos: Bajo, Medio, Alto
Varón=1
Hembra=2
Si=1
No=2
Mayor de 23 años =1
de 19 a 23 años =2
Menor de 19 años =3
Estudiar los percentiles
Comprobar la Normalidad
Asimetría
Apuntalamiento
(Curtosis)
Identificar casos atípicos
Calcular los descriptivos
Centralización:
Media
Mediana
Dispersión:
Desv. Típica
Ampl. Intercuartil
CONCLUSIONES de la MUESTRA:
1.- La media aritmética es muy representativa de la distribución
2.- La mediana tambien es represntativa de la distribución.
3.- La dispersión es relativamente pequeña (desv.típica < 0.4 y Coef.Variación < 0.12)
4.- La media de la muestra es un buen estimador del la media poblacional (N=230 > 30) además la distribución se aproxima muy bien a una distribución normal
El peso medio de un neonato estará entre 2.99 y 3.06
Asimetría
Curtosis
Cualitativa - Cualitativa:
TABACO - SEXO
Cuantitativa Discr. - Cualitativa:
EDAD - FUMADORA
Cuantitativa Cont. - Cualitativa:
PESO - FUMADORA

Entre dos variables Cualitativas. (Fuma-Sexo)
La influencia de una variable binaria (Sexo) en el promedio de una variable Cuantitativa (Peso)
La relación entre una variable Cualitativa (Pulso) y otra Cuantitativa (Peso)
Cuantitativas Independientes (Peso)-(Apgar1)
Cuantitativas Dependientes (Apgar1)-(Apgar5)
Averiguar la relación entre el peso del neonato y el ritmo cardíaco.
Valencia 2014
4 variables Cuantitativas
5 variables Cualitativas
Lento=1
Medio=2
Alto=3
INFERENCIA a la POBLACIÓN (Intervalo de Confianza):
Acceso a la presentación
Gracias por la Atención!
Cantidad de Cigarros diarios consumidos durante el embarazo
Desv.Típica > Media
Estudio realizado sobre el total de observaciones de la muestra (320)

Hay muchos valores de 0 cigarros de madres No fumadoras
Media SI es representativa
Cantidad de Cigarros diarios consumidos durante el embarazo
Desv.Típica < Media
Estudio realizado sólo sobre el total de madres consumidoras de tabaco durante el embarazo

Ahora la muestra es de 100 casos
Distribución de la variable
Con el gráfico de cajas se pueden ver los cuartiles así como la mediana y los casos atípicos si los hay
Caso atípico pequeño < C1-1.5RI
Caso atípico grande > C3+1.5RI
Conclusiones sobre la variable CIGARROS
El promedio de cigarros consumidos tiene sentido estudiarlo sobre el colectivo de madres fumadoras
Se puede concluir con una confianza del 95% que una madre tipo fumadora, durante el embarazo consume una cantidad diaria promedio mayor que 11.5 y menor que 13.4 cigarros
Representa la cantidad diaria más usual de los cigarros consumidos por las madres durante el embarazo.
Cuantitativa Discreta
Siempre son números enteros.
Indice que es la suma de cinco parámetros fisioanatómicos al minuto de nacer.
Cada uno se puntua con (0, 1, 2) por lo tanto el índice será un valor entero de 0 a 10
Distribución de frecuencias del APGAR1
Aunque la distribución se ajusta aparentemente a una Normal ...
Cualitativa Binaria: Sexo
Cualitativa Ordinal: Pulso
Enrique Ezpeleta
Formato
Prezi
Formato
PDF
Distribución de frecuencias del índice APGAR1
Estadísticos de Posición
Estadísticos de Dispersión
Estadísticos de Forma
Cálculo detallado de los Estadísticos
Se muestra una tabla con los cálculos numéricos y el desarrollo de los principales estadísticos
Intervalos de Confianza de la variable APGAR1
Cuanto mayor sea la probabilidad del intervalo de confianza más amplios serán los límites y por tanto menos acotada estará el estimador de la variable en la población.
Estadísticos de las Tablas de Contingencias
Como no hay celdas vacias aplicamos Chi²
La interpretación de obtiene de las pruebas de contraste de hipótesis.
En este caso valorando el resultado en Chi² de p = 0.798 >> 5%
Cálculo de los histogramas de frecuencias
Comparación de Resultados
Contraste de Hipótesis
Averiguar si es determinante el sexo del neonato en el peso del mismo
Ejemplos:
Madre NO fumadora:
el peso medio del neonato en el 95% de casos [3.09 ; 3.18]
Madre SI fumadora:
el peso medio del neonato en el 95% de casos [2.82 ; 2.94]
Aparentemente parece ser que el hábito de fumar SI influye en el peso del neonato.
Al ser dos variables cualitativas independientes --> Chi-cuadrado
Ho: Hipótesis Nula (Cuando no hay diferencia en la relación entre dos variables)
H1: Hipótesis Alternativa (Cuando hay asociación entre las variables)
Error Tipo I = Rechazar la hipótesis nula cuando es verdadera.
Error Tipo II = Aceptar la hipótesis nula cuando es falsa.
Contraste de Hipótesis
Como el valor de p es 0.958 (95.8%) --> Se acepta la hipótesis nula Ho.
El sexo del neonato es independiente del hábito de fumar de la madre.
Se acepta Ho si p(Ho)>5%
Prueba de T de Student
Para variables indep. y grupos elevados y equilibrados
Contraste de Hipótesis
Tipos de pruebas
Para determinar la relación entre las variables
Contraste de Hipótesis de varibles CUANTITATIVAS
El estudio de contraste de hipótesis de dos variables cuantitativas es distinto según sean las variables o no pareadas o relacionadas.

En la base de datos estudiada prácticamente hay un porcentaje similar de cada sexo.
Los resultados finales de frecuencias se pueden representar gráficamente con barras o sectores.
Con un gráfico se aprecia antes la frecuencia relativa
Por tanto no hay variación significativa del sexo del neonato por el hecho de tener madre fumadora o no.
Descripción variables: Edad - Fumadora
Para ver si hay una posible relación entre el hábito de fumar y la edad de las madres habría que hacer un contraste de hipótesis.
Como el valor de significancia p=0.002 < 5% ==> se rechaza Ho ==> No son iguales los hábitos de fumar en función de los tramos de edad.
Las madres más jóvenes tienen menos hábito de fumar.
Como se trata de dos grupos independientes con más de 30 valores la prueba será t-Student
La prueba para el contraste de hipótesis en este caso es la t-Student por ser las variables dicotómica (Sexo) y Cuantitativa (peso)
El valor de significación = 0.0 < 0.05
Se rechaza la hipótesis nula Ho
Ho = El peso en los varones igual al peso de las hembras
H1 = El peso medio difiere de los varones a las hembras.
Por tanto el peso SI depende del sexo
Variable nominal con variable cuantitativa --> Prueba ANOVA
Contraste de Hipótesis
Como el valor de p < 5%
Hipótesis nula: El ritmo cadíaco (pulso Bajo, Medio, Alto) es igual para cualquier neonato independientemente de su peso al nacer.
Se deduce que se rechaza la Hipótesis nula (Ho)
Se concluye que el peso y el ritmo cardíaco están relacionados
COMPARACIONES MÚLTIPLES
Cuando la variables nominal tiene más de dos valores, se pueden ver las relaciones dos a dos.
Se concluye que el peso medio del neonato es diferente entre todos los tramos de ritmo cardíaco, porque el pulso depende del peso.
Variables Cuantitativas DEPENDIENTES
Variables Cuantitativas INDEPENDIENTES
Las variables peso y Apgar1 tienen una alta correlación r=0.89 (r²=0.79)
La variable Apgar1 puede ser explicada por la variable Peso en un 79%
Conclusión: Las variables Apgar1 y Apgar5 están correlacionadas (p < 5%)
Son variables RELACIONADAS porque a un mismo neonato se le aplica un Apgar1 y posteriormente un Apgar5.
...NO es una Normal (p < 0.05)
El valor del peso de un neonato al azar de la población estará entre valores 2.34 y 3.71
El análisis para ver si hay relación de una variable cuantitativa con una cualitativa:
Si la cualitativa tiene 2 grupos --> aplicaremos: t-Student
Si la cualitativa tiene k grupos --> aplicaremos: ANOVA
SPSS
SPSS
La prueba t-Student hace una comparativa de las medias
Si no se pudiese aplicar t-Student por no ser grupos equilibrados se usaría Mann-Whitney, pero este es un contraste de distribuciones
Full transcript