Loading presentation...

Present Remotely

Send the link below via email or IM

Copy

Present to your audience

Start remote presentation

  • Invited audience members will follow you as you navigate and present
  • People invited to a presentation do not need a Prezi account
  • This link expires 10 minutes after you close the presentation
  • A maximum of 30 users can follow your presentation
  • Learn more about this feature in our knowledge base article

Do you really want to delete this prezi?

Neither you, nor the coeditors you shared it with will be able to recover it again.

DeleteCancel

Make your likes visible on Facebook?

Connect your Facebook account to Prezi and let your likes appear on your timeline.
You can change this under Settings & Account at any time.

No, thanks

ANÁLISIS PARAMÉTRICOS Y NO PARANPETRICOS

No description
by

Jennifer Garcia Guzman

on 14 May 2014

Comments (0)

Please log in to add your comment.

Report abuse

Transcript of ANÁLISIS PARAMÉTRICOS Y NO PARANPETRICOS

ANÁLISIS
PARAMÉTRICO
Y
NO PARAMÉTRICO

DIFERENCIAS
ENTRE PRUEBAS PARAMÉTRICAS Y NO PARAMÉTRICAS

Anàlisis paramètricos
Presuposiciones No Paramètricas
Estadística
No Paramétrica

Estudia las pruebas y modelos estadísticos cuya distribución subyacente no se ajusta a los llamados criterios paramétricos.

No puede ser definida a priori.

Se hace recomendable cuando no se puede asumir que los datos se ajusten a una distribución conocida.

Comparación de la distribución de probabilidades acumulada empírica (resultado de los datos) con la distribución de probabilidades acumulada teórica.

Los datos de una muestra 
provienen de una distribución
específica.
Prueba de Anderson-Darling
Cuanto mayor sea el valor de   , menos verosímil es que la hipótesis sea correcta.

Mide la discrepancia entre una distribución observada y otra teórica  indicando las diferencias existentes entre ambas.

Prueba la independencia de dos variables entre sí, mediante la presentación de los datos en tablas de contingencia.

Prueba de Pearson
Donde t representa el valor proporcionado por las tablas, según el nivel de significación estadística elegido.
.

cuando:
No se rechaza
Criterio de decisión:
Grado de libertad (gl) y el nivel de significancia gl se calcula :
El estadístico ρ viene dado por la expresión:
 Es una medida de la correlación (la asociación o interdependencia) entre dos variables aleatorias continuas.

Para calcular los datos son ordenados y reemplazados por su respectivo orden.

Coeficiente de correlación de
Spearman
La interpretación de coeficiente de Spearman es igual que la del coeficiente de correlación de Pearson. Oscila entre -1 y +1.

0 cero, significa no correlación pero no independencia.

Muestras mayores de 20 observaciones, podemos utilizar la siguiente aproximación a la distribución t de Student:

Donde t representa el valor proporcionado por las tablas, según el nivel de significación estadística elegido.
Paraméricos
* Se hacen muchas suposiciones

* Los datos se distribuyen normalmente

* Mayor potencia estadística
No Paramétrico
* Menos suposiciones

* Datos que no se distribuyen normalmente

* Menor potencia estadística
Tipos De Datos
Distribución De Datos
Paramétricas
* Suposición de conocimiento previo de la distribución normal de datos
No Paramétrico
* No hacen sposiciones sobre la distrubución de los datos
Escala de Datos
Paramétrico
* Hace la suposición de datos que miden una escala de intervalo

* El intervalo entre los puntos de datos es significativo

* Altura o peso son datos de intervalos
No Paramétrico
* No hace suposiciones acerca de la escala de datos
Parámetros Estadísticos
Paramétrico
* Parámetros que se distribuyen normalmente

* La media, la varianza, la desviación estándar, la asimetría, etc.
No Paramétrico
* No hacen uso de estos parámetros estadísticos
Diferencias en Poder Estadístico
Paramétrico
* Mayor probabilidad de rechazar la hipótesis nula

* Probabilidad de que la prueba dará lugar a la inferencia correcta acerca de la población
No Paramétrico
* Es menor que en las pruebas paramétricas
Concepto De Parámetro

En estadística se refiere a los valores o medidas que caracterizan a una población.

La media
La desviación típica de una población



EJEMPLO

1.-Se desea saber que tanto varían los pesos de los empaques (en gramos), de uno de sus productos; por lo que opta por seleccionar al azar cinco unidades de ellos para pesarlos. Los productos tienen los siguientes pesos (490, 500, 510, 515 y 520) gramos respectivamente.
Por lo que su media es:

Varianza

La varianza es la media aritmética del cuadrado de las desviaciones respecto a la media de una distribución estadística.
                                                                                           



1.-Calcular la varianza de la distribución:
9, 3, 8, 8, 9, 8, 9, 18


ANÁLISIS PARAMÉTRICO

ANÁLISIS NO PARAMÉTRICO

ESTIMADOR

ESTADÍSTICO

PARÁMETRO

Infinita

Finita

Tabla de frecuencias

Conteo

Toma de datos

Universo

Estadística
Descriptiva
(características)

Muestra

Estadística
Inferencial
(probabilidad)

ESTADISTICA

FORMA

DISPERSION

CENTRALIZACION

POSICION

TIPOS DE ESTADISTICOS

Cuantiles
Percentiles
Cuartiles
Deciles

Media
Mediana
Moda

Desviación típica
Coeficiente de variación
Rango
varianza

Asimetría
Apuntamiento o curtosis

¿Cuáles son las presuposiciones de la estadística no paramétrica?

La mayoría de estos análisis no requieren de presupuestos acerca de la forma de la distribución poblacional. Aceptan distribuciones no normales.

Las variables no necesariamente deben de estar medidas en un nivel por intervalos o razón , pueden analizarse datos nominales u ordinales.

Sí se quiere análisis no paramétricos a datos por intervalos o razón, estos deben se resumidos a categoría discretas. Las variables deben ser categóricas.
No se requiere de los supuestos paramétricos
Se puede usar para variables no numéricas.
Recomendada para muestras pequeñas.
Son convenientes cuando no se conoce la distribución de la población.

DESVENTAJAS
VENTAJAS
¿Cuáles son los métodos o pruebas estadísticas no paramétricas más utilizadas?

La Ji cuadrada o Chi cuadrada.

Los coeficientes de correlación e independencia para tabulaciones cruzadas.

Los coeficientes de correlación para rangos ordenados de Spearman y Kendall.


¿Qué es la Ji cuadrada o Chi Cuadrado?
Definición:
Es una prueba estadística para evaluar la hipótesis acerca de la relación entre dos variables categóricas

Se simboliza por x2

Hipótesis a probar
: Correlacionales


Variables Involucradas:
Dos


Nivel de medición de las variables :
Nominal u ordinal ( o intervalos o razón reducida a ordinales)

La Chi cuadrada se calcula a través de una tabla de contingencia o tabulación cruzada, de dos dimensiones y cada una representa una variable.

Tipos de pruebas comunes según el número de muestras

En que casos se recomienda utilizar técnicas NO paramétricas
Siempre que en n sea mayor de 30.
La prueba de Smimov-Kolmogorov se sugiere como una prueba para definir si unos datos provienen de una distribución Exponencial, Poisson, entre otras.
La prueba de Shapiro Wilks se sugiere como una prueba para identificar normalidad para muestras mayores de 50.

Utilizar información de la variable
Es menos potente que los resultados obtenidos en los métodos paramétricos si se pudiese aplicar
Prueba de Anderson-Darling
Prueba de Normalidad
EJEMPLO
Los datos se ordenan de menor a mayor (3) y de mayor a menor (4).

Determinar Z de las columnas 3 y 4.






Donde:
x
: dato muestral.
µ
: media muestral.
Z
: desviación estándar.

Nota: los valores de la columna 6 son los mismos que la columna 5, solo están ordenados inversamente.

Los valores para las columnas de 7 y 8, son obtenidos de la tabla de distribución normal acumulada.

En Excel utiliza la función:

= DISTR.NORM (valor, media, desviación estándar, Acum)

Valor:
valor cuya distribución se desea obtener.
Media
: media aritmética de la distribución.
Desviación estándar:
desviación estándar de la distribución.
Acum:
Valor lógico que determina la forma de la función. Argumento VERDADERO para obtener la distribución acumulada.

** Con la utilización de un software ya no es necesario las columnas 5 y 6.

Las columna 9 y 10 se determina con logaritmos neperiano, para columna 9 se determina directo (LN(<valor columna 7>)) y columna 10 se determina LN((1 - <valor columna 8>)) posteriormente se determina el resultado del logaritmo neperiano.

La ultima columna de la tabla se determina con la siguiente formula:
Aplicación del estadístico de Anderson-Darling:

A2 = - N – S
A2 = -(20) – (-20.4916) = 0.491563
=

Se suman los valores de Si (Columna 11):
CONCLUSIONES:




El valor estadístico (A2 = 0.4916 ) es menor al valor critico (A2critico = 0.752), por lo tanto no se rechaza la hipótesis nula.

Por lo tanto los datos observados tienen una naturaleza de distribución normal.

-20.4916
Equipo:
Zarate Antonio Mariana
Cisneros González Doristay
García Guzmán Sthibaliz Jennifer
Miguel Hernández Monserrat Selen
Hernández Orozco Karla Yesenia
Cruz Cortez Celerina
Pacheco Ortiz Jennifer
León Antonio Jesús Ángel

Se llaman así porque su cálculo implica una estimación de los parámetros de la población con base en muestras estadísticas.


Mientras más grande sea la muestra más exacta será la estimación, mientras más pequeña, más distorsionada será la media de las muestras por los valores raros extremos.


Los análisis paramétricos partes de los siguientes supuestos:

1. La distribución poblacional de la variable dependiente es normal: el universo tiene distribución normal.

2. El nivel de medición de las variables es por intervalos de razón.

3. C cuando dos o más poblaciones son estudiadas, tienen una varianza homogénea: las poblaciones en cuestión poseen una dispersión similar en sus distribuciones.

Las pruebas paramétricas más utilizadas son (HFB2):
· Coeficiente de correlación de Pearson y regresión lineal.
· Prueba t.
· Prueba de contraste de las diferencias de proporciones.
· Análisis de varianza unidireccional (ANOVA en un solo sentido o oneway)
· Análisis de Varianza factorial (ANOVA)
· Análisis de covarianza (ANCOVA)

Asumen los parámetros de la distribución de la variable (media y varianza) y un tipo de distribución normal.
Paramétricas
No Paramétricas
No asumen los parámetros de distribución, ni se preocupa por el tipo de distribución, sino trabajan con simple ordenación y recuento a los valores de la variable sin importar la distribución

Las pruebas estadísticas pueden ser paramétricas y no paramétricas
¿Cómo utilizar cada prueba?
Las variables deben ser cuantitativas
Estar medidas en escalas de intervalo o razón
Los datos siguen una distribución normal
Las varianzas son iguales
Muestras grandes (n > 30)
Datos de distribución libre en los grupos
Datos cuantitativos, ordinales o nominales
Varianza grande, un grupo con varianza 0 y el otro no
Trabajar con muestras pequeñas

Tienen mas poder de contraste
Pueden analizar interacciones entre variables independientes

Paramétricas
No Paramétrico
V E N T A J A S
http://es.scribd.com/doc/57801491/Metodos-de-ajuste-de-curvas
http://www.elosiodelosantos.com/sergiman/div/tablnorm.html
http://www.spcforexcel.com/anderson-darling-test-for-normality
http://www.theriac.org/DeskReference/viewDocument.php?id=60&SectionsList=3
http://www.itl.nist.gov/div898/handbook/eda/section3/eda35e.htm
Marqués dos Santos, María José; Estadística Básica: un enfoque no paramétrico, Universidad Nacional Autónoma de México, Facultad de Estudios Superiores Zaragoza.

BIBLIOGRAFÍA
GRACIAS...!
Full transcript