Present Remotely
Send the link below via email or IM
Present to your audience
- Invited audience members will follow you as you navigate and present
- People invited to a presentation do not need a Prezi account
- This link expires 10 minutes after you close the presentation
- A maximum of 30 users can follow your presentation
- Learn more about this feature in our knowledge base article
Estadística
Estadística descriptiva. Tablas y gráficos
by
TweetTeodora Martinez
on 21 October 2013Transcript of Estadística
Es la ciencia que se ocupa de la recogida de datos , su organización y análisis, así como de las predicciones que, a partir de estos datos, pueden hacerse.
Se encarga de recoger, organizar, clasificar y analizar los datos.
Características o propiedades que estudiamos de los elementos que forman la población
Conceptos básicos
Conjunto de elementos objeto de estudio.
Subconjunto de la población que se toma para facilitar el estudio
Población
Muestra
Individuo
Ejemplo: coches en un aparcamiento
Cada elemento de la población o muestra
Pasos a seguir en un estudio estadístico:
Selección de la muestra y de las características que interesa estudiar.
Recogida de datos.
Organización y clasificación de los datos.
Elaboración de tablas.
Confección de gráficos.
Resumen de la información mediante parámetros.
Selección de caracteres:
Recogida de datos:
De cada coche del aparcamiento queremos saber:
Color.
Combustible que usa.
Nº de puertas.
Nº de cilindros
Potencia
Consumo (l/100km)
Blanco
Diesel
3 puertas
4 cilindros
105 CV
6,2 l
Negro
Gasolina
5puertas
4 cilindros
90 CV
7,5
Gris.
Diesel.
5 puertas
6 cilindros
130 CV.
7,6 l
Negro.
Gasolina.
2 puertas.
5 años.
150 CV.
10 s
Gris.
Diesel.
5 puertas
2 años.
130 CV.
10,7s
Gris.
Diesel.
5 puertas
2 años.
130 CV.
10,7s
Rojo
Diesel.
5 puertas
6 cilindos
90 V.
11,4 l
Gris.
Diesel.
5 puertas
2 años.
130 CV.
10,7s
Gris.
Diesel.
5 puertas
2 años.
130 CV.
10,7s
VARIABLES
ESTADÍSTICAS
VARIABLES CUALITATIVAS
VARIABLES CUANTITATIVAS
Cuantitativas discretas
Cuantitativas continuas
Toman valores no numéricos. Se describen con palabras.
Toman valores numéricos. Se pueden medir.
Solo toman valores aislados.
Pueden tomar cualquier valor de un intervalo.
Color del coche
Combutible
Nº de puertas
Potencia
Aceleración
COLOR: G, G, B, B, G, G, N, G, B, G, A, G, G, B, B, G, G, G, G, A, A, A, N, A, A, R, A, R, B, V, B, B, B, B, B, N, B, B, B, R, B, B, R, R, N, N, N, V, M, P
Variable estadística cualitativa.
16
12
7
6
5
4
TOTAL
50
Recuento
Nº de cilindros
Gráfico circular
Tabla de frecuencias (variable cualitativa)
Nº de cilindros: 4, 4, 3, 4, 8, 4, 6, 4, 5, 4, 6, 4, 4, 4, 4, 4, 4, 6, 8, 4, 4, 4, 6, 4, 5, 4, 5, 4, 4, 4, 6, 3, 8, 6, 8, 4, 8, 8, 6, 8, 8, 6, 4, 5, 4, 3
Variable cuantitativa discreta
Gráfico de barras:
Consumo medio (l/100 km): 7,9 - 4,3 - 7,1 -11,4 - 6,6 - 7 - 6,2 - 6,5 - 7 - 5,5 - 4,1 - 6 - 8 - 5,6 - 5,2 - 6 - 7,2 - 5,5 - 5,6 - 6,5 - 10,1 - 7,6 - 4,5 -7,2 - 7 - 4,5 - 5 - 5,5 - 10 - 5 - 5,5 - 5 - 9 - 4,5 - 7,2 - 5,4 - 5,5 - 6,2 - 6,3 - 5,4 - 4,5 - 5 - 5,4 - 5 - 7 - 10 - 7,5 - 8,7 - 10 - 8
Variable cuantitativa continua
Histograma
Para calcular el ángulo de cada sector circular hemos usado la fórmula:
Tablas
Gráficas:
Tabla de frecuencias
Variable cuantitativa continua
Tabla de frecuencias
variable cuantitativa discreta
Total: N = 50
nº de individuos en la muestra
¿Cómo se realiza un estudio estadístico?
Video del INE (instituto nacional de estadística)
Fuente: sitio web del ine: www.ine.es
Más ejemplos:
Estadística
Estadística descriptiva
Estadística inferencial
A partir de los datos de una muestra:
Elabora conclusiones para la población.
Estudia si esas conclusiones son fiables.
Datos ordenados de menor a mayor.
Total: N = 50
N
Tamaño de la muestra.
ESTADÍSTICA
Si la variable es continua, o, discreta con muchos valores distintos, agrupamos los datos en intervalos.
Dos formas posibles:
Elegimos el nº de intervalos y calculamos su amplitud con la fórmula:
Amplitud = (valor mayor - valor menor) / nº de intervalos
Elegimos la amplitud:
Nº intervalos = (valor mayor - valor menor) / amplitud
(Es conveniente que el nº intervalos esté entre 5 y 10)
El valor 5, 5 se cuenta en el intervalo [5,5 ; 7)
El valor 7 se cuenta en el intervalo [7; 8,5) ...
Fórmulas para calcular las marcas de clase
16
15
12
2
5
Total
50
Encontrarás más información interesante en: http://www.ine.es/explica/explica.htm
Otros tipos de gráficos:
Cartogramas
Piramides de población
Fuente: instituto de estadística. Comunidad de Madrid
Gráfico temporal
Fuente: Consejo Económico y Social (CES) Eurostat,INE. Ministerio de trabajo. EL PAÍS.
1
Total
50
1
100%
Total
50
1
100%
En el eje horizontal escribimos los valores que toma la variable.
En el vertical las frecuencias (generalmente,las absolutas).
La altura de la barra corresponde a la frecuencia de ese valor.
Fuente: jppi URL: http://mrg.bz//ZaYxtZ
Las frecuencias acumuladas de un valor se calculan sumando las frecuecias de los valores menores o iguales a él.
Autora: Teodora Martínez Hernaz
DESVIACIÓN MEDIA
MEDIA ARITMÉTICA
variable discreta
VARIANZA
Si calculamos la varianza con calculadora, es más fácil la fórmula:
DESVIACIÓN TÍPICA
DESVIACIÓN TÍPICA
PARÁMETROS DE CENTRALIZACIÓN
Un parámetro o medida de centralización es un valor de la distribución que representa a todos los demás.
Estudiaremos los siguientes:
Moda, Mo
Es el valor de la variable que tiene mayor frecuencia absoluta. La distribución puede tener más de una moda:
Si tiene 2 modas se dice que es bimodal, si tiene 3, trimodal, etc.
Si la variable es cualitativa, la moda es la única medida de centralización que se puede calcular.
En el ejemplo, la mayor frecuencia absoluta es f1 = 16, que corresponde al valor "blanco", la moda es:
Mo = Blanco
En este ejemplo, la mayor frecuencia es f2 = 25, que corresponde al valor 4:
Mo = 4 cilindros
Si los datos están agrupados en intervalos, la clase con mayor frecuencia se llama clase modal. Una aproximación a la moda es la marca de clase del intervalo (hay fórmulas para conseguir una mejor aproximación que no vamos a utilizar). También podemos calcular la moda gráficamente uniendo los extremos de la clase modal con los de las clases continuas, la abscisa del punto de corte es la moda.
Mediana, Me
Es el valor de la variable estadística que deja a su izquierda un número de datos igual a los que deja a su derecha.
Media Aritmética, x
Se obtiene dividiendo la suma de todos los valores que toma la variable por el número total de valores.
Mediana, v. discreta
VARIANZA, V. DISCRETA
Mediana, v. cont.
Desv. Típica discreta:
Desv.típica, v. continua:
VARIANZA, V. CONTINUA
EJEMPLOS.MEDIA EN UNA DISTRIBUCIÓN CONTINUA
Media aritmética, x
Si tenemos la tabla de frecuencias de la variable, la mediana será el primer valor cuya frecuencia absoluta acumulada sea mayor que la mitad de los datos (N/2)
>25
Como N/2 = 25
F1=3<N/2<F2=28
la mediana es el valor cuya frecuencia absoluta acumulada es 28, es decir:
Me = 4
<25
El primer intervalo cuya frecuencia absoluta acumulada supere a la mitad de los datos se llama clase mediana. Tomaremos como una aproximación a la mediana la marca de clase de este intervalo.
Podemos encontrar la mediana gráficamente usando el gráfico de frecuencias abs. acumuladas y la clase mediana. (Dibujo)
N/2 = 25
F1=15<N/2<F2=31
La clase mediana es el intervalo [5,5; 7)
Una aproximación a la mediana es:
Me = 6,25
DM, v. discreta
DM, v. continua
Interpretación de la desviación típica
Variación de la desviación típica
PARÁMETROS DE DISPERSIÓN
Dan una idea del "alejamiento de los datos respecto a las medidas de centralización, en especial de la media.
Estudiamos los siguientes:
Desviación media, DM
Media aritmética de los valores absolutos de la diferencia entre los valores o marcas de clase y la media.
Recorrido
El recorrido o rango es la diferencia entre el mayor y el menor valor de la variable.
R = x(máx) - x(mín)
R= 8-3 = 5
En el ejemplo he elegido que el nº de intervalos sea 5 y por tanto:
Amplitud = (11,4-4,1)/5 =1,46
Para no dejar ningún valor fuera tomamos amplitud 1,5
R = 11,4-4,1
Varianza
Es la media aritmética de los cuadrados de la diferencia entre cada valor o marca de clase y la media.
Desviación típica
Es la raíz cuadrada positiva de la varianza
Coeficiente de variación
Es el cociente entre la desviación típica y el valor absoluto de la media aritmética.
Full transcriptSe encarga de recoger, organizar, clasificar y analizar los datos.
Características o propiedades que estudiamos de los elementos que forman la población
Conceptos básicos
Conjunto de elementos objeto de estudio.
Subconjunto de la población que se toma para facilitar el estudio
Población
Muestra
Individuo
Ejemplo: coches en un aparcamiento
Cada elemento de la población o muestra
Pasos a seguir en un estudio estadístico:
Selección de la muestra y de las características que interesa estudiar.
Recogida de datos.
Organización y clasificación de los datos.
Elaboración de tablas.
Confección de gráficos.
Resumen de la información mediante parámetros.
Selección de caracteres:
Recogida de datos:
De cada coche del aparcamiento queremos saber:
Color.
Combustible que usa.
Nº de puertas.
Nº de cilindros
Potencia
Consumo (l/100km)
Blanco
Diesel
3 puertas
4 cilindros
105 CV
6,2 l
Negro
Gasolina
5puertas
4 cilindros
90 CV
7,5
Gris.
Diesel.
5 puertas
6 cilindros
130 CV.
7,6 l
Negro.
Gasolina.
2 puertas.
5 años.
150 CV.
10 s
Gris.
Diesel.
5 puertas
2 años.
130 CV.
10,7s
Gris.
Diesel.
5 puertas
2 años.
130 CV.
10,7s
Rojo
Diesel.
5 puertas
6 cilindos
90 V.
11,4 l
Gris.
Diesel.
5 puertas
2 años.
130 CV.
10,7s
Gris.
Diesel.
5 puertas
2 años.
130 CV.
10,7s
VARIABLES
ESTADÍSTICAS
VARIABLES CUALITATIVAS
VARIABLES CUANTITATIVAS
Cuantitativas discretas
Cuantitativas continuas
Toman valores no numéricos. Se describen con palabras.
Toman valores numéricos. Se pueden medir.
Solo toman valores aislados.
Pueden tomar cualquier valor de un intervalo.
Color del coche
Combutible
Nº de puertas
Potencia
Aceleración
COLOR: G, G, B, B, G, G, N, G, B, G, A, G, G, B, B, G, G, G, G, A, A, A, N, A, A, R, A, R, B, V, B, B, B, B, B, N, B, B, B, R, B, B, R, R, N, N, N, V, M, P
Variable estadística cualitativa.
16
12
7
6
5
4
TOTAL
50
Recuento
Nº de cilindros
Gráfico circular
Tabla de frecuencias (variable cualitativa)
Nº de cilindros: 4, 4, 3, 4, 8, 4, 6, 4, 5, 4, 6, 4, 4, 4, 4, 4, 4, 6, 8, 4, 4, 4, 6, 4, 5, 4, 5, 4, 4, 4, 6, 3, 8, 6, 8, 4, 8, 8, 6, 8, 8, 6, 4, 5, 4, 3
Variable cuantitativa discreta
Gráfico de barras:
Consumo medio (l/100 km): 7,9 - 4,3 - 7,1 -11,4 - 6,6 - 7 - 6,2 - 6,5 - 7 - 5,5 - 4,1 - 6 - 8 - 5,6 - 5,2 - 6 - 7,2 - 5,5 - 5,6 - 6,5 - 10,1 - 7,6 - 4,5 -7,2 - 7 - 4,5 - 5 - 5,5 - 10 - 5 - 5,5 - 5 - 9 - 4,5 - 7,2 - 5,4 - 5,5 - 6,2 - 6,3 - 5,4 - 4,5 - 5 - 5,4 - 5 - 7 - 10 - 7,5 - 8,7 - 10 - 8
Variable cuantitativa continua
Histograma
Para calcular el ángulo de cada sector circular hemos usado la fórmula:
Tablas
Gráficas:
Tabla de frecuencias
Variable cuantitativa continua
Tabla de frecuencias
variable cuantitativa discreta
Total: N = 50
nº de individuos en la muestra
¿Cómo se realiza un estudio estadístico?
Video del INE (instituto nacional de estadística)
Fuente: sitio web del ine: www.ine.es
Más ejemplos:
Estadística
Estadística descriptiva
Estadística inferencial
A partir de los datos de una muestra:
Elabora conclusiones para la población.
Estudia si esas conclusiones son fiables.
Datos ordenados de menor a mayor.
Total: N = 50
N
Tamaño de la muestra.
ESTADÍSTICA
Si la variable es continua, o, discreta con muchos valores distintos, agrupamos los datos en intervalos.
Dos formas posibles:
Elegimos el nº de intervalos y calculamos su amplitud con la fórmula:
Amplitud = (valor mayor - valor menor) / nº de intervalos
Elegimos la amplitud:
Nº intervalos = (valor mayor - valor menor) / amplitud
(Es conveniente que el nº intervalos esté entre 5 y 10)
El valor 5, 5 se cuenta en el intervalo [5,5 ; 7)
El valor 7 se cuenta en el intervalo [7; 8,5) ...
Fórmulas para calcular las marcas de clase
16
15
12
2
5
Total
50
Encontrarás más información interesante en: http://www.ine.es/explica/explica.htm
Otros tipos de gráficos:
Cartogramas
Piramides de población
Fuente: instituto de estadística. Comunidad de Madrid
Gráfico temporal
Fuente: Consejo Económico y Social (CES) Eurostat,INE. Ministerio de trabajo. EL PAÍS.
1
Total
50
1
100%
Total
50
1
100%
En el eje horizontal escribimos los valores que toma la variable.
En el vertical las frecuencias (generalmente,las absolutas).
La altura de la barra corresponde a la frecuencia de ese valor.
Fuente: jppi URL: http://mrg.bz//ZaYxtZ
Las frecuencias acumuladas de un valor se calculan sumando las frecuecias de los valores menores o iguales a él.
Autora: Teodora Martínez Hernaz
DESVIACIÓN MEDIA
MEDIA ARITMÉTICA
variable discreta
VARIANZA
Si calculamos la varianza con calculadora, es más fácil la fórmula:
DESVIACIÓN TÍPICA
DESVIACIÓN TÍPICA
PARÁMETROS DE CENTRALIZACIÓN
Un parámetro o medida de centralización es un valor de la distribución que representa a todos los demás.
Estudiaremos los siguientes:
Moda, Mo
Es el valor de la variable que tiene mayor frecuencia absoluta. La distribución puede tener más de una moda:
Si tiene 2 modas se dice que es bimodal, si tiene 3, trimodal, etc.
Si la variable es cualitativa, la moda es la única medida de centralización que se puede calcular.
En el ejemplo, la mayor frecuencia absoluta es f1 = 16, que corresponde al valor "blanco", la moda es:
Mo = Blanco
En este ejemplo, la mayor frecuencia es f2 = 25, que corresponde al valor 4:
Mo = 4 cilindros
Si los datos están agrupados en intervalos, la clase con mayor frecuencia se llama clase modal. Una aproximación a la moda es la marca de clase del intervalo (hay fórmulas para conseguir una mejor aproximación que no vamos a utilizar). También podemos calcular la moda gráficamente uniendo los extremos de la clase modal con los de las clases continuas, la abscisa del punto de corte es la moda.
Mediana, Me
Es el valor de la variable estadística que deja a su izquierda un número de datos igual a los que deja a su derecha.
Media Aritmética, x
Se obtiene dividiendo la suma de todos los valores que toma la variable por el número total de valores.
Mediana, v. discreta
VARIANZA, V. DISCRETA
Mediana, v. cont.
Desv. Típica discreta:
Desv.típica, v. continua:
VARIANZA, V. CONTINUA
EJEMPLOS.MEDIA EN UNA DISTRIBUCIÓN CONTINUA
Media aritmética, x
Si tenemos la tabla de frecuencias de la variable, la mediana será el primer valor cuya frecuencia absoluta acumulada sea mayor que la mitad de los datos (N/2)
>25
Como N/2 = 25
F1=3<N/2<F2=28
la mediana es el valor cuya frecuencia absoluta acumulada es 28, es decir:
Me = 4
<25
El primer intervalo cuya frecuencia absoluta acumulada supere a la mitad de los datos se llama clase mediana. Tomaremos como una aproximación a la mediana la marca de clase de este intervalo.
Podemos encontrar la mediana gráficamente usando el gráfico de frecuencias abs. acumuladas y la clase mediana. (Dibujo)
N/2 = 25
F1=15<N/2<F2=31
La clase mediana es el intervalo [5,5; 7)
Una aproximación a la mediana es:
Me = 6,25
DM, v. discreta
DM, v. continua
Interpretación de la desviación típica
Variación de la desviación típica
PARÁMETROS DE DISPERSIÓN
Dan una idea del "alejamiento de los datos respecto a las medidas de centralización, en especial de la media.
Estudiamos los siguientes:
Desviación media, DM
Media aritmética de los valores absolutos de la diferencia entre los valores o marcas de clase y la media.
Recorrido
El recorrido o rango es la diferencia entre el mayor y el menor valor de la variable.
R = x(máx) - x(mín)
R= 8-3 = 5
En el ejemplo he elegido que el nº de intervalos sea 5 y por tanto:
Amplitud = (11,4-4,1)/5 =1,46
Para no dejar ningún valor fuera tomamos amplitud 1,5
R = 11,4-4,1
Varianza
Es la media aritmética de los cuadrados de la diferencia entre cada valor o marca de clase y la media.
Desviación típica
Es la raíz cuadrada positiva de la varianza
Coeficiente de variación
Es el cociente entre la desviación típica y el valor absoluto de la media aritmética.