Loading presentation...

Present Remotely

Send the link below via email or IM

Copy

Present to your audience

Start remote presentation

  • Invited audience members will follow you as you navigate and present
  • People invited to a presentation do not need a Prezi account
  • This link expires 10 minutes after you close the presentation
  • A maximum of 30 users can follow your presentation
  • Learn more about this feature in our knowledge base article

Do you really want to delete this prezi?

Neither you, nor the coeditors you shared it with will be able to recover it again.

DeleteCancel

Make your likes visible on Facebook?

Connect your Facebook account to Prezi and let your likes appear on your timeline.
You can change this under Settings & Account at any time.

No, thanks

Estadística

Estadística descriptiva. Tablas y gráficos
by

Teodora Martinez

on 21 October 2013

Comments (0)

Please log in to add your comment.

Report abuse

Transcript of Estadística

Es la ciencia que se ocupa de la recogida de datos , su organización y análisis, así como de las predicciones que, a partir de estos datos, pueden hacerse.
Se encarga de recoger, organizar, clasificar y analizar los datos.
Características o propiedades que estudiamos de los elementos que forman la población
Conceptos básicos
Conjunto de elementos objeto de estudio.
Subconjunto de la población que se toma para facilitar el estudio
Población
Muestra
Individuo
Ejemplo: coches en un aparcamiento
Cada elemento de la población o muestra
Pasos a seguir en un estudio estadístico:
Selección de la muestra y de las características que interesa estudiar.
Recogida de datos.
Organización y clasificación de los datos.
Elaboración de tablas.
Confección de gráficos.
Resumen de la información mediante parámetros.
Selección de caracteres:
Recogida de datos:
De cada coche del aparcamiento queremos saber:
Color.
Combustible que usa.
Nº de puertas.
Nº de cilindros
Potencia
Consumo (l/100km)
Blanco
Diesel
3 puertas
4 cilindros
105 CV
6,2 l
Negro
Gasolina
5puertas
4 cilindros
90 CV
7,5
Gris.
Diesel.
5 puertas
6 cilindros
130 CV.
7,6 l
Negro.
Gasolina.
2 puertas.
5 años.
150 CV.
10 s
Gris.
Diesel.
5 puertas
2 años.
130 CV.
10,7s
Gris.
Diesel.
5 puertas
2 años.
130 CV.
10,7s
Rojo
Diesel.
5 puertas
6 cilindos
90 V.
11,4 l
Gris.
Diesel.
5 puertas
2 años.
130 CV.
10,7s
Gris.
Diesel.
5 puertas
2 años.
130 CV.
10,7s
VARIABLES
ESTADÍSTICAS
VARIABLES CUALITATIVAS
VARIABLES CUANTITATIVAS
Cuantitativas discretas
Cuantitativas continuas
Toman valores no numéricos. Se describen con palabras.
Toman valores numéricos. Se pueden medir.
Solo toman valores aislados.
Pueden tomar cualquier valor de un intervalo.
Color del coche
Combutible
Nº de puertas
Potencia
Aceleración
COLOR: G, G, B, B, G, G, N, G, B, G, A, G, G, B, B, G, G, G, G, A, A, A, N, A, A, R, A, R, B, V, B, B, B, B, B, N, B, B, B, R, B, B, R, R, N, N, N, V, M, P
Variable estadística cualitativa.
16
12
7
6
5
4
TOTAL
50
Recuento
Nº de cilindros
Gráfico circular
Tabla de frecuencias (variable cualitativa)
Nº de cilindros: 4, 4, 3, 4, 8, 4, 6, 4, 5, 4, 6, 4, 4, 4, 4, 4, 4, 6, 8, 4, 4, 4, 6, 4, 5, 4, 5, 4, 4, 4, 6, 3, 8, 6, 8, 4, 8, 8, 6, 8, 8, 6, 4, 5, 4, 3
Variable cuantitativa discreta
Gráfico de barras:
Consumo medio (l/100 km): 7,9 - 4,3 - 7,1 -11,4 - 6,6 - 7 - 6,2 - 6,5 - 7 - 5,5 - 4,1 - 6 - 8 - 5,6 - 5,2 - 6 - 7,2 - 5,5 - 5,6 - 6,5 - 10,1 - 7,6 - 4,5 -7,2 - 7 - 4,5 - 5 - 5,5 - 10 - 5 - 5,5 - 5 - 9 - 4,5 - 7,2 - 5,4 - 5,5 - 6,2 - 6,3 - 5,4 - 4,5 - 5 - 5,4 - 5 - 7 - 10 - 7,5 - 8,7 - 10 - 8
Variable cuantitativa continua
Histograma
Para calcular el ángulo de cada sector circular hemos usado la fórmula:
Tablas
Gráficas:
Tabla de frecuencias
Variable cuantitativa continua
Tabla de frecuencias
variable cuantitativa discreta
Total: N = 50
nº de individuos en la muestra
¿Cómo se realiza un estudio estadístico?
Video del INE (instituto nacional de estadística)
Fuente: sitio web del ine: www.ine.es
Más ejemplos:
Estadística
Estadística descriptiva
Estadística inferencial
A partir de los datos de una muestra:
Elabora conclusiones para la población.
Estudia si esas conclusiones son fiables.
Datos ordenados de menor a mayor.
Total: N = 50
N
Tamaño de la muestra.
ESTADÍSTICA
Si la variable es continua, o, discreta con muchos valores distintos, agrupamos los datos en intervalos.
Dos formas posibles:
Elegimos el nº de intervalos y calculamos su amplitud con la fórmula:
Amplitud = (valor mayor - valor menor) / nº de intervalos
Elegimos la amplitud:
Nº intervalos = (valor mayor - valor menor) / amplitud
(Es conveniente que el nº intervalos esté entre 5 y 10)
El valor 5, 5 se cuenta en el intervalo [5,5 ; 7)
El valor 7 se cuenta en el intervalo [7; 8,5) ...
Fórmulas para calcular las marcas de clase
16
15
12
2
5
Total
50
Encontrarás más información interesante en: http://www.ine.es/explica/explica.htm
Otros tipos de gráficos:
Cartogramas
Piramides de población
Fuente: instituto de estadística. Comunidad de Madrid
Gráfico temporal
Fuente: Consejo Económico y Social (CES) Eurostat,INE. Ministerio de trabajo. EL PAÍS.
1
Total
50
1
100%
Total
50
1
100%
En el eje horizontal escribimos los valores que toma la variable.
En el vertical las frecuencias (generalmente,las absolutas).
La altura de la barra corresponde a la frecuencia de ese valor.
Fuente: jppi URL: http://mrg.bz//ZaYxtZ
Las frecuencias acumuladas de un valor se calculan sumando las frecuecias de los valores menores o iguales a él.
Autora: Teodora Martínez Hernaz
DESVIACIÓN MEDIA

MEDIA ARITMÉTICA
variable discreta
VARIANZA

Si calculamos la varianza con calculadora, es más fácil la fórmula:


DESVIACIÓN TÍPICA

DESVIACIÓN TÍPICA

PARÁMETROS DE CENTRALIZACIÓN
Un parámetro o medida de centralización es un valor de la distribución que representa a todos los demás.
Estudiaremos los siguientes:

Moda, Mo
Es el valor de la variable que tiene mayor frecuencia absoluta. La distribución puede tener más de una moda:
Si tiene 2 modas se dice que es bimodal, si tiene 3, trimodal, etc.
Si la variable es cualitativa, la moda es la única medida de centralización que se puede calcular.
En el ejemplo, la mayor frecuencia absoluta es f1 = 16, que corresponde al valor "blanco", la moda es:
Mo = Blanco
En este ejemplo, la mayor frecuencia es f2 = 25, que corresponde al valor 4:
Mo = 4 cilindros
Si los datos están agrupados en intervalos, la clase con mayor frecuencia se llama clase modal. Una aproximación a la moda es la marca de clase del intervalo (hay fórmulas para conseguir una mejor aproximación que no vamos a utilizar). También podemos calcular la moda gráficamente uniendo los extremos de la clase modal con los de las clases continuas, la abscisa del punto de corte es la moda.
Mediana, Me
Es el valor de la variable estadística que deja a su izquierda un número de datos igual a los que deja a su derecha.
Media Aritmética, x
Se obtiene dividiendo la suma de todos los valores que toma la variable por el número total de valores.
Mediana, v. discreta

VARIANZA, V. DISCRETA

Mediana, v. cont.

Desv. Típica discreta:

Desv.típica, v. continua:

VARIANZA, V. CONTINUA

EJEMPLOS.MEDIA EN UNA DISTRIBUCIÓN CONTINUA

Media aritmética, x

Si tenemos la tabla de frecuencias de la variable, la mediana será el primer valor cuya frecuencia absoluta acumulada sea mayor que la mitad de los datos (N/2)
>25
Como N/2 = 25
F1=3<N/2<F2=28
la mediana es el valor cuya frecuencia absoluta acumulada es 28, es decir:
Me = 4
<25
El primer intervalo cuya frecuencia absoluta acumulada supere a la mitad de los datos se llama clase mediana. Tomaremos como una aproximación a la mediana la marca de clase de este intervalo.
Podemos encontrar la mediana gráficamente usando el gráfico de frecuencias abs. acumuladas y la clase mediana. (Dibujo)
N/2 = 25
F1=15<N/2<F2=31
La clase mediana es el intervalo [5,5; 7)
Una aproximación a la mediana es:
Me = 6,25
DM, v. discreta

DM, v. continua

Interpretación de la desviación típica

Variación de la desviación típica

PARÁMETROS DE DISPERSIÓN
Dan una idea del "alejamiento de los datos respecto a las medidas de centralización, en especial de la media.
Estudiamos los siguientes:
Desviación media, DM
Media aritmética de los valores absolutos de la diferencia entre los valores o marcas de clase y la media.
Recorrido
El recorrido o rango es la diferencia entre el mayor y el menor valor de la variable.
R = x(máx) - x(mín)
R= 8-3 = 5
En el ejemplo he elegido que el nº de intervalos sea 5 y por tanto:
Amplitud = (11,4-4,1)/5 =1,46
Para no dejar ningún valor fuera tomamos amplitud 1,5
R = 11,4-4,1
Varianza
Es la media aritmética de los cuadrados de la diferencia entre cada valor o marca de clase y la media.
Desviación típica
Es la raíz cuadrada positiva de la varianza
Coeficiente de variación
Es el cociente entre la desviación típica y el valor absoluto de la media aritmética.
Full transcript