Introducing
Your new presentation assistant.
Refine, enhance, and tailor your content, source relevant images, and edit visuals quicker than ever before.
Trending searches
ESTADÍSTICA
Población
Muestra de tamaño n
Medidas de Resumen
Media muestral
Mediana muestral
Moda
Media muestral
X: número de hijos de una varón adulto que fue entrevistado.
X = (0.199 + 1.75 + 2.126 + 3.82 + 4.35 + 5.15 + 6.4 + 7.3 + 8.0 + 9.0 + 10.1) / 540
X = 1,56
Mediana muestral
¿Cómo se calcula la mediana de una muestra de n observaciones?
Se ordenan los datos de menor a mayor (incluyendo los valores que se repiten). La mediana es el dato que ocupa la posición central en la lista ordenada.
Pueden ocurrir dos casos:
Si el número de datos es impar, la mediana es el dato que ocupa la posición central.
Si el número de datos es par, la mediana es el promedio de los dos datos centrales.
X: número de hijos de una varón adulto que fue entrevistado.
n= 540; la mitad es 270, por lo tanto habría que sumar los números en las posiciones 270 y 271 y dividirlos por dos. En este caso la mediana será 1.
Moda
La moda es el dato que ocurre con mayor frecuencia dentro de un conjunto de datos.
Resulta útil sólo en el caso de datos categóricos, permitiéndonos identificar la categoría con mayor cantidad de datos.
Cuartiles
Los cuartiles (Q) son casos particulares, correspondientes a los percentiles 25, 50, 75 y 100.
Percentiles
Q1 → P25 (cuartil inferior)
Q2 → P50(mediana)
Q3 → P75 (cuartil superior)
Q4 → P100
El percentil p% (P) de un conjunto de datos es la observación que deja a lo sumo un p% de las observaciones debajo de él.
Por ejemplo: vimos que la mediana es el dato que ocupa la posición central en un conjunto dado y que coincide con el percentil 50 (P50); es decir que la mediana es la observación que deja a un 50% de los datos por debajo de él.
Desvío estandar
y varianza muestral
Coeficiente de
variación (CV)
Rango muestral
Rango intercuartil (RIC)
Definición
Fórmula de cálculo
La varianza muestral puede pensarse como un “promedio” de las distancias de los datos respecto de la media elevadas al cuadrado (para evitar que las distancias negativas y positivas se anulen entre sí).
Sin embargo, la varianza no tiene las mismas unidades que los datos (porque están elevadas al cuadrado).
Para salvar este inconveniente, se define la desviación estándar muestral como la raíz cuadrada de la varianza.
Coeficiente de variación (CV)
Rango muestral
El rango de una muestra de n observaciones (x1, x2, … , xn) es la diferencia entre la observación más grande o máximo (Xmáx) y la observación más pequeña o mínimo (Xmín).
Rango = Xmáx - Xmín
Rango intercuartil (RIC)
Es la distancia entre Q1 y Q3 e indica el rango donde se encuentra aproximadamente el 50% “central” de los datos.
RIC= Q3 - Q1
Tablas de frecuencias
Tablas de contingencia
Tablas de frecuencias
En el caso de los datos categóricos, se puede caracterizar la proporción de cada atributo por medio de una tabla de frecuencias. Esta tabla indica el número de unidades de análisis que caen en cada una de las clases de la variable cualitativa, pudiendo representarse la frecuencia absoluta, la frecuencia relativa o el porcentaje de cada categoría.
Tablas de contingencia
Permiten construir tablas de clasificación cruzada según diversos criterios de clasificación.
Gráfico de sectores
Gráfico de barras
Histograma
En el eje horizontal se representan los valores de la variable numérica y en el eje vertical una medida de frecuencia (frecuencia absoluta, relativa o relativa porcentual). Cada “clase” está asociada a una columna cuya base cubre el intervalo de la clase y cuya altura indica cuántos datos pertenecen a ella a través de la frecuencia. No existe un espacio entre las columnas de cada clase a menos que una clase esté vacía.
¿Cuántas clases deberíamos utilizar?
Existen distintas reglas para determinar un número apropiado de clases para un conjunto de datos. Por ejemplo:
Regla de Sturges → Nº de clases = 1 + 3,3. log (n)
Diagrama de densidad de puntos
Permite observar dónde se encuentran efectivamente los casos observados y es especialmente útil cuando la cantidad de datos es pequeña.
Diagrama de cajas (Box-Plot)
Diagrama de dispersión
Muestra un conjunto de puntos ordenados en el plano por sus coordenadas X e Y.
Se utiliza cuando se quiere visualizar la variación conjunta de dos variables cuantitativas.
ESTIMACIÓN PUNTUAL
La distribución de cada variable aleatoria tiene parámetros que la caracterizan (por ejemplo, en el caso de una v.a. binomial los parámetros son m y p, en el caso de una v.a. Poisson hay un único parámetro y en caso de una v.a. normal los parámetros son μ y ).
Estos parámetros son generalmente desconocidos dado que son poblacionales y la población es usualmente inaccesible, como mencionamos previamente. Pero podemos estimar estos parámetros a través de estimadores obtenidos a partir de una muestra.
Llamamos “estimador insesgado” a aquel que, al calcularle su esperanza nos da como resultado el parámetro que se desea estimar.
Ahora que aprendimos sobre estadística descriptiva
¿Qué podemos decir de esta imagen?