Introducing
Your new presentation assistant.
Refine, enhance, and tailor your content, source relevant images, and edit visuals quicker than ever before.
Trending searches
Medidas de tendencia central y de dispersión
Media
Una medida de tendencia central que comúnmente se usa es la media, también conocida
como valor promedio o simplemente promedio. Se calcula de esta manera:
Mediana
La mediana es el valor que se encuentra exactamente a la mitad de un arreglo ordenado,
es decir, el conjunto de datos ordenados de menor a mayor. De lo anterior se deduce que
la mitad de las observaciones son menores o iguales a la mediana.
Para determinar el valor de la mediana primero se obtiene el arreglo ordenado de
los datos con los que estemos trabajando y luego se identifica la mediana. Para calcular
la mediana debemos considerar dos casos:
ӹ Si el número de datos (n) es impar, la mediana es el valor de en medio.
ӹ Si el número de datos (n) es par, la mediana es el promedio de las dos observaciones
de en medio.
Al contrario de la media, a la mediana no la afectan valores extremos o aberrantes, ya
que sólo considera la posición del valor central.
Moda
La moda es el valor que más se repite en una lista de datos, es decir, el que se presenta
con mayor frecuencia. Puede darse el caso que haya dos modas en una lista de datos, lo
que recibe el nombre de bimodal. Si hay más de dos modas, se denomina multimodal
El sesgo describe cómo es la distribución de los datos, ya que indica hacia dónde tienden
a concentrarse éstos. Una distribución puede ser
Simétrica, si la mayor concentración de datos se localiza en el centro de la distribución
Sesgada a la derecha, si la mayor concentración de datos está a la izquierda de la
distribución.
ӹ Sesgada a la izquierda, si la mayoría de los datos están concentrados a la derecha.
Es importante también analizar cuán cercanos o lejanos están los datos respecto, por
ejemplo, al valor medio. Para determinar esto se recurre a las llamadas medidas de dispersión
o de variabilidad; de ellas, las medidas más importantes son el rango, la varianza
y la desviación estándar
Rango
El rango, a veces también denominado recorrido, es la medida de dispersión más fácil de
determinar, ya que sólo depende de dos valores. Se calcula de esta manera:
R = Xmáx − Xmín
donde R es el rango o recorrido.
Xmáx es el valor máximo del arreglo ordenado.
Xmín es el valor mínimo del arreglo ordenado.
Algunas desventajas que presenta el rango son:
ӹ Ignora la distribución de los datos, es decir, no considera si es unimodal o multimodal,
o cuál es el sesgo.
ӹ Los valores aberrantes influyen en el valor del rango.
Con este ejemplo podemos
notar que las dos muestras
tienen el mismo rango o
recorrido, así como los
mismos valores máximos
y mínimos, pero las distribuciones
son distintas. La
moda de la muestra 1 es 2,
en tanto que la moda de la
muestra 2 es 3.
Varianza
La varianza es la medida de dispersión más importante, pues tiene como base el promedio
aritmético de las desviaciones (distancia de un valor con respecto a la media)
elevado al cuadrado. En otras palabras, muestra cuán alejados o cuán cercanos están los
datos respecto a la media.
DESVIACION ESTANDAR
Podemos calcular cada una de las medidas, ya sea de forma manual o con las funciones de
Excel, que proporciona la herramienta Estadística descriptiva, que aparece al hacer clic en
el botón Análisis de datos de la ficha Datos. Si este complemento no aparece instalado en tu
versión, revisa el apéndice correspondiente al final del libro para saber cómo instalarlo.