Loading presentation...

Present Remotely

Send the link below via email or IM

Copy

Present to your audience

Start remote presentation

  • Invited audience members will follow you as you navigate and present
  • People invited to a presentation do not need a Prezi account
  • This link expires 10 minutes after you close the presentation
  • A maximum of 30 users can follow your presentation
  • Learn more about this feature in our knowledge base article

Do you really want to delete this prezi?

Neither you, nor the coeditors you shared it with will be able to recover it again.

DeleteCancel

Make your likes visible on Facebook?

Connect your Facebook account to Prezi and let your likes appear on your timeline.
You can change this under Settings & Account at any time.

No, thanks

Estadística Descriptiva

Esta creación contiene la unidad I y II
by

Daniel German Jiménez Doria

on 6 October 2012

Comments (0)

Please log in to add your comment.

Report abuse

Transcript of Estadística Descriptiva

ESTADÍSTICA DESCRIPTIVA UNIDAD I TEMAS Estadística.
Población y Muestreo.
Variables. Estadística Estudia los métodos científicos para recoger, organizar, resumir y analizar datos, así como para sacar conclusiones válidas y tomar decisiones razonables basadas en tal análisis. En un sentido menos amplio, el término estadística se usa para denotar los propios datos, o números derivados de ellos, tales como los promedios. Así se habla de estadística de empleo, estadística de accidentes, etc. Población y Muestreo:
Estadística Inductiva y Descriptiva En vez de examinar el grupo entero, llamado población o universo, se examina una pequeña parte del grupo, llamada muestra.
Una población puede ser finita o infinita. Por ejemplo, la población consiste en todas las tuercas producidas por una fábrica un cierto día, es finita, mientras que la determinada por todos los posibles resultados (caras, cruces) de sucesivas tiradas de una moneda es infinita. Si una muestra es representativa de una población, es posible inferir importantes conclusiones sobre la población a partir del análisis de la muestra. La fase de la estadística que trata con las condiciones bajo las cuales tal diferencia es válida se llama estadística inductiva o inferencia estadística. Ya que dicha inferencia no es del todo exacta, el lenguaje de las probabilidades aparecerá al establecer nuestras conclusiones.
La parte de estadística que sólo se ocupa de describir y analizar un grupo dado, sin sacar conclusiones sobre un grupo mayor, se llama estadística descriptiva o deductiva. Variables: Discretas y continuas Una variables es un símbolo, tal como X, Y, H, x o B, que puede tomar un conjunto prefijado de valores, llamado Dominio de esa variable. Si la variable puede tomar un solo valor, se llama constante.
Una variable que puede tomar cualquier valor entre dos valores se dice que es una variable continua; en caso contrario diremos que la variable es discreta. Ejemplo de variable discreta El número de niños es 4 Ejercicio propuesto 1. Número de acciones vendidas en un día en la bolsa de valores.
2. Altura de un grupo de estudiantes.
3. Número de hijos en una familia. ... small UNIDAD II TEMAS
Filas de datos.
Ordenaciones.
Distribuciones de frecuencias.
Intervalos de clase y límites de clase.
Fronteras de clase.
Tamaño o anchura de un intervalo de clase.
Marca de clase.
Reglas generales para formar distribuciones de frecuencias.
Hitogramas y poligonos de frecuencias.
Distribuciones de frecuencias relativas.
Distribuciones de frecuencias acomuladas y ojivas.
Distribuciones de frecuencias acumuladas y ojivas. Fila de Datos Una fila de datos consiste en datos recogidos que no han sido organizados numéricamente, por ejemplo, las alturas de 100 estudiantes por letra alfabética. Ordenaciones Una ordenación es un conjunto de datos númericos en orden creciente o decreciente. La diferencia entre el mayor y el menor se llama rango de ese conjunto de datos. Así, la mayor altura entre los 100 estudiantes era de 74 in y la menor de 60 in, el rango es de 74-60=14 in El símbolo que define una clase, como el 60-62 en la tabla, se llama un intervalo de clase. Los números extremos, 60 y 62, se llaman límite inferior de clase (60) y límite superior de clase (62). Con frecuencia se intercambian los términos clase e intervalo de clase, aunque el intervalo de clase es un símbolo para la clase. Un intervalo de clase que, al menos en teoría, carece de límite superior o inferior indicado, se llama intervalo de clase abierto. Por ejemplo, refiriéndonos a edades de personas, la clase "65 años o mas" es un intervalo de clase abierto. Intervalos de clase y limites de clase Fronteras de clase Si se dan alturas con precisión de 1 in, el intervalo de clase 60-62 incluye teóricamente todas las medidas desde 59.500 a 62.500 in. Estos números, indicados más brevemente por los números exactos 59.5 y 62.5, se llaman fronteras de clase o verdaderos límites de clase; el menor (59.5) es la frontera inferior y el mayor (62.5) la frontera superior. En la práctica, las fronteras de clase se obtienen promediando el límite superior de una clase con el inferior siguiente.
A veces se usan las fronteras de clase como símbolos para la clase. Así, las clases de la primera columna de la tabla anterior se pueden indicar por 59.5-62.5, 62.5-65.5, etc. Para evitar ambigüedad en tal notación, las fronteras no deben coincidir con valores realmente medidos. De modo que si una observación diera 62.5, no sería posible decidir si pertenece al intervalo de clase 59.5-62.5 o al 62.5-65.5. Tamaño o anchura de un intervalo de clase Es la diferencia entre las fronteras de clase superior e inferior. Si todos los intervalos de clase de un distribución de frecuencias tienen la misma anchura, la denotaremos por c. En tal caso, c es igual a la diferencia entre dos limites inferiores (o superiores) de clases sucesivas. Para la tabla anterior, por ejemplo, 62-60=2. 2 seria la anchura de clase. Marca de clase Es el punto medio del intervalo de clase y se obtiene promediando los límites inferior y superior de clase. Así que las marcas de clase del intervalo 60-62 es (60+62)/2=61. La marca de clase se denomina punto medio de la clase. Reglas generales para formar Distribuciones de Frecuencias 1. Determinar el mayor y el menor de todos los datos, hallando así el rango (diferencia entre ambos).
2. Dividir el rango en un número adecuado de intervalos de clase del mismo tamaño. Si ello no es factible, usar intervalos de clase de distintos tamaños o intervalos de clase abiertos. Se suelen tomar entre 5 y 20 intervalos de clase, según los datos. Los intervalos de clase se eligen también de modo tal que las marcas de clase (o puntos medios) coincidan con datos realmente observados. Ello tiende a disminuir el llamado error de agrupamiento que se produce en análisis anteriores. No obstante, las fronteras de clase no debieran coincidir con datos realmente observados.
3. Determinar el número de observaciones que caen dentro de cada intervalo de clase; esto es, hallar las frecuencias de clase. DISTRIBUCIONES DE FRECUENCIAS Al resumir grandes colecciones de datos, es útil distribuirlos en clases y categorías, y determinar el número de individuos que pertenecen a cada clase, llamado frecuencia de clase. Una disposición tabular de los datos por clase junto con las correspondientes frecuencias de clase, se llama distribución de frecuencias (ó tablas de frecuencias). La tabla es una distribución de frecuencia de alturas (con precisión de una pulgada) de 100 estudiantes varones de la universidad XYZ. La primera clase (o categoría), por ejemplo, consta de las alturas entre 60-62 in, y se indica por el rango 60-62. Como hay 5 estudiante en esta clase, la correspondiente frecuencia de clase es 5. Los datos así organizados en clases como en la anterior distribución de frecuencias se llaman datos agrupados. Aunque el proceso de agrupamiento destruye en general detalles de los datos iniciales, es muy ventajosa la visión nítida obtenida y las relaciones evidentes que saca a la luz. A efectos de análisis subsiguientes, todas las observaciones pertenecientes a un mismo intervalo de clase se supone que coinciden con la marca de calse. De manera que todas las alturas en el intervalo de clase 60-62 se consideraran de 61 in HISTOGRAMAS Y POLÍGONOS DE FRECUENCIAS Los histogramas y los polígonos de frecuencias son dos representaciones gráficas de las distribuciones de frecuencia.
Un Histograma o histograma de frecuencias, consiste en un conjunto de rectángulos con: a) bases en el eje X horizontal, centros en las marcas de clase y longitudes iguales a los tamaños de los intervalos de clase y b) áreas proporcionales a las frecuencias de clase. Si los intervalos de clase tienen todos la misma anchura, las alturas de los rectángulos son proporcionales a las frecuencias de clase, y entonces e costumbre tomar las alturas iguales a las frecuencias de clase. En caso contrario deben ajustarse las alturas.
Un polígono de frecuencias es un gráfico de trozos de la frecuencia de clase con relación a la marca de clase. Puede obtenerse conectando los puntos medios de las partes superiores de los rectángulos del histograma. HISTOGRAMA DE FRECUENCIA DISTRIBUCIONES DE FRECUENCIAS RELATIVAS La frecuencia relativa de una clase es su frecuencia dividida por la frecuencia total de todas las clases y se expresa generalmente como un porcentaje. Por ejemplo, la frecuencia relativa de la clase 66-68 en la tabla de distribución de frecuencia es 42/100=42%. La suma de las fecuencias relayivas de todas las clases da obviamente 1, o sea 100 por 100. Si se sustituyen las frecuencias de la tabla por las correspondientes frecuencias relativas, la tabla resultantes se llama una distribución de frecuencias relativas, distribución de porcentajes o tablas de frecuencias relativas. La representación gráfica de distribuciones de frecuencias relativas se puede obtener del histograma o del polígono de frecuencias sin más que cambiar la escala vertical de frecuencias a frecuencias relativas, manteniendo exactamente el mismo diagrama. Los gráficos resultntes se llaman histogramas de frecuencias relativas (o histogramas de porcentajes) y polígonos de frecuencias relativas (o polígonos de porcentajes), respectivamente. DISTRIBUCIONES DE FRECUENCIAS ACUMULADAS Y OJIVAS La frecuencia total de todos los valores menores que la frontera de clase superior de un intervalo de clase dado se llama frecuencia acumulada hasta ese intervalo de clase inclusive. Por ejemplo, la frecuencia acumulada hasta el intervalo de clase 66-68 en la tabla anterior es 5+18+42 = 65 estudiantes tienen alturas por debajo de 68.5 in. Una tabla que presente tales frecuencias acumuladas se llama una distribución de frecuencias acumuladas, tabla de frecuencias acumuladas, o brevemente una distribución acumulada, y se muestra en la siguiente tabla para distribución de alturas de la tabla anterior. Un gráfico que recoja las frecuencias acumuladas por debajo de cualquier fronteras de clase superiores respecto de dicha frontera se llama un polígono de frecuencias acumuladas u ojiva. A ciertos efectos, es deseable considerar una distribución de frecuencias acumuladas de todos los valores mayores o iguales que la frontera de clase infeior de cada intervalo de clase.Estas ojivas pueden ser menor que ó mas. Mayor que Menor que DISTRIBUCIONES DE FRECUENCIAS RELATIVAS Y OJIVAS DE PORCENTAJES La frecuencia acumulada relativa o frecuencia acumulada en porcentajes, es la frecuencia acumulada por la frecuencia total. Así, la frecuencia acumulada relativa de alturas menores que 68.5 in es 65/100=65%, lo que significa que el 65% de los estudiantes mide menos de 68.5 in. Si se usan frecuencias acumuladas relativas en la tabla anterior en vez de usar frecuecias cumuladas, los resultados se llaman distribuciones de frecuencias acumuladas relativas (o distribuciones acumuladas en porcentajes) y polígonos de frecuencias acumuladas relativas (u ojivas de porcentajes)m respectivamente. TIPOS DE CURVAS DE FRECUENCIA
Full transcript