Loading presentation...

Present Remotely

Send the link below via email or IM

Copy

Present to your audience

Start remote presentation

  • Invited audience members will follow you as you navigate and present
  • People invited to a presentation do not need a Prezi account
  • This link expires 10 minutes after you close the presentation
  • A maximum of 30 users can follow your presentation
  • Learn more about this feature in our knowledge base article

Do you really want to delete this prezi?

Neither you, nor the coeditors you shared it with will be able to recover it again.

DeleteCancel

Make your likes visible on Facebook?

Connect your Facebook account to Prezi and let your likes appear on your timeline.
You can change this under Settings & Account at any time.

No, thanks

ESTADÍSTICA

No description

Comments (0)

Please log in to add your comment.

Report abuse

Transcript of ESTADÍSTICA

ESTADÍSTICA
Contenido resumido
Estadística Descriptiva
PROBABILIDAD
Rama de la matemática que propone modelos para estudiar la incertidumbre. Este concepto surge en los juegos de azar, cuando se propuso la definición clásica de probabilidad de un suceso.
Variable aleatoria
Una variable aleatoria es una fución que asocia un número con cada elemento del espacio muestral
Topic 5
Topic 6
Topic 7
•Estadística Descriptiva
•Teoría de la Probabilidad
•Variables aleatorias Unidimensionales y Multidimensionales
•Introducción a la Inferencia Clásica
•Estadística Ambiental
Conjunto de herramientas y técnicas que tratan de resumir o permitir un buen manejo de la información contenida en un conjunto de datos
¿Qué es un atributo?
¿Qué es una variable?
¿A qué se refieren los términos cuantitativo y cualitativo?
¿Qué son variables discretas y continuas?

Medidas de las variables
Los datos pueden clasificarse en dos categorías:
Cuantitativos: hacen referencia a la información numérica y se miden en una escala numérica. Ej: el precio en pesos. A su vez se pueden clasificar en:
Discretos: se obtienen de un proceso de conteo. Ej: el numero de hijos en una familia
Continuos: se obtienen de un proceso de medición, que puede estar en un intervalo. Ej: la estatura en centimetros.
Cualitativos: hacen referencia a categorías o atributos, que se pueden clasificar según un criterio o cualidad. Ej: el tipo de sangre en A, B, AB, O
Escalas de medición
Los datos tambien se pueden clasificar según la escala de medición o el procedimiento que los generó.
Escala nominal: para datos cuantitativos y cualitativos. Los datos no tiene un orden especifico. Simplemente se agrupan en categorías discretas. Ej: números de telefonos, el genero, la raza...
Escala ordinal: se utiliza cuando se puedan ordenar las categorías de la variable según algún criterio. Ej: rangos acad{emicos
Escala de intervalo: para datos cuantitativos. Permite calcular las distancias entre valores. Ej: pruebas de inteligencia, la temperatura.
Escala de razón: para datos cuantitativos. Se establece una razón entre los datos. Ej: el peso.
Presentación gráfica de los datos
Gráficos de barras: presenta la frecuencia o número de miembros de cada categoría
Diagramas circulares: presenta la frecuencia o numero de miembros en forma porcentual
Histogramas: es una forma de representación gráfica de las distribuciones de frecuencia
Polígonos de frecuencias: se utilizan para representar los datos de intervalos o de razones
ESCALA DE VALORES Y PRESENTACIÓN GRÁFICA DE DATOS
MEDIDAS DE TENDENCIA CENTRAL Y DE VARIABILIDAD
CONCEPTOS BÁSICOS
Medidas de tendencia central
Media
Mediana
Moda
Permiten resumir un conjunto de datos de forma que se dé una visión general de este.
Medida de representación central
La media aritmética es un promedio estándar que a menudo se denomina "promedio"
X =
n
X
i
i = 1
n
n
es el número de observaciones
X
es el valor de cada observación
X
media aritmética o simplemente media
Media aritmética
Por ejemplo, la media aritmética de 34, 27, 45, 55, 22, 34 (seis valores) es 36,167
Media Geométrica
La media geométrica es un promedio muy útil en conjuntos de números que son interpretados en orden de su producto
X
g
=
X
i
n
i = 1
1/n
Existen dos usos principales de la media geométrica:

1. Para promediar porcentajes, índices y cifras relativas y
2. Para determinar el incremento porcentual promedio en ventas, producción u otras actividades o series económicas de un periodo a otro.
Ejercicio: Supóngase que las utilidades obtenidas por una compañía constructora en cuatro proyectos fueron de 3, 2, 4 y 6%, respectivamente. ¿ Cuál es la media geométrica de las ganancias?.
Media armónica
La media armónica es un promedio muy útil en conjuntos de números que se definen en relación con alguna unidad. Promedia un grupo de razones.
X
=
n
i = 1
n
1
x
i
Ejercicio: Supóngase que una familia realiza un viaje en automóvil a un ciudad y cubre los primeros 100 km a 60 km/h, los siguientes 100 km a 70 km/h y los últimos 100 km a 80 km/h. Calcular, en esas condiciones, la velocidad media realizada.
Media ponderada
A veces puede ser útil otorgar pesos o valores a los datos dependiendo de su relevancia para determinado estudio. En esos casos se puede utilizar una media ponderada
Ejercicio: Si la asignatura A tiene un valor de 2 créditos y la asignatura B tiene un valor de 3 créditos. Entonces, para un estudiante que haya obtenido una calificación de 4 en la asignatura A y de 5 en la asignatura B, ¿Cuál sera la nota promedio ponderada?
X
a
p
=
X
i
W
i
W
i
i = 1
i = 1
n
n
Distribución de datos:
Tipo I.
un número pequeño de observaciones y pocas repeticiones. No es necesario agrupar
Tipo II.
un gran número de observaciones y muchas de ellas repetidas. Se genera una tabla de frecuencia
Tipo III.
muchas observaciones y la mayoría distintas. Se agrupan en intervalos
Se define como el valor que divide una distribución de datos ordenados en dos mitades. Es menos sensible a los datos extremos.
X
~
X
n+1
2
X
n
2
+
X
n
2
+
1
Si n es un número impar
Si n es un número par
Ejercicio: Suponga que se tienen las duraciones en horas de un cierto tipo de lamparas incandescentes, ¿cuál es la mediana?
612,623, 666, 744, 883, 898, 964, 970, 983, 1003, 1016, 1022, 1029, 1058, 1085, 1088, 1122, 1135, 1197, 1201.
Es el valor que ocurre con mas frecuencia. Puede existir mas de una moda para todos los datos (variables bimodales, trimodales, etc)
M
e
=
Para distribuciones unitarias, la moda es el valor mayor que se observa en la tabla de frecuencias. A esta se le denomina Moda Absoluta
Moda Absoluta
Moda relativa
En distribuciones no unitarias, la moda relativa es aquel valor de la variable (o variables) cuya frecuencia absoluta no es superada por las de sus valores contiguos
Ejercicio: calcule la moda de los siguientes datos: 40, 37, 6, 4, 4, 4, 2, 1, 1
MEDIDAS DE VARIABILIDAD
Permite caracterizar la naturaleza de los datos
Rango
Cuartiles
Deciles
Percentiles
Rango intercuantilico
Desviación estándar y varianza
Se define como la diferencia entre las observaciones máxima y mínima de una distribución
R = X - X
máx
mín
Ej: para el siguiente conjunto de datos calcule el rango: 5, 2, 2, 1, 5, 3, 2, 3, 4
Dividen a la distribución en cuatro partes iguales, cada uno con el mismo número de observaciones (25%). Los puntos que separan los cuartiles se llaman cuantiles y son Q1, Q2 y Q3.
K * n / 4
K=1,2,3
Dividen el conjunto de los datos en 10 partes iguales (10% cada parte).
K * n / 10
K=1, 2, 3,...,9
Para datos agrupados el cuantil se calcula así:
Q
k
=
L +
(K*n/4)-F
i
i-1
f
i
a
i
L
i
limite inferior de la clase donde se encuentra el cuartil
F
i-1
frecuencia acumulada anterior
a
i
es la amplitud del cuartil
Un percentil es el valor sobre la escala de medida debajo del cual cae un porcentaje dado de los datos en la distribución.
Se define como la diferencia entre el tercer cuantil y el primer cuantil
Q = Q - Q
1
3
Desviación estándar: es una medida de la dispersión con respecto a la media, y es sensible a cada dato de la distribución.
S =
n
(X - X)
i
n - 1
i = 1
S =
n
(X - X)
i
n - 1
i = 1
2
Desviación estandar
Varianza
Es la base moderna de la estadística
Experimento aleatorio
Es la acción que se realiza para obtener información. Los datos son la información que da el resultado de experimentos. Ej: lanzamiento de una moneda.
Espacio muestral
Sucesos aleatorios
Población
Es el conjunto de elementos, individuos o entes sujetos a estudio y de los cuales queremos obtener un resultado.
Muestra
Es un subconjunto de casos o individuos de una población estadística. Las muestras se obtienen con la intención de inferir propiedades de la totalidad de la población, para lo cual deben ser representativas de la misma
Espacio del que se toma una muestra concreta, está formado por el conjunto de todas las posibles muestras que se pueden extraer de una población mediante una determinada técnica de muestreo.
Es un subconjunto del espacio muestral. Se denota con letras mayúsculas del alfabeto. Un suceso se denomina también como una expectativa, un enunciado que podría verificarse al realizar el experimento, o no verificarse. También se conoce como evento.
PROBABILIDAD
Frecuencia relativa
n ( A )
n
0 ≤
≤ 1
Definición axiomática de probabilidad
La función P(A) cumple las siguientes propiedades:
1. 0≤P(A)≤1
2. P(S)=1
3. Si A B=
Entonces P(A U B)=P(A)+P(B)
Teorema 1: la probabilidad del vacío es cero
Teorema 2: P(A') = 1 - P(A)
Teorema 3: P(A U B) = P(A) + P(B) - P(A B)
U
U
Teorema 4: P(A U B U C) = P(A) + P(B) + P(C) -
P(A B) - P(A C) - P(B C) + P(A B C)
U
U
U
U
U
Teorema 5: sea una sucesión de sucesos A , A ,..., A .
P(A U A U...U A ) = P(A ) + P(A )+...+ P(A )+
1
2
n
-(Suma de las probabilidades de todas las intersecciones dobles)+ (Suma de las probabilidades de todas las intersecciones triples)
Teorema 6: Si A B entonces P(A) ≤ P(B)
U
Análisis combinatorio
Permutación
variación del orden o de la disposición de los elementos de un conjunto
Conteo de puntos muestrales
Estudia el elemento de aleatoriedad que se asocia con la ocurrencia de ciertos eventos cuando se lleva a cabo un experimento. El principio fundamental del conteo es llamado "regla de la multiplicación"
Regla de la multiplicación generalizada: si una operación puede realizarse en n1 formas, y si para cada una de éstas puede efectuar una segunda operación en n2 formas , y para cada una de las dos primeras se puede efectuar una tercera en n3 formas, y así sucesivamente, entonces la secuencia de k operaciones puede hacerse en n1n2,...,nk formas.
Ej: ¿cuántos menús que consiten de sopa, emparedado, postre y un refresco existen si se puede seleccionar entre 4 sopas diferentes (n1), 3 clases de emparedados (n2), 5 postres (n3) y 4 refrescos (n4)?

Solución: n1 x n2 x n3 x n4 = 4 x 3 x 5 x 4 = 240
Sin repeticiones
1. se da el número de ordenaciones distintas que se pueden realizar con n elementos. Ej: como organizar 7 libros en una librería
2. se tienen n elementos y se desean organizar k lugares con ellos, de modo que cada elemento solo ocupe un lugar, con k<n. Ej: se tienen 5 letras y tomo 2 de ellas sin repeticiones.
P
n
=
n!
P
k
n
=
n!
(n-k)!
Con repeticiones
1. se tienen n elementos y se desean seleccionar k lugares con ellos de modo que cada elemento pueda ocupar mas de un lugar. Ej: se tienen 5 letras y tomo dos de ellas las cuales pueden ser repetidas
P
n,k
=
n
k
2. dados
n
elementos y los grupos
1
2
3
,
,...,
que sumados dan como resultado
n
, entonces la permutación sera cada uno de los grupos
1
2
3
,
,...,
que se pueda formar con los elementos
n
P
1
2
3
n
=
n!
1
2
3
!
!
!
Permutaciones circulares
Consta de n objetos agregados en circulos
P
C
n
=
(n-1)!
Combinaciones
Caso 1
Caso 2
Caso 1
Sin repeticiones
se emplea para elegir, k elementos de n sin importar el orden
C
k
n
=
( )
n
k
=
n!
(n-k)! k!
Con repeticiones
Caso 2
C
n, k
=
( )
n+ k-1
k
Corolario: si A y B son mutuamente excluyentes, entonces
P(A U B) = P(A) + P(B)
Asignación equi-probable
Se presenta cuando todos los sucesos elementales tienen la misma valoracuón probabilistica
Asignación no equi-probable
Ej: al lanzar un dado cada numero tiene igual probabilidad correspondiente a 1/6
Se presenta cuando algunos sucesos elementales tienen diferente valoración probabilistica
Probabilidad condicional
La probabilidad de que ocurra un evento A dado que ya ocurrió un evento B
Notación:
P(B/A)
Fórmula:
P(B/A)= P(A B)
P(A)
U
P(A/B)= P(A B)
U
P(B)
La probabilidad condicional respeta los teoremas vistos
Sucesos independientes
Se dice que son sucesos independientes si P(A/B) = P(A)
Por tanto P(A B) = P(A) P(B)
U
Así P(A B)
P(B)
= P(A)
U
En resumen se debe cumplir que
P(A/B)=P(A)
P(B/A)=P(B)
P(A B)=P(A)P(B)
U
Principio de expansión
Sean los eventos A , A , A ,..., A entonces
1
2
n
1
2
n
1
2
3
k
P(A A A ... A )= P(A ) P(A /A ) P(A /A A )
P(A /A A ... A )
U
U
U
U
U
U
U
1
2
3
K
1
2
1
K
1
2
3
1
U
2
K-1
Si son eventos independientes, se cumple que
P(A A A ... A )= P(A ) P(A ) P(A )...P(A )
U
U
U
U
1
2
3
k
1
2
3
k
Regla de Bayes
P(B /A)= P(B ) P(A/B )
r=1
k
P(B ) P(A/B )
i
i
i
r
r
Con i=1, 2,...,k
r=1
k
P(B ) P(A/B )
P(A)=
r=1
k
P(B A)=
U
r
r
r
Variable aleatoria
Una función X que asigna números reales a los sucesos elementales de un espacio muestral S se denomina variable aleatoria
Sea s perteneciente a S un suceso elemental del espacio muestral. La asignación será X(s)=x donde x pertenece a los reales.
Ejemplo:
Experimento: lanzar dos sados
Espacio muestral S= {cc, cs, sc, ss}
Sea s el evento de que salga cara s={cc, cs, sc}
La función que indica el número de caras esta dada por X(s)={2, 1, 1} donde x=1, 2
Discretas
Continuas
Si un espacio muestral contiene un numero finito de posibilidades o una serie interminable d¿con tantos elementos como números enteros existen, sellama espacio muestral discreto
Si un espacio muestral contiene un número infinito de posibilidades igual al número de puntos en un segmento de línea, se llama espacio muestral continuo
Una función de los valores numéricos x los denotamos con f(x), g(x), r(x) por tanto f(x)=P(X=x)
Función de densidad de probabilidad
El conjunto de pares ordenados (x, f(x)) se llama función de probabilidad de la variable aleatoria discreta X.
Un conjunto de pares ordenados (x, f(x)) es una función de probabilidad si cumple que:
1. f(x) > 0
2. f(x) = 1
x
3. P(X=x) = f(x)
Función distribución o distribución acumulada
La fución distribución o distribución acumulada F(X) de una variable aleatoria de densidad discreta X con función de probabilidad f(x) es:
F(X) = P(X<x) = f(x)
x
< x <
-
Función de densidad de probabilidad
Aunque la función de probabilidad de una variable continua no se puede representar de forma tabular, se puede establecer como una fórmula representada mediante la notación f(x)
La probabilidad de que X tome un valor entre a y c es igual al área sombreada bajo la función de densidad entre las ordenadas x=a y x=c
P(a<X<c)= f(x)dx
a
c
La función de densidad de probabilidad cumple que:
1. f(x) > 0, para toda x que pertenece a R
2. f(x)dx = 1
3. P(a<X<b) = f(x)dx
a
b
Función Distribución
La distribución acumulada o función distribución F(x) de una variable aleatoria continua X con función de densidad f(x) es
F(x) = P(X<x) = f(t) dt
-
x
Para - <x<
Distribuciones empíricas
Distribución de probabilidad conjunta para variables discretas
Distribución de probabilidad conjunta para variables continuas
Distribuciones marginales
Función de probabilidad condicional
Independencia estadística
Cálculo de probabilidad
Función de densidad
Casos
Discreto
Continuo
Por lo general se desconoce
Se supone por
Información tabular
Gráficas
Diagramas de tronco
Tabla de frecuencias
Simétricas
Sesgadas
La función de densidad cumple que:
1. f(x,y)>0 para todo (x,y)
2. f(x,y) = 1
3. P (X=x, Y=y) = f(x,y)
También llamada bidimensional o bivariada. Presenta dos variables de ocurrencia simultanea
Para cualquier región A en el plano xy,
P[(x,y) pertenece a A] = f(x,y)
x
y
A
En este caso f(x,y) es una superficie sobre el plano xy P[(x,y) pertenece a A] donde A es cualquier región del plano xy. Esta probabilidad esta representada por el volumen limitado por la base A y la superficie.
La función de densidad cumple que:
1. f(x,y)>0 para todo (x,y)
2. f(x,y) dx dy = 1
3. P[(x,y) que pertenece a A] = f(x,y) dx dy
para cualquier región A en el plano xy
-
-
A
Para x sola
Para y sola
V. discreta
V. continua
g(x) = f(x,y)
h(y) = f(x,y)
g(x) = f(x,y)dy
h(y) = f(x,y)dx
y
x
-
-
Ejemplo v. continua
Intervalo
Marca de
clase
Frecuencia
f
Frecuencia relativa
1.5-1.9
2.0-2.4
2.5-2.9
3.0-3.4
3.5-3.9
4.0-4.4
4.5-4.9
1.7
2.2
2.7
3.2
3.7
4.2
4.7
2
1
4
15
10
5
3
0.05
0.025
0.100
0.375
0.250
0.125
0.075

Se sabe que:
P(B/A) = P(A B)
U
P(A)
con P(A) > 0
Lo mismo se cumple para distribuciones conjuntas tanto para el caso discreto como continuo
P(Y=y / X=x) = P(X=x, Y=y)
P(X=x)
= f(x,y)
g(x)
Sean X y Y dos variables aleatorias, discretas o continuas, con distribución de probabilidad f(x,y) y distribuciones marginales g(x) y h(y), respectivamente. Se dice que las variables aleatorias X y Y son estadísticamente independientes si y sólo si:
f(x,y)=g(x)h(y)
para toda (x,y) dentro de sus rangos
Distribuciones de probabilidad discreta
A menudo, las observaciones que se generan en diferentes experimentos estadísticos tienen el mismo tipo general de comportamiento. En consecuencia, las variables aleatorias discretas asociadas con estos experimentos se pueden describir esencialmente con la misma distribución de probabilidad y por tanto se pueden representar mediante una sola fórmula.
Los diferentes tipos de distribución
Distribución Uniforme
Distribución de Bernoulli
Distribución binomial
Distribución hipergeométrica
Distribuciones de probabilidad continua
Los diferentes tipos de distribución son
Distribución Uniforme
Distribución normal
Distribución exponencial
Distribución gamma
Distribución de Weibull
Están representadas por modelos probabilísticos continuos. Dichos modelos consisten en la función de densidad asociada a la variable, la cual se presenta como una fórmula paramétrica. En cada modelo pueden intervenir uno o varios parámetros.
Full transcript