Loading presentation...

Present Remotely

Send the link below via email or IM

Copy

Present to your audience

Start remote presentation

  • Invited audience members will follow you as you navigate and present
  • People invited to a presentation do not need a Prezi account
  • This link expires 10 minutes after you close the presentation
  • A maximum of 30 users can follow your presentation
  • Learn more about this feature in our knowledge base article

Do you really want to delete this prezi?

Neither you, nor the coeditors you shared it with will be able to recover it again.

DeleteCancel

Make your likes visible on Facebook?

Connect your Facebook account to Prezi and let your likes appear on your timeline.
You can change this under Settings & Account at any time.

No, thanks

Probabilidad y Estadística

Diapositivas de apoyo para el curso
by

Juan Castrillon

on 26 August 2013

Comments (0)

Please log in to add your comment.

Report abuse

Transcript of Probabilidad y Estadística

Probabilidad y Estadística
Juan Guillermo Castrillón
Predicciones.
Conclusiones.
Se hace un modelo.
Organización.
Resumen.
Recolección o
generación.
Inferencia
Análisis
Descripción
Datos
Es el “arte y ciencia” de aprender de los datos.
Estadística:
Dato:
Es el “valor” que asume una variable.
Variable:
Función característica que describe a una persona, objeto, estado, etc.
Muestra:
Es un subconjunto de la población.
Población:
Son todos los elementos posibles de interés. De esta se saca todos los posibles resultados.
Escala de razón:
Escala intervalo:
Escala ordinal:
Escala nominal:
Escalas de medición:
Frecuencia relativa acumulativa:
Es la suma de todas las frecuencias relativas.

Frecuencia acumulativa:
Es la suma de todas las frecuencias.
Frecuencia relativa:
Es la relación de la frecuencia con el número de datos.
Frecuencia:
Es el número de veces que los valores de un intervalo aparecen
en los datos.
Es la presentación clara y sencilla de los datos, que se hace por medio de tablas o gráficas.
Para poder realizar estas gráficas se necesitan los siguientes elementos:
Descripción:
Distribución de frecuencia:
Es la organización de los datos tabulados usando intervalos y frecuencias:

No agrupados : lista de los datos con el número de ocurrencia.
Agrupados: intervalos de datos y se listan los números por intervalo.
Es la representación gráfica de una distribución de frecuencias, por medio de intervalos o barras verticales.
Histograma:
Resumen de datos:
Cualquier conjunto de datos tiene dos propiedades importante; el valor central o típico, y la dispersión alrededor de ese valor.

Gráfica dispersión amplia Gráfica dispersión estrecha
Estadística descriptiva:
En la notación se supone una serie de n observaciones y se escribe x1,x2,x3….xn como los valores observados, por ejemplo: x4 es el valor del cuarto dato.


Ej: se encuestan 5 personas acerca del número de horas de televisión que observaron semanalmente y se tiene la siguiente tabla:
Es el valor en el medio de los datos cuando estos tienen un orden
cual es la mediana de este conjunto de datos?
3,8,6,14,0,-4,2,12,-7,-1,-10.
Encontrar la mediana para las edades de los siguientes 8 estudiantes:
23,19,32,25,26,22,24,20
Hallar el rango intercuantil:
0,0,0,4,5,6,7,7,7,8,8,8,9,9,9,9,9,9,10
Cual es la varianza para los siguiente valores muéstrales?
3,8,6,14,0,11
Cual es la moda de los siguiente valores?
3,5,1,4,2,9,6,10
Cual es la moda de los siguiente valores?
3,5,1,4,2,9,6,10,5,3,4,3,9
Cual es la moda de los siguiente valores?
6,10,5,3,4,3,9,3,6,16
¿Cuál es el rango para los siguientes valores?
4, 8, 6, 14, 0, -4, 0, 12, -7, 0,-10
¿Cuál es el rango para los siguientes valores?
996, 1014, 1000, 997, 1001, 1002, 999, 995,990
¿Cuál es el rango para los siguientes valores?
9, 1014, 1000, 997, 1001, 1002, 999, 995, 990
«está afectado por el valor atípico 9»
Se reportaron las siguientes notas para un Quiz de 10 puntos:
¿Cual es el valor del rango intercuartil ?
4, 7, 8, 9, 6, 8, 0, 9, 9, 9, 0, 0, 7, 10, 9, 8, 5, 7, 9
Cual es la varianza muestral para los siguientes valores?
3, 8, 6, 14, 0, 11
Las 3 formas mas importantes son: simétricas, asimétricas positivas y asimétricas negativas.


Asimétricas positiva: la mayor parte de los datos están a la izquierda de la media, y la cola esta a la derecha.


Asimétrica negativa: la mayor parte de los datos están a la derecha de la media, y la cola esta a la izquierda.


Simétrica: los datos se distribuyen igualmente a ambos lados de la media. Media, mediana y moda son las mismas.
Formas de la distribución:
No es afectada por los valores extremos y aún preserva la idea de rango.
Mide la dispersión del 50% ubicado en el medio , de un conjunto ordenado.
Procedimiento:

Ordenar los datos
Dividir los datos en dos grupos iguales de altos y bajos respecto a la mediana
Encontrar la mediana del grupo bajo, este es el primer cuartil o Q1
La mediana del grupo alto es el 3er cuartil o Q3
El rango intercuatil es RIC=Q3-Q1
Rango intercuatil
Varianza muestral
Notación:
Mediana:
Moda:
En un conjunto de datos, es aquel dato que más se repite en ese conjunto.
Si todos los elementos tienen la misma frecuencia. Se dice que el conjunto no tiene moda.
Si tiene un solo valor que se repite se dice que el conjunto es monomodal . Si son dos los elementos que se repiten el conjunto es bimodal.
Es un promedio aproximado del cuadrado de las desviaciones respecto a la media muestral. Se divide por n-1 (n: tamaño de la muestra), esto es para lograr un estimador insesgado.
Desviación estándar muestral
Varianza poblacional
Es el promedio de los cuadrados de las desviaciones respecto a la media poblacional.
Desviación estándar poblacional
Ejercicios
Ejercicios
Probabilidad
Conjuntos
Membresía:
Operaciones con conjuntos
Modelos Probabilísticos
Leyes de Probabilidad
Modelos Discretos
"La probabilidad es sentido común reducido al calculo".

Es un concepto usado para cuantificar la incertidumbre.

Los modelos probabilísticos asignan probabilidades a resultados posibles.
El concepto de conjunto es fundamental en todas las ramas de la matemática.
Intuitivamente, un conjunto es una lista, colección o clase de objetos bien definidos (…). Estos objetos se llaman elementos o miembros del conjunto.
El conjunto se puede definir por extensión o por comprensión:

En la definición por extensión aparecen explícitamente todos los elementos del conjunto, agrupados entre llaves y separados por comas. " s={1,3,a,j}"

En la definición por comprensión se hace explícita la característica, o características, que deben tener los elementos del conjunto. "s={x | x sea zapato rojo}"
Conjuntos
La pertenencia se representa por y la no pertenencia como , es decir:
La membresía o pertenencia de un elemento a un conjunto es un concepto fundamental en teoría de conjuntos. Se dice que un conjunto está bien definido cuando es posible determinar si un elemento pertenece o no a tal conjunto, mediante el uso de ciertas reglas.
Notación:
se lee “ p pertenece a A”
se lee “ q no pertenece a A ”
Existen operaciones definidas entre conjuntos, que se pueden usar para construir nuevos conjuntos, estas son:

Unión: la unión de dos conjuntos A y B es el conjunto de todos los elementos que pertenecen a A , a B o a ambos. Se denota como A B.

Intersección: son todos los elementos de A que también pertenecen a B . Se denota como A B.

Complemento: El complemento de un conjunto B con respecto al conjunto , denotado por


-B
, es el conjunto de elementos de que no están en
B
.
Teoremas
Transitividad: Si A es un subconjunto de B y B es a su vez subconjunto de C , entonces A es subconjunto de C.
Dos conjuntos A y B son disjuntos si no tienen ningún elemento en común.
Constituyen descripciones matemáticas de fenómenos aleatorios.

Elementos principales de un modelo probabilisticos:
El espacio muestral ( ): Conjunto de todos los resultados posibles.
Ley de probabilidad: Es una regla que asigna a un conjunto A de resultados un numero P(A) llamado la probabilidad de A, y representa la creencia acerca de la ocurrencia de los elementos de A.
El experimento: Genera uno de los resultados posibles. El conjunto de todos los resultados posibles se llama al espacio muestral ( )del experimento. Un subconjunto de este espacio se denomina un evento.
Los eventos deben ser distintos y mutuamente excluyentes.
Después de definir el espacio muestral ( ) asociado a un experimento, se debe introducir una ley de probabilidad para completar el modelo de probabilidad. Esta ley asigna a cada evento A un numero P(A), llamado probabilidad de A.

P(A) debe satisfacer las siguientes axiomas:
0 P(A) 1
P( )= 0 , P( ) =1
P(A B)= P(A) + P(B); si A B =
Ley de probabilidad discreta:
Si el espacio muestral consiste de un numero finito de resultados posibles, la ley de probabilidad se especifica a partir de los eventos que consisten en un solo elemento. En particular la probabilidad de cualquier evento {s1,s2,s3, ... ,sn} es la suma de las probabilidades de sus elementos.
P ({s1,s2,s3, ... ,sn}) = P(s1)+P(s2)+P(s3)+...+P(sn)
Ley de probabilidad uniforme discreta (prob clasica)
Si ( ) consiste en n resultados posibles entonces:
P(A)=
números de elementos de A
n
Modelos Continuos
Son para espacios muéstrales continuos, y aquí no es suficiente la probabilidad de un solo evento para caracterizar la ley de probabilidad, porque el espacio muestral es un conjunto continuo de infinitos resultados. En este casi se habla de una ley de densidad de probabilidad.
Probabilidad de frecuencia relativa o empírica
En esta, la probabilidad de que un evento ocurra está dado por la razón del número de veces que el evento ocurre respecto al número total de total de todos los resultados, cuando se repite muchas veces.
Ej: ¿Cual es el espacio muestral de lanzar un dado?
R/= 6, discreto y finito
Ej: El experimento consiste en lanzar una moneda. Determinar el espacio muestral y todos los eventos posibles, Asignar Probabilidad y verificar axiomas.
Ej: Si se sabe que un voltaje aplicado a un resistor está en el rango [0,5].¿Cual es ( ) y clase ?
R/= [0,5], como espacio muestral es infinito, como longitud del intervalo es finito.
Ej: Se considera el experimento de lanzar dos dados, suponiendo que los resultados posibles, {las parejas (i,j) con i,j=1,2,3,4,5,6}, son equiprobables, calcular las probabilidades de los siguientes eventos:
P({La suma de los lanzamientos es par}) R/=18/36
p({El primer lanzamiento es igual al segundo}) R/=6/36
P({EL 1 >2 lanzamiento}) R/=15/36
.P({Al menos un lanzamiento es igual a 6})R/=11/36
U
U
U
U
Para eventos cualquiera A, B Y C, con una ley de probabilidad se tiene:

Si A B P(A) P(B)
P(A B) = P(A) + P(B) - P(A B)
P(A B) P(A) + P(B)
Algunas propiedades de las leyes de probabilidad
U
U
Ej: AL girar una rueda, ¿cual es la probabilidad de que al detenerse, un indicador en la parte superior forme un angulo de 30 grados, con respecto al punto de referencia como origen en la rueda?
inicio
girando
fin
P(A)= lim NA ; si el experimento tiene regularidad estadis

NA= número de resultados favorables del evento A
N= número total de resultados igualmente probables
P(A
o
B)=P(A+B)= lim N +N = P(A)+P(B) si A y B son
P(A1+A2+A3+...+An) = P(A1) + P(A2) +P(A3) + ... + P(An)
mutuamente excluyentes
N
N
N
o
o
N
o
o
Si todos los elementos tienen la misma probabilidad entonces P(Ai) = N
N
Clase 1
Clase 2
Clase 3
Clase 4
Probabilidad Condicional:
Permite una manera de razonar acerca de un experimento basados en información parcial.

Por ejemplo se tiene un receptor de señales binarias ¿Cuál es la probabilidad de que se haya enviado un 1 si se recibió un 0?

Dados un experimento, un espacio muestral y una ley de probabilidad, se supone que se conoce que ha ocurrido el evento B, y se desea cuantificar la probabilidad de que también se haya dado el evento A. Entonces se determina una ley de probabilidad que tenga en cuenta este hecho. Una ley que para cualquier evento A especifica la probabilidad de A dado el evento B, que se denota así: P(A | B)
Modelos secuenciales:
Regla de Bayes
Probabilidad Condicional:
Se introduce la siguiente definición de probabilidad condicional: P(A | B ) = P(A B) P(B) = 0.

P(A | B ) es la fracción asignada a los posibles resultados de B que también están en A.
Propiedades de la ley probabilidad condicional:
P(A | B ) especifica una nueva ley de probabilidad (condicional), en el mismo espacio muestral ( ). Cumple los axiomas de una ley de probabilidad.
Las probabilidades condicionales se pueden interpretar como una ley de probabilidad en el universo nuevo de B.
Si los resultados posibles, son muchos , finitos e igualmente probabilisticos entonces P(A | B ) = # de elementos en A B
# de elementos en B
U
P(B)
U
Cuando se construyen modelos probabilísticos para experimentos; a menudo es conveniente especificar primero las probabilidades condicionales, para luego determinar las probabilidades no condicionales. A menudo se usa la regla P(A B) = P(B)P(A | B) en este proceso.
Regla general para calcular varias probabilidades en unión a una descripción secuencial basada en el árbol de un experimento:
a) Se configura el árbol de modo que un evento de interes esta asociado a una hoja.
b) se escribe las probabilidades condicionales asociadas con las ramas de las hojas.
c) Se obtiene la probabilidad de cada hoja multiplicando las probabilidades de ramas.
P(B)
P(A | B)
P(A B)
U
U
Modelos secuenciales:
En términos matemáticos, se esta tratando un evento A que ocurre si y solo si han ocurrido los eventos A1 A2 A3 ... An. La ocurrencia de A es vista como la ocurrencia de A1 seguida de A2, luego A3, etc. Y se visualiza como un trayecto con n ramas. La probabilidad de A esta dada por:
P( ;Ai) = P(A1)P(A2 | A1)P(A3 | A2 A1) ... P(An | Ai)
n
n
n
n-1
i=1
Teorema de probabilidad Total:
Si A1, A2, A3,... An son eventos disjuntos que forman una partición muestral ( ) y P(Ai)>0, i, entonces para cualquier evento de B se tiene q:
U
U
U
A
P(B) = P(A1 B) + P(A2 B) + P(A3 B) +....+ P(An B)
U
U
U
U
= P(Ai)P(B | Ai)
i = 1
n
P(B) = P(A1 B) + P(A2 B) + P(A3 B) +....+ P(An B)
U
U
U
U
= P(Ai)P(B | Ai)
i = 1
n
A1
A2
A4
A5
A3
B
B = (A1 B) (A2 B) (A3 B) (A4 B) (A5 B)
U
U
U
U
U
U
U
U
U
Axioma de aditividad
(A1 B)
(A2 B)
(A3 B)
(A4 B)
(A5 B)
A1
U
U
U
U
U
A2
A3
A4
A5
B
c
B
c
B
c
B
c
B
c
B
B
B
B
B
Sea A1, A2, A3,... An son eventos disjuntos que forman una partición muestral ( ) y se asume q P(Ai) =/0 i, entonces para cualquier evento de B | P(B) =/ o se tiene q:
P(Ai | B) = P(B | Ai)P(Ai)
P(B)
Esta regla se emplea para inferencia: cuando se desea inferir la causa de un evento (B) sabiendo que hay varias causas (A1, A2, A3,... An ).

Se hace referencia a P(Ai | B) como la probabilidad a posteriori del evento Ai dada la información de ocurrencia de B; y se distingue de P(Ai), que se denomina la probabilidad a priori
A1
A2
An-1
An
P(A1) P(A2 | A1)
P(An-1 | Ai)
P(An | Ai)
n
i=1
i=1
n
n-2
n-1
Clase 5
Se ha introducido anteriormente la probabilidad condicional P(A | B) para obtener la inferencia parcial que el evento B ofrece sobre A. Cuando la ocurrencia de B no altera la probabilidad de ocurrencia de A, se dice que A es independiente probabilisticamente de B, es decir:
P(A | B) = P(A)
Recordando que:
P(A | B) = P(A B)
P(B)
U
Se puede escribir :
P(A B) = P(A)P(B)
U
Y se adopta esta relación, que se puede usar cuando P(B)= 0.

La simetría de esta relación implica que la independencia es una propiedad simétrica. Si A es independiente de B, entonces B es independiente de A . Y se puede decir que A y B independientes.
Independencia:
Independencia condicional:
Como las leyes de probabilidad condicionadas en un evento particular forman una ley validad entonces se puede hablar de la independencia de eventos respecto a su ley de probabilidad condicional.

En particular, dado un evento C, los eventos A y B son independientes condicionalmente si:
P(A B | C) = P(A | C )P(B | C)
U
Se deriva una caracterización alterna de la independencia condicional y la regla de multiplicación.
P(A B | C) = P(A B C)
P(C)
U
U
U
P(A | B C)P(B C)
P(A | B C)P(B | C )P(C)
=
P(C)
P(C)
=
U
U
U
Igualando las expresiones anteriores :
P(A | C)P(B | C )=P(A B | C)=P(A | B C )P(B | C)
P(A | B C) = P(A | C)
En palabras, si se que ha ocurrido C, el conocimiento adicional de que B también ha ocurrido, no cambia P(A | C).
Independencia de una colección de eventos :
Los eventos A1,A2,A3, ... An son independientes si :
Para tres eventos, la independencia es equivalente a las condiciones :
P(A1 A2) = P(A1)P(A2)
P(A2 A3) = P(A2)P(A3)
P(A1 A3) = P(A1)P(A3)
U
U
U
U
P(A1 A2 A3) = P(A1)P(A2)P(A3)
U
La independencia por parejas no implica la independencia general.

La igualdad no es suficiente para la independencia de los eventos
U
P(A1 A2 A3) = P(A1)P(A2)P(A3)
U
Confiabilidad:
En los modelos probabilísticos de sistemas complejos, a menudo es conveniente suponer que el comportamiento de los componentes no esta acoplado ( ie es independiente). Ya que típicamente eso simplifica el análisis.

Un sistema, usualmente, se puede dividir en sub-sistemas de componentes que pueden estar conectados en serie o en paralelo.

Se consideran un sub-sistema en serie, compuesto de m componentes, entonces el sub-sistema funciona si todos sus componentes están bien (activos). Entonces su probabilidad de funcionar es el producto de las probabilidades de que todos los elementos estén activos.

Si Pi es la probabilidad de que este activo el elemento i-esimo, entonces p(subsistema)=p1p2p3 ... pn.
Ahora un sub-sistema en paralelo funciona si al menos opera una de sus componentes; de modo que su posibilidad de fallos es el producto de las probabilidades de fallo de sus elementos correspondiente:
P(fallo del sub-sistema)=(1-p1)(1-p2) ... (1-pn)

P(operación de sub-sistema)= 1 - (1-pn)
P( Ai) =
i S
i S
P(Ai)
U
i =1
n
sub-sistema serie:
sub-sistema paralelo:
Ejemplo: una red conecta los nodos A y B a través de los nodos intermedios C,D,E,F; como se muestra en la figura.Para casa par de nodos conectados directamente (adyacentes) la probabilidad de que su enlace es de Pij. Asuma que las fallas del enlace son independientes entre si, ¿Cuál es la probabilidad de que exista un trayecto que conecta A y B?
A
B
C
D
E
F
0.9
0.8
0.75
0.95
0.85
0.9
0.95
El número cerca a cada enlace es la probabilidad de que este activo
P(C->E->B) = 0.8 * o.9 = 0.7
P(C->F->B) = 0.95 * 0.85 = 0.8075
P( {C->B}) = (1 - 0.72)(1 - 0.8075) = 0.0539
->P(C->B) = 1 - 0.0539 = 0.9461
P(A->C->B) = 0.9 * 0.9461 = 0.85149
P(A->D->B) = 0.75 * 0.95 = 0.7125
P( {A->B}) = (1 - 0.85149)(1 - 0.7125)
= 0.14851 * 0.2875
= 0.042696625
P(A->B) = 1 - 0.042696625
= 0.957303375
Pruebas de independencia y probabilidades binomiales
Si un experimento involucra una secuencia de etapas idénticas e independientes; en el caso especial donde solo son posibles dos resultados por etapa, se dice que esta es una secuencia de pruebas independientes de Bernoulli.

Se considera un experimento que consiste en lanzar una moneda n veces (independientemente). La probabilidad de cara es p (0<p<1). El evento Ai={en el i- ésimo lanzamiento se obtiene cara}. En este contexto independencia significa que P(Ai) no se altera por eventos previos.

La probabilidad de cualquier secuencia de n lanzamientos, que contiene K aras y (n-K) sellos es P (1-p)
k
n-k
Conteo
Se considera la probabilidad:
P(k)->P(k caras en una secuencia de n lanzamientos)
n
k
( )
n-k
k
P(k) = P (1-p)
n
k
( )
donde
=
n!
k!(n-k)!
; número de secuencias distintas que contienen k caras
El cálculo de probabilidades a menudo involucra el conteo del numero de resultados que proporcionan la respuesta deseada en los eventos. Se tiene dos casos en los que se requiere el conteo:
a) P(A) = # de elementos en A
# de elementos en
b) P(A) = P (# de elementos en A )
K caras en n lanzamientos.
Probabilidad binomial
El principio del conteo
Esta basado en la idea "divide y vencerás". EL conteo es dividido en etapas con empleo de un árbol.
Principio de conteo
Ejemplo: considere un experimento que consiste en dos etapas consecutivas. Los posibles resultados de la primera son: a1, a2, a3, ... an; y los resultados de la segunda son: b1, b2, b3 ... bn. Entonces, los resultados posibles del experimento son todos los pares ordenados (ai, bj) con i=1,2,3,...m y j=1,2,3,...n. Entonces el número de pares ordenados es mn. Esto se generaliza asi:
Para realizar un conteo en un experimento de r etapas, y teniendo en cuenta que el número de resultados posibles de la i-ésima etapa es ni, i=1,2,...,r. El número total de hojas (resultados) esta dado por:
Ejemplo: Un número telefónico local consta de 7 dígitos, pero el primer dígito es diferente de 0,1 ¿Cuántos números diferentes hay?
Permutación
se tienen n dígitos distintos y se desea el número de formas diferentes en que se pueden tomar k de estos objetos y arreglarlos en una secuencia --> El primer objeto se puede tomar de (n-1) formas distintas, para escoger el k-ésimo, como ya se han seleccionado (k-1) objetos quedan n - (k-1) opciones para el k-ésimo.
Por el principio de conteo, al número de secuencias posibles, llamadas permutaciones 1 en k es:

k=n(n-1)...(n - k + 1)= n!
Ej: Encuentre el número de palabras que consisten en 4 letras distintas.
R/= 26P4=26!/22! = 26x25x24x23 =358860
Combinación
En una permutación importa el orden de los elementos, pero en una combinación no importa dicho orden.
Por ejemplo, se permutan 4 letras en grupos de 2 y se obtiene:

AB AC AD
BA BC BD
CA CB CD
DA DB DC
Para la permutación AB = BA , ...
Pero la combinación AB = BA , ...
Las combinaciones se obtienen a partir de las permutaciones agrupando las secuencias que tienen los mismos elementos de modo de combinaciones es nCk= nPk = n! = n
k! k!(n-k) k

Ej: Encuentre el número de palabras diferentes de n letras y las palabras deben diferir en al menos una letra
R/= 26C4= 26!/4!22! = 14950
1
2
m
1
2
m

Esta es la cuenta deseada.
i =1
r
n
i
etapa 1
etapa 2
etapa 4
etapa 5
p
n
(n-k)!
( )
n
datos tomados --->
U
U
Igualdad: Dos conjuntos A y B son iguales si y solo si el primero esta incluido en el segundo y viceversa.
Diferencia: La diferencia entre dos conjuntos es una operación que resulta en otro conjunto, cuyos elementos son todos aquellos en el primero de los conjuntos iniciales que no estén en el segundo.
Ejemplos
R/=
={c,s}
Eventos: {c,s}, {c}, {s},
P( )= P{c} + P{s} =1
P{c} = P{s} = 0.5 (simetría)
p( )=0
Ai
A
B
U
U
U
Full transcript