miércoles, 10 de diciembre de 2008

Prueba de hipotesis

Ejemplo: Los sistemas de escape de emergencia para tripulaciones de aeronaves son impulsados por un combustible solido. Una de las caracteristicas es la rapidez de combustion. Las especificaciones requieren que la rapidez promedio de la combustion sea 50 cm/s. La desviacion estandar 2 cm/s. El experimentador decide especificar una probabilidad para el error tipo I, con un nivel de significancia de alfa=0.05.
Selecciona una muestra aleatoria de n=25 y obtiene una rapidez promedio muestral de combustion de 51.3 cm/s.

a)Elabore el intervalo de confianza.
b)A que conclusion debemos llegar.

1)Parametro de interes M=50 cm/s.

2)Ho: M=50

3)Hi: M -desigual- 50

4)alfa=0.05

5)Cual es el estadistico de prueba (varianza poblacional conocida)

6)Region de rechazo



7)z=52.3-50/2/raiz 25 = 3.25

8)3.25 mayor que 1.96

Se cumplio; se rechaza Ho.

9)Conclusion: existe evidencia estadistica de que el valor especificado no esta cumpliendo.

Pasosa seguir para la prueba de hipotesis

Pasos a seguir para la prueba de hipotesis:

1)Del contexto del problema, identificar el parametro de interes.

2)Establecer Ho-hipotesis nula (siempre contiene la igualdad).

3)Especificar Hi-hipotesis alternativa.

4)Seleccionar el nivel de significancia (alfa).

5) Establecer un estadistico apropiado.

6)Establecer region de rechazo (critica).

7)Calcular las cantidades muestrales y sustituir en el estadistico de prueba y encontrar (z, t, f, x2).

8)Decidir si se debe rechazar la hipotesis.

sábado, 6 de diciembre de 2008

Distribución t

Se usa en el caso en que tenemos una tenemos una muestra es pequeña (n<30) y varianza poblacional desconocida.

Estadístico t:




Ejemplo: El fabricante de un sistema propulsor está preocupado y le gustaría afirmar que su producto tiene una taza interna de combustión de 40 pulgadas por minuto. Prueba 25 granos de propulsor seleccionados al azar y si el valor de t calculado entre -t 0.05,24 y t 0.05,24 , entonces queda satisfecho. ¿Aqué conclusión debe llegar si tiene una muestra media de 42.5 y una desviación estándar muestral de 0.75 pulgadas por minuto? Supóngase que la taza de distribución tiene una distribución normal.

M = 40 in/min
n = 25 granos
x -testada- = 42.5 in/min
S = 0.75 in/min







Ejercicio: Determine los siguientes valores con las tablas de las t:

a)t 0.025,10 = 2.228

b)t 0.10,15 = 1.341

c)t 0.01,20 = 2.528

d)P (T10 <= t-alfa-,10) = 0.95 ; t 0.05,10 = 1.812



e)P (T15 <= t-alfa-,15) = 0.01 ; t 0.01,15 = -2.602



f)P (1.476 <= Ts <= t-alfa-,5) = 0.075

Diferencia de medias

Sean dos poblaciones con media M1 y M2 y σ, σ2 - "condición".







Condiciones:
- Muestra debe ser n>=30.
- Si es menor - debemos tener la confianza que la población se distribuye de manera normal.

Ejemplo: Se toma una muestra de tamaño n1 = 16, de una población normal que tiene una M = 75 y σ = 8, n2 = 9, normal M2 = 70 , σ = 12.

n1 = 16 normal M1 = 75, σ = 8
n2 = 9 normal M2 = 70, σ = 12


Unidad 4

Distribuciones de muestreo

Dstribución de probabilidad de las muestras (estadísticos) de una población.

Muestreo es definido como el proceso de seleccionar un número de observaciones (sujetos) de un grupo en particular de la población.
Distribución de muestreo mes definida como la distribución de frecuencias de la estadística de muchas muestras.
Es la distribución de medias y es llamada la distribución de muestreo de la media.

Los cuatro hechos de la distribución de muestreo, incluyen:

1) La estadística de interés (proporción, desviación estándar, o media)

2) Selección aleatoria de la muestra

3) Tamaño de la muestra aleatoria (muy importante)

4) Las características de la población siendo muestreada.


Teorema de límite central

Cuando muestras aleatorias del mismo tamaño son tomadas de la población, la
distribución de las medias de las muestras se acercarán a la distribución Normal.
Cuando la distribución de muestreo de la media tiene muestras de tamaño de 30 o mayores se dice que están Normalmente distribuidas.



Conluímos que la media de las medias es igual a la media de la población.



Si x1, x2, x3 es una muestra aleatoria de tamaño n tomada de una población (finita o infinita) con M y σ2, y si x -testada- es la media muestral, entonces la forma límite de la distribución es:



Ejemplo: Una compañía de electrónica fabrica resistencia, valor aproximado de 100 ohms y una desviación estándar de 10 ohms. La distribución de la resistencia es normal. Encuéntrese la probabilidad de que al tomar una muestra de n=25 resistencias, la resistencia promedio sea menor que 95 ohms.

M = 100 Ω
σ = 10 Ω
n = 25 resistencias
La resistencia promedio sea menor a 95 Ω.


Estadística Descriptiva

Inferencia Estadística

Población: extraer muestras con base en los resultados y conocimientos previos de los parámetros de la población (M,σ.¡).
Elaboramos hipótesis sobre el comportamiento de las variables aleatorias.

Muestreo aleatorio

Está formada por la totalidad de las observaciones en las cuales de tiene cierto interés.

Muestra: subconjunto de observaciones seleccionadas.

Las variables aleatioras:
a) son independientes.
b) todas las observaciones tienen la misma distribución de probabilidad.

De la muestra aleatoria se pueden calcular estadísticas, como son: {media, varianza, desviación estándar} y también son variables aleatorias.

A menudo es necesario estimar:

La media de la población M.
La varianza de la población σ2.
La proporción de objetos de una población que pertenecen a cierta clase de interés.
La diferencia de proporciones entre dos poblaciones P1-P2.

Estimadores puntual debe ser insesgado (sin preferencia).

viernes, 28 de noviembre de 2008

Funciones Discretas

Distribución Uniforme Discreta

Una variable aleatoria X es una variable aleatoria discreta uniforme si cada uno de los n valores que están en el rango de ésta, x1, x2,....., xn, tiene la misma probabilidad. Entonces,

fx(x)= 1/n

Ejemplo: La probabilidad de que el primer dígito del número de serie de una pieza sea uno de los números desde 0 hasta 9, es la misma. Si se toma una pieza al azar de un lote muy grande, y X es el primer dígito del número de serie, entonces X tiene una distribución discreta uniforme con una probabilidad 0.1 para cada valor de R = {0,1,2,...,9}. Esto es, fx(x)= 0.1 para cada valor de R.

Función de probabilidad de X:



Distribución Discreta Binomial

Tipos de experimentos que utilizan una función binomial: Ensayo de Bernoulli.

Ensayo de Bernoulli: Un experimento en el que se pueden presentar n ensayos repetidos tales que:

1)Los ensayos son independientes.

2)Cada ensayo tiene solo dos resultados posibles denominados "éxito" y "fracao".

3)La probabilidad de éxito de cada ensayo, denotada por p, permanece constante.


Ejemplo: La posibilidad de recibir de manera errónea un bit transmitido por un canal de transmisión digital, es 0.1. Además, supóngase que los ensayos de transmisión son independientes. Sea X = número de bits recibidos con error en los próximos cuatro que serán transmitidos. Descríbase el espacio muestral de este experimento e indíquese el valor de X en cada resultado. Calcúlese P(X=2).
En este experimento se indica con E un bit erróneo, y con C un bit sin error, esto es, recibido correctamente. Con esto, el espacio muestral de este experimento puede describirse como una lista de cuatro letras que indican qué bits fueron recibidos con y sin error. Por ejemplo, el resultado CECE indica que el segundo y el cuarto bit son erróneos, y los otros dos se recibieron correctamente. Por consiguiente, el espacio muestral es:



Funciones de probabilidad:

P(X=0)= (0.656)1
P(X=1)= (0.0729)4
P(X=2)= (0.0081)6
P(X=3)= (0.0009)4
P(X=4)= (0.0001)1



Combinaciones:



Entonces:




Distribución Binomial:



Varianza de una variable aleatoria X

Supóngase que la media de X de la variable aleatoria X es M y que la función de probabilidad de X es f(x), entonces la varianza de una variable aleatoria X es:

σx = E(X-M)2 = Σ (xi-M)2 f(xi)

La varianza de una variable aleatoria es similar a la varianza muestral para describir la dispersión en los datos de una muestra. La varianza variable aleatoria se calcula ponderando el cuadrado de cada desviación con respecto a la media, con la probabilidad asociada con la desviación. La probabilidad asociada con una desviación representa la proporción de un número grande de repeticiones del experimento aleatorio en los que se obtiene dicha desviación.


Otra alternativa para medir la variabilidad, que con frecuencia es más fácil de interpretar es la desviación estándar.

La desviación estándar de una variable aleatoria X, (media), denotada por σx es la raíz cuadrada positiva de la varianza.

Las unidades de la desviación estándar son idénticas a las de la variable aleatoria X. Asimismo, la desviación estándar de una variable aleatoria difiere de la desviación estándar de una muestra de datos debido al promedio ponderado utilizado para calcular la primera.

Ejemplo: En la comunicación digital de bits, la tasa de error es una importante consideración de diseño. Esto es, los bits cero que deben ser uno y viceversa, son bits recibidos con error.
Sea la variable aleatoria X el número de bits recibidos correctamente entre errores. Un valor razonable para la media de X, sin hacer uso de códigos de corrección de error, es 10 exp. 6.
¿Qué implicación tiene el hecho de que σx sea tan grande como 10 exp. 6?
Una desviación estándar grande implica que los errores pueden presentarse en rachas que afectan a varios bits consecutivos. Si varios de estos bits son erróneos, entonces existen cero bits correctos entre ellos. Entonces una desviación estándar grande puede obtenerse a partir de varios bits erróneos consecutivos, seguidos por intervalos grande de transisión libre de errores.

Valor esperado de una variable aleatoria

Si X es una variable aleatoria, y el experimento aleatorio que determina el valor de X se repite muchas veces, entonces se obitene una secuencia de valores para X. Puede emplearse un resumen de estos valores, tal como el promedio (media), para identificar el valor central de la variable aleatoria.

La función de probabilidad de X puede interpretarse como la proporción de ensayos en los que X=x. En consecuencia, en realidad no es necesario realizar el experimento muchas veces con la finalidad de determinar el valor medio de X. La media de X puede calcularse como el promedio ponderado de los valores posibles de X, asignando al resultado x un factor de ponderación fx(x)= P(X=x).

La media de X puede interpretarse como el centro de la masa del rango de los valores de X. Esto es, si se coloca una masa igual a fx(x) en cada punto x de la recta real, entonces E(X) es el punto donde la recta queda en equilibrio. Por consiguiente, el término "función de probabilidad" puede interpretarse mediante esta analogía con la mecánica.

M = E(X)= Σ xi f(xi)

Ejemplo: Se supone que la cobertura de una prueba en el proceso de verificación de un semiconductor tiene una eficacia del 80%. Esto es, la probabilidad de que un chip defectuoso no pase la prueba es 0.8. Se someten a prueba tres chip. Supóngase que la falla en cada chip defectuoso es independiente de las que aparezcan en otras pruebas. Sea la variable aleatoria X el número de chips defectuosos que no pasan la prueba. ¿Cuál es el valor esperado de X'?

Para hallar E(X) primero es necesario encontrar la función de probabilidad de X. La tabla siguiente presenta los resultados posibles de este experimento junto con los valores correspondientes de X. La probabilidad de cada resultado se obtiene con ayuda de la hipótesis de independencia. En la tabla, p indica que el chip pasa la prueba, y f, que el chip no pasa la prueba (falle). Por tanto, el resultado donde el primer chip pasa la prueba y los demás no, se denota por ppf. Por oitra parte, P(ppf)= 0.2 x 0.8 x 0.8 = 0.128.

X - {número de chips que no pasan la prueba}




Gráfica de distribución de frecuencias:




La función de probabilidad de X se encuentra a partir de estos resultados.





M = 0(0.008) + 1(0.096) + 2(0.384) + 3(0.512) = 2.4

martes, 25 de noviembre de 2008

Función de distribución acumulada

La función de distribución acumulada de una variable aleatoria discreta X, denotada por Fx(x), es

Fx(x)= P(X<=x)= Σ f(x)

Para una variable aleatoria discreta X, Fx(x) satisface las propiedades siguientes.

(1) Fx(x)= P(X<=x)= Σ fx(x)
(2) 0<=Fx(x)<=1
(3) si x<=y, entonces Fx(x)<=Fx(y)


Ejemplo: 850 partes contiene 50 defectuosas. Se escogen de un lote 2 partes al azar sin reemplazo.
Sea X el número de partes defectuosas. ¿Cuál es la función de distribución acumulada?

X - {número de partes defectuososas} = {0,1,2}

P(X=0)= (800/850)(799/849)= 0.886

P(X=1)= (50/850)(800/849)= 0.111

P(X=2)= (50/850)(49/849)= 0.003





Función de probabilidad:





Distribución de frecuencia acumulada:

F(0)= 0.886

F(1)= 0.886 + 0.111 = 0.997

F(2)= 0.997 + 0.003 = 1.0





Ejemplo: El espacio muestral de un experimento aleatorio es S={a,b,c,d,e,f}. Cada resultado es igualmente posible.
1) Determine la función de probabilidad de X.
2) Determine la función de distribución acumulada.

Se define la variable aleatoria de la siguiente manera:




F(0)= 1/3

F(1.5)= 1/3 + 1/3 = 2/3

F(2)= 2/3 + 1/6 = 5/6

F(3)= 5/6 + 1/6 = 6/6 = 1


3º Unidad

Funcion de distribución de probabilidad


Una variable aleatoria es una función que asigna un número real a cada resultado en el espacio muestral de un experimento aleatorio. Se denotan con una letra mayúscula, tal como X, y con una letra minúscula, como x, el valor posible de X. El conjunto de los posibles valores de la variable aleatoria X recibe el nombre de rango de X.

Una variable aleatoria discreta es una variable aleatoria con un rango finito (o infinito contable).

El evento que está formado por todos los resultados para los que X=x se donota como {X=x}, y la probabilidad de este evento como P(X=x).

La distribución de probabilidad o distribución de una variable aleatoria X es una descripción del conjunto de valores posibles de X (rango de X), junto con la asociada con cada uno de estos valores. A menudo la distribución de probabilidad de una variable aleatoria es el resumen más útil de un experimento aleatorio. la distribución de probabilidad de una variable puede darse de muchas maneras.

La función fx(x)= P(X=x) que va del conjunto de los valores posibles de la variable aleatoria discreta Z al intervalo [0,1] recibe el nombre de función de probabilidad.
Para una variable aleatoria X, fx(x) satisafce las propiedades siguientes:

(1) fx(x) = P(X=x)
(2) fx(x) >= 0 para toda x
(3) Σ fx(x) = 1

Ejemplo: Se tiran dos dados y se suma el valor de sus caras. La variable aleatoria X es el resultado de la suma de los valores.

x={2,3,4,5,6,7,8,9,10,11,12} (x=8)
s={(1,1),..................}=36

P(X=8= = n(8)/n(5)=5/36

La variable aleatoria representa la suma de los 2 dados sea 5.

P(X=5)=4/36



¿Cuál es la probabilidad de que al lanzar dos dados obtengan una suma de 5 o menos?

P(<=)= P(x=2)+P(x=3)+P(x=4)+P(x=5)= 1/36 + 2/36 + 3/36 + 4/36 + 4/36 = 10/36


Ejemplo: Un operador registra el tiempo (redondeado al segundo más cercano) requerido para terminar un ensamble mecánico. Los resultados que obtiene son:





Sea la variable aleatoria X el tiempo necesario para terminar un ensamble.
Determine:
a) función de probabilidad de X
b) P(33<= x < 38)
c) ¿Qué proporción de ensambles se terminan de armar en 35 s. o menos?




b) P(x=33) + P(x=34) + P(x=35) + P(x=36) + P(x=37) = 0.073 + 0.098 + 0.20 + 0.26 + 0.12 = 0.751

c) P(x<=35) = 0.02 + 0.04 + 0.049 + 0.073 + 0.098 + 0.20 = 0.48

Proporción de ensables = 0.48 (122) = 58.66 aprox. = 59

martes, 14 de octubre de 2008

Teorema de Bayes

P(Ek|F) = P(F|Ek)P(Ek)/P(F)

Ejemplo: El software pra detectar fraudes en las tarjetas telefónicas registra todos los días el número de áreas metropolitanas donde se originan todas las llamadas. Se tiene que el 1% de los usuarios legítimos hace al día llamadas que se originan en 2 o más áreas metropolitanas. El 30% de los fraudulentos hacen al día llamadas desde dos o más áreas metropolitanas. La proporción de fraudulentos es 0.01%. Si el mismo usuario hace en un día dos o más llamadas desde dos o más áreas metropolitanas, ¿cuál es la probabilidad de que sea un usuario fraudulento?

1% usuarios legítimos hacen llamadas desde dos o más áreas metropolitanas.

30% usuarios fraudulentos hacen al día llamadas desde dos o más áreas metropolitanas.

Proporción de usuarios fraudulentos = 0.01%

A={usuario legítimo}
A'={usuario fraudulento}
B={llamada se origine en dos o más áreas}
P{usuario sea fraudulento}=0.0001
P{usuario sea legítimo}=1-0.0001=0.9999

P{B|A} = 0.01
P{B|A} = 0.3

P(A'|B) = P(B|A')P(A)/P(B) = P(B|A')P(A')/P(B|A)P(A) + P(B|A')P(A')

= (0.3)(0.0001)/(0.01)(0.999)+ (0.3)(0.0001) = 0.00299

Regla de la probabilidad

P {circuito integrado sujeto a altos niveles de contaminación sea la causa de una falla en un producto} = 0.10

P {circuito integrado que no está sujeto a altos niveles de contaminación sea la causa de la falla} = 0.005

20% de la producción está sujeta a altos niveles de contaminación.

¿Cuál es la probabilidad de que un producto que utilice alguno de estos circuitos falle?

A: {el circuito está expuesto a altos niveles de contaminación}
F: {el producto falla}
A':{el circuito no está expuesto a altos niveles de contaminación}




P(F|A) = 0.1
P(F|A') = 0.005
P(A) = 0.2
P(A') = 1-0.2 = 0.8

P(F) = P(F ∩ A) + P(F ∩ A')
P(F) = P(F|A)P(A) + P(F|A')P(A')
P(F) = (0.1)(0.2) + (0.005)(0.8)
P(F) = 0.024





Si se tiene más de dos eventos excluyentes entre sí:





P(F) = P(F ∩ E1) + P(F ∩ E2) + P(F ∩ E3) +.....+ P(F ∩ En)

P(F) = P(F|E1)P(E1) + P(F|E2)P(E2) + P(F|E3)P(E3) +.....+ P(F|En)P(En)


Ejemplo: La probabilidad de que falle un conector eléctrico durante el periodo de garantía es 1%. Si el conector se humedece la probabilidad de falla durante la garantía es 5%. Si el 90% de los conectores se mantienen secos y el 10% se humedece, ¿qué proporciones de los conectores fallará durante el periodo de garantía?

seco: P(F|E1) = 0.01, P(E1) = 0.9
húmedo: P(F|E2) = 0.05, P(E2) = 0.1

P(F) = P(F|E1)P(E1) + P(F|E2)P(E2)
P(F) = (0.01)(0.9) + (0.05)(0.1)
P(F) = O.014

Reglas multiplicativas

Si en un experimento pueden ocurrir los eventos A y B, entonces

P(A ∩ B) = P(A)P(B|A), dado que P(A)>0.

Así la probabilidad de que ocurran A y B es igual a la probabilidad de que ocurra A multiplicada por la probabilidad condicional de que ocurra B, dado que ocurre A.

Como los eventos A ∩ B y B ∩ a son equivalentes, del teorema anterior se sigue que también podemos escribir

P(A ∩ B) = P(B ∩ A) = P(B)P(A|B).

En otras palabras, no importa qué evento se considere como A y cuál como B.

Ejemplo: Suponga que tenemos una caja de fusibles que contiene 20 unidades, de las cuales 5 están defectuosas. Si se seleccionan 2 fusibles al azar y se retiran de la caja, uno después del otro, sin reemplazar el primero, ¿cuál es la probabilidad de que ambos fusibles estén defectuosos?

Sean A el evento de que el primer fusible esté defectuoso y B ele vento de que el segundo esté defectuoso; entonces, interpretamos A ∩ B como el evento de que ocurra A, y entonces B ocurre después de que haya ocurrido A. La probabilidad de separar primero un fusible defectuoso es 1/4; entonces, la probabilidad de separar un segundo fusible defectuoso de los restantes 4 es 4/19. Por lo tanto,

P(A ∩ B) = (1/4)(4/19) = 1/19.


Eventos independientes

Dos eventos A y B son independientes si y sólo si

P(A ∩ B) = P(A)P(B).

Por lo tanto, para obtener la probabilidad de que ocurran dos eventos independientes, simplemente calculamos el producto de sus probabilidades individuales.

Probabilidad condicional

La probabilidad de que un evento B ocurra cuando se sabe que ya ocurrió algún evento A se llama probabilidad condicional y se denota con P(B|A). El símbolo P(B|A), por lo general se lee "la probabilidad de que ocurra B dado que ocurrió A", o simplemente "la probabilidad de B, dado A".

La probabilidad condicional de B, dado A, que se denota con P(B|A), se define como

P(B|A) = P(A ∩ B)/P(A) si P(A)>0.

Ejemplo: La probabilidad de que un vuelo programado normalmente salga a tiempo es P(D) = 0.83; la probabilidad de que llegue a tiempo es P(A) = 0.82; y la probabilidad de que salga y llegue a tiempo es P(D ∩ A) = 0.78. Encuentre la probabilidad de que un avión
a)llegue a tiempo, dado que salió a tiempo;
y
b)salió a tiempo, dado que llegó a tiempo.

a)La probabilidad de que un avión llegue a tiempo, dado que salió a tiempo es

P(A|D) = P(D ∩ A)/P(D) = 0.78/0.83 = 0.94.

B)La probabilidad de que un avión haya salido a tiempo, dado que llegó a tiempo es

P(D|A) = P(D ∩ A)/P(A) = 0.78/0.82 = 0.95.


Eventos independientes

Dos eventos A y B son independientes si y sólo si

P(B|A) = P(B) O P(A|B) = P(A)

dada la existencia de probabilidad condicional. De otra forma, A y B son dependientes.

Reglas aditivas

Si A y B son dos eventos, entonces

P(A U B) = P(A) + P(B) - P(A ∩ B).




Ejemplo: Al final del semestre, Juan se va a graduar en la facultad de ingeniería industrial en una universidad. Después de tener entrevistas en dos compañías donde quiere trabajar, él evalúa la probabilidad que tiene de lograr una oferta de empleo en la compañía A como 0.8, y la probabilidad de obtenerla de la compañia B como 0.6. Si, por otro lado, considera que la probabilidad de que reciba ofertas de ambas compañías es 0.5, ¿cuál es la probabilidad de que obtendrá al menos una oferta de esas dos compañías?

Con la regla aditiva tenemos: P(A U B) = P(A) + P(B) - P(A ∩ B)=
0.8 + 0.6 - 0.5 = 0.9.

Probabilidad de un evento

La probabilidad de un evento A es la suma de los pedos de todos los puntos muestrales en A. Por lo tanto,

0 <= P(A) <= 1 , P(ø) = 0 y P(S) = 1

Además, si A1, A2, A3, ... es una serie de eventos mutuamente excluyentes, entonces

P1(A1 U A2 U A3 U ... ) = P(A1) + P(A2) + P(A3) + ...

Ejemplo: Sea A el evento de que salga un número par y sea B el evento de que salga un número divisible entre 3. Encuentre P(A U B) y P(A ∩ B).

Para los eventos A = {2, 3, 4, 6} y B = {3, 6}, tenemos

A U B = {2, 3, 4, 6} y A ∩ B = {6}.


Al asignar una probabilidad de 1/9 a cada número non y de 2/9 a cada número par, tenemos

P(A U B) = 2/9 + 1/9 + 2/9 + 2/9 = 7/9 y P(A ∩ B) = 2/9



Si un experimento puede tener como resultado cualquiera de N diferentes resultados dos igualmente probables, y si exactamente n de estos resultados corresponden al evento A, entonces la probabilidad del evento A es

P(A) = n/N

Ejemplo: Una clase de estadística para ingenieros consta de 25 estudiantes de ingeniería industrial, 10 de mecánica, 10 de eléctrica y 8 de civil. Si el profesor elige a una persona al azar para que conteste una pregunta, encuentre la probabilidad de que el estudiante elegido sea
a) un estudiante de ingeniería industrial
b) uno que de ingeniería civil o eléctrica

Se denotan con I, M, E y C las especialidades de ingenierías. El número total de estudiantes en la clase es 53, todos los cuales tienen la misma probabilidad de ser seleccionados.

a) Como 25 de los 53 estudiantes tienen la especialidad de ingeniería industrial, la probabilidad del evento I, elegir al azar a alguien de ingeniería industrial es

P(I) = 25/53

b) como 18 de los 53 estudiantes son de las especialidades de ingeniería civil o eléctrica, se sigue que

P(C U E) = 18/53




Diagrama de Venn

La relación entre eventos y el correspondiente espacio muestral se puede ilustrar de forma gráfica utilizando diagramas de Venn. en un diagrama de Venn representamos el espacio muestral como un rectángulo y los eventos con círculos trazados dentro del rectángulo.
En la figura vemos que:



A ∩ B = regiones 1 y 2,
B ∩ C = regiones 1 y 3,
A U C = regiones 1, 2, 3, 4, 5 y 7,
B' ∩ A = regiones 4 y 7,
A ∩ B ∩ C = región 1,
(A U B) ∩ C' = regiones 2, 6 y 7,
y así sucesivamente.

Ls figura puede representar una situación donde seleccionamos una carta al azar de una baraja ordinaria de 52 cartas y observamos si ocurren los siguientes eventos:

A: la carta es roja,
B: la carta es el jack, la reina o el rey de diamantes,
C: la carta es un as.

El evento A ∩ C consiste sólo en los dos ases rojos.
Varios resultados que se derivan de las definiciones procedentes, y que se pueden verificar de forma sencilla empleando diagramas de Venn, son los que siguen:

A ∩ ø = ø
A U ø = A
A ∩ A' = ø
A U A' = S
S' = ø
ø' = S
(A')' = A
(A ∩ B)' = A U B
(A U B )' = A' ∩ B'

lunes, 13 de octubre de 2008

Eventos

Para cada evento asignamos una colección de puntos muestrales, que constituye un subconjunto del espacio muestral. Ese subconjunto representa la totalidad de los elementos para los que el evento es cierto.

Ejemplo: Dado el espacio muestral S= {t|t>=0}, donde t es la vida en años de cierto componente electrónico, entonces el evento A de que el componente falle antes de que finalice el quinto año es el subconjunto A= {t|0<=t<=5}.

Es concebible que un evento sea un subconjunto que incluya todo el espacio muestral S, o un subconjunto de S que se denomina conjunto vacío y se denota con el símbolo ø, que no contiene elemento alguno.

El complemento de un evento A respecto de S es el subconjunto de todos los elemntos de S que no están en A. Denotamos el complemento de A mediante el símbolo A'.

Ejemplo: Sea R el evento de que se seleccione una carta roja de una baraja ordinaria de 52 cartas, y sea S toda la baraja. Entonces, R' es el evento de que la carta seleccionada de la baraja no sea una roja sino una negra.

La intersección de dos eventos A y B, que se denota con el símbolo A ∩ B, es el evento que contiene todos los elementos que son comunes a A y a B.

Ejemplo: Sea C el evento de que una persona seleccionada al azar en un café Internet sea un estudiante universitario, y sea M el evento de que la persona sea hombre. Entonces C ∩ M es el evento de todos los estidiantes universitarios hombres en el café Internet.

Ejemplo: Sean M = {a, e, i, o, u} y N = {r, s, t}; entonces, se sigue que M ∩ N = ø. Es decir, M y N no tienen elementos comunesy, por lo tanto, no pueden ocurrir ambos de forma simultánea.

Dos eventos A y B son mutuamente excluyentes o disjuntos si A ∩ B = ø; es decir, si A y B no tienen elementos en común.

La unión de dos eventos A y B, que se denota con el símbolo A U B, es el evento que contiene todos los elementos que pertenecen a A o a B o a ambos.

Ejemplo: Sea A = {a, b, a} y B = {b, c, d, e}, entonces A U B = {a, b, c, d, e}. Sea P el evento de que un empleado seleccionado al azar de una compañía petrolera fume cigarrillos. Sea Q el evento de que el empleado seleccionado ingiera bebidas alcohólicas. Entonces, el evento P U Q es el conjunto de todos los empleados que beben o fuman, o que hacen ambas cosas.

Si M = {x | 3 < n =" {y" n =" {z">


UNIDAD II. PROBABILIDAD

Espacio muestral.

El estudio de la estadística trata básicamente con la presentación e interpretación de resultados fortuitos que ocurren en un estudio planeado o en una investigación científica. El estadístico a menudo trata con datos experimentales, conteos o mediciones representativos, o quizá con datos categóricos que se podrían clasificar de acuerdo con algún criterio.
Nos referimos a cualquier registro de información, ya sea numérico o categórico, como una observación.
Los estadísticos utilizan la palabra experimento para describir cualquier proceso que genere un conjunto de datos.
El conjunto de todos los resultados posibles de un experimento estadístico se llama espacio muestral y se representa con el símbolo S. A cada resultado en un espacio muestral se le llama elemento o miembro del espacio muestral, o simplemente punto muestral. Si el espacio muestral tiene un número finito de elementos, podemos listar los miembros separados por comas y encerrarlos entre llaves. De esta forma, el espacio muestral S, de los resultados posibles cuando se lanza una moneda al aire, se escribe como S= {H,T} donde H y T corresponden a "caras" y "cruces", respectivamente.
Considere el experimento de lanzar un dado. Si nos interesamos en el núero que muestre en la cara superior, el espacio muestral sería S1= {1, 2, 3, 4, 5, 6}.
En algunos experimentos es útil listar los elementos del espacio muestral de forma sistemática utilizando un diagrama de árbol.

Experimento aleatorio

Es aquél que proporciona diferentes resultados aún y cuando se repita siempre de la misma manera.


¿Cuál es la probabilidad de que la suma de dos dados sea cinco?

S= {(1,4) , (2,3) , (3,2) , (4,1)}

4/36 = 1/9


Una caja contiene 3 pelotas: roja, azul y blanca. Dos de ellas se sacan con reemplazo. Esto implica:



S= {RR , RA , RB , AR , AA , AB , BR , BA , BB}
S= 9

Sin reemplazo:



S= {RB , RA , AR , AB , BR , BA}
S= 6


lunes, 6 de octubre de 2008

Diagrama de tallo y hoja

El tallo está formado por uno o más de los dígitos principales y una hoja la cual contiene el resto de los dígitos. En general debe escogerse un número relativamente pequeño de tallos en comparación con el número de observaciones. Lo usual es seleccionar entre 5 y 20 tallos.

Construcción de la gráfica

Para hacer la gráfica primero se necesita tener la tabla de datos agrupados. Ya que se tiene se hacen las dos líneas como las azules en la figura. Se puede utilizar escala, en este caso es de 1 cm.
La línea de la izquierda representa la frecuencia y la de abajo representan los datos, empezando de la esquina, cada línea son los límites que se muestran en la tabla de datos agrupados. Se construyen las barras basándose en la frecuencia de la tabla, para cada intervalo. Con las puras barras sería una gráfica de barras o un HISTOGRAMA. Ahora ubicamos las marcas de clase, o puntos medios entre cada intervalo y se unen, empezando desde la esquina inferior izquierda, y terminando en la esquina inferior derecha. Ahora tenemos un POLIGONO DE FRECUENCIAS y se pueden borrar las barras y que queden solo las líneas.

domingo, 5 de octubre de 2008

Datos Agrupados

Se refiera a una distribución de frecuencias

Construcción de una tabla de frecuencias:

(Tomando en cuenta los datos de la tabla enterior):

1.- Definir el rango = Vmaz - Vmin

2.- Cálculo de clase

a) número de clases =

b) ancho de clase =

3.- Intervalos de clase

Intervalos

Frec.

M.C.

(frec)(m.c.)

95 < x <>

2

110

220

125 < x <>

6

140

840

155 < x <>

8

170

1360

185 < x <>

5

200

1000

215 < x <>

4

230

920


30


4340



miércoles, 24 de septiembre de 2008

Percentiles

Es el porcentaje en los datos que se encuentra por debajo del percentil.

P10 --> 10% de los datos es menor que esl valor posicionado en ese lugar.


Cálculo de percentiles:

Ordenamos los datos de menor a mayor.





Basándonos en los datos de la tabla anterior, determinaremos P25, P50 y P75.












P25 = 154

P50 = 175

P75 = 199

domingo, 14 de septiembre de 2008

Estadística Descriptiva

M E D I D A S

De tendencia central:

Media: es igual a la suma de todos ellos dividida entre el número de sumandos. Es uno de los principales estadísticos muestrales.



Mediana: una muestra acomoda en orden cociente de magnitud, entonces se define como la parte media o la [(n+1)/2] encima de la observación si n es impar ó el promedio entre las dos observaciones intermedias si la n es par.

Tenemos dos casos: cuando n es par y cuando n es impar.

Cuando n es par; se ordenan los valores de forma adecuada (menor a mayor) y se toma el valor que se sitúa en el centro de los datos.

si n es par

si n es impar


Moda: es el valor que cuenta con una mayor frecuencia en una distribución de datos.


De dispersión:


Rango = Vmax - Vmin

Varianza: es la media aritmética del cuadrado de las desviaciones respecto a la media de una distribución estadística.









Obetener las medidas de tendencia central y de dispersión de los siguientes datos:

105, 97, 245, 163, 207, 134, 218, 199, 160, 196, 221, 154, 228, 131, 180, 178, 157, 151, 175, 201, 183, 153, 174, 154, 190


Observación

xi - media

(xi - media )2

97

-77.16

5953.66

105

-69.16

4783.1

131

-43.16

1862.78

134

-40.16

1612.82

151

-23.16

536.38

153

-21.16

447.74

154

-20.16

406.42

154

-20.16

406.42

157

-17.16

294.46

160

-14.16

200.5

163

-11.16

124.54

174

-0.16

0.02

175

0.84

0.7

178

3.84

14.74

180

5.84

34.1

183

8.84

78.14

190

15.84

250.9

196

21.84

476.98

199

24.84

617.02

201

26.84

720.38

207

32.84

1078.46

218

43.84

1912.94

221

46.84

2193.98

228

53.84

2898.74

245

70.84

5018.3

4354


31924.22



Media:








Mediana:

n es impar;









Mediana = 175

Moda = 154













Rango = Vmax - Vmin