Pr‡ctica 1
Introducci—n
El objetivo de esta primera pr‡ctica es conocer dos ‡reas de gran interŽs en el campo de la estad’stica: la simulaci—n y la fiabilidad. Para ello disponemos del programa estad’stico Statgraphics y del programa R, versi—n de libre disposici—n del lenguaje SPLUS.
Actividad 1. La exponencial y su papel en fiabilidad
1.1-. El tiempo de duraci—n de un ensamble mec‡nico en una prueba de vibraci—n tiene una distribuci—n Exponencial con media 400 horas. Calcula:
a) ÀCu‡l es la probabilidad de que el ensamble falle durante la prueba en menos de 100 horas?
DespuŽs de introducir los par‡metros en el Statgraphics he obtenido los siguientes resultados:
Cumulative Distribution
-----------------------
Distribution: Exponential
Lower Tail Area (<)
Variable Dist. 1 Dist. 2 Dist. 3 Dist. 4 Dist. 5
100 0,221199
Probability Density
Variable Dist. 1 Dist.
2 Dist.
3
Dist. 4 Dist. 5
100
0,001947
Upper Tail Area (>)
Variable Dist. 1 Dist.
2
Dist. 3 Dist. 4 Dist. 5
100 0,778801
Por lo tanto P(x<100) = 0.221199
b) ÀCu‡l es la probabilidad de que el ensamble trabaje durante m‡s de 500 horas antes de que falle?
He obtenido los siguientes resultados en el Statgraphics:
Cumulative
Distribution
-----------------------
Distribution:
Exponential
Lower Tail Area (<)
Variable Dist. 1 Dist.
2
Dist. 3 Dist. 4 Dist. 5
500
0,713495
Probability Density
Variable Dist. 1 Dist.
2
Dist. 3 Dist. 4 Dist. 5
500
0,000716262
Upper Tail Area (>)
Variable Dist. 1 Dist.
2
Dist. 3 Dist. 4 Dist. 5
500 0,286505
Por lo tanto P(x>500) = 0.286505
c) Si el ensamble se ha probado durante 400 horas sin fallo alguno, Àcu‡l es la probabilidad de que falle en las siguientes 100 horas?
Se trata de una probabilidad condicional, que calcularŽ del siguiente modo:
![]()
Distribution:
Exponential
Lower Tail Area (<)
Variable Dist. 1 Dist.
2
Dist. 3 Dist. 4 Dist. 5
400
0,632121
Upper Tail Area (>)
Variable Dist. 1 Dist.
2
Dist. 3 Dist. 4 Dist. 5
400
0,367879
Distribution:
Exponential
Lower Tail Area (<)
Variable Dist. 1 Dist.
2
Dist. 3 Dist. 4 Dist. 5
500 0,713495
El resultado ser‡ P(x<=500/x>400) = 0,22119773077
En este œltimo apartado acabamos de comprobar la propiedad de falta de memoria de la exponencial.
Actividad 2. Generaci—n de una muestra aleatoria de una distribuci—n exponencial
2.1-.Genera una muestra de tama–o 100, de una exponencial de par‡metro 2 mediante este mŽtodo, es decir, primero genera 100 valores de una uniforme(0,1) y luego transforma estos valores (selecciona una nueva columna; edit>generate data). Guarda los valores obtenidos, pues se usar‡n en otra pr‡ctica. Incluye los datos generados en la memoria. ÁF’jate que tus datos ser‡n diferentes a los de tus compa–eros!
Los diez primeros resultados obtenidos de los 100 s—n:
0,660155 0,207640311525
0,752597 0,142112693506
0,981962 0,00910133395704
0,102 1,14139123285
0,0424284 1,57996866482
0,21045 0,779253591883
0,259873 0,673781114421
0,502572 0,344008182865
0,910308 0,046986137599
0,612277 0,245285242245

2.2-. Describe los valores obtenidos, incluye en la memoria: el histograma, la media y la varianza. ÀCu‡les eran los valores de la media y varianza de la poblaci—n de la que hemos generado los valores? Recuerda que para describir una muestra podemos usar: Describe>Numeric data> One variable an‡lisis, adem‡s, con la libreta obtendremos tablas de frecuencias y medidas descriptivas, mientras que con el gr‡fico conseguiremos diversas gr‡ficas.
El histograma ser‡ el siguiente:

El an‡lisis de valores descriptivos ser‡:
Summary Statistics for Col_2
Count = 100
Average = 0,46288
Variance =
0,172071
Standard deviation
= 0,414814
Minimum =
0,00157197
Maximum = 2,03331
Range = 2,03174
Stnd. skewness =
6,70127
Stnd. kurtosis =
6,49743
De los cuales nos
interesa la media y la varianza:
Summary
Statistics for Col_2
Average =
0,46288
Variance = 0,172071
Actividad 3. Generaci—n de una muestra aleatoria de una distribuci—n Normal. Recordatorio del teorema central del l’mite
3.1-. Genera una muestra de tama–o 200 de una Normal con media d, siendo d los 4 œltimos d’gitos de tu DNI y desviaci—n t’pica 2. Por ejemplo, si tu DNI es:12345678, entonces d=5678. Vamos a comprobar visualmente que los datos obtenidos son Normales, con la media y varianza pedidas, para lo cual incluye en la memoria: el histograma, la media y la varianza de esta variable. Recuerda que para describir una muestra podemos usar: Describe>Numeric data> One variable an‡lisis, adem‡s, con la libreta obtendremos tablas de frecuencias y medidas descriptivas, mientras que con el gr‡fico conseguiremos diversas gr‡ficas.
En este problema d ser‡ 2256, los dos œltimos d’gitos de mi DNI.
DespuŽs de seguir todos los pasos descritos por la pr‡ctica obtendrŽ 2400 valores, de los cuales incluyo los 10 primeros:
2253,7422
2258,09012
2255,90314
2255,18414
2254,76978
2255,15178
2256,79062
2258,3541
2256,0795
2256,44794
Seguidamente mostrarŽ el histograma:

Y el resultado del an‡lisis estad’stico:
Summary
Statistics for Col_4
Count = 200
Average =
2255,86
Median =
2255,94
Mode =
Geometric
mean = 2255,86
Variance = 3,84081
Standard deviation = 1,9598
Minimum = 2250,87
Maximum = 2261,26
Range = 10,3927
Stnd. skewness = 0,703868
Stnd. kurtosis = -0,692945
De los cuales nos interesan media y varianza:
Summary
Statistics for Col_4
Average =
2255,86
Variance = 3,84081
Actividad 4. Simulaci—n de sistemas 3 de 5
En este apartado utilizaremos el programa R.
4.1-. Vamos a calcular la fiabilidad de un sistema 3 de 5, simulando el sistema. La probabilidad de que funcione cada una de las 5 componentes es: 0.9, 0.8, 0.7, 0.6 y 0.5. El siguiente c—digo simula 5 variables, que representan si la componente funciona o no. As’, por ejemplo, para la componente 1, X1 =1 (funciona) con probabilidad 0.9, y X1 =0 (no funciona) con probabilidad 0.1. Para cada componente del sistema, generamos 1000000 valores de una uniforme(0,1), conjuntamente con la indicaci—n de si funciona o no.
El resultado de la ejecuci—n de las instrucciones
es el siguiente:
> c1<-runif(1000000)<.9
> c2<-runif(1000000)<.8
> c3<-runif(1000000)<.7
> c4<-runif(1000000)<.6
> c5<-runif(1000000)<.5
> mean(c1)
[1] 0.899831
>
Para acabar de simular el sistema, sumaremos las variables y veremos si 3 — m‡s componentes funcionan:
> sumar<-c1+c2+c3+c4+c5
> sistema<-sumar>=3
> mean(sistema)
[1] 0.850098
>
4.2-. Vamos a calcular la fiabilidad de otro
sistema 3 de 5. La probabilidad de que funcione cada una de las 5 componentes
es: 0.7. En este caso, S Xi ser’a
una Binomial(5,0.7). Vamos a
calcular la probabilidad te—rica y la obtenida simulando el sistema. Primero
simularemos el sistema:
> c1<-runif(1000000)<.7
> c2<-runif(1000000)<.7
> c3<-runif(1000000)<.7
> c4<-runif(1000000)<.7
> c5<-runif(1000000)<.7
> sumar<-c1+c2+c3+c4+c5
> sistema<-sumar>=3
> mean(sistema)
[1] 0.836289
>
4.3-. Ahora calcula la probabilidad te—rica (probabilidad de que una variable Binomial(5,0.7) sea mayor o igual que 3) y a–‡delo en la memoria. Recuerda que en el Statgraphics podr‡s hacerlo de la siguiente forma: Describe> Distributions > Probability distributions > Binomial, analysis options (bot—n derecho del rat—n) para seleccionar una Binomial(5,0.7), en lugar de Binomial(10,0.1). En la libreta selecciona Cumulative distributions y luego con pane options (bot—n derecho del rat—n), puedes seleccionar el valor para el que deseas calcular la probabilidad. A–ade este valor a la memoria.
Cumulative
Distribution
-----------------------
Distribution:
Binomial
Lower Tail Area (<)
Variable Dist. 1 Dist.
2
Dist. 3 Dist. 4 Dist. 5
3
0,16308
Probability Mass (=)
Variable Dist. 1 Dist.
2
Dist. 3 Dist. 4 Dist. 5
3
0,3087
Upper Tail Area (>)
Variable Dist. 1 Dist.
2
Dist. 3 Dist. 4 Dist. 5
3
0,52822
The
StatAdvisor
---------------
This pane evaluates the
cumulative binomial distribution.
It will
calculate
the tail areas for up to 5 critical values of the
distribution. It will also calculate the probability
density or mass
function. For example, the output indicates that,
for the first
distribution
specified, the probability of obtaining a value less than
3,0 is
0,16308. Also, the probability of
obtaining a value greater
than 3,0 is
0,52822. The probability of
obtaining a value exactly
equal to 3,0 is 0,3087.
El valor que nos interesa es, por tanto, el siguiente:
Cumulative
Distribution
-----------------------
Distribution:
Binomial
Upper Tail Area (>)
Variable Dist. 1 Dist. 2 Dist.
3
Dist. 4 Dist. 5
3
0,52822