Pr‡ctica 4

Introducci—n

En esta pr‡ctica trabajaremos el tema de dise–o de experimentos, que se corresponde con el tema 4 de teor’a. Empezaremos explicando c—mo obtener el an‡lisis de la varianza con un solo factor (dise–o completamente aleatorizado), siguiendo con el an‡lisis de la varianza con dos factores sin interacci—n (dise–o por bloques aleatorizados) y terminando con el ANOVA de dos factores con interacci—n (dise–o factorial con dos factores).

Problemas

1-. Con el fin de comparar el nivel de ruido presente, se est‡n estudiando cuatro circuitos digitales diferentes de computadoras. Los datos obtenidos se encuentran en las variables Ruido y Circuito, la cual indica el tipo de circuito considerado (de 1 a 4).

1.a) Especifica el modelo considerado.

Utilizaremos un dise–o completamente aleatorizado, es decir, ANOVA de un solo factor.

1.b) ÀHay alguna diferencia en cuanto al nivel de ruido debida al tipo de circuito? Usa a = 0.05

Observamos el resultado obtenido en el StatGraphics.

El StatAdvisor nos dice que no hay diferencias.

1.c) Analiza los residuos de este experimento.

This plot shows the residuals versus levels of Circuito.  The

residuals are equal to the observed values of Ruido minus the mean

Ruido for the group from which they come.  You should check this plot

to be sure that the variability within each level of Circuito is

approximately the same.

This plot shows the residuals versus predicted levels of Ruido.

The residuals are equal to the observed values of Ruido minus the mean

Ruido for the group from which they come.  The predicted values are

equal to the means of the 4 levels of Circuito.  This plot is useful

for detecting heteroscedasticity, in which the variance of Ruido

changes together with the mean.  If the points make a general

funnel-shaped pattern, it indicates a type of heteroscedasticity that

can often be corrected by transforming the dependent variable.  In

such cases, you might try entering LOG(Ruido), SQRT(Ruido), or 1/Ruido

as the dependent variable in the data input dialog box.

1.d) Contrasta la homogeneidad de varianzas usando el test de Bartlett.

El StatAdvisor nos dice que no podemos rechazar la hip—tesis nula, es decir, que las varianzas son homogŽneas.

1.e) Usa el mŽtodo de la LSD de Fisher para analizar los niveles de ruido medio de los  cuatro circuitos (usa a = 0.05).

* nos indica diferencias significativas en las medias.

2-. Las primeras terminales de v’deo de pantalla completa presentaban al operador caracteres blancos en un fondo negro. En un principio, los operadores pensaban que el alto grado de contraste era bueno para los ojos porque facilitaba su trabajo. Sin embargo, se vio que despuŽs de un periodo de uso prolongado las pantallas en blanco y negro a menudo causaban irritaci—n ocular temporal. La experimentaci—n con otros colores revel— que las pantallas amarillo/‡mbar podr’an ser las que menos esfuerzo exigen a los ojos. En un estudio realizado en Alemania, se tomaron terminales de v’deo con blanco/negro y seis diferentes colores de s’mbolos. Se pidi— a 30 sujetos cu‡l combinaci—n de color prefer’an calificando cada una de las 7 combinaciones de color en una escala de 0 (no preferida) a 10. Con base a las calificaciones de preferencia medias para cada color proporcionadas por los investigadores, hemos simulado las calificaciones de preferencia individuales indicadas por 10 sujetos que se presentan en las variable Calif. Las variables Colores y Sujeto, recopilan respectivamente los distintos niveles considerados: colores para las pantallas y los individuos.  Los datos se sometieron a un ANOVA para dise–o de bloques aleatorizados. (Est‡ basado en ÔÕMaximize your computing comfort and effiencyÕÕ, Computers & Electrnics, 1983. Las combinaciones eran: Verde/Negro, Blanco/Negro, Amarillo/Blanco, Anaranjado/Blanco, Amarillo, Amarillo/çmbar, Amarillo/Anaranjado.)

2.a) ÀQuŽ factor actœa como bloque?

El sujeto.

2.b) Especifica el modelo considerado.

Se trata de un dise–o en bloques aleatorizados.

2.c) ÀHay alguna diferencia en el color de pantalla preferido? (usa a = 0.05).

El StatAdvisor nos dice que como los dos p-valores obtenidos son menores que 0.05 podemos rechazar la hip—tesis nula, es decir, si que hay diferencias.

 2.d) Analiza los residuos del experimento.

This plot shows the residuals versus levels of Colores.  The

residuals are equal to the observed values of Calif minus the mean

Calif for the group from which they come.  You should check this plot

to be sure that the variability within each level of Colores is

approximately the same.

This plot shows the residuals versus predicted levels of Calif.

This plot is useful for detecting heteroscedasticity, in which the

variance of Calif changes together with the mean.  If the points make

a general funnel-shaped pattern, it indicates a type of

heteroscedasticity that can often be corrected by transforming the

dependent variable.  In such cases, you might try entering LOG(Calif),

SQRT(Calif), or 1/Calif as the dependent variable in the data input

dialog box.

2.e) Utiliza el mŽtodo de la LSD de Fisher para comparar las medias para los colores.

3-. Un m—dem es un dispositivo que convierte impulsos elŽctricos enviados por un ordenador en tonos de audio que viajan por las l’neas telef—nicas hasta una terminal remota. Se quiere comparar cuatro m—dems (Bizcomp 1012, Cermetek 212A, Smartmodem 1200, Vadic 3451) y supongamos que se escogen al azar cinco usuarios de cada tipo de m—dem y se les pide calificar el desempe–o del m—dem (medido en una escala de 0 a 100). Con base a los datos que se encuentran en las variables, Modem y Tipomodem:

3.a) ÀHay pruebas suficientes de que exista diferencia entre las calificaciones de desempe–o de los cuatro m—dems? (usa a = 0.05).

Nos dice que como el p-valor es menor que 0.05 rechazamos la hip—tesis nula y podemos afirmar que si existe diferencia.

3.b) Analiza los residuos. Guarda los residuos obtenidos y comprueba su normalidad: dibuja el normal probability plot (recuerda la pr‡ctica 2)  y usa los tests que conoces (tema 2). ÀTe parecen normales?

Los residuos que obtenemos ser‡n los siguientes:

-19,2

5,8

3,8

17,8

-8,2

-1,0

1,0

-3,0

0,0

3,0

-1,6

6,4

-2,6

-0,6

-1,6

-2,4

-1,4

1,6

-1,4

3,6

 

3.c) Utiliza el test de Kruskal-Wallis (usa a = 0.05). ÀCu‡l es tu conclusi—n?

No hay diferencia entre las medianas porque el p-valor es mayor que 0.05.

4-. Un gerente desea determinar si tres empleados realizan tareas de procesado de texto a esencialmente igual velocidad. Al mismo tiempo, desea saber si el tiempo de finalizaci—n se ve afectado por la elecci—n del paquete de software, A o B.  Dieciocho tareas de igual dificultad se asignan a los empleados y software. Los datos obtenidos aparecen en las variables: Tiempopro (para el tiempo en minutos de procesado), Empleado (para cada empleado) y Software (para cada paquete).

4.a) Construye la tabla de ANOVA de dos factores con interacci—n y determina si la interacci—n y los factores son significativos a nivel 0.05.

Nos dice que si que existe diferencia considerable entre interacci—n y factores.

4.b) Construye el gr‡fico de interacci—n.

No hay interacci—n entre las variables porque no se cruzan los gr‡ficos.

4.c) Calcula los intervalos de confianza para las medias en los distintos paquetes de software.

5-. Se est‡n estudiando tres marcas de pilas o bater’as. Se sospecha que la duraci—n (en semanas) de las tres marcas es diferente. Se prueban 5 bater’as de cada marca y los resultados que se obtienen vienen recogidos en las variables: Pilas y Marcapilas, Žsta œltima variable indica la marca de cada bater’a (de 1 a 3).

5.a) Especifica el modelo considerado.

Utilizaremos un dise–o completamente aleatorizado, es decir, ANOVA de un solo factor.

5.b) ÀHay alguna diferencia en cuanto a la duraci—n debida a la marca de bater’a? Usa a = 0.05.

Nos dice que si que hay diferencia.

5.c) Realiza un diagrama de cajas y comŽntalo.

This graph shows 3 box-and-whisker plots, one for each level of

Marcapilas.  The rectangular part of the plot extends from the lower

quartile to the upper quartile, covering the center half of each

sample.  The center lines within each box show the location of the

sample medians.  The plus signs indicate the location of the sample

means.  The whiskers extend from the box to the minimum and maximum

values in each sample, except for any outside or far outside points,

which will be plotted separately.  Outside points are points which lie

more than 1.5 times the interquartile range above or below the box and

are shown as small squares.  Far outside points are points which lie

more than 3.0 times the interquartile range above or below the box and

are shown as small squares with plus signs through them.  In this

case, there are no outside points, but there is 1 far outside point.

The presence of far outside points may indicate outliers or a highly

skewed distribution.

Podemos ver que cada marca de pila tiene una duraci—n determinada.

5.d) Analiza los residuos de este experimento.

This plot shows the residuals versus levels of Marcapilas.  The

residuals are equal to the observed values of Pilas minus the mean

Pilas for the group from which they come.  You should check this plot

to be sure that the variability within each level of Marcapilas is

approximately the same.

 

 

This plot shows the residuals versus predicted levels of Pilas.

The residuals are equal to the observed values of Pilas minus the mean

Pilas for the group from which they come.  The predicted values are

equal to the means of the 3 levels of Marcapilas.  This plot is useful

for detecting heteroscedasticity, in which the variance of Pilas

changes together with the mean.  If the points make a general

funnel-shaped pattern, it indicates a type of heteroscedasticity that

can often be corrected by transforming the dependent variable.  In

such cases, you might try entering LOG(Pilas), SQRT(Pilas), or 1/Pilas

as the dependent variable in the data input dialog box.

5.e) Usa el mŽtodo de la LSD de Fisher para analizar los duraciones medias de las tres pilas (usa a = 0.05).



Alojamiento con 500GB de espacio y 5000GB de ancho de banda por 4 euros al mes
Cómo contratar servicios de hosting con Dreamhost
Descuento, promocode para dreamhost de $50