Pr‡ctica 4
Introducci—n
En esta pr‡ctica
trabajaremos el tema de dise–o de experimentos, que se corresponde con el tema
4 de teor’a. Empezaremos explicando c—mo obtener el an‡lisis de la varianza con
un solo factor (dise–o completamente aleatorizado), siguiendo con el an‡lisis
de la varianza con dos factores sin interacci—n (dise–o por bloques
aleatorizados) y terminando con el ANOVA de dos factores con interacci—n
(dise–o factorial con dos factores).
Problemas
1-. Con el fin de comparar el nivel de ruido presente, se est‡n estudiando cuatro circuitos digitales diferentes de computadoras. Los datos obtenidos se encuentran en las variables Ruido y Circuito, la cual indica el tipo de circuito considerado (de 1 a 4).
1.a) Especifica el modelo considerado.
Utilizaremos un dise–o completamente aleatorizado, es decir, ANOVA de un solo factor.
1.b) ÀHay alguna diferencia en cuanto al nivel de ruido debida al tipo de circuito? Usa a = 0.05
Observamos el resultado obtenido en el StatGraphics.

El StatAdvisor nos dice que no hay diferencias.
1.c) Analiza los residuos de este experimento.
This plot shows the residuals versus levels of Circuito. The
residuals are equal to the observed values of Ruido minus the mean
Ruido for the group from which they come. You should check this plot
to be sure that the variability within each level of Circuito is
approximately the same.
This plot shows the residuals versus predicted levels of
Ruido.
The residuals are equal to the observed values of Ruido minus the mean
Ruido for the group from which they come. The predicted values are
equal to the means of the 4 levels of Circuito. This plot is useful
for detecting heteroscedasticity, in which the variance of Ruido
changes together with the mean. If the points make a general
funnel-shaped pattern, it indicates a type of heteroscedasticity that
can often be corrected by transforming the dependent variable. In
such cases, you might try entering LOG(Ruido), SQRT(Ruido), or 1/Ruido
as the dependent variable in the data input dialog box.
1.d) Contrasta la homogeneidad de varianzas usando el test de Bartlett.

El StatAdvisor nos dice que no podemos rechazar la hip—tesis nula, es decir, que las varianzas son homogŽneas.
1.e) Usa el mŽtodo de la LSD de Fisher para analizar los niveles de ruido medio de los cuatro circuitos (usa a = 0.05).

* nos indica diferencias significativas en las medias.
2-. Las primeras terminales de v’deo de pantalla completa presentaban al operador caracteres blancos en un fondo negro. En un principio, los operadores pensaban que el alto grado de contraste era bueno para los ojos porque facilitaba su trabajo. Sin embargo, se vio que despuŽs de un periodo de uso prolongado las pantallas en blanco y negro a menudo causaban irritaci—n ocular temporal. La experimentaci—n con otros colores revel— que las pantallas amarillo/‡mbar podr’an ser las que menos esfuerzo exigen a los ojos. En un estudio realizado en Alemania, se tomaron terminales de v’deo con blanco/negro y seis diferentes colores de s’mbolos. Se pidi— a 30 sujetos cu‡l combinaci—n de color prefer’an calificando cada una de las 7 combinaciones de color en una escala de 0 (no preferida) a 10. Con base a las calificaciones de preferencia medias para cada color proporcionadas por los investigadores, hemos simulado las calificaciones de preferencia individuales indicadas por 10 sujetos que se presentan en las variable Calif. Las variables Colores y Sujeto, recopilan respectivamente los distintos niveles considerados: colores para las pantallas y los individuos. Los datos se sometieron a un ANOVA para dise–o de bloques aleatorizados. (Est‡ basado en ÔÕMaximize your computing comfort and effiencyÕÕ, Computers & Electrnics, 1983. Las combinaciones eran: Verde/Negro, Blanco/Negro, Amarillo/Blanco, Anaranjado/Blanco, Amarillo, Amarillo/çmbar, Amarillo/Anaranjado.)
2.a) ÀQuŽ factor actœa como bloque?
El sujeto.
2.b) Especifica el modelo considerado.
Se trata de un dise–o en bloques aleatorizados.
2.c) ÀHay alguna diferencia en el color de pantalla preferido? (usa a = 0.05).

El StatAdvisor nos dice que como los dos p-valores obtenidos son menores que 0.05 podemos rechazar la hip—tesis nula, es decir, si que hay diferencias.
2.d) Analiza los residuos del experimento.

This plot shows the residuals versus levels of Colores. The
residuals
are equal to the observed values of Calif minus the mean
Calif for
the group from which they come.
You should check this plot
to be sure
that the variability within each level of Colores is
approximately
the same.

This plot shows the residuals versus predicted
levels of Calif.
This plot is
useful for detecting heteroscedasticity, in which the
variance of
Calif changes together with the mean.
If the points make
a general
funnel-shaped pattern, it indicates a type of
heteroscedasticity
that can often be corrected by transforming the
dependent
variable. In such cases, you might
try entering LOG(Calif),
SQRT(Calif),
or 1/Calif as the dependent variable in the data input
dialog box.
2.e) Utiliza el mŽtodo de la LSD de Fisher para comparar las medias para los colores.

3-. Un m—dem es un dispositivo que convierte impulsos elŽctricos enviados por un ordenador en tonos de audio que viajan por las l’neas telef—nicas hasta una terminal remota. Se quiere comparar cuatro m—dems (Bizcomp 1012, Cermetek 212A, Smartmodem 1200, Vadic 3451) y supongamos que se escogen al azar cinco usuarios de cada tipo de m—dem y se les pide calificar el desempe–o del m—dem (medido en una escala de 0 a 100). Con base a los datos que se encuentran en las variables, Modem y Tipomodem:
3.a) ÀHay pruebas suficientes de que exista diferencia entre las calificaciones de desempe–o de los cuatro m—dems? (usa a = 0.05).

Nos dice que como el p-valor es menor que 0.05 rechazamos la hip—tesis nula y podemos afirmar que si existe diferencia.
3.b) Analiza los residuos. Guarda los residuos obtenidos y comprueba su normalidad: dibuja el normal probability plot (recuerda la pr‡ctica 2) y usa los tests que conoces (tema 2). ÀTe parecen normales?
Los residuos que obtenemos ser‡n los siguientes:
|
-19,2 5,8 3,8 17,8 |
-8,2 -1,0 1,0 -3,0 |
0,0 3,0 -1,6 6,4 |
-2,6 -0,6 -1,6 -2,4 |
-1,4 1,6 -1,4 3,6 |

3.c) Utiliza el test de Kruskal-Wallis (usa a = 0.05). ÀCu‡l es tu conclusi—n?

No hay diferencia entre las medianas porque el p-valor es mayor que 0.05.
4-. Un gerente desea determinar si tres empleados realizan tareas de procesado de texto a esencialmente igual velocidad. Al mismo tiempo, desea saber si el tiempo de finalizaci—n se ve afectado por la elecci—n del paquete de software, A o B. Dieciocho tareas de igual dificultad se asignan a los empleados y software. Los datos obtenidos aparecen en las variables: Tiempopro (para el tiempo en minutos de procesado), Empleado (para cada empleado) y Software (para cada paquete).
4.a) Construye la tabla de ANOVA de dos factores con interacci—n y determina si la interacci—n y los factores son significativos a nivel 0.05.

Nos dice que si que existe diferencia considerable entre interacci—n y factores.
4.b) Construye el gr‡fico de interacci—n.

No hay interacci—n entre las variables porque no se cruzan los gr‡ficos.
4.c) Calcula los intervalos de confianza para las medias en los distintos paquetes de software.

5-. Se est‡n estudiando tres marcas de pilas o bater’as. Se sospecha que la duraci—n (en semanas) de las tres marcas es diferente. Se prueban 5 bater’as de cada marca y los resultados que se obtienen vienen recogidos en las variables: Pilas y Marcapilas, Žsta œltima variable indica la marca de cada bater’a (de 1 a 3).
5.a) Especifica el modelo considerado.
Utilizaremos un dise–o completamente aleatorizado, es decir, ANOVA de un solo factor.
5.b) ÀHay alguna diferencia en cuanto a la duraci—n debida a la marca de bater’a? Usa a = 0.05.

Nos dice que si que hay diferencia.
5.c) Realiza un diagrama de cajas y comŽntalo.

This graph shows 3 box-and-whisker plots, one for each level of
Marcapilas. The rectangular part of the plot extends from the lower
quartile to the upper quartile, covering the center half of each
sample. The center lines within each box show the location of the
sample medians. The plus signs indicate the location of the sample
means. The whiskers extend from the box to the minimum and maximum
values in each sample, except for any outside or far outside points,
which will be plotted separately. Outside points are points which lie
more than 1.5 times the interquartile range above or below the box and
are shown as small squares. Far outside points are points which lie
more than 3.0 times the interquartile range above or below the box and
are shown as small squares with plus signs through them. In this
case, there are no outside points, but there is 1 far outside point.
The presence of far outside points may indicate outliers or a highly
skewed distribution.
Podemos ver que cada marca de pila tiene una duraci—n determinada.
5.d) Analiza los residuos de este experimento.

This plot shows the residuals versus levels of Marcapilas. The
residuals are equal to the observed values of Pilas minus the mean
Pilas for the group from which they come. You should check this plot
to be sure that the variability within each level of Marcapilas is
approximately the same.

This plot
shows the residuals versus predicted levels of Pilas.
The residuals are equal to the observed values of Pilas minus the mean
Pilas for the group from which they come. The predicted values are
equal to the means of the 3 levels of Marcapilas. This plot is useful
for detecting heteroscedasticity, in which the variance of Pilas
changes together with the mean. If the points make a general
funnel-shaped pattern, it indicates a type of heteroscedasticity that
can often be corrected by transforming the dependent variable. In
such cases, you might try entering LOG(Pilas), SQRT(Pilas), or 1/Pilas
as the dependent variable in the data input dialog box.
5.e) Usa el mŽtodo de la LSD de Fisher para analizar los duraciones medias de las tres pilas (usa a = 0.05).
