Los modelos de diseño de experimentos son modelos estadísticos clásicos cuyo objetivo es
averiguar si unos determinados factores influyen en una variable de interés y, si existe influencia
de algún factor, cuantificar dicha influencia.
Empezamos
INTRODUCCION
Nota:
factores que se consideran son los
siguientes: hora a la que se produce la llamada; día de la semana en que se realiza la
llamada; zona de la ciudad desde la que se hace la llamada; sexo del que realiza la llamada;
tipo de teléfono (público o privado) desde el que se realiza la llamada.
— Una compañía de software está interesada en estudiar la variable porcentaje en que se
comprime un fichero, al utilizar un programa de compresión teniendo en cuenta el tipo
de programa utilizado y el tipo de fichero que se comprime.
— Se quiere estudiar el rendimiento de los alumnos en una asignatura y, para ello, se desean
controlar diferentes factores: profesor que imparte la asignatura; método de enseñanza;
sexo del alumno.
Inconsistencia de los datos
Nota:
Los procesos cambian con el tiempo, se producen cambios
en el personal (cambios de personas, mejoras del personal por procesos de aprendizaje,
motivación, ...), cambios en las máquinas (reposiciones, reparaciones, envejecimiento, ...).
Estos cambios tienen influencia en los datos recogidos, lo que hace que los datos históricos
sean poco fiables, sobre todo si se han recogido en un amplio espacio de tiempo.
Variables con fuerte correlacion
Nota:
Puede ocurrir que en el proceso existan dos o más
variables altamente correlacionadas que pueden llevar a situaciones confusas. Por ejemplo,
en el proceso hay dos variables X1 y X2 fuertemente correlacionadas que influyen en la
respuesta, pero si en los datos que se tiene aumenta al mismo tiempo el valor de las dos
variables no es posible distinguir si la influencia es debida a una u otra o a ambas variables
(confusión de los efectos). Otra situación problemática se presenta si solo se dispone de
datos de una variable (por ejemplo de X1 y no de X2), lo que puede llevar a pensar que la
variable influyente es la X1 cuando, en realidad, la variable influyente es la X2 (variable
oculta).
El rango de las variables controladas es limitado
Nota:
Si el rango de una de las variables
importantes e influyentes en el proceso es pequeño, no se puede saber su influencia fuera
de ese rango y puede quedar oculta su relación con la variable de interés o lo cambios
que se producen en la relación fuera del rango observado. Esto suele ocurrir cuando se
utilizan los datos recogidos al trabajar el proceso en condiciones normales y no se experimenta
(cambiando las condiciones de funcionamiento) para observar el comportamiento
del proceso en situaciones nuevas.
TIPOS DE VARIABILIDAD
Nota:
Uno de los principales objetivos de los modelos estadísticos y, en particular, de los modelos
de diseño de experimentos, es controlar la variabilidad de un proceso aleatorio que puede tener
diferente origen. De hecho, los resultados de cualquier experimento están sometidos a tres tipos
de variabilidad cuyas características son las siguientes:
Variabilidad sistemática y planificada
Nota:
Esta variabilidad viene originada por la posible
dispersión de los resultados debida a diferencias sistemáticas entre las distintas condiciones
experimentales impuestas en el diseño por expreso deseo del experimentador. Es el
tipo de variabilidad que se intenta identificar con el diseño estadístico.
Variabilidad típica de la naturaleza del problema
Nota:
Es la variabilidad
debida al ruido aleatorio. Este término incluye, entre otros, a la componente de
variabilidad no planificada denominada error de medida. Es una variabilidad impredecible
e inevitable.
variabilidad sistemática y no planificada
Nota:
Esta variabilidad produce una variación
sistemática en los resultados y es debida a causas desconocidas y no planificadas. En otras
palabras, los resultados están siendo sesgados sistemáticamente por causas desconocidas.
La presencia de esta variabilidad supone la principal causa de conclusiones erróneas y
estudios incorrectos al ajustar un modelo estadístico.
PLANIFICACION DE UN EXPERIMENTO
Nota:
La forma tradicional que se utilizaba en la experimentación, para el estudio de estos problemas,
se basaba en estudiar los factores uno a uno, esto es, variar los niveles de un factor
permaneciendo fijos los demás. Esta metodología presenta grandes inconvenientes:
— Es necesario un gran número de pruebas.
— Las conclusiones obtenidas en el estudio de cada factor tiene un campo de validez muy
restringido.
— No es posible estudiar la existencia de interacción entre los factores.
— Es inviable, en muchos casos, por problemas de tiempo o costo.
1. Definir los
objetivos del
experimento
Nota:
Se debe hacer una lista completa de las preguntas
concretas a las que debe dar respuesta el experimento. Es importante indicar solamente
cuestiones fundamentales ya que tratar de abordar problemas colaterales pueden complicar
innecesariamente el experimento.
Una vez elaborada la lista de objetivos, puede ser útil esquematizar el tipo de conclusiones
que se espera obtener en el posterior análisis de datos.
Normalmente la lista de objetivos es refinada a medida que se van ejecutando las etapas
del diseño de experimentos.
2. Identificar
todas la
posibles
fuentes de
variacion
Nota:
Se distinguen dos tipos:
— Factores tratamiento: son aquellas fuentes cuyo efecto sobre la respuesta es de particular
interés para el experimentador.
— Factores nuisance: son aquellas fuentes que no son de interés directo pero que se
contemplan en el diseño para reducir la variabilidad no planificada.
Factores y sus niveles
Nota:
Ejemplos de factores cualitativos y sus niveles respectivos son los siguientes:
— proveedor (diferentes proveedores de una materia prima),
— tipo de máquina (diferentes tipos o marcas de máquinas),
— trabajador (los trabajadores encargados de hacer una tarea),
— tipo de procesador (los procesadores de los que se quiere comparar su velocidad de
ejecución),
— un aditivo químico (diferentes tipos de aditivos químicos),
— el sexo (hombre y mujer),
— un método de enseñanza (un número determinado de métodos de enseñanza cuyos
resultados se quieren comparar).
Ejemplos de factores cuantitativos son los siguientes:
— tamaño de memoria (diferentes tamaños de memoria de ordenadores),
— droga (distintas cantidades de la droga),
— la temperatura (conjuntos de temperaturas seleccionadas en unos rangos de interés).
Unidades
experimentales
Nota:
Ejemplos de unidades experimentales son:
— en informática, ordenadores, páginas web, buscadores de internet,
— en agricultura, parcelas de tierra,
— en medicina, individuos humanos u animales,
— en industria, lotes de material, trabajadores, máquinas.
Factores
NUISANCE:
Bloques,
factores ruido y
covariables
Nota:
En cualquier experimento, además de los factores tratamiento cuyo efecto sobre la respuesta
se quiere evaluar, también influyen otros factores, de escaso interés en el estudio,
pero cuya influencia sobre la respuesta puede aumentar significativamente la variabilidad
no planificada. Con el fin de controlar esta influencia pueden incluirse en el diseño nuevos
factores que, atendiendo a su naturaleza, pueden ser de diversos tipos.
Bloque
Covariable
Ruido
3. Elegir una
regla de
asignación de
las unidades
experimentales
a las
condiciones de
estudio
Nota:
La regla de asignación o diseño experimental especifica que unidades experimentales se
observarán bajo cada tratamiento. Hay diferentes posibilidades:
4.
Especificar
las medidas
que se
realizaran
5. Ejecutar
un
experimento
piloto
6.
Especificar
el modelo
7.
Esquematizar
los pasos de
análisis
estadistico
8.
Determinar
el tamaño
muestral
9. Revisar las
decisiones
anteriores
Nota:
Es fundamental tener en cuenta que:
a) Ningún método de análisis estadístico, por sofisticado que sea, permite extraer conclusiones
correctas en un diseño de experimentos mal planificado. Recíprocamente,
debe quedar claro que el análisis estadístico es una etapa más que está completamente
integrado en el proceso de planificación.
b) El análisis estadístico no es un segundo paso independiente de la tarea de planificación.
Es necesario comprender la totalidad de objetivos propuestos antes de
comenzar con el análisis. Si no se hace así, tratar que el experimento responda a
otras cuestiones a posteriori puede ser (lo será casi siempre) imposible. Pero no sólo
los objetivos están presentes al inicio del análisis sino también la técnica experimental
empleada.
c) No invertir nunca todo el presupuesto en un primer conjunto de experimentos y
utilizar en su diseño toda la información previa disponible.
d) Toda persona implicada en la ejecución del experimento y en la recolección de los
datos debe ser informada con precisión de la estrategia experimental diseñada
RESUMEN DE LOS PRINCIPALES CONCEPTOS
1. Unidad
experimental
2. Variable
de interés o
respuesta
3. Factor
4.Factor
tratamiento
5. Factor
bloque
6. Niveles
7. Tratamiento
8.
Observación
experimental
9. Tamaño
de
experimento
10.
Interacción
de factores
11.
Ortogonalidad
de factores
12. Diseño
equilibrado
o
balanceado
PRINCIPIOS BASICOS EN EL DISEÑO DE EXPERIMENTOS
Nota:
Al planificar un experimento hay tres tres principios básicos que se deben tener siempre en
cuenta:
- El principio
de
aleatorizacion
Evita la dependencia entre observaciones al aleatorizar los instantes de recogida muestral.
Transforma la variabilidad sistemática no planificada en variabilidad no planificada o ruido aleatorio.
Dicho de otra forma, aleatorizar previene contra la introducción de sesgos en el experimento.
Valida muchos de los procedimientos estadísticos más comunes.
- El bloqueo
Nota:
Ejemplo.
Se desea investigar las posibles diferencias en la producción de dos máquinas, cada una de
las cuales debe ser manejada por un operario.
En el planteamiento de este problema la variable respuesta es la producción diaria de una
máquina, el factor tratamiento en el que se está interesado es el tipo de máquina que tiene dos
15
niveles y un factor nuisance es el operario que maneja la máquina. En el diseño del experimento
para realizar el estudio se pueden utilizar dos estrategias para controlar el factor operario que
maneja la máquina.
En ocasiones hay dos (o más) fuentes de variación lo suficientemente importantes como para
ser designadas factores de bloqueo. En tal caso, ambos factores bloque pueden ser cruzados o
anidados.
Los factores bloque están cruzados cuando existen unidades experimentales en todas las
combinaciones posibles de los niveles de los factores bloques.
Diseño con factores bloque cruzados. También denominado diseño fila-columna, se caracteriza
porque existen unidades experimentales en todas las celdas (intersecciones de fila y columna).
El modelo matemático de este diseño es:
Respuesta = Constante + Efecto Bloque Fila + Efecto Bloque Columna + Efecto Tratamiento
+ Error