medidas repetidas

un diseño de medidas repetidas es aquel en el que se realizan mediciones múltiples o repetidas en cada unidad experimental. La unidad experimental podría ser una persona o un animal, y las mediciones repetidas podrían tomarse en serie en el tiempo, como en la presión arterial sistólica semanal o pesos mensuales. Las evaluaciones repetidas podrían medirse en diferentes condiciones experimentales. También se pueden realizar mediciones repetidas en la misma unidad experimental en un momento dado., Por ejemplo, podría ser de interés medir el diámetro de cada una de las varias lesiones dentro de cada persona o animal en un estudio. La dependencia, o correlación, entre las respuestas medidas en el mismo individuo es la característica definitoria de un diseño de medidas repetidas. Esta correlación requiere un análisis estadístico que tenga debidamente en cuenta la dependencia entre las mediciones dentro de la misma unidad experimental, lo que resulta en un análisis estadístico más preciso y potente.,

el análisis de medidas repetidas abarca un espectro de aplicaciones, que en el caso más simple es una generalización del test t Pareado.1 un diseño de medidas repetidas dentro de los sujetos puede ser considerado como una extensión de la prueba t pareada que involucra ≥3 evaluaciones en la misma unidad experimental. El análisis de medidas repetidas también puede manejar diseños más complejos y de orden superior con componentes dentro del sujeto y componentes multifactoriales entre los sujetos. El enfoque aquí está en los diseños dentro de los sujetos.,

problemas de diseño

un diseño completamente aleatorio es uno en el que cada unidad experimental (por ejemplo, persona o animal) se asigna aleatoriamente a 1 de varios tratamientos competidores. Por ejemplo, se propone un estudio para comparar 4 tratamientos (por ejemplo, un control y 3 tratamientos activos distintos o un control y 3 dosis diferentes del mismo tratamiento), y una muestra de 20 animales son aleatorizados a los 4 tratamientos., La aleatorización podría implementarse mediante 1 de una serie de técnicas posibles que van desde una simple aleatorización (en la que se produce una sola secuencia de los números del 1 al 4, y los animales se asignan de acuerdo con la secuencia) hasta una aleatorización más involucrada que utiliza estratificación o bloques permutados.2 la estrategia de bloques permutados se utiliza para garantizar el equilibrio en el proceso de aleatorización de modo que se asigne un número igual de animales a cada tratamiento., Esta estrategia se puede diseñar para garantizar el equilibrio en los puntos de inscripción especificados, por ejemplo, el equilibrio entre los 4 tratamientos después de la aleatorización de 8 (2 por tratamiento) o 12 (3 por tratamiento) unidades experimentales. Esta estrategia se utiliza generalmente cuando la inscripción en un estudio ocurre con el tiempo. Con la estrategia de bloques permutados, 5 animales serían asignados aleatoriamente a cada tratamiento en el presente ejemplo.

El objetivo del análisis es comparar las respuestas entre los 4 tratamientos. Si la variable dependiente o de resultado es continua, esta prueba se realiza con ANOVA.,3 si la variable de resultado es categórica, esta prueba se realiza con una prueba de χ2.4 Estas pruebas se basan en el supuesto de que las mediciones dentro y entre los tratamientos son independientes o no están relacionadas. Si las unidades experimentales no están relacionadas (es decir, no son miembros de la familia o compañeros de camada), y se ha hecho una medición por unidad, entonces esta suposición es razonable.

en contraste, en un diseño de medidas repetidas, se toman múltiples mediciones en cada unidad experimental. Considere nuevamente la aplicación descrita anteriormente en la que el objetivo del análisis es comparar los 4 tratamientos competidores., Un diseño de medidas repetidas podría involucrar a 5 animales, cada uno medido 4 veces, una vez bajo cada condición experimental. El diseño de medidas repetidas implica un menor número de animales, lo que es a la vez eficiente y éticamente atractivo.

si se miden 5 animales en cada una de las 4 condiciones experimentales diferentes, un total de 20 mediciones estarán nuevamente disponibles para el análisis. Las 20 mediciones, sin embargo, no son independientes sino que están relacionadas dentro de los sujetos., Debido a que las mediciones pueden verse afectadas por las características dentro del sujeto (por ejemplo, la edad o factores genéticos), se necesitan pruebas estadísticas que tengan debidamente en cuenta la correlación dentro del sujeto. Si asumimos que las medidas tomadas en el mismo individuo están correlacionadas, la prueba para una diferencia en los tratamientos implicará una varianza residual o de error menor que la basada en un diseño completamente aleatorio, aumentando así la precisión en el análisis.,

un diseño de bloques aleatorios es aquel en el que un conjunto de unidades experimentales se organizan en grupos o bloques homogéneos sobre la base de una característica que se supone que afecta el resultado. El objetivo es tener R réplicas de cada uno de los tratamientos k en cada uno de los bloques b, con el tamaño total de la muestra n = kbr. Considere nuevamente el estudio que compara 4 tratamientos competidores (k=4). Supongamos que se sabe que el resultado del interés se ve afectado por la edad. Con n = 20 unidades experimentales independientes, estas podrían estar organizadas en 5 grupos de edad (por ejemplo, quintiles de edad) con 1 replicación por Grupo (k=4, b=5, r=1)., En un diseño de bloques aleatorios, las unidades experimentales dentro de cada bloque se asignan aleatoriamente a los tratamientos, y esta técnica reduce la variación debido a las diferencias en la edad. El diseño puede ser pensado como réplicas de un experimento completamente aleatorio en el que hay tantas replicaciones como bloques.

algunos diseños de medidas repetidas pueden verse como un caso especial del diseño de bloques aleatorios en el que el bloque es la unidad experimental individual (por ejemplo, persona o animal). El diseño de bloques aleatorios se usa a menudo con hermanos o compañeros de camada., La unidad familiar es el bloque, y las evaluaciones se repiten en cada miembro de la familia. Las evaluaciones dentro de una familia o camada están relacionadas. La contabilidad de las dependencias dentro del bloque da como resultado una prueba más precisa de las diferencias de tratamiento.

análisis de medidas repetidas

El análisis de medidas repetidas se puede utilizar para evaluar los cambios a lo largo del tiempo en un resultado medido en serie o para probar las diferencias en 1 o más tratamientos basados en evaluaciones repetidas en los mismos sujetos., La aplicación más simple tiene 1 factor dentro de los sujetos (por ejemplo, cada uno de n sujetos se miden bajo K tratamientos experimentales distintos), y el objetivo del análisis es probar una diferencia en los tratamientos experimentales. Esto se logra mediante la construcción de una estadística de prueba como la relación de la varianza debida a los tratamientos a la varianza residual o de error. En el análisis de medidas repetidas, la varianza total se puede dividir en varianza entre sujetos y varianza dentro de los sujetos. La diferencia entre las asignaturas refleja las diferencias individuales., La varianza dentro de los sujetos consta de 2 componentes, diferencias entre tratamientos y error o variación residual. El estadístico de prueba para probar la hipótesis nula de igualdad de medias es la relación entre la variación debida a los tratamientos y la variación residual, después de que se haya eliminado la variación entre sujetos. Los componentes de varianza y el estadístico de la prueba se ilustran en la Figura 1. Los detalles de los cálculos se ilustran en el ejemplo 1.

la Figura 1., La partición de la varianza total en ANOVA de medidas repetidas de un factor.

ejemplo 1

se realiza un estudio en animales para evaluar la activación de los transgénicos en el corazón. El resultado primario es el acortamiento porcentual fraccional, que se mide al inicio y de nuevo después de 2, 4 y 6 semanas de tratamiento. Se realiza una evaluación final después de 6 semanas de tratamiento y 2 semanas sin tratamiento. Al inicio, los ratones tenían 12 semanas de edad; por lo tanto, en evaluaciones posteriores, tenían 14, 16, 18 y 20 semanas de edad., Tres ratones completaron el protocolo, y los datos sobre el porcentaje de acortamiento fraccional medido en cada punto de tiempo se muestran en la tabla 1. La hipótesis de la investigación es que el porcentaje medio de las puntuaciones de acortamiento fraccional son diferentes con el tiempo. Las medias en cada punto temporal se muestran en la fila inferior de la tabla 1 y disminuyen con el tiempo. Para probar una diferencia significativa en las medias a lo largo del tiempo, se utiliza un ANOVA de medidas repetidas. Los resultados de las medidas repetidas ANOVA se encuentran en la Tabla 2. La estadística de prueba para la igualdad de medias en el tiempo es F = 95.,4 (df = 4,8), que es altamente estadísticamente significativo en p<0.0001. Por lo tanto, existe una diferencia estadísticamente significativa en el acortamiento fraccional porcentual medio a lo largo del tiempo.

la Tabla 1., colspan=»1″ rowspan=»1″>26

13
2 44 46 39 24 14
3 48 48 46 33 20
Media 46.,7 48.3 41.3 27.7 15.7

Table 2.,res ANOVA de Diferencia en el Porcentaje de la fracción de Acortamiento en el Tiempo

Fuente de Variación Grados de Libertad las Sumas de Cuadrados la Media de los Cuadrados F P
Entre los sujetos 2 80.,5
Dentro de los temas 12 2380.4
el Tiempo 4 2331.6 582.,0 95.4 <0.0001
Error 8 48.8 6.1
Total 14 2460.,9

Supongamos que estos mismos datos fueron incorrectamente analizado como si se deriva de un diseño completamente aleatorizado. Los resultados de la ANOVA, comprobando la diferencia de medias a lo largo del tiempo, están contenidos en la Tabla 3. Si los datos se tratan incorrectamente como 15 observaciones independientes y se analizan con ANOVA, el estadístico F es F = 45.1(df = 4,10), que sigue siendo altamente estadísticamente significativo., Observe la diferencia en el error o variación residual entre los métodos. El denominador de la estadística F para probar las diferencias en las medias a lo largo del tiempo es el error cuadrado medio. En la ANOVA de medidas repetidas, el error cuadrado medio es 6.1 comparado con 12.9 en la ANOVA que asumió independencia. En este ejemplo en particular, el análisis incorrecto todavía produjo un resultado significativo. En otras aplicaciones, el no tener en cuenta las dependencias entre las observaciones podría resultar en un hallazgo no significativo., La ANOVA de medidas repetidas que da cuenta apropiadamente de las dependencias en los datos produce una prueba más precisa.

la Tabla 3., Análisis incorrectos Mediante análisis de VARIANZA para la Prueba de Diferencia en el Porcentaje de la fracción de Acortamiento en el Tiempo

Fuente de Variación Grados de Libertad las Sumas de Cuadrados la Media de los Cuadrados F P
el Tiempo 4 2331.,6 582.9 45.1 <0.0001
Error 10 129.3 12.9
Total 14 2460.,9

Si una diferencia significativa se encuentra, puede ser de interés para la prueba de diferencias entre pares de tratamientos o, en el ejemplo 1, entre los puntos de tiempo específicos. Estas pruebas deben manejarse con un procedimiento de comparación múltiple que nuevamente maneje apropiadamente la correlación en los datos y también controle la tasa de error de tipo I (ver Larson3 y Cabral5 para más detalles).,

análisis de medidas repetidas con medidas repetidas en 1 Factor

una extensión popular del ANOVA de medidas repetidas unidireccionales es el ANOVA de dos factores con medidas repetidas en 1 factor. En esta aplicación, a menudo se usa un grupo de tratamiento (por ejemplo, tratamiento médico versus tratamiento quirúrgico, tratamiento versus placebo o desafiado versus no desafiado), y se asignan diferentes sujetos a cada grupo de tratamiento, pero el resultado se mide nuevamente repetidamente con el tiempo. El objetivo es comparar los tratamientos con respecto a las diferencias en el resultado., El factor de tratamiento es un factor entre sujetos y no tiene medidas repetidas. Sin embargo, se toman evaluaciones repetidas de cada tema dentro de cada tratamiento a lo largo del tiempo, y por lo tanto, el factor tiempo debe manejarse adecuadamente en el análisis. El procedimiento nuevamente divide la variación para producir estadísticas F para probar las hipótesis de igualdad de resultados entre tratamientos e igualdad de resultados a lo largo del tiempo. La varianza se divide como se muestra en la Figura 2, y se realizan las siguientes pruebas de hipótesis. La primera prueba es una prueba para el efecto del tratamiento., Esto se hace mediante la construcción de una estadística F como la relación entre la variación del tratamiento y la variación del error debido a los sujetos dentro de los tratamientos (Figura 2). La segunda prueba es para las diferencias en los resultados a lo largo del tiempo, el factor repetido. Esto se realiza de nuevo mediante la construcción de una estadística F. La estadística F para las diferencias a lo largo del tiempo se basa en la relación entre la variación temporal y el error o la variación residual., Debido a que este es un diseño de dos factores, también puede existir la posibilidad de una interacción entre el tratamiento y los factores de tiempo (es decir, un efecto diferente del tratamiento a lo largo del tiempo), y esto se prueba mediante la construcción de un estadístico F como la relación entre la variación del tratamiento por tiempo y el error o variación residual (Figura 2). Algunos investigadores prueban primero el tratamiento y los efectos temporales y luego realizan una prueba para la interacción, mientras que otros prueban primero una interacción y luego prueban los efectos temporales y del tratamiento., Si existe una interacción estadísticamente significativa, el efecto del tratamiento es diferente con el tiempo, y por lo tanto, las pruebas para un efecto global del tratamiento y un efecto global del tiempo no explican completamente las diferencias en el resultado (ver Kleinbaum et al6 para más detalles).

la Figura 2. Partición de la varianza total en ANOVA de dos factores con medidas repetidas en 1 factor.

estos datos se pueden analizar de varias maneras diferentes., Una cuestión importante es la especificación apropiada de la naturaleza de las correlaciones entre mediciones en la misma persona, llamada estructura de covarianza. La mayoría de los paquetes de computación estadística ofrecen una variedad de estructuras de covarianza para estos tipos de análisis, y las covarianzas deben modelarse correctamente. Tres estructuras son muy populares y se adaptan a muchas aplicaciones. La primera se llama «simetría compuesta» y asume que las correlaciones entre todos los pares de medidas son las mismas., Esto puede ser razonable para un estudio de medidas repetidas en el que cada sujeto se mide bajo k condiciones experimentales diferentes. El segundo se llama «autorregresivo de orden 1», o AR (1), y asume que las correlaciones entre pares adyacentes son mayores que las correlaciones entre pares más distantes. Esto puede ser razonable para los datos medidos en serie en el tiempo, donde las medidas más próximas están más altamente correlacionadas que las medidas tomadas más distantes en el tiempo. Para esta estructura, los puntos de tiempo deben estar aproximadamente igualmente espaciados en el tiempo., Una tercera estructura popular se llama «desestructurada», y como su nombre lo indica, asume que cada par de medidas tiene su propia correlación. Aunque este último pueda parecer atractivo, en realidad produce un análisis menos potente porque los datos primero deben usarse para evaluar la estructura de correlación y luego para realizar los análisis primarios. Algunos paquetes de computación estadística (por ejemplo, SAS, SAS Institute, Cary, NC) ofrecen métricas para determinar qué estructura se adapta mejor a los datos. Una de esas medidas es el criterio de información de Akaike, con el cual valores más pequeños indican un mejor ajuste., Como en todos los análisis estadísticos, es importante planificar e implementar modelos parsimoniosos que sean biológicamente sensibles. Un ejemplo de un ANOVA de dos factores con medidas repetidas en 1 factor está contenido en el ejemplo 2.

Ejemplo 2

se realiza un estudio aleatorizado, controlado con placebo para estimar los efectos a corto plazo de un medicamento antihipertensivo sobre la presión arterial sistólica. Los sujetos se asignan al azar para recibir el tratamiento o un placebo., La presión arterial sistólica se mide antes de la administración de la primera dosis de tratamiento (basal) y de nuevo a las 2, 4 y 6 semanas después del inicio del tratamiento (o placebo). El estudio involucra a 6 Participantes, 3 de los cuales son asignados aleatoriamente a cada grupo de tratamiento; los datos sobre la presión arterial sistólica medida en cada momento se muestran en la Tabla 4. La hipótesis de la investigación es que la presión arterial sistólica media es diferente entre los tratamientos.

la Tabla 4.,>

150 148 144
Tema 2 158 155 147 142
Tema 3 158 155 150 145
Media 156.,7 153.3 148.3 143.,> 141 135 130
Tema 5 160 151 135 120
Tema 6 155 145 140 132
Media 154.,3 145.7 136.7 127.3

la figura 3 muestra la presión arterial sistólica media a lo largo del tiempo para los participantes en tratamiento y a los que se les administró placebo. La presión arterial sistólica Media disminuyó con el tiempo en ambos grupos, con una disminución más marcada en el grupo de tratamiento. Los resultados del ANOVA de dos factores con medidas repetidas están contenidos en la Tabla 5. La estadística de la prueba para la igualdad de las medias de tratamiento en el tiempo es F = 36.,1 (df = 1,4), que es altamente estadísticamente significativa en P=0,0039. Por lo tanto, existe una diferencia estadísticamente significativa en la presión arterial sistólica media entre los pacientes tratados con medicación antihipertensiva y los tratados con placebo. La prueba para una diferencia en la presión arterial sistólica media a lo largo del tiempo también es altamente estadísticamente significativa . La prueba para la interacción entre el tratamiento y el tiempo es marginalmente significativa . Esta prueba evalúa la homogeneidad de la diferencia en la presión arterial media entre los grupos de tratamiento y placebo a lo largo del tiempo., La figura 3 muestra que la diferencia de medias se está ampliando con el tiempo, lo que está impulsando la prueba de interacción para acercarse a la significación estadística.

la Figura 3. Media (EE) de la presión arterial sistólica a lo largo del tiempo en los grupos de tratamiento y placebo.

la Tabla 5., De Medidas repetidas ANOVA para las Diferencias en la Presión Arterial con el Tiempo

Fuente de Variación Grados de Libertad las Sumas de Cuadrados la Media de los Cuadrados F P
*El denominador es el error cuadrático medio, debido a que los sujetos en tratamiento.,
†El denominador es el error cuadrático medio.
Entre los sujetos 5 601.5
Tratamiento 1 541.5 541.,5 36.1* 0.0039
Error de los sujetos en tratamiento 4 60.0 15.0
Dentro de los temas 18 1707.,0
el Tiempo 3 1348.5 449.5 27.1† 0.0001
Tratamiento x tiempo 3 159.2 53.,1 3.2† 0.0626
Error 12 199.3 16.6
Total 23 2308.,5

Los análisis reportados en la Tabla 5 se asume la igualdad de las correlaciones entre las mediciones (es decir, compuesto de simetría). Un análisis alternativo para estos datos sería una estructura de correlación autorregresiva en la que las correlaciones entre las medidas tomadas más cerca en el tiempo son más altas que las medidas más distantes., Si asumimos una estructura de covarianza AR (1), el estadístico de la prueba para la igualdad de medias de tratamiento en el tiempo es F=12,7, lo que es significativo en P=0,0235. La prueba de la diferencia en la presión arterial sistólica media a lo largo del tiempo es altamente estadísticamente significativa (F=30.4, P=0.0001), y la prueba de la interacción entre el tratamiento y el tiempo es significativa (F=3.7, P=0.0423). El criterio de información de Akaike es 102.7 para el modelo de simetría compuesta y 98.0 para el modelo AR(1). Debido a que los valores más pequeños indican un mejor ajuste, el modelo AR(1) es una mejor opción para estos datos.,

Las estimaciones del efecto del tratamiento se proporcionan en la Tabla 6 tanto para el modelo que asume la simetría compuesta como para el modelo que asume una estructura de covarianza AR(1). Observe que las estimaciones del efecto del tratamiento son las mismas; sin embargo, los errores estándar son diferentes, lo que afecta la importancia de la diferencia.

la Tabla 6., Las estimaciones del Efecto del Tratamiento Asumiendo Diferentes Estructuras de Covarianza

Estructura de Covarianza Estimación de Efecto SE T P
Compuesto de simetría 9.5 1.6 6.01 0.,0039
AR(1) 9.5 2.7 3.6 0.0235

Enfoques Alternativos para el Análisis de Medidas Repetidas de Datos

Cuando se repite medidas se han tomado en cada unidad experimental, varios enfoques para el análisis estadístico son posibles., Pensando de nuevo en el ANOVA de dos factores con medidas repetidas en 1 factor, un enfoque simple para manejar la correlación entre medidas repetidas en la misma persona implica calcular las puntuaciones medias para cada persona a lo largo del tiempo. En el ejemplo 2, esto reduciría los tamaños de muestra a n1=3 y n2=3, y la prueba de diferencias de tratamiento podría realizarse con la prueba t no emparejada. Utilizando los datos del Ejemplo 2, esto produciría t = 6,0, p=0,0039, lo que indica que existe una diferencia significativa en la presión arterial sistólica promedio entre los grupos., Esta prueba t se basa en solo 3 observaciones por grupo y 1 observación por participante (la presión arterial sistólica media a lo largo del tiempo). Este enfoque es analíticamente correcto, pero no aprovecha al máximo los datos. Este enfoque es mucho menos poderoso que el enfoque de medidas repetidas. Una segunda alternativa es evaluar las diferencias de tratamiento en cada momento. En el ejemplo 2, esto se traduce en la realización de 4 pruebas t no pareadas, 1 en cada punto de observación. Este enfoque también es ineficiente, porque no permite evaluar la tendencia a lo largo del tiempo., Además, este enfoque aumenta la probabilidad de un resultado falso positivo debido a múltiples pruebas estadísticas.5,7 el enfoque más eficiente es explicar explícitamente la dependencia en los datos mediante el uso de técnicas de medidas repetidas, y esto se puede hacer de muchas maneras diferentes.

supuestos y detalles analíticos

un supuesto importante en el análisis de medidas repetidas es la esfericidad, u homogeneidad de las varianzas a lo largo del tiempo. La mayoría de los paquetes de computación estadística ofrecen pruebas de esfericidad., Si se viola la suposición, se pueden usar modelos mixtos para abordar explícitamente las diferencias.8

Hay varios paquetes de computación estadística disponibles que ofrecen procedimientos para ANOVA de medidas repetidas. Dentro de estos paquetes, hay varias opciones disponibles para realizar las pruebas. SAS, por ejemplo, ofrece varios procedimientos que pueden manejar datos de medidas repetidas., Se debe prestar especial atención al diseño de los datos, la especificación de factores (por ejemplo, fijos o repetidos), los Términos de error apropiados para las estadísticas de prueba y la naturaleza de las correlaciones entre las observaciones medidas en el mismo individuo (es decir, la estructura de covarianza). Littell et al7, 8 proporcionan un enfoque detallado para el uso de SAS para el análisis de medidas repetidas.

divulgaciones

ninguna.

notas de pie de Página

correspondencia a Lisa M. Sullivan, PhD, Escuela de Salud Pública de la Universidad de Boston, Departamento de Bioestadística, 715 Albany St, Boston, MA 02118., E-mail

  • 1 Davis RB, Mukamal KJ. Prueba de hipótesis: Media: manual estadístico para la investigación cardiovascular. Circulación. 2006; 114: 1078–1082.LinkGoogle Scholar
  • 2 Verberk WJ, Kroon AA, Kessels AGH, Nelemans PJ, VanRee JW, Lenders JWM, Thien T, Bakx JC, VanMontfrans GA, Smit AJ, Beltman FW, DeLeeuw PW. Comparación de técnicas de aleatorización para ensayos clínicos con datos del ensayo HOMERUS. hipertensión. 2005; 14: 306–314.CrossrefMedlineGoogle Scholar
  • 3 Larson mg. Análisis de varianza. Circulación. 2008; 117: 115–121.,LinkGoogle Scholar
  • 4 D’Agostino RB, Sullivan LM, Beiser AS. Bioestadística Aplicada Introductoria. Belmont, Calif: Brooks / Cole; 2004.Google Scholar
  • 5 Cabral HJ. Procedimientos de comparaciones múltiples. Circulación. 2008; 117: 698–705.LinkGoogle Scholar
  • 6 Kleinbaum DG, Kupper LL, Muller KE. Análisis de regresión aplicada y otros métodos multivariables. 2nd ed. Boston, Mass: PWS-Kent; 1988.Google Scholar
  • 7 Littell RC, Henry PR, Ammerman CB. Análisis estadístico de datos de medidas repetidas utilizando procedimientos SAS. J Anim Sci. 1998; 76: 1216–1231.,CrossrefMedlineGoogle Scholar
  • 8 Littell RC, Milliken GA, Stroup WW, Wolfinger RD. SAS System for Mixed Models. Cary, NC: SAS Institute Inc; 1996.Google Scholar

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *