mesures répétées

un plan de mesures répétées est un plan dans lequel des mesures multiples ou répétées sont effectuées sur chaque unité expérimentale. L’unité expérimentale pourrait être une personne ou un animal, et des mesures répétées pourraient être prises en série dans le temps, telles que la pression artérielle systolique hebdomadaire ou le poids mensuel. Les évaluations répétées pourraient être mesurées dans différentes conditions expérimentales. Des mesures répétées sur la même unité expérimentale peuvent également être prises à un moment donné., Par exemple, il pourrait être intéressant de mesurer le diamètre de chacune de plusieurs lésions au sein de chaque personne ou animal dans une étude. La dépendance, ou corrélation, entre les réponses mesurées chez le même individu est la caractéristique déterminante d’un plan de mesures répétées. Cette corrélation nécessite une analyse statistique qui tient compte de manière appropriée de la dépendance entre les mesures au sein d’une même unité expérimentale, ce qui se traduit par une analyse statistique plus précise et plus puissante.,

L’analyse des mesures répétées englobe un spectre d’applications, qui dans le cas le plus simple est une généralisation du test T apparié.1 un plan de mesures répétées à l’intérieur des sujets peut être considéré comme une extension du test T apparié qui implique ≥3 évaluations dans la même unité expérimentale. L’analyse des mesures répétées peut également gérer des conceptions plus complexes et d’ordre supérieur avec des composants internes au sujet et des composants multifactoriels entre les sujets. L’accent est mis ici sur les conceptions internes.,

problèmes de conception

un plan complètement randomisé est un plan dans lequel chaque unité expérimentale (par exemple, une personne ou un animal) est assignée au hasard à 1 de plusieurs traitements concurrents. Par exemple, une étude est proposée Pour comparer 4 traitements (par exemple, un témoin et 3 traitements actifs distincts ou un témoin et 3 doses différentes d’un même traitement), et un échantillon de 20 animaux est randomisé aux 4 traitements., La randomisation pourrait être mise en œuvre par 1 d’un certain nombre de techniques possibles allant d’une randomisation simple (dans laquelle une seule séquence des nombres 1 à 4 est produite, et les animaux sont assignés en fonction de la séquence) à une randomisation plus impliquée qui utilise la stratification ou les blocs permutés.2 La stratégie des blocs permutés est utilisée pour assurer l’équilibre dans le processus de randomisation, de sorte qu’un nombre égal d’animaux est attribué à chaque traitement., Cette stratégie peut être conçue pour assurer l’équilibre à des points d’inscription spécifiés, par exemple, l’équilibre entre les 4 traitements après la randomisation de 8 (2 par traitement) ou 12 (3 par traitement) unités expérimentales. Cette stratégie est généralement utilisée lorsque l’inscription à une étude se produit au fil du temps. Avec la stratégie des blocs permutés, 5 animaux seraient assignés au hasard à chaque traitement dans le présent exemple.

L’objectif de l’analyse est de comparer les réponses entre les 4 traitements. Si la variable dépendante ou de résultat est continue, ce test est effectué avec ANOVA.,3 si la variable de résultat est catégorique, ce test est effectué avec un test χ2.4 Ces tests sont basés sur l’hypothèse que les mesures à l’intérieur et entre les traitements sont indépendantes ou non liées. Si les unités expérimentales ne sont pas liées (c.-à-d. pas des membres de la famille ou des compagnons de litière) et qu’une mesure a été effectuée par unité, cette hypothèse est raisonnable.

en revanche, dans un plan à mesures répétées, plusieurs mesures sont prises sur chaque unité expérimentale. Considérons à nouveau l’application décrite ci-dessus dans laquelle le but de l’analyse est de comparer les 4 traitements concurrents., Un plan de mesures répétées pourrait impliquer 5 animaux, mesurés chacun 4 fois, une fois dans chaque condition expérimentale. La conception des mesures répétées implique un plus petit nombre d’animaux, ce qui est à la fois efficace et attrayant sur le plan éthique.

Si 5 animaux sont mesurés dans chacune des 4 conditions expérimentales différentes, un total de 20 mesures sera à nouveau disponible pour analyse. Les 20 mesures, cependant, ne sont pas indépendantes mais sont liées au sein des sujets., Étant donné que les mesures peuvent être affectées par des caractéristiques internes au sujet (par exemple, l’âge ou des facteurs génétiques), des tests statistiques qui tiennent dûment compte de la corrélation interne au sujet sont nécessaires. Si nous supposons que les mesures prises chez le même individu sont corrélées, le test de différence de traitement impliquera une variance résiduelle ou d’erreur plus faible que celle basée sur un plan complètement randomisé, augmentant ainsi la précision de l’analyse.,

un plan de blocs randomisés est un plan dans lequel un ensemble d’unités expérimentales sont organisées en groupes ou blocs homogènes sur la base d’une caractéristique supposée affecter le résultat. L’objectif est d’avoir des répliques r de chacun des K traitements dans chacun des blocs b, avec la taille totale de l’échantillon n=kbr. Considérons à nouveau l’étude comparant 4 traitements concurrents (k=4). Supposons que le résultat d’intérêt soit connu pour être affecté par l’âge. Avec n = 20 unités expérimentales indépendantes, celles-ci pourraient être organisées en 5 groupes d’âge (par exemple, quintiles d’âge) avec 1 réplication par groupe (k=4, b=5, r=1)., Dans un plan de blocs randomisés, les unités expérimentales dans chaque bloc sont attribuées au hasard aux traitements, et cette technique réduit la variation due aux différences d’âge. La conception peut être considérée comme des réplications d’une expérience complètement randomisée dans laquelle il y a autant de réplications qu’il y a de blocs.

certains plans de mesures répétées peuvent être considérés comme un cas particulier du plan de blocs randomisés dans lequel le bloc est l’unité expérimentale individuelle (par exemple, une personne ou un animal). La conception de blocs randomisés est souvent utilisée avec des frères et sœurs ou des littermates., L’unité familiale est le bloc, et les évaluations sont répétées sur chaque membre de la famille. Les évaluations au sein d’une famille ou d’une portée sont liées. La prise en compte des dépendances dans le bloc permet un test plus précis des différences de traitement.

Repeated-Measures Analysis

Repeated-measures analysis peut être utilisé pour évaluer les changements au fil du temps dans un résultat mesuré en série ou pour tester les différences dans 1 ou plusieurs traitements basés sur des évaluations répétées chez les mêmes sujets., L’application la plus simple a 1 facteur intra-sujets (par exemple, chacun des n sujets sont mesurés sous k traitements expérimentaux distincts), et le but de l’analyse est de tester une différence dans les traitements expérimentaux. Ceci est réalisé en construisant une statistique de test comme le rapport de la variance due aux traitements à la variance résiduelle ou d’erreur. Dans l’analyse à mesures répétées, la variance totale peut être divisée en variance entre sujets et variance à l’intérieur des sujets. La Variance entre les sujets reflète des différences., La Variance chez les sujets se compose de 2 composantes, les différences entre les traitements et l’erreur ou la variation résiduelle. La statistique de test pour tester l’hypothèse nulle de l’égalité des moyennes est le rapport entre la variation due aux traitements et la variation résiduelle, après élimination de la variation entre les sujets. Les composantes de la variance et de la statistique de test sont illustrées à la Figure 1. Les détails des calculs sont illustrés dans l’exemple 1.

la Figure 1., Partitionnement de la variance totale dans les mesures répétées à un facteur ANOVA.

Exemple 1

Une étude animale est effectuée pour évaluer le transgène d’activation dans le cœur. Le résultat principal est un raccourcissement fractionné en pourcentage, qui est mesuré à l’inclusion et à nouveau après 2, 4 et 6 semaines de traitement. Une évaluation finale est faite après 6 semaines de traitement et 2 semaines de traitement. À l’inclusion, les souris étaient âgées de 12 semaines; ainsi, lors des évaluations ultérieures, elles étaient âgées de 14, 16, 18 et 20 semaines., Trois souris ont complété le protocole, et les données sur le pourcentage de raccourcissement fractionnaire mesuré à chaque point temporel sont présentées dans le tableau 1. L’hypothèse de recherche est que les scores de raccourcissement fractionnaire moyen pour cent sont différents au fil du temps. Les moyennes à chaque point temporel sont indiquées dans la rangée inférieure du tableau 1 et diminuent avec le temps. Pour tester une différence significative de moyens au fil du temps, une ANOVA à mesures répétées est utilisée. Les résultats des mesures répétées ANOVA sont présentés dans le tableau 2. La statistique de test pour l’égalité des moyennes dans le temps est F=95.,4 (df=4,8), qui est hautement statistiquement significatif à P<0,0001. Ainsi, il existe une différence statistiquement significative dans le pourcentage moyen de raccourcissement fractionnaire au fil du temps.

le Tableau 1., colspan= »1″ rowspan= »1″>26

13
2 44 46 39 24 14
3 48 48 46 33 20
Moyenne 46.,7 48.3 41.3 27.7 15.7

Table 2.,res de la VARIANCE de la Différence en pour Cent de la fraction de Raccourcissement au Fil du Temps

Source de Variation Degrés de Liberté la Somme des Carrés Moyenne des Carrés F P
Entre les sujets 2 80.,5
à l’Intérieur des sujets 12 2380.4
Temps 4 2331.6 582.,0 95.4 <0.0001
Erreur 8 48.8 6.1
Total 14 2460.,9

Supposons que ces mêmes données ont été mal analysé comme si ils ont été dérivés à partir d’un dispositif complètement aléatoire. Les résultats de L’ANOVA, test de différence de moyenne au fil du temps, sont présentés dans le tableau 3. Si les données sont traitées incorrectement comme 15 observations indépendantes et analysées avec ANOVA, la statistique F est F=45,1 (df=4,10), ce qui est toujours très significatif statistiquement., Notez la différence dans l’erreur ou la variation résiduelle entre les méthodes. Le dénominateur de la statistique F pour tester les différences de moyennes dans le temps est l’erreur carrée moyenne. Dans L’ANOVA à mesures répétées, l’erreur quadratique moyenne est de 6,1 contre 12,9 dans L’ANOVA qui supposait l’indépendance. Dans cet exemple particulier, l’analyse incorrecte encore produit de résultats significatifs. Dans d’autres applications, le fait de ne pas tenir compte des dépendances entre les observations pourrait entraîner une conclusion non significative., L’ANOVA repeated-measures qui tient compte de manière appropriée des dépendances dans les données produit un test plus précis.

le Tableau 3., Analyse incorrecte à l’Aide de l’analyse de la VARIANCE pour Tester la Différence en pour-Cent de la fraction de Raccourcissement au Fil du Temps

Source de Variation Degrés de Liberté la Somme des Carrés Moyenne des Carrés F P
Temps 4 2331.,6 582.9 45.1 <0.0001
Erreur 10 à 129,3 12.9
Total 14 2460.,9

Si une différence significative est trouvé, il peut être intéressant de tester les différences entre les paires de traitements ou, dans l’exemple 1, entre des moments spécifiques. Ces tests doivent être traités avec une procédure de comparaison multiple qui gère à nouveau de manière appropriée la corrélation dans les données et contrôle également le taux d’erreur de type I (Voir Larson3 et Cabral5 pour plus de détails).,

analyse des mesures répétées avec des mesures répétées sur 1 facteur

une extension populaire de l’ANOVA à mesures répétées à Sens Unique est L’ANOVA à deux facteurs avec des mesures répétées sur 1 facteur. Dans cette application, un groupe de traitement (par exemple, un traitement médical par rapport à un traitement chirurgical, un traitement par rapport à un placebo ou contesté par rapport à un autre) est souvent utilisé, et différents sujets sont assignés à chaque groupe de traitement, mais le résultat est à nouveau mesuré à plusieurs reprises au fil du temps. L’objectif est de comparer les traitements par rapport aux différences dans les résultats., Le facteur de traitement est un facteur entre les sujets et n’a pas de mesures répétées. Cependant, des évaluations répétées sont effectuées sur chaque sujet au cours de chaque traitement au fil du temps et, par conséquent, le facteur temps doit être traité de manière appropriée dans l’analyse. La procédure divise à nouveau la variation pour produire des statistiques F afin de tester les hypothèses d’égalité des résultats entre les traitements et d’égalité des résultats au fil du temps. La variance est partitionnée comme le montre la Figure 2, et les tests d’hypothèse suivants sont effectués. Le premier test est un test pour l’effet du traitement., Ceci est fait en construisant une statistique F comme le rapport de la variation de traitement à la variation d’erreur due aux sujets dans les traitements (Figure 2). Le deuxième test porte sur les différences de résultats au fil du temps, le facteur répété. Ceci est à nouveau effectué en construisant une statistique F. La statistique F pour les différences dans le temps est basée sur le rapport entre la variation dans le temps et l’erreur ou la variation résiduelle., Comme il s’agit d’un plan à deux facteurs, une possibilité d’interaction entre le traitement et les facteurs temporels (c.-à-d. un effet différent du traitement dans le temps) peut également exister, et ceci est testé en construisant une statistique F comme le rapport de la variation du traitement par le temps à l’erreur ou à la variation résiduelle (Figure 2). Certains chercheurs testent d’abord le traitement et les effets temporels, puis effectuent un test d’interaction, tandis que d’autres testent d’abord une interaction, puis testent le traitement et les effets temporels., S’il existe une interaction statistiquement significative, l’effet du traitement est différent dans le temps et, par conséquent, les tests pour un effet global du traitement et un effet global dans le temps n’expliquent pas complètement les différences de résultat (voir Kleinbaum et al6 pour plus de détails).

la Figure 2. Partitionnement de la variance totale dans L’ANOVA à deux facteurs avec des mesures répétées sur 1 facteur.

Ces données peuvent être analysées de plusieurs façons différentes., Une question importante est la spécification appropriée de la nature des corrélations entre les mesures chez la même personne, appelée structure de covariance. La plupart des paquets de calcul statistique offrent une variété de structures de covariance pour ces types d’analyse, et les covariances doivent être modélisées correctement. Trois structures sont très populaires et conviennent à de nombreuses applications. La première est appelée « symétrie composée » et suppose que les corrélations entre toutes les paires de mesures sont les mêmes., Cela peut être raisonnable pour une étude à mesures répétées dans laquelle chaque sujet est mesuré dans k conditions expérimentales différentes. La seconde est appelée « autorégressive d’ordre 1 », ou AR (1), et suppose que les corrélations entre paires adjacentes sont plus grandes que les corrélations entre paires plus éloignées. Cela peut être raisonnable pour les données mesurées en série dans le temps, où les mesures plus proximales sont plus fortement corrélées que les mesures prises plus distantes dans le temps. Pour cette structure, les points temporels doivent être à peu près également espacés dans le temps., Une troisième structure populaire est appelée « non structurée », et comme son nom l’indique, elle suppose que chaque paire de mesures a sa propre corrélation. Bien que ce dernier puisse sembler attrayant, il produit en fait une analyse moins puissante car les données doivent d’abord être utilisées pour évaluer la structure de corrélation, puis pour effectuer les analyses primaires. Certains progiciels de calcul statistique (par exemple, SAS, SAS Institute, Cary, NC) offrent des métriques pour déterminer quelle structure correspond le mieux aux données. L’une de ces mesures est le critère D’information Akaike, avec lequel des valeurs plus petites indiquent un meilleur ajustement., Comme dans toutes les analyses statistiques, il est important de planifier et de mettre en œuvre des modèles parcimonieux qui sont biologiquement sensibles. Un exemple d’ANOVA à deux facteurs avec des mesures répétées sur 1 facteur est contenu dans l’exemple 2.

exemple 2

Une étude randomisée contrôlée versus placebo est réalisée pour estimer les effets à court terme d’un médicament antihypertenseur sur la pression artérielle systolique. Les sujets sont assignés au hasard pour recevoir le traitement ou un placebo., La pression artérielle systolique est mesurée avant l’administration de la première dose de traitement (à l’inclusion) et à nouveau 2, 4 et 6 semaines après le début du traitement (ou le placebo). L’étude implique 6 participants, dont 3 sont assignés au hasard à chaque bras de traitement; les données sur la pression artérielle systolique mesurée à chaque point de temps sont présentées dans le tableau 4. L’hypothèse de recherche est que la pression artérielle systolique moyenne est différente entre les traitements.

le Tableau 4.,>

150 148 144
thème 2 158 155 147 142
l’Objet 3 158 155 150 145
Moyenne 156.,7 153.3 de 148,3 143.,> 141 135 130
Sujet 5 160 151 135 120
Sujet 6 155 145 140 132
Moyenne 154.,3 145.7 136.7 127.3

La Figure 3 représente la moyenne de la pression sanguine systolique de plus de temps pour les participants en cours de traitement et un placebo. La pression artérielle systolique moyenne a diminué au fil du temps dans les deux groupes, avec une diminution plus nette dans le groupe de traitement. Les résultats de L’ANOVA à deux facteurs avec des mesures répétées sont contenus dans le tableau 5. La statistique de test pour les moyennes d’égalité de traitement dans le temps est F=36.,1 (df=1,4), ce qui est hautement statistiquement significatif à P=0,0039. Ainsi, une différence statistiquement significative est présente dans la pression artérielle systolique moyenne entre les patients recevant le médicament antihypertenseur et ceux recevant le placebo. Le test pour une différence dans la pression artérielle systolique moyenne au fil du temps est également très statistiquement significatif . Le test de l’interaction entre le traitement et le temps est marginalement significatif . Ce test évalue l’homogénéité de la différence de pression artérielle moyenne entre le groupe traité et le groupe placebo au fil du temps., La Figure 3 montre que la différence de moyennes s’élargit au fil du temps, ce qui pousse le test d’interaction à se rapprocher de la signification statistique.

la Figure 3. Moyenne (SE) de la pression artérielle systolique au fil du temps dans les groupes sous traitement et placebo.

le Tableau 5., Mesures répétées ANOVA pour les Différences de Pression Artérielle au Cours du Temps

Source de Variation Degrés de Liberté la Somme des Carrés Moyenne des Carrés F P
*le dénominateur est Le carré moyen de l’erreur due à des sujets relevant de traitement.,
†Le dénominateur est l’erreur quadratique moyenne.
Entre les sujets 5 601.5
Traitement 1 541.5 541.,5 36.1* 0.0039
Erreur sujets relevant de traitement 4 60.0 15.0
Dans les sujets 18 1707.,0
Temps 3 1348.5 449.5 27.1† 0.0001
Traitement×temps 3 159.2 53.,1 3.2† 0.0626
Erreur 12 199.3 16.6
Total 23 2308.,5

Les analyses rapportées dans le Tableau 5 supposent l’égalité des corrélations entre les mesures (c’est à dire, composé de symétrie). Une autre analyse de ces données serait une structure de corrélation autorégressive dans laquelle les corrélations entre les mesures prises plus rapprochées dans le temps sont plus élevées que celles mesurées plus loin., Si nous supposons une structure de covariance AR(1), la statistique de test pour l’égalité des moyennes de traitement dans le temps est F=12,7, ce qui est significatif à P=0,0235. Le test pour une différence de pression artérielle systolique moyenne dans le temps est hautement statistiquement significatif (F=30,4, P=0,0001), et le test pour l’interaction entre le traitement et le temps est significatif (F=3,7, P=0,0423). Le critère D’information D’Akaike est de 102,7 pour le modèle de symétrie composé et de 98,0 pour le modèle AR(1). Étant donné que des valeurs plus petites indiquent un meilleur ajustement, le modèle AR(1) est un meilleur choix pour ces données.,

des estimations de l’effet du traitement sont fournies dans le tableau 6 pour le modèle qui suppose une symétrie composée et le modèle qui suppose une structure de covariance AR(1). Notez que les estimations de l’effet du traitement sont les mêmes; cependant, les erreurs types sont différentes, ce qui affecte l’importance de la différence.

le Tableau 6., Les estimations de l’Effet du Traitement en Supposant que les Différents Covariance des Structures

Structure de Covariance Estimation de l’Effet SE T P
Composé de symétrie 9.5 1.6 6.01 0.,0039
AR(1) 9.5 2.7 3.6 0.0235

autres Approches pour l’Analyse des Mesures Répétées de Données

Lors de mesures répétées ont été prises sur chaque unité expérimentale, plusieurs approches de l’analyse statistique sont possibles., En repensant à l’ANOVA à deux facteurs avec des mesures répétées sur un facteur 1, une approche simple pour gérer la corrélation entre les mesures répétées chez la même personne consiste à calculer des scores moyens pour chaque personne au fil du temps. Dans l’exemple 2, cela réduirait la taille des échantillons à n1=3 et n2=3, et le test pour les différences de traitement pourrait être effectué avec le test T non apparié. En utilisant les données de l’exemple 2, cela produirait t=6,0, P=0,0039, ce qui indique qu’une différence significative est présente dans la pression artérielle systolique moyenne entre les groupes., Ce test t est basé sur seulement 3 observations par groupe et 1 observation par participant (la pression artérielle systolique moyenne dans le temps). Cette approche est analytiquement correcte mais ne tire pas pleinement parti des données. Cette approche est beaucoup moins puissante que l’approche à mesures répétées. Une deuxième solution consiste à évaluer les différences de traitement à chaque moment. Dans l’exemple 2, cela se traduit par la réalisation de 4 tests T non appariés, 1 à chaque point d’observation. Cette approche est encore une fois inefficace, car elle ne permet pas d’évaluer les tendances au fil du temps., En outre, cette approche augmente la probabilité d’un résultat faussement positif en raison de tests statistiques multiples.5,7 l’approche la plus efficace consiste à rendre compte explicitement de la dépendance dans les données en utilisant des techniques de mesures répétées, ce qui peut être fait de différentes manières.

hypothèses et détails analytiques

une hypothèse importante dans l’analyse à mesures répétées est la sphéricité, ou homogénéité des variances dans le temps. La plupart des logiciels de calcul statistique proposent des tests de sphéricité., Si l’hypothèse est violée, des modèles mixtes peuvent être utilisés pour traiter explicitement les différences.8

un certain nombre de paquets de calcul statistique sont disponibles qui offrent des procédures pour les mesures répétées ANOVA. Dans ces packages, plusieurs options sont disponibles pour effectuer les tests. SAS, par exemple, propose plusieurs procédures capables de gérer les données de mesures répétées., Une attention particulière doit être portée à la disposition des données, à la spécification des facteurs (par exemple, fixes ou répétés), aux termes d’erreur appropriés pour les statistiques de test et à la nature des corrélations entre les observations mesurées chez le même individu (c.-à-d. la structure de covariance). Littell et al7,8 fournissent une approche détaillée de L’utilisation de SAS pour l’analyse à mesures répétées.

Divulgations

Aucun.

notes de bas de page

correspondance à Lisa M. Sullivan, Ph.D., école de santé publique de L’Université de Boston, Département de Biostatistique, 715 Albany St, Boston, MA 02118., E-mail
  • 1 Davis RB, Mukamal KJ. Test d’hypothèse: signifie: amorce statistique pour la recherche cardiovasculaire. Circulation. 2006; 114: 1078–1082.LinkGoogle Érudit
  • 2 Verberk WJ, Kroon AA, Kessels AGH, Nelemans PJ, VanRee JW, les Prêteurs JWM, Thien T, Bakx JC, VanMontfrans GA, Smit AJ, Beltman FW, DeLeeuw PW. Comparaison des techniques de randomisation pour les essais cliniques avec les données de la HOMERUS procès. hypertension. 2005; 14: 306–314.CrossrefMedlineGoogle Érudit
  • 3 Larson MG. L’analyse de la variance. Circulation. 2008; 117: 115–121.,LinkGoogle Scholar
  • 4 D’Agostino RB, Sullivan LM, Beiser AS. Introduction À La Biostatistique Appliquée. Belmont, Californie: Brooks / Cole; 2004.Google Scholar
  • 5 Cabral HJ. Procédures de comparaisons multiples. Circulation. 2008; 117: 698–705.LinkGoogle Scholar
  • 6 KLEINBAUM DG, Kupper LL, Muller KE. Analyse de régression appliquée et autres méthodes multivariables. 2e ed. À Boston, massachusetts: PWS-Kent; 1988.Google Scholar
  • 7 Littell RC, Henry PR, Ammerman CB. Analyse statistique des données de mesures répétées à l’aide de procédures SAS. J Anim Sci. 1998; 76: 1216–1231.,CrossrefMedlineGoogle Scholar
  • 8 Littell RC, Milliken GA, Stroup WW, Wolfinger RD. SAS System for Mixed Models. Cary, NC: SAS Institute Inc; 1996.Google Scholar

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *