La méta-analyse : bien plus que le simple calcul d’un effet combiné!
Introduction
La méta-analyse est une démarche statistique qui permet de synthétiser quantitativement, par le calcul d’un effet combiné (ou poolé), les résultats d’études indépendantes ayant trait à une question de recherche bien précise. Cette synthèse des résultats est subséquente à une revue systématique et implique une méthodologie rigoureuse qui a pour but, entre autres, d’assurer l’impartialité de la synthèse et sa reproductibilité. Si elle est utilisée de manière appropriée, la méta-analyse permet une évaluation plus objective de la littérature comparativement à la revue narrative traditionnelle1. Elle permet de tirer des conclusions significatives à partir de l’ensemble des données publiées, se faisant ainsi un outil puissant pour soutenir la prise de décision, notamment pour la santé publique.
En soi, le calcul d’un effet combiné est relativement simple. La mise en commun des données de plusieurs études permet d’augmenter la puissance statistique, générant ainsi un effet combiné généralement plus précis, et qui peut sembler plus fiable. Toutefois, une telle synthèse statistique a une tendance inhérente à simplifier la complexité des devis et des méthodes utilisées dans les études sélectionnées. Un certain nombre de conditions doivent donc être remplies ou évalués avant que les données puissent être quantitativement combinées, sans quoi l’effet combiné estimé sera biaisé et les conclusions en découlant possiblement inexactes2-5.
À partir d’un exemple tiré de la littérature scientifique, les lignes qui suivent mettent en évidence certaines considérations méthodologiques en lien avec l’interprétation et la synthèse des résultats de différentes études. Plus précisément, ces considérations sont mises en évidence par la critique d’une publication de Pieters et al.6, dans laquelle les auteurs ont systématiquement revu et méta-analysé 29 études épidémiologiques portant sur l’association entre l’exposition à la pollution atmosphérique particulaire et la variabilité de fréquence cardiaque. La variabilité de fréquence cardiaque est un marqueur physiologique de l’altération du système nerveux autonome, postulé comme étant un des principaux mécanismes par lequel la pollution de l’air pourrait occasionner des évènements cardiovasculaires aigus, tels que l’infarctus du myocarde7-10. Soulignons que les considérations discutées ci-dessous ne sont pas spécifiques à la méta-analyse des études épidémiologiques de la pollution de l’air; elles peuvent s’appliquer à d’autres types d’effets sanitaires et d’autres types d’exposition de nature environnementale ou autre.
Les effets estimés par différents designs d’étude sont-ils comparables?
La mise en commun des résultats requiert notamment que les mesures d’association découlant de différents designs d’étude puissent être exprimées de manière uniforme3,4,11. Par exemple, les rapports de taux (rate ratios) d’études de cohorte pourront être combinés aux rapports de cotes (odds ratios) des études cas-témoins (avec échantillonnage par densité d’incidence) assumant que l’exposition des contrôles sélectionnés est représentative de l’exposition des cas dans la population source12,13. Toutefois, au-delà de l’uniformité de la mesure d’association, on doit aussi se questionner à savoir si les effets estimés dans des études utilisant des devis épidémiologiques différents peuvent être combinés. Dans leur revue et méta-analyse, Pieters et al.6 ont considéré simultanément les études épidémiologiques de type transversal et longitudinal. Brièvement, dans les études transversales, la variabilité de la fréquence cardiaque et l’exposition à la pollution de l’air sont mesurées pour chaque sujet en un seul point dans le temps, et l’analyse se concentre sur les effets observables inter-individus. En revanche, dans les études longitudinales, la variabilité de fréquence cardiaque, ainsi que l’exposition à la pollution de l’air sont mesurées plus d’une fois pour chaque sujet sur une période de temps donné; ceci permet l’estimation des effets intra-individu, qui sont par la suite estimés entre les individus. Conséquemment, l’effet mesuré dans ces deux devis d’études est donc différent et la variabilité de fréquence cardiaque au niveau intra-individuel est vraisemblablement moins importante que la variabilité entre les individus14.
De plus, parmi les études longitudinales retenues par Pieters et al.6 on peut distinguer celles réalisées sur une période de temps relativement courte (généralement quelques semaines), de celles de plus longue durée dont le suivi peut s’échelonner sur plusieurs années. L’effet estimé dans ces deux types d’études longitudinales n’est pas exactement le même. En effet, les études de courte durée s’intéressent aux effets de l’exposition à court terme, alors que l’effet estimé dans l’étude longitudinale de plus longue durée représente une combinaison des effets à court et à plus long terme résultant de l’exposition répétée (ou cumulée) durant la période d’étude.
En résumé, comme les études transversales et longitudinales, de courte et de plus longue durée, considérées par Pieters et al.6 adressent une même question de recherche, il est justifié de les inclure dans une même revue de la littérature. Toutefois, il appert discutable de combiner leurs résultats, étant donné que les effets estimés par ces différents designs épidémiologiques ne sont pas exactement les mêmes.
Les résultats dérivés de modèles statistiques différents sont-ils comparables?
Pour un même devis épidémiologique, des études peuvent utiliser différents modèles statistiques pour évaluer une association. Par exemple, dans les études longitudinales telles qu’incluses dans la revue de Pieters et al.6, l’analyse statistique est généralement réalisée à partir de modèles à effets aléatoires ou de modèles marginaux basés sur des équations d’estimation généralisées. Ces deux types de modèles sont adéquats pour l’analyse de données longitudinales puisqu’ils permettent de prendre en compte la corrélation entre les mesures répétées faites chez un même individu au cours de la période d’étude. Cependant, l’interprétation des résultats générés par ces deux approches n’est pas la même, et souvent leurs résultats diffèreront15. En effet, pour le modèle marginal le coefficient de régression représente l’effet moyen au niveau de la population étudiée, alors que pour le modèle à effets aléatoires, il permet de décrire la variation dans la réponse moyenne au niveau individuel, conditionnellement à l’effet aléatoire et aux autres variables du modèle16. Bref, même si les études utilisent des devis similaires, le choix du modèle statistique peut engendrer des différences au niveau de la valeur du coefficient et de son interprétation, rendant ainsi la mise en commun des résultats questionnable.
De plus, mentionnons que dans certaines études retenues par Pieters et al.6, une transformation logarithmique a été appliquée aux mesures de variabilité de fréquence cardiaque préalablement à la régression afin d’améliorer la normalité des données. Nous avons statistiquement démontré que les résultats générés par les études utilisant une telle transformation (logarithmique) ne peuvent être exprimés de façon uniforme avec ceux des études n’ayant pas transformé les mesures de variabilité de fréquence cardiaque17. Par conséquent, la méthode utilisée par Pieters et al.6 pour convertir ces résultats sous un effet commun était incorrecte. Les transformations statistiques appliquées aux différents paramètres pour répondre aux prémisses du modèle de régression peuvent ainsi empêcher d’exprimer les résultats de façon uniforme, empêchant du fait même le calcul d’un effet combiné.
Les caractéristiques des études sont-elles suffisamment similaires pour être combinés?
L’hétérogénéité est une considération d’importance dans le processus de méta-analyse. Une forte hétérogénéité statistique indique que les résultats des études divergent substantiellement entre eux; conséquemment, il ne convient pas de tirer des conclusions au sujet de l’effet combiné estimé et de son intervalle de confiance, et ce, même si un modèle à effets aléatoires est utilisé18. Toutefois, une faible hétérogénéité statistique n’est pas garante d’un effet poolé convenable.
En effet, préalablement au calcul de l’effet combiné, il importe d’évaluer si les études sont hétérogènes au niveau de leurs caractéristiques et de leur protocole. Il va de soi que chaque étude est unique et inévitablement des différences existeront entre les études retenues. Néanmoins, d’importantes variations au niveau de caractéristiques clés de l’étude et de son protocole pourraient substantiellement influencer les résultats des études individuelles, menant à l’estimation d’un effet combiné sans signification.
Dans la revue de Pieters6, les populations étudiées sont très disparates, notamment quant à l’âge des participants, leurs conditions de santé, ainsi que leur consommation de médicaments. De tels facteurs sont reconnus comme ayant une influence sur la variabilité de fréquence cardiaque. Conséquemment, il serait inadéquat de combiner les résultats d’études chez de jeunes adultes en bonne santé avec ceux obtenus chez des adultes plus âgés souffrant de problèmes cardiaques.
Les études combinées par Pieters et al.6 présentaient aussi des différences notables dans la façon de mesurer la variabilité de fréquence cardiaque. Notamment, la durée des électrocardiogrammes n’est pas uniforme, variant de 5 minutes à 24 heures. Les conditions dans lesquelles ces électrocardiogrammes sont effectués diffèrent également : dans certaines études, les mesures de variabilité de fréquence cardiaque sont prises pendant que les participants sont au repos, alors que dans d’autres, les mesures sont effectuées durant leur travail, leurs activités quotidiennes, etc. Comme la variabilité de fréquence cardiaque est affectée par de nombreux facteurs et stimuli (activité physique, stress, fatigue, etc.), il est donc probable que les résultats dérivés de différentes conditions d’enregistrement de variabilité de fréquence cardiaque ne soient pas directement comparables.
Quant à l’exposition, elle a été mesurée dans certains cas au niveau individuel (c’est-à-dire, à partir d’appareils portatifs), mais la majorité des études a utilisé les mesures faites à une ou plusieurs stations de surveillance des polluants de l’air. Les stations fixes de polluants de l’air reflètent généralement les concentrations extérieures régionales; elles représentent de façon imprécise l’exposition des individus qui, de par leur mobilité, sont exposés quotidiennement à un grand nombre de microenvironnements. La représentativité des mesures faites aux stations fixes est particulièrement limitée pour les polluants qui ont une grande variabilité spatiale, telle que l’ozone ou le dioxyde d’azote. Comme démontré dans une étude19 portant sur l’association entre l’exposition aux polluants atmosphériques du transport routier et la variabilité de fréquence cardiaque, il peut donc exister des différences considérables entre les concentrations mesurées au niveau individuel et celles aux stations de surveillance, menant à des estimés d’associations qui diffèrent substantiellement.
Finalement, dans leur méta-analyse, Pieters et al.6 ont combiné les résultats d’études pour lesquelles l’association entre les particules et la fréquence cardiaque a été analysée à partir de période d’exposition à la pollution de l’air qui ne sont pas uniforme en terme de durée, mais également de synchronisme avec la mesure de la variabilité de fréquence cardiaque. Par exemple, dans la plupart des études, la variabilité de fréquence cardiaque a été analysée en relation avec la moyenne sur 24 heures des concentrations de polluants dans l’air ambiant. Toutefois, cette période d’exposition de 24 heures n’était pas exactement concordante entre ces études : elle était parfois immédiatement avant le début de l’électrocardiogramme, parfois en simultané à ce dernier ou se terminait le matin même (par exemple, à 9 h) du jour de la mesure de la fréquence cardiaque, créant donc un certain délai entre la mesure d’exposition et le début de l’électrocardiogramme. Parce que la période d’exposition n’était pas synchronisée avec la mesure de la variabilité de fréquence cardiaque, les résultats de ces études ne correspondent pas nécessairement au même effet. Si la pollution de l’air impacte la variabilité de fréquence cardiaque de façon immédiate, alors seulement les études ayant considéré la période d’exposition simultanée à l’électrocardiogramme auront capté cet effet. Similairement, l’effet estimé à partir de durées d’exposition substantiellement différentes (par exemple, 4 heures contre. 24 heures) n’est vraisemblablement pas le même et génèrera des différences dans les résultats. Leur mise en commun est donc questionnable.
En résumé
La méta-analyse est un outil de synthèse puissant, permettant de tirer des conclusions significatives et utiles à la prise de décision en santé publique. Elle se veut toutefois un exercice complexe qui ne se limite pas qu’au simple calcul d’un effet combiné. Par un exemple tiré de la littérature épidémiologique sur la pollution de l’air, nous avons mis en évidence certaines considérations méthodologiques qu’il importe d’évaluer afin de déterminer s’il est convenable de calculer un effet combiné. Notamment, des différences au niveau du devis épidémiologique, des caractéristiques des études et des méthodes statistiques utilisées peuvent faire en sorte que des études, qui s’adressent pourtant une même question de recherche, sont difficilement comparables entre elles. Négliger ces considérations peut mener à l’estimation d’un effet combiné qui sera sans signification, et duquel découleront possiblement des conclusions erronées.
Le texte découle de l’article :
Buteau S, Goldberg MS. Methodological issues related to pooling results from panel studies of heart rate variability and its association with ambient air pollution. Environmental Research 2015; 140(0) : 462-5.
Références
- Egger M, Smith GD, Schneider M, Minder C. Bias in meta-analysis detected by a simple, graphical test; 1997.
- Egger M, Smith GD, Phillips AN. Meta-analysis: principles and procedures. Bmj 1997; 315(7121) : 1533-7.
- Friedenreich CM. Methods for pooled analyses of epidemiologic studies. Epidemiology (Cambridge, Mass) 1993; 4(4) : 295-302.
- Greenland S, O' Rourke K. Meta-Analysis. In Modern Epidemiology. 3rd ed. ed: Wolters Kluwer Health/Lippincott Williams & Wilkins; 2008.
- Higgins JPT GSe. Cochrane Handbook for Systematic Reviews of Interventions Version 5.1.0 [updated March 2011]. The Cochrane Collaboration, 2011. Available from http://www.cochrane-handbook.org.
- Pieters N, Plusquin M, Cox B, Kicinski M, Vangronsveld J, Nawrot TS. An epidemiological appraisal of the association between heart rate variability and particulate air pollution: a meta-analysis. Heart (British Cardiac Society) 2012; 98(15) : 1127-35.
- Brook RD, Rajagopalan S, Pope CA, 3rd, et al. Particulate matter air pollution and cardiovascular disease: An update to the scientific statement from the American Heart Association. Circulation 2010; 121(21) : 2331-78.
- Franchini M, Mannucci PM. Short-term effects of air pollution on cardiovascular diseases: outcomes and mechanisms. Journal of thrombosis and haemostasis : JTH 2007; 5(11) : 2169-74.
- Nelin TD, Joseph AM, Gorr MW, Wold LE. Direct and indirect effects of particulate matter on the cardiovascular system. Toxicology letters 2012; 208(3) : 293-9.
- Mustafic H, Jabre P, Caussin C, et al. Main air pollutants and myocardial infarction: a systematic review and meta-analysis. JAMA : the journal of the American Medical Association 2012; 307(7) : 713-21.
- Stroup DF, Berlin JA, Morton SC, et al. Meta-analysis of observational studies in epidemiology: a proposal for reporting. Meta-analysis Of Observational Studies in Epidemiology (MOOSE) group. JAMA : the journal of the American Medical Association 2000; 283(15) : 2008-12.
- Hogue CJ, Gaylor DW, Schulz KF. Estimators of relative risk for case-control studies. American journal of epidemiology 1983; 118(3) : 396-407.
- Rothman KJ, Greenland S, Lash TL. Modern Epidemiology: Wolters Kluwer Health/Lippincott Williams & Wilkins; 2008.
- Goldberg MS, Wheeler AJ, Burnett RT, et al. Physiological and perceived health effects from daily changes in air pollution and weather among persons with heart failure: a panel study. Journal of exposure science & environmental epidemiology 2015; 25(2) : 187-99.
- Marginal versus Random-effects Models. Models for Discrete Longitudinal Data : Springer New York; 2005 : 297-306.
- Vittinghoff E, Glidden D, Shiboski S, McCulloch C. Repeated Measures and Longitudinal Data Analysis. Regression Methods in Biostatistics : Springer US; 2012 : 261-308.
- Buteau S, Goldberg MS. Methodological issues related to pooling results from panel studies of heart rate variability and its association with ambient air pollution. Environmental Research 2015; 140(0) : 462-5.
- Borenstein M, Wiley I. Introduction to meta-analysis. 2009. http://site.ebrary.com/id/10297978.
- Suh HH, Zanobetti A. Exposure error masks the relationship between traffic-related air pollution and heart rate variability. Journal of occupational and environmental medicine / American College of Occupational and Environmental Medicine 2010; 52(7) : 685-92.