Important
Interprétation d'une enquête épidémiologique
principaux types d’études utilisées en épidémiologie
outils statistiques permettant d’évaluer les résultats issus de ces études.
biais qui peuvent fausser l’interprétation des résultats
critères de causalité d’une étude épidémiologique.
Principaux types d'enquêtes épidémiologiques
Dans le domaine biomédical, on peut classer les études en 2 grands groupes : études observationnelles et études expérimentales. Lorsque vous êtes devant un article scientifique, afin de déterminer à quelle catégorie appartient l’étude présentée, répondez à la question :
L’exposition au facteur étudié, c’est-à-dire l’intervention, est-elle contrôlée par l’expérimentateur ?
Si la réponse est oui, il s’agit d’une étude interventionnelle (ou expérimentale) sinon c’est une étude épidémiologique.
Études expérimentales
Il s’agit d’un type d’étude dont l’objectif est de tester un nouveau traitement par exemple (dans ce cas il s’agit s’un essai thérapeutique), en évaluant notamment son efficacité et sa tolérance.
L’étude est dite contrôlée s’il y a comparaison avec un groupe contrôle qui est en fait un groupe témoin, il peut être constitué de sujets qui prennent un placebo ou le traitement gold standard s’il existe. L'attribution de l'exposition peut être randomisée ou non. La randomisation consiste à répartir les sujets au hasard, par tirage au sort, entre les groupes (traitement vs placebo par exemple). Elle est dite « en double aveugle » lorsque ni l’investigateur ni le sujet inclus ne sait la nature du traitement qu’il prend. Les caractères « contrôlé », « randomisé » et « en double aveugle » permettent d’augmenter le niveau de preuve scientifique, c’est le principal avantage de ce type d’étude. En effet, en comparant le groupe qui prend le traitement étudié à un groupe témoin qu’on a constitué par tirage au sort, il y a beaucoup plus de chance que la seule différence qui existe entre les deux groupes soit l’utilisation ou non du traitement étudié. Ainsi, si l’on observe une différence statistiquement significative entre les 2 groupes, cette différence ne pourra s’attribuer qu’à l’effet du traitement.
L'exposition étudiée n’est pas toujours un traitement, il peut s’agir aussi d’une stratégie médicale (diagnostique, thérapeutique ou préventive).
Si l’étude est réalisée dans un seul centre, on l’appelle étude monocentrique. Si au contraire elle regroupe plusieurs centres, elle est dite multicentrique.
Études observationnelles
Comme leur nom l’indique, dans ce type d’étude il n’y a aucune intervention sur les sujets étudiés de la part de l’investigateur, ils sont uniquement observés.
Attention, ces études ont un niveau de preuve plus bas que les études expérimentales et ne permettent pas de mettre en évidence une causalité mais seulement une association, entre un facteur de risque et une maladie par exemple.
Elles sont réparties en 2 catégories : études descriptives et analytiques. Les études descriptives, comme leur nom indique, ont pour but de décrire un élément, ça peut être les caractéristiques d’une pathologie par exemple. De façon générale, on peut dire que leur objectif est de fournir des mesures statistiques qui évaluent l’état de santé d’une population. Il existe 2 types d’études descriptives : études transversales et études de cohorte.
Quant aux études analytiques, elles cherchent à évaluer une association voire un lien de cause à effet entre un facteur et la survenue d’un événement (notamment une pathologie), avec des niveaux de preuve différents selon le design de l’étude. Contrairement aux études descriptives, les études analytiques comportent au moins un groupe de comparaison. Il en existe 3 types : études transversales, études de cohorte exposés/non exposés et études cas-témoins.
Etudes transversales
Les études transversales, qui correspondent à des enquêtes de prévalence si elles ont un but descriptif, correspondent à un « flash », une « photographie » d’une mesure de santé à un instant t. On a une vision instantanée des sujets qui ne seront pas suivis dans le temps. Les sujets ne sont sélectionnés sur aucun critère particulier (d’exposition à un facteur de risque, présence ou non d’une maladie etc). L’idée ici est d’obtenir des informations simultanées sur une maladie, notamment sa prévalence, une exposition à un facteur de risque, les caractéristiques d’une population d’intérêt, à but descriptif ou analytique.
Descriptif veut dire que le but est de rapporter des mesures de santé, par exemple la prévalence d’une maladie, le niveau d’exposition à un facteur de risque et le plus souvent, les études transversales sont réalisées à but descriptif.
Analytique veut dire que l’investigateur peut chercher des associations entre les informations qu’il a recueilli, par exemple un facteur de risque et la maladie, avec un niveau de preuve très faible, ces hypothèses pourront être testées par d’autres études avec un nveau de preuve plus élevé. Le choix de la population varie selon l’étude, on peut faire une enquête sur l’ensemble de la population ou un échantillon, censé représenter l’ensemble de la population dont il est tiré.
L’avantage principal de ce type d’étude est sa simplicité et sa rapidité de réalisation.
Elle présente cependant plusieurs inconvénients :
- Tout d’abord comme dit plus haut elle a un niveau de preuve très faible. Ceci vient du fait que comme on récolte toutes les informations simultanément, il n’y plus possibilité de rétablir la chronologie des événements entre l’exposition à tel ou tel facteur, la date d’apparition de la maladie, etc. On ne peut pas affirmer un lien de cause à effet d’après les résultats d’une étude transversale. En fait, ces études constituent une étape préliminaire pour générer des hypothèses de causalité qui seront testées par la suite par des études analytiques.
- Par ailleurs, comme il s’agit d’une vision instantanée, on ne peut pas évaluer l’incidence d’une pathologie avec ce type d’étude. Pour cette même raison, elles ne sont pas adaptées à l’étude des maladies d’évolution rapide.
Etudes de cohorte descriptives (études d’incidence)
Le principe d’une étude de cohorte est d’évaluer l’évolution d’une population dans le temps, pour cette raison on l’appelle aussi étude longitudinale.
Les études de cohorte descriptives sont aussi appelées études d’incidence. Dans ce cas, une cohorte constitue un ensemble d’individus qu’on va suivre au cours du temps, sur une longue période, afin de décrire l’incidence ou encore la mortalité d’une pathologie par exemple. Attention, les sujets inclus dont une étude de cohorte doivent être indemnes de la maladie qu’on étudie au moment de l’inclusion, c’est l’élément indispensable à la validité de ce type d’étude. Ces études peuvent être prospectives, mais aussi rétrospectives (c’est plus rare, on les appelle cohortes historiques).
La cohorte peut être fixe, c’est-à-dire qu’on inclut des sujets uniquement à la date où on constitue la cohorte, c’est-à-dire au début de l’étude. Elle peut être aussi dynamique, on inclut alors des sujets au fur et à mesure, jusqu’à la fin du suivi.
Les études de cohorte peuvent aussi avoir un but analytique, c’est-à-dire étudier une relation entre un facteur de risque et une maladie et les quantifier par un risque relatif.
Les expositions des sujets de la cohorte sont mesurées à l'inclusion, et parfois lors du suivi. La survenue éventuelle de la maladie est enregistrée au cours du suivi.
avantages :
- Comme on suit les sujets dans le temps, on peut calculer l’incidence d’une maladie et également son pronostic par les données de survie. C’est le seul type d’étude qui permet ce genre d’analyse.
- La chronologie des événements est connue, on évite les biais de mémoire et de sélection, on peut calculer un risque relatif ; elles ont donc un meilleur niveau de preuve que les études transversales.
- C’est un schéma d’étude adapté aux expositions rares (cohorte exposé – non exposé qu’on verra juste après) et à l’étude de plusieurs maladies
Inconvénients :
- Ce sont des études longues et coûteuses
- Elles ne sont pas adaptées aux maladies rares ni aux maladies à temps de latence long
- Il y a le problème de la censure, aves les sujets perdus de vue et les exclus vivants, qui peut induire des biais. Les perdus de vue sont les sujets qui quittent prématurément l’étude. Si la censure est informative, c’est-à-dire s’il n’y pas une indépendance entre le mécanisme d’apparition de la censure et la maladie étudiée (ce qui est souvent le cas pour les sujets perdus de vue), les résultats peuvent ne pas correspondre à la réalité. Les exclus vivants sont les sujets qu’on suit jusqu’à la date de fin d’étude (date de point), mais à cette date-là ils n’auront pas encore été atteints de la maladie. Dans ce cas, la censure est non informative, c’est-à-dire qu’il y a indépendance entre l’apparition de la censure et la maladie (car le choix de la fin de l’étude n’a pas de lien avec le mécanisme d’apparition de la maladie) mais il y a tout de même un manque d’information, car on ne saura pas le délai d’apparition de la maladie pour ces sujets.
Un cas particulier d’étude de cohorte est appelé étude de cohorte exposé / non exposé. Dans une étude de cohorte exposés-non exposés, on compare l’incidence de la maladie étudiée chez les sujets exposés à un facteur de risque par rapport aux sujets non-exposés, le but étant de savoir si l’exposition à ce facteur augmente le risque de survenue de cette maladie. Il peut être judicieux d’utiliser ce type d’étude si l’exposition est rare mais il y a un risque de biais de sélection plus important du fait d’avoir 2 cohortes.
Enquêtes cas-témoins
Le principe est de comparer deux groupes de sujets, les "cas" c’est-à-dire les sujets atteints de la maladie étudiée et les "témoins", qui correspondent aux sujets indemnes de cette maladie. Ici, on constitue donc les groupes selon le statut "malade" et "non malade", on fixe donc le nombre de malades et des témoins. L’échantillon est "contrôlé" sur la maladie et non l’exposition, contrairement à une étude de cohorte exposés / non exposés par exemple. Ces 2 groupes doivent être représentatifs de la population dont ils sont issus. A noter que la constitution du groupe témoin peut êter difficile ; on les recrute dans le milieu hospitalier ou en population générale. Une fois qu’on a constitué ces groupes, on recherche une exposition à un facteur de risque (ou plusieurs) dans le passé. Le recueil d’information concernant l’exposition est donc rétrospectif. On va ensuite comparer la fréquence d’exposition à ce facteur de risque entre les 2 groupes.
Afin d’éviter d’avoir des facteurs de confusion qui peuvent conduire à des conclusions fausses, il faut faire en sorte que les 2 groupes soient relativement comparables. Pour cela, on peut faire un appariement par exemple, sur ce qu’on pense être un facteur de confusion potentiel, on encore une stratification sur les différents niveaux d’un potentiel facteur de confusion. On peut aussi faire un ajustement a posteriori.
Les études cas-témoins présentent des avantages :
- En général , c’est une étude de courte durée et peu coûteuse.
- C’est un type d’étude qui convient aux maladies rares et aux maladies à temps de latence long.
- On peut étudier plusieurs facteurs de risque pour une même maladie
Il y a aussi des inconvénients :
- Les effectifs des cas et témoins étant fixés a priori, la prévalence de la maladie et de l'exposition ne peut être estimée et on ne peut pas calculer de risque relatif, on calcule un odds ratio. De plus il y a une perte de la séquence temporelle entre exposition et maladie avec les biais qui en découlent. Le niveau de preuve scientifique des études cas-témoins est inférieur à celui des enquêtes de cohorte prospectives.
- Ce n’est pas une étude adaptée si l’exposition est rare
- Il y a des risques de biais importants (sélection, classement).
Les outils statistiques
Mesures d’association
Elles servent à quantifier la relation entre un facteur et une maladie. C’est-à-dire qu’on estime dans quelle mesure la probabilité augmente (ou diminue) selon qu’on est exposé à ce facteur ou non.
Le risque relatif est le rapport de la probabilité d’être malade chez les exposés sur la probabilité d’être malade chez les non exposés. Si le risque relatif est strictement supérieur à 1, ça veut dire que le facteur étudié est potentiellement un facteur de risque. Si le risque relatif est égal à 2 par exemple, ça veut dire que la présence du facteur multiplie par 2 le risque d’être atteint de la maladie étudiée. A noter que le RR est calculé dans un modèle multiplicatif. Si on exprime les résultats dans un modèle additif, on calculera le risque en excès qui est la différence du risque entre les sujets exposés et non exposés. Si ce risque en excès est égal à 0, il y a indépendance entre l’exposition et la maladie (au marge d’erreur près).
Dans le cas d’une enquête cas-témoins, on calcule un odds ratio (rapport des cotes) qui est égal à malades sur non malades chez les exposés (odds des exposés) divisé par malades sur non malades chez les non exposés.
Attention si la maladie n’est pas rare, l’odds ratio surestime le risque relatif alors qu’on cas de maladie rare, l’odds ratio est à peu près équivalent au risque relatif. L’interprétation est la même que le risque relatif.
Alors une chose importante, lorsqu’on calcule un RR ou OR à partir des résultats d’une étude, comment peut-on savoir que ce résultat reflète le vrai résultat c’est-à-dire la vraie valeur du paramètre qui existe dans la population dont est tiré cet échantillon ? En effet, si on avait fait une autre étude, avec un autre échantillon, on aurait pu trouver un résultat légèrement différent, du aux fluctuations d’échantillonnage… On doit donc « encadrer » cette estimation ponctuelle par un intervalle de confiance à 95%. Cet intervalle signifie que si on faisait la même expérience 100 fois en calculant 100 RR ou OR, 95 de ces valeurs seraient comprises à l’intérieur des valeurs de cet intervalle. Par exemple, si on trouve un RR de 2 avec un intervalle de confiance de [1,56-2,45], un intervalle qui ne comprend donc pas la valeur 1 qui correspond à l’absence d’association entre le facteur et la maladie, on peut accepter l’hypothèse « le facteur étudié est un facteur de risque de la maladie » avec un risque de 5%. Si on avait trouvé le même résultat de risque relatif mais avec un intervalle qui comprend la valeur 1, on n’aurait pas pu accepter cette hypothèse.
A noter que le RR et OR peuvent s’exprimer aussi en termes d’augmentation relative du risque : RR-1 ou réduction relative du risque : RRR=1-RR.
Tests statistiques
Une fois que l’on a récolté les données à partir d’une étude analytique, le but est de savoir si les résultats observés sont dû au hasard ou imputables au facteur étudié. Pour répondre à cette question, on fait des tests statistiques. Pour comparer des pourcentages, on utilise un test de chi2 et pour comparer des moyennes, un test de Student. Lorsqu’on fait un test statistique, on pose deux hypothèses : l’hypothèse nulle (H0) et l’hypothèse alternative (H1). En général, l’hypothèse qui nous intéresse est l’hypothèse alternative car l’hypothèse nulle sera par exemple traitement A = traitement B pour un essai thérapeutique tandis que l’hypothèse alternative peut être traitement A différent du traitement B.
A l’issu d’un test statistique, on ne dit pas si H1 est vraie ou fausse mais on dit « on accepte H1 avec une certaine marge d’erreur ». Il y a deux types d’erreur à connaitre dans les tests statistiques.
- Le risque alpha, aussi appelée risque de première espèce, est la probabilité d’accepter H1 alors que H0 est vraie. Par exemple, à conclure que le traitement qu’on étudie est plus efficace que le placebo alors que c’est faux. En général, ce risque est fixé à 5%. Si p<5% (qui veut dire « il y a moins de 5% de chance que le résultat observé soit le fruit du hasard), on conclut à une différence statistiquement significative.
- Le risque beta, autrement dit le risque de deuxième espèce, est la probabilité d’accepter H0 alors qu’elle est fausse.
On peut aussi faire des analyses multivariées, c’est-à-dire rechercher une association entre une maladie et un ensemble de facteurs de risque pris en compte simultanément, permettant de rechercher l’effet d’un facteur de risque sur la maladie avec ajustement sur d’autres facteurs. On peut aussi rechercher des interactions entre plusieurs facteurs pour savoir s’il y a une potentialisation de leurs effets lorsqu’ils sont présents simultanément.
Evidemment, si l’on observe un résultat non significatif, ça ne veut pas forcément dire que cette différence n’existe pas en réalité. Peut-être que l’étude manque de puissance nécessaire pour mettre en évidence cette différence. Il faut donc évaluer un résultat statistique dans son contexte, en prenant en compte le design et le déroulement de l’étude.
Les principaux biais
Les biais diffèrent des erreurs aléatoires par le fait qu’il s’agit d’erreurs systématiques, qui ne sont pas dues au hasard.
Il faut prendre en compte ces biais dans l’interprétation des résultats car ils peuvent mettre à mal leur validité.
Il existe 3 grandes catégories de biais.
Biais de sélection
Le biais de sélection est relatif au mode de recrutement des sujets et à leur suivi s’il existe. Il apparait donc lors de la constitution de l’échantillon.
Pour les études transversales, ce biais peut apparaitre lorsque l’échantillon qu’on a choisi ne représente pas correctement la population cible.
Dans les études cas témoins, ce genre de biais peut arriver si on inclut les sujets de façon non indépendante de leur statut d’exposition au facteur. Dans les études de cohorte, ce biais apparait s’il y a des perdus de vue par exemple. Cela va aboutir à un défaut de comparabilité entre les groupes. Ce biais ne peut plus être contrôlé a posteriori, il est donc très important de limiter son apparition au début, c’est-à-dire lors de la conception de l’enquête.
Biais de classement
Le biais de classement est relatif à un mauvais classement des sujets en exposé ou non exposé et en malade ou non malade.
Il existe deux types de biais de classement :
- non différentiel : lorsque l'erreur de mesure ne diffère pas entre les groupes. La présence de ce biais tend a sous-estimer l’association étudiée.
- différentiel : l'erreur de mesure sur l'exposition diffère entre les 2 groupes. Ce biais tend à sous ou sur estimer le risque, le plus souvent à surestimer.
Le biais de classement peut être contrôlé au moment de la planification de l’étude, le protocole doit prévoir des modes de recrutement d’information standardisés dans les 2 groupes et former les enquêteurs au recueil d’information.
Biais de confusion
Ce biais est lié à la présence d’un facteur de confusion.
Un facteur de confusion est un facteur qui est lié à la fois à la maladie et au facteur de risque étudié. Par conséquent, s’il est présent, il modifie la relation entre le facteur qu’on étudie et la maladie.
On peut limiter l’apparition de ce biais par différentes techniques, notamment :
- L'appariement sur un facteur de confusionpotentiel en formant des paires (ou triplets…) en associant à chaque cas (ou sujet exposé sur c’est une étude de cohorte) un témoin (ou sujet non exposé) ayant la même caractéristique. Par exemple, si on suppose que le sexe est un facteur de risque, à chaque cas, on associera un témoin de même sexe.
- On peut faire une analyse stratifiée, il s’agit de calculer un RR (ou OR) au sein de chaque strate du facteur de risque supposé (par exemple strates hommes et femmes pour le sexe), si les valeurs sont comparables entre les différentes strates, on dit qu’il ne s’agit pas d’un facteur de confusion.
- On peut aussi faire une analyse multivariée en prenant en compte plusieurs facteurs en même temps et faire une analyse ajustée sur les facteurs de confusion potentiels.
Critères de causalité :
Lorsqu’on a un résultat statistiquement significatif, on ne peut pas conclure systématiquement à une relation causale. C’est un point essentiel dans l’analyse critique d’un article scientifique, association statistique ne veut pas dire causalité !
Alors comment peut-on juger de la causalité entre un facteur et une maladie ?
On utilise ce qu’on appelle les critères de causalité de Bredford-Hill, la causalité sera d’autant plus probable qu’il y aura de critères présents parmi cette liste (source : tableau du Collège de Santé publique) :
internes à l'étude | |
---|---|
Sequence dans le temps (Temporality) | L'exposition précède la maladie |
Force de l'association (Strength) | Plus la force de la association est grande, moins l'association est susceptible d'être expliquée par des facteurs de confusion |
Spécificité de l'association (Specificity) | Plus l'exposition étudiée est présente chez tous les malades (ou presque) et seulement chez eux, et pour cette seule maladie |
Relation Dose-Effet (Biological gradient) | Plus l'exposition augmente plus on a de chance de développer la maladie |
Cohérence interne (Coherence) | Méthodologie (Design) et prise en compte des biais |
EXTERNES à l'étude | |
---|---|
Constance de l'association (Consistency) | Constance de l'association et reproductibilité dans diverses situations (différentes périodes, régions ou populations) |
Plausibilité biologique (Plausibility) | Existence d'un mécanisme d'action de l'exposition sur la maladie |
Cohérence externe (Coherence) | Reproductibilité des résultats |
Preuves expérimentales (Experiment) | Une intervention visant à diminuer le facteur de risque doit faire diminuer l'incidence de la maladieExpérimentation animale |
Analogie (Analogy) | Raisonnement par analogie (une autre association entre une exposition analogue et une maladie analogue) |
principaux types d’études utilisées en épidémiologie
outils statistiques permettant d’évaluer les résultats issus de ces études.
biais qui peuvent fausser l’interprétation des résultats
critères de causalité d’une étude épidémiologique.
Principaux types d'enquêtes épidémiologiques
Dans le domaine biomédical, on peut classer les études en 2 grands groupes : études observationnelles et études expérimentales. Lorsque vous êtes devant un article scientifique, afin de déterminer à quelle catégorie appartient l’étude présentée, répondez à la question :
L’exposition au facteur étudié, c’est-à-dire l’intervention, est-elle contrôlée par l’expérimentateur ?
Si la réponse est oui, il s’agit d’une étude interventionnelle (ou expérimentale) sinon c’est une étude épidémiologique.
Études expérimentales
Il s’agit d’un type d’étude dont l’objectif est de tester un nouveau traitement par exemple (dans ce cas il s’agit s’un essai thérapeutique), en évaluant notamment son efficacité et sa tolérance.
L’étude est dite contrôlée s’il y a comparaison avec un groupe contrôle qui est en fait un groupe témoin, il peut être constitué de sujets qui prennent un placebo ou le traitement gold standard s’il existe. L'attribution de l'exposition peut être randomisée ou non. La randomisation consiste à répartir les sujets au hasard, par tirage au sort, entre les groupes (traitement vs placebo par exemple). Elle est dite « en double aveugle » lorsque ni l’investigateur ni le sujet inclus ne sait la nature du traitement qu’il prend. Les caractères « contrôlé », « randomisé » et « en double aveugle » permettent d’augmenter le niveau de preuve scientifique, c’est le principal avantage de ce type d’étude. En effet, en comparant le groupe qui prend le traitement étudié à un groupe témoin qu’on a constitué par tirage au sort, il y a beaucoup plus de chance que la seule différence qui existe entre les deux groupes soit l’utilisation ou non du traitement étudié. Ainsi, si l’on observe une différence statistiquement significative entre les 2 groupes, cette différence ne pourra s’attribuer qu’à l’effet du traitement.
L'exposition étudiée n’est pas toujours un traitement, il peut s’agir aussi d’une stratégie médicale (diagnostique, thérapeutique ou préventive).
Si l’étude est réalisée dans un seul centre, on l’appelle étude monocentrique. Si au contraire elle regroupe plusieurs centres, elle est dite multicentrique.
Études observationnelles
Comme leur nom l’indique, dans ce type d’étude il n’y a aucune intervention sur les sujets étudiés de la part de l’investigateur, ils sont uniquement observés.
Attention, ces études ont un niveau de preuve plus bas que les études expérimentales et ne permettent pas de mettre en évidence une causalité mais seulement une association, entre un facteur de risque et une maladie par exemple.
Elles sont réparties en 2 catégories : études descriptives et analytiques. Les études descriptives, comme leur nom indique, ont pour but de décrire un élément, ça peut être les caractéristiques d’une pathologie par exemple. De façon générale, on peut dire que leur objectif est de fournir des mesures statistiques qui évaluent l’état de santé d’une population. Il existe 2 types d’études descriptives : études transversales et études de cohorte.
Quant aux études analytiques, elles cherchent à évaluer une association voire un lien de cause à effet entre un facteur et la survenue d’un événement (notamment une pathologie), avec des niveaux de preuve différents selon le design de l’étude. Contrairement aux études descriptives, les études analytiques comportent au moins un groupe de comparaison. Il en existe 3 types : études transversales, études de cohorte exposés/non exposés et études cas-témoins.
Etudes transversales
Les études transversales, qui correspondent à des enquêtes de prévalence si elles ont un but descriptif, correspondent à un « flash », une « photographie » d’une mesure de santé à un instant t. On a une vision instantanée des sujets qui ne seront pas suivis dans le temps. Les sujets ne sont sélectionnés sur aucun critère particulier (d’exposition à un facteur de risque, présence ou non d’une maladie etc). L’idée ici est d’obtenir des informations simultanées sur une maladie, notamment sa prévalence, une exposition à un facteur de risque, les caractéristiques d’une population d’intérêt, à but descriptif ou analytique.
Descriptif veut dire que le but est de rapporter des mesures de santé, par exemple la prévalence d’une maladie, le niveau d’exposition à un facteur de risque et le plus souvent, les études transversales sont réalisées à but descriptif.
Analytique veut dire que l’investigateur peut chercher des associations entre les informations qu’il a recueilli, par exemple un facteur de risque et la maladie, avec un niveau de preuve très faible, ces hypothèses pourront être testées par d’autres études avec un nveau de preuve plus élevé. Le choix de la population varie selon l’étude, on peut faire une enquête sur l’ensemble de la population ou un échantillon, censé représenter l’ensemble de la population dont il est tiré.
L’avantage principal de ce type d’étude est sa simplicité et sa rapidité de réalisation.
Elle présente cependant plusieurs inconvénients :
- Tout d’abord comme dit plus haut elle a un niveau de preuve très faible. Ceci vient du fait que comme on récolte toutes les informations simultanément, il n’y plus possibilité de rétablir la chronologie des événements entre l’exposition à tel ou tel facteur, la date d’apparition de la maladie, etc. On ne peut pas affirmer un lien de cause à effet d’après les résultats d’une étude transversale. En fait, ces études constituent une étape préliminaire pour générer des hypothèses de causalité qui seront testées par la suite par des études analytiques.
- Par ailleurs, comme il s’agit d’une vision instantanée, on ne peut pas évaluer l’incidence d’une pathologie avec ce type d’étude. Pour cette même raison, elles ne sont pas adaptées à l’étude des maladies d’évolution rapide.
Etudes de cohorte descriptives (études d’incidence)
Le principe d’une étude de cohorte est d’évaluer l’évolution d’une population dans le temps, pour cette raison on l’appelle aussi étude longitudinale.
Les études de cohorte descriptives sont aussi appelées études d’incidence. Dans ce cas, une cohorte constitue un ensemble d’individus qu’on va suivre au cours du temps, sur une longue période, afin de décrire l’incidence ou encore la mortalité d’une pathologie par exemple. Attention, les sujets inclus dont une étude de cohorte doivent être indemnes de la maladie qu’on étudie au moment de l’inclusion, c’est l’élément indispensable à la validité de ce type d’étude. Ces études peuvent être prospectives, mais aussi rétrospectives (c’est plus rare, on les appelle cohortes historiques).
La cohorte peut être fixe, c’est-à-dire qu’on inclut des sujets uniquement à la date où on constitue la cohorte, c’est-à-dire au début de l’étude. Elle peut être aussi dynamique, on inclut alors des sujets au fur et à mesure, jusqu’à la fin du suivi.
Les études de cohorte peuvent aussi avoir un but analytique, c’est-à-dire étudier une relation entre un facteur de risque et une maladie et les quantifier par un risque relatif.
Les expositions des sujets de la cohorte sont mesurées à l'inclusion, et parfois lors du suivi. La survenue éventuelle de la maladie est enregistrée au cours du suivi.
avantages :
- Comme on suit les sujets dans le temps, on peut calculer l’incidence d’une maladie et également son pronostic par les données de survie. C’est le seul type d’étude qui permet ce genre d’analyse.
- La chronologie des événements est connue, on évite les biais de mémoire et de sélection, on peut calculer un risque relatif ; elles ont donc un meilleur niveau de preuve que les études transversales.
- C’est un schéma d’étude adapté aux expositions rares (cohorte exposé – non exposé qu’on verra juste après) et à l’étude de plusieurs maladies
Inconvénients :
- Ce sont des études longues et coûteuses
- Elles ne sont pas adaptées aux maladies rares ni aux maladies à temps de latence long
- Il y a le problème de la censure, aves les sujets perdus de vue et les exclus vivants, qui peut induire des biais. Les perdus de vue sont les sujets qui quittent prématurément l’étude. Si la censure est informative, c’est-à-dire s’il n’y pas une indépendance entre le mécanisme d’apparition de la censure et la maladie étudiée (ce qui est souvent le cas pour les sujets perdus de vue), les résultats peuvent ne pas correspondre à la réalité. Les exclus vivants sont les sujets qu’on suit jusqu’à la date de fin d’étude (date de point), mais à cette date-là ils n’auront pas encore été atteints de la maladie. Dans ce cas, la censure est non informative, c’est-à-dire qu’il y a indépendance entre l’apparition de la censure et la maladie (car le choix de la fin de l’étude n’a pas de lien avec le mécanisme d’apparition de la maladie) mais il y a tout de même un manque d’information, car on ne saura pas le délai d’apparition de la maladie pour ces sujets.
Un cas particulier d’étude de cohorte est appelé étude de cohorte exposé / non exposé. Dans une étude de cohorte exposés-non exposés, on compare l’incidence de la maladie étudiée chez les sujets exposés à un facteur de risque par rapport aux sujets non-exposés, le but étant de savoir si l’exposition à ce facteur augmente le risque de survenue de cette maladie. Il peut être judicieux d’utiliser ce type d’étude si l’exposition est rare mais il y a un risque de biais de sélection plus important du fait d’avoir 2 cohortes.
Enquêtes cas-témoins
Le principe est de comparer deux groupes de sujets, les "cas" c’est-à-dire les sujets atteints de la maladie étudiée et les "témoins", qui correspondent aux sujets indemnes de cette maladie. Ici, on constitue donc les groupes selon le statut "malade" et "non malade", on fixe donc le nombre de malades et des témoins. L’échantillon est "contrôlé" sur la maladie et non l’exposition, contrairement à une étude de cohorte exposés / non exposés par exemple. Ces 2 groupes doivent être représentatifs de la population dont ils sont issus. A noter que la constitution du groupe témoin peut êter difficile ; on les recrute dans le milieu hospitalier ou en population générale. Une fois qu’on a constitué ces groupes, on recherche une exposition à un facteur de risque (ou plusieurs) dans le passé. Le recueil d’information concernant l’exposition est donc rétrospectif. On va ensuite comparer la fréquence d’exposition à ce facteur de risque entre les 2 groupes.
Afin d’éviter d’avoir des facteurs de confusion qui peuvent conduire à des conclusions fausses, il faut faire en sorte que les 2 groupes soient relativement comparables. Pour cela, on peut faire un appariement par exemple, sur ce qu’on pense être un facteur de confusion potentiel, on encore une stratification sur les différents niveaux d’un potentiel facteur de confusion. On peut aussi faire un ajustement a posteriori.
Les études cas-témoins présentent des avantages :
- En général , c’est une étude de courte durée et peu coûteuse.
- C’est un type d’étude qui convient aux maladies rares et aux maladies à temps de latence long.
- On peut étudier plusieurs facteurs de risque pour une même maladie
Il y a aussi des inconvénients :
- Les effectifs des cas et témoins étant fixés a priori, la prévalence de la maladie et de l'exposition ne peut être estimée et on ne peut pas calculer de risque relatif, on calcule un odds ratio. De plus il y a une perte de la séquence temporelle entre exposition et maladie avec les biais qui en découlent. Le niveau de preuve scientifique des études cas-témoins est inférieur à celui des enquêtes de cohorte prospectives.
- Ce n’est pas une étude adaptée si l’exposition est rare
- Il y a des risques de biais importants (sélection, classement).
Les outils statistiques
Mesures d’association
Elles servent à quantifier la relation entre un facteur et une maladie. C’est-à-dire qu’on estime dans quelle mesure la probabilité augmente (ou diminue) selon qu’on est exposé à ce facteur ou non.
Le risque relatif est le rapport de la probabilité d’être malade chez les exposés sur la probabilité d’être malade chez les non exposés. Si le risque relatif est strictement supérieur à 1, ça veut dire que le facteur étudié est potentiellement un facteur de risque. Si le risque relatif est égal à 2 par exemple, ça veut dire que la présence du facteur multiplie par 2 le risque d’être atteint de la maladie étudiée. A noter que le RR est calculé dans un modèle multiplicatif. Si on exprime les résultats dans un modèle additif, on calculera le risque en excès qui est la différence du risque entre les sujets exposés et non exposés. Si ce risque en excès est égal à 0, il y a indépendance entre l’exposition et la maladie (au marge d’erreur près).
Dans le cas d’une enquête cas-témoins, on calcule un odds ratio (rapport des cotes) qui est égal à malades sur non malades chez les exposés (odds des exposés) divisé par malades sur non malades chez les non exposés.
Attention si la maladie n’est pas rare, l’odds ratio surestime le risque relatif alors qu’on cas de maladie rare, l’odds ratio est à peu près équivalent au risque relatif. L’interprétation est la même que le risque relatif.
Alors une chose importante, lorsqu’on calcule un RR ou OR à partir des résultats d’une étude, comment peut-on savoir que ce résultat reflète le vrai résultat c’est-à-dire la vraie valeur du paramètre qui existe dans la population dont est tiré cet échantillon ? En effet, si on avait fait une autre étude, avec un autre échantillon, on aurait pu trouver un résultat légèrement différent, du aux fluctuations d’échantillonnage… On doit donc « encadrer » cette estimation ponctuelle par un intervalle de confiance à 95%. Cet intervalle signifie que si on faisait la même expérience 100 fois en calculant 100 RR ou OR, 95 de ces valeurs seraient comprises à l’intérieur des valeurs de cet intervalle. Par exemple, si on trouve un RR de 2 avec un intervalle de confiance de [1,56-2,45], un intervalle qui ne comprend donc pas la valeur 1 qui correspond à l’absence d’association entre le facteur et la maladie, on peut accepter l’hypothèse « le facteur étudié est un facteur de risque de la maladie » avec un risque de 5%. Si on avait trouvé le même résultat de risque relatif mais avec un intervalle qui comprend la valeur 1, on n’aurait pas pu accepter cette hypothèse.
A noter que le RR et OR peuvent s’exprimer aussi en termes d’augmentation relative du risque : RR-1 ou réduction relative du risque : RRR=1-RR.
Tests statistiques
Une fois que l’on a récolté les données à partir d’une étude analytique, le but est de savoir si les résultats observés sont dû au hasard ou imputables au facteur étudié. Pour répondre à cette question, on fait des tests statistiques. Pour comparer des pourcentages, on utilise un test de chi2 et pour comparer des moyennes, un test de Student. Lorsqu’on fait un test statistique, on pose deux hypothèses : l’hypothèse nulle (H0) et l’hypothèse alternative (H1). En général, l’hypothèse qui nous intéresse est l’hypothèse alternative car l’hypothèse nulle sera par exemple traitement A = traitement B pour un essai thérapeutique tandis que l’hypothèse alternative peut être traitement A différent du traitement B.
A l’issu d’un test statistique, on ne dit pas si H1 est vraie ou fausse mais on dit « on accepte H1 avec une certaine marge d’erreur ». Il y a deux types d’erreur à connaitre dans les tests statistiques.
- Le risque alpha, aussi appelée risque de première espèce, est la probabilité d’accepter H1 alors que H0 est vraie. Par exemple, à conclure que le traitement qu’on étudie est plus efficace que le placebo alors que c’est faux. En général, ce risque est fixé à 5%. Si p<5% (qui veut dire « il y a moins de 5% de chance que le résultat observé soit le fruit du hasard), on conclut à une différence statistiquement significative.
- Le risque beta, autrement dit le risque de deuxième espèce, est la probabilité d’accepter H0 alors qu’elle est fausse.
On peut aussi faire des analyses multivariées, c’est-à-dire rechercher une association entre une maladie et un ensemble de facteurs de risque pris en compte simultanément, permettant de rechercher l’effet d’un facteur de risque sur la maladie avec ajustement sur d’autres facteurs. On peut aussi rechercher des interactions entre plusieurs facteurs pour savoir s’il y a une potentialisation de leurs effets lorsqu’ils sont présents simultanément.
Evidemment, si l’on observe un résultat non significatif, ça ne veut pas forcément dire que cette différence n’existe pas en réalité. Peut-être que l’étude manque de puissance nécessaire pour mettre en évidence cette différence. Il faut donc évaluer un résultat statistique dans son contexte, en prenant en compte le design et le déroulement de l’étude.
Les principaux biais
Les biais diffèrent des erreurs aléatoires par le fait qu’il s’agit d’erreurs systématiques, qui ne sont pas dues au hasard.
Il faut prendre en compte ces biais dans l’interprétation des résultats car ils peuvent mettre à mal leur validité.
Il existe 3 grandes catégories de biais.
Biais de sélection
Le biais de sélection est relatif au mode de recrutement des sujets et à leur suivi s’il existe. Il apparait donc lors de la constitution de l’échantillon.
Pour les études transversales, ce biais peut apparaitre lorsque l’échantillon qu’on a choisi ne représente pas correctement la population cible.
Dans les études cas témoins, ce genre de biais peut arriver si on inclut les sujets de façon non indépendante de leur statut d’exposition au facteur. Dans les études de cohorte, ce biais apparait s’il y a des perdus de vue par exemple. Cela va aboutir à un défaut de comparabilité entre les groupes. Ce biais ne peut plus être contrôlé a posteriori, il est donc très important de limiter son apparition au début, c’est-à-dire lors de la conception de l’enquête.
Biais de classement
Le biais de classement est relatif à un mauvais classement des sujets en exposé ou non exposé et en malade ou non malade.
Il existe deux types de biais de classement :
- non différentiel : lorsque l'erreur de mesure ne diffère pas entre les groupes. La présence de ce biais tend a sous-estimer l’association étudiée.
- différentiel : l'erreur de mesure sur l'exposition diffère entre les 2 groupes. Ce biais tend à sous ou sur estimer le risque, le plus souvent à surestimer.
Le biais de classement peut être contrôlé au moment de la planification de l’étude, le protocole doit prévoir des modes de recrutement d’information standardisés dans les 2 groupes et former les enquêteurs au recueil d’information.
Biais de confusion
Ce biais est lié à la présence d’un facteur de confusion.
Un facteur de confusion est un facteur qui est lié à la fois à la maladie et au facteur de risque étudié. Par conséquent, s’il est présent, il modifie la relation entre le facteur qu’on étudie et la maladie.
On peut limiter l’apparition de ce biais par différentes techniques, notamment :
- L'appariement sur un facteur de confusionpotentiel en formant des paires (ou triplets…) en associant à chaque cas (ou sujet exposé sur c’est une étude de cohorte) un témoin (ou sujet non exposé) ayant la même caractéristique. Par exemple, si on suppose que le sexe est un facteur de risque, à chaque cas, on associera un témoin de même sexe.
- On peut faire une analyse stratifiée, il s’agit de calculer un RR (ou OR) au sein de chaque strate du facteur de risque supposé (par exemple strates hommes et femmes pour le sexe), si les valeurs sont comparables entre les différentes strates, on dit qu’il ne s’agit pas d’un facteur de confusion.
- On peut aussi faire une analyse multivariée en prenant en compte plusieurs facteurs en même temps et faire une analyse ajustée sur les facteurs de confusion potentiels.
Critères de causalité :
Lorsqu’on a un résultat statistiquement significatif, on ne peut pas conclure systématiquement à une relation causale. C’est un point essentiel dans l’analyse critique d’un article scientifique, association statistique ne veut pas dire causalité !
Alors comment peut-on juger de la causalité entre un facteur et une maladie ?
On utilise ce qu’on appelle les critères de causalité de Bredford-Hill, la causalité sera d’autant plus probable qu’il y aura de critères présents parmi cette liste (source : tableau du Collège de Santé publique) :
internes à l'étude | |
---|---|
Sequence dans le temps (Temporality) | L'exposition précède la maladie |
Force de l'association (Strength) | Plus la force de la association est grande, moins l'association est susceptible d'être expliquée par des facteurs de confusion |
Spécificité de l'association (Specificity) | Plus l'exposition étudiée est présente chez tous les malades (ou presque) et seulement chez eux, et pour cette seule maladie |
Relation Dose-Effet (Biological gradient) | Plus l'exposition augmente plus on a de chance de développer la maladie |
Cohérence interne (Coherence) | Méthodologie (Design) et prise en compte des biais |
EXTERNES à l'étude | |
---|---|
Constance de l'association (Consistency) | Constance de l'association et reproductibilité dans diverses situations (différentes périodes, régions ou populations) |
Plausibilité biologique (Plausibility) | Existence d'un mécanisme d'action de l'exposition sur la maladie |
Cohérence externe (Coherence) | Reproductibilité des résultats |
Preuves expérimentales (Experiment) | Une intervention visant à diminuer le facteur de risque doit faire diminuer l'incidence de la maladieExpérimentation animale |
Analogie (Analogy) | Raisonnement par analogie (une autre association entre une exposition analogue et une maladie analogue) |