De l’intérêt des statistiques

En général, l’été n’est pas propice à l’analyse des infos médicales, car tout le petit monde qui gravite autour des médicaments préfère se dorer la pilule. Mais cette année, ce début de mois d’août a été marqué par la publication dans le Lancet d’une étude de sous-groupes d’un essai précédemment publié dans le NEJM, TRILOGY-ACS.

Ce dernier comparait le clopidogrel et le prasugrel dans une étude de supériorité, et surprise, le prasugrel n’a pas montré de supériorité par rapport au clopidogrel (hazard ratio in the prasugrel group, 0.91; 95% confidence interval [CI], 0.79 to 1.05; P=0.21)).

Mais dans l’étude de sous-groupe du Lancet, le prasugrel fait mieux que le clopidogrel chez les patients qui ont bénéficié d’une coronarographie (122/1524 [10·7%] vs 159/1561 [14·9%], HR 0·77, 95% CI 0·61—0·98; p=0·032).

Qu’en dire?

Bah, pour moi, si l’étude principale est négative, une positivité retrouvée dans un sous groupe ne doit faire que réfléchir au pourquoi du comment, surement pas tirer la moindre conclusion sur l’efficacité du traitement dans le sous groupe mis en évidence. En plus, le moins que l’on puisse dire est que le bénéfice du prasugrel n’est pas énorme: 23% en moyenne, 39% au mieux, 2% au pire. Et un p peu impressionnant: 0.032. 

La positivité est vraisemblablement due au hasard, mais ça vaut toujours quand même le coup de regarder cette histoire d’un peu plus près. Ici, les gens qui ont eu une coronarographie diagnostique font mieux sous prasugrel que sous clopidogrel.

Une efficacité thérapeutique discriminante de la coronarographie diagnostique? Une interaction médicamenteuse iode/prasugrel ou iode/clopidogrel? Plutôt une myriade de facteurs confondants.

Maintenant, on va regarder ce qu’en disent les commentateurs, notamment les auteurs de ces études. Vous allez voir, on sent bien l’effet de manche (le spin) et l’envie de faire de ce résultat une victoire.

D’abord, cet article de theheart.org.

You should always be cautious when interpreting any subgroup of a neutral trial, this included,[…]: admirez l’adjectif neutral. TRILOGY-ACS n’a pas échoué à montrer la supériorité du prasugrel par rapport au clopidogrel, il est « neutre ». L’auteur n’a pas osé le « équivalent », mais pas loin. « Neutre » est justement neutre, ça ne mange pas de pain, et ça fait mieux que de parler d’un essai négatif. Sinon, l’auteur dit d’emblée qu’il faut se méfier d’une analyse en sous-groupe d’un essai négatif/neutre. C’est bien.

Vers la fin: Because the study « is a subgroup analysis of an overall negative primary outcome, the results should be considered as hypothesis-generating rather than definitive. However, the hypothesis is plausible and sound, […],

On part donc d’un constat logique: il ne faut pas interpréter la positivité de cette étude de sous groupe, mais, however, et hop, l’hypothèse devient plausible. On ne sait pas trop pourquoi, mais dans le groupe où l’on a fait une coronarographie, le prasugrel marche mieux…

C’est dommage, les gens de theheart.org n’ont pas demandé son avis à un bon méthodologiste, ça aurait pu être intéressant (et plus tranché).

Theheart.org est plutôt sérieux, mais si on regarde d’autres sources, l’effet de manche est plus accentué. Par exemple ici. D’abord le titre et le premier paragraphe:

TRILOGY ACS: Angiography plus prasugrel benefited patients with ACS.

Patients with ACS who underwent coronary angiography and were assigned prasugrel had lower rates of CV death, MI and stroke compared with patients who underwent angiography and were assigned clopidogrel, according to a subgroup analysis of the TRILOGY ACS trial.

Joli, non?

L’auteur qui fut prudent dans l’article de theheart.org se lâche un peu plus:

“These data may have implications for patient care, since the patients who seem to benefit most from intensified anti-platelet treatment are those with confirmed coronary artery disease,” Wiviott said in a press release. “However, these data would need to be verified in another study before making such a recommendation.”

Ces résultats pourraient avoir une implication clinique… Après, il revient un peu en arrière, ce qui rend ses contorsions sémantiques assez cocasses.

Un peu plus loin:

“This study supports the potential benefit of strong antiplatelet medications [in this patient population] … and reaffirms the value of cardiac catheterization in the management and triage of patients with acute chest pain,” Deepak L. Bhatt, MD, MPH, TRILOGY ACS investigator and Cardiology Today’s Intervention Chief Medical Editor, stated in the release.

Strong antiplatelet medication? Qu’est-ce à dire? Du prasugrel, par exemple?

S’intéresser aux statistiques permet d’acquérir des outils simples.

A la limite, on pourrait en faire une série d’aphorismes:

  • A p-value does not replace a brain (K Sainani)
  • Nothing magic happens at p=0.05 (K Sainani)
  • If you torture the data enough, it will always confess (?)

Ces notions simples à comprendre et à retenir permettent de repérer les failles méthodologiques dans les essais et surtout les effets de manche de ceux qui les présentent.

HRP258, c’est fini!

Je vous avais déjà parlé de ce MOOC dans une note précédente.

Je viens de le finir, et la petite routine des cours et des examens partiels hebdomadaires qui me berçait depuis 9 semaines commence à me manquer. La responsable de l’enseignement, Kristin Sainani est vraiment remarquable de didactisme.

J’ai beaucoup aimé ses vidéos dont la durée n’excède jamais 30′ pour garder une attention maximale et les travaux pratiques sur le logiciel « R » afin de mettre la main dans le cambouis des statistiques qui restent sinon largement abstraites. Un seul petit regret, justement sur ces travaux pratiques, il n’y en a pas eu assez à mon goût, notamment pour apprivoiser un peu mieux « R » qui semble être un logiciel complexe mais très puissant.

Vidéos, TD, fora pour discuter avec les enseignants ou les autre élèves, lectures complémentaires (fournies), calendrier et tableau d’avancement des cours pour se repérer, bref, l’ensemble du matériel pédagogique véhiculé par internet, ne m’a jamais fait regretter de ne pas avoir suivi ce cours en amphi.

En plus, l’avantage est de pouvoir googler à n’importe quel moment, sur un autre onglet, une notion qui pourrait être brumeuse, afin de l’éclaircir avec une autre source. Les MOOC, c’est un peu suivre un cours au calme dans la plus grande bibliothèque de la Terre, en ayant la possibilité de rester en pyjama, faire sa pause pipi ou café quand on veut, sans avoir à lever le doigt et gêner le cours. Un autre intérêt, qui était réservé jusqu’à présent à une minorité, est de suivre des cours d’une faculté anglo-saxonne c’est à dire avec une pédagogie totalement différente de la notre.

Je ne dis pas meilleure, je dis différente.

La différence entre leur façon d’enseigner et la notre me fait penser à la différence entre un jardin à la française et un jardin à l’anglaise.

D’un côté, un enseignement construit au cordeau, pas à pas, où on ne voit une notion qu’après en avoir admiré longuement les prémisses.

De l’autre, une forme bien plus libre ou l’enseignant nous tire par la main voir une notion importante, en laissant tout le reste de côté, quitte à y revenir ensuite. Ça papillonne dans un espace apparemment un peu fouillis, de points importants en points importants (les Take Home Messages). Je dis apparemment un peu fouillis, car avec le recul tout est savamment orchestré, comme dans un jardin anglais.

J’aime bien les deux (j’ai une petite préférence, de toujours, pour le jardin anglais), j’aime encore mieux le frisson qu’apporte la comparaison entre les deux.

Pour revenir aux MOOC, je ne tire pas de conclusions hâtives d’une première expérience réussie. Je présume qu’il y a des MOOC déplorables. Mais le principe me plaît.

Comme obtenir les certificats auxquels donnent droit ces cours à distance ne m’importe pas le moins du monde, et que l’inscription est rarement payante, je m’affranchis de la plupart des inconvénients liés à cet enseignement (valeur de ces certificats, coût de l’inscription…). Le temps et ma curiosité sont mes seules limites…

Je me suis inscrit à un autre MOOC de statistiques pour comparer avec HRP258, puis après, je ne sais pas, histoire de l’architecture, de l’art ou… rien.

Let’s go exploring!           

Contact

Imaginons un endroit sobrement luxueux avec plusieurs salles de réunion. Dans chacune, un jury composé de médecins libéraux et d’universitaires siège derrière une table ornée d’un verre et d’une bouteille de Vittel posés sur de petits sous-verres ronds portant le logo de l’établissement. Les candidats sont des visiteurs médicaux.

Tout se passe de façon conviviale, il ne s’agit que d’un simple jeu de rôle. Il n’y a pas d’enjeu.

Enfin, si, car tout est enjeu dans la vie, mais ici il n’est pas pour ceux que l’on imagine.

Chaque visiteur médical doit présenter un produit au jury qui va noter la prestation.

Chaque jury aura bien sûr eu à cœur de prendre connaissance d’un minimum de choses sur le produit afin de juger en conscience. Et chaque jury va écouter 1, 2 , 3, 4 variations sur le même message commercial.

Et à chaque passage, poli par des conseils doctement délivrés, le « candidat » se corrigera afin de s’améliorer, d’épurer son discours, d’éviter les pièges.

6156241010_3f54a661a8_oŒuvre de Martin Nikolaj Christensen

A la fin de cette journée, quand les rayons du soleil teinteront d’or les bords de la piscine, jurys et candidats se retrouveront à partager une coupette de champagne autour de verrines sucrées-salées.

Tous, certains consciemment, d’autres non, se seront bien approprié le message.

VIGOR

La brillante Kristin, m’a fait découvrir la semaine dernière un exemple impressionnant d’optimisation (pour rester poli) de données scientifiques par l’industrie pharmaceutique.

Il s’agit de l’essai Vigor, publié en 2000, qui étudiait l’intérêt du rofecoxib (Vioxx®) sur le naproxène sur la survenue d’évènements gastro-intestinaux. Je ne vais pas vous raconter le scandale du Vioxx®, vous en trouverez des résumés ici et ici. Je ne vais pas non plus vous parler des 3 infarctus qui ont été « malencontreusement » oubliés dans le groupe… rofecoxib (bien évidemment).

On va regarder de façon naïve les résultats dans le résumé de l’article de Bombardier et al. de 2000:

vigorresults2Le risque relatif moyen de saignements gastro-intestinaux du rofecoxib par rapport au naproxène est de 0.5 (0.3-0.6). Bon, d’accord, le rofecoxib fait deux fois moins saigner que le naproxène.

Maintenant, regardons les infarctus:

vigorresults3Les auteurs parlent d’incidence, mais en fait, c’est un risque relatif  qui a été calculé. Passons.  Le risque relatif moyen d’infarctus du myocarde du naproxène par rapport au rofecoxib est de 0.2. Bon d’accord.

Que remarquez-vous?

(…)

Entre le début et la fin de la section résultats du résumé, les auteurs ont inversé le dénominateur et le numérateur du risque relatif.

Si ils avaient gardé un risque relatif rofecoxib/naproxène, logique quand on souhaite comparer une nouvelle molécule par rapport à un produit de référence, le risque relatif des infarctus se serait donc exprimé ainsi:

Le risque relatif moyen d’infarctus du myocarde du rofecoxib par rapport au naproxène est de 5 [l’inverse de 0.2].

Et, là, ça fait bien plus peur, vous ne trouvez pas?

Les auteurs ont sciemment inversé numérateur et dénominateur pour cacher au lecteur peu attentif l’ampleur du problème.

Et cela n’est pas qu’une vue de l’esprit.

Si on regarde un peu plus loin dans l’article, on trouve ce passage absolument extraordinaire:

Thus, our results are consistent with the theory that naproxen has a coronary protective effect and highlight the fact that rofecoxib does not provide this type of protection owing to its selective inhibition of cyclooxygenase- 2 at its therapeutic dose and at higher doses.
The finding that naproxen therapy was associated with a lower rate of myocardial infarction needs further confirmation in larger studies.

Donc, c’est bien ce que l’on disait. Ce n’est pas le rofecoxib qui provoque plus d’infarctus que le naproxène, mais ce dernier qui a un effet protecteur (avec un risque relatif à 0.2).

Treize ans après, l’effet cardio-protecteur des AINS demeure un des chefs d’œuvre de la communication de l’industrie pharmaceutique. Et là, ce n’était pas dans une feuille de chou financée par l’industrie, mais dans le NEJM.

C’est merveilleux, la communication, non?