EINSTEIN-PE

EINSTEIN-PE (NCT00439777) est un énorme travail (4832 patients!) randomisé, multicentrique (263 centres, 38 pays), ouvert qui a comparé un traitement standard par HBPM et Coumadine à un traitement par rivaroxaban (Xarelto®) chez des patients ayant présenté une embolie pulmonaire aiguë. La publication de ce papier a été un temps fort de l’ACC 2012 qui s’est déroulée à Chicago.

Le grand, l’immense Samuel Z Golhaber (aucune ironie, c’est un très grand monsieur de l’embolie pulmonaire) n’a pas eu assez de mots pour décrire son admiration pour cette étude dans cette note de Clotblog:

1954 stands out in our memories as the year that warfarin was introduced for the treatment of arterial venous thromboembolism. With the results of the EINSTEIN PE trial, here at the ACC meeting in Chicago, 2012 will be remembered as the landmark year when rivaroxaban was shown to be a viable monotherapy treatment for a broad spectrum of patients with acute pulmonary embolism.

Initialement, je n’ai pas eu le temps de lire l’étude, le temps passe si vite, puis la mise au point de l’ANSM, quelques questions et mon intérêt pour le sujet ont fait que je m’y suis mis.

Je me suis rouillé, n’hésitez pas à corriger et commenter.

I. Quel est le résultat mis en avant par les auteurs?

Un traitement par rivaroxaban à dose fixe est non-inférieur par rapport au traitement de référence initial et à long terme de l’embolie pulmonaire et présente un rapport bénéfice-risque potentiellement amélioré (potentially improved).

II. Interprétation critique

1) Validité interne

  • Réalité statistique du résultat

Les auteurs ont choisi un critère primaire composite d’efficacité:

  • récidive d’embolie pulmonaire fatale ou non et survenue d’une thrombose veineuse profonde

La comparaison entre le groupe rivaroxaban et le groupe traitement conventionnel montre une non-infériorité pour ce critère primaire avec un risque relatif à 1.12, pour un intervalle de confiance à 95% compris entre 0.75 et 1.68. La marge de non-infériorité était à 2, p=0.003. Une analyse intermédiaire de confirmation de dose a été effectuée sur les 400 premiers patients par une équipe indépendante. Aucune mesure pour éviter l’inflation du risque alpha n’est précisée dans le papier ou dans le protocole (ceux qui savent, des idées?).

  • Contrôle des biais

Prise en compte des facteurs de confusion:

Il existe un groupe contrôle contemporain représenté par le bras traitement conventionnel.

Prise en compte du biais de sélection:

L’essai est randomisé selon une procédure centralisée informatisée, via d’un serveur téléphonique interactif. L’allocation a été stratifiée en fonction du pays et de la durée prévue du traitement (laissée à l’initiative du praticien). Il n’existe pas de différences entre les deux groupes à l’inclusion

Insu:

L’essai est réalisé en ouvert, ce qui expose aux biais de suivi et d’évaluation. Afin de minimiser ces biais, les auteurs ont mis en place les stratégies suivantes:

  • comité d’adjudication des évènements ne connaissant pas l’allocation des patients
  • information des patients sur les signes cliniques correspondant aux critères d’efficacité et de sécurité
  • programme de visite identique dans les deux groupes et questionnaire standardisé
  • optimisation de la documentation des évènements cliniques thrombo-emboliques
  • optimisation du suivi des patients
  • réalisation d’une analyse per-protocole
  • surveillance des sites afin de dépister les biais et les déviations par rapport au protocole

Les arrêts de traitement, les déviations par rapport au protocole et les traitements concomitants ont été correctement documentés et recueillis. Il n’existe pas de différence entre les deux groupes pour le nombre d’exclusions (1/0), de perdus de vue (8/10) ou de retrait de consentement (66/118) entre les deux groupes.

Les auteurs n’ont pas mis en évidence de différence entre l’analyse per-protocole et l’analyse en intention de traiter.

Le nombre d’évènements thrombo-emboliques suspecté a été plus important dans le groupe rivaroxaban (491/453), mais le nombre d’évènements confirmés a été identique (10.2%/9.7%).

Sorties d’essai, biais d’attrition:

Dans le groupe rivaroxaban (2420 patients alloués): 1 exclusion, 7 patients n’ont pas reçu le traitement, 66 retraits de consentement, 8 perdus de vue.

Dans le groupe contrôle (2413 patients alloués): 8 patients n’ont pas reçu le traitement, 118 ont retiré leur consentement, 10 ont été perdus de vue.

  • Validité méthodologique:

L’hypothèse de l’efficacité du rivaroxaban sur les patients inclus dans l’étude est issue d’une démarche hypothético-déductive. Le rivaroxaban a montré une efficacité dans les indications suivantes: prévention des accidents thrombo-emboliques en chirurgie orthopédique (programme RECORD), chez les patients porteurs d’une ACFA (ROCKET-AF), d’une thrombose veineuse profonde (EINSTEIN-DVT). Le but de l’étude est clairement indiqué dans les méthodes.

2) Validité externe

A ce jour, EINSTEIN-PE reste le seul essai étudiant l’efficacité du rivaroxaban chez les patients ayant présenté une embolie pulmonaire aiguë.

3) Pertinence clinique

    • Critères de jugement

Les auteurs ont choisi un critère primaire composite:

  • récidive d’embolie pulmonaire fatale ou non et survenue d’une thrombose veineuse profonde

Et des critère secondaires:

  • un critère “principal” de sécurité associant saignements majeurs et saignements non majeurs mais cliniquement significatifs
  • saignement majeur
  • mortalité toute cause
  • évènements vasculaires (SCA, embolie systémique, AVC)
  • bénéfice clinique net (critère composite: critère primaire d’efficacité et saignement majeur)

Ces critères sont cliniquement pertinents.

  • Taille de l’effet

Le risque relatif observé est de 1.12 avec un intervalle de confiance à 95% entre 0.75 et 1.68 (p=0.003).

L’augmentation relative du risque sous rivaroxaban est de 12% avec au mieux une diminution relative du risque de 25%, et au pire une augmentation relative du risque de 68%.
De fait, le nombre d’évènements du critère primaire dans le groupe rivaroxaban est de 50 (2.1%), contre 44 (1.8%) dans le groupe contrôle.

Le critère de non-infériorité est atteint car le risque relatif observé est inférieur à la marge de non-infériorité qui a été fixée à 2.

Le bénéfice clinique net était de 3.4% dans le groupe rivaroxaban, contre 4% dans le groupe contrôle (HR, 0.85;95% CI 0.63 à 1.14;p=0.28)

  • Patients inclus

Les critères d’inclusions étaient les suivants:

  • EP aiguë avec ou sans thrombose veineuse profonde
  • Age légal

Les critères d’exclusion étaient les suivants:

  • traitement par HBPM, fondaparinux ou HNF dans les 48h avant l’inclusion
  • Prise de plus d’une dose d’AVK avant l’inclusion
  • thrombectomie/implantation filtre cave/fibrinolyse
  • contre-indication à un traitement par HBPM et AVK
  • clairance créatinine <30, hépatopathie
  • saignement actif, endocardite infectieuse
  • TAS>180 mmHg, TAD>110 mmHg
  • allaitement, grossesse actuelle ou potentielle sans moyen contraceptif
  • inhibiteur ou inducteur du CYP3A4
  • espérance de vie < 3mois

Il n’y avait donc pas de critère d’âge maximal (ça me paraît très bien). L’âge moyen dans le groupe rivaroxaban était de 57.9+/-7.3, et de 57.5+/-7.2 dans le groupe contrôle (pas vraiment des personnes âgées, quand même…).

Malgré les critère d’exclusion, 4 patients dans le groupe rivaroxaban et 2 patients dans le groupe contrôle avaient une clairance<30ml/min (pensées pour @PUautomne ).

Dans le groupe rivaroxaban et le groupe contrôle, l’embolie pulmonaire était anatomiquement qualifiée d’intermédiaire respectivement dans 57.5% et 59% des cas et d’étendue (>25% de la vascularisation) dans 24.7% et 23.9% des cas. Environ 12% des patients des deux groupes ont été hospitalisés dans un service de soins intensifs.

  • Traitements comparés:

L’essai comparait une stratégie conventionnelle: HNF ou HBPM puis AVK durant 3, 6 ou 12 mois et un traitement par rivaroxaban 15mg*2 pendant 3 semaines puis 20mg*1 par jour durant une durée de 3, 6 ou 12 mois. La durée des traitements était laissée à l’appréciation des praticiens.

Les patients sous AVK étaient dans l’intervalle thérapeutique (INR 2.0-3.0) durant 62.7% du temps. Cela est superposable aux autres études impliquant un traitement par AVK.

Dans le groupe rivaroxaban, la compliance a été supérieure à 80% chez 94.2% des patients.

  • Traitements concomitants

NA

  • Effets indésirables

Il n’existe pas de différence sur le critère principal de sécurité. Le risque relatif du critère principal de sécurité (critère secondaire) est de 0.9 [0.76-1.07], non significatif (p=0.23).

On note une diminution du risque de saignement majeur d’environ 50% dans le groupe rivaroxaban: risque relatif à 0.49 [0.31-0.79], significatif (p=0.003). La mortalité toutes causes, et le risque de syndrome coronarien aigu (c’était une question importante) sont similaires dans les deux groupes.

III. Conséquences de ce travail pour la pratique médicale.

Bon, c’est l’heure de se mouiller…

Je dirais que cette étude est me pose problème du fait de deux choix très discutables qui la rendent finalement peu déterminante.

Premièrement le choix de la non infériorité.

Les auteurs ont choisi de tolérer une moindre efficacité du rivaroxaban en échange d’une plus grande facilité d’emploi: pas de relai HBPM/AVK, pas contrôle d’INR, pas d’équilibration parfois délicate.

Mais, en fait, est-ce que le rivaroxaban est plus simple à utiliser?

Il faut négocier un changement de dose à la troisième semaine et passer de 15mg*2 à 20mg*1, il faut aussi faire attention à la fonction rénale et aux interactions. En cas de surdosage symptomatique ou de nécessité d’une chirurgie non programmée, il n’existe pas d’antagoniste et la dialyse ne paraît pas être une panacée (Cf. les commentaires de cette note).

L’ANSM a récemment mis en garde les prescripteurs sur l’utilisation des nouveaux anticoagulants, dont le rivaroxaban.

Si on prend en compte tout cela, je ne suis pas certain que le maniement du rivaroxaban soit plus “simple” que HNF/HBPM puis AVK.

Pour moi, cela rend le choix d’un essai de non-infériorité problématique.

Quelle pourcentage d’efficacité les auteurs ont avant le début de l’essai choisi de sacrifier? Évidemment ce choix est fondamental pour le résultat de l’essai. Plus la borne est haute, plus le sacrifice d’efficacité consenti est important, mais plus l’essai a de chances d’être positif.

Je ne vais pas rentrer dans les détails qui me noient très rapidement, mais la perte d’efficacité consentie par rapport à l’efficacité de la coumadine contre placebo est de 34%.

Ce n’est pas scandaleux, des auteurs dans d’autres essais ont fait bien pire. Mais 34% quand même…

Le mode de calcul qui est détaillé dans le protocole disponible dans le Supplementary Material est très rigolo à lire:

Non-inferiority margin selection for the primary analysis

The primary analysis for the VTE Phase 3 non-inferiority trial is the comparison of time to symptomatic VTE during the intended study treatment period. Considering the 0.25 upper limit of the 95 % confidence interval (minimal effect) of the historical difference between ‘more effective’ and ‘less effective’ treatment documented above it follows that to retain the usually applied lower limit of 50% of this difference, the non-inferiority margin calculation is:

1 + (1-0.5)((1/0.25) –1) = 2.50

However, it should be realized that less effective is not equal to a ‘no effect’ or ‘placebo effect’.

Hence it is proposed to retain approximately 66% of the effect, resulting in a non-inferiority margin of

1 + (1-0.666)((1/0.25 –1) = 2.0

The sample sizes for the individual studies will be calculated based on this margin.

In the pre-specified individual data-meta-analysis a relative non-inferiority margin of 1.75 can even be used, which corresponds to a retention of 75% of the minimal effect in the entire population of patients with venous thromboembolism.

Both situations are conservative. Further, the final margin estimate has been rounded down to be even further conservative and the retained effect is 66 % of the upper 95% CI bound of a very conservatively estimated difference versus putative placebo.

Therefore, overall, the applicants believe that the proposed 2.0 margin limit is conservative as the non-inferiority margin limit in the proposed Phase 3 studies in patients with VTE.

En gros, c’est super technique, mais la borne est choisie in fine au doigt mouillé ;-) .

En terme de sécurité, le rivaroxaban ne fait pas mieux que le groupe contrôle sur le critère de sécurité “principal” (notion tendancieuse car c’est bien un critère secondaire, il faut le souligner). Par contre, il diminue d’environ 50% le risque d’hémorragies majeures qui est donc un critère secondaire (pas principal). Vous allez probablement pouvoir constater à quel point ce critère secondaire va être mis en avant par le laboratoire…

Un rappel, dans ROCKET-AF et dans EINSTEIN-DVT, on ne met pas non plus en évidence un meilleur profil de sécurité pour le rivaroxaban. Le taux de saignements majeurs ou cliniquement significatifs est le même.

Il faut aller chercher les hémorragies fatales, ou intra-craniennes dans ROCKET-AF pour mettre en évidence une différence en faveur du rivaroxaban (et les faire resplendir… à la Servier). 

Le bénéfice clinique net n’est pas différent entre les groupes dans EINSTEIN-PE.

Enfin, suspecter une récidive d’EP ou de survenue d’une thrombose veineuse profonde repose sur des arguments cliniques notoirement peu spécifiques et peu sensibles (j’avais la notion de 50% de TVP infra cliniques). Cela pose un problème important dans une étude de non infériorité, qui donne par elle même déjà un avantage au traitement étudié.

Au total, le jeu n’en vaut pas la chandelle, et j’aurais aimé un essai de supériorité.

Deuxièmement, le choix d’un essai ouvert.

Ouvert, c’est à dire pas de double aveugle, c’est à dire un risque d’exposition importante aux biais de suivi et d’évaluation. Les auteurs ont prévu un suivi à intervalle fixe, l’utilisation d’une check-list commune, et un comité adjudication des évènements ne connaissant pas la répartition des patients afin de les minimiser. Mais, ça ne fait pas très sérieux quand on connaît le mal que se sont donnés d’autres protocoles pour faire du double aveugle avec les AVK (faux comprimés, faux INR…).

L’ouvert est aussi très très problématique étant donné les critères cliniques peu spécifiques et très praticien-dépendants devant conduire à un test diagnostique de confirmation. D’ailleurs, les auteurs retrouvent un nombre plus élevé de suspicions cliniques dans le groupe rivaroxaban. Les praticiens devaient être plus inquiets, sachant leurs patients sous un nouveau médicament…

J’aurais donc aimé un essai de supériorité en double aveugle.

#bisous

Bref, des choix méthodologiques douteux, pas d’amélioration décisive du pronostic ou du profil de sécurité, je reste sceptique devant le rivaroxaban dans cette indication.

Et vous?

°0°0°0°0°0°0°0°0°0°0°0°0°0°0°0°

Maintenant, pour rire un peu:

Un simple comprimé pour remplacer la bithérapie par injection (Santéblog 28/03/2012)

et:

EINSTEIN PE valide le traitement des embolies pulmonaires par rivaroxaban
(theheart.org, édition française du 26 mars 2012)

J’adore la dernière phrase, elle est tout simplement énorme…

The Wonder Pill (2)

Il y a vraiment un truc que j’aime pas, c’est de ne pas trouver une info, notamment sur internet.

Depuis tout à l’heure, aussi un peu aiguillonné par @GastonCestBon, j’essaye de trouver l’origine des statistiques brillantes avancées par Cowie dans cet article.

J’ai écumé PubMed, sans succès.

Puis, à force de tourner autour du pot (de torturer Google), je suis tombé là-dessus:

Je n’arrive pas à afficher la page de l’article de theheart.org en tant que cache, mais il semble bien qu’une première version ait été publiée, puis éditée.

Mais Big Google qui passait par là en a gardé un souvenir. Concentrons-nous sur le cinquième paragraphe de l’article actuel:

“The regulator decided it wanted to concentrate on mortality benefit. Within that subsection, the benefits are enormous,” he observes. “Total mortality is reduced by 17%, heart-failure mortality is down by 39%, and that’s on top of really good ACE-inhibitor and beta-blocker therapy. It’s very impressive. That’s what’s caught the media’s attention.”

D’accord?

Maintenant, regardons le fragment donné par le cache de Google:

“I know it’s post hoc, but total mortality is reduced by 17%, heart-failure mortality is down by 39%, and that’s on top of really good ACE-inhibitor and beta-blocker therapy.

Rigolo, non?

I know it’s post hoc, but a été supprimé.

En torturant encore un peu plus le cache Google, je trouve que ce petit bout de phrase était placé entre he observes et Total mortality:

Je n’en tire strictement conclusion sur la rédaction de l’article qui me semble de toute façon très discutable. Ne me faites pas dire ce que je n’ai pas dit.

Par contre, les mystérieuses statistiques ont été tirées d’une analyse post hoc. Et ça, c’est intéressant.

Primo, car je ne suis pas certain que cette analyse ait été publiée. Je parierais volontiers sur l’analyse d’un sous-groupe basé sur la fréquence cardiaque de repos initiale, genre FC>75 ou FC>77. Bien entendu, ce critère exclurait de facto une bonne partie (la majeure selon ce papier que j’ai déjà cité) des centaines de milliers de patients qui auraient pu bénéficier de ces 17 et 39% de diminution de mortalité. Donc l’estimation de 39000 vies épargnées et de 100 millions de livres sterling économisées par an, me semble parfaitement fantaisiste.

Secundo, car dans mon esprit, il s’agit d’une grosse restriction dans l’interprétation des résultats.

Le service commercial de Servier est friand des analyses post-hoc, j’en avais déjà parlé ici.

En gros, ré-assembler un essai clinique après sa réalisation, c’est à dire analyser des sous groupes qui n’ont même pas forcément été pré-spécifiés dans le plan de l’étude n’a qu’une valeur exploratoire qui demande confirmation.

C’est ce que dit ma référence en statistiques

Les analyses en sous-groupes décidées après le recueil des données sont des analyses “post-hoc” dont la valeur est purement exploratoire : l’expérience servant au recueil des données a eu un autre objectif que celui de l’analyse en sous groupe ; aucune hypothèse préalable n’a été formulée; aucun calcul de nombre de sujets nécessaires n’a été réalisé pour garantir une puissance suffisante. Le problème méthodologique provient du fait que les analyses « post-hoc » génèrent à la fois l’hypothèse et la vérification de l’hypothèse. Cette situation tautologique ne peut pas être utilisée comme preuve mais seulement pour générer de nouvelles hypothèses. Les analyses exploratoires exposent ainsi au risque d’ériger un artefact en loi. Il convient ainsi de faire la distinction entre les hypothèses formulées a priori (« prior hypothesis » et les hypothèses dérivées des données (« data-derived hypothesis »). Il est souhaitable de ne pas calculer de valeur de p pour les hypothèses non définies a priori car en général ces valeurs de p ne sont pas retrouvées quand l’hypothèse est testée de façon indépendante dans une autre étude. La définition a priori, dans le protocole de l’essai, des analyses en sous-groupes pressenties ne suppriment que partiellement ces réserves méthodologiques. La multiplication des tests persiste.

La formulation I know it’s… montre bien que Cowie, qui est un garçon brillant, a parfaitement conscience de ces limitations.

Malgré tout cela, Servier a, comme toujours, réussi à faire qu’un résultat médiocre, voire même une étude négative (comme Beautiful), soit magnifiquement montés en épingle par les médias, qu’ils soient médicaux ou non.

Et là dessus, ils sont brillamment imbattables.

Encore une chose.

Quand j’ai écrit ma note précédente, je disais que cette histoire ne nous concernait pas tellement, car elle se déroulait en Grande-Bretagne.

Et bien depuis, elle a traversé la Manche, et vient susurrer suavement à nos oreilles combien l’ivabradine est un produit merveilleux.

Vous remarquerez les sigles NHS en haut de l’article et dans le titre.

Curieux…

Ça laisserait presque à penser que cette vénérable institution cautionne le texte dithyrambique de l’article.

Je doute néanmoins que le NHS relaye les gros titres de médiocres médias britannique annonçant la venue sur terre d’une nouvelle panacée.

D’ailleurs, une rapide recherche sur le site du NHS ramène un in progress

Je vous l’avais dit, Servier, c’est magique…

SHifT Expectations

On va reparler de l’ivabradine et de l’étude SHIFT.

Comme cette molécule et cette étude en particulier m’intéressent beaucoup, j’ai choisi SHIFT comme sujet de mon mémoire pour le DU d’interprétation des essais thérapeutiques.

J’ai pensé que cela pourrait vous intéresser de lire mon analyse. Cette dernière n’a aucune prétention à être exhaustive ou unique. Tout est discutable, c’est même là que réside l’intérêt de l’exercice. Le DU donne une grille de lecture et des outils pour exercer son esprit critique sur des papiers scientifiques, et la discussion sur une analyse s’enrichit toujours de points de vue différents.

En italique et entre crochets, des remarques postérieures au mémoire. Les liens conduisent vers les polycopiés des cours.

°0°0°0°0°0°0°0°0°0°0°0°0°0°0°0°0°

I. Quel est le résultat mis en avant par les auteurs ?

La diminution de la fréquence cardiaque induite par l’ivabradine améliore le pronostic clinique de patients en insuffisance cardiaque chronique. Cet effet est observé contre un placebo, chez des patients traités selon les recommandations actuelles.

II. Interprétation critique

1. Validité interne

a) Réalité statistique du résultat

Le critère primaire composite associe mortalité cardio-vasculaire et hospitalisation pour insuffisance cardiaque.

Il est significativement diminué pour un risque alpha fixé à 5% avec un p<0.0001. Par ailleurs, les auteurs observent un risque relatif à 0.82, un intervalle de confiance à 95% compris entre 0.75 et 0.90.

Les auteurs ont prévu 2 analyses intermédiaires avec une prise en compte de l’inflation du risque alpha (p fixé à 0.001 à chaque analyse par une procédure de Péto).

b) Absence de biais

i. Prise en compte des facteurs de confusion

Il existe un groupe contrôle contemporain, représenté par les patients prenant un placebo. L’effet du traitement est déterminé par rapport à ce groupe.

Le biais de confusion est donc contrôlé.

ii. Randomisation

L’essai est randomisé selon une procédure centralisée informatisée, par le biais d’un serveur téléphonique interactif. L’allocation se fait grâce à un programme informatique géré et développé par les laboratoires Servier. Le personnel ayant accès à ses données, et gérant la logistique n’a pas pris part au déroulement de l’essai. On peut donc raisonnablement supposer que la randomisation est imprévisible.

La randomisation a été effectuée avec une stratification par centre et selon la présence ou non de bêtabloquants à l’inclusion.

Les 2 groupes sont initialement comparables.

Le biais de sélection est donc contrôlé.

iii. Insu

L’essai a été réalisé en double aveugle.

Le placebo est semblable au traitement actif.

Les critères de jugement sont validés par un comité ignorant la nature du traitement alloué.

La mesure du critère de jugement est identique dans les deux groupes.

Les arrêts de traitement, les déviations par rapport au protocole et les traitements concomitants ont été correctement documentés et recueillis.

On remarque notamment l’exclusion de 27 patients dans le groupe ivabradine (2 dont les traitements de l’étude n’ont pas été administrés et 25 appartenant à des centres retirés de l’étude pour faute) et 26 dans le groupe placebo (5 dont les traitements de l’étude n’ont pas été administrés et 21 appartenant à des centres retirés de l’étude pour faute).

Ces exclusions semblent donc se répartir de façon homogène dans les 2 groupes.

On note toutefois un peu plus de retraits de consentement dans le groupe ivabradine (73 sur 3268, soit 2.23%) que dans le groupe placebo (58 sur 3290 soit 1.77%).

Les biais de suivi et d’évaluation sont donc globalement bien contrôlés.

iv. Sorties d’essai, attrition

L’analyse a été effectuée en intention de traiter.

La figure 1 permet donc de dénombrer les patients randomisés mais non pris en compte dans l’analyse:

Dans le groupe placebo :

• 5 patients n’ont pas reçu les traitements de l’étude

• 21 ont été exclus du fait de l’éviction de leur centre pour faute

Soient 26 sur 3290 patients (0.79%)

Dans le groupe ivabradine :

• 2 patients n’ont pas reçu les traitements de l’étude

• 25 ont été exclus du fait de l’éviction de leur centre pour faute

Soient 27 sur 3268 patients (0.83%)

Les auteurs ont utilisé la méthode de remplacement par la dernière observation pour les données manquantes suivantes :

• Pour le groupe placebo : 1 perdu de vue et 58 retraits de consentement

• Pour le groupe ivabradine : 2 perdus de vue et 73 retraits de consentement

L’analyse en intention de traiter, le faible taux de patients exclus et la méthode de remplacement des données manquantes permettent un contrôle satisfaisant du biais d’attrition.

[Bon, ça c'était avant que je me rende compte qu'en fait, les auteurs n'avaient pas du tout pris en compte ces patients manquants pour le critère primaire.

Ils ont donc carrément exclu les 27+26 patients et analysé les 58+1+73+2 patients jusqu'à ce qu'ils quittent l'étude. On dit que ces patients ont été "censurés". C'est à dire qu'ils ne sont plus suivis. Le problème est qu'ils ont été randomisés et qu'ils ont pris durant un certain temps les médicaments de l'étude. Personne ne sait ce qu'ils sont devenus, mais on peut faire des hypothèses afin de vérifier si les résultats statistiques de SHIFT sont robustes.
On peut faire deux tests afin de les mettre à l'épreuve ("Remplacement des données manquantes").

Le premier, l'épreuve du biais moyen: on considère que tous les patients perdus de vue du groupe placebo et du groupe ivabradine ont présenté un évènement. En refaisant les calculs, j'obtiens RR=0.98 [0.9-1.06], p=0.564. On perd donc la significativité sur le critère primaire, et cela uniquement sur 27+26+58+1+73+2 patients dont le suivi est incomplet et l’avenir incertain.

Deuxième test, l’épreuve du biais maximum qui envisage le pire: tous les patients perdus de vue dans le groupe placebo n’ont pas présenté d’évènement, alors que tous ceux du groupe ivabradine l’ont présenté. J’obtiens: RR= 1.08 [0.99-1.17], p=0.074. Donc une tendance non significative vers un effet délétère de l’ivabradine.

Attention, ne me faites pas dire ce que je n’ai pas dit!

Si ma tante en avait ce serait mon oncle, et si on refaisait l’essai il serait négatif sont du même niveau. Ces tests montrent simplement que les résultats de SHIFT ne sont peut-être pas très robustes car ils peuvent être remis en question par l’incertitude du devenir d’une poignée de patients (2.85% des patients randomisés). Le biais d’attrition peut donc être potentiellement important, et il n’est que médiocrement contrôlé]

c) Validité méthodologique

L’hypothèse de l’effet positif de l’ivabradine sur le pronostic des patients insuffisants cardiaques étudiés dans cet article est issue d’une démarche hypothético-déductive.

Le design de l’étude a été publié en 2010 dans Eur J Heart Fail et ne diffère pas de celui de la parution finale.

Les auteurs se sont appuyés sur un fait établi, le bénéfice d’une réduction de la fréquence cardiaque par les bêtabloquants. Ils ont ensuite fait l’hypothèse que la réduction de la fréquence cardiaque par l’ivabradine pourrait apporter un bénéfice similaire.

Par ailleurs, une étude menée chez l’animal et publiée dans Circulation en 2004 supportait ce concept.

De façon anecdotique, l’introduction comporte une « ré-écriture de l’histoire » puisque les auteurs citent avec précision les résultats de l’étude BEAUTIFUL pour insister sur l’importance pronostique de la fréquence cardiaque chez le coronarien. Hors, BEAUTIFUL a été publiée en 2008, alors que le premier patient inclus dans SHIFT l’a été 2 ans avant, en octobre 2006.

Enfin, le but de l’étude est parfaitement indiqué dans l’introduction :

We designed the Systolic Heart failure treatment with the If inhibitor ivabradine Trial (SHIFT) with the aim of evaluating the effect of ivabradine in addition to guidelines-based treatment on cardiovascular outcomes, symptoms, and quality of life in patients with chronic heart failure and systolic dysfunction.

2. Cohérence externe

Cet essai est le premier à tester cette hypothèse sur une population de patients insuffisants cardiaques, et pour l’instant, il reste le seul disponible.

L’hypothèse physiopathologique d’une amélioration du pronostic des patients insuffisants cardiaques par la diminution de la fréquence cardiaque est, comme nous l’avons vu, pertinente, puisqu’établie avec les bêtabloquants et retrouvée chez l’animal avec l’ivabradine.

On note toutefois que l’étude BEAUTIFUL n’a pas permis de mettre en évidence d’amélioration du pronostic chez des patients coronariens avec une fraction d’éjection inférieure à 40% prenant de l’ivabradine par rapport au placebo. Ces patients étaient moins sévères que ceux de SHIFT avec une mortalité globale à 10.1% dans le groupe placebo contre 17% pour SHIFT.

3. Pertinence clinique

a) Critère de jugement

Le critère de jugement principal est un critère composite associant :

• Mortalité cardio-vasculaire et hospitalisation pour aggravation de l’insuffisance cardiaque.

Les critères secondaires sont :

• Mortalité cardio-vasculaire et hospitalisation pour aggravation de l’insuffisance cardiaque chez les patients recevant au moins 50% de la dose cible de bêtabloquants à la randomisation.

• Mortalité toute cause

• Mortalité cardio-vasculaire

• Hospitalisation pour aggravation de l’insuffisance cardiaque

• Hospitalisation, toutes causes

• Hospitalisation pour une cause cardio-vasculaire

• Mortalité par insuffisance cardiaque

• Critère composite associant Mortalité cardio-vasculaire, hospitalisation pour aggravation de l’insuffisance cardiaque, hospitalisation pour un infarctus du myocarde non fatal

• Évolution du stade NYHA

Le critère principal paraît peu pertinent dans une pathologie sévère avec un retentissement systémique, pour laquelle la plupart des traitements ont été jugés avec comme critère principal la mortalité totale.

[Un commentaire de Babydoc a aussi pointé sur une des caractéristiques de ce critère principal composite: il est essentiellement composé par les hospitalisations pour insuffisance cardiaque et c'est aussi sur ce paramètre que l'effet de l'ivabradine est le plus visible


Donc finalement, beaucoup de "mou" dans ce critère principal...]

Par ailleurs, l’ivabradine étant un traitement récent, on aurait aimé que le critère primaire soit la mortalité toutes causes afin d’éliminer l’arrière-pensée d’un effet délétère inattendu en dehors de la sphère cardio-vasculaire.

De fait, la mortalité toutes causes, qui est un des critères secondaires, n’est pas significativement différente entre les deux groupes.

b) Taille de l’effet

Le risque relatif observé est de 0.82 avec un intervalle de confiance à 95% entre 0.75 et 0.90.

La diminution relative du risque est donc de 18% avec au mieux une réduction de 25%, au pire de 10%.

Cet effet de l’ivabradine est observé alors que les patients sont par ailleurs traités selon les recommandations actuelles.

Les auteurs ont calculé un Number Needed to Treat (NNT) à 26 pour 1 an de traitement.

L’effet observé est donc intéressant d’un point de vue statistique.

D’un point de vue clinique, son intérêt est moindre car il ne concerne pas la mortalité globale.

L’ivabradine ne fait pas significativement mieux que le placebo dans le sous-groupe des patients ayant une fréquence cardiaque inférieure à 77 battements par minute (bpm) à l’admission (test d’interaction : p=0.029).

c) Patients inclus

Les patients inclus sont des patients en insuffisance cardiaque chronique stable en stades NYHA II, III et IV avec une fraction d’éjection ventriculaire gauche inférieure ou égale à 35%, et une hospitalisation pour aggravation d’insuffisance cardiaque dans les 12 mois précédents l’inclusion.

Il n’y a pas de limite supérieure d’âge.

Ils ont une insuffisance cardiaque sévère avec une mortalité globale à 17% dans le groupe placebo pour un suivi médian de 22 mois. Cette mortalité place les patients inclus dans SHIFT parmi les patients au pronostic le plus sévère, si on les compare avec les essais classiques des traitements médicamenteux de l’insuffisance cardiaque.

On note des restrictions limitant singulièrement la généralisation de cet essai :

• Obligation d’un rythme sinusal et d’une fréquence cardiaque de repos supérieure ou égale à 70 bpm.

• Pas de cardiopathie valvulaire (ni cardiopathie congénitale, dans une nettement moindre mesure)

• Restriction de la stimulation cardiaque, ce qui a singulièrement limité l’inclusion de patients porteurs d’un stimulateur cardiaque, notamment dans un but de resynchronisation, alors que ce traitement fait partie intégrante des recommandations pour les patients insuffisants cardiaques sévères.

[Probablement le point le plus problèmatique de cette étude, trouver les patients qui pourraient "bénéficier" de l'ivabradine, d'autant plus que la négativité de BEAUTIFUL ne plaide pas pour son utilisation dans les cardiopathies ischémiques]

d) Traitements comparés

L’ivabradine a été testée contre un placebo, chez des patients prenant par ailleurs un traitement supposé être optimal selon les recommandations. Les patients bénéficiant d’une resynchronisation sont toutefois probablement très sous-représentés, étant donné les critères d’exclusion.

e) Traitements concomitants

90% des patients du groupe placebo étaient sous bêtabloquants, 92% sous inhibiteurs de l’enzyme de conversion (IEC) ou antagonistes des récepteurs de l’angiotensine 2 (ARA2), 59% sous anti-aldostérones et 83% sous diurétiques.

Les données sur les bêtabloquants montrent que leur dose n’était pas optimale : 26% des patients du groupe placebo étaient à la dose cible, et 56% recevaient 50% ou plus de la dose cible. Ces valeurs reflètent plus la réalité que ce qui est observé dans les études spécifiquement dédiées aux bêtabloquants dans l’insuffisance cardiaque. Par exemple, dans COPERNICUS, 60% des patients du groupe carvédilol étaient à la dose cible à la fin de l’essai.

[La majorité des critiques s'est concentrée fort justement sur ce nombre très important de patients avec des posologies non optimales de bêtabloquants. Les auteurs ont répondu en disant que cela reflétait "la vraie vie". Si les posologies avaient été optimales, je suis certain qu'ils s'en seraient félicités... C'est de bonne guerre! Dans cette page de theheart.org, vous trouverez un débat intéressant sur ce point particulier.]

Dans le sous groupe des patients prenant au moins 50% de la dose cible du traitement bêtabloquant, le critère primaire n’est pas significativement amélioré par l’ivabradine par rapport au placebo (risque relatif à 0.90 avec un intervalle de confiance à 95% compris entre 0.77 et 1.04).

f) Effets indésirables

Des effets indésirables sérieux sont survenus plus fréquemment dans le groupe placebo que dans le groupe ivabradine (48% contre 45%, p=0.025).

Parmi les effets secondaires ayant conduit à l’arrêt du traitement, les bradycardies symptomatiques ou non ont été observées plus fréquemment dans le groupe ivabradine (1% contre <1% pour les bradycardies symptomatiques avec p<0.0001).

On note aussi plus de phosphènes (3% contre 1%, p<0.0001) dans le groupe ivabradine.

III. Conséquences de ce travail pour la pratique médicale

La balance bénéfice-risque mise en évidence par ce travail et les études qui l’ont précédé n’est pas en faveur d’une utilisation systématique de l’ivabradine chez le patient insuffisant cardiaque.

En effet les points suivants obèrent son intérêt en pratique clinique :

• Le critère primaire choisi est discutable (mortalité cardio-vasculaire contre mortalité globale).

• Les patients inclus sont très sélectionnés, même parmi la population des patients insuffisants cardiaques sévères.

• Le traitement par bêtabloquant est très loin d’être optimal, même si les posologies observées reflètent « la vraie vie ». L’absence d’effet significatif de l’ivabradine dans le sous-groupe des patients ayant à l’admission une fréquence cardiaque inférieure à 77 bpm et chez les patients prenant plus de 50% de la dose cible de bêtabloquants suggère que l’effet de l’ivabradine pourrait être gommé chez des patients mieux bêta-bloqués.

• L’étude BEAUTIFUL n’est pas en faveur de l’utilisation de l’ivabradine chez les patients insuffisants cardiaques porteurs d’une cardiopathie ischémique.

°0°0°0°0°0°0°0°0°0°0°0°0°0°

Maintenant, en cadeau, pour ceux qui ont réussi à arriver jusque-là, ce qu’en disent quelques autres:

(Doctinews)


(Sans crédit, j’ai malheureusement perdu l’auteur et la source, c’est bien dommage…)

(Un communiqué de la SFC)

(Déjà montré, mais je ne m’en lasse pas: Le Cardiologue-Le quotidien de l’ACC n°4, avril 2011)

Pas de capture d’écran, mais c’est pas mal non plus ici, ici et ici.

Au total, si vous voulez penser par vous même, prescrire au mieux de l’intérêt de vos patients, développer votre sens critique et acquérir des outils pour analyser les articles scientifiques médicaux, je ne saurais que vous conseiller de vous inscrire à ce DU. Cerise sur le gâteau, cet enseignement très pragmatique est parfaitement compatible avec une activité professionnelle même dense (cours et contrôle continu sur la toile, présence obligatoire de 2 jours à Lyon, certainement pas une punition ;-) , une analyse d’article à rédiger et à présenter à l’oral).

°0°0°0°0°0°0°0°0°0°0°0°0°0°0°0°0°

Swedberg K, Komajda M, Bohm M, et al, on behalf of the SHIFT Investigators. Ivabradine and outcomes in chronic heart failure (SHIFT): a randomised placebo-controlled study. Lancet 2010; 376:875-85. DOI:10.1016/S01406736(10)61198-1.

Swedberg K, Komajda M, Bohm M, Borer JS, Ford I, Tavazzi L. Rationale and design of a randomized, double-blind, placebo controlled outcome trial of ivabradine in chronic heart failure: the Systolic Heart Failure Treatment with the I(f) Inhibitor Ivabradine Trial (SHIFT). Eur J Heart Fail 2010; 12: 75–81.

Mulder P, Barbier S, Chagraoui A, Richard V, Henry JP, Lallemand F, Renet S, Lerebours G, Mahlberg-Gaudin F, Thuillez C. Long-term heart rate reduction induced by the selective I(f) current inhibitor ivabradine improves left ventricular function and intrinsic myocardial structure in congestive heart failure. Circulation. 2004 Apr 6;109:1674-9.

Fox K, Ford I, Steg PG, Tendera M, Robertson M, Ferrari R on behalf of the BEAUTIFUL investigators. Heart rate as a prognostic risk factor in patients with coronary artery disease and leftventricular systolic dysfunction (BEAUTIFUL): a subgroup analysis of a randomised controlled trial. Lancet 2008; 372: 817–21.

Fox K, Ford I, Steg PG, Tendera M, Ferrari R, on behalf of the BEAUTIFUL investigators. Ivabradine for patients with stable coronary artery disease and left-ventricular systolic dysfunction (BEAUTIFUL): a randomised, double-blind, placebo-controlled trial. Lancet 2008; 372: 807-816.

Terrlink JR. Ivabradine in heart failure-no paradigm SHIFT…yet. Lancet 2010; 376:847-49. DOI:10.1016/S0140-6736(10)61314-1.

de Groote P, Isnard R, Assyag P, Clerson P, Ducardonnet A, Galinier M, Jondeau G, Leurs I, Thebaut JF, Komajda M. Is the gap between guidelines and clinical practice in heart failure treatment being filled? Insights from the IMPACT RECO survey. Eur J Heart Fail 2007;9:1205–1211.