Commentaires sur la note précédente

La note précédente est bien entendu une vaste blague et la très vénérable INSEE n’a bien évidemment pas participé à cette pseudo étude. Par contre, toutes les données que j’ai utilisées sont rigoureusement exactes.

L’idée de cette note m’a été donnée par l’étude Doctolib/Withings sur les déserts médicaux qui a été pas mal reprise par la presse début juillet. Pour résumer, cette étude a comparé (plutôt mis côte à côte) le temps d’attente pour obtenir un rendez-vous médical (délai qui serait diminué par l’utilisation de Doctolib) et des données biométriques collectées par Withings (leur suivi serait censé améliorer la morbi-mortalité).

Vous voyez rapidement que cette « étude » commune, bien présentée, est potentiellement très bénéfique d’un point de vue financier, on ne parle ici bien entendu pas de santé publique. J’ai demandé à plusieurs reprises à Withings d’avoir accès à un peu plus de données, en vain. C’est Doctolib qui m’a gentiment répondu. Certes pas ce que je demandais, mais au moins ils n’ont pas été méprisants et j’ai apprécié.

Je leur demandais seulement si ces données, mises côte à côte avaient bénéficié d’un traitement statistique, au delà de faire des histogrammes sur Excel®. Sans réponse, je suis parti du principe que non.

tw1Peut-on dire que la transparence d’une non-réponse soit claire? Dans un certain sens, oui…

pasdereponsedoctolib

Je n’ai jamais eu de réponse à ces deux tweets…

Nous sommes donc probablement devant une simple juxtaposition de données qui n’a évidemment absolument totalement aucune valeur autre que commerciale. Si une méthodologie statistique a été employée par Doctolib/Withings, je m’engage à écrire une note afin de revoir le problème.

Doctolib m’a donc répondu, et encore une fois, sans aucune ironie je les remercie, même si ils n’ont rien dit.

Quoique…

Leur réponse est très intéressante d’un point de vue statistique. Ils répondent qu’ils observé une corrélation et non une causalité. Leur réponse est un axiome essentiel des statistiques: la corrélation n’entraîne pas la causalité

large_correlation_not_causation(source)

Dans un pays ensoleillé, il y a beaucoup de coups de soleil et il se vend beaucoup de lunettes de soleil. Mais ce n’est pas le port de ces lunettes qui provoque les coups de soleil…

C’est la même chose pour cette étude. Et encore, je ne suis même pas certain que les auteurs aient recherché une corrélation statistique.

Les auteurs du communiqué, du moins les relecteurs savent que cette juxtaposition de données n’a pas de sens, car ils connaissent cet axiome. Ils ne vont pas tomber dans le panneau, et à aucun moment ils vont écrire qu’il y a un lien de causalité entre délai d’attente de rendez-vous médicaux et HTA ou obésité (ou bien ils ont eu peur de froisser leurs potentiels clients?). Ils ne vont donc pas l’écrire noir sur blanc, mais juxtaposer ainsi les données le suggère de façon assez subtile.

tw2

Je suis peut-être tordu, mais les « journalistes » qui ont repris mot pour mot ce communiqué de presse se sont parfois (pas tout le temps!) empressés de faire une relation de cause à effet entre durée d’attente et morbidité, donc entre une potentielle diminution de ce temps et une amélioration de la santé publique:

docto1 docto2 docto3 docto4

tw3

On peut donc féliciter le service de PR qui a réussi à faire dire quelque chose à la presse tout en s’interdisant de le dire eux-mêmes, simplement en le suggérant.

Grande classe.

J’ai beaucoup apprécié, je me suis donc dit que j’allais écrire une note. Pas un cours sur les stats, que je serais bien incapable de faire, mais une caricature du communiqué Doctolib/Withings. J’ai repris ce communiqué quasiment mot pour mot pour utiliser les mêmes éléments de langage. Après, je me suis amusé à torturer des données récupérées sur le site de l’INSEE (le fameux Data Dredging) pour les faire parler et montrer l’aberration du raisonnement. J’ai même ré-utilisé R (après des années, ce fut douloureux) pour chercher des corrélations stupides:

cordoctolib1

RplotPuis après m’être amusé avoir perdu pas mal de temps, j’ai fait, encore une fois je présume, comme les auteurs du communiqué, j’ai fait du cherry picking en choisissant des données sans aucun lien entre elles, mais en les accolant pour leur donner un semblant de corrélation.

Moralité de l’histoire?

  • les PR de Doctolib et Withings sont forts.
  • les journalistes qui font un simple copié-collé des communiqués de presse des PR sont en dessous de tout car ils ne font pas leur travail et surtout ils véhiculent des concepts totalement erronés.
  • Une initiation aux statistiques et à la lecture critique d’articles (pas forcement médicaux!) devrait être faite en secondaire, cela diminuerait mécaniquement le nombre d’âneries pseudo scientifiques avec lesquelles on nous gave comme des oies tous les jours.
  • R, et bien, c’est vraiment dur…

J’espère que vous vous êtes autant amusés que moi en lisant ces notes. Ré-écrire m’a fait un bien fou. Merci à Doctolib et Withings!

L’INSEE et Doctolab pointent les multiples bénéfices de la prise de rendez-vous par internet.

L’INSEE et Doctolab ont croisé pour la première fois plusieurs types de données : le nombre de médecins généralistes par région utilisant les services de Doctolab, le taux de mortalité par suicide, la mortalité par maladies infectieuses et parasitaires, le salaire net moyen et le cheptel présent dans les exploitations agricoles par région.

Une nouvelle perspective sur la santé publique, permise par le numérique

D’un côté, les données de Doctolab permettent de présenter une nouvelle vision de la prise de rendez-vous par internet en fournissant des données précises sur le nombre de médecins généralistes utilisant ses services partout en France et région par région.

doctolabD’un autre côté, les données récoltées par l’INSEE dressent un nouveau portrait de l’état de santé de la population française. Cette nouvelle cartographie révèle également de fortes inégalités entre régions, catégorisées selon la prévalence des conditions étudiées de faibles, moyennes ou fortes.

L’intérêt de cette étude est d’identifier les régions dont l’état de santé et l’accès aux soins seraient tous deux en dessous de la moyenne nationale afin de pointer les bénéfices des régions où Doctolab est le plus implanté. L’étude s’est par ailleurs concentrée sur la médecine générale pour le rôle charnière que celle-ci joue dans la politique de santé publique. Or les régions dans lesquelles Doctolab est le plus implanté ont des données de santé publiques bien plus favorables par rapport à d’autres régions.

(cliquez pour agrandir)

histodoctolibsuicide1

L’Alsace Champagne Ardennes Lorraine, parmi les régions à risque.

Cette région dispose d’un taux élevé de suicides indifféremment chez les hommes ou les femmes, ainsi que d’un taux de pénétration faible de Doctolab. Par rapport à l’Ile de France le nombre de médecins généralistes utilisant Doctolab est 18 fois moindre, et le taux de suicide observé est un peu plus que doublé chez les hommes.

histodoctomalinf1

La région PACA affiche une mortalité par maladies infectieuses 30% plus élevée qu’en Ile de France avec 4.6 fois moins de médecins généralistes utilisant les services de Doctolab, gratuits pour le patient.

revenus

Le salaire net moyen annuel de la population générale en PACA est supérieur à celui de la région Alsace Champagne Ardennes Lorraine de 1452 euros alors que le nombre de médecins généralistes bénéficiant des services de Doctolab est 4 fois plus élevé.

histodoctoanimaux

La quantité de cheptel au sein d’une exploitation agricole, facteur notoirement responsable de zoonoses graves transmissibles à l’homme (grippe aviaire, maladie de la vache folle…) est moindre dans les régions où Doctolab est mieux implanté.

Des mesures insuffisantes face à l’ampleur des risques de santé publique.

Cette étude révèle donc de fortes inégalités entre les régions face aux risques posés par l’absence d’optimisation de la prise de rendez-vous médicaux proposée par Doctolab. Les zones qui ont potentiellement le plus besoin de soins manquent de généralistes affiliés.

Le dernier recensement de la population médicale montre que les mesures d’incitation pour attirer les jeunes médecins utilisant Doctolab dans les territoires déficitaires restent insuffisantes ; qu’il s’agisse de contrats d’engagement de service pour étudiants ou d’avantages financiers ou fiscaux.

Face à ce constat, des acteurs comme Doctolab et l’INSERM proposent des solutions qui peuvent permettre de pallier les risques du côté patient, en facilitant la prise de rendez-vous et en promouvant une meilleure hygiène de vie.

A propos de cette étude

Cette étude a été réalisée par l’INSEE et Doctolab. Les données des métriques de santé proviennent d’un échantillon représentatif de médecins généralistes. Toutes les données ont été agrégées et anonymisées pour éviter toute réidentification.

A propos de Doctolab

Doctolab (www.doctolab.pfff) est le leader français de la recherche et prise de rendez-vous médicaux en ligne chez les médecins généralistes âgés entre 60 et 67 ans, porteurs d’un CYP 1A1*8. Fondé en octobre 1973 (nous serons de toute façon à jamais les premiers) par des jeunes qui en veulent a pour objectif de se faire acheter par Google. La société qui emploie aujourd’hui 4 salariés et compte des collaborateurs dans 30 villes en France, est désormais présente en Albanie. Elle a levé 23M€ en 2 ans grâce à 3 tours de tables réalisés auprès d’entrepreneurs et fonds reconnus.

A propos de l’INSEE

L’Institut national de la statistique et des études économiques (Insee) est chargé de la production, de l’analyse et de la publication des statistiques officielles en France : comptabilité nationale annuelle et trimestrielle, évaluation de la démographie nationale, du taux de chômage, etc. Il constitue une direction générale du ministère de l’Économie, des Finances et de l’Industrie (MINEFI). Il dispose d’une indépendance de fait vis-à-vis du gouvernement, désormais garantie en droit par la loi. Depuis mars 2012, son directeur est Jean-Luc Tavernier.