Banques de données de santé : entre Big Brother et besoins de recherche
Le 15 octobre, Sup’Biotech, en partenariat avec Cancer Campus, Biofutur, Interbiotech et l’association des anciens, DSB, a organisé une conférence interprofessionnelle à l’Institut mutualiste Montsouris (Paris 14e). En présence des étudiants de l’école, des professionnels du secteur public et privé ont échangé sur l’augmentation massive des informations de santé qui permettent de faire progresser la recherche, mais posent des questions de confidentialité. Que sont ces données ? Qui peut les consulter ? Les utiliser ? Quels sont les enjeux de leurs nouvelles mises à disposition ?
Les banques de données font face à de nouvelles demandes d’ouverture : les informations qu’elles contiennent aident au diagnostic et à la recherche épidémiologique. Elles permettent, par exemple, l’identification d’alertes sanitaires. Leur caractère sensible appelle tout de même à la prudence et la vigilance. Quel peut-être l’impact de ce brassage d’informations de santé ? Quels en sont les dangers ? Comment contrôler leur accès ?
Aujourd’hui, cette ouverture des données de santé diffère selon les pays. L’Australie, les Etats-Unis ou encore la Suède ont mis en place des politiques d’ouverture complètes de toutes leurs données, qu’elles soient médicales ou issues des hôpitaux, qu’elles concernent le parcours de soin, les médicaments et les informations administratives. Le Canada et l’Allemagne procèdent de manière sélective selon la nature des demandes (chercheurs, tiers, industries…).
Qu’en est-il de la France ?
Les bases de données françaises sont performantes et complètes, grâce notamment à l’utilisation généralisée et automatisée de la carte vitale. « Il existe deux bases de données principales, explique Jean-Michel Hotton, CEO de JMH & Partners, le Système National d’informations Inter Régions d’Assurance Maladie (SNIIRAM) et le programme de médicalisation des systèmes d’information (PMSI). Le premier prend en compte l’ensemble des informations médicales et inclut le second, qui concerne des données issues de l’hôpital. L’ensemble de ces informations est anonymisé et leur mise à disposition actuellement très encadrée et normée. » « 1,2 milliard de feuilles de soins sont gérées chaque année par les caisses d’assurance maladie et 20 milliards de lignes de prestations sont traitées, précise Michel Régereau, président du Conseil de la Caisse nationale d’Assurance Maladie des travailleurs salariés. Les données agrégées du SNIIRAM sont disponibles pour les institutions, les organismes à but non lucratif et des demandes émanant des pouvoirs publics. L’alerte sanitaire concernant le Mediator a d’ailleurs été lancée après une étude post-autorisation, réalisée à partir de données du SNIIRAM. » Cependant, cette ouverture reste limitée voire impossible pour les organismes à but lucratif. Cette sélectivité tend à rendre parfois compliqués des projets de recherche épidémiologique, dont les besoins en informations sont très importants. Pour Jean-Michel Hotton, si « la France a la possibilité de jouer un rôle majeur dans l’épidémiologie, elle ne le fait pas alors même qu’elle pourrait développer ses capacités d’analyse, d’agrégation ou de visualisation des données. »
Selon le rapport 2013 de l’Institut des données de santé (IDS), il faudrait « encadrer, tout en simplifiant, la procédure d’accès aux données de santé, pour les rendre plus largement disponible. Il faut également faciliter la diffusion ‘grand public’ d’éléments statistiques globalement descriptifs de notre système de soins, ajoute Michel Régereau, accorder l’accès aux données en s’entourant d’un certain nombre de précautions pour les organismes de recherches publics. Pour les organismes à but lucratif, il est important d’élaborer des procédures strictes, adaptées selon le type d’études. La puissance publique doit se doter des moyens de contrôle et de sanction. » Leur utilisation doit donc évoluer vers plus d’ouverture pour les demandes d’informations des organismes de recherche, tout en encadrant cette ouverture pour en limiter les mauvais usages et les détournements.
Quels sont les conséquences des cette ouverture sur les médicaments ?
« L’explosion de l’accès aux bases de données nous permet d’avoir une pharmacovigilance beaucoup plus précise des produits qui sont actuellement sur le marché, explique Anne-Françoise Gaudin, Director Health Economics & Outcomes Research chez Bristol-Myers Squibb. Avec la mise en place du plan de gestion des risques en 2005, il a été demandé de suivre la tolérance de tous les produits. L’accès aux données permet de faire remonter des informations en direct, pratiquement’ au fil de l’eau’, sur nombre d’aspects tels que les effets indésirables ou les interactions médicamenteuses. C’est un vrai bénéfice pour la société, d’autant que cette surveillance est encadrée par des plans de gestions de risques et qu’il est indispensable aujourd’hui de savoir comment un médicament est toléré une fois qu’il est administré à la population générale. A travers les bases de données, on peut également connaître l’efficacité des traitements au niveau patient et en terme d’efficacité comparative, par rapport à d’autres solutions. Elles permettent d’élargir les panels de recherche. »
Quels sont les implications de ces évolutions pour les entreprises ?
L’évolution des bases de données, qu’elle soit matérielle ou politique, influent sur le rôle des entreprises dans le domaine de la santé. Ces nouveaux enjeux, mais aussi de nouvelles techniques et technologies, ont bouleversé le paysage des industries pharmaceutiques et de santé. Mariana Kuras, CTO d’Ariana Pharma, explique : « pour une entreprise comme la nôtre, l’ouverture des données de santé nous permet d’identifier les patients à risque, d’améliorer nos panels de recherche, notamment sur les bio-marqueurs… Nous travaillons avec un outil d’exploration de données (datamining) nommée KEM, qui utilise une méthode par association pour l’analyse d’un très grand nombre de données complexes. Notre business model se base sur des projets à financements externes, les licences des softwares que nous développons ainsi que les différentes subventions et droits d’auteur. Grâce aux Big Data et aux possibilités qu’elles représentent, nous améliorons les procédures de développement des médicaments et les essais cliniques (Alzheimer, oncologie). »
Un exemple d’utilisation des données scientifiques : le système Watson d’IBM
Présenté par Christel Beltran, Watson est un projet de recherche développé par IBM. Ce système unique comprend et analyse le langage naturel (anglais). Il en donne des conclusions et sait s’auto-évaluer. Il assimile également des données non-structurées (données complexes souvent issues d’internet). Les résultats sont accompagnés de liste d’éléments ayant concouru au résultat. La recherche se fait par l’identification de mots-clés permettant une première liste d’hypothèses ; en allant chercher les preuves, le système Watson note les réponses par probabilité et donne le résultat final en les comparant. Utilisé dans toutes sortes de domaines, il a notamment permis de développer un outil novateur dans l’aide au diagnostic, ayant pour but d’accompagner le médecin dans sa prise de décision en mettant à sa disposition un très grand nombre d’informations. Capable de traiter l’équivalent d’un million de livres par seconde, ce système permet l’analyse des données académiques, scientifiques et médicales (concernant les patients).
« La montée en puissance des données de santé ainsi que la question de leur accessibilité laissent présager de nouveaux besoins en compétences dans les années à venir tels que des postes de data manager et je ne veux pas manquer ces opportunités professionnelles pour les étudiants. Cette conférence débat a permis de les sensibiliser sur le sujet et pourquoi pas de susciter des vocations ! » selon Vanessa Proux, directrice de Sup’Biotech.