Tremplin Carnot Interfaces | Traitement automatiques des données : quid des comptes-rendus médicaux ?
934
post-template-default,single,single-post,postid-934,single-format-standard,qode-quick-links-1.0,ajax_fade,page_not_loaded,,qode_grid_1300,footer_responsive_adv,qode-content-sidebar-responsive,qode-child-theme-ver-1.0.0,qode-theme-ver-11.2,qode-theme-bridge,wpb-js-composer js-comp-ver-5.2.1,vc_responsive
 

Traitement automatiques des données : quid des comptes-rendus médicaux ?

Traitement automatiques des données : quid des comptes-rendus médicaux ?

Xavier Tannier est Professeur à Sorbonne Université depuis 2017 et chercheur au Laboratoire d’Informatique Médicale et d’Ingénierie des Connaissances en e-Santé (LIMICS). Porteur d’un projet ANR, il a reçu deux Google Awards pour des travaux sur le journalisme de données et la vérification de faits. Il est actuellement Responsable scientifique pour deux autres projets ANR au LIMICS. Il nous parle de son projet de traitement des données des comptes rendus médicaux.

POUVEZ-VOUS NOUS EXPLIQUER VOTRE PROJET ET SON CONTEXTE ?

Le texte des comptes rendus médicaux n’est pas structuré mais il contient des informations précieuses sur le patient ; en associant ces informations concernant des millions de personnes, on peut déduire des connaissances générales que des médecins ne sont pas capables de découvrir d’eux-mêmes, malgré toute leur expérience, comme :

  • Les effets indésirables des médicaments,
  • Les maladies rares
  • Les profils de patients qui ne répondent pas comme prévu à un traitement…

Le projet permettra, grâce aux avancées récentes de l’intelligence artificielle et du Traitement Automatique des Langues, de partir de grandes masses de données (Big Data) et d’analyser le texte des comptes rendus médicaux. Nous pourrons alors extraire et déduire de nouvelles connaissances, dans le but de répondre à des questions de recherche et de personnaliser les soins aux patients.

EN QUOI PEUT-ON PARLER INNOVATION DANS LE CADRE DE CE TRAVAIL ?

Les approches d’extraction d’information dans les textes ont pour l’instant un certain nombre de limites qui empêchent leur utilisation massive par les experts tels que les médecins.

Si les performances dans le domaine général sont bonnes, elles ont un niveau moindre dans des secteurs spécifiques comme le domaine clinique avec, notamment, un arsenal technologique moins avancé pour l’étude de la langue française que pour la langue anglaise (beaucoup plus étudiée).

Par ailleurs, les modèles statistiques utilisés à l’heure actuelle demandent beaucoup de données annotées par des experts humains, et fournissent des résultats sans explication, qu’il est donc très difficile d’interpréter par la suite.

Nous souhaitons avancer sur chacun de ces points et sur les verrous scientifiques associés pour construire des outils prêts à l’emploi permettant de structurer massivement des données textuelles.

CONCRÈTEMENT COMMENT VONT ETRE UTILISE CES OUTILS A TERME ?

À l’issue du projet, la maturité de nos outils nous aura permis d’engager des collaborations avec des chercheurs en médecine pour les aider à répondre à leurs problématiques de recherche.

Il est important de préciser qu’en aucun cas notre objectif n’est de remplacer l’expert humain à l’entrée comme à la sortie, mais bien d’extraire et d’agréger pour cet expert des connaissances nécessaires à de meilleures prises de décisions. Il s’agit de lui fournir des informations qu’il n’aurait pas pu obtenir autrement.