Actualité - Innovation

Utilisation de l'IA pour la recherche : une étude décisive publiée dans Nature Medicine

19/01/2023
Partager
Pour la première fois, une étude a montré que l’apprentissage fédéré peut être utilisé sur des données d'histopathologies issues de plusieurs hôpitaux sans les exposer directement. Publiée dans Nature Medicine, cette étude menée par Owkin, avec l'Institut Curie, l’IUCT Oncopole, le Centre Léon Bérard et Gustave Roussy, pourrait réaliser des percées dans la médecine de précision grâce à l'utilisation d'une IA sécurisée préservant la confidentialité des données.
Docteur

Cette découverte ouvre la voie à une recherche médicale dont l’un des moteurs serait l'IA utilisant de plus grands ensembles de données multicentriques, permettant aux modèles d'échapper aux biais des études monocentriques. A terme, cela pourrait permettre de réaliser des percées dans la médecine de précision grâce à l'utilisation d'une IA sécurisée préservant la confidentialité des données.

Nous avons franchi une étape importante avec le déploiement de cette infrastructure d'apprentissage fédérée, montrant une nouvelle approche dans la construction des algorithmes d'IA dans la recherche sur le cancer répondant aux enjeux RGPD. Nous sommes vraiment heureux d'avoir fait partie de cette aventure et espérons que cela ouvrira des perspectives prometteuses pour l'avenir des soins aux patients.

déclare Julien Guérin, directeur des Données à l'Institut Curie.

L’IA au service de la recherche médicale

À l'aide des données conservées dans quatre grands hôpitaux français, Owkin, biotech spécialisée dans l’IA appliquée à la recherche médicale, a construit des modèles d'IA capables de générer une prédiction de la réponse future des patientes atteintes d'un cancer du sein triple négatif (TNBC) à une chimiothérapie néoadjuvante. En utilisant une IA interprétable pour extraire des informations de lames de pathologie numérique, Owkin a pu mettre en exergue de nouveaux biomarqueurs potentiels. À l’avenir, cela pourrait aider à orienter les patients vers des traitements plus adaptés ou de nouveaux traitements expérimentaux, améliorant ainsi la personnalisation des soins médicaux.

Le consortium a ainsi utilisé l'apprentissage fédéré, une approche d'IA collaborative qui préserve la confidentialité et la sécurité des données grâce à Substra (logiciel d’Owkin récemment mis en libre accès sur la plateforme github, qui rend chaque opération traçable grâce à la technologie hyperledger). C'est la première fois que des modèles d'apprentissage automatique sont entraînés à l'aide de données histopathologiques provenant de plusieurs hôpitaux, sans que ces données ne quittent ces derniers. Jusqu’à aujourd’hui, la plupart des études publiées se limitaient à simuler l’apprentissage fédéré en distribuant artificiellement des données dans des centres fictifs. Il s'agit d'une preuve historique de l'utilisation de l'IA dans la recherche médicale et d'une percée dans la mise en œuvre pratique de l'IA pour la recherche.

L'étude a utilisé les données pathologiques numériques et les informations cliniques de 650 patients provenant de l'Institut Curie, du Centre Léon Bérard, de Gustave Roussy et de l'IUCT Oncopole, en faisant ainsi l'une des plus grandes cohortes TNBC jamais réunies pour ce type d'analyses.

La recherche s'appuie sur l'utilisation pionnière de l’apprentissage fédéré menée par Owkin pour permettre aux entreprises pharmaceutiques de collaborer à la recherche de médicaments tout en préservant la confidentialité, la sécurité et l’avantage compétitif potentiel de chaque collaborateur. Les résultats du projet MELLODDY, publiés cette année, ont montré que la collaboration en IA pour la découverte de médicaments est possible à l'échelle industrielle grâce à l’apprentissage fédéré, une première pour l'industrie. En plus de répondre aux préoccupations en matière de confidentialité et de sécurité, l’apprentissage fédéré peut également simplifier les questions de gouvernance des données, en supprimant la nécessité de les transférer et en favorisant une recherche plus collaborative.

Grâce à nos partenaires, nous sommes fiers d'avoir réalisé une analyse fédérée originale sur des données médicales en conditions réelles, et la première de ce type sur des données d'histopathologie. En connectant les institutions de manière fédérée, nous avons pu atteindre la masse critique de données de cancer du sein triple négatif nécessaire pour que l'IA découvre, par elle-même, des modèles histologiques prédictifs de la réponse au traitement. Nous espérons que cette preuve de concept va encourager les institutions médicales à collaborer dans des réseaux d'apprentissage fédérés afin de faire avancer la recherche tout en préservant la confidentialité des données des patients.

se réjouit Jean du Terrail, Senior Machine Learning Scientist chez Owkin.

Grâce à ce partenariat multidisciplinaire, nous avons pu vérifier la faisabilité d'une approche d'apprentissage fédérée collaborative inter-hospitalière sur une question médicale pertinente. Cela nous a permis de constituer rapidement un ensemble de données hétérogènes de manière sécurisée afin de développer des modèles reproductibles, transférables et même interprétables. Cette preuve de concept a le potentiel de devenir un outil de décision thérapeutique.

affirme le Dr Guillaume Bataillon, pathologiste à l'IUCT Oncopole de Toulouse et ancien pathologiste à l'Institut Curie.

L'essor de la pathologie numérique couplé à l'explosion des différentes techniques d'apprentissage automatique devrait permettre une médecine de plus en plus précise et personnalisée. De plus, l'apprentissage fédéré, réalisé dans ce projet en évitant les flux de données externes, facilite et sécurise le processus pour la future pratique clinique quotidienne.

commente le Dr Pierre Etienne Heudel, oncologue médical au Centre Léon Bérard.

La pathologie numérique et l'IA représentent la troisième révolution dans notre discipline, et les pathologistes sont enthousiastes à l'idée d’être leaders dans ce nouveau changement de leur pratique. L'apprentissage fédéré, pionnier de la recherche en IA dans le domaine de la pathologie numérique, nous rapproche un peu plus de l'identification de nouveaux biomarqueurs en oncologie tout en garantissant la confidentialité et la sécurité des données.

explique le Dr Magali Lacroix-Triki, pathologiste à Gustave Roussy.

En permettant d’entraîner des modèles d'IA multicentriques sans centralisation des données, l'apprentissage fédéré contourne l'un des principaux obstacles à l'apprentissage automatique sur des données médicales, sans faire de compromis concernant le respect des données personnelles.

conclut le Dr Camille Franchet, pathologiste à l'IUCT Oncopole de Toulouse.

 

Lire la publication

En savoir plus