Portrait - Thomas Balezeau, ingénieur data

23/01/2019
Partager

Il joue avec les programmes informatiques pour collecter et donner du sens aux masses de données dont dispose l’Institut Curie. Avec pour objectif de faciliter leur usage par les chercheurs et les médecins, via des applications et outils simples.

Thomas Balezeau

Dès son arrivée à l’Institut Curie il y a deux ans et demi, ce bio-informaticien de formation est littéralement plongé dans l’univers des big data : « J’ai rejoint l’équipe de Julien Guérin pour construire un entrepôt de données. Un beau challenge : nous étions au début de l’aventure initiée notamment grâce à l’impulsion du projet ICGEx et l’Institut Curie était pionnier dans ce domaine ! »  Sa mission ? Rassembler dans une même base facilement requêtable par les utilisateurs, une grande masse de données. 

Si la base initiale rassemble uniquement des données provenant d’échantillons biologiques (sang, ADN…), elle devient très vite un vaste entrepôt de données cliniques qui centralise virtuellement les comptes rendus médicaux, les données de chimiothérapie, de radiothérapie, etc. Thomas Balezeau s’attèle alors à développer des programmes pour automatiser le flux des données. « L’idée était de toutes les ranger dans une seule et même boite, de manière uniforme, dans le but de les rendre accessibles et ainsi de répondre à toutes les questions et besoins des chercheurs. » Cet entrepôt de données (BIOMEDICS) continue aujourd’hui à être alimenté et utilisé en complément d’un autre projet porté par la fédération UNICANCER et auquel participe Thomas Balezeau, à savoir ConSoRe, pour Continuum soins-recherche. Ce puissant moteur de recherche, est capable de collecter et d’analyser –en une fraction de secondes- des informations disséminées sous forme de texte dans les dossiers médicaux.

La tâche est vaste : ConSoRe interroge les millions de documents des patients et les indexe avec des termes médicaux (et leurs millions de synonymes). Au contraire de BIOMEDICS qui est réservé à un usage avancé d’exploitation de données, ConSoRE, est aussi une interface « friendly » pour ses utilisateurs afin qu’ils puissent poser leurs questions dans le cadre de leurs projets de recherche. « L’idée est de permettre aux médecins et aux chercheurs de poser eux-mêmes un maximum de questions, aussi complexes soient-elle, via une application adaptée à leurs besoins et usages. Et de leur fournir rapidement ces données. »

Donner du sens aux données. Via ces outils très puissants, il est dès lors possible de reconstituer l’histoire d’un patient, en fonction de critères précis (tel cancer, tels antécédents, tel traitement, etc.). C’est là qu’est l’objectif final, résume encore Thomas : traduire les données en connaissance et les corréler. D’ailleurs, poursuit-il, « j’ai obtenu récemment un projet de recherche pour aller fouiller en profondeur dans ces données cliniques, afin d’identifier des corrélations, qui seront je l’espère surprenantes. » Concrètement l’objectif est de faire apparaître des faits, jusque-là invisibles. Par exemple, en comparant des profils de patientes similaires. L’idée est de comprendre si certaines associations de traitements et autres variables cliniques pourraient jouer un rôle dans la réponse au traitement.

Organiser, anticiper. Ce travail d’analyse des données passe aussi par un vaste travail de classement et de référencement. « Cela sera utile, demain, pour échanger avec d’autres moteurs de recherche internationaux. » Autre challenge : la gestion de l’architecture des data. Thomas Balezeau travaille en particulier pour des projets internationaux d'analyse d'image par de l'intelligence artificielle. « On dispose de téra octets de données, dont la gestion pose des problématiques de stockage et d’anonymisation. Leur traitement prend du temps, de la place, et soulève de nombreuses questions : où stocker ces images ? comment fournir et sécuriser les données ? comment les mutualiser ? etc. » Autre sujet de réflexion : l’industrialisation des processus pour améliorer la qualité du service et répondre, pourquoi pas, à tous les besoins. « La tâche n’est pas simple car ils sont aussi variés que subtiles. Mais le sujet est passionnant ! »