Data Challenge SFP 2022-23
Le projet VisioMel : à la recherche d’une signature numérique évaluant le risque d’évolution métastatique des mélanomes localisés dans les 5 années suivant le diagnostic initial.
Le projet VisioMel : à la recherche d’une signature numérique évaluant le risque d’évolution métastatique des mélanomes localisés dans les 5 années suivant le diagnostic initial.
Ce projet, porté par la Société Française de Pathologie, la Société Française de Dermatologie, le Groupe de Cancérologie Cutanée et le Conseil National Professionnel des Pathologistes, a pour objectif l’organisation d’un data challenge en mars-avril 2023 sur le thème du mélanome. Cet événement, en collaboration avec le Health Data Hub et avec le soutien de la Banque Publique d’Investissement (BPI), est une compétition internationale ayant pour but de répondre en un temps imparti, et à partir de données spécifiques et anonymisées, à une question posée. Il s'adresse ainsi à des data scientists (chercheurs, industriels, étudiants…), de diverses nationalités. Cette année, les compétiteurs devront créer un algorithme d’intelligence artificielle (IA) permettant de prédire la récidive à 5 ans des patients atteints de mélanome. Dans une ultime étape, l’accessibilité des données et des algorithmes issus du data challenge est encouragée afin de permettre à la recherche de poursuivre sa progression dans l’intérêt de tous.
Le mélanome est un cancer de la peau ou plus rarement des muqueuses, se développant à partir des mélanocytes (cellules responsables de la pigmentation cutanée).
Les causes de cette maladie sont multifactorielles mais dépendent principalement de l’interaction entre l’exposition aux UV (durée et intensité), des facteurs individuels (présence/abondance de naevus* (*voir lexique ci-dessous), type de peau etc.) ainsi que de facteurs génétiques.
En 2018, l’Institut National du Cancer estime que 15500 nouveaux cas de mélanomes cutanés ont été dépistés en France métropolitaine (7900 hommes et 7600 femmes). Avec 1800 décès cette même année (1040 hommes et 840 femmes), ce cancer représente 1.2% des décès par cancer tous sexes confondus. Il fait partie des cancers dont l'incidence* comme la mortalité ont significativement augmenté ces dernières décennies.
Les mélanomes représentent 10% des cancers de la peau et sont les plus graves du fait de leur haut potentiel métastatique. L’apparition de métastases est en effet un facteur de mauvais pronostic* car elle signifie que des cellules cancéreuses de la tumeur primitive ont colonisé des tissus sains régionaux ou à distance. Cette colonisation entraîne la formation de tumeurs secondaires au niveau des relais ganglionnaires (on parle de métastases régionales) ou dans d’autres organes (on parle de métastases à distance). Cette évolution métastatique est rarement observée au diagnostic initial du mélanome. En effet, elle survient le plus souvent au cours du suivi.
Le diagnostic du mélanome se fait par analyse microscopique après exérèse* de la tumeur par un médecin anatomopathologiste. A partir d’une lame histologique colorée, le médecin réalise le diagnostic de certitude de la maladie et détermine la gravité des lésions par l’analyse de facteurs pronostiques* (épaisseur de la tumeur mesurée en mm, ulcération, mitoses, ...). Ces facteurs pronostiques* sont alors synthétisés en un stade associé au cancer selon la classification AJCC.
Cette analyse couplée avec les facteurs pronostiques cliniques de la maladie (âge, sexe, antécédents, etc.) permet au médecin dermatologue d’adapter la prise en charge du patient selon la sévérité du mélanome.
La survie* du patient dépend principalement du stade au moment du diagnostic. En ce qui concerne les mélanomes primitifs cutanés sans métastase, le pronostic est principalement lié à l’épaisseur du mélanome. Ainsi, à un stade précoce (mélanomes fins de moins de 1 mm d’épaisseur) la survie à 5 ans est évaluée à plus de 95%. Les mélanomes épais (de plus de 4 mm) ont quant à eux, un risque de rechute de 50% dans les 5 ans. Si le mélanome est d’emblée métastatique ou s’il a récidivé, des traitements complémentaires chirurgicaux (curage ganglionnaire, exérèse de métastases) ou médicaux, (immunothérapie, thérapie ciblée,) peuvent alors être proposés.
La recherche de nouveaux marqueurs prédictifs de la récidive pour les mélanomes primitifs non métastatiques par l’intelligence artificielle permettrait de compléter l’analyse du médecin anatomopathologiste et d’adapter ainsi la prise en charge du patient. De plus, cette identification dans le cas de mélanome peu épais, dont la récidive est particulièrement complexe à prédire, constituerait une avancée majeure .
Les approches IA sont particulièrement pertinentes pour la création d’un outil au service des médecins afin de les accompagner dans la détection des cas potentiels de récidives de façon rapide et précise. En effet, il est essentiel d’identifier de nouveaux facteurs pronostiques que l’examen clinique ou l’examen histologique peuvent ne pas percevoir. Des approches utilisant l’IA ont déjà été utilisées. Il s’agit toutefois d’IA basées sur des échantillons d’assez petites tailles et utilisant des méthodes d’apprentissage très supervisées. La taille de la cohorte envisagée ici permettra l’utilisation de méthodes non supervisées. De plus, coupler variables cliniques, histologiques et moléculaires permettrait d’aller au-delà de la segmentation actuelle des disciplines (clinique, histologique et moléculaire) et d’augmenter les chances d’identification de « pattern » pronostiques.
Schéma général du projet VisioMel
Sélection des patients : La problématique étant la prédiction des évolutions métastatiques de mélanomes, seuls les patients ayant une maladie localisée au moment du diagnostic (stade 0 à IIB) sont inclus dans l’étude. La sélection des patients est effectuée à partir de la base de données RIC-Mel. Grâce à l’effort d’un réseau de médecins issus de 49 centres inclueurs français, cette base de données nationale créée en 2012 recueille aujourd’hui les données d’environ 40000 patients atteints de mélanomes.
2000 patients ont été sélectionnés selon les critères suivant :
Variables sélectionnées pour le challenge : L’apprentissage de la prédiction de la récidive à 5 ans des mélanomes primitifs non métastatiques par l’algorithme se fera sur la base de données cliniques, histologiques et moléculaires. L’algorithme ainsi construit devra prédire la récidive et le statut mutationnel de la tumeur sur la base unique d’analyse d’images, c’est-à-dire des données histologiques.
Dans un premier temps, grâce à l’implication des centres inclueurs, les variables suivantes sont extraites de la base de données RIC-Mel ou à partir des comptes rendus anatomopathologiques :
Dans un second temps, les lames histologiques correspondant à ces patients sont en parallèle désarchivées et numérisées après pseudonymisation afin d’être intégrées à la base de données du challenge. Cette tâche est réalisée par les laboratoires d’anatomie et cytologie pathologique (ACP) ayant traité l’analyse de l’exérèse de la tumeur primitive.
Un grand soin est apporté à la qualité des données par implication des centres inclueurs et vérification de l’exhaustivité de ces dernières.
Anonymisation : Les données sont par la suite solidement anonymisées sans retour possible au nom du patient. Une analyse de risque de ré-identification est menée en collaboration avec DrData .
Déroulement du challenge : La base de données une fois constituée sera disponible sur la plateforme hébergeant le data challenge pour une durée de 6 à 7 semaines. Les données des 2000 patients seront séparées en trois sets différents.
Chaque set sera construit de façon à s'affranchir des biais potentiels dus à des facteurs exogènes : laboratoire ACP (préparation et coloration des lames), type de scanner etc. De même, le stade du cancer et le sexe du patient seront répartis de façon équilibrée dans les différents sets.
Le but sera de quantifier la performance de l’algorithme dans la prédiction de la récidive et du statut mutationnel de la tumeur.
La performance des algorithmes proposés par les challengers sera évaluée sur des critères simples, binaires (absence ou présence d’une évolution métastatique à 5 ans). L’erreur entre la prédiction et la “vérité de terrain” sera pondérée par la gravité de cette erreur à l’aide d’une métrique. Cette pondération mathématique aura un sens clinique et sera communiquée au moment de la compétition.
Toutes les étapes du projet ont été encadrées et validées par DrData. Cette structure de conseil spécialisée dans la protection des données personnelles dans le secteur de la santé. Leurs équipes d’experts accompagnent des hôpitaux, des professionnels de santé et des entreprises du numérique (intelligence artificielle, télémédecine…) dans leur conformité RGPD et le privacy by design de tous leurs process et projets.
Le projet est soutenu financièrement par la Banque Publique d’Investissement (BPI) ainsi que par des dons de la part Bristol Myers Squibb (BMS) et Pierre Fabre.
Source : Fondation contre le cancer
Exérèse : Une exérèse est une intervention chirurgicale consistant à retirer de l’organisme, et si possible en totalité, un élément qui lui est nuisible ou inutile.
Facteur pronostique : Situation, état ou caractéristique d'une personne qu'on considère lorsqu'on établit un pronostic. Il existe de nombreux facteurs pronostiques différents, y compris le type et le stade du cancer ainsi que l'âge et l'état de santé global de la personne atteinte.
Incidence : Nombre total de nouveaux cas d’une maladie diagnostiqués chez une population donnée pendant une période de temps déterminée.
Naevus : Grain de beauté. C’est une tache plane ou en relief qui correspond à un amas de cellules de la peau : les mélanocytes.
Pronostic : Issue ou évolution prévue d’une maladie ou chance de guérison ou risque de récidive.
Récidive: Cancer qui se manifeste de nouveau (récidive) après une période au cours de laquelle le patient n’a éprouvé aucun signe ou symptôme (rémission). On parle de récidive locale lorsque le cancer réapparaît dans la même région du corps que l’emplacement initial (siège primitif) de la tumeur. On parle de récidive à distance lorsque le cancer se manifeste de nouveau dans une région du corps autre que l'emplacement initial (siège primitif) de la tumeur.
Survie : Pourcentage de personnes atteintes d’une maladie qui sont toujours en vie à un certain moment donné après avoir reçu leur diagnostic. Les données statistiques sur la survie au cancer sont souvent fournies pour une période de survie de 5 ans. Ces données indiquent le pourcentage de personnes atteintes d’une maladie en particulier qui sont toujours en vie 5 ans après avoir reçu leur diagnostic. Il peut s’agir de personnes qui n’ont pas de récidive, qui sont en rémission ou qui reçoivent encore des traitements.
Traitement adjuvant : traitement administré en plus du traitement de première intention (premier traitement ou traitement standard) pour aider à réduire le risque de réapparition (récidive) de la maladie.
Traitement néo-adjuvant : La thérapie néoadjuvante est l'administration d'agents thérapeutiques avant un traitement principal.
Dernière mise à jour de la page: