Logo SFP

Data Challenges

Data Challenge 2022-23

Le projet VisioMel, à la recherche d’une signature numérique évaluant le risque d’évolution métastatique des mélanomes localisés dans les 5 années suivant le diagnostic initial, a été porté par la Société Française de Pathologie associée à la Société Française de Dermatologie (Groupe de Cancérologie Cutanée) et au Conseil National Professionnel des Pathologistes (CNPath). En collaboration avec le Health Data Hub et avec le soutien de la Banque Publique d’Investissement (BPI), cette compétition internationale destinée aux data scientists (chercheurs, industriels, étudiants…), s’est déroulée en avril et mai 2023.
 
Grâce au travail de sélection des patients à partir de la base de données RIC-Mel répondant aux critères définis pour le data challenge et pris en charge entre 2012 et 2016, puis de celui réalisé par VisoMel auprès des structures de pathologie, presque 1900 dossiers patients ont été retenus. Les 1900 lames d’histopathologie correspondantes ont été réunies, anonymisées et numérisées après contrôle qualité. La plate forme Driven Data a hébergé et orchestré la compétition en rendant disponibles ces données entre avril et mail 2023. Au total, 541 compétiteurs ont participé et 637 algorithmes d’IA permettant de prédire la récidive à 5 ans de patients atteints de mélanome ont été proposés. Le score obtenu par chaque équipe était défini par l’écart de prédiction de récidive obtenue par l’algorithme par rapport à la réalité de terrain.
Ce data challenge, comme tous les data challenges dans le domaine de la santé, s’inscrit dans une démarche d’open source et d’open data. La base de données clinique et anatomo-pathologique VisioMel, riche de 1900 dossiers, sera ainsi la plus importante base à l’échelle mondiale sur le mélanome, disponible pour que se poursuivent des travaux de recherche dans l’intérêt de tous.
 
Liens utiles

  • Présentation vidéo du projet par le Dr Frédéric Staroz, responsable du projet VisioMel (Health Data Hub, mai 2022, présentation des lauréats de l’appel à projet data challenge 2021).
  • Podcast (juin 2022) dans lequel le Dr Frédéric Staroz présente notamment les bénéfices de ces Data Challenges pour l’écosystème de santé et les entrepreneurs.
  • Témoignage des lauréats et 1ers résultats (Health Data Hub, 09/08/2023)

Data Challenge 2022-23 (English version)

The VisioMel project, in search of a digital signature assessing the risk of metastatic evolution of localized melanomas within 5 years following the initial diagnosis, was carried out by the French Society of Pathology associated with the French Society of Dermatology, the Group of Cutaneous Cancerology and the National Professional Council of Pathologists. In collaboration with the Health Data Hub and with the support of the Public Investment Bank (BPI), this international competition intended for data scientists (researchers, students, software companies etc.), took place in April and May 2023.

Thanks to the work of selecting patients from the RIC-Mel database meeting the criteria defined for the data challenge and supported between 2012 and 2016, almost 1900 patient clinical files were obtained. The 1900 corresponding histopathology slides were collected, anonymized and digitized after quality control. The Driven Data platform hosted the competition by making these data available between April and May 2023. In total, 541 competitors participated, with 637 AI algorithms, making it possible to predict 5-year recurrence of melanoma patients. The score obtained by each team was defined by the difference in prediction of relapse obtained by the algorithm compared to ground truth.

This data challenge, like all data challenges in the health field, is part of an open source and open data approach. The VisioMel clinical and pathological database, with 1,900 files, will thus be the largest database on melanoma in the world, available for research work to be carried out in the interest of all.

Usefull links :

Data Challenge 2020

En 2020, notre premier Data Challenge : "l’intelligence artificielle au service de la détection des lésions précancéreuses et cancéreuses pouvant subvenir sur le col de l'utérus"

De même que pour les mélanomes, les diagnostics de cancer du col de l’utérus sont réalisés à partir de l'observation de lames de verre avec un microscope optique. Bien que la pratique de numérisation reste encore marginale, des outils d’Intelligence Artificielle (IA) ont été appliqués pour aider les professionnels de santé dans le diagnostic des lésions du col de l’utérus. 

Grâce à l’effort de la Société Française de Pathologie et du Health Data Hub, un jeu de données anonymes de près de 4 000 lames d’histopathologie (biopsies et conisations) a été constitué pour ce Data Challenge. Ces lames anonymisées, numérisées et richement annotées ont permis d’apporter une vérité de terrain sur laquelle les compétiteurs ont pu se baser pour développer leurs algorithmes. Driven Data, la plateforme ayant hébergé et orchestré la compétition, a rendu ces données histopathologiques disponibles entre septembre et octobre 2020. Au total, 574 participants ont rejoint la compétition pour développer le meilleur algorithme de détection de lésion sur des biopsies du col de l’utérus. Les résultats des algorithmes soumis sont impressionnants. Douze équipes ont atteint un score de plus de 0,9/1 avec un vainqueur culminant à plus de 0.93/1 sur le "Leaderboard".

L’objectif final de cette compétition était la mise en open source des données qui avaient été proposées aux compétiteurs (lames numériques anonymisées). Ceci a été réalisé en janvier 2025 et plus de 1200 lames biopsies de col utérin et de conisation sont maintenant librement accessibles sur le site https://www.data.gouv.fr sous le libellé « jeu de données TissueNet ».

Documents utiles :

Data Challenge 2020 English

In 2020, our first Data Challenge: artificial intelligence to detect pre-cancerous and cancerous lesions that can occur in the cervix.

In the same way as for melanoma, cervical cancer diagnoses are made from the observation of glass slides with an optical microscope. At the era of digital pathology, Artificial Intelligence (AI) tools have been applied to help health professionals in the diagnosis of cervical lesions.

Thanks to the efforts of the French Society of Pathology and the Health Data Hub, an anonymous dataset of nearly 4,000 histological slides (biopsies or conizations) was created for this challenge. These anonymized, digitized, and highly annotated slides bring a ground truth on which competitors could base their algorithms. Driven Data, the platform that hosted and coordinated the competition, made those histological data available for competitors between September and October 2020. In total, 574 participants joined the competition in order to develop the best algorithm for the detection of lesions on cervical biopsies. The results of the submitted algorithms were impressive. Twelve teams achieved a score above 0.9/1 with a winner reaching at more than 0.93/1 in the Leaderboard.

The final objective of this competition was to open the data that had been offered to the competitors (anonymized digital slides). This was carried out in January 2025 and more than 1200 slides of cervical biopsies and of surgical specimen are now freely accessible on the website https://www.data.gouv.fr under the label “TissueNet dataset”

Useful links :

Dernière mise à jour de la page: