Deep learning engineer internship

Contract Start date Duration Last update
Internship Feb. 1, 2022 6 months Nov. 23, 2022, 10:56 a.m.

Apport de l’auto-supervision dans les techniques de deep learning appliquées à l’imagerie 3D

L'équipe "CODED" (Dynamique de la chromatine et du noyau 3D) recherche un ingénieur satagiaire  (3A de préférence) motivé par la recherche académique dans un contexte multi-disciplinaire (biologie santé/ informatique) avec un goût prononcé pour le travail en équipe.

Ce stage vient en soutien d’un projet doctoral co-financé par l’ANR et l’Université Oxford Brookes et s'inscrit dans le projet régional « AIM- Artificial Intelligence for clerMont » (2020-2023). Vous serez encadré par le doctorant Guillaume Mougeot, sous la responsabilité d’un ingénieur de recherche de biologie de l’iGReD (Sophie Desset) et d’un professeur de l’Institut Pascal (Frédéric Chausse). 

Lieu du stage :
Institut GReD, CRBC, faculté de médecine, Clermont-Ferrand
Contact :
Sophie Desset, 04 73 40 53 04,

Contact

Sophie DESSET

Phone: +33473405304

Job description

Malgré les progrès spectaculaires de l’analyse d’images par les réseaux de neurones convolutifs, (convolutif neuronal network, CNN) les techniques d’apprentissage profond (deep learning) restent peu appliquées dans le domaine biomédical pour les images en trois dimensions. La principale raison est qu’elles nécessitent de nombreuses données expertisées manuellement (vérité de terrain) pour l’apprentissage de la tâche à accomplir or ces jeux de données sont rares dans les domaines de la santé et de la biologie, car très couteux à produire.

Pour contourner ce problème, notre équipe développe actuellement des méthodes semi- ou auto-supervisées (semi- or self- supervised methods) qui consistent à entraîner le modèle sur les seules images brutes, qui sont disponibles, elles, en grand nombre, avant l’apprentissage proprement dit qui requiert alors beaucoup moins de vérité de terrain. L’objectif de ce stage sera de mesurer l’apport de cette technique en comparaison des meilleures méthodes supervisées de l’état de l’art sur les jeux de données du laboratoire. Pour les comparer, nous envisageons des critères métriques assez classiques, sur les volumes des objets segmentés par exemple.  Chacune des méthodes sera testée pour ces critères avec une quantité croissante d’images annotées afin d’établir des courbes de précision en fonction de la quantité d’images.

Le stage consistera à :

  • Se familiariser avec les méthodes de deep learning, nnU-Net, Stardist, CellPose et Biom3D avec les jeux de données du laboratoire. Ces méthodes sont déjà utilisées au laboratoire et disponibles dans le conteneur docker ou conda.
  • Configurer l’environnement propre à chaque méthode dans le package Singularity afin de pourvoir utiliser les ressources du Mésocentre Auvergne.
  • Définir les métriques d’évaluation propres à l’évaluation du self-supervised et coder le workflow test.
  • Tester chaque méthode selon ces métriques.

Délivrables :

  • Méthodologie d’analyse (métriques)
  • Environnements configurés dans singularity
  • Résultats comparatifs des méthodes.
  • Résultats sur l’évaluation quantitative et qualitative d’un jeu de données

Prérequis:

  • Bases d’algèbre linéaire et statistique nécessaires à la compréhension du deep learning.  
  • Compétences de base en traitement d’images. 
  • Programmer en langage Python.  
  • Savoir utiliser des outils de versionnage (git). 
  • Les plus : connaître les frameworks de deep learning (Tensorflow, Pytorch) et de packaging (Docker, Anaconda, Singularity). 

A gagner : 

  • Des notions de génétique/ épigénétique/ microscopie pour briller dans les soirées d'informaticiens. Pour les soirées de biologistes, prolongez votre stage par un doctorat au GReD. 
  • A l’issue du stage vous saurez vous approprier rapidement une nouvelle méthode de deep learning appliquée aux images pour réaliser l’ensemble des étapes préalables à l’exécution d’un modèle. Vous saurez l’adapter, l’entraîner sur un nouveau jeu de données et le faire fonctionner en mode inférence.