====== Équipe statistique et génome ======
{{:sg:bannersg.png?800|logo-sg}}
===== Thèmes de recherche =====
Nos thèmes de recherche:
* Tests multiples, Statistique pour la génétique et la génomique, études d’association
* Apprentissage en grande dimension
* Sélection de modèles et méthodes de régularisation
* Structures latentes en science du vivant
* Analyse de sensibilité, Inégalités oracles, Construction de méta-modèles
* Analyse de données de survie
* Analyse de données fonctionnelles, parcimonie fonctionnelle
* Classification géométrique des courbes multivariées issues de la langue des signes
* Détection de ruptures
* Quantification des incertitudes en présence de données manquantes
* Evolution du génome et l’adaptation des espèces, Modèle d'évolution de séquences, Gènes dupliqués, éléments transposables et évolution des génomes.
* Bases de données pour la génomique et les éléments transposables
* Modèles de graphes aléatoires pour l'apprentissage en grande dimension, et Inférence des réseaux,
* Statistiques des processus stochastiques avec des applications en sciences du vivant.
* Processus de branchement
* Intégration de données cliniques longitudinales
* Screening
* Intelligence Artificielle fiable
* Détection des signaux et des promoteurs chez les plantes
* Mise en package de pipeline pour la génomique
* Méthodes à noyaux
Voir les [[sg:publications|publications de l'équipe]].
===== Missions =====
L’équipe de Statistique et Génome développe ses activités de recherche dans les domaines de l’apprentissage statistique, des statistiques appliquées, de la statistique mathématique et de la bio-informatique.
Notre objectif est de développer des méthodes originales pour l’analyse de données issues des sciences du vivant.
Les recherches portent sur des développements méthodologiques, mathématiques et bio-informatiques pour des modèles issus des sciences du vivant (génomique, santé, agronomie, agro-écologie, hydrologie, analyse du mouvement, etc.).
Nous travaillons sur l’analyse des gènes dupliqués, les procédures de tests multiples, l’analyse de données fonctionnelles, et les inégalités oracles dans un contexte d’analyse de sensibilité. L’équipe développe également des logiciels pour la communauté scientifique, disponibles publiquement.
L’équipe est composée d’enseignants-chercheurs et chercheurs en statistique, machine learning et bio-informatique.
===== Membres actuels =====
Le numéro de téléphone complet est composé du préfixe commun : +33 (0)1 64 85 et du numéro de poste indiqué dans le tableau.
\\
lammeteam,SG
Quelques récentes [[http://www.math-evry.cnrs.fr/sg/distinctions | distinctions]].
===== Master =====
L'équipe est très impliquée (direction et cours) dans le [[https://formations.univ-evry.fr/plugins/evry/odf/_content/subprogram-data-science-sante-assurance-finance-fr-fr.pdf | Master Data Science Santé Assurance Finance]].
Ce master 2 en alternance et en formation initiale propose une formation généraliste en statistique et apprentissage statistique, destinée aux étudiants en mathématiques appliquées et aux ingénieurs souhaitant se spécialiser en science des données.
Grâce à des cours d'informatique (programmation et bases de données), les étudiants acquièrent les compétences indispensables en statistique et informatique pour devenir data scientists.
Les évaluations, en grande partie sous forme de projets, développent la capacité à mettre en œuvre des méthodes et algorithmes, ainsi qu’à gérer des projets en équipe. La formation inclut également des cours spécialisés en santé, assurance et finance, offrant une expertise approfondie sur les données complexes de ces secteurs.
===== Séminaires =====
* [[http://www.math-evry.cnrs.fr/evenements/seminaire-statgen |Le séminaire principal de l'équipe Statistique et Génome]]
* [[https://mathforgenomics.github.io/ | Le séminaire interdisciplinaire (math. et génomique).]]
* [[http://www.math-evry.cnrs.fr/evenements/seminaire-statproba |Le séminaire Statistiques et probabilités]]
===== Invités 2024 =====
* [[https://tdhock.github.io/ | Toby Hocking]], Tenured Associate Professor, Université de Sherbrooke, Département d’informatique.
===== Collaborations =====
=== Académiques ===
* L’équipe Statistique et Génome a établie une forte collaboration avec l'équipe Réseaux Génomiques de l'Institut de Sciences des Plantes-Paris Saclay ([[https://ips2.u-psud.fr/fr/recherche/pmin-departement-interactions-plantes-micro-organismes-et-reseaux/gnet-reseaux-genomiques.html | IPS2]]) depuis une dizaine d'années.
* [[http://www.genhotel.com |Genhotel]]
* Lancaster
* [[https://www.lse.ac.uk/statistics/people/anica-kostic | Anica Kostic]]
* [[ https://www.lse.ac.uk/statistics/people/~romano | Gaetano Romano]]
* [[ https://www.maths.lancs.ac.uk/~fearnhea/ | Paul Fearnhead]]
=== Industrielles et ANR ===
* **2023- : ANR TraitZoo**, Responsable Lamme : Ambroise Christophe, Description : Biogéographie des traits et diversité fonctionnelle du mésozooplancton marin : données à haut débit (imagerie, -omique), apprentissage machine, et modélisation numérique avec INRIA and Paris Centre Univ.
* **2022- : Projet BCI ŸNFABRE** Responsable Lamme : Ambroise Christophe, Description : Consacré à la génétique de la larve du scarabée Tenebrio Molitor avec Amine Madoui (CEA).
* **2022- : CIFRE Sensorion** Responsable Lamme : Christophe Ambroise, Marie-Szafranski, Description : Stratification de patients et analyse de biomarqueurs diagnostiques dans un espace de Hilbert à noyau consensus reproduisant : application au traumatisme sonore aigu.
* **2022-2023 : IDOOH (PHC Van Gogh)** Responsable LaMME : Marie Szafranski, Description : Coordination. Projet sur l’intégration de données omiques hétérogènes impliquant le LaMME et le Swammerdam Institute for Life Sciences (University of Amsterdam).
* **2021- : ANR TOCCATA** Responsable Lamme : Guillem Rigaill, Description : WP leader, le coordinateur est W. Majeran (IPS2). Regulatory mechanisms of C4-differentiation : make CO2 fixation great again.
* **2021- : DIGIT-BIO Peersim** Responsable Lamme : Guillem Rigaill, Description : Coordinateur avec E. Delannoy (IPS2). Planification d’expériences pour l’Etude de la Réponse aux Stress-multiples et l’Intégration Multi-omique. Méta-programme DIGITBIO.
* **2020- : Quantmetry**, Responsable Lamme : Nicolas Brunel, Description : Projet de collaboration avec Quantmetry.
* **2019- : CIFRE Dassault Systèmes** Responsable Lamme : Guilloux Agathe, Description : Machine Learning applied to healthcare databases avec Paris Centre Univ. and Evry Paris Saclay univ.
* **2019- : CIFRE CEMKA** Responsable Lamme : Guilloux Agathe, Description : Machine Learning applied to healthcare databases avec Paris Centre Univ. and Evry Paris Saclay Univ.
* **2019- : DISAITEK** Responsable Lamme : Nicolas Brunel, Description : Projet de recherche en collaboration avec DISAITEK.
* **2018- : ATIGE** Responsable Lamme : Guillem Rigaill, Description : Coordinateur. Modèles de segmentation pour l’étude des régulations de l’ADN et de l’ARN. Application à l’analyse des données de Chip-Seq et à l’étude des PPR.
* **2018- : CIFRE Enterome** Responsable Lamme : Christophe Ambroise, Description : Prise en compte de l’organisation hiérarchique des espèces pour la découverte de signatures métagénomiques multi-échelles.
* **2017- : ANR EPITREE**, Responsable Lamme : Ambroise Christophe, Description : Evolutionary and functional relevance of epigenetic variations in forest trees, avec des chercheurs INRA d’Orléans, Bordeau et Clermont-Ferrand. URL : [[https://www6.inra.fr/epitreeproject/Le-projet-EPITREE| EPITREE]]
* **2017- : Projet Antibio-résistance** Responsable Lamme : Ambroise Christophe, Description : Financement d’un post-doctorant sur 2 ans pour participer au développement d’une application de téléphone mobile pour le diagnostic de l’antibio-résistance dans les camps de réfugiés MSF. Les fonds étaient issus des dons à la fondation MSF. Le prototype d’Antibiogo (logiciel maintenant cédé à Médecins Sans Frontières et Google), a remporté, parmi 2602 candidats, le premier prix du Google.org AI Impact Challenge. C. Ambroise a supervisé ce projet et participé au développement pendant trois ans.
* **2016- : ANR MemoDeep** Responsable Lamme : Ambroise Christophe, Description : Methods and Models for Deep Screening of subphenotypes in Parkinson’s Disease avec une équipe INSERM de Toulouse, une équipe de l’institut du cerveau et de la moelle.
* **2016- : CIFRE bioptimize** Responsable Lamme : Christophe Ambroise, Description : Développements méthodologiques autour des modèles mixtes additifs généralisés pour la recherche de signature moléculaires de cancer du sein triple négatif.
* **2015- : France social security** Responsable Lamme : Guilloux Agathe, Description : Machine Learning applied to healthcare databases avec Ecole polytechnique (Caisse Nationale d’Assurance Maladie, CNAM).
* **2015- : CIFRE PwC** Responsable Lamme : Guilloux Agathe, Description : Machine Learning applied to the insurance sector avec Sorbonne Univ.
===== Anciens membres =====
Les anciens membres sont ordonnés des plus récents aux plus anciens.
^ Nom ^ Fonction ^ Lien ^
| Edmond Sanou | Post-doc at CEA | [https://desanou.github.io/] |
| Antoine Bichat | Statistician at Servier | [https://abichat.github.io/] |
| Arthur Frouin | Institut Pasteur | [https://research.pasteur.fr/fr/member/arthur-frouin/] |
| Florent Guinot | Data Scientist chez Roche | [https://institut.roche.com/fr/membre/florent-guinot/] |
| Virginie Stanislas | Biostatistician at Universitätsklinikum Freiburg | [https://www.linkedin.com/in/virginie-stanislas/?originalSubdomain=de] |
| Jean-Michel Bécu | Ingénieur innovation - Data scientist chez ACOEM group | [https://www.linkedin.com/in/jean-michel-b-9ba03245/] |
| Alia Dehman | Senior Biostatistician chez COMAC Médical | |
| Marine Jeanmougin | Lead EU Affairs & Digital Innovation | [https://oslocancercluster.no/marine] |
| Ludivine Obry | Post-doctoral researcher au CNAM | |
| Arnaud Liehrmann | Postdoc à Sorbonne Université UMR 7238 - Biologie Computationnelle et Quantitative | |
| Liudmila Pishchagina | Thèse soutenue au LaMME en 2024 | |
| Halaleh Kamari | Directrice recherche et développement chez Groupe Neper | [https://www.researchgate.net/profile/Halaleh-Kamari] |
| Camille Nevoret | Directrice adjointe Biostatistique à CEMKA | |
| Sarah Lemler | MCF CentraleSupelec | [https://research.centralesupelec.fr/sarah.lemler/] |
| Claudine Devauchelle | PR Université d’Angers | [https://www.researchgate.net/profile/Claudine-Landes-Devauchelle] |
| Etienne Birmelé | PR, Université de Strasbourg | [https://irma.math.unistra.fr/~birmele/] |
| Gregory Nuel | DR CNRS LPSM, CNRS 8001 | [https://nuel.perso.math.cnrs.fr/] |
| Catherine Matias | DR CNRS LPSM; CNRS 8001 | [https://scai.sorbonne-universite.fr/public/profiles/view/6d5dc20f4902229fd347/105] |
| Franck Picard | ENS Lyon, DR CNRS | [https://franckpicard.github.io/] |
| Marius Kwemou | Senior Data Scientist| |
| Mickael Falconnet | Professeur agrégé à Bordeaux | [https://www.linkedin.com/in/mikael-falconnet-91490999/?originalSubdomain=fr] |
| Edith Le Floch | Ingénieur Chercheur CEA | [https://cnrgh.fr] |
| Pierre Latouche | PR Université Clermont Auvergne + IUF | [https://lmbp.uca.fr/~latouche/] |
| Vincent Miele | Ingénieur de recherche à Grenoble | [https://vmiele.gitlab.io/] |
| Sophie Lèbre | MCF à l’université Paul Valéry à Montpellier | [https://www.univ-montp3.fr/miap/~lebre/] |
| Mikael Guedj | Head of Biometrics, Data & Decision Sciences chez Nanobiotix | |
| Sophie Pasek | MCF au L’Institut de Systématique, Évolution, Biodiversité UMR 7205 | |
| Hugues Richard | Research scientist, Bioinformatics Unit (MF1) Robert Koch Institute, Berlin, Germany | [http://www.lgm.upmc.fr/hrichard/] |
| David Robelin | INRAe Ingénieur | |
| Yousri Slaoui | MCF à l’Université de Poitiers | [http://www-math.univ-poitiers.fr/~yslaoui/] |
| Agathe Guilloux | Research director at INRIA-INSERM team HeKA | [https://sites.google.com/view/agatheguilloux-personalwebsite/] |
| Geneviève Robin | Director of Exploratory Research at Owkin | |
| Pierre Neuvial | CNRS researcher (DR) in Statistics, Institut de Mathématiques de Toulouse | |
| Salim Amoukou | Senior AI Research Scientist chez J.P. Morgan AI Research | [https://salimamoukou.github.io/] |
| Marie Courbariaux | Ingénieur de recherche en apprentissage statistique chez SUMMIT | [https://www.linkedin.com/in/marie-courbariaux/?originalSubdomain=fr] |
| Marco Pascucci | Assistant Professor American University of Paris | [https://www.aup.edu/profile/mpascucci] |
| Bernard Prum | | |
| Perrine Chassat | Postdoctoral Researcher at Inria Paris (HeKA) in Machine Learning | [https://www.researchgate.net/profile/Perrine-Chassat] |
| Julien Chiquet | DR INRAe MIA Paris | [https://jchiquet.github.io/] |
===== Publications =====
La liste suivante de publications est extraite automatique de HAL. Elle n'est pas complète, partiellement fausse. Pour une liste plus fiable considérer la page de chacun des membres.
team:SG