Les objectifs du groupe BioLabs sont de découvrir les mécanismes qui gouvernent la régulation épigénétique chez les humains et les animaux, et d'identifier le rôle de ces mécanismes dans la différenciation et le vieillissement des cellules. Nous développons de nouveaux algorithmes et de nouvelles méthodes pour l'analyse des données expérimentales, élaborons des pipelines et des outils informatiques évolutifs, et travaillons en collaboration avec des biologistes dans le cadre de diverses études sur le vieillissement.
Longitudinal analysis of human aging
Le vieillissement est associé à un ralentissement des fonctions physiologiques, une plus grande vulnérabilité aux maladies, des inflammations chroniques et bien plus encore. Cependant, l'impact d'un vieillissement sain sur la programmation moléculaire des cellules est mal comprise.
Un projet commun en collaboration avec le laboratoire Maxim Artyomovde la Washington University à St.Louis, nous permettra de comprendre le vieillissement humain à tous les niveaux, du niveau moléculaire au niveau organique en passant par les fonctions propres aux organes, en opérant une caractérisation complète et une analyse des systèmes à partir de jeux de données multi-omniques à grande échelle. Ces jeux de données inclut des transcriptomiques mono-cellulaires et en masse, l'épigénomique, la métabolomique, la protéomique, les tests sanguins cliniques et autres. L'objectif ultime est d'identifier les facteurs majeurs de vieillissement humain au moyen de données longitudinales bien contrôlées.
Ce groupe crée de nouvelles méthodes et met en place des pipelines de calcul pour tous les stades d'analyse des données expérimentales. Notre expertise en bio-informatique, machine learning et développement logiciel nous permet d'appliquer les meilleures pratiques indispensables pour créer des pipelines robustes et évolutifs.
Principales publications :
Un système d'appel de pic polyvalent et semi-supervisé permettant de traiter un large éventail de jeux de données ChIP-seq, ATAC-seq et ATAC-seq à cellule unique qui gère de façon fiable plusieurs répliques et le bruit en exploitant les informations limitées d'annotations manuelles.
Un navigateur de génome de nouvelle génération, rapide et fiable, disposant de capacités étendues pour l'affichage des grandes sessions, le pic semi-supervisé et la fonctionnalité d'annotation. Il est intégré au SPAN Peak Analyzer.
Le système de gestion de workflow Snakemake prend en charge le plugin pour les IDE de la plateforme IntelliJ, ajoute la mise en évidence des éléments de syntaxe, la saisie semi-automatique du code, les vérifications de code à la volée et l'intégration avancée avec l'écosystème Snakemake.
Un outil d'exploration des publications scientifiques capable d'analyser la structure intellectuelle d'un champ de recherche ou d'analyser des publications similaires.Nous appliquons les méthodes bibliométriques aux graphiques de citation et les algorithmes de traitement du langage naturel à l'analyse de textes. Ce service permet de trouver les articles les plus cités, d'explorer des sujets, de visualiser des citations et des graphiques de similarité d'articles, et de générer des analyses bibliographiques automatisées.
Un algorithme de data mining hybride permettant d'explorer les dépendances masquées dans les jeux de données observationnels. Il combine la technique d'apprentissage des règles associées et la théorie de l'information pour la création automatique du diagramme d'Ishikawa, une méthode visualisation des schémas et règles complexes dans les données.