Bio-informatique et big data

Bio-informatique et big data

Bio-informatique et big data

Bioinformatique

Les plateformes de bioinformatique et les centres de service de l’Alliance ont permis le développement de compétences originales au sein des équipes de recherche. Des projets d’observatoires génomiques originaux sont lancés en Méditerranée et en Manche, grâce aux données d’observation et de génomique.

La plateforme ABIMS de la station de Roscoff propose des activités de service (e-infrastructure, ingénierie logicielle et bio analyse) et de recherche en bioinformatique. Elle est ouverte à l’ensemble de la communauté des sciences du vivant.  C’est l’une des plateformes de l’institut français de bioinformatique et contributrice majeure au NNCR (National Network of Computing Resources) de l’IFB. La plateforme est également un centre de données et de données du pôle Odatis de l’infrastructure DataTerra.

Sur le campus Pierre et Marie Curie de la faculté des Sciences et Ingénierie, l’Institut des sciences du calcul et des données (ISCD) constitue une ressource de calcul qui fonctionne sur appels d’offres.

Au Muséum Nationale d’Histoire Naturelle l’unité mixte de service (UMS 2700) Acquisition et Analyse de Données pour l’Histoire Naturelle propose une plateforme de calcul intensif pour la bioinformatique avec un supercalculateur modulaire. Cette infrastructure est mise à la disposition de la communauté scientifique.

Des compétences fortes en bioanalyse sur les systèmes marins ont été développées dans les stations marines de l’Alliance ainsi que les unités de recherche « Biologie des Organismes et Ecosystèmes Aquatiques » (BOREA), « Institut de Systématique, Evolution, Diversité » (ISYEB), « l’Atelier de Bioinformatique » (ABI), et « l’Institut de Recherche Physico-Chimique » (IBPC),

Big Data

L’évolution des volumétries et la diversification des données dans les domaines de l’écologie ou de la génomique soulèvent des questions communes à tous les acteurs de l’Alliance :

  • Le transport et le stockage des données
  • Le transport des données pour les objets connectés, par exemple les bouées
  • La proximité entre les centres de génération des données et les centres de leur traitement
  • Les infrastructures de traitement et de stockage des données
  • La fairification des données et des traitements
  • La traçabilité
  • La reproductibilité des traitements
  • L’interopérabilité des données

Ces problématiques impliquent des travaux communs avec des spécialistes de l’intelligence artificielle et du calcul intensif, la mise en place d’un plan de gouvernance des données.