Plateforme South Green de bioinformatique

Date de mise à jour : 18 juin 2024

Cette plateforme est dédiée à la bioinformatique appliquée à la génétique et à la génomique des plantes tropicales et méditerranéennes d'intérêt agronomique. C’est un réseau de bioinformaticiens qui propose des méthodes innovantes et des ressources de calcul et de stockage des données. Elle regroupe des équipes et des infrastructures matérielles de Montpellier issues de Bioversity International, CIRAD, INRAE, L'Institut Agro et IRD. Une grande partie de ses ressources provient de l’UMR Agap Institut (Amélioration génétique et adaptation des plantes méditerranéennes et tropicales).

Objectifs

Le plateforme South Green a pour objectifs :

  • Promouvoir les outils originaux issus de la recherche méthodologique du réseau.
  • Proposer un portail Web unique pour l’accès aux outils développés par le réseau.
  • Promouvoir les échanges et les développements collaboratifs au sein du réseau.
  • Promouvoir l’interopérabilité des applications développées au sein du réseau.
  • Proposer des formations pour les biologistes et les bioinformaticiens.
  • Assurer la maintenance et l’évolution, des infrastructures et des applications logicielles via des demandes de financements en partenariat, dans le cadre d’appels d’offre de type plate-forme.
  • Promouvoir la démarche qualité au sein du réseau.
  • Assurer le lien avec l’IFB (Institut Français de Bioinformatique) et Renabi (Réseau national des plates-formes bioinformatiques).

Savoir-faire

La plateforme assure :

  • Le développement de méthodes et outils originaux pour l’analyse des données moléculaires dans les domaines de l’annotation des génomes et des transcriptomes, de la phylogénie, du génotypage par séquençage,…
  • Le développement de hubs par espèce végétale (Banana genome hub, Coffee genome hub,..)où sont regroupées et rendues interopérables les applications utiles pour l’étude des génomes.
  • des formations spécialisées en bioinformatique (analyse des séquences biologiques,  Galaxy) et informatique (logiciel R, Perl, Linux) pour les biologistes et les étudiants.

Equipements et installations

Calcul scientifique

1328 coeurs de calcul sont répartis en :

  • 23 Nœuds de calcul : Haswell 2680v3 : 24 cœurs physiques 48 Cœurs logiques 192 Go RAM
  • 1 Nœud dédié à R-Studio (et autres logiciels au fonctionnement particulier) :  Xeon E7-4820 32 cœurs physiques , 1 To RAM
  • 2 Nœuds BigMem pour les calculs demandant beaucoup de mémoire vice : 1 noeud Xeon E7-4830 v3 48 cœurs physiques 96 cœurs logiques, 2.6 To RAM et 1 noeud Xeon Gold 6136 48 cœurs physiques 96 cœurs logiques, 3 To RAM

Tous ces noeuds de calcul sont interconnectés en Infiniband 40 Gb/sec

Gestion des connexions et des calculs

  • 1 Nœud de Login : Haswell 2680v3 : 24 cœurs physiques 48 Cœurs logiques 128 Go RAM
  • 2 Nœuds d' I/O : Intel E52609v2 : 4 / 8 cœurs 64 Go RAM

Stockage des données scientifiques

  • Espace temporaire : Scratch GPFS : 350 To RAID 6 sans backup pour l’écriture de fichiers temporaires. Au delà d’un certain délai, les fichiers sont effacés
  • Stockage longue durée : GPFS : 815 To RAID 6 avec 11 SSD de 800 Go, sécurisation par snapshot. Chaque utilisateur dispose de 1 To. Pour les volumétries supérieures, la signature d’une convention est nécessaire et implique un paiement
  • Plateforme de virtualisation pour l’hébergement des sites web et la gestion des bases de données (VM Virtual Machine)
  • 20 VM pour les services web et les BdD

La recherche de fiabilité du service et la satisfaction des utilisateurs ont conduit l’équipe ID a formaliser une démarche qualité qui a conduit l’AFNOR a certifié le plateau en mars 2013 (ISO 9001 : 2008). Pour utiliser ces ressources, vous trouverez la charte d’utilisation et les informations nécessaires sur le site SouthGreen.

Date de mise à jour : 18 juin 2024