Soutenance de thèse Xavier Argout

8 March 2017

à 14h00 à Amphithéâtre J. Alliot, Cirad, avenue Agropolis, Lavalette 34398 Montpellier Cedex 5

Le génome du cacaoyer : du décodage de sa séquence jusqu'à l'étude de gènes impliqués dans des caractères agronomiques d'intérêt.

Thèse pour obtenir le grade de Docteur.

Délivré par Montpellier SupAgro, 

Préparée au sein de l’école doctorale GAIA

et de l’unité mixte de recherche Agap

Spécialité : Biologie, Interactions, Diversité Adaptative des Plantes

Composition du jury

M. Patrick WINCKER, Chercheur-HDR, Genoscope/CEA Rapporteur
M. Christophe PLOMION, Directeur de recherche, INRA Rapporteur
M. Jacques DAVID, Professeur, Montpelier SupAgro Examinateur
M. Francis QUETIER, Professeur émérite, Univ. Evry Examinateur
Mme Claire LANAUD, Chercheur-HDR, CIRAD Directeur de thèse

Résumé

Depuis plusieurs années, les programmes de recherche chez le cacaoyer ont mis l'accent sur l'étude des bases génétiques des caractères agronomiques d'intérêt, notamment concernant la résistance aux maladies et la qualité des fèves de cacao, qui représentent deux attributs importants pour la cacaoculture et la production de chocolat. Ce travail présente, par l'exploration du transcriptome et du génome du cacaoyer, la constitution de ressources moléculaires et l'analyse des voies de biosynthèse impliquées dans plusieurs de ces caractères agronomiques d'intérêt.

L'étude du transcriptome a permis l'identification de plusieurs dizaines de milliers de gènes exprimés dans divers organes et pour différentes conditions environnementales et ont fourni de nombreux marqueurs moléculaires qui ont été utilisés pour réaliser des cartes génétiques haute densité. Les informations apportées par ce travail ont permis d’engager le séquençage du génome de la variété Criollo du cacaoyer. Son analyse et son annotation ont apporté un ensemble d'informations biologiques cruciales, depuis le catalogue des gènes et éléments mobiles jusqu'aux aspects évolutifs qui a révélé une structure du génome peu remanié par rapport à l'ancêtre commun aux dicotylédones. Par la suite, les travaux que nous avons menés pour améliorer la séquence complète ont conduit à une réduction considérable de la fragmentation chromosomique observée dans la première version. Par ailleurs 97% de la séquence assemblée et 99% des gènes sont désormais ancrés sur les chromosomes du cacaoyer.

Pour commencer à exploiter cette nouvelle séquence du génome, nous avons conduit une étude QTL à partir d'une descendance entre Trinitario implantée en Guyane, permettant de localiser les régions génomiques impliquées dans la variation de la couleur des fèves de cacao. En s'appuyant sur la version améliorée du génome du Criollo, nous avons identifié deux gènes potentiellement impliqués dans la voie de biosynthèse des anthocyanines et flavonoïdes dans la principale région génomique concernée. Un des deux gènes, situé proche du marqueur situé au pic du QTL et codant pour une chalcone synthase, semble être un gène candidat prometteur. L'étude comparative de sa structure dans le génome du Criollo (à fève blanche) et du génome de l'Amelonado (à fève violette) a mis en évidence des différences structurales pouvant être à l'origine d'une modification fonctionnelle.

L'ensemble des résultats présentés dans ce travail de thèse apporte une connaissance et des outils variés qui peuvent être exploités par de multiples approches intégrées pour étudier la génétique du cacaoyer.

Mots clés: Theobroma cacao (L.), transcriptome, génome, cartographie génétique, assemblage, gènes candidats

Abstract

For several years, cocoa research programs have focused on studying the genetic basis of agronomic traits of interest, especially for disease resistance and quality of cocoa beans, two important attributes for cocoa farmers and chocolate production. This work presents, by exploring the transcriptome and cocoa genome, the constitution of molecular resources and the analysis of biosynthesis pathways involved in several of these agronomical traits.

The transcriptome study allowed the identification of several tens of thousands of genes expressed in various organs and for different environmental conditions and provided numerous molecular markers, used to produce high-density genetic maps. The information provided by this work led to the genome sequencing of a cocoa Criollo variety. Its analysis and annotation have provided a set of crucial biological information, from the catalog of genes and transposable elements to evolutionary aspects, which revealed a close evolutionary relationship to the eudicot putative ancestor, showing a limited number of recombination between ancestral chromosomes. Subsequently, the work we carried out to improve the complete sequence led to a considerable reduction of the chromosomal fragmentation observed in the first version. In addition, 97% of the assembled sequence and 99% of the genes are now anchored on the cocoa chromosomes.

To exploit this new sequence of the genome, we conducted a QTL study from a progeny between Trinitario clones established in French Guiana, allowing to identify genomic regions involved in color trait variation observed in cocoa beans. Based on the improved version of the Criollo genome, we identified two genes potentially involved in the biosynthesis pathway of anthocyanins and flavonoids in the main genomic region concerned. One of the two genes is located nearby the QTL peak and encoding a chalcone synthase, appears to be a promising candidate gene. The comparative study of its structure in the Criollo genome (white bean) and in the Amelonado genome (purple bean) revealed several variations that could be responsible for functional modifications.

The results presented in this thesis provide a variety of knowledge and tools useful to conduct multiple integrated approaches to studying cocoa tree genetics.

Keywords : Theobroma cacao (L.), transcriptome, genome, genetic map, assembly, candidate genes