En naviguant sur notre site vous acceptez l'installation et l'utilisation des cookies sur votre ordinateur. En savoir +

Menu Logo Principal Université Clermont Auvergne

UMR GDEC

UMR 1095 Génétique Diversité et Ecophysiologie des Céréales

Aspect fonctionnel de la recombinaison : caractérisation des gènes impliqués dans la recombinaison

Introduction à l’aspect fonctionnel

La quasi-totalité des espèces végétales a subi, au cours de l’évolution au moins un voire plusieurs évènements de duplication complète du génome (whole genome duplication WGD). La redondance des gènes créée par la WGD suivant la polyploïdisation est effacée par une élimination massive bien qu’incomplète des gènes dupliqués appelée « fractionnement ». Certains gènes semblent retenus de façon itérative après les évènements successifs de duplication (Seoighe and Gehring (2004) Trends Genet 20 : 461-464) alors que d’autres reviennent sous forme de singleton et sont en quelque sorte résistants à la duplication (Paterson et al. (2006) Trends Genet 22 : 597-602). Ainsi, moins de 5% des gènes méiotiques restent à l’état dupliqué chez Arabidopsis après la dernière WGD (?) alors que 25% des gènes en moyenne apparaissent en deux copies (E Jenczewski, travaux non publiés). La même tendance est observée chez le riz (Freeling (2009) Annu Rev Plant Biol 60 : 433-453) et ces données convergentes suggèrent qu’au fil de l’évolution, ces gènes soient devenus plus sensibles aux duplications et que la suppression des copies additionnelles des gènes méiotiques après des WGD pourrait faire partie d’un programme de régulation adaptatif mis en place pour ne conserver qu’une copie de ces gènes (Paterson et al. (2006) Trends Genet 22 : 597-602). Cela suggèrerait donc qu’au moment des phases précoces de polyploïdisation, des mécanismes interviennent pour éliminer ou éteindre les copies redondantes spécifiquement pour ces gènes. Or, nous n’avons aucune idée précise si ce processus est généralisable à tous les polyploïdes ni s’il existe des patrons de rétention et/ou délétion et d’expression pour les gènes méiotiques qui permettraient de mettre en place une « boîte à outils » de copies de gènes essentielles à un bon déroulement de la méiose. Des analyses complémentaires doivent donc être conduites pour tester si les gènes méiotiques sont « résistants » aux WGD. Les résultats préliminaires (E Jenczewski, travaux non publiés) tendent à montrer que c’est le cas mais il est nécessaire d’approfondir la question afin de comprendre si c’est une tendance généralisable à tous les gènes méiotiques et si cette perte de copies est une réponse rapide à la polyploïdisation comme cela a pu être montré sur des séquences anonymes (Feldman et al (1997) Genetics 147 : 1381-1387). Les enjeux scientifiques sont donc de vérifier si les gènes méiotiques sont plus souvent présents (ou fonctionnels) sous forme de simple copie, s’ils sont soumis à une régulation d’expression précoce au cours de la polyploïdisation et si cette régulation est la même pour différents gènes (mêmes copies éteintes, même stade) ce qui suggèrerait que ce processus est commun aux différents gènes méiotiques.

Si les gènes impliqués dans la recombinaison méiotique sont relativement bien connus chez l’espèce modèle Arabidopsis (Mézard et al (2007) Trends in Genet 23: 91-99) ils le sont très peu chez le blé tendre. Seuls quelques uns ont été clonés et étudiés de façon un peu plus approfondie (Rad51, Rad51C, Rad51D, DMC1, Mre11, Rad50, Asy1). Ces travaux ont montré que les gènes de la famille Rad51 sont exprimés dans des tissus en cours de méiose et de mitose comme chez le riz et Arabidopsis (Khoo et al. (2008) Functional Plant Biology 35: 1267-1277 ; Devisetty et al. (2010) BMC Research Notes 3: 245), Rad51 étant légèrement sur exprimé en méiose par rapport à la mitose. Les profils d’expression de Rad51C et Rad51D restent en revanche identiques dans les deux processus. Pour DMC1, les trois copies homéologues sont exprimées très préférentiellement dans les tissus méiotiques avec des niveaux différents (Devisetty et al. (2010) BMC Research Notes 3: 245). Les mutations ponctuelles relevées entre les copies et impliquant un changement d’acide aminé ne semblent pas avoir d’impact sur la structure tridimensionnelle prédite ce qui suggère une fonctionnalité des trois copies. Pour Rad50 et Mre11, il y a maintien de fonction des trois copies des deux gènes mais elles ne sont pas exprimées au même niveau ce qui suggère un silencing en cours des copies les moins exprimées (De Bustos et al. (2007) Theor Appl Genet. 114: 985-999 ; Perez et al. (2010) TAG doi:10.1007/s00122-010-1440-4). Il n’y a pas de spécificité génomique concernant les interactions entre Rad50 et Mre11 et les interactions peuvent avoir lieu entre des copies issues de génomes différents ce qui garantit la formation du complexe MRN dans tous les cas. Pour Asy1, les études ont porté sur l’impact de la mutation ph1 sur son activité (Boden et al. (2007) Plant J 57: 487-497) et les résultats suggèrent qu’Asy1 est nécessaire pour promouvoir les interactions entre chromosomes homologues et que le gène Ph1 a une activité régulatrice sur celui-ci. Les mutants asy1 pourraient ainsi être utilisés dans l’introgression de gènes à partir d’espèces apparentées. Enfin, une étude transcriptomique conduite à large échelle en utilisant une puce Affymetrix constituée d’un set d’environ 55 000 gènes de blé a révélé 1 350 gènes montrant une expression différentielle sur des anthères à sept stades de développement différents (pré-méiotique ; leptotène-pachytène ; diplotène-anaphase ; télophase I-télophase II ; tétrades ; pollen immature ; anthères matures ; Crismani et al (2006) BMC Genomics 7: 267). De la même façon, une étude utilisant une combinaison de génétique quantitative, de recherche de QTL et une approche basée sur de la transcriptomique a identifié une trentaine de gènes pouvant avoir un rôle dans le contrôle de la recombinaison au niveau du génome entier chez le blé tendre (Bovill et al (2009) Funct Integr Genomics 9: 219-229).
La question de recherche a donc pour objectif d’étudier si, chez une espèce polyploïde récente telle que le blé tendre, certaines des copies dupliquées (homéologues) des gènes de recombinaison : (1) sont éliminées précocement. La réponse à cette question permettra d’estimer si le retour vers un état de singleton des gènes méiotiques est un phénomène rapide dans la mesure où le blé est une espèce polyploïde récente (~10 000 ans) ou au contraire s’il s’agit d’un phénomène lent apparaissant au cours de l’évolution du fait d’une perte (ou d’un changement) de fonction progressive de certaines copies. Des études d’expressions ont estimé qu’entre 1 et 5% des gènes sont éteints rapidement, dès le premier cycle de polyploïdisation chez des blés hexaploïdes néo-synthétisés (Kashkush et al. (2002) Genetics 160 : 1651-1659) ; (2) présentent une variabilité inter-copies importante suggérant une différence de fonctionnalité. Des mutations importantes (codons stop, modification des cadres de lecture) pourraient être indicatives d’une perte de fonctionnalité pouvant amener à une pseudogénisation et/ou une élimination de la copie. Des mutations plus légères (changement mineur d’acide aminé) au contraire seront plutôt le reflet qu’elles proviennent des espèces ancêtres du blé qui sont peut être différentes ou alors le signe d’une fonctionnalité variable de la protéine (allèles plus ou moins efficaces) ou d’une possibilité d’évolution de fonction du gène ; (3) sont exprimées ou éteintes de façon différentielle suggérant une nécessité de retourner rapidement à un niveau de simple copie. Une variation dans le niveau d’expression (voire une extinction complète) des copies mise en relation avec une divergence de séquence pourra permettre de conforter l’hypothèse précédente concernant l’élimination de copies et le retour à un système de singleton pour les gènes méiotiques. Chez les blés hexaploïdes actuels, entre 8 et 26% des gènes ont au moins une copie éteinte sur les trois sans qu’il y ait un biais en fonction d’un génome particulier (He et al. (2003) Plant Mol Biol 52 : 401-414 ; Bottley et al. (2006) Plant J 47 : 897-906) ; (4) montrent une variabilité génétique corrélée avec une différence d’expression suggérant également la conservation d’une seule copie fonctionnelle chez toutes les variétés. La réponse à cette question permettra d’évaluer si certaines copies (en particulier celles le plus fortement exprimées) ne présentent jamais de variation dans des collections de variétés ce qui suggèrerait que ces copies sont essentielles au bon fonctionnement de la méiose. Au contraire, d’autres ont peut être une variabilité identique à celle que l’on peut observer dans un jeu de gènes pris aléatoirement (données disponibles au laboratoire ; Ravel et al. (2006) Génome 49 : 1131-1139) ce qui pourrait suggérer une élimination à plus ou moins long terme ou une évolution de fonction.

Les grandes lignes du projet DUPLIC

Les perspectives qui s’ouvrent font suite à un projet innovant (projet POLYMERE) établi en collaboration avec E Jenczewski (INRA Versailles) et s’intègrent dans le cadre d’un programme plus vaste (projet DUPLIC financé par l’ANR, coordinateur E Jenczewski) visant à mieux comprendre comment évoluent les gènes contrôlant la recombinaison méiotique suite à des évènements de polyploïdie. En particulier, le projet prévoit d’analyser dans un premier temps les niveaux de rétention et/ou d'élimination des copies dupliquées de 18 gènes responsables de la formation des CO chez deux espèces polyploïdes récentes (environ 10 000 ans) d'intérêt économique, le blé (Triticum aestivum) et le colza (Brassica napus). Dans un second temps, et après avoir obtenu la séquence complète de chaque copie de chaque gène, le projet a pour but de chercher à comprendre, pour un sous-ensemble de 7-8 d’entre eux, si les copies héritées des espèces parentales du blé et du colza sont toutes exprimées et fonctionnelles. Cette étude amènera à définir un nouveau sous-ensemble de 3-4 gènes pour lesquels la fonction sera étudiée plus en détail, en recherchant et en phénotypant des mutants pour définir si les copies dupliquées présentent toujours des fonctions redondantes ou si au contraire elles se sont diversifiées. Dans le cas où des mutants ne seraient pas identifiés, ceux-ci seront créés par transgénèse (extinction de fonction par RNAi). Enfin, il est prévu d’analyser les niveaux de diversité nucléotidique et les patrons d'évolution moléculaire des copies de 7-8 gènes au sein de collections de variétés élites ou anciennes.

a. Analyse bioinformatique des gènes méiotiques

L’objectif de ce projet est d’utiliser l’information de séquences complètes de génomes qui ne cesse de croitre dans les bases de données (17 génomes de plantes séquencés dont huit depuis deux ans) afin d’analyser les profils d’élimination ou de rétention des copies des gènes méiotiques après les évènements successifs de duplication des génomes (WGD) qui ont jalonné l’évolution de toutes ces espèces. Pour cela, une liste d’une cinquantaine de gènes connus comme ayant une implication dans la recombinaison a été définie et les séquences complètes vont être récupérées chez les espèces modèles (arabidopsis, riz, levure, Caenorabditis, humain) et comparées aux séquences de tous les génomes végétaux connus afin de mesurer le taux de rétention des copies dupliquées. Le résultat nous donnera une indication de la nécessité pour ces gènes de revenir à un état de simple copie comparativement à un jeu de gènes standard.
Pour un jeu d’une vingtaine de gènes, les séquences connues, issues des espèces modèles Arabidopsis et riz seront extraites des bases de données et comparées aux bases de séquences disponibles pour le blé telles que des séquences d’EST (http://www.ncbi.nlm.nih.gov/projects/dbEST/), la séquence shotgun du génome complet en 5X (http://www.cerealsdb.uk.net/copyright.htm) récemment mise à disposition par le BBSRC, la séquence en shotgun des bras de chromosomes triés (disponible début 2011, http://www.wheatgenome.org/). Les séquences de blé seront ensuite assemblées en contigs (un contig par gène) et les structures des différents exons et introns seront déduites des structures connues des espèces modèles. Cela permettra de définir des jeux d’amorces dans les zones les mieux conservées (exons) permettant d‘amplifier les gènes sur toute leur longueur.

b. Profil de rétention des gènes méiotiques chez le blé

Un jeu d’une vingtaine de gènes va être analysé plus en profondeur. En particulier, nous nous attacherons à isoler les trois copies homéologues de ces gènes lorsqu’elles sont présentes chez le blé et nous les séquencerons afin d’identifier des mutations spécifiques de chaque copie. Les couples définis précédemment (cf. § 5.a) serviront pour cribler une banque de grands fragments (Chinese Spring) organisée en pools (6X de couverture) pour identifier et séquencer les trois copies homéologues de chaque gène. Les produits d’amplification issus du crible de la banque de grands fragments seront séquencés. Compte tenu de la couverture (6X) nous attendons en moyenne 18 produits d’amplification par gène (6X x 3 copies). Les produits d’amplification de chaque gènes seront également utilisés comme sonde pour cribler la banque BAC Chinese Spring par hybridation afin de s’assurer que des copies partiellement délétées ou fortement mutées de gènes ne sont pas présentes. Toutes les séquences des produits d’amplification seront ensuite comparées de façon à identifier des mutations ponctuelles (SNP) spécifiques des copies homéologues. Des résultats préliminaires indiquent qu’elles sont relativement fréquentes (en moyenne une toutes les 25 pb) en particulier dans les introns. Des amorces spécifiques de chaque copie seront définies de façon à observer un produit d’amplification génome spécifique. Après validation des couples d’amorces les plus pertinents, les copies de chaque gène seront cartographiées sur les chromosomes par assignation en utilisant les stocks de lignées aneuploïdes (lignées nulli-tétrasomiques, ditélosomiques, de délétion). Les résultats d’assignation seront exploités pour évaluer l’origine des copies (présence dans des zones dupliquées ancestrales ou sur un chromosome ancêtre commun) et définir le patron de rétention/délétion de ces quatre gènes méiotiques chez le blé. Les résultats nous permettront de répondre à trois questions : (1) les trois copies homéologues sont-elles conservées ou au moins une copie est-elle systématiquement éliminée ? (2) les séquences des copies homéologues sont-elles très variables et les mutations observées sont-elles indicatives d’une perte de fonctionnalité ? (3) l’assignation sur les chromosomes permet-elle de définir une histoire évolutive des gènes méiotiques et certains ont-ils des ancêtres communs ayant divergé

c. Analyse d’expression des gènes méiotiques

La plupart des études d’expression des gènes chez le blé montre qu’il existe une différence entre les copies homéologues. Les gènes méiotiques n’échappent vraisemblablement pas à cette règle sans que l’on puisse en définir l’ampleur. Les gènes pour lesquels des amorces génomes-spécifiques auront pu être dessinées dans les exons seront étudiés plus en détail pour déterminer leur profil d’expression chez la lignée de référence internationale Chinese Spring. Celle-ci sera cultivée dans des conditions contrôlées en chambre de culture (production des banques ADNc en cours dans le cadre du projet DUPLIC). Les gènes ciblés s’expriment lors des phases précoces de la méiose (prophase). Le stade prophase est facilement identifiable sur des épis en cours de développement chez le blé tendre par observation au microscope d’anthères. Les anthères au même stade méiotique seront collectées après avoir vérifié le stade par observation d’une anthère d’une fleur (trois anthères/fleur). Les ARNm seront extraits à partir d’un minimum de 25 anthères (~3 mg de matériel) par stade comme décrit dans la littérature (Trizol® de Gibco BRL, Crismani et al (2006) BMC Genomics 7: 267) à cinq stades de développement (pré-méiotique ; leptotène-pachytène ; diplotène-diacinèse ; métaphase I ; anthères matures). Parallèlement, des ARNm issus de feuilles et de racines seront produits à partir des mêmes plantes au même stade afin de servir de témoin d’expression. Les ADNc seront produits par utilisation de kits commerciaux (kits SMART de CLONTECH). Les analyses d’expression seront effectuées sur PCR quantitative (LC480) à l’aide des amorces génomes-spécifiques de chaque gène. Les résultats de ces analyses permettront de vérifier s’il existe une différence d’expression des copies homéologues qui pourrait être indicative d’une évolution avec un retour progressif vers un état de singleton.

d. Analyse de la variabilité des gènes méiotiques

S’il est avéré qu’il existe en général une variabilité pour les gènes impliqués dans des processus communs à différents organes (Ravel et al. (2006) Génome 49 : 1131-1139) la question concernant les gènes méiotiques n’a jamais été abordée. Après les analyses d’expression, une étude de variabilité allélique sera donc conduite pour chaque copie de chaque gène en utilisant un échantillon de la core-collection de 372 lignées développée au sein du laboratoire (Balfourier et al. (2007) Theor Appl Genet 114: 1265-1275). Chaque copie homéologue de chaque gène sera d’abord séquencée sur un jeu de 42 lignées couvrant le maximum de la diversité de la core-collection complète (>95%) et sur les trois espèces diploïdes ancêtres du blé tendre (Ae. speltoides (BB), T. urartu (AA), Ae. tauschii (DD)). Les séquences seront comparées à celle de référence issue de Chinese Spring afin d’analyser si des différences existent, en particulier au niveau des copies les moins exprimées. Les SNP identifiés sur ce jeu de lignées seront ensuite validés sur la collection complète (372 individus) en utilisant le système KASPAR sur PCR micro-fluidique (Fluidigm) disponible sur la plate-forme de génotypage GENTYANE. Les résultats nous permettront d’estimer si la diversité observée sur la collection complète est focalisée uniquement sur les copies les moins exprimées chez Chinese Spring ou si elle concerne l’ensemble des copies. Cela permettra de répondre à la dernière question concernant la sélection préférentielle d’une seule et même copie fonctionnelle chez toutes les variétés. A plus long terme et en étendant l’analyse à plus de gènes, cela permettra d’envisager des plans de croisements entre les cultivars représentatifs de chaque groupe haplotypique pour estimer les valeurs d’aptitude générale et spécifique à la combinaison (AGC et ASC) et développer des variétés qui recombinent mieux.
De plus, la disponibilité d’une collection de mutants de radiation nous permettra de rechercher si certains individus présentent une mutation au niveau des copies les plus exprimées et si cette mutation induit un phénotype méiotique anormal ou si au contraire, les copies surnuméraires sous exprimées en conditions normales sont réactivées du fait de l’extinction de la copie principale. Au cas où ces mutants n’existeraient pas dans la collection, il sera possible de les développer par transgénèse par extinction ou sur-expression de fonction sous promoteur constitutif ou spécifique.

Recherche d’autres gènes impliqués dans la recombinaison 

Afin d’identifier d’autres gènes impliquées dans l’expression de la recombinaison, deux voies sont possibles : une analyse d’expression globale et une analyse de génétique classique. Dans le premier cas, nous allons exploiter les banques d’ADNc développées pour les analyses d’expression (cf. § 5.c) et les séquencer en utilisant les séquenceurs de nouvelle génération (RNA-seq, Illumina, Roche). Nous auront ainsi une vision globale des gènes exprimés au cours de la méiose, du nombre de copies exprimées et de leur niveau d’expression pour chacune d’elle. De plus, des analyses préliminaires d’hybridation d’ADNc issus d’épi en cours de méiose sur une puce contenant un jeu de plus de 40 000 gène uniques de blé réalisées dans le cadre de la thèse de C Rustenholz révèle que plus de 400 gènes sont différentiellement exprimés au cours de la méiose. Une analyse comparative de ces données avec celles générées dans le cadre d’une étude australienne (Crismani et al (2006) BMC Genomics 7: 267) montre qu’une quarantaine de ces gènes sont communs aux deux analyses dont douze ne présentent aucune homologie avec une protéine connue. Ces gènes sont donc potentiellement de très bons candidats pour une analyse plus approfondie.
La deuxième voie consiste à faire une recherche de QTL du taux de recombinaison en établissant une carte génétique sur une génération F2 et en relevant le phénotype (nombre de crossing-over sur le génome entier ou sur une zone particulière) sur la descendance F3. Par exemple, les populations F2 CsRe et CsCT utilisées précédemment pour analyser la distribution des évènements de CO montrent des taux de recombinaison différents (CsRe < CsCt d’environ 5% sur le chromosome 3B). Cela suggère donc une différence entre Ct et Re pour l’aptitude à la recombinaison. Ces deux populations semblent donc bien adaptées et pourraient donc être utilisées pour faire une recherche de QTL de taux de recombinaison avec une cartographie des gènes candidats (gènes méiotiques issus de l’analyse bioinformatique, cf. § 5.a et nouveaux gènes décrits dans le § précédent). De plus, il existe de par le monde, différentes populations pouvant également être utiles pour des analyses similaires (populations MAGIC, NAM, Métapop).