En savoir plus

Notre utilisation de cookies

« Cookies » désigne un ensemble d’informations déposées dans le terminal de l’utilisateur lorsque celui-ci navigue sur un site web. Il s’agit d’un fichier contenant notamment un identifiant sous forme de numéro, le nom du serveur qui l’a déposé et éventuellement une date d’expiration. Grâce aux cookies, des informations sur votre visite, notamment votre langue de prédilection et d'autres paramètres, sont enregistrées sur le site web. Cela peut faciliter votre visite suivante sur ce site et renforcer l'utilité de ce dernier pour vous.

Afin d’améliorer votre expérience, nous utilisons des cookies pour conserver certaines informations de connexion et fournir une navigation sûre, collecter des statistiques en vue d’optimiser les fonctionnalités du site. Afin de voir précisément tous les cookies que nous utilisons, nous vous invitons à télécharger « Ghostery », une extension gratuite pour navigateurs permettant de les détecter et, dans certains cas, de les bloquer.

Ghostery est disponible gratuitement à cette adresse : https://www.ghostery.com/fr/products/

Vous pouvez également consulter le site de la CNIL afin d’apprendre à paramétrer votre navigateur pour contrôler les dépôts de cookies sur votre terminal.

S’agissant des cookies publicitaires déposés par des tiers, vous pouvez également vous connecter au site http://www.youronlinechoices.com/fr/controler-ses-cookies/, proposé par les professionnels de la publicité digitale regroupés au sein de l’association européenne EDAA (European Digital Advertising Alliance). Vous pourrez ainsi refuser ou accepter les cookies utilisés par les adhérents de l'EDAA.

Il est par ailleurs possible de s’opposer à certains cookies tiers directement auprès des éditeurs :

Catégorie de cookie

Moyens de désactivation

Cookies analytiques et de performance

Realytics
Google Analytics
Spoteffects
Optimizely

Cookies de ciblage ou publicitaires

DoubleClick
Mediarithmics

Les différents types de cookies pouvant être utilisés sur nos sites internet sont les suivants :

Cookies obligatoires

Cookies fonctionnels

Cookies sociaux et publicitaires

Ces cookies sont nécessaires au bon fonctionnement du site, ils ne peuvent pas être désactivés. Ils nous sont utiles pour vous fournir une connexion sécuritaire et assurer la disponibilité a minima de notre site internet.

Ces cookies nous permettent d’analyser l’utilisation du site afin de pouvoir en mesurer et en améliorer la performance. Ils nous permettent par exemple de conserver vos informations de connexion et d’afficher de façon plus cohérente les différents modules de notre site.

Ces cookies sont utilisés par des agences de publicité (par exemple Google) et par des réseaux sociaux (par exemple LinkedIn et Facebook) et autorisent notamment le partage des pages sur les réseaux sociaux, la publication de commentaires, la diffusion (sur notre site ou non) de publicités adaptées à vos centres d’intérêt.

Sur nos CMS EZPublish, il s’agit des cookies sessions CAS et PHP et du cookie New Relic pour le monitoring (IP, délais de réponse).

Ces cookies sont supprimés à la fin de la session (déconnexion ou fermeture du navigateur)

Sur nos CMS EZPublish, il s’agit du cookie XiTi pour la mesure d’audience. La société AT Internet est notre sous-traitant et conserve les informations (IP, date et heure de connexion, durée de connexion, pages consultées) 6 mois.

Sur nos CMS EZPublish, il n’y a pas de cookie de ce type.

Pour obtenir plus d’informations concernant les cookies que nous utilisons, vous pouvez vous adresser au Déléguée Informatique et Libertés de l’INRA par email à cil-dpo@inra.fr ou par courrier à :

INRA
24, chemin de Borde Rouge –Auzeville – CS52627
31326 Castanet Tolosan cedex - France

Dernière mise à jour : Mai 2018

Menu Logo Principal Logo UCA

UMR GDEC

UMR 1095 Génétique Diversité et Ecophysiologie des Céréales

2. Analyse de l'espace génique

Objectif : Mieux comprendre l'organisation et l'évolution du contenu en gènes, et les relations entre structure du génome et expression

L’analyse de l’espace génique chez le blé tendre est au cœur des projets de recherche de l’équipe. Au cours des dix dernières années et grâce aux ressources génomiques uniques développées par l’équipe, notamment sur le chromosome 3B, nous nous sommes attachés à répondre à certaines questions biologiques portant notamment sur l’organisation et l’évolution de l’espace génique et les relations entre la structure du génome et l’expression des gènes.

L’annotation de la pseudomolécule du 3B a conduit à l’identification de 7 264 gènes codant des protéines, dont 5 326 avec une structure fonctionnelle et 1 938 correspondant probablement à des pseudogènes ou des fragments de gènes. Ces gènes ne sont pas distribués de façon uniforme le long du chromosome mais selon un gradient de densité du centromère vers les télomères.

La comparaison avec les génomes d’espèces apparentées (Brachypodium, le riz et le sorgho) a révélé que 27% des gènes portés par le chromosome 3B étaient en position non-synténiques et représentaient des gènes additionnels insérés par duplications inter- et intra-chromosomiques dans la lignée des Triticeae après leur divergence avec Brachypodium. Ces nouveaux gènes ne sont pas distribués de façon homogène le long du chromosome 3B. Leur proportion est plus forte dans les régions distales où plus de la moitié des gènes sont des gènes dupliqués. Dans la région centrale du chromosome, le contenu en gènes a évolué moins vite suggérant soit que les extrémités chromosomiques sont des cibles privilégiées de réarrangements, soit que les gènes nouveaux ont une plus forte probabilité d'être retenus au cours de l'évolution s'ils sont portés par ces régions.

Au-delà des questions d’organisation et d’évolution, nous nous intéressons également à la régulation de l’expression des gènes et plus précisément aux relations entre la structure du génome et l’expression génique. Grâce à des données RNAseq sur quinze échantillons d’ARNm couvrant l’ensemble du développement d’un plant de blé, nous avons mis en évidence 8 877 régions transcriptionnellement actives (TAR) dont 5 185 correspondant à des gènes prédits par TriAnnot, soit 71.4% des 7 264 prédictions. Outre les 5 185 gènes prédits, notre analyse a révélé 3 692 régions transcrites mais non annotées comme gènes codant des protéines (ou NTR), parmi lesquelles 596 longs ARN intergéniques non codants (lincRNA) potentiels. Notre analyse a mis en évidence 30 232 transcrits issus de 5 185 gènes exprimés, soit une moyenne de 5.8 transcrits par gène. Pour 38.6% des gènes, un seul transcrit a été identifié tandis que 61.4% sont sujets à épissage alternatif. Le clustering hiérarchique des transcrits a montré que dans 95% des cas, les transcrits issus d’un même gène n’avaient pas le même profil d’expression, suggérant que les isoformes pourraient avoir des fonctions complémentaires dans différents organes ou à différents stades de développement.

Une analyse fine des relations entre expression et caractéristiques structurales des gènes a permis de mettre en évidence une relation non-monotone, notamment entre le niveau d’expression des gènes et la longueur des transcrits primaires, le nombre d’exons, la taille cumulée des introns et le nombre d’isoformes. Ainsi pour des gènes exprimés à un niveau moyen, le niveau d’expression augmente avec ces caractéristiques structurales tandis que pour des gènes à expression forte, la relation s’inverse et ces caractéristiques diminuent lorsque le niveau d’expression augmente. Deux modèles complémentaires peuvent expliquer ce phénomène : la « sélection pour l’économie » et le « dessin génomique » (Eisenberg and Levanon, 2003; Vinogradov, 2004; Vinogradov, 2006; Woody and Shoemaker, 2011). Ainsi si la structure d’un gène est déterminée par sa fonction, l’expression des différents transcrits qui en sont issus est sujette au coût énergétique associé.

Une analyse de segmentation des caractéristiques structurales et fonctionnelles de gènes (densité, niveau et amplitude d’expression, taille des transcrits primaires, nombre d’exons, taille cumulée de introns et nombre d’isoformes) combinées avec des données de recombinaison et de contenu en éléments transposables révèle un partitionnement génomique du chromosome 3B en cinq régions : deux régions distales R1 et R3 de 68 et 59 Mb, respectivement, une région péricentromérique C de 122 Mb et deux régions intermédiaires R2a et R2b, de 197 et 328 Mb, respectivement. Les régions distales se distinguent par une plus forte densité en gènes, des gènes plus courts, avec moins de transcrits alternatifs, un niveau et une amplitude d’expression plus faibles. A cela s’ajoute en enrichissement en gènes impliqués dans des fonctions adaptatives telles que la réponse aux stresses biotiques ou abiotiques. A l’inverse, la région péricentromérique contient moins de gènes, des gènes plus longs, exprimés plus fortement et de façon constitutive et impliqués dans des processus de base de la cellule. Cette observation associée à la présence d’un grand nombre de gènes non-synténiques suggère fortement une évolution accélérée du génome de blé dans les régions distales des chromosomes, évolution liée à l’adaptation de l’espèce ou de l’individu.

 

Projet

 

Si le génome a longtemps été considéré comme stable et équivalent entre individus d’une même espèce, des études récentes menées chez l’humain mais également sur des espèces végétales telles qu’Arabidopsis, le maïs, le soja, l’orge, la pomme de terre et le riz ont mis en évidence des centaines de variations structurales intra-spécifiques impliquant plusieurs mégabases de séquences Le terme « variations structurales » fait référence à des altérations génomiques se caractérisant notamment par des délétions, des insertions de nouvelles séquences (y compris des éléments transposables), des duplications en tandem ou dispersées, des inversions et des translocations (Alkan et al., 2011). Les termes « variations du nombre de copies » (CNV) ou « variations de type présence – absence » (PAV) sont souvent utilisés pour faire référence à une modification du nombre de copies d’une séquence (Marroni et al., 2014). La découverte de ces variations structurales a amené à la conclusion qu’une séquence de référence d’un individu unique ne pouvait en aucun cas être représentative de l’ensemble d’une espèce et qu’une étude à l’échelle de la population était nécessaire pour être en mesure de caractériser un génome. Par voie de conséquence, ils ont également conduit à revoir la notion de génome (Morgante et al., 2007; Marroni et al., 2014). Les gènes présentant des PAV entre individus et donc potentiellement non essentiels pour la survie vont définir le « génome dispensable » par opposition au « génome de base » ou « core génome » qui, lui, contient les gènes présents chez l’ensemble des individus d’une espèce. Le « pangénome » définit quant à lui l’ensemble des gènes retrouvés dans une espèce.

Chez le blé hexaploïde, les variations structurales peuvent apparaître à trois niveaux : (1) entre génomes homéologues ; (2) entre variétés différentes ; (3) à différents niveaux de ploïdie. L’accès aux premières séquences de référence nous offre aujourd’hui la possibilité d’étudier les variations structurales du génome du blé et leur relation avec l’organisation du génome. En combinant des données de génotypage et de séquençage, nous souhaitons caractériser les variations structurales existant au sein du complexe Triticum / Aegilops et ainsi de définir les notions de core génome, génome dispensable et pangénome chez le blé. En mettant ces résultats en regard des données d’organisation et d’évolution du chromosome, nous pourrons étudier les relations entre variations structurales et partitionnement et également la place des gènes non synténiques (core génome ou génome dispensable). En incluant des blés hexaploïdes, tétraploïdes et diploïdes, il nous sera possible d’étudier l’impact des sauts de ploïdie sur ces variations structurales, ainsi que le partitionnement à l’échelle de l’espèce et du complexe d’espèces.