dernière mise à jour le 19/08/2014
Traduction de l’article d’Estelle Vasseur et Lluis Quintana-Murci
Résumé
Les recherches sur l’héritage de la sélection naturelle dans le génome humain se sont révélées très instructives, montrant d'importantes régions qui ont participé à notre adaptation génétique à l'environnement. Mieux encore, l’analyse minutieuse de l'intensité et du type de sélection agissant sur les gènes humains peut être utilisée pour prédire leur responsabilité dans différentes formes et sévérités de maladies humaines. Nous passons ici en revue les progrès de la génétique des populations pour comprendre les effets de la sélection, en forme et en intensité, sur la diversité de notre génome. Nous donnons quelques exemples remarquables et solides de gènes et fonctions biologiques soumises à de fortes pressions alimentaires, climatiques ou d'agents pathogènes. Nous explorons également les liens possibles entre cancer et sélection naturelle, un sujet qui a été largement négligée parce que le cancer est généralement considéré comme une maladie d'apparition tardive. Enfin, nous voyons comment l'incidence de certaines maladies de nos sociétés modernes peut être un sous-produit d’adaptations récentes à d'autres forces sélectives et aux changements des modes de vie. Cette perspective illustre ainsi la valeur d'une approche de génétique des populations pour mieux comprendre les mécanismes biologiques qui ont joué un rôle évolutif majeur sur les modes d’adaptation génétique des humains aux différents environnements et modes de vie au fil du temps.
Introduction
Notre compréhension de la diversité du génome humain s'est considérablement améliorée ces dix dernières années. La séquence complète du génome humain, publié en 2001, nous a fourni des informations sur l'emplacement et la structure des gènes, mais il n'a guère amélioré notre compréhension de la diversité du génome humain au niveau des populations. Un certain nombre de consortiums internationaux ont, depuis, étudié les différences génétiques entre, d’une part, individus de la même population et, d’autre part, entre les différentes populations du monde entier. Le projet « International HapMap », basé sur des technologies de génotypage et, plus récemment, le projet « 1000 génomes », basé sur un séquençage de nouvelle génération, ont apporté une contribution énorme à l'identification et la caractérisation des différents types de variation pour les populations du monde entier. Par exemple, le projet « HapMap », a catalogué à la fois les fréquences alléliques et leurs niveaux d’association génétique (évaluée en mesurant le déséquilibre de liaison, LD) dans plusieurs populations, pour 3,5 millions polymorphismes nucléotidiques (SNP). Le projet « 1000 génomes » a décrit l'emplacement et la fréquence allélique d'environ 15 millions de SNPs, 1 million de courtes insertions et suppressions, et 20 000 variantes structurelles. Fait intéressant, les données suggèrent que chacun de nous porte 250 à 300 variantes de perte de fonction de gènes connus et que nous sommes hétérozygotes pour 50 à 100 variantes connues pour être impliquées dans des maladies génétiques.
Ces ensembles de données sur la variation génétique humaine en santé ont également été très utiles pour la conception des « genome wide association studies » (GWAS) sur de multiples maladies humaines. Fin 2011, plus de 1 500 GWAS avaient été publiés sur 249 caractères ou maladies aussi variées que la taille, la couleur des cheveux, l'obésité, le tabagisme, la schizophrénie, le cancer colorectal ou le cancer de la vessie. Ces GWAS ont apporté une contribution majeure à la compréhension du fondement génétique de variations phénotypiques aussi bien chez les personnes saines que chez les malades, en identifiant les variantes génétiques associés aux variations d’aspect, de sensibilité, de sévérité des maladies et de leur réponse au traitement.
Approche évolutionniste et génétique des populations
Divers facteurs façonnent la diversité du génome humain à l'échelle d’une population et peuvent contribuer à la variation phénotypique. Mutations et recombinaisons créent et remanient la diversité dans les chromosomes. D'autres facteurs, tels que les processus démographiques et le comportement culturel des populations humaines, peuvent ensuite affecter les fréquences alléliques en leur sein. Dans ce contexte, les études génétiques et archéologiques ont toutes deux confirmé l’origine Africaine de tous les êtres humains, et confirmé la thèse de dispersion du « out of Africa » pour Homo Sapiens.
Toutefois, la colonisation de nouvelles régions géographiques ont exposé les populations humaines à différents environnements climatiques et nutritionnels, à différentes ressources et différents types de pathogènes. Tous ont agi comme des forces sélectives, auxquelles les populations humaines ont dû s’adapter pour survivre.
Cela nous amène précisément au concept de sélection naturelle : les variantes génétiques augmentant l’adaptation ont été conservées et ont vu leur fréquence augmenter, tandis que les variantes délétères ont été rapidement éliminées.
Les recherches sur l'héritage des événements sélectifs du passé, au sein du génome humain et sur la manière dont ces événements ont façonné notre diversité génétique actuelle, se sont révélées particulièrement instructives, en repérant des régions fonctionnellement importantes du génome.
En effet, savoir pourquoi et comment la sélection a ciblé des gènes particuliers pour l'espèce humaine dans son ensemble, ou pour des populations spécifiques, constitue un excellent moyen d’identifier les gènes qui ont joué (et probablement continuent à jouer) un rôle essentiel à notre survie et de les distinguer des gènes à plus grand degré de redondance. En outre, cette dissection génétique des populations facilite l'identification des gènes susceptibles d'être impliqués dans de rares et graves maladies mendéliennes et améliore la distinction entre ces gènes et ceux qui sont impliquées dans une susceptibilité plus complexe aux maladies. Dans l'ensemble, cette approche améliore notre compréhension de la façon dont les événements sélectifs du passé ont contribué aux divergences actuelles dans la susceptibilité/résistance aux maladies.
La sélection naturelle agit sous différentes formes
La sélection naturelle peut prendre de nombreuses formes et agir avec des intensités différentes. Le type le plus courant de sélection naturelle est probablement la sélection dite « purificatrice » ou « négative » qui peut affecter la plupart des gènes, à divers degrés. Cette sélection diminue la fréquence des mutations qui s'avèrent défavorable à leurs porteurs dans un environnement donné. La vitesse de disparition de ces mutations est proportionnelle à leur intensité délétère. Si les effets sont très nuisibles aux porteurs, ou même mortels, la variante est vite purgée par une forte sélection purificatrice. La suppression fréquente des variantes délétères peut également entraîner la suppression occasionnelle de variantes neutres qui leur sont liées (particulièrement dans des régions à faible recombinaison), un phénomène appelé sélection de fond (background selection). Les gènes soumis à ce type de sélection ont généralement un déficit important de mutations non-synonymes. Ces gènes peuvent alors jouer un rôle néfaste chez l'hôte, avec peu ou pas de substitutions tolérées d'acides aminés. Dans ce cas, l'apparition de nouvelles variantes d'acides aminés peut entraîner de graves Maladies mendéliennes. La sélection purificatrice est évidemment plus faible pour les mutations moins délétères. Ceci permet à ces mutations de subsister dans la population et d'être maintenues à une faible fréquence. Dans ce cas, un excès d'allèles de basse fréquence est généralement observé pour le gène concerné, sans signature visible. Les gènes sous faible contrainte sélective semblent avoir des fonctions biologiques moins importantes ou plus redondantes que ceux qui sont soumis à une forte sélection purificatrice.
Dans certains cas, l'apparition de nouvelles variantes génétiques peut être avantageuse dans un environnement donné, et accroître l'aptitude des individus. La fréquence de telles variantes va donc augmenter en raison de la sélection positive. Ce processus est également appelé sélection « directionnelle » ou darwinienne. Quand une mutation avantageuse augmente en fréquence dans la population suite à cette sélection positive, des variations neutres liées sont alors entraînées avec elle, ce processus est appelé « genetic hitchhiking » (auto-stop génétique). En conséquence, la variation qui n’est pas associée à l’allèle sélectionné est éliminée ; ce « coup de balai » sélectif (balayage sélectif partiel) conduit à une réduction globale de la diversité génétique autour du site sélectionné. Dans de tels cas, plusieurs signatures moléculaires peuvent être observées, tel qu’un biais de fréquence de distribution des allèles, avec un excès de rares et de hautes fréquences des allèles dérivés et une augmentation transitoire du déséquilibre de liaison associé à l'allèle sélectionné.
Enfin, plusieurs allèles peuvent coexister à un locus donné, s’ils sont avantageux individuellement ou ensemble, en raison de la « balancing selection » (sélection équilibrante). Il s'agit d'un type général de régime sélectif qui favorise le maintien de la diversité dans une population. Il y a deux principaux mécanismes par lesquels la sélection équilibrante préserve le polymorphisme : avantage hétérozygote et sélection fréquence-dépendante.
Les études des effets de sélection au niveau interspécifique (p. ex., comparant l'homme et le chimpanzé) peuvent améliorer notre compréhension des mécanismes génétiques et des traits qui sous-tendent la spéciation. Et les études des effets de la sélection sur des populations humaines spécifiques sont particulièrement utiles pour l'identification des gènes/variantes, responsables de la diversité phénotypique observée dans l’espèce humaine saine (p. ex. taille, couleur de la peau, aspect et croissance des cheveux) et malade (p. ex. différente susceptibilité aux maladies infectieuses ou différentes réponses aux vaccins et traitements).
Tests de neutralité pour détecter les effets de la sélection
Chaque type de sélection laisse une signature moléculaire distinctive (par exemple, diversité des nucléotides, fréquences alléliques, longueur de l’haplotype, etc..) dans le génome concerné. Ces signatures peuvent être détectées avec divers tests statistiques qui peuvent être grossièrement divisés entre les tests de recherche interspécifique (p. ex., homme et chimpanzé) et les tests intraspécifiques au sein de la lignée humaine ou entre populations humaines).
Détection de sélection entre les espèces
Les tests de neutralité entre les espèces utilisent des données concernant la divergence entre espèces étroitement apparentées, comme les humains et les chimpanzés, pour détecter des événements sélectifs relativement anciens, comme ceux qui se produisent au moment de la divergence des deux espèces considérées. Dans certains cas, ces tests prennent également en compte les données concernant le polymorphisme au sein de l'espèce, rendant possible la détection d’événements sélectifs anciens ou plus récents. Les tests interspécifiques comprennent le traditionnel dN/dS, le test McDonald-Kreitman (MK) et son extension MKPRF.
Le test de dN/dS détecte la sélection agissant sur des loci codant pour des protéines en comparant le ratio de substitutions non-synonymes (dN) à celui des substitutions synonymes (dS). En cas de neutralité, les substitutions synonymes et non-synonymes devraient se produire au même rythme et on devrait trouver dN/dS = 1. La sélection négative des variantes non-synonymes se traduirait par dN/dS < 1, alors que la sélection positive de telles variantes se traduirait par dN/dS > 1.
Dans le Test MK, qui considère aussi des données polymorphes, les deux classes de mutations sont censées être évolutivement équivalentes : les modèles de polymorphisme et de divergence doivent donc être les mêmes pour les deux classes de mutations. La non-indépendance entre les nombres de polymorphismes non-synonymes et synonymes, et les différences fixes sont évaluées par le test exact de Fisher. Un excès de différences fixes pour les mutations non synonymes (supposées faire l'objet de sélection) par rapports aux variantes synonymes est considéré généralement comme indicateur d’une évolution adaptative. En revanche, un excès de polymorphismes non-synonymes peut résulter d’une faible sélection négative ou d’une sélection populationnelle locale positive.
Détection de sélection au sein des populations humaines et entre elles
Les tests de neutralité intraspécifiques se concentrent sur le niveau de polymorphisme au sein d'une seule espèce, telle que l’homme et détectent donc les événements de sélection d’apparition récente. Ils peuvent être subdivisés en groupes distincts, chacun se concentrant sur les différents aspects des données génétiques.
Les tests basés sur le spectre de fréquence allélique déterminent si le spectre de fréquence des mutations est conforme aux attentes du modèle standard de neutralité. Les écarts par rapport à la neutralité dans la distribution des fréquences alléliques au sein des populations peuvent être mesurées par différents tests, dont le D Tajima, le D de Fu et de Li, le F de Fu et Li, et le H de Fay et Wu. Les valeurs négatives du D Tajima et des F et D de Fu et Li indiquent généralement un excès d'allèles rares, cohérent avec une sélection positive ou négative, alors que des valeurs positives de ces statistiques reflètent généralement un excès d'allèles de fréquence intermédiaire, dû à la sélection équilibrante. En outre, le H de Fay et Wu peut être utilisé pour détecter les événements de sélection positive (balayage sélectif), par démonstration d'un excès de haute fréquence alléliques des gènes étudiés (variation liée).
D’autres statistiques, comme la FST, sont basées sur le niveau de différenciation génétique entre populations historiquement exposées à des pressions sélectives différentes. Par exemple, une sélection positive géographiquement limitée tend à augmenter le degré de différenciation entre une population humaine donnée et d'autres populations humaines, ce qui entraîne une augmentation de la valeur de FST au locus sélectionné. À l'inverse, la sélection équilibrée, la sélection négative ou la sélection directionnelle de toute l’espèce peuvent produire une valeur de FST inférieure à celle attendue par l’hypothèse neutraliste.
Enfin, un autre groupe de test de neutralité se concentre sur des événements de sélection positive plus récents (par ex : < 30 000 ans), en examinant les patrons d'homozygotie (longueur d’haplotype) associés à des allèles particuliers. Ces tests comprennent le LRH (long range haplotype), le IHS (integrated haplotype score), et le LDD (Linkage Desequilibrium Decay). Tous ces tests sont basés sur la comparaison de la fréquence d'une mutation donnée avec la longueur des haplotypes autour d'elle. Dans une hypothèse neutraliste, les nouveaux allèles prennent beaucoup de temps pour atteindre de hautes fréquences dans la population, et la longueur des haplotypes autour de ces variantes diminue de manière importante pendant ce temps, en raison des recombinaisons. Ainsi, les allèles communs sont généralement vieux et associés à des haplotypes courts. En revanche, une variante de sélection positive récente devrait avoir un haplotype inhabituellement long en regard de sa fréquence dans la population, parce que l'allèle avantageux augmente sa fréquence trop rapidement pour que la recombinaison ait un effet majeur sur la longueur de l'haplotype.
Pièges en raison des effets similaires de la démographie
Des facteurs autres que la sélection, tels que certains processus démographiques, peuvent être également responsables de déviations par rapport au modèle neutraliste. Certains des tests décrits ci-dessus, y compris ceux basés sur le spectre des fréquences alléliques, sont sensibles aux effets trompeurs de la démographie sur les modèles de diversité génétique. Par exemple, un excès d’allèles rares, donnant des valeurs négatives du D de Tajima et des D et F de Fu & Li peut en réalité provenir d'une expansion soudaine de la population, plutôt que des effets d’une sélection positive. De même, les valeurs positives de ces tests témoignent non seulement de l'équilibrage de sélection mais aussi de la présence d’une forte structure de population, ce qui peut augmenter la proportion d'allèles de fréquence intermédiaire dans cette population.
Toutefois, il est possible de surmonter ces problèmes en appliquant un principe de base de la génétique des populations : les événements démographiques influent sur l'ensemble du génome, alors que la sélection naturelle agit plus localement et reste limitée à des régions génomiques précises. Ainsi, lorsqu'on examine l’incidence des facteurs démographiques sur les patrons de diversité, les modèles démographiques basés sur les multiples régions non codantes du génome, prenant en compte les scénarios réalistes de l’histoire démographique des populations humaines (p. ex., expansion de la population, goulots d'étranglement, etc.) peuvent être intégré aux modèles neutres. De la même façon, des procédures empiriques peuvent être utilisées pour comparer la valeur d'une donnée statistique pour le gène considéré (par exemple, D de Tajima, TVF, etc.) avec les attentes des données statistiques générées à partir de tout le génome, qui doivent refléter la neutralité. Ainsi, les procédures empiriques, ou basées sur des simulations, peuvent être utilisées pour faire la différence entre les effets des facteurs démographiques et les événements de sélection naturelle ciblant des régions génomiques précises, mettant en évidence les adaptations passées aux nouveaux climats, aliments ou agents pathogènes.
Phénotypes adaptatifs dans les populations humaines
Ces dernières années, l'accumulation massive de données de variations génétiques sur tout le génome pour diverses populations humaines, comme dans le projet « HapMap » et le « 1 000 Genome Project », a permis de tester aveuglément les occurrences de sélection tout au long de l'ensemble du génome. Ces scans complets ont fourni des longues listes de gènes présumés ciblés par sélection positive, ainsi que des informations sur les fonctions biologiques et les régions génomiques les plus susceptibles d'avoir joué un rôle dans notre adaptation à l'environnement. Cependant, les approches gène-candidat ont fourni les meilleures preuves d’action de la sélection naturelle sur certains gènes, particulièrement lorsque la preuve fonctionnelle est également disponible, et cela, malgré les biais inhérents à de telles approches, en raison de la nécessité de faire des hypothèses initiales sur les gènes susceptibles de faire l'objet de sélection.
Adaptation au régime alimentaire
Beaucoup d'exemples de l'adaptation génétique des êtres humains au régime alimentaire ont été décrits, consommation de lait, régimes riches en amidon, perception du goût amer. L’adaptation à la consommation de lait, par la persistance de la lactase, est probablement un des exemples les plus connus de la sélection naturelle chez l'homme. Une forte concentration de lactase veille à ce que le lactose soit digéré efficacement pendant les premières semaines de vie. Le gène de la lactase est ensuite réprimé, entraînant des concentrations résiduelles (5 à 10% des concentrations néonatales) de l'enzyme chez les adultes. Toutefois, certaines populations, notamment celles qui ont traditionnellement pratiqué l'élevage bovin, maintiennent leur capacité à digérer le lait à l'âge adulte. Ce trait de la « persistance de la lactase » est très fréquent en Europe de l’Est et dans les populations africaines, pour atteindre des fréquences de 90 % en Europe du Nord.
La base génétique de la persistance de la lactase est maintenant bien connue ; elle est héritée comme trait mendélien dominant chez les Européens, avec une mutation (C/T-13910) du promoteur du gène de la lactase (LCT), en augmentant l'expression de ce gène. L’allèle de lactasepersistence-13910T affiche clairement une signature de sélection positive récente chez les Européens (elle est située sur un haplotype dont la longueur dépasse largement ce qu’elle serait en hypothèse de neutralité), et il existe une forte corrélation entre la distribution géographique de cet allèle et l’histoire de la consommation de lait. Par ailleurs, l'âge estimé de l'expansion de cet allèle, entre 5 000 et 12 000 ans, suggère que la persistance de la lactase a émergé en réponse à l'innovation culturelle de production laitière associée à un mode de vie agricole.
Des résultats différents ont été trouvés parmi les populations pastorales d’Afrique de l'Est qui présentent également une persistance de la lactase. Celles-ci n’ont pas l’allèle 13910T, mais une mutation 14010C dans la région promotrice de LCT qui s'est avérée être positivement sélectionnée au cours des 7 000 dernières années. Au total, ces résultats démontrent que le trait culturel de la consommation de lait a conféré un avantage sélectif en termes de survie de l'homme dans différentes parties du monde. L'avantage sélectif le plus évident fourni par la persistance de la lactase est la possibilité pour les individus tolérants au lactose d’accéder à une source de nourriture précieuse en cas de pénurie alimentaire. En outre, les personnes intolérantes au lactose présentent plus de syndromes diarrhéiques avec déshydratation. Les personnes hébergeant les allèles de persistance de la lactase ont pu avoir un autre fort avantage sélectif pour la survie face aux agents pathogènes.
Adaptation au climat
Un autre exemple de l'adaptation génétique à l'évolution des environnements est fourni par l'exposition des populations ancestrales à des climats plus froids et à de plus faibles niveaux de rayonnement solaire après les premières migrations hors d’Afrique. Ces changements de conditions climatiques ont conduit à une variation dans la quantité, le type et la répartition de la mélanine dans la peau, entraînant divers niveaux de pigmentation de la peau. Les peaux plus foncées ont été favorisées dans les régions à forte irradiation UV, en raison de la protection évidente qu'elle procure contre les dommages du soleil (p. ex., les coups de soleil, mélanome, carcinomes basocellulaires et spinocellulaires). Un avantage encore plus grand pour la reproduction vient du fait que les peaux plus foncées protègent contre la photolyse de l’acide folique induite par les UV. Ce métabolite est essentiel pour le développement embryonnaire du tube neural et pour la spermatogenèse. Inversement les peaux plus claires peuvent soulager d’une contrainte fonctionnelle ou conférer un réel avantage sélectif dans les régions à faible niveau de rayonnement UV. Un premier avantage prouvé est le niveau plus élevé de photosynthèse de la vitamine D dans les régions avec des niveaux inférieurs d'irradiation UV.
Un certain nombre de gènes impliqués dans la pigmentation de la peau ont été identifiés, avec des effets à différentes étapes de la voie de la pigmentation (depuis la mélanogénèse jusqu’à la production et l'entretien des mélanosomes et la répartition entre production d'eumélanine et la phéomélanine). De plus en plus de preuves montrent que des gènes de pigmentation, comme ASIP, OCA2, SLC24A5, MATP ou TYR, ont fait l'objet d'une sélection positive à travers le monde ou dans les populations humaines spécifiques. Par exemple, le gène SLC24A5, dont la variante A111G est associée à une peau plus claire présente de forts signaux de sélection positive chez les Européens, comme le montrent les valeurs de FST et l'homozygotie de l’haplotype entourant cette variante. Dans ce cas, la sélection positive peut avoir augmenté la fréquence de cette mutation pour maximiser la synthèse cutanée de vitamine D dans les zones à niveaux inférieurs d’irradiation UV, comme l'Europe.
Un autre cas intéressant de sélection en réponse aux conditions environnementales est l'adaptation à l'altitude pour éviter l’hypoxie, un stress physiologique dû aux niveaux inférieurs d'oxygène en altitude. Diverses populations qui ont vécu historiquement à haute altitude, tels que les Andins de l'Altiplano et les tibétains du plateau Himalayen, ont un ensemble unique de caractéristiques physiologiques qui leur ont permis de s'adapter aux conditions de haute altitude, où la concentration en oxygène est de 40 % inférieure à celle du niveau de la mer. La base génétique de ces adaptations à des conditions environnementales extrêmes n’a commencé à être déchiffrée que récemment. Des études ont fourni des preuves de sélection positive ciblant divers gènes ou régions génomiques impliqués dans le métabolisme et la sensibilité à l'oxygène chez les Andins et les Tibétains. Les plus forts signaux de sélection concernent les gènes EPAS1, EGLN1, PRKAA1 et NOS2A. Ces études ont aidé à délimiter un certain nombre de loci fonctionnellement importants dans l'adaptation génétique à la haute altitude.
Adaptation aux pressions des pathogènes
Une autre importante pression sélective à laquelle l'homme a été confronté au fil du temps est celle imposée par les pathogènes et les maladies infectieuses. En effet, les agents pathogènes ont été et sont encore, dans les régions où les antibiotiques et les vaccins manquent toujours, les principales causes de mortalité, exerçant ainsi une forte pression sélective sur le génome humain. Une sélection équilibrée provoquée par les pathogènes a été clairement démontrée pour le gène de l’Human Leukocyte Antigen (HLA), dont la très grande diversité est fortement corrélée à la résidence dans des zone où existent un grand nombre d'espèces pathogènes.
Plusieurs études ont identifié des signatures de sélection en réponse à la présence de Plasmodium, l'agent responsable du paludisme. Par exemple, la fréquence élevée de certaines hémoglobinopathies a été corrélée avec une plus grande résistance à Plasmodium Falciparum. L'allèle HbS ou « trait drépanocytaire » est un exemple de sélection positive due à une maladie infectieuse, il augmente la résistance aux formes potentiellement mortelles du paludisme chez les hétérozygotes. Un autre exemple est fourni par une carence en glucose-6-phosphate déshydrogénase (G6PD). Les patients atteints de cette maladie ont des niveaux anormalement bas de G6PD, qui est particulièrement importante pour le métabolisme des globules rouges. Plus d'une centaine de variantes peuvent conduire à cette carence, dont certains sont sélectionnés parce qu'ils confèrent une plus grande protection contre plasmodium falciparum ou vivax. Un exemple extrême est fourni par le gène DARC, dont l’allèle nul, conduisant à l’absence de protéine, empêche Plasmodium Vivax de pénétrer dans les cellules de l'hôte. La sélection positive pour l'allèle nul a été démontrée en Afrique sub-saharienne, et il est presque fixé dans certaines populations d'Afrique Centrale, alors qu'il est pratiquement absent des populations originaires d'autres régions du monde. Plasmodium Vivax et d’autres pathogènes utilisant le même mode d'entrée dans les cellules hôtes, ont été identifiés comme des sources très probables de pression sélective dans ce cas.
Mutations multiples supportant des phénotypes adaptatifs similaires
Il est intéressant de noter que plusieurs cas d’adaptations génétiques parmi les mieux étudiés chez l'homme ont révélé de multiples mutations indépendantes qui confèrent un avantage pour des pressions sélectives identiques ou similaires. Encore une fois, le caractère de persistance de la lactase constitue non seulement un des cas mieux documentés de sélection positive dans le génome humain, mais il représente également un exemple clair d'adaptation convergente en réponse à une forte force sélective liée au régime alimentaire. En effet, les allèles de lactase-persistance sont différents en Europe, au Moyen-Orient et en Afrique, où leur fréquence a augmenté indépendamment, sous la même force de sélection. Même au sein d'une population donnée (par exemple, les pasteurs Afrique de l'Est), plusieurs mutations ont été retrouvées pour expliquer le caractère de persistance de la lactase. En outre, les périodes aux cours desquelles ces mutations ont commencé à augmenter en fréquence diffèrent légèrement entre l'Europe et l'Afrique et coïncident avec la pratique culturelle du pastoralisme (et donc la consommation de lait) dans ces populations. Il a été proposé comme explication possible pour cet exemple fascinant d'adaptation convergente au sein de notre espèce, que les taux de mutation des allèles adaptatifs soient suffisamment élevés pour permettre de nouvelles mutations adaptatives géographiques distinctes avant qu’une variante unique se propage dans le monde.
D'autres cas de mutations multiples sur un gène donné, ou même de mutations dans différents gènes, sous-tendant des phénotypes adaptatifs similaires chez les humains, se retrouvent dans la résistance au paludisme, l’adaptation à la haute altitude, ou la pigmentation de la peau. En effet, divers allèles de déficit en G6PD ont été indépendamment ciblés par sélection positive dans les populations africaines, méditerranéennes ou sud-est asiatiques, car ils ont conféré une plus grande résistance à Plasmodium Falciparum ou Vivax. De même, différents gènes expliquent l’adaptation à la haute altitude des Tibétains (EPAS1) et des Andins (PRKAA1, NOS2A), et pour le seul gène ciblé par sélection positive dans les deux populations, EGLN1, les haplotypes sélectionnés diffèrent sensiblement entre les deux populations. Cela montre clairement que les Tibétains et les Andins ont suivi différentes trajectoires évolutives pour s'adapter à la même pression, à haute altitude. Enfin, le cas de la peau claire des Européens et des Asiatiques de l'Est offre un autre exemple d'évolution convergente. En effet, les différents gènes, associés à une couleur de peau plus claire dans ces populations, ont été ciblés indépendamment par la sélection positive chez les Européens (SLC24A5, MATPet TYR) et les Asiatiques de l’Est (ADAM17 et ATRN). Bien que le rôle de la sélection sexuelle ne puisse complètement être exclu, ces données confirment des mécanismes génétiques indépendants pour l'évolution de la couleur de peau.
Le cas particulier de sélection du cancer
La relation entre la sélection et le cancer demeure floue. En effet, les cancers sont souvent considérés comme sélectivement neutres, car ils sont plutôt d'apparition tardive, ce qui devrait donc avoir peu d'impact sur l'aptitude de l'individu. Certains cancers, cependant, affectent principalement des enfants, tels que la leucémie lymphoblastique aiguë, il peut donc exister une sélection pour des adaptations anticancéreuses qui réduisent le risque de mort. En outre, bien que la plupart des cancers surviennent après l'âge de procréer, la variance est grande, et ils peuvent survenir chez une fraction non négligeable de personnes plus jeunes. Dans cette optique, il ne peut être totalement exclu que les cancers exercent une pression de sélection directe. Dans ce contexte, les considérations théoriques prédisent que le risque de développer un cancer chez les espèces à longue durée de vie devrait être plus élevé que chez les espèces à courte durée de vie, mais cela ne semble pas être le cas. Cette observation, connue comme le paradoxe de la Peto, a été utilisée pour suggérer que les grands animaux pourraient avoir développé certains mécanismes de résistance au cancer, soutenant l'idée que le cancer peut effectivement avoir été contre-sélectionné par l’évolution.
La vieille idée que les cancers n'affectent généralement pas les personnes en âge de procréer a constitué un véritable obstacle à l'utilisation de l'approche génétique évolutionniste dans ce domaine. En conséquence, seules quelques études ont abordé directement la question du comment la sélection a influencé l'évolution des gènes liés au cancer. Parmi eux, il faut mentionner le cas de BRCA1, ce gène affiche une des associations les plus fortes avec les cancers du sein et de l'ovaire. Fait intéressant, BRCA1 a été trouvé comme résultant d’une sélection purificatrice. De la même façon, le gène BRCA2 connexe, fortement associé aux mêmes maladies, appartient à un groupe de gènes qui semblent être soumis à une sélection purificatrice dans une distribution de 6033 gènes du génome. Ces observations sont particulièrement intéressantes, puisque les formes héréditaires de cancer du sein ont un impact élevé chez les jeunes adultes. Nous pourrions donc nous attendre à ce que des gènes associés à des cancers ayant un fort impact sur les jeunes adultes ou enfants soient fortement contraints par une sélection purificatrice.
D’autres signatures de sélection positive ont également été signalées pour certains gènes connus pour jouer un rôle direct ou indirect dans le risque de cancer. Certaines de ces études ont cherché des signatures entre espèces, pour mettre en relief la sélection adaptative chez l'espèce humaine dans son ensemble. Par exemple, à l'échelle des espèces, BRCA1 semble évoluer de manière adaptative avec quelques codons spécifiques de réparation de l'ADN ciblés par sélection positive. Cette conclusion, et la signature susmentionnée de sélection purificatrice chez les humains, ne sont pas incompatibles, mais suggèrent que l’évolution de BRCA1 a été adaptative avant la spéciation humaine (accumulation de divers changements d'acides aminés), et par la suite, devenir fortement contrainte au sein de la lignée humaine.
Au niveau intraspécifique, certaines études basées sur des polymorphismes chez l'homme, ont trouvé des signatures de sélection positive sur certains gènes. Par exemple, une analyse génomique de 142 gènes signaux de sélection positive récente a identifié le gène PPP2R5E, qui est impliqué dans la régulation négative de la croissance cellulaire et de la division. Un autre décryptage de 132 gènes retrouve des signatures fortes de sélection positive ou équilibrée dans une région qui s'étend sur plus de 115 kb chez des Euro-Américains, les plus forts signaux étant centrés sur TRPV6. Ce gène est surexprimé dans le cancer de la prostate et associé à une forme agressive de la maladie. Un des exemples plus intéressants est sans doute celle de UGT2B4, qui a été fortement associée à un risque accru de cancer du sein chez des Nigériennes et, dans une moindre mesure, chez des Afro-Américaines, et des signatures de sélection (positive récente et équilibrée) ont été trouvées dans la partie amont du gène. Au total, ces exemples suggèrent qu'il pourrait y avoir une relation directe ou indirecte entre cancer et sélection, mais la proportion, dans l'ensemble du génome, des gènes liés au cancer, et effectivement ciblés par sélection, reste encore à déterminer.
Maladaptation par suite de sélection passée
Il est de plus en plus évident que certaines maladies des sociétés modernes, tels que l'obésité, l'hypertension, les maladies inflammatoires, auto-immunes, allergiques, ou même les cancers, peuvent tout simplement être le sous-produit d’une adaptation passée à d'autres forces sélectives et aux changements de mode de vie. Les modifications génétiques se produisant plus lentement que les changements de mode de vie. Il a longtemps été suggéré que des événements de sélection ancienne peuvent avoir favorisé des variantes qui ne sont plus avantageuses et peuvent même être devenues nuisibles dans les sociétés modernes.
L’hygiène et les gènes économes
L’hypothèse du « gène économe » a été introduite par James Neel, qui a suggéré que les gènes conférant une prédisposition au diabète (appelé « gènes économes ») ont été historiquement avantageux mais sont devenus préjudiciables dans le monde moderne. Certaines variantes avaient été sélectionnées positivement dans le passé parce qu'elles avaient favorisé l'accumulation de grandes quantités de matières grasses, augmentant considérablement la probabilité de survie au cours des famines. Toutefois, aujourd'hui, le passage à un mode de vie sédentaire et l'abondance de la nourriture ont augmenté le risque de développer un diabète de type II chez les individus porteurs de ces variantes. Plusieurs études ont révélé des risques particulièrement élevés de diabète et des niveaux élevés d'obésité dans les populations qui sont récemment et rapidement passé à un « Western lifestyle », tels que les Amérindiens aux États-Unis.
Un autre exemple de mauvaise adaptation peut refléter des changements dans les pressions sélectives imposées par les maladies infectieuses au fil du temps. Les pathogènes sont toujours présents, mais l'amélioration de l'hygiène et l'utilisation d'antibiotiques et de vaccins ont considérablement affaibli leurs pressions de sélection, en particulier dans les pays occidentaux. Une réponse immunitaire forte et exacerbée, qui pouvait être la meilleure façon de survivre dans des environnements riches en pathogènes dans le passé, semble être devenu un fardeau dans les sociétés modernes, car une réponse trop vigoureuse accroît le risque de développer des maladies inflammatoires et auto-immunes. Cette hypothèse, connue sous le nom d’« hypothèse hygiéniste », est étayée par l'observation que les allèles pro-inflammatoires sont plus fréquents dans les populations d'origine tropicale que chez ceux qui ont vécu dans les régions tempérées pendant une longue période.
En outre, les sujets ayant une ascendance tropicale de long terme, migrant en régions tempérées, semblent avoir un risque plus élevé de développer des maladies inflammatoires, des allergies et de l'asthme ; c’est le cas des Afro-américains et des Asiatiques vivant au Royaume-Uni. Dans tous ces cas, l’origine ethnique s'est avérée avoir un impact plus important que les différences environnementales sur la prévalence de l'asthme. D'un point de vue de la génétique des populations, certains allèles conférant un risque plus élevé de maladies inflammatoires et auto-immunes montrent avoir été sous forte pression sélective dans le passé. Ces observations confirment que le risque accru de développer des troubles inflammatoires et auto-immuns peut-être être un sous-produit d’une sélection passée en réponse aux maladies infectieuses.
Compromis au cours de la vie
Sachant que les variantes qui ont été historiquement avantageuses dans une région donnée peuvent devenir un fardeau dans un nouvel environnement. Un autre compromis d'adaptation suggéré est la « pléiotropie antagoniste ». La pléiotropie se définit comme la situation dans laquelle un seul gène contrôle plus d’un caractère phénotypique dans l'organisme ; « pléiotropie antagoniste » est le terme utilisé lorsqu'au moins un trait est bénéfique et un autre est préjudiciable. L'hypothèse de la pléiotropie antagoniste a été d'abord présentée par George Christopher Williams en 1957 pour expliquer la sénescence. Les variantes qui ont été avantageuses au début de la vie pourraient devenir préjudiciables par la suite, avec une diversité résultant de compromis qui maximisent la survie en début de vie plutôt que la santé ultérieure. En effet, la variation génétique peut affecter plusieurs voies à différents âges. Par exemple, des niveaux élevés de testostérone dans le sang sont associés à une aptitude supérieure en début de vie, mais sont associés à un risque plus élevé de développer un cancer de la prostate plus tard. Un autre cas intéressant est le poids à la naissance : il a été suggéré que la sélection d’un poids élevé à la naissance, bénéfique pour la survie précoce, est contrebalancée par un risque plus élevé de diverses formes de cancer plus tard dans la vie.
Conclusion
Les études de génétique des populations ont grandement amélioré notre connaissance de la façon dont les humains se sont génétiquement adaptés aux variations des pressions de l'environnement et aux changements de mode de vie au cours des temps. De même, étudier comment la sélection naturelle a dirigé l'évolution de certains gènes et fonctions biologiques s'est avéré utile pour informer sur la relation entre la diversité génétique, les phénotypes adaptatifs et les maladies. Dans ce contexte, il est maintenant nécessaire de passer au peigne fin les approches de génétique des populations en utilisant l’ensembles des données de génomes entiers séquencés maintenant disponibles sur les différentes populations humaines (ex : projet des 1000 génomes) et leurs association avec plusieurs maladies ou traits d'intérêt. De même, nous avons encore beaucoup à apprendre de l'intégration des données de la génétique des populations, de l’épigénétique et des études en génétique épidémiologique sur les populations ayant différents modes de vie et modes de subsistance (par exemple, agriculture, chasse et cueillette, sédentaire, nomade) ou vivant dans des milieux complètement différents (p.ex., urbain, rural, forestier). Ces efforts multidisciplinaires sont vraiment nécessaires pour clarifier les relations entre sélection naturelle et maladies et améliorer notre compréhension des mécanismes évolutionnistes des différences actuelles dans la susceptibilité, la résistance ou la progression des maladies observées chez l’homme. En fin de compte, ces approches intégratives sont essentielles pour déterminer la contribution des variables génotypiques, épigénétiques et environnementales dans le risque actuel de nombreuses maladies, et faciliter leur diagnostic, leur prévention et leur traitement.
Vasseur E. and Quintana-Murci L.
The impact of natural selection on health and disease: uses of the population genetics approach in humans
Evol Appl. 2013 June; 6(4): 596–607.
DOI : 10.1111/eva.12045
Site médical sans publicité
et sans conflit d'intérêts.