Overblog Suivre ce blog
Editer l'article Administration Créer mon blog
Le blog des Bactéries et de l'Evolution

Mon petit modèle de surdominance

25 Janvier 2007 , Rédigé par Benjamin Publié dans #Evolution

Je me suis récemment penché sur un papier de modélisation qui s'intéressait au maintien évolutif de l'homosexualité. En voilà un sujet épineux! Pour écarter tout risque de subjectivité, et parce que je n'aime pas considérer les comportements humains d'un point de vue réductionniste, considérez que je m'intéresse à partir de cette ligne exclusivement à l'homosexualité chez les animaux, homme exclu. Effectivement, ne vous laissez pas dire que l'homosexualité est "contre-nature", c'est un comportement assez fréquent chez les animaux (ce qui laisse toute considération morale de côté, positive ou négative, le meurtre aussi est "naturel"!). J'espère revenir à cet article très bientôt, mais pour faire simple, il existe des indices que l'homosexualité aurait une base génétique (et une base environnementale, bien sûr). Partant de ce constat, de nombreux auteurs se sont interrogés sur le maintien des gènes promouvant l'homosexualité d'une manière ou d'une autre, et ce pour d'évidentes raisons: l'homosexualité mène à une impasse reproductive (encore une fois, ceci n'est pas un jugement moral!). Les versions des gènes (i. e. les "allèles") qui favoriseraient ce comportement seraient donc moins transmises à chaque génération que les allèles n'ayant pas d'influence ou une influence contraire. Dans la suite du raisonnement, j'appellerai A cet allèle sans influence (l'allèle "straight" si vous préférez) et a l'allèle muté qui favorise l'homosexualité (aucune notion d'infériorité dans la minuscule, juste une convention de génétique ; il est en effet plus probable que a soit issu de A que l'inverse!).

Un mécanisme invoqué est la surdominance (overdominance en anglais): chez un diploïde (nous, la mouche, le chien, un piaf), les individus hétérozygotes Aa auraient un avantage sélectif par rapport aux individus homozygotes AA, c'est à dire plus de descendants. Dans l'exemple du jour, les homozygotes aa ont beaucoup moins de descendants, c'est à dire zéro pour simplifier. Nous avons donc affaire à un exemple de vigueur hybride avec une asymétrie entre les deux homozygotes possibles. Ce mécanisme de surdominance s'applique par exemple à la drépanocytose dans les régions où sévit la malaria: la drépanocytose est une anomalie des globules rouges déterminée par un gène défectueux, létale à l'état homozygote mais qui protège contre la malaria à l'état hétérozygote. Le gène muté, potentiellement fatal à l'état homozygote (soit zéro descendants) est donc mieux transmis par les individus hétérozygotes et se maintient dans la population à des fréquences élevées. Encore une fois, loin de moi l'idée d'assimiler l'homosexualité à une maladie génétique; cette affirmation reposerait sur des considérations de morale humaine qui n'ont pas cours dans ce billet.

Pour mieux me rendre compte de ce phénomène, sur lequel je n'ai encore rien lu, j'ai bâti en quelques minutes mon petit modèle de
surdominance, grâce aux bon vieux papier, crayon et R (seul logiciel que j'avais sous la main pour les simulations). En voici le détail:
-deux allèles A et a (modèle monogénique)
-des individus diploïdes de trois génotypes différents AA, Aa et aa. Les effectifs de ces catégories sont notés respectivement X, Y et Z
-pour exprimer l'avantage sélectif de Aa et la dimension "diploïde" du problème, j'exprime cet avantage sous la forme du nombre de gamètes qui participeront à la reproduction selon les différents génotypes. Ainsi, AA produit 2b gamètes, tous de génotype A. Aa produit 2*(b+c) gamètes, soit (b+c) de génotype A et (b+c) de génotype a. Pour simplifier aa ne produit pas du tout de gamètes participant à la reproduction.
-Il y a panmixie, c'est à dire que les individus choisissent pas leur partenaire selon sa catégorie.
-par convention, X+Y+Z=1 (soit la population a une taille limite, soit on ne s'intéresse qu'aux proportions). On part avec Z=0; justement, on veut savoir si une population "impasse évolutive" peut apparaître du fait de la surdominance du génotype Aa et sous quelles conditions. Posons X=0.9 et Y=0.1.
-Un simple tableau de croisement donne les proportions de zygotes selon leur génotype après fécondation.

Premier cas: le génotype Aa ne confère aucun avantage (c=0)
Même si le phénotype Aa marche aussi bien que AA, l'allèle a a bien un désavantage: chaque fois qu'il se retrouve avec lui-même dans un corps, il ne sera pas transmis. A n'a pas ce problème, et va donc envahir la population, qui consistera alors majoritairement de AA. L'issue est bien sûr identique, quoique plus rapide, si l'allèle a confère un désavantage même à l'état hétérozygote (c<0).

Deuxième cas: l'avantage de Aa est écrasant (c>>b)
On continue dans les cas triviaux: posons c=100 par exemple. Aa est alors extrêment avantagé, mais n'envahit pas la population pour autant! En effet, un génome diploïde n'est pas durable à l'échelle des générations, du fait de la reproduction sexuée; les allèles d'un même locus n'y sont associés que le temps de la vie de l'individu. On a donc des Aa avec un fort succès mais la fréquence de a ne peut donc dépasser 50%. Dans le cas limite de l'hyper-avantage, on peut considérer que AA est aussi stérile que aa. Les gamètes proviennent donc presque uniquement de Aa à chaque génération, donc une répartition mendelienne 25% AA 50% Aa 25% aa, donc une fréquence allélique
de a tendant vers 50% lorsque c tend vers l'infini.

Troisième cas: c>0, mais pas trop grand
Après deux simulations, je constate que f(a)=33% pour c=1 et f(a)=25% pour c=0,5. J'en déduis une loi empirique f(a)=c/2c+b. Est-il possible de retrouver ce résultat par le raisonnement? Oui, mais ça serait un peu longuet. Remarquons que ça colle avec les limites calculées précédemment, 0 et 1/2. Le graphe A représente l'évolution de f(a) au cours des générations et selon plusieurs valeurs du paramètre c. On remarque que c=9 (Aa produit 10 fois plus de gamètes "efficaces" que AA) aboutit presque à la limite f(a)=1/2. Le graphe B représente selon les différentes valeurs de c l'évolution de la proportion homozygote aa au cours des générations.

Nous voici à la conclusion-discussion : ce modèle fonctionne pour expliquer l'apparition d'homozygotes "impasses évolutives" et leur stabilité dans une population. Ce n'est pourtant qu'un modèle, et il ne peut être invoqué que dans les cas où l'on connaît le(s) gène(s) impliqué(s) et où l'on a la preuve d'un avantage sélectif pour l'hétérozygote; c'est le cas de la drépanocytose. A propos du formalisme du modèle, je crois fermement à l'expression du nombre de gamètes "efficaces" car participant à la reproduction : on intègre ainsi la diploïdie et l'avantage sélectif. C'est, je pense, le moyen couramment utilisé en génétique des populations. Pour faciliter les calculs, il serait peut-être plus judicieux d'exprimer l'avantage de l'hétérozygote sous la forme k*b, mais c'est trop tard (dans ce cas k=(b+c)/b ou c=k*b-b). Ainsi, avec un code à deux euros cinquante (voir ci-dessous), on peut soi-même tester les modèles de génétique des populations (= évolution + dynamique des populations) et se rendre compte que "ça marche".

edit : j'ai de sérieux problèmes avec over-blog pour mettre des images... j'espère y arriver plus tard. Toujours des problèmes au 08/02, quel que soit le format utilisé...

#Déclaration des paramètres
X=0.9
Y=0.1
Z=0
N=30
b=1
c=0.5
i=1
T=0
U=X
V=Y
W=Z


#Algorithme de reproduction
for (i in 1 : N){

#Nombre de gamètes de génotype A ou a
gam.A=(X*2*b + (b+c)*Y)
gam.a=((b+c)*Y)

#Fécondation ; nombres de zygotes de différents génotypes
zyg.AA=gam.A^2
zyg.Aa=2* gam.A* gam.a
zyg.aa= gam.a^2

#Normalisation de la population à 1
X = zyg.AA/( zyg.AA+ zyg.Aa+ zyg.aa)
Y = zyg.Aa/( zyg.AA+ zyg.Aa+ zyg.aa)
Z = zyg.aa/( zyg.AA+ zyg.Aa+ zyg.aa)

T = c(T,i)
U = c(U,X)
V = c(V,Y)
W = c(W,Z)}


#Traçage des courbes
#plot (T,((V+2*W)/(2*U+2*V+2*W)), type= "l", col="red", ylim=c(0,1), lab=c(5, 10, 40), xaxs="i", yaxs="i", lwd=2, xlab="Générations", ylab="Fréquence de l'allèle a", lty=1)
plot (T,((W)/(U+V+W)), type= "l", col="red", ylim=c(0,1), lab=c(5, 10, 40), xaxs="i", yaxs="i", lwd=2, xlab="Générations", ylab="Fréquence des homozygotes aa", lty=2)

 


Partager cet article

Repost 0
Pour être informé des derniers articles, inscrivez vous :

Commenter cet article

Sherpa 11/03/2008 12:28

Désolé, au temps pour moi. Bon ben j'ai lu un peu vite, toutes mes excuses, j'ai cru que tu avais fais des simulations pour tous les cas de figures, et des raisonnements pour aucun.Bref, précipitation et longueur de temps font mieux que force et courage (ou quelque chose comme ça je crois). La prochaine fois je lirais deux fois l'article avant de poster un commentaire.

Benjamin 03/03/2008 19:07

heu... tu me forces à me replonger dedans, mais ce n'est pas ce que j'ai écrit?"Dire que c >>> b est équivalent à dire que b est à peu près nul : en effet, puisque tout est normalisé, seul compte le rapport de b à c (c infiniment grand est exactement la même chose que b = 0).Bref, tu te retrouves dans un cas où AA et aa sont strictement similaires, et le seul cas qui se reproduit est Aa."c'est pas loin de : "Dans le cas limite de l'hyper-avantage, on peut considérer que AA est aussi stérile que aa."

Sherpa 03/03/2008 18:42

Un petit commentaire mathématique. Dans le cas c >>> b, nul besoin de simulation informatique, un peu de raisonnement suffit.Dire que c >>> b est équivalent à dire que b est à peu près nul : en effet, puisque tout est normalisé, seul compte le rapport de b à c (c infiniment grand est exactement la même chose que b = 0).Bref, tu te retrouves dans un cas où AA et aa sont strictement similaires, et le seul cas qui se reproduit est Aa. Puisque Aa sont les seuls à se reproduire, tu vas retrouver dans ta population un répartition tiré uniquement de la distribution de Aa, soit 4 cas égaux AA, Aa, aA et aa, et comme aA et Aa sont la même chose en génétique, on tombe bien sur la répartition AA 25%, aa 25% et Aa 50%.Comme quoi au moins ce résultat n'est pas trop difficile à démontrer par le raisonnement.Tcho

Timothée 27/01/2007 21:46

Héhé non, certains utilisent Scilab, CaML, Maple (qui a l'air assez sympa), R.Pour tout ce qui n'est pas maths, j'utilise perl, pour tout le reste, un tableur peut suffire. R est langage open source, qui oui existe sous linux. http://fr.wikipedia.org/wiki/R_(logiciel)http://www.r-project.org/La bête à l'air puissante !

Tom Roud 26/01/2007 23:20

C'est quoi le R ? Ca existe sous linux ?Moi qui croyais que tous les biologistes utilisaient MATLAB ! Un mythe s'effondre... ;)