Overblog Suivre ce blog
Editer l'article Administration Créer mon blog
Le blog des Bactéries et de l'Evolution

Combien de mutants de transposition pour recouvrir tout le génome d'une bactérie? Démonstration!

4 Juillet 2007 , Rédigé par Benjamin Publié dans #Microbiologie

Reprenons les données du billet précédent, mais imaginons un pauvre diable thésard qui n'a vraiment pas de chance et travaille sur Borrelia burgdoreferi, un spirochète agent de la maladie de Lyme, transmise par les tiques et que vous ne voulez surtout pas rencontrer au coin d'un bois. La bactérie de notre thésard possède un peu moins de 900 gènes et dieu sait combien de plasmides; son seul outil de génétique est la transposition, et il cherche des mutants ayant perdu leur virulence. Malheureusement, ne disposant que d'une calculatrice (à moins de pouvoir calculer des logarithmes de tête..) et non de R, comment savoir combien de clones il lui faut pour couvrir tous les gènes de Borrelia? Plus généralement, comment avoir une idée de ce nombre étant donnés le nombre de gènes et les quelques approximations discutées dans le précédent billet?


Soit G le nombre de gènes contenus dans le génome et N le nombre de clones obtenus, c’est-à-dire le nombre d’évènements de transposition indépendants ayant eu lieu dans le génome. Chaque gène a une probabilité p = 1/G d’être touché par un évènement de transposition, donc une probabilité q = 1-p = (G-1)/G de ne pas être trouché par un évènement de transposition. Après N évènements de transposition indépendants, chaque gène a une probabilité qN de n’avoir jamais été touché :

qN = [(G-1)/G]N

Cette probabilité étant valable pour chaque gène et les gènes étant indépendants, on exprime R le nombre de gènes ratés par les N transposons :

R = G . qN
R = G . [(G-1)/G]N

C'est toujours la même vieille astuce qui consiste à passer par l'évènement contraire: il est plus facile de calculer en une ligne le nombre de gènes ratés que le nombre de gènes touchés en fonction du nombre de clones. Le nombre de gènes ratés suit donc une loi géométrique ("l'attente du premier succès", pour ceux qui s'en rapellent). A partir de cette equation on obtient les courbes C et D (echelle logarithmique) correspondant aux valeurs théoriques, très proches des courbes simulées. En général, on souhaite R<1, du moins en moyenne. La fonction R(N) étant décroissante, on recherche N* (le “bon” nombre de clones) tel que R(N*)=1, et si N>N* alors R(N)<1.

R(N*) = 1
G . [(G-1)/G]N* = 1
ln(G)+N* . ln[(G-1)/G] = 0

N* = ln(G)/ln[(G/(G-1)]

A partir de cette relation, le tableau ci-dessous ou la courbe E montrent que dans les ordres de grandeur considérés, il faut environ dix fois plus de transposons que de cibles pour toutes les atteindre, en moyenne. Le nombre de transposons par gène suit une loi de Poisson, reconstituée en F (35000 transposons dans 4290 gènes). Remarquez que beaucoup de gènes ontreçu plus d'un transposon, ce qui montre d'une autre façon pourquoi il faut tant de clones pour avoir couvert tout le génome.

Nombre de gènes dans le génome:
1    1000   2000   3000   4000   5000   6000   7000   8000   9000   10000
Nombre de transposons nécessaires pour toucher tous les gènes en moyenne:
1    6905  15198  24016  33172  42581  52193  61972  71894  81941   92099


mutagenese2.jpg

Partager cet article

Repost 0
Pour être informé des derniers articles, inscrivez vous :

Commenter cet article

Benjamin 06/07/2007 12:56

Le dernier graphe représente la distribution des transposons par gène, qui suit bien spur une loi de Poisson. Les gènes ayant reçu 9 transposons sont ainsi très fréquents, bien plus que ceux en ayant reçu 0, 1, 3 ou 20.Il n'y a pas de rapport direct avec Borrelia, c'était juste pour introduire le besoin de généralisation du calcul et ce sans simulation.Je me fiche bien de convaincre tous les microbiologistes de la planète de faire quatre fois plus de clones, ces calculs n'ont d'intérêt que si l'on souhaite couvrir tout le génome (et encore, on pourrait faire des tas de corrections avec notamment la taille des gènes, etc.).

ugn 06/07/2007 12:32

J'ai pas compris non plus le rapport avec Borrelia.Est-ce que tu vas te mettre à utiliser 30 000 clones au lieu de 10 000 sur E.Coli après cette petite étude ? Voire, te lancer dans une croisade pour convaincre tous les microbiologistes de la planète ?

ugn 06/07/2007 12:28

que représente la dernière figure "nb gènes = f (nb transposons)" ?