Combien de mutants de transposition pour recouvrir tout le génome d'une bactérie? Démonstration!
Soit G le nombre de gènes contenus dans le génome et N le nombre de clones obtenus, c’est-à-dire le nombre d’évènements de transposition indépendants ayant eu lieu dans le génome. Chaque gène a une probabilité p = 1/G d’être touché par un évènement de transposition, donc une probabilité q = 1-p = (G-1)/G de ne pas être trouché par un évènement de transposition. Après N évènements de transposition indépendants, chaque gène a une probabilité qN de n’avoir jamais été touché :
Cette probabilité étant valable pour chaque gène et les gènes étant indépendants, on exprime R le nombre de gènes ratés par les N transposons :
R = G . [(G-1)/G]N
C'est toujours la même vieille astuce qui consiste à passer par l'évènement contraire: il est plus facile de calculer en une ligne le nombre de gènes ratés que le nombre de gènes touchés en fonction du nombre de clones. Le nombre de gènes ratés suit donc une loi géométrique ("l'attente du premier succès", pour ceux qui s'en rapellent). A partir de cette equation on obtient les courbes C et D (echelle logarithmique) correspondant aux valeurs théoriques, très proches des courbes simulées. En général, on souhaite R<1, du moins en moyenne. La fonction R(N) étant décroissante, on recherche N* (le “bon” nombre de clones) tel que R(N*)=1, et si N>N* alors R(N)<1.
R(N*) = 1
G . [(G-1)/G]N* = 1
ln(G)+N* . ln[(G-1)/G] = 0
N* = ln(G)/ln[(G/(G-1)]
A partir de cette relation, le tableau ci-dessous ou la courbe E montrent que dans les ordres de grandeur considérés, il faut environ dix fois plus de transposons que de cibles pour toutes les atteindre, en moyenne. Le nombre de transposons par gène suit une loi de Poisson, reconstituée en F (35000 transposons dans 4290 gènes). Remarquez que beaucoup de gènes ontreçu plus d'un transposon, ce qui montre d'une autre façon pourquoi il faut tant de clones pour avoir couvert tout le génome.
Nombre de gènes dans le génome:
1 1000 2000 3000 4000 5000 6000 7000 8000 9000 10000
Nombre de transposons nécessaires pour toucher tous les gènes en moyenne:
1 6905 15198 24016 33172 42581 52193 61972 71894 81941 92099
