Recherche:Corrélation entre les codons dans les gènes de protéines/Annexe/Tableaux

Une page de Wikiversité.
Aller à : navigation, rechercher
Tableaux
Image logo représentative de la faculté
Annexe 1
Recherche : Corrélation entre les codons dans les gènes de protéines
Précédent :Sommaire
Suivant :Diagrammes
Icon falscher Titel.svg
En raison de limitations techniques, la typographie souhaitable du titre, « Annexe : Tableaux
Corrélation entre les codons dans les gènes de protéines/Annexe/Tableaux
 », n'a pu être restituée correctement ci-dessus.



Paris le 8.12.16

Sommaire

Diagrammes codons-GC-DRNA[modifier | modifier le wikicode]

Compilation DRNA[modifier | modifier le wikicode]

codons DRNA[modifier | modifier le wikicode]

  • Lien tableur: codons DRNA
  • Résultats directs de la compilation des 111 bactéries. A copier dans un tableur avec une largeur de colonne de 1.3 cm.

Total codons DRNA[modifier | modifier le wikicode]

  • Lien Tableur: Total codons DRNA
  • Sommation des résultats directs du chapitre précédent. A copier dans un tableur avec une largeur de colonne de 1.3 cm.

acides aminés DRNA[modifier | modifier le wikicode]

  • Lien Tableur: acides aminés DRNA
  • Résultats directs de la compilation. A copier dans un tableur avec une largeur de colonne de 1.3 cm.

Total acides aminés DRNA[modifier | modifier le wikicode]

  • Lien Tableur: Total acides aminés DRNA
  • Sommation des résultats directs du chapitre précédent. A copier dans un tableur avec une largeur de colonne de 1.3 cm.

Contenu en GC des génomes DRNA[modifier | modifier le wikicode]

  • Lien Tableur: Contenu en GC des génomes DRNA
  • Le contenu en GC (%GC) de 80 bactéries sont tirés des tableaux numériques de l'article "répétition des bases dans l'ADN des procaryotes". Pour la cyanobactérie synd voir dans cyanobactérie de la même annexe.
  • synd
  • aae, aba, ade, age, amd, amo, apt, bae, bla, bmf, bmv, bsu, cad, cbd, cbl, cff, cgq, chp, cje, cmi, cmn, crp, cta, dba, ddr, dpt, dvl, eal, eco, eno, fnc, gau, gva, kpn, ksk, lat, liv, ljf, lla, lpl, mcac, mts, opr, pac, pae, pgd, pgi, ple, ppoy, ret, rip, roa, rpr, rru, saci, salb, say, sbn, sbz, sep, sgr, sho, sma, smk, spi, spl, sty, sus, tai, tde, tma, tme, tos, tpas, tsu, uur, vin, xcb, ype, zin.
  • J'ai soumis le programme repete.pl pour les 30 autres bactéries dont les résultats sont ci-dessous:

Contenu en GC des 111 génomes DRNA[modifier | modifier le wikicode]

Tableau des diagrammes des codons DRNA[modifier | modifier le wikicode]

  1. récupération des contenus en GC (%GC) des résultats du chapitre précédent.
  2. Création de la colonne %AT (100-%GC)
  3. Somme de tous les codons (codons stops compris) d'une bactérie donnée, colonne aas. La colonne Trp isole les tga donnant du Trp, des tga donnant des stops.
  4. Moyenne des aas par bactérie: 6 550 aas par bactérie, avec un écart type de 304.
  5. Recalcul du codon: 6550*codon/aas.
  • Le tableau est suivi de la moyenne des codons.

Maximum et 75% DRNA[modifier | modifier le wikicode]

  • Le nombre de codons est calculé d'après les équations des courbes de tendance pour caractériser chaque codon par un maximum de la courbe et, s'il n'existe pas (équation du second degré sans solution), par la valeur à 75% GC ou AT.

constantes des courbes DRNA[modifier | modifier le wikicode]

  • Lien Tableur: constantes des courbes DRNA
  • Ces constantes sont relevées à la main parce que le format de l'équation dans Libreoffice/calc est une image. Ces équations sont représentées dans les diagrammes.

abscisse du maximum DRNA[modifier | modifier le wikicode]

  • Lien Tableur: abscisse du maximum DRNA
  • C'est la solution qui annule la dérivée de l'équation de degré 3. C'est une équation du second degré qui quelque fois n'a pas de solution. Mais quand il y en a 1 ou 2 solutions, une seule est valable et doit être supérieure à 50 et inférieur à 100 %GC ou %AT. J'ai éliminé les abscisses supérieures à 90% pour tenir compte des valeurs extrêmes trouvées chez les bactéries étudiées.
  • La fonction dans calc est: "=(-2*P345-RACINE(((2*P345)^2)-12*O345*Q345))/(6*O345)" où P345 désigne la cellule de la 2ème constante, O345 la 1ère et Q345 la 3ème.

maximum DRNA[modifier | modifier le wikicode]

  • Lien Tableur: maximum DRNA
  • Il est calculé avec l'équation du diagramme: "=P387*(O345*P387^2+P345*P387+Q345)" voir abscisse ci-dessus et P387 étant la cellule de l'abscisse (%AT ou %GC)

Caractérisation des codons par les courbes et les coefficients de corrélation[modifier | modifier le wikicode]

Les queues. A partir du tableau original normé des 111 bactéries[modifier | modifier le wikicode]

  1. queue: nombre de bactéries ayant des effectifs faibles de leur codon (en rouge)
  2. moyenne queue: total des effectifs faibles divisé par le nombre de la queue
  3. moyenne codon: total du codon divisé par 111.
  4. %queue: total effectifs faibles de la queue divisé par (moyenne codon x 111) en %.
111 bactéries: Caractérisation des codons . Les queues à partir du tableau original.
aas KEGG %AT %GC tta ttg* ctt cta ctg ctc aaa aag ttt ttc tct tca agt tcg tcc agc
5710 zin 86,5 13,5 564 9 8 10 0 0 1241 22 452 9 146 99 57 1 2 3
5760 crp 83,4 16,6 532 55 38 40 2 1 935 44 575 24 164 131 84 14 3 13
5864 hcr 77,5 22,5 417 32 156 22 0 4 729 54 296 26 135 165 41 7 13 10
6157 mcac 76,3 23,7 502 40 38 51 0 0 579 43 261 16 101 151 114 1 0 12
6041 ssdc 75,8 24,2 503 40 65 16 1 3 539 66 279 13 182 113 54 13 12 12
6132 sbw 74,9 25,1 414 34 76 34 9 9 634 27 300 18 171 94 63 12 12 28
5709 uur 74,5 25,5 442 55 40 55 1 2 535 65 255 23 55 181 102 14 6 10
6361 ple 73,8 26,2 414 107 45 53 9 5 577 81 267 10 105 136 94 13 10 18
6600 smf 73,7 26,3 376 23 133 38 6 0 532 112 212 41 117 142 75 7 2 16
6345 fnc 72,9 27,1 364 74 121 51 3 3 514 119 189 43 129 137 58 5 4 15
6697 bfl 72,6 27,4 424 124 49 26 11 7 414 74 246 10 175 99 78 18 19 12
6334 cbl 71,7 28,3 337 38 114 65 3 2 462 118 198 54 127 103 87 3 17 17
6762 rip 71,5 28,5 247 112 81 65 33 32 504 127 236 90 220 109 51 36 49 15
6715 rpr 71,0 29,0 306 47 141 67 26 24 421 112 250 46 120 114 88 21 18 45
6569 pub 70,3 29,7 316 59 126 72 18 4 571 103 266 43 128 151 81 14 13 27
6265 cad 70,1 29,9 251 32 121 120 15 4 420 142 181 64 105 117 97 18 5 27
6706 cje 69,5 30,5 273 91 228 25 4 12 569 85 269 22 91 54 128 13 8 67
6431 pmh 68,9 31,1 275 99 159 78 15 25 417 110 190 46 160 137 89 20 24 34
__ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __
6490 din 43,9 56,1 3 23 69 4 387 123 115 258 108 142 22 24 44 30 141 87
5844 say 43,2 56,8 112 228 44 18 154 108 139 90 122 75 17 9 39 112 54 50
6773 bmf 42,8 57,2 2 49 120 7 262 123 51 309 52 182 20 15 8 136 88 47
6638 kpn 42,5 57,5 7 20 38 4 486 74 241 138 61 153 58 4 9 46 112 76
6820 aba 41,6 58,4 6 85 48 11 173 272 88 334 27 210 15 14 12 109 67 85
6546 dba 41,4 58,6 5 63 92 6 322 135 90 301 73 189 20 18 10 59 139 91
6472 synd 40,9 59,1 0 69 55 3 386 180 74 230 17 154 11 21 38 60 117 120
6745 pgd 40,4 59,6 1 35 46 10 380 84 129 218 84 152 18 14 8 101 85 45
6549 pac 40,0 60,0 5 93 82 20 227 154 47 250 41 171 40 18 15 108 112 39
6780 bla 39,5 60,5 1 61 31 3 248 221 34 272 8 217 5 16 12 119 114 62
6795 ret 38,7 61,3 0 29 63 5 290 196 42 319 30 198 12 7 3 156 96 44
6566 sus 38,1 61,9 3 79 34 7 334 145 59 337 34 203 7 4 12 115 60 89
6672 saci 37,7 62,3 2 85 45 4 190 329 62 295 16 195 5 5 11 127 50 118
6805 smk 37,3 62,7 1 22 74 4 221 228 33 313 20 221 9 6 4 169 91 41
6720 dvl 37,0 63,0 1 14 64 3 256 294 20 329 8 221 12 10 6 129 90 65
6859 ddr 36,6 63,4 3 14 20 3 473 89 44 252 34 187 9 16 22 49 71 159
6582 tai 36,2 63,8 7 46 82 18 347 164 9 300 23 202 11 4 9 54 209 96
7021 gau 35,7 64,3 1 86 16 5 284 239 11 291 35 201 13 16 21 142 59 49
6764 xcb 35,0 65,0 1 51 7 1 511 72 17 284 16 194 6 0 11 122 69 98
6688 rru 34,6 65,4 3 66 64 3 381 84 29 292 21 209 2 1 3 132 65 76
6845 dpt 33,8 66,2 0 21 7 8 519 69 70 216 52 159 8 5 12 84 76 146
6664 pae 33,4 66,6 0 23 4 6 501 118 29 330 1 222 1 4 3 86 98 100
6576 roa 32,6 67,4 0 27 8 0 331 237 5 289 0 204 5 1 8 150 104 60
7207 bmv 31,9 68,1 1 35 19 3 293 257 19 316 15 205 1 4 3 193 22 46
6617 tos 31,4 68,6 10 32 69 26 286 331 18 323 49 189 1 1 0 22 126 70
7209 vin 31,1 68,9 0 4 12 5 197 395 5 343 5 231 9 2 1 134 104 63
6713 age 30,6 69,4 0 11 2 0 337 298 3 448 1 225 7 0 6 92 107 94
6646 opr 30,0 70,0 0 27 21 1 342 288 18 302 10 223 1 1 1 85 39 100
6487 mts 29,7 70,3 0 10 11 2 271 326 15 285 0 232 3 3 3 173 65 76
6581 sma 29,3 70,7 0 5 11 0 374 208 1 310 1 230 3 2 1 121 142 43
6465 amd 28,7 71,3 0 11 7 1 399 190 3 252 1 215 3 3 2 157 87 41
6559 sho 28,0 72,0 0 5 11 0 385 187 0 295 4 223 0 1 0 98 152 45
6561 sgr 27,8 72,2 0 2 7 0 368 210 1 301 2 227 2 1 2 114 146 34
6452 cmi 27,3 72,7 0 5 1 1 240 387 0 248 0 215 0 0 0 117 113 108
6571 salb 26,7 73,3 0 2 4 0 354 240 0 287 1 227 1 0 1 116 144 39
6532 ksk 25,8 74,2 0 6 3 0 401 201 0 260 1 217 1 0 0 134 137 44
6733 ade 25,1 74,9 0 2 3 0 296 305 4 362 0 220 0 0 0 129 85 54
moyenne queue 1,7 3,7 3,6 3,0 3,8 3,1 1,1 - 2,1 - 2,8 1,5 1,9 5,6 4,8 -
moyenne codon 120 81 97 30 180 104 247 202 123 125 69 50 38 58 66 55
codon tta ttg ctt cta ctg ctc aaa aag ttt ttc tct tca agt tcg tcc agc
queue 35 6 5 20 12 12 8 0 12 0 19 19 16 4 4 1
%queue 0,4 0,2 0,2 1,8 0,2 0,3 0,0 - 0,2 - 0,7 0,5 0,7 0,3 0,3 -
  • Les queues au complet à copier dans un tableur avec une largeur de colonne de 1.3 cm. Voir le tableur.

Les queues. Les courbes à partir des équations de tendance[modifier | modifier le wikicode]

111 bactéries: Caractérisation des codons . Les courbes à partir des équations de tendance.
x3 0,00219 -0,00254 -0,00329 -0,00085 -0,00462 0,00016 0,0020 -0,00081 0,00057 -0,00075 -0,00091 -0,0003 -0,0005 -0,0002 -0,0013 -0,0010
x2 -0,10807 0,27112 0,37605 0,10907 0,5886 0,0552 -0,05462 0,09348 0,01185 0,11012 0,13691 0,06661 0,07383 0,0518 0,15161 0,09531
x 0,97089 -5,14699 -8,20089 -2,69606 -13,46935 -1,18671 0,91141 1,73297 -0,2492 -0,95591 -3,32039 -1,92933 -1,84844 -0,92575 -2,72647 -1,05602
aas KEGG %AT %GC tta ttg* ctt cta ctg ctc aaa aag ttt ttc tct tca agt tcg tcc agc
5710 zin 86,5 13,5 692 -60 -24 33 -86 -6 989 39 435 5 148 163 88 -4 -12 1
5760 crp 83,4 16,6 601 -17 23 41 -83 -4 881 51 393 11 147 152 87 -2 -9 4
5864 hcr 77,5 22,5 445 47 92 51 -58 3 691 77 317 26 141 129 81 3 1 14
6157 mcac 76,3 23,7 419 57 102 52 -50 5 659 83 304 29 140 125 80 4 3 16
6041 ssdc 75,8 24,2 406 62 106 52 -46 6 643 85 297 31 139 123 79 5 4 17
6132 sbw 74,9 25,1 387 68 113 53 -41 7 620 89 288 33 137 120 78 6 6 18
5709 uur 74,5 25,5 378 71 116 53 -37 8 608 92 283 35 136 118 78 7 8 19
6361 ple 73,8 26,2 364 76 120 53 -32 10 590 95 276 37 135 116 77 8 9 21
6600 smf 73,7 26,3 361 77 121 53 -31 10 587 96 274 37 135 115 77 8 10 21
6345 fnc 72,9 27,1 344 82 126 54 -25 12 566 100 265 40 133 113 75 9 12 23
6697 bfl 72,6 27,4 339 83 128 54 -22 12 559 101 263 41 132 112 75 9 12 23
6334 cbl 71,7 28,3 321 89 133 54 -14 14 536 106 253 44 130 108 74 11 15 25
6762 rip 71,5 28,5 318 89 133 54 -13 15 532 106 251 45 130 108 74 11 15 25
6715 rpr 71,0 29,0 308 92 136 54 -8 16 520 109 246 47 129 106 73 12 17 26
6569 pub 70,3 29,7 295 96 139 54 -2 18 503 113 239 49 127 103 72 13 19 28
6265 cad 70,1 29,9 291 97 140 54 0 18 497 114 237 50 126 102 71 13 19 28
6706 cje 69,5 30,5 280 99 142 54 6 20 483 117 231 52 125 100 70 14 21 30
6431 pmh 68,9 31,1 269 102 144 54 12 21 470 120 225 54 123 98 69 15 23 31
__ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __
6490 din 43,9 56,1 20 82 86 20 281 135 107 248 60 161 41 22 21 76 95 73
5844 say 43,2 56,8 17 79 82 19 287 140 102 251 57 163 39 20 20 78 96 73
6773 bmf 42,8 57,2 15 77 80 18 290 142 99 253 56 165 37 19 19 79 97 74
6638 kpn 42,5 57,5 14 76 78 17 293 145 97 255 55 166 36 18 19 80 97 74
6820 aba 41,6 58,4 11 72 73 15 300 151 90 259 51 170 33 16 17 83 99 74
6546 dba 41,4 58,6 10 71 71 15 303 153 89 260 50 171 32 16 17 84 99 74
6472 synd 40,9 59,1 9 69 69 14 306 156 86 262 49 173 31 15 16 85 100 74
6745 pgd 40,4 59,6 7 67 65 13 310 159 82 264 47 176 29 14 15 87 101 74
6549 pac 40,0 60,0 6 65 63 12 313 162 80 266 45 177 28 13 14 88 101 75
6780 bla 39,5 60,5 5 63 60 11 316 166 77 268 44 179 26 12 13 89 102 75
6795 ret 38,7 61,3 3 60 55 10 322 171 72 271 41 182 24 10 12 92 103 75
6566 sus 38,1 61,9 1 57 51 9 326 176 68 273 39 185 22 9 11 94 104 75
6672 saci 37,7 62,3 0 55 49 8 328 179 66 275 38 186 21 8 10 95 104 74
6805 smk 37,3 62,7 0 54 47 7 330 182 64 276 37 188 20 7 9 96 105 74
6720 dvl 37,0 63,0 -1 52 45 6 332 184 62 278 36 189 18 7 9 97 105 74
6859 ddr 36,6 63,4 -2 50 42 6 334 187 60 279 35 191 17 6 8 99 105 74
6582 tai 36,2 63,8 -3 49 40 5 337 190 58 281 34 192 16 5 8 100 106 74
7021 gau 35,7 64,3 -3 46 37 4 339 194 56 282 32 194 15 4 7 101 106 74
6764 xcb 35,0 65,0 -4 43 33 3 342 200 53 285 30 197 13 3 6 104 106 73
6688 rru 34,6 65,4 -5 41 30 2 344 204 50 287 29 199 11 2 5 105 107 73
6845 dpt 33,8 66,2 -6 38 26 1 347 209 47 289 27 202 9 1 4 108 107 72
6664 pae 33,4 66,6 -6 36 23 0 349 213 46 291 26 203 8 0 3 109 107 72
6576 roa 32,6 67,4 -7 32 18 -1 351 220 42 293 24 206 6 -1 2 112 107 71
7207 bmv 31,9 68,1 -8 29 14 -3 353 226 40 296 23 209 4 -2 1 114 107 70
6617 tos 31,4 68,6 -8 27 12 -3 354 230 38 297 22 210 3 -3 0 116 107 69
7209 vin 31,1 68,9 -8 26 9 -4 355 233 37 298 21 212 2 -3 0 117 107 69
6713 age 30,6 69,4 -9 23 7 -5 356 237 35 300 20 214 0 -4 -1 119 106 68
6646 opr 30,0 70,0 -9 21 3 -6 357 243 33 302 19 216 -1 -5 -2 121 106 67
6487 mts 29,7 70,3 -9 20 2 -6 357 245 32 302 18 216 -2 -5 -2 121 106 67
6581 sma 29,3 70,7 -9 18 0 -7 357 249 31 304 17 218 -3 -6 -3 123 106 66
6465 amd 28,7 71,3 -9 16 -3 -8 357 254 29 305 16 220 -4 -7 -3 125 105 65
6559 sho 28,0 72,0 -9 13 -7 -9 357 261 27 307 15 222 -6 -8 -4 127 104 63
6561 sgr 27,8 72,2 -9 12 -8 -9 357 263 27 308 14 223 -6 -8 -4 128 104 63
6452 cmi 27,3 72,7 -9 10 -10 -10 356 267 26 309 14 224 -7 -8 -5 130 104 62
6571 salb 26,7 73,3 -9 7 -14 -10 355 273 24 310 13 226 -8 -9 -6 132 103 60
6532 ksk 25,8 74,2 -9 4 -18 -12 354 281 22 312 11 229 -10 -10 -7 135 101 58
6733 ade 25,1 74,9 -9 1 -21 -12 352 288 21 314 10 231 -11 -11 -7 137 100 56

Les écarts. Moyenne des écarts, en %, par rapport à la courbe théorique. Les queues. Les moyennes des codons.[modifier | modifier le wikicode]

111 bactéries: Caractérisation des codons . Moyenne des écarts, moyenne des codons, queues,
aas KEGG %AT %GC tta ttg ctt cta ctg ctc aaa aag ttt ttc tct tca agt tcg tcc agc
5710 zin 86,5 13,5 18 115 133 69 100 100 25 44 4 71 2 40 35 132 119 322
5760 crp 83,4 16,6 11 414 66 2 103 130 6 12 46 118 11 14 3 774 136 188
5864 hcr 77,5 22,5 6 32 70 56 100 44 6 31 7 0 4 28 49 112 1920 27
6157 mcac 76,3 23,7 20 29 62 1 100 100 12 48 14 45 28 21 42 76 100 26
6041 ssdc 75,8 24,2 24 35 39 69 102 45 16 23 6 58 31 8 32 152 166 29
6132 sbw 74,9 25,1 7 50 33 35 121 14 2 70 4 46 25 22 20 89 82 50
5709 uur 74,5 25,5 17 23 65 4 103 72 12 29 10 34 60 53 31 103 24 46
6361 ple 73,8 26,2 14 42 62 2 129 47 2 14 3 72 22 17 22 74 12 15
6600 smf 73,7 26,3 4 70 10 29 119 100 9 17 22 9 13 23 2 12 79 24
6345 fnc 72,9 27,1 6 9 4 6 113 73 9 19 29 8 3 22 23 43 65 31
6697 bfl 72,6 27,4 25 49 62 51 148 44 26 26 6 76 32 11 4 87 51 49
6334 cbl 71,7 28,3 5 57 14 20 122 86 14 12 22 22 2 4 18 71 12 34
6762 rip 71,5 28,5 22 26 39 20 355 118 5 19 6 101 69 2 30 224 223 39
6715 rpr 71,0 29,0 1 49 4 24 417 53 19 3 1 2 7 8 21 81 5 70
6569 pub 70,3 29,7 7 38 10 32 971 77 14 9 11 13 0 46 13 8 31 3
6265 cad 70,1 29,9 14 66 13 122 5112 77 16 25 24 28 17 14 36 33 73 4
6706 cje 69,5 30,5 2 9 60 53 36 41 18 27 16 57 27 46 82 12 63 128
6431 pmh 68,9 31,1 2 3 10 45 29 19 11 8 15 16 30 40 28 32 7 9
__ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __
6490 din 43,9 56,1 85 72 20 80 38 9 7 4 80 11 46 12 108 60 49 19
5844 say 43,2 56,8 561 188 47 4 46 23 36 64 113 54 57 55 95 44 44 31
6773 bmf 42,8 57,2 87 36 50 62 10 14 48 22 7 10 46 24 60 73 9 36
6638 kpn 42,5 57,5 52 74 51 77 66 49 149 46 12 8 60 79 53 42 16 3
6820 aba 41,6 58,4 48 18 34 32 42 80 2 29 48 24 54 12 32 31 32 15
6546 dba 41,4 58,6 51 11 29 60 7 11 2 16 45 10 38 14 40 29 40 23
6472 synd 40,9 59,1 100 1 20 78 26 16 14 12 65 11 64 44 144 30 17 62
6745 pgd 40,4 59,6 86 48 30 25 22 48 57 18 79 13 37 0 47 17 15 40
6549 pac 40,0 60,0 17 42 30 63 27 5 41 6 10 3 43 41 6 23 10 48
6780 bla 39,5 60,5 80 4 49 74 22 34 56 2 82 21 82 40 12 33 12 17
6795 ret 38,7 61,3 100 52 13 51 10 14 41 18 28 8 52 33 76 70 6 41
6566 sus 38,1 61,9 143 38 34 19 3 18 14 23 14 10 68 55 11 22 42 19
6672 saci 37,7 62,3 364 54 8 50 42 84 7 8 59 5 76 39 7 33 52 58
6805 smk 37,3 62,7 327 59 58 46 33 25 49 13 45 18 56 21 59 76 13 44
6720 dvl 37,0 63,0 187 74 44 55 23 60 67 19 78 17 37 47 34 32 15 12
6859 ddr 36,6 63,4 256 72 53 50 41 53 27 10 1 2 50 176 167 51 33 114
6582 tai 36,2 63,8 371 6 105 257 3 14 85 7 32 5 32 22 19 46 98 29
7021 gau 35,7 64,3 128 85 57 13 16 23 80 3 10 3 11 275 203 40 45 34
6764 xcb 35,0 65,0 122 19 79 66 49 64 67 0 46 2 54 100 88 18 35 34
6688 rru 34,6 65,4 157 60 113 47 11 59 42 2 29 5 82 54 40 26 39 5
6845 dpt 33,8 66,2 100 44 74 959 49 67 48 25 90 21 16 426 229 22 29 103
6664 pae 33,4 66,6 100 37 83 18171 44 45 38 14 96 9 88 1451 7 22 8 40
6576 roa 32,6 67,4 100 17 57 100 6 8 88 2 100 1 14 193 307 35 3 16
7207 bmv 31,9 68,1 111 19 37 201 17 14 52 7 35 2 76 260 226 69 80 34
6617 tos 31,4 68,6 220 16 494 867 19 44 53 9 124 10 63 134 100 81 18 1
7209 vin 31,1 68,9 100 86 25 214 44 70 88 15 78 9 440 153 437 15 3 9
6713 age 30,6 69,4 100 54 71 100 5 25 92 49 95 6 1619 100 708 23 1 37
6646 opr 30,0 70,0 100 27 499 117 4 19 47 0 47 3 196 120 157 30 63 48
6487 mts 29,7 70,3 100 49 437 133 24 33 53 6 100 7 285 157 247 42 39 13
6581 sma 29,3 70,7 100 72 3805 100 5 16 97 2 94 6 211 134 138 1 35 35
6465 amd 28,7 71,3 100 28 311 113 12 25 90 17 94 2 176 146 161 26 17 38
6559 sho 28,0 72,0 100 60 252 100 8 28 100 4 73 0 100 113 100 23 45 29
6561 sgr 27,8 72,2 100 83 185 100 3 20 96 2 86 2 133 113 145 11 40 46
6452 cmi 27,3 72,7 100 49 110 111 33 45 100 20 100 4 100 100 100 10 9 73
6571 salb 26,7 73,3 100 73 129 100 0 12 100 7 92 0 112 100 118 12 40 36
6532 ksk 25,8 74,2 100 48 117 100 13 29 100 17 91 5 110 100 100 0 36 24
6733 ade 25,1 74,9 100 36 114 100 16 6 81 15 100 5 100 100 100 6 15 3
Total sans queue 3601 4547 4752 4168 3618 4358 3137 2959 2870 2430 3384 3477 4121 4601 3941 4159
bactéries sans queue 76 106 101 91 95 99 103 111 99 111 92 92 95 107 107 111
écart (moyenne) 47 43 47 46 38 44 30 27 29 22 37 38 43 43 37 37
queue 35 5 10 20 16 12 8 0 12 0 19 19 16 4 4 0
Moyenne du codon 120 81 97 30 180 104 247 202 123 125 69 50 38 58 66 55
codon tta ttg ctt cta ctg ctc aaa aag ttt ttc tct tca agt tcg tcc agc

Les coefficients de corrélation[modifier | modifier le wikicode]

  • Lien Tableur: Les coefficients de corrélation
  • Les valeurs présentées ici sont les coefficients de corrélation X 100. La corrélation entre 2 codons est celle de 2 colonnes du tableau des diagrammes normalisé. Pour obtenir les valeurs absolues il suffit de copier ce tableau (largeur de colonne 1.3 cm) et de remplacer le moins (-) par rien. Pour extraire le maximum d'une colonne il suffit de remplacer 100 par rien (format sans décimales et option de recherche 'cellule entière').
  • Légende:
  1. moyenne : moyenne des corrélations en valeurs absolues d'un codon.
  2. >74 : nombre de corrélations en valeurs absolues d'un codon supérieures à 0.74.
  3. >79 : nombre de corrélations en valeurs absolues d'un codon supérieures à 0.79.
  4. max : corrélation maximum parmi les valeurs absolues des corrélations d'un codon.

Tableau synthétique des diagrammes[modifier | modifier le wikicode]

Tableau des abscisses et maxima des courbes de tendance.[modifier | modifier le wikicode]
- (*): ttg et agg, sont reportés en %AT et tga en %GC.
- (75) abscisse sans maximum, valeur de max à 75.
- (75) abscisse supérieure à 75 pour le maximum, valeur de max à 75.
Tableau des abscisses et maxima des courbes de tendance
abscis max abscis max abscis max abscis max
ttt 75 288 tct 75 137 tat 75 261 tgt 75 51
ttc 75 231 tcc 67 107 tac 75 172 tgc 64 48
tta 75 389 tca 75 120 taa 75 5 tga* 75 3
ttg* 60 119 tcg 75 138 tag 75 1 tgg 75 89
ctt 63 153 cct 68 104 cat 73 91 cgt 56 134
ctc 75 289 ccc 75 140 cac 75 131 cgc 75 359
cta 71 54 cca 74 106 caa 75 174 cga 61 28
ctg 71 357 ccg 75 213 cag 68 213 cgg 75 131
att 75 369 act 75 137 aat 75 399 agt 75 78
atc 73 296 acc 75 238 aac 66 171 agc 61 75
ata 75 259 aca 75 129 aaa 75 622 aga 75 150
atg 51 168 acg 69 110 aag 75 314 agg* 59 36
gtt 68 211 gct 66 170 gat 70 329 ggt 63 183
gtc 75 328 gcc 75 405 gac 75 447 ggc 75 419
gta 70 143 gca 67 141 gaa 67 420 gga 75 157
gtg 70 236 gcg 75 287 gag 75 513 ggg 64 70
Caractérisation par les diagrammes et les coefficients de corrélation[modifier | modifier le wikicode]
  1. Le paramètre R2 est le coefficient de détermination des courbes de tendance. Pour comparaison avec le paramètre écart.
  2. Le paramètre queue a été déterminé à partir des courbes calculées à partir des coefficients du polynôme de degré 3 du diagramme de chaque codon. Voir le tableau de ces calculs. Il est exprimé ici en nombre de bactéries dont les effectifs des codons sont nulles ou très faibles au début des abscisses, voir le tableau de la 1ère détermination de ces queues avec des effectifs qui ne dépassent pas 3% du total. Sur 32 queues de longueur supérieure à 4, 5 seulement ont des effectifs qui dépassent 1% du total.
  3. Le paramètre écart est l'équivalent du R2 mais calculé pour les effectifs sans la queue du codon. C'est la moyenne des différences, en valeur absolue et en % par rapport à la valeur théorique, entre cette valeur théorique et l'effectif compté du codon. Quand une différence est très élevée à cause d'un effectif théorique très faible, elle est ignorée et la queue rallongée. Voir le tableau de ces calculs.
  4. Le paramètre abscis est l'abscisse du maximum de la courbe de tendance. Il est exprimé en %GC ou %AT. Voir le tableau de ces calculs. Pour les courbes sans maximum l'abscisse 75% (AT ou GC) est utilisée pour comparaison. Quand l'abscisse du maximum dépasse 75% elle est seulement indiquée sous la forme 75/xx où xx est l'abscisse en question.
  5. Le paramètre moyen, pour moyenne, est la moyenne du codon sur les 111 bactéries. C'est la somme des effectifs d'un codon divisé par 111.
  6. La colonne %: c'est le pourcentage d'un codon dans la constitution de son acide aminé.
  7. Le paramètre max est l'ordonnée de l'abscisse abscis. C'est le maximum de la courbe ou la valeur pour l'abscisse 75% quand ce maximum n'existe pas ou si son abscisse est supérieure à 75%.
  8. La colonne %moy c'est le rapport max/moyen dans le but de normaliser les courbes.
  9. La colonne cor>79 correspond au nombre de corrélations supérieures à 0.79 pour un codon donné avec les autres codons (l'identité exclue).
  10. La colonne cor tot correspond à la moyenne des corrélations d'un codon avec les autres codons. Cette moyenne est reportée en fin du tableau des corrélations.
111 bactéries. Caractérisation des codons par leurs diagrammes et leurs coefficients de corrélation.
codon R2 écart queue Moyen. % abscis max %moy. Cor>79 cor tot
act 891 38 14 68 21 75/82 137 200 10 64,1
acc 932 30 8 121 37 75 238 196 17 66,0
aca 884 38 18 65 20 75/78 129 198 6 63,0
acg 832 38 4 71 22 69 110 155 0 48,4
325
gct 911 30 9 108 22 66 170 156 4 56,8
gcc 931 28 9 164 33 75 405 247 17 66,9
gca 929 30 6 91 19 67 141 155 6 59,2
gcg 882 35 5 126 26 75 287 228 3 59,5
490
gtt 944 28 8 132 28 68 211 160 11 62,7
gtc 916 32 4 118 25 75 328 278 7 62,9
gta 888 45 13 84 18 70 143 171 0 58,4
gtg 907 39 5 137 29 70 236 172 0 60,1
471
ggt 900 30 0 142 31 63 183 129 0 39,6
ggc 956 42 0 169 37 75 419 248 28 68,6
gga 847 42 9 88 19 75/78 157 178 2 56,0
ggg 710 42 0 54 12 64 70 131 0 26,8
453
tta 925 47 35 120 20 75 389 324 13 61,2
ttg* 765 43 5 81 13 60 119 147 0 26,6
ctt 805 47 10 97 16 63 153 158 0 39,2
ctc 839 44 12 104 17 75 289 278 4 60,0
cta 756 46 20 30 5 71 54 183 0 51,5
ctg 878 38 16 180 30 71 357 198 6 61,9
611
agt 876 43 16 38 11 75/86 78 205 7 62,3
agc 857 37 0 55 16 61 75 136 0 42,6
tct 876 37 19 69 20 75 137 200 7 62,5
tcc 868 37 4 66 20 67 107 162 0 54,8
tca 893 38 19 50 15 75 120 240 12 63,5
tcg 853 43 4 58 17 75 138 236 3 58,2
336
aga 715 64 31 60 16 75 150 251 1 53,2
agg* 308 92 10 24 6 59 36 148 0 13,5
cgt 736 51 0 103 27 56 134 131 0 18,2
cgc 938 28 19 132 34 75 359 272 17 66,6
cga 571 66 0 20 5 61 28 136 0 22,4
cgg 699 56 20 44 12 75 131 297 0 48,5
383
111 bactéries. Caractérisation des codons par leurs diagrammes et leurs coefficients de corrélation.
codon R2 écart queue Moyen. % abscis max %moy. Cor>79 cor tot
atg 985 10 0 154 51 168 109 0 19,5
tgg 970 10 7* 71 75 89 125 0 43,2
tat 967 22 11 116 52 75 261 226 20 66,2
tac 927 25 0 107 48 75/83 172 161 8 60,1
222
cat 914 30 10 59 46 73 91 155 6 60,0
cac 962 20 0 70 54 75 131 189 19 66,2
128
caa 880 36 14 89 40 75/80 174 196 12 63,3
cag 964 26 0 132 60 68 213 161 21 66,3
220
aat 966 35 15 133 51 75 399 300 10 58,9
aac 951 21 0 128 49 66 171 133 8 57,6
261
aaa 957 30 8 247 55 75 622 252 11 62,7
aag 918 27 0 202 45 75/85 314 155 1 56,8
450
gat 965 23 0 217 52 70 329 152 21 65,8
gac 970 20 0 202 48 75 447 222 27 69,4
419
gaa 951 27 0 296 57 67 420 142 4 58,2
gag 924 30 0 226 43 75 513 227 6 61,7
521
ttt 947 29 12 123 50 75 288 235 15 63,7
ttc 963 22 0 125 50 75 231 185 25 67,8
248
tgt 850 37 19 27 46 75 51 193 5 57,8
tgc 874 37 5 31 54 64 48 154 0 53,3
58
att 913 30 9 168 39 75 369 219 13 63,2
atc 938 26 2 181 42 73 296 163 11 63,8
ata 691 80 31 84 19 75 259 310 0 44,3
433
tga* 727 104 2 75 3 180 1 44,8
taa 835 42 3 75/77 5 151 1 42,0
tag 488 129 1 75 1 95 0 9,3
cct 941 32 8 65 23 68 104 160 11 63,0
ccc 735 62 9 61 21 75 140 228 1 53,9
cca 851 39 19 58 20 74 106 182 3 60,2
ccg 885 40 8 101 35 75/82 213 210 7 61,3
286
Diagramme corcodon[modifier | modifier le wikicode]

Tableaux des parallèles. Diagramme / coefficient de corrélation[modifier | modifier le wikicode]

  • Voir l'article pour la définition des paramètres pour l'établissement des matrices du paramètre diag. Ces paramètres sont donnés avant la matrice pour être utilisés dans un tableur.
  1. écart: C'est la moyenne des différences, en valeur absolue et en % par rapport à la valeur théorique, entre cette valeur théorique et l'effectif compté du codon. Voir le tableau de ces calculs.
  2. q3: C'est la cotation du paramètre queue, nombre de bactéries, en continu, ayant des effectifs faibles ou nuls. Le tableau des cotations pour les paramètres q3 et a3 donne la correspondance entre le %AT ou le %GC et le rang de la dernière bactérie de la queue avant le décollage de la courbe. Voir le tableau de ces calculs.
  3. a3: Cotation du paramètre abscis, abscisse du maximum de la courbe de tendance. Il est exprimé en %GC ou %AT. Voir le tableau de ces calculs. Le tableau des cotations pour les paramètres q3 et a3 donne la correspondance entre a3 et abscis.
  4. moyen.: pour moyenne, est la moyenne des effectifs du codon sur les 111 bactéries. En tant que moyenne ce paramètre n'a pas de sens biologique, car que veut dire l'absence d'un codon pour une bactérie donnée? Par contre la somme des effectifs correspond en mathématique à l'intégrale d'une courbe continue.C'est une caractéristique mathématique du diagramme. Voir calculs.
cor>79: nombre de coefficients du codon supérieurs à 79; pour illustration. Voir le tableau des coefficients.
cor tot: corrélation moyenne, moyenne des valeurs absolues des coefficients (multipliés par 100) du codon; pour illustration. Voir calculs.
Matrice de calcul du paramètre diag %AT (diagramme)[modifier | modifier le wikicode]
diag = 200*(abs((e1-e2)/(e1+e2))+abs((q31-q32)/(q31+q32))+abs((a31-a32)/(a31+a32))+abs((moyen1-moyen2)/(moyen1+moyen2))).
La matrice de calcul de diag est une matrice symétrique dont la diagonale est nulle.
Matrice de calcul du paramètre diag %GC (diagramme)[modifier | modifier le wikicode]
diag = 200*(abs((e1-e2)/(e1+e2))+abs((q31-q32)/(q31+q32))+abs((a31-a32)/(a31+a32))+abs((moyen1-moyen2)/(moyen1+moyen2))).
La matrice de calcul de diag est une matrice symétrique dont la diagonale est nulle.
Paramètres q3 a3[modifier | modifier le wikicode]
  • Lien Tableur: Paramètres q3 a3
  • Légende: voir caractérisation des codons et tableaux des parallèles.
  • Notes pour les diagrammes %AT: */86 abscisse optimale, 86 abscisse maximale, ttg* et agg* reportés en %AT au lieu de en %GC.
  • Notes pour les diagrammes %GC: */85 abscisse optimale non considérée pour les calculs, 75 abscisse maximale, tga* reporté en %GC au lieu de en %AT.
  • Tableaux non formatés du 13.3.17
111 bactéries: Caractérisation des codons . Diagrammes %AT. Cotation de queue, écart et abscisse.
codon queue rang q3 écart abscis a3 Moyen. Cor>79 Cor tot
aaa 29,3 8 11 30 86 5 247 11 62,7
aat 32,6 15 17 35 86 5 133 10 58,9
aca 34,6 18 20 38 78 11 65 6 63,0
act 31,9 14 17 38 82 8 68 10 64,1
aga 40,9 31 35 64 86 5 60 1 53,2
agg* 30,0 10 14 92 59 32 24 0 13,5
agt 33,4 16 20 43 */86 5 38 7 62,3
ata 40,9 31 35 80 86 5 84 0 44,3
att 29,7 9 11 30 86 5 168 13 63,2
caa 31,9 14 17 36 80 11 89 12 63,3
cat 30,0 10 14 30 73 17 59 6 60,0
cca 35,0 19 23 39 74 17 58 3 60,2
cct 29,3 8 11 32 68 23 65 11 63,0
cga 25,1 0 5 66 61 29 20 0 22,4
cgt 25,1 0 5 51 56 35 103 0 18,2
cta 35,7 20 23 46 71 20 30 0 51,5
ctt 30,0 10 14 47 63 26 97 0 39,2
gaa 25,1 0 5 27 67 23 296 4 58,2
gat 25,1 0 5 23 70 20 217 21 65,8
gca 28,0 6 8 30 67 23 91 6 59,2
gct 29,7 9 11 30 66 23 108 4 56,8
gga 29,7 9 11 42 78 11 88 2 56,0
ggt 25,1 0 5 30 63 26 142 0 39,6
gta 31,4 13 17 45 70 20 84 0 58,4
gtt 29,3 8 11 28 68 23 132 11 62,7
taa 25,1 0 5 42 77 14 3 1 42,0
tat 30,6 11 14 22 86 5 116 20 66,2
tca 35,0 19 23 38 86 5 50 12 63,5
tct 35,0 19 23 37 86 5 69 7 62,5
tgt 35,0 19 23 37 86 5 27 5 57,8
tta 42,8 35 38 47 86 5 120 13 61,2
ttg* 27,8 5 8 43 60 29 81 0 26,6
ttt 31,1 12 14 29 86 5 123 15 63,7
111 bactéries: Caractérisation des codons . Diagrammes %GC. Cotation de queue, écart et abscisse.
codon queue rang q3 écart abscis a3 Moyen. Cor>79 Cor tot
aac 13,5 0 5 21 66 14 128 8 57,6
aag 13,5 0 5 27 */85 5 202 1 56,8
acc 26,2 8 11 30 75 5 121 17 66,0
acg 23,7 4 8 38 69 11 71 0 48,4
agc 13,5 0 5 37 61 17 55 0 42,6
atc 16,6 2 5 26 73 5 181 11 63,8
atg 13,5 0 5 10 51 29 154 0 19,5
cac 13,5 0 5 20 75 5 70 19 66,2
cag 13,5 0 5 26 68 11 132 21 66,3
ccc 26,3 9 11 62 75 5 61 1 53,9
ccg 26,2 8 11 40 */82 5 101 7 61,3
cgc 31,4 19 23 28 75 5 132 17 66,6
cgg 32,1 20 23 56 75 5 44 0 48,5
ctc 28,3 12 14 44 75 5 104 4 60,0
ctg 29,9 16 20 38 71 8 180 6 61,9
gac 13,5 0 5 20 75 5 202 27 69,4
gag 13,5 0 5 30 75 5 226 6 61,7
gcc 26,3 9 11 28 75 5 164 17 66,9
gcg 24,2 5 8 35 75 5 126 3 59,5
ggc 13,5 0 5 42 75 5 169 28 68,6
ggg 13,5 0 5 42 64 14 54 0 26,8
gtc 23,7 4 8 32 75 5 118 7 62,9
gtg 24,2 5 8 39 70 8 137 0 60,1
tac 13,5 0 5 25 */83 5 107 8 60,1
tag 13,5 0 5 129 75 5 1 0 9,3
tcc 23,7 4 8 37 67 11 66 0 54,8
tcg 23,7 4 8 43 75 5 58 3 58,2
tga* 13,5 0 5 104 75 5 2 1 44,8
tgc 24,2 5 8 37 64 14 31 0 53,3
tgg 13,5 0 5 10 75 5 71 0 43,2
ttc 13,5 0 5 22 75 5 125 25 67,8
Tableaux des parallèles %AT[modifier | modifier le wikicode]
  • Lien Tableur: Tableaux des parallèles %AT
  • Ces 30 parallèles sont faits pour les couples dont le paramètre diag est inférieur à 100. Le paramètre cor est tiré du tableau des corrélations et les autres paramètres sont ceux du tableau synthétique.
  • Légende: voir caractérisation des codons et tableaux des parallèles.
  • diag/cor la 1ère ligne indique la valeur de diag la 2ème, la corrélation entre les 2 codons du parallèle.
  • Nota: ici l’abscisse du maximum peut aller jusqu'à 86% AT car les bactéries peuvent atteindre ce taux. Quand la courbe de tendance n'a pas de maximum c'est ce taux qui est indiqué. Si le maximum a exactement 86% alors c'est indiqué sous la forme */86.
  • Les 2 tableaux non formatés du 15.3.17
111 bactéries: Caractérisation des codons . Parallèle diagramme %AT / coefficient de corrélation. 2/2.
codon écart queue Moyen. abscis Cor>79 cor tot diag/cor
tca 38 19 50 86 12 63,5 64
tgt 37 19 27 86 5 57,8 62
gta 45 13 84 70 0 58,4 64
ctt 47 10 97 63 0 39,2 49
tgt 37 19 27 86 5 57,8 66
agt 43 16 38 86 7 62,3 72
cct 32 8 65 68 11 63,0 70
cat 30 10 59 73 6 60,0 74
ttg* 43 5 81 60 0 26,6 71
gca 30 6 91 67 6 59,2 36
gca 30 6 91 67 6 59,2 71
cct 32 8 65 68 11 63,0 79
cca 39 19 58 74 3 60,2 71
aca 38 18 65 78 6 63,0 75
gtt 28 8 132 68 11 62,7 76
gca 30 6 91 67 6 59,2 83
cca 39 19 58 74 3 60,2 78
cat 30 10 59 73 6 60,0 62
tat 22 11 116 86 20 66,2 78
aat 35 15 133 86 10 58,9 92
tct 37 19 69 86 7 62,5 79
act 38 14 68 82 10 64,1 79
att 30 9 168 86 13 63,2 79
aat 35 15 133 86 10 58,9 85
gtt 28 8 132 68 11 62,7 82
cct 32 8 65 68 11 63,0 81
gta 45 13 84 70 0 58,4 87
caa 36 14 89 80 12 63,3 65
ata 80 31 84 86 0 44,3 95
tta 47 35 120 86 13 61,2 62
111 bactéries: Caractérisation des codons . Parallèle diagramme %AT / coefficient de corrélation. 1/2.
codon écart queue Moyen. abscis Cor>79 cor tot diag/cor
gtt 28 8 132 68 11 62,7 27
gct 30 9 108 66 4 56,8 84
tat 22 11 116 86 20 66,2 33
ttt 29 12 123 86 15 63,7 91
tct 37 19 69 86 7 62,5 34
tca 38 19 50 86 12 63,5 70
att 30 9 168 86 13 63,2 38
aaa 30 8 247 86 11 62,7 83
ttt 29 12 123 86 15 63,7 45
aat 35 15 133 86 10 58,9 91
gct 30 9 108 66 4 56,8 49
gca 30 6 91 67 6 59,2 75
aca 38 18 65 78 6 63,0 53
caa 36 14 89 80 12 63,3 73
aca 38 18 65 78 6 63,0 54
act 38 14 68 82 10 64,1 69
tca 38 19 50 86 12 63,5 55
agt 43 16 38 86 7 62,3 75
gct 30 9 108 66 4 56,8 56
cct 32 8 65 68 11 63,0 85
aga 64 31 60 86 1 53,2 56
ata 80 31 84 86 0 44,3 76
gaa 27 0 296 67 4 58,2 58
gat 23 0 217 70 21 65,8 79
caa 36 14 89 80 12 63,3 59
gga 42 9 88 78 2 56,0 56
att 30 9 168 86 13 63,2 60
ttt 29 12 123 86 15 63,7 87
act 38 14 68 82 10 64,1 62
caa 36 14 89 80 12 63,3 80
Tableaux des parallèles %GC[modifier | modifier le wikicode]
  • Lien Tableur: Tableaux des parallèles %GC
  • Ces 30 parallèles sont faits pour les couples dont le paramètre diag est inférieur à 100. Le paramètre cor est tiré du tableau des corrélations et les autres paramètres sont ceux du tableau synthétique.
  • Légende: voir caractérisation des codons et tableaux des parallèles.
  • diag/cor la 1ère ligne indique la valeur de diag la 2ème, la corrélation entre les 2 codons du parallèle.
  • Nota: ici l’abscisse du maximum peut aller jusqu'à 75% GC car les bactéries peuvent atteindre ce taux. Quand la courbe de tendance n'a pas de maximum c'est ce taux qui est indiqué. Si le maximum a une abscisse supérieure à 75% alors cette abscisse est indiquée sous la forme */xx où xx est l'abscisse en question. Cela reste une caractéristique de la courbe même si biologiquement cette abscisse n'est pas atteinte.
  • Tableaux non formatés du 15.3.17
111 bactéries: Caractérisation des codons . Parallèle diagramme %GC / coefficient de corrélation. 2/2.
codon écart queue Moyen. abscis cor>79 cor tot diag/cor
gag 30 0 226 75 6 61,7 51
gac 20 0 202 75 27 69,4 81
ttc 22 0 125 75 25 67,8 54
atc 26 2 181 73 11 63,8 89
tac 25 0 107 75/83 8 60,1 54
atc 26 2 181 73 11 63,8 66
ggc 42 0 169 75 28 68,6 55
atc 26 2 181 73 11 63,8 84
ttc 22 0 125 75 25 67,8 56
gac 20 0 202 75 27 69,4 91
ggc 42 0 169 75 28 68,6 62
gag 30 0 226 75 6 61,7 73
ggc 42 0 169 75 28 68,6 63
aag 27 0 202 75/85 1 56,8 68
tga* 104 2 75 1 44,8 66
tag 129 1 75 0 9,3 11
gtg 39 5 137 70 0 60,1 66
gcg 35 5 126 75 3 59,5 69
tac 25 0 107 75/83 8 60,1 67
aag 27 0 202 75/85 1 56,8 77
tac 25 0 107 75/83 8 60,1 67
cac 20 0 70 75 19 66,2 92
ttc 22 0 125 75 25 67,8 67
cac 20 0 70 75 19 66,2 87
gcg 35 5 126 75 3 59,5 67
ccg 40 8 101 75/82 7 61,3 89
ttc 22 0 125 75 25 67,8 67
aag 27 0 202 75/85 1 56,8 80
gtc 32 4 118 75 7 62,9 71
ccg 40 8 101 75/82 7 61,3 75
111 bactéries: Caractérisation des codons . Parallèle diagramme %GC / coefficient de corrélation. 1/2.
codon écart queue Moyen. abscis cor>79 cor tot diag/cor
tcc 37 4 66 67 0 54,8 9
acg 38 4 71 69 0 48,4 40
aag 27 0 202 75/85 1 56,8 14
atc 26 2 181 73 11 63,8 66
gtc 32 4 118 75 7 62,9 17
gcg 35 5 126 75 3 59,5 71
gag 30 0 226 75 6 61,7 23
aag 27 0 202 75/85 1 56,8 76
gac 20 0 202 75 27 69,4 29
aag 27 0 202 75/85 1 56,8 73
ttc 22 0 125 75 25 67,8 30
tac 25 0 107 75/83 8 60,1 82
agc 37 0 55 61 0 42,6 34
ggg 42 0 54 64 0 26,8 26
ctc 44 12 104 75 4 60,0 35
ccg 40 8 101 75/82 7 61,3 58
gac 20 0 202 75 27 69,4 36
atc 26 2 181 73 11 63,8 80
gcc 28 9 164 75 17 66,9 36
acc 30 8 121 75 17 66,0 89
gag 30 0 226 75 6 61,7 37
atc 26 2 181 73 11 63,8 66
gtc 32 4 118 75 7 62,9 39
acc 30 8 121 75 17 66,0 78
ccg 40 8 101 75/82 7 61,3 47
acc 30 8 121 75 17 66,0 74
aac 21 0 128 66 8 57,6 50
cag 26 0 132 68 21 66,3 79
gcg 35 5 126 75 3 59,5 51
acc 30 8 121 75 17 66,0 67
Diagramme diagcor-gc[modifier | modifier le wikicode]
Diagramme diagcor-at[modifier | modifier le wikicode]

Caractérisation des aas par les courbes et les coefficients de corrélation[modifier | modifier le wikicode]

Tableau des diagrammes aas DRNA[modifier | modifier le wikicode]

Courbes à partir des équations de tendance[modifier | modifier le wikicode]

Moyenne des écarts par rapport à la courbe théorique[modifier | modifier le wikicode]

Taux de variation des acides aminés[modifier | modifier le wikicode]

  1. écart*: moyenne des écarts de l'aa calculée ci-dessus
  2. ax et cte: de l'équation de la courbe de tendance linéaire, "effectif de l'aa" = ax+cte. A calculer à partir du tableau des diagrammes des aas. Le signe de ax indique le sens de la variation de l'aa.
  3. Max et Min (avec ou sans zin et crp) sont en fin du tableau des diagrammes des aas.
  4. Les bactéries zin et crp sont extrêmes, ce qui fait que le Maximum et le minimum sans eux ne concernent que 109 bactéries et avec les écart* faibles, le rapport M/m (Maximum sur minimum) reflète mieux la courbe de tendance linéaire.
Tableau des taux de variation des aas
Sans zin ni crp −Avec zin et crp
ax cte écart* Max min M/m −Max min M/m
A 7.49 131 8.4 693 221 3.1 693 91 7.6
C -0.24 69 25.3 121 21 5.7 121 21 5.7
D 1.61 342 7.5 526 292 1.8 526 148 3.6
E 0.77 485 7.6 694 340 2.0 694 196 3.5
F -1.88 338 7.8 326 171 1.9 599 171 3.5
G 3.54 284 4.0 538 309 1.7 538 217 2.5
H 0.42 109 8.0 162 92 1.8 162 61 2.7
I -7.34 785 7.6 767 261 2.9 1074 261 4.1
K -8.17 840 11.0 783 229 3.4 1263 229 5.5
L 0.35 595 4.4 753 543 1.4 753 543 1.4
M 0.40 135 10.2 207 97 2.1 207 70 2.9
N -5.58 528 9.0 544 123 4.4 864 123 7.0
P 2.61 161 4.8 401 190 2.1 401 113 3.6
Q 0.47 198 12.0 302 148 2.0 302 97 3.1
R 4.79 154 7.3 546 221 2.5 546 128 4.3
S -1.72 418 8.5 496 220 2.3 496 220 2.3
T 1.14 271 7.5 391 231 1.7 391 174 2.2
V 3.09 323 4.8 588 255 2.3 588 134 4.4
W 0.48 51 8.6 117 54 2.2 117 50 2.3
Y -2.22 329 7.8 306 149 2.1 399 149 2.7
  • Tableau non formaté

Les coefficients de corrélation entre aas[modifier | modifier le wikicode]

  • Lien Tableur: Les coefficients de corrélation entre aas
  • Les valeurs présentées ici sont les coefficients de corrélation X 100. La corrélation entre 2 aas est celle de 2 colonnes du tableau des diagrammes des aas. Pour obtenir les valeurs absolues il suffit de copier ce tableau (largeur de colonne 1.3 cm) et de remplacer le moins (-) par rien. Pour extraire le maximum d'une colonne il suffit de remplacer 100 par rien (format sans décimales et option de recherche 'cellule entière').
  • Légende:
  1. moyenne : moyenne des corrélations en valeurs absolues d'un aa.
  2. >74 : nombre de corrélations en valeurs absolues d'un aa supérieures à 0.74.
  3. >79 : nombre de corrélations en valeurs absolues d'un aa supérieures à 0.79.
  4. max : corrélation maximum parmi les valeurs absolues des corrélations d'un aa.

Diagramme coraa[modifier | modifier le wikicode]

Synthèse des corrélations des codons et des aas[modifier | modifier le wikicode]

Tableau synthétique[modifier | modifier le wikicode]
  • Lien Tableur: Tableau synthétique
  • Tableau synthétique non formaté
  • Légende: corrélations en valeur absolue et multipliée par 100 entre 2 aas ou 2 codons.
  1. Corrélations entre aas (acides aminés): d'après la matrice des corrélations.
    1. moy : moyenne des corrélations d'un aa.
    2. >74−79 : nombre de corrélations d'un aa supérieures à 0.74 − dont corrélations supérieures à 0.79.
    3. max : corrélation maximum d'un aa.
  2. Corrélations entre codons
    1. t,c,a,g,t/c,a/g : terminaison des codons (t/c pour t ou c), pour lesquels on a la moyenne "moy" sous moyt (comme pour les aas) et le nombre ">74−79" sous >74−79t (comme pour les aas).
    2. moyt : total des moyennes "moy" des codons d'un aa.
    3. >74−79t  : total des nombres ">74−79" des codons d'un aa.
    4. 0-70 : pour un codon, zéro corrélations supérieures à 0.74 − avec une corrélation maximale (en valeur absolue) de 0.70.
    5. stop : les codons stops. Les codons taa et tga ont une seule corrélation supérieure à 0.74 et c'est celle entre eux. Elle est négative (*). Sont indiqués aussi le maximum de tag et les maxima de taa et tga en dehors de leur corrélation de -0.802.
  3. Résumés :
    1. moyn : nombre des moyennes "moy" pour une gamme donnée en en-tête de la colonne.
    2. 74n : nombre des nombres ">74−79" pour une gamme donnée en en-tête de la colonne.
    3. 74t : total des corrélations supérieures à 0.74 seulement, des codons d'un aa.
    4. moyt : déjà défini dans codons
    5. %total: 20 aas et 61 codons (pour les aas).
  4. Résumé III: La corrélation entre aas traduit peu la corrélation qui existe entre codons. Ainsi
    1. Les aas à un codon, M W, sont peu corrélés avec les autres aas et peu corrélés avec les autres codons;
    2. Les aas, A F I P V Y, sont très corrélés avec les autres aas et leurs codons sont très corrélés avec les autres codons;
    3. Les aas, G K N R, sont très corrélés avec les autres aas et leurs codons sont peu corrélés avec les autres codons;
    4. Les aas, C D E H L Q S T, sont peu corrélés avec les autres aas et leurs codons sont très corrélés avec les autres codons.
111 bactéries: Caractérisation des aas . Coefficients de corrélation codons / aas.
A C D E F G H I K L M N P Q R S T V W Y
aas
moy 61 20 51 26 59 62 40 65 64 13 35 62 60 32 56 31 46 58 38 55
>74−79 7−7 0 1−0 0 7−5 9−9 0 9−9 9−9 0 0 9−9 9−8 0 8−7 0 0 7−6 0 7−7
max 38 74 56 66 35 54 54 57 67 68
codons
moyt 242 111 135 120 131 191 126 171 119 300 19 116 238 130 222 344 242 244 43 126
t 57 58 66 - 64 40 60 63 - 39 - 59 63 - 18 63 64 63 - 66
c 67 53 69 - 68 69 66 64 - 60 - 58 54 - 67 55 66 63 - 60
a 59 - - 58 - 56 - 44 63 51 - - 60 63 22 64 63 58 - -
g 59 - - 62 - 27 - - 57 62 19 - 61 66 49 58 48 60 43 -
t/a 61 53 62
c/g 27 13 43
>74−79t 62−30 8−5 65−48 25−10 56−40 40−30 44−25 50−24 28−12 47−23 0−0 27−18 51−22 50−33 33−18 75−29 76−33 65−18 0−0 48−28
t 7 −4 8−5 28−21 - 22−15 0-70 14 −6 23−13 - 0-69 - 13−10 21−11 - 0-70 16 −7 25 −10 19−11 - 31−20
c 33−17 0-72 37−27 - 34−25 33−28 30−19 26−11 - 9 −4 - 14 −8 1 −1 - 29−17 4 −76 30−17 24 −7 - 17 −8
a 13 −6 - - 8 −4 - 6 −2 - 1 −76 20−11 0-69 - - 12 −3 21−12 0-46 27−12 21 −6 10 −78 - -
g 9 −3 - - 17−6 - 1-75 - - 8 −1 20 −6 0-55 - 17 −7 29−21 1 −75 8 −3 0-73 12 −77 0-72 -
t/a 18−13 2 −1 20 −7
c/g 0-52 0-43 0-65
Stop max suivant max
taa 80* 60 tag 48
tga 80* 62 * taa/tga= -80.2
I Résumés
codons >27 26-12 10-6 4-0 codons >58 57-51 <49 aas 7-9 1 0 aas >58 57-51 <49
74n 11 23 9 18 moyn 40 8 13 74n 10 1 9 moyn 8 3 9
II +faibles 74n %total moyn %total +forts 74n %total moyn %total
gamme <3 <33 >12/7 >54
codons 17 28 % 6 10 % 34 56 % 45 74 %
aas 10 50 % 5 25 % 10 50 % 10 50 %
III A C D E F G H I K L M N P Q R S T V W Y
aas
>74 7 1 7 9 9 9 9 9 8 7 7
moy 61 20 51 26 59 62 40 65 64 13 35 62 60 32 56 31 46 58 38 55
codons
74t 62 8 65 25 56 40 44 50 28 47 0 27 51 50 33 75 76 65 0 48
moyt 242 111 135 120 131 191 126 171 119 300 19 116 238 130 222 344 242 244 43 126
Repartition des fréquences de corrélation des aas et des codons[modifier | modifier le wikicode]
  • Lien Tableur: Repartition des fréquences de corrélation des aas et des codons
  • Les effectifs ou fréquence (fr) sont comptés à partir des matrices des coefficients de corrélation des aas et des codons. La matrice est formatée sans décimales et copiée dans 'writer'. L'effectif d'une corrélation donnée (exemple 3) est affiché (18) quand on exécute la recherche sur la matrice de cette corrélation avec l'option 'tout rechercher'.
  • Légende :
  1. cor : corrélation
  2. fr : fréquence
  • Les diagrammes: Repartition des corrélations codons et aas. Dans le même tableau de diagrammes: Fréquences des corrélations entre codons, Répartition des corrélations entre codons, Fréquences des corrélations entre aas, Répartition des corrélations entre aas
  • Fréquences des corrélations entre codons (multipliées par 100).
  • Fréquences des corrélations entre aas (multipliées par 100).
Tableaux triés des corrélations des aas et des codons entre eux[modifier | modifier le wikicode]
Tableau trié des corrélations des aas entre eux[modifier | modifier le wikicode]
voir ici
  • Tableau non formaté
Tableau trié des corrélations des codons entre eux[modifier | modifier le wikicode]
Un tableau de cette taille formaté avec wikipédia serait très compliqué à faire. Aussi j'ai opté de prendre une image de ce tableau formaté sous le tableur calc de LibreOffice.
  • Image du tableau formaté:
    voir ici
  • Construction: 3 lignes-colonnes sont ajoutées pour trier les codons. La L-C "ordre original" sert à retrouver l’ordre de la matrice des corrélations entre codons. Elle est numérotée de 1 à 64 de façon progressive sur cette matrice. Les 2 autres L-C "ordres optimisés" séparent les numéros des codons se terminant par "a,t" (en incluant agg, ttg et en excluant tga) des numéros des codons se terminant par "g,c" (en procédant de façon inverse pour agg, ttg et tga).
  • Tri sur les valeurs les plus élevées des corrélations: les numéros des 2 L-C sont obtenus par estimation de l'ordre des codons suivant le classement de leurs corrélations positives avec les autres codons. Le tableau final est optimisé pour avoir des groupes de codons fortement corrélés entre eux, les plus grands possibles. Voici ci-dessous les ordres estimés et optimisés obtenus, à recopier dans un tableur. Les codons ayant beaucoup de corrélations alternées, positives et négatives, ne sont pas inclus, c'est à dire atg, tag, ctg, agg. Les tris ne concernent alors que 2 carrés à corrélations positives de 29X29 codons.
Tableaux triés, connexions entre codons et aas[modifier | modifier le wikicode]
Tableau trié des 10 aas fortement corrélés entre eux[modifier | modifier le wikicode]
I K N F Y G A P V R D
I 92 93 83 82 -93 -89 -89 -90 -83 -72
K 92 86 80 84 -90 -88 -85 -83 -86 -72
N 93 86 81 81 -90 -81 -87 -90 -85 -60
F 83 80 81 71 -80 -70 -74 -80 -66 -74
Y 82 84 81 71 -84 -84 -80 -72 -80 -62
G -93 -90 -90 -80 -84 90 88 82 86 65
A -89 -88 -81 -70 -84 90 84 73 83 63
P -89 -85 -87 -74 -80 88 84 80 89 51
V -90 -83 -90 -80 -72 82 73 80 77 61
R -83 -86 -85 -66 -80 86 83 89 77 43
D -72 -72 -60 -74 -62 65 63 51 61 43
  • Distribution des fréquences entre ces 10 aas et le total
fréquences des corrélations en valeur absolue					
cor	aas10	aas	cor	aas10	aas
93	2	2	78	0	0
92	1	1	77	1	1
91	0	0	76	0	0
90	5	5	75	0	0
89	3	3	74	1	2
88	2	2	73	1	1
87	1	1	72	1	3
86	3	3	71	1	1
85	2	2	70	1	1
84	4	4	69	0	0
83	4	4	68	0	1
82	2	2	67	0	1
81	3	3	66	1	3
80	6	6	65	0	1
79	0	0	64	0	0
Tableaux triés de groupes de codons fortement corrélés entre eux[modifier | modifier le wikicode]
Y F N L K I S
codon tat ttt aat tta aaa att tca
Y tat 91 92 90 91 86 81
F ttt 91 91 85 93 87 79
N aat 92 91 91 92 85 79
L tta 90 85 91 84 85 81
K aaa 91 93 92 84 83 78
I att 86 87 85 85 83 82
S tca 81 79 79 81 78 82
Tableau non formaté: voir tableur
  • Tableau formaté de 8 codons moyennement corrélés se terminant par a,t.
D V Q T P A A H
codon gat gtt caa act cct gca gct cat
D gat 85 83 81 83 81 81 87
V gtt 85 71 82 81 83 84 69
Q caa 83 71 80 71 66 72 81
T act 81 82 80 77 74 82 69
P cct 83 81 71 77 79 85 74
A gca 81 83 66 74 79 75 69
A gct 81 84 72 82 85 75 66
H cat 87 69 81 69 74 69 66
Tableau non formaté: voir tableur
  • Tableau formaté de 12 codons fortement corrélés se terminant par g,c.
V Y L I T A Q R H G F D
codon gtc tac ctg atc acc gcc cag cgc cac ggc ttc gac
V gtc 64 62 77 78 84 71 80 78 83 82 87
Y tac 64 66 66 73 68 76 67 92 70 82 84
L ctg 62 66 75 88 76 90 77 76 83 74 78
I atc 77 66 75 82 79 79 82 76 84 89 80
T acc 78 73 88 82 89 86 81 84 86 81 87
A gcc 84 68 76 79 89 78 87 79 88 83 87
Q cag 71 76 90 79 86 78 82 83 85 83 84
R cgc 80 67 77 82 81 87 82 80 96 85 87
H cac 78 92 76 76 84 79 83 80 81 87 92
G ggc 83 70 83 84 86 88 85 96 81 87 90
F ttc 82 82 74 89 81 83 83 85 87 87 91
D gac 87 84 78 80 87 87 84 87 92 90 91
Tableau non formaté: voir tableur
Les Corrélations faibles entre codons[modifier | modifier le wikicode]
Les 2 groupes de corrélations faibles
cta ata ctt ggt taa ggg tgg agc tga cgg acg tgc tcc
cta 41 41 43 37 -16 -29 -39 -45 -44 -46 -56 -57
ata 41 28 1 15 -20 -40 -35 -21 -38 -51 -38 -44
ctt 41 28 25 22 -11 -19 -9 -34 -40 -35 -22 -29
ggt 43 1 25 53 -39 -18 -28 -45 -55 -32 -49 -33
taa 37 15 22 53 -26 -38 -21 -80 -44 -40 -41 -45
ggg -16 -20 -11 -39 -26 37 26 15 75 24 30 36
tgg -29 -40 -19 -18 -38 37 33 43 50 44 34 52
agc -39 -35 -9 -28 -21 26 33 23 29 31 62 39
tga -45 -21 -34 -45 -80 15 43 23 44 42 37 44
cgg -44 -38 -40 -55 -44 75 50 29 44 46 42 50
acg -46 -51 -35 -32 -40 24 44 31 42 46 44 40
tgc -56 -38 -22 -49 -41 30 34 62 37 42 44 65
tcc -57 -44 -29 -33 -45 36 52 39 44 50 40 65
mcor 51.5 44.3 39.2 39.6 42.0 26.8 43.2 42.6 44.8 48.5 48.4 53.3 54.8
  • Tableau non formaté: voir tableur
Corrélations isolées, fortes et faibles entre codons[modifier | modifier le wikicode]
ccg	ccg	aga	aac	caa	tct
gcg	ggc	gga	cac	att	tgt
89	84	83	83	83	82
					
caa	tat	gag	ttt	gct	gct
tta	agt	cac	tgt	aat	aac
81	81	81	80	40	-50
					
tga	cgt	tga	cgt	cgg	ata
taa	atg	gtc	ggt	ggg	aga
-80	55	60	70	75	76
Codons ne suivant pas le processus GC[modifier | modifier le wikicode]
  • Légende: mcod, moyenne du codon − mcor, moyenne des corrélations en valeurs absolues du codon − 7 cod dans le carré des 7 codons − seul, corrélation solitaire forte − max, corrélation maximum en dehors de la solitaire.
  • tga est l’équivalent de taa puisque il y a revirement total.
  • Alors que ttg se comporte comme cga, mais à l’envers.
  • Donc il y a 6 indéterminés : ttg cga cgt agg tag atg.
  • taa et ggg sont normaux donc ont un total de 63 codons pour le décompte des processus.
  • Les 7 codons ont un total de 57 codons en dehors des 7.
  • Il y a une inconnue sur le processus de la corrélation dans le carré des 7 codons.
7 codons ne suivant pas le processus GC
Processus Corrélations sup 0.40 Notes
mcod mcor non GC GC non GC GC 7 cod seul max
taa 3 42.0 4 59 0 44 - 80 tga - 60 gag
ttg 81 26.6 53 4 9 0 1 52 gct
cga 20 22.4 4 53 0 2 1 46 ttg
cgt 103 18.2 19 38 2 3 1 70 ggt 55 atg
agg 24 13.5 36 21 1 0 0 43 ata
tag 1 9.3 34 23 0 1 0 - 48 taa
atg 154 19.5 12 45 0 4 1 55 cgt - 46 aat
ggg 54 26.8 2 61 0 4 75 cgg 57 ccc
tga 2 44.8 57 0 49 0 0 - 80 taa - 62 gaa

Corrélations entre bactéries et conformation des protéines[modifier | modifier le wikicode]

Conformation des protéines par le nombre d'aas et de codons[modifier | modifier le wikicode]

  • Légende:La conformation moyenne des 6 protéines étudiées peut être représentée par les moyennes des aas calculées dans le tableau des diagrammes des aas. Pour chaque bactérie j'ai fait le diagramme "moyenne de l'aa" /"effectif de son aa correspodant"; La conformation moyenne des 6 protéines pour cette bactérie peut être alors représentée par les 3 paramètres de la droite de tendance de ce diagramme. A savoir:
  1. R2: coefficient de détermination de la droite (ici multiplié par 100)
  2. a: la pente de la droite (ici notée ax).
  3. b: la constante de la droite.

Les 3 paramètres sont reportés tels quels en fonction du contenu en GC (%GC) des bactéries dans les diagrammes des chapitres suivants.

  • La conformation des gènes des 6 protéines est étudiée de la même manière qu'avec les aas, mais ici je considère les 64 codons d'après le tableau des diagrammes des codons.
  • Dans le chapitre des exemples qui suit sont représentés 12 tableaux de ces diagrammes.
Conformation des protéines par le nombre d'aas[modifier | modifier le wikicode]
Conformation des protéines par le nombre de codons[modifier | modifier le wikicode]
  • Lien Tableur: Conformation des protéines par le nombre de codons
  • format2 : voir 2ème diagramme.
  • Voir la légende
  • Ce diagramme est l'équivalent de celui des aas car il réunit tout les codons. Les 2 diagrammes sont cependant très différents par la grande variance de R2 avec les codons, somme de 2 variances opposées que sont celle des triplets bbc,g et celle des bbt,a, et une très faible variance de R2 avec les aas, nécessaire au maintient des fonctions de ces 6 protéines.
Conformation des protéines par le nombre de codons bbc,g[modifier | modifier le wikicode]
Conformation des protéines par le nombre de codons bbt,a[modifier | modifier le wikicode]
Conformation, récapitulatif[modifier | modifier le wikicode]
  • La colonne 3° R2 correspond au coefficient de détermination d'un polynôme de degré 3.
Coefficient pente constante R2
Paramètre a b r2 a b r2 r'23 r23
Diagramme
aas 0.003 0.86 391 -0.99 47.5 410 540 874
codons 0.005 0.76 279 -0.50 24.6 280 320 709
bbg,c 0.040 -0.91 907 -0.54 26.3 170 260 691
bba,t -0.033 2.59 894 -0.62 30.8 250 420 665

Conformation des protéines, exemples[modifier | modifier le wikicode]

Conformation des protéines par le nombre d'aas[modifier | modifier le wikicode]
  1. moyen: moyenne de l'aa, voir la légende ci-dessus.
  2. zero: colonne à valeurs nulles pour reporter les noms des aas.
  3. hth: code KEGG de la bactérie
Conformation des protéines par le nombre de codons bbc,g[modifier | modifier le wikicode]
  1. moyen: moyenne du codon, voir la légende ci-dessus.
  2. zero: colonne à valeurs nulles pour reporter les noms des codons.
  3. eal: code KEGG de la bactérie
Conformation des protéines par le nombre de codons bbt,a[modifier | modifier le wikicode]
  1. moyen: moyenne du codon, voir la légende ci-dessus.
  2. zero: colonne à valeurs nulles pour reporter les noms des codons.
  3. fnc: code KEGG de la bactérie

Fréquences des corrélations entre bactéries / codons[modifier | modifier le wikicode]

Fréquences des corrélations entre bactéries / aas[modifier | modifier le wikicode]

Les tRNAs[modifier | modifier le wikicode]

Nombres de tRNAs des 111 bactéries[modifier | modifier le wikicode]

  • Lien Tableur: Nombres de tRNAs des 111 bactéries
  • Base de données des tRNAs [1], gtRNAdb.   Pour vin amo ssm opr age fbt cad sbw mcac j'ai utilisé la base de données KEGG [2]: fournir les 3 lettres du génome dans organism. Puis cliquer successivement sur Assembly, Genome et RefSeq. Ctrl+F: tRNA-Arg . . .
  • Légende:
colonne tRNA/8: les 8 aas à 4 et 6 codons ayant 1 seul codon avec tRNA pour le carré à 4 codons (ct pour L par exemple). Pour réduire la notation sont indiqués en 1er les aas à 4 codons suivis de ceux à 6 codons. S'il y a un seul aa avec plus d'un codon à tRNA, cet aa est noté avec le signe −.
  1. −G *: R n'a aucun tRNa pour les 4 codons cg (ceci pour *) et G a plus d'un codon à tRNA. Donc APTV ont 1 seul codon à tRNA et SL en ont plus de 1 pour leur carré.
  2. −G SR*: L n'a aucun tRNa pour les 4 codons ct (ceci pour *) et G a plus d'un codon à tRNA. Donc APTV et SR ont 1 seul codon à tRNA pour leur carré.
  3. T*: 4 codons avec tRNA pour T.
  4. 5 SRL, tRNA/8: Les 5 aas à 4 codons et SRL ont 1 seul codon à tRNA.
Colonne >2: les 8 aas à 4 et 6 codons ayant plus de 2 codons à tRNA pour le carré à 4 codons (ct pour L par exemple). Pour réduire la notation sont indiqués en 1er les aas à 4 codons suivis de ceux à 6 codons. S'il y a un seul aa avec 2 codons à tRNA, cet aa est noté avec le signe −.
  1. 8: APTVG et SRL ont plus de 2 codons à tRNA.
  2. T S: T et S ont plus de 2 codons à tRNA.
  3. −V −S: APTG et RL ont plus de 2 codons à tRNA.
  4. GT* SL: GSL ont plus de 2 codons à tRNA et T en a 4 (pour *).
Colonne 2: Les aas KEQ à 2 codons peuvent avoir les 2 codons avec tRNA. Les codons tta et ttg de L ont dans la majorité des cas un tRNA chacun, de même pour aga et agg de R. Pour S le codon agt n’a pratiquement jamais de tRNA alors que agc en a toujours. Donc S sera absent dans cette colonne.
  1. 3RL: KEQ et RL ont 2 codons à tRNA.
  2. KRL: ces 3 aas ont 2 codons à tRNA.
  3. W C I : Les codons tgg et tga, tgt et tgc, ata ont chacun un tRNA.
Les tRNAs des 111 bactéries
KEGG %GC tRNA tRNA/8 >2 2 KEGG %GC tRNA tRNA/8 >2 2 KEGG %GC tRNA tRNA/8 >2 2 KEGG %GC tRNA tRNA/8 >2 2
zin 13.5 25 −G SR* 0 0 lat 36.3 44 P T SL KQR ype 47.6 70 0 G L KQRL ret 61.3 50 0 GPTSL 3R
crp 16.6 28 −G * 0 0 bbd 36.8 39 V 0 RL amo 48.0 48 0 8 3RLW sus 61.9 51 0 8 3RL
hcr 22.5 28 5 SRL 0 L liv 37.1 67 AP T S RL pgi 48.3 53 V GPT L KQRL saci 62.3 68 0 8 3RLC
mcac 23.7 30 −T SRL 0 KL hmr 37.5 48 0 8 3RL mah 48.7 45 0 T SL RL smk 62.7 57 0 -V −R 3RL
ssdc 24.2 34 AP L KRL tde 37.9 44 0 APTSL 3RL ssm 49.0 48 0 8 3RL dvl 63.0 68 0 −R KQRL
sbw 25.1 35 AP L KRL spi 38.3 63 APV 0 KRL eal 49.7 85 0 GPTSL QRL ddr 63.4 48 0 −R KQRL
uur 25.5 30 −G SL 0 KL vpr 38.6 48 APV G S KRL lfc 50.0 52 0 8 3RL tai 63.8 50 0 8 3RL
ple 26.2 33 AP S 0 chp 39.1 38 0 T SL RL eco 50.8 87 0 GPTSL QRL gau 64.3 48 0 −R 3RL
smf 26.3 39 5 SRL 0 KL spl 39.1 143 0 0 RL sbz 51.3 86 0 GPTSL QRL xcb 65.0 55 0 −R 3RL
fnc 27.1 47 −G SL 0 KRL tsu 39.2 48 0 −V −S 3RL bvs 51.7 62 V GPTSL 3RL rru 65.5 55 0 −R 3RL
bfl 27.4 37 AP T SL KRL nis 39.7 45 0 T RL sty 52.1 79 0 GPTSL QRL dpt 66.2 46 0 −G −R KQRL
cbl 28.3 81 APV G 3RL cmn 40.3 37 0 T SL L tpas 52.8 45 0 −G 3RL pae 66.6 63 0 GPTSL RL
rip 28.5 33 AP 0 RL nse 41.1 33 AP 0 RL  I apt 53.0 57 0 −R KQL roa 67.4 52 0 −R 3RL
rpr 29.0 33 P T 0 cta 41.3 37 0 T SL L caa 53.6 46 0 GPTSL KRL bmv 68.2 56 0 −R KR
pub 29.7 32 AP L 0 L hhd 41.8 67 P 0 RL cgq 54.2 58 0 −A −R 3RL tos 68.6 52 0 −R 3RL  I
cad 29.9 81 APV 0 LW gva 42.0 45 0 −P −R 3RL dal 54.5 56 0 −R 3RL vin 68.9 49 0 8 3RL
cje 30.6 43 P 0 RL cbd 42.4 42 0 GPTSL KERL eno 55.1 83 0 GT L QRL age 69.5 81 0 8 3RL
pmh 31.1 40 0 T S RL bae 43.2 75 P 0 RL mcu 55.4 46 0 −R 3RL opr 70.0 46 0 −R 3RL
tme 31.4 50 0 8 3RL aae 43.5 44 0 GPTSL KRL din 56.1 37 0 P L RL mts 70.3 46 0 −R 3RL
sep 32.1 59 APV 0 L bsu 43.5 54 P L RL say 56.8 53 0 8 3RL sma 70.7 71 0 −R 3RL
hhl 32.5 44 0 0 RL hth 44.0 44 0 −R KRL bmf1 57.2 55 0 −R 3RL amd 71.3 52 0 −R 3RL
cff 33.3 41 P 0 KERL lpl 44.5 73 V GT* SL 3RL kpn 57.5 86 0 GPTSL QRL sho 72.0 73 0 −R 3RL
ial 33.9 45 0 −V 3RL pdi 45.1 82 0 GPTSL 3RL aba 58.4 46 0 8 3RL sgr 72.2 67 0 −R 3RL
ljf 34.5 55 AV R GT* SL 3RL ppoy 45.5 109 0 T SL KL dba 58.7 64 0 8 3RL cmi 72.7 45 0 −R 3RL
dte 34.9 43 0 T SL RL tma 46.3 46 0 8 3RL synd 59.1 46 0 −R RL salb 73.3 66 0 −R 3RL
lla 35.3 63 APV T SL KRL sbn 46.3 105 0 L RL pgd 59.6 60 0 −A −R RL ksk 74.2 78 0 −R 3RL
axl 35.7 55 P 0 L fbt 46.5 47 V L RL pac 60.0 45 0 −R 3RL ade 74.9 49 0 8 3RL
thl 36.0 62 AV GT SL KRL tli 47.1 48 0 8 3RL bla 60.5 52 0 −R 3RL
  • Tableau non formaté: voir tableur
  • Récapitulatif
Nombre de bactéries (sur 111) ayant au moins un tRNA par codon
codons 0 1 2 3 4 0 1 2
aa
A 0 23 40 48
C 0 110 1
D 0 111 0
E 0 62 49
F 0 111 0
G 0 3 41 67
H 0 111 0
I 0 109 2
K 0 38 73
L 1 6 22 82 0 7 104
M 0 111 0
N 0 111 0
P 0 29 19 63
Q 0 51 60
R 1 5 87 18 0 16 95
S 0 6 29 76 0 111 0
T 0 6 25 78 2
V 0 20 46 46
W 0 109 2
Y 0 111 0
  • Tableau non formaté: voir tableur
Moyenne des codons t/c et a/g en %[modifier | modifier le wikicode]
Moyenne des codons 2*(t-c)/(t+c) et 2*(a-g)/(a+g) en %
ttt 123 tct 69 tat 116 tgt 27
c 125 c 66 c 107 c 31
a 120 a 50 a 3 a 2
g 81 g 58 g 1 g 71
ctt 97 cct 65 cat 59 cgt 103
c 104 c 61 c 70 c 132
a 30 a 58 a 89 a 20
g 180 g 101 g 132 g 44
att 168 act 68 aat 133 agt 38
c 181 c 121 c 128 c 55
a 84 a 65 a 247 a 60
g 154 g 71 g 202 g 24
gtt 132 gct 108 gat 217 ggt 142
c 118 c 164 c 202 c 169
a 84 a 91 a 296 a 88
g 137 g 126 g 226 g 54
ttt/c -2 tct 4 tat 8 tgt -15
tta/g 39 -15 103 -191
ctt/c -7 cct 5 cat -17 cgt -25
cta/g -144 -54 -39 -73
att/c -7 act -56 aat 4 agt -35
ata/g -59 -8 20 84
gtt/c 11 gct -41 gat 7 ggt -17
gta/g -48 -32 27 49
  • Tableau non formaté: voir tableur
Moyenne des corrélations t/c et a/g en %[modifier | modifier le wikicode]
Moyenne des corrélations 2*(t-c)/(t+c) et 2*(a-g)/(a+g) en %
ttt 64 tct 63 tat 66 tgt 58
c 68 c 55 c 60 c 53
a 61 a 64 a 42 a 45
g 27 g 58 g 9 g 43
ctt 39 cct 63 cat 60 cgt 18
c 60 c 54 c 66 c 67
a 51 a 60 a 63 a 22
g 62 g 61 g 66 g 49
att 63 act 64 aat 59 agt 62
c 64 c 66 c 58 c 43
a 44 a 63 a 63 a 53
g 19 g 48 g 57 g 13
gtt 63 gct 57 gat 66 ggt 40
c 63 c 67 c 69 c 69
a 58 a 59 a 58 a 56
g 60 g 59 g 62 g 27
ttt/c -6 tct 13 tat 10 tgt 8
tta/g 79 9 128 4
ctt/c -42 cct 16 cat -10 cgt -114
cta/g -18 -2 -5 -74
att/c -1 act -3 aat 2 agt 38
ata/g 78 26 10 119
gtt/c 0 gct -16 gat -5 ggt -54
gta/g -3 0 -6 70
  • Tableau non formaté: voir tableur
Les corrélations en ordre[modifier | modifier le wikicode]
L'ordre des corrélations
ttt 2a tct 17a tat 1a tgt 21a
c 2g c 22g c 11g c 23g
a 4a a 7a a 29a a* 26g
g* 30a g 16g g 31g g 28g
ctt 27a cct 12a cat 15a cgt 32a
c 17g c 20g c 4g c 5g
a 25a a 16a a 10a a 31a
g 10g g 14g g 6g g 25g
att 6a act 11a aat 3a agt 18a
c 9g c 8g c 13g c 27g
a 26a a 19a a 5a a 24a
g 30g g 24g g 19g g* 33a
gtt 9a gct 14a gat 8a ggt 28a
c 12g c 7g c 1g c 3g
a 22a a 13a a 20a a 23a
g 21g g 15g g 18g g 29g
  • Tableau non formaté:voir tableur

Comptes détaillés des tRNAs des 111 bactéries[modifier | modifier le wikicode]

Comptes détaillés[modifier | modifier le wikicode]
Spectres des codons des tRNAs des 111 bactéries[modifier | modifier le wikicode]
Spectres des codons des tRNAs111
n tRNAs    ttc tta ttg    tcc tca tcg    tac taa tag    tgc tga tgg
0 0 3 4 6 0 34 0 2 78 1
1 80 94 104 95 91 73 82 93 33 101
2 22 9 2 9 16 3 18 13 8
3 8 3 1 1 2 1 8 1 1
4 1 1 2 2 2
5 1 0
autres 1
ctc cta ctg ccc cca ccg cac caa cag cgt cga cgg
0 12 1 28 33 0 44 2 0 50 11 76 21
1 89 97 66 72 93 65 91 83 47 67 34 88
2 10 11 9 4 12 1 18 18 14 19 1 2
3 1 2 2 5 1 6 4
4 0 6 1 3 8
5 1 1 0
autres 2
atc ata atg acc aca acg aac aaa aag agc aga agg
0 0 0 9 0 29 0 1 37 0 0 16
1 53 0 85 90 80 65 73 62 99 102 90
2 23 3 16 8 2 21 17 7 10 7 4
3 24 55 1 7 11 7 4 2 2 1
4 6 20 6 9 5 1
5 4 12 3 3
autres 1 21 2 5
gtc gta gtg gcc gca gcg gac gaa gag ggc gga ggg
0 20 0 65 24 0 62 0 0 61 3 0 44
1 72 73 39 66 53 49 50 63 40 51 86 65
2 12 13 6 20 18 35 21 4 27 14 1
3 7 13 1 1 24 16 12 5 19 8 1
4 6 8 8 8 1 8 2
5 4 5 1 2 1 1
autres 2 3 1 5 2
  • Tableau non formaté: voir tableur
Comptes des solitaires des tRNAs des 111 bactéries[modifier | modifier le wikicode]
			   Résultat	Formules
			nom	cellule		
4 codons	ctx	0	ES12	SI(ET(DC12=0,DD12=0,DE12=0,DF12=0),1,0)	
			ctt	ET12	SI(ET(DC12>0,DD12=0,DE12=0,DF12=0),1,0)	
			ctc	EU12	SI(ET(DC12=0,DD12>0,DE12=0,DF12=0),1,0)	
			cta	EV12	SI(ET(DC12=0,DD12=0,DE12>0,DF12=0),1,0)	
			ctg	EW12	SI(ET(DC12=0,DD12=0,DE12=0,DF12>0),1,0)	
2 codons	ctt,ctc	ctt	EX12	SI(ET(DC12>0,DD12=0),1,0)	
			ctc	EY12	SI(ET(DC12=0,DD12>0),1,0)	
			11	EZ12	SI(ET(DC12=1,DD12=1),1,0)	
			01	FA12	SI(SOMME(EX12:EZ12)=0,1,0)	
La procédure utilisée ici pour 111 bactéries est la même que j'ai utilisée pour les 4032 bactéries de la base gtRNAdb: un tRNA est dit solitaire pour un carré donné (ctx), s'il ne contient qu'un seul type (ctt), les autres (ctc cta ctg) étant nuls. Pour les 4032 bactéries je cherchais les occurrences *ctt*, *ctt;ctt*, . . . .. Ici pour le nom ctt je teste la condition ctt>0 et (ctc=0 cta=0 ctg=0) pour une bactérie donnée. Ce qui donne dans calc pour la bactérie zin (ligne 12) les codonss "ctt ctc cta ctg" (colonnes DC12 DD12 DE12 DF12). La cellule DC12 correspond à la ligne zin et à la colonne ctt du tableau des décomptes détaillés ci-dessus.
  1. 4 codons: calculs pour les 4 codons non nuls d'un carré et 0 s'il n'y a aucun tRNA.
  2. 2 codons: calculs sur 2 codons supposés lus par un seul tRNA. ctt,ctc,11,01: respectivement, seul le codon ctt ou ctc a plus d'un tRNA, ctt et ctc ont chacun 1 seul tRNA, autre combinaison. La colonne avec (*) correspond au cas où les 2 codons n'ont pas de tRNA parmi le décompte "autre combinaison".
Les xxt ne sont pas présentés sauf ctt cgt act, car ils n’ont pas de tRNA (voir tableau).
Donc il n’y a pas de résultat pour
ttt,c Phe
tct,c Ser . . . .
DC12 cellule ctt du tableau pour la bactérie zin
DD12 cellule ctc du tableau « 
. . . .
EX12 cellule du résultat du test ctt pour 2 codons
EY12 cellule du résultat du test ctc pour 2 codons
EZ12 cellule du résultat du test 11 pour 2 codons
Les résultats présentés sont la somme des colonnes des noms
Leu 0
Leu ctt
. . . . . . . .
Comptes des solitaires des tRNAs des 111 bactéries
Leu 0 1 Arg 0 1 Glu gaa 61 Thr 0 0 Gly 0 0
ctt 0 cgt 4 gag 0 act 0 ggc 0
ctc 0 cgc 1 11 28 acc 0 gga 3
cta 6 cga 0 01 22 aca 6 ggg 0
ctg 0 cgg 0 Trp tga 0 acg 0 gga 44
ctt 5 cgt 100 tgg 77 act 2 ggg 0
ctc 99 cgc 10 11 29 acc 99 11 54
11 0 11 0 01 5 11 1 01 13
01 7 7* 01 1 1* Val 0 0 01 9
cta 27 cga 15 gtc 0 aca 29
ctg 0 cgg 70 gta 20 acg 0
11 63 11 18 gtg 0 11 72
01 21 1* 01 8 6* gta 65 01 10
tta 4 aga 16 gtg 0 Ala 0 0
ttg 3 agg 0 11 37 gcc 0
11 87 11 85 01 9 gca 23
01 17 01 10 Pro 0 0 gcg 0
Ser 0 0 Lys aaa 37 ccc 0 gca 62
tcc 0 aag 1 cca 29 gcg 0
tca 6 11 47 ccg 0 11 30
tcg 0 01 26 cca 106 01 19
tca 34 Gln caa 50 ccg 0
tcg 0 cag 0 11 3
11 68 11 41 01 2
01 9 01 20
  • Tableau non formaté: voir tableur
Comptes détaillés des tRNAs des 111 bactéries: totaux[modifier | modifier le wikicode]
I. 4032 bactéries: total
ttt 10 tct 5 tat 4 tgt 3
c 6105 c 4520 c 6420 c 4473
a 4749 a 5299 a a 1315
g 3999 g 2622 g g 4366
ctt 369 cct 10 cat 4 cgt 7478
c 3849 c 2742 c 4715 c 333
a 4940 a 5453 a 6388 a 887
g 5186 g 2183 g 2389 g 3355
att 5 act 103 aat 5 agt 1
c 9,203 c 4513 c 8,764 c 4422
a 55 a 5878 a 9,105 a 4804
g 18,026 g 2760 g 2427 g 3452
gtt 9 gct 2 gat 0 ggt 1
c 4430 c 4166 c 9,023 c 9,273
a 8,859 a 10,185 a 9,679 a 5515
g 1313 g 1224 g 1388 g 2266
II. 4032 bactéries : 100 * n / 3950
0.3 0.1 0.1 0.1
155 114 163 113
120 134 33
101 66 111
9.3 0.3 0.1 189
97 69 119 8.4
125 138 162 22
131 55 60 85
0.1 2.6 0.1 0.0
233 114 222 112
1.4 149 231 122
456 70 61 87
0.2 0.1 0.0 0.0
112 105 228 235
224 258 245 140
33 31 35 57
I'. 111 bactéries: total
ttt 0 tct 0 tat 0 tgt 1
ttc 152 tcc 116 tac 156 tgc 130
tta 130 tca 137 taa 0 tga 33
ttg 111 tcg 82 tag 0 tgg 120
ctt 6 cct 0 cat 0 cgt 162
ctc 109 ccc 86 cac 127 cgc 10
cta 127 cca 136 caa 154 cga 36
ctg 114 ccg 70 cag 75 cgg 92
att 0 act 6 aat 0 agt 0
atc 222 acc 120 aac 204 agc 125
ata 4 aca 151 aaa 201 aga 122
atg 462 acg 84 aag 92 agg 101
gtt 0 gct 0 gat 0 ggt 0
gtc 117 gcc 109 gac 211 ggc 213
gta 199 gca 237 gaa 221 gga 151
gtg 54 gcg 49 gag 67 ggg 70
II'. 111 bactéries : 100 * n / 111
0 0 0 0.9
137 105 141 117
117 123 0 30
100 74 0 108
5.4 0 0 146
98 77 114 9
114 123 139 32
103 63 68 83
0 5.4 0 0
200 108 184 113
3.6 136 181 110
416 76 83 91
0 0 0 0
105 98 190 192
179 214 199 136
49 44 60 63
  • Tableaux non formatés: voir tableur
Comptes détaillés des tRNAs des 111 bactéries: solitaires[modifier | modifier le wikicode]
II 4032. Nombre de bactéries à tRNAs solitaires de 4 codons. Total requête.
ttt 3948 tct 3945 tat 3934 tgt 3947
c 15 c 2 c 3930 c 12
a 0 a 85 a a 0
g 2 g 0 g g 17
ctt 3942 cct 3941 cat 3948 cgt 106*
c 7 c 3 c 5 c 1
a 98 a 1173 a 6 a 7
g 0 g 1 g 2 g 7
att 3949 act 3946 aat 3949 agt 3944
c 2 c 2 c 2 c 1
a 0 a 152 a 5 a 0
g 81 g 3 g 1 g 0
gtt 3943 gct 3934 gat 3949 ggt 3948
c 8 c 32 c 5 c 9
a 724 a 877 a 8 a 66
g 1 g 7 g 1 g 0
III 4032. Nombre de bactéries à tRNAs solitaires des codons a,g. Total requête.
tt tc ta tg
sag 3933 sag 3943 sag sag 3934
a 96 a 1493 a a 15
g 190 g 22 g g 2629
ct cc ca cg
sag 3935 sag 3939 sag 3943 sag 3833
a 692 a 1813 a 2130 a 539
g 30 g 5 g 18 g 3026
at ac aa ag
sag 3947 sag 3944 sag 3941 sag 3928
a 0 a 1288 a 1899 a 780
g 3947 g 13 g 9 g 10
gt gc ga gg
sag 3935 sag 3902 sag 3928 sag 3939
a 2724 a 2721 a 2808 a 1699
g 2 g 11 g 5 g 11
II 111. Nombre de bactéries à tRNAs solitaires des carrés à 4 codons.
ttt 111 tct 111 tat 111 tgt 110
c 0 c 0 c 0 c 0
a 0 a 6 a a
g 0 g 0 g g 1
ctt 111 cct 111 cat 111 cgt 4*
c 0 c 0 c 0 c 1
a 6 a 29 a 2 a 0
g 0 g 0 g 0 g 0
att 111 act 111 aat 111 agt 111
c 0 c 0 c 0 c 0
a 0 a 6 a 0 a 0
g 0 g 0 g 0 g 0
gtt 111 gct 111 gat 111 ggt 111
c 0 c 0 c 0 c 0
a 20 a 23 a 0 a 3
g 0 g 0 g 0 g 0
III 111. Nombre de bactéries à tRNAs solitaires des codons a,g.
ttt tct 111 cg 110 tgt
sag 111 sag 111 sct 110 sag 110
a 4 a 34 t 100 a 0
g 3 g 0 c 10 g 77
ctt 110 cct 111 cat cgt 110
sag 110 sag 111 sag 111 sag 105
a 27 a 106 a 50 a 15
g 0 g 0 g 0 g 70
ctt 111 act 111 aat agt
sct 104 sag 111 sag 111 sag 111
t 5 a 29 a 37 a 16
c 99 g 0 g 1 g 0
gtt 111 gct 111 gat ggt 111
sag 111 sag 111 sag 111 sag 111
a 65 a 62 a 61 a 44
g 0 g 0 g 0 g 0
IV 4032. Pourcentage des bactéries à tRNAs solitaires.
tt tc ta tg
%4 2.2
1a1g 2804 2114 1238
%2 7 38 67
ct cc ca cg
%4 2.7 29.9 3.1
1a1g 962 1911 996 222
%2 18 46 54 93
at ac aa ag
%4 2.1 4.0
1a1g 0 2166 1155 2579
%2 100 33 48 20
gt gc ga gg
%4 18.6 23.3 1.9
1a1g 1051 562 602 1973
%2 69 70 72 43
ct cg ac
%4 2.7 3.1 4.0
1t1c 8 10 41
%2 99 99 98
IV 111. Pourcentage des bactéries à tRNAs solitaires.
tt tc ta tg
%4 5,4
1a1g 87 68 0 29
%2 6 31 100 70
ct cc ca cg
%4 5,5 26.1 4,5
1a1g 63 3 41 18
%2 25 95 45 81
at ac aa ag
%4 0 5,4
1a1g 0 72 47 85
%2 99 26 34 14
gt gc ga gg
%4 18.0 20.7 2,7
1a1g 37 30 28 54
%2 59 56 55 40
ct cg ac
%4
1t1c 0 0 1
%2 100 100 91
  • Compléments
		Nombre de bactéries à tRNAs solitaires des codons c,t.							
4032	sct	t	c			111	sct	t	c
ac	3775	41	3682			ac	111	2	99
cg	3932	3614	307			cg	110	100	10
ct	3834	323	3502			ct	104	5	99
  • Tableaux non formatés:voir tableur
tRNAs des 111 bactéries: Diagramme des solitaires APV[modifier | modifier le wikicode]
  • Diagramme des solitaires APV .
	Effectifs des tRNAs solitaires APV							
%GC	A	P	V	T	G	L	R	S
15-20	2	2	2	2	0	0	1	1
20-25	3	3	2	1	2	2	2	2
25-30	10	11	5	3	1	4	1	3
30-35	2	3	2	0	0	0	1	0
35-40	5	6	5					
40-45	1	4	1					
45-50	0	0	2					
50-55	0	0	1					
55-60	0	0	0					
total	23	29	20	6	3	6	5	6

Nombres de tRNAs des 4032 bactéries[modifier | modifier le wikicode]

  • Lien Tableur: Nombres de tRNAs des 4032 bactéries
  • Base de données gtRNAdb [3]
  • Légende:
    1. I. Nombres de tRNAs. 4032 bactéries.
        5   : nombre de tRNAs d'un codon se terminant par t. Ils sont tous inférieurs à 11 sauf ctt cgt act.
      4 366: Effectif élevé de tRNAs d'un codon se terminant par g.
      2622: Effectif faible de tRNAs.
    2. II. Nombre de bactéries à tRNAs solitaires de 4 codons (1ère et 2ème base). Total d’une requête: Comptage fait pour les carrés. C’est un nombre de bactéries ayant x tRNAs pour un seul et même codon.
      Total d'une requête: Le 1er codon se terminant par t n'a pas de solitaire sauf ici pour Arg, et il est remplacé par le total de la requête.
      a,g,c : Nombre de bactéries à tRNAs solitaires pour les carrés de 4 codons.
      106*: solitaires du codon cgt. Le carré de Arg étant complet le total de la requête est représenté par *, il est de 3946.
      Note: le total des bactéries de la base des tRNA est de 4032. Cependant le total des bactéries comptées est compris entre 3832-3947. Est-ce que ce qui manque est du aux bactéries sans tRNAs pour les codons demandés? Cela ne serait pas vrai pour les aas à 2 codons.
      − Méthode pour compter, cas de la Thr, anti-codons xGT:
      • Sélectionner les anticodons pour la requête (ne pas oublier de mettre Bacteria dans Domain). Copier le résultat, ctrl+A, ctrl+C.
      • Dans calc ctrl+V, supprimer le dessin en le sélectionnant, supprimer toutes les colonnes sauf la colonne des anticodons, sélectionner le 1er anticodon puis ctrl+schift+fin ce qui sélectionne tous les anticodons et les cellules à blanc. Il n'y a pas de cellule intercalée entre 2 anticodon de la même bactérie.
      • Copier,ctrl+v, dans writer (texte non formaté), ctrl+h (expression régulière, $ en ; tout remplacer), ctrl+h (décocher expression régulière, ;; en *;;* tout remplacer). Le tout rechercher de * ;;* donne le total de la requête (nombre total de bactéries moins 1). Mettre un * à la fin mais pas début (le logiciel déplace tout le texte pour insérer *, ce qui prend beaucoup de temps). Repérer le motif du début avant * ;;*. Si le motif concerne une recherche ultérieure, en tenir compte.
      • ctrl+h (*GGT* tout rechercher donne 2916, *AGT* donne 41, *GGT;GGT donne 754 . . . ).
    3. III. Nombre de bactéries à tRNAs solitaires des codons a,g et t,c. Total d’une requête: tRNAs solitaires pour les codons se terminant par a ou g et t ou c; total des bactéries d'une requête de la base de données suivant les codons demandés.
      stc,sag, tt (1ère et 2ème base d'un carré) , tc . . . : Total des bactéries respectivement de la requête pour 2 codons se terminant par t ou c, pour 2 codons se terminant par a ou g.
      a,g,t,c : Nombre de bactéries à tRNAs solitaires pour les codons se terminant par a,g,t,c.
      − Trp-Sec: Les solitaires de Sec sont en fait des Trp (tga).
    4. IV. Pourcentage des bactéries à tRNAs solitaires: calculés à partir des tableaux II et III précédents.
      tt (1ère et 2ème base d'un carré) , tc . . .
       %4: Pourcentage des bactéries à 1 seul codon à tRNA dans les carrés de 4; toujours a est à plus de 90% sauf pour cgt (Arg) et atg (Met).
       %2: Pourcentage des bactéries à 1 seul codon à tRNA pour les codons se terminant par a ou g. Toujours a est à plus de 90% sauf pour R (cg), L (tt), M et W.
      1a1g: Nombre de bactéries ayant 1 tRNA pour le codon se terminant par a et 1 tRNA pour le codon se terminant par g. Permet de mettre en exergue les autres bactéries ayant des tRNAs multiples.
    5. V. Multiplicité des tRNAs en %: Voir les calculs.
I. Nombre de tRNAs.
4032 bactéries
ttt 10 tct 5 tat 4 tgt 3
c 6105 c 4520 c 6420 c 4473
a 4749 a 5299 a a 1315
g 3999 g 2622 g g 4366
ctt 369 cct 10 cat 4 cgt 7478
c 3849 c 2742 c 4715 c 333
a 4940 a 5453 a 6388 a 887
g 5186 g 2183 g 2389 g 3355
att 5 act 103 aat 5 agt 1
c 9,203 c 4513 c 8,764 c 4422
a 55 a 5878 a 9,105 a 4804
g 18,026 g 2760 g 2427 g 3452
gtt 9 gct 2 gat 0 ggt 1
c 4430 c 4166 c 9,023 c 9,273
a 8,859 a 10,185 a 9,679 a 5515
g 1313 g 1224 g 1388 g 2266
II. Nombre de bactéries à tRNAs solitaires de 4 codons. Total d'une requête.
ttt 3948 tct 3945 tat 3934 tgt 3947
c 15 c 2 c 3930 c 12
a 0 a 85 a a 0
g 2 g 0 g g 17
ctt 3942 cct 3941 cat 3948 cgt 106*
c 7 c 3 c 5 c 1
a 98 a 1173 a 6 a 7
g 0 g 1 g 2 g 7
att 3949 act 3946 aat 3949 agt 3944
c 2 c 2 c 2 c 1
a 0 a 152 a 5 a 0
g 81 g 3 g 1 g 0
gtt 3943 gct 3934 gat 3949 ggt 3948
c 8 c 32 c 5 c 9
a 724 a 877 a 8 a 66
g 1 g 7 g 1 g 0
III. Nombre de bactéries à tRNAs solitaires des codons a,g. Total d’une requête.
tt tc ta tg
sag 3933 sag 3943 sag sag 3934
a 96 a 1493 a a 15
g 190 g 22 g g 2629
ct cc ca cg
sag 3935 sag 3939 sag 3943 sag 3833
a 692 a 1813 a 2130 a 539
g 30 g 5 g 18 g 3026
at ac aa ag
sag 3947 sag 3944 sag 3941 sag 3928
a 0 a 1288 a 1899 a 780
g 3947 g 13 g 9 g 10
gt gc ga gg
sag 3935 sag 3902 sag 3928 sag 3939
a 2724 a 2721 a 2808 a 1699
g 2 g 11 g 5 g 11
  • Complément Tableau III:
Nombre de bactéries à tRNAs solitaires des codons c,t.					
			sct	t	c
		ac	3775	41	3682
		cg	3932	3614	307
		ct	3834	323	3502
IV. Pourcentage des bactéries à tRNAs solitaires.
tt tc ta tg
%4 2.2
1a1g 2804 2114 1238
%2 7 38 67
ct cc ca cg
%4 2.7 29.9 3.1
1a1g 962 1911 996 222
%2 18 46 54 93
at ac aa ag
%4 2.1 4.0
1a1g 0 2166 1155 2579
%2 100 33 48 20
gt gc ga gg
%4 18.6 23.3 1.9
1a1g 1051 562 602 1973
%2 69 70 72 43
ct cg ac
%4 2.7 3.1 4.0
1t1c 8 10 41
%2 99 99 98
V. Multiplicité des tRNAs.
   FL     SS     YX     CW 
t 1,00 1,00 1,00 1,00
c 1,55 1,18 1,63 1,14
a 1,27 1,35 - 1,01
g 1,04 1,07 - 1,11
LL P HQ RR
t 1,11 1,00 1,33 2,06
c 1,10 1,03 1,20 1,05
a 1,26 1,39 1,63 1,10
g 1,86 1,03 1,32 1,02
IM T NK SR
t 1,00 1,11 1,00 1,00
c 2,38 1,21 2,23 1,12
a 1,15 1,50 2,32 1,23
g 4,57 1,04 1,19 1,10
V A DE G
t 1,00 1,00 0,00 1,00
c 1,38 1,37 2,29 2,39
a 2,25 2,62 2,47 1,40
g 1,09 1,04 1,24 1,01
  • Tableaux non formatés: voir tableur
Calcul de la multiplicité des tRNAs[modifier | modifier le wikicode]
  • Lien Tableur: Calcul de la multiplicité des tRNAs
  • Légende: tRNAs, nombre affiché par la requête. lignes, nombre de lignes affiché dans calc après nettoyage. bactéries=lignes - tRNAs. multiplicité= tRNAs / bactéries.
Décompte des multiplicités des tRNAs par codon
t c a g
tRNAs lignes bactéries multiplicité tRNAs lignes bactéries multiplicité tRNAs lignes bacteries multiplicité tRNAs lignes bactéries multiplicité
t t 10 19 10 1,00 5 9 5 1,00 4 7 4 1,00 3 5 3 1,00
c 6105 10044 3940 1,55 4520 8343 3824 1,18 6420 10353 3934 1,63 4473 8401 3929 1,14
a 4749 8491 3743 1,27 5299 9221 3923 1,35 1 0,00 1315 2619 1305 1,01
g 3999 7835 3837 1,04 2622 5071 2450 1,07 1 0,00 4366 8285 3920 1,11
c t 369 700 332 1,11 10 19 10 1,00 4 6 3 1,33 7478 11102 3625 2,06
c 3849 7359 3511 1,10 2742 5399 2658 1,03 4715 8649 3935 1,20 333 650 318 1,05
a 4940 8857 3918 1,26 5453 9386 3934 1,39 6388 10312 3925 1,63 887 1693 807 1,10
g 5186 7969 2784 1,86 2183 4307 2125 1,03 2389 4201 1813 1,32 3355 6648 3294 1,02
a t 5 9 5 1,00 103 195 93 1,11 5 9 5 1,00 1 1 1 1,00
c 9203 13067 3865 2,38 4513 8246 3734 1,21 8764 12695 3932 2,23 4422 8354 3933 1,12
a 55 102 48 1,15 5878 9808 3931 1,50 9105 13036 3932 2,32 4804 8721 3918 1,23
g 18026 21972 3947 4,57 2760 5415 2656 1,04 2427 4468 2042 1,19 3452 6600 3149 1,10
g t 9 17 9 1,00 2 3 2 1,00 0 0 1 0,00 1 1 1 1,00
c 4430 7637 3208 1,38 4166 7201 3036 1,37 9023 12957 3935 2,29 9273 13153 3881 2,39
a 8859 12791 3933 2,25 10185 14075 3891 2,62 9679 13603 3925 2,47 5515 9442 3928 1,40
g 1313 2521 1209 1,09 1224 2404 1181 1,04 1388 2509 1122 1,24 2266 4505 2240 1,01
  • Tableau non formaté:voir tableur
Comparaison des codons par les 2 1ères bases[modifier | modifier le wikicode]
Comparaison des codons avec les 2 1ères bases
Multiplicité NK DE HQ    V A    SS T    P G    RR    LL    FL SR    IM CW    YX
t 1,00 0,00 1,33 1,00 1,00 1,00 1,11 1,00 1,00 2,06 1,11 1,00 1,00 1,00 1,00 1,00
c 2,23 2,29 1,20 1,38 1,37 1,18 1,21 1,03 2,39 1,05 1,10 1,55 1,12 2,38 1,14 1,63
a 2,32 2,47 1,63 2,25 2,62 1,35 1,50 1,39 1,40 1,10 1,26 1,27 1,23 1,15 1,01
g 1,19 1,24 1,32 1,09 1,04 1,07 1,04 1,03 1,01 1,02 1,86 1,04 1,10 4,57 1,11
total tRNAs
t 5 0 4 9 2 5 103 10 1 7478 369 10 1 5 3 4
c 8,764 9,023 4715 4430 4166 4520 4513 2742 9,273 333 3849 6105 4422 9,203 4473 6420
a 9,105 9,679 6388 8,859 10,185 5299 5878 5453 5515 887 4940 4749 4804 55 1315
g 2427 1388 2389 1313 1224 2622 2760 2183 2266 3355 5186 3999 3452 18,026 4366
codon solitaire
t 3949 3949 3948 3943 3934 3945 3946 3941 3948 106* 3942 3948 3944 3949 3947 3934
c 2 5 5 8 32 2 2 3 9 1 7 15 1 2 12 3930
a 5 8 6 724 877 85 152 1173 66 7 98 0 0 0 0 -
g 1 1 2 1 7 0 3 1 0 7 0 2 0 81 17 -
solitaire a,g
total 3941 3928 3943 3935 3902 3943 3944 3939 3939 3833 3935 3933 3928 3947 3924 -
a 1899 2808 2130 2724 2721 1493 1288 1813 1699 539 692 96 780 0 15
g 9 5 18 2 11 22 13 5 11 3026 30 190 10 3947 2629
moyenne codon
t/c % 4 7 -17 11 -41 4 -56 5 -17 -25 -7 -2 -35 -7 -15 8
a/g % 20 27 -39 -48 -32 -15 -8 -54 49 -73 -144 39 84 -59 -191 103
ordre corrélation
t 3a 8a 15a 9a 14a 17a 11a 12a 28a 32a 27a 2a 6a 6a 21a 1a
c 13g 1g 4g 12g 7g 22g 8g 20g 3g 5g 17g 2g 9g 9g 23g 11g
a 5a 20a 10a 22a 13a 7a 19a 16a 23a 31a 25a 4a 26a 26a 26g 29a
g 19g 18g 6g 21g 15g 16g 24g 14g 29g 25g 10g 30a 30g 30g 28g 31g
  • Tableau non formaté:voir tableur

Comparaison des 3 domaines avec les nombres des tRNAs[modifier | modifier le wikicode]

  • Légende: Décompte des gènes tRNAs par codon suivant la base de données gtRNAdb [4]. La statistique de la base donne les effectifs suivants:
Domain		Number of Genomes	Number of tRNAs		Moyenne		Nombre de tRNAs
										comptés
Bacteria	4,032			239,000			59		235,027
Archaea		184			8,731			47		8,749
Eukaryota	155			119,380			770		115,111
Eukaryota	121			−			461		55,830
Zebrafish       1                       −                       12,258          12,258
Comparaison globale[modifier | modifier le wikicode]
Codons par ordre de valeurs dans les carrés[modifier | modifier le wikicode]
  • Lien Tableur: Codons par ordre de valeurs dans les carrés
  • Légende: classement des codons par leur ordre des effectifs de gène tRNA, dans les doublets des bactéries (B), des archées (A) et des eucaryotes (E). Les ordres sont ceux des tableaux I100, II100, III100.
Codons par ordre de valeurs dans les carrés
tt B A E
t 4 4 4
c 1 1 1
a 2 2 3
g 3 3 2
tc B A E
t 4 4 1
c 2 1 4
a 1 2 2
g 3 3 3
ta B A E
t 4 4 4
c 1 1 1
a
g
tg B A E
t 4 4 4
c 1 1 1
a 3 3 3
g 2 2 2
ct      
t 4 4 1
c 3 1 4
a 2 2 3
g 1 3 2
cc      
t 4 4 2
c 2 2 4
a 1 1 1
g 3 3 3
ca      
t 4 4 4
c 2 2 2
a 1 1 1
g 3 3 3
cg      
t 1 4 2
c 4 1 4
a 3 2 1
g 2 3 3
at      
t 4 4 2
c 2 2 4
a 3 3 3
g 1 1 1
ac      
t 4 4 1
c 2 2 4
a 1 1 2
g 3 3 3
aa      
t 4 4 4
c 2 1 2
a 1 2 3
g 3 3 1
ag      
t 4 4 4
c 2 1 1
a 1 2 2
g 3 3 3
gt      
t 4 4 2
c 2 1 4
a 1 2 3
g 3 3 1
gc      
t 4 4 3
c 2 2 4
a 1 1 1
g 3 3 2
ga      
t 4 4 4
c 2 2 3
a 1 1 1
g 3 3 2
gg      
t 4 4 4
c 1 1 3
a 2 2 2
g 3 3 1
  • Tableau non formaté: voir tableur
Groupes de codons[modifier | modifier le wikicode]
  • Lien Tableur: Groupes de codons
  • Légende: Les effectifs sont ceux des tableaux I100, II100, III100 sauf pour les faibles effectifs des tableaux I II III quand ils sont indiqués.
    Groupe: Par exemple le groupe 111, est celui des codons classés en 1er dans chaque carré (doublet) des 3 domaines, bactéries (B), archées (A) et eucaryotes (E). L'attribution du groupe à chaque codon est faite dans le tableau des ordres.
    − Les paires de codons qui se ressemblent beaucoup sont soulignés en jaune.
Groupes de codons
Groupe B A E total
111 Tableaux I II III 100.
cca 2,320 2,103 1,426 5,849
tac 2,732 2,172 1,925 6,828
caa 2,718 2,240 1,989 6,947
ttc 2,598 2,457 1,679 6,734
gaa 4,118 2,629 6,150 12,897
gca 4,334 2,926 6,636 13,896
tgc 1,903 3,418 2,393 7,714
atg 7,670 6,732 3,355 17,757
B A E total
444 Tableaux I II III.
cat 4 0 47 51
agt 1 0 53 54
ttt 10 0 66 76
gat 0 0 100 100
ggt 1 1 132 134
aat 5 0 149 154
tat 4 0 155 159
tgt 3 0 233 236
B A E total
333 Tableaux I II III 100.
ata 23 23 739 786
tga 560 206 242 1,008
ccg 929 1,726 639 3,293
tcg 1,116 1,737 651 3,504
cag 1,016 1,886 1,606 4,509
agg 1,469 1,886 1,116 4,471
acg 1,174 1,932 724 3,830
B A E total
224 Tableaux I II III 100.
ccc 1,167 1,955 30 3,151
gcc 1,773 2,103 352 4,227
acc 1,920 2,160 134 4,214
atc 3,916 2,423 86 6,425
B A E total
332 Tableaux I II III 100.
gcg 521 1,817 4,115 6,453
gag 591 1,829 3,261 5,681
ttg 1,702 1,863 1,085 4,650
 
 
suite
Suite B A E total
223 Tableaux I II III 100.
cta 2,102 2,115 758 4,974
tta 2,021 2,183 773 4,977
gac 3,839 2,492 2,432 8,762
441
tct 2 0 1,618 1,621
act 44 0 1,912 1,956
ctt 157 11 1,369 1,538
442
cct 4 0 1,423 1,427
gtt 4 11 1,825 1,840
att 2 0 2,109 2,111
331
ggg 964 1,772 6,126 8,862
aag 1,033 1,897 5,268 8,198
gtg 559 1,943 2,713 5,215
222
tgg 1,858 2,103 1,722 5,683
cac 2,006 2,115 1,632 5,753
gga 2,347 2,160 4,811 9,318
B A E total
214 Tableaux I II III 100.
tcc 1,923 2,172 98 4,193
gtc 1,885 2,423 95 4,403
123
gta 3,769 2,126 945 6,840
aaa 3,874 2,252 2,293 8,419
122
tca 2,255 2,103 904 5,262
aga 2,044 2,126 1,531 5,701
Tableaux I II III 100.
314 ctc 1,638 2,446 32 4,116
414 cgc 142 2,137 50 2,329
233 cgg 1,427 1,589 453 3,470
132 ctg 2,207 1,829 1,126 5,161
112 aca 2,501 2,263 1,298 6,062
142 cgt 3,182 23 1,379 4,583
211 agc 1,881 2,137 1,646 5,665
321 cga 377 2,115 2,030 4,522
443 gct 1 0 2,573 2,574
113 ggc 3,946 2,777 2,849 9,572
212 aac 3,729 2,446 3,061 9,236
  • Tableau non formaté: voit tableur
Comparaison par tri sur E et différences successives en %[modifier | modifier le wikicode]
B A E E% B%
ccc 1,167 1,955 30 9 40
ctc 1,638 2,446 32 54 1056
cgc 142 2,137 50 74 2664
atc 3,916 2,423 86 10 108
gtc 1,885 2,423 95 4 2
tcc 1,923 2,172 98 36 0
acc 1,920 2,160 134 81 243
tga 560 206 242 45 217
gcc 1,773 2,103 352 29 24
cgg 1,427 1,589 453 41 54
ccg 929 1,726 639 2 20
tcg 1,116 1,737 651 11 5
acg 1,174 1,932 724 2 4918
ata 23 23 739 2 8882
cta 2,102 2,115 758 2 4
tta 2,021 2,183 773 17 12
tca 2,255 2,103 904 5 67
gta 3,769 2,126 945 15 122
ttg 1,702 1,863 1,085 3 16
agg 1,469 1,886 1,116 1 50
ctg 2,207 1,829 1,126 15 13
aca 2,501 2,263 1,298 5 1493
ctt 157 11 1,369 1 1927
cgt 3,182 23 1,379 3 74680
cct 4 0 1,423 0 54430
cca 2,320 2,103 1,426 7 14
aga 2,044 2,126 1,531 5 101
cag 1,016 1,886 1,606 1 47680
tct 2 0 1,618 1 94200
cac 2,006 2,115 1,632 1 7
agc 1,881 2,137 1,646 2 38
ttc 2,598 2,457 1,679 3 40
tgg 1,858 2,103 1,722 6 48411
gtt 4 11 1,825 5 1044
act 44 0 1,912 1 6133
tac 2,732 2,172 1,925 3 1
caa 2,718 2,240 1,989 2 620
cga 377 2,115 2,030 4 17640
att 2 0 2,109 9 182000
aaa 3,874 2,252 2,293 4 104
tgc 1,903 3,418 2,393 2 102
gac 3,839 2,492 2,432 6 451050
gct 1 0 2,573 5 65550
gtg 559 1,943 2,713 5 606
ggc 3,946 2,777 2,849 7 6
aac 3,729 2,446 3,061 7 531
gag 591 1,829 3,261 3 1199
atg 7,670 6,732 3,355 23 1373
gcg 521 1,817 4,115 17 351
gga 2,347 2,160 4,811 9 127
aag 1,033 1,897 5,268 16 7
ggg 964 1,772 6,126 0 327
gaa 4,118 2,629 6,150 8 5
gca 4,334 2,926 6,636
  • Tableau non formaté: voir tableur
Diagramme de comparaison globale[modifier | modifier le wikicode]
Corrélations entre nombre de tRNAs des 3 domaines A B E[modifier | modifier le wikicode]
  • Lien Tableur: Corrélations entre nombre de tRNAs des 3 domaines A B E
  • Voir après le texte les tableaux des corrélations et leur légende. Les diagrammes des corrélations:   Ba42 Ba62 Eb33 Eb52 Ea33 Ea53 .
  • Similitude des comportements des codons dans les 3 domaines
    1. Problématique: La similitude des comportements des codons dans 4 processus différents est le résultat de leurs comportements physiques dans l'ADN.
      − Liens:   ordre des codonsmoyenne des codonsE/BTotaux1ère et 2ème valeurdiagramme global.
      − Si l'hypothèse de la résonance dans l'ADN était vraie on devrait dégager une similitude de comportement des codons indépendamment des processus qui agissent sur eux. J'ai démontré, dans l'étude des diagrammes étendus, que le comportement des codons n'était pas assujetti aux radicaux de leurs aas et que tout codon avait un comportement propre à lui. Avec l'étude du nombre des gènes des tRNAs dans les 3 domaines le comportement des codons n'est soumis qu'aux processus qui affectent l'ADN pour leurs duplications, sans considération des aas qu'ils codent. Ces processus sont différents dans les 3 domaines Bactéries Archées Eucaryotes comme nous l'avons vu en introduction [5]. Du point de vue théorique ces 4 processus peuvent être différenciés comme suite:
      1.− Les gènes de protéines sont soumis à la résonance de l'ADN entre le codon d'initiation et le codon stop, c'est ce que j'ai appelé la conformation du gène [6].
      2.− Les gènes des tRNAs des eucaryotes, grâce à la membrane nucléique qui protège les RNAs, peuvent incorporer un intron entre les bases 36 et 37 ce qui change leur résonance dans l'ADN, les rend plus sensibles aux processus de duplication et permet la synthèse des tRNAs de codons se terminant par t une fois l'intron excisé.
      3.− Les gènes des tRNAs des archées doivent être très robustes et nécessiter peu de transformations. Cette robustesse se traduirait par un gène tRNA par codon et pour tous les codons xyc,a, g. D'où l'uniformité constatée des tRNAs des archées (voir l'introduction aux tRNas, paragraphe archées [7] ) et seraient très peu sensibles au processus de duplication. Cette uniformité est due à l’architecture particulière de la membrane des archées.
      4.− Les gènes des tRNAs des bactéries n'ont pas la protection de la membrane nucléique pour utiliser les introns à grand échelle ni la membrane des archées qui leur permet de survivre aux contraintes physiques extrêmes. Ils sont alors plus sensibles à la duplication et peuvent utiliser toute la gamme de résonance permise sans les introns. Cette résonance sans les introns permet la synthèse de gènes de tRNAs de codons se terminant par t mais leurs comportements ( ctt cgt) sont totalement différents de ceux des eucaryotes comme on le verra.
    2. Méthode d'analyse
      1.− Les comportements des tRNAs des bactéries et des archées se ressemblent beaucoup. J'ai montré dans le tableau des ordres des codons qu'il n'y a que 4 carrés à changements nets dans les ordres des valeurs dont 2 carrés anormaux, 3 carrés à changements très faibles et huit sans changement du tout. C'est ce qui m'a poussé à faire les moyennes des codons par ligne. Il s'est avéré que, dans les 2 domaines, les codons se terminant par g sont nettement inférieurs aux c a qui se différencient très peu par leur moyenne. Ensuite j'ai estimé la variation (voir 1ère et 2ème valeur) entre les codons se terminant par c a. Bien que la différence entre a c chez les archées soit très faible ( différence et taux de variation) elle reste conséquente (moyenne des variations de 48% pour les bactéries et 18% pour les archées). Enfin le diagramme global des 3 domaines (sans les codons se terminant par t à très faibles valeurs, soit 44 codons restant) montre clairement qu'il y a une très bonne corrélation entre archées et bactéries.
      2.− Permutations chez les eucaryotes: Il est difficile de trouver une similitude de comportement des eucaryotes avec les bactéries et les archées. On ne peut pas trouver de corrélation entre les nombres des tRNAs tant les changements des codons se terminant par c en t sont brutaux, nombreux et quasiment symétriques, et que les codons de la 4ème ligne gxy sont excessivement dupliqués.
      Les changements quasiment symétriques des c en t suggèrent cependant qu'on puisse permuter leurs valeurs pour chercher une corrélation entre codons des eucaryotes et les 2 autres domaines. En effet dans le tableau des moyennes des codons, les codons t qui sont devenus majoritaires ont un taux de variance faible, par rapport à leur moyenne 25%, proche de celle des archées et égal à celui des codons c qui n'ont pas changés. Leurs moyennes ne diffèrent que de 25% (1713 contre 2123). Voir les lignes t2 et c2 du tableau. De même pour les valeurs mineurs respectivement de ces codons, les moyennes ne diffèrent que de 8% et leurs taux de variance conformes à leurs faibles effectifs mais tous les 2 très élevés. Voir les lignes t1 et c1 du tableau.
      3.− Retrait des changements élevés: En ce qui concerne les duplications excessives je les ai retirées de la corrélation. Elles sont au nombre de 12 entre eucaryotes et bactéries et de 10 seulement entre eucaryotes et archées car chez ces derniers la valeur excessive de cga chez les eucaryotes s'est uniformisée chez les archées et tgc n'est pas retiré selon un rapport E/A que je n'ai pas réalisé. Voir le tableau E/B pour les valeurs excessives. Le rapport E/B du codon cct (ou ccc pour les diagrammes) est de 16, celui de cag de 20 mais ces codons n'ont pas été retirés parce qu'ils influent très peu sur les coefficients de corrélation et de détermination comme on le constate sur les diagrammes Eb33 et Ea33 .
      4.− Diagrammes après permutations et retraits: En fin de compte il reste 62 codons à corréler entre bactéries et archées, 50 entre eucaryotes et bactéries et 52 entre eucaryotes et archées, ensembles tout à fait comparables.
      5.− Diagrammes après retrait des valeurs faibles: Pour pousser plus loin la comparaison j'ai réduit, dans un 2ème temps, les effectifs des codons à comparer en éliminant les faibles valeurs de nombres de tRNAs, car ces valeurs constituent un groupe très différent des valeurs élevées qui ont une grande signification statistique. En outre les 4 codons tga ata atg et tgc influent beaucoup sur les coefficients des 3 comparaisons (diagrammes Eb52 Ea53 Ba62 ) et ont donc été éliminés des groupes réduits. Le nombre de codons à corréler se réduit alors respectivement à 42, 31 et 32 pour les corrélations ci-dessus (voir respectivement les diagrammes Ba42 Eb33 Ea33 ). C'est moins que précédemment mais les comparaisons restent statistiquement valables.
    3. Résultats: Voici ci-dessous tableau1 un condensé des corrélations des 3 combinaisons EB EA BA.
      1.− Il y a bien corrélation forte pour 42 31 32 codons comparés respectivement des combinaisons BA EB EA, aux quels il faut ajouter gxa (3), gxb(4) et aag qui évoluent dans le même sens entre B A et E avec les exagérations qui les ont exclus. Il faut ajouter atg tga qui évoluent sans basculement dans leur carrés pour les 3 combinaisons. Ce qui fait finalement, en excluant les permutations, 43 28 28 codons qui évoluent dans le même sens. En excluant les permutations et atg tga ata tgc on n'a fait corréler respectivement que 42 18 18 codons pour BA EB EA.
      2.− Pour les explications théoriques les processus se différencient encore plus par le comportement de ata, cga et tgc. Seul E active ata. La duplication de tgc est décuplée entre A et B et multiplié par 16 entre B et E. Pour cga, A le normalise par rapport à B, ce qui est conforme au processus de A. Mais pour B le couple cga/cgg se comporte comme le doublet cgt/cgc, il y a permutation. La permutation se fait dans le même domaine. Ainsi il y a permutation entre cgg et cga, dans B, car chacun se comporte à l'inverse de ses codons semblables (se terminant par la même base): cgg devrait avoir une valeur seconde comme les 9 autres xyg sur 11 si on exclut les exceptions tag, tgg et atg, ctg/cta ne permutant pas car ils sont à égalité (ce qu'on peut considérer comme une permutation neutre); cga devrait avoir une valeur élevée par rapport aux codons xyg comme les 12 autres xya. On peut faire le même parallèle pour cgt/cgt dans B et dans E, ce qui fait qu'il y a 8 permutations dans E et une dans B. Je définis la bascule comme l'inversion d'un rapport de 2 codons entre 2 domaines. La permutation est propre à un processus alors que la bascule définit la relation entre 2 processus.
      Tout ceci est clairement mis en évidence dans le tableau2 ci-dessous quand on compare les rapports g/a de B et E. Ainsi cgg/cga permute dans B avec un rapport de 3.78 et bascule entre B et E avec un rapport de 0.22 dans E. Ce rapport dans E est le plus petit devant ccg/cca avec 0.45. Le processus de E traite cga comme si c'était un xyg et l'augmente comme les gxg et aag, alors que les autres diminuent. Le processus E traite aussi cgg comme si c'était un xya et le diminue comme les xta et les xca. Par contre cgt/cgc ne bascule pas avec un rapport de 22.5 dans B et 27.8 dans E. Deux bascules de même importance que cgg/cga sont aag/aaa et gtg/gta qui se font dans le même sens que les bascules t/c. Mais les rapports dans E sont trop faibles pour une permutation. Les rapports du tableau2 sont faits à partir des tableaux I1 et III3 des nombres de tRNAs par génome.
    4. Critiques:
      .− Avec les codons de gènes de protéines j'avais démontré l'unicité de chaque codon. Ici avec les corrélations seuls 28 codons répondent au test de l'unicité des 3 processus de l'ADN. Par ailleurs je n'arrive pas à comprendre que le tRNA ata n'existe quasiment pas chez les A et B alors qu'en principe le codon ata devrait être traduit par le tRNA atg comme pour les aas à 2 codons. Le nombre élevé des tRNAs atg laisse penser que c'est le cas, mais il faut alors une modification drastique pour l'habiller en Ile. C'est ce qui se passe chez E.Coli comme on le verra dans les modifications(ref.). Par ailleurs, nous le verrons dans les tRNAs super wobbles (Nombres de tRNAs des_4032_bactéries tableau II), 2 % des bactéries utilisent le seul gène tRNA atg pour traduire les 4 codons du carré at.
    5. Hypothèses:
      .− Ces remarques sur les 3 processus, les nombreux cas particuliers et le codon ata m'a amené à remettre sur le tapis la résonance dans l'ADN. En tenant compte que mêmes les toutes petites différences des nombres chez les A jouent un rôle dans les corrélations précédentes, il est évident qu'un 5 ème processus est en jeu dans les faibles codons. Ce processus serait très peu sensible à la création des gènes tRNAs mais il serait valorisé par les processus de duplication chez les eucaryotes qui augmentent notablement les codons faibles. Avec l'hypothèse de la résonance je stipule que tout gène tRNA a une résonance et en particulier son codon aussi. Il suffit que le processus de duplication soit assez robuste pour le révéler. Je conçois alors le codon dans le tRNA comme un codon d'un polypeptide réduit à 1 seul aa. Aussi les 64 codons peuvent être étudiés, non seulement par rapport à leur 3ème base, mais par rapport aux 3 bases. Ce qui m'a ramené à étudier les triplets (et non le code génétique défini pour la traduction) suivant la 1ère base (ligne) et la 2ème base (colonne). L'entité de base sera alors le carré à 4 codons. Si l'hypothèse de la résonanse est vraie alors le tableau des triplets, dans l'ADN et non en relation avec la traduction, sera structuré en lignes et colonnes de forces différentes comme je l'ai décrit dans répétitions des bases (ref.). C'est cette structuration que je décris dans l'analyse des tableaux des nombres et des totaux. Je comparerai, ensuite, en détail les codons dans toutes les combinaisons 2 à 2 pour montrer que chaque codon est unique. La comparaison du processus qui détermine les codons dans les protéines (codon usage) avec les processus dans l'ADN que nous venons de voir sera abordé avec l'étude spécifique des 111 bactéries des diagrammes étendus et les gènes des tRNAs du domaine bactérien.
Tableau 2. Bascule des codons g vers a
g/a B E B E B E B E
tt 0.84 1.40 tc 0.49 0.72 ta tg 3.32 7.10
ct 1.05 1.49 cc 0.40 0.45 ca 0.37 0.81 cg 3.78 0.22
at 328 4.54 ac 0.47 0.56 aa 0.27 2.30 ag 0.72 0.73
gt 0.15 2.87 gc 0.12 0.62 ga 0.14 0.53 gg 0.41 1.27
Tableau 1. condensé des corrélations EB EA BA
Diagramme Eb52 Eb33 Ea53 Ea33 Ba62 Ba42
R2 81.7 56.8 76.3 58.0 75.0 60.3
corrélation 90.4 75.4 87.4 76.2 86.6 77.7
codons 50 31 52 32 62 42


  1. Coefficient R 80.9 77.7: coefficient de corrélation respectivement de toute la colonne, des codons colorés en cyan.
  2. Domaine A B E, Ba Eb Ea: domaine respectivement des archées bactéries eucaryotes, diagramme respectivement de la corrélation AB BE AE.
  3. permutation: permutation entre le nombre de tRNAs du codon xyt et xyc pour le domaine E, 7 permutations, et le domaine B, 1 permutation. En supposant que les tRNAs des codons xyt de E se comportement relativement de la même façon que les codons xyc de B.
  4. Retraits:retrait des codons gxa,g et cga aag qui sont surexprimés dans le domaine E.
  5. X10: multiplication des nombres des tRNAs des domaines A et B pour adapter à l'échelle de E.
Corrélations entre nombre de tRNAs des 3 domaines A B E
Corrélation AB
Iab. Sans permuter
coefficient R 80.9
domaine B A
ttt 0.25 0
ttc 151 117
tta 118 104
ttg 99 89
ctt 9.2 0.54
ctc 95 116
cta 123 101
ctg 129 87
att 0.12 0
atc 228 115
ata 1.4 1.1
atg 447 320
gtt 0.22 0.54
gtc 110 115
gta 220 101
gtg 33 92
tct 0.12 0
tcc 112 103
tca 131 100
tcg 65 83
cct 0.25 0
ccc 68 93
cca 135 100
ccg 54 82
act 3 0
acc 112 103
aca 146 108
acg 68 92
gct 0.05 0
gcc 103 100
gca 253 139
gcg 30 86
tat 0.10 0
tac 159 103
cat 0.10 0
cac 117 101
caa 158 107
cag 59 90
aat 0.12 0
aac 217 116
aaa 226 107
aag 60 90
gat 0 0
gac 224 118
gaa 240 125
gag 34 87
tgt 0.07 0
tgc 111 163
tga 33 10
tgg 108 100
cgt 185 1.1
cgc 8.3 102
cga 22 101
cgg 83 76
agt 0.02 0
agc 110 102
aga 119 101
agg 86 90
ggt 0.02 0.54
ggc 230 132
gga 137 103
ggg 56 84
IIab. 1 permutation
86.6
B A
0.25 0
151 117
118 104
99 89
9.2 0.54
95 116
123 101
129 87
0.12 0
228 115
1.4 1.1
447 320
0.22 0.54
110 115
220 101
33 92
0.12 0
112 103
131 100
65 83
0.25 0
68 93
135 100
54 82
3 0
112 103
146 108
68 92
0.05 0
103 100
253 139
30 86
0.10 0
159 103
0.10 0
117 101
158 107
59 90
0.12 0
217 116
226 107
60 90
0 0
224 118
240 125
34 87
0.07 0
111 163
33 10
108 100
8.3 1.1
185 102
22 101
83 76
0.02 0
110 102
119 101
86 90
0.02 0.54
230 132
137 103
56 84
IIIab. codons xya,g
84.0
B A
 
 
118 104
99 89
 
 
123 101
129 87
 
 
1.4 1.1
447 320
 
 
220 101
33 92
 
 
131 100
65 83
 
 
135 100
54 82
 
 
146 108
68 92
 
 
253 139
30 86
 
 
 
 
158 107
59 90
 
 
226 107
60 90
 
 
240 125
34 87
 
 
33 10
108 100
 
 
22 101
83 76
 
 
119 101
86 90
 
 
137 103
56 84
IVab. Diagramme AB x10
86.6 77.7
codons A Ba
ttt 0 2.5
att 0 1.2
tct 0 1.2
cct 0 2.5
act 0 26
gct 0 0.5
tat 0 1.0
cat 0 1.0
aat 0 1.2
gat 0 0
tgt 0 0.7
agt 0 0.2
ctt 5.4 92
gtt 5.4 2.2
ggt 5.4 0.2
ata 10.9 13.6
cgt 11 83
tga 98 326
cgg 755 832
ccg 821 541
tcg 826 650
ggg 842 562
gcg 864 304
ctg 870 1,286
gag 870 344
ttg 886 992
cag 897 593
agg 897 856
aag 902 602
acg 918 685
gtg 924 326
ccc 929 680
tca 1,000 1,314
cca 1,000 1,352
gcc 1,000 1,033
tgg 1,000 1,083
cta 1,005 1,225
cac 1,005 1,169
cga 1,005 220
gta 1,011 2,197
aga 1,011 1,191
cgc 1,016 1,855
agc 1,016 1,097
acc 1,027 1,119
gga 1,027 1,368
tcc 1,033 1,121
tac 1,033 1,592
tta 1,038 1,178
caa 1,065 1,584
aaa 1,071 2,258
aca 1,076 1,458
atc 1,152 2,282
gtc 1,152 1,099
ctc 1,163 955
aac 1,163 2,174
ttc 1,168 1,514
gac 1,185 2,238
gaa 1,250 2,401
ggc 1,321 2,300
gca 1,391 2,526
tgc 1,625 1,109
atg 3,201 4,471
Corrélation BE
Ibe. Sans permuter
35.6
B E
ttt 0.25 43
ttc 151 1,247
tta 118 574
ttg 99 806
ctt 9.2 1,017
ctc 95 24
cta 123 563
ctg 129 836
att 0.12 1,566
atc 228 64
ata 1.4 549
atg 447 2,492
gtt 0.22 1,355
gtc 110 70
gta 220 702
gtg 33 2,015
tct 0.12 1,202
tcc 112 73
tca 131 672
tcg 65 483
cct 0.25 1,057
ccc 68 22
cca 135 1,059
ccg 54 474
act 3 1,420
acc 112 99
aca 146 964
acg 68 537
gct 0.05 1,911
gcc 103 261
gca 253 4,928
gcg 30 3,056
tat 0.10 100
tac 159 1,430
cat 0.10 30
cac 117 1,212
caa 158 1,477
cag 59 1,193
aat 0.12 96
aac 217 2,274
aaa 226 1,703
aag 60 3,912
gat 0 65
gac 224 1,806
gaa 240 4,567
gag 34 2,422
tgt 0.07 150
tgc 111 1,777
tga 33 180
tgg 108 1,279
cgt 185 1,024
cgc 8.3 37
cga 22 1,508
cgg 83 337
agt 0.02 34
agc 110 1,223
aga 119 1,137
agg 86 829
ggt 0.02 85
ggc 230 2,115
gga 137 3,573
ggg 56 4,550
IIbe. 7 permutations
52.4
B E
0.25 43
151 1,247
118 574
99 806
9.2 24
95 1,017
123 563
129 836
0.12 64
228 1,566
1.4 549
447 2,492
0.22 70
110 1,355
220 702
33 2,015
0.12 73
112 1,202
131 672
65 483
0.25 22
68 1,057
135 1,059
54 474
3 99
112 1,420
146 964
68 537
0.05 261
103 1,911
253 4,928
30 3,056
0.10 100
159 1,430
0.10 30
117 1,212
158 1,477
59 1,193
0.12 96
217 2,274
226 1,703
60 3,912
0 65
224 1,806
240 4,567
34 2,422
0.07 150
111 1,777
33 180
108 1,279
185 1,024
8.3 37
22 1,508
83 337
0.02 34
110 1,223
119 1,137
86 829
0.02 85
230 2,115
137 3,573
56 4,550
IIIbe. retraits et X10
90.4
B E
2.48 43
1514 1,247
1178 574
992 806
91.5 24
955 1,017
1225 563
1286 836
1.24 64
2282 1,566
13.6 549
4471 2,492
2.23 70
1099 1,355
 
 
1.24 73
1121 1,202
1314 672
650 483
2.48 22
680 1,057
1352 1,059
541 474
26 99
1119 1,420
1458 964
685 537
0.50 261
 
 
 
0.99 100
1592 1,430
0.99 30
1169 1,212
1584 1,477
593 1,193
1.24 96
2174 2,274
2258 1,703
 
0 65
2238 1,806
 
 
0.74 150
 
326 180
1083 1,279
1855 1,024
82.6 37
 
832 337
0.25 34
1097 1,223
1191 1,137
856 829
0.25 85
2300 2,115
 
 
IVbe. Diagramme BE x10
90.4 75.4
codons B Eb
gat 0 65
agt 0.25 34
ggt 0.25 85
gct 0.50 261
tgt 0.74 150
tat 0.99 100
cat 0.99 30
att 1.24 64
tct 1.24 73
aat 1.24 96
gtt 2.23 70
ttt 2.48 43
cct 2.48 22
ata 13.6 549
act 26 99
cgc 82.6 37
ctt 91.5 24
tga 326 180
ccg 541 474
cag 593 1,193
tcg 650 483
ccc 680 1,057
acg 685 537
cgg 832 337
agg 856 829
ctc 955 1,017
ttg 992 806
tgg 1083 1,279
agc 1097 1,223
gtc 1099 1,355
acc 1119 1,420
tcc 1121 1,202
cac 1169 1,212
tta 1178 574
aga 1191 1,137
cta 1225 563
ctg 1286 836
tca 1314 672
cca 1352 1,059
aca 1458 964
ttc 1514 1,247
caa 1584 1,477
tac 1592 1,430
cgt 1855 1,024
aac 2174 2,274
gac 2238 1,806
aaa 2258 1,703
atc 2282 1,566
ggc 2300 2,115
atg 4471 2,492
tgc
gcc
gta
gtg
gca
gcg
aag
gaa
gag
cga
gga
ggg
Corrélation AE
Iae. Sans permuter
34.8
A E
ttt 0 43
ttc 117 1,247
tta 104 574
ttg 89 806
ctt 0.54 1,017
ctc 116 24
cta 101 563
ctg 87 836
att 0 1,566
atc 115 64
ata 1.1 549
atg 320 2,492
gtt 0.54 1,355
gtc 115 70
gta 101 702
gtg 92 2,015
tct 0 1,202
tcc 103 73
tca 100 672
tcg 83 483
cct 0 1,057
ccc 93 22
cca 100 1,059
ccg 82 474
act 0 1,420
acc 103 99
aca 108 964
acg 92 537
gct 0 1,911
gcc 100 261
gca 139 4,928
gcg 86 3,056
tat 0 100
tac 103 1,430
cat 0 30
cac 101 1,212
caa 107 1,477
cag 90 1,193
aat 0 96
aac 116 2,274
aaa 107 1,703
aag 90 3,912
gat 0 65
gac 118 1,806
gaa 125 4,567
gag 87 2,422
tgt 0 150
tgc 163 1,777
tga 10 180
tgg 100 1,279
cgt 1.1 1,024
cgc 102 37
cga 101 1,508
cgg 76 337
agt 0 34
agc 102 1,223
aga 101 1,137
agg 90 829
ggt 0.54 85
ggc 132 2,115
gga 103 3,573
ggg 84 4,550
IIae. 8 permutations
59.8
A E
0 43
117 1,247
104 574
89 806
0.54 24
116 1,017
101 563
87 836
0 64
115 1,566
1.1 549
320 2,492
0.54 70
115 1,355
101 702
92 2,015
0 73
103 1,202
100 672
83 483
0 22
93 1,057
100 1,059
82 474
0 99
103 1,420
108 964
92 537
0 261
100 1,911
139 4,928
86 3,056
0 100
103 1,430
0 30
101 1,212
107 1,477
90 1,193
0 96
116 2,274
107 1,703
90 3,912
0 65
118 1,806
125 4,567
87 2,422
0 150
163 1,777
10 180
100 1,279
1.1 37
102 1,024
101 1,508
76 337
0 34
102 1,223
101 1,137
90 829
0.54 85
132 2,115
103 3,573
84 4,550
IIIae. retraits et X10
87.4
A E
0 43
1,168 1,247
1,038 574
886 806
5 24
1,163 1,017
1,005 563
870 836
0 64
1,152 1,566
11 549
3,201 2,492
5 70
1,152 1,355
 
 
0 73
1,033 1,202
1,000 672
826 483
0 22
929 1,057
1,000 1,059
821 474
0 99
1,027 1,420
1,076 964
918 537
0 261
 
 
 
0 100
1,033 1,430
0 30
1,005 1,212
1,065 1,477
897 1,193
0 96
1,163 2,274
1,071 1,703
 
0 65
1,185 1,806
 
 
0 150
 
98 180
1,000 1,279
11 37
1,016 1,024
1,005 1,508
755 337
0 34
1,016 1,223
1,011 1,137
897 829
5 85
1,321 2,115
 
 
IVae. Diagramme AE x10
87.4 76.2
codons A Ea
ttt 0 43
att 0 64
tct 0 73
cct 0 22
act 0 99
gct 0 261
tat 0 100
cat 0 30
aat 0 96
gat 0 65
tgt 0 150
agt 0 34
ctt 5 24
gtt 5 70
ggt 5 85
ata 11 549
cgt 11 37
tga 98 180
cgg 755 337
ccg 821 474
tcg 826 483
ctg 870 836
ttg 886 806
cag 897 1,193
agg 897 829
acg 918 537
ccc 929 1,057
tca 1,000 672
cca 1,000 1,059
tgg 1,000 1,279
cta 1,005 563
cac 1,005 1,212
cga 1,005 1,508
aga 1,011 1,137
cgc 1,016 1,024
agc 1,016 1,223
acc 1,027 1,420
tcc 1,033 1,202
tac 1,033 1,430
tta 1,038 574
caa 1,065 1,477
aaa 1,071 1,703
aca 1,076 964
atc 1,152 1,566
gtc 1,152 1,355
ctc 1,163 1,017
aac 1,163 2,274
ttc 1,168 1,247
gac 1,185 1,806
ggc 1,321 2,115
tgc 1,625 1,777
atg 3,201 2,492
gcc
gta
gtg
gca
gcg
aag
gaa
gag
gga
ggg
Nombres de tRNAs, pour 100 000 tRNAs et tRNAs par génome[modifier | modifier le wikicode]
  • Voir après le texte les tableaux des gènes tRNAs et leur légende.
Au niveau de l'ADN le code génétique est structuré par doublets.[modifier | modifier le wikicode]
  • Lien au tableau analysé: ci-dessous.
  • La genèse des gènes de tRNAs et leur duplication
    1. Problématique:
      − Nous avons vu dans le tableau des corrélations (3.Résultats/1.−) entre gènes de tRNAs qu'il y a une très forte corrélation entre 18 codons pour les 3 combinaisons des 3 domaines BAE. Malgré les fortes corrélations obtenues entre un plus grand nombre de codons pour certaines combinaisons, il reste un très grand nombres d'exceptions, jusqu'à 44 pour les combinaisons EB et EA. Cependant les 18 codons précédents laissent penser que le comportement d'un gène de tRNA dans le code est déterminé dans l'ADN avant même son intervention dans la machinerie traductionnelle. Pourtant, même dans l'hypothèse de la résonance dans l'ADN, celle d'un codon dans les gènes de protéines, fraction de la résonance du gène protéique, ne peut être comparée à celle de l'unique codon porté par son gène tRNA. La question qui se pose alors est: est-ce qu'on va retrouver la même structuration du code génétique par les gènes des tRNAs que par les codons dans les gènes protéiques? Si c'est oui, alors l'hypothèse de la résonance des gènes protéiques se trouve renforcée parce qu'il n'y a pas de lien direct, si ce n'est la sélection, entre le gène du tRNA dans l'ADN et son codon dans le gène protéique.
      − Les différences entre les processus qui interviennent dans la création et la duplication des gènes de tRNAs entre les 3 domaines permettent de mettre à l'épreuve la structuration du code génétique par ces processus. Un aperçu des processus théoriques est signalé dans la problématique du tableau des corrélations. L'analyse des tableaux des nombres des gènes des tRNAs en introduction [8] montre bien qu'il y a de grandes différences entre les processus des 3 domaines.
    2. Méthode d'analyse:
      − Comme pour les corrélations entre nombres de gènes de tRNAs il s'agit de retrouver une indépendance de la structuration du code par les doublets, par rapport aux 3 processus différents des 3 domaines, pour qu'on puisse attribuer cette structure aux propriétés physiques de chaque doublet. La méthode d'analyse consiste à dégager des propriétés communes à 4, 3 ou 2 doublets d'une ligne ou d'une colonne. Comme pour les répétitions des bases [9] la force d'interprétation est attribuée aux lignes ou colonnes ayant le plus de doublets communs.
      − En introduction j'ai détaillé la méthode de lecture des 3 tableaux I, II et III indicés par 100 pour les nombres de tRNAs rapportés à 100 000 par domaine [10]. J'utiliserai les 3 tableaux I, II et III indicés par le chiffre 1 pour le nombre de gènes de tRNAs par génome ou indice de multiplicité et les tableaux des rapports E/B . Au fur et à mesure j'illustrerai les discussions par des tableaux simples de rapports entre codons. Pour simplifier l'écriture je parle souvent de codon pour les gènes de tRNA. Je préciserai qu'il s'agit de la traduction le cas échéant.
      − Dans un 1er temps je décrirai la structuration de chaque code de chaque domaine en commençant par les structures les plus nettes et les comparerai au code génétique de la traduction. Je n'attribue un aa à un codon que pour le code de la traduction. Aussi la comparaison avec ce dernier ne se fera que par doublet ( ou carré à 4 codons).
      − Dans un 2ème temps je procéderai aux comparaisons entre codes pour dégager une structuration commune.
    3. Résultats:
      1.− Code du domaine E, les eucaryotes.
      Liens: effectifs tRNAs,   demi-doublets,   Lignes et colonnes,  comportement des 121 eucaryotes
      1.a − les bascules des codons c en t chez E.
      • Le processus qui donne naissance aux gènes de tRNAs chez les eucaryotes est sensible aux codons se terminant par t des doublets ct at gt xc cg; il est sensible aux codons se terminant par c des doublets tt xa tg ag gg. Ce qui donne 8 gènes à codons xyt et 8 gènes à codons xyc sensibles. Visuellement le code est structuré en colonnes, la 1 avec 3 doublets et la 2 avec 4 doublets sensibles aux codons se terminant par t, et la colonne 3 avec 4 doublets et la 4 avec 3 doublets sensibles aux codons se terminant par c. Il est aussi structuré en lignes, la 1 et la 2 avec 3 doublets chacune sensibles aux codons se terminant par t ou c, et la 3 et la 4 chacune sensible à 2 doublets de codons se terminant par t et à 2 doublets de codons se terminant par c
      • Si l'on compare au code génétique de l'amino-acylation, il y a une très grande similitude entre les 2 processus. Les enzymes qui fixent l'aa au tRNA après les modifications ne distinguent pas les tRNAs d'un doublet ct gt xc cg gg quand ce doublet en a plusieurs. Après traduction les 4 codons d'un même doublet de ce groupe donnent donc le même aa. Les enzymes qui fixent l'aa au tRNA des doublets tt at xa tg ag distinguent, pour le même doublet, entre les tRNAs d'un demi doublet portant les codons se terminant par t c, des tRNAs de l'autre demi doublet portant les codons se terminant par a g. Chaque demi doublet pouvant produire 1 à 2 tRNAs portant le même aa. Après traduction un doublet de ce groupe donne 2 aas sauf pour le doublet ta.
      • La similitude entre les 2 processus n'est pas totale puisque le doublet gg appartient au 2ème groupe du processus de genèse (sensible à ggc) et au 1er groupe du processus de fixation (fixant le même aa sur tous les tRNAs du doublet). Inversement le doublet at appartient au 1er groupe de genèse (sensible à att) et au 2ème groupe de fixation (fixant 1 aa par demi-doublet at). C'est seulement avec les eucaryotes que le doublet gg apparaît nettement comme une exception. Avec seulement les nombres de tRNAs, ce doublet n’apparaît pas comme une exception dans les tableaux I et II. Apparaissent par contre comme exception, dans les 9 tableaux des nombres, les 3 mêmes doublets at ta tg. Ainsi le doublet gg fait exception pour le basculement c/t, le doublet tg fait exception pour le nombre de tRNAs de son codon tga, le doublet ta pour ses 2 codons stop et le doublet at 3 fois exceptionnel par le nombre de tRNAs de son codon atg dans les 3 tableaux, par le nombre de tRNAs de son codon ata dans les tableaux I et II seulement, et par la bascule c/t dans le tableau III.
      • Le code de la genèse des tRNAs chez les eucaryotes est structuré aussi en demi-doublets: La structuration en demi-doublet dans le processus de fixation est matérialisée par la traduction d'un doublet en 2 aas différents, un aa pour les codons se terminant par c t et un aa pour les codons se terminant par a g. Cette structuration n'est valable que pour les doublets tt at xa tg ag. Avec la bascule c/t chez les eucaryotes tous les doublets sont structurés en demi-doublet c t et en demi-doublet a g. Par contre cette structuration n'est pas matérialisée pour les 2 processus de genèse et de fixation. Le processus de fixation n'a à sa disposition souvent qu'un à deux tRNAs par doublet et nécessite un processus supplémentaire pendant la traduction sur le RNAm pour le codon tga , et un processus spéciale de modification, avant celui de la fixation, pour différencier 2 tRNAs identiques du codon atg qui fixeront l'un Met lisant le codon atg et l'autre Ile lisant le codon ata. Ainsi la structuration en demi-doublet est potentielle pour le processus de fixation et se réalise avec la traduction. La structuration en demi-doublets du processus de genèse est la manifestation directe de la bascule c/t pour les 8 doublets concernés, du fait que les demi-doublets a g ne basculent pas. La structuration des autres 8 doublets ne basculant pas, se déduit du comportement semblable des demi-doublets c t des 2 groupes avec une grande différence entre le nombre des tRNAs du codons c et celui du codon t mais de sens inverse dans les 2 groupes. Les différences entre les nombres des codons a g sont beaucoup plus faibles, semblables et des 2 signes dans les 2 groupes. Voir le tableau des rapports des Demi-doublets à la suite du texte, où les rapports colorés sont des rapports inversés. Les exceptions des doublets at ta tg qu'on a révélé au paragraphe précédent met en jeu les 2 codons des 3 demi-doublets a g et aucun des 3 demi-doublets c t.
      1.b − les codons a et g de E
      • Les rapports g/a: Avec la bascule t/c nous avons défini les demi-doublets dans chaque doublet et partagé le code des gènes de tRNAs en 2 groupes dont les rapports t/c sont inversés l'un par rapport à l'autre. En utilisant les rapports g/a nous obtenons alors 4 groupes qui se différencient par des rapports t/c pour moitié inverse l'une de l'autre et de même pour le rapport g/a. Les 4 groupes de doublets se répartissent comme suite: voir tableau.
        4 dont les rapports t/c et g/a sont directs ( blanc, blanc).
        3 dont le rapport t/c est direct et le rapport g/a inversé (blanc, cyan).
        3 dont le rapport t/c est inversé et le rapport g/a direct (orange, blanc).
        5 dont le rapport t/c est inversé et le rapport g/a inversé (orange, cyan).
        Plus le doublet ta avec ses 2 codons stop (blanc).
      • Lignes et colonnes: Avant de détailler les caractéristiques de chaque doublet au paragraphe suivant on peut apprécier le poids de la 1ère et la 2ème base du doublet, du point de vue quantitatif, en étudiant les statistiques des lignes et des colonnes du tableau. Il est évident que le doublet ne peut être caractérisé que du point de vue qualitatif, c'est à dire avec des nombres et des rapports très différents. Le tableau des moyennes des codons pour une 3ème base, pour une ligne et pour une colonne, et les totaux par doublet, différencie nettement la ligne 4 par rapport aux 3 autres avec tous les codons ayant des effectifs les plus élevés de leur colonne dans le tableau des nombres III. C'est le reflet de la base G en 1ère position. Ce tableau différencie aussi nettement la colonne 3 avec les mêmes critères sauf pour le doublet ta avec ses 2 codons stops. Les lignes 1 et 2 avec des moyennes de codon (mcod) très faibles se ressemblent beaucoup et de même pour les colonnes 1 et 2 avec des moyennes faibles. Les rapports des moyennes de codon pour les 3ème bases a et g, g/a , sont inverses entre les 2 lignes d'une part et les 2 colonnes d'autre part. La ligne 3 et la colonne 4 ont des moyennes de codon élevées avec des différences faibles entre les moyennes de codon pour les 3ème bases a et g.
      • Caractérisation des codons: quand les rapports g/a sont semblables entre 2 doublets, je comparerai leurs effectifs.
        − Les 4 doublets ( blanc, blanc):
        tt : son g/a (1.4) est très différent de ceux de tg(7.1) et aa (2.3) mais proche de gg (1.3); tt (1085/773) et gg (6126/4811) sont très différents par leurs effectifs.
        tg : son g/a (7.1) est le plus élevé du tableau à cause de la particularité du codon tga à faible effectif. Son t/c (12) le plus faible du tableau.
        aa : son g/a (2.3) est élevé, 5ème sur 15. aa se distingue par rapport à gg par son codon aaa très faible (5268/2293).
        gg : il se distingue des 3 autres par ses effectifs élevés (6126/4811) qui le différencient du rapport g/a de tt (1085/773) et de celui de ca (1606/1989) trop proche de l'unité (1.2) qui ne justifierai pas son inversion.
        − Les 3 doublets ( blanc, cyan):
        ca: a le rapport g/a (1.2) le plus faible du tableau et se distingue de ag (1.4) par ses effectifs nettement plus élevés (1606/1989) contre (1531/1116).
        ag: il se distingue de ca comme ci-dessus et de ga par son rapport g/a 1.4 contre 1.9, le 6ème sur 15, et par ses effectifs 1531/1116 contre 6150/3261.
        ga: il se distingue des 2 autres par ses effectifs , 6150/3261, et son rapport g/a (1.9).
        − Les 3 doublets (orange, blanc): ct at gt. Ils se différencient par leur effectif du codon g respectivement 1126 3355 2713 et un codon a presque constant, respectivement 758 739 945. C'est la différenciation des colonnes 1 et 2 par le rapport g/a.
        − Les 5 doublets (orange, cyan):
        gc cg se distinguent des 3 autres par le rapport t/c (7.3) le plus bas du tableau pour gc et le rapport g/a inverse (4.5) le plus élevé du tableau pour cg.
        tc cc ac: La distinction par le rapport g/a est nette, respectivement 1.4, 2.2, 1.8. Ils appartiennent à la colonne 2 inverse pour le rapport g/a de la colonne 1. Et de même le codon g est constant comme le codon a de la colonne 1. Mais en plus le doublet tc se distingue par un codon a le plus faible de la colonne 2 et proche de ceux de la colonne 1; le doublet cc a la particularité, dans tout le tableau, d'avoir les codons cct et cca égaux (3/1426); la différence entre 2 codons qui vient après est celle entre cac et cag (26/1606).
      1.c − les exceptions des eucaryotes
      • L'exception du doublet cg: La caractérisation des codons en demi-doublets dans E est structurelle. C'est à dire que les comparaisons entre 2 codons t-c (xyt et xyc) et 2 codons a-g (xya et xyg) ont un sens alors que celles entre les paires t-a, t-g, c-a et c-g n'en ont pas. Ce sens est celui de la bascule, " c/t bascule et a/g ne bascule pas". Une seule exception qui confirme la règle est celle du doublet cg où a/g bascule alors que c/t a déjà fait sa bascule dans B. Nous verrons ce cas en comparant les codes de B et A à celui de E, car c'est un cas isolé difficile à révéler avec les eucaryotes seuls. L'exception du doublet cg apparaît dans le code de B avec la bascule c/t et l’exception disparaît dans E et A. Cette disparition de A fait partie aussi de son exceptionnalité. L'exception de cg dans le code de E c'est sa bascule a/g entre le code B et E alors que sa bascule c/t est une exception dans B et ne l'est plus dans E. La bascule a/g de ce doublet de 4.5 est faible par rapport aux bascules c/t, et au début je la considérait comme une non bascule dans E. Mais c'est la 2ème valeur de ce rapport avec celle du doublet at (4.5), derrière celle du doublet tg (7.1) et devant celle du doublet gt (2.9). Elle est comparable à la bascule c/t la plus faible du doublet gc (7.3). Les rapports g/a du doublet tg et du doublet at ne peuvent pas être considérés comme des bascules parce qu'ils ne s'inversent pas dans aucun code. En conclusion le doublet cg est 3 fois exceptionnel, par sa bascule c/t dans B, la disparition de celle-ci dans A et par sa bascule a/g dans E.
      • L'exception du doublet ta: ce sont les 2 codons stop qu'on connaît dans la traduction et présents dans les 3 code BAE. Absence totale de gène tRNA sinon par mutation d'un autre gène en suppresseur de codon stop.
      • L'exception du doublet tg: le gène de tRNA de son codon tga est souvent absent et le codon devient un codon stop dont son comportement vis à vis du processus GC est lui-même une exception. Quand il est présent il code un tRNA de l'aa Sec. Ce qui explique le rapport de 7.1 de son a/g à peu près constant dans les 3 codes car le gène tRNA du codon tgg du Trp est toujours présent. Dans la traduction le tRNA-Sec nécessite une séquence spécifique dans le RNA messager pour pouvoir lier son aa au polypeptide, ce qui le différencie d'un codon stop. D'où 3 comportements exceptionnels du doublet tg.
      • L'exception du doublet at: Il subit la bascule c/t dans E, donc il est sensible au codon att pour le processus de genèse des tRNAs et appartient au 2ème groupe de fixation des aas (fixant 1 aa par demi-doublet at). Il ne subit pas la bascule a/g mais son codon ata a un indice de multiplicité normal pour le code E de 5.5 alors qu'il est inexistant dans B et A comme leurs codons xyt. Nous pouvons dire qu'il est sensible au processus de la genèse des tRNAs sans basculer. Le rapport g/a du doublet at est de 4.5, égal à celui du doublet cg. Je suppose que les tRNAs ata fixent l'aa Ile chez les eucaryotes. A vérifier. Une 3ème exception du doublet at est le nombre élevé des gènes de tRNA du codon atg même chez les eucaryotes. Chez les procaryotes ces tRNAs fixent la Met et la formyl-Met nécessaire à l'initiation de la traduction et fixent après une modification spéciale Ile et lit le codon ata. D'où un nombre double de celui des eucaryotes. Chez ces derniers l'aa d'initiation est Met mais le nombre de gènes de tRNAs du codon reste élevé. Il est le plus élevé de la 1ère colonne et le 2ème de sa ligne ( 3355 pour atg contre 5268 pour aag, voir tableau des effectifs). C'est comme si, les tRNAs de ata étant présents, les tRNAs de atg étaient modifiés différemment, une moitié servirait à lire le codon atg dans le gène de protéine et l'autre ne servirait qu'à l’initiation. Nous avons, encore là, 3 exceptions pour le doublet at, la bascule c/t, la pseudo-bascule g/a de at et son comportement, et enfin le nombre élevé des tRNAs du codon atg.
      • L'exception du doublet gg: Nous avons décrit cette exception comme propre aux eucaryotes dans l'étude de la bascule c/t. Le doublet gg appartient au 2ème groupe du processus de genèse (sensible à ggc) et au 1er groupe du processus de fixation (fixant le même aa sur tous les tRNAs du doublet). J'ai étudié en détail la fréquence des répétitions de la base G et celle de la base C qui incluent essentiellement les codons ggg et ccc, dans l'article répétition des bases [11]. Développer.
      • L'exception du doublet cc: Il faudrait reprendre les comportements du codon ccc de l'article répétitions des bases [12] en relation de ceux du codon ggg. Mais dans E l'égalité des nombres de tRNA du codon cct et du codon cca est troublante.
      2.− Code du domaine B, des bactéries
      liens: Lignes et colonnes.     effectifs tRNAs     moyennes et variances.     demi-doublets
      2.a − Le code de la genèse des tRNAs chez les bactéries est structuré aussi en demi-doublets: Ce n'est pas aussi spectaculaire que chez les eucaryotes et l'on n'arrivera pas à distinguer le doublet gg comme une exception. Cependant la démonstration est plus aisée qu'avec les archées, très homogènes, où la distinction d'un doublet en 2 moitiés n'est possible qu'en s'appuyant sur le comportement des enzymes qui fixent l'aa sur le tRNA pour 8 doublets. Pour les bactéries je vais utiliser l'indice de multiplicité du tableau I1 , ainsi que la bascule c/t du doublet cg pour montrer cette partition.
      Des indices de multiplicité très faibles, inférieurs à 0.34, conjugués à l’absence des gènes de tRNA des codons se terminant par t (et se terminant par c pour le doublet cg) laissent 3 doublets à 2 aas ( tg at ga ) et 3 doublets à 1 aa ( cg gc gt ) avec 2 codons seulement dont l'indice dépasse largement l'unité ( sauf pour le codon cgg avec 0.83). Quatre autres doublets ont un indice du codon se terminant par g inférieur 0.60, soit seulement un plus que la moitié des indices des codons a et des codons c . Ce sont 2 doublets à 2 aas ( ca aa ) et 2 doublets à 1 acide aminé ( cc gg ). C'est comme si on avait 2 demi-doublets distincts, l'un sans gène de tRNA du codon t et l'autre avec un gène de tRNA du codon g très peu sensible à la duplication. Le doublet cc présente la caractéristique unique des doublets à 1 acide aminé d'avoir 1 seul codon dont l'indice est supérieur à l'unité (avec 0.68 pour le codon ccc) ce qui laisse penser qu'un seul tRNA puisse lire les 4 codons du doublets et serait donc à l'encontre de l'hypothèse du demi-doublet. Mais c'est l'exception qui confirme la règle:
      1. − Le doublet ta, avec un seul tRNA pour un demi-doublet ne code qu'un seul acide aminé.
      2. − Pour le doublet at et le doublet tg, le codon minoritaire est le codon a et il est remplacé par le codon g et non par le codon t. Donc le processus de genèse des tRNAs différencie bien entre les 2 demi-doublets.
      3. − Le doublet cg subit une bascule c/t très nette avec un rapport t/c égal à 22 (voir tableau des demi-doublets) et simultanément subit une bascule g/a franche avec un rapport g/a égal à 3.8 aussi élevé que celui de la même bascule du doublet tg (3.3). C'est comme si le demi-doublet t/c et le demi-doublet a/g étaient bien distincts. N'oublions pas que nous parlons de gènes et non de tRNAs portant un acide aminé.
      4. − Le tRNA du codon peut très bien être absent et celui-ci lu par un autre tRNA. Cela n'empêche pas que le processus de genèse des tRNAs soit plus ou moins sensible au codon ccc.
      5. − Par contre quand les codons du même demi-doublet ont des indices proches ou supérieurs à l'unité, cela veut dire que c'est une contrainte forte qui nécessite les 2 tRNAs en même temps. C'est ce qu'on observe chez les archées (13 doublets avec 3 indices proche de l'unité) et les eucaryotes (avec 5 doublets à 4 indices et 10 doublets à 3 indices proches de l'unité). Dans le cas des bactéries on a 3 doublets qui font exception et imposent 3 tRNAs, ce sont le doublet tt (indices 1.51 1.18 0.99) et le doublet ag (indices 1.10 1.19 0.86) pour 2 aas et le doublet ct (indices 0.95 1.23 1.29) pour 1 seul acide aminé.
      2.b − Le code de la genèse des tRNAs chez les bactéries est structuré aussi en lignes et colonnes:
      Codons xyg: Voir tableau des nombres de gènes de tRNA. Avec les bactéries la majorité des codons xyg (11 sur 15) sont minoritaires dans leur doublet. Comme les codons xyt sont presque inexistants il ne nous reste plus que 3 codons par doublet à comparer. Par leur faiblesse les codons xyg deviennent homogènes et nous permettent alors de différencier les colonnes 2 par 2 et la ligne 4 par rapport aux 3 autres lignes. C'est ainsi que les colonnes 1 et 4 ont chacune 3 codons xyg à effectif élevé ( 1702 2207 7670, 1858 1427 1469 ) alors que les colonnes 2 et 3 ont 7 codons g à effectif faible ( 521 - 1174 ) et la ligne 4 a 4 codons à effectif faible ( 964 - 521 ).
      Codons xya et xyc: J'ai conçu 2 tableaux spécialement pour ces codons, lignes colonnes c − a des bactéries, pour les faire ressortir. Les 16 codons xyt (cgc permuté avec cgt) forment un groupe homogène à très faibles effectifs; les 14 codons xyg (sans atg) forment un groupe homogène aux effectifs faibles dont seulement ttg tgg ctg dépassent 1638 (effectif du codon cta) et se structurent en ligne colonne comme on l'a vu précédemment ci-dessus. Par contre je n'arrive pas à séparer les codons xyc des xya. Les codons xyc se divisent en 2 groupes, un de 8 codons à effectifs élevés de 1638 (cta) à 2006 (cac) et un de 7 codons à effectifs très élevés de 2598 (ttc) à 3946 (ggc). De même pour les codons xya on a, respectivement, un groupe de 6 codons de 2021 (tta) à 2347 (gga) et un groupe de 6 codons de 2501 (aca) à 4334 (gca). Le seul codon qui empiète sur la gamme des effectifs des codons xyg est ccc avec 1167. L'exclusion du codon cga vient du fait qu'il est très faible chez les bactéries et qu'il bascule avec le codon cgg quand on passe des bactéries aux eucaryotes.
        Les codons à effectifs très élevés, homogènes et communs aux codons xyc et xya font qu'on ne peut pas séparer ces derniers en 2 groupes homogènes. Aussi ils sont analysés ensemble. Le résultat intéressant qui ressort de cette analyse, c'est la distinction nette entre les colonnes 2 et 3 d'une part et l'équivalence des colonnes 1 et 4, ce que la structuration en lignes et colonnes 121 eucaryotes, englobant tous les codons, ne montre pas. Par contre les lignes des xya et xyc confirment l'équivalence des lignes 1 et 2 d'une part et 3 et 4 d'autre part.
        Les 8 codons à effectifs très élevés, entre 3729 et 4334 (à part atg), seraient la manifestation de la résonance dans l'ADN chez les bactéries comme cela est supposé dans le cadre de cette hypothèse (ref.) par le grand saut entre tac (2732) et aac (3729). Le cas de cgt (3129), intermédiaire, serait du à la permutation cgt/cgc, processus unique chez les bactéries.
      2.c − Les exceptions dans le domaine B des bactéries.
      − En construisant le tableau des ligne et colonne, j'avais tenu compte, dans un 1er temps, des exceptions que j'avais décrites dans le chapitre des eucaryotes (ref.). En ajoutant les exceptions propres au domaine B il m'est apparu, qu'en fait, tout doublet est caractérisé par sa ligne et sa colonne avec les 2 processus de genèse des tRNAs des domaines E et B. Aussi, je n'ai retiré, dans le tableau que 4 codons: taa tag pour les 3 domaines et ata atg pour les 2 domaines B et A seulement parce que les 2 1ers sont des codons stop, que le codon ata ressemble par sa faiblesse (comme les codons xyt des domaines A et B) à un codon stop et qu'enfin le codon atg, associé au même demi-doublet que ata et avec des effectifs élevés dans A et B, pouvait être retiré de ces 2 domaines comme le codon ata. J'ai gardé le codon ata et le codon atg dans le domaine E parce qu'ils ont des effectifs analogues aux autres codons de E.
      − Nouveaux comportements des exceptions déjà décrites dans le domaine E:
      • ta: rien de nouveau.
      • tg: le codon tgg augmente légèrement son effectif par rapport à celui du domaine E et apparaît comme un codon xyg majeur dans B (effectif dans B, 1.858).
      • gg: il n'est plus une exception dans B, car il n'a pas de sensibilité au codon ggt (gène tRNA) et code 1 seul aa (amino-acylation).
      • cc: il n'y a plus égalité entre cct et cca, mais il y a faiblesse et presque égalité entre ccc et ccg. J'ai utilisé ce changement pour montrer la partition en demi-doublet dans le domaine B.
      • cg: La bascule c/t apparaît dans le domaine B et est maintenue dans le domaine E. Le rapport g/a s'inverse dans B par rapport à E et cgg devient majeur (effectif dans B, 1.427) parmi les codons xyg de B. Le codon cgg lui même devient une nouvelle exception dans B. Son effectif est réduit de 69% et celui du codon cga associé à son demi-doublet est multiplié par 5 dans E. C'est l’effet de la bascule g/a.
      • at: redevient normal pour la sensibilité au codon att du fait qu'il perd cette sensibilité (gène tRNA), comme le doublet gg et qu'il code 2 aas (amino-acylation). Par contre le codon ata devient inexistant, équivalent à un codon xyt, le codon atc et le codon atg voient leurs effectifs doublés par rapport au domaine E. Les tRNAs du codon atg semblent subir 3 types de modifications, une pour fixer Met, une pour fixer formyl-Met comme tRNA d'initiation de la traduction chez les procaryotes et une pour fixer Ile. D'où le doublement de son effectif dans B et apparaît comme un codon xyg majeur dans B (effectif dans B, 7.670).
      − Nouvelles exceptions dans le domaine B:
      • ct: il apporte 2 nouvelles exceptions. L'effectif du codon ctt devient aussi significatif que le codon cgc dans B, mais il n'y a pas bascule. Et le codon ctg devient majeur (effectif dans B, 2.207) parmi les codons xyg de B. L'effectif du codon ctg est réduit de 50% et celui du codon cta associé à son demi-doublet est réduit de 65% dans E.
      • tt: son codon ttg est un codon xyg majeur dans B (effectif dans B, 1.702). Son effectif est réduit de 37% et celui du codon tta associé à son demi-doublet est réduit de 62% dans E.
      • ag: il arbore le même comportement que le doublet tt. Son codon agg est un codon xyg majeur dans B (effectif dans B, 1.469). Son effectif est réduit de 25% et celui du codon aga associé à son demi-doublet est réduit de 27% dans E.
      • tc: L'exception n'apparaît qu'en comparant B avec E. Son codon tca paraît banal dans B et dans E parmi les autres codons xya. Mais son effectif est réduit de 61% dans E par rapport à B. L'effectif de son codon tcg associé au demi-doublet est lui réduit de 43%.
      − Les aas à 6 codons: Avec le processus de genèse des tRNAs dans E j'avais trouvé que la sensibilité à la bascule c/t était associée aux doublets à 1 acide aminé sauf pour le doublet gg. Dans B le processus de genèse différencie entre codons xyg majeurs (6) et mineurs (9). Et 4 codons xyg majeurs se trouvent associés aux aas à 6 codons, 2 pour la Leu (ttg ctg) et 2 pour l'Arg (cgg agg). La Ser avec 6 codons ne suit pas. Elle se distingue par le fait qu'elle n'a pas 2 codons xyg et son codon tca qui est réduit fortement.
      − Les comportements différents des demi-doublets a g et des demi-doublets t c:
      • Les demi-doublets t c réagissent fortement, par la bascule c/t, au processus de genèse des tRNAs des eucaryotes (7 cas) et peu à celui des bactéries (1 cas).
      • Par contre les demi-doublets a g réagissent aux 2 processus par des bascules a/g plus modérées que les bascules c/t, par des exceptions communes aux 2 domaines (tg où tga est faible, at où ata est quasiment inexistant dans B et ta avec les 2 codons stop) et par des réductions et des augmentations de forces variées des codons xyg et/ou xya. C'est ainsi que les exceptions apparaissent toujours avec les demi-doublets a g sauf pour le doublet cc où les 2 codons sujets de l'exception (égalité entre eux) changent de c/g dans B à t/a dans E, et le doublet gg qui doit son exception à son insensibilité aux 2 processus. A la différence de la bascule c/t qui ne change pas entre B et E, la bascule g/a du doublet cg est inversée entre B et E.
      • En résumé, les 2 processus de genèses et de duplication des tRNAs dans E et B sont complètement différents.
      3.− Code du domaine A, les archées.
      3.a − Le processus de genèse et de duplication des tRNAs est très différent de ceux de E et B.
      liens: Introduction aux tRNAs, paragraphe archées [13] pour l'uniformité des archées.     Aperçu théorique du processus chez les archées dans les corrélations, chapitre "1.− Problématique".     Demi-doublets     Lignes et colonnes.     effectifs tRNAs     moyennes et variances.     ordre des codons.     1ère 2ème valeur.     ordre dans les carrés.     groupes de codons.     comparaison par tri.     diagramme global.
      Malgré la disparition des sensibilités détectées avec les bactéries et les eucaryotes avec leurs exceptions, je retrouve, par comparaison, la structuration en ligne et colonne. La structuration par demi-doublet reste faisable pour les aas à 2 codons mais devient difficile pour les aas à 4 codons. Avec les archées, à cause de l'uniformisation ou autrement dit, du manque de sensibilité du processus, apparaît la structuration par codon, comme si elle était masqué par les processus puissants des E et B.
      Structuration par codons: Elle devrait se traduire, pour un doublet donné et quelque soit ce doublet, par les 4 codons tous différents entre eux. Étant donné la faiblesse des différences entre codons on aurait du avoir, statistiquement, quelques égalités strictes entre codons du même doublet sur 15 doublets avec 3 codons non nuls chacun.
      • Si maintenant on admet que le processus agit spécifiquement sur les codons se terminant par g puisque 13 d'entre eux ont des effectifs strictement inférieurs (gtg 1943) à ceux des codons se terminant par a c (ccc 1955) en omettant, de façon évidente, les 2 exceptions des doublets tg et at , il reste alors 13 couples a c à comparer (effectifs tRNAs). Chez les archées seuls deux couples a c diffèrent d'une unité (aga c) sur 187 et de 2 (cga c) sur 187. Chez les eucaryotes 1 seul couple (cct a) diffère de 3 sur 1641. Sinon dans les 3 domaines les différences sont largement supérieures (1ère 2ème valeur). Voici le tableau des 1ères valeurs les plus faibles.
      • Si on compare (multiplicité tRNAs) codon par codon, entre les 2 domaines B et A, il y a des ressemblances évidentes qui font penser aux corrélations déjà étudiées (corrélations). C'est ainsi pour les couples gca c (1.03 - 2.53 / 1.00 - 1.39), gaa c (2.24 - 2.40 / 1.18 - 1.25), gga c (2.30 - 1.37 / 1.32 - 1.03), cca c (0.68 - 1.35 / 0.93 - 1.00), respectivement pour B / A, xya - xyc.
      • Dans l'hypothèse de la résonance de l'ADN tous les codons devraient être différents entre eux. Par contre pour les archées seuls, avec leurs faibles effectifs j'ai trouvé plusieurs codons de même effectif: (diagramme global) 8 paires, 1 quadruple et un triple sur les 44 codons du diagramme. Le contraste entre l'ensemble des codons et les codons d'un même carré chez les archées est nette. Les codons d'un carré ne diffèrent entre eux que par une base à la 3ème position, ils sont donc comparables car les tRNAs avec leur résonance propre, ont une direction qui est nécessairement sensible aux processus de genèse des tRNAs des archées qui ne font pas beaucoup de duplication. La différence de résonance entre 2 codons d'un même carré est donc celle des résonances des 2 3ème bases qui, en principe, sont différentes par leurs architectures moléculaires. Et c'est pour cela qu'il y a structuration par codon. La différence de résonance entre 2 codons de 2 carrés différents peut être plus faible qu'entre 2 codons du même carré. Car la résonance d'un codon est la combinaison des états vibratoires de ses 3 bases, qui peuvent s'affaiblir ou au contraire se renforcer d'après la théorie ondulatoire.
      • Les codons identiques dans les carrés triés sur la 1ère et la 2ème base: Avec l'uniformité des archées le regroupement des codons suivant la 1ère et la 2ème base au lieu de la 3ème comme précédemment donne à peu près le même résultat, cependant avec une légère diminution de la 1ère à la 3ème base comme si effectivement cette dernière était sensible à la résonance des tRNAs pendant leur création. Les résultats pour la 1ère et la 2ème base sont consignés dans le tableau des codons identiques dans les 3 domaines. Les résultats pour la 3ème base sont ceux déjà étudiés précédemment avec la comparaison des 1ères 2èmes valeurs. La diminution des codons identiques se décile comme suite:
        + Par rapport à la 1ère base nous avons chez les archées (voir tableaux des effectifs et non en 100000 tRNAs) 3 couples identiques (jaunes) et 7 couples se différenciant par 1 seul tRNA (orange); chez les bactéries 1 couple presque identique (jaune) avec une différence seulement de 3 pour 2000, vient ensuite 1 couple (cyan) avec une différence de 17 pour 1000; chez les eucaryotes les différences sont toujours supérieurs à 2%.
        + Par rapport à la 2ème base, chez les archées 2 couples identiques (jaune), 4 couples différant par 2 tRNAs (orange) et 3 couples par 2 tRNAs (cyan), en comptage direct; chez les bactéries 1 seul couple avec une différence de 1% de même pour les archées (cyan).
        + Par rapport à la 3ème base, chez les archées 1 couple différant par un tRNA et un autre par 2, les autres par plus de 6; chez les bactéries tous les couples ont une différence supérieure à 2%; chez les eucaryotes 1 seul couple presque identique (cct cca que nous avions repéré comme une exception) avec une différence de 3 pour 1638 (comptage direct) tous les autres dépassent les 7%.
      • J'ai cherché ensuite à comparer tous les codons, quelque soit leur doublet, 2 à 2 pour rechercher ceux qui se comportent de la même façon dans les 3 domaines.
        + Dans un 1er essai j'ai comparé 2 codons par leurs effectifs dans les 3 domaines B A E, après les avoir ordonnés. Je n'ai trouvé que 4 paires aux codons presque identiques (voir le tableau des comparaisons (groupes de codons)).
        + Dans un 2ème essai j'ai aligné les 3 colonnes des effectifs des codons des 3 domaines et je les ai triés dans l'ordre croissant des eucaryotes (comparaison par tri). J'ai ajouté une colonne pour le taux de différence entre 2 codons successifs d'eucaryotes et une autre colonne pour le taux des mêmes codons pour les bactéries. Comme les effectifs des eucaryotes sont triés leurs différences sont très faibles, par contre celles des bactéries et des archées peuvent être élevées. Après avoir souligné les taux inférieurs à 16% des bactéries il ne me reste qu'à estimer la différence entre les 2 codons des archées puis comparer les 3 effectifs. Les faibles effectifs des codons se terminant par t ne sont pas contenus dans ces listes (pour éviter la division par zéro). En plus des 2 couples à forts effectifs du test précédent (tac.caa et cta.tta) j'ai trouvé le couple cac.agc dont les codons sont très semblables.
      • Conclusion pour la structuration par codons: En conclusion je peux dire que
        + chaque codon a un comportement spécifique quand on le teste dans les 3 domaines pour la genèse et la duplication des gènes de tRNAs;
        + pour les processus de genèse et de duplication des 3 domaines, les 4 codons d'un doublet traductionnel (xy.) se comportent différemment l'un de l'autre, c'est la structuration par codon;
        + pour les archées on aperçoit surtout la structuration par le processus de genèse même pour les codons se terminant par g car tous les codons c a g doivent exister car la duplication est faible.
        + pour les bactéries la structuration est le fait des 2 processus car la genèse est très affaiblie pour les 2/3 des codons se terminant par g (indice de multiplicité inférieur à 0.7) et la duplication est plus élevée que chez lez archées (indice jusqu'à 2.53 pour les bactéries contre 1.39 pour les archées).
        + pour les eucaryotes la genèse existe pour tous les codons et la duplication explose. Ce qui fait que la structuration par codon n'est pas homogène. Il suffit d'un génome pour changer les exceptions chez les eucaryotes, cas de la chimère (Callorhinchus milii) où même la structuration par ligne et colonne se trouve faussée. ( faire les tableaux et commentaires).
      3.b − Le code de la genèse des tRNAs chez les archées est structuré en lignes,colonnes et demi-doublets.
      Structuration par ligne et colonne chez les archées: Lignes et colonnes
      Alors qu'avec les bactéries la structuration est très différenciée grâce à une faible duplication et une genèse très affaiblie des codons se terminant par g, et que celle des eucaryotes est cahotique à cause des duplications extrêmes, les archées vont avoir une structuration claire et nette en ligne et colonne mais peu différenciée pour pouvoir comparer des carrés comme avec les bactéries et ceci, respectivement, grâce et à cause de leur uniformité.
      • Moyennes des lignes et colonnes par rapport à la 3ème base (moyenne 3ème base, dans le tableau):
        − Les moyennes des lignes et colonnes g (3ème base) sont les plus faibles et inférieures à 1905. Les moyennes des lignes et colonnes c et a (3ème base) sont toutes supérieures à 2 134, valeur de la 4ème colonne a quand on ne tient pas en compte l'exception tga (effectif de 206 pour 100 000 tRNAs). La valeur de la 1ère ligne a est alors de 2143.
        − 3 couples de lignes, cxc-a (2150) axc-a (2250) gxc-a (2450), et un couple de colonne, xac-a (2335) ont leurs partenaires presque identiques entre eux. Pour les 4 autres couples les partenaires diffèrent entre eux de plus de 300, txc-a (+400) xtc-a (+300) xcc-a (-250) xgc-a (+500). Sur les 8 carrés seule la colonne se terminant par c (xcc 2097) est inférieure de 10% par rapport à son partenaire a xca. Le codon ccc a été déjà signalé comme une exception. Toutes les autres moyennes se terminant par c sont supérieures (3) ou égales (4) à leur partenaire se terminant par a.
        − Avec la même lecture les bactéries donne des couples différents après permuatation de cgc en cgt (cxc 1998) et correction du codon tga (560): ligne txa avec 2138 à la place de 1612, et colonne xga avec 1589 au lieu de 1337.
        • Les moyennes des lignes et colonnes g (3ème base) sont les plus faibles et inférieures à 1558 (txg). Les moyennes des lignes et colonnes c et a (3ème base) sont toutes supérieures à 1589 (xga).
        • 3 couples de lignes, txc-a (2200) axc-a (2830) cxc-a (1940), et un couple de colonnes, xtc-a (2560) ont leurs partenaires presque identiques entre eux. Dans les 4 autres couples les partenaires diffèrent entre eux de plus de 500, gxc-a (-800) xac-a (-500) xcc-a (-1100) xgc-a (+1100). L'exception de la moyenne de colonne se terminant par c (xcc 1696) se maintient, elle est inférieure de 68% par rapport à son partenaire xca.
        • Si l'on tient compte de l'uniformité des archées par rapport aux bactéries, la comparaison entre 2 lignes ou 2 colonnes de même terminaison des 2 domaines ne peut se faire que par rapport à la différence relative entre les 2 partenaires d'un couple du même domaine se terminant par c et a. C'est ainsi qu'on observe que les 2 domaines se comportent de la même façon: sur 8 comparaisons de couples les 2 lignes c et a sont semblables par l'égalté entre les 2 partenaires (= / =), les 2 colonnes c et a par une différence négative ( nette pour c (< / <) et relative pour a (< / =<)), la ligne t et la colonne g par une différence positive (relative pour t (=> / > ) et nette pour g (> / >)). Soit au total les 3/4 des comparaisons. Il reste la ligne g où la différence est nette entre les 2 partenaires bactériens alors que les archées présentent une égalité quasi stricte ( < / ==); puis il y a la colonne t où les bactéries ont une différence négative relative et les archées une différence positive nette (=< / >). Voir le tableau en bas du texte.
        − Avec la même lecture les eucaryotes ne présentent que les moyennes de la ligne cx et celles de la colonne xc qui soient comparables aux 2 autres domaines, car cxg et xcg sont inférieures à cxc-a et xcc-a dans les 3 domaines. Les 3 lignes ont le même comportement entre elles de même que les 3 colonnes entre elles. On retrouve encore l'exception du codon ccc avec des rapports c/a des moyennes de 3ème base de colonne respectivement de 1882/2566, 1696/2852, 2097/2349 pour E B A. Il faut noter que 8 codons forts xyt eucaryotes et 1 un bactériens ont été permutés avec les codons faibles xyc pour avoir des moyennes de 3ème base comparables entre xyc et xya. Ainsi l'exception du codon ccc chez les bactéries et les archées réapparaît avec le codon cct chez les eucaryotes avec la moyenne de la 3ème base de la colonne xcc.
      • Moyennes des lignes et colonnes avec les 4 3ème bases (moyennes lignes et colonnes, dans le tableau): Ces moyennes représentent bien l'influence totale de la 1ère base (ligne) et de la 2ème base (colonne). A ce niveau élevé de totalisation la ressemblance entre les 3 domaines devrait être plus élevée que précédemment.
        − L'ordre des moyennes des lignes des bactéries est le même que celui des lignes des archées en les notant de gauche à droite: 3-4-2-1. C'est le même constat pour les moyennes des colonnes des bactéries et des archées, l'ordre est le même mais différents de celui des lignes: 2-3-1-3 pour les bactéries et 2-3-1-4 pour les archées. Il faut noter la netteté avec les archées alors qu'ils sont très uniformes. Dans le cas des bactéries aux codons très différenciés et avec un total des tRNAs de 235 027 ( contre 8749 pour les archées) l'égalité des ordres des colonnes 2 et 4 est tout à fait acceptable avec une différence de 2 unités sur 1830, alors que cette égalté serait douteuse avec les archées à cause de leur uniformité.
        − L'ordre des moyennes des lignes des eucaryotes est quasiment le même que celui des 2 autres domaines. Avec la notation de gauche à droite nous avons 3-3-2-1 contre le 3-4-2-1 des 2 autres domaines. La différence entre la ligne 1 et 2 est de 20/1300 ce qui est très faible pour la différenciation extrême des eucaryotes et un total des tRNAs de 115 111 contre 237 027 pour les bactéries.
      • Moyennes des carrés: elles représentent le comportement de chaque doublet.
        − Malgré la grande différenciation chez les eucaryotes et les bactéries, la grande uniformité chez les archées et en excluant les 2 exceptions des doublets ta et at, les 4 doublets aa gc ga gg ont les valeurs les plus élevées parmi les 12 doublets restants. L'ordre de ces 4 doublets, suivant leur valeur, change cependant entre les 3 domaines: il est 4-2-3-1 pour les eucaryotes, respectivement suivant la notation précédente aa gc ga gg; il est 1-4-2-3 chez les bactéries; et 4-2-1-3 chez les archées.
        − Grâce aux 4 doublets aa gc ga gg la ligne 4 et la colonne 3 se distinguent nettement dans les 3 domaines alors que la colonne 1 n'est commune qu'aux bactéries et archées. Les autres lignes et colonnes varient beaucoup entre les 3 domaines.
      Structuration du code en demi-doublets chez les archées: Jusqu'ici j'hésitais à utiliser les codons se terminant par g comme critère de différenciation du code des archées en demi-doublet à cause de la grande uniformité. Cependant la netteté des comparaisons relevée au paragraphe précédent sur les lignes et colonnes, et surtout la distinction de couples de lignes ou de colonnes des moyennes de 3ème base pour analyser les archées m'autorisent à utliser les codons se terminant par g comme critère de différenciation. L'argumentation pour différencier le code chez les archées en demi-doublets se fait alors de la même façon que chez les bactéries (ref.).
      Les exceptions dans le code des archées: 3 nouveautés sur les 5 exceptions qui restent chez les archées.
      • Les doublets ta et cc ne changent pas en exception et l'exception du codon ccc quoique difficile à faire a été détectée dans les comparaisons ligne et colonne précedentes.
      • Le doublet tg ajoute une nouvelle exception au codon tga, avec le codon tgc dont l'indice de multiplicité est le plus élevé 1.69 chez les archées après l'exception atg 3.20 et avant gca 1.39, alors qu'il n'est que de 1.11 chez les bactéries. Ce n'est pas du à un génome particulier.
      • Le doublet at maintient l'exception du codon atg mais aggrave celle du codon ata, car la grande uniformité des codons des archées est due à sa robustesse: Dans les conditions extrêmes il est plus avantageux d'utiliser des anti-codons différents que de contrôler des voies de synthèse de plusieurs enzymes pour modifier les tRNAs. Or apparemment les archées soit ils ont choisi l'option de la modification comme chez E.Coli soit les tRNAs à codon atg sont différenciés ou bien il existe un processus spéciale au niveau de l'ARNm comme pour le codon tga.
      • Le doublet cg est peut-être le plus spectaculaire par son exception spécifique chez les archées qui le différencie de celle des bactéries (bascule c/t et bascule a/g) et de celle des eucaryotes (annulation de la bascule a/g et non celle de c/t). Les archées annulent les 2 bascules à la fois et l'exception du doublet cg vient de sa normalité chez les archées.
    4. Critiques:
      − Au paragraphe 3b, sur les archées, la comparaison entre ligne et colonne est aisée entre bactéries et archées mais pas du tout avec les eucaryotes. De même j'ai noté en conclusion du paragraphe 3a pour la structuration en codons que des effectifs élevés en tRNAs des eucaryotes ne permettaient pas de dégager des analogies de structuration entre les 3 domaines, ce qui est mon objectif principal de l'étude des tRNAs en vue de l'hypothèse de la résonance. Pourtant la comparaison entre eucaryotes et bactéries a révélé des caractéristiques nettes et précises des codons qui les différencient à l'intérieur de chaque domaine. Elle nous a permis aussi de dégager des comportements de groupes de codons analogues ce qui a permis de les caractériser en doublet et demi doublet. Malgré l'uniformité et les faibles effectifs des archées j'ai pu montrer ces caractéristiques entre eux et les bactéries.
    5. Hypothèses:
      − C'est la comparaison inachevée entre eucaryotes et archées qui m'a laissé penser qu'il existait un 4ème processus de duplication propre aux eucaryotes différent de ceux déjà étudiés dans les 3 domaines. Ce processus, par ses duplications explosives, est analogue au processus qui provoque les changements brutaux des fréquences des codons ggg et ccc dans les génomes des procaryotes, comportement que j'ai utilisé pour établir l'hypothèse de la résonance dans l'ADN dans l'article "répétitions des bases". Pour étudier ce nouveau processus, il faut détailler le code génétique pour chaque génome. L'idée c'est de le séparer des autres processus pour rendre les tableaux de code des trois domaines plus lisibles et de dégager l'analogie recherchée entre ces 3 domaines. Je devrais faire la même étude pour les 3 domaines pour que la comparaison soit valable.
      Fortes duplications chez les bactéries et les archées: Pour les archées l'uniformité et la multiplicité proche de l'unité ne laissent pas de place à une duplication explosive. J'ai détaillé le cas de la Cys qui a un indice de 1.6, voir ci-dessous. Pour les bactéries j'ai compté le nombre de génomes n'ayant qu'un seul exemplaire de tRNA par demi doublet sous la forme 1a1g ou 1c1t (tRNA se terminant par a g c t, tableau IV). Avec ces décomptes et les indices de multiplicité très faibles des bactéries il ne reste pas beaucoup de place aussi pour les fortes duplications. Un échantillon du spectre des tRNAs des 111 bactéries des diagrammes étendus montre que les duplications chez les bactéries dépassent rarement 5.
      − L'effectif de 155 eucaryotes, assez élevé pour des décomptes détaillés, m'a encouragé à étudier les fortes duplications dans ce domaine.
    6. Tableaux de bas de page:
1ères valeurs Voir le paragraphe d'appel.
			couple		différence	effectif	taux %
		B	cta g		246		5186		5
			aaa c		341		9105		4
		A	aga c		1		187		1
			cga c		2		187		1
			tca c		6		190		3
		E	cct a		3		1641		0
			aga c		133		1895		7
4 paires presque identiques. Voir le paragraphe d'appel.
		 	 B		A		E
		 tac 	 2732   	2172   		1925
 		 caa	 2718 		2240 		1989

		 cta	 2102   	2115   		758
		 tta	 2021   	2183   		773

		 cat 	 4 		0 		47
		 agt	 1 		0 		53

		 aat	 5 		0 		149
		 tat	 4 		0 		155
couple ac.ag. Voir le paragraphe d'appel.
		 	B		A		E
		 cac	2006 		2115 		1632
		 agc	1881 		2137 		1646
Comparaison ligne colonne entre bactéries et archées. voir le paragraphe d'appel.
Ligne colonne
base3 B A B A
t =>7% >0 =<5% >0
c = = <0 <0
a = = <0 =<%3
g <0 == >0 >0
Spectre des tRNAs Cys chez les archées. voir le paragraphe d'appel.
tRNAs par génome	1	2	3	4	5	6	7	8	tottal
nombre de génomes	137	11	16	10	5	2	1	1	183
nombre de tRNAs		137	22	48	40	25	12	7	8	299
Demi-doublets[modifier | modifier le wikicode]
  • Lien Tableur: Demi-doublets
  • Légende:
    Domaine E: ensemble des 155 eucaryotes avec un total de tRNAs de 115 111.
    Domaine B: ensemble des 4032 bactéries avec un total de tRNAs de 235 027.
    Domaine A: ensemble des 184 archées avec un total de tRNAs de 8 749.
    g/a: rapport des codons xyg sur xya de la ligne x et de la colonne y du tableau des effectifs,   1.4  rapport inverse de g/a.
    t/c: rapport des codons xyc sur xyt de la ligne x et de la colonne y du tableau des effectifs,   16  rapport inverse de t/c.
    t c a g: colonnes du tableau des effectifs
  • Tableaux du texte:
Demi-doublets par domaine
Domaine E. Demi-doublets
t c a g
t/c 29 16 14 12
g/a 1.4 1.4 7.1
t/c 43 48 40 28
g/a 1.5 2.2 1.2 4.5
t/c 25 14 24 36
g/a 4.5 1.8 2.3 1.4
t/c 19 7.3 28 25
g/a 2.9 1.6 1.9 1.3
Domaine B. Demi-doublets
t c a g
t/c
g/a 1.2 2.0 3.3
t/c 10 22
g/a 1.05 2.5 2.7 3.8
t/c 44
g/a 328 2.1 3.8 1.4
t/c
g/a 6.7 8.3 7.0 2.4
Domaine A. Demi-doublets
t c a g
t/c
g/a 1.17 1.21 10.2
t/c
g/a 1.16 1.22 1.19 1.33
t/c
g/a 295 1.17 1.19 1.13
t/c
g/a 1.09 1.61 1.44 1.22
  • Tableau non formaté: voir tableur
Tableau des effectifs des gènes de tRNAs[modifier | modifier le wikicode]
  • Lien Tableur: Tableau des effectifs des gènes de tRNAs
  • Analyse du tableau ci-dessus.
  • Légende: Décompte des gènes tRNAs par codon suivant la base de données gtRNAdb [14].
    1.   5   : nombre de tRNAs d'un codon se terminant par t. Ce sont les plus faibles.
    2.   113   : nombre de tRNAs d'un codon se terminant par t: Changement de t en c chez les archées et de c en t chez les eucaryotes.
    3. 4 366: Effectif élevé de tRNAs d'un codon se terminant par g chez les procaryotes.
    4. 2622: Effectif faible de tRNAs supérieurs à   t   et à   c   .
    5. 160: Changement de codon   g   Chez les archées et les eucaryotes.
  • Tableaux:
    1. Nombre de tRNAs, tableaux I II III, décompte de la base gtRNAdb.
    2. Pour 100 000 tRNAs, tableaux I100 II100 III100, décomptes rapportés à 100 000 tRNAs pour comparaison.
    3. tRNAs pour 1 génome, tableaux I1 II1 III1, indice de la multiplicité = nombre de tRNAs / nombre des génomes du domaine.
I . Nombre de tRNAs. 4032 Bactéries
ttt 10 tct 5 tat 4 tgt 3
c 6105 c 4520 c 6420 c 4473
a 4749 a 5299 a a 1315
g 3999 g 2622 g g 4366
ctt 369 cct 10 cat 4 cgt 7478
c 3849 c 2742 c 4715 c 333
a 4940 a 5453 a 6388 a 887
g 5186 g 2183 g 2389 g 3355
att 5 act 103 aat 5 agt 1
c 9203 c 4513 c 8764 c 4422
a 55 a 5878 a 9105 a 4804
g 18026 g 2760 g 2427 g 3452
gtt 9 gct 2 gat 0 ggt 1
c 4430 c 4166 c 9,023 c 9,273
a 8859 a 10185 a 9679 a 5515
g 1313 g 1224 g 1388 g 2266
II . Nombre de tRNAs. 184 Archées
ttt 0 tct 0 tat 0 tgt 0
c 215 c 190 c 190 c 299
a 191 a 184 a - a 18
g 163 g 152 g g 184
ctt 1 cct 0 cat 0 cgt 2
c 214 c 171 c 185 c 187
a 185 a 184 a 196 a 185
g 160 g 151 g 165 g 139
att 0 act 0 aat 0 agt 0
c 212 c 189 c 214 c 187
a 2 a 198 a 197 a 186
g 589 g 169 g 166 g 165
gtt 1 gct 0 gat 0 ggt 1
c 212 c 184 c 218 c 243
a 186 a 256 a 230 a 189
g 170 g 159 g 160 g 155
III . Nombre de tRNAs. 155 Eucaryotes
ttt 66 tct 1 863 tat 155 tgt 233
c 1 933 c 113 c 2 216 c 2 755
a 890 a 1 041 a - a 279
g 1 249 g 749 g - g 1 982
ctt 1 576 cct 1 638 cat 47 cgt 1 587
c 37 c 34 c 1 879 c 57
a 872 a 1 641 a 2 289 a 2 337
g 1 296 g 735 g 1 849 g 522
att 2 428 act 2 201 aat 149 agt 53
c 99 c 154 c 3 524 c 1 895
a 851 a 1 494 a 2 640 a 1 762
g 3 862 g 833 g 6 064 g 1 285
gtt 2 101 gct 2 962 gat 100 ggt 132
c 109 c 405 c 2 799 c 3 279
a 1 088 a 7 639 a 7 079 a 5 538
g 3 123 g 4 737 g 3 754 g 7 052
I100. 100 000 tRNAs. 4032 bactéries. 235 027
ttt 4 tct 2 tat 2 tgt 1
c 2 598 c 1 923 c 2 732 c 1 903
a 2 021 a 2 255 a - a 560
g 1 702 g 1 116 g - g 1 858
ctt 157 cct 4 cat 2 cgt 3 182
c 1 638 c 1 167 c 2 006 c 142
a 2 102 a 2 320 a 2 718 a 377
g 2 207 g 929 g 1 016 g 1 427
att 2 act 44 aat 2 agt 0
c 3 916 c 1 920 c 3 729 c 1 881
a 23 a 2 501 a 3 874 a 2 044
g 7 670 g 1 174 g 1 033 g 1 469
gtt 4 gct 1 gat 0 ggt 0
c 1 885 c 1 773 c 3 839 c 3 946
a 3 769 a 4 334 a 4 118 a 2 347
g 559 g 521 g 591 g 964
II100. 100 000 tRNAs. 184 Archées  8749
ttt 0 tct 0 tat 0 tgt 0
c 2 457 c 2 172 c 2 172 c 3 418
a 2 183 a 2 103 a - a 206
g 1 863 g 1 737 g - g 2 103
ctt 11 cct 0 cat 0 cgt 23
c 2 446 c 1 955 c 2 115 c 2 139
a 2 115 a 2 103 a 2 240 a 2 115
g 1 829 g 1 726 g 1 886 g 1 589
att 0 act 0 aat 0 agt 0
c 2 423 c 2 160 c 2 446 c 2 137
a 23 a 2 263 a 2 252 a 2 126
g 6 732 g 1 932 g 1 897 g 1 886
gtt 11 gct 0 gat 0 ggt 11
c 2 423 c 2 103 c 2 495 c 2 777
a 2 126 a 2 926 a 2 629 a 2 160
g 1 943 g 1 817 g 1 829 g 1 772
III100. 100 000 tRNAs. 155 Eucaryotes. 115 111
ttt 57 tct 1 618 tat 135 tgt 202
c 1 679 c 98 c 1 925 c 2 393
a 773 a 904 a - a 242
g 1 085 g 651 g - g 1 722
ctt 1 369 cct 1 423 cat 41 cgt 1 379
c 32 c 30 c 1 632 c 50
a 758 a 1 426 a 1 989 a 2 030
g 1 126 g 639 g 1 606 g 453
att 2 109 act 1 912 aat 129 agt 46
c 86 c 134 c 3 061 c 1 646
a 739 a 1 298 a 2 293 a 1 531
g 3 355 g 724 g 5 268 g 1 116
gtt 1 825 gct 2 573 gat 87 ggt 115
c 95 c 352 c 2 432 c 2 849
a 945 a 6 636 a 6 150 a 4 811
g 2 713 g 4 115 g 3 261 g 6 126
I1 . tRNAs pour 1 génome. 4032 Bactéries
ttt 0 tct 0 tat 0 tgt 0
c 1,51 c 1,12 c 1,59 c 1,11
a 1,18 a 1,31 a - a 0,33
g 0,99 g 0,65 g - g 1,08
ctt 0,09 cct 0 cat 0 cgt 1,85
c 0,95 c 0,68 c 1,17 c 0,08
a 1,23 a 1,35 a 1,58 a 0,22
g 1,29 g 0,54 g 0,59 g 0,83
att 0 act 0,03 aat 0 agt 0
c 2,28 c 1,12 c 2,17 c 1,10
a 0,01 a 1,46 a 2,26 a 1,19
g 4,47 g 0,68 g 0,60 g 0,86
gtt 0 gct 0 gat 0 ggt 0
c 1,10 c 1,03 c 2,24 c 2,30
a 2,20 a 2,53 a 2,40 a 1,37
g 0,33 g 0,30 g 0,34 g 0,56
II1 . tRNAs pour 1 génome. 184 Archées
ttt 0 tct 0 tat 0 tgt 0
c 1,17 c 1,03 c 1,03 c 1,63
a 1,04 a 1,00 a - a 0,10
g 0,89 g 0,83 g - g 1,00
ctt 0,01 cct 0 cat 0 cgt 0,01
c 1,16 c 0,93 c 1,01 c 1,02
a 1,01 a 1,00 a 1,07 a 1,01
g 0,87 g 0,82 g 0,90 g 0,76
att 0 act 0 aat 0 agt 0
c 1,15 c 1,03 c 1,16 c 1,02
a 0,01 a 1,08 a 1,07 a 1,01
g 3,20 g 0,92 g 0,90 g 0,90
gtt 0,01 gct 0 gat 0 ggt 0,01
c 1,15 c 1,00 c 1,18 c 1,32
a 1,01 a 1,39 a 1,25 a 1,03
g 0,92 g 0,86 g 0,87 g 0,84
III1 . tRNAs pour 1 génome. 155 Eucaryotes
ttt 0,4 tct 12,0 tat 1,0 tgt 1,5
c 12,5 c 0,7 c 14,3 c 17,8
a 5,7 a 6,7 a - a 1,8
g 8,1 g 4,8 g - g 12,8
ctt 10,2 cct 10,6 cat 0,3 cgt 10,2
c 0,2 c 0,2 c 12,1 c 0,4
a 5,6 a 10,6 a 14,8 a 15,1
g 8,4 g 4,7 g 11,9 g 3,4
att 15,7 act 14,2 aat 1,0 agt 0,3
c 0,6 c 1,0 c 22,7 c 12,2
a 5,5 a 9,6 a 17,0 a 11,4
g 24,9 g 5,4 g 39,1 g 8,3
gtt 13,6 gct 19,1 gat 0,6 ggt 0,9
c 0,7 c 2,6 c 18,1 c 21,2
a 7,0 a 49,3 a 45,7 a 35,7
g 20,1 g 30,6 g 24,2 g 45,5
  • Tableaux non formatés: voir tableur
Lignes et colonnes[modifier | modifier le wikicode]
  • Lien Tableur: Lignes et colonnes
  • Légende: Les moyennes des codons de la 3ème base appartenant aux doublets ayant la même 1ère base (ligne) ou ayant la même 2ème base (colonne) sont faites sur 4 codons ou sur 3 codons seulement quand on rencontre les codons stop (taa tag) ou le codon ata lorsqu'il est trop faible ( sauf celui des eucaryotes) ou le codon atg à effectif très élevé (sauf celui des eucaryotes). La moyenne des lignes et colonnes est faite sur 12 codons ou seulement 10 quand on rencontre les codons taa tag ata atguand les codons xyt ont des effectifs élevés ils sont permutés avec les codons xyc ( 1 permutation chez les bactéries et 8 chez les eucaryotes). Aussi les lignes et colonnes xyt contiennent les valeurs faibles après permutation et les lignes et colonnes xyc contiennent les valeurs fortes après permutation.
    n pour nombre de codons, mcod pour moyenne des codons, Lig. pour ligne, Col. pour colonne et car. pour carré ou doublet.
    txt, c, a, g pour respectivement les 4 codons "ttt tct tat tgt" de la 3ème base t, les 4 codons "ttc tcc tac tgc" de la 3ème base c . . . etc. (Ligne Lig.)
    xtt, c, a, g pour respectivement les 4 codons "ttt ctt att gtt" de la 3ème base t, les 4 codons "ttc ctc atc gtc" de la 3ème base c . . . etc. (colonne Col.)
Lignes Colonnes pour 100000 tRNAs.
IIILC. 155 Eucaryotes. 115 111
Moyenne 3ème base
Lig. n mcod
tx t 4 123
c 4 1,904
a 3 640
g 3 1,153
col. n mcod
xt t 4 68
c 4 1,746
a 4 804
g 4 2,070
cx t 4 38
c 4 1,451
a 4 1,550
g 4 956
xc t 4 153
c 4 1,882
a 4 2,566
g 4 1,532
ax t 4 99
c 4 2,182
a 4 1,465
g 4 2,616
xa t 4 98
c 4 2,263
a 3 3,477
g 3 3,378
gx t 4 162
c 4 2,420
a 4 4,636
g 4 4,054
xg t 4 103
c 4 2,067
a 4 2,154
g 4 2,354
Moyenne Lignes
Lig. ttt ctt att gtt
n 10 12 12 12
mcod 1,299 1,319 2,088 3,703
Moyenne colonnes
col. ttt tct tat tgt
n 12 12 10 12
mcod 1,540 1,993 2,962 2,192
Totaux carrés
car. 1000 t c a g
t 3.59 3.27 2.06 4.56
c 3.28 3.52 5.27 3.91
a 6.29 4.07 10.75 4.34
g 5.58 13.68 11.93 13.90
ILC. 4032 Bactéries. 235 027.
Moyenne 3ème base
Lig. n mcod
txt 4 2
c 4 2,289
a 3 1,612
g 3 1,558
Col. n mcod
xtt 4 42
c 4 2,509
a 3 2,631
g 3 1,489
cxt 4 76
c 4 1,998
a 4 1,879
g 4 1,395
xct 4 13
c 4 1,696
a 4 2,852
g 4 935
axt 4 12
c 4 2,862
a 3 2,806
g 3 1,225
xat 4 1
c 4 3,076
a 3 3,570
g 3 880
gxt 4 1
c 4 2,861
a 4 3,642
g 4 659
xgt 4 36
c 4 2,728
a 4 1,332
g 4 1,430
Moyenne Lignes
Lig. ttt ctt att gtt
n 10 12 10 12
mcod 1,867 1,757 2,354 2,387
Moyenne colonnes
col. ttt tct tat tgt
n 10 12 10 12
mcod 2,239 1,828 2,566 1,830
Totaux carrés
car. 1000 t c a g
t 6.32 5.30 2.73 4.32
c 6.10 4.42 5.74 5.13
a 11.61 5.64 8.64 5.39
g 6.22 6.63 8.55 7.26
IILC. 184 Archées. 8 749
Moyenne 3ème base
Lig. n mcod
txt 4 0
c 4 2,555
a 3 1,497
g 3 1,901
Col. n mcod
xtt 4 6
c 4 2,437
a 3 2,141
g 3 1,878
cxt 4 9
c 4 2,163
a 4 2,143
g 4 1,757
xct 4 0
c 4 2,097
a 4 2,349
g 4 1,803
axt 4 0
c 4 2,292
a 3 2,214
g 3 1,905
xat 4 0
c 4 2,306
a 3 2,374
g 3 1,871
gxt 4 6
c 4 2,449
a 4 2,460
g 4 1,840
xgt 4 9
c 4 2,617
a 4 1,652
g 4 1,837
Moyenne Lignes
Lig. ttt ctt att gtt
n 10 12 10 12
mcod 2,041 2,021 2,152 2,250
Moyenne colonnes
col. ttt tct tat tgt
n 10 12 10 12
mcod 2,181 2,083 2,196 2,035
Totaux carrés
car. 1000 t c a g
t 6.50 6.01 2.17 5.73
c 6.40 5.78 6.24 5.86
a 9.18 6.36 6.60 6.15
g 6.50 6.85 6.95 6.72
  • Tableaux non formatés: voir tableur
Moyennes et variances pour 100 000 tRNAs des codons[modifier | modifier le wikicode]
  • Lien Tableur: Moyennes et variances pour 100 000 tRNAs des codons
  • Légende:
    1. Moyenne et écart type sont faits sur les carrés, sauf certains carrés.
    2. % :rapport de l'écart type par la moyenne en pourcent.
    3. moyenne par génome: celle du codon pour calculer l'indice de multiplicité. Elle est égale à dom*moyenne/100 000, dom étant le nombre de tRNAs par domaine, 8 731 pour les archées, 119 380 pour les eucaryotes et 239 000 pour les bactéries. Voir les statistiques de la base de données.
    4. multiplicité moyenne: rapport "moyenne par génome" du codon divisé par le nombre d'espèces du domaine de la base de données, 184 pour les archées, 155 pour les eucaryotes et 4 032 pour les bactéries.
Moyenne pour 100 000 des codons classés sur la 3ème base.
moyenne écart % carrés sauf moyenne
par génome
multiplicité
moyenne
Bactéries
t 2 1.4 74 13 ct ac cg - -
c 2,457 945 38 15 cg 5,775 1.43
a 2,524 1,193 47 14 ta at 5,933 1.47
g 1,183 501 42 14 ta at 2,781 0.69
Archées
t 4 7 193 16 - -
c 2,365 350 15 16 207 1.12
a 2,257 246 11 13 ta at tg 197 1.07
g 1,843 120 7 14 ta at 161 0.88
Eucaryotes
t 939 912 97 16 1,081 6.97
c 1,156 1,150 99 16 1,331 8.58
a 2,306 2,027 88 14 ta tg 2,654 17.12
g 2,264 1,800 80 15 ta 2,606 16.81
Eucaryotes
t1 102 55 54 8 117 0.75
t2 1,776 421 24 8 2,045 13.19
c1 109 104 95 8 126 0.81
c2 2,202 564 26 8 2,535 16.35
t1+c1 105 81 76 16 121 0.78
t2+c2 1,989 529 27 16 2,290 14.77
  • Tableau non formaté:voir tableur
Rapport E/B des codons[modifier | modifier le wikicode]
  • Lien Tableur: Rapport E/B des codons
  • Légende: Valeur du codon se terminant par x de E / Valeur du codon se terminant par x de B
  1. 0.8: t de E / c de B
  2. Tableau rapport E/B pour 100 000: d'après les valeurs des tableaux III100 / I100
  3. Tableau rapport E/B par génome: d'après les valeurs des tableaux III1 / I1
Rapport E/B pour 100 000.
ttt tct 0.83 tat tgt
c 0,63 c c 0,69 c 1,23
a 0,38 a 0,39 a - a 0,42
g 0,63 g 0,57 g - g 0,91
ctt 0.82 cct 1.20 cat cgt 0,42
c c c 0,80 c 0,34
a 0,35 a 0,60 a 0,72 a 5,27
g 0,50 g 0,67 g 1,55 g 0,31
att 0.53 act 0.98 aat agt
c c c 0,81 c 0,86
a 31 a 0,51 a 0,58 a 0,73
g 0,43 g 0,60 g 5,00 g 0,75
gtt 0.95 gct 1.42 gat ggt
c c c 0,62 c 0,71
a 0,25 a 1,50 a 1,46 a 2,01
g 4,76 g 7,75 g 5,41 g 6,23
Rapport E/B par génome.
ttt tct 11 tat tgt
c 8 c 0.7 c 9 c 16
a 5 a 5 a a 6
g 8 g 7 g g 12
ctt 11 cct 16 cat cgt 6
c 0.3 c 0.3 c 10 c 4
a 5 a 8 a 9 a 69
g 7 g 9 g 20 g 4
att 5 act 13 aat agt
c 0.3 c 0.9 c 10 c 11
a 402 a 7 a 8 a 10
g 6 g 8 g 65 g 10
gtt 12 gct 18 gat ggt
c 0.6 c 2.5 c 8 c 9
a 3.2 a 20 a 19 a 26
g 62 g 101 g 70 g 81
  • Tableau non formaté: voir tableur
Ordre des codons pour 100 000 tRNAs[modifier | modifier le wikicode]
  • Lien Tableur: Ordre des codons pour 100 000 tRNAs
  • Légende: B bactéries, A archées, E eucaryotes.
    1. gac: Chez les bactéries le codon se terminant par g n'est pas dernier.
    2. cag: changement chez les archées par rapport aux bactéries.
    3. tag: chez les eucaryotes le codon se terminant par g est dernier.
    4. cag: différence très faible mais toujours non nulle.
tRNAs rapportés à 100 0000. Ordre des codons.
B t c a g
t cag acg cga
c gac acg acg tga
a gca acg acg acg
g acg acg acg cag
A t c a g
t cag cag cga
c cag acg acg cag
a gca acg cag cag
g cag acg acg cag
E t c a g
t cga tag cga
c tga atg acg atg
a gta tag gca cag
g gta agt agc gac
  • Tableau non formaté: voir tableur
Totaux des carrés pour 100 000 tRNAs[modifier | modifier le wikicode]
tRNAs rapportés à 100 0000. totaux des carrés.
B t c a g
t 6 219 5 208 2 688 4 250
c 6 002 4 346 5 647 5 043
a 11 418 5 546 8 494 5 305
g 6 113 6 518 8 406 7 136
A t c a g
t 6 517 6 025 2 176 5 738
c 6 414 5 795 6 254 5 876
a 9 197 6 368 6 609 6 162
g 6 517 6 861 6 964 6 735
E t c a g
t 3 466 3 155 1 986 4 397
c 3 167 3 391 5 080 3 772
a 6 065 3 922 10 368 4 184
g 5 379 13 187 11 503 13 403
  • Tableau non formaté: voir tableur
Variation en % entre la 1ère et la 2ème valeur[modifier | modifier le wikicode]
  1. -17, variation en % des 2 1ères valeurs; 779 différence en valeur absolue de la base de données de référence. La variation est calculée entre le nombre de codons contenu dans la cellule affichant la variation en % (-17) et celui contenu dans la cellule affichant la différence en valeur absolue (779).
  2.     : 4ème valeur sans changement entre B et A ou E
  3.     : 3ème valeur sans changement entre B et A ou E
  4.     : 4ème valeur après changement entre B et A ou E
  5.     : 3ème valeur après changement entre B et A ou E
  • Moyenne des valeurs absolues des variations:
	B	A	E
Moy	48.1	18.2	39.1
Ecart	47.4	21.0	24.5
%	98.5	115.2	62.7
Variation en % entre la 1ère et la 2ème valeur.
I100. Nombre de tRNAs. 4032 Bactéries
ttt tct tat tgt
c 29 c -17 c c 2
a 1 356 a 779 a - a
g g g - g 107
ctt cct cat cgt 123
c c -99 c -35 c
a -5 a 2 711 a 1 673 a
g 246 g g g 4 123
att act aat agt
c -49 c -30 c -4 c -9
a a 1 365 a 341 a 382
g 8 823 g g g
gtt gct gat ggt
c -100 c -144 c -7 c 68
a 4 429 a 6 019 a 656 a 3 758
g g g g
II100. Nombre de tRNAs. 184 Archées
ttt tct tat tgt
c 13 c 3 c c 63
a 24 a 6 a - a
g g g - g 115
ctt cct cat cgt
c 16 c -8 c -6 c 1
a 29 a 13 a 11 a 2
g g g g
att act aat agt
c -64 c -5 c 9 c 1
a a 9 a 17 a 1
g 377 g g g
gtt gct gat ggt
c 14 c -39 c -6 c 29
a 26 a 72 a 12 a 54
g g g g
III100. Nombre de tRNAs. 155 Eucaryotes
ttt tct 79 tat tgt
c 55 c c c 39
a a 822 a - a
g 684 g g - g 773
ctt 22 cct 0 cat cgt -32
c c c -22 c
a a 3 a 410 a 750
g 280 g g g
att -37 act 47 aat agt
c c c -42 c 7
a a 707 a a 133
g 1 434 g g 2 540 g
gtt -33 gct gat ggt
c c c c
a a 61 a 89 a -21
g 1 022 g 2 902 g 3 325 g 1 514
  • Tableau non formaté: voir tableur
Codons identiques par classement des 3 bases[modifier | modifier le wikicode]
Codons identiques par classement des 3 bases
1ère base
II100 Nombres de tRNAs. 184 archées. 8749
ttt 0   
ctt 11   
att 0
gtt 11
ttc 2,457
ctc 2,446
atc 2,423
gtc 2,423
tta 2,183
cta 2,115
ata 23
gta 2,126
ttg 1,863
ctg 1,829
atg 6,732
gtg 1,943
tct 0   
cct 0
act 0
gct 0
tcc 2,172
ccc 1,955
acc 2,160
gcc 2,103
tca 2,103
cca 2,103
aca 2,263
gca 2,926
tcg 1,737
ccg 1,726
acg 1,932
gcg 1,817
tat 0   
cat 0
aat 0
gat 0
tac 2,172
cac 2,115
aac 2,446
gac 2,492
taa -
caa 2,240
aaa 2,252
gaa 2,629
tag -
cag 1,886
aag 1,897
gag 1,829
tgt 0
cgt 23   
agt 0
ggt 11
tgc 3,418
cgc 2,137
agc 2,137
ggc 2,777
tga 206
cga 2,115
aga 2,126
gga 2,160
tgg 2,103
cgg 1,589
agg 1,886
ggg 1,772
I100 Nombres de tRNAs. 4032 bactéries. 235 027
ttt 4   
ctt 157
att 2
gtt 4
ttc 2,598
ctc 1,638
atc 3,916
gtc 1,885
tta 2,021
cta 2,102
ata 23
gta 3,769
ttg 1,702
ctg 2,207
atg 7,670
gtg 559
tct 2
cct 4
act 44   
gct 1
tcc 1,923
ccc 1,167
acc 1,920
gcc 1,773
tca 2,255
cca 2,320
aca 2,501
gca 4,334
tcg 1,116
ccg 929
acg 1,174
gcg 521
tat 2   
cat 2
aat 2
gat 0
tac 2,732
cac 2,006
aac 3,729
gac 3,839
taa
caa 2,718
aaa 3,874
gaa 4,118
tag
cag 1,016
aag 1,033
gag 591
tgt 1
cgt 3,182
agt 0
ggt 0
tgc 1,903
cgc 142
agc 1,881
ggc 3,946
tga 560
cga 377
aga 2,044
gga 2,347
tgg 1,858
cgg 1,427
agg 1,469
ggg 964
III100 Nombres de tRNAs. 155 eucaryotes. 115 111
ttt 57
ctt 1,369
att 2,109
gtt 1,825
ttc 1,679
ctc 32
atc 86
gtc 95
tta 773
cta 758 
ata 739
gta 945
ttg 1,085
ctg 1,126
atg 3,355
gtg 2,713
tct 1,618
cct 1,423
act 1,912
gct 2,573
tcc 98
ccc 30
acc 134 
gcc 352
tca 904
cca 1,426
aca 1,298
gca 6,636
tcg 1,423
ccg 639
acg 724
gcg 4,115
tat 135
cat 41  
aat 129
gat 87
tac 1,925
cac 1,632
aac 3,061
gac 2,432
taa -
caa 1,989
aaa 2,293
gaa 6,150
tag 41
cag 1,606
aag 5,268
gag 3,261
tgt 202
cgt 1,379
agt 46
ggt 115
tgc 2,393
cgc 50
agc 1,646
ggc 2,849
tga 242
cga 2,030
aga 1,531
gga 4,811
tgg 1,379
cgg 453
agg 1,116
ggg 6,126
2ème base
II100 Nombres de tRNAs. 184 archées. 8749
ttt 0   
tct 0
tat 0
tgt 0
ttc 2,457
tcc 2,172
tac 2,172
tgc 3,418
tta 2,183
tca 2,103
taa -
tga 206
ttg 1,863
tcg 1,737
tag -
tgg 2,103
ctt 11
cct 0   
cat 0
cgt 23
ctc 2,446
ccc 1,955
cac 2,115
cgc 2,137
cta 2,115
cca 2,103
caa 2,240
cga 2,115
ctg 1,829
ccg 1,726
cag 1,886
cgg 1,589
att 0
act 0   
aat 0
agt 0
atc 2,423
acc 2,160
aac 2,446
agc 2,137
ata 23
aca 2,263
aaa 2,252
aga 2,126
atg 6,732
acg 1,932
aag 1,897
agg 1,886
gtt 11
gct 0   
gat 0
ggt 11
gtc 2,423
gcc 2,103
gac 2,492
ggc 2,777
gta 2,126
gca 2,926
gaa 2,629
gga 2,160
gtg 1,943
gcg 1,817
gag 1,829
ggg 1,772
I100 Nombres de tRNAs. 4032 bactéries. 235 027
ttt 4
tct 2
tat 2
tgt 1   
ttc 2,598
tcc 1,923
tac 2,732
tgc 1,903
tta 2,021
tca 2,255
taa
tga 560
ttg 1,702
tcg 1,116
tag
tgg 1,858
ctt 157
cct 4
cat 2   
cgc 142
ctc 1,638
ccc 1,167
cac 2,006
cgt 3,182
cta 2,102
cca 2,320
caa 2,718
cga 377
ctg 2,207
ccg 929
cag 1,016
cgg 1,427
att 2
act 44
aat 2   
agt 0
atc 3,916
acc 1,920
aac 3,729
agc 1,881
ata 23
aca 2,501
aaa 3,874
aga 2,044
atg 7,670
acg 1,174
aag 1,033
agg 1,469
gtt 4
gct 1   
gat 0
ggt 0
gtc 1,885
gcc 1,773
gac 3,839
ggc 3,946
gta 3,769
gca 4,334
gaa 4,118
gga 2,347
gtg 559
gcg 521 
gag 591
ggg 964
III100 Nombres de tRNAs. 155 eucaryotes. 115 111
ttt 57
tct 1,618
tat 135
tgt 202
ttc 1,679
tcc 98
tac 1,925
tgc 2,393
tta 773
tca 904
taa −   
tga 242
ttg 1,085
tcg 1,423
tag 41
tgg 1,379
ctt 1,369
cct 1,423
cat 41
cgt 1,379
ctc 32
ccc 30
cac 1,632
cgc 50
cta 758
cca 1,426
caa 1,989
cga 2,030
ctg 1,126
ccg 639
cag 1,606
cgg 453
att 2,109
act 1,912
aat 129
agt 46
atc 86
acc 134
aac 3,061
agc 1,646
ata 739
aca 1,298
aaa 2,293
aga 1,531
atg 3,355
acg 724
aag 5,268
agg 1,116
gtt 1,825
gct 2,573
gat 87
ggt 115
gtc 95
gcc 352
gac 2,432
ggc 2,849
gta 945
gca 6,636
gaa 6,150
gga 4,811
gtg 2,713
gcg 4,115
gag 3,261
ggg 6,126
  • Tableau non formaté: voir tableur
Les 121 eucaryotes[modifier | modifier le wikicode]
Demi-doublets des 121 eucaryotes[modifier | modifier le wikicode]
  • Lien Tableur: Demi-doublets des 121 eucaryotes
  • Légende:
    155 eucaryotes, tableau des demi-doublets sur les effectifs des 155 eucaryotes avant sélection des 121.
    121 eucaryotes 92530: tableau des demi-doublets sur les effectifs des 121 eucaryotes avant calcul sur les tRNAs surexprimés.
    121 eucaryotes 55830: tableau des demi-doublets sur les effectifs des 121 eucaryotes après calcul sur les tRNAs surexprimés.
    g/a: rapport des codons xyg sur xya de la ligne x et de la colonne y du tableau des effectifs,   1.4  rapport inverse de g/a.
    t/c: rapport des codons xyc sur xyt de la ligne x et de la colonne y du tableau des effectifs,   16  rapport inverse de t/c.
    t c a g: colonnes du tableau des effectifs
Demi-doublets des 121 eucaryotes
155 Eucaryotes 115 111
t c a g
t/c 29 16 14 12
g/a 1.4 1.4 7.1
t/c 43 48 40 28
g/a 1.5 2.2 1.2 4.5
t/c 25 14 24 36
g/a 4.5 1.8 2.3 1.4
t/c 19 7.3 28 25
g/a 2.9 1.6 1.9 1.3
121 eucaryotes 92 530
t c a g
t/c 32 13 33 11
g/a 1.2 1.3 7.0
t/c 49 45 36 35
g/a 1.5 2.6 1.5 4.7
t/c 25 18 28 35
g/a 4.3 1.6 2.5 1.3
t/c 16 11 24 15
g/a 3.4 1.6 2.1 1.2
121 eucaryotes 55 830
t c a g
t/c 46 33 45 64
g/a 1.2 1.3 4.6
t/c 46 66 46 61
g/a 1.4 2.6 1.05 1.6
t/c 41 51 40 44
g/a 3.5 1.6 1.2 1.2
t/c 27 64 52 75
g/a 1.6 1.8 1.2 2.1
  • Tableau non formaté: voir tableur
Lignes et colonnes 121 eucaryotes[modifier | modifier le wikicode]
  • Lien Tableur: Lignes et colonnes 121 eucaryotes
  • Liens: Calculs pour 121 eucaryotes,  Tableau des effectifs calculés des 121 eucaryotes,  Lignes colonnes des 155 eucaryotes pour comparer avec les 121.
  • Légende: Les moyennes des codons de la 3ème base appartenant aux doublets ayant la même 1ère base (ligne) ou ayant la même 2ème base (colonne) sont faites sur 4 codons ou sur 3 codons seulement quand on rencontre les codons stop (taa tag) ou le codon ata lorsqu'il est trop faible ( sauf celui des eucaryotes) ou le codon atg à effectif très élevé (sauf celui des eucaryotes). La moyenne des lignes et colonnes est faite sur 12 codons ou seulement 10 quand on rencontre les codons taa tag ata atg. Quand les codons xyt ont des effectifs élevés ils sont permutés avec les codons xyc ( 1 permutation chez les bactéries et 8 chez les eucaryotes). Aussi les lignes et colonnes xyt contiennent les valeurs faibles après permutation et les lignes et colonnes xyc contiennent les valeurs fortes après permutation.
    n pour nombre de codons, mcod pour moyenne des codons, Lig. pour ligne, Col. pour colonne et car. pour carré ou doublet.
    txt, c, a, g pour respectivement les 4 codons "ttt tct tat tgt" de la 3ème base t, les 4 codons "ttc tcc tac tgc" de la 3ème base c . . . etc. (Ligne Lig.)
    xtt, c, a, g pour respectivement les 4 codons "ttt ctt att gtt" de la 3ème base t, les 4 codons "ttc ctc atc gtc" de la 3ème base c . . . etc. (colonne Col.)
Lignes Colonnes pour 100000 tRNAs.
IVLC. 121 eucaryotes. 55 830.
Moyenne 3ème base
Lig. n mcod
tx t 4 62
c 4 2 869
a 3 958
g 3 1 485
col. n mcod
xt t 4 66
c 4 2 494
a 4 1 137
g 4 1 833
cx t 4 38
c 4 2 023
a 4 1 656
g 4 1 323
xc t 4 53
c 4 2 716
a 4 1 840
g 4 1 022
ax t 4 65
c 4 2 800
a 4 2 045
g 4 2 719
xa t 4 67
c 4 3 066
a 3 2 703
g 3 3 117
gx t 4 70
c 4 3 494
a 4 2 123
g 4 1 882
xg t 4 48
c 4 2 908
a 4 1 537
g 4 1 411
Moyenne Lignes
Lig. ttt ctt att gtt
n 10 12 12 12
mcod 1 880 1 668 2 521 2 499
Moyenne colonnes
col. ttt tct tat tgt
n 12 12 10 12
mcod 1 966 1 860 2 973 1 952
Totaux carrés
car. 1000 t c a g
t 5,24 4,60 2,96 6,24
c 4,28 5,12 6,64 4,12
a 8,58 5,18 10,71 6,05
g 5,75 7,62 9,69 7,21
ILC. 4032 Bactéries. 235 027.
Moyenne 3ème base
Lig. n mcod
txt 4 2
c 4 2,289
a 3 1,612
g 3 1,558
Col. n mcod
xtt 4 42
c 4 2,509
a 3 2,631
g 3 1,489
cxt 4 76
c 4 1,998
a 4 1,879
g 4 1,395
xct 4 13
c 4 1,696
a 4 2,852
g 4 935
axt 4 12
c 4 2,862
a 3 2,806
g 3 1,225
xat 4 1
c 4 3,076
a 3 3,570
g 3 880
gxt 4 1
c 4 2,861
a 4 3,642
g 4 659
xgt 4 36
c 4 2,728
a 4 1,332
g 4 1,430
Moyenne Lignes
Lig. ttt ctt att gtt
n 10 12 10 12
mcod 1,867 1,757 2,354 2,387
Moyenne colonnes
col. ttt tct tat tgt
n 10 12 10 12
mcod 2,239 1,828 2,566 1,830
Totaux carrés
car. 1000 t c a g
t 6.32 5.30 2.73 4.32
c 6.10 4.42 5.74 5.13
a 11.61 5.64 8.64 5.39
g 6.22 6.63 8.55 7.26
VLC. Danio rerio (Zebrafish). 12 258.
Moyenne 3ème base
Lig. n mcod
tx t 4 53
c 4 1 846
a 3 805
g 3 993
Col. n mcod
xt t 4 61
c 4 1 952
a 4 1 269
g 4 2 039
cx t 4 82
c 4 2 396
a 4 1 348
g 4 1 642
xc t 4 37
c 4 2 248
a 4 2 186
g 4 893
ax t 4 118
c 4 4 254
a 4 2 329
g 4 3 355
xa t 4 82
c 4 3 708
a 3 2 325
g 3 3 981
gx t 4 45
c 4 2 672
a 4 1 774
g 4 1 738
xg t 4 118
c 4 3 261
a 4 857
g 4 969
Moyenne Lignes
Lig. ttt ctt att gtt
n 10 12 12 12
mcod 1 278 1 795 3 313 2 061
Moyenne colonnes
col. ttt tct tat tgt
n 12 12 10 12
mcod 1 950 1 776 3 375 1 695
Totaux carrés
car. 1000 t c a g
t 4,25 5,12 1,97 1,66
c 6,67 5,73 6,27 3,21
a 7,06 5,91 20,78 6,48
g 5,67 4,70 5,07 9,48
  • Tableaux non formatés: voir tableur
Tableau des effectifs des gènes de tRNAs 121 eucaryotes.[modifier | modifier le wikicode]
  • Lien Tableur: Tableau des effectifs des gènes de tRNAs 121 eucaryotes.
  • Liens: Sélection des 121 eucaryotestableaux synthétiques des 121
  • Utilisation de ces tableaux: Le tableau III1 92 530, est comparé au tableau III1 55 948 des tableaux synthétiques, pour l'indice de la multiplicité. Les codons en gras ont un indice multiplié par 3 à 10 par rapport à la tendance de l'ensemble des codons calculée dans III1 55 948. Le processus normal de duplication chez les eucaryotes (et non zebrafish) entre en résonance avec ces codons décuplés. Voilà encore une autre illustration de la résonance dans l'ADN.
  • Légende: Décompte des gènes tRNAs par codon suivant la base de données gtRNAdb [15].
    1.   5   : nombre de tRNAs d'un codon se terminant par t. Ce sont les plus faibles.
    2.   113   : nombre de tRNAs d'un codon se terminant par t: Changement de t en c chez les archées et de c en t chez les eucaryotes.
    3. 4 366: Effectif élevé de tRNAs d'un codon se terminant par g chez les procaryotes.
    4. 2622: Effectif faible de tRNAs supérieurs à   t   et à   c   .
    5. 160: Changement de codon   g   Chez les archées et les eucaryotes.
  • Tableaux:
    1. Nombre de tRNAs des 121 eucaryotes, tableau III 92 530.
    2. Pour 100 000 tRNAs des 121 eucaryotes, tableau III100 92 530.
    3. tRNAs pour 1 génome, tableau III1 92 530, indice de la multiplicité = nombre de tRNAs / 121.
III. Nombres de tRNAs. 121 eucaryotes. 92 530
ttt 45 tct 1,266 tat 50 tgt 209
c 1,461 c 99 c 1,661 c 2,403
a 705 a 715 a a 249
g 816 g 551 g g 1,739
ctt 1,085 cct 1,123 cat 34 cgt 1,153
c 22 c 25 c 1,239 c 33
a 561 a 1,244 a 1,957 a 2,020
g 857 g 476 g 1,318 g 428
att 1,803 act 1,527 aat 72 agt 36
c 70 c 83 c 2,039 c 1,265
a 675 a 1,053 a 1,880 a 1,369
g 2,921 g 672 g 4,658 g 1,095
gtt 1,543 gct 2,524 gat 93 ggt 138
c 94 c 240 c 2,245 c 2,017
a 790 a 7,139 a 6,609 a 5,547
g 2,699 g 4,540 g 3,111 g 6,439
III100 100000 tRNAs. 121 eucaryotes. 92 530.
ttt 49 tct 1,368 tat 54 tgt 226
c 1,579 c 107 c 1,795 c 2,597
a 762 a 773 a 0 a 269
g 882 g 595 g 0 g 1,879
ctt 1,173 cct 1,214 cat 37 cgt 1,246
c 24 c 27 c 1,339 c 36
a 606 a 1,344 a 2,115 a 2,183
g 926 g 514 g 1,424 g 463
att 1,949 act 1,650 aat 78 agt 39
c 76 c 90 c 2,204 c 1,367
a 729 a 1,138 a 2,032 a 1,480
g 3,157 g 726 g 5,034 g 1,183
gtt 1,668 gct 2,728 gat 101 ggt 149
c 102 c 259 c 2,426 c 2,180
a 854 a 7,715 a 7,143 a 5,995
g 2,917 g 4,907 g 3,362 g 6,959
III1 tRNAs par génome. 121 eucaryotes. 92 530.
ttt 0.37 tct 10.46 tat 0.41 tgt 1.73
c 12.07 c 0.82 c 13.73 c 19.86
a 5.83 a 5.91 a 0.00 a 2.06
g 6.74 g 4.55 g 0.00 g 14.37
ctt 8.97 cct 9.28 cat 0.28 cgt 9.53
c 0.18 c 0.21 c 10.24 c 0.27
a 4.64 a 10.28 a 16.17 a 16.69
g 7.08 g 3.93 g 10.89 g 3.54
att 14.90 act 12.62 aat 0.60 agt 0.30
c 0.58 c 0.69 c 16.85 c 10.45
a 5.58 a 8.70 a 15.54 a 11.31
g 24.14 g 5.55 g 38.50 g 9.05
gtt 12.75 gct 20.86 gat 0.77 ggt 1.14
c 0.78 c 1.98 c 18.55 c 16.67
a 6.53 a 59.00 a 54.62 a 45.84
g 22.31 g 37.52 g 25.71 g 53.21
  • Tableaux non formatés: voir tableur
Tableau des effectifs calculés des gènes de tRNAs 121 eucaryotes.[modifier | modifier le wikicode]
  • Lien Tableur: Tableau des effectifs calculés des gènes de tRNAs 121 eucaryotes.
  • Liens: Résultats des calculs sur les 121 eucaryotesTableaux des effectifs 1213 domaines   Les duplications excessives, tableau des différences III1−IV1.
  • Caractérisation des codons par les processus de genèse et de duplication des eucaryotes: se reporter aux calculs effectués sur les 121 eucaryotes pour la problématique de cette étude.
    − Problématique de la comparaison avec les procaryotes et zébrafish: Chez les procaryotes la duplication est très faible et c'est la genèse qui prévaut. J'ai pu déterminer, dans les 3 domaines, la structuration par codons avec les archées (résultats.3a) et la structuration par doublets avec les bactéries (résultats.2b) qui présentent une bonne duplication par rapport aux archées. Ces structurations étaient possibles tant que la duplication restait faible. Pour zebrafish la situation est analogue à celle des procaryotes, tous les codons ont une forte duplication mais elle est quasi uniforme et l'on peut comparer avec les effectifs rapportés à 100 000 tRNAs. Avec les 121 eucaryotes, comme on l'a vu dans les calculs, la duplication varie continuellement même en réduisant celle des codons décuplés. La caractérisation des codons par les effectifs dépendrait du nombre des eucaryotes étudiés et surtout de celui des eucaryotes présentant des codons décuplés. Par contre si on fait l'hypothèse que le taux de ces derniers eucaryotes est constant, alors la pente de la droite de tendance restera constante et caractérisera mieux les codons pour le processus de duplication seul.
    − Méthode pour comparer: J'ai comparé les effectifs (rapportés à 100 000 tRNAs) des 121 eucaryotes réduits dont l'effectif total est de 55 830 (décompte du 3.11.17), de zébrafish dont l'effectif total est de 12 558 et des bactéries dont l’effectif total que j'ai décompté est de 235 027 ( total du tableau des effectifs comptés au 10.1.16 (pour mémoire NCBI/repete110.ods/GC code 110) et non celui des statistiques de la base de données gtRNAdb qui ne lui correspond pas et qui peut varier avec les mises à jour). J'ai comparé les indices de multiplicité des 121 eucaryotes réduits (total 55 830) à ceux des 121 non réduits ( total 92 530) pour repérer les codons décuplés. Enfin j’ai ajouté les tableaux des pentes et des coefficients de détermination des 121 réduits.
    − Résultats:
  • Légende: Décompte des gènes tRNAs par codon suivant la base de données gtRNAdb [16].
    1.   5   : nombre de tRNAs d'un codon se terminant par t. Ce sont les plus faibles.
    2.   113   : nombre de tRNAs d'un codon se terminant par t: Changement de t en c chez les archées et de c en t chez les eucaryotes.
    3. 4 366: Effectif élevé de tRNAs d'un codon se terminant par g chez les procaryotes.
    4. 2622: Effectif faible de tRNAs supérieurs à   t   et à   c   .
    5. 160: Changement de codon   g   Chez les archées et les eucaryotes.
  • Tableaux: Chaque tableau contient le total des génomes étudiés suivi de son total de gènes tRNAs: 121 eucaryotes 55 830 pour les 121 eucaryotes réduits; pour les autres tableaux les décomptes des gènes de tRNAs sont directs.
    1. Nombre de tRNAs: tableau IV Résultats des calculs sur les 121 eucaryotes, tableau V décompte de la base gtRNAdb.
    2. Pour 100 000 tRNAs, tableaux IV100 III100 V100, décomptes rapportés à 100 000 tRNAs pour comparaison.
    3. tRNAs pour 1 génome, tableaux IV1 III1 , indice de la multiplicité = nombre de tRNAs / nombre de génomes.
    4. IVp, pentes; IVr, coefficients de détermination R2. Voir les calculs pour les 121 eucaryotes
IV . Nombres de tRNAs. 121 eucaryotes. 55 830
ttt 32 tct 1 266 tat 36 tgt 32
c 1 461 c 38 c 1 619 c 2 060
a 640 a 715 a a 249
g 794 g 551 g g 1 143
ctt 1 003 cct 1 123 cat 27 cgt 1 153
c 22 c 17 c 1 239 c 19
a 561 a 1 244 a 1 193 a 701
g 804 g 476 g 1 247 g 428
att 1 693 act 1 436 aat 47 agt 29
c 41 c 28 c 1 858 c 1 265
a 675 a 875 a 1 880 a 1 138
g 2 382 g 551 g 2 193 g 945
gtt 1 413 gct 2 241 gat 41 ggt 27
c 53 c 35 c 2 131 c 2 017
a 664 a 1 276 a 1 455 a 1 345
g 1 083 g 704 g 1 781 g 635
IVp Pentes des tRNAs. 121 eucaryotes 55 830
ttt tct 0.946 tat tgt
c 1.139 c c 1.293 c 1.603
a 0.463 a 0.699 a a
g 0.574 g 0.511 g g 0.941
ctt 0.853 cct 0.991 cat cgt 0.948
c c c 0.998 c
a 0.504 a 1.062 a 0.925 a 0.606
g 0.627 g 0.469 g 1.065 g 0.321
att 1.334 act 1.188 aat agt
c c c 1.442 c 1.174
a 0.668 a 0.848 a 1.669 a 0.969
g 2.025 g 0.491 g 1.738 g 0.808
gtt 1.020 gct 1.728 gat ggt
c c c 1.690 c 1.476
a 0.591 a 1.079 a 1.233 a 1.263
g 0.905 g 0.673 g 1.375 g 0.485
V Nombres Danio rerio (Zebrafish) 12 258
ttt 10 tct 336 tat 5 tgt 9
c 197 c 2 c 236 c 136
a 73 a 209 a - a 14
g 241 g 80 g - g 44
ctt 270 cct 315 cat 10 203
c 4 c 2 c 387 c 24
a 244 a 205 a 105 a 107
g 300 g 180 g 266 g 59
att 258 act 359 aat 24 agt 14
c 10 c 10 c 1 045 c 424
a 75 a 290 a 525 a 252
g 522 g 66 g 953 g 104
gtt 232 gct 92 gat 1 ggt 11
c 6 c 4 c 150 c 836
a 230 a 368 a 225 a 47
g 227 g 112 g 245 g 268
IV100. 100 000 tRNAs. 121 eucaryotes. 55 830
ttt 57 tct 2 268 tat 64 tgt 57
c 2 617 c 68 c 2 900 c 3 690
a 1 146 a 1 281 a a 446
g 1 422 g 987 g g 2 047
ctt 1 797 cct 2 011 cat 48 cgt 2 065
c 39 c 30 c 2 219 c 34
a 1 005 a 2 228 a 2 137 a 1 256
g 1 440 g 853 g 2 234 g 767
att 3 032 act 2 572 aat 84 agt 52
c 73 c 50 c 3 328 c 2 266
a 1 209 a 1 567 a 3 367 a 2 038
g 4 267 g 987 g 3 928 g 1 693
gtt 2 531 gct 4 014 gat 73 ggt 48
c 95 c 63 c 3 817 c 3 613
a 1 189 a 2 286 a 2 606 a 2 409
g 1 940 g 1 261 g 3 190 g 1 137
I100. 100 000 tRNAs. 4032 bactéries. 235 027
ttt 4 tct 2 tat 2 tgt 1
c 2 598 c 1 923 c 2 732 c 1 903
a 2 021 a 2 255 a - a 560
g 1 702 g 1 116 g - g 1 858
ctt 157 cct 4 cat 2 cgt 3 182
c 1 638 c 1 167 c 2 006 c 142
a 2 102 a 2 320 a 2 718 a 377
g 2 207 g 929 g 1 016 g 1 427
att 2 act 44 aat 2 agt 0
c 3 916 c 1 920 c 3 729 c 1 881
a 23 a 2 501 a 3 874 a 2 044
g 7 670 g 1 174 g 1 033 g 1 469
gtt 4 gct 1 gat 0 ggt 0
c 1 885 c 1 773 c 3 839 c 3 946
a 3 769 a 4 334 a 4 118 a 2 347
g 559 g 521 g 591 g 964
V100. Danio rerio (Zebrafish) 12 258
ttt 82 tct 2 741 tat 41 tgt 73
c 1 607 c 16 c 1 925 c 1 109
a 596 a 1 705 a - a 114
g 1 966 g 653 g - g 359
ctt 2 203 cct 2 570 cat 82 cgt 1 656
c 33 c 16 c 3 157 c 196
a 1 991 a 1 672 a 857 a 873
g 2 447 g 1 468 g 2 170 g 481
att 2 105 act 2 929 aat 196 agt 114
c 82 c 82 c 8 525 c 3 459
a 612 a 2 366 a 4 283 a 2 056
g 4 258 g 538 g 7 775 g 848
gtt 1 893 gct 751 gat 8 ggt 90
c 49 c 33 c 1 224 c 6 820
a 1 876 a 3 002 a 1 836 a 383
g 1 852 g 914 g 1 999 g 2 186
IV1. tRNAs par génome. 121 eucaryotes.  55 830
ttt 0.26 tct 10.46 tat 0.30 tgt 0.26
c 12.07 c 0.31 c 13.38 c 17.02
a 5.29 a 5.91 a a 2.06
g 6.56 g 4.55 g g 9.45
ctt 8.29 cct 9.28 cat 0.22 cgt 9.53
c 0.18 c 0.14 c 10.24 c 0.16
a 4.64 a 10.28 a 9.86 a 5.79
g 6.64 g 3.93 g 10.31 g 3.54
att 13.99 act 11.87 aat 0.39 agt 0.24
c 0.34 c 0.23 c 15.36 c 10.45
a 5.58 a 7.23 a 15.54 a 9.40
g 19.69 g 4.55 g 18.12 g 7.81
gtt 11.68 gct 18.52 gat 0.34 ggt 0.22
c 0.44 c 0.29 c 17.61 c 16.67
a 5.49 a 10.55 a 12.02 a 11.12
g 8.95 g 5.82 g 14.72 g 5.25
III1. tRNAs par génome. 121 Eucaryotes  92 530
ttt 0.37 tct 10.46 tat 0.41 tgt 1.73
c 12.07 c 0.82 c 13.73 c 19.86
a 5.83 a 5.91 a a 2.06
g 6.74 g 4.55 g g 14.37
ctt 8.97 cct 9.28 cat 0.28 cgt 9.53
c 0.18 c 0.21 c 10.24 c 0.27
a 4.64 a 10.28 a 16.17 a 16.69
g 7.08 g 3.93 g 10.89 g 3.54
att 14.90 act 12.62 aat 0.60 agt 0.30
c 0.58 c 0.69 c 16.85 c 10.45
a 5.58 a 8.70 a 15.54 a 11.31
g 24.14 g 5.55 g 38.50 g 9.05
gtt 12.75 gct 20.86 gat 0.77 ggt 1.14
c 0.78 c 1.98 c 18.55 c 16.67
a 6.53 a 59.00 a 54.62 a 45.84
g 22.31 g 37.52 g 25.71 g 53.21
IVr . R2 des tRNAs. 121 eucaryotes 55 830
ttt tct 881 tat tgt
c 914 c c 748 c 743
a 734 a 758 a a
g 775 g 731 g g 815
ctt 807 cct 816 cat cgt 760
c c c 938 c
a 748 a 713 a 614 a 801
g 697 g 743 g 822 g 570
att 847 act 803 aat agt
c c c 913 c 797
a 740 a 788 a 770 a 666
g 892 g 866 g 845 g 594
gtt 840 gct 863 gat ggt
c c c 791 c 818
a 723 a 748 a 880 a 795
g 793 g 809 g 728 g 597
  • Les duplications excessives:Différences en pourcentage % entre les indices de IV1 et III1.
  • Retour à la légende
III1−IV1 . Nombres de tRNAs. 121 eucaryotes. en %
ttt 41 tct 0 tat 39 tgt 553
c 0 c 161 c 3 c 17
a 10 a 0 a a 0
g 3 g 0 g g 52
ctt 8 cct 0 cat 26 cgt 0
c 0 c 47 c 0 c 74
a 0 a 0 a 64 a 188
g 7 g 0 g 6 g 0
att 6 act 6 aat 53 agt 24
c 71 c 196 c 10 c 0
a 0 a 20 a 0 a 20
g 23 g 22 g 112 g 16
gtt 9 gct 13 gat 127 ggt 411
c 77 c 586 c 5 c 0
a 19 a 459 a 354 a 312
g 149 g 545 g 75 g 914
Processus E et résonance des 121 eucaryotes[modifier | modifier le wikicode]
  • Lien Tableur: Processus E et résonance des 121 eucaryotes
  • Processus E et résonance des 121 eucaryotes: Texte.
    1. Problématique: Voir la construction des tableaux, par le calcul, le chapitre "Calculs pour 121 eucaryotes". Dans ce dernier il est spécifié que "Les nombres des effectifs non réduits des 121 eucaryotes sont la somme d'un processus analogue à celui des procaryotes, que j'appelle processus E, et d'un processus de résonance. Il s'agit ici de séparer, par les différences entre les tableaux, entre le processus E et le processus de résonance.
    2. Méthode d'analyse:
      La différence est faite "1er tableau de gauche" − "2ème tableau à droite". Le résultat est mis dans un 3ème tableau à droite. Ces différences sont faites entre les indices de multiplicité. Relativement une différence d'indice d'une unité fait doubler celui d'un codon moyen d'une bactérie. Ce qui est élevé. On peut le noter spécialement pour 2 codons faibles, tgt et gcc qui ont un indice inférieur à 0.30 dans le processus E. J'ai coloré en vert foncé les différences supérieures à 4.45, ce qui quintuple l'indice de base.
      − La somme du processus E et du processus de résonance apparaît dans le tableau III1.
      − Le processus E seul apparaît dans le tableau IV1.
      − Le processus B seul apparaît dans le tableau I1.
      − Le processus de résonance seul apparaît dans la différence entre les 121 eucaryotes non réduits par le calcul et les 121 eucaryotes réduits: III1 − IV1.
      Les codons xyc/t forts sont comparés aux forts et les faibles aux faibles, permutation des xyc/t.
    3. Résultats:
      − Comparaison des processus E et B, tableaux IV1 et I1 en couleurs.
      − Différence quantitative entre E et B: les caractéristiques de chaque codon pour la bascule c/t, la genèse, la résonance, la sensibilité relative.
      − Distribution des différences: Les duplications se font par nombres entiers.
      − La résonance de duplication
    4. Critiques
    5. Hypothèses
      Le contraste de phase: C'est une analogie avec la microscopie en contraste de phase et en polarisation. En contraste de phase on peut différencier les éléments par la couleur, comme avec les bactéries où existe un peu de duplication représentant la couleur. Avec les archées, sans les duplications on a alors du gris. On a du gris plus foncé avec les codons des bactéries à faible indice de multiplicité. En polarisation on se retrouve dans le domaine des eucaryotes où l'état vibratoire du codon est révélé par le processus de duplication des eucaryotes alors que cet état est le même chez les bactéries mais n'est pas révélé par leur processus. Les processus bactériens et eucaryotes sont les équivalents des filtres polarisant. On le voit clairement avec les codons ata gtg gcg et cca. Le facteur multiplicateur n'augmente pas leur duplication au-delà de celle de leurs semblables, tta cta gta pour ata, tcg ccg acg pour gcg, ttg ctg atg pour gtg bien que atg ait acquis ses duplications chez les bactéries alors que son facteur multiplicateur est le même que celui de son carré, et enfin tca aca gca pour cca.
  • Légende: Décompte des gènes tRNAs par codon suivant la base de données gtRNAdb [17].
    1. Les permutations c/t: pour faire des différences entre 2 codons c ou t de même force. Les codons   0.12   ne sont pas permutés et les codons   0.82   le sont.
      − Pour le tableau I1:  0.25: indices multipliés par 100.
    2. Le processus E: Les gammes d'indices des Tableaux IV1, I1 pour le calcul des processus E et B. Les gammes sont définies par une rupture dans la progression des indices quand ceux-ci sont triés en ordre croissant.
      − Une seule couleur est attribuée aux 2 gammes de même ordre relatif respectivement du tableau IV1 et I1. Ainsi   13.38   correspond aux indices supérieurs à 13.38 pour le tableau IV1 et supérieurs à 1.85 pour le tableau I1. J'ai définis 4 gammes, comme suite:
        13.38    13.38  1.85;    8.95    8.95  1.17;    6.56    6.56  0.83;    2.06    2.06  0.22;    taa    codons non pris en compte.
      − Les couleurs des noms de codons du tableau IV1 sont ceux du tableau I1 pour illustrer la variation entre les 2 domaines. Les couleurs des indices sont ceux des 121 eucaryotes calculés.
      − Différence des processus E et B, Tableau IV1 − I1:   8.28   , codons impactés par la résonance;    4.11    processus E négatif;    9.71    processus E positif fort. Pour processus positif et négatif voir le tableau des sensibilités.  3.41: faible genèse de gènes de tRNA. Pour la genèse voir les tableaux de la Genèse des gènes de tRNAs.
    3. La résonance: différence entre les indices brutes et les indices calculés des 121 eucaryotes, III1 − IV1.   48.50   : Grandes résonances.
IV1. tRNAs par génome. 121 eucaryotes. 55 830
ttt 0.26 tcc 0.31 tat 0.30 tgt 0.26
atc 0.34 acc 0.23 aat 0.39 agt 0.24
ctc 0.18 ccc 0.14 cat 0.22 cgc 0.16
gtc 0.44 gcc 0.29 gat 0.34 ggt 0.22
ttc 12.07 tct 10.46 tac 13.38 tgc 17.02
att 13.99 act 11.87 aac 15.36 agc 10.45
ctt 8.29 cct 9.28 cac 10.24 cgt 9.53
gtt 11.68 gct 18.52 gac 17.61 ggc 16.67
tta 5.29 tca 5.91 taa tga 2.06
ata 5.58 aca 7.23 aaa 15.54 aga 9.40
cta 4.64 cca 10.28 caa 9.86 cga 5.79
gta 5.49 gca 10.55 gaa 12.02 gga 11.12
ttg 6.56 tcg 4.55 tag tgg 9.45
atg 19.69 acg 4.55 aag 18.12 agg 7.81
ctg 6.64 ccg 3.93 cag 10.31 cgg 3.54
gtg 8.95 gcg 5.82 gag 14.72 ggg 5.25
I1 . tRNAs pour 1 génome. 4032 Bactéries
ttt 0.25 tct 0.12 tat 0.10 tgt 0.07
att 0.12 act 2.55 aat 0.12 agt 0.02
ctt 9.15 cct 0.25 cat 0.10 cgc 8.26
gtt 0.22 gct 0.05 gat 0 ggt 0.02
ttc 1.51 tcc 1.12 tac 1.59 tgc 1.11
atc 2.28 acc 1.12 aac 2.17 agc 1.10
ctc 0.95 ccc 0.68 cac 1.17 cgt 1.85
gtc 1.10 gcc 1.03 gac 2.24 ggc 2.30
tta 1.18 tca 1.31 taa tga 0.33
ata 0.01 aca 1.46 aaa 2.26 aga 1.19
cta 1.23 cca 1.35 caa 1.58 cga 0.22
gta 2.20 gca 2.53 gaa 2.40 gga 1.37
ttg 0.99 tcg 0.65 tag tgg 1.08
atg 4.47 acg 0.68 aag 0.60 agg 0.86
ctg 1.29 ccg 0.54 cag 0.59 cgg 0.83
gtg 0.33 gcg 0.30 gag 0.34 ggg 0.56
IV1−I1. Différence des processus E - B.
ttt 0.26 tcc 0.31 tat 0.30 tgt 0.26
atc 0.34 acc 0.21 aat 0.39 agt 0.24
ctc 0.09 ccc 0.14 cat 0.22 cgc 0.07
gtc 0.44 gcc 0.29 gat 0.34 ggt 0.22
ttc 10.60 tct 9.34 tac 11.80 tgc 15.90
att 11.70 act 10.70 aac 13.20 agc 9.36
ctt 7.33 cct 8.60 cac 9.07 cgt 7.67
gtt 10.60 gct 17.50 gac 15.40 ggc 14.40
tta 4.11 tca 4.59 taa tga 1.73
ata 5.56 aca 5.77 aaa 13.30 aga 8.21
cta 3.41 cca 8.93 caa 8.28 cga 5.57
gta 3.29 gca 8.02 gaa 9.62 gga 9.75
ttg 5.57 tcg 3.90 tag tgg 8.36
atg 15.20 acg 3.87 aag 17.50 agg 6.95
ctg 5.36 ccg 3.39 cag 9.71 cgg 2.71
gtg 8.62 gcg 5.51 gag 14.40 ggg 4.69
III1. tRNAs par génome.121 Eucaryotes. 92 530
ttt 0.37 tcc 0.82 tat 0.41 tgt 1.73
atc 0.58 acc 0.69 aat 0.60 agt 0.30
ctc 0.18 ccc 0.21 cat 0.28 cgc 0.27
gtc 0.78 gcc 1.98 gat 0.77 ggt 1.14
ttc 12.07 tct 10.46 tac 13.73 tgc 19.86
att 14.90 act 12.62 aac 16.85 agc 10.45
ctt 8.97 cct 9.28 cac 10.24 cgt 9.53
gtt 12.75 gct 20.86 gac 18.55 ggc 16.67
tta 5.83 tca 5.91 taa tga 2.06
ata 5.58 aca 8.70 aaa 15.54 aga 11.31
cta 4.64 cca 10.28 caa 16.17 cga 16.69
gta 6.53 gca 59.00 gaa 54.62 gga 45.84
ttg 6.74 tcg 4.55 tag tgg 14.37
atg 24.14 acg 5.55 aag 38.50 agg 9.05
ctg 7.08 ccg 3.93 cag 10.89 cgg 3.54
gtg 22.31 gcg 37.52 gag 25.71 ggg 53.21
IV1. tRNAs par génome. 121 eucaryotes. 55 830
ttt 0.26 tcc 0.31 tat 0.30 tgt 0.26
atc 0.34 acc 0.23 aat 0.39 agt 0.24
ctc 0.18 ccc 0.14 cat 0.22 cgc 0.16
gtc 0.44 gcc 0.29 gat 0.34 ggt 0.22
ttc 12.07 tct 10.46 tac 13.38 tgc 17.02
att 13.99 act 11.87 aac 15.36 agc 10.45
ctt 8.29 cct 9.28 cac 10.24 cgt 9.53
gtt 11.68 gct 18.52 gac 17.61 ggc 16.67
tta 5.29 tca 5.91 taa tga 2.06
ata 5.58 aca 7.23 aaa 15.54 aga 9.40
cta 4.64 cca 10.28 caa 9.86 cga 5.79
gta 5.49 gca 10.55 gaa 12.02 gga 11.12
ttg 6.56 tcg 4.55 tag tgg 9.45
atg 19.69 acg 4.55 aag 18.12 agg 7.81
ctg 6.64 ccg 3.93 cag 10.31 cgg 3.54
gtg 8.95 gcg 5.82 gag 14.72 ggg 5.25
III1−IV1. Résonance des 121 Eucaryotes.
ttt 0.11 tcc 0.50 tat 0.12 tgt 1.46
atc 0.24 acc 0.45 aat 0.21 agt 0.06
ctc 0 ccc 0.07 cat 0.06 cgc 0.12
gtc 0.34 gcc 1.69 gat 0.43 ggt 0.92
ttc 0 tct 0 tac 0.35 tgc 2.83
att 0.91 act 0.75 aac 1.50 agc 0
ctt 0.68 cct 0 cac 0 cgt 0
gtt 1.07 gct 2.34 gac 0.94 ggc 0
tta 0.54 tca 0 taa tga 0
ata 0 aca 1.47 aaa 0 aga 1.91
cta 0 cca 0 caa 6.31 cga 10.90
gta 1.04 gca 48.50 gaa 42.60 gga 34.70
ttg 0.18 tcg 0 tag tgg 4.93
atg 4.45 acg 1.00 aag 20.40 agg 1.24
ctg 0.44 ccg 0 cag 0.59 cgg 0
gtg 13.40 gcg 31.70 gag 11.00 ggg 48.00
Duplications entières du processus E[modifier | modifier le wikicode]
Duplications entières du processus E
codon iE saut codon iE saut codon iE saut codon iE saut
cgc 0.07 21 tga 1.73 56 agg 6.95 5 ttc 10.56 0
ctc 0.09 53 cgg 2.71 22 ctt 7.33 5 gtt 10.58 2
ccc 0.14 49 gta 3.29 3 cgt 7.67 4 act 10.75 9
acc 0.21 8 ccg 3.39 1 gca 8.02 2 att 11.71 1
cat 0.22 0 cta 3.41 13 aga 8.21 1 tac 11.79 12
ggt 0.22 7 acg 3.87 1 caa 8.28 1 aac 13.18 1
agt 0.24 9 tcg 3.90 5 tgg 8.36 3 aaa 13.28 8
ttt 0.26 1 tta 4.11 12 cct 8.60 0 ggc 14.37 0
tgt 0.26 9 tca 4.59 2 gtg 8.62 4 gag 14.37 6
gcc 0.29 3 ggg 4.69 14 cca 8.93 2 atg 15.22 1
tat 0.30 5 ctg 5.36 3 cac 9.07 3 gac 15.37 4
tcc 0.31 8 gcg 5.51 1 tct 9.34 0 tgc 15.92 10
atc 0.34 0 ata 5.56 0 agc 9.36 3 gct 17.49 0
gat 0.34 14 ttg 5.57 0 gaa 9.62 1 aag 17.52
aat 0.39 13 cga 5.57 4 cag 9.71 0
gtc 0.44 297 aca 5.77 20 gga 9.75 8
Doublets 12 23 13[modifier | modifier le wikicode]
  • Lien Tableur: Doublets 12 23 13
  • Légende
    − Les couleurs des codons c/t à valeurs faibles:   0.26   , codons xyt non permutés.    0.30   codons xyc permutés, à valeurs faibles et mis avec les valeurs faibles xyt.
    − Les couleurs des codons c/t à valeurs fortes et des autres codons: Les gammes sont définies par une rupture dans la progression des indices quand ceux-ci sont triés en ordre croissant. Une seule couleur est attribuée aux 3 gammes de même ordre relatif respectivement des tableaux IV1, I1 et II1. Ainsi   13.38   correspond aux indices supérieurs à 13.38 pour le tableau IV1, supérieurs à 1.85 pour le tableau I1 et supérieurs à 1.25 pour le tableau II1. J'ai définis 4 gammes, comme suite:
    Tableaux    IV1   I1  II1
    1.   13.38    13.38  1.85  1.25
    2.   8.95      8.95  1.17  1.15
    3.   6.56      6.56  0.83  1.00
    4.   2.06      2.06  0.22  0.76
    5.   taa      codons non pris en compte.
    6. 9.15: moyennes multipliées par 100.
IV1.12 Indices tRNAs. 121 eucaryotes. 55 830
ttt 0.26 tcc 0.31 tat 0.30 tgt 0.26
ttc 12.07 tct 10.46 tac 13.38 tgc 17.02
tta 5.29 tca 5.91 taa tga 2.06
ttg 6.56 tcg 4.55 tag tgg 9.45
ctc 0.18 ccc 0.14 cat 0.22 cgc 0.16
ctt 8.29 cct 9.28 cac 10.24 cgt 9.53
cta 4.64 cca 10.28 caa 9.86 cga 5.79
ctg 6.64 ccg 3.93 cag 10.31 cgg 3.54
atc 0.34 acc 0.23 aat 0.39 agt 0.24
att 13.99 act 11.87 aac 15.36 agc 10.45
ata 5.58 aca 7.23 aaa 15.54 aga 9.40
atg 19.69 acg 4.55 aag 18.12 agg 7.81
gtc 0.44 gcc 0.29 gat 0.34 ggt 0.22
gtt 11.68 gct 18.52 gac 17.61 ggc 16.67
gta 5.49 gca 10.55 gaa 12.02 gga 11.12
gtg 8.95 gcg 5.82 gag 14.72 ggg 5.25
I1.12 Indices tRNAs. 4032 bactéries. 235 027
ttt 0.25 tct 0.12 tat 0.10 tgt 0.07
ttc 1.51 tcc 1.12 tac 1.59 tgc 1.11
tta 1.18 tca 1.31 taa tga 0.33
ttg 0.99 tcg 0.65 tag tgg 1.08
ctt 9.15 cct 0.25 cat 0.10 cgc 8.26
ctc 0.95 ccc 0.68 cac 1.17 cgt 1.85
cta 1.23 cca 1.35 caa 1.58 cga 0.22
ctg 1.29 ccg 0.54 cag 0.59 cgg 0.83
att 0.12 act 2.55 aat 0.12 agt 0.02
atc 2.28 acc 1.12 aac 2.17 agc 1.10
ata 0.01 aca 1.46 aaa 2.26 aga 1.19
atg 4.47 acg 0.68 aag 0.60 agg 0.86
gtt 0.22 gct 0.05 gat 0 ggt 0.02
gtc 1.10 gcc 1.03 gac 2.24 ggc 2.30
gta 2.20 gca 2.53 gaa 2.40 gga 1.37
gtg 0.33 gcg 0.30 gag 0.34 ggg 0.56
II1.12 Indices tRNAs. 184 archées
ttt 0 tct 0 tat 0 tgt 0
ttc 1.17 tcc 1.03 tac 1.03 tgc 1.63
tta 1.04 tca 1.00 taa tga 0.10
ttg 0.89 tcg 0.83 tag tgg 1.00
ctt 0.54 cct 0 cat 0 cgt 1.09
ctc 1.16 ccc 0.93 cac 1.01 cgc 1.02
cta 1.01 cca 1.00 caa 1.07 cga 1.01
ctg 0.87 ccg 0.82 cag 0.90 cgg 0.76
att 0 act 0 aat 0 agt 0
atc 1.15 acc 1.03 aac 1.16 agc 1.02
ata 0.01 aca 1.08 aaa 1.07 aga 1.01
atg 3.20 acg 0.92 aag 0.90 agg 0.90
gtt 0.54 gct 0 gat 0 ggt 0.54
gtc 1.15 gcc 1.00 gac 1.18 ggc 1.32
gta 1.01 gca 1.39 gaa 1.25 gga 1.03
gtg 0.92 gcg 0.86 gag 0.87 ggg 0.84
IV1.23 Indices tRNAs. 121 eucaryotes. 55 830
ttt 0.26 tcc 0.31 tat 0.30 tgt 0.26
atc 0.34 acc 0.23 aat 0.39 agt 0.24
ctc 0.18 ccc 0.14 cat 0.22 cgc 0.16
gtc 0.44 gcc 0.29 gat 0.34 ggt 0.22
ttc 12.07 tct 10.46 tac 13.38 tgc 17.02
att 13.99 act 11.87 aac 15.36 agc 10.45
ctt 8.29 cct 9.28 cac 10.24 cgt 9.53
gtt 11.68 gct 18.52 gac 17.61 ggc 16.67
tta 5.29 tca 5.91 taa tga 2.06
ata 5.58 aca 7.23 aaa 15.54 aga 9.40
cta 4.64 cca 10.28 caa 9.86 cga 5.79
gta 5.49 gca 10.55 gaa 12.02 gga 11.12
ttg 6.56 tcg 4.55 tag tgg 9.45
atg 19.69 acg 4.55 aag 18.12 agg 7.81
ctg 6.64 ccg 3.93 cag 10.31 cgg 3.54
gtg 8.95 gcg 5.82 gag 14.72 ggg 5.25
I1.23 Indices tRNAs. 4032 bactéries. 235 027
ttt 0.25 tct 0.12 tat 0.10 tgt 0.07
att 0.12 act 2.55 aat 0.12 agt 0.02
ctt 9.15 cct 0.25 cat 0.10 cgc 8.26
gtt 0.22 gct 0.05 gat 0 ggt 0.02
ttc 1.51 tcc 1.12 tac 1.59 tgc 1.11
atc 2.28 acc 1.12 aac 2.17 agc 1.10
ctc 0.95 ccc 0.68 cac 1.17 cgt 1.85
gtc 1.10 gcc 1.03 gac 2.24 ggc 2.30
tta 1.18 tca 1.31 taa tga 0.33
ata 0.01 aca 1.46 aaa 2.26 aga 1.19
cta 1.23 cca 1.35 caa 1.58 cga 0.22
gta 2.20 gca 2.53 gaa 2.40 gga 1.37
ttg 0.99 tcg 0.65 tag tgg 1.08
atg 4.47 acg 0.68 aag 0.60 agg 0.86
ctg 1.29 ccg 0.54 cag 0.59 cgg 0.83
gtg 0.33 gcg 0.30 gag 0.34 ggg 0.56
II1.23 Indices tRNAs. 184 archées
ttt 0 tct 0 tat 0 tgt 0
att 0 act 0 aat 0 agt 0
ctt 0.54 cct 0 cat 0 cgt 1.09
gtt 0.54 gct 0 gat 0 ggt 0.54
ttc 1.17 tcc 1.03 tac 1.03 tgc 1.63
atc 1.15 acc 1.03 aac 1.16 agc 1.02
ctc 1.16 ccc 0.93 cac 1.01 cgc 1.02
gtc 1.15 gcc 1.00 gac 1.18 ggc 1.32
tta 1.04 tca 1.00 taa tga 0.10
ata 0.01 aca 1.08 aaa 1.07 aga 1.01
cta 1.01 cca 1.00 caa 1.07 cga 1.01
gta 1.01 gca 1.39 gaa 1.25 gga 1.03
ttg 0.89 tcg 0.83 tag tgg 1.00
atg 3.20 acg 0.92 aag 0.90 agg 0.90
ctg 0.87 ccg 0.82 cag 0.90 cgg 0.76
gtg 0.92 gcg 0.86 gag 0.87 ggg 0.84
IV1.13 Indices tRNAs. 121 eucaryotes. 55 830
ttt 0.26 atc 0.34 ctc 0.18 gtc 0.44
tat 0.30 aat 0.39 cat 0.22 gat 0.34
tcc 0.31 acc 0.23 ccc 0.14 gcc 0.29
tgt 0.26 agt 0.24 cgc 0.16 ggt 0.22
ttc 12.07 att 13.99 ctt 8.29 gtt 11.68
tac 13.38 aac 15.36 cac 10.24 gac 17.61
tct 10.46 act 11.87 cct 9.28 gct 18.52
tgc 17.02 agc 10.45 cgt 9.53 ggc 16.67
tta 5.29 ata 5.58 cta 4.64 gta 5.49
taa aaa 15.54 caa 9.86 gaa 12.02
tca 5.91 aca 7.23 cca 10.28 gca 10.55
tga 2.06 aga 9.40 cga 5.79 gga 11.12
ttg 6.56 atg 19.69 ctg 6.64 gtg 8.95
tag aag 18.12 cag 10.31 gag 14.72
tcg 4.55 acg 4.55 ccg 3.93 gcg 5.82
tgg 9.45 agg 7.81 cgg 3.54 ggg 5.25
I1.13 Indices tRNAs. 4032 bactéries. 235 027
ttt 0.25 att 0.12 ctt 9.15 gtt 0.22
tat 0.10 aat 0.12 cat 0.10 gat 0
tct 0.12 act 2.55 cct 0.25 gct 0.05
tgt 0.07 agt 0.02 cgc 8.26 ggt 0.02
ttc 1.51 atc 2.28 ctc 0.95 gtc 1.10
tac 1.59 aac 2.17 cac 1.17 gac 2.24
tcc 1.12 acc 1.12 ccc 0.68 gcc 1.03
tgc 1.11 agc 1.10 cgt 1.85 ggc 2.30
tta 1.18 ata 0.01 cta 1.23 gta 2.20
taa aaa 2.26 caa 1.58 gaa 2.40
tca 1.31 aca 1.46 cca 1.35 gca 2.53
tga 0.33 aga 1.19 cga 0.22 gga 1.37
ttg 0.99 atg 4.47 ctg 1.29 gtg 0.33
tag aag 0.60 cag 0.59 gag 0.34
tcg 0.65 acg 0.68 ccg 0.54 gcg 0.30
tgg 1.08 agg 0.86 cgg 0.83 ggg 0.56
II1.13 Indices tRNAs. 184 archées
ttt 0 att 0 ctt 0.54 gtt 0.54
tat 0 aat 0 cat 0 gat 0
s 0 act 0 cct 0 gct 0
tgt 0 agt 0 cgt 1.09 ggt 0.54
ttc 1.17 atc 1.15 ctc 1.16 gtc 1.15
tac 1.03 aac 1.16 cac 1.01 gac 1.18
tcc 1.03 acc 1.03 ccc 0.93 gcc 1.00
tgc 1.63 agc 1.02 cgc 1.02 ggc 1.32
tta 1.04 ata 0.01 cta 1.01 gta 1.01
taa aaa 1.07 caa 1.07 gaa 1.25
tca 1.00 aca 1.08 cca 1.00 gca 1.39
tga 0.10 aga 1.01 cga 1.01 gga 1.03
ttg 0.89 atg 3.20 ctg 0.87 gtg 0.92
tag aag 0.90 cag 0.90 gag 0.87
tcg 0.83 acg 0.92 ccg 0.82 gcg 0.86
tgg 1.00 agg 0.90 cgg 0.76 ggg 0.84
Paires de base des codons[modifier | modifier le wikicode]
  • Lien Tableur: Paires de base des codons
  • Légende:
    − Les couleurs des codons c/t à valeurs faibles:   0.26   , codons xyt non permutés.    0.30   codons xyc permutés, à valeurs faibles et mis avec les valeurs faibles xyt.
    − Les couleurs des codons c/t à valeurs fortes et des autres codons: Les gammes sont définies par une rupture dans la progression des indices quand ceux-ci sont triés en ordre croissant. Une seule couleur est attribuée aux 3 gammes de même ordre relatif respectivement des tableaux IV1.ap et I1.ap. Ainsi   13.38   correspond aux indices supérieurs à 13.38 pour le tableau IV1, supérieurs à 1.85 pour le tableau I1. J'ai définis 4 gammes, comme suite:
    Tableaux    IV1.ap   I1.ap
    1.   13.38    13.38  1.85
    2.   8.95      8.95  1.17
    3.   6.56      6.56  0.83
    4.   2.06      2.06  0.22
    5.   taa      codons non pris en compte.
    6. 9.15: moyennes multipliées par 100.
    Tableaux IV1.apr  I1.apr
      1.2   : codons ne respectant pas la dissymétrie ou l'inversant.
      1.2   : très faible dissymétrie du tableau I1.apr influençant les rapports de IV1.apr
      0.3   : bascule cgt/cgc
      −0.4   : codons non pris en compte.
    Tableaux IV1.pc  I1.pc
    +   0   : valeurs remarquables.
    + gat brin ne donnant pas de gène tRNA, ou agt donnant 1 seul gène de tRNA du codon tga.
IV1.ap Indices tRNAs. 121 eucaryotes. 55 830
ttc 12.07 ctc 0.18 atc 0.34 gtc 0.44
aag 18.12 gag 14.72 tag cag 10.31
aac 15.36 gac 17.61 tac 13.38 cac 10.24
ttg 6.56 ctg 6.64 atg 19.69 gtg 8.95
tcc 0.31 ccc 0.14 acc 0.23 gcc 0.29
agg 7.81 ggg 5.25 tgg 9.45 cgg 3.54
agc 10.45 ggc 16.67 tgc 17.02 cgc 0.16
tcg 4.55 ccg 3.93 acg 4.55 gcg 5.82
ttt 0.26 ctt 8.29 att 13.99 gtt 11.68
aaa 15.54 gaa 12.02 taa caa 9.86
aat 0.39 gat 0.34 tat 0.30 cat 0.22
tta 5.29 cta 4.64 ata 5.58 gta 5.49
tct 10.46 cct 9.28 act 11.87 gct 18.52
aga 9.40 gga 11.12 tga 2.06 cga 5.79
agt 0.24 ggt 0.22 tgt 0.26 cgt 9.53
tca 5.91 cca 10.28 aca 7.23 gca 10.55
I1.ap Indices tRNAs. 4032 bactéries. 235 027
ttc 1.51 ctc 0.95 atc 2.28 gtc 1.10
aag 0.60 gag 0.34 tag cag 0.59
aac 2.17 gac 2.24 tac 1.59 cac 1.17
ttg 0.99 ctg 1.29 atg 4.47 gtg 0.33
tcc 1.12 ccc 0.68 acc 1.12 gcc 1.03
agg 0.86 ggg 0.56 tgg 1.08 cgg 0.83
agc 1.10 ggc 2.30 tgc 1.11 cgc 8.26
tcg 0.65 ccg 0.54 acg 0.68 gcg 0.30
ttt 0.25 ctt 9.15 att 0.12 gtt 0.22
aaa 2.26 gaa 2.40 taa caa 1.58
aat 0.12 gat 0 tat 0.10 cat 0.10
tta 1.18 cta 1.23 ata 0.01 gta 2.20
tct 0.12 cct 0.25 act 2.55 gct 0.05
aga 1.19 gga 1.37 tga 0.33 cga 0.22
agt 0.02 ggt 0.02 tgt 0.07 cgt 1.85
tca 1.31 cca 1.35 aca 1.46 gca 2.53
IV1.apr rapports a/t c/g. 121 eucaryotes. 55 830
ttc c/g ctc c/g atc c/g gtc c/g
aag 0.7 gag 0.01 tag cag 0.04
aac gac tac cac
ttg 2.3 ctg 2.7 atg 0.7 gtg 1.1
tcc ccc acc gcc
agg 0.04 ggg 0.03 tgg 0.02 cgg 0.08
agc ggc tgc cgc
tcg 2.3 ccg 4.2 acg 3.7 gcg 0.03
ttt a/t ctt a/t att a/t gtt a/t
aaa 58.8 gaa 1.5 taa caa 0.8
aat gat tat cat
tta 13.6 cta 13.7 ata 18.8 gta 24.6
tct cct act gct
aga 0.9 gga 1.2 tga 0.2 cga 0.3
agt ggt tgt cgt
tca 24.7 cca 46.1 aca 27.3 gca 1.1
I1.apr rapports a/t c/g. 4032 bactéries. 235 027
ttc c/g ctc c/g atc c/g gtc c/g
aag 2.5 gag 2.8 tag cag 1.9
aac gac tac cac
ttg 2.2 ctg 1.7 atg 0.4 gtg 3.6
tcc ccc acc gcc
agg 1.3 ggg 1.2 tgg 1.0 cgg 1.2
agc ggc tgc cgc
tcg 1.7 ccg 4.2 acg 1.6 gcg 0.3
ttt a/t ctt a/t att a/t gtt a/t
aaa 910 gaa 26 taa caa 710
aat gat tat cat
tta 950 cta >>>> ata 14 gta 2215
tct cct act gct
aga 961 gga 552 tga 13 cga 443
agt ggt tgt cgt
tca 5299 cca 5453 aca 1959 gca 1.4
IV1.pc Codons par paire. 121 eucaryotes. 55 830
tat ttt tct tgt cgc gat agt
paire ata aaa aga aca gcg cta tca
codons 2 2 4 2 2 1 3
ttc ttg tac tgg tcc tcg
paire aag aac atg acc agg agc
codons 4 4 3 2 3 4
aat ggg ctc cac gac ggc tgc
paire tta ccc gag gtg ctg ccg acg
codons 2 2 2 4 3 3 4
I1.pc Codons par paire. 4032 bactéries. 235 027
tat ttt tct tgt cgc gat agt
paire ata aaa aga aca gcg cta tca
codons 0 2 2 2 2 2 2
ttc ttg tac tgg tcc tcg
paire aag aac atg acc agg agc
codons 3 3 3 3 3 3
aat ggg ctc cac gac ggc tgc
paire tta ccc gag gtg ctg ccg acg
codons 1 4 4 4 4 4 4
Sensibilite du processus E[modifier | modifier le wikicode]
  • Lien tableur:Sensibilité du processus E
  • Légende:
    + Le tableau IV1.265 représente la sensibilité relative du processus E par rapport aux bactéries. C'est la différence, en %, entre l'indice de sensibilité du tableau IV1.79 et de l'indice de multiplicité des bactéries (tableau I1.23).
    + Le tableau IV1.79 est obtenu en divisant l'indice de multiplicité des eucaryotes (tableau IV1.23) par 7.90. Le facteur multiplicateur, 7.90, est l'optimum, en faisant varier ce facteur dans un tableur, pour avoir le minimum de la somme des valeurs absolues des codons du tableau IV1.265 ayant les plus faibles sensibilités relatives (codons jaunes). Ce minimum est de 265.0. Une fois ce minimum obtenu il faut changer les formules du tableur, en enlevant la fonction ABS, pour obtenir les signes positifs ou négatifs des sensibilités relatives comme indiqué dans le tableau IV1.265.
    + La légende des 4 tableaux, autres que IV1.265 et IV1.265p, est celle des tableaux doublets 12 23 13 dont j'ai extrais les tableaux IV1.23 et I1.23. Cette légende est recopiée ci-dessous.
    + Légende du tableau des sensibilités relatives, IV1.265 et IV1.265p: Ne pas confondre avec les couleurs des 4 autres tableaux
    •   -22.4   , sensibilités minimales, inférieures à 22.4% en valeur absolue.
    •   -68   , sensibilités négatives comprises entre -34% et -68% en valeur absolue.
    •   73   , sensibilités supérieures à 73%.
    •   -98   , codons non pris en compte
    •   -12   , codons non pris en compte et dont la valeur est divisée par 100, le vrai rapport en % est 1200.
    + Légende des tableaux doublets 12 23 13: copié à partir du chapitre "doublets 12 23 13", tels quels, avec le tableau des archées II1 qui n'est pas représenté ici.
    − Les couleurs des codons c/t à valeurs faibles:   0.26   , codons xyt non permutés.    0.30   codons xyc permutés, à valeurs faibles et mis avec les valeurs faibles xyt.
    − Les couleurs des codons c/t à valeurs fortes et des autres codons: Les gammes sont définies par une rupture dans la progression des indices quand ceux-ci sont triés en ordre croissant. Une seule couleur est attribuée aux 3 gammes de même ordre relatif respectivement des tableaux IV1, I1 et II1. Ainsi   13.38   correspond aux indices supérieurs à 13.38 pour le tableau IV1, supérieurs à 1.85 pour le tableau I1 et supérieurs à 1.25 pour le tableau II1. J'ai définis 4 gammes, comme suite:
    Tableaux    IV1   I1  II1
    1.   13.38    13.38  1.85  1.25
    2.   8.95      8.95  1.17  1.15
    3.   6.56      6.56  0.83  1.00
    4.   2.06      2.06  0.22  0.76
    5.   taa      codons non pris en compte.
    6. 9.15: moyennes multipliées par 100.
IV1.23 Indices tRNAs. 121 eucaryotes. 55 830
ttt 0.26 tcc 0.31 tat 0.30 tgt 0.26
atc 0.34 acc 0.23 aat 0.39 agt 0.24
ctc 0.18 ccc 0.14 cat 0.22 cgc 0.16
gtc 0.44 gcc 0.29 gat 0.34 ggt 0.22
ttc 12.07 tct 10.46 tac 13.38 tgc 17.02
att 13.99 act 11.87 aac 15.36 agc 10.45
ctt 8.29 cct 9.28 cac 10.24 cgt 9.53
gtt 11.68 gct 18.52 gac 17.61 ggc 16.67
tta 5.29 tca 5.91 taa tga 2.06
ata 5.58 aca 7.23 aaa 15.54 aga 9.40
cta 4.64 cca 10.28 caa 9.86 cga 5.79
gta 5.49 gca 10.55 gaa 12.02 gga 11.12
ttg 6.56 tcg 4.55 tag tgg 9.45
atg 19.69 acg 4.55 aag 18.12 agg 7.81
ctg 6.64 ccg 3.93 cag 10.31 cgg 3.54
gtg 8.95 gcg 5.82 gag 14.72 ggg 5.25
I1.23 Indices tRNAs. 4032 bactéries. 235 027
ttt 0.25 tct 0.12 tat 0.10 tgt 0.07
att 0.12 act 2.55 aat 0.12 agt 0.02
ctt 9.15 cct 0.25 cat 0.10 cgc 8.26
gtt 0.22 gct 0.05 gat 0 ggt 0.02
ttc 1.51 tcc 1.12 tac 1.59 tgc 1.11
atc 2.28 acc 1.12 aac 2.17 agc 1.10
ctc 0.95 ccc 0.68 cac 1.17 cgt 1.85
gtc 1.10 gcc 1.03 gac 2.24 ggc 2.30
tta 1.18 tca 1.31 taa tga 0.33
ata 0.01 aca 1.46 aaa 2.26 aga 1.19
cta 1.23 cca 1.35 caa 1.58 cga 0.22
gta 2.20 gca 2.53 gaa 2.40 gga 1.37
ttg 0.99 tcg 0.65 tag tgg 1.08
atg 4.47 acg 0.68 aag 0.60 agg 0.86
ctg 1.29 ccg 0.54 cag 0.59 cgg 0.83
gtg 0.33 gcg 0.30 gag 0.34 ggg 0.56
IV1.79 Indices tRNAs. 121 eucaryotes. 55 830
ttt 0.03 tcc 0.04 tat 0.04 tgt 0.03
atc 0.04 acc 0.03 aat 0.05 agt 0.03
ctc 0.02 ccc 0.02 cat 0.03 cgc 0.02
gtc 0.06 gcc 0.04 gat 0.04 ggt 0.03
ttc 1.53 tct 1.32 tac 1.69 tgc 2.16
att 1.77 act 1.50 aac 1.94 agc 1.32
ctt 1.05 cct 1.17 cac 1.30 cgt 1.21
gtt 1.48 gct 2.34 gac 2.23 ggc 2.11
tta 0.67 tca 0.75 taa tga 0.26
ata 0.71 aca 0.92 aaa 1.97 aga 1.19
cta 0.59 cca 1.30 caa 1.25 cga 0.73
gta 0.69 gca 1.33 gaa 1.52 gga 1.41
ttg 0.83 tcg 0.58 tag tgg 1.20
atg 2.49 acg 0.58 aag 2.29 agg 0.99
ctg 0.84 ccg 0.50 cag 1.30 cgg 0.45
gtg 1.13 gcg 0.74 gag 1.86 ggg 0.66
IV1.265 Sensibilité du processus E
ttt 12 tcc 31 tat 37 tgt 44
atc 34 acc 0.1 aat 39 agt 121
ctc -0.7 ccc 6 cat 27 cgc -0.8
gtc 24 gcc 73 gat ggt 113
ttc 1 tct 18 tac 6 tgc 94
att -22.4 act 34 aac -11 agc 20.7
ctt 10 cct 73 cac 11 cgt -35
gtt 35 gct 127 gac 0 ggc -8
tta -43 tca -43 taa tga -20.1
ata aca -37 aaa -13 aga 0
cta -52 cca -4 caa -21.2 cga 233
gta -68 gca -47 gaa -37 gga 3
ttg -16 tcg -11 tag tgg 10
atg -44 acg -16 aag 281 agg 15
ctg -35 ccg -8 cag 120 cgg -46
gtg 248 gcg 143 gag 441 ggg 18
IV1.79p Indices tRNAs. 121 eucaryotes. 55 830
ttt 0.03 tct 1.32 tat 0.04 tgt 0.03
att 1.77 act 1.50 aat 0.05 agt 0.03
ctt 1.05 cct 1.17 cat 0.03 cgt 1.21
gtt 1.48 gct 2.34 gat 0.04 ggt 0.03
ttc 1.53 tcc 0.04 tac 1.69 tgc 2.16
atc 0.04 acc 0.03 aac 1.94 agc 1.32
ctc 0.02 ccc 0.02 cac 1.30 cgc 0.02
gtc 0.06 gcc 0.04 gac 2.23 ggc 2.11
tta 0.67 tca 0.75 taa tga 0.26
ata 0.71 aca 0.92 aaa 1.97 aga 1.19
cta 0.59 cca 1.30 caa 1.25 cga 0.73
gta 0.69 gca 1.33 gaa 1.52 gga 1.41
ttg 0.83 tcg 0.58 tag tgg 1.20
atg 2.49 acg 0.58 aag 2.29 agg 0.99
ctg 0.84 ccg 0.50 cag 1.30 cgg 0.45
gtg 1.13 gcg 0.74 gag 1.86 ggg 0.66
IV1.265p Sensibilité du processus E
ttt 12 tct 1067 tat 37 tgt 44
att 1427 act 58 aat 39 agt 121
ctt 10 cct 473 cat 27 cgt -35
gtt 661 gct 4725 gat - ggt 113
ttc 1 tcc -96 tac 6 tgc 94
atc -98 acc -97 aac -11 agc 20.7
ctc -98 ccc -97 cac 11 cgc -0.8
gtc -95 gcc -96 gac 0 ggc -8
tta -43 tca -43 taa tga -20.1
ata aca -37 aaa -13 aga 0
cta -52 cca -4 caa -21.2 cga 233
gta -68 gca -47 gaa -37 gga 3
ttg -16 tcg -11 tag tgg 10
atg -44 acg -16 aag 281 agg 15
ctg -35 ccg -8 cag 120 cgg -46
gtg 248 gcg 143 gag 441 ggg 18
Genèse des gènes de tRNAs[modifier | modifier le wikicode]
  • Lien tableur:Genèse des gènes de tRNAs
  • Légende de la construction du tableau de la sensibilité relative.
    + Le tableau IV1.265 représente la sensibilité relative du processus E par rapport aux bactéries. C'est la différence, en %, entre l'indice de sensibilité du tableau IV1.79 et de l'indice de multiplicité des bactéries (tableau I1.23).
    + Le tableau IV1.79 est obtenu en divisant l'indice de multiplicité des eucaryotes (tableau IV1.23) par 7.90. Le facteur multiplicateur, 7.90, est l'optimum, en faisant varier ce facteur dans un tableur, pour avoir le minimum de la somme des valeurs absolues des codons du tableau IV1.265 ayant les plus faibles sensibilités relatives (codons jaunes). Ce minimum est de 265.0. Une fois ce minimum obtenu il faut changer les formules du tableur, en enlevant la fonction ABS, pour obtenir les signes positifs ou négatifs des sensibilités relatives comme indiqué dans le tableau IV1.265.
    + La légende des 3 autres tableaux que IV1.265 est celle des tableaux doublets 12 23 13 dont j'ai extrais les tableaux IV1.23 et I1.23. Cette légende est recopiée ci-dessous.
    + Légende du tableau des sensibilités relatives, IV1.265 et IV1.265p: Ne pas confondre avec les couleurs des 4 autres tableaux
    •   -22.4   , sensibilités minimales, inférieures à 22.4% en valeur absolue.
    •   -68   , sensibilités comprises entre 34% et 68% en valeur absolue.
    •   73   , sensibilités supérieures à 73%.
    •   -98   , codons non pris en compte
    •   -12   , codons non pris en compte et dont la valeur est divisée par 100, le vrai rapport en % est 1200.
  • Légende tableau IV1.z: les zéros des 121 eucaryotes, codons sans gène de tRNA, extrait du tableau du détail des 121 eucaryotes
    Pour les * voir la base de données dtRNAdb:
    *ata: comptage des génomes ayant au moins 1 codon ata pour le total de la base, 4032.
    *ttc: 2 gènes tRNAs pour ttt et 0 pour ttc, Strongylocentrotus purpuratus (Sea urchin)
    *gac: indéterminé et il y a des gènes de tRNA avec intron, Cryptococcus neoformans var. grubii H99
    *cac: un symbionte peut utiliser les tRNAs de l'hôte, Plasmodium falciparum
    *tgc: un symbionte peut utiliser les tRNAs de l'hôte, Plasmodium falciparum
    *tgg: type de tRNA indéterminé
    Exophiala dermatitidis NIH/UT8656
    Penicillium chrysogenum P2niaD18
    Plasmodium falciparum
  • Légende tableau I1.z et tableau I1.zb: les zéros des bactéries, codons sans gène de tRNA. Extrait du tableau des tRNAs solitaires
  • Légende tableau IV1.g et tableau I1.g: pour l'indice de genèse, c'est le rapport (total des génomes − les zéros)/total des génomes). Pour les bactéries le total des génomes est celui du tableau I1.zb.
Genèse des gènes de tRNAs
I1.g Genèse tRNAs. 4032 bactéries. 235 027
ttt tct tat tgt
att act 0.02 aat agt
ctt 0.09 cct cat cgc 0.08
gtt gct gat ggt
ttc 1 tcc 1 tac 1 tgc 1
atc 1 acc 0.99 aac 1 agc 1
ctc 0.92 ccc 0.67 cac 1 cgt 0.92
gtc 1 gcc 1 gac 1 ggc 1
tta 0.95 tca 0.99 taa tga 0.33
*ata 0.01 aca 1.00 aaa 1.00 aga 1.00
cta 0.99 cca 1.00 caa 1.00 cga 0.21
gta 1.00 gca 1.00 gaa 1.00 gga 1.00
ttg 0.98 tcg 0.62 tag tgg 1.00
atg 1 acg 0.67 aag 0.52 agg 0.80
ctg 0.82 ccg 0.54 cag 0.46 cgg 0.86
gtg 0.31 gcg 0.30 gag 0.29 ggg 0.57
IV1.g Genèse tRNAs. 121 eucaryotes. 55 830
ttt 0.21 tcc 0.23 tat 0.22 tgt 0.23
atc 0.26 acc 0.19 aat 0.28 agt 0.14
ctc 0.16 ccc 0.13 cat 0.18 cgc 0.11
gtc 0.31 gcc 0.21 gat 0.28 ggt 0.16
ttc 0.99 tct 1 tac 1 tgc 0.99
att 1 act 0.99 aac 1 agc 0.99
ctt 0.91 cct 0.96 cac 0.99 cgt 0.99
gtt 1 gct 1 gac 0.99 ggc 0.98
tta 0.98 tca 1 taa tga 0.60
ata 0.98 aca 1 aaa 0.98 aga 0.98
cta 0.93 cca 0.99 caa 1 cga 0.83
gta 0.98 gca 1 gaa 1 gga 1
ttg 0.96 tcg 1 tag tgg 0.98
atg 1 acg 0.98 aag 0.98 agg 0.98
ctg 0.90 ccg 0.82 cag 1 cgg 0.90
gtg 0.99 gcg 0.86 gag 1 ggg 0.93
IV1.265 Sensibilité du processus E
ttt 12 tcc 31 tat 37 tgt 44
atc 34 acc 0.1 aat 39 agt 121
ctc -0.7 ccc 6 cat 27 cgc -0.8
gtc 24 gcc 73 gat ggt 113
ttc 1 tct 18 tac 6 tgc 94
att -22.4 act 34 aac -11 agc 20.7
ctt 10 cct 73 cac 11 cgt -35
gtt 35 gct 127 gac 0 ggc -8
tta -43 tca -43 taa tga -20.1
ata aca -37 aaa -13 aga 0
cta -52 cca -4 caa -21.2 cga 233
gta -68 gca -47 gaa -37 gga 3
ttg -16 tcg -11 tag tgg 10
atg -44 acg -16 aag 281 agg 15
ctg -35 ccg -8 cag 120 cgg -46
gtg 248 gcg 143 gag 441 ggg 18
I1.z Zéros tRNAs. 4032 bactéries. 235 027
ttt tct tat tgt
att act 3682 aat agt
ctt 3502 cct cat cgc 3614
gtt gct gat ggt
ttc 0 tcc 0 tac 0 tgc 0
atc 0 acc 41 aac 0 agc 0
ctc 323 ccc 1285 cac 0 cgt 307
gtc 0 gcc 0 gac 0 ggc 0
tta 190 tca 22 taa tga 2629
*ata 48 aca 13 aaa 9 aga 10
cta 30 cca 5 caa 18 cga 3026
gta 2 gca 11 gaa 5 gga 11
ttg 96 tcg 1493 tag tgg 15
atg 0 acg 1288 aag 1899 agg 780
ctg 692 ccg 1813 cag 2130 cgg 539
gtg 2724 gcg 2721 gag 2808 ggg 1699
IV1.z Zéros tRNAs. 121 eucaryotes. 55 830
ttt 96 tcc 93 tat 94 tgt 93
atc 90 acc 98 aat 87 agt 104
ctc 102 ccc 105 cat 99 cgc 108
gtc 83 gcc 96 gat 87 ggt 102
*ttc 1 tct 0 tac 0 *tgc 1
att 0 act 1 aac 0 agc 1
ctt 11 cct 5 *cac 1 cgt 1
gtt 0 gct 0 *gac 1 ggc 2
tta 2 tca 0 taa tga 48
ata 2 aca 0 aaa 2 aga 2
cta 9 cca 1 caa 0 cga 20
gta 2 gca 0 gaa 0 gga 0
ttg 5 tcg 0 tag *tgg 3
atg 0 acg 2 aag 2 agg 2
ctg 12 ccg 22 cag 0 cgg 12
gtg 1 gcg 17 gag 0 ggg 8
I1.zb Bactéries. 4032 bactéries. 235 027
ttt tct tat tgt
att act 3775 aat agt
ctt 3834 cct cat cgc 3932
gtt gct gat ggt
ttc 0 tcc 0 tac 0 tgc 0
atc 0 acc 3775 aac 0 agc 0
ctc 3834 ccc 3940 cac 0 cgt 3932
gtc 0 gcc 0 gac 0 ggc 0
tta 3933 tca 3943 taa tga 3934
ata aca 3944 aaa 3941 aga 3928
cta 3935 cca 3939 caa 3943 cga 3833
gta 3935 gca 3902 gaa 3928 gga 3939
ttg 3933 tcg 3943 tag tgg 3934
atg 0 acg 3944 aag 3941 agg 3928
ctg 3935 ccg 3939 cag 3943 cgg 3833
gtg 3935 gcg 3902 gag 3928 ggg 3939
Genèse et sensibilité[modifier | modifier le wikicode]
  • Lien au tableur:Genèse et sensibilité
  • Légende:
    1. B E, genèse des bactéries, genèse des 121 eucaryotes. La genèse est le nombre de génomes ayant au moins 1 gène tRNA par codon divisé par le nombre total de génomes étudiés. Pour les eucaryotes ici le nombre total est de 121. Pour plus de détail sur la genèse des bactéries et des eucaryotes voir chapitre "genèse des 121 eucaryotes".
    2. z,E: nombre de génomes ayant zéros tRNA pour un codon donné. Cette colonne souligne les faibles effectifs des 121 eucaryotes, les bactéries ayant un effectif par codon d'environ 4000 génomes ne nécessitent pas de détail.
    3. sens,r et sens,E: sensibilité relative des eucaryotes E par rapport aux bactéries, et sensibilité des eucaryotes après avoir divisé les indicves de multiplicité par 7.9. Pour plus de détail voir le chapitre sur les sensibilités relatives.
    4. table: groupes de codons
    5. sens,E:Sensibilité des 121 eucaryotes du tableau IV1.79
      -   1.69   supérieur à 1.69
      -   1.13   supérieur à 1.13
      -   0.83   supérieur à 0.83
      -   0.26   supérieur à 0.26
Genèse et sensibilité
Sensibilité relative neutre
table codon B E z,E sens,r sens,E
genèse constante, neutre
ttc 1 0,99 1 1 1,53
tac 1 1 0 6 1,69
aac 1 1 0 -11 1,94
cac 1 0,99 1 11 1,30
gac 1 0,99 1 0 2,23
I tgg 1 0,98 3 10 1,20
aaa 1 0,98 2 -13 1,97
II caa 1 1 0 -21,2 1,25
atc/t 1 1 0 -22,4 1,77
tcc/t 1 1 0 18 1,32
agc 1 0,99 1 20,7 1,32
III ggc 1 0,98 2 -8 2,11
cca 1 0,99 1 -4 1,30
aga 1 0,98 2 0 1,19
IV gga 1 1 0 3 1,41
ttg 0,98 0,96 5 -16 0,83
ctc/t 0,92 0,91 11 10 1,05
ccg 0,54 0,82 22 -8 0,50
ggg 0,57 0,93 8 18 0,66
V tga 0,33 0,60 48 -20,1 0,26
genèse variable, neutre
tcg 0,62 1 0 -11 0,58
acg 0,67 0,98 2 -16 0,58
a agg 0,80 0,98 2 15 0,99
Sensibilité relative négative et positive
table codon B E z,E sens,r sens,E
genèse constante, négative
gta 1,00 0,98 2 -68 0,69
atg 1 1 0 -44 2,49
tca 0,99 1 0 -43 0,75
aca 1,00 1 0 -37 0,92
gca 1,00 1 0 -47 1,33
gaa 1,00 1 0 -37 1,52
tta 0,95 0,98 2 -43 0,67
VI cgt/c 0,92 0,99 1 -35 1,21
ctg 0,82 0,90 12 -35 0,84
cgg 0,86 0,90 12 -46 0,45
VII cta 0,99 0,93 9 -52 0,59
genèse constante, sensible
gtc/t 1 1 0 35 1,48
acc/t 0,99 0,99 1 34 1,50
tgc 1 0,99 1 94 2,16
VIII gcc/t 1 1 0 127 2,34
genèse variable, sensible
ata 0,98 2 0,71
aag 0,52 0,98 2 281 2,29
cag 0,46 1 0 120 1,30
gag 0,29 1 0 441 1,86
b gtg 0,31 0,99 1 248 1,13
gcg 0,30 0,86 17 143 0,74
cga 0,21 0,83 20 233 0,73
c cct/c 0,67 0,96 5 73 1,17
Moyennes des doublets 12 23 13[modifier | modifier le wikicode]
  • Lien tableur: Moyennes des doublets 12 23 13
  • Légende: Pour les indices des doublets se reporter au chapitre Doublets 12 23 13. Pour le processus E se reporter au chapitre Processus E et résonance des 121 eucaryotes.
    − Attention aux permutations c/t entre eucaryotes et procaryotes. Les doublets .tt .ct .at .gt ne contiennent que les valeurs faibles des codons c/t et les doublets .tc .cc .at .gc les valeurs fortes de ces mêmes codons. Voir surtout les tableaux des indices.
    − Les moyennes des colonnes des tableaux TT.23 et TT.13 sont faites sur les 3 derniers doublets.
    − Toutes les moyennes des doublets, colonnes et lignes des tableaux TT.12 sont faites sur les 3 derniers codons de chaque doublet, sans le codon c/t.
    − Tableaux IV1. L'indice de atg est exclu des moyennes.
    − Tableaux II1. Les indices de atg et ata sont exclus des moyennes.
    − Tableaux I1. Les indices de atg, ata et tga sont exclus des moyennes.
    − Les moyennes des lignes ..t et ..c des tableaux TT.23 et TT.13 sont faites sur les 16 codons respectivement faibles et forts après les permutations.
    m, moyenne sur 4 codons, e son écart type, % le rapport en pourcentage e/m.

Voici les moyennes sur 8 codons chacune des codons faibles et forts sans effectuer les permutations:

Ligne	..t	..t	..c	..c
m	0.28	11.70	0.26	14.10
e	0.06	3.28	0.10	2.97
%	21	28	39	21
  • Doublets 23
Moyenne, écartype et rapport m/e des doublets adénéliques dans le processus E
IV1.23 121 eucaryotes
doublet .tt .ct .at .gt
m 0.31 0.24 0.31 0.22
e 0.11 0.08 0.07 0.05
% 36 32 22 21
doublet .tc .cc .ac .gc
m 11.51 12.53 14.15 13.42
e 2.37 4.13 3.13 3.98
% 21 33 22 30
doublet .ta .ca .aa .ga
m 5.25 8.49 12.47 8.77
e 0.43 2.29 2.87 2.72
% 8 27 23 31
doublet .tg .cg .ag .gg
m 7.39 4.71 14.38 6.51
e 1.36 0.79 3.92 2.63
% 18 17 27 40
Ligne ..t ..c ..a ..g
m 0.27 12.90 8.48 7.87
e 0.08 3.27 3.25 4.23
% 30 25 38 54
Colonne .t. .c. .a. .g.
m 8.11 8.58 13.72 9.64
e 3.19 4.17 3.04 4.26
% 39 49 22 44
I1.23 4032 Bactéries
doublet .tt .ct .at .gt
m 0.20 0.14 0.08 0.04
e 0.10 0.10 0.05 0.03
% 51 71 68 69
doublet .tc .cc .ac .gc
m 1.46 0.99 1.79 1.59
e 0.60 0.21 0.51 0.59
% 41 21 28 37
doublet .ta .ca .aa .ga
m 1.53 1.66 2.08 0.93
e 0.58 0.58 0.44 0.62
% 38 35 21 67
doublet .tg .cg .ag .gg
m 0.87 0.54 0.51 0.83
e 0.49 0.17 0.15 0.21
% 57 32 28 26
Ligne ..t ..c ..a ..g
m 1.34 1.46 1.56 0.69
e 2.94 0.54 0.64 0.29
% 220 37 41 42
Colonne .t. .c. .a. .g.
m 1.31 1.07 1.50 1.13
e 0.58 0.58 0.78 0.57
% 45 55 52 50
IV1−I1 Processus E.
doublet .tt .ct .at .gt
m 0.28 0.24 0.31 0.20
e 0.15 0.08 0.07 0.09
% 52 34 22 43
doublet .tc .cc .ac .gc
m 10.05 11.54 12.35 11.83
e 1.89 4.06 2.64 3.94
% 19 35 21 33
doublet .ta .ca .aa .ga
m 4.09 6.83 10.39 7.84
e 1.04 1.99 2.59 2.11
% 26 29 25 27
doublet .tg .cg .ag .gg
m 6.52 4.17 13.87 5.68
e 1.83 0.93 3.93 2.49
% 28 22 28 44
Ligne ..t ..c ..a ..g
m 0.26 11.44 7.03 7.18
e 0.10 3.05 2.88 4.29
% 39 27 41 60
Colonne .t. .c. .a. .g.
m 6.92 7.51 12.22 8.51
e 3.04 4.00 3.04 3.89
% 44 53 25 46
II1.23 184 archées.
doublet .tt .ct .at .gt
m 0.27 0 0 0.41
e 0.31 0.52
% 115 128
doublet .tc .cc .ac .gc
m 1.16 1.00 1.10 1.24
e 0.01 0.05 0.09 0.29
% 1 5 8 23
doublet .ta .ca .aa .ga
m 1.02 1.12 1.13 1.01
e 0.02 0.19 0.11 0.01
% 2 17 9 1
doublet .tg .cg .ag .gg
m 0.89 0.86 0.89 0.87
e 0.03 0.05 0.02 0.10
% 3 5 2 12
Ligne ..t ..c ..a ..g
m 0.17 1.12 1.07 0.88
e 0.33 0.17 0.12 0.06
% 193 15 11 7
Colonne .t. .c. .a. .g.
m 1.04 0.99 1.04 1.05
e 0.12 0.15 0.13 0.24
% 11 15 12 23
  • Doublets 13
Moyenne, écartype et rapport m/e des doublets 13
IV1.13 121 eucaryotes
doublet t.t c.t a.t g.t
m 0.29 0.18 0.30 0.32
e 0.02 0.04 0.08 0.09
% 9 20 26 28
doublet t.c c.c a.c g.c
m 13.24 9.33 12.92 16.12
e 2.79 0.81 2.18 3.06
% 21 9 17 19
doublet t.a c.a a.a g.a
m 5.60 7.64 9.44 9.79
e 0.44 2.85 4.36 2.93
% 8 37 46 30
doublet t.g c.g a.g g.g
m 6.85 6.11 10.16 8.68
e 2.46 3.12 7.08 4.34
% 36 51 70 50
Ligne ..t ..c ..a ..g
m 0.27 12.90 8.48 7.87
e 0.08 3.27 3.25 4.23
% 30 25 38 54
Colonne .t. .c. .a. .g.
m 9.41 10.90 7.69 11.53
e 4.23 4.45 2.64 4.66
% 45 41 34 40
I1.13 4032 Bactéries
doublet t.t c.t a.t g.t
m 0.14 4.44 0.71 0.07
e 0.08 4.94 1.23 0.10
% 57 111 174 136
doublet t.c c.c a.c g.c
m 1.33 1.16 1.67 1.67
e 0.25 0.50 0.65 0.70
% 19 43 39 42
doublet t.a c.a a.a g.a
m 1.25 1.10 1.64 2.12
e 0.10 0.60 0.56 0.52
% 8 55 34 25
doublet t.g c.g a.g g.g
m 0.91 0.81 0.71 0.38
e 0.23 0.34 0.13 0.12
% 25 42 18 31
Ligne ..t ..c ..a ..g
m 1.34 1.46 1.56 0.69
e 2.94 0.54 0.64 0.29
% 220 37 41 42
Colonne .t. .c. .a. .g.
m 1.17 1.37 1.02 1.39
e 0.28 0.65 0.47 0.90
% 24 47 46 64
II1.13 184 archées.
doublet t.t c.t a.t g.t
m 0 0.41 0 0.27
e 0 0.52 0 0.31
% 128 115
doublet t.c c.c a.c g.c
m 1.21 1.03 1.09 1.16
e 0.28 0.10 0.08 0.13
% 23 9 7 11
doublet t.a c.a a.a g.a
m 1.02 1.02 1.05 1.17
e 0.03 0.03 0.04 0.18
% 3 3 3 16
doublet t.g c.g a.g g.g
m 0.90 0.84 0.91 0.88
e 0.9 0.06 0.01 0.03
% 10 7 1 4
Ligne ..t ..c ..a ..g
m 0.17 1.12 1.07 0.88
e 0.33 0.17 0.12 0.06
% 193 15 11 7
Colonne .t. .c. .a. .g.
m 1.07 1.02 0.96 1.07
e 0.23 0.10 0.11 0.19
% 22 9 12 17
  • Doublets 12
Moyenne, écartype et rapport m/e des doublets 12
IV1.12 121 eucaryotes
doublet tt. tc. ta. tg.
m 7.98 6.98 13.38 13.24
e 3.61 3.10 5.36
% 45 44 40
doublet ct. cc. ca. cg.
m 6.52 7.83 10.13 6.29
e 1.83 3.41 0.24 3.03
% 28 44 2 48
doublet at. ac. aa. ag.
m 9.79 7.88 16.34 9.22
e 5.95 3.70 1.55 1.33
% 61 47 9 14
doublet gt. gc. ga. gg.
m 8.71 11.63 14.79 11.01
e 3.10 6.42 2.79 5.71
% 36 55 19 52
Ligne t.. c.. a.. g..
m 9.41 10.90 7.69 11.53
e 4.23 4.45 2.64 4.66
% 45 41 34 40
Colonne .t. .c. .a. .g.
m 8.11 8.58 13.72 9.64
e 3.19 4.17 3.04 4.26
% 39 49 22 44
I1.12 4032 Bactéries
doublet tt. tc. ta. tg.
m 1.23 1.03 1.59 1.10
e 0.26 0.34 0.02
% 22 33 2
doublet ct. cc. ca. cg.
m 1.16 0.86 1.12 0.97
e 0.18 0.43 0.50 0.83
% 15 51 45 85
doublet at. ac. aa. ag.
m 2.28 1.09 1.68 1.05
e 0.39 0.93 0.17
% 36 56 16
doublet gt. gc. ga. gg.
m 1.21 1.29 1.66 1.41
e 0.94 1.13 1.14 0.87
% 78 88 69 62
Ligne t.. c.. a.. g..
m 1.17 1.37 1.02 1.39
e 0.28 0.65 0.47 0.90
% 24 47 46 64
Colonne .t. .c. .a. .g.
m 1.31 1.07 1.50 1.13
e 0.58 0.58 0.78 0.57
% 45 55 52 50
II1.12 184 archées.
doublet tt. tc. ta. tg.
m 1.03 0.95 1.03 1.31
e 0.14 0.11 0.44
% 14 12 34
doublet ct. cc. ca. cg.
m 1.01 0.92 0.99 0.93
e 0.15 0.09 0.09 0.15
% 15 10 9 16
doublet at. ac. aa. ag.
m 1.15 1.01 1.05 0.97
e 0.08 0.13 0.07
% 8 13 7
doublet gt. gc. ga. gg.
m 1.03 1.09 1.10 1.06
e 0.12 0.27 0.20 0.24
% 11 25 18 23
Ligne t.. c.. a.. g..
m 1.07 1.02 0.96 1.07
e 0.23 0.10 0.11 0.19
% 22 9 12 17
Colonne .t. .c. .a. .g.
m 1.04 0.99 1.04 1.05
e 0.12 0.15 0.13 0.24
% 11 15 12 23
Moyennes des doublets à 3 codons homogènes[modifier | modifier le wikicode]
  • Lien au tableur: Moyennes des doublets à 3 codons homogènes
  • Légende:
    − Chez les eucaryotes les codons ttc et cgc sont dans leurs doublets (pas de permutation). De même pour cgc chez les bactéries.
    − Pour les indices se reporter au chapitre Doublets 12 23 13.
    m, moyenne sur 4 codons, e son écart type, % le rapport en pourcentage e/m.
Doublets à 3 codons homogènes
IV1.23 Nombres de tRNAs. 121 eucaryotes. 55 830
doublet .tt .ct .ac .gc
sauf ttt gct cac cgt
m 11.32 10.54 15.45 14.72
e 2.87 1.29 2.12 3.70
% 25 12 14 25
doublet .ta .ca .aa .ga
sauf cta tca taa tga
m 5.45 9.35 12.47 8.77
e 0.15 2.16 2.87 2.72
% 3 23 23 31
doublet .tg .cg .ag .gg
sauf atg gcg tag cgg
m 7.39 4.35 14.38 7.50
e 1.36 0.36 3.92 2.12
% 18 8 27 28
I1.23 Nombres de tRNAs. 4032 bactéries.
doublet .tc .cc .ac .gc
sauf atc ccc cac cgt
m 1.19 1.09 2.00 1.50
e 0.29 0.05 0.36 0.69
% 24 5 18 46
doublet .ta .ca .aa .ga
sauf ata gca taa tga
m 1.53 1.37 2.08 0.93
e 0.58 0.07 0.44 0.62
% 38 5 21 67
doublet .tg .cg .ag .gg
sauf atg gcg tag ggg
m 0.87 0.63 0.51 0.92
e 0.49 0.07 0.15 0.14
% 57 12 28 15
IV1.13 Nombres de tRNAs. 121 eucaryotes. 55 830
doublet t.c a.c c.t g.c
sauf tct cac
m 14.16 9.03
e 2.57 0.66
% 18 7
doublet t.a a.a c.a g.a
sauf taa ata cta gta
m 4.42 10.72 8.64 11.23
e 2.07 4.31 1.92 0.75
% 47 40 22 7
doublet t.g a.g c.g g.g
sauf tag acg cag gag
m 6.85 15.21 4.71 6.67
e 2.46 6.45 1.69 1.99
% 36 42 36 30
I1.13 Nombres de tRNAs. 4032 bactéries.
doublet t.c a.c c.c g.c
sauf tgc agc cgt ggc
m 1.41 1.86 0.93 1.46
e 0.25 0.64 0.25 0.68
% 18 35 26 47
doublet t.a a.a c.a g.a
sauf taa ata cga gga
m 0.94 1.64 1.39 2.37
e 0.54 0.56 0.18 0.17
% 57 34 13 7
doublet t.g a.g c.g g.g
sauf tag atg ctg ggg
m 0.91 0.71 0.66 0.32
e 0.23 0.13 0.16 0.02
% 25 18 24 6
Calculs pour 121 eucaryotes[modifier | modifier le wikicode]
  • Lien Tableur: Calculs pour 121 eucaryotes
  • Liens: base de données gtRNAdb [18]Lignes et colonnes des 121tableaux synthétiquesTableau des effectifs 121Processus E et résonance des 121 eucaryotesIV1.265 sensibilité relative
  • Linéarité du code des gènes de tRNA chez les eucaryotes: Voir le tableau analysé,
    1. Problématique: voir la problématique dans 3 domaines paragraphe "3.résultats/3.code des archées/3a/-structuration par codons, conclusion".
      - Chez les procaryotes la multiplicité est très faible par rapport à celle des eucaryotes. Elle est aussi très variable d'un codon à un autre chez ces derniers. L'effectif de 155 eucaryotes de la base de donné gtRNAdb est faible et la multiplicité dépassant le millier pour certains codons seulement ne permettent pas de dégager une tendance des codons comme chez les procaryotes où pour les bactéries l'effectif est très élevé (autour de 4000 bactéries) et où pour les archées leur uniformité et leurs multiplicités proches de l'unité suffisent à caractériser chaque codon comme on l' a vu dans les 3 domaines. Donc pour les procaryotes les totaux des codons relevés dans la base de données suffisent à les caractériser, mais pour les eucaryotes il suffit d'un seul nouveau génome avec un codon à très grande multiplicité pour changer significativement sa moyenne.
      - Dans un 1er temps j’ai éliminé des effectifs les 6 eucaryotes dont au moins 1 codon a une multiplicité supérieure à 1000. Les tendances analogues à celles des procaryotes se précisent alors clairement. Mais beaucoup d'autres codons dont la multiplicité dépasse la centaine rend arbitraire la limite de 1000 choisie auparavant. Aussi j'ai décidé de porter les nombres de tRNA d'un codon en fonction des moyennes de chaque eucaryote sélectionné. C'est ainsi que le codon n’est plus caractérisé par un nombre mais par sa courbe de tendance.
    2. Méthode d'analyse
      - Pour représenter la courbe de tendance par un seul paramètre j'ai choisi une droite passant par l'origine. Le passage par l'origine est justifié parce qu'un codon peut n’avoir aucun gène tRNA. Et la droite est la courbe la plus simple permettant d'avoir un seul paramètre. Enfin, comme la base de données du 29.10.17 présente moins de 10% des eucaryotes ayant des codons à grande multiplicité, j'ai éliminé pour la droite d'un codon étudié ceux qui diminuent fortement son coefficient de détermination. C'est ainsi que je n'ai éliminé que 74 codons sur un total de 5445 (121*45) étudiés avec 121 eucaryotes sélectionnés restant et 45 codons, en laissant de côté les codons xyc/t faibles, le codon tga et les 2 codons stop.
      - Par ailleurs la base de données contient des doublons ou autrement des génomes qui ont été analysés plusieurs fois avec des individus différents. Je n'ai choisi aussi que les variants d'une même espèces qui ont un écart de leur total supérieur à 10%. C'est ainsi que j'ai éliminé de l'étude 30 eucaryotes. Sur 155 eucaryotes affichés par les statistiques de la base je n'en ai décompté que 154 dont 2 sont anormaux (Oryzias latipes (Medaka), Eremothecium cymbalariae). Par ailleurs j'ai étudié en parallèle Danio rerio (zebra fish) car tous ses codons ont une multiplicité élevé et le total de 12258 tRNAs permet sa comparaison avec les 3 domaines. Il reste donc 121 eucaryotes.
      - Pour pouvoir comparer avec les nombres de tRNAs des codons des procaryotes j'ai remplacé l'effectif supprimé par son effectif calculé: la pente du codon concerné (pente du diagramme de sa colonne) est multipliée par la moyenne des codons de l'eucaryote concerné (moyenne calculée de sa ligne, sans ce codon à effectif excessif). Le nombre total des tRNAs d'un codon, des 121 eucaryotes, est alors la somme des décomptes directs des codons non supprimés et de ceux recalculés ( ligne "totaux + sommes calculées"). Cette méthode, par rapport à l'omission de tout un génome, a l'avantage d'étudier tous les génomes et les codons sont traités de façon homogène.
    3. Résultats
      − Du tableau des calculs ci-dessous sont extraits
      + le tableau   IV. Nombres des 121 eucaryotes 55 830  des effectifs calculés des gènes de tRNA des 121 eucaryotes et
      + le tableau  III. Nombres des 121 eucaryotes 92 580des effectifs non réduits des gènes de tRNA des 121 eucaryotes.
      Ils sont accompagnés de leurs tableaux respectifs des effectifs rapportés à 100 000 tRNAs  
      + le tableau IV100. Nombres des 121 eucaryotes 55 830, 
      + le tableau III100. Nombres des 121 eucaryotes 92 580,  
      et de leurs tableaux respectifs des indices de multiplicité  
      + le tableau IV1. Nombres des 121 eucaryotes 55 830,  
      + le tableau III1. Nombres des 121 eucaryotes 92 580.
      − Le tableau synthétique des tableaux, pour les comparaisons in visu, contient:
      + les 3 tableaux des effectifs calculés des 121 eucaryotes,  IV.IV100.IV1.  Nombres des 121 eucaryotes 55 830,
      + les 2 tableaux des pentes et des coefficients de détermination des calculs sur les 121 eucaryotes,  IVp. PentesIVr. R2  des 121 eucaryotes 55 830.
       Pour refaire les calculs des pentes dans un tableur utiliser le tableau non formaté correspondant au tableau analysé ci-dessous.
      + le tableau de multiplicité des effectifs non réduits des 121 eucaryotes,  III1.  Nombres des 121 eucaryotes 92 580,
      + le tableau des effectifs rapportés à 100 000 tRNAs des bactéries  I100.  Nombres des 4032 bactéries 235 027, et
      + les 2 tableaux de zebrafish des effectifs et des effectifs rapportés à 100 000 tRNAs,  V.V100.  Nombres des tRNAs Zebrafish 12 258.
      − L'étude des lignes et colonnes pour les doublets des 121 eucaryotes et du zebrafish est reportée ici.
      − Le processus E de duplication et la résonance des 121 eucaryotes: Les nombres des effectifs non réduits des 121 eucaryotes sont la somme d'un processus de duplication linéaire, analogue à celui des procaryotes, que j'appelle processus E, E pour eucaryote, c'est à dire un processus à progression linéaire une fois les nombres triés dans l'ordre croissant; et la somme, pour certains codons seulement, des duplications explosives de plus de 100 tRNAs par codon et que j'appelle résonance des eucaryotes par analogie aux sauts de fréquence des répétitions de plus de 4 bases identiques dans l'ADN des procaryotes de l'article "répétitions des bases chez les procaryotes" (ref.) à l'origine de mon hypothèse de la résonance de l'ADN. Pour apprécier ces 2 phénomènes j'ai procédé aux calculs des différences, reportés au chapitre Processus E et résonance des 121 eucaryotes, entre les tableaux nommés ci-dessus:
      + Différence entre "III1. Nombres des 121 eucaryotes 92 580" et "I1. Nombres des 4032 bactéries 235 027", pour la somme du processus E et de la résonance;
      + Différence entre "IV1. Nombres des 121 eucaryotes 55 830" et "I1. Nombres des 4032 bactéries 235 027", pour la différence entre le processus E et le processus B des bactéries;
      + Différence entre "III1. Nombres des 121 eucaryotes 92 580" et "IV1. Nombres des 121 eucaryotes 55 830", pour la résonance seule.
      1. Le comportement des codons avec les 121 eucaryotes:
        Liens: Tableau synthétique,  Analyse des 155 eucaryotes,  LC des 121 eucaryotes,  demi-doublets des 121 eucaryotes.
          Avant d'aller plus loin le tableau IVp montre bien que l'objectif de calculer les effectifs des codons, après avoir retirer les duplications excessives, au moyen des pentes des droites de tendance des diagrammes "effectifs d'un codon en fonction des moyennes des codons de chaque génome" est bien atteint: L'ordre des effectifs et des pentes des codons est le même dans les tableaux IV et IVp. Le tableau IVr ne respecte pas cet ordre et donc représente bien la spécifité de chaque codon. Par ailleurs on devrait trouver les mêmes comportements des codons non touchés par les duplications excessives que pour l'étude de l'ensemble des 155 eucaryotes, tant le nombre de codons retirés pour l'ajustement des coefficients de détermination est faible, 13 pour un total de 5445 considérés.
          Pour analyser les résultats nous allons reprendre la même grille de lecture que pour les 155 eucaryotes mais avec les 121 eucaryotes sélectionnés, sans doublons et sans calcul, avec les tableaux "121 eucaryotes 92530", comme référence. Entre "155 eucaryotes" et ces tableaux les différences sont minimes.
        1.a − Les codons impactés par les calculs: Tableaux IV1 et III1. Tous les indices de IV1 sont inférieurs ou égaux à ceux de III1. Voir le tableau des différences en % .
        • Les codons c/t forts: ne sont pas impactés, seuls tgc et gct dépassent les 10% en différences, avec respectivement 17% et 13%.
        • Les codons c/t faibles: Ce sont toujours les plus faibles du tableau puisque l'indice le plus bas de tous les autres codons est celui de tga avec 2.06. Par contre ils se sont harmonisés avec une gamme de 0.14 − 0.44 (respectivement ccc gtc) au lieu de 0.18 − 1.98 (respectivement ctc gcc) du tableau III1. Les duplications les plus excessives dans III1 sont celles de gcc ggt tgt (respectivement 1.98 1.14 1.73). Elles diminuent fortement dans IV1 avec respectivement 586 411 553 % de baisse.
        • Les codons a/g : sur les 30 codons a/g du tableau, 19 ont une différence inférieure à 23% dont 12 inférieure à 10%. Les colonnes 3 et 4 sont impactées chacune par 4 codons excessifs avec une différence supérieure à 52%, respectivement caa-64, aag-112, gaa-354, gag-75 et tgg-52, cga-188, gga-312, ggg-914. La ligne 4 est impactée par 7 codons dont 4 en commun avec les colonnes 3 et 4. Les 3 codons restants sont gtg-149, gcg-545, gca-459.
        1.b − En ce qui concerne l'agencement des couleurs, c.a.d l'ordre des 1ères valeurs (codons c/t faibles) et des 2èmes valeurs (supérieures aux 1ères), nous retrouvons:
        • l'agencement des colonnes 2 et 4 des bactéries, avec la seule exception cgg qui, nous l'avons vu dans les corrélations entre gènes de tRNAs au paragraphe 3.2, se comporte comme un codon xya et prend la place de cga et vis versa.
        • l'agencement des colonnes 1 et 3 qui s'harmonisent en cédant la 2ème valeur aux codons xya au lieu de xyg. Elles se comportent de la même manière à l'exception de aac qui prend la 2ème valeur à aaa, mais les 2 valeurs sont presque identiques (dans IV100 on a respectivement 3328 contre 3367). Nous le verrons avec les moyennes des lignes et colonnes, les valeurs de la colonne 3 sont les plus élevées de tout le tableau et elle se différencie ainsi de la colonne 1.
        • La ligne 4 (codons gxy) a les valeurs les plus élevées comme la colonne 3. Avec les 121 eucaryotes elle est différenciée contrairement aux "121 eucaryotes 92 530" (tableau III1) et aux bactéries surtout pour les codons gxg qui y sont respectivement tous trop forts et trop faibles.
        1.c − Lignes et colonnes des 121 eucaryotes: Lignes et colonnes des 121Lignes et colonnes des 155 eucaryotes
        • Je compare ici le tableau des lignes et colonnes pour les 155 eucaryotes (III100) et pour les "121 eucaryotes 55 830" (IV100). Le tableau des "121 eucaryotes 92530" (III100) n'a pas été fait, celui des 155 diffèrant peu tant qu'il s'agit de moyennes ou de totaux relatifs. Voir les liens en tête de paragraphe. les tableaux LC des "121 eucaryotes 55 830" (IV100) sont comparés aussi aux bactéries et à zebrafish.
        • En comparant bactéries et 155 eucaryotes on voit que la symétrie qui existe chez les bactéries est rompue chez les eucaryotes: Chez les bactéries on a à peu près L1=L2 (1800) et L3=L4 (2350), chez les eucaryotes L1=L2 (1300) donc très affaiblies et L4>>L3 (3700 2100). De même du côté des colonnes, chez les bactéries C1~C3 (2450) et C2=C4 (1830), chez les eucaryotes C1<<C3 (1500 2900) et C2~C4 (2100). En comparant bactéries et 121 eucaryotes on voit que la symétrie n'est pas rétablie mais néanmoins la dissymétrie est atténuée pour les lignes: L1~L2 (1700) donc plus vigoureuse, L4=L3 (2500) donc égalité et C1<<C3 (1960 2970), C2~C4 (1900) donc même dissymétrie que les 155 eucaryotes.
        • La comparaison de zebrafish aux 121 eucaryotes et aux bactéries montre une quasi distorsion de zebrafish avec les 2 autres tableaux: les 4 lignes sont toutes différentes entre elles et la ligne 3 est très grande par rapport aux 2 autres lignes 3 des 2 autres tableaux, respectivement aux B E Z, on a 2354 2521 3313. Pour les colonnes on en a 2 presque égales, C1<<<C3 (1950 3375) et C2~C4 (1740). Encore là la colonne 3 est disproportionnée, respectivement aux B E Z, 2566 2973 3375. En conclusion zebrafish ne peut être comparé ni aux 121 eucaryotes ni aux bactéries même si on ignore ses effectifs élevés, car il y a absence totale de symétrie entre les ligne et entre les colonnes.
        • Les carrés: Avec le tableau des lignes et colonnes j'ai donné aussi les totaux des carrés, c.a.d la somme des 4 codons d'un doublet constitué par les mêmes 1ère et 2ème base. Entre les bactéries et les 155 eucaryotes la différence est flagrante. Si les 4 doublets majoritaires sont les mêmes dans les 2 domaines, aa ga gg gc, leurs effectifs sont beaucoup plus élevés chez les eucaryotes que chez les bactéries (leur somme est de 50 000 contre 31 000 pour les bactéries). Du coup, comme on travaille sur des pourcentages, les autres doublets diminuent pour autant. Mais la diminution n'est pas égale pour tous les doublets. Ainsi les 4 doublets tt tc ct cc diminuent tous drastiquement, leur somme passant de 22 000 chez les bactéries à 12 000 chez les eucaryotes. Les 6 autres doublets ordinaires, autres que ta et at, ont des sommes qui varient peu, 32 000 pour les bactéries contre 28 000 pour les eucaryotes. Quand on passe aux 121 eucaryotes on a respectivement pour les 4 majoritaires, les 4 minoritaires et les 6 intermédiaires 35 000, 19 000 et 31 000. Les intermédiaires sont quasiment égaux à ceux des bactéries alors que les minoritaires ne sont plus qu'à 15% et les majoritaires à 30% contre 12, 40 et 40% chez les 155 eucaryotes. Le comportement de zebrafish est analogue à sa distorsion qu'on a relevée pour les lignes et les colonnes: les majoritaires et les minoritaires ne sont plus à leurs places; le maximum atteint fait le double de celui des eucaryotes (doublet aa avec 21 000 contre 10 000) et le minimum atteint fait le tiers de celui des 2 autres tableaux (doublet tg avec 1660 contre 4020 pour le doublet cg des eucaryotes).
        1.d − structuration en doublet et demi-doublet:
        • Cette structuration mise en évidence avec les 155 eucaryotes au chapitre 3/1.a et basée sur la bascule c/t reste toujours valable puisque cette dernière n'est pas impactée par les duplications excessives (voir ci-dessus le paragraphe 1.a).
        • Quand on regarde le tableau des demi-doublets des 121 eucaryotes, l’harmonisation constatée avec l'agencement des couleurs (voir paragraphe 1.a ci-dessus) est accentuée avec les rapports g/a. La structuration en demi-doublets est toujours là avec un renforcement de la bascule c/t, par rapport aux demi-doublets des 155 eucaryotes, notamment pour tgt gcc ggt qui contiennent les duplications les plus excessives (voir demi-doublets des 121 où les nombres soulignés représentent les codons impactés par les duplications excessives).
        • La structuration des doublets en ligne et colonne est plus nette notamment pour la colonne 3 où les rapports deviennent tous directs et quasiment égaux. Les rapports de la colonne 1 s’harmonisent aussi puisque le doublet gt passe de 3.4 à 1.6, les autres ne changeant presque pas. La colonne 2 est bien harmonisée d'origine et ses rapports ne changent quasiment pas.
        • Sur les 4 codons de la colonne 4 impactés par les duplications excessives seule la bascule g/a change son rapport, puisqu'il passe de 4.5 (inverse) à 1.6 (inverse) et ne change pas la nature de cette bascule. L'exception gg révélée par la bascule c/t se confirme avec un rapport g/a direct élevé de 2.1. La colonne 4 se distingue nettement des autres colonnes puisque les 3 doublets non impactés par les bascules c/t et g/a, du doublet cg, ont 8 codons sur 9 qui sont quasiment égaux (en pourcentage) à ceux des bactéries.
        • La caractérisation des codons par les rapports g/a, utilisée pour les 155 eucaryotes, très complexe n'a plus lieu d'être puisqu'elle est remplacée par l'harmonisation des colonnes. Elle reste cependant nécessaire pour les 155 eucaryotes qui incluent les duplications excessives.
        1.e − les exceptions des eucaryotes: L'analyse faite au chapitre 3/1.c avec les 155 eucaryotes est toujours valable à part 2 changements minimes mais importants puisqu'ils renforcent l'exceptionnalité.
        • Doublet gg: nous venons de le voir ci-dessus, il est renforcé chez les 121 eucaryotes par son rapport g/a élevé par rapport à ceux de la colonne aux doublets sans bascule c/t. Mais en plus, le fait que ses codons restent égaux en pourcentage à ceux du même doublet bactérien, que le codon ggg bactérien a un pourcentage bactérien des codons xag de la colonne 3, ces caractéristiques le rendent exceptionnel chez les bactéries aussi. En plus le doublet bactérien gg a un rapport c/a inverse de ceux des 3 autres doublets bactériens gxy, encore une autre exception.
        • Doublet cc: l'égalité entre le codon cct et cca en nombre ou en indice reste préoccupante même si une différence de 10% apparaît chez les 121 eucaryotes. En indices on a 10.6 et 10.6 chez les 155 eucaryotes et respectivement 9.28 et 10.28 chez les 121 eucaryotes.
        • Par contre j'avais évoqué l'éventualité d'une bascule de type g/a des doublets gt et aa dans les corrélations entre gènes de tRNAs au paragraphe 3.2. Avec les nouveaux nombres on a respectivement pour les bactéries, les 121 eucaryotes(92530) et les 121 eucaryotes (55830):
          Pour aa  0.27  2.48  1.17
          Pour gt  0.15  3.41  1.63
          Pour cg  3.78  0.21  0.61
          Ces rapports montrent qu'il n'en est rien pour aa et gt, par contre cg a bien une bascule g/a.
      2. Comparaison entre les bactéries et les 121 eucaryotes: avec processus E et processus résonance
        ""Séparation processus E et résonance: Processus E et Résonance
        Comparaison processus E et processus Bactéries: Analyse des 155 eucaryotes, Processus E et Résonance, LC des 121 eucaryotes""
          Jusque là j'ai toujours comparé bactéries et eucaryotes avec les 155 eucaryotes et en pourcentage, que ça soit en introduction des tRNAs dans le corps de l'article [19] ou dans les textes des tableaux numériques. Dans ces derniers j'ai étudié les corrélations et les comparaisons entre les domaines.
         Dans ce texte de l'étude des 121 eucaryotes j'ai comparé ces derniers avec les bactéries pour la structuration en ligne et colonne et pour les exceptions, respectivement aux chapitres 3/1.c et 3/1.e. J'aborde dans ce chapitre la comparaison entre les bactéries et les 121 eucaryotes pour les groupes de codons, pour la quantification des processus de genèse, de duplication et de résonance et pour la corrélation entre les nombres de gènes de tRNAs des codons.
        2.a − Rappel des chapitres précédents:
        • Statistiques et exceptions: La comparaison entre ligne/colonne des bactéries et ligne/colonne des 121 eucaryotes est de nature statistique, et celle avec les exceptions est une caractérisation de codons individuels. Les 2 approches montrent une forte analogie entre les 2 domaines malgré la grande différence due aux bascules xyc/t et cga/cgg et l'exception du doublet gg qui en découle.
        • Les corrélations: L'étude des corrélations entre les nombres de gènes de tRNAs des codons des 3 domaines, avec 155 eucaryotes, montrait une forte corrélation entre bactéries et eucaryotes pour 31 codons, donc en excluant certains codons excessivement représentés. C'est ce qui m'a conduit à constituer un groupe de 121 eucaryotes, sans doublons, et à séparer dans ce groupe le processus de duplication ou processus E, du processus de résonance pour les duplications excessives. Dans le paragraphe 2.e ci-dessous j'ai repris ces corrélations avec les 121 eucaroyotes et elles montrent maintenant une forte corrélation entre 40 codons sur 46 considérés.
        • Les groupes de codons: J'avais utilisé déjà le groupage des codons dans l'étude étendue des protéines de 111 bactéries (ref. [20]). J'ai procédé au groupage de ceux des gènes de tRNAs des bactéries au chapitre 3/2.b dans l'étude des 3 domaines mais ce groupage semblait fastidieux pour les 155 eucaryotes à cause de la disparité des duplications excessives (chapitre 3/1.b) jusqu'à conclure, au chapitre 3/2.c, que les processus des 2 domaines étaient totalement différents. Avec l'harmonisation du code des 121 eucaryotes, relevée précédemment, j'ai refait le regroupage des codons sous la même forme que ceux des bactéries, mais avec les indices de multiplicité, au chapitre suivant.
        • Les quantifications: J'ai commencé à mettre en parallèle les réductions des pourcentages, entre 2 codons, chez les bactéries et les 155 eucaryotes, au chapitre 3/2.c de l'étude des 3 domaines, pour repérer de nouvelles exceptions. C'est un début de quantification. La séparation du processus E de dupication et de la résonance, et l'harmonisation constatée des 121 eucaryotes, m'ont poussé à quantifier rigoureusement ces 2 processus par rapport à celui des bactéries que j'appelle processus de genèse des gènes de tRNA parce que ces derniers dupliquent faiblement et qu'ils sont en corrélation avec ceux des eucaryotes. La quantification, au chapitre 3/2.c ci-dessous, ne sera plus faite sur les pourcentages mais sur les indices de multiplicité.
        2.b − Les groupes de codons: le code génétique adénélique, les groupes xyg, xyc/t et xya. Rappel de ces groupes pour les codons des protéines: ttg agg cgt cga . . . Voir les moyennes des doublets du processus E.
        • L'ordre adénélique du code génétique:
           Dans le code traductionnelle les codons sont ordonnés par rapport aux aas qu'ils colportent, ce qui fait que la 1ère base se trouve sur une ligne du tableau et la 2ème sur une colonne. La 3ème base est reléguée dans un carré correspondant à 2 ou 4 aas. Ce groupage des codons est basé sur des nombres entiers et le code génétique est insensible (doublets à 4 aas) ou peu sensible ( doublets à 2 aas) à la 3ème base.
           Les tableaux des gènes de tRNAs ont, certes, aussi des nombres entiers, mais ils sont très élevés. Ce qui fait qu'on n'a pas de groupes distincts mais des groupes plus ou moins homogènes. En classant les nombres de gènes de tRNA des codons en valeurs faibles , intermédiaires et fortes, comme je l'ai fait pour les bactéries, les archées et les eucaryotes, il apparaît clairement qu'il faut regrouper les codons suivant la 2ème et la 3ème base, et non suivant la 1ère et la 2ème comme pour le code traductionnel, pour obtenir des doublets homogènes (cet ordre apparaît avec la comparaison entre le processus des bactéries et des eucaryotes où les couleurs alternées des codons montrent des comportements analogues, comme dans le tableau IV1 débarrassé des résonances des duplications. ref.). Ce faisant, si le doublet est homogène, les 4 codons auront le même nombre de gènes de tRNA, à peu près, et du coup le processus à la base de cette genèse est insensible à la 1ère base, alors que le processus qui fixe l'aa sur le tRNA est insensible, lui, à la 3ème base. Comme le tRNA a un sens et qu'il prend naissance par appariement à l'ADN, sa 3ème base correspond à la 1ère base de son gène et donc celui-ci a aussi un sens, le sens opposé du tRNA. J'appelle ce code, trié sur la 2ème et 3ème base, le code génique ou adénélique puisqu'il impacte les gènes des tRNAs. Il est l'opposé du code génétique qui impacte le tRNA lui-même.
           J'ai montré dans l'article sur la répétition des bases dans l'ADN des procaryotes qu'au niveau de l'ADN le code génétique est géré par les 2 forces d’appariement et de résonance. C'est le code adénélique que je viens de décrire. Le code génétique ne fait pas apparaître l’appariement. N'intervient dans le tRNA que sa résonance. Cette résonance est différente de celle de son gène puisque celle-ci se fait dans un double brin au lieu du simple du tRNA. C'est la résonance du tRNA qui interagit avec les protéines qui le modifient et définit donc l'aa à accrocher au tRNA. La résonance adénélique du codon apparaît dans les différences entre les 4 codons d'un doublet (2ème et 3ème base). On remarque systématiquement un codon qui a 2 ou 3 bases identiques par rapport aux 3 autres codons du doublet adénélique. Et de toute façon chaque codon a sa résonance propre comme je l'ai montré avec les archées (ref.).
           Il faut distinguer entre le processus de création du gène de tRNA de sa duplication et de sa duplication excessive. Le processus de création ou genèse des gènes de tRNA est différent dans les 3 domaines puisque celui des archées ne crée pas les codons xyt, cgt compris, ni ata; il crée plus difficilement (indice de multiplicité inférieur à l'unité) pour les xyg alors que les codons xya et xyc ont une multiplicité supérieure à l'unité mais inférieure à celle des mêmes codons bactériens. La genèse des bactéries se différencie de celle des archées par une multiplicité beaucoup plus faible pour les xyg et un peu plus élevée pour les xyc et xya. Elle ne donne pas naissance au codon ata, par contre elle crée cgt et un peu des codons ctt et act. La genèse des eucaryotes est masquée en partie par les duplications et les duplications excessives. En effet elle se distingue des 2 autres domaines par la création de 7 codons xyt, du codon ata et de la bascule cga/cgg. C'est la forte corrélation entre les codons bactériens et eucaryotes qui laissent penser que le processus de duplication s'ajoute à un processus de genèse eucaryote analogue à celui des bactéries.
        • Les 3 types de doublets:
          +  Les colonnes et lignes de force décrites dans l'article répétition concernent l'état vibratoire des tRNAs et non de leurs gènes. État vibratoire, image miroir de celui du brin d'ADN transcrit. Cela reste dans le domaine de la résonance de l'ADN et non du domaine du codon usage ou autrement dit de la sélection. Les forces étaient nettes pour la colonne 2 et 3 puisque les protéines qui fixent l'aa sur le tRNA le font à 100% et le nombre de gènes de tRNA ne rentre pas en jeu.
          +   Dans le tableau des nombres de gènes de tRNA les valeurs ne sont plus discrètes mais continues et représentent des moyennes, des valeurs qui dénotent le comportement global du codon. On peut encore estimer une force d'une ligne ou d'une colonne, mais les forces entre codons varient de façon continue. L'appréciation de ces forces ne peut se faire que par comparaison entre codons en constituant des groupes homogènes de valeurs proches. Le groupe doit refléter alors une similitude dans sa composition en bases. Ainsi on peut considérer les codons ayant la même base à la même position, ce qu'on analyse en ligne et colonne du tableau, ou bien 2 bases communes à la même position, c'est le classement en doublets. Le groupe d'un doublet adénélique homogène est constitué de 4 codons alors que pour la fixation des aas la colonne 2, homogène, contient 4 doublets traductionnels, soit 16 codons.
          +   Il y a 3 types de doublets et à chaque type est associé un type de ligne. Les 3 types sont notés 12 23 13 où un chiffre représente la position d'une base du codon. Les 3 types de lignes sont représentées alors par la position de la base manquante, soit respectivement pour les 3 types de doublets 12 23 13, les 3 types de lignes 12x x23 1x3 et avec une autre notation, 12. .23 1.3. Les moyennes des lignes nous renseignent sur la force d'une base à une position donnée dans le codon, mais de par leurs valeurs continues et non discrètes, elles ne permettent pas de les distinguer nettement entre elles. Par contre l'analyse minutieuse des groupes de codons et leur représentation en couleurs vont nous permettre de retrouver les résultats des fixations des aas (les lignes de force de l'article répétitions des bases), et d'appréhender l'agencement des forces de tous les codons et notamment l’imbrication de celles de chaque type de doublet. De cette façon on aura pour la première fois une image de la résonance dans l'ADN. Pour cela, ne pouvant pas représenter cette image en 3 dimensions, nous allons la décomposer en 3 tableaux chacun pour un type de doublet.
          +   La force d'un doublet est d'autant plus grande, c.a.d qu'il impose son empreinte, que le nombre de ses codons homogènes est plus grand. Pour les fixations des aas on a 2 colonnes entièrement homogènes chacune et différentes entre elles, les 4 lignes sont alors affaiblies, ce qui affaiblit ensuite les 2 colonnes restantes. La situation n'est plus la même pour les doublets, car ses 4 codons contiennent un représentant de chaque type de doublet. Ce qui fait qu'on identifie un doublet par un codon et les 3 autres représentent les 3 types de doublets. Le doublet contient donc nécessairement 2 codons homogènes, les 2 autres pouvant être homogènes ou non. A cela il faut ajouter les codons exceptionnels qui ne participent pas à cette force parce qu'ils sont absents, les 2 codons stops et/ou le codon ata, ou bien ils ont un comportement spécial, atg surexprimé. Le codon tga devrait entrer dans la résonance mais il est toujours sous exprimé. On ne tiendra pas compte donc de 4 codons exceptionnels pour les eucaryotes (taa tag tga atg) et de de 5 pour les procaryotes avec le codon ata en plus.
          +   Les permutations c/t concernent 2 doublets .xt et .xc pour les types 23, x.t et x.c pour les types 13. Dans les types 12, la permutation se fait dans le doublet. Voir les tableaux des moyennes des doublets. Quand on considère, dans le type 12 la force d'un doublet, la faiblesse de la valeur d'un codon c ou t (se terminant par) se détache nettement des 3 autres codons du doublet alors que pour les codons a ou g la différence est beaucoup plus atténuée.
          +   Voir les tableaux des doublets 12 23 13 et leurs moyennes pour l'analyse qui suit.
          . Les doublets 12: Chez les procaryotes la faiblesse des codons xyt et xyg font qu'aucun doublet n'est fort. C'est avec le processus E des eucaryotes qui augmente les valeurs des codons xyg qui fait que la colonne 3 du tableau IV1.12 contient 3 doublets forts homogènes, ca. aa. ga., avec des taux de variance, calculés sur 3 codons, respectivement de 2 9 et 19 %. J'appelle les doublets 12, des doublets traductionnels, parce qu'ils correspondent au code génétique de la traduction et ne reflètent pas les propriétés des gènes.
          . Les doublets 23:
          − Chez les archées tous les doublets sont homogènes sauf 3, .ac .gc .aa en ne tablant que sur 3 codons homogènes par doublet (voir les tableaux des doublets 12 23 13). Le tableau II1.23 des moyennes des doublets donne des moyennes sur 4 codons par doublet.
          − Chez les bactéries seuls 6 doublets n'ont pas 3 codons homogènes, .tc .gc .ta .ga .tg .ag. Soit 10 doublets homogènes sur 16. Pour les doublets 23 des eucaryotes et bactéries j'ai fait les moyennes des 3 codons homogènes, sans les permutations c/t, au lieu des 4 codons du tableau des moyennes 12 23 13. Le doublet .ag avec 28% de taux de variance pourrait être considéré comme homogène.
          − Chez les eucaryotes à 31% maximum de taux de variance tous les doublets sont homogènes à 3 codons. Il ne reste plus que 3 doublets, .ag .ga .gg, si on met le maximum de taux de variance à 25%. Le doublet .gg devient homogène si on tient compte de la bascule cga/cgg et le doublet .ga devient plus hétérogène, respectivement pour m e % on a 6.28 1.35 21, contre 8.02 3.97 50 pour .ga. Remarquons que le doublet .ag se positionne comme celui des bactéries avec 27% contre 28% de taux de variance pour les bactéries. La similitude des 2 tableaux pour les moyennes est frappante, avec 2 doublets seulement changeant radicalement quand on passe ds bactéries aux eucaryotes, .ta en diminution et .ag en augmentation. On remarquera dans les 2 domaines la force de la colonne .a. (sauf .ag pour les bactéries) et de la ligne ..c (avec les permutations c/t pour les eucaryotes).
          Remarque pour les "codon usage": Nous avons vu dans l'étude des protéines des 111 bactéries (ref.) que les doublets .tg et .gg des codons protéiques se comportaient de façon particulière. Dans l'étude des 155 eucaryotes (§3.2.b) j'avais relevé que les codons ttg ctg atg et tgg cgg agg des bactéries avaient des effectifs élevés par par rapport aux codons des doublets .cg .ag et que cette situation se maintenait pour les mêmes codons et le doublet .cg. Ici nous voyons, qu'en plus, dans les 2 domaines le doublet .gg est homogène pour 3 codons et que le codon ggg se comporterait comme les 3 autres du doublets. De même le codon gtg est très élevés par rapport aux doublets .cg et .ag chez les eucaryotes après suppression des duplications excessives.
          . Les doublets 13:
          − Chez les archées les moyennes 12 23 13 sur 4 codons laisseraient penser que tous les doublets sont homogènes. Et effectivement c'est le cas étant donné les faibles différences entre les effectifs. Mais comme j'ai déjà montré que même avec ces faibles effectifs on peut structurer les codons comme pour les bactéries (ref.), ce sont les couleurs qui permettent de repérer les doublets vraiment homogènes. Ainsi je n'ai pu distinguer que 5 doublets hétérogènes: t.c, a.c, g.c, t.a, g.a. Il reste donc 11 doublets homogènes à 3 codons. Je ne peux pas utiliser les faibles effectifs de la ligne ..t pour différencier ses 4 doublets.
          − Pour les bactéries le tableau des moyennes à 3 codons montre qu'il y a 8 doublets à taux de variance inférieurs à 26% auxquels il faut ajouter 3 doublets de la ligne ..t où le doublet c.t contient 2 codons à valeurs très élevées, ctt et cgt. Il reste donc 11 doublets homogènes à 3 codons.
          − Pour les eucaryotes la résonance du processus E fait apparaître des différences entre les codons des doublets de la ligne ..g. Les bascules c/t des lignes ..t et ..c dues encore à la résonance du processus E rend hétérogène 4 doublets sur 8. Il reste seulement 6 doublets homogènes à 3 codons: t.t, t.c, c.t, c.c, c.a, g.a. J'avais attribué aux doublets 12 le qualificatif de traductionnel puisque il n'y a que 3 doublets homogènes à 3 codons pour les 3 domaines. J'attribue ici le qualificatif résonnant pour les doublets 13 parce qu'ils font intervenir la résonance du processus E et se présentent comme une onde avec les nœuds 1 et 3, alors que le ventre est la 2ème base. De même j'attribue le qualificatif d’appariement aux doublets 23 car ils rendent homogènes quasiment tous les doublets des 3 domaines.
        2.c Quantification des processus de genèse, de duplication et de résonance:
        Voir les tableaux Processus E et résonance des 121 eucaryotes pour cette analyse.
        • Comparaison eucaryotes/bactéries par les valeurs relatives des codons en couleurs. J'analyse ici les tableaux IV1 et I1 des indices respectivement des eucaryotes et des bactéries.
        Après avoir trié les indices des codons par ordre croissant j'ai défini 4 gammes de valeurs. Une rupture forte entre 2 valeurs successives sert de frontière entre 2 gammes successives.
        - Pour les bactéries la gamme des valeurs supérieures à 1.85, la valeur 1.85 comprise, contient 10 codons, celle de 1.59 à 1.17 12 codons, celle de 1.12 à 0.83 11 codons et enfin celle de 0.68 à 0.22 12 codons. Soit 45 codons.
        - Pour les eucaryotes la gamme des valeurs supérieures à 13.38, la valeur 13.38 comprise, contient 11 codons, celle de 12.07 à 8.95 17 codons, celle de 8.29 à 6.56 5 codons et enfin celle de 5.91 à 2.06 13 codons. Soit 46 codons, ata compris.
        + La coloration des codons:
        − J'ai coloré chez les bactéries les noms des codons d'une couleur d'une même gamme puis j'ai reporté ces couleurs sur les noms des mêmes codons des eucaryotes. En colorant les indices des eucaryotes d'une même gamme avec sa propre couleur, je peux visualiser, directement sur le tableau IV1, la différence relative entre l'indice bactérien et l'indice eucaryote du même codon. Voir la légende des tableaux pour les couleurs des gammes de valeurs. La même couleur est utilisée pour les 2 gammes de même ordre de valeurs relatives des bactéries et des eucaryotes. Comme pour l'homogénéité des doublets au paragraphe précédent, à cause de l'imbrication des forces des doublets entre eux, je considère ici qu'un doublet bactérien se comporte de la même façon que le même doublet eucaryote si 3 codons ont la même couleur pour le nom et l'indice. Cependant, l’imprécision de la frontière des bactéries s'ajoutant à celle des eucaryotes, les 4 codons peuvent être tous différents entre eux ou tous les 4 identiques (en couleur), alors que pour l'homogénéité d'un doublet commence par l'identification de 2 codons de valeurs proches ( voir 2.b, 3 doublets).
        − En ce qui concerne les permutations c/t seul le doublet .tt eucaryote contient le codon ttc permuté: le doublet .tt eucaryote est comparé au doublet .tc bactérien, le .ct eucaryote au .cc bactérien, les 2 .ac entre eux et les 2 .gc entre eux. Il faut remarquer que la permutation cgt est faite dans les 2 doublets, le bactérien et l'eucaryote.
        − La bascule cgg/cga chez les eucaryotes: je n'ai pas permuté les 2 codons , par contre j'ai mis en évidence l'indice du codon cgg dans le tableau IV1.
        + Les changements des codons faibles c/t: Tous ces codons sont homogènes et du coup les 4 doublets le sont aussi chez les eucaryotes. Chez les bactéries les 4 doublets sont homogènes et seulement 3 codons ctt act cgc ont des indices élevés de l'ordre de ceux des codons c/t faibles des eucaryotes. Sinon la différence fondamentale entre bactéries et eucaryotes est la bascule c/t de 7 nouveaux codons suivie d'une multiplication par 100 de tous les indices c et t des codons faibles des eucaryotes.
        + Les doublets forts semblables ou identiques: .cg .ga .ac .tt .aa. Le doublet .cg a ses 4 codons identiques et dans la même gamme dans les 2 domaines. Le doublet .ga a 4 codons identiques mais dans 2 gammes différentes d'indices, et il contient en plus le codon tga à comportement global particulier (exclusion des moyennes des doublets). Deux doublets .tt et .ac ont seulement 3 codons identiques, suffisamment pour les considérer comme ayant un même comportement, notamment .ac. Le doublet .aa a le codon stop taa comme codon identique et le codon gaa eucaryote a un indice à la frontière de la 1ère gamme d'indices ( 12.02 contre 13.38 de la 1ère gamme, le bleu), enfin par ses indices élevés il rend la colonne 3 très forte et homogène par ses 3 doublets chez les eucaryotes.
        + Les doublets forts qui se différencient par 3 ou 4 codons: Il n'y a que de 2 doublets à 2 codons identiques, .gg .tg. Les 5 doublets forts restant ont 3 ou 4 codons différents, .ta .ct .ag .ca .gc.
        − Le doublet .ta: Relativement les indices eucaryotes sont ont été drastiquement réduits par rapport à ceux des bactéries. Puisque les codons tta et cta bactériens passent de la gamme 2 à la gamme 4 chez les eucaryotes et gta de 1 à 4. En plus ata, inexistant chez les bactéries, est créé et dupliqué chez les eucaryotes. Le plus frappant encore c'est que les 4 indices eucaryotes sont quasiment identiques.
        − Le doublet .ag: C'est l'image inverse du doublet .ta. Les codons bactériens sont homogènes et appartiennent à la gamme 4, les codons eucaryotes sont dans les gammes 2 et 1. Et là le plus frappant ce n'est pas tant l'homogénéité cassé par le codon stop, mais la forte ressemblance avec les 2 doublets eucaryotes .ac et .aa; les codons sont dans les mêmes gammes, les codons cac caa cag sont quasiment identiques et les codons aag et gag ont des indices aussi élevés de ceux des 2 autres doublets. Le processus E parait donc adopter le comportement des doublets de la colonne 3, comportement qu'on trouve aussi chez le processus B pour les doublets .ac et .aa, mais pas .ag. C'est comme si le processus E a révélé un comportement qui était caché par le processus B.
        − Analogie avec le microscope: C'est une analogie avec la microscopie en contraste de phase et en polarisation. En contraste de phase on peut différencier les éléments par la couleur, comme avec les bactéries où existe un peu de duplication représentant la couleur. Avec les archées, sans les duplications on a alors du gris. On a du gris plus foncé avec les codons des bactéries à faible indice de multiplicité. En polarisation on se retrouve dans le domaine des eucaryotes où l'état vibratoire du codon est révélé par le processus de duplication des eucaryotes alors que cet état est le même chez les bactéries mais n'est pas révélé par leur processus. Les processus bactériens et eucaryotes sont les équivalents des filtres polarisant. On le voit clairement avec les codons ata gtg gcg et cct. Le facteur multiplicateur n'augmente pas leur duplication au-delà de celle de leurs semblables, tta cta gta pour ata, tcg ccg acg pour gcg, ttg ctg atg pour gtg bien que atg ait acquis ses duplications chez les bactéries alors que son facteur multiplicateur est le même que celui de son carré, et enfin tct act gct pour cct.
        − Parallèle entre les doublets .ta et .ag: Nous venons de voir que les 4 indices du doublet .ta sont presque identiques et que le doublet .ag est son image inverse. Avec l'analogie du microscope on s'attendrait que le processus E révèle taa comme il a révélé ata. Ce n'est pas le cas car le processus E n'a permuté aucun codon xyt avec xyc de la colonne 3. Par contre il l'a fait entre att et atc qui accompagnent le doublet traductionnel at., c'est pour cela que ata est à considérer comme un codon bactérien faible plutôt que comme un codon stop. Par ailleurs l'analogie avec le microscope polarisant est toujours séduisante puisque suivant le filtre polarisant 2 plages peuvent avoir la même couleur ou non. Le filtre du processus B donne la même couleur pour les 3 codons de .ag et est insensible au codon taa alors que le filtre du processus E donne la même couleur pour les 4 codons de .ta et est sensible au codon ata.
        − Les doublets forts à 3 codons différents, .ct .ca .gc: ces 3 doublets présentent 1 ou 2 codons très différents. Mais on n'atteint pas l'originalité des doublets .ta et .ag. Les codons tgc cct gct et tca ont une différence de gammes entre les 2 processus égale 2. L'analogie avec le microscope est moins frappante mais le codon cct partage son indice eucaryote avec 2 autres codons, tct et act, situation intermédiaire entre le doublet .ta et .ag.
        + Les doublets forts à 2 codons identiques: .tg et .gg: les indices des 4 codons du doublet .tg des eucaryotes sont plus grands que le plus grand indice des 4 codons du doublet .cg. De même pour les 2 codons tgg et agg du doublet .gg des eucaryotes. Du coté des bactéries les 6 codons de .tg et .gg, sans gtg et ggg, sont plus grands que le plus grand indice des 8 codons de .cg et .ag; en plus ggg a un indice presque double des 3 autres codons de la même ligne g.g. Comme je l'ai noté au chapitre des 3 doublets ces codons à indices élevés ont un comportement particulier dans l'étude des codons des protéines des 111 bactéries, ou codon-usage (ref.).
        − Pour la comparaison bactéries eucaryotes, le doublet .tg a 2 codons identiques. Il se comporte, pour les 3 codons ttg ctg gtg, comme le doublet .ta: ils ont le même indice chez les eucaryotes alors qu'ils sont différents chez les bactéries. Cependant le comportement est plus atténué, l'indice, 8.95 du codon gtg eucaryote est la limite inférieure de la gamme 2 alors que la limite supérieure de la gamme 3 est de 8.29, et donc la différence des gammes entre les 2 domaines n'est que d'une unité alors que pour le doublet .ta elle est de deux.
        − Le doublet .gg a aussi 2 codons identiques et son comportement est analogue au doublet .ag avec 3 codons bactériens de gamme 3, identiques. De même la situation entre .gg et .ag est atténuée qu'entre les doublets .ta et .tg.
        • Comparaison eucaryotes/bactéries après décomposition du processus E en duplication et sensibilité.
        + La sensibilité: On peut considérer le processus B des bactéries comme exempte de duplications du type de celles des eucaryotes (en dehors des duplications excessives ou de résonance), avec un facteur multiplicateur égal à l'unité. L'indice de multiplicité d'un codon bactérien est alors la sensibilité de ce codon au processus B. Le processus E peut être considéré alors de la même façon, produit d'un facteur de sensibilité au processus E et d'un facteur multiplicateur unique, propre aux eucaryotes, ou facteur de duplication. Ce facteur de duplication est la moyenne de toutes les duplications des 121 eucaryotes étudiés. Ce facteur changera alors avec le lot d'eucaryotes sélectionnés débarrassés des duplications excessives. Par contre la sensibilté des codons au processus E devrait rester la même d'un lot à un autre (sans doublons ni répétitions de génome). On peut alors comparer sensibilité bactérienne et eucaryote. En quelque sorte le facteur multiplicateur supprime la relativité qu'on a utilisée au paragraphe précédent.
        + Calcul de la sensibilité relative: J'ai divisé tous les indices (codons forts et faibles) du tableau IV1.23 par 8 pour obtenir le tableau IV1.79 puis j'ai fait la différence, en pourcentage, entre le nouvel indice eucaryote et l'indice des bactéries du tableau I1.23 pour obetenir le tableau IV1.265. Ce dernier représente la sensibilité relative des eucaryotes par rapport aux bactéries. Les nouveaux indices du tableau IV1.79 se rapprochent beaucoup, pour un grand nombre d'entre eux, à ceux des bactéries. Aussi j'ai cherché à obtenir le maximum de nouveaux indices les plus proches de ceux des bactéries. Ainsi j'ai remplacé les rapports du tableau IV1.79 par la fonction rapport du tableur et la différence du tableau IV1.265 par la fonction valeur absolue de la différence, puis dans une cellule du tableur en dehors des tableaux j'ai fait la somme des valeurs absolues des indices relatifs les plus proches de zéro. En faisant varier le diviseur du tableau IV1.79 très vite sont apparus 23 codons qui se détachent des 22 autres (les codons faibles, les 2 codons stop et ata n'entrent pas dans cette étude). Ils sont colorés en jaune dans le tableau IV1.265. La différence entre la valeur absolue de la sensibilté relative la plus élevée du 1er groupe (valeurs proches de zéro) est de 22 environ et celle la plus petite du 2èmme groupe est de 34 environ. Cette différence est très élevée ce qui m'a ammené à chercher le minimum de la somme des valeurs absolues des sensibilités relatives du 1er groupe. Le minimum de 265 est atteint pour le diviseur 7.90 du tableau IV1.79. En éliminant, dans le tableau IV1.265, la fonction ABS du tableau, je retrouve de vraies valeurs relatives avec des signes + et −.
        + Quantification de la sensibilité des codons au processus E: Alors qu'au chapitre précédent je comparais codons bactériens et eucaryotes avec des gammes de couleurs, tableau IV1.23, et avec les moyennes à 3 codons ou à 4 codons des doublets, ici la différence entre 2 codons est quantifiée ce qui permet de repérer le codon intrus dans 1 doublet (par rapport aux moyennes homogènes à 3 codons) et d'éviter les frontières entre les gammes. La méthode des gammes a permis de voir rapidement que certains doublets 23 ne changent pas de comportement alors que d'autres le font franchement, ce qui m'a suggéréré l'analogie avec le microscope à contraste de phase et le microscope polarisant. La quantification avec les sensibilités relatives va nous permettre d'élargir ces 2 groupes et d'en définir d'autres. Cependant je vais présenter colonne par colonne, car chacune a une dominante propre pour les comportements de ses 4 doublets, en admettant qu'un doublet de 3 à 4 codons faibles est un doublet homogène et que tous les doublets faibles des bactériens sont au moins 50 fois plus faibles que ceux des eucaryotes. Pour apprécier l'homogénéité des doublets j’ai construit les tableaux IV1.79p et IV1.265p sans la permutation des codons c/t. Dans ce qui suit chaque doublet est décrit par le taux variance/moyenne (e/m en %) d'après les tableaux "moyenne 3 codons"/"moyenne 4 codons", eucaryote-bactérie, suivi du codon intrus du tableau des moyennes à 3 codons des eucaryotes et des codons semblables du tableau IV1.265 des sensibilités relatives. La caractéristique de chaque colonne est déduite de tous ces tableaux plus le tableau IV1.23 aux couleurs des bactéries et des eucaryotes.
        1. Colonne 1: La colonne 1 se distingue par l'hétérogéneité des doublets bactériens et l'homogénéité des doublets eucaryotes. Un seul doublet, .tt, sur 4 est homogène chez les bactéries et hétérogène chez les eucaryotes.
          + .tg, 18-57/18-57, atg, 1 seul codon semblable ttg (-16);
          + .ta, 3-38/8-38, cta, aucun codon semblable;
          + .tc, faible-24/faible-41, atc, 1 seul codon semblable, ttc (1);
          + .tt, 25-tfaible/21-tfaible, ttt, aucun codon semblable.
        2. Colonne 2: La colonne 2 se distingue par l'homogéneité des doublets bactériens et eucaryotes. Un seul doublet, .ca, sur 4 est homogène chez les bactéries et hétérogène chez les eucaryotes.
          + .cg, 8-12/17-32, gcg, 1 seul codon différent, gcg (143);
          + .ca, 23-5/27-35, tca, 1 seul codon semblable cca (-4);
          + .cc, faible-5/faible-21, pas d'intrus, aucun codon semblable;
          + .ct, 12-tfaible/33-tfaible, gct, aucun codon semblable.
        3. Colonne 3: La colonne 3 se distingue par des indices les plus élevés que çà soit du côté bactérien ou eucaryote. Seul le doublet .at est homogène dans les 2 domaines et le doublet .ac est homogène chez les eucaryotes seuls. Pour les autres doublets bactériens et eucaryotes, l'hétérogénéité est faible, elle se dispute entre 2 gammes d'indices, même pour le doublet .ag chez les bactéries.
          + .ag, 27-28/27-28, tag, aucun codon semblable;
          + .aa, 23-21/23-21, taa, 1 seul codon différent, gaa (-37);
          + .ac, 14-18/22-28, cac, aucun codon différent;
          + .at, faible-tfaible/faible-tfaible, pas d'intrus, aucun codon semblable.
        4. Colonne 4: La colonne se distingue par le grand nombre de doublets hétérogènes, 3 pour les eucaryotes et 2 pour les bactéries. C'est aussi la colonne des exceptions: tga, bascule cgg/cga chez les eucaryotes et bascule c/t chez les bactéries. Le doublet .gt constitué de 3 codons faibles est homogène dans les 2 domaines. Seul le .gg bactérien est homogène. Cependant, à cause de la bascule cgg/cga, la moyenne sur les mêmes codons tant bactériens que eucaryotes rend ce doublet bactérien aussi hétérogène que celui des eucaryotes. Pour les 3 codons tgg agg ggg on a respectivement pour m e %: 7.50 2.12 28 pour les eucaryotes contre 0.83 0.26 31 pour les bactéries.
          + .gg, 28-15/40-26, cgg, 1 seul codon différent, cgg (-46);
          + .ga, 31-67/31-67, tga, 1 seul codon différent, cga (233);
          + .gc, 25-46/30-37, cgc, 2 codons semblables agc (20.7) et ggc (-8);
          + .gt, faible-tfaible/faible-tfaible, cgt, aucun codon semblable.
        + Quantification de la sensibilité des codons c/t forts au processus E après permutation: Dans le tableau IV1.265 j'ai comparé les codons ttc att ctt gtt eucaryotes aux codons codons .tc bactériens et de même respectivement pour .ct et .cc. J'ai déjà étudié longuement cette comparaison, sans la quantifiée en supposant, étant donné les effectifs élevés des codons et la netteté de la bascule c/t, que les codons sont comparables. Dans le cadre de cette hypothèse la quantification par sensibilité relative montre que sur 8 codons permutés 3 sont semblables, suivant les critères adoptés pour tous les codons (couleur jaune), et ce sont (respectivement codon eucaryote-codon bactérien) att-atc, ctt-ctc et tct-tcc; 3 codons permutés sont quasiment semblables (avec des valeurs absolues à la limite inférieure des critères de similitude du groupe à valeurs élevées, 34%), ce sont gtt-gtc act-acc et cgt-cgc; et 2 codons permutés à valeur absolue élevée, gct-gcc et cct-ccc. En permutant les codons ttc et ttt des eucaryotes la comparaison des doublets .tt-.tc est analogue à celle des doublets .gg-.gg avec 3 codons semblables et un codn quasi semblable. De même la comparaison .ct-.cc est analogue à celle de .tg-.tg avec 1 sembable, 2 intermédiaires et un avec une valeur absolue élevée.
        + La 2ème base du codon dans le processus E:
          J'ai ordonné, dans le chapitre précédent, la description des doublets colonne par colonne parce qu'elles présentent chacune une dominante propre pour les comportements de ses 4 doublets, en admettant qu'un doublet de 3 à 4 codons faibles est un doublet homogène et que tous les doublets faibles des bactéries sont au moins 50 fois plus faibles que ceux des eucaryotes. Je vais détailler ici ces comportements qui sont dus à la 2ème base du codon.
          Remarquons d'abord que l'homogénéité des 15 doublets adénéliques sur 16, comme analysée dans le chapitre précédent, montre que le processus E ne présente pas une seule ligne avec 3 doublets semblables, ce qui aurait défini son homogénéité (avec la règle de 3 sur 4). Deux lignes seulement, la 1 et la 2 du tableau IV1.79p, présentent chacune 2 fois 2 doublets semblables que sont les doublets c/t faibles d'une part et les doublets c/t forts d'autre part. Dans le tableau des sensibilités relatives IV2.265p cette cractéristique est généralisée à toutes les lignes et on a 2 fois 2 doublets semblables par ligne. Ceci m'a ramené à mieux analyser les colonnes, donc la 2ème base du codon.
          C'est ainsi que les 2 colonnes 1 et 2 supportent les 2 caractéristiques du processus E autre que sa duplication, que sont la bascule c/t et les sensibilités relatives négatives. Par contre les colonnes 3 et 4 ne subissent pratiquement ni bascule ni sensibilités négatives. Les sensibilités relatives positives et élevées sont réparties équitablement entre les 2 moitiés, colonne 1 et 2 d'une part et colonne 3 et 4 d'autre part. Ce lien étroit entre sensibilité et bascule se retrouve dans les codons qui ont basculé seuls sans leur doublet 23, à savoir cgt/cgc chez les procaryotes déjà, et cgg/cga chez les eucaryotes, ou bien qui n'ont pas basculé avec leur doublet comme c'est le cas pour ttt/ttc.
          Dénombrons alors ces caractéristiques en ajoutant ttt et ttc aux colonnes 3 et 4 (codons sans bascule), et le doublet traductionnel cg. aux colonnes 1 et 2 (codons avec bascule). Les colonnes 1 et 2 comptent alors un total de 34 codons alors que la 1 et 2 un total de 30.
          Les colonnes 1 et 2 comportent 15 codons non comparables aux bactéries, en gris, et qui constituent la bascule c/t des eucaryotes; elles comportent 19 codons comparables aux bactéries, en couleurs, dont les 3 codons basculés du doublet cg. traductionnel. Sur ces 19 codons, 10 ont une sensibilité négative élevée, 5 une sensibilité négative très faible et enfin 4 ont une sensibilité positive très élevée.
          Les colonnes 3 et 4 comportent 8 codons xyt, en gris, qui n'ont pas basculés et restent comparables à ceux des bactéries. Les codons xyc/t faibles sont comparables à ceux des bactéries mais avec des sensibilités très élevées par rapport à celles des codons forts si on leur applique le même diviseur que ces derniers. Le processus de duplication de ces codons faibles est apparemment différent de celui des codons forts. Comme il n'y a pas bascule pour les codons xyt des colonnes 3 et 4, on peut considérer que leurs sensibilités relatives propres à leur processus de duplication sont analogues à celles des codons forts de ces colonnes. Si on devait leur mettre une couleur pour les caractériser comme les codons forts, elle serait jaune.
          Sur les 22 codons restant des colonnes 3 et 4, 17 ont une sensibilité proche de zéro dont 10 sont positives, 4 ont une sensibilité positive très élevée et seulement 1 codon, gaa, a une sensibilité franchement négative (-37). Les codons stops taa et tag sont considérés comme neutre et rentrent dans ces décomptes. Même si on inclut les sensibilités moyennement faibles négatives, caa (-21) et tga (-20), on ne totalise que 3, loin des 10 sensibilités négatives des colonnes 1 et 2.
        • Les zéros des bactéries et des eucaryotes, Genèse des gènes de tRNAs.
          + Sans parler des duplications excessives, le processus E des eucaryotes présente un fort taux de duplication de tous les codons autres que les 16 codons faibles c/t. Tous les indices de multiplicité des codons forts, xyc/t xya xyg, du tableau IV1, sont largement supérieurs à l'unité. Mais un indice supérieur à l'unité ne veut pas dire que tous les génomes de l'échantillon étudié pour un codon donné possèdent ce codon. La non existence de tRNA dans un génome peut être compensée par une forte duplication du même codon chez un autre génome. C'est cette non existence que j'applle "zéros tRNAs", c'est le nombre de génomes, pour le décompte d'un tRNA donné, qui n'ont pas ce tRNA. La question qui se pose alors est celle du taux des "zéros tRNA" dans le processus E. J'ai appelé taux de genèse de gènes de tRNA, le taux des génomes ayant au moins un tRNA pour le codon étudié. Ce taux est inférieur ou égal à l'unité. Comme il est plus facile de compter les "zéros tRNA", dans la base de données gtRNAdb, le taux de genèse est alors l'unité moins le taux des "zéros tRNA".
          + J'ai calculé le taux de genèse d'un codon chez les bactéries et les eucaryotes en dénombrant les génomes qui n'ont pas ce codon dans la base de données gtRNAdb. La méthode de calcul est détaillée dans les tableaux de Genèse des gènes de tRNAs.
          + Taux des codons faibles c/t: Chez les eucaryotes ils sont quasiment égaux aux indices de multiplicité du tableau IV1 qui ne contient pas les duplications excessives. Ce qu veut dire qu'il y a très peu de duplication dans le processus E. Chez les bactéries le taux de ces codons sont au moins 50 fois plus faibles que chez les eucaryotes. Chez ces derniers les taux de genèse des codons c/t faibles sont du même ordre que les codons les plus faibles des bactéries à part le codon ata: codons gtg gcg gag tga cga (tableaux I1.g et IV1.g). Quand on compare au tableau IV1 du processus E, on remarque que les codons faibles c/t des eucaryotes ont un très faible taux de duplication puisque indices de multiplicité et taux de genèse sont pratiquement égaux et tous inférieurs à l'unité. Pour les codons faibles des eucaryotes, la genèse est faible et ne dépasse pas 0.3. Par rapport aux bactéries la genèse des codons faibles est multipliée par, à peu près, un facteur de 50. Il n'y a pas duplication mais multiplication des possibilités de créer ces codons.
          + Taux des codons forts: Cette multiplication des possibilités de création, on la constate chez les codons forts aussi à faible taux de genèse. Cependant le faible effectif de 121 eucaryotes ne nous permet pas de certifier la genèse totale de certains de ces codons. Sur 20 codons à genèse faible sur 46 chez les bactéries seulement 10 présentent une faiblesse notable de la genèse chez les eucaryotes (effectifs des "zéros tRNA" supérieurs à 5) et un nouveau cas apparait avec cta (9 zéros tRNA). Les 10 autres codons restants laissent penser, à cause des faibles effectifs, que la genèse n'est pas totale: 5 ont un effectif de "zéros tRNA" de 2, tta (0.95) et 4 dont la genèse est très faible chez les bactéries acg aag agg ata (taux inférieurs à 0.80); 2 ont un effectif de "zéros tRNA" de 1, gtg (0.31) cgt (0.92); et 3 codons n'ont pas de "zéros tRNA" chez les eucaryotes alors que les bactéries ont un taux inférieur à 0.62, tcg (0.62) cag (0.46) et gag (0.29).
          + Les taux de ces 20 codons, chez les eucaryotes, montrent que la genèse n'est ni homogène ni proportionnelle à celle des bactéries, avec le codon cta dont la genèse diminue même par rapport aux bactéries. Au chapitre des sensibilités les taux des duplications présentent aussi une grande hétérogénéité et c'est pour cela que j'ai attribué le qualificatif de sensibilité qui réunit duplication et genèse pour chaque codon. Ce qui est intéressant de noter c'est que la sensibilité à la genèse est très prononcée pour 9 mêmes codons, bactériens et eucaryotes. Nous retrouvons les caractéristiques d'unicité et de similitude nécessaires à la démonstration de l'hypothèse de la résonance dans l'ADN.
          + La genèse des tRNAs étendue aux 3 domaines pour l'hypothèse de la résonance: en admettant que les tRNAs xxg dans A et E se comportent de la même façon, c'est à dire qu'ils ont une genèse asymptotique inférieure à l'unité (c'est notamment le cas de acg aag agg) et que les indices de multiplicité des A sont les mêmes que leurs indices de genèse, alors il reste seulement 6 indices de genèse, sur 32, des tRNAs xxc et xxa qui varient entre les 3 domaines. Ces 6 tRNAs sont ctt/c cta ata cgt/c tta cga. Le caractère exceptionnel d'unicité, outre l'indice de genèse, s'applique à ata cgt/c et cga: ata n'est activé totalement que dans E, la bascule cgt/c apparaît dans B, se maintient dans E et disparaît dans A et la bascule cga/g n'apparaît que dans E. Les 3 autres tRNAs ctt/c cta tta ne manifestent leur unicité que par la genèse entre E et B: ctt/c apparaît dans les 2 domaines, cta dans E et tta dans B. Par ailleurs la similitude de tous les autres tRNAs et notamment cct/c et tga dont les indices de genèse sont nettement inférieurs à l'unité, renforce l'hypothèse de la résonance (dans l'ADN et non de duplication) comme je l'ai souligné précédemment entre E et B.
        • Le processus E.  IV1, I1, IV1-I1, "Processus E et résonance des 121 eucaryotes".   duplications entières du processus E.
          + C'est la sensibilité à la genèse très prononcée pour les 9 mêmes codons, bactériens et eucaryotes, qui ne me permet pas de séparer duplication et genèse pour calculer la différence quantitative entre processus E et B. D'autant plus qu'il est difficile de distinguer, dans mes décomptes, entre la vraie duplication (2 gènes identiques), et 2 tRNAs à séquences différentes ayant le même codon.
          + Le processus E, comme je l'ai défini et construit avec les courbes de tendance des codons, est représenté par le tableau IV1. De même le processus B sera représenté par le tableau I1.
          + La différence quantitative entre les 2 processus E et B:
          • Si l'on admet que la résonance dans l'ADN ne change pas fondamentalement entre procaryotes et eucaryotes, parce qu'elle se produit dans l'ADN double brin, la différence de comportement des gènes de tRNA entre les 3 domaines ne peut s'expliquer en 1er lieu qu'avec les différences fondamentales de leurs architectures: différence chimique entre la membrane des archées et celle commune aux bactéries et aux eucaryotes; différence structurelle et fonctionnelle entre la membrane nucléaire, propre aux eucaryotes, et la membrane externe commune à ces derniers et aux bactéries; différence entre un chromosome unique petit et circulaire chez la plus part des bactéries et un grand nombre ( entre 3 et 80) de chromosomes très grands et linéaires chez les eucaryotes.
          • La bascule c/t peut être expliquée par l'intervention de la membrane nucléaire lors des réparations de l'ADN qui changerait le codon xyc en xyt mais n'interviendrait pas dans la résonance du gène de tRNA lui-même. Ce qui légitimerait la permutation de ces codons et la comparaison (et la différence) entre codons faibles xyct entre eux d'une part les codons forts xyc/t entre eux d'autre part. Pour cette bascule, j'ai émis très tôt l'hypothèse des introns des gènes de tRNA qui changeraient la résonance du gène et donc la base c en t du codon. La membrane nucléaire serait alors la protectrice de ces tRNAs avec leur intron. Je reviendrai sur ces hypothèses lors de l'étude détaillée des introns des 121 eucaryotes.
          • Les taux de genèse et de duplication peuvent être expliqués par le grand nombre de chromosomes, leurs tailles et leurs géométries.
          • La signification biologique de la différence entre les 2 processus refléterait la différence de résonance des gènes de tRNA avec ou sans leur intron dans les chromosomes eucaryotes, et la résonance de ces gènes, sans introns, dans le chromosome unique et circulaire bactérien. Il faudrait, en fait, considérer pour les eucaryotes l'indice de multiplicité moyen par chromosome et non la multiplicité totale. Les résultats obtenu avec le tableau IV1-I1 concernent la multiplicité totale. Si on divise par le nombre moyen de chromosomes des 121 eucaryotes on aura alors l'équivalent du tableau IV1.265 des sensibilités relatives puisque le nombre moyen de chromosomes des 121 eucaryotes est à peu près le double du diviseur du tableau des sensibilités ( 17.0 contre 7.9). Dans le tableau IV1-I1 ce sont les différences de multiplicité entre codons qui révèlent leur comportement dans le processus E. Je commente, juste après, les différences de multiplicité entre codons du tableau IV1-I1 avec le tableau des duplications entières.
        • Les processus E et R
          + Le comportement de chaque codon: pour la bascule c/t, la genèse, la résonance, la sensibilité relative. B G R S. Les 3 comportements B G S font partie du processus E, s'y ajoute le comportement du processus R que je suppose de type essentiellement duplication ( copie multiple de la même séquence ). J'ai dressé si après la liste des groupes de codon ayant le même comportement B G R S. Sur 62 codons considérés un groupe de 13 codons (N) ne présentent qu'une sensibilité relative neutre (ref.), 25 présentent un seul type de comportement et 24 présentent au moins 2 types de comportement. La sensibilité relative est en gras quand elle est forte (supérieure à 73%). Les codons faibles c/t sont soulignés. "J'ai surchargé ce tableau avec les sensibilités relatives, les résonance de duplication et les genèses de gènes de tRNA." phrase à remanier.
          • N 13:   ttc   cca tcg acg   tac cac aac gac aaa   agc aga agg ggc
          • B 4:   att gtt   tct act
          • G 10:   ttg ccg tga    +cgc  tat aat cat gat   ttt agt
          • R 3:   tgg gga caa
          • S 8:   tta gta tca aca +cgt    tgc ata cag
          • BG 7:   ctt    atc ctc gtc   tcc acc ccc
          • BS 1:   gct
          • BGR 1:   gcc
          • BGS 1:   cct
          • GRS 2:   cga gcg
          • GR 1:   ggg
          • GS 3:   cta ctg   cgg
          • GR 2:   tgt ggt
          • RS 6:   gca gaa atg    gtg aag gag
          - Analyse des comportements du tableau IV1-I1:
          + Les duplications entières
        2.d − Distribution des gènes de tRNAs par codon
        2.e − Corrélation entre les gènes des 121 eucaryotes et et ceux des bactéries: Diagrammes Eb45 Eb40  Voir le chapitre sur les corrélations entre les 3 domaines ABE. Voir le tableau des diagrammes des corrélations entre codons des 121 eucaryotes et des bactéries
      3. Comparaison avec zebrafish
    4. Critiques
      1. La caractérisation par les effectifs et la comparaison avec les bactéries restent complexes, surtout avec le non regroupement des codons semblables et la comparaison en pourcentage (pour 100 000 tRNAs).
      2. La caractérisation des codons par les pentes seules ne suffit pas, il faut surtout le coefficient de détermination qui représente la variance autour de la pente ce qui rend cette caractérisation insignifiante.
      3. Les comparaisons entre zebrafish et les bactéries ainsi que les eucaryotes n'est pas faisable du fait le comportement physique d'un codon doit être indépendant du génome et donc doit être exprimé par une moyenne d'un effectif élevé des génomes.
    5. Hypothèses
      1. Pour améliorer la caractérisation des codons par les effectifs et la comparaison avec les bactéries j'ai utilisé l’ordre adénélique du code génétique, c a d qu'une ligne du code est représentée par la 3ème base et non la 1ère, une colonne est représentée par la 2ème base et la 1ère différencie les 4 codons d'un carré se terminant par la même 3ème base, à l'inverse du code traductionnelle. Par ailleurs Je ne compare plus des pourcentages ( effectifs pour 100 000 tRNAs) mais des indices de multiplicité qui permettent de faire des rapports qui ont un sens. Les comparaisons en ligne et colonne seront refaits avec les indices.
      2. La caractérisation des codons par les courbes se fera surtout avec les courbes de distribution des fréquences de leurs gènes. Ces courbes suivent la loi de Poisson étant les faibles effectifs des codons par génome. Distribution des codons dans le processus E, Distribution des tRNAs des 121_eucaryotes.
      3. Zebrafish sera comparée de génome à génome avec d'abord les eucaryotes à résonance puis avec quelques uns parmi les 121 sélectionnés pour l'étude du processus eucaryote: Processus Zebrafish et processus de résonance, distribution des codons sur les chromosomes (en cours).
  • Légende: retour au texte
    ttt ttc . . . nombre de gènes de tRNA des codons ttt ttc . . . relevé de la base de données gtRNAdb au 29.10.17
    moy : moyenne des codons d'un eucaryote. Si la ligne contient les caractères € ou #, les codons correspondants n'entrent pas dans la moyenne comme le fait le tableur calc. Les codons faibles xyc/t ne rentrent pas dans la moyenne.
    pour nombres dépassant 100 dans une 1ère approche du coefficient de détermination R2. Il y en a 61.
    # pour nombres améliorant le coefficient de détermination. Il y en a 13.
    − Doublons: ce sont les eucaryotes qui sont dans la base mais non utilisés pour les diagrammes car ils concernent 2 individus de la même espèce ou des variantes très proches des espèces retenues (voir texte pour plus de détail).
    − Tableau des diagrammes: Il est fait de 121 espèces et de 43 codons. Ne sont pas concernés les codons à faibles effectifs xyc ou xyt.
    − Données non modifiées: Pour repérer les codons omis, en jaune ceux supérieurs à 100 () et en orange les codons d'ajustement (#). Pour comparaison j’ai mis zebrafish sans annotations.
    − codons forts: codons à effectifs élevés. Au total 43. Ne sont pas pris en compte les 16 codons xyc/t faibles et les codons stop tga taa tag.
    + total: total des effectifs restants après suppression des effectifs élevés ou d'ajustement.
    + somme calculée: pente multipliée par la somme des moyennes des eucaryotes ayant perdu le codon omis.
    + totaux + sommes calculées: est le nombre calculé des gènes de tRNA du codon.
    + R2 et pente: coefficient de détermination et pente de la courbe de tendance du diagramme du codon en fonction de la moyenne moy. J'ai opté pour une droite passant par l'origine d'après le tableur calc. R2 a été multiplié par 1000.
    − codons faibles: les 16 codons xyc/t à effectifs faibles.
    + c/t > 3: est le nombre de codons faibles ayant plus de 3 gènes de tRNA.
    + c/t > 3, total: leur total en gènes
    + reste calculé: total des gènes des autres codons plus c/t > 3. C'est la réduction des codons faibles reportés dans la ligne "Totaux des 121 réduits" ci-dessous.
    + multiplicité x 100: division de reste calculé par 121 en %.
    + c/t = 3: est le nombre de codons faibles ayant 3 gènes de tRNA (pour illustration).
    − Totaux des 121 réduits: ils sont reportés dans les tableaux des effectifs calculés des gènes de tRNA des 121 eucaryotes "IV. nombre des 121 eucaryotes 55 830".
    − Totaux des 121 eucaryotes non réduits: ils sont reportés dans les tableaux des effectifs des gènes de tRNA des 121 eucaryotes "III. nombre des 121 eucaryotes 92 580".
    − KEGG [21]: nomenclature de l'eucaryote dans la base KEGG, bta par exemple. Surmonté d'un * le code n'est pas celui de KEGG, mais attribué pour homogénéité.
  • Tableau des calculs pour 121 eucaryotes sélectionnés.
Gènes de tRNAs: calculs pour 121 eucaryotes.
Gènes de tRNA eucaryotes, doublons.
max total KEGG eucaryote moy ttt ttc tta ttg ctt ctc cta ctg att atc ata atg gtt gtc gta gtg tct tcc tca tcg cct ccc cca ccg act acc aca acg gct gcc gca gcg tat tac taa tag cat cac caa cag aat aac aaa aag gat gac gaa gag tgt tgc tga tgg cgt cgc cga cgg agt agc aga agg ggt ggc gga ggg
1327 4180 bta Bos taurus (cow) (Baylor Btau_4.6.1 Oct 2011) 86,7 7 31 10 14 10 0 5 8 17 0 8 33 23 0 23 46 14 30 6 7 12 0 9 5 15 1 10 7 30 2 36 18 11 38 0 0 4 22 19 43 0 40 83 40 7 47 456 172 156 351 26 187 14 10 12 15 4 18 45 114 20 61 401 1 327
46 758 cre* Caenorhabditis remanei (WUGSC 15.0.1 May 2007) 16,7 0 18 6 12 24 0 7 4 25 1 14 24 28 0 4 9 16 0 10 6 7 2 41 6 18 0 10 6 27 0 15 6 0 22 0 0 1 22 23 9 1 23 20 33 0 36 23 25 0 14 0 17 25 0 11 1 0 9 13 5 0 28 46 5
38 600 hsa Homo sapiens (hg19 - NCBI Build 37.1 Feb 2009) 12,8 0 15 9 12 12 0 4 11 18 6 5 20 12 1 8 17 12 1 6 4 10 1 8 4 10 0 6 7 31 1 10 5 5 32 0 0 0 10 18 22 2 34 20 24 1 17 14 10 1 38 3 8 7 0 6 4 1 8 7 5 0 15 9 13
33 508 yli Yarrowia lipolytica WSH-Z06 11,3 0 17 1 3 21 0 2 13 26 0 1 18 24 0 2 8 21 0 2 4 21 0 3 2 22 0 3 2 29 0 4 2 0 14 0 0 0 12 3 15 0 16 4 33 0 28 6 27 0 8 0 13 1 0 25 0 0 6 4 1 0 30 11 0
34 484 yli Yarrowia lipolytica PO1f 10,8 0 18 1 3 18 0 2 12 26 0 1 18 24 0 2 8 21 0 2 4 21 0 3 2 22 0 3 3 29 0 4 2 0 14 0 0 0 12 3 15 0 15 4 34 0 24 6 22 0 8 0 13 1 0 24 0 0 6 4 1 0 18 11 0
57 432 mmu Mus musculus (mm9 July 2007) 9,4 0 7 4 4 8 0 3 10 11 1 5 18 8 1 3 11 9 1 3 3 7 0 8 3 9 0 4 5 19 0 11 10 0 10 0 0 1 10 6 10 0 14 11 19 0 16 8 13 0 57 2 8 6 0 3 5 0 8 5 5 1 14 7 7
16 315 dwi Drosophila willistoni (D. willistoni Feb. 2006) 6,8 0 7 3 7 4 1 2 9 9 2 4 15 8 1 5 5 8 1 3 3 7 0 5 4 7 1 7 4 11 0 6 2 0 8 0 0 0 8 4 6 0 10 8 10 0 16 11 12 0 12 1 7 10 0 7 1 0 6 4 5 0 12 6 0
17 305 dan Drosophila ananassae (D. ananassae Feb. 2006 Agencourt CAF1) 6,7 0 8 2 4 5 0 2 10 11 0 2 12 7 0 2 7 6 0 3 6 4 0 4 8 9 0 7 3 10 0 4 6 0 9 0 0 0 5 4 8 0 10 7 17 0 13 6 14 1 6 1 6 12 0 8 0 0 6 3 2 0 16 6 3
18 293 dpe Drosophila persimilis (D. persimilis Oct. 2005 Broad) 6,5 0 7 1 3 5 0 2 10 11 0 2 11 7 0 2 5 9 0 2 5 6 0 6 4 8 0 8 3 11 0 2 3 0 9 0 0 0 7 4 7 0 9 4 14 0 18 6 14 0 8 1 8 13 0 5 0 0 5 2 4 0 13 6 3
18 292 dpo Drosophila pseudoobscura (D. pseudoobscura Feb. 2006) 6,5 0 7 2 4 5 0 2 9 10 0 2 11 7 0 2 6 11 0 2 3 3 0 6 4 8 0 8 4 12 0 3 3 0 9 0 0 0 5 4 7 0 9 5 12 0 14 6 18 0 11 1 8 9 0 4 0 0 5 3 5 0 14 6 3
15 291 des Drosophila sechellia (D. sechellia Oct. 2005 Broad) 6,4 0 9 4 4 5 0 2 8 10 0 2 15 8 0 2 8 8 0 2 4 7 0 5 5 9 0 6 5 13 0 2 3 0 9 0 0 0 7 2 8 0 9 4 12 0 13 5 13 0 6 1 8 9 0 7 0 0 6 3 4 0 13 6 0
14 282 der Drosophila erecta (D. erecta Feb. 2006 Agencourt CAF1) 6,2 0 9 3 4 5 0 2 7 9 0 2 12 7 0 2 7 9 0 2 4 5 0 5 5 8 0 6 3 12 0 2 3 0 8 0 0 0 6 4 8 0 8 5 11 0 14 6 13 1 6 1 8 9 0 7 0 0 6 3 4 0 14 1 6
14 268 dvi Drosophila virilis (D. virilis Feb. 2006 Agencourt CAF1) 5,9 0 8 2 5 3 0 3 7 9 0 2 12 6 0 2 7 6 0 2 4 4 0 3 5 7 0 7 4 8 0 3 3 0 10 0 0 0 5 4 7 0 7 12 12 0 13 6 10 0 8 1 6 10 0 5 0 0 5 2 2 0 14 6 1
14 262 dmo Drosophila mojavensis (D. mojavensis Feb. 2006 Agencourt CAF1) 5,8 0 8 2 6 3 0 2 6 8 0 2 12 6 0 2 6 6 0 2 4 6 0 5 3 7 0 8 4 9 0 4 3 0 7 0 0 0 5 4 7 0 8 8 11 0 12 6 11 0 7 1 6 10 0 5 0 0 5 2 2 0 14 6 1
18 259 dgr Drosophila grimshawi (D. grimshawi Feb. 2006 Agencourt CAF1) 5,7 0 9 2 4 4 0 2 7 7 0 2 10 6 0 2 6 6 0 2 4 4 0 4 5 7 0 8 4 8 0 3 3 0 10 0 0 0 5</