Recherche:Corrélation entre les codons dans les gènes de protéines/Annexe/Tableaux

Une page de Wikiversité.
Aller à : navigation, rechercher
Tableaux
Image logo représentative de la faculté
Annexe 1
Recherche : Corrélation entre les codons dans les gènes de protéines
Précédent : Sommaire
Suivant : Diagrammes
Icon falscher Titel.svg
En raison de limitations techniques, la typographie souhaitable du titre, « Annexe : Tableaux
Corrélation entre les codons dans les gènes de protéines/Annexe/Tableaux
 », n'a pu être restituée correctement ci-dessus.



Paris le 8.12.16

Sommaire

Diagrammes codons-GC-DRNA[modifier | modifier le wikicode]

Compilation DRNA[modifier | modifier le wikicode]

codons DRNA[modifier | modifier le wikicode]

  • Lien tableur: codons DRNA
  • Résultats directs de la compilation des 111 bactéries. A copier dans un tableur avec une largeur de colonne de 1.3 cm.

Total codons DRNA[modifier | modifier le wikicode]

  • Lien Tableur: Total codons DRNA
  • Sommation des résultats directs du chapitre précédent. A copier dans un tableur avec une largeur de colonne de 1.3 cm.

acides aminés DRNA[modifier | modifier le wikicode]

  • Lien Tableur: acides aminés DRNA
  • Résultats directs de la compilation. A copier dans un tableur avec une largeur de colonne de 1.3 cm.

Total acides aminés DRNA[modifier | modifier le wikicode]

  • Lien Tableur: Total acides aminés DRNA
  • Sommation des résultats directs du chapitre précédent. A copier dans un tableur avec une largeur de colonne de 1.3 cm.

Contenu en GC des génomes DRNA[modifier | modifier le wikicode]

  • Lien Tableur: Contenu en GC des génomes DRNA
  • Le contenu en GC (%GC) de 80 bactéries sont tirés des tableaux numériques de l'article "répétition des bases dans l'ADN des procaryotes". Pour la cyanobactérie synd voir dans cyanobactérie de la même annexe.
  • synd
  • aae, aba, ade, age, amd, amo, apt, bae, bla, bmf, bmv, bsu, cad, cbd, cbl, cff, cgq, chp, cje, cmi, cmn, crp, cta, dba, ddr, dpt, dvl, eal, eco, eno, fnc, gau, gva, kpn, ksk, lat, liv, ljf, lla, lpl, mcac, mts, opr, pac, pae, pgd, pgi, ple, ppoy, ret, rip, roa, rpr, rru, saci, salb, say, sbn, sbz, sep, sgr, sho, sma, smk, spi, spl, sty, sus, tai, tde, tma, tme, tos, tpas, tsu, uur, vin, xcb, ype, zin.
  • J'ai soumis le programme repete.pl pour les 30 autres bactéries dont les résultats sont ci-dessous:

Contenu en GC des 111 génomes DRNA[modifier | modifier le wikicode]

Tableau des diagrammes des codons DRNA[modifier | modifier le wikicode]

  1. récupération des contenus en GC (%GC) des résultats du chapitre précédent.
  2. Création de la colonne %AT (100-%GC)
  3. Somme de tous les codons (codons stops compris) d'une bactérie donnée, colonne aas. La colonne Trp isole les tga donnant du Trp, des tga donnant des stops.
  4. Moyenne des aas par bactérie: 6 550 aas par bactérie, avec un écart type de 304.
  5. Recalcul du codon: 6550*codon/aas.
  • Le tableau est suivi de la moyenne des codons.

Maximum et 75% DRNA[modifier | modifier le wikicode]

  • Le nombre de codons est calculé d'après les équations des courbes de tendance pour caractériser chaque codon par un maximum de la courbe et, s'il n'existe pas (équation du second degré sans solution), par la valeur à 75% GC ou AT.

constantes des courbes DRNA[modifier | modifier le wikicode]

  • Lien Tableur: constantes des courbes DRNA
  • Ces constantes sont relevées à la main parce que le format de l'équation dans Libreoffice/calc est une image. Ces équations sont représentées dans les diagrammes.

abscisse du maximum DRNA[modifier | modifier le wikicode]

  • Lien Tableur: abscisse du maximum DRNA
  • C'est la solution qui annule la dérivée de l'équation de degré 3. C'est une équation du second degré qui quelque fois n'a pas de solution. Mais quand il y en a 1 ou 2 solutions, une seule est valable et doit être supérieure à 50 et inférieur à 100 %GC ou %AT. J'ai éliminé les abscisses supérieures à 90% pour tenir compte des valeurs extrêmes trouvées chez les bactéries étudiées.
  • La fonction dans calc est: "=(-2*P345-RACINE(((2*P345)^2)-12*O345*Q345))/(6*O345)" où P345 désigne la cellule de la 2ème constante, O345 la 1ère et Q345 la 3ème.

maximum DRNA[modifier | modifier le wikicode]

  • Lien Tableur: maximum DRNA
  • Il est calculé avec l'équation du diagramme: "=P387*(O345*P387^2+P345*P387+Q345)" voir abscisse ci-dessus et P387 étant la cellule de l'abscisse (%AT ou %GC)

Caractérisation des codons par les courbes et les coefficients de corrélation[modifier | modifier le wikicode]

Les queues. A partir du tableau original normé des 111 bactéries[modifier | modifier le wikicode]

  1. queue: nombre de bactéries ayant des effectifs faibles de leur codon (en rouge)
  2. moyenne queue: total des effectifs faibles divisé par le nombre de la queue
  3. moyenne codon: total du codon divisé par 111.
  4. %queue: total effectifs faibles de la queue divisé par (moyenne codon x 111) en %.
111 bactéries: Caractérisation des codons . Les queues à partir du tableau original.
aas KEGG %AT %GC tta ttg* ctt cta ctg ctc aaa aag ttt ttc tct tca agt tcg tcc agc
5710 zin 86,5 13,5 564 9 8 10 0 0 1241 22 452 9 146 99 57 1 2 3
5760 crp 83,4 16,6 532 55 38 40 2 1 935 44 575 24 164 131 84 14 3 13
5864 hcr 77,5 22,5 417 32 156 22 0 4 729 54 296 26 135 165 41 7 13 10
6157 mcac 76,3 23,7 502 40 38 51 0 0 579 43 261 16 101 151 114 1 0 12
6041 ssdc 75,8 24,2 503 40 65 16 1 3 539 66 279 13 182 113 54 13 12 12
6132 sbw 74,9 25,1 414 34 76 34 9 9 634 27 300 18 171 94 63 12 12 28
5709 uur 74,5 25,5 442 55 40 55 1 2 535 65 255 23 55 181 102 14 6 10
6361 ple 73,8 26,2 414 107 45 53 9 5 577 81 267 10 105 136 94 13 10 18
6600 smf 73,7 26,3 376 23 133 38 6 0 532 112 212 41 117 142 75 7 2 16
6345 fnc 72,9 27,1 364 74 121 51 3 3 514 119 189 43 129 137 58 5 4 15
6697 bfl 72,6 27,4 424 124 49 26 11 7 414 74 246 10 175 99 78 18 19 12
6334 cbl 71,7 28,3 337 38 114 65 3 2 462 118 198 54 127 103 87 3 17 17
6762 rip 71,5 28,5 247 112 81 65 33 32 504 127 236 90 220 109 51 36 49 15
6715 rpr 71,0 29,0 306 47 141 67 26 24 421 112 250 46 120 114 88 21 18 45
6569 pub 70,3 29,7 316 59 126 72 18 4 571 103 266 43 128 151 81 14 13 27
6265 cad 70,1 29,9 251 32 121 120 15 4 420 142 181 64 105 117 97 18 5 27
6706 cje 69,5 30,5 273 91 228 25 4 12 569 85 269 22 91 54 128 13 8 67
6431 pmh 68,9 31,1 275 99 159 78 15 25 417 110 190 46 160 137 89 20 24 34
__ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __
6490 din 43,9 56,1 3 23 69 4 387 123 115 258 108 142 22 24 44 30 141 87
5844 say 43,2 56,8 112 228 44 18 154 108 139 90 122 75 17 9 39 112 54 50
6773 bmf 42,8 57,2 2 49 120 7 262 123 51 309 52 182 20 15 8 136 88 47
6638 kpn 42,5 57,5 7 20 38 4 486 74 241 138 61 153 58 4 9 46 112 76
6820 aba 41,6 58,4 6 85 48 11 173 272 88 334 27 210 15 14 12 109 67 85
6546 dba 41,4 58,6 5 63 92 6 322 135 90 301 73 189 20 18 10 59 139 91
6472 synd 40,9 59,1 0 69 55 3 386 180 74 230 17 154 11 21 38 60 117 120
6745 pgd 40,4 59,6 1 35 46 10 380 84 129 218 84 152 18 14 8 101 85 45
6549 pac 40,0 60,0 5 93 82 20 227 154 47 250 41 171 40 18 15 108 112 39
6780 bla 39,5 60,5 1 61 31 3 248 221 34 272 8 217 5 16 12 119 114 62
6795 ret 38,7 61,3 0 29 63 5 290 196 42 319 30 198 12 7 3 156 96 44
6566 sus 38,1 61,9 3 79 34 7 334 145 59 337 34 203 7 4 12 115 60 89
6672 saci 37,7 62,3 2 85 45 4 190 329 62 295 16 195 5 5 11 127 50 118
6805 smk 37,3 62,7 1 22 74 4 221 228 33 313 20 221 9 6 4 169 91 41
6720 dvl 37,0 63,0 1 14 64 3 256 294 20 329 8 221 12 10 6 129 90 65
6859 ddr 36,6 63,4 3 14 20 3 473 89 44 252 34 187 9 16 22 49 71 159
6582 tai 36,2 63,8 7 46 82 18 347 164 9 300 23 202 11 4 9 54 209 96
7021 gau 35,7 64,3 1 86 16 5 284 239 11 291 35 201 13 16 21 142 59 49
6764 xcb 35,0 65,0 1 51 7 1 511 72 17 284 16 194 6 0 11 122 69 98
6688 rru 34,6 65,4 3 66 64 3 381 84 29 292 21 209 2 1 3 132 65 76
6845 dpt 33,8 66,2 0 21 7 8 519 69 70 216 52 159 8 5 12 84 76 146
6664 pae 33,4 66,6 0 23 4 6 501 118 29 330 1 222 1 4 3 86 98 100
6576 roa 32,6 67,4 0 27 8 0 331 237 5 289 0 204 5 1 8 150 104 60
7207 bmv 31,9 68,1 1 35 19 3 293 257 19 316 15 205 1 4 3 193 22 46
6617 tos 31,4 68,6 10 32 69 26 286 331 18 323 49 189 1 1 0 22 126 70
7209 vin 31,1 68,9 0 4 12 5 197 395 5 343 5 231 9 2 1 134 104 63
6713 age 30,6 69,4 0 11 2 0 337 298 3 448 1 225 7 0 6 92 107 94
6646 opr 30,0 70,0 0 27 21 1 342 288 18 302 10 223 1 1 1 85 39 100
6487 mts 29,7 70,3 0 10 11 2 271 326 15 285 0 232 3 3 3 173 65 76
6581 sma 29,3 70,7 0 5 11 0 374 208 1 310 1 230 3 2 1 121 142 43
6465 amd 28,7 71,3 0 11 7 1 399 190 3 252 1 215 3 3 2 157 87 41
6559 sho 28,0 72,0 0 5 11 0 385 187 0 295 4 223 0 1 0 98 152 45
6561 sgr 27,8 72,2 0 2 7 0 368 210 1 301 2 227 2 1 2 114 146 34
6452 cmi 27,3 72,7 0 5 1 1 240 387 0 248 0 215 0 0 0 117 113 108
6571 salb 26,7 73,3 0 2 4 0 354 240 0 287 1 227 1 0 1 116 144 39
6532 ksk 25,8 74,2 0 6 3 0 401 201 0 260 1 217 1 0 0 134 137 44
6733 ade 25,1 74,9 0 2 3 0 296 305 4 362 0 220 0 0 0 129 85 54
moyenne queue 1,7 3,7 3,6 3,0 3,8 3,1 1,1 - 2,1 - 2,8 1,5 1,9 5,6 4,8 -
moyenne codon 120 81 97 30 180 104 247 202 123 125 69 50 38 58 66 55
codon tta ttg ctt cta ctg ctc aaa aag ttt ttc tct tca agt tcg tcc agc
queue 35 6 5 20 12 12 8 0 12 0 19 19 16 4 4 1
%queue 0,4 0,2 0,2 1,8 0,2 0,3 0,0 - 0,2 - 0,7 0,5 0,7 0,3 0,3 -
  • Les queues au complet à copier dans un tableur avec une largeur de colonne de 1.3 cm. Voir le tableur.

Les queues. Les courbes à partir des équations de tendance[modifier | modifier le wikicode]

111 bactéries: Caractérisation des codons . Les courbes à partir des équations de tendance.
x3 0,00219 -0,00254 -0,00329 -0,00085 -0,00462 0,00016 0,0020 -0,00081 0,00057 -0,00075 -0,00091 -0,0003 -0,0005 -0,0002 -0,0013 -0,0010
x2 -0,10807 0,27112 0,37605 0,10907 0,5886 0,0552 -0,05462 0,09348 0,01185 0,11012 0,13691 0,06661 0,07383 0,0518 0,15161 0,09531
x 0,97089 -5,14699 -8,20089 -2,69606 -13,46935 -1,18671 0,91141 1,73297 -0,2492 -0,95591 -3,32039 -1,92933 -1,84844 -0,92575 -2,72647 -1,05602
aas KEGG %AT %GC tta ttg* ctt cta ctg ctc aaa aag ttt ttc tct tca agt tcg tcc agc
5710 zin 86,5 13,5 692 -60 -24 33 -86 -6 989 39 435 5 148 163 88 -4 -12 1
5760 crp 83,4 16,6 601 -17 23 41 -83 -4 881 51 393 11 147 152 87 -2 -9 4
5864 hcr 77,5 22,5 445 47 92 51 -58 3 691 77 317 26 141 129 81 3 1 14
6157 mcac 76,3 23,7 419 57 102 52 -50 5 659 83 304 29 140 125 80 4 3 16
6041 ssdc 75,8 24,2 406 62 106 52 -46 6 643 85 297 31 139 123 79 5 4 17
6132 sbw 74,9 25,1 387 68 113 53 -41 7 620 89 288 33 137 120 78 6 6 18
5709 uur 74,5 25,5 378 71 116 53 -37 8 608 92 283 35 136 118 78 7 8 19
6361 ple 73,8 26,2 364 76 120 53 -32 10 590 95 276 37 135 116 77 8 9 21
6600 smf 73,7 26,3 361 77 121 53 -31 10 587 96 274 37 135 115 77 8 10 21
6345 fnc 72,9 27,1 344 82 126 54 -25 12 566 100 265 40 133 113 75 9 12 23
6697 bfl 72,6 27,4 339 83 128 54 -22 12 559 101 263 41 132 112 75 9 12 23
6334 cbl 71,7 28,3 321 89 133 54 -14 14 536 106 253 44 130 108 74 11 15 25
6762 rip 71,5 28,5 318 89 133 54 -13 15 532 106 251 45 130 108 74 11 15 25
6715 rpr 71,0 29,0 308 92 136 54 -8 16 520 109 246 47 129 106 73 12 17 26
6569 pub 70,3 29,7 295 96 139 54 -2 18 503 113 239 49 127 103 72 13 19 28
6265 cad 70,1 29,9 291 97 140 54 0 18 497 114 237 50 126 102 71 13 19 28
6706 cje 69,5 30,5 280 99 142 54 6 20 483 117 231 52 125 100 70 14 21 30
6431 pmh 68,9 31,1 269 102 144 54 12 21 470 120 225 54 123 98 69 15 23 31
__ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __
6490 din 43,9 56,1 20 82 86 20 281 135 107 248 60 161 41 22 21 76 95 73
5844 say 43,2 56,8 17 79 82 19 287 140 102 251 57 163 39 20 20 78 96 73
6773 bmf 42,8 57,2 15 77 80 18 290 142 99 253 56 165 37 19 19 79 97 74
6638 kpn 42,5 57,5 14 76 78 17 293 145 97 255 55 166 36 18 19 80 97 74
6820 aba 41,6 58,4 11 72 73 15 300 151 90 259 51 170 33 16 17 83 99 74
6546 dba 41,4 58,6 10 71 71 15 303 153 89 260 50 171 32 16 17 84 99 74
6472 synd 40,9 59,1 9 69 69 14 306 156 86 262 49 173 31 15 16 85 100 74
6745 pgd 40,4 59,6 7 67 65 13 310 159 82 264 47 176 29 14 15 87 101 74
6549 pac 40,0 60,0 6 65 63 12 313 162 80 266 45 177 28 13 14 88 101 75
6780 bla 39,5 60,5 5 63 60 11 316 166 77 268 44 179 26 12 13 89 102 75
6795 ret 38,7 61,3 3 60 55 10 322 171 72 271 41 182 24 10 12 92 103 75
6566 sus 38,1 61,9 1 57 51 9 326 176 68 273 39 185 22 9 11 94 104 75
6672 saci 37,7 62,3 0 55 49 8 328 179 66 275 38 186 21 8 10 95 104 74
6805 smk 37,3 62,7 0 54 47 7 330 182 64 276 37 188 20 7 9 96 105 74
6720 dvl 37,0 63,0 -1 52 45 6 332 184 62 278 36 189 18 7 9 97 105 74
6859 ddr 36,6 63,4 -2 50 42 6 334 187 60 279 35 191 17 6 8 99 105 74
6582 tai 36,2 63,8 -3 49 40 5 337 190 58 281 34 192 16 5 8 100 106 74
7021 gau 35,7 64,3 -3 46 37 4 339 194 56 282 32 194 15 4 7 101 106 74
6764 xcb 35,0 65,0 -4 43 33 3 342 200 53 285 30 197 13 3 6 104 106 73
6688 rru 34,6 65,4 -5 41 30 2 344 204 50 287 29 199 11 2 5 105 107 73
6845 dpt 33,8 66,2 -6 38 26 1 347 209 47 289 27 202 9 1 4 108 107 72
6664 pae 33,4 66,6 -6 36 23 0 349 213 46 291 26 203 8 0 3 109 107 72
6576 roa 32,6 67,4 -7 32 18 -1 351 220 42 293 24 206 6 -1 2 112 107 71
7207 bmv 31,9 68,1 -8 29 14 -3 353 226 40 296 23 209 4 -2 1 114 107 70
6617 tos 31,4 68,6 -8 27 12 -3 354 230 38 297 22 210 3 -3 0 116 107 69
7209 vin 31,1 68,9 -8 26 9 -4 355 233 37 298 21 212 2 -3 0 117 107 69
6713 age 30,6 69,4 -9 23 7 -5 356 237 35 300 20 214 0 -4 -1 119 106 68
6646 opr 30,0 70,0 -9 21 3 -6 357 243 33 302 19 216 -1 -5 -2 121 106 67
6487 mts 29,7 70,3 -9 20 2 -6 357 245 32 302 18 216 -2 -5 -2 121 106 67
6581 sma 29,3 70,7 -9 18 0 -7 357 249 31 304 17 218 -3 -6 -3 123 106 66
6465 amd 28,7 71,3 -9 16 -3 -8 357 254 29 305 16 220 -4 -7 -3 125 105 65
6559 sho 28,0 72,0 -9 13 -7 -9 357 261 27 307 15 222 -6 -8 -4 127 104 63
6561 sgr 27,8 72,2 -9 12 -8 -9 357 263 27 308 14 223 -6 -8 -4 128 104 63
6452 cmi 27,3 72,7 -9 10 -10 -10 356 267 26 309 14 224 -7 -8 -5 130 104 62
6571 salb 26,7 73,3 -9 7 -14 -10 355 273 24 310 13 226 -8 -9 -6 132 103 60
6532 ksk 25,8 74,2 -9 4 -18 -12 354 281 22 312 11 229 -10 -10 -7 135 101 58
6733 ade 25,1 74,9 -9 1 -21 -12 352 288 21 314 10 231 -11 -11 -7 137 100 56

Les écarts. Moyenne des écarts, en %, par rapport à la courbe théorique. Les queues. Les moyennes des codons.[modifier | modifier le wikicode]

111 bactéries: Caractérisation des codons . Moyenne des écarts, moyenne des codons, queues,
aas KEGG %AT %GC tta ttg ctt cta ctg ctc aaa aag ttt ttc tct tca agt tcg tcc agc
5710 zin 86,5 13,5 18 115 133 69 100 100 25 44 4 71 2 40 35 132 119 322
5760 crp 83,4 16,6 11 414 66 2 103 130 6 12 46 118 11 14 3 774 136 188
5864 hcr 77,5 22,5 6 32 70 56 100 44 6 31 7 0 4 28 49 112 1920 27
6157 mcac 76,3 23,7 20 29 62 1 100 100 12 48 14 45 28 21 42 76 100 26
6041 ssdc 75,8 24,2 24 35 39 69 102 45 16 23 6 58 31 8 32 152 166 29
6132 sbw 74,9 25,1 7 50 33 35 121 14 2 70 4 46 25 22 20 89 82 50
5709 uur 74,5 25,5 17 23 65 4 103 72 12 29 10 34 60 53 31 103 24 46
6361 ple 73,8 26,2 14 42 62 2 129 47 2 14 3 72 22 17 22 74 12 15
6600 smf 73,7 26,3 4 70 10 29 119 100 9 17 22 9 13 23 2 12 79 24
6345 fnc 72,9 27,1 6 9 4 6 113 73 9 19 29 8 3 22 23 43 65 31
6697 bfl 72,6 27,4 25 49 62 51 148 44 26 26 6 76 32 11 4 87 51 49
6334 cbl 71,7 28,3 5 57 14 20 122 86 14 12 22 22 2 4 18 71 12 34
6762 rip 71,5 28,5 22 26 39 20 355 118 5 19 6 101 69 2 30 224 223 39
6715 rpr 71,0 29,0 1 49 4 24 417 53 19 3 1 2 7 8 21 81 5 70
6569 pub 70,3 29,7 7 38 10 32 971 77 14 9 11 13 0 46 13 8 31 3
6265 cad 70,1 29,9 14 66 13 122 5112 77 16 25 24 28 17 14 36 33 73 4
6706 cje 69,5 30,5 2 9 60 53 36 41 18 27 16 57 27 46 82 12 63 128
6431 pmh 68,9 31,1 2 3 10 45 29 19 11 8 15 16 30 40 28 32 7 9
__ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __
6490 din 43,9 56,1 85 72 20 80 38 9 7 4 80 11 46 12 108 60 49 19
5844 say 43,2 56,8 561 188 47 4 46 23 36 64 113 54 57 55 95 44 44 31
6773 bmf 42,8 57,2 87 36 50 62 10 14 48 22 7 10 46 24 60 73 9 36
6638 kpn 42,5 57,5 52 74 51 77 66 49 149 46 12 8 60 79 53 42 16 3
6820 aba 41,6 58,4 48 18 34 32 42 80 2 29 48 24 54 12 32 31 32 15
6546 dba 41,4 58,6 51 11 29 60 7 11 2 16 45 10 38 14 40 29 40 23
6472 synd 40,9 59,1 100 1 20 78 26 16 14 12 65 11 64 44 144 30 17 62
6745 pgd 40,4 59,6 86 48 30 25 22 48 57 18 79 13 37 0 47 17 15 40
6549 pac 40,0 60,0 17 42 30 63 27 5 41 6 10 3 43 41 6 23 10 48
6780 bla 39,5 60,5 80 4 49 74 22 34 56 2 82 21 82 40 12 33 12 17
6795 ret 38,7 61,3 100 52 13 51 10 14 41 18 28 8 52 33 76 70 6 41
6566 sus 38,1 61,9 143 38 34 19 3 18 14 23 14 10 68 55 11 22 42 19
6672 saci 37,7 62,3 364 54 8 50 42 84 7 8 59 5 76 39 7 33 52 58
6805 smk 37,3 62,7 327 59 58 46 33 25 49 13 45 18 56 21 59 76 13 44
6720 dvl 37,0 63,0 187 74 44 55 23 60 67 19 78 17 37 47 34 32 15 12
6859 ddr 36,6 63,4 256 72 53 50 41 53 27 10 1 2 50 176 167 51 33 114
6582 tai 36,2 63,8 371 6 105 257 3 14 85 7 32 5 32 22 19 46 98 29
7021 gau 35,7 64,3 128 85 57 13 16 23 80 3 10 3 11 275 203 40 45 34
6764 xcb 35,0 65,0 122 19 79 66 49 64 67 0 46 2 54 100 88 18 35 34
6688 rru 34,6 65,4 157 60 113 47 11 59 42 2 29 5 82 54 40 26 39 5
6845 dpt 33,8 66,2 100 44 74 959 49 67 48 25 90 21 16 426 229 22 29 103
6664 pae 33,4 66,6 100 37 83 18171 44 45 38 14 96 9 88 1451 7 22 8 40
6576 roa 32,6 67,4 100 17 57 100 6 8 88 2 100 1 14 193 307 35 3 16
7207 bmv 31,9 68,1 111 19 37 201 17 14 52 7 35 2 76 260 226 69 80 34
6617 tos 31,4 68,6 220 16 494 867 19 44 53 9 124 10 63 134 100 81 18 1
7209 vin 31,1 68,9 100 86 25 214 44 70 88 15 78 9 440 153 437 15 3 9
6713 age 30,6 69,4 100 54 71 100 5 25 92 49 95 6 1619 100 708 23 1 37
6646 opr 30,0 70,0 100 27 499 117 4 19 47 0 47 3 196 120 157 30 63 48
6487 mts 29,7 70,3 100 49 437 133 24 33 53 6 100 7 285 157 247 42 39 13
6581 sma 29,3 70,7 100 72 3805 100 5 16 97 2 94 6 211 134 138 1 35 35
6465 amd 28,7 71,3 100 28 311 113 12 25 90 17 94 2 176 146 161 26 17 38
6559 sho 28,0 72,0 100 60 252 100 8 28 100 4 73 0 100 113 100 23 45 29
6561 sgr 27,8 72,2 100 83 185 100 3 20 96 2 86 2 133 113 145 11 40 46
6452 cmi 27,3 72,7 100 49 110 111 33 45 100 20 100 4 100 100 100 10 9 73
6571 salb 26,7 73,3 100 73 129 100 0 12 100 7 92 0 112 100 118 12 40 36
6532 ksk 25,8 74,2 100 48 117 100 13 29 100 17 91 5 110 100 100 0 36 24
6733 ade 25,1 74,9 100 36 114 100 16 6 81 15 100 5 100 100 100 6 15 3
Total sans queue 3601 4547 4752 4168 3618 4358 3137 2959 2870 2430 3384 3477 4121 4601 3941 4159
bactéries sans queue 76 106 101 91 95 99 103 111 99 111 92 92 95 107 107 111
écart (moyenne) 47 43 47 46 38 44 30 27 29 22 37 38 43 43 37 37
queue 35 5 10 20 16 12 8 0 12 0 19 19 16 4 4 0
Moyenne du codon 120 81 97 30 180 104 247 202 123 125 69 50 38 58 66 55
codon tta ttg ctt cta ctg ctc aaa aag ttt ttc tct tca agt tcg tcc agc

Les coefficients de corrélation[modifier | modifier le wikicode]

  • Lien Tableur: Les coefficients de corrélation
  • Les valeurs présentées ici sont les coefficients de corrélation X 100. La corrélation entre 2 codons est celle de 2 colonnes du tableau des diagrammes normalisé. Pour obtenir les valeurs absolues il suffit de copier ce tableau (largeur de colonne 1.3 cm) et de remplacer le moins (-) par rien. Pour extraire le maximum d'une colonne il suffit de remplacer 100 par rien (format sans décimales et option de recherche 'cellule entière').
  • Légende:
  1. moyenne : moyenne des corrélations en valeurs absolues d'un codon.
  2. >74 : nombre de corrélations en valeurs absolues d'un codon supérieures à 0.74.
  3. >79 : nombre de corrélations en valeurs absolues d'un codon supérieures à 0.79.
  4. max : corrélation maximum parmi les valeurs absolues des corrélations d'un codon.

Tableau synthétique des diagrammes[modifier | modifier le wikicode]

Tableau des abscisses et maxima des courbes de tendance.[modifier | modifier le wikicode]
- (*): ttg et agg, sont reportés en %AT et tga en %GC.
- (75) abscisse sans maximum, valeur de max à 75.
- (75) abscisse supérieure à 75 pour le maximum, valeur de max à 75.
Tableau des abscisses et maxima des courbes de tendance
abscis max abscis max abscis max abscis max
ttt 75 288 tct 75 137 tat 75 261 tgt 75 51
ttc 75 231 tcc 67 107 tac 75 172 tgc 64 48
tta 75 389 tca 75 120 taa 75 5 tga* 75 3
ttg* 60 119 tcg 75 138 tag 75 1 tgg 75 89
ctt 63 153 cct 68 104 cat 73 91 cgt 56 134
ctc 75 289 ccc 75 140 cac 75 131 cgc 75 359
cta 71 54 cca 74 106 caa 75 174 cga 61 28
ctg 71 357 ccg 75 213 cag 68 213 cgg 75 131
att 75 369 act 75 137 aat 75 399 agt 75 78
atc 73 296 acc 75 238 aac 66 171 agc 61 75
ata 75 259 aca 75 129 aaa 75 622 aga 75 150
atg 51 168 acg 69 110 aag 75 314 agg* 59 36
gtt 68 211 gct 66 170 gat 70 329 ggt 63 183
gtc 75 328 gcc 75 405 gac 75 447 ggc 75 419
gta 70 143 gca 67 141 gaa 67 420 gga 75 157
gtg 70 236 gcg 75 287 gag 75 513 ggg 64 70
Caractérisation par les diagrammes et les coefficients de corrélation[modifier | modifier le wikicode]
  1. Le paramètre R2 est le coefficient de détermination des courbes de tendance. Pour comparaison avec le paramètre écart.
  2. Le paramètre queue a été déterminé à partir des courbes calculées à partir des coefficients du polynôme de degré 3 du diagramme de chaque codon. Voir le tableau de ces calculs. Il est exprimé ici en nombre de bactéries dont les effectifs des codons sont nulles ou très faibles au début des abscisses, voir le tableau de la 1ère détermination de ces queues avec des effectifs qui ne dépassent pas 3% du total. Sur 32 queues de longueur supérieure à 4, 5 seulement ont des effectifs qui dépassent 1% du total.
  3. Le paramètre écart est l'équivalent du R2 mais calculé pour les effectifs sans la queue du codon. C'est la moyenne des différences, en valeur absolue et en % par rapport à la valeur théorique, entre cette valeur théorique et l'effectif compté du codon. Quand une différence est très élevée à cause d'un effectif théorique très faible, elle est ignorée et la queue rallongée. Voir le tableau de ces calculs.
  4. Le paramètre abscis est l'abscisse du maximum de la courbe de tendance. Il est exprimé en %GC ou %AT. Voir le tableau de ces calculs. Pour les courbes sans maximum l'abscisse 75% (AT ou GC) est utilisée pour comparaison. Quand l'abscisse du maximum dépasse 75% elle est seulement indiquée sous la forme 75/xx où xx est l'abscisse en question.
  5. Le paramètre moyen, pour moyenne, est la moyenne du codon sur les 111 bactéries. C'est la somme des effectifs d'un codon divisé par 111.
  6. La colonne %: c'est le pourcentage d'un codon dans la constitution de son acide aminé.
  7. Le paramètre max est l'ordonnée de l'abscisse abscis. C'est le maximum de la courbe ou la valeur pour l'abscisse 75% quand ce maximum n'existe pas ou si son abscisse est supérieure à 75%.
  8. La colonne %moy c'est le rapport max/moyen dans le but de normaliser les courbes.
  9. La colonne cor>79 correspond au nombre de corrélations supérieures à 0.79 pour un codon donné avec les autres codons (l'identité exclue).
  10. La colonne cor tot correspond à la moyenne des corrélations d'un codon avec les autres codons. Cette moyenne est reportée en fin du tableau des corrélations.
111 bactéries. Caractérisation des codons par leurs diagrammes et leurs coefficients de corrélation.
codon R2 écart queue Moyen. % abscis max %moy. Cor>79 cor tot
act 891 38 14 68 21 75/82 137 200 10 64,1
acc 932 30 8 121 37 75 238 196 17 66,0
aca 884 38 18 65 20 75/78 129 198 6 63,0
acg 832 38 4 71 22 69 110 155 0 48,4
325
gct 911 30 9 108 22 66 170 156 4 56,8
gcc 931 28 9 164 33 75 405 247 17 66,9
gca 929 30 6 91 19 67 141 155 6 59,2
gcg 882 35 5 126 26 75 287 228 3 59,5
490
gtt 944 28 8 132 28 68 211 160 11 62,7
gtc 916 32 4 118 25 75 328 278 7 62,9
gta 888 45 13 84 18 70 143 171 0 58,4
gtg 907 39 5 137 29 70 236 172 0 60,1
471
ggt 900 30 0 142 31 63 183 129 0 39,6
ggc 956 42 0 169 37 75 419 248 28 68,6
gga 847 42 9 88 19 75/78 157 178 2 56,0
ggg 710 42 0 54 12 64 70 131 0 26,8
453
tta 925 47 35 120 20 75 389 324 13 61,2
ttg* 765 43 5 81 13 60 119 147 0 26,6
ctt 805 47 10 97 16 63 153 158 0 39,2
ctc 839 44 12 104 17 75 289 278 4 60,0
cta 756 46 20 30 5 71 54 183 0 51,5
ctg 878 38 16 180 30 71 357 198 6 61,9
611
agt 876 43 16 38 11 75/86 78 205 7 62,3
agc 857 37 0 55 16 61 75 136 0 42,6
tct 876 37 19 69 20 75 137 200 7 62,5
tcc 868 37 4 66 20 67 107 162 0 54,8
tca 893 38 19 50 15 75 120 240 12 63,5
tcg 853 43 4 58 17 75 138 236 3 58,2
336
aga 715 64 31 60 16 75 150 251 1 53,2
agg* 308 92 10 24 6 59 36 148 0 13,5
cgt 736 51 0 103 27 56 134 131 0 18,2
cgc 938 28 19 132 34 75 359 272 17 66,6
cga 571 66 0 20 5 61 28 136 0 22,4
cgg 699 56 20 44 12 75 131 297 0 48,5
383
111 bactéries. Caractérisation des codons par leurs diagrammes et leurs coefficients de corrélation.
codon R2 écart queue Moyen. % abscis max %moy. Cor>79 cor tot
atg 985 10 0 154 51 168 109 0 19,5
tgg 970 10 7* 71 75 89 125 0 43,2
tat 967 22 11 116 52 75 261 226 20 66,2
tac 927 25 0 107 48 75/83 172 161 8 60,1
222
cat 914 30 10 59 46 73 91 155 6 60,0
cac 962 20 0 70 54 75 131 189 19 66,2
128
caa 880 36 14 89 40 75/80 174 196 12 63,3
cag 964 26 0 132 60 68 213 161 21 66,3
220
aat 966 35 15 133 51 75 399 300 10 58,9
aac 951 21 0 128 49 66 171 133 8 57,6
261
aaa 957 30 8 247 55 75 622 252 11 62,7
aag 918 27 0 202 45 75/85 314 155 1 56,8
450
gat 965 23 0 217 52 70 329 152 21 65,8
gac 970 20 0 202 48 75 447 222 27 69,4
419
gaa 951 27 0 296 57 67 420 142 4 58,2
gag 924 30 0 226 43 75 513 227 6 61,7
521
ttt 947 29 12 123 50 75 288 235 15 63,7
ttc 963 22 0 125 50 75 231 185 25 67,8
248
tgt 850 37 19 27 46 75 51 193 5 57,8
tgc 874 37 5 31 54 64 48 154 0 53,3
58
att 913 30 9 168 39 75 369 219 13 63,2
atc 938 26 2 181 42 73 296 163 11 63,8
ata 691 80 31 84 19 75 259 310 0 44,3
433
tga* 727 104 2 75 3 180 1 44,8
taa 835 42 3 75/77 5 151 1 42,0
tag 488 129 1 75 1 95 0 9,3
cct 941 32 8 65 23 68 104 160 11 63,0
ccc 735 62 9 61 21 75 140 228 1 53,9
cca 851 39 19 58 20 74 106 182 3 60,2
ccg 885 40 8 101 35 75/82 213 210 7 61,3
286
Diagramme corcodon[modifier | modifier le wikicode]

Tableaux des parallèles. Diagramme / coefficient de corrélation[modifier | modifier le wikicode]

  • Voir l'article pour la définition des paramètres pour l'établissement des matrices du paramètre diag. Ces paramètres sont donnés avant la matrice pour être utilisés dans un tableur.
  1. écart: C'est la moyenne des différences, en valeur absolue et en % par rapport à la valeur théorique, entre cette valeur théorique et l'effectif compté du codon. Voir le tableau de ces calculs.
  2. q3: C'est la cotation du paramètre queue, nombre de bactéries, en continu, ayant des effectifs faibles ou nuls. Le tableau des cotations pour les paramètres q3 et a3 donne la correspondance entre le %AT ou le %GC et le rang de la dernière bactérie de la queue avant le décollage de la courbe. Voir le tableau de ces calculs.
  3. a3: Cotation du paramètre abscis, abscisse du maximum de la courbe de tendance. Il est exprimé en %GC ou %AT. Voir le tableau de ces calculs. Le tableau des cotations pour les paramètres q3 et a3 donne la correspondance entre a3 et abscis.
  4. moyen.: pour moyenne, est la moyenne des effectifs du codon sur les 111 bactéries. En tant que moyenne ce paramètre n'a pas de sens biologique, car que veut dire l'absence d'un codon pour une bactérie donnée? Par contre la somme des effectifs correspond en mathématique à l'intégrale d'une courbe continue.C'est une caractéristique mathématique du diagramme. Voir calculs.
cor>79: nombre de coefficients du codon supérieurs à 79; pour illustration. Voir le tableau des coefficients.
cor tot: corrélation moyenne, moyenne des valeurs absolues des coefficients (multipliés par 100) du codon; pour illustration. Voir calculs.
Matrice de calcul du paramètre diag %AT (diagramme)[modifier | modifier le wikicode]
diag = 200*(abs((e1-e2)/(e1+e2))+abs((q31-q32)/(q31+q32))+abs((a31-a32)/(a31+a32))+abs((moyen1-moyen2)/(moyen1+moyen2))).
La matrice de calcul de diag est une matrice symétrique dont la diagonale est nulle.
Matrice de calcul du paramètre diag %GC (diagramme)[modifier | modifier le wikicode]
diag = 200*(abs((e1-e2)/(e1+e2))+abs((q31-q32)/(q31+q32))+abs((a31-a32)/(a31+a32))+abs((moyen1-moyen2)/(moyen1+moyen2))).
La matrice de calcul de diag est une matrice symétrique dont la diagonale est nulle.
Paramètres q3 a3[modifier | modifier le wikicode]
  • Lien Tableur: Paramètres q3 a3
  • Légende: voir caractérisation des codons et tableaux des parallèles.
  • Notes pour les diagrammes %AT: */86 abscisse optimale, 86 abscisse maximale, ttg* et agg* reportés en %AT au lieu de en %GC.
  • Notes pour les diagrammes %GC: */85 abscisse optimale non considérée pour les calculs, 75 abscisse maximale, tga* reporté en %GC au lieu de en %AT.
  • Tableaux non formatés du 13.3.17
111 bactéries: Caractérisation des codons . Diagrammes %AT. Cotation de queue, écart et abscisse.
codon queue rang q3 écart abscis a3 Moyen. Cor>79 Cor tot
aaa 29,3 8 11 30 86 5 247 11 62,7
aat 32,6 15 17 35 86 5 133 10 58,9
aca 34,6 18 20 38 78 11 65 6 63,0
act 31,9 14 17 38 82 8 68 10 64,1
aga 40,9 31 35 64 86 5 60 1 53,2
agg* 30,0 10 14 92 59 32 24 0 13,5
agt 33,4 16 20 43 */86 5 38 7 62,3
ata 40,9 31 35 80 86 5 84 0 44,3
att 29,7 9 11 30 86 5 168 13 63,2
caa 31,9 14 17 36 80 11 89 12 63,3
cat 30,0 10 14 30 73 17 59 6 60,0
cca 35,0 19 23 39 74 17 58 3 60,2
cct 29,3 8 11 32 68 23 65 11 63,0
cga 25,1 0 5 66 61 29 20 0 22,4
cgt 25,1 0 5 51 56 35 103 0 18,2
cta 35,7 20 23 46 71 20 30 0 51,5
ctt 30,0 10 14 47 63 26 97 0 39,2
gaa 25,1 0 5 27 67 23 296 4 58,2
gat 25,1 0 5 23 70 20 217 21 65,8
gca 28,0 6 8 30 67 23 91 6 59,2
gct 29,7 9 11 30 66 23 108 4 56,8
gga 29,7 9 11 42 78 11 88 2 56,0
ggt 25,1 0 5 30 63 26 142 0 39,6
gta 31,4 13 17 45 70 20 84 0 58,4
gtt 29,3 8 11 28 68 23 132 11 62,7
taa 25,1 0 5 42 77 14 3 1 42,0
tat 30,6 11 14 22 86 5 116 20 66,2
tca 35,0 19 23 38 86 5 50 12 63,5
tct 35,0 19 23 37 86 5 69 7 62,5
tgt 35,0 19 23 37 86 5 27 5 57,8
tta 42,8 35 38 47 86 5 120 13 61,2
ttg* 27,8 5 8 43 60 29 81 0 26,6
ttt 31,1 12 14 29 86 5 123 15 63,7
111 bactéries: Caractérisation des codons . Diagrammes %GC. Cotation de queue, écart et abscisse.
codon queue rang q3 écart abscis a3 Moyen. Cor>79 Cor tot
aac 13,5 0 5 21 66 14 128 8 57,6
aag 13,5 0 5 27 */85 5 202 1 56,8
acc 26,2 8 11 30 75 5 121 17 66,0
acg 23,7 4 8 38 69 11 71 0 48,4
agc 13,5 0 5 37 61 17 55 0 42,6
atc 16,6 2 5 26 73 5 181 11 63,8
atg 13,5 0 5 10 51 29 154 0 19,5
cac 13,5 0 5 20 75 5 70 19 66,2
cag 13,5 0 5 26 68 11 132 21 66,3
ccc 26,3 9 11 62 75 5 61 1 53,9
ccg 26,2 8 11 40 */82 5 101 7 61,3
cgc 31,4 19 23 28 75 5 132 17 66,6
cgg 32,1 20 23 56 75 5 44 0 48,5
ctc 28,3 12 14 44 75 5 104 4 60,0
ctg 29,9 16 20 38 71 8 180 6 61,9
gac 13,5 0 5 20 75 5 202 27 69,4
gag 13,5 0 5 30 75 5 226 6 61,7
gcc 26,3 9 11 28 75 5 164 17 66,9
gcg 24,2 5 8 35 75 5 126 3 59,5
ggc 13,5 0 5 42 75 5 169 28 68,6
ggg 13,5 0 5 42 64 14 54 0 26,8
gtc 23,7 4 8 32 75 5 118 7 62,9
gtg 24,2 5 8 39 70 8 137 0 60,1
tac 13,5 0 5 25 */83 5 107 8 60,1
tag 13,5 0 5 129 75 5 1 0 9,3
tcc 23,7 4 8 37 67 11 66 0 54,8
tcg 23,7 4 8 43 75 5 58 3 58,2
tga* 13,5 0 5 104 75 5 2 1 44,8
tgc 24,2 5 8 37 64 14 31 0 53,3
tgg 13,5 0 5 10 75 5 71 0 43,2
ttc 13,5 0 5 22 75 5 125 25 67,8
Tableaux des parallèles %AT[modifier | modifier le wikicode]
  • Lien Tableur: Tableaux des parallèles %AT
  • Ces 30 parallèles sont faits pour les couples dont le paramètre diag est inférieur à 100. Le paramètre cor est tiré du tableau des corrélations et les autres paramètres sont ceux du tableau synthétique.
  • Légende: voir caractérisation des codons et tableaux des parallèles.
  • diag/cor la 1ère ligne indique la valeur de diag la 2ème, la corrélation entre les 2 codons du parallèle.
  • Nota: ici l’abscisse du maximum peut aller jusqu'à 86% AT car les bactéries peuvent atteindre ce taux. Quand la courbe de tendance n'a pas de maximum c'est ce taux qui est indiqué. Si le maximum a exactement 86% alors c'est indiqué sous la forme */86.
  • Les 2 tableaux non formatés du 15.3.17
111 bactéries: Caractérisation des codons . Parallèle diagramme %AT / coefficient de corrélation. 2/2.
codon écart queue Moyen. abscis Cor>79 cor tot diag/cor
tca 38 19 50 86 12 63,5 64
tgt 37 19 27 86 5 57,8 62
gta 45 13 84 70 0 58,4 64
ctt 47 10 97 63 0 39,2 49
tgt 37 19 27 86 5 57,8 66
agt 43 16 38 86 7 62,3 72
cct 32 8 65 68 11 63,0 70
cat 30 10 59 73 6 60,0 74
ttg* 43 5 81 60 0 26,6 71
gca 30 6 91 67 6 59,2 36
gca 30 6 91 67 6 59,2 71
cct 32 8 65 68 11 63,0 79
cca 39 19 58 74 3 60,2 71
aca 38 18 65 78 6 63,0 75
gtt 28 8 132 68 11 62,7 76
gca 30 6 91 67 6 59,2 83
cca 39 19 58 74 3 60,2 78
cat 30 10 59 73 6 60,0 62
tat 22 11 116 86 20 66,2 78
aat 35 15 133 86 10 58,9 92
tct 37 19 69 86 7 62,5 79
act 38 14 68 82 10 64,1 79
att 30 9 168 86 13 63,2 79
aat 35 15 133 86 10 58,9 85
gtt 28 8 132 68 11 62,7 82
cct 32 8 65 68 11 63,0 81
gta 45 13 84 70 0 58,4 87
caa 36 14 89 80 12 63,3 65
ata 80 31 84 86 0 44,3 95
tta 47 35 120 86 13 61,2 62
111 bactéries: Caractérisation des codons . Parallèle diagramme %AT / coefficient de corrélation. 1/2.
codon écart queue Moyen. abscis Cor>79 cor tot diag/cor
gtt 28 8 132 68 11 62,7 27
gct 30 9 108 66 4 56,8 84
tat 22 11 116 86 20 66,2 33
ttt 29 12 123 86 15 63,7 91
tct 37 19 69 86 7 62,5 34
tca 38 19 50 86 12 63,5 70
att 30 9 168 86 13 63,2 38
aaa 30 8 247 86 11 62,7 83
ttt 29 12 123 86 15 63,7 45
aat 35 15 133 86 10 58,9 91
gct 30 9 108 66 4 56,8 49
gca 30 6 91 67 6 59,2 75
aca 38 18 65 78 6 63,0 53
caa 36 14 89 80 12 63,3 73
aca 38 18 65 78 6 63,0 54
act 38 14 68 82 10 64,1 69
tca 38 19 50 86 12 63,5 55
agt 43 16 38 86 7 62,3 75
gct 30 9 108 66 4 56,8 56
cct 32 8 65 68 11 63,0 85
aga 64 31 60 86 1 53,2 56
ata 80 31 84 86 0 44,3 76
gaa 27 0 296 67 4 58,2 58
gat 23 0 217 70 21 65,8 79
caa 36 14 89 80 12 63,3 59
gga 42 9 88 78 2 56,0 56
att 30 9 168 86 13 63,2 60
ttt 29 12 123 86 15 63,7 87
act 38 14 68 82 10 64,1 62
caa 36 14 89 80 12 63,3 80
Tableaux des parallèles %GC[modifier | modifier le wikicode]
  • Lien Tableur: Tableaux des parallèles %GC
  • Ces 30 parallèles sont faits pour les couples dont le paramètre diag est inférieur à 100. Le paramètre cor est tiré du tableau des corrélations et les autres paramètres sont ceux du tableau synthétique.
  • Légende: voir caractérisation des codons et tableaux des parallèles.
  • diag/cor la 1ère ligne indique la valeur de diag la 2ème, la corrélation entre les 2 codons du parallèle.
  • Nota: ici l’abscisse du maximum peut aller jusqu'à 75% GC car les bactéries peuvent atteindre ce taux. Quand la courbe de tendance n'a pas de maximum c'est ce taux qui est indiqué. Si le maximum a une abscisse supérieure à 75% alors cette abscisse est indiquée sous la forme */xx où xx est l'abscisse en question. Cela reste une caractéristique de la courbe même si biologiquement cette abscisse n'est pas atteinte.
  • Tableaux non formatés du 15.3.17
111 bactéries: Caractérisation des codons . Parallèle diagramme %GC / coefficient de corrélation. 2/2.
codon écart queue Moyen. abscis cor>79 cor tot diag/cor
gag 30 0 226 75 6 61,7 51
gac 20 0 202 75 27 69,4 81
ttc 22 0 125 75 25 67,8 54
atc 26 2 181 73 11 63,8 89
tac 25 0 107 75/83 8 60,1 54
atc 26 2 181 73 11 63,8 66
ggc 42 0 169 75 28 68,6 55
atc 26 2 181 73 11 63,8 84
ttc 22 0 125 75 25 67,8 56
gac 20 0 202 75 27 69,4 91
ggc 42 0 169 75 28 68,6 62
gag 30 0 226 75 6 61,7 73
ggc 42 0 169 75 28 68,6 63
aag 27 0 202 75/85 1 56,8 68
tga* 104 2 75 1 44,8 66
tag 129 1 75 0 9,3 11
gtg 39 5 137 70 0 60,1 66
gcg 35 5 126 75 3 59,5 69
tac 25 0 107 75/83 8 60,1 67
aag 27 0 202 75/85 1 56,8 77
tac 25 0 107 75/83 8 60,1 67
cac 20 0 70 75 19 66,2 92
ttc 22 0 125 75 25 67,8 67
cac 20 0 70 75 19 66,2 87
gcg 35 5 126 75 3 59,5 67
ccg 40 8 101 75/82 7 61,3 89
ttc 22 0 125 75 25 67,8 67
aag 27 0 202 75/85 1 56,8 80
gtc 32 4 118 75 7 62,9 71
ccg 40 8 101 75/82 7 61,3 75
111 bactéries: Caractérisation des codons . Parallèle diagramme %GC / coefficient de corrélation. 1/2.
codon écart queue Moyen. abscis cor>79 cor tot diag/cor
tcc 37 4 66 67 0 54,8 9
acg 38 4 71 69 0 48,4 40
aag 27 0 202 75/85 1 56,8 14
atc 26 2 181 73 11 63,8 66
gtc 32 4 118 75 7 62,9 17
gcg 35 5 126 75 3 59,5 71
gag 30 0 226 75 6 61,7 23
aag 27 0 202 75/85 1 56,8 76
gac 20 0 202 75 27 69,4 29
aag 27 0 202 75/85 1 56,8 73
ttc 22 0 125 75 25 67,8 30
tac 25 0 107 75/83 8 60,1 82
agc 37 0 55 61 0 42,6 34
ggg 42 0 54 64 0 26,8 26
ctc 44 12 104 75 4 60,0 35
ccg 40 8 101 75/82 7 61,3 58
gac 20 0 202 75 27 69,4 36
atc 26 2 181 73 11 63,8 80
gcc 28 9 164 75 17 66,9 36
acc 30 8 121 75 17 66,0 89
gag 30 0 226 75 6 61,7 37
atc 26 2 181 73 11 63,8 66
gtc 32 4 118 75 7 62,9 39
acc 30 8 121 75 17 66,0 78
ccg 40 8 101 75/82 7 61,3 47
acc 30 8 121 75 17 66,0 74
aac 21 0 128 66 8 57,6 50
cag 26 0 132 68 21 66,3 79
gcg 35 5 126 75 3 59,5 51
acc 30 8 121 75 17 66,0 67
Diagramme diagcor-gc[modifier | modifier le wikicode]
Diagramme diagcor-at[modifier | modifier le wikicode]

Caractérisation des aas par les courbes et les coefficients de corrélation[modifier | modifier le wikicode]

Tableau des diagrammes aas DRNA[modifier | modifier le wikicode]

Courbes à partir des équations de tendance[modifier | modifier le wikicode]

Moyenne des écarts par rapport à la courbe théorique[modifier | modifier le wikicode]

Taux de variation des acides aminés[modifier | modifier le wikicode]

  1. écart*: moyenne des écarts de l'aa calculée ci-dessus
  2. ax et cte: de l'équation de la courbe de tendance linéaire, "effectif de l'aa" = ax+cte. A calculer à partir du tableau des diagrammes des aas. Le signe de ax indique le sens de la variation de l'aa.
  3. Max et Min (avec ou sans zin et crp) sont en fin du tableau des diagrammes des aas.
  4. Les bactéries zin et crp sont extrêmes, ce qui fait que le Maximum et le minimum sans eux ne concernent que 109 bactéries et avec les écart* faibles, le rapport M/m (Maximum sur minimum) reflète mieux la courbe de tendance linéaire.
Tableau des taux de variation des aas
Sans zin ni crp −Avec zin et crp
ax cte écart* Max min M/m −Max min M/m
A 7.49 131 8.4 693 221 3.1 693 91 7.6
C -0.24 69 25.3 121 21 5.7 121 21 5.7
D 1.61 342 7.5 526 292 1.8 526 148 3.6
E 0.77 485 7.6 694 340 2.0 694 196 3.5
F -1.88 338 7.8 326 171 1.9 599 171 3.5
G 3.54 284 4.0 538 309 1.7 538 217 2.5
H 0.42 109 8.0 162 92 1.8 162 61 2.7
I -7.34 785 7.6 767 261 2.9 1074 261 4.1
K -8.17 840 11.0 783 229 3.4 1263 229 5.5
L 0.35 595 4.4 753 543 1.4 753 543 1.4
M 0.40 135 10.2 207 97 2.1 207 70 2.9
N -5.58 528 9.0 544 123 4.4 864 123 7.0
P 2.61 161 4.8 401 190 2.1 401 113 3.6
Q 0.47 198 12.0 302 148 2.0 302 97 3.1
R 4.79 154 7.3 546 221 2.5 546 128 4.3
S -1.72 418 8.5 496 220 2.3 496 220 2.3
T 1.14 271 7.5 391 231 1.7 391 174 2.2
V 3.09 323 4.8 588 255 2.3 588 134 4.4
W 0.48 51 8.6 117 54 2.2 117 50 2.3
Y -2.22 329 7.8 306 149 2.1 399 149 2.7
  • Tableau non formaté

Les coefficients de corrélation entre aas[modifier | modifier le wikicode]

  • Lien Tableur: Les coefficients de corrélation entre aas
  • Les valeurs présentées ici sont les coefficients de corrélation X 100. La corrélation entre 2 aas est celle de 2 colonnes du tableau des diagrammes des aas. Pour obtenir les valeurs absolues il suffit de copier ce tableau (largeur de colonne 1.3 cm) et de remplacer le moins (-) par rien. Pour extraire le maximum d'une colonne il suffit de remplacer 100 par rien (format sans décimales et option de recherche 'cellule entière').
  • Légende:
  1. moyenne : moyenne des corrélations en valeurs absolues d'un aa.
  2. >74 : nombre de corrélations en valeurs absolues d'un aa supérieures à 0.74.
  3. >79 : nombre de corrélations en valeurs absolues d'un aa supérieures à 0.79.
  4. max : corrélation maximum parmi les valeurs absolues des corrélations d'un aa.

Diagramme coraa[modifier | modifier le wikicode]

Synthèse des corrélations des codons et des aas[modifier | modifier le wikicode]

Tableau synthétique[modifier | modifier le wikicode]
  • Lien Tableur: Tableau synthétique
  • Tableau synthétique non formaté
  • Légende: corrélations en valeur absolue et multipliée par 100 entre 2 aas ou 2 codons.
  1. Corrélations entre aas (acides aminés): d'après la matrice des corrélations.
    1. moy : moyenne des corrélations d'un aa.
    2. >74−79 : nombre de corrélations d'un aa supérieures à 0.74 − dont corrélations supérieures à 0.79.
    3. max : corrélation maximum d'un aa.
  2. Corrélations entre codons
    1. t,c,a,g,t/c,a/g : terminaison des codons (t/c pour t ou c), pour lesquels on a la moyenne "moy" sous moyt (comme pour les aas) et le nombre ">74−79" sous >74−79t (comme pour les aas).
    2. moyt : total des moyennes "moy" des codons d'un aa.
    3. >74−79t  : total des nombres ">74−79" des codons d'un aa.
    4. 0-70 : pour un codon, zéro corrélations supérieures à 0.74 − avec une corrélation maximale (en valeur absolue) de 0.70.
    5. stop : les codons stops. Les codons taa et tga ont une seule corrélation supérieure à 0.74 et c'est celle entre eux. Elle est négative (*). Sont indiqués aussi le maximum de tag et les maxima de taa et tga en dehors de leur corrélation de -0.802.
  3. Résumés :
    1. moyn : nombre des moyennes "moy" pour une gamme donnée en en-tête de la colonne.
    2. 74n : nombre des nombres ">74−79" pour une gamme donnée en en-tête de la colonne.
    3. 74t : total des corrélations supérieures à 0.74 seulement, des codons d'un aa.
    4. moyt : déjà défini dans codons
    5. %total: 20 aas et 61 codons (pour les aas).
  4. Résumé III: La corrélation entre aas traduit peu la corrélation qui existe entre codons. Ainsi
    1. Les aas à un codon, M W, sont peu corrélés avec les autres aas et peu corrélés avec les autres codons;
    2. Les aas, A F I P V Y, sont très corrélés avec les autres aas et leurs codons sont très corrélés avec les autres codons;
    3. Les aas, G K N R, sont très corrélés avec les autres aas et leurs codons sont peu corrélés avec les autres codons;
    4. Les aas, C D E H L Q S T, sont peu corrélés avec les autres aas et leurs codons sont très corrélés avec les autres codons.
111 bactéries: Caractérisation des aas . Coefficients de corrélation codons / aas.
A C D E F G H I K L M N P Q R S T V W Y
aas
moy 61 20 51 26 59 62 40 65 64 13 35 62 60 32 56 31 46 58 38 55
>74−79 7−7 0 1−0 0 7−5 9−9 0 9−9 9−9 0 0 9−9 9−8 0 8−7 0 0 7−6 0 7−7
max 38 74 56 66 35 54 54 57 67 68
codons
moyt 242 111 135 120 131 191 126 171 119 300 19 116 238 130 222 344 242 244 43 126
t 57 58 66 - 64 40 60 63 - 39 - 59 63 - 18 63 64 63 - 66
c 67 53 69 - 68 69 66 64 - 60 - 58 54 - 67 55 66 63 - 60
a 59 - - 58 - 56 - 44 63 51 - - 60 63 22 64 63 58 - -
g 59 - - 62 - 27 - - 57 62 19 - 61 66 49 58 48 60 43 -
t/a 61 53 62
c/g 27 13 43
>74−79t 62−30 8−5 65−48 25−10 56−40 40−30 44−25 50−24 28−12 47−23 0−0 27−18 51−22 50−33 33−18 75−29 76−33 65−18 0−0 48−28
t 7 −4 8−5 28−21 - 22−15 0-70 14 −6 23−13 - 0-69 - 13−10 21−11 - 0-70 16 −7 25 −10 19−11 - 31−20
c 33−17 0-72 37−27 - 34−25 33−28 30−19 26−11 - 9 −4 - 14 −8 1 −1 - 29−17 4 −76 30−17 24 −7 - 17 −8
a 13 −6 - - 8 −4 - 6 −2 - 1 −76 20−11 0-69 - - 12 −3 21−12 0-46 27−12 21 −6 10 −78 - -
g 9 −3 - - 17−6 - 1-75 - - 8 −1 20 −6 0-55 - 17 −7 29−21 1 −75 8 −3 0-73 12 −77 0-72 -
t/a 18−13 2 −1 20 −7
c/g 0-52 0-43 0-65
Stop max suivant max
taa 80* 60 tag 48
tga 80* 62 * taa/tga= -80.2
I Résumés
codons >27 26-12 10-6 4-0 codons >58 57-51 <49 aas 7-9 1 0 aas >58 57-51 <49
74n 11 23 9 18 moyn 40 8 13 74n 10 1 9 moyn 8 3 9
II +faibles 74n %total moyn %total +forts 74n %total moyn %total
gamme <3 <33 >12/7 >54
codons 17 28 % 6 10 % 34 56 % 45 74 %
aas 10 50 % 5 25 % 10 50 % 10 50 %
III A C D E F G H I K L M N P Q R S T V W Y
aas
>74 7 1 7 9 9 9 9 9 8 7 7
moy 61 20 51 26 59 62 40 65 64 13 35 62 60 32 56 31 46 58 38 55
codons
74t 62 8 65 25 56 40 44 50 28 47 0 27 51 50 33 75 76 65 0 48
moyt 242 111 135 120 131 191 126 171 119 300 19 116 238 130 222 344 242 244 43 126
Repartition des fréquences de corrélation des aas et des codons[modifier | modifier le wikicode]
  • Lien Tableur: Repartition des fréquences de corrélation des aas et des codons
  • Les effectifs ou fréquence (fr) sont comptés à partir des matrices des coefficients de corrélation des aas et des codons. La matrice est formatée sans décimales et copiée dans 'writer'. L'effectif d'une corrélation donnée (exemple 3) est affiché (18) quand on exécute la recherche sur la matrice de cette corrélation avec l'option 'tout rechercher'.
  • Légende :
  1. cor : corrélation
  2. fr : fréquence
  • Les diagrammes: Repartition des corrélations codons et aas. Dans le même tableau de diagrammes: Fréquences des corrélations entre codons, Répartition des corrélations entre codons, Fréquences des corrélations entre aas, Répartition des corrélations entre aas
  • Fréquences des corrélations entre codons (multipliées par 100).
  • Fréquences des corrélations entre aas (multipliées par 100).
Tableaux triés des corrélations des aas et des codons entre eux[modifier | modifier le wikicode]
Tableau trié des corrélations des aas entre eux[modifier | modifier le wikicode]
voir ici
  • Tableau non formaté
Tableau trié des corrélations des codons entre eux[modifier | modifier le wikicode]
Un tableau de cette taille formaté avec wikipédia serait très compliqué à faire. Aussi j'ai opté de prendre une image de ce tableau formaté sous le tableur calc de LibreOffice.
  • Image du tableau formaté:
    voir ici
  • Construction: 3 lignes-colonnes sont ajoutées pour trier les codons. La L-C "ordre original" sert à retrouver l’ordre de la matrice des corrélations entre codons. Elle est numérotée de 1 à 64 de façon progressive sur cette matrice. Les 2 autres L-C "ordres optimisés" séparent les numéros des codons se terminant par "a,t" (en incluant agg, ttg et en excluant tga) des numéros des codons se terminant par "g,c" (en procédant de façon inverse pour agg, ttg et tga).
  • Tri sur les valeurs les plus élevées des corrélations: les numéros des 2 L-C sont obtenus par estimation de l'ordre des codons suivant le classement de leurs corrélations positives avec les autres codons. Le tableau final est optimisé pour avoir des groupes de codons fortement corrélés entre eux, les plus grands possibles. Voici ci-dessous les ordres estimés et optimisés obtenus, à recopier dans un tableur. Les codons ayant beaucoup de corrélations alternées, positives et négatives, ne sont pas inclus, c'est à dire atg, tag, ctg, agg. Les tris ne concernent alors que 2 carrés à corrélations positives de 29X29 codons.
Tableaux triés, connexions entre codons et aas[modifier | modifier le wikicode]
Tableau trié des 10 aas fortement corrélés entre eux[modifier | modifier le wikicode]
I K N F Y G A P V R D
I 92 93 83 82 -93 -89 -89 -90 -83 -72
K 92 86 80 84 -90 -88 -85 -83 -86 -72
N 93 86 81 81 -90 -81 -87 -90 -85 -60
F 83 80 81 71 -80 -70 -74 -80 -66 -74
Y 82 84 81 71 -84 -84 -80 -72 -80 -62
G -93 -90 -90 -80 -84 90 88 82 86 65
A -89 -88 -81 -70 -84 90 84 73 83 63
P -89 -85 -87 -74 -80 88 84 80 89 51
V -90 -83 -90 -80 -72 82 73 80 77 61
R -83 -86 -85 -66 -80 86 83 89 77 43
D -72 -72 -60 -74 -62 65 63 51 61 43
  • Distribution des fréquences entre ces 10 aas et le total
fréquences des corrélations en valeur absolue                                   
cor     aas10   aas     cor     aas10   aas
93      2       2       78      0       0
92      1       1       77      1       1
91      0       0       76      0       0
90      5       5       75      0       0
89      3       3       74      1       2
88      2       2       73      1       1
87      1       1       72      1       3
86      3       3       71      1       1
85      2       2       70      1       1
84      4       4       69      0       0
83      4       4       68      0       1
82      2       2       67      0       1
81      3       3       66      1       3
80      6       6       65      0       1
79      0       0       64      0       0
Tableaux triés de groupes de codons fortement corrélés entre eux[modifier | modifier le wikicode]
Y F N L K I S
codon tat ttt aat tta aaa att tca
Y tat 91 92 90 91 86 81
F ttt 91 91 85 93 87 79
N aat 92 91 91 92 85 79
L tta 90 85 91 84 85 81
K aaa 91 93 92 84 83 78
I att 86 87 85 85 83 82
S tca 81 79 79 81 78 82
Tableau non formaté: voir tableur
  • Tableau formaté de 8 codons moyennement corrélés se terminant par a,t.
D V Q T P A A H
codon gat gtt caa act cct gca gct cat
D gat 85 83 81 83 81 81 87
V gtt 85 71 82 81 83 84 69
Q caa 83 71 80 71 66 72 81
T act 81 82 80 77 74 82 69
P cct 83 81 71 77 79 85 74
A gca 81 83 66 74 79 75 69
A gct 81 84 72 82 85 75 66
H cat 87 69 81 69 74 69 66
Tableau non formaté: voir tableur
  • Tableau formaté de 12 codons fortement corrélés se terminant par g,c.
V Y L I T A Q R H G F D
codon gtc tac ctg atc acc gcc cag cgc cac ggc ttc gac
V gtc 64 62 77 78 84 71 80 78 83 82 87
Y tac 64 66 66 73 68 76 67 92 70 82 84
L ctg 62 66 75 88 76 90 77 76 83 74 78
I atc 77 66 75 82 79 79 82 76 84 89 80
T acc 78 73 88 82 89 86 81 84 86 81 87
A gcc 84 68 76 79 89 78 87 79 88 83 87
Q cag 71 76 90 79 86 78 82 83 85 83 84
R cgc 80 67 77 82 81 87 82 80 96 85 87
H cac 78 92 76 76 84 79 83 80 81 87 92
G ggc 83 70 83 84 86 88 85 96 81 87 90
F ttc 82 82 74 89 81 83 83 85 87 87 91
D gac 87 84 78 80 87 87 84 87 92 90 91
Tableau non formaté: voir tableur
Les Corrélations faibles entre codons[modifier | modifier le wikicode]
Les 2 groupes de corrélations faibles
cta ata ctt ggt taa ggg tgg agc tga cgg acg tgc tcc
cta 41 41 43 37 -16 -29 -39 -45 -44 -46 -56 -57
ata 41 28 1 15 -20 -40 -35 -21 -38 -51 -38 -44
ctt 41 28 25 22 -11 -19 -9 -34 -40 -35 -22 -29
ggt 43 1 25 53 -39 -18 -28 -45 -55 -32 -49 -33
taa 37 15 22 53 -26 -38 -21 -80 -44 -40 -41 -45
ggg -16 -20 -11 -39 -26 37 26 15 75 24 30 36
tgg -29 -40 -19 -18 -38 37 33 43 50 44 34 52
agc -39 -35 -9 -28 -21 26 33 23 29 31 62 39
tga -45 -21 -34 -45 -80 15 43 23 44 42 37 44
cgg -44 -38 -40 -55 -44 75 50 29 44 46 42 50
acg -46 -51 -35 -32 -40 24 44 31 42 46 44 40
tgc -56 -38 -22 -49 -41 30 34 62 37 42 44 65
tcc -57 -44 -29 -33 -45 36 52 39 44 50 40 65
mcor 51.5 44.3 39.2 39.6 42.0 26.8 43.2 42.6 44.8 48.5 48.4 53.3 54.8
  • Tableau non formaté: voir tableur
Corrélations isolées, fortes et faibles entre codons[modifier | modifier le wikicode]
ccg     ccg     aga     aac     caa     tct
gcg     ggc     gga     cac     att     tgt
89      84      83      83      83      82
                                        
caa     tat     gag     ttt     gct     gct
tta     agt     cac     tgt     aat     aac
81      81      81      80      40      -50
                                        
tga     cgt     tga     cgt     cgg     ata
taa     atg     gtc     ggt     ggg     aga
-80     55      60      70      75      76
Codons ne suivant pas le processus GC[modifier | modifier le wikicode]
  • Légende: mcod, moyenne du codon − mcor, moyenne des corrélations en valeurs absolues du codon − 7 cod dans le carré des 7 codons − seul, corrélation solitaire forte − max, corrélation maximum en dehors de la solitaire.
  • tga est l’équivalent de taa puisque il y a revirement total.
  • Alors que ttg se comporte comme cga, mais à l’envers.
  • Donc il y a 6 indéterminés : ttg cga cgt agg tag atg.
  • taa et ggg sont normaux donc ont un total de 63 codons pour le décompte des processus.
  • Les 7 codons ont un total de 57 codons en dehors des 7.
  • Il y a une inconnue sur le processus de la corrélation dans le carré des 7 codons.
7 codons ne suivant pas le processus GC
Processus Corrélations sup 0.40 Notes
mcod mcor non GC GC non GC GC 7 cod seul max
taa 3 42.0 4 59 0 44 - 80 tga - 60 gag
ttg 81 26.6 53 4 9 0 1 52 gct
cga 20 22.4 4 53 0 2 1 46 ttg
cgt 103 18.2 19 38 2 3 1 70 ggt 55 atg
agg 24 13.5 36 21 1 0 0 43 ata
tag 1 9.3 34 23 0 1 0 - 48 taa
atg 154 19.5 12 45 0 4 1 55 cgt - 46 aat
ggg 54 26.8 2 61 0 4 75 cgg 57 ccc
tga 2 44.8 57 0 49 0 0 - 80 taa - 62 gaa

Corrélations entre bactéries et conformation des protéines[modifier | modifier le wikicode]

Conformation des protéines par le nombre d'aas et de codons[modifier | modifier le wikicode]

  • Légende:La conformation moyenne des 6 protéines étudiées peut être représentée par les moyennes des aas calculées dans le tableau des diagrammes des aas. Pour chaque bactérie j'ai fait le diagramme "moyenne de l'aa" /"effectif de son aa correspodant"; La conformation moyenne des 6 protéines pour cette bactérie peut être alors représentée par les 3 paramètres de la droite de tendance de ce diagramme. A savoir:
  1. R2: coefficient de détermination de la droite (ici multiplié par 100)
  2. a: la pente de la droite (ici notée ax).
  3. b: la constante de la droite.

Les 3 paramètres sont reportés tels quels en fonction du contenu en GC (%GC) des bactéries dans les diagrammes des chapitres suivants.

  • La conformation des gènes des 6 protéines est étudiée de la même manière qu'avec les aas, mais ici je considère les 64 codons d'après le tableau des diagrammes des codons.
  • Dans le chapitre des exemples qui suit sont représentés 12 tableaux de ces diagrammes.
Conformation des protéines par le nombre d'aas[modifier | modifier le wikicode]
Conformation des protéines par le nombre de codons[modifier | modifier le wikicode]
  • Lien Tableur: Conformation des protéines par le nombre de codons
  • format2 : voir 2ème diagramme.
  • Voir la légende
  • Ce diagramme est l'équivalent de celui des aas car il réunit tout les codons. Les 2 diagrammes sont cependant très différents par la grande variance de R2 avec les codons, somme de 2 variances opposées que sont celle des triplets bbc,g et celle des bbt,a, et une très faible variance de R2 avec les aas, nécessaire au maintient des fonctions de ces 6 protéines.
Conformation des protéines par le nombre de codons bbc,g[modifier | modifier le wikicode]
Conformation des protéines par le nombre de codons bbt,a[modifier | modifier le wikicode]
Conformation, récapitulatif[modifier | modifier le wikicode]
  • La colonne 3° R2 correspond au coefficient de détermination d'un polynôme de degré 3.
Coefficient pente constante R2
Paramètre a b r2 a b r2 r'23 r23
Diagramme
aas 0.003 0.86 391 -0.99 47.5 410 540 874
codons 0.005 0.76 279 -0.50 24.6 280 320 709
bbg,c 0.040 -0.91 907 -0.54 26.3 170 260 691
bba,t -0.033 2.59 894 -0.62 30.8 250 420 665

Conformation des protéines, exemples[modifier | modifier le wikicode]

Conformation des protéines par le nombre d'aas[modifier | modifier le wikicode]
  1. moyen: moyenne de l'aa, voir la légende ci-dessus.
  2. zero: colonne à valeurs nulles pour reporter les noms des aas.
  3. hth: code KEGG de la bactérie
Conformation des protéines par le nombre de codons bbc,g[modifier | modifier le wikicode]
  1. moyen: moyenne du codon, voir la légende ci-dessus.
  2. zero: colonne à valeurs nulles pour reporter les noms des codons.
  3. eal: code KEGG de la bactérie
Conformation des protéines par le nombre de codons bbt,a[modifier | modifier le wikicode]
  1. moyen: moyenne du codon, voir la légende ci-dessus.
  2. zero: colonne à valeurs nulles pour reporter les noms des codons.
  3. fnc: code KEGG de la bactérie

Fréquences des corrélations entre bactéries / codons[modifier | modifier le wikicode]

Fréquences des corrélations entre bactéries / aas[modifier | modifier le wikicode]

Les tRNAs[modifier | modifier le wikicode]

Nombres de tRNAs des 111 bactéries[modifier | modifier le wikicode]

  • Lien Tableur: Nombres de tRNAs des 111 bactéries
  • Base de données des tRNAs [1], gtRNAdb.   Pour vin amo ssm opr age fbt cad sbw mcac j'ai utilisé la base de données KEGG [2]: fournir les 3 lettres du génome dans organism. Puis cliquer successivement sur Assembly, Genome et RefSeq. Ctrl+F: tRNA-Arg . . .
  • Légende:
colonne tRNA/8: les 8 aas à 4 et 6 codons ayant 1 seul codon avec tRNA pour le carré à 4 codons (ct pour L par exemple). Pour réduire la notation sont indiqués en 1er les aas à 4 codons suivis de ceux à 6 codons. S'il y a un seul aa avec plus d'un codon à tRNA, cet aa est noté avec le signe −.
  1. −G *: R n'a aucun tRNa pour les 4 codons cg (ceci pour *) et G a plus d'un codon à tRNA. Donc APTV ont 1 seul codon à tRNA et SL en ont plus de 1 pour leur carré.
  2. −G SR*: L n'a aucun tRNa pour les 4 codons ct (ceci pour *) et G a plus d'un codon à tRNA. Donc APTV et SR ont 1 seul codon à tRNA pour leur carré.
  3. T*: 4 codons avec tRNA pour T.
  4. 5 SRL, tRNA/8: Les 5 aas à 4 codons et SRL ont 1 seul codon à tRNA.
Colonne >2: les 8 aas à 4 et 6 codons ayant plus de 2 codons à tRNA pour le carré à 4 codons (ct pour L par exemple). Pour réduire la notation sont indiqués en 1er les aas à 4 codons suivis de ceux à 6 codons. S'il y a un seul aa avec 2 codons à tRNA, cet aa est noté avec le signe −.
  1. 8: APTVG et SRL ont plus de 2 codons à tRNA.
  2. T S: T et S ont plus de 2 codons à tRNA.
  3. −V −S: APTG et RL ont plus de 2 codons à tRNA.
  4. GT* SL: GSL ont plus de 2 codons à tRNA et T en a 4 (pour *).
Colonne 2: Les aas KEQ à 2 codons peuvent avoir les 2 codons avec tRNA. Les codons tta et ttg de L ont dans la majorité des cas un tRNA chacun, de même pour aga et agg de R. Pour S le codon agt n’a pratiquement jamais de tRNA alors que agc en a toujours. Donc S sera absent dans cette colonne.
  1. 3RL: KEQ et RL ont 2 codons à tRNA.
  2. KRL: ces 3 aas ont 2 codons à tRNA.
  3. W C I : Les codons tgg et tga, tgt et tgc, ata ont chacun un tRNA.
Les tRNAs des 111 bactéries
KEGG %GC tRNA tRNA/8 >2 2 KEGG %GC tRNA tRNA/8 >2 2 KEGG %GC tRNA tRNA/8 >2 2 KEGG %GC tRNA tRNA/8 >2 2
zin 13.5 25 −G SR* 0 0 lat 36.3 44 P T SL KQR ype 47.6 70 0 G L KQRL ret 61.3 50 0 GPTSL 3R
crp 16.6 28 −G * 0 0 bbd 36.8 39 V 0 RL amo 48.0 48 0 8 3RLW sus 61.9 51 0 8 3RL
hcr 22.5 28 5 SRL 0 L liv 37.1 67 AP T S RL pgi 48.3 53 V GPT L KQRL saci 62.3 68 0 8 3RLC
mcac 23.7 30 −T SRL 0 KL hmr 37.5 48 0 8 3RL mah 48.7 45 0 T SL RL smk 62.7 57 0 -V −R 3RL
ssdc 24.2 34 AP L KRL tde 37.9 44 0 APTSL 3RL ssm 49.0 48 0 8 3RL dvl 63.0 68 0 −R KQRL
sbw 25.1 35 AP L KRL spi 38.3 63 APV 0 KRL eal 49.7 85 0 GPTSL QRL ddr 63.4 48 0 −R KQRL
uur 25.5 30 −G SL 0 KL vpr 38.6 48 APV G S KRL lfc 50.0 52 0 8 3RL tai 63.8 50 0 8 3RL
ple 26.2 33 AP S 0 chp 39.1 38 0 T SL RL eco 50.8 87 0 GPTSL QRL gau 64.3 48 0 −R 3RL
smf 26.3 39 5 SRL 0 KL spl 39.1 143 0 0 RL sbz 51.3 86 0 GPTSL QRL xcb 65.0 55 0 −R 3RL
fnc 27.1 47 −G SL 0 KRL tsu 39.2 48 0 −V −S 3RL bvs 51.7 62 V GPTSL 3RL rru 65.5 55 0 −R 3RL
bfl 27.4 37 AP T SL KRL nis 39.7 45 0 T RL sty 52.1 79 0 GPTSL QRL dpt 66.2 46 0 −G −R KQRL
cbl 28.3 81 APV G 3RL cmn 40.3 37 0 T SL L tpas 52.8 45 0 −G 3RL pae 66.6 63 0 GPTSL RL
rip 28.5 33 AP 0 RL nse 41.1 33 AP 0 RL  I apt 53.0 57 0 −R KQL roa 67.4 52 0 −R 3RL
rpr 29.0 33 P T 0 cta 41.3 37 0 T SL L caa 53.6 46 0 GPTSL KRL bmv 68.2 56 0 −R KR
pub 29.7 32 AP L 0 L hhd 41.8 67 P 0 RL cgq 54.2 58 0 −A −R 3RL tos 68.6 52 0 −R 3RL  I
cad 29.9 81 APV 0 LW gva 42.0 45 0 −P −R 3RL dal 54.5 56 0 −R 3RL vin 68.9 49 0 8 3RL
cje 30.6 43 P 0 RL cbd 42.4 42 0 GPTSL KERL eno 55.1 83 0 GT L QRL age 69.5 81 0 8 3RL
pmh 31.1 40 0 T S RL bae 43.2 75 P 0 RL mcu 55.4 46 0 −R 3RL opr 70.0 46 0 −R 3RL
tme 31.4 50 0 8 3RL aae 43.5 44 0 GPTSL KRL din 56.1 37 0 P L RL mts 70.3 46 0 −R 3RL
sep 32.1 59 APV 0 L bsu 43.5 54 P L RL say 56.8 53 0 8 3RL sma 70.7 71 0 −R 3RL
hhl 32.5 44 0 0 RL hth 44.0 44 0 −R KRL bmf1 57.2 55 0 −R 3RL amd 71.3 52 0 −R 3RL
cff 33.3 41 P 0 KERL lpl 44.5 73 V GT* SL 3RL kpn 57.5 86 0 GPTSL QRL sho 72.0 73 0 −R 3RL
ial 33.9 45 0 −V 3RL pdi 45.1 82 0 GPTSL 3RL aba 58.4 46 0 8 3RL sgr 72.2 67 0 −R 3RL
ljf 34.5 55 AV R GT* SL 3RL ppoy 45.5 109 0 T SL KL dba 58.7 64 0 8 3RL cmi 72.7 45 0 −R 3RL
dte 34.9 43 0 T SL RL tma 46.3 46 0 8 3RL synd 59.1 46 0 −R RL salb 73.3 66 0 −R 3RL
lla 35.3 63 APV T SL KRL sbn 46.3 105 0 L RL pgd 59.6 60 0 −A −R RL ksk 74.2 78 0 −R 3RL
axl 35.7 55 P 0 L fbt 46.5 47 V L RL pac 60.0 45 0 −R 3RL ade 74.9 49 0 8 3RL
thl 36.0 62 AV GT SL KRL tli 47.1 48 0 8 3RL bla 60.5 52 0 −R 3RL
  • Tableau non formaté: voir tableur
  • Récapitulatif
Nombre de bactéries (sur 111) ayant au moins un tRNA par codon
codons 0 1 2 3 4 0 1 2
aa
A 0 23 40 48
C 0 110 1
D 0 111 0
E 0 62 49
F 0 111 0
G 0 3 41 67
H 0 111 0
I 0 109 2
K 0 38 73
L 1 6 22 82 0 7 104
M 0 111 0
N 0 111 0
P 0 29 19 63
Q 0 51 60
R 1 5 87 18 0 16 95
S 0 6 29 76 0 111 0
T 0 6 25 78 2
V 0 20 46 46
W 0 109 2
Y 0 111 0
  • Tableau non formaté: voir tableur

Moyenne des codons t/c et a/g en %[modifier | modifier le wikicode]

Moyenne des codons 2*(t-c)/(t+c) et 2*(a-g)/(a+g) en %
ttt 123 tct 69 tat 116 tgt 27
c 125 c 66 c 107 c 31
a 120 a 50 a 3 a 2
g 81 g 58 g 1 g 71
ctt 97 cct 65 cat 59 cgt 103
c 104 c 61 c 70 c 132
a 30 a 58 a 89 a 20
g 180 g 101 g 132 g 44
att 168 act 68 aat 133 agt 38
c 181 c 121 c 128 c 55
a 84 a 65 a 247 a 60
g 154 g 71 g 202 g 24
gtt 132 gct 108 gat 217 ggt 142
c 118 c 164 c 202 c 169
a 84 a 91 a 296 a 88
g 137 g 126 g 226 g 54
ttt/c -2 tct 4 tat 8 tgt -15
tta/g 39 -15 103 -191
ctt/c -7 cct 5 cat -17 cgt -25
cta/g -144 -54 -39 -73
att/c -7 act -56 aat 4 agt -35
ata/g -59 -8 20 84
gtt/c 11 gct -41 gat 7 ggt -17
gta/g -48 -32 27 49
  • Tableau non formaté: voir tableur

Moyenne des corrélations t/c et a/g en %[modifier | modifier le wikicode]

Moyenne des corrélations 2*(t-c)/(t+c) et 2*(a-g)/(a+g) en %
ttt 64 tct 63 tat 66 tgt 58
c 68 c 55 c 60 c 53
a 61 a 64 a 42 a 45
g 27 g 58 g 9 g 43
ctt 39 cct 63 cat 60 cgt 18
c 60 c 54 c 66 c 67
a 51 a 60 a 63 a 22
g 62 g 61 g 66 g 49
att 63 act 64 aat 59 agt 62
c 64 c 66 c 58 c 43
a 44 a 63 a 63 a 53
g 19 g 48 g 57 g 13
gtt 63 gct 57 gat 66 ggt 40
c 63 c 67 c 69 c 69
a 58 a 59 a 58 a 56
g 60 g 59 g 62 g 27
ttt/c -6 tct 13 tat 10 tgt 8
tta/g 79 9 128 4
ctt/c -42 cct 16 cat -10 cgt -114
cta/g -18 -2 -5 -74
att/c -1 act -3 aat 2 agt 38
ata/g 78 26 10 119
gtt/c 0 gct -16 gat -5 ggt -54
gta/g -3 0 -6 70
  • Tableau non formaté: voir tableur

Les corrélations en ordre[modifier | modifier le wikicode]

L'ordre des corrélations
ttt 2a tct 17a tat 1a tgt 21a
c 2g c 22g c 11g c 23g
a 4a a 7a a 29a a* 26g
g* 30a g 16g g 31g g 28g
ctt 27a cct 12a cat 15a cgt 32a
c 17g c 20g c 4g c 5g
a 25a a 16a a 10a a 31a
g 10g g 14g g 6g g 25g
att 6a act 11a aat 3a agt 18a
c 9g c 8g c 13g c 27g
a 26a a 19a a 5a a 24a
g 30g g 24g g 19g g* 33a
gtt 9a gct 14a gat 8a ggt 28a
c 12g c 7g c 1g c 3g
a 22a a 13a a 20a a 23a
g 21g g 15g g 18g g 29g
  • Tableau non formaté:voir tableur

Nombres de tRNAs des 4032 bactéries[modifier | modifier le wikicode]

  • Lien Tableur: Nombres de tRNAs des 4032 bactéries
  • Base de données gtRNAdb [3]
  • Légende:
    1. I. Nombres de tRNAs. 4032 bactéries.
        5   : nombre de tRNAs d'un codon se terminant par t. Ils sont tous inférieurs à 11 sauf ctt cgt act.
      4 366: Effectif élevé de tRNAs d'un codon se terminant par g.
      2622: Effectif faible de tRNAs.
    2. II. Nombre de bactéries à tRNAs solitaires de 4 codons (1ère et 2ème base). Total d’une requête: Comptage fait pour les carrés. C’est un nombre de bactéries ayant x tRNAs pour un seul et même codon.
      Total d'une requête: Le 1er codon se terminant par t n'a pas de solitaire sauf ici pour Arg, et il est remplacé par le total de la requête.
      a,g,c : Nombre de bactéries à tRNAs solitaires pour les carrés de 4 codons.
      106*: solitaires du codon cgt. Le carré de Arg étant complet le total de la requête est représenté par *, il est de 3946.
      Note: le total des bactéries de la base des tRNA est de 4032. Cependant le total des bactéries comptées est compris entre 3832-3947. Est-ce que ce qui manque est du aux bactéries sans tRNAs pour les codons demandés? Cela ne serait pas vrai pour les aas à 2 codons.
      − Méthode pour compter, cas de la Thr, anti-codons xGT:
      • Sélectionner les anticodons pour la requête (ne pas oublier de mettre Bacteria dans Domain). Copier le résultat, ctrl+A, ctrl+C.
      • Dans calc ctrl+V, supprimer le dessin en le sélectionnant, supprimer toutes les colonnes sauf la colonne des anticodons, sélectionner le 1er anticodon puis ctrl+schift+fin ce qui sélectionne tous les anticodons et les cellules à blanc. Il n'y a pas de cellule intercalée entre 2 anticodon de la même bactérie.
      • Copier,ctrl+v, dans writer (texte non formaté), ctrl+h (expression régulière, $ en ; tout remplacer), ctrl+h (décocher expression régulière, ;; en *;;* tout remplacer). Le tout rechercher de * ;;* donne le total de la requête (nombre total de bactéries moins 1). Mettre un * à la fin mais pas début (le logiciel déplace tout le texte pour insérer *, ce qui prend beaucoup de temps). Repérer le motif du début avant * ;;*. Si le motif concerne une recherche ultérieure, en tenir compte.
      • ctrl+h (*GGT* tout rechercher donne 2916, *AGT* donne 41, *GGT;GGT donne 754 . . . ).
    3. III. Nombre de bactéries à tRNAs solitaires des codons a,g et t,c. Total d’une requête: tRNAs solitaires pour les codons se terminant par a ou g et t ou c; total des bactéries d'une requête de la base de données suivant les codons demandés.
      stc,sag, tt (1ère et 2ème base d'un carré) , tc . . . : Total des bactéries respectivement de la requête pour 2 codons se terminant par t ou c, pour 2 codons se terminant par a ou g.
      a,g,t,c : Nombre de bactéries à tRNAs solitaires pour les codons se terminant par a,g,t,c.
      − Trp-Sec: Les solitaires de Sec sont en fait des Trp (tga).
    4. IV. Pourcentage des bactéries à tRNAs solitaires: calculés à partir des tableaux II et III précédents.
      tt (1ère et 2ème base d'un carré) , tc . . .
       %4: Pourcentage des bactéries à 1 seul codon à tRNA dans les carrés de 4; toujours a est à plus de 90% sauf pour cgt (Arg) et atg (Met).
       %2: Pourcentage des bactéries à 1 seul codon à tRNA pour les codons se terminant par a ou g. Toujours a est à plus de 90% sauf pour R (cg), L (tt), M et W.
      1a1g: Nombre de bactéries ayant 1 tRNA pour le codon se terminant par a et 1 tRNA pour le codon se terminant par g. Permet de mettre en exergue les autres bactéries ayant des tRNAs multiples.
    5. V. Multiplicité des tRNAs en %: Voir les calculs.
I. Nombre de tRNAs.
4032 bactéries
ttt 10 tct 5 tat 4 tgt 3
c 6105 c 4520 c 6420 c 4473
a 4749 a 5299 a a 1315
g 3999 g 2622 g g 4366
ctt 369 cct 10 cat 4 cgt 7478
c 3849 c 2742 c 4715 c 333
a 4940 a 5453 a 6388 a 887
g 5186 g 2183 g 2389 g 3355
att 5 act 103 aat 5 agt 1
c 9,203 c 4513 c 8,764 c 4422
a 55 a 5878 a 9,105 a 4804
g 18,026 g 2760 g 2427 g 3452
gtt 9 gct 2 gat 0 ggt 1
c 4430 c 4166 c 9,023 c 9,273
a 8,859 a 10,185 a 9,679 a 5515
g 1313 g 1224 g 1388 g 2266
II. Nombre de bactéries à tRNAs solitaires de 4 codons. Total d'une requête.
ttt 3948 tct 3945 tat 3934 tgt 3947
c 15 c 2 c 3930 c 12
a 0 a 85 a a 0
g 2 g 0 g g 17
ctt 3942 cct 3941 cat 3948 cgt 106*
c 7 c 3 c 5 c 1
a 98 a 1173 a 6 a 7
g 0 g 1 g 2 g 7
att 3949 act 3946 aat 3949 agt 3944
c 2 c 2 c 2 c 1
a 0 a 152 a 5 a 0
g 81 g 3 g 1 g 0
gtt 3943 gct 3934 gat 3949 ggt 3948
c 8 c 32 c 5 c 9
a 724 a 877 a 8 a 66
g 1 g 7 g 1 g 0
III. Nombre de bactéries à tRNAs solitaires des codons a,g. Total d’une requête.
tt tc ta tg
sag 3933 sag 3943 sag sag 3934
a 96 a 1493 a a 15
g 190 g 22 g g 2629
ct cc ca cg
sag 3935 sag 3939 sag 3943 sag 3833
a 692 a 1813 a 2130 a 539
g 30 g 5 g 18 g 3026
at ac aa ag
sag 3947 sag 3944 sag 3941 sag 3928
a 0 a 1288 a 1899 a 780
g 3947 g 13 g 9 g 10
gt gc ga gg
sag 3935 sag 3902 sag 3928 sag 3939
a 2724 a 2721 a 2808 a 1699
g 2 g 11 g 5 g 11
  • Complément Tableau III:
Nombre de bactéries à tRNAs solitaires des codons c,t.                                  
                        sct     t       c
                ac      3775    41      3682
                cg      3932    3614    307
                ct      3834    323     3502
IV. Pourcentage des bactéries à tRNAs solitaires.
tt tc ta tg
%4 2.2
1a1g 2804 2114 1238
%2 7 38 67
ct cc ca cg
%4 2.7 29.9 3.1
1a1g 962 1911 996 222
%2 18 46 54 93
at ac aa ag
%4 2.1 4.0
1a1g 0 2166 1155 2579
%2 100 33 48 20
gt gc ga gg
%4 18.6 23.3 1.9
1a1g 1051 562 602 1973
%2 69 70 72 43
ct cg ac
%4 2.7 3.1 4.0
1t1c 8 10 41
%2 99 99 98
V. Multiplicité des tRNAs.
   FL     SS     YX     CW 
t 1,00 1,00 1,00 1,00
c 1,55 1,18 1,63 1,14
a 1,27 1,35 - 1,01
g 1,04 1,07 - 1,11
LL P HQ RR
t 1,11 1,00 1,33 2,06
c 1,10 1,03 1,20 1,05
a 1,26 1,39 1,63 1,10
g 1,86 1,03 1,32 1,02
IM T NK SR
t 1,00 1,11 1,00 1,00
c 2,38 1,21 2,23 1,12
a 1,15 1,50 2,32 1,23
g 4,57 1,04 1,19 1,10
V A DE G
t 1,00 1,00 0,00 1,00
c 1,38 1,37 2,29 2,39
a 2,25 2,62 2,47 1,40
g 1,09 1,04 1,24 1,01
  • Tableaux non formatés: voir tableur

Calcul de la multiplicité des tRNAs[modifier | modifier le wikicode]

  • Lien Tableur: Calcul de la multiplicité des tRNAs
  • Légende: tRNAs, nombre affiché par la requête. lignes, nombre de lignes affiché dans calc après nettoyage. bactéries=lignes - tRNAs. multiplicité= tRNAs / bactéries.
Décompte des multiplicités des tRNAs par codon
t c a g
tRNAs lignes bactéries multiplicité tRNAs lignes bactéries multiplicité tRNAs lignes bacteries multiplicité tRNAs lignes bactéries multiplicité
t t 10 19 10 1,00 5 9 5 1,00 4 7 4 1,00 3 5 3 1,00
c 6105 10044 3940 1,55 4520 8343 3824 1,18 6420 10353 3934 1,63 4473 8401 3929 1,14
a 4749 8491 3743 1,27 5299 9221 3923 1,35 1 0,00 1315 2619 1305 1,01
g 3999 7835 3837 1,04 2622 5071 2450 1,07 1 0,00 4366 8285 3920 1,11
c t 369 700 332 1,11 10 19 10 1,00 4 6 3 1,33 7478 11102 3625 2,06
c 3849 7359 3511 1,10 2742 5399 2658 1,03 4715 8649 3935 1,20 333 650 318 1,05
a 4940 8857 3918 1,26 5453 9386 3934 1,39 6388 10312 3925 1,63 887 1693 807 1,10
g 5186 7969 2784 1,86 2183 4307 2125 1,03 2389 4201 1813 1,32 3355 6648 3294 1,02
a t 5 9 5 1,00 103 195 93 1,11 5 9 5 1,00 1 1 1 1,00
c 9203 13067 3865 2,38 4513 8246 3734 1,21 8764 12695 3932 2,23 4422 8354 3933 1,12
a 55 102 48 1,15 5878 9808 3931 1,50 9105 13036 3932 2,32 4804 8721 3918 1,23
g 18026 21972 3947 4,57 2760 5415 2656 1,04 2427 4468 2042 1,19 3452 6600 3149 1,10
g t 9 17 9 1,00 2 3 2 1,00 0 0 1 0,00 1 1 1 1,00
c 4430 7637 3208 1,38 4166 7201 3036 1,37 9023 12957 3935 2,29 9273 13153 3881 2,39
a 8859 12791 3933 2,25 10185 14075 3891 2,62 9679 13603 3925 2,47 5515 9442 3928 1,40
g 1313 2521 1209 1,09 1224 2404 1181 1,04 1388 2509 1122 1,24 2266 4505 2240 1,01
  • Tableau non formaté:voir tableur

Comparaison des codons par les 2 1ères bases[modifier | modifier le wikicode]

Comparaison des codons avec les 2 1ères bases
Multiplicité NK DE HQ    V A    SS T    P G    RR    LL    FL SR    IM CW    YX
t 1,00 0,00 1,33 1,00 1,00 1,00 1,11 1,00 1,00 2,06 1,11 1,00 1,00 1,00 1,00 1,00
c 2,23 2,29 1,20 1,38 1,37 1,18 1,21 1,03 2,39 1,05 1,10 1,55 1,12 2,38 1,14 1,63
a 2,32 2,47 1,63 2,25 2,62 1,35 1,50 1,39 1,40 1,10 1,26 1,27 1,23 1,15 1,01
g 1,19 1,24 1,32 1,09 1,04 1,07 1,04 1,03 1,01 1,02 1,86 1,04 1,10 4,57 1,11
total tRNAs
t 5 0 4 9 2 5 103 10 1 7478 369 10 1 5 3 4
c 8,764 9,023 4715 4430 4166 4520 4513 2742 9,273 333 3849 6105 4422 9,203 4473 6420
a 9,105 9,679 6388 8,859 10,185 5299 5878 5453 5515 887 4940 4749 4804 55 1315
g 2427 1388 2389 1313 1224 2622 2760 2183 2266 3355 5186 3999 3452 18,026 4366
codon solitaire
t 3949 3949 3948 3943 3934 3945 3946 3941 3948 106* 3942 3948 3944 3949 3947 3934
c 2 5 5 8 32 2 2 3 9 1 7 15 1 2 12 3930
a 5 8 6 724 877 85 152 1173 66 7 98 0 0 0 0 -
g 1 1 2 1 7 0 3 1 0 7 0 2 0 81 17 -
solitaire a,g
total 3941 3928 3943 3935 3902 3943 3944 3939 3939 3833 3935 3933 3928 3947 3924 -
a 1899 2808 2130 2724 2721 1493 1288 1813 1699 539 692 96 780 0 15
g 9 5 18 2 11 22 13 5 11 3026 30 190 10 3947 2629
moyenne codon
t/c % 4 7 -17 11 -41 4 -56 5 -17 -25 -7 -2 -35 -7 -15 8
a/g % 20 27 -39 -48 -32 -15 -8 -54 49 -73 -144 39 84 -59 -191 103
ordre corrélation
t 3a 8a 15a 9a 14a 17a 11a 12a 28a 32a 27a 2a 6a 6a 21a 1a
c 13g 1g 4g 12g 7g 22g 8g 20g 3g 5g 17g 2g 9g 9g 23g 11g
a 5a 20a 10a 22a 13a 7a 19a 16a 23a 31a 25a 4a 26a 26a 26g 29a
g 19g 18g 6g 21g 15g 16g 24g 14g 29g 25g 10g 30a 30g 30g 28g 31g
  • Tableau non formaté:voir tableur

Comptes détaillés des tRNAs des 111 bactéries[modifier | modifier le wikicode]

Comptes détaillés[modifier | modifier le wikicode]
Spectres des codons des tRNAs des 111 bactéries[modifier | modifier le wikicode]
Spectres des codons des tRNAs111
n tRNAs    ttc tta ttg    tcc tca tcg    tac taa tag    tgc tga tgg
0 0 3 4 6 0 34 0 2 78 1
1 80 94 104 95 91 73 82 93 33 101
2 22 9 2 9 16 3 18 13 8
3 8 3 1 1 2 1 8 1 1
4 1 1 2 2 2
5 1 0
autres 1
ctc cta ctg ccc cca ccg cac caa cag cgt cga cgg
0 12 1 28 33 0 44 2 0 50 11 76 21
1 89 97 66 72 93 65 91 83 47 67 34 88
2 10 11 9 4 12 1 18 18 14 19 1 2
3 1 2 2 5 1 6 4
4 0 6 1 3 8
5 1 1 0
autres 2
atc ata atg acc aca acg aac aaa aag agc aga agg
0 0 0 9 0 29 0 1 37 0 0 16
1 53 0 85 90 80 65 73 62 99 102 90
2 23 3 16 8 2 21 17 7 10 7 4
3 24 55 1 7 11 7 4 2 2 1
4 6 20 6 9 5 1
5 4 12 3 3
autres 1 21 2 5
gtc gta gtg gcc gca gcg gac gaa gag ggc gga ggg
0 20 0 65 24 0 62 0 0 61 3 0 44
1 72 73 39 66 53 49 50 63 40 51 86 65
2 12 13 6 20 18 35 21 4 27 14 1
3 7 13 1 1 24 16 12 5 19 8 1
4 6 8 8 8 1 8 2
5 4 5 1 2 1 1
autres 2 3 1 5 2
  • Tableau non formaté: voir tableur
Comptes des solitaires des tRNAs des 111 bactéries[modifier | modifier le wikicode]
                           Résultat     Formules
                        nom     cellule         
4 codons        ctx     0       ES12    SI(ET(DC12=0,DD12=0,DE12=0,DF12=0),1,0) 
                        ctt     ET12    SI(ET(DC12>0,DD12=0,DE12=0,DF12=0),1,0)      
                        ctc     EU12    SI(ET(DC12=0,DD12>0,DE12=0,DF12=0),1,0)      
                        cta     EV12    SI(ET(DC12=0,DD12=0,DE12>0,DF12=0),1,0)      
                        ctg     EW12    SI(ET(DC12=0,DD12=0,DE12=0,DF12>0),1,0)      
2 codons        ctt,ctc ctt     EX12    SI(ET(DC12>0,DD12=0),1,0)    
                        ctc     EY12    SI(ET(DC12=0,DD12>0),1,0)    
                        11      EZ12    SI(ET(DC12=1,DD12=1),1,0)       
                        01      FA12    SI(SOMME(EX12:EZ12)=0,1,0)      
La procédure utilisée ici pour 111 bactéries est la même que j'ai utilisée pour les 4032 bactéries de la base gtRNAdb: un tRNA est dit solitaire pour un carré donné (ctx), s'il ne contient qu'un seul type (ctt), les autres (ctc cta ctg) étant nuls. Pour les 4032 bactéries je cherchais les occurrences *ctt*, *ctt;ctt*, . . . .. Ici pour le nom ctt je teste la condition ctt>0 et (ctc=0 cta=0 ctg=0) pour une bactérie donnée. Ce qui donne dans calc pour la bactérie zin (ligne 12) les codonss "ctt ctc cta ctg" (colonnes DC12 DD12 DE12 DF12). La cellule DC12 correspond à la ligne zin et à la colonne ctt du tableau des décomptes détaillés ci-dessus.
  1. 4 codons: calculs pour les 4 codons non nuls d'un carré et 0 s'il n'y a aucun tRNA.
  2. 2 codons: calculs sur 2 codons supposés lus par un seul tRNA. ctt,ctc,11,01: respectivement, seul le codon ctt ou ctc a plus d'un tRNA, ctt et ctc ont chacun 1 seul tRNA, autre combinaison. La colonne avec (*) correspond au cas où les 2 codons n'ont pas de tRNA parmi le décompte "autre combinaison".
Les xxt ne sont pas présentés sauf ctt cgt act, car ils n’ont pas de tRNA (voir tableau).
Donc il n’y a pas de résultat pour
ttt,c Phe
tct,c Ser . . . .
DC12 cellule ctt du tableau pour la bactérie zin
DD12 cellule ctc du tableau « 
. . . .
EX12 cellule du résultat du test ctt pour 2 codons
EY12 cellule du résultat du test ctc pour 2 codons
EZ12 cellule du résultat du test 11 pour 2 codons
Les résultats présentés sont la somme des colonnes des noms
Leu 0
Leu ctt
. . . . . . . .
Comptes des solitaires des tRNAs des 111 bactéries
Leu 0 1 Arg 0 1 Glu gaa 61 Thr 0 0 Gly 0 0
ctt 0 cgt 4 gag 0 act 0 ggc 0
ctc 0 cgc 1 11 28 acc 0 gga 3
cta 6 cga 0 01 22 aca 6 ggg 0
ctg 0 cgg 0 Trp tga 0 acg 0 gga 44
ctt 5 cgt 100 tgg 77 act 2 ggg 0
ctc 99 cgc 10 11 29 acc 99 11 54
11 0 11 0 01 5 11 1 01 13
01 7 7* 01 1 1* Val 0 0 01 9
cta 27 cga 15 gtc 0 aca 29
ctg 0 cgg 70 gta 20 acg 0
11 63 11 18 gtg 0 11 72
01 21 1* 01 8 6* gta 65 01 10
tta 4 aga 16 gtg 0 Ala 0 0
ttg 3 agg 0 11 37 gcc 0
11 87 11 85 01 9 gca 23
01 17 01 10 Pro 0 0 gcg 0
Ser 0 0 Lys aaa 37 ccc 0 gca 62
tcc 0 aag 1 cca 29 gcg 0
tca 6 11 47 ccg 0 11 30
tcg 0 01 26 cca 106 01 19
tca 34 Gln caa 50 ccg 0
tcg 0 cag 0 11 3
11 68 11 41 01 2
01 9 01 20
  • Tableau non formaté: voir tableur
Comptes détaillés des tRNAs des 111 bactéries: totaux[modifier | modifier le wikicode]
I. 4032 bactéries: total
ttt 10 tct 5 tat 4 tgt 3
c 6105 c 4520 c 6420 c 4473
a 4749 a 5299 a a 1315
g 3999 g 2622 g g 4366
ctt 369 cct 10 cat 4 cgt 7478
c 3849 c 2742 c 4715 c 333
a 4940 a 5453 a 6388 a 887
g 5186 g 2183 g 2389 g 3355
att 5 act 103 aat 5 agt 1
c 9,203 c 4513 c 8,764 c 4422
a 55 a 5878 a 9,105 a 4804
g 18,026 g 2760 g 2427 g 3452
gtt 9 gct 2 gat 0 ggt 1
c 4430 c 4166 c 9,023 c 9,273
a 8,859 a 10,185 a 9,679 a 5515
g 1313 g 1224 g 1388 g 2266
II. 4032 bactéries : 100 * n / 3950
0.3 0.1 0.1 0.1
155 114 163 113
120 134 33
101 66 111
9.3 0.3 0.1 189
97 69 119 8.4
125 138 162 22
131 55 60 85
0.1 2.6 0.1 0.0
233 114 222 112
1.4 149 231 122
456 70 61 87
0.2 0.1 0.0 0.0
112 105 228 235
224 258 245 140
33 31 35 57
I'. 111 bactéries: total
ttt 0 tct 0 tat 0 tgt 1
ttc 152 tcc 116 tac 156 tgc 130
tta 130 tca 137 taa 0 tga 33
ttg 111 tcg 82 tag 0 tgg 120
ctt 6 cct 0 cat 0 cgt 162
ctc 109 ccc 86 cac 127 cgc 10
cta 127 cca 136 caa 154 cga 36
ctg 114 ccg 70 cag 75 cgg 92
att 0 act 6 aat 0 agt 0
atc 222 acc 120 aac 204 agc 125
ata 4 aca 151 aaa 201 aga 122
atg 462 acg 84 aag 92 agg 101
gtt 0 gct 0 gat 0 ggt 0
gtc 117 gcc 109 gac 211 ggc 213
gta 199 gca 237 gaa 221 gga 151
gtg 54 gcg 49 gag 67 ggg 70
II'. 111 bactéries : 100 * n / 111
0 0 0 0.9
137 105 141 117
117 123 0 30
100 74 0 108
5.4 0 0 146
98 77 114 9
114 123 139 32
103 63 68 83
0 5.4 0 0
200 108 184 113
3.6 136 181 110
416 76 83 91
0 0 0 0
105 98 190 192
179 214 199 136
49 44 60 63
  • Tableaux non formatés: voir tableur
Comptes détaillés des tRNAs des 111 bactéries: solitaires[modifier | modifier le wikicode]
II 4032. Nombre de bactéries à tRNAs solitaires de 4 codons. Total requête.
ttt 3948 tct 3945 tat 3934 tgt 3947
c 15 c 2 c 3930 c 12
a 0 a 85 a a 0
g 2 g 0 g g 17
ctt 3942 cct 3941 cat 3948 cgt 106*
c 7 c 3 c 5 c 1
a 98 a 1173 a 6 a 7
g 0 g 1 g 2 g 7
att 3949 act 3946 aat 3949 agt 3944
c 2 c 2 c 2 c 1
a 0 a 152 a 5 a 0
g 81 g 3 g 1 g 0
gtt 3943 gct 3934 gat 3949 ggt 3948
c 8 c 32 c 5 c 9
a 724 a 877 a 8 a 66
g 1 g 7 g 1 g 0
III 4032. Nombre de bactéries à tRNAs solitaires des codons a,g. Total requête.
tt tc ta tg
sag 3933 sag 3943 sag sag 3934
a 96 a 1493 a a 15
g 190 g 22 g g 2629
ct cc ca cg
sag 3935 sag 3939 sag 3943 sag 3833
a 692 a 1813 a 2130 a 539
g 30 g 5 g 18 g 3026
at ac aa ag
sag 3947 sag 3944 sag 3941 sag 3928
a 0 a 1288 a 1899 a 780
g 3947 g 13 g 9 g 10
gt gc ga gg
sag 3935 sag 3902 sag 3928 sag 3939
a 2724 a 2721 a 2808 a 1699
g 2 g 11 g 5 g 11
II 111. Nombre de bactéries à tRNAs solitaires des carrés à 4 codons.
ttt 111 tct 111 tat 111 tgt 110
c 0 c 0 c 0 c 0
a 0 a 6 a a
g 0 g 0 g g 1
ctt 111 cct 111 cat 111 cgt 4*
c 0 c 0 c 0 c 1
a 6 a 29 a 2 a 0
g 0 g 0 g 0 g 0
att 111 act 111 aat 111 agt 111
c 0 c 0 c 0 c 0
a 0 a 6 a 0 a 0
g 0 g 0 g 0 g 0
gtt 111 gct 111 gat 111 ggt 111
c 0 c 0 c 0 c 0
a 20 a 23 a 0 a 3
g 0 g 0 g 0 g 0
III 111. Nombre de bactéries à tRNAs solitaires des codons a,g.
ttt tct 111 cg 110 tgt
sag 111 sag 111 sct 110 sag 110
a 4 a 34 t 100 a 0
g 3 g 0 c 10 g 77
ctt 110 cct 111 cat cgt 110
sag 110 sag 111 sag 111 sag 105
a 27 a 106 a 50 a 15
g 0 g 0 g 0 g 70
ctt 111 act 111 aat agt
sct 104 sag 111 sag 111 sag 111
t 5 a 29 a 37 a 16
c 99 g 0 g 1 g 0
gtt 111 gct 111 gat ggt 111
sag 111 sag 111 sag 111 sag 111
a 65 a 62 a 61 a 44
g 0 g 0 g 0 g 0
IV 4032. Pourcentage des bactéries à tRNAs solitaires.
tt tc ta tg
%4 2.2
1a1g 2804 2114 1238
%2 7 38 67
ct cc ca cg
%4 2.7 29.9 3.1
1a1g 962 1911 996 222
%2 18 46 54 93
at ac aa ag
%4 2.1 4.0
1a1g 0 2166 1155 2579
%2 100 33 48 20
gt gc ga gg
%4 18.6 23.3 1.9
1a1g 1051 562 602 1973
%2 69 70 72 43
ct cg ac
%4 2.7 3.1 4.0
1t1c 8 10 41
%2 99 99 98
IV 111. Pourcentage des bactéries à tRNAs solitaires.
tt tc ta tg
%4 5,4
1a1g 87 68 0 29
%2 6 31 100 70
ct cc ca cg
%4 5,5 26.1 4,5
1a1g 63 3 41 18
%2 25 95 45 81
at ac aa ag
%4 0 5,4
1a1g 0 72 47 85
%2 99 26 34 14
gt gc ga gg
%4 18.0 20.7 2,7
1a1g 37 30 28 54
%2 59 56 55 40
ct cg ac
%4
1t1c 0 0 1
%2 100 100 91
  • Compléments
                Nombre de bactéries à tRNAs solitaires des codons c,t.                                                  
4032    sct     t       c                       111     sct     t       c
ac      3775    41      3682                    ac      111     2       99
cg      3932    3614    307                     cg      110     100     10
ct      3834    323     3502                    ct      104     5       99
  • Tableaux non formatés:voir tableur
tRNAs des 111 bactéries: Diagramme des solitaires APV[modifier | modifier le wikicode]
  • Diagramme des solitaires APV .
        Effectifs des tRNAs solitaires APV                                                      
%GC     A       P       V       T       G       L       R       S
15-20   2       2       2       2       0       0       1       1
20-25   3       3       2       1       2       2       2       2
25-30   10      11      5       3       1       4       1       3
30-35   2       3       2       0       0       0       1       0
35-40   5       6       5                                       
40-45   1       4       1                                       
45-50   0       0       2                                       
50-55   0       0       1                                       
55-60   0       0       0                                       
total   23      29      20      6       3       6       5       6

Comparaison des 3 domaines avec les nombres des tRNAs[modifier | modifier le wikicode]

  • Légende: Décompte des gènes tRNAs par codon suivant la base de données gtRNAdb [4]. La statistique de la base donne les effectifs suivants:
Domain          Number of Genomes       Number of tRNAs         Moyenne         Nombre de tRNAs
                                                                                comptés
Bacteria        4,032                   239,000                 59              235,027
Archaea         184                     8,731                   47              8,749
Eukaryota       155                     119,380                 770             115,111
Eukaryota       121                     −                       461             55,830
Zebrafish       1                       −                       12,258          12,258
Nombres de tRNAs, pour 100 000 tRNAs et tRNAs par génome[modifier | modifier le wikicode]
  • Voir après le texte les tableaux des gènes tRNAs et leur légende.
Au niveau de l'ADN le code génétique est structuré par doublets.[modifier | modifier le wikicode]
  • Lien au tableau analysé: ci-dessous.
  • La genèse des gènes de tRNAs et leur duplication
    1. Problématique:
      − Nous avons vu dans le tableau des corrélations (3.Résultats/1.−) entre gènes de tRNAs qu'il y a une très forte corrélation entre 18 codons pour les 3 combinaisons des 3 domaines BAE. Malgré les fortes corrélations obtenues entre un plus grand nombre de codons pour certaines combinaisons, il reste un très grand nombres d'exceptions, jusqu'à 44 pour les combinaisons EB et EA. Cependant les 18 codons précédents laissent penser que le comportement d'un gène de tRNA dans le code est déterminé dans l'ADN avant même son intervention dans la machinerie traductionnelle. Pourtant, même dans l'hypothèse de la résonance dans l'ADN, celle d'un codon dans les gènes de protéines, fraction de la résonance du gène protéique, ne peut être comparée à celle de l'unique codon porté par son gène tRNA. La question qui se pose alors est: est-ce qu'on va retrouver la même structuration du code génétique par les gènes des tRNAs que par les codons dans les gènes protéiques? Si c'est oui, alors l'hypothèse de la résonance des gènes protéiques se trouve renforcée parce qu'il n'y a pas de lien direct, si ce n'est la sélection, entre le gène du tRNA dans l'ADN et son codon dans le gène protéique.
      − Les différences entre les processus qui interviennent dans la création et la duplication des gènes de tRNAs entre les 3 domaines permettent de mettre à l'épreuve la structuration du code génétique par ces processus. Un aperçu des processus théoriques est signalé dans la problématique du tableau des corrélations. L'analyse des tableaux des nombres des gènes des tRNAs en introduction [5] montre bien qu'il y a de grandes différences entre les processus des 3 domaines.
    2. Méthode d'analyse:
      − Comme pour les corrélations entre nombres de gènes de tRNAs il s'agit de retrouver une indépendance de la structuration du code par les doublets, par rapport aux 3 processus différents des 3 domaines, pour qu'on puisse attribuer cette structure aux propriétés physiques de chaque doublet. La méthode d'analyse consiste à dégager des propriétés communes à 4, 3 ou 2 doublets d'une ligne ou d'une colonne. Comme pour les répétitions des bases [6] la force d'interprétation est attribuée aux lignes ou colonnes ayant le plus de doublets communs.
      − En introduction j'ai détaillé la méthode de lecture des 3 tableaux I, II et III indicés par 100 pour les nombres de tRNAs rapportés à 100 000 par domaine [7]. J'utiliserai les 3 tableaux I, II et III indicés par le chiffre 1 pour le nombre de gènes de tRNAs par génome ou indice de multiplicité et les tableaux des rapports E/B . Au fur et à mesure j'illustrerai les discussions par des tableaux simples de rapports entre codons. Pour simplifier l'écriture je parle souvent de codon pour les gènes de tRNA. Je préciserai qu'il s'agit de la traduction le cas échéant.
      − Dans un 1er temps je décrirai la structuration de chaque code de chaque domaine en commençant par les structures les plus nettes et les comparerai au code génétique de la traduction. Je n'attribue un aa à un codon que pour le code de la traduction. Aussi la comparaison avec ce dernier ne se fera que par doublet ( ou carré à 4 codons).
      − Dans un 2ème temps je procéderai aux comparaisons entre codes pour dégager une structuration commune.
    3. Résultats:
      1.− Code du domaine E, les eucaryotes.
      Liens: effectifs tRNAs,   demi-doublets,   Lignes et colonnes,  comportement des 121 eucaryotes
      1.a − les bascules des codons c en t chez E.
      • Le processus qui donne naissance aux gènes de tRNAs chez les eucaryotes est sensible aux codons se terminant par t des doublets ct at gt xc cg; il est sensible aux codons se terminant par c des doublets tt xa tg ag gg. Ce qui donne 8 gènes à codons xyt et 8 gènes à codons xyc sensibles. Visuellement le code est structuré en colonnes, la 1 avec 3 doublets et la 2 avec 4 doublets sensibles aux codons se terminant par t, et la colonne 3 avec 4 doublets et la 4 avec 3 doublets sensibles aux codons se terminant par c. Il est aussi structuré en lignes, la 1 et la 2 avec 3 doublets chacune sensibles aux codons se terminant par t ou c, et la 3 et la 4 chacune sensible à 2 doublets de codons se terminant par t et à 2 doublets de codons se terminant par c
      • Si l'on compare au code génétique de l'amino-acylation, il y a une très grande similitude entre les 2 processus. Les enzymes qui fixent l'aa au tRNA après les modifications ne distinguent pas les tRNAs d'un doublet ct gt xc cg gg quand ce doublet en a plusieurs. Après traduction les 4 codons d'un même doublet de ce groupe donnent donc le même aa. Les enzymes qui fixent l'aa au tRNA des doublets tt at xa tg ag distinguent, pour le même doublet, entre les tRNAs d'un demi doublet portant les codons se terminant par t c, des tRNAs de l'autre demi doublet portant les codons se terminant par a g. Chaque demi doublet pouvant produire 1 à 2 tRNAs portant le même aa. Après traduction un doublet de ce groupe donne 2 aas sauf pour le doublet ta.
      • La similitude entre les 2 processus n'est pas totale puisque le doublet gg appartient au 2ème groupe du processus de genèse (sensible à ggc) et au 1er groupe du processus de fixation (fixant le même aa sur tous les tRNAs du doublet). Inversement le doublet at appartient au 1er groupe de genèse (sensible à att) et au 2ème groupe de fixation (fixant 1 aa par demi-doublet at). C'est seulement avec les eucaryotes que le doublet gg apparaît nettement comme une exception. Avec seulement les nombres de tRNAs, ce doublet n’apparaît pas comme une exception dans les tableaux I et II. Apparaissent par contre comme exception, dans les 9 tableaux des nombres, les 3 mêmes doublets at ta tg. Ainsi le doublet gg fait exception pour le basculement c/t, le doublet tg fait exception pour le nombre de tRNAs de son codon tga, le doublet ta pour ses 2 codons stop et le doublet at 3 fois exceptionnel par le nombre de tRNAs de son codon atg dans les 3 tableaux, par le nombre de tRNAs de son codon ata dans les tableaux I et II seulement, et par la bascule c/t dans le tableau III.
      • Le code de la genèse des tRNAs chez les eucaryotes est structuré aussi en demi-doublets: La structuration en demi-doublet dans le processus de fixation est matérialisée par la traduction d'un doublet en 2 aas différents, un aa pour les codons se terminant par c t et un aa pour les codons se terminant par a g. Cette structuration n'est valable que pour les doublets tt at xa tg ag. Avec la bascule c/t chez les eucaryotes tous les doublets sont structurés en demi-doublet c t et en demi-doublet a g. Par contre cette structuration n'est pas matérialisée pour les 2 processus de genèse et de fixation. Le processus de fixation n'a à sa disposition souvent qu'un à deux tRNAs par doublet et nécessite un processus supplémentaire pendant la traduction sur le RNAm pour le codon tga , et un processus spéciale de modification, avant celui de la fixation, pour différencier 2 tRNAs identiques du codon atg qui fixeront l'un Met lisant le codon atg et l'autre Ile lisant le codon ata. Ainsi la structuration en demi-doublet est potentielle pour le processus de fixation et se réalise avec la traduction. La structuration en demi-doublets du processus de genèse est la manifestation directe de la bascule c/t pour les 8 doublets concernés, du fait que les demi-doublets a g ne basculent pas. La structuration des autres 8 doublets ne basculant pas, se déduit du comportement semblable des demi-doublets c t des 2 groupes avec une grande différence entre le nombre des tRNAs du codons c et celui du codon t mais de sens inverse dans les 2 groupes. Les différences entre les nombres des codons a g sont beaucoup plus faibles, semblables et des 2 signes dans les 2 groupes. Voir le tableau des rapports des Demi-doublets à la suite du texte, où les rapports colorés sont des rapports inversés. Les exceptions des doublets at ta tg qu'on a révélé au paragraphe précédent met en jeu les 2 codons des 3 demi-doublets a g et aucun des 3 demi-doublets c t.
      1.b − les codons a et g de E
      • Les rapports g/a: Avec la bascule t/c nous avons défini les demi-doublets dans chaque doublet et partagé le code des gènes de tRNAs en 2 groupes dont les rapports t/c sont inversés l'un par rapport à l'autre. En utilisant les rapports g/a nous obtenons alors 4 groupes qui se différencient par des rapports t/c pour moitié inverse l'une de l'autre et de même pour le rapport g/a. Les 4 groupes de doublets se répartissent comme suite: voir tableau.
        4 dont les rapports t/c et g/a sont directs ( blanc, blanc).
        3 dont le rapport t/c est direct et le rapport g/a inversé (blanc, cyan).
        3 dont le rapport t/c est inversé et le rapport g/a direct (orange, blanc).
        5 dont le rapport t/c est inversé et le rapport g/a inversé (orange, cyan).
        Plus le doublet ta avec ses 2 codons stop (blanc).
      • Lignes et colonnes: Avant de détailler les caractéristiques de chaque doublet au paragraphe suivant on peut apprécier le poids de la 1ère et la 2ème base du doublet, du point de vue quantitatif, en étudiant les statistiques des lignes et des colonnes du tableau. Il est évident que le doublet ne peut être caractérisé que du point de vue qualitatif, c'est à dire avec des nombres et des rapports très différents. Le tableau des moyennes des codons pour une 3ème base, pour une ligne et pour une colonne, et les totaux par doublet, différencie nettement la ligne 4 par rapport aux 3 autres avec tous les codons ayant des effectifs les plus élevés de leur colonne dans le tableau des nombres III. C'est le reflet de la base G en 1ère position. Ce tableau différencie aussi nettement la colonne 3 avec les mêmes critères sauf pour le doublet ta avec ses 2 codons stops. Les lignes 1 et 2 avec des moyennes de codon (mcod) très faibles se ressemblent beaucoup et de même pour les colonnes 1 et 2 avec des moyennes faibles. Les rapports des moyennes de codon pour les 3ème bases a et g, g/a , sont inverses entre les 2 lignes d'une part et les 2 colonnes d'autre part. La ligne 3 et la colonne 4 ont des moyennes de codon élevées avec des différences faibles entre les moyennes de codon pour les 3ème bases a et g.
      • Caractérisation des codons: quand les rapports g/a sont semblables entre 2 doublets, je comparerai leurs effectifs.
        − Les 4 doublets ( blanc, blanc):
        tt : son g/a (1.4) est très différent de ceux de tg(7.1) et aa (2.3) mais proche de gg (1.3); tt (1085/773) et gg (6126/4811) sont très différents par leurs effectifs.
        tg : son g/a (7.1) est le plus élevé du tableau à cause de la particularité du codon tga à faible effectif. Son t/c (12) le plus faible du tableau.
        aa : son g/a (2.3) est élevé, 5ème sur 15. aa se distingue par rapport à gg par son codon aaa très faible (5268/2293).
        gg : il se distingue des 3 autres par ses effectifs élevés (6126/4811) qui le différencient du rapport g/a de tt (1085/773) et de celui de ca (1606/1989) trop proche de l'unité (1.2) qui ne justifierai pas son inversion.
        − Les 3 doublets ( blanc, cyan):
        ca: a le rapport g/a (1.2) le plus faible du tableau et se distingue de ag (1.4) par ses effectifs nettement plus élevés (1606/1989) contre (1531/1116).
        ag: il se distingue de ca comme ci-dessus et de ga par son rapport g/a 1.4 contre 1.9, le 6ème sur 15, et par ses effectifs 1531/1116 contre 6150/3261.
        ga: il se distingue des 2 autres par ses effectifs , 6150/3261, et son rapport g/a (1.9).
        − Les 3 doublets (orange, blanc): ct at gt. Ils se différencient par leur effectif du codon g respectivement 1126 3355 2713 et un codon a presque constant, respectivement 758 739 945. C'est la différenciation des colonnes 1 et 2 par le rapport g/a.
        − Les 5 doublets (orange, cyan):
        gc cg se distinguent des 3 autres par le rapport t/c (7.3) le plus bas du tableau pour gc et le rapport g/a inverse (4.5) le plus élevé du tableau pour cg.
        tc cc ac: La distinction par le rapport g/a est nette, respectivement 1.4, 2.2, 1.8. Ils appartiennent à la colonne 2 inverse pour le rapport g/a de la colonne 1. Et de même le codon g est constant comme le codon a de la colonne 1. Mais en plus le doublet tc se distingue par un codon a le plus faible de la colonne 2 et proche de ceux de la colonne 1; le doublet cc a la particularité, dans tout le tableau, d'avoir les codons cct et cca égaux (3/1426); la différence entre 2 codons qui vient après est celle entre cac et cag (26/1606).
      1.c − les exceptions des eucaryotes
      • L'exception du doublet cg: La caractérisation des codons en demi-doublets dans E est structurelle. C'est à dire que les comparaisons entre 2 codons t-c (xyt et xyc) et 2 codons a-g (xya et xyg) ont un sens alors que celles entre les paires t-a, t-g, c-a et c-g n'en ont pas. Ce sens est celui de la bascule, " c/t bascule et a/g ne bascule pas". Une seule exception qui confirme la règle est celle du doublet cg où a/g bascule alors que c/t a déjà fait sa bascule dans B. Nous verrons ce cas en comparant les codes de B et A à celui de E, car c'est un cas isolé difficile à révéler avec les eucaryotes seuls. L'exception du doublet cg apparaît dans le code de B avec la bascule c/t et l’exception disparaît dans E et A. Cette disparition de A fait partie aussi de son exceptionnalité. L'exception de cg dans le code de E c'est sa bascule a/g entre le code B et E alors que sa bascule c/t est une exception dans B et ne l'est plus dans E. La bascule a/g de ce doublet de 4.5 est faible par rapport aux bascules c/t, et au début je la considérait comme une non bascule dans E. Mais c'est la 2ème valeur de ce rapport avec celle du doublet at (4.5), derrière celle du doublet tg (7.1) et devant celle du doublet gt (2.9). Elle est comparable à la bascule c/t la plus faible du doublet gc (7.3). Les rapports g/a du doublet tg et du doublet at ne peuvent pas être considérés comme des bascules parce qu'ils ne s'inversent pas dans aucun code. En conclusion le doublet cg est 3 fois exceptionnel, par sa bascule c/t dans B, la disparition de celle-ci dans A et par sa bascule a/g dans E.
      • L'exception du doublet ta: ce sont les 2 codons stop qu'on connaît dans la traduction et présents dans les 3 code BAE. Absence totale de gène tRNA sinon par mutation d'un autre gène en suppresseur de codon stop.
      • L'exception du doublet tg: le gène de tRNA de son codon tga est souvent absent et le codon devient un codon stop dont son comportement vis à vis du processus GC est lui-même une exception. Quand il est présent il code un tRNA de l'aa Sec. Ce qui explique le rapport de 7.1 de son a/g à peu près constant dans les 3 codes car le gène tRNA du codon tgg du Trp est toujours présent. Dans la traduction le tRNA-Sec nécessite une séquence spécifique dans le RNA messager pour pouvoir lier son aa au polypeptide, ce qui le différencie d'un codon stop. D'où 3 comportements exceptionnels du doublet tg.
      • L'exception du doublet at: Il subit la bascule c/t dans E, donc il est sensible au codon att pour le processus de genèse des tRNAs et appartient au 2ème groupe de fixation des aas (fixant 1 aa par demi-doublet at). Il ne subit pas la bascule a/g mais son codon ata a un indice de multiplicité normal pour le code E de 5.5 alors qu'il est inexistant dans B et A comme leurs codons xyt. Nous pouvons dire qu'il est sensible au processus de la genèse des tRNAs sans basculer. Le rapport g/a du doublet at est de 4.5, égal à celui du doublet cg. Je suppose que les tRNAs ata fixent l'aa Ile chez les eucaryotes. A vérifier. Une 3ème exception du doublet at est le nombre élevé des gènes de tRNA du codon atg même chez les eucaryotes. Chez les procaryotes ces tRNAs fixent la Met et la formyl-Met nécessaire à l'initiation de la traduction et fixent après une modification spéciale Ile et lit le codon ata. D'où un nombre double de celui des eucaryotes. Chez ces derniers l'aa d'initiation est Met mais le nombre de gènes de tRNAs du codon reste élevé. Il est le plus élevé de la 1ère colonne et le 2ème de sa ligne ( 3355 pour atg contre 5268 pour aag, voir tableau des effectifs). C'est comme si, les tRNAs de ata étant présents, les tRNAs de atg étaient modifiés différemment, une moitié servirait à lire le codon atg dans le gène de protéine et l'autre ne servirait qu'à l’initiation. Nous avons, encore là, 3 exceptions pour le doublet at, la bascule c/t, la pseudo-bascule g/a de at et son comportement, et enfin le nombre élevé des tRNAs du codon atg.
      • L'exception du doublet gg: Nous avons décrit cette exception comme propre aux eucaryotes dans l'étude de la bascule c/t. Le doublet gg appartient au 2ème groupe du processus de genèse (sensible à ggc) et au 1er groupe du processus de fixation (fixant le même aa sur tous les tRNAs du doublet). J'ai étudié en détail la fréquence des répétitions de la base G et celle de la base C qui incluent essentiellement les codons ggg et ccc, dans l'article répétition des bases [8]. Développer.
      • L'exception du doublet cc: Il faudrait reprendre les comportements du codon ccc de l'article répétitions des bases [9] en relation de ceux du codon ggg. Mais dans E l'égalité des nombres de tRNA du codon cct et du codon cca est troublante.
      2.− Code du domaine B, des bactéries
      liens: Lignes et colonnes.     effectifs tRNAs     moyennes et variances.     demi-doublets
      2.a − Le code de la genèse des tRNAs chez les bactéries est structuré aussi en demi-doublets: Ce n'est pas aussi spectaculaire que chez les eucaryotes et l'on n'arrivera pas à distinguer le doublet gg comme une exception. Cependant la démonstration est plus aisée qu'avec les archées, très homogènes, où la distinction d'un doublet en 2 moitiés n'est possible qu'en s'appuyant sur le comportement des enzymes qui fixent l'aa sur le tRNA pour 8 doublets. Pour les bactéries je vais utiliser l'indice de multiplicité du tableau I1 , ainsi que la bascule c/t du doublet cg pour montrer cette partition.
      Des indices de multiplicité très faibles, inférieurs à 0.34, conjugués à l’absence des gènes de tRNA des codons se terminant par t (et se terminant par c pour le doublet cg) laissent 3 doublets à 2 aas ( tg at ga ) et 3 doublets à 1 aa ( cg gc gt ) avec 2 codons seulement dont l'indice dépasse largement l'unité ( sauf pour le codon cgg avec 0.83). Quatre autres doublets ont un indice du codon se terminant par g inférieur 0.60, soit seulement un plus que la moitié des indices des codons a et des codons c . Ce sont 2 doublets à 2 aas ( ca aa ) et 2 doublets à 1 acide aminé ( cc gg ). C'est comme si on avait 2 demi-doublets distincts, l'un sans gène de tRNA du codon t et l'autre avec un gène de tRNA du codon g très peu sensible à la duplication. Le doublet cc présente la caractéristique unique des doublets à 1 acide aminé d'avoir 1 seul codon dont l'indice est supérieur à l'unité (avec 0.68 pour le codon ccc) ce qui laisse penser qu'un seul tRNA puisse lire les 4 codons du doublets et serait donc à l'encontre de l'hypothèse du demi-doublet. Mais c'est l'exception qui confirme la règle:
      1. − Le doublet ta, avec un seul tRNA pour un demi-doublet ne code qu'un seul acide aminé.
      2. − Pour le doublet at et le doublet tg, le codon minoritaire est le codon a et il est remplacé par le codon g et non par le codon t. Donc le processus de genèse des tRNAs différencie bien entre les 2 demi-doublets.
      3. − Le doublet cg subit une bascule c/t très nette avec un rapport t/c égal à 22 (voir tableau des demi-doublets) et simultanément subit une bascule g/a franche avec un rapport g/a égal à 3.8 aussi élevé que celui de la même bascule du doublet tg (3.3). C'est comme si le demi-doublet t/c et le demi-doublet a/g étaient bien distincts. N'oublions pas que nous parlons de gènes et non de tRNAs portant un acide aminé.
      4. − Le tRNA du codon peut très bien être absent et celui-ci lu par un autre tRNA. Cela n'empêche pas que le processus de genèse des tRNAs soit plus ou moins sensible au codon ccc.
      5. − Par contre quand les codons du même demi-doublet ont des indices proches ou supérieurs à l'unité, cela veut dire que c'est une contrainte forte qui nécessite les 2 tRNAs en même temps. C'est ce qu'on observe chez les archées (13 doublets avec 3 indices proche de l'unité) et les eucaryotes (avec 5 doublets à 4 indices et 10 doublets à 3 indices proches de l'unité). Dans le cas des bactéries on a 3 doublets qui font exception et imposent 3 tRNAs, ce sont le doublet tt (indices 1.51 1.18 0.99) et le doublet ag (indices 1.10 1.19 0.86) pour 2 aas et le doublet ct (indices 0.95 1.23 1.29) pour 1 seul acide aminé.
      2.b − Le code de la genèse des tRNAs chez les bactéries est structuré aussi en lignes et colonnes:
      Avec les bactéries la majorité des codons xyg (11 sur 15) sont minoritaires dans leur doublet. Comme les codons xyt sont presque inexistants il ne nous reste plus que 3 codons par doublet à comparer. Par leur faiblesse les codons xyg deviennent homogènes et nous permettent alors de différencier les colonnes 2 par 2 et la ligne 4 par rapport aux 3 autres lignes. C'est ainsi que les colonnes 1 et 4 ont chacune 3 codons xyg à effectif élevé ( 1702 2207 7670, 1858 1427 1469 ) alors que les colonnes 2 et 3 ont 7 codons g à effectif faible ( 521 - 1174 ) et la ligne 4 a 4 codons à effectif faible ( 964 - 521 ).
      1. Colonnes 1 − 4: Elles sont différentes par leurs codons xtc/xgc et xta/xga. Les rapports sont supérieurs à 2 sauf pour ttc/tgc égal à 1.4 (j'ai permuté ici le codon cgt et le codon cgc ). Dans chaque colonne les 4 carrés sont très différents. La moyenne des codons de la colonne 1 est de 2.239 et celle de la colonne 4 de 1.830 (voir tableau). Il faut ajouter les codons communs en plus des codons g: la colonne 1 a 2 codons a avant ligne 4, la colonne 4 a 2 codons c sans ligne 4 et cgt.
      2. Colonne 2 − 3: De même que les colonnes 1 et 4, elles se différencient par les effectifs des 2 autres codons xac/xcc et xaa/xca. Les rapports sont élevés mais plus faibles (1.42 - 2.17) sauf pour caa/cca égale 1.17 et gaa/gca égale 0.95. Dans chaque colonne les 4 carrés sont très différents sauf pour les 2 carrés aa et ga qui ne se différencient que par aag (1033) et gag (591). La moyenne des codons de la colonne 2 est de 1.828 et celle de la colonne 3 de 2.566 (voir tableau). Il faut ajouter les codons communs en plus des codons g: la colonne 2 a 3 codons a avant ligne 4, et la colonne 3 avec les codons a et les codons c.
      3. Ligne 4 − 3: Pour les codons g la ligne 4 contient les 4 valeurs les plus faibles. Elle se caractérise aussi par les 3 codons a les plus élevés de tous le tableau. La moyenne des codons de la ligne est de 2.347. Cette moyenne est comparable à celle de la ligne 3 avec 2.354. Les 2 lignes sont donc de même puissance. La ligne 4 se différencie par l'homogénéité de ses codons a (3) les plus élevés du tableau et celle de ses codons g (4) les plus faibles du tableau. Les codons g de la ligne 3 sont 2 fois plus élevés que ceux de la 4, par contre elle n'affiche que 3 codons à effectif supérieur à 3.000 contre 5 pour la ligne 4. Les 3 lignes de codons de la ligne 3 ne sont pas homogènes, aucune d'elles n'aligne 3 effectifs semblables alors que la ligne 4 en a 2 homogènes.
      4. Ligne 1 −2: Ces 2 lignes ont des moyennes de codons nettement inférieures à ceux des lignes 3 et 4, respectivement 1.867 et 1.757 contre, respectivement, 2.354 et 2.387 pour la ligne 3 et 4. Elles sont donc comparables. Elles ont leurs lignes de codons g semblables à celle de la ligne 3, hétérogénéité et effectifs élevés. La ligne de codons c de la ligne 1 est plus forte et plus homogène que celle de la ligne 2, faible et hétérogène. La ligne de codons a de la ligne 2 est homogène alors que celle de la ligne 1 non.
      2.c − Les exceptions dans le domaine B des bactéries.
      − En construisant le tableau des lignes et colonnes (ref.), j'avais tenu compte, dans un 1er temps, des exceptions que j'avais décrites dans le chapitre des eucaryotes (ref.). En ajoutant les exceptions propres au domaine B il m'est apparu, qu'en fait, tout doublet est caractérisé par sa ligne et sa colonne avec les 2 processus de genèse des tRNAs des domaines E et B. Aussi, je n'ai retiré, dans le tableau que 4 codons: taa tag pour les 3 domaines et ata atg pour les 2 domaines B et A seulement parce que les 2 1ers sont des codons stop, que le codon ata ressemble par sa faiblesse (comme les codons xyt des domaines A et B) à un codon stop et qu'enfin le codon atg, associé au même demi-doublet que ata et avec des effectifs élevés dans A et B, pouvait être retiré de ces 2 domaines comme le codon ata. J'ai gardé le codon ata et le codon atg dans le domaine E parce qu'ils ont des effectifs analogues aux autres codons de E.
      − Nouveaux comportements des exceptions déjà décrites dans le domaine E:
      • ta: rien de nouveau.
      • tg: le codon tgg augmente légèrement son effectif par rapport à celui du domaine E et apparaît comme un codon xyg majeur dans B (effectif dans B, 1.858).
      • gg: il n'est plus une exception dans B, car il n'a pas de sensibilité au codon ggt (gène tRNA) et code 1 seul aa (amino-acylation).
      • cc: il n'y a plus égalité entre cct et cca, mais il y a faiblesse et presque égalité entre ccc et ccg. J'ai utilisé ce changement pour montrer la partition en demi-doublet dans le domaine B.
      • cg: La bascule c/t apparaît dans le domaine B et est maintenue dans le domaine E. Le rapport g/a s'inverse dans B par rapport à E et cgg devient majeur (effectif dans B, 1.427) parmi les codons xyg de B. Le codon cgg lui même devient une nouvelle exception dans B. Son effectif est réduit de 69% et celui du codon cga associé à son demi-doublet est multiplié par 5 dans E. C'est l’effet de la bascule g/a.
      • at: redevient normal pour la sensibilité au codon att du fait qu'il perd cette sensibilité (gène tRNA), comme le doublet gg et qu'il code pour 2 aas (amino-acylation). Par contre le codon ata devient inexistant, équivalent à un codon xyt, le codon atc et le codon atg voient leurs effectifs doublés par rapport au domaine E. Les tRNAs du codon atg semblent subir 3 types de modifications, une pour fixer Met, une pour fixer formyl-Met comme tRNA d'initiation de la traduction chez les procaryotes et une pour fixer Ile. D'où le doublement de son effectif dans B et apparaît comme un codon xyg majeur dans B (effectif dans B, 7.670).
      − Nouvelles exceptions dans le domaine B:
      • ct: il apporte 2 nouvelles exceptions. L'effectif du codon ctt devient aussi significatif que le codon cgc dans B, mais il n'y a pas bascule. Et le codon ctg devient majeur (effectif dans B, 2.207) parmi les codons xyg de B. L'effectif du codon ctg est réduit de 50% et celui du codon cta associé à son demi-doublet est réduit de 65% dans E.
      • tt: son codon ttg est un codon xyg majeur dans B (effectif dans B, 1.702). Son effectif est réduit de 37% et celui du codon tta associé à son demi-doublet est réduit de 62% dans E.
      • ag: il arbore le même comportement que le doublet tt. Son codon agg est un codon xyg majeur dans B (effectif dans B, 1.469). Son effectif est réduit de 25% et celui du codon aga associé à son demi-doublet est réduit de 27% dans E.
      • tc: L'exception n'apparaît qu'en comparant B avec E. Son codon tca paraît banal dans B et dans E parmi les autres codons xya. Mais son effectif est réduit de 61% dans E par rapport à B. L'effectif de son codon tcg associé au demi-doublet est lui réduit de 43%.
      − Les aas à 6 codons: Avec le processus de genèse des tRNAs dans E j'avais trouvé que la sensibilité à la bascule c/t était associée aux doublets à 1 acide aminé sauf pour le doublet gg. Dans B le processus de genèse différencie entre codons xyg majeurs (6) et mineurs (9). Et 4 codons xyg majeurs se trouvent associés aux aas à 6 codons, 2 pour la Leu (ttg ctg) et 2 pour l'Arg (cgg agg). La Ser avec 6 codons ne suit pas. Elle se distingue par le fait qu'elle n'a pas 2 codons xyg et son codon tca qui est réduit fortement.
      − Les comportements différents des demi-doublets a g et des demi-doublets t c:
      • Les demi-doublets t c réagissent fortement, par la bascule c/t, au processus de genèse des tRNAs des eucaryotes (7 cas) et peu à celui des bactéries (1 cas). Par contre le processus de B augmentent fortement les codons c relativement aux codons c de E et aux codons t qui ont basculés dans E, sauf tgc ccc gcc. Et le processus de E n'interfère pas sur celui de B, le rapport t/c pour le doublet cg reste pratiquement le même (respectivement 28 contre 22).
      • Par contre les demi-doublets a g réagissent aux 2 processus par des bascules a/g plus modérées que les bascules c/t, par des exceptions communes aux 2 domaines (tg où tga est faible, at où ata est quasiment inexistant dans B et ta avec les 2 codons stop) et par des réductions et des augmentations de forces variées des codons xyg et/ou xya. C'est ainsi que les exceptions apparaissent toujours avec les demi-doublets a g sauf pour le doublet cc où les 2 codons sujets de l'exception (égalité entre eux) changent de c/g dans B à t/a dans E, et le doublet gg qui doit son exception à son insensibilité aux 2 processus. A la différence de la bascule c/t qui ne change pas entre B et E, la bascule g/a du doublet cg est inversée entre B et E.
      • En résumé les 2 processus de genèses et de duplication des tRNAs dans E et B sont complètement différents.
      3.− Code du domaine A, les archées.
      3.a − Le processus de genèse et de duplication des tRNAs est très différent de ceux de E et B.
      liens: Introduction aux tRNAs, paragraphe archées [10] pour l'uniformité des archées.     Aperçu théorique du processus chez les archées dans les corrélations, chapitre "1.− Problématique".     Demi-doublets     Lignes et colonnes.     effectifs tRNAs     moyennes et variances.     ordre des codons.     1ère 2ème valeur.     ordre dans les carrés.     groupes de codons.     comparaison par tri.     diagramme global.
      Malgré la disparition des sensibilités détectées avec les bactéries et les eucaryotes avec leurs exceptions, je retrouve, par comparaison, la structuration en ligne et colonne. La structuration par demi-doublet reste faisable pour les aas à 2 codons mais devient difficile pour les aas à 4 codons. Avec les archées, à cause de l'uniformisation ou autrement dit, du manque de sensibilité du processus, apparaît la structuration par codon, comme si elle était masqué par les processus puissants des E et B.
      Structuration par codons: Elle devrait se traduire, pour un doublet donné et quelque soit ce doublet, par les 4 codons tous différents entre eux. Étant donné la faiblesse des différences entre codons on aurait du avoir, statistiquement, quelques égalités strictes entre codons du même doublet sur 15 doublets avec 3 codons non nuls chacun.
      • Si maintenant on admet que le processus agit spécifiquement sur les codons se terminant par g puisque 13 d'entre eux ont des effectifs strictement inférieurs (gtg 1943) à ceux des codons se terminant par a c (ccc 1955) en omettant, de façon évidente, les 2 exceptions des doublets tg et at , il reste alors 13 couples a c à comparer (effectifs tRNAs). Chez les archées seuls deux couples a c diffèrent d'une unité (aga c) sur 187 et de 2 (cga c) sur 187. Chez les eucaryotes 1 seul couple (cct a) diffère de 3 sur 1641. Sinon dans les 3 domaines les différences sont largement supérieures (1ère 2ème valeur). Voici le tableau des 1ères valeurs les plus faibles.
      • Si on compare (multiplicité tRNAs) codon par codon, entre les 2 domaines B et A, il y a des ressemblances évidentes qui font penser aux corrélations déjà étudiées (corrélations). C'est ainsi pour les couples gca c (1.03 - 2.53 / 1.00 - 1.39), gaa c (2.24 - 2.40 / 1.18 - 1.25), gga c (2.30 - 1.37 / 1.32 - 1.03), cca c (0.68 - 1.35 / 0.93 - 1.00), respectivement pour B / A, xya - xyc.
      • Dans l'hypothèse de la résonance de l'ADN tous les codons devraient être différents entre eux. Par contre pour les archées seuls, avec leurs faibles effectifs j'ai trouvé plusieurs codons de même effectif: (diagramme global) 8 paires, 1 quadruple et un triple sur les 44 codons du diagramme. Le contraste entre l'ensemble des codons et les codons d'un même carré chez les archées est nette. Les codons d'un carré ne diffèrent entre eux que par une base à la 3ème position, ils sont donc comparables car les tRNAs avec leur résonance propre, ont une direction qui est nécessairement sensible aux processus de genèse des tRNAs des archées qui ne font pas beaucoup de duplication. La différence de résonance entre 2 codons d'un même carré est donc celle des résonances des 2 3ème bases qui, en principe, sont différentes par leurs architectures moléculaires. Et c'est pour cela qu'il y a structuration par codon. La différence de résonance entre 2 codons de 2 carrés différents peut être plus faible qu'entre 2 codons du même carré. Car la résonance d'un codon est la combinaison des états vibratoires de ses 3 bases, qui peuvent s'affaiblir ou au contraire se renforcer d'après la théorie ondulatoire.
      • Les codons identiques dans les carrés triés sur la 1ère et la 2ème base: Avec l'uniformité des archées le regroupement des codons suivant la 1ère et la 2ème base au lieu de la 3ème comme précédemment donne à peu près le même résultat, cependant avec une légère diminution de la 1ère à la 3ème base comme si effectivement cette dernière était sensible à la résonance des tRNAs pendant leur création. Les résultats pour la 1ère et la 2ème base sont consignés dans le tableau des codons identiques dans les 3 domaines. Les résultats pour la 3ème base sont ceux déjà étudiés précédemment avec la comparaison des 1ères 2èmes valeurs. La diminution des codons identiques se décile comme suite:
        + Par rapport à la 1ère base nous avons chez les archées (voir tableaux des effectifs et non en 100000 tRNAs) 3 couples identiques (jaunes) et 7 couples se différenciant par 1 seul tRNA (orange); chez les bactéries 1 couple presque identique (jaune) avec une différence seulement de 3 pour 2000, vient ensuite 1 couple (cyan) avec une différence de 17 pour 1000; chez les eucaryotes les différences sont toujours supérieurs à 2%.
        + Par rapport à la 2ème base, chez les archées 2 couples identiques (jaune), 4 couples différant par 2 tRNAs (orange) et 3 couples par 2 tRNAs (cyan), en comptage direct; chez les bactéries 1 seul couple avec une différence de 1% de même pour les archées (cyan).
        + Par rapport à la 3ème base, chez les archées 1 couple différant par un tRNA et un autre par 2, les autres par plus de 6; chez les bactéries tous les couples ont une différence supérieure à 2%; chez les eucaryotes 1 seul couple presque identique (cct cca que nous avions repéré comme une exception) avec une différence de 3 pour 1638 (comptage direct) tous les autres dépassent les 7%.
      • J'ai cherché ensuite à comparer tous les codons, quelque soit leur doublet, 2 à 2 pour rechercher ceux qui se comportent de la même façon dans les 3 domaines.
        + Dans un 1er essai j'ai comparé 2 codons par leurs effectifs dans les 3 domaines B A E, après les avoir ordonnés. Je n'ai trouvé que 4 paires aux codons presque identiques (voir le tableau des comparaisons (groupes de codons)).
        + Dans un 2ème essai j'ai aligné les 3 colonnes des effectifs des codons des 3 domaines et je les ai triés dans l'ordre croissant des eucaryotes (comparaison par tri). J'ai ajouté une colonne pour le taux de différence entre 2 codons successifs d'eucaryotes et une autre colonne pour le taux des mêmes codons pour les bactéries. Comme les effectifs des eucaryotes sont triés leurs différences sont très faibles, par contre celles des bactéries et des archées peuvent être élevées. Après avoir souligné les taux inférieurs à 16% des bactéries il ne me reste qu'à estimer la différence entre les 2 codons des archées puis comparer les 3 effectifs. Les faibles effectifs des codons se terminant par t ne sont pas contenus dans ces listes (pour éviter la division par zéro). En plus des 2 couples à forts effectifs du test précédent (tac.caa et cta.tta) j'ai trouvé le couple cac.agc dont les codons sont très semblables.
      • Conclusion pour la structuration par codons: En conclusion je peux dire que
        + chaque codon a un comportement spécifique quand on le teste pour les 3 domaines et pour la genèse et la duplication des gènes de tRNAs;
        + pour tout processus des 3 domaines, genèse ou duplication, les 4 codons d'un doublet se comportent différemment l'un de l'autre, c'est la structuration par codon;
        + pour les archées on aperçoit surtout la structuration par le processus de genèse même pour les codons se terminant par g car tous les codons c a g doivent exister car la duplication est faible.
        + pour les bactéries la structuration est le fait des 2 processus car la genèse est très affaiblie pour les 2/3 des codons se terminant par g (indice de multiplicité inférieur à 0.7) et la duplication est plus élevée que chez lez archées (indice jusqu'à 2.53 pour les bactéries contre 1.39 pour les archées).
        + pour les eucaryotes la genèse existe pour tous les codons et la duplication explose. Ce qui fait que la structuration par codon n'est pas homogène. Il suffit d'un génome pour changer les exceptions chez les eucaryotes, cas de la chimère (Callorhinchus milii) où même la structuration par ligne et colonne se trouve faussée. ( faire les tableaux et commentaires).
      3.b − Le code de la genèse des tRNAs chez les archées est structuré en lignes,colonnes et demi-doublets.
      Structuration par ligne et colonne chez les archées: Lignes et colonnes
      Alors qu'avec les bactéries la structuration est très différenciée grâce à une faible duplication et une genèse très affaiblie des codons se terminant par g, et que celle des eucaryotes est cahotique à cause des duplications extrêmes, les archées vont avoir une structuration claire et nette en ligne et colonne mais peu différenciée pour pouvoir comparer des carrés comme avec les bactéries et ceci, respectivement, grâce et à cause de leur uniformité.
      • Moyennes des lignes et colonnes par rapport à la 3ème base (moyenne 3ème base, dans le tableau):
        − Les moyennes des lignes et colonnes g (3ème base) sont les plus faibles et inférieures à 1905. Les moyennes des lignes et colonnes c et a (3ème base) sont toutes supérieures à 2 134, valeur de la 4ème colonne a quand on ne tient pas en compte l'exception tga (effectif de 206 pour 100 000 tRNAs). La valeur de la 1ère ligne a est alors de 2143.
        − 3 couples de lignes, cxc-a (2150) axc-a (2250) gxc-a (2450), et un couple de colonne, xac-a (2335) ont leurs partenaires presque identiques entre eux. Pour les 4 autres couples les partenaires diffèrent entre eux de plus de 300, txc-a (+400) xtc-a (+300) xcc-a (-250) xgc-a (+500). Sur les 8 carrés seule la colonne se terminant par c (xcc 2097) est inférieure de 10% par rapport à son partenaire a xca. Le codon ccc a été déjà signalé comme une exception. Toutes les autres moyennes se terminant par c sont supérieures (3) ou égales (4) à leur partenaire se terminant par a.
        − Avec la même lecture les bactéries donne des couples différents après permuatation de cgc en cgt (cxc 1998) et correction du codon tga (560): ligne txa avec 2138 à la place de 1612, et colonne xga avec 1589 au lieu de 1337.
        • Les moyennes des lignes et colonnes g (3ème base) sont les plus faibles et inférieures à 1558 (txg). Les moyennes des lignes et colonnes c et a (3ème base) sont toutes supérieures à 1589 (xga).
        • 3 couples de lignes, txc-a (2200) axc-a (2830) cxc-a (1940), et un couple de colonnes, xtc-a (2560) ont leurs partenaires presque identiques entre eux. Dans les 4 autres couples les partenaires diffèrent entre eux de plus de 500, gxc-a (-800) xac-a (-500) xcc-a (-1100) xgc-a (+1100). L'exception de la moyenne de colonne se terminant par c (xcc 1696) se maintient, elle est inférieure de 68% par rapport à son partenaire xca.
        • Si l'on tient compte de l'uniformité des archées par rapport aux bactéries, la comparaison entre 2 lignes ou 2 colonnes de même terminaison des 2 domaines ne peut se faire que par rapport à la différence relative entre les 2 partenaires d'un couple du même domaine se terminant par c et a. C'est ainsi qu'on observe que les 2 domaines se comportent de la même façon: sur 8 comparaisons de couples les 2 lignes c et a sont semblables par l'égalté entre les 2 partenaires (= / =), les 2 colonnes c et a par une différence négative ( nette pour c (< / <) et relative pour a (< / =<)), la ligne t et la colonne g par une différence positive (relative pour t (=> / > ) et nette pour g (> / >)). Soit au total les 3/4 des comparaisons. Il reste la ligne g où la différence est nette entre les 2 partenaires bactériens alors que les archées présentent une égalité quasi stricte ( < / ==); puis il y a la colonne t où les bactéries ont une différence négative relative et les archées une différence positive nette (=< / >). Voir le tableau en bas du texte.
        − Avec la même lecture les eucaryotes ne présentent que les moyennes de la ligne cx et celles de la colonne xc qui soient comparables aux 2 autres domaines, car cxg et xcg sont inférieures à cxc-a et xcc-a dans les 3 domaines. Les 3 lignes ont le même comportement entre elles de même que les 3 colonnes entre elles. On retrouve encore l'exception du codon ccc avec des rapports c/a des moyennes de 3ème base de colonne respectivement de 1882/2566, 1696/2852, 2097/2349 pour E B A. Il faut noter que 8 codons forts xyt eucaryotes et 1 un bactériens ont été permutés avec les codons faibles xyc pour avoir des moyennes de 3ème base comparables entre xyc et xya. Ainsi l'exception du codon ccc chez les bactéries et les archées réapparaît avec le codon cct chez les eucaryotes avec la moyenne de la 3ème base de la colonne xcc.
      • Moyennes des lignes et colonnes avec les 4 3ème bases (moyennes lignes et colonnes, dans le tableau): Ces moyennes représentent bien l'influence totale de la 1ère base (ligne) et de la 2ème base (colonne). A ce niveau élevé de totalisation la ressemblance entre les 3 domaines devrait être plus élevée que précédemment.
        − L'ordre des moyennes des lignes des bactéries est le même que celui des lignes des archées en les notant de gauche à droite: 3-4-2-1. C'est le même constat pour les moyennes des colonnes des bactéries et des archées, l'ordre est le même mais différents de celui des lignes: 2-3-1-3 pour les bactéries et 2-3-1-4 pour les archées. Il faut noter la netteté avec les archées alors qu'ils sont très uniformes. Dans le cas des bactéries aux codons très différenciés et avec un total des tRNAs de 235 027 ( contre 8749 pour les archées) l'égalité des ordres des colonnes 2 et 4 est tout à fait acceptable avec une différence de 2 unités sur 1830, alors que cette égalté serait douteuse avec les archées à cause de leur uniformité.
        − L'ordre des moyennes des lignes des eucaryotes est quasiment le même que celui des 2 autres domaines. Avec la notation de gauche à droite nous avons 3-3-2-1 contre le 3-4-2-1 des 2 autres domaines. La différence entre la ligne 1 et 2 est de 20/1300 ce qui est très faible pour la différenciation extrême des eucaryotes et un total des tRNAs de 115 111 contre 237 027 pour les bactéries.
      • Moyennes des carrés: elles représentent le comportement de chaque doublet.
        − Malgré la grande différenciation chez les eucaryotes et les bactéries, la grande uniformité chez les archées et en excluant les 2 exceptions des doublets ta et at, les 4 doublets aa gc ga gg ont les valeurs les plus élevées parmi les 12 doublets restants. L'ordre de ces 4 doublets, suivant leur valeur, change cependant entre les 3 domaines: il est 4-2-3-1 pour les eucaryotes, respectivement suivant la notation précédente aa gc ga gg; il est 1-4-2-3 chez les bactéries; et 4-2-1-3 chez les archées.
        − Grâce aux 4 doublets aa gc ga gg la ligne 4 et la colonne 3 se distinguent nettement dans les 3 domaines alors que la colonne 1 n'est commune qu'aux bactéries et archées. Les autres lignes et colonnes varient beaucoup entre les 3 domaines.
      Structuration du code en demi-doublets chez les archées: Jusqu'ici j'hésitais à utiliser les codons se terminant par g comme critère de différenciation du code des archées en demi-doublet à cause de la grande uniformité. Cependant la netteté des comparaisons relevée au paragraphe précédent sur les lignes et colonnes, et surtout la distinction de couples de lignes ou de colonnes des moyennes de 3ème base pour analyser les archées m'autorisent à utliser les codons se terminant par g comme critère de différenciation. L'argumentation pour différencier le code chez les archées en demi-doublets se fait alors de la même façon que chez les bactéries (ref.).
      Les exceptions dans le code des archées: 3 nouveautés sur les 5 exceptions qui restent chez les archées.
      • Les doublets ta et cc ne changent pas en exception et l'exception du codon ccc quoique difficile à faire a été détectée dans les comparaisons ligne et colonne précedentes.
      • Le doublet tg ajoute une nouvelle exception au codon tga, avec le codon tgc dont l'indice de multiplicité est le plus élevé 1.69 chez les archées après l'exception atg 3.20 et avant gca 1.39, alors qu'il n'est que de 1.11 chez les bactéries. Ce n'est pas du à un génome particulier.
      • Le doublet at maintient l'exception du codon atg mais aggrave celle du codon ata, car la grande uniformité des codons des archées est due à sa robustesse: Dans les conditions extrêmes il est plus avantageux d'utiliser des anti-codons différents que de contrôler des voies de synthèse de plusieurs enzymes pour modifier les tRNAs. Or apparemment les archées soit ils ont choisi l'option de la modification comme chez E.Coli soit les tRNAs à codon atg sont différenciés ou bien il existe un processus spéciale au niveau de l'ARNm comme pour le codon tga.
      • Le doublet cg est peut-être le plus spectaculaire par son exception spécifique chez les archées qui le différencie de celle des bactéries (bascule c/t et bascule a/g) et de celle des eucaryotes (annulation de la bascule a/g et non celle de c/t). Les archées annulent les 2 bascules à la fois et l'exception du doublet cg vient de sa normalité chez les archées.
    4. Critiques:
      − Au paragraphe 3b, sur les archées, la comparaison entre ligne et colonne est aisée entre bactéries et archées mais pas du tout avec les eucaryotes. De même j'ai noté en conclusion du paragraphe 3a pour la structuration en codons que des effectifs élevés en tRNAs des eucaryotes ne permettaient pas de dégager des analogies de structuration entre les 3 domaines, ce qui est mon objectif principal de l'étude des tRNAs en vue de l'hypothèse de la résonance. Pourtant la comparaison entre eucaryotes et bactéries a révélé des caractéristiques nettes et précises des codons qui les différencient à l'intérieur de chaque domaine. Elle nous a permis aussi de dégager des comportements de groupes de codons analogues ce qui a permis de les caractériser en doublet et demi doublet. Malgré l'uniformité et les faibles effectifs des archées j'ai pu montrer ces caractéristiques entre eux et les bactéries.
    5. Hypothèses:
      − C'est la comparaison inachevée entre eucaryotes et archées qui m'a laissé penser qu'il existait un 4ème processus de duplication propre aux eucaryotes différent de ceux déjà étudiés dans les 3 domaines. Ce processus, par ses duplications explosives, est analogue au processus qui provoque les changements brutaux des fréquences des codons ggg et ccc dans les génomes des procaryotes, comportement que j'ai utilisé pour établir l'hypothèse de la résonance dans l'ADN dans l'article "répétitions des bases". Pour étudier ce nouveau processus il faut détailler le code pour chaque génome. L'idée c'est de le séparer des autres processus pour rendre les tableaux de code des trois domaines plus lisibles et de dégager l'analogie recherchée entre ces 3 domaines. Je devrais faire la même étude pour les 3 domaines pour que la comparaison soit valable.
      Fortes duplications chez les bactéries et les archées: Pour les archées l'uniformité et la multiplicité proche de l'unité ne laissent pas de place à une duplication explosive. J'ai détaillé le cas de la Cys qui a un indice de 1.6, voir ci-dessous. Pour les bactéries j'ai compté le nombre de génomes n'ayant qu'un seul exemplaire de tRNA par demi doublet sous la forme 1a1g ou 1c1t (tRNA se terminant par a g c t, tableau IV). Avec ces décomptes et les indices de multiplicité très faibles des bactéries il ne reste pas beaucoup de place aussi pour les fortes duplications. Un échantillon du spectre des tRNAs des 111 bactéries des diagrammes étendus montre que les duplications chez les bactéries dépassent rarement 5.
      − L'effectif de 155 eucaryotes, assez élevé pour des décomptes détaillés, m'a encouragé à étudier les fortes duplications dans ce domaine.
    6. Tableaux de bas de page:
1ères valeurs Voir le paragraphe d'appel.
                        couple          différence      effectif        taux %
                B       cta g           246             5186            5
                        aaa c           341             9105            4
                A       aga c           1               187             1
                        cga c           2               187             1
                        tca c           6               190             3
                E       cct a           3               1641            0
                        aga c           133             1895            7
4 paires presque identiques. Voir le paragraphe d'appel.
                         B              A               E
                 tac     2732           2172            1925
                 caa     2718           2240            1989

                 cta     2102           2115            758
                 tta     2021           2183            773

                 cat     4              0               47
                 agt     1              0               53

                 aat     5              0               149
                 tat     4              0               155
couple ac.ag. Voir le paragraphe d'appel.
                        B               A               E
                 cac    2006            2115            1632
                 agc    1881            2137            1646
Comparaison ligne colonne entre bactéries et archées. voir le paragraphe d'appel.
Ligne colonne
base3 B A B A
t =>7% >0 =<5% >0
c = = <0 <0
a = = <0 =<%3
g <0 == >0 >0
Spectre des tRNAs Cys chez les archées. voir le paragraphe d'appel.
tRNAs par génome        1       2       3       4       5       6       7       8       tottal
nombre de génomes       137     11      16      10      5       2       1       1       183
nombre de tRNAs         137     22      48      40      25      12      7       8       299
Demi-doublets[modifier | modifier le wikicode]
  • Lien Tableur: Demi-doublets
  • Légende:
    Domaine E: ensemble des 155 eucaryotes avec un total de tRNAs de 115 111.
    Domaine B: ensemble des 4032 bactéries avec un total de tRNAs de 235 027.
    Domaine A: ensemble des 184 archées avec un total de tRNAs de 8 749.
    g/a: rapport des codons xyg sur xya de la ligne x et de la colonne y du tableau des effectifs,   1.4  rapport inverse de g/a.
    t/c: rapport des codons xyc sur xyt de la ligne x et de la colonne y du tableau des effectifs,   16  rapport inverse de t/c.
    t c a g: colonnes du tableau des effectifs
  • Tableaux du texte:
Demi-doublets par domaine
Domaine E. Demi-doublets
t c a g
t/c 29 16 14 12
g/a 1.4 1.4 7.1
t/c 43 48 40 28
g/a 1.5 2.2 1.2 4.5
t/c 25 14 24 36
g/a 4.5 1.8 2.3 1.4
t/c 19 7.3 28 25
g/a 2.9 1.6 1.9 1.3
Domaine B. Demi-doublets
t c a g
t/c
g/a 1.2 2.0 3.3
t/c 10 22
g/a 1.05 2.5 2.7 3.8
t/c 44
g/a 328 2.1 3.8 1.4
t/c
g/a 6.7 8.3 7.0 2.4
Domaine A. Demi-doublets
t c a g
t/c
g/a 1.17 1.21 10.2
t/c
g/a 1.16 1.22 1.19 1.33
t/c
g/a 295 1.17 1.19 1.13
t/c
g/a 1.09 1.61 1.44 1.22
  • Tableau non formaté: voir tableur
Demi-doublets des 121 eucaryotes[modifier | modifier le wikicode]
  • Lien Tableur: Demi-doublets des 121 eucaryotes
  • Légende:
    155 eucaryotes, tableau des demi-doublets sur les effectifs des 155 eucaryotes avant sélection des 121.
    121 eucaryotes 92530: tableau des demi-doublets sur les effectifs des 121 eucaryotes avant calcul sur les tRNAs surexprimés.
    121 eucaryotes 55830: tableau des demi-doublets sur les effectifs des 121 eucaryotes après calcul sur les tRNAs surexprimés.
    g/a: rapport des codons xyg sur xya de la ligne x et de la colonne y du tableau des effectifs,   1.4  rapport inverse de g/a.
    t/c: rapport des codons xyc sur xyt de la ligne x et de la colonne y du tableau des effectifs,   16  rapport inverse de t/c.
    t c a g: colonnes du tableau des effectifs
Demi-doublets des 121 eucaryotes
155 Eucaryotes 115 111
t c a g
t/c 29 16 14 12
g/a 1.4 1.4 7.1
t/c 43 48 40 28
g/a 1.5 2.2 1.2 4.5
t/c 25 14 24 36
g/a 4.5 1.8 2.3 1.4
t/c 19 7.3 28 25
g/a 2.9 1.6 1.9 1.3
121 eucaryotes 92 530
t c a g
t/c 32 13 33 11
g/a 1.2 1.3 7.0
t/c 49 45 36 35
g/a 1.5 2.6 1.5 4.7
t/c 25 18 28 35
g/a 4.3 1.6 2.5 1.3
t/c 16 11 24 15
g/a 3.4 1.6 2.1 1.2
121 eucaryotes 55 830
t c a g
t/c 46 33 45 64
g/a 1.2 1.3 4.6
t/c 46 66 46 61
g/a 1.4 2.6 1.05 1.6
t/c 41 51 40 44
g/a 3.5 1.6 1.2 1.2
t/c 27 64 52 75
g/a 1.6 1.8 1.2 2.1
  • Tableau non formaté: voir tableur
Tableau des effectifs des gènes de tRNAs[modifier | modifier le wikicode]
  • Lien Tableur: Tableau des effectifs des gènes de tRNAs
  • Analyse du tableau ci-dessus.
  • Légende: Décompte des gènes tRNAs par codon suivant la base de données gtRNAdb [11].
    1.   5   : nombre de tRNAs d'un codon se terminant par t. Ce sont les plus faibles.
    2.   113   : nombre de tRNAs d'un codon se terminant par t: Changement de t en c chez les archées et de c en t chez les eucaryotes.
    3. 4 366: Effectif élevé de tRNAs d'un codon se terminant par g chez les procaryotes.
    4. 2622: Effectif faible de tRNAs supérieurs à   t   et à   c   .
    5. 160: Changement de codon   g   Chez les archées et les eucaryotes.
  • Tableaux:
    1. Nombre de tRNAs, tableaux I II III, décompte de la base gtRNAdb.
    2. Pour 100 000 tRNAs, tableaux I100 II100 III100, décomptes rapportés à 100 000 tRNAs pour comparaison.
    3. tRNAs pour 1 génome, tableaux I1 II1 III1, indice de la multiplicité = nombre de tRNAs / nombre des génomes du domaine.
I . Nombre de tRNAs. 4032 Bactéries
ttt 10 tct 5 tat 4 tgt 3
c 6105 c 4520 c 6420 c 4473
a 4749 a 5299 a a 1315
g 3999 g 2622 g g 4366
ctt 369 cct 10 cat 4 cgt 7478
c 3849 c 2742 c 4715 c 333
a 4940 a 5453 a 6388 a 887
g 5186 g 2183 g 2389 g 3355
att 5 act 103 aat 5 agt 1
c 9203 c 4513 c 8764 c 4422
a 55 a 5878 a 9105 a 4804
g 18026 g 2760 g 2427 g 3452
gtt 9 gct 2 gat 0 ggt 1
c 4430 c 4166 c 9,023 c 9,273
a 8859 a 10185 a 9679 a 5515
g 1313 g 1224 g 1388 g 2266
II . Nombre de tRNAs. 184 Archées
ttt 0 tct 0 tat 0 tgt 0
c 215 c 190 c 190 c 299
a 191 a 184 a - a 18
g 163 g 152 g g 184
ctt 1 cct 10 cat 4 cgt 2
c 214 c 171 c 185 c 187
a 185 a 184 a 196 a 185
g 160 g 151 g 165 g 139
att 0 act 0 aat 0 agt 0
c 212 c 189 c 214 c 187
a 2 a 198 a 197 a 186
g 589 g 169 g 166 g 165
gtt 1 gct 0 gat 0 ggt 1
c 212 c 184 c 218 c 243
a 186 a 256 a 230 a 189
g 170 g 159 g 160 g 155
III . Nombre de tRNAs. 155 Eucaryotes
ttt 66 tct 1 863 tat 155 tgt 233
c 1 933 c 113 c 2 216 c 2 755
a 890 a 1 041 a - a 279
g 1 249 g 749 g - g 1 982
ctt 1 576 cct 1 638 cat 47 cgt 1 587
c 37 c 34 c 1 879 c 57
a 872 a 1 641 a 2 289 a 2 337
g 1 296 g 735 g 1 849 g 522
att 2 428 act 2 201 aat 149 agt 53
c 99 c 154 c 3 524 c 1 895
a 851 a 1 494 a 2 640 a 1 762
g 3 862 g 833 g 6 064 g 1 285
gtt 2 101 gct 2 962 gat 100 ggt 132
c 109 c 405 c 2 799 c 3 279
a 1 088 a 7 639 a 7 079 a 5 538
g 3 123 g 4 737 g 3 754 g 7 052
I100. 100 000 tRNAs. 4032 bactéries. 235 027
ttt 4 tct 2 tat 2 tgt 1
c 2 598 c 1 923 c 2 732 c 1 903
a 2 021 a 2 255 a - a 560
g 1 702 g 1 116 g - g 1 858
ctt 157 cct 4 cat 2 cgt 3 182
c 1 638 c 1 167 c 2 006 c 142
a 2 102 a 2 320 a 2 718 a 377
g 2 207 g 929 g 1 016 g 1 427
att 2 act 44 aat 2 agt 0
c 3 916 c 1 920 c 3 729 c 1 881
a 23 a 2 501 a 3 874 a 2 044
g 7 670 g 1 174 g 1 033 g 1 469
gtt 4 gct 1 gat 0 ggt 0
c 1 885 c 1 773 c 3 839 c 3 946
a 3 769 a 4 334 a 4 118 a 2 347
g 559 g 521 g 591 g 964
II100. 100 000 tRNAs. 184 Archées  8749
ttt 0 tct 0 tat 0 tgt 0
c 2 457 c 2 172 c 2 172 c 3 418
a 2 183 a 2 103 a - a 206
g 1 863 g 1 737 g - g 2 103
ctt 11 cct 0 cat 0 cgt 23
c 2 446 c 1 955 c 2 115 c 2 139
a 2 115 a 2 103 a 2 240 a 2 115
g 1 829 g 1 726 g 1 886 g 1 589
att 0 act 0 aat 0 agt 0
c 2 423 c 2 160 c 2 446 c 2 137
a 23 a 2 263 a 2 252 a 2 126
g 6 732 g 1 932 g 1 897 g 1 886
gtt 11 gct 0 gat 0 ggt 11
c 2 423 c 2 103 c 2 495 c 2 777
a 2 126 a 2 926 a 2 629 a 2 160
g 1 943 g 1 817 g 1 829 g 1 772
III100. 100 000 tRNAs. 155 Eucaryotes. 115 111
ttt 57 tct 1 618 tat 135 tgt 202
c 1 679 c 98 c 1 925 c 2 393
a 773 a 904 a - a 242
g 1 085 g 651 g - g 1 722
ctt 1 369 cct 1 423 cat 41 cgt 1 379
c 32 c 30 c 1 632 c 50
a 758 a 1 426 a 1 989 a 2 030
g 1 126 g 639 g 1 606 g 453
att 2 109 act 1 912 aat 129 agt 46
c 86 c 134 c 3 061 c 1 646
a 739 a 1 298 a 2 293 a 1 531
g 3 355 g 724 g 5 268 g 1 116
gtt 1 825 gct 2 573 gat 87 ggt 115
c 95 c 352 c 2 432 c 2 849
a 945 a 6 636 a 6 150 a 4 811
g 2 713 g 4 115 g 3 261 g 6 126
I1 . tRNAs pour 1 génome. 4032 Bactéries
ttt 0 tct 0 tat 0 tgt 0
c 1,51 c 1,12 c 1,59 c 1,11
a 1,18 a 1,31 a - a 0,33
g 0,99 g 0,65 g - g 1,08
ctt 0,09 cct 0 cat 0 cgt 1,85
c 0,95 c 0,68 c 1,17 c 0,08
a 1,23 a 1,35 a 1,58 a 0,22
g 1,29 g 0,54 g 0,59 g 0,83
att 0 act 0,03 aat 0 agt 0
c 2,28 c 1,12 c 2,17 c 1,10
a 0,01 a 1,46 a 2,26 a 1,19
g 4,47 g 0,68 g 0,60 g 0,86
gtt 0 gct 0 gat 0 ggt 0
c 1,10 c 1,03 c 2,24 c 2,30
a 2,20 a 2,53 a 2,40 a 1,37
g 0,33 g 0,30 g 0,34 g 0,56
II1 . tRNAs pour 1 génome. 184 Archées
ttt 0 tct 0 tat 0 tgt 0
c 1,17 c 1,03 c 1,03 c 1,63
a 1,04 a 1,00 a - a 0,10
g 0,89 g 0,83 g - g 1,00
ctt 0,01 cct 0 cat 0 cgt 0,01
c 1,16 c 0,93 c 1,01 c 1,02
a 1,01 a 1,00 a 1,07 a 1,01
g 0,87 g 0,82 g 0,90 g 0,76
att 0 act 0 aat 0 agt 0
c 1,15 c 1,03 c 1,16 c 1,02
a 0,01 a 1,08 a 1,07 a 1,01
g 3,20 g 0,92 g 0,90 g 0,90
gtt 0,01 gct 0 gat 0 ggt 0,01
c 1,15 c 1,00 c 1,18 c 1,32
a 1,01 a 1,39 a 1,25 a 1,03
g 0,92 g 0,86 g 0,87 g 0,84
III1 . tRNAs pour 1 génome. 155 Eucaryotes
ttt 0,4 tct 12,0 tat 1,0 tgt 1,5
c 12,5 c 0,7 c 14,3 c 17,8
a 5,7 a 6,7 a - a 1,8
g 8,1 g 4,8 g - g 12,8
ctt 10,2 cct 10,6 cat 0,3 cgt 10,2
c 0,2 c 0,2 c 12,1 c 0,4
a 5,6 a 10,6 a 14,8 a 15,1
g 8,4 g 4,7 g 11,9 g 3,4
att 15,7 act 14,2 aat 1,0 agt 0,3
c 0,6 c 1,0 c 22,7 c 12,2
a 5,5 a 9,6 a 17,0 a 11,4
g 24,9 g 5,4 g 39,1 g 8,3
gtt 13,6 gct 19,1 gat 0,6 ggt 0,9
c 0,7 c 2,6 c 18,1 c 21,2
a 7,0 a 49,3 a 45,7 a 35,7
g 20,1 g 30,6 g 24,2 g 45,5
  • Tableaux non formatés: voir tableur
Lignes et colonnes[modifier | modifier le wikicode]
  • Lien Tableur: Lignes et colonnes
  • Légende: Les moyennes des codons de la 3ème base appartenant aux doublets ayant la même 1ère base (ligne) ou ayant la même 2ème base (colonne) sont faites sur 4 codons ou sur 3 codons seulement quand on rencontre les codons stop (taa tag) ou le codon ata lorsqu'il est trop faible ( sauf celui des eucaryotes) ou le codon atg à effectif très élevé (sauf celui des eucaryotes). La moyenne des lignes et colonnes est faite sur 12 codons ou seulement 10 quand on rencontre les codons taa tag ata atguand les codons xyt ont des effectifs élevés ils sont permutés avec les codons xyc ( 1 permutation chez les bactéries et 8 chez les eucaryotes). Aussi les lignes et colonnes xyt contiennent les valeurs faibles après permutation et les lignes et colonnes xyc contiennent les valeurs fortes après permutation.
    n pour nombre de codons, mcod pour moyenne des codons, Lig. pour ligne, Col. pour colonne et car. pour carré ou doublet.
    txt, c, a, g pour respectivement les 4 codons "ttt tct tat tgt" de la 3ème base t, les 4 codons "ttc tcc tac tgc" de la 3ème base c . . . etc. (Ligne Lig.)
    xtt, c, a, g pour respectivement les 4 codons "ttt ctt att gtt" de la 3ème base t, les 4 codons "ttc ctc atc gtc" de la 3ème base c . . . etc. (colonne Col.)
Lignes Colonnes pour 100000 tRNAs.
IIILC. 155 Eucaryotes. 115 111
Moyenne 3ème base
Lig. n mcod
tx t 4 123
c 4 1,904
a 3 640
g 3 1,153
col. n mcod
xt t 4 68
c 4 1,746
a 4 804
g 4 2,070
cx t 4 38
c 4 1,451
a 4 1,550
g 4 956
xc t 4 153
c 4 1,882
a 4 2,566
g 4 1,532
ax t 4 99
c 4 2,182
a 4 1,465
g 4 2,616
xa t 4 98
c 4 2,263
a 3 3,477
g 3 3,378
gx t 4 162
c 4 2,420
a 4 4,636
g 4 4,054
xg t 4 103
c 4 2,067
a 4 2,154
g 4 2,354
Moyenne Lignes
Lig. ttt ctt att gtt
n 10 12 12 12
mcod 1,299 1,319 2,088 3,703
Moyenne colonnes
col. ttt tct tat tgt
n 12 12 10 12
mcod 1,540 1,993 2,962 2,192
Totaux carrés
car. 1000 t c a g
t 3.59 3.27 2.06 4.56
c 3.28 3.52 5.27 3.91
a 6.29 4.07 10.75 4.34
g 5.58 13.68 11.93 13.90
ILC. 4032 Bactéries. 235 027.
Moyenne 3ème base
Lig. n mcod
txt 4 2
c 4 2,289
a 3 1,612
g 3 1,558
Col. n mcod
xtt 4 42
c 4 2,509
a 3 2,631
g 3 1,489
cxt 4 76
c 4 1,998
a 4 1,879
g 4 1,395
xct 4 13
c 4 1,696
a 4 2,852
g 4 935
axt 4 12
c 4 2,862
a 3 2,806
g 3 1,225
xat 4 1
c 4 3,076
a 3 3,570
g 3 880
gxt 4 1
c 4 2,861
a 4 3,642
g 4 659
xgt 4 36
c 4 2,728
a 4 1,332
g 4 1,430
Moyenne Lignes
Lig. ttt ctt att gtt
n 10 12 10 12
mcod 1,867 1,757 2,354 2,387
Moyenne colonnes
col. ttt tct tat tgt
n 10 12 10 12
mcod 2,239 1,828 2,566 1,830
Totaux carrés
car. 1000 t c a g
t 6.32 5.30 2.73 4.32
c 6.10 4.42 5.74 5.13
a 11.61 5.64 8.64 5.39
g 6.22 6.63 8.55 7.26
IILC. 184 Archées. 8 749
Moyenne 3ème base
Lig. n mcod
txt 4 0
c 4 2,555
a 3 1,497
g 3 1,901
Col. n mcod
xtt 4 6
c 4 2,437
a 3 2,141
g 3 1,878
cxt 4 9
c 4 2,163
a 4 2,143
g 4 1,757
xct 4 0
c 4 2,097
a 4 2,349
g 4 1,803
axt 4 0
c 4 2,292
a 3 2,214
g 3 1,905
xat 4 0
c 4 2,306
a 3 2,374
g 3 1,871
gxt 4 6
c 4 2,449
a 4 2,460
g 4 1,840
xgt 4 9
c 4 2,617
a 4 1,652
g 4 1,837
Moyenne Lignes
Lig. ttt ctt att gtt
n 10 12 10 12
mcod 2,041 2,021 2,152 2,250
Moyenne colonnes
col. ttt tct tat tgt
n 10 12 10 12
mcod 2,181 2,083 2,196 2,035
Totaux carrés
car. 1000 t c a g
t 6.50 6.01 2.17 5.73
c 6.40 5.78 6.24 5.86
a 9.18 6.36 6.60 6.15
g 6.50 6.85 6.95 6.72
  • Tableaux non formatés: voir tableur
Lignes et colonnes 121 eucaryotes[modifier | modifier le wikicode]
  • Lien Tableur: Lignes et colonnes 121 eucaryotes
  • Liens: Calculs pour 121 eucaryotes,  Tableau des effectifs calculés des 121 eucaryotes
  • Légende: Les moyennes des codons de la 3ème base appartenant aux doublets ayant la même 1ère base (ligne) ou ayant la même 2ème base (colonne) sont faites sur 4 codons ou sur 3 codons seulement quand on rencontre les codons stop (taa tag) ou le codon ata lorsqu'il est trop faible ( sauf celui des eucaryotes) ou le codon atg à effectif très élevé (sauf celui des eucaryotes). La moyenne des lignes et colonnes est faite sur 12 codons ou seulement 10 quand on rencontre les codons taa tag ata atg. Quand les codons xyt ont des effectifs élevés ils sont permutés avec les codons xyc ( 1 permutation chez les bactéries et 8 chez les eucaryotes). Aussi les lignes et colonnes xyt contiennent les valeurs faibles après permutation et les lignes et colonnes xyc contiennent les valeurs fortes après permutation.
    n pour nombre de codons, mcod pour moyenne des codons, Lig. pour ligne, Col. pour colonne et car. pour carré ou doublet.
    txt, c, a, g pour respectivement les 4 codons "ttt tct tat tgt" de la 3ème base t, les 4 codons "ttc tcc tac tgc" de la 3ème base c . . . etc. (Ligne Lig.)
    xtt, c, a, g pour respectivement les 4 codons "ttt ctt att gtt" de la 3ème base t, les 4 codons "ttc ctc atc gtc" de la 3ème base c . . . etc. (colonne Col.)
Lignes Colonnes pour 100000 tRNAs.
IVLC. 121 eucaryotes. 55 830.
Moyenne 3ème base
Lig. n mcod
tx t 4 62
c 4 2 869
a 3 958
g 3 1 485
col. n mcod
xt t 4 66
c 4 2 494
a 4 1 137
g 4 1 833
cx t 4 38
c 4 2 023
a 4 1 656
g 4 1 323
xc t 4 53
c 4 2 716
a 4 1 840
g 4 1 022
ax t 4 65
c 4 2 800
a 4 2 045
g 4 2 719
xa t 4 67
c 4 3 066
a 3 2 703
g 3 3 117
gx t 4 70
c 4 3 494
a 4 2 123
g 4 1 882
xg t 4 48
c 4 2 908
a 4 1 537
g 4 1 411
Moyenne Lignes
Lig. ttt ctt att gtt
n 10 12 12 12
mcod 1 880 1 668 2 521 2 499
Moyenne colonnes
col. ttt tct tat tgt
n 12 12 10 12
mcod 1 966 1 860 2 973 1 952
Totaux carrés
car. 1000 t c a g
t 5,24 4,60 2,96 6,24
c 4,28 5,12 6,64 4,12
a 8,58 5,18 10,71 6,05
g 5,75 7,62 9,69 7,21
ILC. 4032 Bactéries. 235 027.
Moyenne 3ème base
Lig. n mcod
txt 4 2
c 4 2,289
a 3 1,612
g 3 1,558
Col. n mcod
xtt 4 42
c 4 2,509
a 3 2,631
g 3 1,489
cxt 4 76
c 4 1,998
a 4 1,879
g 4 1,395
xct 4 13
c 4 1,696
a 4 2,852
g 4 935
axt 4 12
c 4 2,862
a 3 2,806
g 3 1,225
xat 4 1
c 4 3,076
a 3 3,570
g 3 880
gxt 4 1
c 4 2,861
a 4 3,642
g 4 659
xgt 4 36
c 4 2,728
a 4 1,332
g 4 1,430
Moyenne Lignes
Lig. ttt ctt att gtt
n 10 12 10 12
mcod 1,867 1,757 2,354 2,387
Moyenne colonnes
col. ttt tct tat tgt
n 10 12 10 12
mcod 2,239 1,828 2,566 1,830
Totaux carrés
car. 1000 t c a g
t 6.32 5.30 2.73 4.32
c 6.10 4.42 5.74 5.13
a 11.61 5.64 8.64 5.39
g 6.22 6.63 8.55 7.26
VLC. Danio rerio (Zebrafish). 12 258.
Moyenne 3ème base
Lig. n mcod
tx t 4 53
c 4 1 846
a 3 805
g 3 993
Col. n mcod
xt t 4 61
c 4 1 952
a 4 1 269
g 4 2 039
cx t 4 82
c 4 2 396
a 4 1 348
g 4 1 642
xc t 4 37
c 4 2 248
a 4 2 186
g 4 893
ax t 4 118
c 4 4 254
a 4 2 329
g 4 3 355
xa t 4 82
c 4 3 708
a 3 2 325
g 3 3 981
gx t 4 45
c 4 2 672
a 4 1 774
g 4 1 738
xg t 4 118
c 4 3 261
a 4 857
g 4 969
Moyenne Lignes
Lig. ttt ctt att gtt
n 10 12 12 12
mcod 1 278 1 795 3 313 2 061
Moyenne colonnes
col. ttt tct tat tgt
n 12 12 10 12
mcod 1 950 1 776 3 375 1 695
Totaux carrés
car. 1000 t c a g
t 4,25 5,12 1,97 1,66
c 6,67 5,73 6,27 3,21
a 7,06 5,91 20,78 6,48
g 5,67 4,70 5,07 9,48
  • Tableaux non formatés: voir tableur
Tableau des effectifs des gènes de tRNAs 121 eucaryotes.[modifier | modifier le wikicode]
  • Lien Tableur: Tableau des effectifs des gènes de tRNAs 121 eucaryotes.
  • Liens: Sélection des 121 eucaryotestableaux synthétiques des 121
  • Utilisation de ces tableaux: Le tableau III1 92 530, est comparé au tableau III1 55 948 des tableaux synthétiques, pour l'indice de la multiplicité. Les codons en gras ont un indice multiplié par 3 à 10 par rapport à la tendance de l'ensemble des codons calculée dans III1 55 948. Le processus normal de duplication chez les eucaryotes (et non zebrafish) entre en résonance avec ces codons décuplés. Voilà encore une autre illustration de la résonance dans l'ADN.
  • Légende: Décompte des gènes tRNAs par codon suivant la base de données gtRNAdb [12].
    1.   5   : nombre de tRNAs d'un codon se terminant par t. Ce sont les plus faibles.
    2.   113   : nombre de tRNAs d'un codon se terminant par t: Changement de t en c chez les archées et de c en t chez les eucaryotes.
    3. 4 366: Effectif élevé de tRNAs d'un codon se terminant par g chez les procaryotes.
    4. 2622: Effectif faible de tRNAs supérieurs à   t   et à   c   .
    5. 160: Changement de codon   g   Chez les archées et les eucaryotes.
  • Tableaux:
    1. Nombre de tRNAs des 121 eucaryotes, tableau III 92 530.
    2. Pour 100 000 tRNAs des 121 eucaryotes, tableau III100 92 530.
    3. tRNAs pour 1 génome, tableau III1 92 530, indice de la multiplicité = nombre de tRNAs / 121.
III. Nombres de tRNAs. 121 eucaryotes. 92 530
ttt 45 tct 1,266 tat 50 tgt 209
c 1,461 c 99 c 1,661 c 2,403
a 705 a 715 a a 249
g 816 g 551 g g 1,739
ctt 1,085 cct 1,123 cat 34 cgt 1,153
c 22 c 25 c 1,239 c 33
a 561 a 1,244 a 1,957 a 2,020
g 857 g 476 g 1,318 g 428
att 1,803 act 1,527 aat 72 agt 36
c 70 c 83 c 2,039 c 1,265
a 675 a 1,053 a 1,880 a 1,369
g 2,921 g 672 g 4,658 g 1,095
gtt 1,543 gct 2,524 gat 93 ggt 138
c 94 c 240 c 2,245 c 2,017
a 790 a 7,139 a 6,609 a 5,547
g 2,699 g 4,540 g 3,111 g 6,439
III100 100000 tRNAs. 121 eucaryotes. 92 530.
ttt 49 tct 1,368 tat 54 tgt 226
c 1,579 c 107 c 1,795 c 2,597
a 762 a 773 a 0 a 269
g 882 g 595 g 0 g 1,879
ctt 1,173 cct 1,214 cat 37 cgt 1,246
c 24 c 27 c 1,339 c 36
a 606 a 1,344 a 2,115 a 2,183
g 926 g 514 g 1,424 g 463
att 1,949 act 1,650 aat 78 agt 39
c 76 c 90 c 2,204 c 1,367
a 729 a 1,138 a 2,032 a 1,480
g 3,157 g 726 g 5,034 g 1,183
gtt 1,668 gct 2,728 gat 101 ggt 149
c 102 c 259 c 2,426 c 2,180
a 854 a 7,715 a 7,143 a 5,995
g 2,917 g 4,907 g 3,362 g 6,959
III1 tRNAs par génome. 121 eucaryotes. 92 530.
ttt 0.37 tct 10.46 tat 0.41 tgt 1.73
c 12.07 c 0.82 c 13.73 c 19.86
a 5.83 a 5.91 a 0.00 a 2.06
g 6.74 g 4.55 g 0.00 g 14.37
ctt 8.97 cct 9.28 cat 0.28 cgt 9.53
c 0.18 c 0.21 c 10.24 c 0.27
a 4.64 a 10.28 a 16.17 a 16.69
g 7.08 g 3.93 g 10.89 g 3.54
att 14.90 act 12.62 aat 0.60 agt 0.30
c 0.58 c 0.69 c 16.85 c 10.45
a 5.58 a 8.70 a 15.54 a 11.31
g 24.14 g 5.55 g 38.50 g 9.05
gtt 12.75 gct 20.86 gat 0.77 ggt 1.14
c 0.78 c 1.98 c 18.55 c 16.67
a 6.53 a 59.00 a 54.62 a 45.84
g 22.31 g 37.52 g 25.71 g 53.21
  • Tableaux non formatés: voir tableur
Tableau des effectifs calculés des gènes de tRNAs 121 eucaryotes.[modifier | modifier le wikicode]
  • Lien Tableur: Tableau des effectifs calculés des gènes de tRNAs 121 eucaryotes.
  • Liens: Résultats des calculs sur les 121 eucaryotesTableaux des effectifs 1213 domaines
  • Caractérisation des codons par les processus de genèse et de duplication des eucaryotes: se reporter aux calculs effectués sur les 121 eucaryotes pour la problématique de cette étude.
    − Problématique de la comparaison avec les procaryotes et zébrafish: Chez les procaryotes la duplication est très faible et c'est la genèse qui prévaut. J'ai pu déterminer, dans les 3 domaines, la structuration par codons avec les archées (résultats.3a) et la structuration par doublets avec les bactéries (résultats.2b) qui présentent une bonne duplication par rapport aux archées. Ces structurations étaient possibles tant que la duplication restait faible. Pour zebrafish la situation est analogue à celle des procaryotes, tous les codons ont une forte duplication mais elle est quasi uniforme et l'on peut comparer avec les effectifs rapportés à 100 000 tRNAs. Avec les 121 eucaryotes, comme on l'a vu dans les calculs, la duplication varie continuellement même en réduisant celle des codons décuplés. La caractérisation des codons par les effectifs dépendrait du nombre des eucaryotes étudiés et surtout de celui des eucaryotes présentant des codons décuplés. Par contre si on fait l'hypothèse que le taux de ces derniers eucaryotes est constant, alors la pente de la droite de tendance restera constante et caractérisera mieux les codons pour le processus de duplication seul.
    − Méthode pour comparer: J'ai comparé les effectifs (rapportés à 100 000 tRNAs) des 121 eucaryotes réduits dont l'effectif total est de 55 830 (décompte du 3.11.17), de zébrafish dont l'effectif total est de 12 558 et des bactéries dont l’effectif total que j'ai décompté est de 235 027 ( total du tableau des effectifs comptés au 10.1.16 (pour mémoire NCBI/repete110.ods/GC code 110) et non celui des statistiques de la base de données gtRNAdb qui ne lui correspond pas et qui peut varier avec les mises à jour). J'ai comparé les indices de multiplicité des 121 eucaryotes réduits (total 55 830) à ceux des 121 non réduits ( total 92 530) pour repérer les codons décuplés. Enfin j’ai ajouté les tableaux des pentes et des coefficients de détermination des 121 réduits.
    − Résultats:
  • Légende: Décompte des gènes tRNAs par codon suivant la base de données gtRNAdb [13].
    1.   5   : nombre de tRNAs d'un codon se terminant par t. Ce sont les plus faibles.
    2.   113   : nombre de tRNAs d'un codon se terminant par t: Changement de t en c chez les archées et de c en t chez les eucaryotes.
    3. 4 366: Effectif élevé de tRNAs d'un codon se terminant par g chez les procaryotes.
    4. 2622: Effectif faible de tRNAs supérieurs à   t   et à   c   .
    5. 160: Changement de codon   g   Chez les archées et les eucaryotes.
  • Tableaux: Chaque tableau contient le total des génomes étudiés suivi de son total de gènes tRNAs: 121 eucaryotes 55 830 pour les 121 eucaryotes réduits; pour les autres tableaux les décomptes des gènes de tRNAs sont directs.
    1. Nombre de tRNAs: tableau IV Résultats des calculs sur les 121 eucaryotes, tableau V décompte de la base gtRNAdb.
    2. Pour 100 000 tRNAs, tableaux IV100 III100 V100, décomptes rapportés à 100 000 tRNAs pour comparaison.
    3. tRNAs pour 1 génome, tableaux IV1 III1 , indice de la multiplicité = nombre de tRNAs / nombre de génomes.
    4. IVp, pentes; IVr, coefficients de détermination R2. Voir les calculs pour les 121 eucaryotes
IV . Nombres de tRNAs. 121 eucaryotes. 55 830
ttt 32 tct 1 266 tat 36 tgt 32
c 1 461 c 38 c 1 619 c 2 060
a 640 a 715 a a 249
g 794 g 551 g g 1 143
ctt 1 003 cct 1 123 cat 27 cgt 1 153
c 22 c 17 c 1 239 c 19
a 561 a 1 244 a 1 193 a 701
g 804 g 476 g 1 247 g 428
att 1 693 act 1 436 aat 47 agt 29
c 41 c 28 c 1 858 c 1 265
a 675 a 875 a 1 880 a 1 138
g 2 382 g 551 g 2 193 g 945
gtt 1 413 gct 2 241 gat 41 ggt 27
c 53 c 35 c 2 131 c 2 017
a 664 a 1 276 a 1 455 a 1 345
g 1 083 g 704 g 1 781 g 635
IVp Pentes des tRNAs. 121 eucaryotes 55 830
ttt tct 0.946 tat tgt
c 1.139 c c 1.293 c 1.603
a 0.463 a 0.699 a a
g 0.574 g 0.511 g g 0.941
ctt 0.853 cct 0.991 cat cgt 0.948
c c c 0.998 c
a 0.504 a 1.062 a 0.925 a 0.606
g 0.627 g 0.469 g 1.065 g 0.321
att 1.334 act 1.188 aat agt
c c c 1.442 c 1.174
a 0.668 a 0.848 a 1.669 a 0.969
g 2.025 g 0.491 g 1.738 g 0.808
gtt 1.020 gct 1.728 gat ggt
c c c 1.690 c 1.476
a 0.591 a 1.079 a 1.233 a 1.263
g 0.905 g 0.673 g 1.375 g 0.485
V Nombres Danio rerio (Zebrafish) 12 258
ttt 10 tct 336 tat 5 tgt 9
c 197 c 2 c 236 c 136
a 73 a 209 a - a 14
g 241 g 80 g - g 44
ctt 270 cct 315 cat 10 203
c 4 c 2 c 387 c 24
a 244 a 205 a 105 a 107
g 300 g 180 g 266 g 59
att 258 act 359 aat 24 agt 14
c 10 c 10 c 1 045 c 424
a 75 a 290 a 525 a 252
g 522 g 66 g 953 g 104
gtt 232 gct 92 gat 1 ggt 11
c 6 c 4 c 150 c 836
a 230 a 368 a 225 a 47
g 227 g 112 g 245 g 268
IV100. 100 000 tRNAs. 121 eucaryotes. 55 830
ttt 57 tct 2 268 tat 64 tgt 57
c 2 617 c 68 c 2 900 c 3 690
a 1 146 a 1 281 a a 446
g 1 422 g 987 g g 2 047
ctt 1 797 cct 2 011 cat 48 cgt 2 065
c 39 c 30 c 2 219 c 34
a 1 005 a 2 228 a 2 137 a 1 256
g 1 440 g 853 g 2 234 g 767
att 3 032 act 2 572 aat 84 agt 52
c 73 c 50 c 3 328 c 2 266
a 1 209 a 1 567 a 3 367 a 2 038
g 4 267 g 987 g 3 928 g 1 693
gtt 2 531 gct 4 014 gat 73 ggt 48
c 95 c 63 c 3 817 c 3 613
a 1 189 a 2 286 a 2 606 a 2 409
g 1 940 g 1 261 g 3 190 g 1 137
I100. 100 000 tRNAs. 4032 bactéries. 235 027
ttt 4 tct 2 tat 2 tgt 1
c 2 598 c 1 923 c 2 732 c 1 903
a 2 021 a 2 255 a - a 560
g 1 702 g 1 116 g - g 1 858
ctt 157 cct 4 cat 2 cgt 3 182
c 1 638 c 1 167 c 2 006 c 142
a 2 102 a 2 320 a 2 718 a 377
g 2 207 g 929 g 1 016 g 1 427
att 2 act 44 aat 2 agt 0
c 3 916 c 1 920 c 3 729 c 1 881
a 23 a 2 501 a 3 874 a 2 044
g 7 670 g 1 174 g 1 033 g 1 469
gtt 4 gct 1 gat 0 ggt 0
c 1 885 c 1 773 c 3 839 c 3 946
a 3 769 a 4 334 a 4 118 a 2 347
g 559 g 521 g 591 g 964
V100. Danio rerio (Zebrafish) 12 258
ttt 82 tct 2 741 tat 41 tgt 73
c 1 607 c 16 c 1 925 c 1 109
a 596 a 1 705 a - a 114
g 1 966 g 653 g - g 359
ctt 2 203 cct 2 570 cat 82 cgt 1 656
c 33 c 16 c 3 157 c 196
a 1 991 a 1 672 a 857 a 873
g 2 447 g 1 468 g 2 170 g 481
att 2 105 act 2 929 aat 196 agt 114
c 82 c 82 c 8 525 c 3 459
a 612 a 2 366 a 4 283 a 2 056
g 4 258 g 538 g 7 775 g 848
gtt 1 893 gct 751 gat 8 ggt 90
c 49 c 33 c 1 224 c 6 820
a 1 876 a 3 002 a 1 836 a 383
g 1 852 g 914 g 1 999 g 2 186
IV1. tRNAs par génome. 121 eucaryotes.  55 830
ttt 0.26 tct 10.46 tat 0.30 tgt 0.26
c 12.07 c 0.31 c 13.38 c 17.02
a 5.29 a 5.91 a a 2.06
g 6.56 g 4.55 g g 9.45
ctt 8.29 cct 9.28 cat 0.22 cgt 9.53
c 0.18 c 0.14 c 10.24 c 0.16
a 4.64 a 10.28 a 9.86 a 5.79
g 6.64 g 3.93 g 10.31 g 3.54
att 13.99 act 11.87 aat 0.39 agt 0.24
c 0.34 c 0.23 c 15.36 c 10.45
a 5.58 a 7.23 a 15.54 a 9.40
g 19.69 g 4.55 g 18.12 g 7.81
gtt 11.68 gct 18.52 gat 0.34 ggt 0.22
c 0.44 c 0.29 c 17.61 c 16.67
a 5.49 a 10.55 a 12.02 a 11.12
g 8.95 g 5.82 g 14.72 g 5.25
III1. tRNAs par génome. 121 Eucaryotes  92 530
ttt 0.37 tct 10.46 tat 0.41 tgt 1.73
c 12.07 c 0.82 c 13.73 c 19.86
a 5.83 a 5.91 a a 2.06
g 6.74 g 4.55 g g 14.37
ctt 8.97 cct 9.28 cat 0.28 cgt 9.53
c 0.18 c 0.21 c 10.24 c 0.27
a 4.64 a 10.28 a 16.17 a 16.69
g 7.08 g 3.93 g 10.89 g 3.54
att 14.90 act 12.62 aat 0.60 agt 0.30
c 0.58 c 0.69 c 16.85 c 10.45
a 5.58 a 8.70 a 15.54 a 11.31
g 24.14 g 5.55 g 38.50 g 9.05
gtt 12.75 gct 20.86 gat 0.77 ggt 1.14
c 0.78 c 1.98 c 18.55 c 16.67
a 6.53 a 59.00 a 54.62 a 45.84
g 22.31 g 37.52 g 25.71 g 53.21
IVr . R2 des tRNAs. 121 eucaryotes 55 830
ttt tct 881 tat tgt
c 914 c c 748 c 743
a 734 a 758 a a
g 775 g 731 g g 815
ctt 807 cct 816 cat cgt 760
c c c 938 c
a 748 a 713 a 614 a 801
g 697 g 743 g 822 g 570
att 847 act 803 aat agt
c c c 913 c 797
a 740 a 788 a 770 a 666
g 892 g 866 g 845 g 594
gtt 840 gct 863 gat ggt
c c c 791 c 818
a 723 a 748 a 880 a 795
g 793 g 809 g 728 g 597
  • Tableaux non formatés: voir tableur
Tableau des facteurs multiplicateurs des 121 eucaryotes[modifier | modifier le wikicode]
  • Lien au tableur: Tableau des facteurs multiplicateurs des 121 eucaryotes.
  • Légende: Les couleurs sont adaptées aux games des facteurs dans le 3ème tableau, IV/I1LC et sont reportées telles quelles sur les autres tableaux où elles ne sont pas adaptées aux effectifs.
    1. Les codons
        ctt   et   ctc   : ne sont pas permutés chez les bactéries,
        ctt   et   ctc   : alors qu'ils permutent chez les eucaryotes.
        cgt   et   cgc   : permutent chez les bactéries,
        cgt   et   cgc   : alors qu'ils ne permutent pas chez les eucaryotes.
    2. Les games des facteurs multiplicateurs: c'est le multiplicateur de l'indice de multiplicité des bactéries qui donne l'indice des eucaryotes. Ils sont définis dans le tableau IV/I1LC.
        gta   : 2.5, c'est le facteur le plus faible du tableau, 1 seul codon.
        ttc   : gamme de 3.8 − 5.2 avec 9 codons
        ttg   : gamme de 6.1 − 7.3 avec 11 codons
        tta   : gamme de 7.6 − 8.8 avec 9 codons
      −   gtt  : gamme de 9.1 − 10.6 avec 6 codons
        gtg   : gamme de 13.6 − 42.8 avec 9 codons
        ctc   : Facteurs des codons faibles xyc ou xyt. Ces facteurs n'ont pas été utilisés pour définir les gammes.
        0.12   : Valeurs des indices des codons faibles xyt et cgc multipliés par 100 pour l'affichage.
        409   : indices et facteurs hors norme.
        2.20   : Indices de multiplicité supérieurs à 1.51 pour les bactéries et à 12.02 pour les eucaryotes.
IV1. tRNAs par génome. 121 eucaryotes. 55 830 a
ttt 0.26 tcc 0.31 tat 0.30 tgt 0.26
atc 0.34 acc 0.23 aat 0.39 agt 0.24
ctc 0.18 ccc 0.14 cat 0.22 cgc 0.16
gtc 0.44 gcc 0.29 gat 0.34 ggt 0.22
ttc 12.07 tct 10.46 tac 13.38 tgc 17.02
att 13.99 act 11.87 aac 15.36 agc 10.45
ctt 8.29 cct 9.28 cac 10.24 cgt 9.53
gtt 11.68 gct 18.52 gac 17.61 ggc 16.67
tta 5.29 tca 5.91 taa tga 2.06
ata 5.58 aca 7.23 aaa 15.54 aga 9.40
cta 4.64 cca 10.28 caa 9.86 cgg 3.54
gta 5.49 gca 10.55 gaa 12.02 gga 11.12
ttg 6.56 tcg 4.55 tag tgg 9.45
atg 19.69 acg 4.55 aag 18.12 agg 7.81
ctg 6.64 ccg 3.93 cag 10.31 cga 5.79
gtg 8.95 gcg 5.82 gag 14.72 ggg 5.25
I1 . tRNAs pour 1 génome. 4032 Bactéries a
ttt 0.25 tct 0.12 tat 0.10 tgt 0.07
att 0.12 act 2.6 aat 0.12 agt 0.02
ctt 9.2 cct 0.25 cat 0.10 cgc 8.3
gtt 0.22 gct 0.05 gat 0 ggt 0.02
ttc 1,51 tcc 1,12 tac 1,59 tgc 1,11
atc 2,28 acc 1,12 aac 2,17 agc 1,10
ctc 0,95 ccc 0,68 cac 1,17 cgt 1,85
gtc 1,10 gcc 1,03 gac 2,24 ggc 2,30
tta 1,18 tca 1,31 taa tga 0,33
ata 0,01 aca 1,46 aaa 2,26 aga 1,19
cta 1,23 cca 1,35 caa 1,58 cgg 0,83
gta 2,20 gca 2,53 gaa 2,40 gga 1,37
ttg 0,99 tcg 0,65 tag tgg 1,08
atg 4,47 acg 0,68 aag 0,60 agg 0,86
ctg 1,29 ccg 0,54 cag 0,59 cga 0,22
gtg 0,33 gcg 0,30 gag 0,34 ggg 0,56
IV1. Indices multiplicité 121 eucaryotes 55 830 b
ttt 0.26 tcc 0.31 tat 0.30 tgt 0.26
atc 0.34 acc 0.23 aat 0.39 agt 0.24
ctc 0.18 ccc 0.14 cat 0.22 cgc 0.16
gtc 0.44 gcc 0.29 gat 0.34 ggt 0.22
ttc 12.07 tct 10.46 tac 13.38 tgc 17.02
att 13.99 act 11.87 aac 15.36 agc 10.45
ctt 8.29 cct 9.28 cac 10.24 cgt 9.53
gtt 11.68 gct 18.52 gac 17.61 ggc 16.67
tta 5.29 tca 5.91 taa tga 2.06
ata 5.58 aca 7.23 aaa 15.54 aga 9.40
cta 4.64 cca 10.28 caa 9.86 cgg 3.54
gta 5.49 gca 10.55 gaa 12.02 gga 11.12
ttg 6.56 tcg 4.55 tag tgg 9.45
atg 19.69 acg 4.55 aag 18.12 agg 7.81
ctg 6.64 ccg 3.93 cag 10.31 cga 5.79
gtg 8.95 gcg 5.82 gag 14.72 ggg 5.25
IV/I1LC Facteurs multiplicateurs E/B
ttt 107 tcc 253 tat 300 tgt 355
atc 273 acc 9 aat 313 agt 966
ctc 2 ccc 57 cat 225 cgc 2
gtc 196 gcc 583 gat ggt 900
ttc 8.0 tct 9.3 tac 8.4 tgc 15.3
att 6.1 act 10.6 aac 7.1 agc 9.5
ctt 8.7 cct 13.6 cac 8.8 cgt 5.1
gtt 10.6 gct 17.9 gac 7.9 ggc 7.2
tta 4.5 tca 4.5 taa tga 6.3
ata 409 aca 5.0 aaa 6.9 aga 7.9
cta 3.8 cca 7.6 caa 6.2 cgg 16.1
gta 2.5 gca 4.2 gaa 5.0 gga 8.1
ttg 6.6 tcg 7.0 tag tgg 8.7
atg 4.4 acg 6.7 aag 30.1 agg 9.1
ctg 5.2 ccg 7.3 cag 17.4 cga 7.0
gtg 27.5 gcg 19.2 gag 42.8 ggg 9.3
Tableau des facteurs multiplicateurs des archées[modifier | modifier le wikicode]
  • Lien au tableur: Tableau des facteurs multiplicateurs des archées.
  • Légende: Les couleurs sont adaptées aux games des facteurs dans le 3ème tableau, II/I1LC et sont reportées telles quelles sur les autres tableaux où elles ne sont pas adaptées aux effectifs.
    1. Les codons
        cgt   et   cgc   : permutent chez les bactéries,
        cgt   et   cgc   : alors qu'ils ne permutent pas chez les archées.
    2. Les games des facteurs multiplicateurs: c'est le multiplicateur de l'indice de multiplicité des bactéries qui donne l'indice des eucaryotes. Ils sont définis dans le tableau II/I1LC.
        gta   : 0.10, c'est le facteur le plus faible du tableau, 1 seul codon.
        ttc   : gamme de 0.46 − 0.57 avec 9 codons
        ttg   : gamme de 0.65 − 0.77 avec 9 codons
        tta   : gamme de 0.80 − 1.05 avec 13 codons
      −   gtt  : gamme de 1.21 − 1.37 avec 5 codons
        tgc   : gamme de 1.46 − 1.52 avec 5 codons
        gtg   : gamme de 2.53 − 3.43 avec 4 codons
        ctt   : Facteurs des codons faibles xyt. Ces facteurs n'ont pas été utilisés pour définir les gammes.
        0.12   : Valeurs des indices des codons faibles xyt et cgt multipliés par 100 pour l'affichage.
        409   : indices et facteurs hors norme.
        2.20   : Indices de multiplicité supérieurs à 1.51 pour les bactéries et à 1.15 pour les archées.
II1 . tRNAs pour 1 génome. 184 Archées a
ttt 0 tct 0 tat 0 tgt 0
att 0 act 0 aat 0 agt 0
ctt 0,54 cct 0 cat 0 cgt 1.09
gtt 0,54 gct 0 gat 0 ggt 0,54
ttc 1,17 tcc 1,03 tac 1,03 tgc 1,63
atc 1,15 acc 1,03 aac 1,16 agc 1,02
ctc 1,16 ccc 0,93 cac 1,01 cgc 1,02
gtc 1,15 gcc 1,00 gac 1,18 ggc 1,32
tta 1,04 tca 1,00 taa - tga 0,10
ata 0,01 aca 1,08 aaa 1,07 aga 1,01
a 1,01 cca 1,00 caa 1,07 cga 1,01
gta 1,01 gca 1,39 gaa 1,25 gga 1,03
ttg 0,89 tcg 0,83 tag - tgg 1,00
atg 3,20 acg 0,92 aag 0,90 agg 0,90
ctg 0,87 ccg 0,82 cag 0,90 cgg 0,76
gtg 0,92 gcg 0,86 gag 0,87 ggg 0,84
I1 . tRNAs pour 1 génome. 4032 Bactéries a
ttt 0.25 tct 0.12 tat 0.10 tgt 0.07
att 0.12 act 2.6 aat 0.12 agt 0.02
ctt 9.2 cct 0.25 cat 0.10 cgc 8.3
gtt 0.22 gct 0.05 gat 0 ggt 0.02
ttc 1,51 tcc 1,12 tac 1,59 tgc 1,11
atc 2,28 acc 1,12 aac 2,17 agc 1,10
ctc 0,95 ccc 0,68 cac 1,17 cgt 1,85
gtc 1,10 gcc 1,03 gac 2,24 ggc 2,30
tta 1,18 tca 1,31 taa tga 0,33
ata 0,01 aca 1,46 aaa 2,26 aga 1,19
cta 1,23 cca 1,35 caa 1,58 cgg 0,83
gta 2,20 gca 2,53 gaa 2,40 gga 1,37
ttg 0,99 tcg 0,65 tag tgg 1,08
atg 4,47 acg 0,68 aag 0,60 agg 0,86
ctg 1,29 ccg 0,54 cag 0,59 cga 0,22
gtg 0,33 gcg 0,30 gag 0,34 ggg 0,56
II1 Indices multiplicité 184 archées 8 749 b
ttt 0 tct 0 tat 0 tgt 0
att 0 act 0 aat 0 agt 0
ctt 0.54 cct 0 cat 0 cgt 1.09
gtt 0.54 gct 0 gat 0 ggt 0.54
ttc 1.17 tcc 1.03 tac 1.03 tgc 1.63
atc 1.15 acc 1.03 aac 1.16 agc 1.02
ctc 1.16 ccc 0.93 cac 1.01 cgc 1.02
gtc 1.15 gcc 1.00 gac 1.18 ggc 1.32
tta 1.04 tca 1.00 taa tga 0.10
ata 0.01 aca 1.08 aaa 1.07 aga 1.01
cta 1.01 cca 1.00 caa 1.07 cga 1.01
gta 1.01 gca 1.39 gaa 1.25 gga 1.03
ttg 0.89 tcg 0.83 tag tgg 1.00
atg 3.20 acg 0.92 aag 0.90 agg 0.90
ctg 0.87 ccg 0.82 cag 0.90 cgg 0.76
gtg 0.92 gcg 0.86 gag 0.87 ggg 0.84
II/I1LC Facteurs multiplicateurs A/B
ttt 0 tct 0 tat 0 tgt 0
att 0 act 0 aat 0 agt 0
ctt 0.06 cct 0 cat 0 cgt 0.13
gtt 2.4 gct 0 gat 0 ggt 21.9
ttc 0.77 tcc 0.92 tac 0.65 tgc 1.46
atc 0.50 acc 0.92 aac 0.54 agc 0.93
ctc 1.22 ccc 1.37 cac 0.86 cgc 0.55
gtc 1.05 gcc 0.97 gac 0.53 ggc 0.57
tta 0.88 tca 0.76 taa tga 0.30
ata 0.80 aca 0.74 aaa 0.47 aga 0.85
cta 0.82 cca 0.74 caa 0.67 cga 1.21
gta 0.46 gca 0.55 gaa 0.52 gga 0.75
ttg 0.89 tcg 1.27 tag tgg 0.92
atg 0.72 acg 1.34 aag 1.50 agg 1.05
ctg 0.68 ccg 1.52 cag 1.51 cgg 3.43
gtg 2.84 gcg 2.85 gag 2.53 ggg 1.50
Lignes colonnes des facteurs multiplicateurs des 121 eucaryotes[modifier | modifier le wikicode]
  • Lien au tableur: Lignes colonnes des facteurs multiplicateurs des 121 eucaryotes.
  • Légende: Les indices de multiplicité sont ceux des tableaux IV1 et I1 mais où les lignes sont organisées sur la 3ème base et non la 1ère.
    1. mcod et n: moyenne de n codons homogènes.
    2. .tt, .t.: Les moyennes des codons sont représentées par des codons à point où le point est la base variable. Un carré attribué à la 3ème base t peut contenir la 3ème base c et versa suivant l'hypothèse de la permutation de ces codons pour permettre la comparaison. Voir les tableaux des indices.
    3. x.c/t, x pour la 1ère base, variable, et le point pour la 2ème base pour chaque colonne.
    4.   10.8   : Total des facteurs sans celui du codon ata,à cause du faible effectif de celui des bactéries, rapport de 409.
    5.   30.1   : Moyenne de facteurs multiplicateurs supérieurs à 13. Voir le tableau des facteurs et sa légende. La coloration des tableaux LC y font référence.
    6. 0.14 ces indices des bactéries (I1) sont multipliés par 100 pour affichage.
Lignes Colonnes des facteurs multiplicateurs.
IV1LC. 121 Eucaryotes. 55 830
Moyennes 1ère base
Lig. n mcod
t.t 4 0.29
a.t 4 0.30
c.t 4 0.18
g.t 4 0.32
col. n mcod
.tc 4 0.31
.tt 4 11.5
.ta 3 5.1
.tg 3 7.4
t.c 4 13.2
a.c 4 12.9
c.c 4 9.3
g.c 4 16.1
.cc 4 0.24
.ct 4 12.5
.ca 4 8.5
.cg 4 4.7
t.a 2 5.6
a.a 3 10.7
c.a 4 7.1
g.a 4 9.8
.at 4 0.31
.ac 4 14.1
.aa 3 12.5
.ag 3 14.4
t.g 3 6.9
a.g 3 10.2
c.g 4 6.5
g.g 4 8.7
.gt 4 0.22
.gc 4 13.4
.ga 3 8.0
.gg 4 7.1
Moyenne Lignes
Lig. ..t ..c ..a ..g
n 16 16 13 14
mcod 0.27 12.9 8.5 8.0
n 6
mcod 10.2
Moyenne colonnes
col. .t. .c. .a. .g.
n 10 12 10 11
mcod 8.4 8.6 13.7 9.6
Totaux carrés
car. B2 t c a g
x.c/t 1.22 0.98 1.25 0.88
x.t/c 46.0 50.1 56.6 53.7
x.a 15.4 34.0 37.4 24.1
x.g 22.2 18.9 43.1 28.3
I1LC. 4032 Bactéries. 235 027.
+Moyennes 1ère base
Lig. n mcod
t.t 4 0.14
a.t 4 0.71
c.t 4 4.44
g.t 4 0.07
Col. n mcod
.tc 4 2.44
.tt 4 1.46
.ta 3 1.53
.tg 3 0.87
t.c 4 1.33
a.c 4 1.67
c.c 4 1.16
g.c 4 1.67
.cc 4 0.74
.ct 4 0.99
.ca 4 1.66
.cg 4 0.54
t.a 2 1.25
a.a 3 1.64
c.a 4 1.25
g.a 4 2.12
.at 4 0.08
.ac 4 1.79
.aa 3 2.08
.ag 3 0.51
t.g 3 0.91
a.g 3 0.71
c.g 4 0.66
g.g 4 0.38
.gt 4 2.10
.gc 4 1.59
.ga 3 1.13
.gg 4 0.68
Moyenne Lignes
Lig. ..t ..c ..a ..g
n 16 16 13 14
mcod 1.34 1.46 1.61 0.65
n 6
mcod 0.40
Moyenne colonnes
col. .t. .c. .a. .g.
n 10 12 10 11
mcod 1.31 1.07 1.50 1.13
Totaux carrés
car. B2 t c a g
x.c/t 9.75 2.98 0.32 8.38
x.t/c 5.85 3.95 7.17 6.36
x.a 4.60 6.65 6.24 3.39
x.g 7.07 2.18 1.54 2.72
IV/I1LC. Facteurs multiplicateurs E/B
+Moyennes 1ère base
Lig. n mcod
t.t 4 254
a.t 4 390
c.t 4 71
g.t 3 560
Col. n mcod
.tc 4 145
.tt 4 8.4
.ta 3 3.6
.tg 3 13.1
t.c 4 10.3
a.c 4 8.3
c.c 4 9.1
g.c 4 10.9
.cc 4 226
.ct 4 12.9
.ca 4 5.3
.cg 4 10.0
t.a 2 4.5
a.a 3 6.6
c.a 4 8.4
g.a 4 5.0
.at 3 279
.ac 4 8.0
.aa 3 6.0
.ag 3 30.1
t.g 3 7.4
a.g 3 15.3
c.g 4 9.9
g.g 4 24.7
.gt 4 556
.gc 4 9.3
.ga 3 7.7
.gg 4 8.5
Moyenne Lignes
Lig. ..t ..c ..a ..g
n 16 16 13 14
mcod 303 9.6 6.3 14.6
n 6
mcod 25.5
Moyenne colonnes
col. .t. .c. .a. .g.
n 10 12 10 11
mcod 8.3 9.4 14.0 9.4
Totaux carrés
car. B2 t c a g
x.c/t 578 902 838 2223
x.t/c 33.4 51.5 32.1 37.3
x.a 10.8 21.2 18.1 32.1
x.g 39.3 40.1 90.3 34.1
Lignes colonnes des facteurs multiplicateurs des archées[modifier | modifier le wikicode]
  • Lien au tableur: Lignes colonnes des facteurs multiplicateurs des archées.
  • Légende: Les indices de multiplicité sont ceux des tableaux II1 et I1 mais où les lignes sont organisées sur la 3ème base et non la 1ère.
    1. mcod et n: moyenne de n codons homogènes.
    2. .tt, .t.: Les moyennes des codons sont représentées par des codons à point où le point est la base variable. Un carré attribué à la 3ème base t peut contenir la 3ème base c et versa suivant l'hypothèse de la permutation de ces codons pour permettre la comparaison. Voir les tableaux des indices.
    3. x.c/t, x pour la 1ère base, variable, et le point pour la 2ème base pour chaque colonne.
    4.   2.96   : Total des facteurs sans celui du codon ata,à cause du faible effectif de celui des bactéries, rapport de 409.
    5.   1.85   : Moyenne de facteurs multiplicateurs supérieurs à 13. Voir le tableau des facteurs et sa légende. La coloration des tableaux LC y font référence.
    6. 0.14 ces indices des bactéries (I1) sont multipliés par 100 pour affichage.
Lignes Colonnes des facteurs multiplicateurs.
II1LC. 184 archées. 8 749
Moyennes 1ère base
Lig. n mcod
t.t 4 0
a.t 4 0
c.t 4 0.41
g.t 4 0.27
col. n mcod
.tc 4 0.27
.tt 4 1.16
.ta 3 1.02
.tg 3 0.89
t.c 4 1.21
a.c 4 1.09
c.c 4 1.03
g.c 4 1.16
.cc 4 0
.ct 4 1.00
.ca 4 1.12
.cg 4 0.86
t.a 2 1.02
a.a 3 1.05
c.a 4 1.02
g.a 4 1.17
.at 4 0
.ac 4 1.10
.aa 3 1.13
.ag 3 0.89
t.g 3 0.90
a.g 3 0.91
c.g 4 0.84
g.g 4 0.88
.gt 4 0.41
.gc 4 1.24
.ga 3 1.01
.gg 4 0.87
Moyenne Lignes
Lig. ..t ..c ..a ..g
n 16 16 13 14
mcod 0.17 1.12 1.07 0.88
n 4
mcod 0.85
Moyenne colonnes
col. .t. .c. .a. .g.
n 10 12 10 11
mcod 1.04 0.99 1.04 0.88
Totaux carrés
car. B2 t c a g
x.c/t 1.09 0 0 1.63
x.t/c 4.64 3.99 4.39 4.98
x.a 3.07 4.47 3.39 3.14
x.g 2.68 3.43 2.67 3.49
I1LC. 4032 Bactéries. 235 027.
+Moyennes 1ère base
Lig. n mcod
t.t 4 0.14
a.t 4 0.71
c.t 4 4.44
g.t 4 0.07
Col. n mcod
.tc 4 2.44
.tt 4 1.46
.ta 3 1.53
.tg 3 0.87
t.c 4 1.33
a.c 4 1.67
c.c 4 1.16
g.c 4 1.67
.cc 4 0.74
.ct 4 0.99
.ca 4 1.66
.cg 4 0.54
t.a 2 1.25
a.a 3 1.64
c.a 4 1.25
g.a 4 2.12
.at 4 0.08
.ac 4 1.79
.aa 3 2.08
.ag 3 0.51
t.g 3 0.91
a.g 3 0.71
c.g 4 0.66
g.g 4 0.38
.gt 4 2.10
.gc 4 1.59
.ga 3 1.13
.gg 4 0.68
Moyenne Lignes
Lig. ..t ..c ..a ..g
n 16 16 13 14
mcod 1.34 1.46 1.61 0.65
n 6
mcod 0.40
Moyenne colonnes
col. .t. .c. .a. .g.
n 10 12 10 11
mcod 1.31 1.07 1.50 1.13
Totaux carrés
car. B2 t c a g
x.c/t 9.75 2.98 0.32 8.38
x.t/c 5.85 3.95 7.17 6.36
x.a 4.60 6.65 6.24 3.39
x.g 7.07 2.18 1.54 2.72
II/I1LC. Facteurs multiplicateurs A/B
+Moyennes 1ère base
Lig. n mcod
t.t 4 0
a.t 4 0
c.t 4 0.05
g.t 3 8.12
Col. n mcod
.tc 4 0.62
.tt 4 0.89
.ta 3 0.72
.tg 3 1.47
t.c 4 0.95
a.c 4 0.72
c.c 4 1.00
g.c 4 0.78
.cc 4 0
.ct 4 1.04
.ca 4 0.70
.cg 4 1.74
t.a 2 0.82
a.a 3 0.71
c.a 4 0.86
g.a 4 0.57
.at 3 0
.ac 4 0.64
.aa 3 0.56
.ag 3 1.85
t.g 3 1.03
a.g 3 1.30
c.g 4 1.78
g.g 4 2.43
.gt 4 5.51
.gc 4 0.88
.ga 3 0.94
.gg 4 1.73
Moyenne Lignes
Lig. ..t ..c ..a ..g
n 16 16 13 14
mcod 1.64 0.86 0.73 1.70
n 4
mcod 2.91
Moyenne colonnes
col. .t. .c. .a. .g.
n 10 12 10 11
mcod 1.01 1.16 098 1.20
Totaux carrés
car. B2 t c a g
x.c/t 2.49 0 0 22.0
x.t/c 3.54 4.17 2.57 3.51
x.a 2.96 2.79 1.67 2.81
x.g 4.41 6.97 5.54 6.90
Processus E et résonance des 121 eucaryotes[modifier | modifier le wikicode]
  • Lien Tableur: Processus E et résonance des 121 eucaryotes
  • Processus E et résonance des 121 eucaryotes: Texte.
    1. Problématique: Voir la construction des tableaux, par le calcul, le chapitre "Calculs pour 121 eucaryotes". Dans ce dernier il est spécifié que "Les nombres des effectifs non réduits des 121 eucaryotes sont la somme d'un processus analogue à celui des procaryotes, que j'appelle processus E, et d'un processus de résonance. Il s'agit ici de séparer, par les différences entre les tableaux, entre le processus E et le processus de résonance.
    2. Méthode d'analyse: La différence est faite "1er tableau de gauche" − "2ème tableau à droite". Le résultat est mis dans un 3ème tableau à droite. Les couleurs de fond des résultats sont ceux du 1er tableau. Ces différences sont faites entre les indices de multiplicité. Relativement une différence d'indice d'une unité fait doubler celui d'un codon moyen d'une bactérie. Ce qui est élevé. On peut le noter spécialement pour 2 codons faibles, tgt et gcc qui ont un indice inférieur à 0.30 dans le processus E. J'ai coloré en vert foncé les différences supérieures à 2.83, ce qui quadruple l'indice de base.
      − La somme du processus E et du processus de résonance apparaît dans la différence entre les 121 eucaryotes non réduits par le calcul et les bactéries: III1 − I1.
      − Le processus E seul apparaît dans la différence entre les 121 eucaryotes réduits par le calcul et les bactéries: IV1 − I1.
      − Le processus de résonance seul apparaît dans la différence entre les 121 eucaryotes non réduits par le calcul et les 121 eucaryotes réduits: III1 − IV100.
      Les codons xyc/t forts sont comparés aux forts et les faibles aux faibles.
    3. Résultats:
  • Légende: Décompte des gènes tRNAs par codon suivant la base de données gtRNAdb [14].
    1. Voir la légende initiale dans Tableau des effectifs des gènes de tRNAs.
    2.   48.5   : Grandes résonances.
III1. tRNAs par génome.121 Eucaryotes. 92 530
ttt 0.37 tct 10.46 tat 0.41 tgt 1.73
c 12.07 c 0.82 c 13.73 c 19.86
a 5.83 a 5.91 a a 2.06
g 6.74 g 4.55 g g 14.37
ctt 8.97 cct 9.28 cat 0.28 cgt 9.53
c 0.18 c 0.21 c 10.24 c 0.27
a 4.64 a 10.28 a 16.17 a 16.69
g 7.08 g 3.93 g 10.89 g 3.54
att 14.90 act 12.62 aat 0.60 agt 0.30
c 0.58 c 0.69 c 16.85 c 10.45
a 5.58 a 8.70 a 15.54 a 11.31
g 24.14 g 5.55 g 38.50 g 9.05
gtt 12.75 gct 20.86 gat 0.77 ggt 1.14
c 0.78 c 1.98 c 18.55 c 16.67
a 6.53 a 59.00 a 54.62 a 45.84
g 22.31 g 37.52 g 25.71 g 53.21
I1 . tRNAs pour 1 génome. 4032 Bactéries
ttt 0 tct 0 tat 0 tgt 0
c 1,51 c 1,12 c 1,59 c 1,11
a 1,18 a 1,31 a - a 0,33
g 0,99 g 0,65 g - g 1,08
ctt 0,09 cct 0 cat 0 cgt 1,85
c 0,95 c 0,68 c 1,17 c 0,08
a 1,23 a 1,35 a 1,58 a 0,22
g 1,29 g 0,54 g 0,59 g 0,83
att 0 act 0,03 aat 0 agt 0
c 2,28 c 1,12 c 2,17 c 1,10
a 0,01 a 1,46 a 2,26 a 1,19
g 4,47 g 0,68 g 0,60 g 0,86
gtt 0 gct 0 gat 0 ggt 0
c 1,10 c 1,03 c 2,24 c 2,30
a 2,20 a 2,53 a 2,40 a 1,37
g 0,33 g 0,30 g 0,34 g 0,56
III1−I1 Résonance + Processus E.
ttt 0.37 tct 9.34 tat 0.41 tgt 1.73
c 10.6 c 0.82 c 12.1 c 18.8
a 4.65 a 4.59 a a 1.73
g 5.75 g 3.90 g g 13.3
ctt 8.01 cct 8.60 cat 0.28 cgt 7.67
c 0.09 c 0.20 c 9.07 c 0.19
a 3.41 a 8.93 a 14.6 a 16.5
g 5.80 g 3.39 g 10.3 g 2.71
att 12.6 act 11.5 aat 0.59 agt 0.30
c 0.58 c 0.66 c 14.7 c 9.36
a 5.56 a 7.24 a 13.3 a 10.1
g 19.7 g 4.87 g 37.9 g 8.19
gtt 11.7 gct 19.8 gat 0.77 ggt 1.14
c 0.77 c 1.98 c 16.3 c 14.4
a 4.33 a 56.5 a 52.2 a 44.5
g 22.0 g 37.2 g 25.4 g 52.7
IV1. tRNAs par génome. 121 eucaryotes. 55 830
ttt 0.26 tct 10.46 tat 0.30 tgt 0.26
c 12.07 c 0.31 c 13.38 c 17.02
a 5.29 a 5.91 a a 2.06
g 6.56 g 4.55 g g 9.45
ctt 8.29 cct 9.28 cat 0.22 cgt 9.53
c 0.18 c 0.14 c 10.24 c 0.16
a 4.64 a 10.28 a 9.86 a 5.79
g 6.64 g 3.93 g 10.31 g 3.54
att 13.99 act 11.87 aat 0.39 agt 0.24
c 0.34 c 0.23 c 15.36 c 10.45
a 5.58 a 7.23 a 15.54 a 9.40
g 19.69 g 4.55 g 18.12 g 7.81
gtt 11.68 gct 18.52 gat 0.34 ggt 0.22
c 0.44 c 0.29 c 17.61 c 16.67
a 5.49 a 10.55 a 12.02 a 11.12
g 8.95 g 5.82 g 14.72 g 5.25
I1 . tRNAs pour 1 génome. 4032 Bactéries
ttt 0 tct 0 tat 0 tgt 0
c 1,51 c 1,12 c 1,59 c 1,11
a 1,18 a 1,31 a - a 0,33
g 0,99 g 0,65 g - g 1,08
ctt 0,09 cct 0 cat 0 cgt 1,85
c 0,95 c 0,68 c 1,17 c 0,08
a 1,23 a 1,35 a 1,58 a 0,22
g 1,29 g 0,54 g 0,59 g 0,83
att 0 act 0,03 aat 0 agt 0
c 2,28 c 1,12 c 2,17 c 1,10
a 0,01 a 1,46 a 2,26 a 1,19
g 4,47 g 0,68 g 0,60 g 0,86
gtt 0 gct 0 gat 0 ggt 0
c 1,10 c 1,03 c 2,24 c 2,30
a 2,20 a 2,53 a 2,40 a 1,37
g 0,33 g 0,30 g 0,34 g 0,56
IV1−I1. Processus E des 121 Eucaryotes.
ttt 0.26 tct 9.34 tat 0.30 tgt 0.26
c 10.6 c 0.31 c 11.8 c 15.9
a 4.11 a 4.59 a a 1.73
g 5.57 g 3.90 g g 8.36
ctt 7.33 cct 8.60 cat 0.22 cgt 7.67
c 0.09 c 0.14 c 9.07 c 0.07
a 3.41 a 8.93 a 8.28 a 5.57
g 5.36 g 3.39 g 9.71 g 2.71
att 11.7 act 10.7 aat 0.39 agt 0.24
c 0.34 c 0.21 c 13.2 c 9.36
a 5.56 a 5.77 a 13.3 a 8.21
g 15.2 g 3.87 g 17.5 g 6.95
gtt 10.6 gct 17.5 gat 0.34 ggt 0.22
c 0.44 c 0.29 c 15.4 c 14.4
a 3.29 a 8.02 a 9.62 a 9.75
g 8.62 g 5.51 g 14.4 g 4.69
III1. tRNAs par génome.121 Eucaryotes. 92 530
ttt 0.37 tct 10.46 tat 0.41 tgt 1.73
c 12.07 c 0.82 c 13.73 c 19.86
a 5.83 a 5.91 a a 2.06
g 6.74 g 4.55 g g 14.37
ctt 8.97 cct 9.28 cat 0.28 cgt 9.53
c 0.18 c 0.21 c 10.24 c 0.27
a 4.64 a 10.28 a 16.17 a 16.69
g 7.08 g 3.93 g 10.89 g 3.54
att 14.90 act 12.62 aat 0.60 agt 0.30
c 0.58 c 0.69 c 16.85 c 10.45
a 5.58 a 8.70 a 15.54 a 11.31
g 24.14 g 5.55 g 38.50 g 9.05
gtt 12.75 gct 20.86 gat 0.77 ggt 1.14
c 0.78 c 1.98 c 18.55 c 16.67
a 6.53 a 59.00 a 54.62 a 45.84
g 22.31 g 37.52 g 25.71 g 53.21
IV1. tRNAs par génome. 121 eucaryotes. 55 830
ttt 0.26 tct 10.46 tat 0.30 tgt 0.26
c 12.07 c 0.31 c 13.38 c 17.02
a 5.29 a 5.91 a a 2.06
g 6.56 g 4.55 g g 9.45
ctt 8.29 cct 9.28 cat 0.22 cgt 9.53
c 0.18 c 0.14 c 10.24 c 0.16
a 4.64 a 10.28 a 9.86 a 5.79
g 6.64 g 3.93 g 10.31 g 3.54
att 13.99 act 11.87 aat 0.39 agt 0.24
c 0.34 c 0.23 c 15.36 c 10.45
a 5.58 a 7.23 a 15.54 a 9.40
g 19.69 g 4.55 g 18.12 g 7.81
gtt 11.68 gct 18.52 gat 0.34 ggt 0.22
c 0.44 c 0.29 c 17.61 c 16.67
a 5.49 a 10.55 a 12.02 a 11.12
g 8.95 g 5.82 g 14.72 g 5.25
III1−IV1. Résonance des 121 Eucaryotes.
ttt 0.11 tct 0 tat 0.12 tgt 1.46
c 0 c 0.50 c 0.35 c 2.83
a 0.54 a 0 a a 0
g 0.18 g 0 g g 4.93
ctt 0.68 cct 0 cat 0.06 cgt 0
c 0 c 0.07 c 0 c 0.12
a 0 a 0 a 6.31 a 10.9
g 0.44 g 0 g 0.59 g 0
att 0.91 act 0.75 aat 0.21 agt 0.06
c 0.24 c 0.45 c 1.50 c 0
a 0 a 1.47 a 0 a 1.91
g 4.45 g 1.00 g 20.4 g 1.24
gtt 1.07 gct 2.34 gat 0.43 ggt 0.92
c 0.34 c 1.69 c 0.94 c 0
a 1.04 a 48.5 a 42.6 a 34.7
g 13.4 g 31.7 g 11.0 g 48.0
Calculs pour 121 eucaryotes[modifier | modifier le wikicode]
  • Lien Tableur: Calculs pour 121 eucaryotes
  • Liens: base de données gtRNAdb [15]Lignes et colonnes des 121tableaux synthétiquesTableau des effectifs 121Processus E et résonance des 121 eucaryotes
  • Linéarité du code des gènes de tRNA chez les eucaryotes: Voir le tableau analysé,
    1. Problématique: voir la problématique dans 3 domaines paragraphe "3.résultats/3.code des archées/3a/-structuration par codons, conclusion".
      - Chez les procaryotes la multiplicité est très faible par rapport à celle des eucaryotes. Elle est aussi très variable d'un codon à un autre chez ces derniers. L'effectif de 155 eucaryotes de la base de donné gtRNAdb est faible et la multiplicité dépassant le millier pour certains codons seulement ne permettent pas de dégager une tendance des codons comme chez les procaryotes où pour les bactéries l'effectif est très élevé (autour de 4000 bactéries) et où pour les archées leur uniformité et leurs multiplicités proches de l'unité suffisent à caractériser chaque codon comme on l' a vu dans les 3 domaines. Donc pour les procaryotes les totaux des codons relevés dans la base de données suffisent à les caractériser.
      - Dans un 1er temps j’ai éliminé des effectifs les 6 eucaryotes dont au moins 1 codon a une multiplicité supérieure à 1000. Les tendances analogues à celles des procaryotes se précisent alors clairement. Mais beaucoup d'autres codons dont la multiplicité dépasse la centaine rend arbitraire la limite de 1000 choisie auparavant. Aussi j'ai décidé de porter les nombres de tRNA d'un codon en fonction des moyennes de chaque eucaryote sélectionné. C'est ainsi que le codon n’est plus caractérisé par un nombre mais par sa courbe de tendance.
    2. Méthode d'analyse
      - Pour représenter la courbe de tendance par un seul paramètre j'ai choisi une droite passant par l'origine. Le passage par l'origine est justifié parce qu'un codon peut n’avoir aucun gène tRNA. Et la droite est la courbe la plus simple permettant d'avoir un seul paramètre. Enfin, comme la base de données du 29.10.17 présente moins de 10% des eucaryotes ayant des codons à grande multiplicité, j'ai éliminé pour la droite d'un codon étudié ceux qui diminuent fortement son coefficient de détermination. C'est ainsi que je n'ai éliminé que 74 codons sur un total de 5445 (121*45) étudiés avec 121 eucaryotes sélectionnés restant et 45 codons, en laissant de côté les codons xyc/t faibles, le codon tga et les 2 codons stop.
      - Par ailleurs la base de données contient des doublons ou autrement des génomes qui ont été analysés plusieurs fois avec des individus différents. Je n'ai choisi aussi que les variants d'une même espèces qui ont un écart de leur total supérieur à 10%. C'est ainsi que j'ai éliminé de l'étude 30 eucaryotes. Sur 155 eucaryotes affichés par les statistiques de la base je n'en ai décompté que 154 dont 2 sont anormaux (Oryzias latipes (Medaka), Eremothecium cymbalariae). Par ailleurs j'ai étudié en parallèle Danio rerio (zebra fish) car tous ses codons ont une multiplicité élevé et le total de 12258 tRNAs permet sa comparaison avec les 3 domaines. Il reste donc 121 eucaryotes.
      - Pour pouvoir comparer avec les nombres de tRNAs des codons des procaryotes j'ai calculé le nombre de tRNAs des codons supprimés en multipliant la pente par la moyenne des codons du génome de ce codon supprimé. Le nombre total des tRNAs d'un codon est alors la somme des décomptes directs des codons non supprimés et de ceux recalculés ( ligne totaux + sommes calculées). Cette méthode, par rapport à l'omission de tout un génome, a l'avantage d'étudier tous les génomes et les codons sont traités de façon homogène.
    3. Résultats
      − Du tableau des calculs ci-dessous sont extraits
      + le tableau   IV. Nombres des 121 eucaryotes 55 830  des effectifs calculés des gènes de tRNA des 121 eucaryotes et
      + le tableau  III. Nombres des 121 eucaryotes 92 580des effectifs non réduits des gènes de tRNA des 121 eucaryotes.
      Ils sont accompagnés de leurs tableaux respectifs des effectifs rapportés à 100 000 tRNAs  
      + le tableau IV100. Nombres des 121 eucaryotes 55 830, 
      + le tableau III100. Nombres des 121 eucaryotes 92 580,  
      et de leurs tableaux respectifs des indices de multiplicité  
      + le tableau IV1. Nombres des 121 eucaryotes 55 830,  
      + le tableau III1. Nombres des 121 eucaryotes 92 580.
      − Le tableau synthétique des tableaux, pour les comparaisons in visu, contient:
      + les 3 tableaux des effectifs calculés des 121 eucaryotes,  IV.IV100.IV1.  Nombres des 121 eucaryotes 55 830,
      + les 2 tableaux des pentes et des coefficients de détermination des calculs sur les 121 eucaryotes,  IVp. PentesIVr. R2  des 121 eucaryotes 55 830.
       Pour refaire les calculs dans un tableur utiliser le tableau non formaté correspondant au tableau ci-dessous.
      + le tableau de multiplicité des effectifs non réduits des 121 eucaryotes,  III1.  Nombres des 121 eucaryotes 92 580,
      + le tableau des effectifs rapportés à 100 000 tRNAs des bactéries  I100.  Nombres des 4032 bactéries 235 027, et
      + les 2 tableaux de zebrafish des effectifs et des effectifs rapportés à 100 000 tRNAs,  V.V100.  Nombres des tRNAs Zebrafish 12 258.
      − L'étude des lignes et colonnes pour les doublets des 121 eucaryotes et du zebrafish est reportée ici.
      − Le processus E de duplication et la résonance des 121 eucaryotes: Les nombres des effectifs non réduits des 121 eucaryotes sont la somme d'un processus de duplication linéaire, analogue à celui des procaryotes, que j'appelle processus E, E pour eucaryote, c'est à dire un processus à progression linéaire une fois les nombres triés dans l'ordre croissant; et la somme, pour certains codons seulement, des duplications explosives de plus de 100 tRNAs par codon et que j'appelle résonance des eucaryotes par analogie aux sauts de fréquence des répétitions de plus de 4 bases identiques dans l'ADN des procaryotes de l'article "répétitions des bases chez les procaryotes" (ref.) à l'origine de mon hypothèse de la résonance de l'ADN. Pour apprécier ces 2 phénomènes j'ai procédé aux calculs des différences, reportés au chapitre Processus E et résonance des 121 eucaryotes, entre les tableaux nommés ci-dessus:
      + Différence entre "III1. Nombres des 121 eucaryotes 92 580" et "I1. Nombres des 4032 bactéries 235 027", pour la somme du processus E et de la résonance;
      + Différence entre "IV1. Nombres des 121 eucaryotes 55 830" et "I1. Nombres des 4032 bactéries 235 027", pour le processus E seul;
      + Différence entre "III1. Nombres des 121 eucaryotes 92 580" et "IV1. Nombres des 121 eucaryotes 55 830", pour la résonance seule.
      1. Comportement des 121 eucaryotes:
        Liens: Tableau synthétique,  Analyse des 155 eucaryotes,  LC des 121 eucaryotes,  demi-doublets des 121 eucaryotes.
        1.a − les bascules des codons c en t chez E.
        1.b − les codons a et g de E
        • Les rapports g/a:
        • Lignes et colonnes
        • Caractérisation des codons:
        1.c − les exceptions des eucaryotes
      2. Séparation processus E et résonance: Processus E et Résonance
      3. Comparaison processus E et processus Bactéries: Analyse des 155 eucaryotes, Processus E et Résonance, LC des 121 eucaryotes
        Avec les bactéries la majorité des codons xyg (11 sur 15) sont minoritaires dans leur doublet. Comme les codons xyt sont presque inexistants il ne nous reste plus que 3 codons par doublet à comparer. Par leur faiblesse les codons xyg deviennent homogènes et nous permettent alors de différencier les colonnes 2 par 2 et la ligne 4 par rapport aux 3 autres lignes. C'est ainsi que les colonnes 1 et 4 ont chacune 3 codons xyg à effectif élevé ( 1702 2207 7670, 1858 1427 1469 ) alors que les colonnes 2 et 3 ont 7 codons g à effectif faible ( 521 - 1174 ) et la ligne 4 a 4 codons à effectif faible ( 964 - 521 ).
      4. Distribution des codons dans le processus E: Distribution des tRNAs des 121_eucaryotes
      5. Processus Zebrafish et processus de résonance: distribution des codons sur les chromosomes
  • Légende: retour au texte
    ttt ttc . . . nombre de gènes de tRNA des codons ttt ttc . . . relevé de la base de données gtRNAdb au 29.10.17
    moy : moyenne des codons d'un eucaryote. Si la ligne contient les caractères € ou #, les codons correspondants n'entrent pas dans la moyenne comme le fait le tableur calc. Les codons faibles xyc/t ne rentrent pas dans la moyenne.
    pour nombres dépassant 100 dans une 1ère approche du coefficient de détermination R2. Il y en a 61.
    # pour nombres améliorant le coefficient de détermination. Il y en a 13.
    − Doublons: ce sont les eucaryotes qui sont dans la base mais non utilisés pour les diagrammes car ils concernent 2 individus de la même espèce ou des variantes très proches des espèces retenues (voir texte pour plus de détail).
    − Tableau des diagrammes: Il est fait de 121 espèces et de 43 codons. Ne sont pas concernés les codons à faibles effectifs xyc ou xyt.
    − Données non modifiées: Pour repérer les codons omis, en jaune ceux supérieurs à 100 () et en orange les codons d'ajustement (#). Pour comparaison j’ai mis zebrafish sans annotations.
    − codons forts: codons à effectifs élevés. Au total 43. Ne sont pas pris en compte les 16 codons xyc/t faibles et les codons stop tga taa tag.
    + total: total des effectifs restants après suppression des effectifs élevés ou d'ajustement.
    + somme calculée: pente multipliée par la somme des moyennes des eucaryotes ayant perdu le codon omis.
    + totaux + sommes calculées: est le nombre calculé des gènes de tRNA du codon.
    + R2 et pente: coefficient de détermination et pente de la courbe de tendance du diagramme du codon en fonction de la moyenne moy. J'ai opté pour une droite passant par l'origine d'après le tableur calc. R2 a été multiplié par 1000.
    − codons faibles: les 16 codons xyc/t à effectifs faibles.
    + c/t > 3: est le nombre de codons faibles ayant plus de 3 gènes de tRNA.
    + c/t > 3, total: leur total en gènes
    + reste calculé: total des gènes des autres codons plus c/t > 3. C'est la réduction des codons faibles reportés dans la ligne "Totaux des 121 réduits" ci-dessous.
    + multiplicité x 100: division de reste calculé par 121 en %.
    + c/t = 3: est le nombre de codons faibles ayant 3 gènes de tRNA (pour illustration).
    − Totaux des 121 réduits: ils sont reportés dans les tableaux des effectifs calculés des gènes de tRNA des 121 eucaryotes "IV. nombre des 121 eucaryotes 55 830".
    − Totaux des 121 eucaryotes non réduits: ils sont reportés dans les tableaux des effectifs des gènes de tRNA des 121 eucaryotes "III. nombre des 121 eucaryotes 92 580".
    − KEGG [16]: nomenclature de l'eucaryote dans la base KEGG, bta par exemple. Surmonté d'un * le code n'est pas celui de KEGG, mais attribué pour homogénéité.
  • Tableau des calculs pour 121 eucaryotes sélectionnés.
Gènes de tRNAs: calculs pour 121 eucaryotes.
Gènes de tRNA eucaryotes, doublons.
max total KEGG eucaryote moy ttt ttc tta ttg ctt ctc cta ctg att atc ata atg gtt gtc gta gtg tct tcc tca tcg cct ccc cca ccg act acc aca acg gct gcc gca gcg tat tac taa tag cat cac caa cag aat aac aaa aag gat gac gaa gag tgt tgc tga tgg cgt cgc cga cgg agt agc aga agg ggt ggc gga ggg
1327 4180 bta Bos taurus (cow) (Baylor Btau_4.6.1 Oct 2011) 86,7 7 31 10 14 10 0 5 8 17 0 8 33 23 0 23 46 14 30 6 7 12 0 9 5 15 1 10 7 30 2 36 18 11 38 0 0 4 22 19 43 0 40 83 40 7 47 456 172 156 351 26 187 14 10 12 15 4 18 45 114 20 61 401 1 327
46 758 cre* Caenorhabditis remanei (WUGSC 15.0.1 May 2007) 16,7 0 18 6 12 24 0 7 4 25 1 14 24 28 0 4 9 16 0 10 6 7 2 41 6 18 0 10 6 27 0 15 6 0 22 0 0 1 22 23 9 1 23 20 33 0 36 23 25 0 14 0 17 25 0 11 1 0 9 13 5 0 28 46 5
38 600 hsa Homo sapiens (hg19 - NCBI Build 37.1 Feb 2009) 12,8 0 15 9 12 12 0 4 11 18 6 5 20 12 1 8 17 12 1 6 4 10 1 8 4 10 0 6 7 31 1 10 5 5 32 0 0 0 10 18 22 2 34 20 24 1 17 14 10 1 38 3 8 7 0 6 4 1 8 7 5 0 15 9 13
33 508 yli Yarrowia lipolytica WSH-Z06 11,3 0 17 1 3 21 0 2 13 26 0 1 18 24 0 2 8 21 0 2 4 21 0 3 2 22 0 3 2 29 0 4 2 0 14 0 0 0 12 3 15 0 16 4 33 0 28 6 27 0 8 0 13 1 0 25 0 0 6 4 1 0 30 11 0
34 484 yli Yarrowia lipolytica PO1f 10,8 0 18 1 3 18 0 2 12 26 0 1 18 24 0 2 8 21 0 2 4 21 0 3 2 22 0 3 3 29 0 4 2 0 14 0 0 0 12 3 15 0 15 4 34 0 24 6 22 0 8 0 13 1 0 24 0 0 6 4 1 0 18 11 0
57 432 mmu Mus musculus (mm9 July 2007) 9,4 0 7 4 4 8 0 3 10 11 1 5 18 8 1 3 11 9 1 3 3 7 0 8 3 9 0 4 5 19 0 11 10 0 10 0 0 1 10 6 10 0 14 11 19 0 16 8 13 0 57 2 8 6 0 3 5 0 8 5 5 1 14 7 7
16 315 dwi Drosophila willistoni (D. willistoni Feb. 2006) 6,8 0 7 3 7 4 1 2 9 9 2 4 15 8 1 5 5 8 1 3 3 7 0 5 4 7 1 7 4 11 0 6 2 0 8 0 0 0 8 4 6 0 10 8 10 0 16 11 12 0 12 1 7 10 0 7 1 0 6 4 5 0 12 6 0
17 305 dan Drosophila ananassae (D. ananassae Feb. 2006 Agencourt CAF1) 6,7 0 8 2 4 5 0 2 10 11 0 2 12 7 0 2 7 6 0 3 6 4 0 4 8 9 0 7 3 10 0 4 6 0 9 0 0 0 5 4 8 0 10 7 17 0 13 6 14 1 6 1 6 12 0 8 0 0 6 3 2 0 16 6 3
18 293 dpe Drosophila persimilis (D. persimilis Oct. 2005 Broad) 6,5 0 7 1 3 5 0 2 10 11 0 2 11 7 0 2 5 9 0 2 5 6 0 6 4 8 0 8 3 11 0 2 3 0 9 0 0 0 7 4 7 0 9 4 14 0 18 6 14 0 8 1 8 13 0 5 0 0 5 2 4 0 13 6 3
18 292 dpo Drosophila pseudoobscura (D. pseudoobscura Feb. 2006) 6,5 0 7 2 4 5 0 2 9 10 0 2 11 7 0 2 6 11 0 2 3 3 0 6 4 8 0 8 4 12 0 3 3 0 9 0 0 0 5 4 7 0 9 5 12 0 14 6 18 0 11 1 8 9 0 4 0 0 5 3 5 0 14 6 3
15 291 des Drosophila sechellia (D. sechellia Oct. 2005 Broad) 6,4 0 9 4 4 5 0 2 8 10 0 2 15 8 0 2 8 8 0 2 4 7 0 5 5 9 0 6 5 13 0 2 3 0 9 0 0 0 7 2 8 0 9 4 12 0 13 5 13 0 6 1 8 9 0 7 0 0 6 3 4 0 13 6 0
14 282 der Drosophila erecta (D. erecta Feb. 2006 Agencourt CAF1) 6,2 0 9 3 4 5 0 2 7 9 0 2 12 7 0 2 7 9 0 2 4 5 0 5 5 8 0 6 3 12 0 2 3 0 8 0 0 0 6 4 8 0 8 5 11 0 14 6 13 1 6 1 8 9 0 7 0 0 6 3 4 0 14 1 6
14 268 dvi Drosophila virilis (D. virilis Feb. 2006 Agencourt CAF1) 5,9 0 8 2 5 3 0 3 7 9 0 2 12 6 0 2 7 6 0 2 4 4 0 3 5 7 0 7 4 8 0 3 3 0 10 0 0 0 5 4 7 0 7 12 12 0 13 6 10 0 8 1 6 10 0 5 0 0 5 2 2 0 14 6 1
14 262 dmo Drosophila mojavensis (D. mojavensis Feb. 2006 Agencourt CAF1) 5,8 0 8 2 6 3 0 2 6 8 0 2 12 6 0 2 6 6 0 2 4 6 0 5 3 7 0 8 4 9 0 4 3 0 7 0 0 0 5 4 7 0 8 8 11 0 12 6 11 0 7 1 6 10 0 5 0 0 5 2 2 0 14 6 1
18 259 dgr Drosophila grimshawi (D. grimshawi Feb. 2006 Agencourt CAF1) 5,7 0 9 2 4 4 0 2 7 7 0 2 10 6 0 2 6 6 0 2 4 4 0 4 5 7 0 8 4 8 0 3 3 0 10 0 0 0 5 3 12 0 7 7 12 0 12 6 10 0 6 1 6 9 0 4 0 0 3 3 2 0 18 4 0
24 296 fpu Fusarium pseudograminearum CS3096 6,6 0 9 1 3 17 0 2 5 10 0 2 6 19 0 2 3 11 0 2 2 9 0 3 2 10 0 4 3 14 0 4 3 0 9 0 0 0 6 5 6 0 8 2 17 0 9 4 24 0 5 0 4 11 0 8 1 0 9 1 2 0 13 5 1
19 292 fpu Fusarium pseudograminearum CS3270 6,5 0 10 1 3 13 0 2 5 13 0 2 6 17 0 2 3 11 0 2 2 10 0 3 2 10 0 4 3 13 0 4 3 0 8 0 0 0 6 5 6 0 9 2 16 0 13 4 19 0 5 0 4 11 0 9 1 0 8 1 2 0 13 5 1
17 280 sceb* Saccharomyces sp. boulardii 17 6,2 0 11 6 9 0 1 3 0 13 0 3 10 15 0 3 2 11 0 3 1 2 0 10 0 9 0 4 1 8 0 5 0 0 9 0 0 0 7 9 1 0 9 7 15 0 17 14 2 0 4 0 6 7 0 0 1 0 4 13 1 1 17 4 2
15 263 sceb* Saccharomyces sp. boulardii ATCC MYA-796 5,8 0 11 7 9 0 1 3 0 12 0 2 10 13 0 2 2 10 0 3 1 2 0 10 0 10 0 5 1 11 0 5 0 0 8 0 0 0 8 7 1 0 8 7 13 0 14 13 2 0 4 0 6 6 0 0 1 0 4 10 1 0 15 3 2
14 265 ndi Naumovozyma dairenensis CBS 421 5,9 0 9 9 8 1 0 4 0 12 0 2 9 14 0 2 2 11 0 3 1 1 0 11 0 11 0 5 2 10 0 5 0 0 9 0 0 0 7 10 1 0 9 8 12 0 13 13 1 0 5 0 5 5 0 0 2 0 5 11 1 0 12 3 1
13 224 vda Verticillium dahliae JR2 4,9 0 7 1 1 8 0 1 4 10 0 0 9 11 0 1 2 6 1 2 4 8 0 3 2 8 0 2 3 11 0 2 4 0 6 0 0 0 6 2 5 0 6 2 12 0 9 2 12 0 5 1 3 9 0 2 2 0 5 3 2 0 13 3 3
11 178 afm Aspergillus fumigatus Af293 4,0 0 5 1 2 6 0 0 4 7 0 1 8 7 0 1 2 5 0 1 2 5 0 2 2 6 0 3 2 8 0 3 2 0 5 0 0 0 4 2 6 0 5 1 8 0 9 4 8 0 3 0 3 9 0 2 2 0 4 1 2 0 11 3 1
10 141 cgi Cryptococcus gattii WM276 3,1 0 5 1 3 6 0 0 1 6 0 1 6 7 0 0 2 6 0 1 1 6 0 1 0 5 0 1 1 7 0 1 2 0 4 0 0 0 4 2 3 0 4 1 7 0 0 3 10 0 3 0 3 3 0 5 1 0 2 1 3 0 9 3 0
9 139 cne Cryptococcus neoformans var. neoformans JEC21 3,1 0 5 1 3 6 0 0 1 6 0 1 6 7 0 0 2 6 0 1 1 5 0 1 0 5 0 1 1 7 0 1 2 0 4 0 0 0 4 2 3 0 4 1 7 0 0 3 9 0 3 0 3 3 0 5 1 0 2 1 3 0 9 3 0
9 137 cnb Cryptococcus neoformans var. neoformans B-3501A 3,0 0 5 1 3 6 0 0 1 6 0 1 6 7 0 0 2 4 0 1 1 5 0 1 0 5 0 1 1 7 0 1 2 0 4 0 0 0 4 2 3 0 4 1 7 0 0 3 9 0 3 0 3 3 0 5 1 0 2 1 3 0 9 3 0
8 130 cdu Candida dubliniensis CD36 2,9 0 5 5 5 2 0 0 1 6 0 1 4 8 0 1 1 4 0 3 1 1 0 5 0 5 0 2 1 6 0 2 0 0 4 0 0 0 3 4 1 0 4 5 3 0 6 7 1 0 2 0 2 2 0 0 1 0 1 5 1 0 6 2 1
6 123 kpa* Komagataella pastoris GS115 2,7 0 5 1 3 2 0 1 2 5 0 1 4 5 0 1 1 4 0 2 1 2 0 4 1 5 0 1 1 5 0 2 0 0 4 0 0 0 3 3 2 0 4 3 5 0 6 5 4 0 2 0 3 2 0 1 1 0 2 4 1 0 5 3 1
2 46 ehe Encephalitozoon hellem ATCC 50504 1,0 0 1 1 1 1 0 1 1 1 0 1 2 1 0 1 1 1 0 1 1 1 0 1 1 1 0 1 1 1 0 1 1 0 1 0 0 0 1 1 1 0 2 1 1 0 1 1 1 0 1 0 1 1 0 1 0 0 1 1 1 0 1 1 1
2 46 ein Encephalitozoon intestinalis ATCC 50506 1,0 0 1 1 1 1 0 1 1 1 0 1 2 1 0 1 1 1 0 1 1 1 0 1 1 1 0 1 1 1 0 1 1 0 1 0 0 0 1 1 1 0 2 1 1 0 1 1 1 0 1 0 1 1 0 1 0 0 1 1 1 0 1 1 1
2 46 ero Encephalitozoon romaleae SJ-2008 1,0 0 1 1 1 1 0 1 1 1 0 1 2 1 0 1 1 1 0 1 1 1 0 1 1 1 0 1 1 1 0 1 1 0 1 0 0 0 1 1 1 0 2 1 1 0 1 1 1 0 1 0 1 1 0 1 0 0 1 1 1 0 1 1 1
Tableau des diagrammes des pentes
max total KEGG eucaryote moy ttt ttc tta ttg ctt ctc cta ctg att atc ata atg gtt gtc gta gtg tct tcc tca tcg cct ccc cca ccg act acc aca acg gct gcc gca gcg tat tac taa tag cat cac caa cag aat aac aaa aag gat gac gaa gag tgt tgc tga tgg cgt cgc cga cgg agt agc aga agg ggt ggc gga ggg
2 35 pfa Plasmodium falciparum 0,78 0 1 1 1 1 0 1 1 1 0 1 2 1 0 1 1 1 0 1 1 1 0 1 1 0 0 1 1 1 0 1 1 0 1 0 0 0 0 1 1 0 1 0 0 0 1 1 1 0 0 0 0 0 0 1 0 0 1 1 0 0 0 1 0
2 46 ecu Encephalitozoon cuniculi GB-M1 1,02 0 1 1 1 1 0 1 1 1 0 1 2 1 0 1 1 1 0 1 1 1 0 1 1 1 0 1 1 1 0 1 1 0 1 0 0 0 1 1 1 0 2 1 1 0 1 1 1 0 1 0 1 1 0 1 0 0 1 1 1 0 1 1 1
2 53 ede* Exophiala dermatitidis NIH/UT8656 1,16 0 1 1 1 1 1 1 1 2 0 1 1 2 0 1 1 1 0 1 1 0 0 1 1 2 0 1 1 2 0 1 1 0 1 0 0 0 2 1 1 0 1 1 0 0 2 1 2 0 1 0 0 2 0 2 1 0 1 0 1 0 2 1 2
4 80 opa* Ogataea parapolymorpha DL-1 1,78 0 3 1 3 1 0 1 1 4 0 1 4 3 0 0 1 2 0 1 1 0 0 3 0 3 0 1 1 3 0 2 0 0 2 0 0 0 2 2 1 0 2 2 3 0 3 2 3 0 1 0 2 2 0 0 1 0 2 3 1 0 4 2 0
5 82 cot Candida orthopsilosis Co 90-125 1,82 0 2 3 1 1 0 0 1 4 0 1 4 4 0 1 1 2 0 2 1 1 0 3 0 4 0 2 1 3 0 2 0 0 3 0 0 0 1 3 1 0 3 4 3 0 5 2 1 0 1 0 1 2 0 0 1 0 1 2 1 0 2 1 0
4 82 lma Leishmania major 1,82 0 2 1 1 3 0 1 2 3 0 1 4 2 0 1 2 1 0 1 1 2 0 1 2 3 0 1 2 2 0 1 2 0 3 0 0 0 2 1 3 0 3 1 3 0 3 1 2 0 1 0 1 4 0 1 1 0 2 1 1 0 4 1 1
6 96 sre* Sporisorium reilianum SRZ2 2,11 0 4 1 0 4 0 1 2 4 0 1 4 4 0 1 0 2 0 1 2 3 0 1 1 4 0 1 1 3 0 1 1 0 2 0 0 0 3 3 2 0 3 1 5 0 3 2 4 0 2 1 2 4 0 2 0 0 0 1 1 0 6 1 1
6 111 uma Ustilago maydis 521 2,40 0 3 1 0 4 0 2 2 4 0 1 4 4 0 1 1 3 0 1 3 4 1 1 1 4 0 1 1 5 0 1 1 0 3 0 0 0 2 2 3 0 3 1 5 0 5 2 5 0 2 2 2 4 0 3 0 0 2 1 1 0 6 2 1
6 123 kpa* Komagataella pastoris CBS 7435 2,73 0 5 1 3 2 0 1 2 5 0 1 4 5 0 1 1 4 0 2 1 2 0 4 1 5 0 1 1 5 0 2 0 0 4 0 0 0 3 3 2 0 4 3 5 0 6 5 4 0 2 0 3 2 0 1 1 0 2 4 1 0 5 3 1
6 125 cal Candida albicans WO-1 2,78 0 5 5 6 2 0 0 1 6 0 1 4 6 0 1 1 4 0 3 1 1 0 4 0 4 0 2 1 6 0 2 0 0 4 0 0 0 3 5 1 0 3 5 2 0 6 6 1 0 2 0 2 2 0 0 1 0 2 5 1 0 5 2 1
10 143 cneg* Cryptococcus neoformans var. grubii H99 3,18 0 5 1 3 6 0 0 1 6 0 1 7 7 0 0 2 6 0 1 1 6 0 1 0 5 0 1 1 8 0 1 2 0 4 0 0 0 4 2 3 0 4 1 7 0 0 3 10 0 3 0 3 3 0 5 1 0 2 1 3 0 9 3 0
10 154 ttt Thielavia terrestris NRRL 8126 3,42 0 5 5 1 5 0 1 4 6 0 1 5 6 0 1 3 3 0 1 3 4 0 2 3 4 0 1 2 7 0 2 3 0 4 0 0 0 3 2 4 0 3 2 6 0 6 2 7 0 3 0 4 6 0 1 3 0 3 1 2 0 10 2 2
11 155 mgp Meleagris gallopavo (turkey) (TGC Turkey_2.01 Dec 2009) 3,42 0 6 1 2 1 0 1 4 3 0 1 11 3 1 2 3 5 0 3 1 7 0 2 1 4 0 2 0 7 0 6 3 0 6 0 0 0 3 1 1 0 4 4 3 0 3 5 6 0 5 0 5 2 0 1 2 0 6 3 3 0 5 4 3
9 156 vma* Valsa mali 03-8 3,47 0 4 0 2 5 0 1 4 7 0 1 8 7 0 1 2 5 0 1 2 0 0 2 1 4 0 3 2 7 0 2 2 0 4 0 0 0 5 2 4 0 5 0 9 0 6 3 9 0 3 0 3 6 0 2 2 0 3 1 2 0 9 3 2
9 158 kna* Kazachstania naganishii CBS 8797 3,51 0 6 3 5 1 0 3 0 7 0 2 4 7 0 1 2 7 0 1 1 1 0 6 0 7 0 2 1 7 0 1 1 0 5 0 0 0 4 4 2 0 6 4 7 0 8 5 3 0 4 0 4 3 0 0 1 0 3 6 1 0 9 1 2
9 162 kla Kluyveromyces lactis NRRL Y-1140 3,58 0 5 3 7 0 1 2 0 7 0 1 6 7 0 1 2 6 0 2 1 1 0 7 0 6 0 2 1 7 0 3 0 0 5 0 0 0 4 6 1 0 6 4 9 0 8 8 2 0 3 0 4 3 0 0 1 0 2 7 1 0 7 2 1
9 168 spo Schizosaccharomyces pombe 972h- 3,73 0 5 2 4 5 0 1 1 8 0 1 7 9 0 2 1 7 0 2 1 6 0 2 1 7 0 2 1 6 0 2 1 0 4 0 0 0 4 4 2 0 6 3 9 0 8 4 6 0 3 0 3 8 0 1 1 0 3 2 1 0 8 3 1
10 170 pic Scheffersomyces stipitis CBS 6054 3,78 0 6 3 8 3 0 0 1 7 0 1 6 7 0 2 1 6 0 2 2 1 0 6 0 7 0 2 1 7 0 3 0 0 5 0 0 0 4 5 2 0 7 3 9 0 8 8 2 0 3 0 4 3 0 0 1 0 2 7 1 0 10 3 1
11 181 ani Aspergillus nidulans FGSC A4 4,02 0 5 1 2 6 0 2 3 7 0 1 7 8 0 1 2 5 0 1 2 6 0 2 2 6 0 2 2 8 0 2 3 0 6 0 0 0 5 2 5 0 6 2 8 0 8 3 8 0 3 0 3 9 0 2 2 0 4 2 2 0 11 3 1
14 190 mgr Magnaporthe oryzae 70-15 4,22 0 7 1 2 7 0 1 4 8 0 1 8 6 0 1 2 4 0 2 3 5 0 2 2 6 0 2 2 9 0 3 2 0 5 0 0 0 4 2 6 0 6 2 9 0 10 3 9 0 3 0 4 6 0 2 2 0 3 1 3 0 14 3 3
13 191 mun* Melopsittacus undulatus (Budgerigar Sep. 2011 WUSTL v6.3/melUnd1) 4,18 0 6 4 3 3 0 0 6 5 0 1 9 3 1 1 4 4 1 3 1 2 0 3 2 5 0 2 0 9 0 5 2 0 7 0 0 0 4 2 4 0 9 3 13 0 9 3 1 0 5 1 4 3 0 1 1 0 8 4 4 0 10 9 1
11 191 cjd* Cyberlindnera jadinii NBRC 0988 NBRC0988 4,20 0 8 1 7 4 0 3 1 6 1 1 7 9 0 2 3 7 0 3 1 0 0 7 0 6 0 3 1 6 0 3 0 0 5 0 0 0 6 6 2 0 7 5 8 0 8 4 9 0 3 1 4 6 0 0 1 0 3 7 0 0 11 4 1
12 192 tdl Torulaspora delbrueckii CBS 1146 4,24 0 6 3 8 0 1 4 0 8 0 1 7 12 0 1 2 7 0 2 1 1 0 6 0 9 0 2 1 8 0 4 0 0 6 0 0 0 4 6 2 0 7 5 10 0 9 8 4 0 3 0 4 4 0 0 1 0 3 7 1 0 11 2 1
12 192 pch* Penicillium chrysogenum P2niaD18 4,22 0 5 0 0 6 1 0 3 10 0 2 10 9 0 1 3 7 0 1 2 0 0 0 1 12 0 3 2 8 0 2 2 0 5 0 0 0 11 3 5 0 6 1 9 0 9 3 10 0 3 1 0 10 0 2 2 0 4 0 2 0 11 4 1
11 192 mth* Myceliophthora thermophila ATCC 42464 4,24 0 5 1 2 7 0 1 4 8 0 1 8 7 0 2 3 5 0 3 3 6 0 2 3 6 0 2 3 7 0 2 3 0 6 0 0 0 4 2 5 0 6 3 9 0 10 2 8 0 3 1 4 7 0 1 2 0 5 1 2 0 11 4 2
16 203 gfr Geospiza fortis (Medium ground finch Apr. 2012 GeoFor_1.0/geoFor1) 4,44 0 6 11 2 4 0 7 0 6 1 2 6 2 1 1 3 2 0 3 1 4 0 5 1 5 0 4 1 16 0 5 2 0 12 0 0 0 4 2 3 1 6 4 7 0 5 4 6 0 10 0 3 6 0 2 0 0 6 3 2 0 8 4 4
11 205 sas* Saccharomycetaceae sp. Ashbya aceri 4,51 0 7 3 7 0 1 4 1 9 0 1 10 7 0 3 4 7 0 3 3 1 0 7 0 7 0 3 2 7 0 5 2 0 5 0 0 0 5 4 4 0 8 4 9 0 10 3 8 0 3 1 5 4 0 0 2 0 3 7 1 0 11 2 2
13 206 tpf Tetrapisispora phaffii CBS 4417 4,56 0 9 9 2 0 1 2 0 10 0 2 8 10 0 2 1 8 0 2 1 1 0 7 0 9 0 2 1 9 0 3 0 0 6 0 0 0 5 7 1 0 9 6 9 0 12 11 1 0 4 0 4 3 0 0 1 0 3 8 1 0 13 2 1
12 207 cgr Candida glabrata CBS 138 4,58 0 6 3 8 0 1 4 0 9 0 2 7 10 0 2 1 9 0 2 1 1 0 7 0 9 0 3 1 10 0 5 0 0 6 0 0 0 6 6 2 0 9 3 12 0 9 9 3 0 3 0 5 4 0 0 1 0 3 9 1 0 12 2 1
12 211 acs Anolis carolinensis (lizard) (Broad AnoCar2.0 May 2010) 4,64 0 5 2 2 4 0 3 4 6 0 1 12 5 0 2 3 5 0 1 2 3 1 3 2 4 0 3 1 12 0 6 3 0 6 0 0 0 5 3 5 0 10 5 6 0 8 7 5 0 12 1 7 4 0 3 1 0 5 3 3 0 7 8 2
10 212 bfu Botrytis cinerea B05.10 4,69 0 7 2 5 6 0 1 1 8 0 1 8 8 0 2 2 7 0 3 2 4 0 7 1 6 0 3 0 8 0 5 2 0 6 0 0 0 4 6 2 0 6 3 10 0 9 6 9 0 5 0 6 6 0 4 2 0 5 5 1 1 8 2 7
11 214 dha Debaryomyces hansenii CBS767 4,71 0 8 9 4 2 0 0 1 9 1 2 10 10 0 1 1 6 0 4 1 1 0 7 0 8 0 2 1 7 0 5 1 0 6 0 0 0 6 7 1 0 9 8 10 0 10 9 1 0 4 1 4 5 0 0 1 0 3 10 1 0 11 5 1
13 225 vda Verticillium dahliae VdLs.17 4,93 0 7 1 1 8 0 1 4 9 0 0 9 11 0 1 2 6 1 2 4 8 0 3 2 8 0 2 3 11 0 2 4 1 6 0 0 0 6 2 5 0 6 2 12 0 10 2 12 0 5 1 3 9 0 2 2 0 5 3 2 0 13 3 3
15 229 lth Lachancea thermotolerans CBS 6340 5,04 0 7 2 8 0 2 3 3 10 0 1 8 11 0 1 3 9 0 2 2 2 0 8 0 9 0 2 1 10 0 3 2 0 6 0 0 0 5 5 5 0 7 4 14 0 10 6 11 0 4 0 5 4 0 0 1 0 3 9 1 0 15 3 2
21 230 tgu Taeniopygia guttata (Zebra finch Feb. 2013 WashU taeGut324/taeGut2) 4,87 0 10 4 4 1 0 1 7 21 2 1 5 3 2 1 1 3 0 2 1 6 0 1 2 8 1 4 2 18 0 7 3 0 13 0 0 0 5 1 6 2 8 4 5 0 7 2 3 1 9 1 3 6 0 2 0 1 5 3 2 1 8 7 4
15 242 aor Aspergillus oryzae RIB40 5,31 0 7 2 0 0 0 1 4 10 0 2 6 10 1 2 3 7 0 1 3 9 0 2 0 10 0 2 2 10 0 3 4 1 13 0 0 0 8 4 7 0 8 3 11 0 13 6 11 1 4 0 4 12 0 2 3 0 6 2 2 0 15 4 1
27 252 mlu* Myotis lucifugus (Microbat Jul. 2010 Broad Institute Myoluc2.0/myoLuc2) 5,49 0 5 2 3 3 0 5 2 10 0 3 14 5 0 3 5 6 0 2 2 6 0 3 3 5 0 5 3 8 0 1 3 0 5 0 0 5 7 3 7 0 9 3 11 0 8 5 6 0 27 0 4 6 0 5 2 0 5 5 5 0 8 6 3
15 256 dsi Drosophila simulans (D. simulans Apr. 2005 WUGSC mosaic 1.0) 5,67 0 8 3 4 5 0 2 9 8 0 0 12 7 0 2 6 8 0 2 3 6 0 5 5 8 0 5 4 9 0 5 0 0 10 0 0 0 6 4 8 0 6 4 11 0 6 5 10 0 7 1 9 9 0 5 0 0 3 3 3 0 15 5 0
20 258 mmr* Microcebus murinus (Mouse lemur) (Jun 2003) 5,71 0 8 3 3 5 0 2 7 4 0 3 14 4 0 2 5 7 0 2 3 7 0 4 3 3 0 3 2 11 0 5 3 0 8 0 0 0 6 4 12 0 9 5 6 0 5 9 8 1 20 0 6 6 0 3 2 0 7 5 3 0 11 7 2
15 258 lkl* Lachancea kluyveri NRRL Y-12651 5,69 0 8 3 11 0 1 3 0 12 0 1 10 14 0 1 3 11 0 2 1 1 1 10 0 12 0 2 1 13 0 4 0 0 7 0 0 0 6 10 1 0 9 5 14 0 13 13 3 0 5 0 5 5 0 0 1 0 4 12 1 0 15 2 2
17 266 kaf Kazachstania africana CBS 2517 5,91 0 9 14 2 2 0 2 0 13 0 2 9 13 0 2 1 11 0 4 1 1 0 10 0 11 0 3 1 12 0 5 0 0 9 0 0 0 6 9 1 0 10 8 12 0 13 15 2 0 5 0 6 4 0 0 1 0 4 11 1 0 17 3 1
14 270 ncs Naumovozyma castellii CBS 4309 6,00 0 10 7 9 2 0 3 0 12 0 2 9 13 0 2 2 12 0 4 1 1 0 10 0 11 0 3 2 12 0 5 0 0 9 0 0 0 8 9 1 0 10 8 14 0 14 13 1 0 4 0 7 5 0 0 2 0 4 10 1 0 13 3 2
16 270 fgr Fusarium graminearum CS3005 5,98 0 9 1 3 6 0 2 5 11 0 2 5 16 0 2 3 11 0 2 2 10 0 3 2 11 0 4 3 13 0 3 3 0 6 0 0 0 7 5 7 0 9 2 12 0 10 4 13 0 5 1 4 10 0 9 1 0 8 2 2 0 15 5 1
17 272 zro Zygosaccharomyces rouxii CBS 732 6,00 0 8 4 10 0 1 5 0 11 1 1 9 12 0 2 4 12 0 3 2 3 0 10 0 10 0 2 2 12 0 9 0 0 7 0 0 0 6 10 3 0 9 7 14 0 14 10 4 0 4 0 6 5 0 0 1 0 5 8 2 0 17 5 2
15 273 fve* Flammulina velutipes KACC42780 5,98 2 15 1 4 6 0 2 2 10 0 2 14 7 0 3 3 7 0 2 3 4 0 4 2 7 0 3 4 13 0 9 5 0 6 0 0 0 3 4 6 1 12 6 11 1 2 6 11 0 4 0 4 13 0 8 2 0 4 2 6 0 11 8 8
16 275 sce Saccharomyces cerevisiae (S288c Apr 2011) 6,09 0 10 7 10 0 1 3 0 13 0 2 10 14 0 2 2 11 0 3 1 2 0 10 0 11 0 4 1 11 0 5 0 0 8 0 0 0 7 9 1 0 10 7 14 0 16 14 2 0 4 0 6 6 0 0 1 0 4 11 1 0 16 3 2
24 283 gga Gallus gallus (galGal4 Nov 2011) 6,24 0 10 3 3 3 0 2 7 7 0 2 14 7 1 3 7 9 0 4 2 7 0 4 3 4 0 4 2 24 0 7 4 0 16 0 0 0 6 2 5 0 11 6 6 0 10 9 7 0 11 1 6 8 0 2 2 0 7 4 3 0 7 7 4
16 285 fvr Fusarium verticillioides 7600 6,33 0 10 2 4 12 0 2 5 11 0 1 8 13 0 2 3 10 0 2 3 10 0 3 2 11 0 4 2 14 0 3 3 0 8 0 0 0 6 4 8 0 8 2 15 0 14 5 16 0 5 0 5 10 0 7 1 0 7 2 2 0 14 5 1
16 288 mfa* Millerozyma farinosa CBS 7064 6,40 0 10 4 14 4 0 0 2 12 0 4 10 12 0 2 4 10 0 4 2 2 0 8 0 10 0 4 2 12 0 8 2 0 10 0 0 0 8 8 4 0 12 6 10 0 14 8 8 0 4 0 6 4 0 0 2 0 6 10 2 0 16 6 2
14 289 dme Drosophila melanogaster (D. melanogaster Aug. 2014 BDGP Release 6 + ISO1 MT/dm6) 6,40 0 8 4 4 4 0 2 8 9 0 2 12 6 0 2 7 8 0 2 4 7 0 5 5 8 0 6 3 12 0 2 3 0 9 0 0 0 5 4 8 0 10 6 13 0 14 6 13 0 7 1 8 10 0 10 0 0 6 3 3 0 14 6 0
19 305 fgr Fusarium graminearum PH-1 NRRL 31084 6,76 0 11 2 3 13 0 2 5 13 0 2 6 19 0 2 3 11 0 2 2 10 0 3 2 11 0 4 3 14 0 4 2 0 8 0 0 0 7 5 7 0 9 3 16 0 14 5 19 0 5 1 4 10 0 9 1 0 8 2 2 0 14 6 1
21 326 oga* Otolemur garnettii (Bushbaby Mar. 2011 Broad/otoGar3) 6,96 1 6 3 5 4 0 3 9 10 9 11 13 6 0 3 5 6 0 3 3 7 0 4 3 9 0 6 3 13 0 7 3 0 8 0 0 0 8 5 9 0 12 11 9 0 13 5 8 0 21 1 6 6 0 4 3 2 7 4 5 0 12 9 3
18 326 dya Drosophila yakuba (D. yakuba Nov. 2005 WUGSC 7.1) 7,22 0 9 5 4 5 0 2 8 10 0 2 15 7 0 2 10 9 0 2 5 6 0 8 5 8 0 6 5 18 0 2 5 0 9 0 0 0 5 4 8 0 11 6 16 0 15 7 14 0 8 1 8 12 0 7 0 0 6 3 4 0 16 7 1
23 328 tbl Tetrapisispora blattae CBS 6284 7,27 0 12 12 9 0 1 2 0 17 0 2 11 18 0 2 1 16 0 4 2 1 0 13 0 15 0 3 1 19 0 5 0 0 9 0 0 0 7 10 1 0 11 9 15 0 19 16 1 0 5 0 7 4 0 0 1 0 6 13 1 0 23 3 1
19 334 sbq Saimiri boliviensis (Squirrel monkey Oct. 2011 Broad/saiBol1) 7,27 0 9 8 5 6 0 4 5 10 1 6 14 6 1 4 7 9 1 3 3 9 0 5 4 8 0 6 5 15 0 8 5 1 8 0 0 0 8 6 10 0 11 12 9 0 9 10 5 0 19 3 6 6 0 4 3 0 7 5 5 0 10 6 4
17 338 opr* Ochotona princeps (Pika May 2012 OchPri3.0/ochPri3) 7,49 0 10 3 4 5 0 5 11 8 0 4 15 7 0 4 7 7 0 3 4 8 0 4 4 7 0 6 7 15 0 7 4 0 10 0 0 0 5 5 12 0 14 9 11 0 14 7 11 0 10 1 6 7 0 6 4 0 7 5 6 0 17 7 5
29 353 meu* Macropus eugenii (Wallaby Sep. 2009 TWGS Meug_1.1/macEug2) 7,62 1 10 3 8 5 0 4 6 6 0 6 14 8 0 1 7 8 0 4 2 7 0 4 2 8 0 6 3 13 0 6 5 1 8 0 0 1 7 4 7 0 14 10 11 0 13 12 7 0 29 7 8 7 0 3 5 0 10 7 4 0 16 10 5
46 367 hgl Heterocephalus glaber (Naked mole-rat Jan. 2012 Broad HetGla_female_1.0/hetGla2) 7,62 0 6 4 5 5 0 5 5 8 0 3 14 12 1 4 6 7 0 3 3 13 0 5 3 15 2 4 4 46 6 5 6 0 7 0 0 0 7 3 6 0 9 8 15 2 10 6 4 0 23 7 6 5 0 4 4 2 7 6 5 4 10 4 3
20 373 lcm Latimeria chalumnae (Coelacanth Aug. 2011 Broad/latCha1) 7,96 0 7 11 4 4 0 5 8 7 0 7 11 3 0 7 4 3 0 6 3 12 0 10 4 11 0 9 2 5 0 20 3 2 8 0 0 0 5 10 9 3 9 20 13 1 19 11 8 5 17 4 15 4 0 1 4 0 8 9 8 0 7 5 2
25 374 san* Sorex araneus (Shrew Aug. 2008 Broad/sorAra2) 8,24 0 10 4 4 6 1 2 13 15 0 5 15 7 0 5 7 8 0 3 4 8 0 6 2 8 0 5 5 10 0 8 3 0 9 0 0 0 7 5 7 0 12 8 13 0 19 10 14 0 25 2 6 9 0 5 3 0 8 6 6 0 22 12 2
34 383 cpo* Cavia porcellus (Guinea pig) (Broad Feb 2008) 8,36 0 8 4 6 5 0 3 6 10 0 5 15 6 1 3 6 8 0 3 4 8 0 4 3 10 0 4 3 28 4 9 5 0 15 0 0 0 8 4 8 0 18 11 26 1 10 6 5 0 34 1 8 7 0 4 3 0 10 5 5 0 11 6 6
26 396 ncr Neurospora crassa OR74A 8,78 0 12 1 5 17 0 2 6 17 1 1 17 19 0 2 4 14 0 3 4 11 0 4 4 12 0 3 3 19 0 3 5 0 10 0 0 0 9 3 11 0 12 2 24 0 18 5 24 0 7 0 7 21 0 2 3 0 6 5 5 0 26 4 3
40 407 rno Rattus norvegicus (rn5 Mar 2012) 8,89 1 8 3 0 1 0 1 5 12 0 3 13 8 0 3 7 11 0 4 3 33 0 6 3 9 0 5 4 36 2 9 4 0 2 0 0 0 10 6 10 0 15 1 19 2 15 10 8 0 40 1 8 6 0 3 5 1 12 6 8 0 11 9 5
30 408 cjc Callithrix jacchus (marmoset) (WUGSC 3.2 Mar 2009) 8,80 0 8 9 6 7 0 3 11 9 2 5 19 6 1 4 10 9 0 5 4 7 0 6 4 9 1 6 4 15 1 5 4 0 19 0 0 1 8 4 12 0 23 14 11 1 13 11 12 0 30 2 6 6 3 4 3 0 8 5 5 0 14 9 4
28 411 pha* Papio hamadryas (baboon) (Nov 2008) 8,93 0 12 7 7 9 0 3 6 12 2 4 15 9 1 7 12 9 0 5 3 7 0 6 4 10 0 7 6 19 1 9 5 0 15 0 0 0 10 6 11 1 18 12 12 1 10 13 4 2 28 1 8 7 0 6 4 0 9 6 5 0 13 4 8
31 414 aga Anopheles gambiae 9,20 0 9 2 3 5 0 3 10 12 0 2 18 31 0 3 29 6 0 2 8 7 0 8 13 8 0 2 5 17 0 3 6 0 22 0 0 0 21 4 11 0 11 8 17 0 20 11 15 0 5 0 6 10 0 8 0 0 6 2 2 0 15 8 0
24 418 ppp Physcomitrella patens 9,18 1 14 2 6 6 1 5 5 12 0 4 24 13 0 2 11 13 0 5 7 13 0 8 4 10 0 5 6 19 0 9 8 0 8 0 0 0 9 9 10 1 14 8 16 0 11 7 14 0 7 1 9 8 1 7 5 0 9 6 10 0 15 9 11
22 421 nle Nomascus leucogenys (Gibbon Oct. 2012 GGSC Nleu3.0/nomLeu3) 9,04 1 11 7 5 8 0 3 9 12 3 5 16 11 1 6 10 9 1 4 4 9 1 5 4 11 0 4 5 18 1 9 5 0 14 0 0 0 11 9 13 2 14 22 15 0 10 10 8 1 22 3 8 7 0 7 3 0 8 6 5 0 12 6 7
28 435 ggo Gorilla gorilla gorilla (gorilla) (gorGor3.1 May 2011) 9,42 0 12 8 7 8 0 4 5 11 2 6 17 9 1 8 10 10 1 4 5 8 0 7 4 9 0 6 6 22 2 6 4 1 16 0 0 0 7 7 14 1 24 13 14 0 15 14 7 0 28 3 8 7 0 6 5 0 8 5 6 0 12 3 9
45 446 shr Sarcophilus harrisii (Tasmanian devil Feb. 2011 WTSI Devil_ref v7.0/sarHar1) 9,87 0 13 6 3 9 0 4 9 11 0 4 22 8 0 4 10 10 0 5 3 10 0 6 3 9 0 7 2 18 0 7 4 0 11 0 0 0 9 45 10 0 13 14 32 0 19 15 10 0 8 2 8 4 0 5 3 0 8 5 4 0 19 9 6
64 455 tsy* Tarsius syrichta (Tarsier Sep. 2013 Tarsius_syrichta-2.0.1/tarSyr2) 9,25 0 6 # 4 6 0 5 7 8 0 4 12 6 0 4 6 7 0 5 3 7 1 32 4 9 0 4 4 12 0 4 3 0 10 0 0 1 10 64 6 1 15 10 7 1 13 9 10 1 25 1 6 6 0 5 3 0 9 6 4 0 14 6 7
27 458 mcc Macaca mulatta (Rhesus Oct. 2010 BGI CR_1.0/rheMac3) 9,80 0 9 15 8 9 0 5 6 10 5 7 18 10 3 6 11 9 2 6 4 8 0 8 3 9 0 5 4 21 1 10 5 1 23 0 0 0 14 10 12 2 19 16 13 1 14 11 6 0 27 2 8 6 0 5 4 0 8 6 7 0 14 4 8
60 469 mmu Mus musculus (mm10 Dec 2011) 10,13 0 7 7 4 5 0 4 10 12 1 5 19 8 1 3 12 10 1 3 3 8 1 8 3 11 0 4 4 23 4 11 10 0 11 0 0 1 10 7 12 0 13 14 26 0 16 8 14 1 60 1 8 6 0 5 3 0 8 6 5 2 15 8 7
27 476 pan* Papio anubis (Baboon Mar. 2012 Baylor Panu_2.0/papAnu2) 10,20 1 13 8 8 8 0 3 11 14 2 6 19 9 1 7 12 9 1 5 3 8 0 6 4 10 0 7 6 20 1 9 5 3 21 0 0 0 10 9 12 2 21 14 15 2 15 13 9 1 27 3 9 7 0 5 4 0 11 6 5 0 20 8 8
46 481 mdo Monodelphis domestica (opossum) (Broad Oct 2006) 10,58 0 12 2 4 8 0 6 11 13 0 7 25 9 0 5 9 12 0 6 3 11 0 8 3 12 0 7 3 15 0 9 6 0 15 0 0 0 9 7 11 0 13 13 19 1 24 14 13 4 46 0 9 5 0 5 4 0 9 6 5 0 24 11 8
34 485 eeu* Erinaceus europaeus (Hedgehog May 2012 EriEur2.0/eriEur2) 7,59 0 8 3 6 6 0 3 6 9 0 4 16 7 0 6 4 7 0 3 3 10 0 5 3 9 0 6 4 14 0 10 4 0 13 0 0 0 5 4 8 0 7 11 0 13 8 9 0 34 2 7 6 0 5 3 0 7 5 7 0 14 7 5
51 494 ecb Equus caballus (horse) (Sep 2007) 10,76 0 12 4 6 7 0 5 3 20 0 5 25 12 3 6 15 12 0 4 4 10 0 7 3 9 0 7 3 27 0 11 8 1 14 0 0 1 11 6 12 1 17 15 16 0 10 11 51 0 25 4 7 10 0 4 4 0 12 5 7 0 10 4 8
86 498 cge Cricetulus griseus cell line CHO-K1 (Chinese hamster ovary CriGri 1.0 Aug 2011) 10,96 0 8 4 4 5 0 4 10 13 0 5 16 13 0 5 9 6 0 3 3 7 0 6 3 8 1 4 4 22 1 15 6 0 11 0 0 0 14 5 11 0 17 15 86 0 15 7 20 0 41 2 6 6 0 6 3 0 9 5 6 1 14 6 7
28 499 vvi Vitis vinifera (Grapevine 12X) 10,89 0 14 7 13 10 0 9 7 13 1 7 25 14 0 5 9 13 1 7 3 13 0 16 4 10 2 6 3 11 0 28 5 1 17 0 0 1 12 9 10 1 18 11 13 1 18 14 21 0 11 1 10 8 0 5 4 0 9 6 7 0 17 12 6
30 503 ptr Pan troglodytes (Chimp Feb. 2011 CSAC 2.1.4/panTro4) 10,82 0 15 10 7 9 0 3 6 14 1 5 21 11 1 10 12 11 1 7 4 9 1 8 5 10 0 6 5 30 1 9 5 2 22 0 0 0 10 8 10 1 27 14 19 1 15 15 11 1 27 2 7 7 1 6 5 3 9 6 5 0 13 6 13
29 506 ocu Oryctolagus cuniculus (rabbit) (Broad Apr 2009) 10,67 0 14 6 3 5 0 4 16 11 1 7 18 12 0 8 14 10 0 4 5 9 0 5 4 8 1 7 5 21 0 9 4 0 12 0 0 0 9 5 15 1 26 12 29 1 23 18 19 0 25 1 10 7 0 4 5 0 10 6 6 21 0 14 16
34 510 yli Yarrowia lipolytica CLIB122 11,33 0 17 1 3 21 0 2 13 26 0 1 18 24 0 2 8 21 0 2 4 21 0 3 2 22 0 3 2 30 0 4 2 0 14 0 0 0 12 3 15 0 16 4 34 0 28 6 27 0 8 0 13 1 0 25 0 0 6 4 1 0 30 11 0
33 517 ppy* Pongo pygmaeus abelii (Orangutan July 2007 WUGSC 2.0.2/ponAbe2) 11,18 0 13 6 6 10 0 3 11 14 4 6 20 10 1 7 18 10 1 6 5 10 0 7 5 12 0 4 7 22 1 9 4 1 19 0 0 0 10 7 13 2 33 20 22 1 13 22 8 0 30 3 6 7 0 6 7 0 8 8 7 0 14 8 10
77 518 csi* Ceratotherium simum (White rhinoceros May 2012 CerSimSim1.0/cerSim1) 11,40 0 13 5 6 6 0 4 4 13 0 5 26 11 1 7 15 13 0 5 4 10 0 7 4 10 0 8 5 23 0 13 6 0 11 0 0 0 10 5 12 2 14 15 22 1 13 11 77 0 24 1 8 10 0 5 4 0 13 6 7 0 10 4 9
32 540 tng Tetraodon nigroviridis (tetraodon) (Genoscope 8.0 Mar 2007) 11,91 1 17 5 7 15 0 6 32 16 0 5 20 10 0 4 15 12 1 7 2 11 1 11 4 26 0 10 13 20 0 10 4 0 13 0 0 0 12 9 18 0 17 9 20 0 18 15 13 0 15 1 10 14 0 6 2 0 11 9 9 0 14 14 6
36 554 cpic Chrysemys picta bellii (Painted turtle Dec. 2011 v3.0.1/chrPic1) 11,87 2 22 13 7 2 1 4 6 11 1 13 16 16 0 5 6 24 0 15 10 12 1 4 2 17 0 18 5 11 1 15 4 1 5 0 0 0 10 16 11 1 17 36 9 0 14 17 5 5 18 4 10 7 0 5 3 3 20 26 10 0 11 24 2
35 575 tru Takifugu rubripes (Fugu Oct. 2011 FUGU5/fr3) 12,64 1 18 6 9 10 0 4 21 11 0 6 35 19 0 8 25 11 0 7 3 10 0 7 6 18 0 7 7 10 0 8 6 1 13 0 0 1 19 8 12 0 20 19 19 1 22 13 20 0 15 1 16 16 1 7 4 0 17 13 10 0 18 12 4
37 578 sbi Sorghum bicolor (Version 1.0) 12,56 0 20 4 9 15 0 9 11 17 0 5 37 16 2 4 10 11 3 12 6 14 0 11 7 12 2 9 6 18 0 13 11 1 14 0 0 1 15 11 13 1 16 9 18 2 24 13 23 0 13 1 13 15 0 4 7 0 13 7 10 0 24 10 6
40 582 mtr Medicago truncatula (March 2009 Version 3.0) 12,47 0 26 7 14 9 0 10 4 19 0 10 40 17 3 7 7 12 2 8 2 7 0 11 1 10 4 10 1 25 0 16 3 1 12 0 0 0 17 17 5 9 28 18 16 0 28 19 11 0 10 1 14 12 0 5 3 0 15 8 6 1 23 15 3
34 596 cel Caenorhabditis elegans (WS220 Oct 2010) 13,18 0 15 4 7 20 0 3 5 21 0 7 19 19 0 5 6 15 0 9 6 6 0 31 4 17 0 11 7 22 0 9 4 0 19 0 0 0 19 20 7 0 20 14 30 0 27 17 24 0 13 2 12 18 0 8 1 1 9 8 4 0 14 34 3
40 618 pop Populus trichocarpa (Jan 2010 Version 2.0) 13,53 4 18 7 3 40 1 0 7 20 1 9 26 17 0 8 10 13 1 9 5 14 0 22 4 6 0 11 4 20 0 18 5 0 18 0 0 0 13 11 11 0 22 17 17 0 33 14 21 1 13 1 14 10 0 7 5 0 16 11 11 0 25 17 7
40 622 hsa Homo sapiens (hg38 - GRCh38 Dec 2013) 13,31 0 18 8 12 12 0 4 11 19 6 5 22 11 1 8 21 12 1 6 5 10 1 8 4 10 0 6 7 35 1 10 5 5 32 0 0 0 10 18 24 2 40 20 24 1 16 17 10 1 38 3 8 7 0 6 4 1 8 7 5 0 15 9 12
55 639 bdi Brachypodium distachyon (JGI v1.0 8X) 13,82 0 18 4 15 14 0 10 8 20 2 4 55 15 3 5 11 11 4 10 5 15 0 18 8 9 3 10 6 19 0 12 11 1 17 0 0 3 21 15 11 0 16 12 18 0 25 15 19 0 14 0 18 16 1 5 6 0 18 9 9 0 27 9 9
43 674 oni* Oreochromis niloticus (Nile tilapia Jan. 2011 Broad oreNil1.1/oreNil2) 14,80 0 23 12 7 14 0 7 16 25 0 25 27 8 0 9 9 10 0 10 6 14 0 11 4 18 1 25 8 18 0 11 12 3 18 0 0 0 23 6 11 0 9 16 43 0 10 14 15 1 42 1 12 16 0 7 6 2 10 27 18 0 13 12 9
83 684 ath Arabidopsis thaliana (TAIR10 Feb 2011) 15,00 0 17 6 12 12 1 11 3 17 2 5 32 14 2 7 8 37 3 12 7 15 0 47 5 10 1 9 5 16 0 10 7 0 83 0 0 0 12 10 9 0 19 15 17 0 29 14 13 0 17 0 16 11 0 6 4 0 16 10 8 0 25 12 5
56 738 osa Oryza sativa 15,67 0 20 4 19 15 0 10 10 18 0 5 56 17 16 4 10 12 4 17 8 14 0 14 9 11 8 15 5 20 1 10 12 2 19 0 0 0 26 21 10 0 29 12 20 1 31 16 25 1 17 0 18 24 0 4 8 0 20 12 11 0 28 9 10
36 738 gmx Glycine max (soybean) (Wm82.a2) 16,31 0 22 9 18 16 0 10 7 31 0 8 36 22 1 9 13 15 0 11 6 21 0 27 5 9 1 10 4 24 0 17 8 0 21 0 0 0 18 13 13 2 22 20 22 0 33 16 24 0 14 0 18 13 0 9 5 0 28 18 13 0 29 18 9
42 743 cbr Caenorhabditis briggsae (C. briggsae Jan. 2007 WUGSC 1.0/cb3) 16,51 0 22 6 11 26 0 5 7 21 0 24 23 25 0 6 6 17 0 8 8 6 0 41 4 22 0 10 9 29 0 14 7 0 19 0 0 0 21 24 10 0 23 16 40 0 34 19 30 0 16 0 13 22 0 10 0 0 9 10 2 0 21 42 5
37 749 mpu* Mustela putorius furo (Ferret Apr. 2011 MusPutFur1.0/musFur1) 10,68 0 11 4 6 6 0 4 5 10 0 5 20 8 0 6 7 8 0 4 4 9 0 7 2 10 0 7 5 15 0 8 5 0 9 0 0 1 7 37 17 6 12 31 0 8 7 19 0 25 1 11 6 0 29 5 0 12 16 21 0 9 9 4
48 804 str* Spermophilus tridecemlineatus (Squirrel Nov. 2011 Broad/speTri2) 11,02 1 10 3 10 6 0 3 4 14 6 4 14 18 3 5 39 15 1 7 6 12 1 7 3 34 5 6 7 31 39 18 0 9 0 0 0 6 4 6 1 9 10 12 6 8 5 7 0 48 1 7 6 0 5 3 0 7 5 6 7 13 5 20
97 807 ssc Sus scrofa (Pig Aug. 2011 SGSC Sscrofa10.2/susScr3) 12,68 0 21 4 6 8 0 5 5 13 0 5 23 10 1 11 12 10 0 5 4 9 0 4 3 13 0 8 4 23 0 14 7 0 17 0 0 0 10 9 12 2 18 38 16 10 97 13 1 23 0 7 7 0 5 3 0 10 7 4 0 19 10 6
47 827 cja* Caenorhabditis japonica (WUGSC 3.0.2 Mar 2008) 18,33 1 24 5 7 26 0 6 12 26 0 7 30 23 0 7 13 19 0 7 15 9 0 43 8 24 0 12 11 31 0 11 8 0 24 0 0 0 17 14 16 0 23 30 37 0 41 20 40 0 15 1 18 21 0 11 1 0 15 12 3 0 34 47 2
83 856 oaa Ornithorhynchus anatinus (platypus) (WUGSC 5.0.1 Mar 2007) 18,56 1 24 10 10 8 0 7 18 27 0 10 32 23 1 15 10 16 4 6 8 19 4 12 7 23 1 18 10 83 0 17 11 0 28 0 0 1 24 11 19 0 21 32 25 0 27 16 27 0 37 5 14 12 0 7 14 2 18 6 9 2 40 15 9
43 906 cfa Canis familiaris (dog) (CanFam3.1 Sept 2011) 11,23 0 10 4 5 4 0 4 7 9 0 5 23 6 0 5 8 10 0 5 8 8 0 8 4 8 0 4 5 14 0 11 4 0 9 0 0 0 9 43 20 1 21 34 2 13 15 22 0 21 1 6 6 0 15 4 0 8 9 29 0 11 11 9
82 1065 spu Strongylocentrotus purpuratus (Sea urchin) 23,56 2 0 14 2 18 0 8 5 69 2 22 73 20 0 11 16 25 0 15 6 19 0 21 9 27 0 21 9 32 0 17 7 0 24 0 0 0 26 17 21 0 39 57 42 0 82 26 29 0 31 0 18 29 0 19 1 1 17 18 19 0 42 33 4
66 1095 cbr* Caenorhabditis brenneri (WUGSC 6.0.1 Feb 2008) 24,07 0 24 7 14 32 0 8 8 33 1 26 29 33 0 8 15 20 0 14 9 25 2 54 9 31 1 15 10 35 0 11 6 2 28 0 0 1 26 40 11 0 33 29 49 0 34 36 37 2 21 3 22 32 0 17 24 0 14 13 11 0 39 66 25
81 1119 dno* Dasypus novemcinctus (Armadillo Dec. 2011 Baylor/dasNov3) 15,86 0 12 8 8 5 0 3 10 12 1 6 30 12 1 16 # 10 0 6 6 7 0 7 4 11 0 8 7 23 2 66 17 0 14 0 0 1 10 5 10 0 23 18 43 0 21 20 45 0 22 1 15 10 0 8 5 0 10 9 47 24 19 34
61 1176 oas Ovis aries (sheep) (Feb 2010) 12,50 1 6 5 7 6 0 2 3 6 0 5 18 7 0 8 9 2 3 4 3 4 0 6 1 5 0 5 3 18 3 12 7 2 16 0 0 0 8 7 9 0 13 22 16 2 8 60 16 61 4 47 2 2 6 6 0 7 22 33 5 30
82 1198 zma Zea mays (Version 5b.60) 23,18 1 25 5 20 29 0 9 13 69 0 5 79 22 12 4 16 13 22 11 6 15 0 31 9 20 13 14 6 66 0 15 22 0 21 0 0 1 26 22 13 0 49 82 1 42 22 30 1 25 0 27 35 0 7 6 0 14 9 11 0 33 11 11
55 1463 aml Ailuropoda melanoleuca (panda) (BGI-Shenzhen AilMel 1.0 Dec 2009) 13,84 0 11 5 9 7 0 5 7 12 0 6 24 10 0 7 9 10 0 6 4 9 0 11 5 10 0 9 10 17 0 9 5 0 11 0 0 0 8 43 25 6 28 55 1 11 11 37 0 25 2 10 8 1 # 7 2 13 17 45 0 10 7 7
63 1492 gmo* Gadus morhua (Atlantic cod May 2010 Genofisk GadMor_May2010/gadMor1) 30,05 6 36 16 15 33 0 24 47 26 0 18 21 0 9 28 30 0 18 14 55 0 21 22 30 0 30 30 55 1 24 26 0 50 0 0 1 26 11 45 2 34 63 43 1 30 51 50 0 27 2 29 31 2 17 10 1 41 21 28 0 30 39 18
76 2002 lav Loxodonta africana (elephant) (Broad/July 2009) 25,95 1 32 15 17 22 0 11 10 43 0 7 50 41 1 50 35 29 0 7 4 16 0 14 3 14 1 22 10 54 0 53 15 1 19 0 0 3 27 14 28 4 51 60 36 0 20 24 1 28 24 23 14 0 18 3 3 76 # 16 4 33 #
40 2017 tma* Trichechus manatus latirostris (Manatee Oct. 2011 Broad v1.0/triMan1) 13,98 1 11 6 10 8 0 5 5 13 1 8 21 11 0 26 16 14 0 6 4 11 0 8 3 16 1 18 4 20 1 40 6 1 15 0 0 0 12 8 10 1 23 31 16 1 15 19 5 22 18 13 8 0 12 7 5 36 13 9 23 #
90 2485 pma* Petromyzon marinus (Lamprey Sep. 2010 WUGSC 7.0/petMar2) 34,89 2 57 5 # 0 40 # 0 10 1 26 # 22 0 20 35 54 0 43 21 62 19 19 23 0 31 24 0 90 0 0 1 27 44 0 24 23 2 90 12 11 0 68 1 9 85 1 26 10 0 65 18 50 1 54 17 6
99 2489 gac* Gasterosteus aculeatus (stickleback) (Broad 1.0 Feb 2006) 41,18 0 35 12 7 49 0 17 9 0 61 21 1 12 18 52 0 62 29 63 0 29 18 99 0 35 23 53 0 53 56 0 17 0 0 0 52 60 81 1 61 97 0 46 53 0 1 74 49 0 # 2 0 30 68 26 0 12 61 4
99 2639 xtr Xenopus tropicalis (frog) (JGI 4.2 Nov 2009) 50,41 2 58 # 22 38 2 25 32 63 5 51 55 0 36 53 40 3 41 23 60 1 53 36 0 91 29 67 0 47 36 0 0 0 1 42 28 40 1 47 72 97 0 59 84 51 2 92 1 33 33 3 33 8 0 99 27 0 85 80
68 3729 fca Felis catus (cat) (Felis_catus-6.2 Sept 2011) 19,40 1 12 19 8 6 0 33 5 10 0 9 24 8 0 6 9 8 1 14 5 8 1 68 7 9 0 13 9 18 1 10 7 0 10 0 0 2 16 47 5 28 50 1 9 15 44 1 32 18 23 9 9 24 2 12 54 53 2 10 48 6
78 4040 bta Bos taurus (Cow Jun. 2014 Bos_taurus_UMD_3.1.1/bosTau8) 22,58 6 30 10 14 11 0 5 6 18 0 8 35 20 0 21 39 13 32 7 7 13 0 9 4 14 1 10 7 31 2 35 16 11 39 0 0 4 19 20 40 0 30 78 40 6 42 143 29 13 7 12 16 4 19 44 20 63
74 5845 ttr* Tursiops truncatus (Dolphin Oct. 2011 Baylor Ttru_1.4/turTru2) 16,73 0 12 6 7 6 0 4 6 11 0 5 17 8 3 16 22 12 0 6 4 7 0 5 4 9 1 6 3 19 2 36 21 1 18 0 0 0 9 16 15 0 13 74 19 10 49 6 22 21 7 1 7 12 0 11 48 54 19 43
86 7080 bacu Balaenoptera acutorostrata scammoni (Minke whale Oct. 2013 BalAcu1.0/balAcu1) 18,77 0 13 13 8 6 0 4 7 12 1 8 21 14 1 18 32 10 1 5 4 7 0 5 4 13 0 8 4 20 0 42 20 0 14 0 0 0 11 10 20 0 24 86 29 20 45 2 24 17 9 0 9 21 0 13 55 # 12 64
94 13727 cmk Callorhinchus milii (Elephant shark Dec. 2013 Callorhinchus_milii-6.1.3/calMil1) 32,70 3 35 13 31 20 2 20 25 31 0 23 94 22 16 26 1 54 48 12 6 51 41 24 12 75 168 1 36 0 0 1 37 7 18 2 48 43 36 6 49 66 1 15 3 30 9 0 25 2 0 33 14 12 2 19 66 #
ttt ttc tta ttg ctt ctc cta ctg att atc ata atg gtt gtc gta gtg tct tcc tca tcg cct ccc cca ccg act acc aca acg gct gcc gca gcg tat tac taa tag cat cac caa cag aat aac aaa aag gat gac gaa gag tgt tgc tga tgg cgt cgc cga cgg agt agc aga agg ggt ggc gga ggg
Total du diagramme 45 1,461 617 774 973 22 561 782 1,592 70 675 2,065 1,377 94 645 1,007 1,266 99 715 551 1,123 25 1,244 476 1,376 83 847 535 2,162 240 1,241 682 50 1,554 0 0 34 1,239 1,175 1,210 72 1,748 1,880 2,044 93 2,061 1,303 1,656 209 1,958 249 1,088 1,153 33 656 428 36 1,265 1,051 912 138 2,017 1,185 541
Codons forts pente 1.139 0.463 0.574 0.853 0.504 0.627 1.334 0.668 2.025 1.02 0.591 0.905 0.946 0.699 0.511 0.991 1.062 0.469 1.188 0.848 0.491 1.728 1.079 0.673 1.293 0.998 0.925 1.065 1.442 1.669 1.738 1.69 1.233 1.375 1.603 - 0.941 0.948 0.606 0.321 1.174 0.964 0.808 1.476 1.263 0.485
somme calculée - 23.3 20.0244 29.8 - 21.9 101.5 - 317.0 35.6 19.3 75.5 - - - - - - 59.9 27.7 16.1 79.3 35.3 22.0 65.2 - 17.9 37.2 109.7 - 149.3 69.6 151.9 124.8 102.2 - 54.6 - 45.1 - - 87.1 33.4 - 159.6 93.9
Totaux + calculés 1,461 640 794 1,003 561 804 1,693 675 2,382 1,413 664 1,083 1,266 715 551 1,123 1,244 476 1,436 875 551 2,241 1,276 704 1,619 0 0 1,239 1,193 1,247 1,858 1,880 2,193 2,131 1,455 1,781 2,060 249 1,143 1,153 701 428 1,265 1,138 945 2,017 1,345 635
R2 914 734 775 807 748 697 847 740 892 840 723 793 881 758 743 816 713 743 803 788 866 863 748 809 748 938 614 822 913 770 845 791 880 728 743 815 760 801 570 797 666 594 818 795 597
Codons faibles c/t nombre >3 3 0 6 3 5 2 6 4 2 2 5 6 7 2 2 9
c/t nombre >3, total 16 0 35 44 66 10 61 209 16 9 30 58 184 16 9 120
reste calculé 32 22 41 53 38 17 28 35 36 27 47 41 32 19 29 27
multiplicité X 100 26 18 34 44 31 14 23 29 30 22 39 34 26 16 24 22
c/t nombre=3 1 0 1 6 4 0 1 1 2 2 1 0 0 2 3 0
Totaux des 121 réduits 55830 32 1,461 640 794 1,003 22 561 804 1,693 41 675 2,382 1,413 53 664 1,083 1,266 38 715 551 1,123 17 1,244 476 1,436 28 875 551 2,241 35 1,276 704 36 1,619 0 0 27 1,239 1,193 1,247 47 1,858 1,880 2,193 41 2,131 1,455 1,781 32 2,060 249 1,143 1,153 19 701 428 29 1,265 1,138 945 27 2,017 1,345 635
Données non modifiées
64 455 tsy* Tarsius syrichta (Tarsier Sep. 2013 Tarsius_syrichta-2.0.1/tarSyr2) 9,0 0 6 42 4 6 0 5 7 8 0 4 12 6 0 4 6 7 0 5 3 7 1 32 4 9 0 4 4 12 0 4 3 0 10 0 0 1 10 64 6 1 15 10 7 1 13 9 10 1 25 1 6 6 0 5 3 0 9 6 4 0 14 6 7
149 485 eeu* Erinaceus europaeus (Hedgehog May 2012 EriEur2.0/eriEur2) 10,7 0 8 3 6 6 0 3 6 9 0 4 16 7 0 6 4 7 0 3 3 10 0 5 3 9 0 6 4 14 0 10 4 0 13 0 0 0 5 4 8 0 7 11 149 0 13 8 9 0 34 2 7 6 0 5 3 0 7 5 7 0 14 7 5
271 749 mpu* Mustela putorius furo (Ferret Apr. 2011 MusPutFur1.0/musFur1) 16,5 0 11 4 6 6 0 4 5 10 0 5 20 8 0 6 7 8 0 4 4 9 0 7 2 10 0 7 5 15 0 8 5 0 9 0 0 1 7 37 17 6 12 31 271 0 8 7 19 0 25 1 11 6 0 29 5 0 12 16 21 0 9 9 4
256 804 str* Spermophilus tridecemlineatus (Squirrel Nov. 2011 Broad/speTri2) 16,5 1 10 3 10 6 0 3 4 14 6 4 14 18 3 5 39 15 1 7 6 12 1 7 3 34 5 6 7 256 31 39 18 0 9 0 0 0 6 4 6 1 9 10 12 6 8 5 7 0 48 1 7 6 0 5 3 0 7 5 6 7 13 5 20
235 807 ssc Sus scrofa (Pig Aug. 2011 SGSC Sscrofa10.2/susScr3) 17,6 0 21 4 6 8 0 5 5 13 0 5 23 10 1 11 12 10 0 5 4 9 0 4 3 13 0 8 4 23 0 14 7 0 17 0 0 0 10 9 12 2 18 38 16 10 97 235 13 1 23 0 7 7 0 5 3 0 10 7 4 0 19 10 6
408 906 cfa Canis familiaris (dog) (CanFam3.1 Sept 2011) 20,0 0 10 4 5 4 0 4 7 9 0 5 23 6 0 5 8 10 0 5 8 8 0 8 4 8 0 4 5 14 0 11 4 0 9 0 0 0 9 43 20 1 21 34 408 2 13 15 22 0 21 1 6 6 0 15 4 0 8 9 29 0 11 11 9
326 1119 dno* Dasypus novemcinctus (Armadillo Dec. 2011 Baylor/dasNov3) 24,2 0 12 8 8 5 0 3 10 12 1 6 30 12 1 16 81 10 0 6 6 7 0 7 4 11 0 8 7 23 2 66 17 0 14 0 0 1 10 5 10 0 23 18 43 0 21 20 45 0 22 1 15 10 0 8 5 0 10 9 47 24 19 326 34
341 1176 oas Ovis aries (sheep) (Feb 2010) 25,3 1 6 5 7 6 0 2 3 6 0 5 18 7 0 8 9 2 3 4 3 4 0 6 1 5 0 5 3 18 3 12 7 2 16 0 0 0 8 7 9 0 13 22 16 2 8 139 60 16 61 4 47 2 2 6 6 0 7 22 33 5 30 133 341
127 1198 zma Zea mays (Version 5b.60) 25,5 1 25 5 20 29 0 9 13 69 0 5 79 22 12 4 16 13 22 11 6 15 0 31 9 20 13 14 6 66 0 15 22 0 21 0 0 1 26 22 13 0 49 82 127 1 42 22 30 1 25 0 27 35 0 7 6 0 14 9 11 0 33 11 11
772 1463 aml Ailuropoda melanoleuca (panda) (BGI-Shenzhen AilMel 1.0 Dec 2009) 32,2 0 11 5 9 7 0 5 7 12 0 6 24 10 0 7 9 10 0 6 4 9 0 11 5 10 0 9 10 17 0 9 5 0 11 0 0 0 8 43 25 6 28 55 772 1 11 11 37 0 25 2 10 8 1 84 7 2 13 17 45 0 10 7 7
154 1492 gmo* Gadus morhua (Atlantic cod May 2010 Genofisk GadMor_May2010/gadMor1) 32,8 6 36 16 15 33 0 24 47 26 0 18 154 21 0 9 28 30 0 18 14 55 0 21 22 30 0 30 30 55 1 24 26 0 50 0 0 1 26 11 45 2 34 63 43 1 30 51 50 0 27 2 29 31 2 17 10 1 41 21 28 0 30 39 18
619 2002 lav Loxodonta africana (elephant) (Broad/July 2009) 43,5 1 32 15 17 22 0 11 10 43 0 7 50 41 1 50 35 29 0 7 4 16 0 14 3 14 1 22 10 54 0 53 15 1 19 0 0 3 27 14 28 4 51 60 36 0 20 114 24 1 28 24 23 14 0 18 3 3 76 90 16 4 33 619 72
1073 2017 tma* Trichechus manatus latirostris (Manatee Oct. 2011 Broad v1.0/triMan1) 43,8 1 11 6 10 8 0 5 5 13 1 8 21 11 0 26 16 14 0 6 4 11 0 8 3 16 1 18 4 20 1 40 6 1 15 0 0 0 12 8 10 1 23 31 16 1 15 114 19 5 22 18 13 8 0 12 7 5 36 123 13 9 23 1073 90
278 2485 pma* Petromyzon marinus (Lamprey Sep. 2010 WUGSC 7.0/petMar2) 53,7 2 57 5 42 112 0 40 75 110 0 10 278 166 1 26 71 22 0 20 35 54 0 43 21 62 19 19 23 106 0 31 24 0 90 0 0 1 27 44 108 0 168 24 23 2 90 12 11 0 68 1 9 85 1 26 10 0 65 18 50 1 54 17 6
286 2489 gac* Gasterosteus aculeatus (stickleback) (Broad 1.0 Feb 2006) 55,2 0 35 12 7 49 0 17 9 101 0 61 286 21 1 12 18 52 0 62 29 63 0 29 18 99 0 35 23 53 0 53 56 0 17 0 0 0 52 60 81 1 123 61 97 0 184 46 53 0 107 1 74 49 0 79 2 0 30 68 26 0 12 61 4
151 2639 xtr Xenopus tropicalis (frog) (JGI 4.2 Nov 2009) 57,2 2 58 46 22 38 2 25 32 63 5 51 138 55 0 36 53 40 3 41 23 60 1 53 36 151 0 91 29 67 0 47 36 0 107 0 0 1 42 28 40 1 47 72 97 0 59 84 51 2 92 1 33 33 3 33 8 0 99 105 27 0 85 80 105
1201 3729 fca Felis catus (cat) (Felis_catus-6.2 Sept 2011) 81,9 1 12 19 8 6 0 33 5 10 0 9 24 8 0 6 9 8 1 14 5 8 1 68 7 9 0 13 9 18 1 10 7 0 10 0 0 2 16 782 47 5 28 50 887 1 9 15 44 1 32 18 23 9 9 1 201 24 2 12 54 53 2 10 48 6
1295 4040 bta Bos taurus (Cow Jun. 2014 Bos_taurus_UMD_3.1.1/bosTau8) 83,9 6 30 10 14 11 0 5 6 18 0 8 35 20 0 21 39 13 32 7 7 13 0 9 4 14 1 10 7 31 2 35 16 11 39 0 0 4 19 20 40 0 30 78 40 6 42 435 164 143 338 29 178 13 7 12 16 4 19 44 116 20 63 391 1 295
1901 5845 ttr* Tursiops truncatus (Dolphin Oct. 2011 Baylor Ttru_1.4/turTru2) 128,5 0 12 6 7 6 0 4 6 11 0 5 17 8 3 16 22 12 0 6 4 7 0 5 4 9 1 6 3 19 2 36 21 1 18 0 0 0 9 16 15 0 13 74 19 10 49 1 901 395 6 22 21 217 7 1 7 12 0 11 48 54 19 43 833 1 766
2368 7080 bacu Balaenoptera acutorostrata scammoni (Minke whale Oct. 2013 BalAcu1.0/balAcu1) 156,1 0 13 13 8 6 0 4 7 12 1 8 21 14 1 18 32 10 1 5 4 7 0 5 4 13 0 8 4 20 0 42 20 0 14 0 0 0 11 10 20 0 24 86 29 20 45 2 368 468 2 24 17 256 9 0 9 21 0 13 55 67 12 64 987 2 148
5898 13727 cmk Callorhinchus milii (Elephant shark Dec. 2013 Callorhinchus_milii-6.1.3/calMil1) 300,1 3 35 13 31 20 2 20 25 31 0 23 94 22 16 145 1 540 26 1 54 48 12 6 51 41 24 12 206 137 75 168 5 898 3 858 1 36 0 0 1 37 7 18 2 48 43 36 6 49 66 428 1 15 3 30 9 0 25 2 0 33 14 12 2 19 66 81
1045 12258 dre Danio rerio (Zebrafish) (Zv8 Apr 2009) 268,8 10 197 73 241 270 4 244 300 258 10 75 522 232 6 230 227 336 2 209 80 315 2 205 180 359 10 290 66 92 4 368 112 5 236 0 0 10 387 105 266 24 1 045 525 953 1 150 225 245 9 136 14 44 203 24 107 59 14 424 252 104 11 836 47 268
92530 Totaux des 121 eucaryotes non réduits 45 1461 705 816 1085 22 561 857 1803 70 675 2921 1543 94 790 2699 1266 99 715 551 1123 25 1244 476 1527 83 1053 672 2524 240 7139 4540 50 1661 0 0 34 1239 1957 1318 72 2039 1880 4658 93 2245 6609 3111 209 2403 249 1739 1153 33 2020 428 36 1265 1369 1095 138 2017 5547 6439
  • Tableau non formaté : voir tableur
Distribution des tRNAs de 121 eucaryotes[modifier | modifier le wikicode]
  • Lien Tableur: Distribution des tRNAs de 121 eucaryotes
  • Tableau des diagrammes et totaux des fréquences 0-4
  • Tableau non formaté: voir tableur
  • Image des diagrammes des codons se terminant par a: xya
  • Image des diagrammes des codons se terminant par g: xyg
  • Image des diagrammes des codons se terminant par c ou t: xyct
Cumul des fréquences des tRNAs/génome >4. 121 Eucaryotes.
ttt 2 tct 104 tat 2 tgt 6
c 111 c 2 c 106 c 87
a 55 a 48 a - a 9
g 70 g 32 g - g 87
ctt 80 cct 85 cat 1 cgt 92
c 0 c 1 c 97 c 2
a 37 a 82 a 78 a 64
g 72 g 24 g 87 g 28
att 111 act 106 aat 4 agt 1
c 5 c 5 c 108 c 88
a 55 a 61 a 83 a 86
g 110 g 43 g 113 g 61
gtt 107 gct 114 gat 6 ggt 8
c 3 c 3 c 112 c 114
a 49 a 83 a 98 a 77
g 71 g 52 g 95 g 53
Cumul des fréquences des tRNAs/génome > 4. 121 Eucaryotes.
Total ligne
t c a g
Base1 721 830 1040 1045
t1+c1 12 4 15 20
t2+c2 408 354 413 447
a 112 261 285 307
g 189 211 327 271
Total colonne
t c a g
Base2 938 845 990 863
t1+c1 10 11 13 17
t2+c2 409 409 423 381
a 196 274 259 236
g 323 151 295 229
Tableau des effectifs élevés des gènes de tRNAs eucaryotes[modifier | modifier le wikicode]
Callorhinchus milii    13 727
ttt 3 tct 26 tat 1 tgt 1
c 35 c 1 c 36 c 15
a 13 a 54 a a 3
g 31 g 48 g g 30
ctt 20 cct 12 cat 1 cgt 9
c 2 c 6 c 37 c
a 20 a 51 a 7 a 25
g 25 g 41 g 18 g 2
att 31 act 24 aat 2 agt
c c 12 c 48 c 33
a 23 a 206 a 43 a 14
g 94 g 137 g 36 g 12
gtt 22 gct 75 gat 6 ggt 2
c 16 c 168 c 49 c 19
a 145 a 5,898 a 66 a 66
g 1,540 g 3,858 g 428 g 81
Danio rerio (Zebrafish)    12 258
ttt 10 tct 336 tat 5 tgt 9
c 197 c 2 c 236 c 136
a 73 a 209 a a 14
g 241 g 80 g g 44
ctt 270 cct 315 cat 10 cgt 203
c 4 c 2 c 387 c 24
a 244 a 205 a 105 a 107
g 300 g 180 g 266 g 59
att 258 act 359 aat 24 agt 14
c 10 c 10 c 1,045 c 424
a 75 a 290 a 525 a 252
g 522 g 66 g 953 g 104
gtt 232 gct 92 gat 1 ggt 11
c 6 c 4 c 150 c 836
a 230 a 368 a 225 a 47
g 227 g 112 g 245 g 268
Balaenoptera acutorostrata scammoni 7 080
ttt tct 10 tat tgt 2
c 13 c 1 c 14 c 24
a 13 a 5 a a 17
g 8 g 4 g g 256
ctt 6 cct 7 cat cgt 9
c c c 11 c
a 4 a 5 a 10 a 9
g 7 g 4 g 20 g 21
att 12 act 13 aat agt
c 1 c c 24 c 13
a 8 a 8 a 86 a 55
g 21 g 4 g 29 g 67
gtt 14 gct 20 gat 20 ggt 12
c 1 c c 45 c 64
a 18 a 42 a 2,368 a 987
g 32 g 20 g 468 g 2,148
Tursiops truncatus (Dolphin)    5 845
ttt tct 12 tat 1 tgt 6
c 12 c c 18 c 22
a 6 a 6 a a 21
g 7 g 4 g g 217
ctt 6 cct 7 cat cgt 7
c c c 9 c 1
a 4 a 5 a 16 a 7
g 6 g 4 g 15 g 12
att 11 act 9 aat agt
c c 1 c 13 c 11
a 5 a 6 a 74 a 48
g 17 g 3 g 19 g 54
gtt 8 gct 19 gat 10 ggt 19
c 3 c 2 c 49 c 43
a 16 a 36 a 1,901 a 833
g 22 g 21 g 395 g 1,766
Bos taurus    4 040
ttt 6 tct 13 tat 11 tgt 143
c 30 c 32 c 39 c 338
a 10 a 7 a a 29
g 14 g 7 g g 178
ctt 11 cct 13 cat 4 cgt 13
c c c 19 c 7
a 5 a 9 a 20 a 12
g 6 g 4 g 40 g 16
att 18 act 14 aat agt 4
c c 1 c 30 c 19
a 8 a 10 a 78 a 44
g 35 g 7 g 40 g 116
gtt 20 gct 31 gat 6 ggt 20
c c 2 c 42 c 63
a 21 a 35 a 435 a 391
g 39 g 16 g 164 g 1,295
Felis catus (cat)    3 729
ttt 1 tct 8 tat tgt 1
c 12 c 1 c 10 c 32
a 19 a 14 a a 18
g 8 g 5 g g 23
ctt 6 cct 8 cat 2 cgt 9
c c 1 c 16 c 9
a 33 a 68 a 782 a 1,201
g 5 g 7 g 47 g 24
att 10 act 9 aat 5 agt 2
c c c 28 c 12
a 9 a 13 a 50 a 54
g 24 g 9 g 887 g 53
gtt 8 gct 18 gat 1 ggt 2
c c 1 c 9 c 10
a 6 a 10 a 15 a 48
g 9 g 7 g 44 g 6
  • Tableaux non formatés: voir tableur
Zebrafish[modifier | modifier le wikicode]
Comparaison Zebrafisch, 121 Eucaryotes, Bactéries[modifier | modifier le wikicode]
  • Lien Tableur: Comparaison_Zebrafisch,121 Eucaryotes, Bactéries
  • Légende: Décompte des gènes tRNAs par codon suivant la base de données gtRNAdb [17].
    1. Voir la légende initiale dans Tableau des effectifs des gènes de tRNAs.
    2. 81: Pourcentage de résonance des codons forts. La résonance des codons faibles est en gras sur leur couleur de fond habituelle, jaune et orange.
    3.   -75   : Pourcentage pour les codons faibles.
    4. Les différences en % sont obtenues en divisant par l'effectif le plus élevé. Dans le tableur calc de LibreOffice cela donne: =SI(cel1>cel2,100*(cel2-cel1)/cel1,100*(cel2-cel1)/cel2).
IV100. 100 000 tRNAs. 121 eucaryotes. 55 830
ttt 57 tct 2 268 tat 64 tgt 57
c 2 617 c 68 c 2 900 c 3 690
a 1 146 a 1 281 a a 446
g 1 422 g 987 g g 2 047
ctt 1 797 cct 2 011 cat 48 cgt 2 065
c 39 c 30 c 2 219 c 34
a 1 005 a 2 228 a 2 137 a 1 256
g 1 440 g 853 g 2 234 g 767
att 3 032 act 2 572 aat 84 agt 52
c 73 c 50 c 3 328 c 2 266
a 1 209 a 1 567 a 3 367 a 2 038
g 4 267 g 987 g 3 928 g 1 693
gtt 2 531 gct 4 014 gat 73 ggt 48
c 95 c 63 c 3 817 c 3 613
a 1 189 a 2 286 a 2 606 a 2 409
g 1 940 g 1 261 g 3 190 g 1 137
V100. Danio rerio (Zebrafish) 12 258
ttt 82 tct 2 741 tat 41 tgt 73
c 1 607 c 16 c 1 925 c 1 109
a 596 a 1 705 a - a 114
g 1 966 g 653 g - g 359
ctt 2 203 cct 2 570 cat 82 cgt 1 656
c 33 c 16 c 3 157 c 196
a 1 991 a 1 672 a 857 a 873
g 2 447 g 1 468 g 2 170 g 481
att 2 105 act 2 929 aat 196 agt 114
c 82 c 82 c 8 525 c 3 459
a 612 a 2 366 a 4 283 a 2 056
g 4 258 g 538 g 7 775 g 848
gtt 1 893 gct 751 gat 8 ggt 90
c 49 c 33 c 1 224 c 6 820
a 1 876 a 3 002 a 1 836 a 383
g 1 852 g 914 g 1 999 g 2 186
I100. 100 000 tRNAs. 4032 bactéries. 235 027
ttt 4 tct 2 tat 2 tgt 1
c 2 598 c 1 923 c 2 732 c 1 903
a 2 021 a 2 255 a - a 560
g 1 702 g 1 116 g - g 1 858
ctt 157 cct 4 cat 2 cgt 3 182
c 1 638 c 1 167 c 2 006 c 142
a 2 102 a 2 320 a 2 718 a 377
g 2 207 g 929 g 1 016 g 1 427
att 2 act 44 aat 2 agt 0
c 3 916 c 1 920 c 3 729 c 1 881
a 23 a 2 501 a 3 874 a 2 044
g 7 670 g 1 174 g 1 033 g 1 469
gtt 4 gct 1 gat 0 ggt 0
c 1 885 c 1 773 c 3 839 c 3 946
a 3 769 a 4 334 a 4 118 a 2 347
g 559 g 521 g 591 g 964
IV100−V100.
ttt -30 tct -17 tat 37 tgt -22
c 39 c 76 c 34 c 70
a 48 a -25 a a 74
g -28 g 34 g g 82
ctt -189 cct -22 cat -41 cgt 20
c 17 c 46 c -30 c -83
a -50 a 25 a 60 a 30
g -41 g -42 g 3 g 37
att 31 act -12 aat -57 agt -55
c -10 c -39 c -61 c -34
a 49 a -34 a -21 a -1
g 0 g 45 g -49 g 50
gtt 25 gct 81 gat 89 ggt -46
c 48 c 48 c 68 c -47
a -37 a -24 a 30 a 84
g 5 g 28 g 37 g -48
V100−I100.
ttt 95 tct 30 tat 96 tgt 98
c -38 c 87 c -30 c -42
a -71 a -24 a a -80
g 13 g -42 g g -81
ctt 26 cct 55 cat 98 cgt -48
c -79 c 74 c 36 c 28
a -5 a -28 a -68 a 57
g 10 g 37 g 53 g -66
att -46 act 34 aat 99 agt 100
c 97 c 46 c 56 c 46
a 96 a -5 a 10 a 1
g -44 g -54 g 87 g -42
gtt 0 gct -58 gat 100 ggt 100
c 92 c 97 c -68 c 42
a -50 a -31 a -55 a -84
g 70 g 43 g 70 g 56
IV100−I100. % Processus E des 121 Eucaryotes.
ttt 93 tct 18 tat 97 tgt 98
c 1 c 99 c 6 c 48
a -43 a -43 a a -20
g -16 g -12 g g 9
ctt 9 cct 42 cat 96 cgt -35
c -75 c 86 c 10 c -76
a -52 a -4 a -21 a 70
g -35 g -8 g 54 g -46
att -23 act 25 aat 97 agt 99
c 97 c 13 c -11 c 17
a 98 a -37 a -13 a 0
g -44 g -16 g 74 g 13
gtt 26 gct 56 gat 100 ggt 99
c 96 c 99 c -1 c -8
a -68 a -47 a -37 a 3
g 71 g 59 g 81 g 15
  • Tableaux non formatés: voir tableur
Comparaison de Zebrafish aux eucaryotes à résonance[modifier | modifier le wikicode]
  • Lien au tableur: Comparaison de Zebrafish aux eucaryotes à résonance
  • Légende:
    1. Eucaryotes
      fca  Felis catus (cat) (Felis_catus-6.2 Sept 2011)
      bta  Bos taurus (Cow Jun. 2014 Bos_taurus_UMD_3.1.1/bosTau8)
      ttr*  Tursiops truncatus (Dolphin Oct. 2011 Baylor Ttru_1.4/turTru2)
      bacu  Balaenoptera acutorostrata scammoni (Minke whale Oct. 2013 BalAcu1.0/balAcu1)
      cmk  Callorhinchus milii (Elephant shark Dec. 2013 Callorhinchus_milii-6.1.3/calMil1)
      dre  Danio rerio (Zebrafish) (Zv8 Apr 2009)
    2. Codons
      code, codon    eff, effectif des gènes de tRNA    T, total des effectifs de tous les codons    X, maximum de tous les effectifs      faibles, codons xyc, xyt et codon tga à effectif faible.
      rup: Les effectifs sont triés en ordre croissants. La colonne rup est la différence en % entre l'effectif du codon et son suivant.
    3. Processus E des eucaryotes pour les codons forts: codons autres que les codons faibles mais dont les effectifs restent faibles par rapport à ceux à résonance. La résonance commence à une rupture élevée. Celle-ci est encadrée 46.
      mpe,  epe,  xpe,  spe,  minpe,  respectivement, moyenne, écart type, maximum, somme et minimum des codons forts sujets au processus E (sur 45 codons moins les codons résonants).
      m/e, rapport en % de mpe et epe pour indiquer l’homogénéité du processus
    4. Processus de résonance:
      Le processus commence quand le rapport rup est très élevé. Je l'appelle alors rupture et elle est encadrée 46. Les rapports rup suivants sont colorés en orange 111pour indiquer que ces ruptures élevées se produisent plus souvent dans le processus de résonance et non dans Zebrafish qui a des rapports rup très peu contrastés.
      − Les codons sujets à la résonance sont colorés en cyan 5,898.
      − 2 codons faibles, tgt et gcc colorés en jaunes, 143, ne devraient pas être avec les codons résonant cyan. Ils sont cependant intégrés dans la somme sre.
      sre: somme des codons résonants.
Comparaison de Zebrafish aux eucaryotes à résonance
fca bta ttr* bacu cmk zebra
code eff rup code eff rup code eff rup code eff rup code eff rup code eff rup
tgc 32 3 gac 42 5 tgc 22 64 gtg 32 31 gga 66 14 ctg 300 5
cta 33 33 aga 44 43 gca 36 19 gca 42 7 gct 75 8 cct 315 7
gag 44 7 ggc 63 24 ggc 43 12 gac 45 22 ggg 81 16 tct 336 7
cag 47 2 aaa 78 49 aga 48 2 aga 55 16 atg 94 46 act 359 3
gga 48 4 agg 116 23 gac 49 10 ggc 64 5 acg 137 6 gca 368 5
aaa 50 6 tgt 143 15 agg 54 37 agg 67 28 gta 145 16 cac 387 10
agg 53 2 gag 164 9 aaa 74 193 aaa 86 198 gcc 168 23 agc 424 23
aga 54 26 tgg 178 90 tgg 217 82 tgg 256 83 aca 206 108 atg 522 1
cca 68 1050 tgc 338 16 gag 395 111 gag 468 111 gag 428 260 aaa 525 59
caa 782 13 gga 391 11 gga 833 112 gga 987 118 gtg 1,540 151 ggc 836 14
aag 887 35 gaa 435 198 ggg 1,766 8 ggg 2,148 10 gcg 3,858 53 aag 953 10
cga 1,201 ggg 1,295 gaa 1,901 gaa 2,368 gca 5,898 aac 1,045
T 3729 4040 5845 7080 13727 12258
X 1201 1295 1901 2368 5898 1045
mpe 19 23 17 20 34 221
epe 17 17 16 19 21 120
% e/m 85 74 96 96 63 55
xpe 68 78 74 86 94 525
X/mpe 62 57 114 119 174 5
X/xpe 18 17 26 28 63 2
sre 2870 3060 5112 6227 12380 2834
spe 859 980 733 853 1347 9424
faibles 3 10 4 3 8 0
minpe 5 4 3 4 2 44
Moyennes et variances pour 100 000 tRNAs des codons[modifier | modifier le wikicode]
  • Lien Tableur: Moyennes et variances pour 100 000 tRNAs des codons
  • Légende:
    1. Moyenne et écart type sont faits sur les carrés, sauf certains carrés.
    2. % :rapport de l'écart type par la moyenne en pourcent.
    3. moyenne par génome: celle du codon pour calculer l'indice de multiplicité. Elle est égale à dom*moyenne/100 000, dom étant le nombre de tRNAs par domaine, 8 731 pour les archées, 119 380 pour les eucaryotes et 239 000 pour les bactéries. Voir les statistiques de la base de données.
    4. multiplicité moyenne: rapport "moyenne par génome" du codon divisé par le nombre d'espèces du domaine de la base de données, 184 pour les archées, 155 pour les eucaryotes et 4 032 pour les bactéries.
Moyenne pour 100 000 des codons classés sur la 3ème base.
moyenne écart % carrés sauf moyenne
par génome
multiplicité
moyenne
Bactéries
t 2 1.4 74 13 ct ac cg - -
c 2,457 945 38 15 cg 5,775 1.43
a 2,524 1,193 47 14 ta at 5,933 1.47
g 1,183 501 42 14 ta at 2,781 0.69
Archées
t 4 7 193 16 - -
c 2,365 350 15 16 207 1.12
a 2,257 246 11 13 ta at tg 197 1.07
g 1,843 120 7 14 ta at 161 0.88
Eucaryotes
t 939 912 97 16 1,081 6.97
c 1,156 1,150 99 16 1,331 8.58
a 2,306 2,027 88 14 ta tg 2,654 17.12
g 2,264 1,800 80 15 ta 2,606 16.81
Eucaryotes
t1 102 55 54 8 117 0.75
t2 1,776 421 24 8 2,045 13.19
c1 109 104 95 8 126 0.81
c2 2,202 564 26 8 2,535 16.35
t1+c1 105 81 76 16 121 0.78
t2+c2 1,989 529 27 16 2,290 14.77
  • Tableau non formaté:voir tableur
Rapport E/B des codons[modifier | modifier le wikicode]
  • Lien Tableur: Rapport E/B des codons
  • Légende: Valeur du codon se terminant par x de E / Valeur du codon se terminant par x de B
  1. 0.8: t de E / c de B
  2. Tableau rapport E/B pour 100 000: d'après les valeurs des tableaux III100 / I100
  3. Tableau rapport E/B par génome: d'après les valeurs des tableaux III1 / I1
Rapport E/B pour 100 000.
ttt tct 0.83 tat tgt
c 0,63 c c 0,69 c 1,23
a 0,38 a 0,39 a - a 0,42
g 0,63 g 0,57 g - g 0,91
ctt 0.82 cct 1.20 cat cgt 0,42
c c c 0,80 c 0,34
a 0,35 a 0,60 a 0,72 a 5,27
g 0,50 g 0,67 g 1,55 g 0,31
att 0.53 act 0.98 aat agt
c c c 0,81 c 0,86
a 31 a 0,51 a 0,58 a 0,73
g 0,43 g 0,60 g 5,00 g 0,75
gtt 0.95 gct 1.42 gat ggt
c c c 0,62 c 0,71
a 0,25 a 1,50 a 1,46 a 2,01
g 4,76 g 7,75 g 5,41 g 6,23
Rapport E/B par génome.
ttt tct 11 tat tgt
c 8 c 0.7 c 9 c 16
a 5 a 5 a a 6
g 8 g 7 g g 12
ctt 11 cct 16 cat cgt 6
c 0.3 c 0.3 c 10 c 4
a 5 a 8 a 9 a 69
g 7 g 9 g 20 g 4
att 5 act 13 aat agt
c 0.3 c 0.9 c 10 c 11
a 402 a 7 a 8 a 10
g 6 g 8 g 65 g 10
gtt 12 gct 18 gat ggt
c 0.6 c 2.5 c 8 c 9
a 3.2 a 20 a 19 a 26
g 62 g 101 g 70 g 81
  • Tableau non formaté: voir tableur
Ordre des codons pour 100 000 tRNAs[modifier | modifier le wikicode]
  • Lien Tableur: Ordre des codons pour 100 000 tRNAs
  • Légende: B bactéries, A archées, E eucaryotes.
    1. gac: Chez les bactéries le codon se terminant par g n'est pas dernier.
    2. cag: changement chez les archées par rapport aux bactéries.
    3. tag: chez les eucaryotes le codon se terminant par g est dernier.
    4. cag: différence très faible mais toujours non nulle.
tRNAs rapportés à 100 0000. Ordre des codons.
B t c a g
t cag acg cga
c gac acg acg tga
a gca acg acg acg
g acg acg acg cag
A t c a g
t cag cag cga
c cag acg acg cag
a gca acg cag cag
g cag acg acg cag
E t c a g
t cga tag cga
c tga atg acg atg
a gta tag gca cag
g gta agt agc gac
  • Tableau non formaté: voir tableur
Totaux des carrés pour 100 000 tRNAs[modifier | modifier le wikicode]
tRNAs rapportés à 100 0000. totaux des carrés.
B t c a g
t 6 219 5 208 2 688 4 250
c 6 002 4 346 5 647 5 043
a 11 418 5 546 8 494 5 305
g 6 113 6 518 8 406 7 136
A t c a g
t 6 517 6 025 2 176 5 738
c 6 414 5 795 6 254 5 876
a 9 197 6 368 6 609 6 162
g 6 517 6 861 6 964 6 735
E t c a g
t 3 466 3 155 1 986 4 397
c 3 167 3 391 5 080 3 772
a 6 065 3 922 10 368 4 184
g 5 379 13 187 11 503 13 403
  • Tableau non formaté: voir tableur
Variation en % entre la 1ère et la 2ème valeur[modifier | modifier le wikicode]
  1. -17, variation en % des 2 1ères valeurs; 779 différence en valeur absolue de la base de données de référence. La variation est calculée entre le nombre de codons contenu dans la cellule affichant la variation en % (-17) et celui contenu dans la cellule affichant la différence en valeur absolue (779).
  2.     : 4ème valeur sans changement entre B et A ou E
  3.     : 3ème valeur sans changement entre B et A ou E
  4.     : 4ème valeur après changement entre B et A ou E
  5.     : 3ème valeur après changement entre B et A ou E
  • Moyenne des valeurs absolues des variations:
        B       A       E
Moy     48.1    18.2    39.1
Ecart   47.4    21.0    24.5
%       98.5    115.2   62.7
Variation en % entre la 1ère et la 2ème valeur.
I100. Nombre de tRNAs. 4032 Bactéries
ttt tct tat tgt
c 29 c -17 c c 2
a 1 356 a 779 a - a
g g g - g 107
ctt cct cat cgt 123
c c -99 c -35 c
a -5 a 2 711 a 1 673 a
g 246 g g g 4 123
att act aat agt
c -49 c -30 c -4 c -9
a a 1 365 a 341 a 382
g 8 823 g g g
gtt gct gat ggt
c -100 c -144 c -7 c 68
a 4 429 a 6 019 a 656 a 3 758
g g g g
II100. Nombre de tRNAs. 184 Archées
ttt tct tat tgt
c 13 c 3 c c 63
a 24 a 6 a - a
g g g - g 115
ctt cct cat cgt
c 16 c -8 c -6 c 1
a 29 a 13 a 11 a 2
g g g g
att act aat agt
c -64 c -5 c 9 c 1
a a 9 a 17 a 1
g 377 g g g
gtt gct gat ggt
c 14 c -39 c -6 c 29
a 26 a 72 a 12 a 54
g g g g
III100. Nombre de tRNAs. 155 Eucaryotes
ttt tct 79 tat tgt
c 55 c c c 39
a a 822 a - a
g 684 g g - g 773
ctt 22 cct 0 cat cgt -32
c c c -22 c
a a 3 a 410 a 750
g 280 g g g
att -37 act 47 aat agt
c c c -42 c 7
a a 707 a a 133
g 1 434 g g 2 540 g
gtt -33 gct gat ggt
c c c c
a a 61 a 89 a -21
g 1 022 g 2 902 g 3 325 g 1 514
  • Tableau non formaté: voir tableur
Codons identiques par classement des 3 bases[modifier | modifier le wikicode]
Codons identiques par classement des 3 bases
1ère base
II100 Nombres de tRNAs. 184 archées. 8749
ttt 0   
ctt 11   
att 0
gtt 11
ttc 2,457
ctc 2,446
atc 2,423
gtc 2,423
tta 2,183
cta 2,115
ata 23
gta 2,126
ttg 1,863
ctg 1,829
atg 6,732
gtg 1,943
tct 0   
cct 0
act 0
gct 0
tcc 2,172
ccc 1,955
acc 2,160
gcc 2,103
tca 2,103
cca 2,103
aca 2,263
gca 2,926
tcg 1,737
ccg 1,726
acg 1,932
gcg 1,817
tat 0   
cat 0
aat 0
gat 0
tac 2,172
cac 2,115
aac 2,446
gac 2,492
taa -
caa 2,240
aaa 2,252
gaa 2,629
tag -
cag 1,886
aag 1,897
gag 1,829
tgt 0
cgt 23   
agt 0
ggt 11
tgc 3,418
cgc 2,137
agc 2,137
ggc 2,777
tga 206
cga 2,115
aga 2,126
gga 2,160
tgg 2,103
cgg 1,589
agg 1,886
ggg 1,772
I100 Nombres de tRNAs. 4032 bactéries. 235 027
ttt 4   
ctt 157
att 2
gtt 4
ttc 2,598
ctc 1,638
atc 3,916
gtc 1,885
tta 2,021
cta 2,102
ata 23
gta 3,769
ttg 1,702
ctg 2,207
atg 7,670
gtg 559
tct 2
cct 4
act 44   
gct 1
tcc 1,923
ccc 1,167
acc 1,920
gcc 1,773
tca 2,255
cca 2,320
aca 2,501
gca 4,334
tcg 1,116
ccg 929
acg 1,174
gcg 521
tat 2   
cat 2
aat 2
gat 0
tac 2,732
cac 2,006
aac 3,729
gac 3,839
taa
caa 2,718
aaa 3,874
gaa 4,118
tag
cag 1,016
aag 1,033
gag 591
tgt 1
cgt 3,182
agt 0
ggt 0
tgc 1,903
cgc 142
agc 1,881
ggc 3,946
tga 560
cga 377
aga 2,044
gga 2,347
tgg 1,858
cgg 1,427
agg 1,469
ggg 964
III100 Nombres de tRNAs. 155 eucaryotes. 115 111
ttt 57
ctt 1,369
att 2,109
gtt 1,825
ttc 1,679
ctc 32
atc 86
gtc 95
tta 773
cta 758 
ata 739
gta 945
ttg 1,085
ctg 1,126
atg 3,355
gtg 2,713
tct 1,618
cct 1,423
act 1,912
gct 2,573
tcc 98
ccc 30
acc 134 
gcc 352
tca 904
cca 1,426
aca 1,298
gca 6,636
tcg 1,423
ccg 639
acg 724
gcg 4,115
tat 135
cat 41  
aat 129
gat 87
tac 1,925
cac 1,632
aac 3,061
gac 2,432
taa -
caa 1,989
aaa 2,293
gaa 6,150
tag 41
cag 1,606
aag 5,268
gag 3,261
tgt 202
cgt 1,379
agt 46
ggt 115
tgc 2,393
cgc 50
agc 1,646
ggc 2,849
tga 242
cga 2,030
aga 1,531
gga 4,811
tgg 1,379
cgg 453
agg 1,116
ggg 6,126
2ème base
II100 Nombres de tRNAs. 184 archées. 8749
ttt 0   
tct 0
tat 0
tgt 0
ttc 2,457
tcc 2,172
tac 2,172
tgc 3,418
tta 2,183
tca 2,103
taa -
tga 206
ttg 1,863
tcg 1,737
tag -
tgg 2,103
ctt 11
cct 0   
cat 0
cgt 23
ctc 2,446
ccc 1,955
cac 2,115
cgc 2,137
cta 2,115
cca 2,103
caa 2,240
cga 2,115
ctg 1,829
ccg 1,726
cag 1,886
cgg 1,589
att 0
act 0   
aat 0
agt 0
atc 2,423
acc 2,160
aac 2,446
agc 2,137
ata 23
aca 2,263
aaa 2,252
aga 2,126
atg 6,732
acg 1,932
aag 1,897
agg 1,886
gtt 11
gct 0   
gat 0
ggt 11
gtc 2,423
gcc 2,103
gac 2,492
ggc 2,777
gta 2,126
gca 2,926
gaa 2,629
gga 2,160
gtg 1,943
gcg 1,817
gag 1,829
ggg 1,772
I100 Nombres de tRNAs. 4032 bactéries. 235 027
ttt 4
tct 2
tat 2
tgt 1   
ttc 2,598
tcc 1,923
tac 2,732
tgc 1,903
tta 2,021
tca 2,255
taa
tga 560
ttg 1,702
tcg 1,116
tag
tgg 1,858
ctt 157
cct 4
cat 2   
cgc 142
ctc 1,638
ccc 1,167
cac 2,006
cgt 3,182
cta 2,102
cca 2,320
caa 2,718
cga 377
ctg 2,207
ccg 929
cag 1,016
cgg 1,427
att 2
act 44
aat 2   
agt 0
atc 3,916
acc 1,920
aac 3,729
agc 1,881
ata 23
aca 2,501
aaa 3,874
aga 2,044
atg 7,670
acg 1,174
aag 1,033
agg 1,469
gtt 4
gct 1   
gat 0
ggt 0
gtc 1,885
gcc 1,773
gac 3,839
ggc 3,946
gta 3,769
gca 4,334
gaa 4,118
gga 2,347
gtg 559
gcg 521 
gag 591
ggg 964
III100 Nombres de tRNAs. 155 eucaryotes. 115 111
ttt 57
tct 1,618
tat 135
tgt 202
ttc 1,679
tcc 98
tac 1,925
tgc 2,393
tta 773
tca 904
taa −   
tga 242
ttg 1,085
tcg 1,423
tag 41
tgg 1,379
ctt 1,369
cct 1,423
cat 41
cgt 1,379
ctc 32
ccc 30
cac 1,632
cgc 50
cta 758
cca 1,426
caa 1,989
cga 2,030
ctg 1,126
ccg 639
cag 1,606
cgg 453
att 2,109
act 1,912
aat 129
agt 46
atc 86
acc 134
aac 3,061
agc 1,646
ata 739
aca 1,298
aaa 2,293
aga 1,531
atg 3,355
acg 724
aag 5,268
agg 1,116
gtt 1,825
gct 2,573
gat 87
ggt 115
gtc 95
gcc 352
gac 2,432
ggc 2,849
gta 945
gca 6,636
gaa 6,150
gga 4,811
gtg 2,713
gcg 4,115
gag 3,261
ggg 6,126
  • Tableau non formaté: voir tableur
Comparaison globale[modifier | modifier le wikicode]
Codons par ordre de valeurs dans les carrés[modifier | modifier le wikicode]
  • Lien Tableur: Codons par ordre de valeurs dans les carrés
  • Légende: classement des codons par leur ordre des effectifs de gène tRNA, dans les doublets des bactéries (B), des archées (A) et des eucaryotes (E). Les ordres sont ceux des tableaux I100, II100, III100.
Codons par ordre de valeurs dans les carrés
tt B A E
t 4 4 4
c 1 1 1
a 2 2 3
g 3 3 2
tc B A E
t 4 4 1
c 2 1 4
a 1 2 2
g 3 3 3
ta B A E
t 4 4 4
c 1 1 1
a
g
tg B A E
t 4 4 4
c 1 1 1
a 3 3 3
g 2 2 2
ct      
t 4 4 1
c 3 1 4
a 2 2 3
g 1 3 2
cc      
t 4 4 2
c 2 2 4
a 1 1 1
g 3 3 3
ca      
t 4 4 4
c 2 2 2
a 1 1 1
g 3 3 3
cg      
t 1 4 2
c 4 1 4
a 3 2 1
g 2 3 3
at      
t 4 4 2
c 2 2 4
a 3 3 3
g 1 1 1
ac      
t 4 4 1
c 2 2 4
a 1 1 2
g 3 3 3
aa      
t 4 4 4
c 2 1 2
a 1 2 3
g 3 3 1
ag      
t 4 4 4
c 2 1 1
a 1 2 2
g 3 3 3
gt      
t 4 4 2
c 2 1 4
a 1 2 3
g 3 3 1
gc      
t 4 4 3
c 2 2 4
a 1 1 1
g 3 3 2
ga      
t 4 4 4
c 2 2 3
a 1 1 1
g 3 3 2
gg      
t 4 4 4
c 1 1 3
a 2 2 2
g 3 3 1
  • Tableau non formaté: voir tableur
Groupes de codons[modifier | modifier le wikicode]
  • Lien Tableur: Groupes de codons
  • Légende: Les effectifs sont ceux des tableaux I100, II100, III100 sauf pour les faibles effectifs des tableaux I II III quand ils sont indiqués.
    Groupe: Par exemple le groupe 111, est celui des codons classés en 1er dans chaque carré (doublet) des 3 domaines, bactéries (B), archées (A) et eucaryotes (E). L'attribution du groupe à chaque codon est faite dans le tableau des ordres.
    − Les paires de codons qui se ressemblent beaucoup sont soulignés en jaune.
Groupes de codons
Groupe B A E total
111 Tableaux I II III 100.
cca 2,320 2,103 1,426 5,849
tac 2,732 2,172 1,925 6,828
caa 2,718 2,240 1,989 6,947
ttc 2,598 2,457 1,679 6,734
gaa 4,118 2,629 6,150 12,897
gca 4,334 2,926 6,636 13,896
tgc 1,903 3,418 2,393 7,714
atg 7,670 6,732 3,355 17,757
B A E total
444 Tableaux I II III.
cat 4 0 47 51
agt 1 0 53 54
ttt 10 0 66 76
gat 0 0 100 100
ggt 1 1 132 134
aat 5 0 149 154
tat 4 0 155 159
tgt 3 0 233 236
B A E total
333 Tableaux I II III 100.
ata 23 23 739 786
tga 560 206 242 1,008
ccg 929 1,726 639 3,293
tcg 1,116 1,737 651 3,504
cag 1,016 1,886 1,606 4,509
agg 1,469 1,886 1,116 4,471
acg 1,174 1,932 724 3,830
B A E total
224 Tableaux I II III 100.
ccc 1,167 1,955 30 3,151
gcc 1,773 2,103 352 4,227
acc 1,920 2,160 134 4,214
atc 3,916 2,423 86 6,425
B A E total
332 Tableaux I II III 100.
gcg 521 1,817 4,115 6,453
gag 591 1,829 3,261 5,681
ttg 1,702 1,863 1,085 4,650
 
 
suite
Suite B A E total
223 Tableaux I II III 100.
cta 2,102 2,115 758 4,974
tta 2,021 2,183 773 4,977
gac 3,839 2,492 2,432 8,762
441
tct 2 0 1,618 1,621
act 44 0 1,912 1,956
ctt 157 11 1,369 1,538
442
cct 4 0 1,423 1,427
gtt 4 11 1,825 1,840
att 2 0 2,109 2,111
331
ggg 964 1,772 6,126 8,862
aag 1,033 1,897 5,268 8,198
gtg 559 1,943 2,713 5,215
222
tgg 1,858 2,103 1,722 5,683
cac 2,006 2,115 1,632 5,753
gga 2,347 2,160 4,811 9,318
B A E total
214 Tableaux I II III 100.
tcc 1,923 2,172 98 4,193
gtc 1,885 2,423 95 4,403
123
gta 3,769 2,126 945 6,840
aaa 3,874 2,252 2,293 8,419
122
tca 2,255 2,103 904 5,262
aga 2,044 2,126 1,531 5,701
Tableaux I II III 100.
314 ctc 1,638 2,446 32 4,116
414 cgc 142 2,137 50 2,329
233 cgg 1,427 1,589 453 3,470
132 ctg 2,207 1,829 1,126 5,161
112 aca 2,501 2,263 1,298 6,062
142 cgt 3,182 23 1,379 4,583
211 agc 1,881 2,137 1,646 5,665
321 cga 377 2,115 2,030 4,522
443 gct 1 0 2,573 2,574
113 ggc 3,946 2,777 2,849 9,572
212 aac 3,729 2,446 3,061 9,236
  • Tableau non formaté: voit tableur
Comparaison par tri sur E et différences successives en %[modifier | modifier le wikicode]
B A E E% B%
ccc 1,167 1,955 30 9 40
ctc 1,638 2,446 32 54 1056
cgc 142 2,137 50 74 2664
atc 3,916 2,423 86 10 108
gtc 1,885 2,423 95 4 2
tcc 1,923 2,172 98 36 0
acc 1,920 2,160 134 81 243
tga 560 206 242 45 217
gcc 1,773 2,103 352 29 24
cgg 1,427 1,589 453 41 54
ccg 929 1,726 639 2 20
tcg 1,116 1,737 651 11 5
acg 1,174 1,932 724 2 4918
ata 23 23 739 2 8882
cta 2,102 2,115 758 2 4
tta 2,021 2,183 773 17 12
tca 2,255 2,103 904 5 67
gta 3,769 2,126 945 15 122
ttg 1,702 1,863 1,085 3 16
agg 1,469 1,886 1,116 1 50
ctg 2,207 1,829 1,126 15 13
aca 2,501 2,263 1,298 5 1493
ctt 157 11 1,369 1 1927
cgt 3,182 23 1,379 3 74680
cct 4 0 1,423 0 54430
cca 2,320 2,103 1,426 7 14
aga 2,044 2,126 1,531 5 101
cag 1,016 1,886 1,606 1 47680
tct 2 0 1,618 1 94200
cac 2,006 2,115 1,632 1 7
agc 1,881 2,137 1,646 2 38
ttc 2,598 2,457 1,679 3 40
tgg 1,858 2,103 1,722 6 48411
gtt 4 11 1,825 5 1044
act 44 0 1,912 1 6133
tac 2,732 2,172 1,925 3 1
caa 2,718 2,240 1,989 2 620
cga 377 2,115 2,030 4 17640
att 2 0 2,109 9 182000
aaa 3,874 2,252 2,293 4 104
tgc 1,903 3,418 2,393 2 102
gac 3,839 2,492 2,432 6 451050
gct 1 0 2,573 5 65550
gtg 559 1,943 2,713 5 606
ggc 3,946 2,777 2,849 7 6
aac 3,729 2,446 3,061 7 531
gag 591 1,829 3,261 3 1199
atg 7,670 6,732 3,355 23 1373
gcg 521 1,817 4,115 17 351
gga 2,347 2,160 4,811 9 127
aag 1,033 1,897 5,268 16 7
ggg 964 1,772 6,126 0 327
gaa 4,118 2,629 6,150 8 5
gca 4,334 2,926 6,636
  • Tableau non formaté: voir tableur
Diagramme de comparaison globale[modifier | modifier le wikicode]
Corrélations entre nombre de tRNAs des 3 domaines A B E[modifier | modifier le wikicode]
  • Lien Tableur: Corrélations entre nombre de tRNAs des 3 domaines A B E
  • Voir après le texte les tableaux des corrélations et leur légende. Les diagrammes des corrélations:   Ba42Ba62Eb33Eb52Ea33Ea53 .
  • Similitude des comportements des codons dans les 3 domaines
    1. Problématique: La similitude des comportements des codons dans 4 processus différents détermine leurs comportements physiques dans l'ADN.
      − Liens:   ordre des codonsmoyenne des codonsE/BTotaux1ère et 2ème valeurdiagramme global.
      − Si l'hypothèse de la résonance dans l'ADN était vraie on devrait dégager une similitude de comportement des codons indépendamment des processus qui agissent sur eux. J'ai démontré, dans l'étude des diagrammes étendus, que le comportement des codons n'était pas assujetti aux radicaux de leurs aas et que tout codon avait un comportement propre à lui. Avec l'étude du nombre des gènes des tRNAs dans les 3 domaines le comportement des codons n'est soumis qu'aux processus qui affectent l'ADN pour leurs duplications, sans considération des aas qu'ils codent. Ces processus sont différents dans les 3 domaines Bactéries Archées Eucaryotes comme nous l'avons vu en introduction [18]. Du point de vue théorique ces 4 processus peuvent être différenciés comme suite:
      1.− Les gènes de protéines sont soumis à la résonance de l'ADN entre le codon d'initiation et le codon stop, c'est ce que j'ai appelé la conformation du gène [19].
      2.− Les gènes des tRNAs des eucaryotes, grâce à la membrane nucléique qui protège les RNAs, peuvent incorporer un intron entre les bases 36 et 37 ce qui change leur résonance dans l'ADN, les rend plus sensibles aux processus de duplication et permet la synthèse des tRNAs de codons se terminant par t une fois l'intron excisé.
      3.− Les gènes des tRNAs des archées doivent être très robustes et nécessitant peu de transformations. Cette robustesse se traduirait par un gène tRNA par codon et pour tous les codons xyc,a, g. D'où l'uniformité constatée des tRNAs des archées (voir l'introduction aux tRNas, paragraphe archées [20] ) et seraient très peu sensibles au processus de duplication. Cette uniformité est due à l’architecture particulière de la membrane des archées.
      4.− Les gènes des tRNAs des bactéries n'ont pas la protection de la membrane nucléique pour utiliser les introns à grand échelle ni la membrane des archées qui leur permet de survivre aux contraintes physiques extrêmes. Ils sont alors plus sensibles à la duplication et peuvent utiliser toute la gamme de résonance permise sans les introns. Cette résonance sans les introns permet la synthèse de gènes de tRNAs de codons se terminant par t mais leurs comportements ( ctt cgt) sont totalement différents de ceux des eucaryotes comme on le verra.
    2. Méthode d'analyse
      1.− Les comportements des tRNAs des bactéries et des archées se ressemblent beaucoup. J'ai montré dans le tableau des ordres des codons qu'il n'y a que 4 carrés à changements nets dans les ordres des valeurs dont 2 carrés anormaux, 3 carrés à changements très faibles et huit sans changement du tout. C'est ce qui m'a poussé à faire les moyennes des codons par ligne. Il s'est avéré que, dans les 2 domaines, les codons se terminant par g sont nettement inférieurs aux c a qui se différencient très peu par leur moyenne. Ensuite j'ai estimé la variation (voir 1ère et 2ème valeur) entre les codons se terminant par c a. Bien que la différence entre a c chez les archées soit très faible ( différence et taux de variation) elle reste conséquente (moyenne des variations de 48% pour les bactéries et 18% pour les archées). Enfin le diagramme global des 3 domaines (sans les codons se terminant par t à très faibles valeurs, soit 44 codons restant) montre clairement qu'il y a une très bonne corrélation entre archées et bactéries.
      2.− Permutations chez les eucaryotes: Il est difficile de trouver une similitude de comportement des eucaryotes avec les bactéries et les archées. On ne peut pas trouver de corrélation entre les nombres des tRNAs tant les changements des codons se terminant par c en t sont brutaux, nombreux et quasiment symétriques, et que les codons de la 4ème ligne gxy sont excessivement dupliqués.
      Les changements quasiment symétriques des c en t suggèrent cependant qu'on puisse permuter leurs valeurs pour chercher une corrélation entre codons des eucaryotes et les 2 autres domaines. En effet dans le tableau des moyennes des codons, les codons t qui sont devenus majoritaires ont un taux de variance faible, par rapport à leur moyenne 25%, proche de celle des archées et égal à celui des codons c qui n'ont pas changés. Leurs moyennes ne diffèrent que de 25% (1713 contre 2123). Voir les lignes t2 et c2 du tableau. De même pour les valeurs mineurs respectivement de ces codons, les moyennes ne diffèrent que de 8% et leurs taux de variance conformes à leurs faibles effectifs mais tous les 2 très élevés. Voir les lignes t1 et c1 du tableau.
      3.− Retrait des changements élevés: En ce qui concerne les duplications excessives je les ai retirées de la corrélation. Elles sont au nombre de 12 entre eucaryotes et bactéries et de 10 seulement entre eucaryotes et archées car chez ces derniers la valeur excessive de cga chez les eucaryotes s'est uniformisée chez les archées et tgc n'est pas retiré selon un rapport E/A que je n'ai pas réalisé. Voir le tableau E/B pour les valeurs excessives. Le rapport E/B du codon cct (ou ccc pour les diagrammes) est de 16, celui de cag de 20 mais ces codons n'ont pas été retirés parce qu'ils influent très peu sur les coefficients de corrélation et de détermination comme on le constate sur les diagrammes Eb33 et Ea33 .
      4.− Diagrammes après permutations et retraits: En fin de compte il reste 62 codons à corréler entre bactéries et archées, 50 entre eucaryotes et bactéries et 52 entre eucaryotes et archées, ensembles tout à fait comparables.
      5.− Diagrammes après retrait des valeurs faibles: Pour pousser plus loin la comparaison j'ai réduit, dans un 2ème temps, les effectifs des codons à comparer en éliminant les faibles valeurs de nombres de tRNAs, car ces valeurs constituent un groupe très différent des valeurs élevées qui ont une grande signification statistique. En outre les 4 codons tga ata atg et tgc influent beaucoup sur les coefficients des 3 comparaisons (diagrammes Eb52 Ea53 Ba62 ) et ont donc été éliminés des groupes réduits. Le nombre de codons à corréler se réduit alors respectivement à 42, 31 et 32 pour les corrélations ci-dessus (voir respectivement les diagrammes Ba42 Eb33 Ea33 ). C'est moins que précédemment mais les comparaisons restent statistiquement valables.
    3. Résultats: Voici ci-dessous tableau1 un condensé des corrélations des 3 combinaisons EB EA BA.
      1.− Il y a bien corrélation forte pour 42 31 32 codons comparés respectivement des combinaisons BA EB EA, aux quels il faut ajouter gxa (3), gxb(4) et aag qui évoluent dans le même sens entre B A et E avec les exagérations qui les ont exclus. Il faut ajouter atg tga qui évoluent sans basculement dans leur carrés pour les 3 combinaisons. Ce qui fait finalement, en excluant les permutations, 43 28 28 codons qui évoluent dans le même se