Recherche:Corrélation entre les codons dans les gènes de protéines/Annexe/Tableaux

Une page de Wikiversité.
Sauter à la navigation Sauter à la recherche
Tableaux
Image logo représentative de la faculté
Annexe 1
Recherche : Corrélation entre les codons dans les gènes de protéines
Précédent :Sommaire
Suivant :Diagrammes
Icon falscher Titel.svg
En raison de limitations techniques, la typographie souhaitable du titre, « Annexe : Tableaux
Corrélation entre les codons dans les gènes de protéines/Annexe/Tableaux
 », n'a pu être restituée correctement ci-dessus.



Paris le 8.12.16

Sommaire

Diagrammes codons-GC-DRNA[modifier | modifier le wikicode]

Compilation DRNA[modifier | modifier le wikicode]

codons DRNA[modifier | modifier le wikicode]

  • Lien tableur: codons DRNA
  • Résultats directs de la compilation des 111 bactéries. A copier dans un tableur avec une largeur de colonne de 1.3 cm.

Total codons DRNA[modifier | modifier le wikicode]

  • Lien Tableur: Total codons DRNA
  • Sommation des résultats directs du chapitre précédent. A copier dans un tableur avec une largeur de colonne de 1.3 cm.

acides aminés DRNA[modifier | modifier le wikicode]

  • Lien Tableur: acides aminés DRNA
  • Résultats directs de la compilation. A copier dans un tableur avec une largeur de colonne de 1.3 cm.

Total acides aminés DRNA[modifier | modifier le wikicode]

  • Lien Tableur: Total acides aminés DRNA
  • Sommation des résultats directs du chapitre précédent. A copier dans un tableur avec une largeur de colonne de 1.3 cm.

Contenu en GC des génomes DRNA[modifier | modifier le wikicode]

  • Lien Tableur: Contenu en GC des génomes DRNA
  • Le contenu en GC (%GC) de 80 bactéries sont tirés des tableaux numériques de l'article "répétition des bases dans l'ADN des procaryotes". Pour la cyanobactérie synd voir dans cyanobactérie de la même annexe.
  • synd
  • aae, aba, ade, age, amd, amo, apt, bae, bla, bmf, bmv, bsu, cad, cbd, cbl, cff, cgq, chp, cje, cmi, cmn, crp, cta, dba, ddr, dpt, dvl, eal, eco, eno, fnc, gau, gva, kpn, ksk, lat, liv, ljf, lla, lpl, mcac, mts, opr, pac, pae, pgd, pgi, ple, ppoy, ret, rip, roa, rpr, rru, saci, salb, say, sbn, sbz, sep, sgr, sho, sma, smk, spi, spl, sty, sus, tai, tde, tma, tme, tos, tpas, tsu, uur, vin, xcb, ype, zin.
  • J'ai soumis le programme repete.pl pour les 30 autres bactéries dont les résultats sont ci-dessous:

Contenu en GC des 111 génomes DRNA[modifier | modifier le wikicode]

Tableau des diagrammes des codons DRNA[modifier | modifier le wikicode]

  1. récupération des contenus en GC (%GC) des résultats du chapitre précédent.
  2. Création de la colonne %AT (100-%GC)
  3. Somme de tous les codons (codons stops compris) d'une bactérie donnée, colonne aas. La colonne Trp isole les tga donnant du Trp, des tga donnant des stops.
  4. Moyenne des aas par bactérie: 6 550 aas par bactérie, avec un écart type de 304.
  5. Recalcul du codon: 6550*codon/aas.
  • Le tableau est suivi de la moyenne des codons.

Maximum et 75% DRNA[modifier | modifier le wikicode]

  • Le nombre de codons est calculé d'après les équations des courbes de tendance pour caractériser chaque codon par un maximum de la courbe et, s'il n'existe pas (équation du second degré sans solution), par la valeur à 75% GC ou AT.

constantes des courbes DRNA[modifier | modifier le wikicode]

  • Lien Tableur: constantes des courbes DRNA
  • Ces constantes sont relevées à la main parce que le format de l'équation dans Libreoffice/calc est une image. Ces équations sont représentées dans les diagrammes.

abscisse du maximum DRNA[modifier | modifier le wikicode]

  • Lien Tableur: abscisse du maximum DRNA
  • C'est la solution qui annule la dérivée de l'équation de degré 3. C'est une équation du second degré qui quelque fois n'a pas de solution. Mais quand il y en a 1 ou 2 solutions, une seule est valable et doit être supérieure à 50 et inférieur à 100 %GC ou %AT. J'ai éliminé les abscisses supérieures à 90% pour tenir compte des valeurs extrêmes trouvées chez les bactéries étudiées.
  • La fonction dans calc est: "=(-2*P345-RACINE(((2*P345)^2)-12*O345*Q345))/(6*O345)" où P345 désigne la cellule de la 2ème constante, O345 la 1ère et Q345 la 3ème.

maximum DRNA[modifier | modifier le wikicode]

  • Lien Tableur: maximum DRNA
  • Il est calculé avec l'équation du diagramme: "=P387*(O345*P387^2+P345*P387+Q345)" voir abscisse ci-dessus et P387 étant la cellule de l'abscisse (%AT ou %GC)

Caractérisation des codons par les courbes et les coefficients de corrélation[modifier | modifier le wikicode]

Les queues. A partir du tableau original normé des 111 bactéries[modifier | modifier le wikicode]

  1. queue: nombre de bactéries ayant des effectifs faibles de leur codon (en rouge)
  2. moyenne queue: total des effectifs faibles divisé par le nombre de la queue
  3. moyenne codon: total du codon divisé par 111.
  4. %queue: total effectifs faibles de la queue divisé par (moyenne codon x 111) en %.
111 bactéries: Caractérisation des codons . Les queues à partir du tableau original.
aas KEGG %AT %GC tta ttg* ctt cta ctg ctc aaa aag ttt ttc tct tca agt tcg tcc agc
5710 zin 86,5 13,5 564 9 8 10 0 0 1241 22 452 9 146 99 57 1 2 3
5760 crp 83,4 16,6 532 55 38 40 2 1 935 44 575 24 164 131 84 14 3 13
5864 hcr 77,5 22,5 417 32 156 22 0 4 729 54 296 26 135 165 41 7 13 10
6157 mcac 76,3 23,7 502 40 38 51 0 0 579 43 261 16 101 151 114 1 0 12
6041 ssdc 75,8 24,2 503 40 65 16 1 3 539 66 279 13 182 113 54 13 12 12
6132 sbw 74,9 25,1 414 34 76 34 9 9 634 27 300 18 171 94 63 12 12 28
5709 uur 74,5 25,5 442 55 40 55 1 2 535 65 255 23 55 181 102 14 6 10
6361 ple 73,8 26,2 414 107 45 53 9 5 577 81 267 10 105 136 94 13 10 18
6600 smf 73,7 26,3 376 23 133 38 6 0 532 112 212 41 117 142 75 7 2 16
6345 fnc 72,9 27,1 364 74 121 51 3 3 514 119 189 43 129 137 58 5 4 15
6697 bfl 72,6 27,4 424 124 49 26 11 7 414 74 246 10 175 99 78 18 19 12
6334 cbl 71,7 28,3 337 38 114 65 3 2 462 118 198 54 127 103 87 3 17 17
6762 rip 71,5 28,5 247 112 81 65 33 32 504 127 236 90 220 109 51 36 49 15
6715 rpr 71,0 29,0 306 47 141 67 26 24 421 112 250 46 120 114 88 21 18 45
6569 pub 70,3 29,7 316 59 126 72 18 4 571 103 266 43 128 151 81 14 13 27
6265 cad 70,1 29,9 251 32 121 120 15 4 420 142 181 64 105 117 97 18 5 27
6706 cje 69,5 30,5 273 91 228 25 4 12 569 85 269 22 91 54 128 13 8 67
6431 pmh 68,9 31,1 275 99 159 78 15 25 417 110 190 46 160 137 89 20 24 34
__ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __
6490 din 43,9 56,1 3 23 69 4 387 123 115 258 108 142 22 24 44 30 141 87
5844 say 43,2 56,8 112 228 44 18 154 108 139 90 122 75 17 9 39 112 54 50
6773 bmf 42,8 57,2 2 49 120 7 262 123 51 309 52 182 20 15 8 136 88 47
6638 kpn 42,5 57,5 7 20 38 4 486 74 241 138 61 153 58 4 9 46 112 76
6820 aba 41,6 58,4 6 85 48 11 173 272 88 334 27 210 15 14 12 109 67 85
6546 dba 41,4 58,6 5 63 92 6 322 135 90 301 73 189 20 18 10 59 139 91
6472 synd 40,9 59,1 0 69 55 3 386 180 74 230 17 154 11 21 38 60 117 120
6745 pgd 40,4 59,6 1 35 46 10 380 84 129 218 84 152 18 14 8 101 85 45
6549 pac 40,0 60,0 5 93 82 20 227 154 47 250 41 171 40 18 15 108 112 39
6780 bla 39,5 60,5 1 61 31 3 248 221 34 272 8 217 5 16 12 119 114 62
6795 ret 38,7 61,3 0 29 63 5 290 196 42 319 30 198 12 7 3 156 96 44
6566 sus 38,1 61,9 3 79 34 7 334 145 59 337 34 203 7 4 12 115 60 89
6672 saci 37,7 62,3 2 85 45 4 190 329 62 295 16 195 5 5 11 127 50 118
6805 smk 37,3 62,7 1 22 74 4 221 228 33 313 20 221 9 6 4 169 91 41
6720 dvl 37,0 63,0 1 14 64 3 256 294 20 329 8 221 12 10 6 129 90 65
6859 ddr 36,6 63,4 3 14 20 3 473 89 44 252 34 187 9 16 22 49 71 159
6582 tai 36,2 63,8 7 46 82 18 347 164 9 300 23 202 11 4 9 54 209 96
7021 gau 35,7 64,3 1 86 16 5 284 239 11 291 35 201 13 16 21 142 59 49
6764 xcb 35,0 65,0 1 51 7 1 511 72 17 284 16 194 6 0 11 122 69 98
6688 rru 34,6 65,4 3 66 64 3 381 84 29 292 21 209 2 1 3 132 65 76
6845 dpt 33,8 66,2 0 21 7 8 519 69 70 216 52 159 8 5 12 84 76 146
6664 pae 33,4 66,6 0 23 4 6 501 118 29 330 1 222 1 4 3 86 98 100
6576 roa 32,6 67,4 0 27 8 0 331 237 5 289 0 204 5 1 8 150 104 60
7207 bmv 31,9 68,1 1 35 19 3 293 257 19 316 15 205 1 4 3 193 22 46
6617 tos 31,4 68,6 10 32 69 26 286 331 18 323 49 189 1 1 0 22 126 70
7209 vin 31,1 68,9 0 4 12 5 197 395 5 343 5 231 9 2 1 134 104 63
6713 age 30,6 69,4 0 11 2 0 337 298 3 448 1 225 7 0 6 92 107 94
6646 opr 30,0 70,0 0 27 21 1 342 288 18 302 10 223 1 1 1 85 39 100
6487 mts 29,7 70,3 0 10 11 2 271 326 15 285 0 232 3 3 3 173 65 76
6581 sma 29,3 70,7 0 5 11 0 374 208 1 310 1 230 3 2 1 121 142 43
6465 amd 28,7 71,3 0 11 7 1 399 190 3 252 1 215 3 3 2 157 87 41
6559 sho 28,0 72,0 0 5 11 0 385 187 0 295 4 223 0 1 0 98 152 45
6561 sgr 27,8 72,2 0 2 7 0 368 210 1 301 2 227 2 1 2 114 146 34
6452 cmi 27,3 72,7 0 5 1 1 240 387 0 248 0 215 0 0 0 117 113 108
6571 salb 26,7 73,3 0 2 4 0 354 240 0 287 1 227 1 0 1 116 144 39
6532 ksk 25,8 74,2 0 6 3 0 401 201 0 260 1 217 1 0 0 134 137 44
6733 ade 25,1 74,9 0 2 3 0 296 305 4 362 0 220 0 0 0 129 85 54
moyenne queue 1,7 3,7 3,6 3,0 3,8 3,1 1,1 - 2,1 - 2,8 1,5 1,9 5,6 4,8 -
moyenne codon 120 81 97 30 180 104 247 202 123 125 69 50 38 58 66 55
codon tta ttg ctt cta ctg ctc aaa aag ttt ttc tct tca agt tcg tcc agc
queue 35 6 5 20 12 12 8 0 12 0 19 19 16 4 4 1
%queue 0,4 0,2 0,2 1,8 0,2 0,3 0,0 - 0,2 - 0,7 0,5 0,7 0,3 0,3 -
  • Les queues au complet à copier dans un tableur avec une largeur de colonne de 1.3 cm. Voir le tableur.

Les queues. Les courbes à partir des équations de tendance[modifier | modifier le wikicode]

111 bactéries: Caractérisation des codons . Les courbes à partir des équations de tendance.
x3 0,00219 -0,00254 -0,00329 -0,00085 -0,00462 0,00016 0,0020 -0,00081 0,00057 -0,00075 -0,00091 -0,0003 -0,0005 -0,0002 -0,0013 -0,0010
x2 -0,10807 0,27112 0,37605 0,10907 0,5886 0,0552 -0,05462 0,09348 0,01185 0,11012 0,13691 0,06661 0,07383 0,0518 0,15161 0,09531
x 0,97089 -5,14699 -8,20089 -2,69606 -13,46935 -1,18671 0,91141 1,73297 -0,2492 -0,95591 -3,32039 -1,92933 -1,84844 -0,92575 -2,72647 -1,05602
aas KEGG %AT %GC tta ttg* ctt cta ctg ctc aaa aag ttt ttc tct tca agt tcg tcc agc
5710 zin 86,5 13,5 692 -60 -24 33 -86 -6 989 39 435 5 148 163 88 -4 -12 1
5760 crp 83,4 16,6 601 -17 23 41 -83 -4 881 51 393 11 147 152 87 -2 -9 4
5864 hcr 77,5 22,5 445 47 92 51 -58 3 691 77 317 26 141 129 81 3 1 14
6157 mcac 76,3 23,7 419 57 102 52 -50 5 659 83 304 29 140 125 80 4 3 16
6041 ssdc 75,8 24,2 406 62 106 52 -46 6 643 85 297 31 139 123 79 5 4 17
6132 sbw 74,9 25,1 387 68 113 53 -41 7 620 89 288 33 137 120 78 6 6 18
5709 uur 74,5 25,5 378 71 116 53 -37 8 608 92 283 35 136 118 78 7 8 19
6361 ple 73,8 26,2 364 76 120 53 -32 10 590 95 276 37 135 116 77 8 9 21
6600 smf 73,7 26,3 361 77 121 53 -31 10 587 96 274 37 135 115 77 8 10 21
6345 fnc 72,9 27,1 344 82 126 54 -25 12 566 100 265 40 133 113 75 9 12 23
6697 bfl 72,6 27,4 339 83 128 54 -22 12 559 101 263 41 132 112 75 9 12 23
6334 cbl 71,7 28,3 321 89 133 54 -14 14 536 106 253 44 130 108 74 11 15 25
6762 rip 71,5 28,5 318 89 133 54 -13 15 532 106 251 45 130 108 74 11 15 25
6715 rpr 71,0 29,0 308 92 136 54 -8 16 520 109 246 47 129 106 73 12 17 26
6569 pub 70,3 29,7 295 96 139 54 -2 18 503 113 239 49 127 103 72 13 19 28
6265 cad 70,1 29,9 291 97 140 54 0 18 497 114 237 50 126 102 71 13 19 28
6706 cje 69,5 30,5 280 99 142 54 6 20 483 117 231 52 125 100 70 14 21 30
6431 pmh 68,9 31,1 269 102 144 54 12 21 470 120 225 54 123 98 69 15 23 31
__ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __
6490 din 43,9 56,1 20 82 86 20 281 135 107 248 60 161 41 22 21 76 95 73
5844 say 43,2 56,8 17 79 82 19 287 140 102 251 57 163 39 20 20 78 96 73
6773 bmf 42,8 57,2 15 77 80 18 290 142 99 253 56 165 37 19 19 79 97 74
6638 kpn 42,5 57,5 14 76 78 17 293 145 97 255 55 166 36 18 19 80 97 74
6820 aba 41,6 58,4 11 72 73 15 300 151 90 259 51 170 33 16 17 83 99 74
6546 dba 41,4 58,6 10 71 71 15 303 153 89 260 50 171 32 16 17 84 99 74
6472 synd 40,9 59,1 9 69 69 14 306 156 86 262 49 173 31 15 16 85 100 74
6745 pgd 40,4 59,6 7 67 65 13 310 159 82 264 47 176 29 14 15 87 101 74
6549 pac 40,0 60,0 6 65 63 12 313 162 80 266 45 177 28 13 14 88 101 75
6780 bla 39,5 60,5 5 63 60 11 316 166 77 268 44 179 26 12 13 89 102 75
6795 ret 38,7 61,3 3 60 55 10 322 171 72 271 41 182 24 10 12 92 103 75
6566 sus 38,1 61,9 1 57 51 9 326 176 68 273 39 185 22 9 11 94 104 75
6672 saci 37,7 62,3 0 55 49 8 328 179 66 275 38 186 21 8 10 95 104 74
6805 smk 37,3 62,7 0 54 47 7 330 182 64 276 37 188 20 7 9 96 105 74
6720 dvl 37,0 63,0 -1 52 45 6 332 184 62 278 36 189 18 7 9 97 105 74
6859 ddr 36,6 63,4 -2 50 42 6 334 187 60 279 35 191 17 6 8 99 105 74
6582 tai 36,2 63,8 -3 49 40 5 337 190 58 281 34 192 16 5 8 100 106 74
7021 gau 35,7 64,3 -3 46 37 4 339 194 56 282 32 194 15 4 7 101 106 74
6764 xcb 35,0 65,0 -4 43 33 3 342 200 53 285 30 197 13 3 6 104 106 73
6688 rru 34,6 65,4 -5 41 30 2 344 204 50 287 29 199 11 2 5 105 107 73
6845 dpt 33,8 66,2 -6 38 26 1 347 209 47 289 27 202 9 1 4 108 107 72
6664 pae 33,4 66,6 -6 36 23 0 349 213 46 291 26 203 8 0 3 109 107 72
6576 roa 32,6 67,4 -7 32 18 -1 351 220 42 293 24 206 6 -1 2 112 107 71
7207 bmv 31,9 68,1 -8 29 14 -3 353 226 40 296 23 209 4 -2 1 114 107 70
6617 tos 31,4 68,6 -8 27 12 -3 354 230 38 297 22 210 3 -3 0 116 107 69
7209 vin 31,1 68,9 -8 26 9 -4 355 233 37 298 21 212 2 -3 0 117 107 69
6713 age 30,6 69,4 -9 23 7 -5 356 237 35 300 20 214 0 -4 -1 119 106 68
6646 opr 30,0 70,0 -9 21 3 -6 357 243 33 302 19 216 -1 -5 -2 121 106 67
6487 mts 29,7 70,3 -9 20 2 -6 357 245 32 302 18 216 -2 -5 -2 121 106 67
6581 sma 29,3 70,7 -9 18 0 -7 357 249 31 304 17 218 -3 -6 -3 123 106 66
6465 amd 28,7 71,3 -9 16 -3 -8 357 254 29 305 16 220 -4 -7 -3 125 105 65
6559 sho 28,0 72,0 -9 13 -7 -9 357 261 27 307 15 222 -6 -8 -4 127 104 63
6561 sgr 27,8 72,2 -9 12 -8 -9 357 263 27 308 14 223 -6 -8 -4 128 104 63
6452 cmi 27,3 72,7 -9 10 -10 -10 356 267 26 309 14 224 -7 -8 -5 130 104 62
6571 salb 26,7 73,3 -9 7 -14 -10 355 273 24 310 13 226 -8 -9 -6 132 103 60
6532 ksk 25,8 74,2 -9 4 -18 -12 354 281 22 312 11 229 -10 -10 -7 135 101 58
6733 ade 25,1 74,9 -9 1 -21 -12 352 288 21 314 10 231 -11 -11 -7 137 100 56

Les écarts. Moyenne des écarts, en %, par rapport à la courbe théorique. Les queues. Les moyennes des codons.[modifier | modifier le wikicode]

111 bactéries: Caractérisation des codons . Moyenne des écarts, moyenne des codons, queues,
aas KEGG %AT %GC tta ttg ctt cta ctg ctc aaa aag ttt ttc tct tca agt tcg tcc agc
5710 zin 86,5 13,5 18 115 133 69 100 100 25 44 4 71 2 40 35 132 119 322
5760 crp 83,4 16,6 11 414 66 2 103 130 6 12 46 118 11 14 3 774 136 188
5864 hcr 77,5 22,5 6 32 70 56 100 44 6 31 7 0 4 28 49 112 1920 27
6157 mcac 76,3 23,7 20 29 62 1 100 100 12 48 14 45 28 21 42 76 100 26
6041 ssdc 75,8 24,2 24 35 39 69 102 45 16 23 6 58 31 8 32 152 166 29
6132 sbw 74,9 25,1 7 50 33 35 121 14 2 70 4 46 25 22 20 89 82 50
5709 uur 74,5 25,5 17 23 65 4 103 72 12 29 10 34 60 53 31 103 24 46
6361 ple 73,8 26,2 14 42 62 2 129 47 2 14 3 72 22 17 22 74 12 15
6600 smf 73,7 26,3 4 70 10 29 119 100 9 17 22 9 13 23 2 12 79 24
6345 fnc 72,9 27,1 6 9 4 6 113 73 9 19 29 8 3 22 23 43 65 31
6697 bfl 72,6 27,4 25 49 62 51 148 44 26 26 6 76 32 11 4 87 51 49
6334 cbl 71,7 28,3 5 57 14 20 122 86 14 12 22 22 2 4 18 71 12 34
6762 rip 71,5 28,5 22 26 39 20 355 118 5 19 6 101 69 2 30 224 223 39
6715 rpr 71,0 29,0 1 49 4 24 417 53 19 3 1 2 7 8 21 81 5 70
6569 pub 70,3 29,7 7 38 10 32 971 77 14 9 11 13 0 46 13 8 31 3
6265 cad 70,1 29,9 14 66 13 122 5112 77 16 25 24 28 17 14 36 33 73 4
6706 cje 69,5 30,5 2 9 60 53 36 41 18 27 16 57 27 46 82 12 63 128
6431 pmh 68,9 31,1 2 3 10 45 29 19 11 8 15 16 30 40 28 32 7 9
__ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __
6490 din 43,9 56,1 85 72 20 80 38 9 7 4 80 11 46 12 108 60 49 19
5844 say 43,2 56,8 561 188 47 4 46 23 36 64 113 54 57 55 95 44 44 31
6773 bmf 42,8 57,2 87 36 50 62 10 14 48 22 7 10 46 24 60 73 9 36
6638 kpn 42,5 57,5 52 74 51 77 66 49 149 46 12 8 60 79 53 42 16 3
6820 aba 41,6 58,4 48 18 34 32 42 80 2 29 48 24 54 12 32 31 32 15
6546 dba 41,4 58,6 51 11 29 60 7 11 2 16 45 10 38 14 40 29 40 23
6472 synd 40,9 59,1 100 1 20 78 26 16 14 12 65 11 64 44 144 30 17 62
6745 pgd 40,4 59,6 86 48 30 25 22 48 57 18 79 13 37 0 47 17 15 40
6549 pac 40,0 60,0 17 42 30 63 27 5 41 6 10 3 43 41 6 23 10 48
6780 bla 39,5 60,5 80 4 49 74 22 34 56 2 82 21 82 40 12 33 12 17
6795 ret 38,7 61,3 100 52 13 51 10 14 41 18 28 8 52 33 76 70 6 41
6566 sus 38,1 61,9 143 38 34 19 3 18 14 23 14 10 68 55 11 22 42 19
6672 saci 37,7 62,3 364 54 8 50 42 84 7 8 59 5 76 39 7 33 52 58
6805 smk 37,3 62,7 327 59 58 46 33 25 49 13 45 18 56 21 59 76 13 44
6720 dvl 37,0 63,0 187 74 44 55 23 60 67 19 78 17 37 47 34 32 15 12
6859 ddr 36,6 63,4 256 72 53 50 41 53 27 10 1 2 50 176 167 51 33 114
6582 tai 36,2 63,8 371 6 105 257 3 14 85 7 32 5 32 22 19 46 98 29
7021 gau 35,7 64,3 128 85 57 13 16 23 80 3 10 3 11 275 203 40 45 34
6764 xcb 35,0 65,0 122 19 79 66 49 64 67 0 46 2 54 100 88 18 35 34
6688 rru 34,6 65,4 157 60 113 47 11 59 42 2 29 5 82 54 40 26 39 5
6845 dpt 33,8 66,2 100 44 74 959 49 67 48 25 90 21 16 426 229 22 29 103
6664 pae 33,4 66,6 100 37 83 18171 44 45 38 14 96 9 88 1451 7 22 8 40
6576 roa 32,6 67,4 100 17 57 100 6 8 88 2 100 1 14 193 307 35 3 16
7207 bmv 31,9 68,1 111 19 37 201 17 14 52 7 35 2 76 260 226 69 80 34
6617 tos 31,4 68,6 220 16 494 867 19 44 53 9 124 10 63 134 100 81 18 1
7209 vin 31,1 68,9 100 86 25 214 44 70 88 15 78 9 440 153 437 15 3 9
6713 age 30,6 69,4 100 54 71 100 5 25 92 49 95 6 1619 100 708 23 1 37
6646 opr 30,0 70,0 100 27 499 117 4 19 47 0 47 3 196 120 157 30 63 48
6487 mts 29,7 70,3 100 49 437 133 24 33 53 6 100 7 285 157 247 42 39 13
6581 sma 29,3 70,7 100 72 3805 100 5 16 97 2 94 6 211 134 138 1 35 35
6465 amd 28,7 71,3 100 28 311 113 12 25 90 17 94 2 176 146 161 26 17 38
6559 sho 28,0 72,0 100 60 252 100 8 28 100 4 73 0 100 113 100 23 45 29
6561 sgr 27,8 72,2 100 83 185 100 3 20 96 2 86 2 133 113 145 11 40 46
6452 cmi 27,3 72,7 100 49 110 111 33 45 100 20 100 4 100 100 100 10 9 73
6571 salb 26,7 73,3 100 73 129 100 0 12 100 7 92 0 112 100 118 12 40 36
6532 ksk 25,8 74,2 100 48 117 100 13 29 100 17 91 5 110 100 100 0 36 24
6733 ade 25,1 74,9 100 36 114 100 16 6 81 15 100 5 100 100 100 6 15 3
Total sans queue 3601 4547 4752 4168 3618 4358 3137 2959 2870 2430 3384 3477 4121 4601 3941 4159
bactéries sans queue 76 106 101 91 95 99 103 111 99 111 92 92 95 107 107 111
écart (moyenne) 47 43 47 46 38 44 30 27 29 22 37 38 43 43 37 37
queue 35 5 10 20 16 12 8 0 12 0 19 19 16 4 4 0
Moyenne du codon 120 81 97 30 180 104 247 202 123 125 69 50 38 58 66 55
codon tta ttg ctt cta ctg ctc aaa aag ttt ttc tct tca agt tcg tcc agc

Les coefficients de corrélation[modifier | modifier le wikicode]

  • Lien Tableur: Les coefficients de corrélation
  • Les valeurs présentées ici sont les coefficients de corrélation X 100. La corrélation entre 2 codons est celle de 2 colonnes du tableau des diagrammes normalisé. Pour obtenir les valeurs absolues il suffit de copier ce tableau (largeur de colonne 1.3 cm) et de remplacer le moins (-) par rien. Pour extraire le maximum d'une colonne il suffit de remplacer 100 par rien (format sans décimales et option de recherche 'cellule entière').
  • Légende:
  1. moyenne : moyenne des corrélations en valeurs absolues d'un codon.
  2. >74 : nombre de corrélations en valeurs absolues d'un codon supérieures à 0.74.
  3. >79 : nombre de corrélations en valeurs absolues d'un codon supérieures à 0.79.
  4. max : corrélation maximum parmi les valeurs absolues des corrélations d'un codon.

Tableau synthétique des diagrammes[modifier | modifier le wikicode]

Tableau des abscisses et maxima des courbes de tendance.[modifier | modifier le wikicode]
- (*): ttg et agg, sont reportés en %AT et tga en %GC.
- (75) abscisse sans maximum, valeur de max à 75.
- (75) abscisse supérieure à 75 pour le maximum, valeur de max à 75.
Tableau des abscisses et maxima des courbes de tendance
abscis max abscis max abscis max abscis max
ttt 75 288 tct 75 137 tat 75 261 tgt 75 51
ttc 75 231 tcc 67 107 tac 75 172 tgc 64 48
tta 75 389 tca 75 120 taa 75 5 tga* 75 3
ttg* 60 119 tcg 75 138 tag 75 1 tgg 75 89
ctt 63 153 cct 68 104 cat 73 91 cgt 56 134
ctc 75 289 ccc 75 140 cac 75 131 cgc 75 359
cta 71 54 cca 74 106 caa 75 174 cga 61 28
ctg 71 357 ccg 75 213 cag 68 213 cgg 75 131
att 75 369 act 75 137 aat 75 399 agt 75 78
atc 73 296 acc 75 238 aac 66 171 agc 61 75
ata 75 259 aca 75 129 aaa 75 622 aga 75 150
atg 51 168 acg 69 110 aag 75 314 agg* 59 36
gtt 68 211 gct 66 170 gat 70 329 ggt 63 183
gtc 75 328 gcc 75 405 gac 75 447 ggc 75 419
gta 70 143 gca 67 141 gaa 67 420 gga 75 157
gtg 70 236 gcg 75 287 gag 75 513 ggg 64 70
Caractérisation par les diagrammes et les coefficients de corrélation[modifier | modifier le wikicode]
  1. Le paramètre R2 est le coefficient de détermination des courbes de tendance. Pour comparaison avec le paramètre écart.
  2. Le paramètre queue a été déterminé à partir des courbes calculées à partir des coefficients du polynôme de degré 3 du diagramme de chaque codon. Voir le tableau de ces calculs. Il est exprimé ici en nombre de bactéries dont les effectifs des codons sont nulles ou très faibles au début des abscisses, voir le tableau de la 1ère détermination de ces queues avec des effectifs qui ne dépassent pas 3% du total. Sur 32 queues de longueur supérieure à 4, 5 seulement ont des effectifs qui dépassent 1% du total.
  3. Le paramètre écart est l'équivalent du R2 mais calculé pour les effectifs sans la queue du codon. C'est la moyenne des différences, en valeur absolue et en % par rapport à la valeur théorique, entre cette valeur théorique et l'effectif compté du codon. Quand une différence est très élevée à cause d'un effectif théorique très faible, elle est ignorée et la queue rallongée. Voir le tableau de ces calculs.
  4. Le paramètre abscis est l'abscisse du maximum de la courbe de tendance. Il est exprimé en %GC ou %AT. Voir le tableau de ces calculs. Pour les courbes sans maximum l'abscisse 75% (AT ou GC) est utilisée pour comparaison. Quand l'abscisse du maximum dépasse 75% elle est seulement indiquée sous la forme 75/xx où xx est l'abscisse en question.
  5. Le paramètre moyen, pour moyenne, est la moyenne du codon sur les 111 bactéries. C'est la somme des effectifs d'un codon divisé par 111.
  6. La colonne %: c'est le pourcentage d'un codon dans la constitution de son acide aminé.
  7. Le paramètre max est l'ordonnée de l'abscisse abscis. C'est le maximum de la courbe ou la valeur pour l'abscisse 75% quand ce maximum n'existe pas ou si son abscisse est supérieure à 75%.
  8. La colonne %moy c'est le rapport max/moyen dans le but de normaliser les courbes.
  9. La colonne cor>79 correspond au nombre de corrélations supérieures à 0.79 pour un codon donné avec les autres codons (l'identité exclue).
  10. La colonne cor tot correspond à la moyenne des corrélations d'un codon avec les autres codons. Cette moyenne est reportée en fin du tableau des corrélations.
111 bactéries. Caractérisation des codons par leurs diagrammes et leurs coefficients de corrélation.
codon R2 écart queue Moyen. % abscis max %moy. Cor>79 cor tot
act 891 38 14 68 21 75/82 137 200 10 64,1
acc 932 30 8 121 37 75 238 196 17 66,0
aca 884 38 18 65 20 75/78 129 198 6 63,0
acg 832 38 4 71 22 69 110 155 0 48,4
325
gct 911 30 9 108 22 66 170 156 4 56,8
gcc 931 28 9 164 33 75 405 247 17 66,9
gca 929 30 6 91 19 67 141 155 6 59,2
gcg 882 35 5 126 26 75 287 228 3 59,5
490
gtt 944 28 8 132 28 68 211 160 11 62,7
gtc 916 32 4 118 25 75 328 278 7 62,9
gta 888 45 13 84 18 70 143 171 0 58,4
gtg 907 39 5 137 29 70 236 172 0 60,1
471
ggt 900 30 0 142 31 63 183 129 0 39,6
ggc 956 42 0 169 37 75 419 248 28 68,6
gga 847 42 9 88 19 75/78 157 178 2 56,0
ggg 710 42 0 54 12 64 70 131 0 26,8
453
tta 925 47 35 120 20 75 389 324 13 61,2
ttg* 765 43 5 81 13 60 119 147 0 26,6
ctt 805 47 10 97 16 63 153 158 0 39,2
ctc 839 44 12 104 17 75 289 278 4 60,0
cta 756 46 20 30 5 71 54 183 0 51,5
ctg 878 38 16 180 30 71 357 198 6 61,9
611
agt 876 43 16 38 11 75/86 78 205 7 62,3
agc 857 37 0 55 16 61 75 136 0 42,6
tct 876 37 19 69 20 75 137 200 7 62,5
tcc 868 37 4 66 20 67 107 162 0 54,8
tca 893 38 19 50 15 75 120 240 12 63,5
tcg 853 43 4 58 17 75 138 236 3 58,2
336
aga 715 64 31 60 16 75 150 251 1 53,2
agg* 308 92 10 24 6 59 36 148 0 13,5
cgt 736 51 0 103 27 56 134 131 0 18,2
cgc 938 28 19 132 34 75 359 272 17 66,6
cga 571 66 0 20 5 61 28 136 0 22,4
cgg 699 56 20 44 12 75 131 297 0 48,5
383
111 bactéries. Caractérisation des codons par leurs diagrammes et leurs coefficients de corrélation.
codon R2 écart queue Moyen. % abscis max %moy. Cor>79 cor tot
atg 985 10 0 154 51 168 109 0 19,5
tgg 970 10 7* 71 75 89 125 0 43,2
tat 967 22 11 116 52 75 261 226 20 66,2
tac 927 25 0 107 48 75/83 172 161 8 60,1
222
cat 914 30 10 59 46 73 91 155 6 60,0
cac 962 20 0 70 54 75 131 189 19 66,2
128
caa 880 36 14 89 40 75/80 174 196 12 63,3
cag 964 26 0 132 60 68 213 161 21 66,3
220
aat 966 35 15 133 51 75 399 300 10 58,9
aac 951 21 0 128 49 66 171 133 8 57,6
261
aaa 957 30 8 247 55 75 622 252 11 62,7
aag 918 27 0 202 45 75/85 314 155 1 56,8
450
gat 965 23 0 217 52 70 329 152 21 65,8
gac 970 20 0 202 48 75 447 222 27 69,4
419
gaa 951 27 0 296 57 67 420 142 4 58,2
gag 924 30 0 226 43 75 513 227 6 61,7
521
ttt 947 29 12 123 50 75 288 235 15 63,7
ttc 963 22 0 125 50 75 231 185 25 67,8
248
tgt 850 37 19 27 46 75 51 193 5 57,8
tgc 874 37 5 31 54 64 48 154 0 53,3
58
att 913 30 9 168 39 75 369 219 13 63,2
atc 938 26 2 181 42 73 296 163 11 63,8
ata 691 80 31 84 19 75 259 310 0 44,3
433
tga* 727 104 2 75 3 180 1 44,8
taa 835 42 3 75/77 5 151 1 42,0
tag 488 129 1 75 1 95 0 9,3
cct 941 32 8 65 23 68 104 160 11 63,0
ccc 735 62 9 61 21 75 140 228 1 53,9
cca 851 39 19 58 20 74 106 182 3 60,2
ccg 885 40 8 101 35 75/82 213 210 7 61,3
286
Diagramme corcodon[modifier | modifier le wikicode]

Tableaux des parallèles. Diagramme / coefficient de corrélation[modifier | modifier le wikicode]

  • Voir l'article pour la définition des paramètres pour l'établissement des matrices du paramètre diag. Ces paramètres sont donnés avant la matrice pour être utilisés dans un tableur.
  1. écart: C'est la moyenne des différences, en valeur absolue et en % par rapport à la valeur théorique, entre cette valeur théorique et l'effectif compté du codon. Voir le tableau de ces calculs.
  2. q3: C'est la cotation du paramètre queue, nombre de bactéries, en continu, ayant des effectifs faibles ou nuls. Le tableau des cotations pour les paramètres q3 et a3 donne la correspondance entre le %AT ou le %GC et le rang de la dernière bactérie de la queue avant le décollage de la courbe. Voir le tableau de ces calculs.
  3. a3: Cotation du paramètre abscis, abscisse du maximum de la courbe de tendance. Il est exprimé en %GC ou %AT. Voir le tableau de ces calculs. Le tableau des cotations pour les paramètres q3 et a3 donne la correspondance entre a3 et abscis.
  4. moyen.: pour moyenne, est la moyenne des effectifs du codon sur les 111 bactéries. En tant que moyenne ce paramètre n'a pas de sens biologique, car que veut dire l'absence d'un codon pour une bactérie donnée? Par contre la somme des effectifs correspond en mathématique à l'intégrale d'une courbe continue.C'est une caractéristique mathématique du diagramme. Voir calculs.
cor>79: nombre de coefficients du codon supérieurs à 79; pour illustration. Voir le tableau des coefficients.
cor tot: corrélation moyenne, moyenne des valeurs absolues des coefficients (multipliés par 100) du codon; pour illustration. Voir calculs.
Matrice de calcul du paramètre diag %AT (diagramme)[modifier | modifier le wikicode]
diag = 200*(abs((e1-e2)/(e1+e2))+abs((q31-q32)/(q31+q32))+abs((a31-a32)/(a31+a32))+abs((moyen1-moyen2)/(moyen1+moyen2))).
La matrice de calcul de diag est une matrice symétrique dont la diagonale est nulle.
Matrice de calcul du paramètre diag %GC (diagramme)[modifier | modifier le wikicode]
diag = 200*(abs((e1-e2)/(e1+e2))+abs((q31-q32)/(q31+q32))+abs((a31-a32)/(a31+a32))+abs((moyen1-moyen2)/(moyen1+moyen2))).
La matrice de calcul de diag est une matrice symétrique dont la diagonale est nulle.
Paramètres q3 a3[modifier | modifier le wikicode]
  • Lien Tableur: Paramètres q3 a3
  • Légende: voir caractérisation des codons et tableaux des parallèles.
  • Notes pour les diagrammes %AT: */86 abscisse optimale, 86 abscisse maximale, ttg* et agg* reportés en %AT au lieu de en %GC.
  • Notes pour les diagrammes %GC: */85 abscisse optimale non considérée pour les calculs, 75 abscisse maximale, tga* reporté en %GC au lieu de en %AT.
  • Tableaux non formatés du 13.3.17
111 bactéries: Caractérisation des codons . Diagrammes %AT. Cotation de queue, écart et abscisse.
codon queue rang q3 écart abscis a3 Moyen. Cor>79 Cor tot
aaa 29,3 8 11 30 86 5 247 11 62,7
aat 32,6 15 17 35 86 5 133 10 58,9
aca 34,6 18 20 38 78 11 65 6 63,0
act 31,9 14 17 38 82 8 68 10 64,1
aga 40,9 31 35 64 86 5 60 1 53,2
agg* 30,0 10 14 92 59 32 24 0 13,5
agt 33,4 16 20 43 */86 5 38 7 62,3
ata 40,9 31 35 80 86 5 84 0 44,3
att 29,7 9 11 30 86 5 168 13 63,2
caa 31,9 14 17 36 80 11 89 12 63,3
cat 30,0 10 14 30 73 17 59 6 60,0
cca 35,0 19 23 39 74 17 58 3 60,2
cct 29,3 8 11 32 68 23 65 11 63,0
cga 25,1 0 5 66 61 29 20 0 22,4
cgt 25,1 0 5 51 56 35 103 0 18,2
cta 35,7 20 23 46 71 20 30 0 51,5
ctt 30,0 10 14 47 63 26 97 0 39,2
gaa 25,1 0 5 27 67 23 296 4 58,2
gat 25,1 0 5 23 70 20 217 21 65,8
gca 28,0 6 8 30 67 23 91 6 59,2
gct 29,7 9 11 30 66 23 108 4 56,8
gga 29,7 9 11 42 78 11 88 2 56,0
ggt 25,1 0 5 30 63 26 142 0 39,6
gta 31,4 13 17 45 70 20 84 0 58,4
gtt 29,3 8 11 28 68 23 132 11 62,7
taa 25,1 0 5 42 77 14 3 1 42,0
tat 30,6 11 14 22 86 5 116 20 66,2
tca 35,0 19 23 38 86 5 50 12 63,5
tct 35,0 19 23 37 86 5 69 7 62,5
tgt 35,0 19 23 37 86 5 27 5 57,8
tta 42,8 35 38 47 86 5 120 13 61,2
ttg* 27,8 5 8 43 60 29 81 0 26,6
ttt 31,1 12 14 29 86 5 123 15 63,7
111 bactéries: Caractérisation des codons . Diagrammes %GC. Cotation de queue, écart et abscisse.
codon queue rang q3 écart abscis a3 Moyen. Cor>79 Cor tot
aac 13,5 0 5 21 66 14 128 8 57,6
aag 13,5 0 5 27 */85 5 202 1 56,8
acc 26,2 8 11 30 75 5 121 17 66,0
acg 23,7 4 8 38 69 11 71 0 48,4
agc 13,5 0 5 37 61 17 55 0 42,6
atc 16,6 2 5 26 73 5 181 11 63,8
atg 13,5 0 5 10 51 29 154 0 19,5
cac 13,5 0 5 20 75 5 70 19 66,2
cag 13,5 0 5 26 68 11 132 21 66,3
ccc 26,3 9 11 62 75 5 61 1 53,9
ccg 26,2 8 11 40 */82 5 101 7 61,3
cgc 31,4 19 23 28 75 5 132 17 66,6
cgg 32,1 20 23 56 75 5 44 0 48,5
ctc 28,3 12 14 44 75 5 104 4 60,0
ctg 29,9 16 20 38 71 8 180 6 61,9
gac 13,5 0 5 20 75 5 202 27 69,4
gag 13,5 0 5 30 75 5 226 6 61,7
gcc 26,3 9 11 28 75 5 164 17 66,9
gcg 24,2 5 8 35 75 5 126 3 59,5
ggc 13,5 0 5 42 75 5 169 28 68,6
ggg 13,5 0 5 42 64 14 54 0 26,8
gtc 23,7 4 8 32 75 5 118 7 62,9
gtg 24,2 5 8 39 70 8 137 0 60,1
tac 13,5 0 5 25 */83 5 107 8 60,1
tag 13,5 0 5 129 75 5 1 0 9,3
tcc 23,7 4 8 37 67 11 66 0 54,8
tcg 23,7 4 8 43 75 5 58 3 58,2
tga* 13,5 0 5 104 75 5 2 1 44,8
tgc 24,2 5 8 37 64 14 31 0 53,3
tgg 13,5 0 5 10 75 5 71 0 43,2
ttc 13,5 0 5 22 75 5 125 25 67,8
Tableaux des parallèles %AT[modifier | modifier le wikicode]
  • Lien Tableur: Tableaux des parallèles %AT
  • Ces 30 parallèles sont faits pour les couples dont le paramètre diag est inférieur à 100. Le paramètre cor est tiré du tableau des corrélations et les autres paramètres sont ceux du tableau synthétique.
  • Légende: voir caractérisation des codons et tableaux des parallèles.
  • diag/cor la 1ère ligne indique la valeur de diag la 2ème, la corrélation entre les 2 codons du parallèle.
  • Nota: ici l’abscisse du maximum peut aller jusqu'à 86% AT car les bactéries peuvent atteindre ce taux. Quand la courbe de tendance n'a pas de maximum c'est ce taux qui est indiqué. Si le maximum a exactement 86% alors c'est indiqué sous la forme */86.
  • Les 2 tableaux non formatés du 15.3.17
111 bactéries: Caractérisation des codons . Parallèle diagramme %AT / coefficient de corrélation. 2/2.
codon écart queue Moyen. abscis Cor>79 cor tot diag/cor
tca 38 19 50 86 12 63,5 64
tgt 37 19 27 86 5 57,8 62
gta 45 13 84 70 0 58,4 64
ctt 47 10 97 63 0 39,2 49
tgt 37 19 27 86 5 57,8 66
agt 43 16 38 86 7 62,3 72
cct 32 8 65 68 11 63,0 70
cat 30 10 59 73 6 60,0 74
ttg* 43 5 81 60 0 26,6 71
gca 30 6 91 67 6 59,2 36
gca 30 6 91 67 6 59,2 71
cct 32 8 65 68 11 63,0 79
cca 39 19 58 74 3 60,2 71
aca 38 18 65 78 6 63,0 75
gtt 28 8 132 68 11 62,7 76
gca 30 6 91 67 6 59,2 83
cca 39 19 58 74 3 60,2 78
cat 30 10 59 73 6 60,0 62
tat 22 11 116 86 20 66,2 78
aat 35 15 133 86 10 58,9 92
tct 37 19 69 86 7 62,5 79
act 38 14 68 82 10 64,1 79
att 30 9 168 86 13 63,2 79
aat 35 15 133 86 10 58,9 85
gtt 28 8 132 68 11 62,7 82
cct 32 8 65 68 11 63,0 81
gta 45 13 84 70 0 58,4 87
caa 36 14 89 80 12 63,3 65
ata 80 31 84 86 0 44,3 95
tta 47 35 120 86 13 61,2 62
111 bactéries: Caractérisation des codons . Parallèle diagramme %AT / coefficient de corrélation. 1/2.
codon écart queue Moyen. abscis Cor>79 cor tot diag/cor
gtt 28 8 132 68 11 62,7 27
gct 30 9 108 66 4 56,8 84
tat 22 11 116 86 20 66,2 33
ttt 29 12 123 86 15 63,7 91
tct 37 19 69 86 7 62,5 34
tca 38 19 50 86 12 63,5 70
att 30 9 168 86 13 63,2 38
aaa 30 8 247 86 11 62,7 83
ttt 29 12 123 86 15 63,7 45
aat 35 15 133 86 10 58,9 91
gct 30 9 108 66 4 56,8 49
gca 30 6 91 67 6 59,2 75
aca 38 18 65 78 6 63,0 53
caa 36 14 89 80 12 63,3 73
aca 38 18 65 78 6 63,0 54
act 38 14 68 82 10 64,1 69
tca 38 19 50 86 12 63,5 55
agt 43 16 38 86 7 62,3 75
gct 30 9 108 66 4 56,8 56
cct 32 8 65 68 11 63,0 85
aga 64 31 60 86 1 53,2 56
ata 80 31 84 86 0 44,3 76
gaa 27 0 296 67 4 58,2 58
gat 23 0 217 70 21 65,8 79
caa 36 14 89 80 12 63,3 59
gga 42 9 88 78 2 56,0 56
att 30 9 168 86 13 63,2 60
ttt 29 12 123 86 15 63,7 87
act 38 14 68 82 10 64,1 62
caa 36 14 89 80 12 63,3 80
Tableaux des parallèles %GC[modifier | modifier le wikicode]
  • Lien Tableur: Tableaux des parallèles %GC
  • Ces 30 parallèles sont faits pour les couples dont le paramètre diag est inférieur à 100. Le paramètre cor est tiré du tableau des corrélations et les autres paramètres sont ceux du tableau synthétique.
  • Légende: voir caractérisation des codons et tableaux des parallèles.
  • diag/cor la 1ère ligne indique la valeur de diag la 2ème, la corrélation entre les 2 codons du parallèle.
  • Nota: ici l’abscisse du maximum peut aller jusqu'à 75% GC car les bactéries peuvent atteindre ce taux. Quand la courbe de tendance n'a pas de maximum c'est ce taux qui est indiqué. Si le maximum a une abscisse supérieure à 75% alors cette abscisse est indiquée sous la forme */xx où xx est l'abscisse en question. Cela reste une caractéristique de la courbe même si biologiquement cette abscisse n'est pas atteinte.
  • Tableaux non formatés du 15.3.17
111 bactéries: Caractérisation des codons . Parallèle diagramme %GC / coefficient de corrélation. 2/2.
codon écart queue Moyen. abscis cor>79 cor tot diag/cor
gag 30 0 226 75 6 61,7 51
gac 20 0 202 75 27 69,4 81
ttc 22 0 125 75 25 67,8 54
atc 26 2 181 73 11 63,8 89
tac 25 0 107 75/83 8 60,1 54
atc 26 2 181 73 11 63,8 66
ggc 42 0 169 75 28 68,6 55
atc 26 2 181 73 11 63,8 84
ttc 22 0 125 75 25 67,8 56
gac 20 0 202 75 27 69,4 91
ggc 42 0 169 75 28 68,6 62
gag 30 0 226 75 6 61,7 73
ggc 42 0 169 75 28 68,6 63
aag 27 0 202 75/85 1 56,8 68
tga* 104 2 75 1 44,8 66
tag 129 1 75 0 9,3 11
gtg 39 5 137 70 0 60,1 66
gcg 35 5 126 75 3 59,5 69
tac 25 0 107 75/83 8 60,1 67
aag 27 0 202 75/85 1 56,8 77
tac 25 0 107 75/83 8 60,1 67
cac 20 0 70 75 19 66,2 92
ttc 22 0 125 75 25 67,8 67
cac 20 0 70 75 19 66,2 87
gcg 35 5 126 75 3 59,5 67
ccg 40 8 101 75/82 7 61,3 89
ttc 22 0 125 75 25 67,8 67
aag 27 0 202 75/85 1 56,8 80
gtc 32 4 118 75 7 62,9 71
ccg 40 8 101 75/82 7 61,3 75
111 bactéries: Caractérisation des codons . Parallèle diagramme %GC / coefficient de corrélation. 1/2.
codon écart queue Moyen. abscis cor>79 cor tot diag/cor
tcc 37 4 66 67 0 54,8 9
acg 38 4 71 69 0 48,4 40
aag 27 0 202 75/85 1 56,8 14
atc 26 2 181 73 11 63,8 66
gtc 32 4 118 75 7 62,9 17
gcg 35 5 126 75 3 59,5 71
gag 30 0 226 75 6 61,7 23
aag 27 0 202 75/85 1 56,8 76
gac 20 0 202 75 27 69,4 29
aag 27 0 202 75/85 1 56,8 73
ttc 22 0 125 75 25 67,8 30
tac 25 0 107 75/83 8 60,1 82
agc 37 0 55 61 0 42,6 34
ggg 42 0 54 64 0 26,8 26
ctc 44 12 104 75 4 60,0 35
ccg 40 8 101 75/82 7 61,3 58
gac 20 0 202 75 27 69,4 36
atc 26 2 181 73 11 63,8 80
gcc 28 9 164 75 17 66,9 36
acc 30 8 121 75 17 66,0 89
gag 30 0 226 75 6 61,7 37
atc 26 2 181 73 11 63,8 66
gtc 32 4 118 75 7 62,9 39
acc 30 8 121 75 17 66,0 78
ccg 40 8 101 75/82 7 61,3 47
acc 30 8 121 75 17 66,0 74
aac 21 0 128 66 8 57,6 50
cag 26 0 132 68 21 66,3 79
gcg 35 5 126 75 3 59,5 51
acc 30 8 121 75 17 66,0 67
Diagramme diagcor-gc[modifier | modifier le wikicode]
Diagramme diagcor-at[modifier | modifier le wikicode]

Caractérisation des aas par les courbes et les coefficients de corrélation[modifier | modifier le wikicode]

Tableau des diagrammes aas DRNA[modifier | modifier le wikicode]

Courbes à partir des équations de tendance[modifier | modifier le wikicode]

Moyenne des écarts par rapport à la courbe théorique[modifier | modifier le wikicode]

Taux de variation des acides aminés[modifier | modifier le wikicode]

  1. écart*: moyenne des écarts de l'aa calculée ci-dessus
  2. ax et cte: de l'équation de la courbe de tendance linéaire, "effectif de l'aa" = ax+cte. A calculer à partir du tableau des diagrammes des aas. Le signe de ax indique le sens de la variation de l'aa.
  3. Max et Min (avec ou sans zin et crp) sont en fin du tableau des diagrammes des aas.
  4. Les bactéries zin et crp sont extrêmes, ce qui fait que le Maximum et le minimum sans eux ne concernent que 109 bactéries et avec les écart* faibles, le rapport M/m (Maximum sur minimum) reflète mieux la courbe de tendance linéaire.
Tableau des taux de variation des aas
Sans zin ni crp −Avec zin et crp
ax cte écart* Max min M/m −Max min M/m
A 7.49 131 8.4 693 221 3.1 693 91 7.6
C -0.24 69 25.3 121 21 5.7 121 21 5.7
D 1.61 342 7.5 526 292 1.8 526 148 3.6
E 0.77 485 7.6 694 340 2.0 694 196 3.5
F -1.88 338 7.8 326 171 1.9 599 171 3.5
G 3.54 284 4.0 538 309 1.7 538 217 2.5
H 0.42 109 8.0 162 92 1.8 162 61 2.7
I -7.34 785 7.6 767 261 2.9 1074 261 4.1
K -8.17 840 11.0 783 229 3.4 1263 229 5.5
L 0.35 595 4.4 753 543 1.4 753 543 1.4
M 0.40 135 10.2 207 97 2.1 207 70 2.9
N -5.58 528 9.0 544 123 4.4 864 123 7.0
P 2.61 161 4.8 401 190 2.1 401 113 3.6
Q 0.47 198 12.0 302 148 2.0 302 97 3.1
R 4.79 154 7.3 546 221 2.5 546 128 4.3
S -1.72 418 8.5 496 220 2.3 496 220 2.3
T 1.14 271 7.5 391 231 1.7 391 174 2.2
V 3.09 323 4.8 588 255 2.3 588 134 4.4
W 0.48 51 8.6 117 54 2.2 117 50 2.3
Y -2.22 329 7.8 306 149 2.1 399 149 2.7
  • Tableau non formaté

Les coefficients de corrélation entre aas[modifier | modifier le wikicode]

  • Lien Tableur: Les coefficients de corrélation entre aas
  • Les valeurs présentées ici sont les coefficients de corrélation X 100. La corrélation entre 2 aas est celle de 2 colonnes du tableau des diagrammes des aas. Pour obtenir les valeurs absolues il suffit de copier ce tableau (largeur de colonne 1.3 cm) et de remplacer le moins (-) par rien. Pour extraire le maximum d'une colonne il suffit de remplacer 100 par rien (format sans décimales et option de recherche 'cellule entière').
  • Légende:
  1. moyenne : moyenne des corrélations en valeurs absolues d'un aa.
  2. >74 : nombre de corrélations en valeurs absolues d'un aa supérieures à 0.74.
  3. >79 : nombre de corrélations en valeurs absolues d'un aa supérieures à 0.79.
  4. max : corrélation maximum parmi les valeurs absolues des corrélations d'un aa.

Diagramme coraa[modifier | modifier le wikicode]

Synthèse des corrélations des codons et des aas[modifier | modifier le wikicode]

Tableau synthétique[modifier | modifier le wikicode]
  • Lien Tableur: Tableau synthétique
  • Tableau synthétique non formaté
  • Légende: corrélations en valeur absolue et multipliée par 100 entre 2 aas ou 2 codons.
  1. Corrélations entre aas (acides aminés): d'après la matrice des corrélations.
    1. moy : moyenne des corrélations d'un aa.
    2. >74−79 : nombre de corrélations d'un aa supérieures à 0.74 − dont corrélations supérieures à 0.79.
    3. max : corrélation maximum d'un aa.
  2. Corrélations entre codons
    1. t,c,a,g,t/c,a/g : terminaison des codons (t/c pour t ou c), pour lesquels on a la moyenne "moy" sous moyt (comme pour les aas) et le nombre ">74−79" sous >74−79t (comme pour les aas).
    2. moyt : total des moyennes "moy" des codons d'un aa.
    3. >74−79t : total des nombres ">74−79" des codons d'un aa.
    4. 0-70 : pour un codon, zéro corrélations supérieures à 0.74 − avec une corrélation maximale (en valeur absolue) de 0.70.
    5. stop : les codons stops. Les codons taa et tga ont une seule corrélation supérieure à 0.74 et c'est celle entre eux. Elle est négative (*). Sont indiqués aussi le maximum de tag et les maxima de taa et tga en dehors de leur corrélation de -0.802.
  3. Résumés :
    1. moyn : nombre des moyennes "moy" pour une gamme donnée en en-tête de la colonne.
    2. 74n : nombre des nombres ">74−79" pour une gamme donnée en en-tête de la colonne.
    3. 74t : total des corrélations supérieures à 0.74 seulement, des codons d'un aa.
    4. moyt : déjà défini dans codons
    5. %total: 20 aas et 61 codons (pour les aas).
  4. Résumé III: La corrélation entre aas traduit peu la corrélation qui existe entre codons. Ainsi
    1. Les aas à un codon, M W, sont peu corrélés avec les autres aas et peu corrélés avec les autres codons;
    2. Les aas, A F I P V Y, sont très corrélés avec les autres aas et leurs codons sont très corrélés avec les autres codons;
    3. Les aas, G K N R, sont très corrélés avec les autres aas et leurs codons sont peu corrélés avec les autres codons;
    4. Les aas, C D E H L Q S T, sont peu corrélés avec les autres aas et leurs codons sont très corrélés avec les autres codons.
111 bactéries: Caractérisation des aas . Coefficients de corrélation codons / aas.
A C D E F G H I K L M N P Q R S T V W Y
aas
moy 61 20 51 26 59 62 40 65 64 13 35 62 60 32 56 31 46 58 38 55
>74−79 7−7 0 1−0 0 7−5 9−9 0 9−9 9−9 0 0 9−9 9−8 0 8−7 0 0 7−6 0 7−7
max 38 74 56 66 35 54 54 57 67 68
codons
moyt 242 111 135 120 131 191 126 171 119 300 19 116 238 130 222 344 242 244 43 126
t 57 58 66 - 64 40 60 63 - 39 - 59 63 - 18 63 64 63 - 66
c 67 53 69 - 68 69 66 64 - 60 - 58 54 - 67 55 66 63 - 60
a 59 - - 58 - 56 - 44 63 51 - - 60 63 22 64 63 58 - -
g 59 - - 62 - 27 - - 57 62 19 - 61 66 49 58 48 60 43 -
t/a 61 53 62
c/g 27 13 43
>74−79t 62−30 8−5 65−48 25−10 56−40 40−30 44−25 50−24 28−12 47−23 0−0 27−18 51−22 50−33 33−18 75−29 76−33 65−18 0−0 48−28
t 7 −4 8−5 28−21 - 22−15 0-70 14 −6 23−13 - 0-69 - 13−10 21−11 - 0-70 16 −7 25 −10 19−11 - 31−20
c 33−17 0-72 37−27 - 34−25 33−28 30−19 26−11 - 9 −4 - 14 −8 1 −1 - 29−17 4 −76 30−17 24 −7 - 17 −8
a 13 −6 - - 8 −4 - 6 −2 - 1 −76 20−11 0-69 - - 12 −3 21−12 0-46 27−12 21 −6 10 −78 - -
g 9 −3 - - 17−6 - 1-75 - - 8 −1 20 −6 0-55 - 17 −7 29−21 1 −75 8 −3 0-73 12 −77 0-72 -
t/a 18−13 2 −1 20 −7
c/g 0-52 0-43 0-65
Stop max suivant max
taa 80* 60 tag 48
tga 80* 62 * taa/tga= -80.2
I Résumés
codons >27 26-12 10-6 4-0 codons >58 57-51 <49 aas 7-9 1 0 aas >58 57-51 <49
74n 11 23 9 18 moyn 40 8 13 74n 10 1 9 moyn 8 3 9
II +faibles 74n %total moyn %total +forts 74n %total moyn %total
gamme <3 <33 >12/7 >54
codons 17 28 % 6 10 % 34 56 % 45 74 %
aas 10 50 % 5 25 % 10 50 % 10 50 %
III A C D E F G H I K L M N P Q R S T V W Y
aas
>74 7 1 7 9 9 9 9 9 8 7 7
moy 61 20 51 26 59 62 40 65 64 13 35 62 60 32 56 31 46 58 38 55
codons
74t 62 8 65 25 56 40 44 50 28 47 0 27 51 50 33 75 76 65 0 48
moyt 242 111 135 120 131 191 126 171 119 300 19 116 238 130 222 344 242 244 43 126
Repartition des fréquences de corrélation des aas et des codons[modifier | modifier le wikicode]
  • Lien Tableur: Repartition des fréquences de corrélation des aas et des codons
  • Les effectifs ou fréquence (fr) sont comptés à partir des matrices des coefficients de corrélation des aas et des codons. La matrice est formatée sans décimales et copiée dans 'writer'. L'effectif d'une corrélation donnée (exemple 3) est affiché (18) quand on exécute la recherche sur la matrice de cette corrélation avec l'option 'tout rechercher'.
  • Légende :
  1. cor : corrélation
  2. fr : fréquence
  • Les diagrammes: Repartition des corrélations codons et aas. Dans le même tableau de diagrammes: Fréquences des corrélations entre codons, Répartition des corrélations entre codons, Fréquences des corrélations entre aas, Répartition des corrélations entre aas
  • Fréquences des corrélations entre codons (multipliées par 100).
  • Fréquences des corrélations entre aas (multipliées par 100).
Tableaux triés des corrélations des aas et des codons entre eux[modifier | modifier le wikicode]
Tableau trié des corrélations des aas entre eux[modifier | modifier le wikicode]
Correlations-codons-GC-DRNA-triaas.png
Tableau trié des corrélations des codons entre eux[modifier | modifier le wikicode]
  • Lien Tableur: Tableau trié des corrélations des codons entre eux
  • Image du tableau formaté: Un tableau de cette taille formaté avec wikipédia serait très compliqué à faire. Aussi j'ai opté de prendre une image de ce tableau formaté sous le tableur calc de LibreOffice.
Correlations-codons-GC-DRNA-tricodons.png
  • Construction: 3 lignes-colonnes sont ajoutées pour trier les codons. La L-C "ordre original" sert à retrouver l’ordre de la matrice des corrélations entre codons. Elle est numérotée de 1 à 64 de façon progressive sur cette matrice. Les 2 autres L-C "ordres optimisés" séparent les numéros des codons se terminant par "a,t" (en incluant agg, ttg et en excluant tga) des numéros des codons se terminant par "g,c" (en procédant de façon inverse pour agg, ttg et tga).
  • Tri sur les valeurs les plus élevées des corrélations: les numéros des 2 L-C sont obtenus par estimation de l'ordre des codons suivant le classement de leurs corrélations positives avec les autres codons. Le tableau final est optimisé pour avoir des groupes de codons fortement corrélés entre eux, les plus grands possibles. Voici ci-dessous les ordres estimés et optimisés obtenus, à recopier dans un tableur. Les codons ayant beaucoup de corrélations alternées, positives et négatives, ne sont pas inclus, c'est-à-dire atg, tag, ctg, agg. Les tris ne concernent alors que 2 carrés à corrélations positives de 29X29 codons.
Tableaux triés, connexions entre codons et aas[modifier | modifier le wikicode]
Tableau trié des 10 aas fortement corrélés entre eux[modifier | modifier le wikicode]
I K N F Y G A P V R D
I 92 93 83 82 -93 -89 -89 -90 -83 -72
K 92 86 80 84 -90 -88 -85 -83 -86 -72
N 93 86 81 81 -90 -81 -87 -90 -85 -60
F 83 80 81 71 -80 -70 -74 -80 -66 -74
Y 82 84 81 71 -84 -84 -80 -72 -80 -62
G -93 -90 -90 -80 -84 90 88 82 86 65
A -89 -88 -81 -70 -84 90 84 73 83 63
P -89 -85 -87 -74 -80 88 84 80 89 51
V -90 -83 -90 -80 -72 82 73 80 77 61
R -83 -86 -85 -66 -80 86 83 89 77 43
D -72 -72 -60 -74 -62 65 63 51 61 43
  • Distribution des fréquences entre ces 10 aas et le total
fréquences des corrélations en valeur absolue					
cor	aas10	aas	cor	aas10	aas
93	2	2	78	0	0
92	1	1	77	1	1
91	0	0	76	0	0
90	5	5	75	0	0
89	3	3	74	1	2
88	2	2	73	1	1
87	1	1	72	1	3
86	3	3	71	1	1
85	2	2	70	1	1
84	4	4	69	0	0
83	4	4	68	0	1
82	2	2	67	0	1
81	3	3	66	1	3
80	6	6	65	0	1
79	0	0	64	0	0
Tableaux triés de groupes de codons fortement corrélés entre eux[modifier | modifier le wikicode]
Y F N L K I S
codon tat ttt aat tta aaa att tca
Y tat 91 92 90 91 86 81
F ttt 91 91 85 93 87 79
N aat 92 91 91 92 85 79
L tta 90 85 91 84 85 81
K aaa 91 93 92 84 83 78
I att 86 87 85 85 83 82
S tca 81 79 79 81 78 82
Tableau non formaté: voir tableur
  • Tableau formaté de 8 codons moyennement corrélés se terminant par a,t.
D V Q T P A A H
codon gat gtt caa act cct gca gct cat
D gat 85 83 81 83 81 81 87
V gtt 85 71 82 81 83 84 69
Q caa 83 71 80 71 66 72 81
T act 81 82 80 77 74 82 69
P cct 83 81 71 77 79 85 74
A gca 81 83 66 74 79 75 69
A gct 81 84 72 82 85 75 66
H cat 87 69 81 69 74 69 66
Tableau non formaté: voir tableur
  • Tableau formaté de 12 codons fortement corrélés se terminant par g,c.
V Y L I T A Q R H G F D
codon gtc tac ctg atc acc gcc cag cgc cac ggc ttc gac
V gtc 64 62 77 78 84 71 80 78 83 82 87
Y tac 64 66 66 73 68 76 67 92 70 82 84
L ctg 62 66 75 88 76 90 77 76 83 74 78
I atc 77 66 75 82 79 79 82 76 84 89 80
T acc 78 73 88 82 89 86 81 84 86 81 87
A gcc 84 68 76 79 89 78 87 79 88 83 87
Q cag 71 76 90 79 86 78 82 83 85 83 84
R cgc 80 67 77 82 81 87 82 80 96 85 87
H cac 78 92 76 76 84 79 83 80 81 87 92
G ggc 83 70 83 84 86 88 85 96 81 87 90
F ttc 82 82 74 89 81 83 83 85 87 87 91
D gac 87 84 78 80 87 87 84 87 92 90 91
Tableau non formaté: voir tableur
Les Corrélations faibles entre codons[modifier | modifier le wikicode]
Les 2 groupes de corrélations faibles
cta ata ctt ggt taa ggg tgg agc tga cgg acg tgc tcc
cta 41 41 43 37 -16 -29 -39 -45 -44 -46 -56 -57
ata 41 28 1 15 -20 -40 -35 -21 -38 -51 -38 -44
ctt 41 28 25 22 -11 -19 -9 -34 -40 -35 -22 -29
ggt 43 1 25 53 -39 -18 -28 -45 -55 -32 -49 -33
taa 37 15 22 53 -26 -38 -21 -80 -44 -40 -41 -45
ggg -16 -20 -11 -39 -26 37 26 15 75 24 30 36
tgg -29 -40 -19 -18 -38 37 33 43 50 44 34 52
agc -39 -35 -9 -28 -21 26 33 23 29 31 62 39
tga -45 -21 -34 -45 -80 15 43 23 44 42 37 44
cgg -44 -38 -40 -55 -44 75 50 29 44 46 42 50
acg -46 -51 -35 -32 -40 24 44 31 42 46 44 40
tgc -56 -38 -22 -49 -41 30 34 62 37 42 44 65
tcc -57 -44 -29 -33 -45 36 52 39 44 50 40 65
mcor 51.5 44.3 39.2 39.6 42.0 26.8 43.2 42.6 44.8 48.5 48.4 53.3 54.8
  • Tableau non formaté: voir tableur
Corrélations isolées, fortes et faibles entre codons[modifier | modifier le wikicode]
ccg	ccg	aga	aac	caa	tct
gcg	ggc	gga	cac	att	tgt
89	84	83	83	83	82
					
caa	tat	gag	ttt	gct	gct
tta	agt	cac	tgt	aat	aac
81	81	81	80	40	-50
					
tga	cgt	tga	cgt	cgg	ata
taa	atg	gtc	ggt	ggg	aga
-80	55	60	70	75	76

Corrélations entre bactéries et conformation des protéines[modifier | modifier le wikicode]

Conformation des protéines par le nombre d'aas et de codons[modifier | modifier le wikicode]

  • Légende:La conformation moyenne des 6 protéines étudiées peut être représentée par les moyennes des aas calculées dans le tableau des diagrammes des aas. Pour chaque bactérie j'ai fait le diagramme "moyenne de l'aa" /"effectif de son aa correspodant"; La conformation moyenne des 6 protéines pour cette bactérie peut être alors représentée par les 3 paramètres de la droite de tendance de ce diagramme. A savoir:
  1. R2: coefficient de détermination de la droite (ici multiplié par 100)
  2. a: la pente de la droite (ici notée ax).
  3. b: la constante de la droite.

Les 3 paramètres sont reportés tels quels en fonction du contenu en GC (%GC) des bactéries dans les diagrammes des chapitres suivants.

  • La conformation des gènes des 6 protéines est étudiée de la même manière qu'avec les aas, mais ici je considère les 64 codons d'après le tableau des diagrammes des codons.
  • Dans le chapitre des exemples qui suit sont représentés 12 tableaux de ces diagrammes.
Conformation des protéines par le nombre d'aas[modifier | modifier le wikicode]
Conformation des protéines par le nombre de codons[modifier | modifier le wikicode]
  • Lien Tableur: Conformation des protéines par le nombre de codons
  • format2 : voir 2ème diagramme.
  • Voir la légende
  • Ce diagramme est l'équivalent de celui des aas car il réunit tout les codons. Les 2 diagrammes sont cependant très différents par la grande variance de R2 avec les codons, somme de 2 variances opposées que sont celle des triplets bbc,g et celle des bbt,a, et une très faible variance de R2 avec les aas, nécessaire au maintient des fonctions de ces 6 protéines.
Conformation des protéines par le nombre de codons bbc,g[modifier | modifier le wikicode]
Conformation des protéines par le nombre de codons bbt,a[modifier | modifier le wikicode]
Conformation, récapitulatif[modifier | modifier le wikicode]
  • La colonne 3° R2 correspond au coefficient de détermination d'un polynôme de degré 3.
Coefficient pente constante R2
Paramètre a b r2 a b r2 r'23 r23
Diagramme
aas 0.003 0.86 391 -0.99 47.5 410 540 874
codons 0.005 0.76 279 -0.50 24.6 280 320 709
bbg,c 0.040 -0.91 907 -0.54 26.3 170 260 691
bba,t -0.033 2.59 894 -0.62 30.8 250 420 665

Conformation des protéines, exemples[modifier | modifier le wikicode]

Conformation des protéines par le nombre d'aas[modifier | modifier le wikicode]
  1. moyen: moyenne de l'aa, voir la légende ci-dessus.
  2. zero: colonne à valeurs nulles pour reporter les noms des aas.
  3. hth: code KEGG de la bactérie
Conformation des protéines par le nombre de codons bbc,g[modifier | modifier le wikicode]
  1. moyen: moyenne du codon, voir la légende ci-dessus.
  2. zero: colonne à valeurs nulles pour reporter les noms des codons.
  3. eal: code KEGG de la bactérie
Conformation des protéines par le nombre de codons bbt,a[modifier | modifier le wikicode]
  1. moyen: moyenne du codon, voir la légende ci-dessus.
  2. zero: colonne à valeurs nulles pour reporter les noms des codons.
  3. fnc: code KEGG de la bactérie

Fréquences des corrélations entre bactéries / codons[modifier | modifier le wikicode]

Fréquences des corrélations entre bactéries / aas[modifier | modifier le wikicode]

Les tRNAs[modifier | modifier le wikicode]

Nombres de tRNAs des 111 bactéries[modifier | modifier le wikicode]

  • Lien Tableur: Nombres de tRNAs des 111 bactéries
  • Base de données des tRNAs [1], gtRNAdb.   Pour vin amo ssm opr age fbt cad sbw mcac j'ai utilisé la base de données KEGG [2]: fournir les 3 lettres du génome dans organism. Puis cliquer successivement sur Assembly, Genome et RefSeq. Ctrl+F: tRNA-Arg . . .
  • Légende:
colonne tRNA/8: les 8 aas à 4 et 6 codons ayant 1 seul codon avec tRNA pour le carré à 4 codons (ct pour L par exemple). Pour réduire la notation sont indiqués en 1er les aas à 4 codons suivis de ceux à 6 codons. S'il y a un seul aa avec plus d'un codon à tRNA, cet aa est noté avec le signe −.
  1. −G *: R n'a aucun tRNa pour les 4 codons cg (ceci pour *) et G a plus d'un codon à tRNA. Donc APTV ont 1 seul codon à tRNA et SL en ont plus de 1 pour leur carré.
  2. −G SR*: L n'a aucun tRNa pour les 4 codons ct (ceci pour *) et G a plus d'un codon à tRNA. Donc APTV et SR ont 1 seul codon à tRNA pour leur carré.
  3. 5 SRL, tRNA/8: Les 5 aas à 4 codons et SRL ont 1 seul codon à tRNA.
Colonne >2: les 8 aas à 4 et 6 codons ayant plus de 2 codons à tRNA pour le carré à 4 codons (ct pour L par exemple). Pour réduire la notation sont indiqués en 1er les aas à 4 codons suivis de ceux à 6 codons. S'il y a un seul aa avec 2 codons à tRNA, cet aa est noté avec le signe −.
  1. 8: APTVG et SRL ont plus de 2 codons à tRNA.
  2. T S: T et S ont plus de 2 codons à tRNA.
  3. −V −S: APTG et RL ont plus de 2 codons à tRNA.
  4. GT* SL: GSL ont plus de 2 codons à tRNA et T en a 4 (pour *).
Colonne 2: Les aas KEQ à 2 codons peuvent avoir les 2 codons avec tRNA. Les codons tta et ttg de L ont dans la majorité des cas un tRNA chacun, de même pour aga et agg de R. Pour S le codon agt n’a pratiquement jamais de tRNA alors que agc en a toujours. Donc S sera absent dans cette colonne.
  1. 3RL: KEQ et RL ont 2 codons à tRNA.
  2. KRL: ces 3 aas ont 2 codons à tRNA.
  3. W C I : Les codons tgg et tga, tgt et tgc, ata ont chacun un tRNA.
Les tRNAs des 111 bactéries
KEGG %GC tRNA tRNA/8  >2  2 KEGG %GC tRNA tRNA/8  >2  2 KEGG %GC tRNA tRNA/8  >2  2 KEGG %GC tRNA tRNA/8  >2   2 
zin 13.5 25 −G SR* 0 0 lat 36.3 44 P T SL KQR ype 47.6 70 0 G L KQRL ret 61.3 50 0 GPTSL 3R
crp 16.6 28 −G * 0 0 bbd 36.8 39 V 0 RL amo 48.0 48 0 8 3RLW sus 61.9 51 0 8 3RL
hcr 22.5 28 5 SRL 0 L liv 37.1 67 AP T S RL pgi 48.3 53 V GPT L KQRL saci 62.3 68 0 8 3RLC
mcac 23.7 30 −T SRL 0 KL hmr 37.5 48 0 8 3RL mah 48.7 45 0 T SL RL smk 62.7 57 0 -V −R 3RL
ssdc 24.2 34 AP L KRL tde 37.9 44 0 APTSL 3RL ssm 49.0 48 0 8 3RL dvl 63.0 68 0 −R KQRL
sbw 25.1 35 AP L KRL spi 38.3 63 APV 0 KRL eal 49.7 85 0 GPTSL QRL ddr 63.4 48 0 −R KQRL
uur 25.5 30 −G SL 0 KL vpr 38.6 48 APV G S KRL lfc 50.0 52 0 8 3RL tai 63.8 50 0 8 3RL
ple 26.2 33 AP S 0 chp 39.1 38 0 T SL RL eco 50.8 87 0 GPTSL QRL gau 64.3 48 0 −R 3RL
smf 26.3 39 5 SRL 0 KL spl 39.1 143 0 0 RL sbz 51.3 86 0 GPTSL QRL xcb 65.0 55 0 −R 3RL
fnc 27.1 47 −G SL 0 KRL tsu 39.2 48 0 −V−S 3RL bvs 51.7 62 V GPTSL 3RL rru 65.5 55 0 −R 3RL
bfl 27.4 37 AP T SL KRL nis 39.7 45 0 T RL sty 52.1 79 0 GPTSL QRL dpt 66.2 46 0 −G−R KQRL
cbl 28.3 81 APV G 3RL cmn 40.3 37 0 TSL L tpas 52.8 45 0 −G 3RL pae 66.6 63 0 GPTSL RL
rip 28.5 33 AP 0 RL nse 41.1 33 AP 0 RL  I apt 53.0 57 0 −R KQL roa 67.4 52 0 −R 3RL
rpr 29.0 33 P T 0 cta 41.3 37 0 TSL L caa 53.6 46 0 GPTSL KRL bmv 68.2 56 0 −R KR
pub 29.7 32 AP L 0 L hhd 41.8 67 P 0 RL cgq 54.2 58 0 −A−R 3RL tos 68.6 52 0 −R 3RL I
cad 29.9 81 APV 0 LW gva 42.0 45 0 −P−R 3RL dal 54.5 56 0 −R 3RL vin 68.9 49 0 8 3RL
cje 30.6 43 P 0 RL cbd 42.4 42 0 GPTSL KERL eno 55.1 83 0 GT L QRL age 69.5 81 0 8 3RL
pmh 31.1 40 0 T S RL bae 43.2 75 P 0 RL mcu 55.4 46 0 −R 3RL opr 70.0 46 0 −R 3RL
tme 31.4 50 0 8 3RL aae 43.5 44 0 GPTSL KRL din 56.1 37 0 P L RL mts 70.3 46 0 −R 3RL
sep 32.1 59 APV 0 L bsu 43.5 54 P L RL say 56.8 53 0 8 3RL sma 70.7 71 0 −R 3RL
hhl 32.5 44 0 0 RL hth 44.0 44 0 −R KRL bmf1 57.2 55 0 −R 3RL amd 71.3 52 0 −R 3RL
cff 33.3 41 P 0 KERL lpl 44.5 73 V GT*SL 3RL kpn 57.5 86 0 GPTSL QRL sho 72.0 73 0 −R 3RL
ial 33.9 45 0 −V 3RL pdi 45.1 82 0 GPTSL 3RL aba 58.4 46 0 8 3RL sgr 72.2 67 0 −R 3RL
ljf 34.5 55 AV R GT*SL 3RL ppoy 45.5 109 0 T SL KL dba 58.7 64 0 8 3RL cmi 72.7 45 0 −R 3RL
dte 34.9 43 0 TSL RL tma 46.3 46 0 8 3RL synd 59.1 46 0 −R RL salb 73.3 66 0 −R 3RL
lla 35.3 63 APV TSL KRL sbn 46.3 105 0 L RL pgd 59.6 60 0 −A−R RL ksk 74.2 78 0 −R 3RL
axl 35.7 55 P 0 L fbt 46.5 47 V L RL pac 60.0 45 0 −R 3RL ade 74.9 49 0 8 3RL
thl 36.0 62 AV GT SL KRL tli 47.1 48 0 8 3RL bla 60.5 52 0 −R 3RL
  • Tableau non formaté: voir tableur
  • Récapitulatif
Nombre de bactéries (sur 111) ayant au moins un tRNA par codon
codons 0 1 2 3 4 0 1 2
aa
A 0 23 40 48
C 0 110 1
D 0 111 0
E 0 62 49
F 0 111 0
G 0 3 41 67
H 0 111 0
I 0 109 2
K 0 38 73
L 1 6 22 82 0 7 104
M 0 111 0
N 0 111 0
P 0 29 19 63
Q 0 51 60
R 1 5 87 18 0 16 95
S 0 6 29 76 0 111 0
T 0 6 25 78 2
V 0 20 46 46
W 0 109 2
Y 0 111 0
  • Tableau non formaté: voir tableur
Moyenne des codons t/c et a/g en %[modifier | modifier le wikicode]
Moyenne des codons 2*(t-c)/(t+c) et 2*(a-g)/(a+g) en %
ttt 123 tct 69 tat 116 tgt 27
c 125 c 66 c 107 c 31
a 120 a 50 a 3 a 2
g 81 g 58 g 1 g 71
ctt 97 cct 65 cat 59 cgt 103
c 104 c 61 c 70 c 132
a 30 a 58 a 89 a 20
g 180 g 101 g 132 g 44
att 168 act 68 aat 133 agt 38
c 181 c 121 c 128 c 55
a 84 a 65 a 247 a 60
g 154 g 71 g 202 g 24
gtt 132 gct 108 gat 217 ggt 142
c 118 c 164 c 202 c 169
a 84 a 91 a 296 a 88
g 137 g 126 g 226 g 54
ttt/c -2 tct 4 tat 8 tgt -15
tta/g 39 -15 103 -191
ctt/c -7 cct 5 cat -17 cgt -25
cta/g -144 -54 -39 -73
att/c -7 act -56 aat 4 agt -35
ata/g -59 -8 20 84
gtt/c 11 gct -41 gat 7 ggt -17
gta/g -48 -32 27 49
  • Tableau non formaté: voir tableur
Moyenne des corrélations t/c et a/g en %[modifier | modifier le wikicode]
Moyenne des corrélations 2*(t-c)/(t+c) et 2*(a-g)/(a+g) en %
ttt 64 tct 63 tat 66 tgt 58
c 68 c 55 c 60 c 53
a 61 a 64 a 42 a 45
g 27 g 58 g 9 g 43
ctt 39 cct 63 cat 60 cgt 18
c 60 c 54 c 66 c 67
a 51 a 60 a 63 a 22
g 62 g 61 g 66 g 49
att 63 act 64 aat 59 agt 62
c 64 c 66 c 58 c 43
a 44 a 63 a 63 a 53
g 19 g 48 g 57 g 13
gtt 63 gct 57 gat 66 ggt 40
c 63 c 67 c 69 c 69
a 58 a 59 a 58 a 56
g 60 g 59 g 62 g 27
ttt/c -6 tct 13 tat 10 tgt 8
tta/g 79 9 128 4
ctt/c -42 cct 16 cat -10 cgt -114
cta/g -18 -2 -5 -74
att/c -1 act -3 aat 2 agt 38
ata/g 78 26 10 119
gtt/c 0 gct -16 gat -5 ggt -54
gta/g -3 0 -6 70
  • Tableau non formaté: voir tableur
Les corrélations en ordre[modifier | modifier le wikicode]
L'ordre des corrélations
ttt 2a tct 17a tat 1a tgt 21a
c 2g c 22g c 11g c 23g
a 4a a 7a a 29a a* 26g
g* 30a g 16g g 31g g 28g
ctt 27a cct 12a cat 15a cgt 32a
c 17g c 20g c 4g c 5g
a 25a a 16a a 10a a 31a
g 10g g 14g g 6g g 25g
att 6a act 11a aat 3a agt 18a
c 9g c 8g c 13g c 27g
a 26a a 19a a 5a a 24a
g 30g g 24g g 19g g* 33a
gtt 9a gct 14a gat 8a ggt 28a
c 12g c 7g c 1g c 3g
a 22a a 13a a 20a a 23a
g 21g g 15g g 18g g 29g

Comptes détaillés des tRNAs des 111 bactéries[modifier | modifier le wikicode]

Comptes détaillés[modifier | modifier le wikicode]
Spectres des codons des tRNAs des 111 bactéries[modifier | modifier le wikicode]
Spectres des codons des tRNAs111
n tRNAs    ttc tta ttg    tcc tca tcg    tac taa tag    tgc tga tgg
0 0 3 4 6 0 34 0 2 78 1
1 80 94 104 95 91 73 82 93 33 101
2 22 9 2 9 16 3 18 13 8
3 8 3 1 1 2 1 8 1 1
4 1 1 2 2 2
5 1 0
autres 1
ctc cta ctg ccc cca ccg cac caa cag cgt cga cgg
0 12 1 28 33 0 44 2 0 50 11 76 21
1 89 97 66 72 93 65 91 83 47 67 34 88
2 10 11 9 4 12 1 18 18 14 19 1 2
3 1 2 2 5 1 6 4
4 0 6 1 3 8
5 1 1 0
autres 2
atc ata atg acc aca acg aac aaa aag agc aga agg
0 0 0 9 0 29 0 1 37 0 0 16
1 53 0 85 90 80 65 73 62 99 102 90
2 23 3 16 8 2 21 17 7 10 7 4
3 24 55 1 7 11 7 4 2 2 1
4 6 20 6 9 5 1
5 4 12 3 3
autres 1 21 2 5
gtc gta gtg gcc gca gcg gac gaa gag ggc gga ggg
0 20 0 65 24 0 62 0 0 61 3 0 44
1 72 73 39 66 53 49 50 63 40 51 86 65
2 12 13 6 20 18 35 21 4 27 14 1
3 7 13 1 1 24 16 12 5 19 8 1
4 6 8 8 8 1 8 2
5 4 5 1 2 1 1
autres 2 3 1 5 2
Spectre du codon atg des gènes tRNA des 111 bactéries[modifier | modifier le wikicode]
  • Lien Tableur: Spectre du codon atg des gènes tRNA des 111 bactéries
  • Légende: Décompte du 10.04.19 des 101 bactéries sur 111 de la liste des bactéries étudiées ici. Dix génomes n'ont pu être décomptés (génome, gènes atg): age 5 amo 3 cad 9 cbl 7 fbt 3 opr 3 salb 6 sbw 3 ssm 4 vin 3.
  • Méthode: Prendre le nom latin dans KEGG avec le code à 3 lettres de KEGG [1].C'est seulement à l'affichage des tableaux VF5 de gtRNAdb [2] que l'on peut avoir les effectifs de fMet et Met sous la forme de fMet/Met de la ligne Met, et ceux de Ile (anti codon cat) de la ligne Ile.
  • Bactéries sans Ile (anti codon cat) ni Ile (anti codon tat): sur les 9 bactéries sans Ile (anti codon cat) une a ile (anti codon tat), c'est nse. Les 8 autres se répartissent en 3 n'ayant qu'un gène Met (ssdc saci dpt) et 5 avec 2 gènes Met (ple rpr tme ial tma). Si on admet que les 5 derniers ont une erreur sur les 2 gènes Met et que ceux-ci sont en réalité Ile plus Met, alors il reste 3 génomes n’ayant pas du tout de gènes tRNA pouvant coder Ile. Est-ce que ce sont des symbiotes ou des erreus? Pourtant saci avec 62% GC et dpt avec 66% ne semblent pas être des symbiotes comme ssdc avec 24%. Voir le tableau détaillé des génomes.
Distribution des gènes de tRNAs du codon atg
occur. fMet Met Ile
0 0 0 9
1 55 78 85
2 19 22 6
3 15 1 1
4 8
5 1
6 1
7 1
9 1
genèse 101 101 92
dup % 95 24 9
Comptes des solitaires des tRNAs des 111 bactéries[modifier | modifier le wikicode]
			   Résultat	Formules
			nom	cellule		
4 codons Leu	ctx	0	ES12	SI(ET(DC12=0,DD12=0,DE12=0,DF12=0),1,0)	
			ctt	ET12	SI(ET(DC12>0,DD12=0,DE12=0,DF12=0),1,0)	
			ctc	EU12	SI(ET(DC12=0,DD12>0,DE12=0,DF12=0),1,0)	
			cta	EV12	SI(ET(DC12=0,DD12=0,DE12>0,DF12=0),1,0)	
			ctg	EW12	SI(ET(DC12=0,DD12=0,DE12=0,DF12>0),1,0)	
2 codons	ctt,ctc	ctt	EX12	SI(ET(DC12>0,DD12=0),1,0)	
			ctc	EY12	SI(ET(DC12=0,DD12>0),1,0)	
			11	EZ12	SI(ET(DC12=1,DD12=1),1,0)	
			01	FA12	SI(SOMME(EX12:EZ12)=0,1,0)	
3 codons Ser	tcx	0	GR12	SI(ET(DU12=0;DV12=0;DW12=0);1;0)
			tcc	GS12	SI(ET(DU12>0;DV12=0;DW12=0);1;0)
			tca	GT12	SI(ET(DU12=0;DV12>0;DW12=0);1;0)
			tcg	GU12	SI(ET(DU12=0;DV12=0;DW12>0);1;0)
La procédure utilisée ici pour 111 bactéries est la même que j'ai utilisée pour les 4032 bactéries de la base gtRNAdb: un tRNA est dit solitaire pour un carré donné (ctx), s'il ne contient qu'un seul type (ctt), les autres (ctc cta ctg) étant nuls. Pour les 4032 bactéries je cherchais les occurrences *ctt*, *ctt;ctt*, . . . .. Ici pour le nom ctt je teste la condition ctt>0 et (ctc=0 cta=0 ctg=0) pour une bactérie donnée. Ce qui donne dans calc pour la bactérie zin (ligne 12) les codonss "ctt ctc cta ctg" (colonnes DC12 DD12 DE12 DF12). La cellule DC12 correspond à la ligne zin et à la colonne ctt du tableau des décomptes détaillés ci-dessus.
  1. 4 codons: calculs pour les 4 codons non nuls d'un carré et 0 s'il n'y a aucun tRNA. Les 4 sont testés pour ctx cgx acx, et seulement 3 pour tcx ccx gtx gcx ggx.
  2. 2 codons: calculs sur 2 codons supposés lus par un seul tRNA. ctt,ctc,11,01: respectivement, seul le codon ctt ou ctc a plus d'un tRNA, ctt et ctc ont chacun 1 seul tRNA, autre combinaison. La colonne avec (*) correspond au cas où les 2 codons n'ont pas de tRNA parmi le décompte "autre combinaison". Ces tests sont faits pour ctt.c cta.g tta.g aga.g cgt.c cga.g act.c aca.g tca.g cca.g gca.g gta.g gga.g tga.g aaa.g caa.g gaa.g
Les xxt ne sont pas présentés sauf ctt cgt act, car ils n’ont pas de tRNA (voir tableau).
Donc il n’y a pas de résultat pour tct cct gtt gct ggt;
att,c ata atg Ile;  tat,c taa,g Tyr stp; 
ttt,c Phe; cat,c His; aat,c Asn; gat,c Asp; tgt,c Cys; agt,c Ser;
Il reste donc 39 colonnes à tester et les résultats peuvent se localiser en ES quand les colonnes à tester commencent en DC.
DC12 cellule ctt du tableau pour la bactérie zin
DD12 cellule ctc du tableau « 
. . . .
EX12 cellule du résultat du test ctt pour 2 codons
EY12 cellule du résultat du test ctc pour 2 codons
EZ12 cellule du résultat du test 11 pour 2 codons
FA12 cellule du résultat du test 01 pour 2 codons
Les résultats présentés sont la somme des colonnes des noms
Leu 0
Leu ctt
. . . . . . . .
Comptes des solitaires des tRNAs des 111 bactéries
Leu 0 1 Arg 0 1 Glu gaa 61 Thr 0 0 Gly 0 0
ctt 0 cgt 4 gag 0 act 0 ggc 0
ctc 0 cgc 1 11 28 acc 0 gga 3
cta 6 cga 0 01 22 aca 6 ggg 0
ctg 0 cgg 0 Trp tga 0 acg 0 gga 44
ctt 5 cgt 100 tgg 77 act 2 ggg 0
ctc 99 cgc 10 11 29 acc 99 11 54
11 0 11 0 01 5 11 1 01 13
01 7 7* 01 1 1* Val 0 0 01 9
cta 27 cga 15 gtc 0 aca 29
ctg 0 cgg 70 gta 20 acg 0
11 63 11 18 gtg 0 11 72
01 21 1* 01 8 6* gta 65 01 10
tta 4 aga 16 gtg 0 Ala 0 0
ttg 3 agg 0 11 37 gcc 0
11 87 11 85 01 9 gca 23
01 17 01 10 Pro 0 0 gcg 0
Ser 0 0 Lys aaa 37 ccc 0 gca 62
tcc 0 aag 1 cca 29 gcg 0
tca 6 11 47 ccg 0 11 30
tcg 0 01 26 cca 44 01 19
tca 34 Gln caa 50 ccg 0
tcg 0 cag 0 11 63
11 68 11 41 01 4
01 9 01 20
  • Tableau non formaté: voir tableur
Comptes détaillés des tRNAs des 111 bactéries: totaux[modifier | modifier le wikicode]
I. 4032 bactéries: total
ttt 10 tct 5 tat 4 tgt 3
c 6105 c 4520 c 6420 c 4473
a 4749 a 5299 a a 1315
g 3999 g 2622 g g 4366
ctt 369 cct 10 cat 4 cgt 7478
c 3849 c 2742 c 4715 c 333
a 4940 a 5453 a 6388 a 887
g 5186 g 2183 g 2389 g 3355
att 5 act 103 aat 5 agt 1
c 9,203 c 4513 c 8,764 c 4422
a 55 a 5878 a 9,105 a 4804
g 18,026 g 2760 g 2427 g 3452
gtt 9 gct 2 gat 0 ggt 1
c 4430 c 4166 c 9,023 c 9,273
a 8,859 a 10,185 a 9,679 a 5515
g 1313 g 1224 g 1388 g 2266
II. 4032 bactéries : 100 * n / 3950
0.3 0.1 0.1 0.1
155 114 163 113
120 134 33
101 66 111
9.3 0.3 0.1 189
97 69 119 8.4
125 138 162 22
131 55 60 85
0.1 2.6 0.1 0.0
233 114 222 112
1.4 149 231 122
456 70 61 87
0.2 0.1 0.0 0.0
112 105 228 235
224 258 245 140
33 31 35 57
I'. 111 bactéries: total
ttt 0 tct 0 tat 0 tgt 1
ttc 152 tcc 116 tac 156 tgc 130
tta 130 tca 137 taa 0 tga 33
ttg 111 tcg 82 tag 0 tgg 120
ctt 6 cct 0 cat 0 cgt 162
ctc 109 ccc 86 cac 127 cgc 10
cta 127 cca 136 caa 154 cga 36
ctg 114 ccg 70 cag 75 cgg 92
att 0 act 6 aat 0 agt 0
atc 222 acc 120 aac 204 agc 125
ata 4 aca 151 aaa 201 aga 122
atg 462 acg 84 aag 92 agg 101
gtt 0 gct 0 gat 0 ggt 0
gtc 117 gcc 109 gac 211 ggc 213
gta 199 gca 237 gaa 221 gga 151
gtg 54 gcg 49 gag 67 ggg 70
II'. 111 bactéries : 100 * n / 111
0 0 0 0.9
137 105 141 117
117 123 0 30
100 74 0 108
5.4 0 0 146
98 77 114 9
114 123 139 32
103 63 68 83
0 5.4 0 0
200 108 184 113
3.6 136 181 110
416 76 83 91
0 0 0 0
105 98 190 192
179 214 199 136
49 44 60 63
  • Tableaux non formatés: voir tableur
Comptes détaillés des tRNAs des 111 bactéries: solitaires[modifier | modifier le wikicode]
II 4032. Nombre de bactéries à tRNAs solitaires de 4 codons. Total requête.
ttt 3948 tct 3945 tat 3934 tgt 3947
c 15 c 2 c 3930 c 12
a 0 a 85 a a 0
g 2 g 0 g g 17
ctt 3942 cct 3941 cat 3948 cgt 106*
c 7 c 3 c 5 c 1
a 98 a 1173 a 6 a 7
g 0 g 1 g 2 g 7
att 3949 act 3946 aat 3949 agt 3944
c 2 c 2 c 2 c 1
a 0 a 152 a 5 a 0
g 81 g 3 g 1 g 0
gtt 3943 gct 3934 gat 3949 ggt 3948
c 8 c 32 c 5 c 9
a 724 a 877 a 8 a 66
g 1 g 7 g 1 g 0
III 4032. Nombre de bactéries à tRNAs solitaires des codons a,g. Total requête.
tt tc ta tg
sag 3933 sag 3943 sag sag 3934
a 96 a 1493 a a 15
g 190 g 22 g g 2629
ct cc ca cg
sag 3935 sag 3939 sag 3943 sag 3833
a 692 a 1813 a 2130 a 539
g 30 g 5 g 18 g 3026
at ac aa ag
sag 3947 sag 3944 sag 3941 sag 3928
a 0 a 1288 a 1899 a 780
g 3947 g 13 g 9 g 10
gt gc ga gg
sag 3935 sag 3902 sag 3928 sag 3939
a 2724 a 2721 a 2808 a 1699
g 2 g 11 g 5 g 11
II 111. Nombre de bactéries à tRNAs solitaires des carrés à 4 codons.
ttt 111 tct 111 tat 111 tgt 110
c 0 c 0 c 0 c 0
a 0 a 6 a a
g 0 g 0 g g 1
ctt 111 cct 111 cat 111 cgt 4*
c 0 c 0 c 0 c 1
a 6 a 29 a 2 a 0
g 0 g 0 g 0 g 0
att 111 act 111 aat 111 agt 111
c 0 c 0 c 0 c 0
a 0 a 6 a 0 a 0
g 0 g 0 g 0 g 0
gtt 111 gct 111 gat 111 ggt 111
c 0 c 0 c 0 c 0
a 20 a 23 a 0 a 3
g 0 g 0 g 0 g 0
III 111. Nombre de bactéries à tRNAs solitaires des codons a,g.
ttt tct 111 cg 110 tgt
sag 111 sag 111 sct 110 sag 110
a 4 a 34 t 100 a 0
g 3 g 0 c 10 g 77
ctt 110 cct 111 cat cgt 110
sag 110 sag 111 sag 111 sag 105
a 27 a 44 a 50 a 15
g 0 g 0 g 0 g 70
ctt 111 act 111 aat agt
sct 104 sag 111 sag 111 sag 111
t 5 a 29 a 37 a 16
c 99 g 0 g 1 g 0
gtt 111 gct 111 gat ggt 111
sag 111 sag 111 sag 111 sag 111
a 65 a 62 a 61 a 44
g 0 g 0 g 0 g 0
IV 4032. Pourcentage des bactéries à tRNAs solitaires.
tt tc ta tg
%4 2.2
1a1g 2804 2114 1238
%2 7 38 67
ct cc ca cg
%4 2.7 29.9 3.1
1a1g 962 1911 996 222
%2 18 46 54 93
at ac aa ag
%4 2.1 4.0
1a1g 0 2166 1155 2579
%2 100 33 48 20
gt gc ga gg
%4 18.6 23.3 1.9
1a1g 1051 562 602 1973
%2 69 70 72 43
ct cg ac
%4 2.7 3.1 4.0
1t1c 8 10 41
%2 99 99 98
IV 111. Pourcentage des bactéries à tRNAs solitaires.
tt tc ta tg
%4 5,4
1a1g 87 68 0 29
%2 6 31 100 70
ct cc ca cg
%4 5,5 26.1 4,5
1a1g 63 63 41 18
%2 25 40 45 81
at ac aa ag
%4 0 5,4
1a1g 0 72 47 85
%2 99 26 34 14
gt gc ga gg
%4 18.0 20.7 2,7
1a1g 37 30 28 54
%2 59 56 55 40
ct cg ac
%4
1t1c 0 0 1
%2 100 100 91
  • Compléments
		Nombre de bactéries à tRNAs solitaires des codons c,t.							
4032	sct	t	c			111	sct	t	c
ac	3775	41	3682			ac	111	2	99
cg	3932	3614	307			cg	110	100	10
ct	3834	323	3502			ct	104	5	99
  • Tableaux non formatés:voir tableur
tRNAs des 111 bactéries: Diagramme des solitaires APV[modifier | modifier le wikicode]
  • Diagramme des solitaires APV .
	Effectifs des tRNAs solitaires APV							
%GC	A	P	V	T	G	L	R	S
15-20	2	2	2	2	0	0	1	1
20-25	3	3	2	1	2	2	2	2
25-30	10	11	5	3	1	4	1	3
30-35	2	3	2	0	0	0	1	0
35-40	5	6	5					
40-45	1	4	1					
45-50	0	0	2					
50-55	0	0	1					
55-60	0	0	0					
total	23	29	20	6	3	6	5	6

Diagrammes codons-GC-PDNA[modifier | modifier le wikicode]

Compilation PDNA[modifier | modifier le wikicode]

codons PDNA[modifier | modifier le wikicode]

aseca;a63551[modifier | modifier le wikicode]
  • aseca;a63551;a63552;a27140;a4213;a2211;a36314;a363141;a6412
    Lien Tableur: aseca;a63551
a64121[modifier | modifier le wikicode]
  • a64121
    Lien Tableur: a64121
a64122[modifier | modifier le wikicode]
  • a64122
    Lien Tableur: a64122

Total codons PDNA[modifier | modifier le wikicode]

  • Lien Tableur: Total codons PDNA
  • Total numérique: addition des 3 tableaux codons PDNA

acides aminés PDNA[modifier | modifier le wikicode]

39 bactéries 9 protéines[modifier | modifier le wikicode]
Complément 36 bactéries protéine 6142-1[modifier | modifier le wikicode]
Complément 36 bactéries protéine 6142-2[modifier | modifier le wikicode]

Total acides aminés PDNA[modifier | modifier le wikicode]

Tableau des diagrammes des codons PDNA[modifier | modifier le wikicode]

  • Lien Tableur: Tableau des diagrammes des codons PDNA
  • codons des PDNA rapportés à 6 555, moyenne du total des aas des DRNA par bactérie. La moyenne correspondante des PDNA 6 391 est donnée pour indication.

Maximum et 75% PDNA[modifier | modifier le wikicode]

Constantes des courbes PDNA[modifier | modifier le wikicode]

abscisse du maximum PDNA[modifier | modifier le wikicode]

maximum PDNA[modifier | modifier le wikicode]

Diagrammes codons-GC-DRNA-39[modifier | modifier le wikicode]

Compilation DRNA-39[modifier | modifier le wikicode]

codons DRNA-39[modifier | modifier le wikicode]

acides aminés DRNA-39[modifier | modifier le wikicode]

Contenu en GC des génomes DRNA-39[modifier | modifier le wikicode]

Tableau des diagrammes des codons DRNA-39[modifier | modifier le wikicode]

Maximum et 75% DRNA-39[modifier | modifier le wikicode]

Constantes des courbes DRNA-39[modifier | modifier le wikicode]

abscisse du maximum DRNA-39[modifier | modifier le wikicode]

maximum DRNA-39[modifier | modifier le wikicode]

Différences entre DRNA-39 et PDNA-39[modifier | modifier le wikicode]

Différence en % par rapport à DRNA-39[modifier | modifier le wikicode]

Corrélation entre les différences “dna-prot” de 2 codons[modifier | modifier le wikicode]

Corrélation entre les différences[modifier | modifier le wikicode]

Tableau des diagrammes x.y[modifier | modifier le wikicode]

Différences entre codons dues à la séquence des gènes[modifier | modifier le wikicode]

  • Les protéines, notamment les tRNA synthases et les protéines de maintenance de l'ADN, différencient les codons. Ainsi il existe plusieurs tRNA pour Gly et la maintenance de l'ADN est à l'origine de la différence en contenu GC et différencie entre la paire GC et la paire AT. L'objet de ce chapitre est d'éliminer l'influence des protéines en comparant dans le même génome la différence entre 2 codons dans le lot des gènes prot et le lot dna. Si la différence est statistiquement significative entre les 2 lots, alors il n'y a que la séquence des gènes qui peut en être la cause.
  • Construction du tableau de comparaison. Légende:
  1. DE at :comparaison entre gaa et gat
  2. %GC :contenu en GC du génome
  3. KEGG :code de la bactérie
  4. Différences.prot: 200*((prot.gaa − prot.gat) / (prot.gaa + prot.gat)).
  5. Différences.DNA : 200*((DNA.gaa − DNA.gat) / (DNA.gaa + DNA.gat))
  6. dif :Différences.prot − Différences.DNA
  7. Eprot :200*RACINE(1 / (prot.gaa + prot.gat) )
  8. Edna :200*RACINE(1 / (DNA.gaa + DNA.gat) )
  9. ecart :SI (dif < 0,(−dif − (Eprot + Edna)), (dif − (Eprot + Edna)))
  10. ok :SI (ecart <0,0,1), différence statiquement significative.
  11. gaa :effectif du codon gaa d’après le résultat direct (nombre entier). voir la compilation totale des codons pour prot dans total numérique et pour dna dans compilations des codons.
  12. gat :effectif du codon gat d’après le résultat direct (nombre entier). idem
  13. (*) :bactérie éliminée pour les diagrammes: Eprot ou Edna supérieur à 21.
  • Exemple:
DE at		Différences						prot		DNA		
%GC	KEGG	prot	DNA	dif	Eprot	Edna	ecart	ok	gaa	gat	gaa	gat	
74.9	ade	-169	-125	-44	55	50	-61	0	1	12	3	13   *
71.3	amd	149	135	14	21	19	-25	0	83	12	93	18	
53.0	apt	42	33	9	8	8	-7	0	374	244	412	295	
43.2	bae	66	52	14	8	8	-2	0	405	203	404	237	
60.5	bla	20	-10	30	11	12	7	1	180	148	136	151	
68.1	bmv	60	69	-9	12	11	-14	0	171	92	220	107	
43.5	bsu	58	48	10	8	8	-6	0	397	219	404	248	
42.4	cbd	50	30	20	8	8	4	1	404	242	396	292	
28.3	cbl	40	35	5	7	7	-9	0	435	289	507	356	
33.3	cff	-5	-22	18	8	8	2	1	298	312	310	388	
54.1	cgq	70	0	69	10	10	49	1	250	121	217	216	
30.5	cje	33	28	4	7	7	-10	0	427	307	491	369	
63.0	dvl	125	122	4	14	11	-21	0	174	40	275	67	
49.7	eal	63	58	5	9	8	-12	0	362	189	370	204	
50.8	eco	73	61	13	9	8	-4	0	374	173	373	199	
55.1	eno	68	53	16	9	9	-2	0	314	154	326	190	
57.5	kpn	50	47	3	9	9	-15	0	284	170	311	193	
36.3	lat	11	-10	20	8	7	5	1	323	290	343	378	
37.1	liv	53	64	-11	7	7	-4	0	486	282	483	249	
35.3	lla	66	54	11	7	7	-3	0	481	243	475	272	
60.0	pac	-21	-59	38	14	13	12	1	95	117	89	163	
66.6	pae	126	87	39	13	12	14	1	197	45	193	76	
59.6	pgd	29	18	11	10	9	-9	0	241	180	249	207	
31.1	pmh	29	-1	30	8	7	15	1	398	297	360	364	
45.5	ppoy	50	3	46	8	9	29	1	356	214	264	255	
61.3	ret	84	41	42	10	10	23	1	280	115	258	170	
67.4	roa	101	57	45	16	16	12	1	116	38	95	53	
65.4	rru	25	-4	29	10	11	8	1	207	161	174	181	
73.3	salb	172	120	52	30	52	-30	0	40	3	12	3     *
56.8	say	77	43	33	10	10	14	1	276	123	259	167	
51.3	sbz	51	39	12	9	8	-5	0	336	200	336	227	
32.1	sep	33	34	-1	7	7	-13	0	464	333	439	312	
72.2	sgr	120	103	17	32	33	-47	0	32	8	28	9     *
70.7	sma	102	118	-16	27	32	-43	0	40	13	31	8     *
62.7	smk	86	36	50	11	11	28	1	230	92	201	140	
52.1	sty	50	47	3	9	8	-15	0	332	200	349	216	
59.1	synd	41	-2	42	11	11	21	1	210	139	179	182	
65.0	xcb	66	70	-5	10	11	-16	0	255	129	229	110	
47.6	ype	24	14	10	8	8	-7	0	322	252	326	282	
								15					
								total ok			

Différences entre codons dues à la séquence des gènes: tableaux pour tableur[modifier | modifier le wikicode]

. − DE at

Différences entre codons dues à la séquence des gènes: tableaux pour diagrammes dif-difxz[modifier | modifier le wikicode]

. − La largeur des colonnes est de 1.3 cm.
dif-difac[modifier | modifier le wikicode]
dif-difag[modifier | modifier le wikicode]
dif-difat[modifier | modifier le wikicode]
dif-diftc[modifier | modifier le wikicode]
dif-diftg[modifier | modifier le wikicode]
dif-difcg[modifier | modifier le wikicode]

Différences entre codons dues à la séquence des gènes: tableaux pour le calcul de la moyenne[modifier | modifier le wikicode]

dif-difac2[modifier | modifier le wikicode]
(*) non retenu pour les diagrammes
(") différence significative (difS)
dif-difag2[modifier | modifier le wikicode]
(*) non retenu pour les diagrammes
(") différence significative (difS)
(**) différence significative, non retenu pour les diagrammes (extrêmes)
dif-difat2[modifier | modifier le wikicode]
(*) non retenu pour les diagrammes
(") différence significative (difS)
(**) différence significative, non retenu pour les diagrammes (extrêmes)
dif-diftc2[modifier | modifier le wikicode]
(*) non retenu pour les diagrammes
(") différence significative (difS)
dif-diftg2[modifier | modifier le wikicode]
(*) non retenu pour les diagrammes
(") différence significative (difS)
dif-difcg2[modifier | modifier le wikicode]
(*) non retenu pour les diagrammes
(") différence significative (difS)

Notes et références[modifier | modifier le wikicode]