Aller au contenu

Recherche:Les clusters de gènes tRNA et rRNA chez les procaryotes/Annexe/archeo

Une page de Wikiversité, la communauté pédagogique libre.
archeo
Image logo représentative de la faculté
Annexe 10
Recherche : Les clusters de gènes tRNA et rRNA chez les procaryotes
Précédent :spiro
Suivant :génomes synthèse
En raison de limitations techniques, la typographie souhaitable du titre, « Annexe : archeo
Les clusters de gènes tRNA et rRNA chez les procaryotes/Annexe/archeo
 », n'a pu être restituée correctement ci-dessus.



Methanobacterium formicicum DSM1535

mfi opérons

  • Lien tableur: mfi opérons
  • Liens: gtRNAdb [1], NCBI [2], génome [orgn]
  • Phylogénie: Archaea; Euryarchaeota; Methanomada group; Methanobacteria; Methanobacteriales; Methanobacteriaceae; Methanobacterium.
  • Légende: cdsa: cds aas, cdsd: cds dirigé
Ar1. mfi opérons, Methanobacterium formicicum DSM1535
41.2%GC 17.8.19 Paris  47   doubles intercal cds aa avec aa cdsa cdsd protéines
157153..157563 CDS 36 36 137
comp 157600..157683 ctc 246 246
157930..158232 CDS 101
comp 211693..213681 CDS 206 206 663
213888..213971 tcg 281 281
214253..215677 CDS 475
comp 314088..314264 CDS 50 50 59
comp 314315..314487 caa @1 -1 -1
comp 314487..314654 CDS 56
comp 317759..318211 CDS 198 198 151
comp 318410..318494 tcc 177 177
comp 318672..319634 CDS 321
comp 419250..419975 CDS 156 156 242
comp 420132..420204 aac 29 29
comp 420234..420545 CDS 104
comp 466570..467484 CDS 223 223 305
comp 467708..467792 agc 186 186
comp 467979..468294 ncRNA @2 122 122 316
468417..469397 CDS 327
681116..681676 CDS 37 37 187
comp 681714..681786 gcg 195 195
comp 681982..682488 CDS 169
695936..696538 CDS 939 939 201
comp 697478..697600 5s 305 123
comp 697906..700772 23s 233 2867
comp 701006..701079 gca 87
comp 701167..702646 16s 724 724 1480
703371..704336 CDS 322
comp 746487..747290 CDS 155 155 268
comp 747446..747518 acc 85 85
comp 747604..747686 tta 303 303
747990..748163 CDS 58
comp 800615..801820 CDS 43 43 402
comp 801864..801935 caa 72 72
comp 802008..802697 CDS 230
comp 963425..964432 CDS 273 273 336
964706..964778 aac 5 5
964784..964857 atgi 58 58
964916..964990 gaa 53 53
965044..965127 cta 29 29
965157..965232 cac 146 146
965379..965717 CDS 113
comp 974621..974842 CDS 564 564 74
975407..975480 aag 90 90
975571..975653 ttg 504 504
976158..976231 aaa 148 148
comp 976380..976679 CDS 100
comp 1006329..1008095 CDS 397 397 589
1008493..1008614 5s @3 748 122
1009363..1009485 5s 286 123
1009772..1012638 23s 233 2867
1012872..1012945 gca 72
1013018..1014497 16s 454 454 1480
1014952..1016097 CDS 382
comp 1088211..1088831 CDS 53 53 207
comp 1088885..1089038 tgg @1 40 40
comp 1089079..1089150 tgc 212 212
comp 1089363..1089746 CDS 128
1143658..1144137 CDS 166 166 160
comp 1144304..1144610 ncRNA @2 14 14 307
comp 1144625..1144699 atgf 139 139
comp 1144839..1145162 CDS 108
1153368..1154087 CDS 56 56 240
1154144..1154217 aga 62 62
1154280..1154354 agg 552 552
comp 1154907..1156157 CDS 417
1247204..1247659 CDS 4 4 152
comp 1247664..1247739 cga 133 133
comp 1247873..1248481 CDS 203
comp 1320721..1321641 CDS 183 183 307
1321825..1321896 gta 99 99
1321996..1322067 gtg 228 228
comp 1322296..1323084 CDS 263
comp 1403886..1409507 CDS 351 351 1874
comp 1409859..1409930 cgc 222 222
comp 1410153..1410620 CDS 156
1532795..1533088 CDS 127 127 98
comp 1533216..1533325 atgj @1 246 246
1533572..1534402 CDS 277
1541929..1542321 CDS 127 127 131
1542449..1542522 ggg 1 1
comp 1542524..1543528 CDS 335
1602054..1603277 CDS 257 257 408
1603535..1603608 aca 76 76
1603685..1603759 cca 44 44
1603804..1603877 tac 170 170
1604048..1604119 gac 7 7
1604127..1604200 aaa 24 24
1604225..1604461 CDS 79
1617553..1617861 CDS 187 187 103
1618049..1618133 tca 252 252
1618386..1619444 CDS 353
comp 1692202..1692552 CDS 271 271 117
comp 1692824..1692895 cag 156 156
comp 1693052..1693972 CDS 307
1887796..1888038 CDS 136 136 81
1888175..1888257 ctg 193 193
1888451..1891267 CDS 939
2057488..2057883 CDS 230 230 132
2058114..2058184 tgc 143 143
2058328..2059713 CDS 462
2128536..2129312 CDS 123 123 259
2129436..2129509 acg 362 362
comp 2129872..2130963 CDS
comp 2204492..2204932 CDS 178 178 147
2205111..2205182 gtc 4 4
2205187..2205259 ttc 283 283
comp 2205543..2205875 CDS 111
2317208..2317498 CDS 271 271 97
2317770..2317842 atc 460 460
2318303..2318863 CDS 187
comp 2414821..2415903 CDS 491 491 361
2416395..2416468 gcc 303 303
comp 2416772..2417797 CDS 342
comp 2432399..2432848 CDS 537 537 150
2433386..2433459 ggc 2 2
2433462..2433535 gga 326 326
comp 2433862..2434263 CDS 134

mfi cumuls

cumuls. mfi.
opérons Fréquences intercalaires tRNAs Fréquences intercalaires cds Fréquences aas cds chromosome
effectif gammes sans rRNAs avec rRNAs gammes cds gammes cdsd gammes cdsa gammes cdsa 300
avec rRNA opérons 2 1 0 - 1 2 1 100 9 30 0
16 23 5s 0 0 20 4 50 8 20 200 21 60 3
16 gca 235 2 40 2 100 3 40 300 10 90 3
16 23 5s a 0 60 3 150 10 60 400 12 120 10
max a 1 80 2 200 12 80 500 5 150 7
a doubles 0 100 3 250 8 100 600 1 180 5
autres 2 120 0 300 7 120 700 1 210 5
total aas 2 140 0 350 3 140 800 0 240 2
sans opérons 29 160 0 400 3 160 900 0 270 4
1 aa 20 180 1 450 0 180 1000 1 300 1
max a 5 200 0 500 3 200 1100 0 330 6
a doubles 0 1 5 1 15
total aas 45 16 0 64 0 61 61
total aas 47
remarques 3
avec jaune moyenne 83 224 266
variance 121 176 265
sans jaune moyenne 35 178 213 171
variance 27 96 115 81

mfi blocs

Ar1. mfi blocs, Methanobacterium formicicum DSM1535
CDS 939 201
5s 305 123
23s 233 2867
gca 87
16s 724 1480
CDS 322
CDS 397 589
5s 748 !122
5s 286 123
23s 233 2867
gca 72
16s 454 1480
CDS 382

mfi remarques

  • Lien tableur: mfi remarques
  • Remarques: pas de doubles mais des séquences. Il n’y a pas de cgt, on est avec les archées.
    1. @ Les introns des(gtRNAdb) archées existent pour tgg et atgj tujours. Ici en plus il y a un caa.
      - caa (Join(314315..314349,314448..314487)), l’intron empiète sur le cds d’où l’intercalaire négatif.
      - tgg ( join(1088885..1088919,1089000..1089038)), l’intron mais n’empiète pas sur les cds.
      - atgj Join(1533216..1533251,1533288..1533325), n’empiète pas sur les cds. C’est Met mais pas Il2 ni atgf.
    2. @ Ces ncRNAs sont dans le même cluster, sur le même brin qu’ un tRNA et très proche de lui, agc 186 et atgf 14. Ils sont petits respectivement 316 et 307 pbs.
    3. @ Le 5s collé au cluster du 16sgca23s5s, il se comporte comme un tRNA. Il a une pb de moins que les 2 autres 5s.
  • Séquence des doubles: aucun double dans une séquence. Les doubles exitants sont gca aac aaa caa tgc.
  • Tableau du code génétique de mfi
    Légende: prélèvement de la base gtRNAdb le 17.8.19
    • - totaux en en-tête, 47 total de gtRNAdb contenant des pseudo et inconnus; 47 total du cumul.
    • - atgi, c'est Ile2, mis à la place de ttt, très rare chez les procaryotes.
    • - atgf, c'est Metf, mis à la place de tgt, très rare chez les procaryotes.
    • - atgj, c'est Met, remplace le atg standard qui est la somme Ile2 Metf Met.
    • - Voir la légende des tris et couleurs, g1 t1.
Ar1. mfi, Methanobacterium formicicum DSM1535
g1    t1       47  47
atgi 1 tct tat atgf 1
att act aat agt
ctt cct cat cgt
gtt gct gat ggt
ttc 1 tcc 1 tac 1 tgc 2
atc 1 acc 1 aac 2 agc 1
ctc 1 ccc cac 1 cgc 1
gtc 1 gcc 1 gac 1 ggc 1
tta 1 tca 1 taa tga
ata aca 1 aaa 2 aga 1
cta 1 cca 1 caa 2 cga 1
gta 1 gca 2 gaa 1 gga 1
ttg 1 tcg 1 tag tgg 1
atgj 1 acg 1 aag 1 agg 1
ctg 1 ccg cag 1 cgg
gtg 1 gcg 1 gag ggg 1

mfi distribution

Ar1. mfi distribution. Methanobacterium formicicum DSM1535. Archée
g1    t1       
atgi 1 tct tat atgf 1
att act aat agt
ctt cct cat cgt
gtt gct gat ggt
ttc 1 tcc 1 tac 1 tgc 2
atc 1 acc 1 aac 2 agc 1
ctc 1 ccc cac 1 cgc 1
gtc 1 gcc 1 gac 1 ggc 1
tta 1 tca 1 taa tga
ata aca 1 aaa 2 aga 1
cta 1 cca 1 caa 2 cga 1
gta 1 gca 2 gaa 1 gga 1
ttg 1 tcg 1 tag tgg 1
atgj 1 acg 1 aag 1 agg 1
ctg 1 ccg cag 1 cgg
gtg 1 gcg 1 gag ggg 1
arch >1aa =1aa -5s +5s -16s +16s total
mfi 25 20 * 2 47

Methanocaldococcus jannaschii DSM 2661

mja opérons

  • Lien tableur: mja opérons
  • Liens: gtRNAdb [3], NCBI [4], génome [5]
  • Phylogénie: Archaea; Euryarchaeota; Methanomada group; Methanococci; Methanococcales; Methanocaldococcaceae; Methanocaldococcus.
  • Légende: cdsa: cds aas, cdsd: cds dirigé
Ar2. mja opérons, Methanocaldococcus jannaschii DSM 2661
31.3%GC 17.8.19 Paris  37   doubles intercal cds aa avec aa cdsa cdsd protéines
comp 96499..97053 CDS 372 372 185
comp 97426..97537 atgj @1 91 91
97629..97716 ctc 241 241
97958..99259 CDS 434
comp 110328..111545 CDS 222 222 406
111768..111852 tga 21 21
111874..112785 CDS 304
137244..138245 CDS 98 98 334
comp 138344..138419 gtg 59 59
comp 138479..138781 CDS 101
153070..154479 CDS 182 182 470
comp 154662..157639 23s 207 2978
comp 157847..157919 gca 64
comp 157984..159463 16s 340 340 1480
159804..160085 CDS 94
comp 185874..186671 CDS 306 306 266
186978..187066 tcc 71 71
187138..187590 CDS 151
190579..190800 CDS 31 31 74
190832..190908 ccc 32 32
190941..191114 CDS 58
comp 214560..215060 CDS 149 149 167
215210..215297 tta 154 154
215452..216240 CDS 263
226386..227639 CDS 64 64 418
comp 227704..227780 gcc 239 239
228020..229720 CDS 567
303613..303927 CDS 64 64 105
303992..304081 tca 230 230
comp 304312..304752 CDS 147
comp 357984..358547 CDS 220 220 188
358768..358845 aga 23 23
358869..358943 gaa 164 164
359108..359923 CDS 272
359108..359923 CDS 48 48 272
comp 359972..360047 atgf 103 103
comp 360151..361485 CDS 445
401945..402796 CDS 171 171 284
comp 402968..403044 gtc 229 229
403274..403834 CDS 187
comp 618311..618757 CDS 402 402 149
comp 619160..619234 tgc 63 63
comp 619298..619915 CDS 206
636394..637449 CDS 133 133 352
637583..637659 ttc 7 7
637667..637742 aac 29 29
637772..637849 atgi 18 18
637868..637942 gaa 39 39
637982..638069 cta 11 11
638081..638152 cac 295
638448..639930 16s 64 1483
639995..640067 gca 207
640275..643254 23s 78 2980
643333..643447 5s 56 115
643504..643761 ncRNA @2 232 232 258
643994..644962 CDS 323
762859..763608 CDS 157 157 250
comp 763766..763842 acc 178 178
764021..764096 caa 50 50
764147..764818 CDS 224
862207..862410 CDS 179 179 68
862590..862661 cga 41 41
862703..863392 CDS 86 86 230
863479..863555 aca 14 14
863570..863647 cca 8 8
863656..863732 tac 83 83
863816..863889 aaa 13
863903..864017 5s @3 46 115
864064..864141 gac 80 80
864222..864842 CDS 207
871492..873447 CDS 238 238 652
comp 873686..873763 atc 102 102
comp 873866..875110 CDS 415
comp 882566..883615 CDS 65 65 350
883681..883754 gta 123 123
comp 883878..884297 CDS 140
comp 1037197..1038504 CDS 39 39 436
comp 1038544..1038620 cgc @4 1 1
comp 1038622..1039386 CDS 255
comp 1148669..1149934 CDS 210 210 422
1150145..1150220 ggc 34 34
1150255..1150330 gga 243 243
1150574..1151254 CDS 227
comp 1188906..1189772 CDS 172 172 289
1189945..1190055 tgg @1 95 95
1190151..1190684 CDS 178
comp 1312335..1312781 CDS 383 383 149
1313165..1313249 agc 177 177
1313427..1314617 CDS 397

mja cumuls

cumuls. mja.
opérons Fréquences intercalaires tRNAs Fréquences intercalaires cds Fréquences aas cds chromosome
effectif gammes sans rRNAs avec rRNAs gammes cds gammes cdsd gammes cdsa gammes cdsa 300
avec rRNA opérons 2 1 0 0 1 1 1 100 4 30 0
16 23 5s 0 0 20 0 5 50 7 20 200 12 60 1
16 atc gca 0 40 2 2 100 10 40 300 13 90 2
16 23 5s a 0 60 0 0 150 5 60 400 6 120 3
max a 7 80 0 0 200 8 80 500 8 150 4
a doubles 0 100 1 1 250 10 100 600 1 180 3
autres 2 120 0 0 300 0 120 700 1 210 5
total aas 13 140 0 0 350 2 140 800 0 240 3
sans opérons 20 160 0 0 400 2 160 900 0 270 4
1 aa 16 180 1 0 450 1 180 1000 0 300 4
max a 2 200 0 0 500 0 200 1100 0 330 2
a doubles 0 0 0 0 0 14
total aas 24 4 8 46 0 45 45
total aas 37
remarques 4
avec jaune moyenne 82 26 154 269
variance 71 25 102 137
sans jaune moyenne 29 18 152 253 194
variance 8 12 95 117 74

mja blocs

Ar2. mja blocs, Methanocaldococcus jannaschii DSM 2661
CDS 182
23s 207 2978
gca 64
16s 340 1480
CDS
cac 295
16s 64 1483
gca 207
23s 78 2980
5s 56 115
ncRNA 232 258
CDS
aaa 13
5s 46 115
gac 80
CDS

mja remarques

  • Lien tableur: mja remarques
  • Remarques: pas de doubles mais des séquences. Il n’y a pas de cgt, on est avec les archées.
    1. @ Les introns (gtRNAdb) des archées existent toujours pour tgg et atgj.
      - tgg, Join(1189945..1189984,1190018..1190055), l’ intron mais n’empiète pas sur les cds.
      - atgj, Join(97426..97464,97500..97537), n’empiète pas sur les cds. C’est Met mais pas Il2 ni atgf.
    2. @ Ce ncRNA est dans et sur le même brin que le cluster et très proche de lui, 56 au lieu de 232 avec cds. Il est petit, 258 pbs comme pour mfi.
    3. @ Le 5s est décollé du cluster du 16sgca23s, il se comporte comme un tRNA et est dans leur séquence. C’est pour ça que j’ai ces aas dans la colonne “avec rRNAs”.
    4. @ cgc très collé à ses 2 cds
  • Séquence des doubles: aucun double dans une séquence. Les doubles exitants sont gca gaa.
  • Tableau du code génétique de mja
    Légende: prélèvement de la base gtRNAdb le 17.8.19
    • - totaux en en-tête, 37 total de gtRNAdb contenant des pseudo et inconnus; 37 total du cumul.
    • - atgi, c'est Ile2, mis à la place de ttt, très rare chez les procaryotes.
    • - atgf, c'est Metf, mis à la place de tgt, très rare chez les procaryotes.
    • - atgj, c'est Met, remplace le atg standard qui est la somme Ile2 Metf Met.
    • - Voir la légende des tris et couleurs, g1 t1.
Ar2. mja, Methanocaldococcus jannaschii DSM 2661
g1    t1       37  37
atgi 1 tct tat atgf 1
att act aat agt
ctt cct cat cgt
gtt gct gat ggt
ttc 1 tcc 1 tac 1 tgc 1
atc 1 acc 1 aac 1 agc 1
ctc 1 ccc 1 cac 1 cgc 1
gtc 1 gcc 1 gac 1 ggc 1
tta 1 tca 1 taa tga 1
ata aca 1 aaa 1 aga 1
cta 1 cca 1 caa 1 cga 1
gta 1 gca 2 gaa 2 gga 1
ttg tcg tag tgg 1
atg 1 acg aag agg
ctg ccg cag cgg
gtg 1 gcg gag ggg

mja distribution

Ar2. mja distribution, Methanocaldococcus jannaschii DSM 2661. Archée
g1    t1       
atgi 1 tct tat atgf 1
att act aat agt
ctt cct cat cgt
gtt gct gat ggt
ttc 1 tcc 1 tac 1 tgc 1
atc 1 acc 1 aac 1 agc 1
ctc 1 ccc 1 cac 1 cgc 1
gtc 1 gcc 1 gac 1 ggc 1
tta 1 tca 1 taa tga 1
ata aca 1 aaa 1 aga 1
cta 1 cca 1 caa 1 cga 1
gta 1 gca 2 gaa 2 gga 1
ttg tcg tag tgg 1
atgj 1 acg aag agg
ctg ccg cag cgg
gtg 1 gcg gag ggg
arch >1aa =1aa -5s +5s -16s +16s total
mja 8 16 1 4 6 * 2 37

mja intercalaires entre cds

  • Lien NCBI [6] 9.4.20
  • Note: Pour les génomes des annexes j'ai relevé les intercalaires entre tRNAs et entre ceux-ci et les cds qui leur sont adjacents. L'exemple est celui de rru du clade alpha. L'idée de départ de ces prélèvements est la recherche d'opérons formés de tRNA et de protéine comme dans le cas d'E.coli: l'intercalaire entre le tRNA et la protéine devrait être faible. Voir l'exemple d'eco (remarque @3) avec tac-tac-tpr et aca-tac-gga-acc-tufB.

mja les fréquences

  • Lien tableur: mja intercalaires entre cds
  • Légende:   long, longueur en pbs,   intercal pour intercalaire
    - fréquence-1 1 5 6 f, respectivement fréquence des intercalaires négatives à l'unité, positives à l'unité, par blocs de 5, par blocs de 10 jusqu'à 600 pbs et f pour finales. Ces fréquences servent à faire les diagrammes. La fréquence fréquence6 est étendue à 1200 pour certains grands génomes.
    - cumul,% colonne à la droite de frequence6, reprend les fréquences par plages et leurs pourcentages indiqués déjà dans la 1ère partie du tableau.
    - La couleur cyan des fréquences fréquence-1 et 1 sert à montrer leur périodicité ternaire.
    - intercaln intercalx, pour les intercalaires négatifs minimaux et intercalaires positifs maximaux.
    - colonne ADN pour la longueur totale du génome en pbs et intercals pour le total en pbs des intercalaires entre cds uniquement, d'après la méthode des prélèvements de NCBI du 9.4.20.
mja Les fréquences des intercalaires entre cds
mja intercalaires total % intercalaires moyenne ecartype plage ADN intercal frequence5
négatif 219 12.7 négatif -13 14 -1 à -83 1 664 970 -1 219
zéro 21 1.2 intercals 0 21
1 à 200 1275 73.7 0 à 200 64 56 151 580 5 128
201 à 370 166 9.6 201 à 370 265 47 9.1% 10 100
371 à 600 37 2.1 371 à 600 438 51 15 102
601 à max 12 0.7 601 à 1028 675 39 20 83
total 1730 <201 88 total 1727 85 109 -83 à 724 25 73
adresse intercalx intercal fréquence1 intercal fréquence6 cumul,% intercal fréquence-1 30 35
470326 1019 -1 219 -70 3 0 21 35 39
47370 859 0 21 -60 3 -1 25 40 27
451281 848 1 30 -50 1 -2 0 45 36
449897 724 2 40 -40 5 -3 0 50 25
291222 711 3 9 -30 10 min à -1 -4 77 55 18
623421 694 4 38 -20 25 219 -5 2 60 37
1432395 694 5 11 -10 44 12.7% -6 4 65 22
694012 687 6 9 0 149 -7 3 70 36
1461617 685 7 7 10 228 -8 14 75 21
1176472 629 8 20 20 185 -9 3 80 27
328329 625 9 35 30 108 -10 1 85 27
911715 622 10 29 40 66 1 à 200 -11 12 90 44
106958 542 11 23 50 61 935 -12 3 95 22
91672 527 12 26 60 55 54.0% -13 4 100 33
692428 522 13 20 70 58 -14 10 105 21
256182 501 14 18 80 48 -15 3 110 17
1370826 495 15 15 90 71 -16 2 115 21
15863 490 16 15 100 55 -17 5 120 25
424100 489 17 12 110 38 -18 2 125 22
1547813 489 18 19 120 46 -19 2 130 20
73799 487 19 21 130 42 -20 6 135 25
1128054 479 20 16 140 51 -21 1 140 26
777753 478 21 20 150 34 -22 0 145 18
983847 478 22 15 160 31 -23 7 150 16
1338520 474 23 10 170 21 1 à 200 -24 1 155 15
518562 472 24 14 180 28 1275 -25 4 160 16
410085 456 25 14 190 24 74% -26 1 165 11
1291124 450 26 10 200 25 -27 0 170 10
1607321 446 27 8 210 15 -28 1 175 16
1596121 439 28 3 220 22 -29 4 180 12
439827 431 29 6 230 17 -30 0 185 10
489906 417 30 8 240 12 -31 0 190 14
966335 417 31 7 250 12 0 à 200 -32 5 195 16
7338 412 32 6 260 7 1296 223 200 9
325298 411 33 12 270 13 reste 17 205 6
1119539 406 34 13 280 9 total 240 210 9
258119 400 35 1 290 14 215 11
36 5 300 4 220 11
37 4 310 5 225 5
38 6 320 12 230 12
39 11 330 3 235 5
40 1 340 6 201 à 370 240 7
reste 903 350 3 166 245 6
total 1730 360 6 9.6% 250 6
370 6 255 4
380 6 260 3
390 3 265 7
adresse intercaln décalage long 400 4 270 6
349543 -83 shift2 635 410 1 275 7
541115 -73 shift2 498 420 4 280 2
575292 -71 shift2 146 430 0 285 9
125178 -64 shift2 246 440 2 290 5
1600078 -62 comp 450 2 295 3
1611178 -62 shift2 1499 460 1 300 1
28018 -59 shift2 497 470 0 305 4
316817 -49 shift2 495 480 5 310 1
1478759 -48 comp 490 4 315 6
739648 -44 shift2 851 500 1 320 6
875683 -41 shift2 635 510 1 325 3
1378478 -41 shift2 1910 520 0 330 0
12869 -39 530 2 335 5
1051112 -38 540 0 371 à 600 340 1
1285398 -38 550 1 37 345 2
1623026 -38 560 0 2.1% 350 1
697374 -35 570 0 355 3
1152607 -34 580 0 601 à max 360 3
1328814 -34 590 0 12 365 4
139527 -32 600 0 0.7% 370 2
312088 -32 reste 12 reste 49
352843 -32 total 1730 total 1730

mja autres intercalaires

  • Lien tableur: mja autres intercalaires
  • Légende:  
    - comp, le gène est sur le brin complement
    - deb, fin sont respectivement dans le sens des adresses croissantes, le cds avant le 1er tRNA et le cds après le dernier tRNA du bloc.
mja Les autres intercalaires.
mja1 adresses1
deb-fin gènes adresses intercal sens
deb CDS 1664008 ? comp
repeat_region 378 89
fin CDS 2216 comp
deb CDS 96499 372 comp
tRNA 97426 91 comp
tRNA 97629 241
fin CDS 97958
deb CDS 110328 250 comp
tRNA 111766 19
fin CDS 111874
deb CDS 131467 369
repeat_region 132922 114
fin CDS 134114 comp
deb CDS 137244 98
tRNA 138344 59 comp
fin CDS 138479 comp
deb CDS 153070 182
rRNA 154662 207 comp
tRNA 157847 64 comp
rRNA 157984 340 comp
fin CDS 159804
deb CDS 185874 306 comp
tRNA 186978 71
fin CDS 187138
deb CDS 190579 31
tRNA 190832 32
fin CDS 190941
deb CDS 214560 149 comp
tRNA 215210 154
fin CDS 215452
deb CDS 226386 64
tRNA 227704 239 comp
fin CDS 228020
deb CDS 235984 394
repeat_region 236564 97
fin CDS 238282 comp
deb CDS 303622 64
tRNA 303992 230
fin CDS 304312 comp
deb CDS 351301 129 comp
repeat_region 351694 374
fin CDS 352843 comp
deb CDS 357984 220 comp
tRNA 358768 23
tRNA 358869 164
deb CDS 359108 48
tRNA 359972 103 comp
fin CDS 360151 comp
mja2 adresses2
deb-fin gènes adresses intercal sens
deb CDS 862207 179
tRNA 862590 41
deb CDS 862703 86
tRNA 863479 14
tRNA 863570 8
tRNA 863656 83
tRNA 863816 13
rRNA 863903 46
tRNA 864064 80
fin CDS 864222
deb CDS 401945 171
tRNA 402968 229 comp
fin CDS 403274
deb CDS 427091 467
repeat_region 428572 39
fin CDS 429676 comp
deb CDS 498208 604 comp
repeat_region 501491 52
fin CDS 502042 comp
deb CDS 506108 484 comp
repeat_region 507264 282
fin CDS 508398
deb CDS 551189 251 comp
ncRNA 552541 28
fin CDS 552885
deb CDS 618311 402 comp
tRNA 619160 63 comp
fin CDS 619298 comp
deb CDS 636394 133
tRNA 637583 7
tRNA 637667 29
tRNA 637772 18
tRNA 637868 39
tRNA 637982 11
tRNA 638081 295
rRNA 638448 64
tRNA 639995 207
rRNA 640275 78
rRNA 643333 56
ncRNA 643504 232
fin CDS 643994
deb CDS 762859 157
tRNA 763766 178 comp
tRNA 764021 50
fin CDS 764147
mja3 adresses3
deb-fin gènes adresses intercal sens
deb CDS 857400 118 comp
repeat_region 858112 532
fin CDS 858876
deb CDS 871492 238
tRNA 873686 102 comp
fin CDS 873866 comp
deb CDS 882566 65 comp
tRNA 883681 123
fin CDS 883878 comp
deb CDS 1033083 474 comp
repeat_region 1034820 93
fin CDS 1035848 comp
deb CDS 1037197 39 comp
tRNA 1038544 1 comp
fin CDS 1038622 comp
deb CDS 1047158 568 comp
repeat_region 1049373 181
fin CDS 1050484
deb CDS 1148669 210 comp
tRNA 1150145 34
tRNA 1150255 243
fin CDS 1150574
deb CDS 1188906 172 comp
tRNA 1189945 95
fin CDS 1190151
deb CDS 1218598 79
repeat_region 1219844 479
fin CDS 1220645 comp
deb CDS 1266436 484
repeat_region 1267046 79
fin CDS 1267794 comp
deb CDS 1312335 383 comp
tRNA 1313165 177
fin CDS 1313427
deb CDS 1455222 68
repeat_region 1456715 384
fin CDS 1457720 comp
deb CDS 1568600 484
repeat_region 1570374 121
fin CDS 1571017 comp
deb CDS 1574035 473
repeat_region 1575519 223
fin CDS 1576607

mja intercalaires tRNA

  • Lien tableur: mja intercalaires tRNA
  • Légende:
    - comp', l'intercalaire est entre un gène comp (sur le complément) et un gène sur le brin direct. Continu les 2 gènes sont sur le même brin.
    - deb, fin sont les intercalaires des cds du tableau précédent, autres intercalaires: respectivement dans le sens des adresses croissantes, le cds avant le 1er tRNA et le cds après le dernier tRNA du bloc.
  • Cumuls comp'+continu du tableau
	deb	fin	total
<201	14	16	30
total	22	21	43
taux	64%	76%	70%
mja intercalaires tRNA
mja les relevés deb-fin
comp’ entre tRNAs comp’ deb comp’ fin
comp’ 91 372 241
23 comp’ 250 19
7 comp’ 98 59
29 comp’ 306 71
18 31 32
39 comp’ 149 154
11 comp’ 64 comp’ 239
comp’ 178 64 comp’ 230
14 comp’ 220 164
8 comp’ 48 103
83 comp’ 171 comp’ 229
34 402 63
133
comp’ 157 50
179 41
86 80
comp’ 238 102
comp’ 65 comp’ 123
39 1
comp’ 210 243
comp’ 172 95
comp’ 383 177
mja intercalaires inférieures à 201 pbs
deb fin continu cumuls
31 1 deb
39 19 <201 6
64 32 total 8
86 41 taux 75%
133 50
179 59 fin
372 63 <201 15
402 71 total 17
- 80 taux 88%
- 95
- 102 total
- 103 <201 21
- 154 total 25
- 164 taux 84%
- 177
- 241
- 243 comp’ cumuls
48 123 deb
64 229 <201 8
65 230 total 14
98 239 taux 57%
149 -
157 - fin
171 - <201 1
172 - total 4
210 - taux 25%
220 -
238 - total
250 - <201 9
306 - total 18
383 - taux 50%

mja intercalaires rRNA

  • Voir la présentation des blocs à rRNA dans le chapitre mja blocs de l'étude préliminaire. A comparer avec le tableau mja autres intercalaires.
  • Remarque: Quand le 16s n'est pas précédé de tRNAs l'intercalaire cds-16s est élevé, il est ici pour les 2 blocs de 340 295 pbs. L'intercalaire cds-bloc de l'autre côté du bloc est beaucoup plus faible, il est ici pour les 2 blocs de, respectivement, 182 232 pbs. Cette orientation est quasiment générale chez tous les génomes que j'ai étudié ici. Je l'ai notée dans les chapitres génome-bloc de chaque génome.
  • Note: J'ai supposé souvent que les blocs à tRNA sans rRNA sont aussi orientés de l'intercalaire le plus grand au plus petit. Dans mja cumuls et de même pour les autres génomes, j'ai noté cette orientation dans la colonne cdsd, pour cds dirigé. Je n'ai conservé pour les calculs que le plus petit intercalaire des 2 cds bordant le bloc. L'idée était que cette orientation provoquait la création du cds en fin de bloc. Ces cds sont souvent de petites protéines et souvent hypothétiques. Aussi je présente ci-dessous la transformation deb-fin qui est imposée par l'adressage en intercalaire plus grand et plus petit.
deb	fin		tri	grand	petit
372	241		18	39	1
250	19		2	250	19
98	59		5	32	31
306	71		14	179	41
31	32		10	103	48
149	154		13	157	50
64	239		3	98	59
64	230		12	402	63
220	164		7	239	64
48	103		8	230	64
171	229		17	123	65
402	63		4	306	71
157	50		15	86	80
179	41		20	172	95
86	80		16	238	102
238	102		6	154	149
65	123		9	220	164
39	1		11	229	171
210	243		21	383	177
172	95		19	243	210
383	177		1	372	241

Methanosarcina barkeri str. Fusaro

mba opérons

  • Lien tableur: mba opérons
  • Liens: gtRNAdb [7], NCBI [8], génome [9]
  • Phylogénie: Archaea; Euryarchaeota; Stenosarchaea group; Methanomicrobia; Methanosarcinales; Methanosarcinaceae; Methanosarcina.
  • Légende: cdsa: cds aas, cdsd: cds dirigé
Ar3. mba opérons, Methanosarcina barkeri str. Fusaro
39.2%GC 2.2.20 Paris  62   doubles intercal cds aa avec aa cdsa cdsd protéines
91192..91938 cds 137 137 249 DUF429 domain-containing protein
comp 92076..92160 ctc + 132 132
comp 92293..92377 ctc 2 ctc 298 298
comp 92676..93476 cds 267 DNA-directed RNA polymerase subunit D
comp 98630..99337 cds 535 535 236 ABC transporter ATP-binding protein
comp 99873..99955 tcc 222 222
comp 100178..101194 cds 339 RNA-guided pseudouridylation complex pseudouridine synthase subunit Cbf5
comp 146979..147518 cds 80 80 180 tyrosine-type recombinase/integrase
comp 147599..147670 acc 198 198
comp 147869..148381 cds 171 DUF98 domain-containing protein
comp 199345..200268 cds 492 492 308 aldolase
comp 200761..200833 aac + 71 71
comp 200905..200979 atgi 2 aac 119 119
comp 201099..201171 aac 964 964
202136..202366 cds 77 hp
260990..261532 cds 173 173 181 nitroreductase family protein"
261706..261777 cgg 673 673
262451..262960 cds 170 hp
comp 463836..464723 cds 2075 2075 296 polyprenyl synthetase family protein
466799..466870 gga 94 94
466965..467049 cta 221 221
comp 467271..468818 cds 516 MBL fold metallo-hydrolase
473154..473723 cds 298 298 190 hp
comp 474022..474096 gag 246 246
comp 474343..475584 cds 414 proteasome-activating nucleotidase
comp 692109..692987 cds 349 349 293 branched-chain-amino-acid transaminase
693337..693411 aga 400 400
comp 693812..694420 cds 203 sulfite exporter TauE/SafE family protein
comp 703446..703958 cds 488 488 171 biotin transporter BioY
704447..704521 agg 283 283
704805..705284 cds 160 N-acetyltransferase
comp 800463..800642 cds 799 799 60 hp
comp 801442..801526 agc 137 137
comp 801664..801978 ncRNA @1 327 327 315
802306..803931 cds 542 methylamine methyltransferase corrinoid protein reductive activase
1109819..1110013 cds 15 15 65 hp
1110029..1110103 atgf + 63 63
1110167..1110241 atgf 3 atg 63 63
1110305..1110379 atgf 273 273
1110653..1111984 cds 444 signal recognition particle protein
comp 1134460..1135074 cds 235 235 205 endonuclease III
comp 1135310..1135381 tgc + 65 65
comp 1135447..1135518 tgc 2 tgc 126 126
comp 1135645..1136277 cds 211 hp
1137210..1137680 cds 488 488 157 P-bacterioferritin
comp 1138169..1138290 5s 129 122
comp 1138420..1141252 23s 222 2833
comp 1141475..1142963 16s 830 830 1489
1143794..1145302 cds 503 2-isopropylmalate synthase
comp 1249870..1250040 cds 423 423 57 CopG family transcriptional regulator
comp 1250464..1250537 aag 546 546
1251084..1251290 cds 69 TRAM domain-containing protein
1315521..1315691 cds @2 -12 -12 57 hp
comp 1315680..1315751 cgc 174 174
1315926..1317110 cds 395 redox-regulated ATPase YchF
<comp 1514831..1515373 cds 1133 1133 181 ArsR family transcriptional regulator
1516507..1516579 caa 760 760
comp 1517340..1517663 cds 108 hp
comp 1538879..1539286 cds 36 36 136 sensor histidine kinase
comp 1539323..1539395 other @3 1249 1249 73
>comp 1540645..1540794 cds 50 PKD domain-containing protein
comp 1546247..1547791 cds 576 576 515 aminotransferase class V-fold PLP-dependent enzyme
comp 1548368..1548441 aca 448 448
< 1548890..1549093 cds 68 matrixin family metalloprotease
1550566..1550760 cds 745 745 65 DeoR family transcriptional regulator
comp 1551506..1551579 aca 506 506
1552086..1552640 cds 185 YkgJ family cysteine cluster protein
1621639..1622835 cds 433 433 399 methionine adenosyltransferase
1623269..1623384 tac @4 112 112
1623497..1623569 gac 300 300
comp 1623870..1624067 cds 66 hp
1714788..1715069 cds 154 154 94 hp
comp 1715224..1715295 acg 187 187
comp 1715483..1716493 cds 337 class I SAM-dependent methyltransferase family protein
comp 1755811..1755993 cds 113 113 61 DNA-directed RNA polymerase subunit K
comp 1756107..1756181 ccg @5 0 0
comp 1756182..1756370 cds 63 DNA-directed RNA polymerase subunit N
1842058..1842195 cds 16 16 46 hp
comp 1842212..1842285 gtg 717 717
1843003..1843767 cds 255 peptidase A24
comp 1852573..1852896 cds 1364 1364 108 PadR family transcriptional regulator
comp 1854261..1854338 ccc 198 198
comp 1854537..1855097 cds 187 CDP-alcohol phosphatidyltransferase family protein
comp 1908225..1908989 cds 349 349 255 hp
comp 1909339..1909530 tgg 445 445
> 1909976..1910152 cds 59 nitrogenase reductase
1926717..1927178 cds 183 183 154 DUF4145 domain-containing protein
comp 1927362..1927445 tcg 125 125
comp 1927571..1928944 cds 458 endonuclease Q family protein
comp 2005431..2007053 cds 2315 2315 541 PKD domain-containing protein
comp 2009369..2009443 cca 199 199
comp 2009643..2010194 cds 184 UbiX family flavin prenyltransferase
comp 2026807..2028456 cds 314 314 550 ATP-dependent DNA ligase
2028771..2028842 ggg 513 513
comp 2029356..2029766 cds 137 PaaI family thioesterase
2157926..2158684 cds 567 567 253 hp
2159252..2159362 atgj 349 349
2159712..2160225 cds 171 amidohydrolase family protein
comp 2194967..2195302 cds 713 713 112 translation initiation factor eIF-1A
2196016..2197504 16s 222 1489
2197727..2200559 23s 129 2833
2200689..2200810 5s 607 607 122
comp 2201418..2201615 cds 66 hp
>comp 2434335..2434609 cds 603 603 92 nucleoside deaminase
comp 2435213..2435284 gcc 223 223
2435508..2435584 atc + 74 74
2435659..2435735 atc 2 atc 241 241
comp 2435977..2436390 cds 138 transcriptional regulator
2622097..2624025 cds 1489 1489 643 replication factor C large subunit
2625515..2625588 gta 1102 1102
2626691..2626918 cds 76 hp
2650514..2651296 cds 164 164 261 thiazole biosynthesis protein
2651461..2651532 cac 218 218
2651751..2653460 cds 570 radical SAM protein
2663547..2664668 cds 318 318 374 PGF-pre-PGF domain-containing protein
comp 2664987..2665058 ggc 263 263
2665322..2666563 cds 414 hp
2856552..2857409 cds 134 134 286 hp
comp 2857544..2857628 tca 153 153
comp 2857782..2858546 cds 255 peptidylprolyl isomerase
3326036..3326557 cds 539 539 174 hp
3327097..3327168 tgc 995 995
3328164..3328898 cds 245 hp
3994472..3994921 cds 514 514 150 IS200/IS605 family transposase
comp 3995436..3995529 cga 477 477
3996007..3996714 cds 236 hp
4005709..4006026 cds 269 269 106 divalent-cation tolerance protein CutA
4006296..4006378 ttg 860 860
4007239..4009012 rpr @6 169 169 1774 Family CRISPR
comp 4009182..4009478 cds 99 CRISPR-associated endonuclease Cas2
comp 4031590..4031871 cds 1075 1075 94 hp
4032947..4033019 cag 182 182
comp 4033202..4033765 cds 188 hp
comp 4041205..4041960 cds 96 96 252 MBL fold metallo-hydrolase
4042057..4042141 tta 375 375
comp 4042517..4044976 cds 820 beta-propeller fold lactonase family protein
comp 4045359..4048274 cds 718 718 972 PKD domain-containing protein
4048993..4049077 tta 35 35
comp 4049113..4052403 cds 241 241 1097 PGF-pre-PGF domain-containing protein
4052645..4052729 tta 177 177
comp 4052907..4053395 cds 163 MarR family transcriptional regulator
4407561..4407830 cds 64 64 90 elongation factor 1-beta
4407895..4407966 gcg 675 675
comp 4408642..4409715 cds 358 radical SAM protein
comp 4504139..4504300 cds 536 536 54 hp
comp 4504837..4504921 ctg 220 220
comp 4505142..4506050 cds 303 ornithine carbamoyltransferase
comp 4551177..4551851 cds 566 566 225 MBL fold metallo-hydrolase
4552418..4552491 gtc + 94 94
4552586..4552660 ttc 2 gtc 7 7
4552668..4552739 ggc 2 ttc 61 61
4552801..4552874 gtc 2 ggc 94 94
4552969..4553043 ttc 7 7
4553051..4553122 ggc 717 717
4553840..4554052 cds 71 MoaD/ThiS family protein
4617920..4618339 cds 200 200 140 hp
4618540..4618617 gaa 351 351
4618969..4619190 cds 377 377 74 hp
4619568..4619645 gaa 214 214
comp 4619860..4620678 cds 273 hp
4673041..4673643 cds 289 289 201 adenosylcobinamide amidohydrolase
comp 4673933..4674054 5s 129 122
comp 4674184..4677016 23s 135 2833
comp 4677152..4677224 gca 79
comp 4677304..4678792 16s 1242 1242 1489
4680035..4680817 cds 261 methanol-5-hydroxybenzimidazolylcobamide methyltransferase
comp 4759174..4759410 cds 89 89 79 DNA-directed RNA polymerase subunit H
comp 4759500..4759576 aaa 655 655
comp 4760232..4760801 cds 190 DJ-1/PfpI family protein

mba cumuls

cumuls. mba.
opérons Fréquences intercalaires tRNAs Fréquences intercalaires cds Fréquences aas cds chromosome
effectif gammes sans rRNAs avec rRNAs gammes cds gammes cdsd gammes cdsa gammes cdsa 300
avec rRNA opérons 3 1 0 - 1 2 1 100 25 30 0
16 23 5s 0 2 20 2 50 4 20 200 27 60 7
16 gca 235 1 40 0 100 4 40 300 21 90 14
16 23 5s a 0 60 0 150 6 60 400 8 120 8
max a 1 80 6 200 14 80 500 4 150 5
a doubles 0 100 3 250 9 100 600 7 180 10
autres 0 120 2 300 8 120 700 1 210 11
total aas 1 140 1 350 6 140 800 0 240 4
sans opérons 44 160 0 400 4 160 900 1 270 10
1 aa 37 180 0 450 4 180 1000 1 300 4
max a 6 200 0 500 4 200 1100 1 330 2
a doubles 6 1 35 0 21
total aas 61 15 0 100 0 96 96
total aas 62
remarques 6
avec jaune moyenne 85 457 240
variance 52 407 194
sans jaune moyenne 51 210 186 158
variance 28 98 106 78

mba blocs

Ar3. mba blocs, Methanosarcina barkeri str. Fusaro
cds 289 201 adenosylcobinamide amidohydrolase
5s 129 122
23s 135 2833
gca 79
16s 1242 1489
cds 261 methanol-5-hydroxybenzimidazolylcobamide methyltransferase
cds 713 112 translation initiation factor eIF-1A
16s 222 1489
23s 129 2833
5s 607 122
cds 66 hp
cds 488 157 P-bacterioferritin
5s 129 122
23s 222 2833
16s 830 1489
cds 503 2-isopropylmalate synthase

mba remarques

  • Lien tableur: mba remarques
  • Remarques un génome avec beaucoup de doubles dont une séquence de 3 aas.
    1. @ ncRNA, dans le même ques l que’aa, taille de 315 pbs.
    2. @ intercalaire négatif du au changement de sens
    3. @ un autre aa, other
    4. @ 4 introns
      - tac 1623269..1623304,1623349..1623384
      - tgg 1909339..1909374,1909493..1909530
      - atgj 2159252..2159289,2159327..2159362
      - cga 3995436..3995470,3995491..3995529
    5. @ un intercalaire nul sans changement de sens
    6. @ rpr, repeat région famille CRISPR, assez grand 1774 pbs. Dans le même sens que l’aa.
  • Séquence des doubles: 6 clusters avec des doubles dont une séquence de 3 aas et un triplet.
    - 2 doublets seuls ctc tgc
    - gcc 2atc
    - aac atgi aac
    - 3 atgf
    - 2 (gtc ttc ggc)
  • Tableau du code génétique de mba
    Légende: prélèvement de la base gtRNAdb le 2.2.20
    • - totaux en en-tête, 62 total de gtRNAdb contenant des pseudo et inconnus; 62 total du cumul.
    • - atgi, c'est Ile2, mis à la place de ttt, très rare chez les procaryotes.
    • - atgf, c'est Metf, mis à la place de tgt, très rare chez les procaryotes.
    • - atgj, c'est Met, remplace le atg standard qui est la somme Ile2 Metf Met.
    • - Voir la légende des tris et couleurs, g1 t1.
Ar3. mba, Methanosarcina barkeri str. Fusaro
g1    t1       62  62
atgi 1 tct tat atgf 3
att act aat agt
ctt cct cat cgt
gtt gct gat ggt
ttc 2 tcc 1 tac 1 tgc 4
atc 2 acc 1 aac 2 agc 1
ctc 2 ccc 1 cac 1 cgc 1
gtc 2 gcc 1 gac 1 ggc 3
tta 3 tca 1 taa tga
ata aca 2 aaa 1 aga 1
cta 1 cca 1 caa 1 cga 1
gta 1 gca 1 gaa 2 gga 1
ttg 1 tcg 1 tag tgg 1
atg 1 acg 1 aag 1 agg 1
ctg 1 ccg 1 cag 1 cgg 1
gtg 1 gcg 1 gag 1 ggg 1
  • intercalaires élevés avec le cds 43/100
1315680	cgc	-12	comp
1756107	ccg	0	
			
1250464	aag	423	
1623269	tac	433	
1909339	tgg	445	comp
1548368	aca	448	comp
3995436	cga	477	comp
704447	agg	488	comp
1138169	5s	488	comp
200761	aac	492	
1551506	aca	506	comp
2028771	ggg	513	comp
3995436	cga	514	comp
99873	tcc	535	
4504837	ctg	536	
3327097	tgc	539	
1250464	aag	546	comp
4552418	gtc	566	comp
2159252	atgj	567	
1548368	aca	576	
2435213	gcc	603	
2200689	5s	607	comp
4759500	aaa	655	
261706	cgg	673	
4407895	gcg	675	comp
2194967	16s	713	comp
1842212	gtg	717	comp
4553840	ggc	717	
4048993	tta	718	comp
1551506	aca	745	comp
1516507	caa	760	comp
801442	agc	799	
1141475	16s	830	comp
4006296	ttg	860	
201099	aac	964	comp
3327097	tgc	995	
4032947	cag	1075	comp
2625515	gta	1102	
1516507	caa	1133	comp
4677304	16s	1242	comp
1539323	other	1249	
1854261	ccc	1364	
2625515	gta	1489	
466799	gga	2075	
2009369	cca	2315	
moyenne		795	
écart		415	
  • intercalaires élevés entre aas
ttc-ggc		7	
ttc-ggc		7	
ggc-gtc		61	
atgf-atgf	63	
atgf-atgf	63	
tgc-tgc		65	
aac-atgi	71	
atc-atc		74	
--	--	
gga-cta		94	
gtc-ttc		94	
gtc-ttc		94	
tac-gac		112	intron
atgi-aac	119	intron
ctc-ctc		132	
gcc-atc		223	

mba distribution

Ar3. mba distribution, Methanosarcina barkeri str. Fusaro. Archée
g1    t1       
atgi 1 tct tat atgf 3
att act aat agt
ctt cct cat cgt
gtt gct gat ggt
ttc 2 tcc 1 tac 1 tgc 3
atc 2 acc 1 aac 2 agc 1
ctc 2 ccc 1 cac 1 cgc 1
gtc 2 gcc 1 gac 1 ggc 3
tta 3 tca 1 taa tga
ata aca 2 aaa 1 aga 1
cta 1 cca 1 caa 1 cga 1
gta 1 gca 1 gaa 2 gga 1
ttg 1 tcg 1 tag tgg 1
atgj 1 acg 1 aag 1 agg 1
ctg 1 ccg 1 cag 1 cgg 1
gtg 1 gcg 1 gag 1 ggg 1
arch >1aa =1aa -5s +5s -16s +16s total
mba 23 * 37 * 1 61

mba intercalaires entre cds

  • Lien NCBI [10] 17.12.20
  • Note: Pour les génomes des annexes j'ai relevé les intercalaires entre tRNAs et entre ceux-ci et les cds qui leur sont adjacents. L'exemple est celui de rru du clade alpha. L'idée de départ de ces prélèvements est la recherche d'opérons formés de tRNA et de protéine comme dans le cas d'E.coli: l'intercalaire entre le tRNA et la protéine devrait être faible. Voir l'exemple d'eco (remarque @3) avec tac-tac-tpr et aca-tac-gga-acc-tufB.

mba les fréquences

  • Lien tableur: mba intercalaires entre cds
  • Légende:   long, longueur en pbs,   intercal pour intercalaire
    - fréquence-1 1 5 6 f, respectivement fréquence des intercalaires négatives à l'unité, positives à l'unité, par blocs de 5, par blocs de 10 jusqu'à 600 pbs et f pour finales. Ces fréquences servent à faire les diagrammes. La fréquence fréquencez est l'étendue à 1200 de la fréquence6 pour certains grands génomes.
    - cumul,% colonne à la droite de frequence6, reprend les fréquences par plages et leurs pourcentages indiqués déjà dans la 1ère partie du tableau.
    - La couleur cyan des fréquences fréquence-1 et 1 sert à montrer leur périodicité ternaire.
    - intercaln intercalx, pour les intercalaires négatifs minimaux et intercalaires positifs maximaux.
    - colonne ADN pour la longueur totale du génome en pbs et intercals pour le total en pbs des intercalaires entre cds uniquement, d'après la méthode des prélèvements de NCBI du 17.12.20.
mba Les fréquences des intercalaires entre cds
mba intercalaires total % intercalaires moyenne ecartype plage ADN intercal frequence5 intercal fréquencez
négatif 329 8.3 négatif -12 13 -1 à -74 4 837 408 -1 329 610 21
zéro 22 0.6 intercals 0 22 620 23
1 à 200 1478 37.5 0 à 200 85 62 1 292 909 5 110 630 21
201 à 370 782 19.8 201 à 370 278 48 26.7% 10 53 640 20
371 à 600 643 16.3 371 à 600 475 66 15 73 650 14
601 à max 689 17.5 601 à 1028 920 310 20 67 660 22
total 3943 <201 46 total 3938 324 341 -74 à 2323 25 46 670 14
adresse intercalx intercal fréquence1 intercal fréquence6 cumul,% intercal fréquence-1 30 37 680 28
3095040 2919 -1 329 -70 1 0 22 35 39 690 6
526434 2894 0 22 -60 0 -1 33 40 54 700 11
1788553 2705 1 22 -50 8 -2 2 45 35 710 20
2002090 2693 2 33 -40 7 -3 2 50 31 720 14
4631335 2517 3 12 -30 14 min à -1 -4 120 55 34 730 7
818173 2323 4 19 -20 34 329 -5 1 60 45 740 16
2797830 2322 5 24 -10 66 8.3% -6 2 65 34 750 20
3799612 2309 6 15 0 221 -7 5 70 25 760 12
376145 2299 7 4 10 163 -8 33 75 34 770 18
3653740 2282 8 6 20 140 -9 1 80 36 780 12
4809596 2233 9 8 30 83 -10 4 85 41 790 8
1187952 2165 10 20 40 93 1 à 100 -11 13 90 30 800 7
4415180 2161 11 18 50 66 900 -12 0 95 27 810 6
3268995 2076 12 8 60 79 22.8% -13 5 100 27 820 8
372411 1964 13 19 70 59 -14 18 105 23 830 8
3552425 1946 14 15 80 70 -15 0 110 31 840 9
3151269 1901 15 13 90 71 -16 5 115 32 850 13
3603917 1870 16 14 100 54 -17 12 120 41 860 6
542032 1854 17 11 110 54 -18 5 125 25 870 18
682785 1848 18 16 120 73 -19 4 130 25 880 8
3195397 1797 19 8 130 50 -20 8 135 24 890 10
2484625 1761 20 18 140 55 -21 0 140 31 900 9
3100209 1754 21 9 150 71 -22 1 145 42 910 7
2724177 1733 22 12 160 47 -23 6 150 29 920 5
912406 1712 23 6 170 58 1 à 200 -24 0 155 23 930 4
2448660 1707 24 14 180 60 1478 -25 5 160 24 940 7
2750853 1677 25 5 190 75 37.5% -26 9 165 22 950 15
4703857 1624 26 6 200 57 -27 1 170 36 960 9
974831 1613 27 11 210 39 -28 3 175 29 970 5
4637075 1600 28 5 220 74 -29 1 180 31 980 9
2503952 1596 29 5 230 51 -30 0 185 39 990 8
511626 1595 30 10 240 47 -31 0 190 36 1000 9
2705610 1569 31 3 250 51 0 à 200 -32 4 195 33 1010 3
3908084 1568 32 6 260 59 1500 325 200 24 1020 9
2490112 1557 33 8 270 53 reste 26 205 19 1030 4
63786 1555 34 10 280 55 total 351 210 20 1040 7
136653 1553 35 12 290 42 215 46 1050 3
958597 1549 36 14 300 35 220 28 1060 7
301149 1548 37 9 310 43 225 29 1070 10
1165546 1516 38 11 320 44 intercal frequencef 230 22 1080 5
39 10 330 37 600 3254 235 24 1090 3
40 10 340 49 201 à 370 700 180 240 23 1100 1
reste 3113 350 40 782 800 134 245 29 1110 8
total 3943 360 32 19.8% 900 95 250 22 1120 4
370 31 1000 78 255 30 1130 3
adresses intercaln décalage long 380 36 1100 52 260 29 1140 4
4403838 -74 comp 390 23 1200 41 265 26 1150 3
1874377 -59 shift2 688 400 37 1300 30 270 27 1160 5
4136612 -59 shift2 694 410 34 1400 22 275 22 1170 4
493240 -56 shift2 127 420 31 1500 15 280 33 1180 3
942901 -56 shift2 601 430 43 1600 13 285 20 1190 3
4169341 -56 shift2 238 440 34 1700 3 290 22 1200 4
4335751 -56 shift2 445 450 30 1800 6 295 20 580
4374865 -55 comp 460 27 1900 3 300 15 reste 109
2801727 -51 comp 470 31 2000 3 305 18 total 3943
1742959 -49 shift2 2660 480 28 2100 1 310 25
2882494 -49 shift2 1325 490 28 2200 2 315 24
3292321 -49 shift2 101 500 26 2300 3 320 20
2440972 -47 shift2 664 510 22 2400 3 325 19
4561346 -44 shift2 1744 520 32 2500 0 330 18
1057681 -41 shift2 394 530 25 2600 1 335 21
1723225 -41 comp 540 20 371 à 600 2700 1 340 28
82489 -38 550 23 643 2800 1 345 21
222695 -38 560 22 16.3% 2900 1 350 19
3533580 -38 570 22 3000 1 355 19
1573832 -35 580 28 601 à max 689 360 13
1931905 -35 590 18 689 365 15
3122151 -35 600 23 17.5% 370 16
3337334 -35 reste 689 reste 0 reste 1332
4054645 -35 total 3943 total 3943 total 3943

mba autres intercalaires

  • Lien tableur: mba autres intercalaires
  • Légende:  
    - comp, le gène est sur le brin complement
    - deb, fin sont respectivement dans le sens des adresses croissantes, le cds avant le 1er tRNA et le cds après le dernier tRNA du bloc.
mba Les autres intercalaires.
mba1 adresses1
deb-fin gènes adresses intercal sens
deb CDS 91192 137
tRNA 92076 132 comp
tRNA 92293 298 comp
fin CDS 92676 comp
deb CDS 98630 535 comp
tRNA 99873 222 comp
fin CDS 100178 comp
deb CDS 146979 80 comp
tRNA 147599 198 comp
fin CDS 147869 comp
deb CDS 199345 492 comp
tRNA 200761 71 comp
tRNA 200905 119 comp
tRNA 201099 790 comp
fin CDS 201962
deb CDS 260990 173
tRNA 261706 673
fin CDS 262451
deb CDS 355894 309
repeat_region 356467 137
fin CDS 359947
deb CDS 463836 2075 comp
tRNA 466799 94
tRNA 466965 221
fin CDS 467271 comp
deb CDS 473154 298
tRNA 474022 246 comp
fin CDS 474343 comp
deb CDS 692109 349 comp
tRNA 693337 400
fin CDS 693812 comp
deb CDS 703446 488 comp
tRNA 704447 307
fin CDS 704829
deb CDS 800463 799 comp
tRNA 801442 137 comp
ncRNA 801664 327 comp
fin CDS 802306
deb CDS 1109819 15
tRNA 1110029 63
tRNA 1110167 63
tRNA 1110305 273
fin CDS 1110653
deb CDS 1134460 235 comp
tRNA 1135310 65 comp
tRNA 1135447 126 comp
fin CDS 1135645 comp
deb CDS 1137210 488
rRNA 1138169 74 comp
rRNA 1138365 209 comp
rRNA 1141481 835 comp
fin CDS 1143794
deb CDS 1249870 423 comp
tRNA 1250464 546 comp
fin CDS 1251084
deb CDS 1315521 -12
tRNA 1315680 174 comp
fin CDS 1315926
mba2 adresses2
deb-fin gènes adresses intercal sens
deb CDS 1516050 286 comp
tRNA 1516507 760
fin CDS 1517340 comp
deb CDS 1538879 36 comp
tRNA 1539323 1249 comp
fin CDS 1540645 comp
deb CDS 1546247 576 comp
tRNA 1548368 448 comp
fin CDS 1548890
deb CDS 1550566 745
tRNA 1551506 506 comp
fin CDS 1552086
deb CDS 1621639 433
tRNA 1623269 112
tRNA 1623497 300
fin CDS 1623870 comp
deb CDS 1657967 616 comp
repeat_region 1660242 74
fin CDS 1661656
deb CDS 1714788 154
tRNA 1715224 187 comp
fin CDS 1715483 comp
deb CDS 1755811 113 comp
tRNA 1756107 0 comp
fin CDS 1756182 comp
deb CDS 1842058 16
tRNA 1842212 717 comp
fin CDS 1843003
deb CDS 1852573 1379 comp
tRNA 1854261 198 comp
fin CDS 1854537 comp
deb CDS 1908225 349 comp
tRNA 1909339 445 comp
fin CDS 1909976
deb CDS 1926495 183
tRNA 1927362 125 comp
fin CDS 1927571 comp
deb CDS 1975038 78
ncRNA 1976292 428 comp
fin CDS 1977078
deb CDS 2005431 2315 comp
tRNA 2009369 199 comp
fin CDS 2009643 comp
deb CDS 2026807 314 comp
tRNA 2028771 513
fin CDS 2029356 comp
deb CDS 2157926 567
tRNA 2159252 349
fin CDS 2159712
deb CDS 2194967 718 comp
rRNA 2196021 209
rRNA 2197708 74
rRNA 2200689 607
fin CDS 2201418 comp
deb CDS 2434335 603 comp
tRNA 2435213 223 comp
tRNA 2435508 74
tRNA 2435659 241
fin CDS 2435977 comp
mba3 adresses3
deb-fin gènes adresses intercal sens
deb CDS 2622097 1489
tRNA 2625515 1102
fin CDS 2626691
deb CDS 2650514 164
tRNA 2651461 218
fin CDS 2651751
deb CDS 2663547 318
tRNA 2664987 263 comp
fin CDS 2665322
deb CDS 2856552 134
tRNA 2857544 153 comp
fin CDS 2857782 comp
deb CDS 3326036 539
tRNA 3327097 995
fin CDS 3328164
deb CDS 3994472 514
tRNA 3995436 477 comp
fin CDS 3996007
deb CDS 4005709 269
tRNA 4006296 860
repeat_region 4007239 169
fin CDS 4009182 comp
deb CDS 4031590 1075 comp
tRNA 4032947 182
fin CDS 4033202 comp
deb CDS 4041205 96 comp
tRNA 4042057 375
fin CDS 4042517 comp
deb CDS 4045359 718 comp
tRNA 4048993 35
deb CDS 4049113 241 comp
tRNA 4052645 177
fin CDS 4052907 comp
deb CDS 4407561 64
tRNA 4407895 675
fin CDS 4408642 comp
deb CDS 4504139 536 comp
tRNA 4504837 220 comp
fin CDS 4505142 comp
deb CDS 4551177 566 comp
tRNA 4552418 94
tRNA 4552586 7
tRNA 4552668 61
tRNA 4552801 94
tRNA 4552969 7
tRNA 4553051 717
fin CDS 4553840
deb CDS 4617920 200
tRNA 4618540 351
deb CDS 4618969 377
tRNA 4619568 214
fin CDS 4619860 comp
deb CDS 4673041 289
rRNA 4673933 74 comp
rRNA 4674129 116 comp
tRNA 4677152 85 comp
rRNA 4677310 1247 comp
fin CDS 4680035
deb CDS 4759174 89 comp
tRNA 4759500 655 comp
fin CDS 4760232 comp

mba intercalaires tRNA

  • Lien tableur: mba intercalaires tRNA
  • Légende:
    - comp', l'intercalaire est entre un gène comp (sur le complément) et un gène sur le brin direct. Continu les 2 gènes sont sur le même brin.
    - deb, fin sont les intercalaires des cds du tableau précédent, autres intercalaires: respectivement dans le sens des adresses croissantes, le cds avant le 1er tRNA et le cds après le dernier tRNA du bloc.
  • Cumuls comp'+continu du tableau
	deb	fin	toal
<201	16	12	28
total	46	44	90
taux	35%	27%	31%
mba intercalaires tRNA
mba les relevés deb-fin
comp’ entre tRNAs comp’ deb comp’ fin
132 comp’ 137 298
535 222
80 198
71 119 492 comp’ 790
173 673
94 comp’ 2075 comp’ 221
comp’ 298 246
comp’ 349 comp’ 400
comp’ 488 307
799
63 63 15 273
65 235 126
423 comp’ 546
comp’ -12 comp’ 174
comp’ 286 comp’ 760
36 1249
576 comp’ 448
comp’ 745 comp’ 506
112 433 comp’ 300
comp’ 154 187
113 0
comp’ 16 comp’ 717
1379 198
349 comp’ 445
comp’ 183 125
2315 199
comp’ 314 comp’ 513
567 349
comp’ 223 603 comp’ 241
74
1489 1102
164 218
comp’ 318 comp’ 263
comp’ 134 153
539 995
comp’ 514 comp’ 477
269
comp’ 1075 comp’ 182
comp’ 96 comp’ 375
comp’ 718 comp’ 35
comp’ 241 comp’ 177
64 comp’ 675
536 220
94 7 61 94 7 comp’ 566 717
200 351
377 comp’ 214
89 655
mba intercalaires inférieures à 201 pbs
deb fin continu cumuls
15 0 deb
36 125 <201 9
64 126 total 25
80 153 taux 36%
89 187
113 198 fin
164 198 <201 8
173 199 total 23
200 218 taux 35%
235 220
269 222 total
349 246 <201 17
377 273 total 48
423 298 taux 35%
433 307
535 349
536 351
539 655
567 673
576 717
603 995
799 1102
1379 1249
1489 -
2315 - comp’ cumuls
-12 35
16 174 deb
96 177 <201 7
134 182 total 21
137 214 taux 33%
154 221
183 241 fin
241 263 <201 4
286 300 total 21
298 375 taux 19%
314 400
318 445 total
349 448 <201 11
488 477 total 42
492 506 taux 26%
514 513
566 546
718 675
745 717
1075 760
2075 790

mba intercalaires rRNA

  • Voir la présentation des blocs à rRNA dans le chapitre mba blocs de l'étude préliminaire. A comparer avec le tableau mba autres intercalaires.
  • Remarque: Quand le 16s n'est pas précédé de tRNAs l'intercalaire cds-16s est élevé, il est ici pour les 3 blocs de 1242 713 830. L'intercalaire cds-bloc de l'autre côté du bloc est beaucoup plus faible, il est ici pour les 3 blocs de, respectivement, 289 607 488 pbs. Cette orientation est quasiment générale chez tous les génomes que j'ai étudié ici. Je l'ai notée dans les chapitres génome-bloc de chaque génome.
  • Note: J'ai supposé souvent que les blocs à tRNA sans rRNA sont aussi orientés de l'intercalaire le plus grand au plus petit. Dans mba cumuls et de même pour les autres génomes, j'ai noté cette orientation dans la colonne cdsd, pour cds dirigé. Je n'ai conservé pour les calculs que le plus petit intercalaire des 2 cds bordant le bloc. L'idée était que cette orientation provoquait la création du cds en fin de bloc. Ces cds sont souvent de petites protéines et souvent hypothétiques. Aussi je présente ci-dessous la transformation deb-fin qui est imposée par l'adressage en intercalaire plus grand et plus petit.
deb	fin		tri	grand	petit		deb	fin		tri	grand	petit
137	298		13	174	-12		349	445		43	377	214
535	222		20	113	0		183	125		40	536	220
80	198		10	273	15		2315	199		6	2075	221
492	790		21	717	16		314	513		2	535	222
173	673		37	718	35		567	349		28	603	241
2075	221		15	1249	36		603	241		7	298	246
298	246		39	675	64		1489	1102		31	318	263
349	400		3	198	80		164	218		14	760	286
488	307		44	655	89		318	263		18	433	300
15	273		36	375	96		134	153		9	488	307
235	126		24	183	125		539	995		26	513	314
423	546		11	235	126		514	477		8	400	349
-12	174		32	153	134		1075	182		23	445	349
286	760		1	298	137		96	375		27	567	349
36	1249		19	187	154		718	35		12	546	423
576	448		30	218	164		241	177		16	576	448
745	506		5	673	173		64	675		34	514	477
433	300		38	241	177		536	220		4	790	492
154	187		35	1075	182		566	717		17	745	506
113	0		22	1379	198		200	351		33	995	539
16	717		25	2315	199		377	214		41	717	566
1379	198		42	351	200		89	655		29	1489	1102

Methanosarcina sp. WH1

mfe opérons

  • Lien tableur: mfe opérons
  • Liens: gtRNAdb [11], NCBI [12], génome [13], %GC 41.80 [14]
  • Phylogénie: Archaea; Euryarchaeota; Stenosarchaea group; Methanomicrobia; Methanosarcinales; Methanosarcinaceae; Methanosarcina; unclassified Methanosarcina
  • Légende: cdsa: cds aas, cdsd: cds dirigé
Ar4. mfe opérons, Methanosarcina sp. WH1
40.2%GC 2.2.20 Paris  56   doubles intercal cds aa avec aa cdsa cdsd protéines
comp 38726..40264 cds 698 698 513 2-isopropylmalate synthase
40963..42450 16s 208 1488
42659..45491 23s 130 2833
45622..45743 5s 857 857 122
46601..47164 cds 102 102 188 hp
47267..47338 tgc + 72 72
47411..47482 tgc 2 tgc 411 411
47894..48508 cds 205 endonuclease III
comp 71092..72423 cds 384 384 444 signal recognition particle protein
comp 72808..72882 atgf + 89 89
comp 72972..73046 atgf 2 atgf 234 234
73281..73472 cds 64 hp
comp 175573..176153 cds 163 163 194 hp
comp 176317..176389 gac 111 111
comp 176501..176614 tac @1 295 295
176910..177248 cds 113 hp
comp 214884..215966 cds 801 801 361 hp
comp 216768..216841 aca 150 150
216992..217582 cds 197 aldolase
comp 372219..373091 cds 558 558 291 hp
comp 373650..373723 gtg 340 340
374064..374828 cds 255 peptidase A24
comp 379248..381950 cds 1076 1076 901 DNA mismatch repair protein MutS
comp 383027..383104 ccc 193 193
comp 383298..383882 cds 195 CDP-alcohol phosphatidyltransferase family protein
comp 532751..533176 cds 356 356 142 hp
comp 533533..533607 cca 149 149
comp 533757..534308 cds 184 UbiX family flavin prenyltransferase
comp 598666..599850 cds 170 170 395 redox-regulated ATPase YchF
600021..600092 cgc 341 341
600434..600868 cds 145 cell surface lipoprotein
680493..681734 cds 185 185 414 proteasome-activating nucleotidase
681920..681994 gag 242 242
> 682237..682560 cds 108 p-IS200/IS605 family transposase
689062..689631 cds 36 36 190 phosphatase PAP2 family protein
comp 689668..689752 cta 73 73
comp 689826..689897 gga 1481 1481
691379..691483 cds 35 CcmD family protein
comp 793563..795017 cds 111 111 485 p-IS66 family transposase
comp 795129..795213 ctc + 117 117
comp 795331..795418 ctc 2 ctc 235 235
comp 795654..796454 cds 267 DNA-directed RNA polymerase subunit D
810088..810471 cds 861 861 128 hp
comp 811333..811415 tcc 123 123
comp 811539..812555 cds 339 RNA-guided pseudouridylation complex pseudouridine synthase subunit Cbf5
comp 893309..894232 cds 391 391 308 aldolase
comp 894624..894696 aac + 87 87
comp 894784..894858 atgi 2 aac 110 110
comp 894969..895041 aac 1415 1415
comp 896457..897506 cds 350 TIGR00303 family protein
949570..950112 cds 208 208 181 nitroreductase family protein
950321..950392 cgg 498 498
comp 950891..952300 cds 470 NADPH-dependent glutamate synthase
1088496..1090946 cds 360 360 817 PGF-pre-PGF domain-containing protein
comp 1091307..1091378 gcc 227 227
1091606..1091682 atc + 62 62
1091745..1091818 atc 2 atc 353 353
comp 1092172..1092585 cds 138 transcriptional regulator
1155736..1156137 cds 210 210 134 AsnC family transcriptional regulator
1156348..1156425 gaa + 718 718
1157144..1157221 gaa 2 gaa 233 233
comp 1157455..1158645 cds @4 397 ISH3 family transposase
comp 1199367..1200149 cds 967 967 261 methanol-5-hydroxybenzimidazolylcobamide methyltransferase
1201117..1202604 16s 80 1488
1202685..1202757 gca 135
1202893..1205725 23s 130 2833
1205856..1205977 5s 5 5 122
comp 1205983..1206231 cds 83 hp
1207508..1211485 cds 12 12 1326 PAS domain S-box protein
comp 1211498..1211582 ctg 190 190
comp 1211773..1212681 cds 303 ornithine carbamoyltransferase
comp 1220571..1220783 cds 596 596 71 MoaD/ThiS family protein
comp 1221380..1221451 ggc + 25 25
comp 1221477..1221551 ttc 2 ggc 57 57
comp 1221609..1221682 gtc 2 ttc 71 71
comp 1221754..1221825 ggc 2 gtc 25 25
comp 1221851..1221925 ttc 118 118
comp 1222044..1222117 gtc 358 358
1222476..1223792 cds 439 methanogenesis marker 16 metalloprotein
1400830..1401773 cds 914 914 315 helix-turn-helix domain-containing protein
1402688..1402761 gta 287 287
1403049..1403276 cds 76 hp
comp 1504221..1505630 cds 686 686 470 F0F1 ATP synthase subunit beta
comp 1506317..1506410 cga 750 750
1507161..1508039 cds 293 response regulator
1513245..1513562 cds 213 213 106 divalent-cation tolerance protein CutA
1513776..1513858 ttg 268 268
> 1514127..1514647 cds 174 p-IS1634 family transposase
1887880..1888338 cds 392 392 153 pyridoxamine 5'-phosphate oxidase family protein
comp 1888731..1888802 ggc 378 378
1889181..1890518 cds 446 DHH family phosphoesterase
1962666..1963553 cds 130 130 296 hp
comp 1963684..1963768 tta 235 235
1964004..1964759 cds 252 MBL fold metallo-hydrolase
1971331..1971852 cds 319 319 174 hp
comp 1972172..1972244 cag 204 204
comp 1972449..1972850 cds 134 hp
comp 2170713..2172446 cds 156 156 578 radical SAM protein
comp 2172603..2172674 cac 174 174
comp 2172849..2173631 cds 261 thiazole biosynthesis protein
<comp 2320809..2321131 cds 141 141 108 p-IS200/IS605 family transposase
comp 2321273..2321344 gcg 65 65
comp 2321410..2321679 cds 90 elongation factor 1-beta
2387890..2388675 cds 150 150 262 peptidylprolyl isomerase
2388826..2388911 tca 326 326
comp 2389238..2389453 cds 72 hp
comp 2678132..2678368 cds 85 85 79 DNA-directed RNA polymerase subunit H
comp 2678454..2678530 aaa 824 824
comp 2679355..2679537 cds 61 hp
3091524..3091754 cds 271 271 77 hp
comp 3092026..3092147 5s 130 122
comp 3092278..3095110 23s 208 2833
comp 3095319..3096806 16s 839 839 1488
3097646..3097975 cds 110 translation initiation factor eIF-1A
comp 3153517..3155214 cds 599 599 566 diguanylate phosphodiesterase
comp 3155814..3155923 atgj 799 799
3156723..3157106 cds 128 tRNA CCA-pyrophosphorylase
comp 3241682..3242944 cds 473 473 421 diaminopimelate decarboxylase
3243418..3243489 ggg 377 377
3243867..3244073 cds 69 hp
3341829..3342017 cds @2 0 0 63 DNA-directed RNA polymerase subunit N
3342018..3342092 ccg 112 112
3342205..3342387 cds 61 DNA-directed RNA polymerase subunit K
3358176..3359186 cds 533 533 337 class I SAM-dependent methyltransferase family protein
3359720..3359791 acg 52 52
comp 3359844..3360305 cds 154 peroxiredoxin
comp 3397316..3398947 cds 422 422 544 methylamine methyltransferase corrinoid protein reductive activase
3399370..3399684 ncRNA @3 149 149 315
3399834..3399918 agc 230 230
3400149..3400847 cds 233 ATPase
3435506..3436918 cds 181 181 471 phosphotransferase
3437100..3437183 tcg 273 273
3437457..3437948 cds 870 870 164 rubrerythrin family protein
3438819..3438989 cds 107 107 57 hp
3439097..3439289 tgg 42 42
comp 3439332..3439484 cds 51 hp MLELDILDLDILDLDILDLKILELEILELEVLELEILELEILELEVLVQS
3456114..3456473 cds 260 260 120 hp
comp 3456734..3456805 acc 200 200
comp 3457006..3457518 cds 171 DUF98 domain-containing protein
comp 3583589..3584044 cds 295 295 152 N-acetyltransferase
comp 3584340..3584414 agg 339 339
3584754..3585317 cds 188 biotin transporter BioY
3593430..3593861 cds 343 343 144 PspC domain-containing protein
comp 3594205..3594279 aga 348 348
3594628..3595506 cds 293 branched-chain-amino-acid transaminase
3603458..3603697 cds 389 389 80 type II toxin-antitoxin system HicB family antitoxin
3604087..3604159 caa 633 633
comp 3604793..3606301 cds 503 lipopolysaccharide biosynthesis protein
comp 3856073..3856279 cds 402 402 69 TRAM domain-containing protein
3856682..3856755 aag 498 498
3857254..3857424 cds 57 CopG family transcriptional regulator

mfe cumuls

cumuls. mfe.
opérons Fréquences intercalaires tRNAs Fréquences intercalaires cds Fréquences aas cds chromosome
effectif gammes sans rRNAs avec rRNAs gammes cds gammes cdsd gammes cdsa gammes cdsa 300
avec rRNA opérons 3 1 0 - 1 1 1 100 18 30 0
16 23 5s 0 2 20 0 50 4 20 200 29 60 4
16 gca 235 1 40 2 100 3 40 300 12 90 14
16 23 5s a 0 60 1 150 11 60 400 9 120 6
max a 1 80 4 200 9 80 500 9 150 8
a doubles 0 100 2 250 10 100 600 5 180 7
autres 0 120 4 300 7 120 700 0 210 9
total aas 1 140 0 350 7 140 800 0 240 1
sans opérons 40 160 0 400 10 160 900 1 270 6
1 aa 31 180 0 450 3 180 1000 1 300 4
max a 6 200 0 500 3 200 1100 0 330 3
a doubles 7 2 20 1 23
total aas 55 15 0 88 0 85 85
total aas 56
remarques
avec jaune moyenne 131 376 255
variance 169 299 210
sans jaune moyenne 55 223 207 157
variance 21 108 127 80

mfe blocs

Ar4. mfe blocs, Methanosarcina sp. WH1
cds 698 513 2-isopropylmalate synthase
16s 208 1488
23s 130 2833
5s 857 122
cds 102 188 hp
cds 967 261 methanol-5-hydroxybenzimidazolylcobamide methyltransferase
16s 80 1488
gca 135
23s 130 2833
5s 5 122
cds 83 hp
cds 271 77 hp
5s 130 122
23s 208 2833
16s 839 1488
cds 110 translation initiation factor eIF-1A

mfe remarques

  • Lien tableur: mfe remarques
  • Remarques un génome avec beaucoup de doubles dont une séquence de 3 aas.
    1. @ ncRNA, dans le même ques l que’aa, taille de 315 pbs.
    2. @ 4 introns
      - tac 176501..176536,176579..176614
      - tgg 3439097..3439134,3439254..3439289
      - atgj 3155814..3155849,3155886..3155923
      - cga 1506317..1506351,1506372..1506410
    3. @ un intercalaire nul sans changement de sens
    4. @ intercalaire très élevé 718 pbs entre 2 aas, le nouveau doublet gaa.
  • Séquence des doubles: 7 clusters avec des doubles dont une séquence de 3 aas
    - 4 doublets seuls ctc tgc atgf gaa
    - gcc 2atc
    - aac atgi aac
    - 2 (gtc ttc ggc)
    - par rapport à mja un noveau doublet, gaa. Le triplet atgf est changé en doublet. Les autres restent identiques.
  • Tableau du code génétique de mfe
    Légende: prélèvement de la base gtRNAdb le 2.2.20
    • - totaux en en-tête, 56 total de gtRNAdb contenant des pseudo et inconnus; 56 total du cumul.
    • - atgi, c'est Ile2, mis à la place de ttt, très rare chez les procaryotes.
    • - atgf, c'est Metf, mis à la place de tgt, très rare chez les procaryotes.
    • - atgj, c'est Met, remplace le atg standard qui est la somme Ile2 Metf Met.
    • - Voir la légende des tris et couleurs, g1 t1.
Ar4. mfe, Methanosarcina sp. WH1
g1    t1       56  56
atgi 1 tct tat atgf 2
att act aat agt
ctt cct cat cgt
gtt gct gat ggt
ttc 2 tcc 1 tac 1 tgc 2
atc 2 acc 1 aac 2 agc 1
ctc 2 ccc 1 cac 1 cgc 1
gtc 2 gcc 1 gac 1 ggc 3
tta 1 tca 1 taa tga
ata aca 1 aaa 1 aga 1
cta 1 cca 1 caa 1 cga 1
gta 1 gca 1 gaa 2 gga 1
ttg 1 tcg 1 tag tgg 1
atg 1 acg 1 aag 1 agg 1
ctg 1 ccg 1 cag 1 cgg 1
gtg 1 gcg 1 gag 1 ggg 1
  • intercalaires élevés avec le cds 26/88
3856682	aag	402	comp
47411	tgc	411	
3399370	ncRNA	422	comp
3243418	ggg	473	comp
950321	cgg	498	comp
3856682	aag	498	
3359720	acg	533	
373650	gtg	558	
1221380	ggc	596	
3155814	atgj	599	
3604087	caa	633	comp
1506317	cga	686	
40963	16s	698	comp
1506317	cga	750	comp
3155814	atgj	799	comp
216768	aca	801	
2678454	aaa	824	
3095319	16s	839	comp
45622	5s	857	
811333	tcc	861	comp
3438819	cds	870	
1402688	gta	914	
1201117	16s	967	comp
383027	ccc	1076	
894969	aac	1415	
689826	gga	1481	comp
  • intercalaires élevés entre aas
ggc-ttc		25
ggc-ttc		25
ttc-gtc		57
atc-atc		62
gtc-ggc		71
tgc-tgc		72
cta-gga		73
aac-atgi	87
atgf-atgf	89
atgi-aac	110
gac-tac		111
ctc-ctc		117
ttc-gtc		118
gcc-atc		227
gaa-gaa		718

mfe distribution

Ar4. mfe distribution, Methanosarcina sp. WH1. Archée
g1    t1       
atgi 1 tct tat atgf 2
att act aat agt
ctt cct cat cgt
gtt gct gat ggt
ttc 2 tcc 1 tac 1 tgc 2
atc 2 acc 1 aac 2 agc 1
ctc 2 ccc 1 cac 1 cgc 1
gtc 2 gcc 1 gac 1 ggc 3
tta 1 tca 1 taa tga
ata aca 1 aaa 1 aga 1
cta 1 cca 1 caa 1 cga 1
gta 1 gca 1 gaa 2 gga 1
ttg 1 tcg 1 tag tgg 1
atgj 1 acg 1 aag 1 agg 1
ctg 1 ccg 1 cag 1 cgg 1
gtg 1 gcg 1 gag 1 ggg 1
arch >1aa =1aa -5s +5s -16s +16s total
mfe 24 * 31 * 1 56

archées synthèse

archées distribution par génome

archées distribution par génome
arch >1aa 1aa -5s +5s -16s +16s duplica 1-3aas total
mba 14 37 1 9 61
mfe 14 31 1 10 56
mfi 25 20 2 47
mja 8 16 1 4 6 2 37
total 61 104 1 4 6 6 19 0 201

archées distribution du total

  • Lien tableur: archées distribution du total
  • Liens indices: euryarchaeota
  • Notes: Les -5s +5s et -16s sont colorés et correspondent à un seul tRNA du génome mja. Les +16s sont tout les 6 des gca. Les -16s sont d'un seul bloc de 6 aas. Les -5s et +5s sont inversés dans le bloc 4aas-5s-gac.
  • Légende: Tableau des indices, en-tête: total des génomes, total des tRNAs, indice ttt, indice tgt.
Euryarcheota. distribution et indices.
Euryarcheota. distribution du total
g1    t1       
atgi 4 tct tat atgf 7
att act aat agt
ctt cct cat cgt
gtt gct gat ggt
ttc 6 tcc 4 tac 4 tgc 8
atc 6 acc 4 aac 7 agc 4
ctc 6 ccc 3 cac 4 cgc 4
gtc 6 gcc 4 gac 4 ggc 8
tta 6 tca 4 taa tga 1
ata aca 5 aaa 5 aga 4
cta 4 cca 4 caa 5 cga 4
gta 4 gca 6 gaa 7 gga 4
ttg 3 tcg 3 tag tgg 4
atgj 4 acg 3 aag 3 agg 3
ctg 3 ccg 2 cag 3 cgg 2
gtg 4 gcg 3 gag 2 ggg 3
arch >1aa =1aa -5s +5s -16s +16s total
total 80 104 1 4 6 6 201
Euryarchaeota. indices du 16.1.21 143 génomes
g1 t1 143 6935 0  0
atgi 99 tct tat atgf 127
att act aat agt
ctt 0.7 cct cat cgt 0.7
gtt gct gat ggt 0.7
ttc 122 tcc 106 tac 104 tgc 181
atc 121 acc 104 aac 122 agc 104
ctc 122 ccc 93 cac 101 cgc 102
gtc 121 gcc 101 gac 124 ggc 141
tta 107 tca 101 taa tga 13
ata aca 110 aaa 110 aga 103
cta 103 cca 102 caa 108 cga 103
gta 103 gca 151 gaa 132 gga 103
ttg 87 tcg 87 tag tgg 102
atgj 101 acg 90 aag 87 agg 88
ctg 85 ccg 78 cag 87 cgg 71
gtg 91 gcg 84 gag 84 ggg 79
inter max min total
eury

archées distribution par type

  • Lien tableur: archées distribution par type
  • Notes: Le cyan pour les effectifs élevés des solitaires, le jaune celui des multiples sans duplicata et le blanc, le reste. En rapportant au total de chaque type je constate que les 3 processus sont distincts et se chevauchent très peu, respectivement pour 1aa >1aa duplicata, % 65 61 79.
	1aa		>1aa		duplica	%
	104	%	61	%	19	
jaune	4	4	37	61	0	0
cyan	68	65	7	11	4	21
blanc	32	31	17	28	15	79
Archées. Distribution par type.
Archées. distribution des solitaires
g1    t1          
atgi tct tat atgf 2
att act aat agt
ctt cct cat cgt
gtt gct gat ggt
ttc tcc 4 tac tgc 3
atc 2 acc 2 aac 1 agc 4
ctc 1 ccc 3 cac 2 cgc 4
gtc 1 gcc 2 gac ggc 2
tta 5 tca 4 taa tga 1
ata aca 3 aaa 2 aga 2
cta cca 2 caa 4 cga 4
gta 3 gca gaa 2 gga 2
ttg 2 tcg 3 tag tgg 3
atgj 3 acg 3 aag 2 agg 2
ctg 3 ccg 2 cag 3 cgg 2
gtg 3 gcg 3 gag 2 ggg 3
arch 1aa 104
Archées. distribution du type >1aa sans duplicata.
g1    t1          
atgi 3 tct tat atgf
att act aat agt
ctt cct cat cgt
gtt gct gat ggt
ttc 5 tcc tac 3 tgc 1
atc acc 2 aac 5 agc
ctc 1 ccc cac 1 cgc
gtc 5 gcc 2 gac 3 ggc
tta 1 tca taa tga
ata aca 1 aaa 2 aga 2
cta 3 cca 1 caa 1 cga
gta 1 gca gaa 2 gga 4
ttg 1 tcg tag tgg 1
atgj 1 acg aag 1 agg 1
ctg ccg cag cgg
gtg 1 gcg gag ggg
arch >1aa 61
Archées. distribution des duplicata
g1    t1          
atgi tct tat atgf 5
att act aat agt
ctt cct cat cgt
gtt gct gat ggt
ttc tcc tac tgc 4
atc 4 acc aac agc
ctc 4 ccc cac cgc
gtc gcc gac ggc
tta tca taa tga
ata aca aaa aga
cta cca caa cga
gta gca gaa 2 gga
ttg tcg tag tgg
atgj acg aag agg
ctg ccg cag cgg
gtg gcg gag ggg
arch dupl 19

archées par rapport au groupe de référence

Comparaison avec la référence
tRNAs blocs tRNAs blocs rRNAs
archeo4 1aa >1aa dup +5s 1-3aas autres total
21 faible 40 11 4 55
16 moyen 39 16 8 9 72
14 fort 25 34 7 4 4 74
104 61 19 4 13 201
10 g+cgg 26 2 28
2 agg+cga 6 1 7
4 carre ccc 7 8 4 19
5 autres 1 1
40 11 4 55
total tRNAs ‰
archeo4 1aa >1aa dup +5s 1-3aas autres archeo ‰ ref.‰
21 faible 199 55 20 274 26
16 moyen 194 80 40 45 358 324
14 fort 124 169 35 20 20 368 650
517 303 95 20 65 201 729
10 g+cgg 129 10 139 10
2 agg+cga 30 5 35
4 carre ccc 35 40 20 95 16
5 autres 5 5
199 55 20 274
blocs tRNAs ‰ total colonne %
archeo4 1aa >1aa dup total ref.‰ 1aa >1aa dup
21 faible 217 60 22 299 26 38 18
16 moyen 212 87 43 342 324 38 26
14 fort 136 185 38 359 650 24 56
565 332 103 184 729 104 61
10 g+cgg 141 11 152 10 65
2 agg+cga 33 5 38 15
4 carre ccc 38 43 22 103 16 18
5 autres 5 5 3
217 60 22 299 40

euryarchaeota, estimation des -rRNAs

  • Lien tableur: euryarchaeota, estimation des -rRNAs
  • Liens fiche:   typage
  • Légende: prélèvement de la base gtRNAdb le 16.1.21
    - ttt et tgt sont nuls partout
    - atgi, c'est Ile2, mis à la place de ttt, très rare chez les procaryotes.
    - atgf, c'est iMet, mis à la place de tgt, très rare chez les procaryotes.
    - atgj, c'est Met, remplace le atg standard qui est la somme Ile2 Met iMet.
    - Voir la légende des tris, g1 t1 et des couleurs

euryarchaeota, calcul des -rRNAs

eur euryarchaeota 63 génomes
eur1 cumul des +rRNAs de la fiche euryarchaeota pour 63 génomes
g1    t1        0  0
atgi tct tat atgf
att act aat agt
ctt cct cat cgt
gtt gct gat ggt
ttc tcc 2 tac tgc 28
atc 1 acc aac agc
ctc ccc cac 0 cgc
gtc gcc gac ggc
tta tca taa tga
ata aca aaa 3 aga
cta cca caa cga
gta gca 87 gaa gga
ttg tcg tag tgg
atgj acg aag 1 agg
ctg ccg cag cgg 2
gtg gcg gag ggg
eury63 inter max min total
118 3 3 124
eur2 indices du clade euryarchaeota du 16.1.21 de gtRNAdb pour 100 génomes
g1    t1       
atgi 99 tct tat atgf 127
att act ° aat agt
ctt °0.7 cct cat cgt 0.7
gtt gct gat ggt 0.7
ttc 122 tcc 106 tac 104 tgc 181
atc 121 acc 104 aac 122 agc 104
ctc °122 ccc °93 cac 101 cgc 102
gtc °121 gcc °101 gac 124 ggc 141
tta 107 tca 101 taa tga °13
ata ° aca 110 aaa 110 aga 103
cta 103 cca 102 caa 108 cga °103
gta 103 gca 151 gaa 132 gga 103
ttg 87 tcg °87 tag tgg 102
atgj 101 acg °90 aag °87 agg °88
ctg 85 ccg °78 cag °87 cgg °71
gtg °91 gcg °84 gag °84 ggg °79
gtRNA inter max min total
1757 1612 1480 4848
eur3 cumul des -rRNAs de l'annexe archeo 4 génomes
g1    t1       
atgi 3 tct tat atgf 7
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc 5 tcc 4 tac 3 tgc 8
atc 6 acc 4 aac 6 agc 4
ctc 6 ccc 3 cac 3 cgc 4
gtc 6 gcc 4 gac 3 ggc 8
tta 6 tca 4 taa tga 1
ata aca 4 aaa 4 aga 4
cta 3 cca 3 caa 5 cga 4
gta 4 gca gaa 6 gga 4
ttg 3 tcg 3 tag tgg 4
atgj 4 acg 3 aag 3 agg 3
ctg 3 ccg 2 cag 3 cgg 2
gtg 4 gcg 3 gag 2 ggg 3
eury4 inter max min total
63 66 55 184
eur4 indices des +rRNAs de la fiche euryarchaeota pour 100 génomes
g1    t1       
atgi tct tat atgf
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc tcc 3 tac tgc 44
atc 2 acc aac agc
ctc ccc cac cgc
gtc gcc gac ggc
tta tca taa tga
ata aca aaa 5 aga
cta cca caa cga
gta gca 138 gaa gga
ttg tcg tag tgg
atgj acg aag 2 agg
ctg ccg cag cgg 3
gtg gcg gag ggg
eury63 inter max min total
187 5 5 197
eur5 estimation des -rRNA du clade euryarchaeota pour 100 génomes
g1    t1       
atgi 99 tct tat atgf 127
att act aat agt
ctt 0.7 cct cat cgc 0.7
gtt gct gat ggt 0.7
ttc 122 tcc 102 tac 104 tgc 137
atc 119 acc 104 aac 122 agc 104
ctc 122 ccc 93 cac 101 cgc 102
gtc 121 gcc 101 gac 124 ggc 141
tta 107 tca 101 taa tga 13
ata aca 110 aaa 106 aga 103
cta 103 cca 102 caa 108 cga 103
gta 103 gca 13 gaa 132 gga 103
ttg 87 tcg 87 tag tgg 102
atgj 101 acg 90 aag 85 agg 88
ctg 85 ccg 78 cag 87 cgg 68
gtg 91 gcg 84 gag 84 ggg 79
-rRNA inter max min total
1569 1607 1475 4651
eur6 indices des -rRNAs de l'annexe archeo pour 100 génomes
g1    t1       
atgi 75 tct tat atgf 175
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc 125 tcc 100 tac 75 tgc 200
atc 150 acc 100 aac 150 agc 100
ctc 150 ccc 75 cac 75 cgc 100
gtc 150 gcc 100 gac 75 ggc 200
tta 150 tca 100 taa tga 25
ata aca 100 aaa 100 aga 100
cta 75 cca 75 caa 125 cga 100
gta 100 gca gaa 150 gga 100
ttg 75 tcg 75 tag tgg 100
atgj 100 acg 75 aag 75 agg 75
ctg 75 ccg 50 cag 75 cgg 50
gtg 100 gcg 75 gag 50 ggg 75
eury4 inter max min total
1575 1650 1375 4600

euryarchaeota, comparaison clade-annexe des -rRNAs

  • Lien tableur: euryarchaeota, comparaison clade-annexe des -rRNAs
  • Légende
    - eur7. diff, somme des couleurs de eur7. La différence entre tRNAs est faite entre eur5 et eur6 du tableau précédent. Elle est exprimée en % et rapporté à la plus grande valeur des 2 termes de la différence. Ce qui fait quand un tRNA est à zéro la différence en % est égale à 100.
    - eur8. rap, rapport des sommes couleurs eur5/eur2. Le rapport -rRNA/total est celui du tRNA de eur5 sur celui de eur2.
  • Fréquences des différences en % du tableau eur7
gamme		0/0	10	20	30	40	50	60	70	80	90	100			total
fréquence	1	17	14	10	3	2	0	0	0	0	0	1	48
tot ≤ 50							41							
  • Comparaison avec le nombre de tRNAs de la fiche du clade: L’estimation des -rRNA par l'annexe est 10% au dessus de celle de la fiche des archées.
tRNAs		fiche		annexe
sans		2642		184
avec		150		17
genomes		63		4
indice %	42		46
eur euryarchaeota 63 génomes
eur7 euryarchaeota, différence clade-annexe des -rRNAs
g1    t1       
atgi 24 tct tat atgf 28
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc 2 tcc 2 tac 28 tgc 32
atc 20 acc 4 aac 19 agc 4
ctc 19 ccc 19 cac 26 cgc 2
gtc 19 gcc 1 gac 39 ggc 29
tta 29 tca 1 taa tga 50
ata aca 9 aaa 5 aga 3
cta 27 cca 27 caa 13 cga 3
gta 3 gca 100 gaa 12 gga 3
ttg 14 tcg 14 tag tgg 2
atgj 1 acg 17 aag 12 agg 15
ctg 12 ccg 36 cag 14 cgg 27
gtg 9 gcg 11 gag 40 ggg 5
diff inter max min total
361 220 311 832
eur8 euryarchaeota, rapports -rRNA/total
g1    t1       
atgi tct tat atgf
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc tcc 97 tac tgc 75
atc 99 acc aac agc
ctc ccc cac cgc 2
gtc gcc gac ggc
tta tca taa tga
ata aca aaa 96 aga
cta cca caa cga
gta gca 9 gaa gga
ttg tcg tag tgg
atgj acg aag 98 agg
ctg ccg cag cgg 96
gtg gcg gag ggg
rap inter max min total
89 100 100 96