Recherche:Les clusters de gènes tRNA et rRNA chez les procaryotes/Annexe/clostridia

Une page de Wikiversité.
Sauter à la navigation Sauter à la recherche
clostridia
Image logo représentative de la faculté
Annexe 4
Recherche : Les clusters de gènes tRNA et rRNA chez les procaryotes
Précédent :bacilli
Suivant :actino
Icon falscher Titel.svg
En raison de limitations techniques, la typographie souhaitable du titre, « Annexe : clostridia
Les clusters de gènes tRNA et rRNA chez les procaryotes/Annexe/clostridia
 », n'a pu être restituée correctement ci-dessus.



  • Annexe en préparation

Tanger le 3.11.19

Paeniclostridium sordellii AM370[modifier | modifier le wikicode]

psor opérons[modifier | modifier le wikicode]

  • Liens: gtRNAdb, NCBI [1], génome [2]
  • Lien tableur: psor opérons
  • Phylogénie: Bacteria; Firmicutes; Clostridia; Clostridiales;Peptostreptococcaceae; Paeniclostridium.
  • Légende: cdsa: cds aas, cdsj: cdsa sans jaune, cdsd: cdsa dirigé
    - @2, cds de 62 aas, hp, à allure répétitive susceptible d'être créé par contrainte lors des conversions ou d'autres réparations: MWLFFLFFFLFFFLFFFFFLFFFLFFFFFLFFFFFFPIVVLQTEINFRYGYIYTIHSGIIF
    - @4, riboswitch se trouve dans un bloc à rRNA. Concerne cette remarque aussi le RNA non codant, ncRNA, à l'adresse 19421..19685.
C1 Paeniclostridium sordellii AM370
27.3%GC 8.8.19 Paris  112   doubles intercal cds aa avec aa cdsa cdsd
9847..10620 CDS 205 205 258
10826..12332 16s 196
12529..15445 23s 78
15524..15640 5s 85 85 85
15726..15947 CDS 74
18845..19297 CDS 3 3 151 3
19301..19393 tcc 27
19421..19685 ncRNA 152 152
19838..21478 CDS *547
24343..24570 CDS 309 309 76
24880..26386 16s 196
26583..29499 23s 122
29622..29738 5s 5 5
29744..29832 tta + 13 13
29846..29921 atg 3 aaa 15 15
29937..30011 gaa 6 atg 9 9
30021..30094 gga 3 gta 6 6
30101..30176 gta 1 cgt 5 5
30182..30258 gac 1 ggc 16 16
30275..30350 aac 2 fois suite 4 4
30355..30429 aca aac aca aga 4 4
30434..30518 tac caa cac cca 15 15
30534..30617 cta cta gaa gac 14 14
30632..30708 aga gga tac tca 7 7
30716..30791 caa tgc tta ttc 11 11
30803..30878 aaa 6 6
30885..30973 tca 3 3
30977..31052 ttc 9 9
31062..31138 atg 8 8
31147..31223 atg 21 21
31245..31321 cca 6 6
31328..31404 cac 4 4
31409..31482 tgc 25 25
31508..31596 tta 13 13
31610..31685 atg 15 15
31701..31775 gaa 9 9
31785..31858 gga 6 6
31865..31940 gta 5 5
31946..32022 gac 16 16
32039..32114 aac 4 4
32119..32193 aca 4 4
32198..32282 tac 15 15
32298..32381 cta 11 11
32393..32467 ggc 13 13
32481..32557 aga 7 7
32565..32640 caa 11 11
32652..32727 aaa 6 6
32734..32822 tca 3 3
32826..32901 ttc 9 9
32911..32987 atg 8 8
32996..33072 atg 21 21
33094..33170 cca 6 6
33177..33253 cac 9 9
33263..33338 aaa 21 21
33360..33433 tgc 6 6
33440..33516 cgt 10
33527..33602 gta 162 162 162
33765..34016 CDS 84
34042..34455 CDS 249 249 138
34705..36211 16s 196
36408..39324 23s 78
39403..39519 5s 402 *402
comp 39922..40113 CDS 348 348 64
40462..41968 16s 196
42165..45081 23s 78
45160..45276 5s 180 180 *180
45457..47394 CDS *646
101428..102144 CDS 276 276 239
102421..103927 16s 54
103982..104057 gca 114
104172..107096 23s 41
107138..107211 gga 11
107223..107339 5s 99 99 99
comp 107439..108617 CDS 393
111345..111884 CDS 431 *431 180
112316..113822 16s 54
113877..113952 gca 114
114067..116982 23s 193
117176..117292 5s 5
117298..117386 tta 9 9
117396..117472 atg 123
117596..119102 16s 54
119157..119232 gca 114
119347..122263 23s 193
122457..122573 5s 5
122579..122667 tta 9 9
122677..122753 atg 123
122877..124383 16s 54
124438..124513 gca 114
124628..127549 23s 78
127628..127744 5s 100 100 100
127845..129260 CDS 472
215388..216260 CDS 264 264 291
216525..218030 16s 123
218154..218229 gca 152
218382..221296 23s 50
221347..221420 gga 12
221433..221549 5s 109 109 109
221659..221940 CDS 525 *525 94
222466..223972 16s 196
224169..227083 23s 144
227228..227344 5s 228 228 *228
227573..227989 CDS 139
449964..450266 CDS 253 253 101
450520..452026 16s 196
452223..455139 23s 144
455284..455400 5s 112 112 112
comp 455513..456616 CDS 368
498418..499074 CDS 189 189 219
499264..500770 16s 118
500889..500964 gca 95
501060..503976 23s 144
504121..504237 5s 131 131 131
504369..504551 CDS 61
546886..550416 CDS 41 41 *1177 *41
comp 550458..550544 ttg 138 138
550683..553325 CDS *881
608009..608683 CDS 195 195 225
608879..608975 tga 37 37 37
comp 609013..609732 CDS 240
815939..816655 CDS 71 71 239 71
816727..816800 tgc 12 12
816813..816888 aac 3 3
816892..816966 aca 285 285
817252..818727 CDS 492
1284870..1288097 CDS 111 111 *1076 *111
1288209..1288297 cta 426 *426
1288724..1290853 CDS *710
1445161..1445664 CDS 135 135 168 135
1445800..1445868 other @1 258 258
1446127..1446813 CDS 229
2267513..2267698 CDS @2 306 306 62 *306
comp 2268005..2268088 cta 404 *404
2268493..2269758 CDS 422
3094098..3094784 CDS 40 40 229 40
comp 3094825..3094941 5s 78
comp 3095020..3097936 23s 194
comp 3098131..3099637 16s 276 276
comp 3099914..3101161 CDS 416
3159922..3160827 CDS 37 37 302 37
comp 3160865..3160956 agc 120 120
comp 3161077..3161376 CDS 100
comp 3274188..3274733 CDS 245 245 182 *245
comp 3274979..3275095 5s @3 12
comp 3275108..3275181 gga 107
comp 3275289..3278214 23s 137
comp 3278352..3279858 16s 253 253
comp 3280112..3280690 CDS 193
comp 3303104..3304150 CDS 124 124 349 124
comp 3304275..3304459 riboswitch @4 96
comp 3304556..3304672 5s 11
comp 3304684..3304758 aca 116
comp 3304875..3307789 23s 196
comp 3307986..3309492 16s 364 *364
3309857..3310504 CDS 216
comp 3438683..3439531 CDS 142 142 283 142
comp 3439674..3439750 aga 7 7
comp 3439758..3439832 ggc 9 9
comp 3439842..3439918 gac 5 5
comp 3439924..3439999 gta 8 8
comp 3440008..3440082 gaa 5
comp 3440088..3440204 5s 40
comp 3440245..3443168 23s 112
comp 3443281..3443356 gca 109
comp 3443466..3444972 16s 138
comp 3445111..3445187 atg + 13 13
comp 3445201..3445276 ttc 3 atg 6 6
comp 3445283..3445359 atc 2 cca 6 6
comp 3445366..3445442 cca 2 gga 31 31
comp 3445474..3445549 tgg 2 aac 11 11
comp 3445561..3445637 atg 6 6
comp 3445644..3445720 cca 6 6
comp 3445727..3445817 agc 11 11
comp 3445829..3445917 tca 6 6
comp 3445924..3445999 aaa 12 12
comp 3446012..3446087 caa 6 6
comp 3446094..3446170 aga 19 19
comp 3446190..3446263 gga 11 11
comp 3446275..3446359 tac 4 4
comp 3446364..3446438 aca 4 4
comp 3446443..3446518 aac 31 31
comp 3446550..3446625 aac 16 16
comp 3446642..3446718 gac 5 5
comp 3446724..3446799 gta 6 6
comp 3446806..3446879 gga 9 9
comp 3446889..3446963 gaa 15 15
comp 3446979..3447054 atg 13 13
comp 3447068..3447156 tta 5
comp 3447162..3447278 5s 213
comp 3447492..3450406 23s 196
comp 3450603..3452109 16s 239 239
comp 3452349..3452552 CDS 68
comp 3523330..3524046 CDS 129 129 239 129
comp 3524176..3524251 gta + 8 8
comp 3524260..3524334 gaa 2 fois 20 20
comp 3524355..3524430 aaa gta gaa aaa 10 10
comp 3524441..3524515 aca 10 10
comp 3524526..3524602 gac 7 7
comp 3524610..3524685 gta 9 9
comp 3524695..3524769 gaa 5 5
comp 3524775..3524850 aaa 289 289
3525140..3526039 CDS 300

psor cumuls[modifier | modifier le wikicode]

cumuls. Paeniclostridium sordellii AM370
opérons Fréquences intercalaires tRNAs Fréquences intercalaires cds Fréquences aas cds
effectif gammes sans rRNAs avec rRNAs gammes cds gammes cdsd gammes cdsa
avec rRNA opérons 17 1 0 0 1 0 1 0 100 9
16 23 5s 0 6 20 9 65 50 5 20 1 200 8
16 atc gca 0 40 0 6 100 4 40 3 300 13
16 23 5s a 2 60 0 0 150 10 60 1 400 4
max a 44 80 0 0 200 5 80 1 500 4
a doubles 2 100 0 0 250 5 100 3 600 1
autres 9 120 0 0 300 8 120 3 700 1
total aas 87 140 0 0 350 3 140 4 800 1
sans opérons 7 160 0 0 400 1 160 1 900 1
1 aa 5 180 0 0 450 4 180 2 1000 0
max a 8 200 0 0 500 0 200 0 1100 1
a doubles 1 0 0 1 3 1
total aas 17 9 71 46 22 44
total aas 104
remarques 4
avec jaune moyenne 9 10 206 119 304
variance 5 6 121 73 257
sans jaune moyenne 173 95 220
variance 90 45 121

psor blocs[modifier | modifier le wikicode]

  • Lien tableur: psor blocs
  • Lien cdc blocs: le tabeau de cdc blocs est à comparer à celui de psor pour les types manquants, en gris dans cdc blocs.
  • Légende:
    - Les blocs sont rangés par type de I à IV pour les blocs 16s23s et de V à X pour les blocs 16sgca23s. Chaque bloc est noté par son type suivi d'un indice.
    - La 1ère partie du tableau représente la totalité des blocs; la 2ème les groupes où les blocs se suivent avec des intercalaires très faibles. Seul l'intercalaire séparant le bloc V2 de I4 est élevé et le plus grand du tableau, 525. Je considère qu'un intercalaire inférieur à 350 est faible relativement aux intercalaires intra bloc. Les intercalaires avec les CDS sont faibles ici puisque seulement 3 sont supérieurs à 350, 402 (I2), 431 (VI1) et 525 (I4). Voir le tableau des cumuls pour tout les intercalaires des cds où seulement 6 sur 46 dépassent 350, avec une moyenne de 173±90.
    - Les couleurs, rouge pour rRNA, vert pour une configuration peu courante, un gène tRNA entre 23s et 5s, et ribosw pour riboswitch. Le cyan pour repérer le même intercalaire par rapport à la direction 16s23s5s quand elle change quand on a des adresses complément.
  • Notes:
    - 3 blocs avec des tRNAs longs, 44 23 5, concentrant les 2/3 des tRNAs avec des blocs 16s23s. 15 tRNAs sont dans des blocs courts ou 16sgca23s. Les tRNAs extra blocs sont 17.
    - 10 blocs 16s23s contre 7 blocs 16sgca23s
    - Le regroupement des blocs par 3 et 2 concerne 10 blocs et restent donc 7 blocs solitaires, 3 sans tRNA et 4 avec 1 ou 2 tRNA.
    - Existence de 4 cds intra groupe de petite taille en aas, 84 138 64 pour le 2èmer groupe, et 94 pour le 4ème groupe.
    - Le 1er groupe de 3 blocs n'a pas de cds internes et est constitué de la duplication d'un même bloc.
    - Des intercalaires très faibles inter blocs
    - Des intercalaires intra blocs qui se répètent beaucoup mais peuvent être divisés ou multipliés par 2.
intercalaire				Total
16s-23s	9*196	137			10
23s-5s	5*78	4*144	3*193	40	13
16s-gca	4*54	3*120			7
gca-23s	5*114	95	152		7
5s-aas	4*5 (tta)	5 (gaa)		5
C1. Paeniclostridium sordellii AM370, blocs à rRNA
I I2 I3 I4 II III IV IV1 IV2
CDS 124
CDS 245 ribosw 96
CDS 205 249 348 525 253 40 5s 12 5s 11 CDS 309 5
16s 196 196 196 196 196 78 gga 107 aca 116 16s 196 213
23s 78 78 78 144 144 194 23s 137 23s 196 23s 122 196
5s 85 402 180 228 112 276 16s 253 16s 364 5s 5 239
CDS CDS CDS tta
V V2 VI VI1 VII VII1 VIII VIII1 IX X X1
CDS 276 264 CDS 431 CDS 189 gaa 5
16s 54 123 16s 54 16s 54 16s 54 16s 118 5s 40
gca 114 152 gca 114 gca 114 gca 114 gca 95 23s 112
23s 41 50 23s 193 23s 193 23s 78 23s 144 gca 109
gga 11 12 5s 5 5s 5 5s 100 5s 131 16s 138
5s 99 109 tta 9 tta 9 CDS CDS atg
CDS atg 123 atg 123
groupe1 groupe2 groupe3 groupe4
CDS 431 CDS 309 CDS 142 CDS 264
VI1 16s 54 IV1 16s 196 **4aas 8 V2 16s 123
gca 114 23s 122 gaa 5 gca 152
23s 193 5s 5 5s 40 23s 50
5s 5 tta 13 23s 112 gga 12
tta 9 **42aas 10 gca 109 5s 109
atg 123 gta 162 X1 16s 138 CDS 525
VII1 16s 54 CDS 25 atg 13 I4 16s 196
gca 114 CDS 249 **21aas 13 23s 144
23s 193 I2 16s 196 tta 5 5s 228
5s 5 23s 78 5s 213 CDS
tta 9 5s 402 23s 196
atg 123 CDS 348 IV2 16s 239
VIII1 16s 54 I3 16s 196 CDS
gca 114 23s 78
23s 78 5s 180
5s 100 CDS
CDS

psor remarques[modifier | modifier le wikicode]

  • Lien tableur: psor remarques
  • Nombre de gènes protéines: 3327 (NCBI)
  • Rmarques @:
  1. - Un tRNA nommé other, non déterminé
  2. - cds de 62 aas, hp, à allure répétitive susceptible d'être créé par contrainte lors des conversions ou d'autres réparations: MWLFFLFFFLFFFLFFFFFLFFFLFFFFFLFFFFFFPIVVLQTEINFRYGYIYTIHSGIIF
  3. - une configuration rare 23s-aas-5s concerne 3 gga et 1 aca
  4. - Les RNAs non codants: riboswitch dans un bloc à rRNA et ncRNA dans un bloc sans rRNA, adresse 19421..19685.
  • Configuration des blocs: voir psor blocs.
  • Les séquences des doubles: Il y a très peu de doubles mais des duplications de séquences. Le signe + dans psor opérons indique les doubles.
    - séquence 44 aas: voir psor opérons, la couleur cyan pour la duplication de 20 aas et la couleur verte pour les insertions. Je n'ai pas pu distingué les 3 types d'atg dans 6 atg, qui certainement doivent être départagés en 2 atgf 2 atgj 2 atgi. Ce qui laisse 2 doubles aaa et gta.
    - séquence 23 aas: voir ci-dessous l'analogie de séquence entre 23 aas et le début de 44 aas. Seuls 3 aas ont des doubles cca gga aac, aucune séquence n'est dupliquée.
    - séquence 5 aas, c'est une petite séquence simple à la suite du blocs 23aas. Est-ce le fait d'être dans un bloc 416s-gca-23s?
    - séquence 8 aas: voir psor opérons, adresse 3523330..3524046, duplication de 3 aas. Est-ce que ça ne serait pas une séquence détachée d'un bloc 16s23s5s comme les 2 autres longs blocs.
23aas	tta atg gaa gga gta gac aac aac aca tac gga aga caa aaa tca   agc cca atg tgg cca atc   ttc atg
44aas	tta atg gaa gga gta gac aac     aca tac cta aga caa aaa tca                             ttc atg   atg cca cac - - - -

Peptoclostridium difficile CD196[modifier | modifier le wikicode]

cdc opérons[modifier | modifier le wikicode]

  • Liens: gtRNAdb [3], NCBI [4], génome [orgn]
  • Lien tableur: cdc opérons
  • Phylogénie: Bacteria; Firmicutes; Clostridia; Clostridiales;Peptostreptococcaceae; Clostridioides.
  • Légende: cdsa: cds aas, cdsd: cds dirigé
C2 Peptoclostridium difficile CD196
28.6%GC 11.9.19 Paris  83   doubles intercal cds aa avec aa cdsa cdsd protéines
dir 9857..10630 cds 179 179 258 SigB/SigF/SigG family RNA polymerase sigma factor
dir 10810..12317 16s 52
dir 12370..12445 gca 249
dir 12695..15596 23s 111
dir 15708..15824 5s 126 126 126
dir 15951..16460 cds 170 transcription repressor NadR
dir 19402..19857 cds 0 0 152 0 nucleoside deaminase
dir 19858..19949 tcc 37
dir 19987..20251 ncRNA @1 76 76
dir 20328..21965 cds 546 DNA polymerase III subunit gamma/tau
comp 23419..24624 cds 505 *505 402 glycosyl transferase
dir 25130..26637 16s 279
dir 26917..29816 23s + 180
dir 29997..30113 5s 3 aaa 6
dir 30120..30194 aac 3 gta 6 6
dir 30201..30286 tta 15 15
dir 30302..30377 atgf 7 7
dir 30385..30459 gaa 9 9
dir 30469..30542 gga 5 5
dir 30548..30623 gta 5 5
dir 30629..30705 gac 9 9
dir 30715..30789 aca 14 14
dir 30804..30888 tac 8 8
dir 30897..30980 cta 29 29
dir 31010..31086 aga 7 7
dir 31094..31169 caa 88 88
dir 31258..31346 tca 3 3
dir 31350..31425 ttc 6 6
dir 31432..31508 atgj 11 11
dir 31520..31596 atgi 23 23
dir 31620..31696 cca 7 7
dir 31704..31780 cac 8 8
dir 31789..31864 aaa 7 7
dir 31872..31945 tgc 6 6
dir 31952..32026 aac 5 5
dir 32032..32117 tta 15 15
dir 32133..32208 atgf 7 7
dir 32216..32290 gaa 9 9
dir 32300..32373 gga 5 5
dir 32379..32454 gta 5 5
dir 32460..32536 gac 9 9
dir 32546..32620 aca 14 14
dir 32635..32719 tac 9 9
dir 32729..32812 cta 23 23
dir 32836..32910 ggc 24 24
dir 32935..33011 aga 9 9
dir 33021..33096 caa 8 8
dir 33105..33180 aaa 2 2
dir 33183..33271 tca 3 3
dir 33275..33350 ttc 6 6
dir 33357..33433 atgj 11 11
dir 33445..33521 atgi 17 17
dir 33539..33615 cac 8 8
dir 33624..33699 aaa 7 7
dir 33707..33780 tgc 7 7
dir 33788..33864 cgt 12 12
dir 33877..33952 gta 75 75 75
dir 34028..34441 cds 308 308 138 hp
dir 34750..38181 cds 1144 pyruvate carboxylase
dir 127011..127715 cds 281 281 235 N-acetylmuramoyl-L-alanine amidase CwlD
dir 127997..129505 16s 279
dir 129785..132685 23s + 131
dir 132817..132933 5s 2 cca 6
dir 132940..133014 aac 4 4
dir 133019..133093 gaa 5 5
dir 133099..133174 gta 5 5
dir 133180..133256 gac 10 10
dir 133267..133341 aca 14 14
dir 133356..133440 tac 9 9
dir 133450..133523 gga 10 10
dir 133534..133610 aga 9 9
dir 133620..133695 caa 11 11
dir 133707..133782 aaa 2 2
dir 133785..133873 tca 17 17
dir 133891..133981 agc 8 8
dir 133990..134066 cca 85 85
dir 134152..134227 tgg 60 60
dir 134288..134364 cca 6 6
dir 134371..134447 atc 3 3
dir 134451..134526 ttc 7 7
dir 134534..134610 atgj 114
dir 134725..136115 16s 68
dir 136184..136259 gca 271
dir 136531..139430 23s 126
dir 139557..139673 5s 213 213 213
comp 139887..141071 cds 372 *372 395 pyridoxal phosphate-dependent aminotransferase
dir 141444..143795 cds 21 21 784 anaerobic ribonucleoside triphosphate reductase
dir 143817..144356 cds 776 *776 180 anaerobic ribonucleoside-triphosphate reductase activating protein
dir 145133..146640 16s 52
dir 146693..146768 gca 373
dir 147142..150041 23s 126
dir 150168..150284 5s 7 7
dir 150292..150366 aac 5 5
dir 150372..150457 tta 15 15
dir 150473..150548 atgf 7 7
dir 150556..150630 gaa 14 14
dir 150645..150718 gga 5 5
dir 150724..150799 gta 5 5
dir 150805..150881 gac 10 10
dir 150892..150966 ggc 9 9
dir 150976..151049 aga 975 *975
dir 152025..152864 cds 280 TIGR00159 family protein
dir 378341..380728 cds 583 *583 796 cadmium-translocating P-type ATPase
dir 381312..382819 16s 311
dir 383131..386030 23s 126
dir 386157..386273 5s 177 177 177
dir 386451..387059 cds 203 DedA family protein
comp 833130..833894 cds 258 258 255 DeoR/GlpR transcriptional regulator
dir 834153..834243 agc 87 87 87
dir 834331..835119 cds 263 flagellar motor protein
dir 1089165..1090139 cds 239 239 325 239 Mannosyl-glycoprotein endo-beta-N-acetylglucosamidase
dir 1090379..1091886 16s 320
dir 1092207..1095106 23s 91
dir 1095198..1095271 gga @2 8
dir 1095280..1095396 5s 273 273
dir 1095670..1097688 cds 673 N-acetylmuramoyl-L-alanine amidase
comp 1181549..1182958 cds 1374 *1374 470 MBOAT family protein
comp 1184333..1184415 ttg 318 318 318
dir 1184734..1187382 cds 883 DNA polymerase I
dir 1835768..1837498 cds 109 109 577 109 Na+/H+ antiporter NhaC family protein
dir 1837608..1837688 cta 231 231
<dir 1837920..1838093 cds 58 HXXEE domain-containing protein
dir 2981767..2982444 cds 159 159 226 159 sortase SrtB
comp 2982604..2982678 aca @3 94
comp 2982773..2985672 23s 184
comp 2985857..2987364 16s 340 340
dir 2987705..2988643 cds 313 delta-lactam-biosynthetic de-N-acetylase
comp 3787361..3788431 cds 454 *454 357 ABC transporter ATP-binding protein
comp 3788886..3789002 5s 126
comp 3789129..3792028 23s 281
comp 3792310..3793817 16s 191 191 191
comp 3794009..3794587 cds 193 bifunctional precorrin-2 dehydrogenase/sirohydrochlorin ferrochelatase
comp 3944262..3944453 cds 119 119 64 119 DUF378 domain-containing protein
comp 3944573..3944689 5s 126
comp 3944816..3947715 23s 217
comp 3947933..3949440 16s 282 282
comp 3949723..3950004 cds 221 221 94 hp
comp 3950226..3951755 cds 510 lysine--tRNA ligase
dir 4084445..4085437 cds 382 *382 331 DNA replication protein DnaC
comp 4085820..4085894 aca 33
comp 4085928..4086003 gta 4
comp 4086008..4086082 gaa 6
comp 4086089..4086164 aaa 326 326 326
comp 4086491..4087780 cds 430 adenylosuccinate synthase

cdc cumuls[modifier | modifier le wikicode]

cumuls. Peptoclostridium difficile CD196
opérons Fréquences intercalaires tRNAs Fréquences intercalaires cds Fréquences aas cds
effectif gammes sans rRNAs avec rRNAs gammes cds gammes cdsd gammes cdsa
avec rRNA opérons 10 1 0 1 1 1 1 100 3
16 23 5s 0 3 20 2 61 50 1 20 0 200 5
16 gca 235 3 40 1 4 100 3 40 0 300 7
16 23 5s a 2 60 1 150 3 60 0 400 5
max a 43 80 0 200 4 80 1 500 3
a doubles 2 100 2 250 4 100 1 600 3
autres 2 120 0 300 4 120 2 700 1
total aas 75 140 0 350 4 140 1 800 2
sans opérons 5 160 0 400 2 160 1 900 1
1 aa 4 180 0 450 0 180 1 1000 0
max a 4 200 0 500 1 200 1 1100 0
a doubles 0 0 5 4 1
total aas 8 3 68 32 13 31
total aas 83
remarques 3
avec jaune moyenne 14 12 313 165 378
variance 15 283 94 259
sans jaune moyenne 9 206 286
variance 5 107 144

cdc blocs[modifier | modifier le wikicode]

  • Lien tableur: cdc blocs
  • Lien psor blocs: le tabeau de cdc blocs est à comparer à celui de psor pour les types manquants, ici en gris.
  • Légende: voir psor blocs.
  • Notes:
    - cdc a perdu 3 blocs de type I, 16s23s5s sans tRNAs; les 2 blocs de type V, 16s-gca-23sgga5s et les 2 blocs 16s-gca-23s5s-2aas de type VI et VII. Soit la moitié des blocs courts, 7 sur 14, et plus de la moitié des blocs 16s-gca, 4 sur 7. Les 3 blocs longs sont maintenus mais modifiés.
C2. cdc blocs
groupes types absents            
cds 281 I II III IV IV1 IV2
IV2 16s 279
23s 131 CDS 583 454 119 cds 239
5s 6 16s 311 126 126 16s 320 cds 159 cds 505 281
aac 4 23s 126 281 217 23s 91 aca 94 16s 279 279
**16aas 3 5s 177 191 282 gga 8 23s 184 23s 180 131
ttc 7 CDS 5s 273 16s 340 5s 6 6
atgj 114 cds cds aac 6 4
VIII1 16s 68
gca 271 V V2 VI VI1 VII VII1
23s 126
5s 213
cds 372
cds 21 VIII VIII1 IX X X1
cds 776 cds 21
X1 16s 52 atgj 114 cds 179 cds 776
gca 373 16s 68 16s 52 16s 52
23s 126 gca 271 gca 249 gca 373
5s 7 23s 126 23s 111 23s 126
aac 5 5s 213 5s 126 5s 7
**7aas 9 cds 372 cds aac 5
aga 975
cds

cdc psor[modifier | modifier le wikicode]

  • Lien tableur: cdc psor
  • Comparaison bsu-lmo: Les séquences, les cumuls.
  • Légende:
    - La couleur cyan pour les différents entre cdc et psor; bois pour les identiques entre les clusters 43aas et 18aas de cdc d'une part et les clusters 44aas et 23aas de psor. Le gène aaa du cluster 18aas de cdc a son identique dans la 2ème partie du cluster 43aas et non dans la 1ère partie, car la duplication n'est pas exacte.
    - Le bleu pour des intercalaires exceptionnels.
    - Les blocs 16s indiquent des rRNAs de bordure, l'équivalent d'un cds.
    - Le jaune pour la conservation des cds: je ne l'ai appliqué ici qu'aux petits clusters sans rRNAs; Comparer les cumuls des intercalaires et protéines des cds de cdc et psor montre clairement que les clusters soit, sont très mobiles ou bien qu'il y a de nombreuses recombinansons entre le cluster et ses cds. Le jaune indique ici des intercalaires et des protéines presque identiques.
    - Les bordures très épaisses noires encadrent les 7 gènes du cluster 9aas identiques dans les duplicata du 43aas, comparaison cdc-cdc. Les bordures très épaisses bleues encadrent les 4 gènes du cluster 9aas de cdc et ceux du 23aas de psor, comparaison cdc-psor.
  • Notes:
    - Les 3 blocs longs de cdc commencent tous par aac. Chez psor 2 blocs longs et 2 courts commencent par tta et 1 bloc long gca commence par gaa.
    - Le jaune encadré montre que le cluster cta conservé dans cdc est celui ayant une protéine identique, 58 contre 62 aas dans psor. Or dans psor ce cluster présente des répétitions caractéristiques des contraintes imposées aux réparations.
    - Les fréquences des différences entre intercalaires (diff) sont reportées dans le dernier tableau C24 et sont établies sur la plage des différences entre intercalaires cdc et psor du tableau C21 pour des couples identiques. 16% des différences sont nulles (8 sur 49) et 50% ne dépassent pas 2 paires de bases. Ces résultats sont à mettre en parallèle avec ceux de la omparaison bsu-lmo, avec les séquences et les cumuls. La faible variabilité des intercalaires cdc-psor par rapport à bsu-lmo est due à leur plus grande filiation, niveau genre contre le niveau famille pour bsu-lmo.
C2. Comparaison cdc-psor
C21. Comparaison cdc-psor
cdc intercal psor intercal diff
cds 505 cds 309
16s 279 16s 196
23s 180 23s 122
5s 6 5s 5
aac 6 tta 13
tta 15 atg 15 -2
atgf 7 gaa 9 8
gaa 9 gga 6 0
gga 5 gta 5 1
gta 5 gac 16
gac 9 aac 4
aca 14 aca 4 -10
tac 8 tac 15 7
cta 29 cta 14 -15
aga 7 aga 7 0
caa 88 caa 11
tca 3 aaa 6
ttc 6 tca 3 0
atgj 11 ttc 9 3
atgi 23 atg 8 -3
cca 7 atg 21 -2
cac 8 cca 6 -1
aaa 7 cac 4
tgc 6 tgc 25
aac 5 tta 13 -2
tta 15 atg 15 8
atgf 7 gaa 9 0
gaa 9 gga 6 1
gga 5 gta 5 0
gta 5 gac 16
gac 9 aac 4
aca 14 aca 4 -10
tac 9 tac 15 6
cta 23 cta 11 -12
ggc 24 ggc 13 -11
aga 9 aga 7 -2
caa 8 caa 11 3
aaa 2 aaa 6 4
tca 3 tca 3 0
ttc 6 ttc 9 3
atgj 11 atg 8 -3
atgi 17 atg 21
cac 8 cca 6
aaa 7 cac 9 1
tgc 7 aaa 21 14
cgt 12 tgc 6 -1
gta 75 cgt 10 -2
cds gta 162
cds
cds 776
16s 52
gca 373
23s 126
5s 7 atg 138
aac 5 16s 109
tta 15 gca 112
atgf 7 23s 40
gaa 14 5s 5
gga 5 gaa 8
gta 5 gta 5 0
gac 10 gac 9 -1
ggc 9 ggc 7 -2
aga 975 aga 142
cds cds
cds 281 cds 239
16s 279 16s 196
23s 131 23s 213
5s 6 5s 5
aac 4 tta 13
gaa 5 atg 15
gta 5 gaa 9
gac 10 gga 6
aca 14 gta 5
tac 9 gac 16
gga 10 aac 31
aga 9 aac 4
caa 11 aca 4 -10
aaa 2 tac 11 2
tca 17 gga 19 9
agc 8 aga 6 -3
cca 85 caa 12 1
tgg 60 aaa 6 4
cca 6 tca 11 -6
atc 3 agc 6 -2
ttc 7 cca 6
atgj 114 atg 11
16s tgg 31 -29
cca 6 0
atc 6 3
ttc 13 6
atg 138
16s
cds 129
gta 8
gaa 20
aaa 10
cds 382 aca 10
aca 33 gac 7
gta 4 gta 9 5
gaa 6 gaa 5 -1
aaa 326 aaa 289
cds cds
C22. Comparaisons internes
cdc intercal cdc intercal diff
cds 505 cds 281
16s 279 16s 279
23s 180 23s 131
5s 6 5s 6
aac 6 aac 4
tta 15 gaa 5
atgf 7 gta 5
gaa 9 gac 10
gga 5 aca 14
gta 5 tac 9 0
gac 9 gga 10 1
aca 14 aga 9 0
tac 8 caa 11
cta 29 aaa 2
aga 7 tca 17 2
caa 88 agc 8
tca 3 cca 85
ttc 6 tgg 60
atgj 11 cca 6
atgi 23 atc 3
cca 7 ttc 7
cac 8 atgj 114
aaa 7 16s
tgc 6 cds 776
aac 5 16s 52
tta 15 gca 373
atgf 7 23s 126
gaa 9 5s 7
gga 5 aac 5
gta 5 tta 15 0
gac 9 atgf 7 1
aca 14 gaa 14 0
tac 9 gga 5
cta 23 gta 5
ggc 24 gac 10
aga 9 ggc 9 0
caa 8 aga 975 3
aaa 2 cds 0
tca 3
ttc 6
atgj 11
atgi 17
cac 8
aaa 7
tgc 7
cgt 12
gta 75
cds
psor psor intercal diff
cds 309 cds 239
16s 196 16s 196
23s 122 23s 213
5s 5 5s 5
tta 13 tta 13 0
atg 15 atg 15 0
gaa 9 gaa 9 0
gga 6 gga 6 0
gta 5 gta 5 0
gac 16 gac 16 0
aac 4 aac 31
aca 4 aac 4
tac 15 aca 4 0
cta 14 tac 11 -4
aga 7 cta 19 5
caa 11 aga 6 -1
aaa 6 caa 12 1
tca 3 aaa 6 0
ttc 9 tca 11
atg 8 agc 6
atg 21 cca 6
cca 6 atg 11
cac 4 tgg 31
tgc 25 cca 6
tta 13 atc 6 0
atg 15 ttc 13 0
gaa 9 atg 138 0
gga 6 16s 0
gta 5 atg 138 0
gac 16 16s 109 0
aac 4 gca 112
aca 4 23s 40 0
tac 15 5s 5
cta 11 gaa 8
ggc 13 gta 5
aga 7 gac 9 -1
caa 11 ggc 7 1
aaa 6 aga 142 0
tca 3 cds
ttc 9
atg 8
atg 21
cca 6
cac 9
aaa 21
tgc 6
cgt 10
gta 162
cds
C23. Conservation des cds
cdc intercal psor intercal protéines
cds 0 cds 3 151 – 152
tcc 37 tcc 27
ncRNA 76 ncRNA 152 547 – 546
cds cds
cds 1374 cds 41 470 – 1177
ttg 318 ttg 138 883 – 881
cds cds
cds 109 cds 111 577 – 1076
cta 231 cta 426
cds cds 58 – 577
cds 258 cds 37 255 – 302
agc 87 agc 120
cds cds 263 – 100
cds 306 62
cta 404
cds 422
cds 135
other 258
cds
cds 195
tga 37
cds
cds 71
tgc 12
aac 3
aca 285
cds
C24. Fréquence des différences des intercalaires
gamme fréquence
-15 2
-14
-13
-12 1
-11 1
-10 3
-9
-8
-7
-6 1
-5
-4
-3 3
-2 7
-1 4
0 8
1 4
2 1
3 4
4 2
5 1
6 2
7 1
8 2
9 1
10
11
12
13
14 1
15
total 49
sous t. -2+2 24

cdc remarques[modifier | modifier le wikicode]

  • Nombre de gènes protéines: cdc 3615, psor 3327 (NCBI)
  • Comparaison bsu-lmo: Les séquences, les cumuls. bsu-lmo nouveau
  • Rmarques @: On retrouve une partie des remarques de psor
  1. - Les RNAs non codants: seul le bloc cds-tcc-ncRNA-cds est maintenu.
  2. - Une configuration rare 23s-gga-5s complète au lieu de 3.
  3. - La configuration 16s23s-aca-5s-riboswitch perd 5s-riboswitch et devient 16s23s-aca.
  • Comparaison cdc-psor
    1. Les blocs à rRNAs: Les blocs disparaissent au moment des divisions et ce sont les non protégés par des séquences de tRNAs qui disparaissent en 1er. 7 clusters simples disparaissent et les groupes se défont.
    2. Les séquences longues:
      • Comparaison entre les 2 génomes, cdc-psor: Très peu de modifications, plutôt des mutations que des recombinaisons et encore moins des créations. Le cas de la disparition de aaa qui apparaît dans un intercalaire est emblématique.
      • Comparaisons intra génome, cdc-cdc et psor-psor. Là les remaniements sont légions et puissants: duplication de 20 tRNAs d'un seul coup, recombinaisons par lots ou tRNA par tRNA.
  • Comparaison clostridia-bacilli entre cdc-psor et bsu-lmo: la comparaison est saisissante et on arrive à repérer une recombinaison après division, celle de 16s23s5s en 16s-atcgca-23s5s entre bsu et lmo. La mutation de cta en ctg, entre génome, qui conserve la longueur du tRNA, ainsi que la agc en tcc dans le petit bloc aac-**-gaa en intra.
    - Seul les clostridia présentent des cds dans les groupes, les bacilli non. Les autres génomes de clostridia (voir fiche) présentent beaucoup de cds dans les clusters alors que les bacilli (fiche) jamais.
  • Conclusion: Tout se passe comme si le processus se déroulait d'un seul coup dans un génome, en dehors de la division. Puis pendant la 1ère division et les divisions suivantes certains clusters disparaissent facilement alors que se produisent quelques rares mutations et recombinaisons. C'est avant tout un processus de création ordonné donnant des séquences qui peuvent se dupliquer et se recombiner. Les séquences de tRNA stabilisent et maintiennent les blocs de rRNAs, un seul cluster à 6 tRNAs disparaît entre bsu et lmo, et aucun entre cdc et psor.

Peptoclostridium difficile M68[modifier | modifier le wikicode]

cdc8 opérons[modifier | modifier le wikicode]

  • Liens data bases: gtRNAdb [5], NCBI [6], génome [7]
  • Lien tableur: cdc8 opérons
  • Phylogénie: Bacteria; Firmicutes; Clostridia; Clostridiales;Peptostreptococcaceae; Clostridioides.
  • Liens internes: noms abrégéscdc8 remarquescdc8 cumuls
  • Légende: voir cdc8 cumuls pour cdsa: cds en pbs, cdsd: cds dirigé; voir cdc8 remarques pour @ et +
    - 23s': possible 23S ribosomal RNA but does not have good blast hits on one or both of the ends.
    - 23s°: 23S ribosomal RNA rRNA prediction is too short
    - cca: tRNA dupliqué dans le cluster 43aas (4306341).
    - cca: tRNA non dupliqué dans le cluster 43aas (4306341), ou remarques @2 et @3.
    - 554: voir cdc8 cumuls, veut dire sans jaune, exclu de la moyenne.
C3 Peptoclostridium difficile M68
28.6%GC 11.9.19 Paris  110  doubles intercal cds aa avec aa cdsa cdsd protéines
dir 4299490..4300134 cds 214 214 645 tyrosine-type recombinase/integrase
dir 4300349..4300807 cds @1 554 554 459 helix-turn-helix domain-containing protein
dir 4301362..4303101 cds 0 0 1740 hypothetical protein
dir 4303102..4303305 cds 167 167 204 hp
dir 4303473..4304299 23s° 132 827
dir 4304432..4304548 5s + 6 117
dir 4304555..4304629 aac 4 4 75
dir 4304634..4304708 gaa 2 cca 5 5 75
dir 4304714..4304789 gta 5 5 76
dir 4304795..4304871 gac 11 11 77
dir 4304883..4304957 aca 14 14 75
dir 4304972..4305056 tac 9 9 85
dir 4305066..4305139 gga 10 10 74
dir 4305150..4305226 aga 9 9 77
dir 4305236..4305311 caa 11 11 76
dir 4305323..4305398 aaa 2 2 76
dir 4305401..4305489 tca 18 18 89
dir 4305508..4305598 agc 8 8 91
dir 4305607..4305683 cca 85 85 77
dir 4305769..4305844 tgg 60 60 76
dir 4305905..4305981 cca 5 5 77
dir 4305987..4306063 atc 3 3 77
dir 4306067..4306142 ttc 7 7 76
dir 4306150..4306226 atgj 114 77
dir 4306341..4307538 16s 0 0 1198 0
dir 4307539..4308225 cds 100 100 687 xylose isomerase
dir 1..796 23s° 181 796
dir 978..1094 5s 6 117
dir 1101..1175 aac + 6 6 75
dir 1182..1267 tta 3 aaa 15 15 86
dir 1283..1358 atgf 3 gta 7 7 76
dir 1366..1440 gaa 9 9 75
dir 1450..1523 gga 5 5 74
dir 1529..1604 gta 5 5 76
dir 1610..1686 gac 9 9 77
dir 1696..1770 aca 14 14 75
dir 1785..1869 tac 10 10 85
dir 1880..1963 cta 28 28 84
dir 1992..2068 aga 7 7 77
dir 2076..2151 caa 89 89 76
dir 2241..2329 tca 3 3 89
dir 2333..2408 ttc 6 6 76
dir 2415..2491 atgj 11 11 77
dir 2503..2579 atgi 29 29 77
dir 2609..2685 cca 7 7 77
dir 2693..2769 cac 8 8 77
dir 2778..2853 aaa 7 7 76
dir 2861..2934 tgc 6 6 74
dir 2941..3015 aac 6 6 75
dir 3022..3107 tta 15 15 86
dir 3123..3198 atgf 7 7 76
dir 3206..3280 gaa 9 9 75
dir 3290..3363 gga 5 5 74
dir 3369..3444 gta 5 5 76
dir 3450..3526 gac 9 9 77
dir 3536..3610 aca 14 14 75
dir 3625..3709 tac 9 9 85
dir 3719..3802 cta 24 24 84
dir 3827..3901 ggc 24 24 75
dir 3926..4002 aga 9 9 77
dir 4012..4087 caa 8 8 76
dir 4096..4171 aaa 2 2 76
dir 4174..4262 tca 3 3 89
dir 4266..4341 ttc 6 6 76
dir 4348..4424 atgj 11 11 77
dir 4436..4512 atgi 17 17 77
dir 4530..4606 cac 8 8 77
dir 4615..4690 aaa 7 7 76
dir 4698..4771 tgc 7 7 74
dir 4779..4855 cgt 12 12 77
dir 4868..4943 gta 75 75 76 75
dir 5019..5432 cds 308 308 414 hp
dir 5741..9172 cds 3432 pyruvate carboxylase
dir 94032..94736 cds 281 281 705 281 N-acetylmuramoyl-L-alanine amidase CwlD
dir 95018..95994 16s° 100 977
dir 96095..97613 23s° 126 1519
dir 97740..97856 5s 7 117
dir 97864..97938 aac 6 6 75
dir 97945..98030 tta 15 15 86
dir 98046..98121 atgf 7 7 76
dir 98129..98203 gaa 8 8 75
dir 98212..98285 gga 4 4 74
dir 98290..98365 gta 5 5 76
dir 98371..98447 gac 10 10 77
dir 98458..98532 ggc 9 9 75
dir 98542..98615 aga 954 954 74
dir 99570..100409 cds 840 TIGR00159 family protein
dir 306829..309216 cds 733 733 2388 cadmium-translocating P-type ATPase
<> comp 309950..310076 cds 1 1 127 1 glycine/sarcosine/betaine reductase complex selenoprotein A
dir 310078..311313 23s° 126 1236
dir 311440..311556 5s 177 177 117
dir 311734..312342 cds 609 DedA family protein
comp 861856..862620 cds 258 258 765 DeoR/GlpR transcriptional regulator
dir 862879..862969 agc 87 87 91 87
dir 863057..863845 cds 789 flagellar motor protein
dir 1106477..1107451 cds 238 238 975 238 Mannosyl-glycoprotein endo-beta-N-acetylglucosamidase
dir 1107690..1109197 16s @2 320 1508
dir 1109518..1112416 23s 91 2899
dir 1112508..1112581 gga 8 74
dir 1112590..1112706 5s 273 273 117
dir 1112980..1114998 cds 2019 N-acetylmuramoyl-L-alanine amidase
comp 1196804..1198213 cds 1378 1378 1410 MBOAT family protein
comp 1199592..1199674 ttg 318 318 83 318
dir 1199993..1202641 cds 2649 DNA polymerase I
dir 1850896..1852626 cds 109 109 1731 109 Na+/H+ antiporter NhaC family protein
dir 1852736..1852816 cta 334 334 81
dir 1853151..1853666 cds 516 HXXEE domain-containing protein
dir 3024038..3024715 cds 150 150 678 150 sortase SrtB
comp 3024866..3024940 aca @3 93 75
comp 3025034..3027933 23s 184 2900
comp 3028118..3029625 16s 374 374 1508
dir 3030000..3030938 cds 939 delta-lactam-biosynthetic de-N-acetylase
dir 3805298..3806743 cds 208 208 1446 tyrosine-type recombinase/integrase
comp 3806952..3807028 agg 61 61 77 61
<comp 3807090..3808790 cds 1701 formate dehydrogenase subunit alpha
comp 3875816..3876886 cds 452 452 1071 ABC transporter ATP-binding protein
comp 3877339..3877455 5s 125 117
comp 3877581..3880480 23s 261 2900
comp 3880742..3882249 16s 190 190 1508 190
comp 3882440..3883018 cds 579 bifunctional precorrin-2 dehydrogenase/sirohydrochlorin ferrochelatase
comp 4017523..4017714 cds 118 118 192 118 DUF378 domain-containing protein
comp 4017833..4017949 5s 126 117
comp 4018076..4020975 23s 321 2900
comp 4021297..4022804 16s 292 292 1508
comp 4023097..4023378 cds 221 221 282 hp
comp 4023600..4025129 cds 1530 lysine--tRNA ligase
dir 4135881..4136873 cds 383 383 993 DNA replication protein DnaC
comp 4137257..4137331 aca 33 33 75
comp 4137365..4137440 gta 4 4 76
comp 4137445..4137519 gaa 6 6 75
comp 4137526..4137601 aaa 331 331 76 331
comp 4137933..4139222 cds 1290 adenylosuccinate synthase
dir 4178197..4178970 cds 179 179 774 SigB/SigF/SigG family RNA polymerase sigma factor
dir 4179150..4180587 16s 161 1438
comp 4180749..4180865 5s 201 117
comp 4181067..4183959 23s 217 2893
comp 4184177..4185684 16s 108 1508
comp 4185793..4185869 atgi 11 11 77
comp 4185881..4185969 tta 5 89
comp 4185975..4186091 5s 201 117
comp 4186293..4189192 23s 375 2900
comp 4189568..4189643 gca 52 76
comp 4189696..4190959 16s’ @4 100 1264
dir 4191060..4192225 16s’ 52 1166
dir 4192278..4192353 gca 248 76
dir 4192602..4193197 23s° 100 596
dir 4193298..4193874 16s° 321 577
dir 4194196..4196423 23s’ 100 2228
dir 4196524..4197091 16s° 320 568
dir 4197412..4199044 23s° 100 1633
dir 4199145..4201593 23s’ 126 2449
dir 4201720..4201836 5s 127 127 117 127
dir 4201964..4202473 cds 510 transcription repressor NadR
dir 4205417..4205872 cds 0 0 456 0 nucleoside deaminase
dir 4205873..4205964 tcc @5 37 92
dir 4206002..4206266 ncRNA 76 76 265
dir 4206343..4207980 cds 1638 DNA polymerase III subunit gamma/tau
comp 4209435..4210639 cds 496 496 1205 glycosyl transferase
4211136..4212643 16s 321 1508
4212965..4213127 23s° 100 100 163 100
<>comp 4213228..4213849 cds 111 622 CHAP domain-containing protein
comp 4213961..4214620 cds 228 228 660 228 type A-1 chloramphenicol O-acetyltransferase
dir 4214849..4216199 16s 321 1351
dir 4216521..4217008 23s° 101 488
comp 4217110..4218529 23s° 250 1420
comp 4218780..4218855 gca 52 76
comp 4218908..4219471 16s° 100 564
comp 4219572..4219856 23s° 217 285
comp 4220074..4221581 16s 179 179 1508 179
>comp 4221761..4222206 cds 386 386 446 386 B/F/G family RNA polymerase sigma-70 factor
dir 4222593..4224100 16s 321 1508
dir 4224422..4227321 23s 181 2900
dir 4227503..4227619 5s 6 117
dir 4227626..4227700 aac 6 6 75
dir 4227707..4227792 tta 15 15 86
dir 4227808..4227883 atgf 7 7 76
dir 4227891..4227965 gaa 9 9 75
dir 4227975..4228048 gga 5 5 74
dir 4228054..4228129 gta 5 5 76
dir 4228135..4228211 gac 9 9 77
dir 4228221..4228295 aca 14 14 75
dir 4228310..4228394 tac 10 10 85
dir 4228405..4228488 cta 28 28 84
dir 4228517..4228593 aga 7 7 77
dir 4228601..4228676 caa 89 89 76
dir 4228766..4228854 tca 3 3 89
dir 4228858..4228933 ttc 6 6 76
dir 4228940..4229016 atgj 11 11 77
dir 4229028..4229104 atgi 29 29 77
dir 4229134..4229210 cca 7 7 77
dir 4229218..4229294 cac 8 8 77
dir 4229303..4229378 aaa 353 76
comp 4229732..4229848 5s 126 117
comp 4229975..4232010 23s' 582 2036
dir 4232593..4234098 16s @6 217 1506
dir 4234316..4237215 23s 126 2900
dir 4237342..4237458 5s 216 216 117 216
comp 4237675..4238859 cds 372 372 1185 pyridoxal phosphate-dependent aminotransferase
dir 4239232..4241583 cds 21 21 2352 anaerobic ribonucleoside triphosphate reductase
dir 4241605..4242144 cds 778 778 540 anaerobic ribonucleoside-triphosphate reductase activating protein
dir 4242923..4244459 16s @7 261 1537
dir 4244721..4247619 23s 201 2899
dir 4247821..4247937 5s 5 117
dir 4247943..4248031 tta 11 11 89
dir 4248043..4248119 atgi 108 77
dir 4248228..4249735 16s 184 1508
dir 4249920..4250564 23s° 100 100 645 100
<dir 4250665..4250923 cds 112 112 259 112 hp
comp 4251036..4253145 23s’ 375 2110
comp 4253521..4253596 gca 52 76
comp 4253649..4254226 16s° 282 282 578
dir 4254509..4254712 cds 12 12 204 hp
dir 4254725..4256002 cds 1278 phage portal protein

cdc8 cumuls[modifier | modifier le wikicode]

  • Lien tableur: cdc8 cumuls
  • Liens internes: cdc8 opérons
  • Légende:
    - avec et sans rRNA, fréquences des intercalaires dans les clusters avec rRNA ou sans rRNA.
    - cdsd, je ne choisis que le cds avec l'intercalaire le plus faible d'un cluster donné, en supposant que ce cds a été créé par le cluster lors des conversions.
    - cdsa, longueur du cds en aas ici. C'est le cdsa de cdc8 opérons divisé par 3.
    -  1 : occurences exclues de la moyenne. Sont exclus de la moyenne les jaunes 554 de cdc8 opérons.
C3. cumuls. Peptoclostridium difficile M68
opérons Fréquences intercalaires tRNAs Fréquences intercalaires cds Fréquences aas cds
effectif gammes sans rRNAs avec rRNAs gammes cds gammes cdsd gammes cdsa
avec rRNA opérons 21 1 0 1 4 1 3 100 6
16 23 5s 0 4 20 2 77 50 2 20 0 200 8
16 gca 235 2 40 1 6 100 7 40 0 300 11
16 23 5s a 5 60 0 150 5 60 0 400 5
max a 43 80 1 200 5 80 2 500 5
a doubles 2 100 3 250 6 100 3 600 5
autres 10 120 0 300 5 120 3 700 1
total aas 98 140 0 350 4 140 1 800 1
sans opérons 6 160 0 400 4 160 1 900 1
1 aa 5 180 0 450 0 180 1 1000 0
max a 4 200 0 500 2 200 1 1100 0
a doubles 0 0 4 7 1
total aas 9 3 87 48 22 44
total aas 108
remarques 7
avec jaune moyenne 14 13 256 155 330
variance 16 252 109 234
sans jaune moyenne 10 182 208
variance 6 117 97

cdc8 blocs[modifier | modifier le wikicode]

  • Lien tableur: cdc8 blocs
  • Lien cdc blocs: La colonne "Bloc type" de cdc8 blocs correspond aux types définis dans cdc blocs.
  • Légende
    - 23s': possible 23S ribosomal RNA but does not have good blast hits on one or both of the ends.
    - 23s°: 23S ribosomal RNA rRNA prediction is too short
    - cca: remarques @2 et @3.
  • Notes:
    - Je définis le type de bloc en comparant avec un bloc de cdc_bloc ayant approximativement les mêmes intercalaires et quand c'est possible les tRNAs identiques qui l'accompagnent. L'identification des tRNAs est faite dans la comparaison entre cdc et cdc 8 dans 43aas, 18aas et 9aas.
    - Les groupes de clusters. Un groupe de cluster à rRNA, et ici avec les débris de rRNA aussi, est un ensemble de rRNAs espacés de tRNAs et de cds par des intercalaires faibles, inférieurs à 778 pbs ici. Les 2 intercalaires des cds terminaux peuvent être très élevés, indiquant que le cds n'est pas sous l'influence de la conversion appliquée au cluster. Au total cdc8 a 9 groupes dont 6 avec un seul bloc, et 3 avec plus de 2 comprenant la quasi totalité des rRNAs, 40/46.
    1. Les solitaires, 6 dont 5 bien typés, I2 I3 II III et X1.
    2. Le groupe à 2 blocs, IV1 et IV2 bien typés.
    3. Le groupe à 15 rRNAs dans lequel je n'ai pu typé que 2 blocs, I1 et VII1.
    4. Le groupe à 23 rRNAs dans lequel je n'ai pu typé que 3 blocs, I4 IV3 IV4.
    5. Le type IV4, 16s23s5s-tta-atgi, n'existe pas dans psor mais est ajouté ici parce qu'il est semblable aux types IV, 16s23s5s suivi de tRNAs. Mais en plus avec tta-atgi il est comparable aussi aux types VII1 et VIII1. Ce point est important quand on considère l'origine de cdc8 comme croisement de cdc et psor. Ce type IV4 va en faveur d'une évolution de cdc vers psor en passant par cdc8.
C3. cdc8 blocs
Bloc type groupes intercal Bloc type groupes intercal Bloc type groupe intercal
cds 554 cds 150 cds 496
cds 0 aca 93 16s 321
cds 167 23s 184 23s° 100
23s° 132 III 16s 374 cds 111
IV2 5s 6 cds cds 228
aac 4 16s 321
**16aas 7 cds 452 23s° 101
atgj 114 5s 125 23s° 250
IV1 16s 0 23s 261 gca 52
cds 100 I2 16s 190 16s° 100
23s° 181 cds 23s° 217
5s 6 16s 179
aac 6 cds 118 cds 386
**41aas 12 5s 126 IV3 16s 321
gta 75 23s 321 23s 181
cds 308 I3 16s 292 5s 6
cds cds aac 6
**17aas 8
cds 281 cds 179 aaa 353
16s° 100 16s 161 5s 126
23s° 126 5s 201 23s' 582
X1 5s 7 I1 23s 217 I4 16s 217
aac 6 16s 108 23s 126
**7aas 9 atgi 11 5s 216
aga 954 tta 5 cds 372
cds 5s 201 cds 21
23s 375 cds 778
cds 733 VII1 gca 52 IV4 16s 261
cds 1 16s’ 100 23s 201
23s° 126 16s’ 52 5s 5
5s 177 gca 248 tta 11
cds 23s° 100 atgi 108
16s° 321 16s 184
cds 238 23s' 100 23s° 100
II 16s 320 16s° 320 cds 112
23s 91 23s° 100 23s’ 375
gga 8 23s’ 126 gca 52
5s 273 5s 127 16s° 282
cds cds cds

cdc8 cdc psor 43[modifier | modifier le wikicode]

  • Lien tableur: cdc8 cdc psor 43
  • Lien cdc psor: le tableau de comparaison cdc-psor
  • Légende
    - 23s': possible 23S ribosomal RNA but does not have good blast hits on one or both of the ends.
    - 23s°: 23S ribosomal RNA rRNA prediction is too short
    - cca: marque les tRNAs différents entre les 2 génomes.
    - diff pour différence entre les intercalaires (intercal) cdc moins cdc8.
    - séquences identiques (bordure épaisse): Une séquence identique entre les 2 génomes est encadrée par 2 tRNAs différents (cyan) dans l'un et par 2 bordures épaisses dans l'autre.
  • Notes:
    - identité entre cdc et cdc8 avec de rares différences faibles entre les intercalaires.
    - Aussi on retrouve les différences entre cdc et psor dans le tableau de droite.
C3. Comparaison cdc8-cdc-psor 43
C31. Comparaison cdc8-cdc 43
cdc8 43aas cdc 43aas
gene intercal gene intercal diff
16s 1
cds 100 16s 279
23s° 181 23s 180 -1
5s 6 5s 6 0
aac 6 aac 6 0
tta 15 tta 15 0
atgf 7 atgf 7 0
gaa 9 gaa 9 0
gga 5 gga 5 0
gta 5 gta 5 0
gac 9 gac 9 0
aca 14 aca 14 0
tac 10 tac 8 -2
cta 28 cta 29 1
aga 7 aga 7 0
caa 89 caa 88 -1
tca 3 tca 3 0
ttc 6 ttc 6 0
atgj 11 atgj 11 0
atgi 29 atgi 23 -6
cca 7 cca 7 0
cac 8 cac 8 0
aaa 7 aaa 7 0
tgc 6 tgc 6 0
aac 6 aac 5 -1
tta 15 tta 15 0
atgf 7 atgf 7 0
gaa 9 gaa 9 0
gga 5 gga 5 0
gta 5 gta 5 0
gac 9 gac 9 0
aca 14 aca 14 0
tac 9 tac 9 0
cta 24 cta 23 -1
ggc 24 ggc 24 0
aga 9 aga 9 0
caa 8 caa 8 0
aaa 2 aaa 2 0
tca 3 tca 3 0
ttc 6 ttc 6 0
atgj 11 atgj 11 0
atgi 17 atgi 17 0
cac 8 cac 8 0
aaa 7 aaa 7 0
tgc 7 tgc 7 0
cgt 12 cgt 12 0
gta 75 gta 75 0
cds cds
C32. Comparaison cdc8-psor 43
cdc8 43aas psor 44aas
gene intercal gene intercal diff
16s 1
cds 100 16s 196
23s° 181 23s 122
5s 6 5s 5
aac 6 tta 13 -2
tta 15 atg 15 8
atgf 7 gaa 9 0
gaa 9 gga 6 1
gga 5 gta 5 0
gta 5 gac 16
gac 9 aac 4
aca 14 aca 4 -10
tac 10 tac 15 5
cta 28 cta 14 -14
aga 7 aga 7 0
caa 89 caa 11
tca 3 aaa 6
ttc 6 tca 3 0
atgj 11 ttc 9 3
atgi 29 atg 8 -3
cca 7 atg 21 -8
cac 8 cca 6 -1
aaa 7 cac 4
tgc 6 tgc 25
aac 6 tta 13 -2
tta 15 atg 15 8
atgf 7 gaa 9 0
gaa 9 gga 6 1
gga 5 gta 5 0
gta 5 gac 16
gac 9 aac 4
aca 14 aca 4 -10
tac 9 tac 15 6
cta 24 cta 11 -13
ggc 24 ggc 13 -11
aga 9 aga 7 -2
caa 8 caa 11 3
aaa 2 aaa 6 4
tca 3 tca 3 0
ttc 6 ttc 9 3
atgj 11 atg 8 -3
atgi 17 atg 21
cac 8 cca 6
aaa 7 cac 9 1
tgc 7 aaa 21 14
cgt 12 tgc 6 -1
gta 75 cgt 10 -2
cds gta 162
cds

cdc8 cdc psor 18[modifier | modifier le wikicode]

  • Lien tableur: cdc8 cdc psor 18
  • Lien cdc psor: le tableau de comparaison cdc-psor
  • Légende
    - 23s': possible 23S ribosomal RNA but does not have good blast hits on one or both of the ends.
    - 23s°: 23S ribosomal RNA rRNA prediction is too short
    - cca: marque les tRNAs différents entre les 2 génomes.
    - diff pour différence entre les intercalaires (intercal) colonne de droite moins colonne de gauche.
    - séquences identiques (bordure épaisse): Une séquence identique entre les 2 génomes est encadrée par 2 tRNAs différents (cyan) dans l'un et par 2 bordures épaisses dans l'autre.
  • Notes:
    - Sont comparés ici des suite de longueurs équivalentes entre les 3 génomes, 18aas 19aas 23aas,
    - avec 4 comparaisons cdc8 18aas/cdc 18aas, cdc8 19aas/psor 23aas, cdc8 18aas/psor 23aas, cdc8 19aas/cdc8 18aas,
    - cdc8 18aas et cdc 18aas sont identiques alors que, en intra, cdc8 19aas est très différent de cdc8 18aas.
    - cdc8 18aas est quasiment inclus dans psor 23aas: les 14 tRNAs de la fin de cdc8 se trouvent en fin de psor avec une seule insertion dans psor, mais les différences entre intercalaires sont élevées comme entre cdc et psor.
C3. Comparaison cdc8-cdc-psor 18
C33. Comparaison cdc8-cdc-psor 18
cdc8 18aas cdc 18aas
gene intercal gene intercal diff
cds 214
cds 554
cds 0
cds 167 16s 279
23s° 132 23s 131 -1
5s 6 5s 6 0
aac 4 aac 4 0
gaa 5 gaa 5 0
gta 5 gta 5 0
gac 11 gac 10 -1
aca 14 aca 14 0
tac 9 tac 9 0
gga 10 gga 10 0
aga 9 aga 9 0
caa 11 caa 11 0
aaa 2 aaa 2 0
tca 18 tca 17 -1
agc 8 agc 8 0
cca 85 cca 85 0
tgg 60 tgg 60 0
cca 5 cca 6 1
atc 3 atc 3 0
ttc 7 ttc 7 0
atgj 114 atgj 114 0
cdc8 18aas psor 23aas
gène intercal gène intercal diff
16s 196
23s 213
cds 214 5s 5
cds 554 tta 13
cds 0 atg 15
cds 167 gaa 9
23s° 132 gga 6
5s 6 gta 5 0
aac 4 gac 16
gaa 5 aac 31
gta 5 aac 4
gac 11 aca 4 -10
aca 14 tac 11 2
tac 9 gga 19 9
gga 10 aga 6 -3
aga 9 caa 12 1
caa 11 aaa 6 4
aaa 2 tca 11 -7
tca 18 agc 6 -2
agc 8 cca 6
cca 85 atg 11
tgg 60 tgg 31 -29
cca 5 cca 6 1
atc 3 atc 6 3
ttc 7 ttc 13 6
atgj 114 atg 138 24
C34. Comparaison cdc8-cdc-psor 19
cdc8 19aas psor 23aas
gene intercal gene intercal diff
16s 321 16s 196
23s 181 23s 213
5s 6 5s 5
aac 6 tta 13 -2
tta 15 atg 15 8
atgf 7 gaa 9 0
gaa 9 gga 6 1
gga 5 gta 5 0
gta 5 gac 16
gac 9 aac 31
aca 14 aac 4
tac 10 aca 4 -10
cta 28 tac 11
aga 7 gga 19
caa 89 aga 6 -1
tca 3 caa 12
ttc 6 aaa 6
atgj 11 tca 11
atgi 29 agc 6
cca 7 cca 6
cac 8 atg 11
aaa 353 tgg 31
cca 6
atc 6
ttc 13
atg 138
cdc8 19aas cdc8 18aas
gène intercal gène intercal diff
cds 214
cds 554
cds 0
16s 321 cds 167
23s 181 23s° 132
5s 6 5s 6
aac 6 aac 4
tta 15 gaa 5
atgf 7 gta 5 0
gaa 9 gac 11 2
gga 5 aca 14 0
gta 5 tac 9
gac 9 gga 10
aca 14 aga 9 2
tac 10 caa 11
cta 28 aaa 2
aga 7 tca 18
caa 89 agc 8
tca 3 cca 85
ttc 6 tgg 60
atgj 11 cca 5
atgi 29 atc 3
cca 7 ttc 7
cac 8 atgj 114
aaa 353

cdc8 cdc psor 9[modifier | modifier le wikicode]

  • Lien tableur: cdc8 cdc psor 9
  • Lien cdc psor: le tableau de comparaison cdc-psor
  • Légende
    - 23s': possible 23S ribosomal RNA but does not have good blast hits on one or both of the ends.
    - 23s°: 23S ribosomal RNA rRNA prediction is too short
    - cca: marque les tRNAs différents entre les 2 génomes.
    - diff pour différence entre les intercalaires (intercal) colonne de droite moins colonne de gauche.
    - séquences identiques (bordure épaisse): Une séquence identique entre les 2 génomes est encadrée par 2 tRNAs différents (cyan) dans l'un et par 2 bordures épaisses dans l'autre.
  • Notes:
    - Sont comparés ici des suites courtes, en intra cdc8 18aas/9aas et 19aas/9aas, cdc8 9aas/cdc 9aas et cdc8 VII1/psor VII1.
    - cdc8 9aas et cdc 9aas sont identiques
    - cdc8 9aas se retrouve entièrement (sauf 1 tRNA) dans cdc8 19aas avec cependant des diff élevés, mais il est très différent de cdc8 18aas (4 tRNAs différents).
    - La comparaison cdc8 VII1/psor VII1: le groupe de psor à 3 blocs 16s-gca-23s5s est caractérisé en plus par la séquence courte tta-atg (atg supposé atgi). On retrouve le bloc du milieu, VII1 dans cdc8, à l'envers (compléments) et on retrouve partiellement le bloc de fin VIII1 à l'endroit. Dans cdc8 ces blocs sont partiellement abîmés et se trouvent dans le groupe à 15 rRNAs (voir cdc8_blocs). Attention aux diff qui suivent le changement de sens.
    - 3 intercalaires sont préservés entre cdc8 VII1 et celui de psor, 16s-gca5s-ttatta-atgi. De même pour 16s-gca du bloc VIII1.
C3. Comparaison cdc8-cdc-psor 9
C35. Comparaison cdc8-cdc-psor 9
cdc8 18aas cdc8 9aas
gene intercal gene intercal diff
cds 214
cds 554
cds 0 cds 281
cds 167 16s° 100
23s° 132 23s° 126
5s 6 5s 7
aac 4 aac 6
gaa 5 tta 15
gta 5 atgf 7
gac 11 gaa 8
aca 14 gga 4
tac 9 gta 5 0
gga 10 gac 10
aga 9 ggc 9
caa 11 aga 954
aaa 2 cds
tca 18
agc 8
cca 85
tgg 60
cca 5
atc 3
ttc 7
atgj 114
cdc8 19aas cdc8 9aas
gene intercal gene intercal diff
cds 281
16s 321 16s° 100
23s 181 23s° 126
5s 6 5s 7
aac 6 aac 6 0
tta 15 tta 15 9
atgf 7 atgf 7 -8
gaa 9 gaa 8 1
gga 5 gga 4 -5
gta 5 gta 5 0
gac 9 gac 10
aca 14 ggc 9
tac 10 aga 954
cta 28 cds
aga 7
caa 89
tca 3
ttc 6
atgj 11
atgi 29
cca 7
cac 8
aaa 353
C36. Comparaison cdc8-cdc-psor groupe
cdc8 9aas cdc 9aas
gene intercal gene intercal diff
cds 281 16s 52
16s° 100 gca 373
23s° 126 23s 126
5s 7 5s 7
aac 6 aac 5 -1
tta 15 tta 15 0
atgf 7 atgf 7 0
gaa 8 gaa 14 6
gga 4 gga 5 1
gta 5 gta 5 0
gac 10 gac 10 0
ggc 9 ggc 9 0
aga 954 aga 975 21
cds cds
cdc8 I4 cdc VIII1
gene intercal gene intercal diff
16s 68
16s 217 gca 271
23s 126 23s 126 0
5s 216 5s 213 -3
cds 372 cds 372 0
cds 21 cds 21 0
cds 778 cds 776 -2
16s 261 16s 52
23s 201 gca 373
5s 5 23s 126 -75
5s 7 2
psor VII1 cdc8 VII1
gene intercal gene intercal diff
CDS 431 cds 179
16s 54 16s 161
gca 114 5s 201
23s 193 23s 217
5s 5 16s 108
tta 9 atgi 11 2
atg 123 tta 5 0
16s 54 5s 201 8
gca 114 23s 375 261
23s 193 gca 52 -2
5s 5 16s’ 100 -23
tta 9 16s’ 52
atg 123 gca 248
16s 54 23s° 100 -2
gca 114 16s° 321 134
23s 78 23s' 100
5s 100 16s° 320
CDS 23s° 100
23s’ 126
5s 127
cds

cdc8 cdc protéines[modifier | modifier le wikicode]

  • Notes:
    - L'altération poussée des rRNAs dans cdc8 qui saute aux yeux quand on comapre les blocs en tRNAs et intercalaires, m'a poussé à comparer les tailles en pbs ici des rRNAs et des cds qui les entourent avec l'idée que ces cds sont issus de la conversion de ces rRNAs. D'où l'idée de création de gène par conversion à l'instar du processus CRISPR.

Alignement sur cdc[modifier | modifier le wikicode]

  • Lien tableur: Alignement sur cdc
  • Lien noms abrégés
  • Légende: abrégé pour noms abrégés des protéines.
    - 23s': possible 23S ribosomal RNA but does not have good blast hits on one or both of the ends.
    - 23s°: 23S ribosomal RNA rRNA prediction is too short
    - SigB: Protéine existant dans cdc et cdc8 mais est décalée dans cdc8 par les grands remaniements. Voir alignement sur cdc8, tableau qui suit.
  • Notes:
    - cdc présente 15 clusters avec ou sans rRNAs. 5 clusters sans rRNAs sont reproduits tels quels dans cdc8. Les clusters avec rRNAs se répartissent en 3 16sgca23s et 7 16s23s. Dans cdc8 les 3 16sgca23s sont modifiés ou altérés, 3 16s23s sont altérés et les 4 autres sont reproduits tels quels.
    - Les 3 16sgca23s5s perdent leur gca mais gardent le 5s. Deux sont durement altérés dont un porte une séquence de 9 tRNAs et l'autre rien. La modification du 3ème consiste en la suppression du gca seulement sans tocher le reste. Cependant l'intercalaire 16s-23s de 415 pbs dans cdc est divisé par 2 dans cdc8, 217 pbs.
    - Les 3 16s23s5s altérés le sont fortement, 2 portent des séquences longues de tRNAs, 43 et 18, le 3ème est sans tRNAs.
    - La colonne "ordre dans cdc" servira à repérer les grands remaniement quand je ferai l'alignement sur cdc8. De même pour les protéines en bleu foncé.
C3. cdc-cdc8, alignement des protéines sur cdc
C37. cdc protéines
ordre sens adresse gene intercal pbs abrégé
0 dir 9857..10630 cds 179 774 SigB
dir 10810..12317 16s 52 1508
dir 12370..12445 gca 249 76
1 dir 12695..15596 23s 111 2902
dir 15708..15824 5s 126 117
dir 15951..16460 cds 11 510 NadR
dir 16472..17353 cds 457 882 mecano
dir 17811..19082 cds 319 1272 S-ligase
dir 19402..19857 cds 0 456 Nuc-de
dir 19858..19949 tcc 37 92
2 dir 19987..20251 ncRNA 76 265
dir 20328..21965 cds 1638 III-tau
comp 23419..24624 cds 505 1206 Glyco-tr
dir 25130..26637 16s 279 1508
dir 26917..29816 23s 180 2900
dir 29997..30113 5s 6 117
3 dir 30120..30194 aac 6 75
dir **41aas 12
dir 33877..33952 gta 75 76
dir 34028..34441 cds 308 414 hp-414
dir 34750..38181 cds 3432 pyruvate
dir 127011..127715 cds 281 705 CwlD
dir 127997..129505 16s 279 1509
dir 129785..132685 23s 131 2901
dir 132817..132933 5s 6 117
4 dir 132940..133014 aac 4 75
dir **16aas 8
dir 134534..134610 atgj 114 77
dir 134725..136115 16s 68 1391
dir 136184..136259 gca 271 76
dir 136531..139430 23s 126 2900
dir 139557..139673 5s 213 117
comp 139887..141071 cds 372 1185 B6
5 dir 141444..143795 cds 21 2352 Art-red
dir 143817..144356 cds 776 540 Art-reda
dir 145133..146640 16s 52 1508
dir 146693..146768 gca 373 76
dir 147142..150041 23s 126 2900
dir 150168..150284 5s 7 117
6 dir 150292..150366 aac 5 75
dir **7aas 6
dir 150976..151049 aga 975 74
dir 152025..152864 cds 840 TIGR
dir 378341..380728 cds 583 2388 cad
dir 381312..382819 16s 311 1508
dir 383131..386030 23s 126 2900
7 dir 386157..386273 5s 177 117
dir 386451..387059 cds 609 DedA
comp 833130..833894 cds 258 765 DeoR
8 dir 834153..834243 agc 87 91
dir 834331..835119 cds 789 flagellar
dir 1089165..1090139 cds 239 975 Mannosyl
dir 1090379..1091886 16s 320 1508
dir 1092207..1095106 23s 91 2900
dir 1095198..1095271 gga 8 74
9 dir 1095280..1095396 5s 273 117
dir 1095670..1097688 cds 2019 Ala amid
comp 1181549..1182958 cds 1374 1410 MBOAT
10 comp 1184333..1184415 ttg 318 83
dir 1184734..1187382 cds 2649 PolyI
dir 1835768..1837498 cds 109 1731 NhaC
11 dir 1837608..1837688 cta 231 81
<dir 1837920..1838093 cds 174 HXXEE
dir 2981767..2982444 cds 159 678 SrtB
comp 2982604..2982678 aca 94 75
comp 2982773..2985672 23s 184 2900
12 comp 2985857..2987364 16s 340 1508
dir 2987705..2988643 cds 939 lactam
comp 3787361..3788431 cds 454 1071 ABC
comp 3788886..3789002 5s 126 117
13 comp 3789129..3792028 23s 281 2900
comp 3792310..3793817 16s 191 1508
comp 3794009..3794587 cds 579 precorrin
comp 3944262..3944453 cds 119 192 DUF378
comp 3944573..3944689 5s 126 117
14 comp 3944816..3947715 23s 217 2900
comp 3947933..3949440 16s 282 1508
comp 3949723..3950004 cds 221 282 hp-282
comp 3950226..3951755 cds 1530 K-ligase
dir 4084445..4085437 cds 382 993 DnaC
comp 4085820..4085894 aca 33 75
15 comp 4085928..4086003 gta 4 76
comp 4086008..4086082 gaa 6 75
comp 4086089..4086164 aaa 326 76
comp 4086491..4087780 cds 1290 succinate
C38. cdc8 protéines
sens adresse gene intercal pbs abrégé
dir 4194196..4196423 23s’ 100 2228
dir 4196524..4197091 16s° 320 568
dir 4197412..4199044 23s° 100 1633
dir 4199145..4201593 23s’ 126 2449
dir 4201720..4201836 5s 127 117
dir 4201964..4202473 cds 11 510 NadR
dir 4202485..4203366 cds 458 882 mecano
dir 4203825..4205096 cds 320 1272 S-ligase
dir 4205417..4205872 cds 0 456 Nuc-de
dir 4205873..4205964 tcc 37 92
dir 4206002..4206266 ncRNA 76 265
dir 4206343..4207980 cds 1638 III-tau
dir 4306341..4307538 16s 0 1198
dir 4307539..4308225 cds 100 687 xylose
dir 1..796 23s° 181 796
dir 978..1094 5s 6 117
dir 1101..1175 aac 6 75
dir **41aas 12
dir 4868..4943 gta 75 76
dir 5019..5432 cds 308 414 hp-414
dir 5741..9172 cds 3432 pyruvate
dir 4300349..4300807 cds 554 459 Helix
dir 4301362..4303101 cds 0 1740 hp-1740
dir 4303102..4303305 cds 167 204 hp-204
dir 4303473..4304299 23s° 132 827
dir 4304432..4304548 5s 6 117
dir 4304555..4304629 aac 4 75
dir **16aas 8
dir 4306150..4306226 atgj 114 77
dir 4232593..4234098 16s 217 1506
dir 4234316..4237215 23s 126 2900
dir 4237342..4237458 5s 216 117
comp 4237675..4238859 cds 372 1185 B6
dir 4239232..4241583 cds 21 2352 Art-red
dir 4241605..4242144 cds 778 540 Art-reda
dir 94032..94736 cds 281 705 CwlD
dir 95018..95994 16s° 100 977
dir 96095..97613 23s° 126 1519
dir 97740..97856 5s 7 117
dir 97864..97938 aac 6 75
dir **7aas 6
dir 98542..98615 aga 954 74
dir 99570..100409 cds 840 TIGR
dir 306829..309216 cds 733 2388 cad
<>comp 309950..310076 cds 1 127 seleno
dir 310078..311313 23s° 126 1236
dir 311440..311556 5s 177 117
dir 311734..312342 cds 609 DedA
comp 861856..862620 cds 258 765 DeoR
dir 862879..862969 agc 87 91
dir 863057..863845 cds 789 flagellar
dir 1106477..1107451 cds 238 975 Mannosyl
dir 1107690..1109197 16s 320 1508
dir 1109518..1112416 23s 91 2899
dir 1112508..1112581 gga 8 74
dir 1112590..1112706 5s 273 117
dir 1112980..1114998 cds 2019 Ala amid
comp 1196804..1198213 cds 1378 1410 MBOAT
comp 1199592..1199674 ttg 318 83
dir 1199993..1202641 cds 2649 PolyI
dir 1850896..1852626 cds 109 1731 NhaC
dir 1852736..1852816 cta 334 81
dir 1853151..1853666 cds 516 HXXEE
dir 3024038..3024715 cds 150 678 SrtB
comp 3024866..3024940 aca 93 75
comp 3025034..3027933 23s 184 2900
comp 3028118..3029625 16s 374 1508
dir 3030000..3030938 cds 939 lactam
comp 3875816..3876886 cds 452 1071 ABC
comp 3877339..3877455 5s 125 117
comp 3877581..3880480 23s 261 2900
comp 3880742..3882249 16s 190 1508
comp 3882440..3883018 cds 579 precorrin
comp 4017523..4017714 cds 118 192 DUF378
comp 4017833..4017949 5s 126 117
comp 4018076..4020975 23s 321 2900
comp 4021297..4022804 16s 292 1508
comp 4023097..4023378 cds 221 282 hp-282
comp 4023600..4025129 cds 1530 K-ligase
dir 4135881..4136873 cds 383 993 DnaC
comp 4137257..4137331 aca 33 75
comp 4137365..4137440 gta 4 76
comp 4137445..4137519 gaa 6 75
comp 4137526..4137601 aaa 331 76
comp 4137933..4139222 cds 1290 succinate

Alignement sur cdc8[modifier | modifier le wikicode]

  • Lien tableur: Alignement sur cdc8
  • Lien noms abrégés
  • Légende:
    - 23s': possible 23S ribosomal RNA but does not have good blast hits on one or both of the ends.
    - 23s°: 23S ribosomal RNA rRNA prediction is too short
    - SigB: Protéine existant dans cdc et cdc8 mais est décalée dans cdc8 par les grands remaniements. Voir alignement sur cdc, tableau précédent.
  • Notes:
    - Ici je n'ai pas fait de parallélisme cdc8/cdc. Il suffit de voir la colonne ordre de cdc décrit dans le tableau précédent (alignement sur cdc) pour se rendre compte des grands remaniements du chromosome. Dans cette colonne j'ai ajouté "insert" pour insertion par rapport à cdc.
    - Pour comparer cdc8 à psor pour certains clusters j'ai du intervertir l'ordre des tableaux, le tableau de gauche doit être la suite de celui de droite.
    - Les insertions accumulent les 2 grands groupes qu'on a vu dans cdc8-blocs, à 15 et 23 rRNAs. Par contre en dehors des insertions on trouve 3 groupes altérés à 1 ou 2 clusters, et tous les groupes non altérés sauf l'ordre 5 de cdc.
    - comparaison avec psor: on devine les types VI VII VIII, mais il y a de nouveau type le IV4 par exemple qu'on a signalé dans cdc8-blocs.
C3. cdc-cdc8, alignement des protéines sur cdc8
C40. cdc8 début
cdc8
ordre cdc sens adresse gène intercal pbs abrégé
insert dir 4299490..4300134 cds 214 645 Y-r1
insert dir 4300349..4300807 cds 554 459 Helix
dir 4301362..4303101 cds 0 1740 hp-1740
dir 4303102..4303305 cds 167 204 hp-204
dir 4303473..4304299 23s° 132 827
4 dir 4304432..4304548 5s 6 117
dir 4304555..4304629 aac 4 75
dir 4304634..4304708 gaa 5 75
dir 4304555..4304629 aac 4 75
dir **16aas 8
dir 4306150..4306226 atgj 114 77
dir 4306341..4307538 16s 0 1198
dir 4307539..4308225 cds 100 687 xylose
dir 1..796 23s° 181 796
3 dir 978..1094 5s 6 117
dir 1101..1175 aac 6 75
dir **41aas 12
dir 4868..4943 gta 75 76
dir 5019..5432 cds 308 414 hp-414
dir 5741..9172 cds 3432 pyruvate
dir 94032..94736 cds 281 705 CwlD
dir 95018..95994 16s° 100 977
dir 96095..97613 23s° 126 1519
6 dir 97740..97856 5s 7 117
dir 97864..97938 aac 6 75
dir **7aas 6
dir 98542..98615 aga 954 74
dir 99570..100409 cds 840 TIGR
<> cp 309950..310076 cds 1 127 seleno
dir 310078..311313 23s° 126 1236
7 dir 311440..311556 5s 177 117
dir 311734..312342 cds 609 DedA
comp 861856..862620 cds 258 765 DeoR
8 dir 862879..862969 agc 87 91
dir 863057..863845 cds 789 flagellar
dir 1106477..1107451 cds 238 975 Mannosyl
dir 1107690..1109197 16s 320 1508
dir 1109518..1112416 23s 91 2899
dir 1112508..1112581 gga 8 74
9 dir 1112590..1112706 5s 273 117
dir 1112980..1114998 cds 2019 Ala amid
comp 1196804..1198213 cds 1378 1410 MBOAT
10 comp 1199592..1199674 ttg 318 83
dir 1199993..1202641 cds 2649 PolyI
dir 1850896..1852626 cds 109 1731 NhaC
11 dir 1852736..1852816 cta 334 81
dir 1853151..1853666 cds 516 HXXEE
dir 3024038..3024715 cds 150 678 SrtB
comp 3024866..3024940 aca 93 75
12 comp 3025034..3027933 23s 184 2900
comp 3028118..3029625 16s 374 1508
dir 3030000..3030938 cds 939 lactam
insert dir 3805298..3806743 cds 208 1446 Y-r2
insert comp 3806952..3807028 agg 61 77
insert <comp 3807090..3808790 cds 1701 fdHa
comp 3875816..3876886 cds 452 1071 ABC
comp 3877339..3877455 5s 125 117
13 comp 3877581..3880480 23s 261 2900
comp 3880742..3882249 16s 190 1508
comp 3882440..3883018 cds 579 precorrin
comp 4017523..4017714 cds 118 192 DUF378
comp 4017833..4017949 5s 126 117
14 comp 4018076..4020975 23s 321 2900
comp 4021297..4022804 16s 292 1508
comp 4023097..4023378 cds 221 282 hp-282
comp 4023600..4025129 cds 1530 K-ligase
dir 4135881..4136873 cds 383 993 DnaC
comp 4137257..4137331 aca 33 75
15 comp 4137365..4137440 gta 4 76
comp 4137445..4137519 gaa 6 75
comp 4137526..4137601 aaa 331 76
comp 4137933..4139222 cds 1290 succinate
C40. cdc8 suite
cdc8 psor
ordre cdc sens adresse gène intercal pbs abrégé adresse gène intercal pbs abrégé 
0 dir 4178197..4178970 cds 179 774 SigB 127845..129260 CDS 100 1416 R-deca
insert dir 4179150..4180587 16s 161 1438 127628..127744 5s 78
insert comp 4180749..4180865 5s 201 117 124628..127549 23s 114
insert comp 4181067..4183959 23s 217 2893 124438..124513 gca 54
insert comp 4184177..4185684 16s 108 1508 122877..124383 16s 123
insert comp 4185793..4185869 atgi 11 77 122677..122753 atg 9
insert comp 4185881..4185969 tta 5 89 122579..122667 tta 5
insert comp 4185975..4186091 5s 201 117 122457..122573 5s 193
insert comp 4186293..4189192 23s 375 2900 119347..122263 23s 114
insert comp 4189568..4189643 gca 52 76 119157..119232 gca 54
insert comp 4189696..4190959 16s’ 100 1264 117596..119102 16s 123
insert dir 4191060..4192225 16s’ 52 1166 117396..117472 atg 9
insert dir 4192278..4192353 gca 248 76 117298..117386 tta 5
insert dir 4192602..4193197 23s° 100 596 117176..117292 5s 193
insert dir 4193298..4193874 16s° 321 577 114067..116982 23s 114
insert dir 4194196..4196423 23s’ 100 2228 113877..113952 gca 54
dir 4196524..4197091 16s° 320 568 112316..113822 16s 431
1 dir 4197412..4199044 23s° 100 1633 111345..111884 CDS 540 Art-reda
dir 4199145..4201593 23s’ 126 2449
dir 4201720..4201836 5s 127 117
dir 4201964..4202473 cds 11 510 NadR
dir 4202485..4203366 cds 458 882 mecano
dir 4203825..4205096 cds 320 1272 S-ligase
dir 4205417..4205872 cds 0 456 Nuc-de
dir 4205873..4205964 tcc 37 92
2 dir 4206002..4206266 ncRNA 76 265
dir 4206343..4207980 cds 1638 III-tau
insert comp 4209435..4210639 cds 496 1205 Glyco-tr
insert 4211136..4212643 16s 321 1508
insert 4212965..4213127 23s° 100 163
insert <>comp 4213228..4213849 cds 622 CHAP
insert comp 4213961..4214620 cds 228 660 A-1chlor
insert dir 4214849..4216199 16s 321 1351
insert dir 4216521..4217008 23s° 101 488
insert comp 4217110..4218529 23s° 250 1420
insert comp 4218780..4218855 gca 52 76
insert comp 4218908..4219471 16s° 100 564
insert comp 4219572..4219856 23s° 217 285
insert comp 4220074..4221581 16s 179 1508
insert >comp 4221761..4222206 cds 386 446 SigB2 3452349..3452552 CDS 239 204 hp-204
insert dir 4222593..4224100 16s 321 1508 3450603..3452109 16s 196
insert dir 4224422..4227321 23s 181 2900 3447492..3450406 23s 213
insert dir 4227503..4227619 5s 6 117 3447162..3447278 5s 5
insert dir 4227626..4227700 aac 6 75 3447068..3447156 tta 13
insert dir 4227707..4227792 tta 15 86 3446979..3447054 atg 15
insert dir 4227808..4227883 atgf 7 76 3446889..3446963 gaa 9
insert dir 4227891..4227965 gaa 9 75 3446806..3446879 gga 6
insert dir 4227975..4228048 gga 5 74 3446724..3446799 gta 5
insert dir 4228054..4228129 gta 5 76 3446642..3446718 gac 16
insert dir 4228135..4228211 gac 9 77 3446550..3446625 aac 31
insert dir 4228221..4228295 aca 14 75 3446443..3446518 aac 4
insert dir 4228310..4228394 tac 10 85 3446364..3446438 aca 4
insert dir 4228405..4228488 cta 28 84 3446275..3446359 tac 11
insert dir 4228517..4228593 aga 7 77 3446190..3446263 gga 19
insert dir 4228601..4228676 caa 89 76 3446094..3446170 aga 6
insert dir 4228766..4228854 tca 3 89 3446012..3446087 caa 12
insert dir 4228858..4228933 ttc 6 76 3445924..3445999 aaa 6
insert dir 4228940..4229016 atgj 11 77 3445829..3445917 tca 11
insert dir 4229028..4229104 atgi 29 77 3445727..3445817 agc 6
insert dir 4229134..4229210 cca 7 77 3445644..3445720 cca 6
insert dir 4229218..4229294 cac 8 77 3445561..3445637 atg 11
insert dir 4229303..4229378 aaa 353 76 3445474..3445549 tgg 31
insert comp 4229732..4229848 5s 126 117 3445366..3445442 cca 6
insert comp 4229975..4232010 23s’ 582 2036 3445283..3445359 atc 6
dir 4232593..4234098 16s 217 1506 3445201..3445276 ttc 13
dir 4234316..4237215 23s 126 2900 3445111..3445187 atg
dir 4237342..4237458 5s 216 117
comp 4237675..4238859 cds 372 1185 B6
5 dir 4239232..4241583 cds 21 2352 Art-red
dir 4241605..4242144 cds 778 540 Art-reda
insert dir 4242923..4244459 16s 261 1537
insert dir 4244721..4247619 23s 201 2899
insert dir 4247821..4247937 5s 5 117 111345..111884 CDS 431 540 Art-reda
insert dir 4247943..4248031 tta 11 89 112316..113822 16s 54
insert dir 4248043..4248119 atgi 108 77 113877..113952 gca 114
insert dir 4248228..4249735 16s 184 1508 114067..116982 23s 193
insert dir 4249920..4250564 23s° 100 645 117176..117292 5s 5
insert <dir 4250665..4250923 cds 112 259 hp-259 117298..117386 tta 9
insert comp 4251036..4253145 23s’ 375 2110 117396..117472 atg 123
insert comp 4253521..4253596 gca 52 76 117596..119102 16s 54
insert comp 4253649..4254226 16s° 282 578 119157..119232 gca 114
insert dir 4254509..4254712 cds 12 204 hp-204 119347..122263 23s 193
insert dir 4254725..4256002 cds 1278 phagePP 122457..122573 5s 5
122579..122667 tta 9
début début début début début début début 122677..122753 atg 123
insert dir 4299490..4300134 cds 214 645 Y-r1 122877..124383 16s 54
insert dir 4300349..4300807 cds 554 459 Helix 124438..124513 gca 114
dir 4301362..4303101 cds 0 1740 hp-1740 124628..127549 23s 78
dir 4303102..4303305 cds 167 204 hp-204 127628..127744 5s 100
4 dir 4303473..4304299 23s° 132 827 127845..129260 CDS 1416 R-deca

cdc8 cdc création de cds[modifier | modifier le wikicode]

  • Lien tableur: cdc8 cdc création de cds
  • Lien abrégé
  • Notes:
    - Dans la colonne abrégé sont marqués les cds spécifiques à cdc8, cyan dans Alignement sur cdc8.
    - Certains de ces cds, étant donné leur position dans un bloc de rRNAs dégradés, seraient des candidats de gènes créés de novo lors des conversions qui ont altéré ce bloc. Il est évident qu'on peut toujours rétorquer que ce gène a été copié ou intégré à ce niveau par la conversion. Mais si ce gène ou plusieurs n'existaient pas dans cdc mais seulement dans cdc8, alors l'hypothèse de création de novo serait renforcée.
    - 7 gènes de cdc8, Y-r1 Helix xylose seleno CHAP A-1chlor sigB2, répondent aux critères de la conversion mais n'existent pas dans cdc. Ces cds sont colorés en jaunes et repérés par leur taille en pbs.
    - 4 gènes parmi les 7, seleno CHAP A-1chlor sigB2, n'existent qu'en un seul exemplaire, et ne peuvent donc être extraits à la limite que d'un cds hypothétique, hypothetical protein.
    - Les 3 gènes restants, Y-r1 Helix xylose, ont des cds analogues, c.a.d portant le même nom dans mes recherches et pourraient être extraits de ces analogues d'autant plus qu'ils ont des noms portant la mention type ou domaine.
    - Le gène PhagePP est à la limite du critère de conversion puisqu'il est en fin de bloc mais séparé de 12 pbs du cds hp-204 qui est plus proche de la création de novo puisqu'il est hypothétique. Il appartiendrait au 2ème groupe de gènes ayant des analogues. Cependant j'ai trouvé un gène dans cdc et un gène dans psor qui ont des tailles quasi identiques. Aussi j'ai recherché les cdcs encadrant ces gènes, ils sont tous différents dans les 3 génomes. PhagePP serait analogue donc à Y-r1 Helix xylose.
    Le nom complet du cds Clp est "Clp protéase" et celui de PhageHM est "phage head morphogenesis, SPP1 gp7 family domain protein".
    - J'ai inclue aussi 2 cds appartenant à un cluster sans rRNA, Y-r2 et fdhA. Y-r2 avec sa taille de 1446 se comporte comme Y-r1, il n'existe pas dans cdc. fdhA est le contre exemple de cds qui n'est pas créé de novo, il n'est pas dans une zone altérée par la conversion des rRNA, et il existe dans cdc, mais pas dans psor qui est plus loin phylogénétiquement.
C3. cdc8 cdc création de cds
abrégé cdc8 pbs cdc pbs psor pbs
seleno A 309950..310076 127 0 -
Y-r 457663..457878 216 457207..457422 216 -
1237414..1237986 573 1223841..1224413 573
1291413..1292327 915 1277836..1278750 915
1418672..1419580 909 1405262..1406170 909
2120221..2121348 1128
2785863..2786042 180
3564835..3565434 600
Y-r2 3805298..3806743 1446
Y-r1 4299490..4300134 645
Helix 351106..351336 231 391813..392001 189 -
379952..380503 552 429510..430061 552
456588..456776 189 461727..462398 672
1187185..1187736 552 1169984..1170535 552
1466364..1466783 420 1292255..1292926 672
1467749..1468147 399 1454375..1454773 399
1605760..1606344 585 1517855..1518619 765
1694358..1694750 393 1592306..1592890 585
1936722..1937267 546 1682266..1682658 393
2105662..2106711 1050 1695592..1696284 693
2196549..2198204 1656 1916424..1916630 207
2342487..2342690 204 1922813..1923358 546
2353934..2354578 645 2164151..2165806 1656
2378761..2379891 1131 2308386..2308589 204
2721795..2722316 522 2319833..2320477 645
3485137..3486024 888 2344477..2345607 1131
3570953..3571183 231 2501260..2501931 672
3571660..3571878 219 2688255..2688776 522
3804379..3804627 249 3459701..3460588 888
3804878..3805279 402 3475449..3475589 141
4286854..4287222 369
4288799..4289518 720
4300349..4300807 459
xylose 3383443..3384780 1338 3349843..3351180 1338 0
<4307539..4308225 687
CHAP <4213228..>4213849 622 0 -
A-1chlor 4213961..4214620 660 0 0
SigB2 4221761..4222206 446 0 0
fdHa 4221761..4222206 1701 3711229..3713373 2145 -
R-deca 0 0 127845..129260 1416
876023..877522 1500
phagePP 1448919..1449983 1065 1435547..1436611 1065 1489507..1490769 1263
1450539..1450985 447 1437167..1437613 447
1709611..1711050 1440 1697521..1698963 1443
1718404..1718844 441 1708192..1708632 441
3560756..3561910 1155 3841162..3842367 1206
4254725..4256002 1278
4260531..4261586 1056
4262058..4262474 417
hp-204 4254509..4254712 204
phagePP 4254725..4256002 1278
phageHM 4255980..4256741 762
hp-543 3840525..3841067 543
phagePP 3841162..3842367 1206
hydrolase 3842345..3842512 168
terminase 1487770..1489491 1722
phagePP 1489507..1490769 1263
Clp 1490762..1491607 846

cdc8 cdc abrégé protéines[modifier | modifier le wikicode]

C3. C39 abrégé des protéines
abrégé nom protéine
A-1chlor type A-1 chloramphenicol O-acetyltransferase
ABC ABC transporter ATP-binding protein
Ala amid N-acetylmuramoyl-L-alanine amidase
Art-red anaerobic ribonucleoside triphosphate reductase
Art-reda anaerobic ribonucleoside-triphosphate reductase activating protein
B6 pyridoxal phosphate-dependent aminotransferase
cad cadmium-translocating P-type ATPase
CHAP CHAP domain-containing protein
CwlD N-acetylmuramoyl-L-alanine amidase CwlD
DedA DedA family protein
DeoR DeoR/GlpR transcriptional regulator
DnaC DNA replication protein DnaC
DUF378 DUF378 domain-containing protein
fdHa formate dehydrogenase subunit alpha
flagellar flagellar motor protein
Glyco-tr glycosyl transferase
Helix helix-turn-helix domain-containing protein
hp-1740 hp-1740
hp-204 hp-204
hp-282 hp-282
hp-414 hp-414
HXXEE HXXEE domain-containing protein
III-tau DNA polymerase III subunit gamma/tau
K-ligase lysine--tRNA ligase
lactam delta-lactam-biosynthetic de-N-acetylase
Mannosyl Mannosyl-glycoprotein endo-beta-N-acetylglucosamidase
MBOAT MBOAT family protein
mecano mechanosensitive ion channel
NadR transcription repressor NadR
NhaC Na+/H+ antiporter NhaC family protein
Nuc-de nucleoside deaminase
phagePP phage portal protein
PolyI DNA polymerase I
precorrin bifunctional precorrin-2 dehydrogenase/sirohydrochlorin ferrochelatase
pyruvate pyruvate carboxylase
R-deca arginine decarboxylase
seleno glycine/sarcosine/betaine reductase complex selenoprotein A
SigB SigB/SigF/SigG family RNA polymerase sigma factor
SigB2 B/F/G family RNA polymerase sigma-70 factor
S-ligase serine--tRNA ligase
SrtB sortase SrtB
succinate adenylosuccinate synthase
TIGR TIGR00159 family protein
xylose xylose isomerase
Y-r1 tyrosine-type recombinase/integrase – 1
Y-r2 tyrosine-type recombinase/integrase – 2

cdc8 cdc psor stats[modifier | modifier le wikicode]

C3 cdc8 cdc psor base NCBI
NCBI du 13.11.19 cdc8 cdc psor
date 15-MAR-2017 18-MAY-2017 08-JAN-2018
DNA circulaire 4 308 325 4 110 554 3 550 458
Genes (total) 4 025 3 807 3 528
CDS (total) 3 870 3 691 3 368
Genes (coding) 3 763 3 615 3 327
CDS (coding) 3 763 3 615 3 327
Genes (RNA) 155 116 160
RRNAs (5S, 16S, 23S) 14, 16, 13 9, 10, 10 17, 17, 17
complete rRNAs 14, 16, 13 9, 10, 10 17, 17, 17
tRNAs 108 83 105
ncRNAs 4 4 4
Pseudo Genes (total) 107 76 41
Pseudo Genes (ambiguous residues) 0 of 107 0 of 76 0 of 41
Pseudo Genes (frameshifted) 60 of 107 42 of 76 4 of 41
Pseudo Genes (incomplete) 35 of 107 30 of 76 18 of 41
Pseudo Genes (internal stop) 31 of 107 18 of 76 22 of 41
Pseudo Genes (multiple problems) 18 of 107 12 of 76 3 of 41
CRISPR Arrays 4 9 -
Décompte du 19.11.19
hypothetical protein 609 523 1 256
hp / cds (total) 0,16 0,14 0,37

cdc8 remarques[modifier | modifier le wikicode]

  • Lien noms abrégés
  • Liens pour ce chapitre:  noms abrégésopéronscumulsblocscdc8 cdc psor 43cdc8 cdc psor 18cdc8 cdc psor 9Alignement sur cdcAlignement sur cdc8.
  • Remarques des 7 @ dans opérons :
    1. @ Dans la comparaison cdc8-cdc du bloc à 18aas, les rRNAs 23s et 16s disparaissent. Les 4 cds récupérés et le 23s° (voir opérons pour les noms et les longueurs des cds)
      - correspondraient à la somme des longueurs de 16s (1500 pbs) et 23s (2900 pbs), soit 4400 pbs
      - correspondraient à la longueur totale entre le 1er cds et le 5s, 4304299-4299490 = 4810 pbs
      - la somme des 4 cds récupérés et du 23s° est de 3875 pbs. Les longueurs des cds en aas sont dans l'ordre 215 153 580 68.
      - Le plus intéressant c'est que, si on suppose que les 2 protéines hypothétiques 580 et 68 sont dues aux remaniements,
      - les 2 protéines qui les précèdent sont qualifiées de type intégrase et de protéine contenant un domaine. C'est comme si les remaniements (certainement des conversions géniques) utilisaient une partie d'un gène protéique comme matrice de copie.
    2. @ configuration de bloc peu courante, avec gga: même bloc que cdc et psor.
    3. @ configuration de bloc peu courante, avec aca, et perte de 5s: même bloc que cdc et psor sans 5s.
    4. @ On retrouve le groupe1 de psor, avec 2 gca: VII1 en comp suivi de VIII1 en dir
      - L’intercalaire 23s-gca de VII1 est de 375, beaucoup plus élevé que celui de psor , 114.
      - De même pour VIII1, 248 contre 114.
    5. @ Conservation du bloc tcc-ncRNA dans cdc8 cdc et psor, avec les mêmes intercalaires.
    6. @ Conservation des 3 cds , avec leurs intercalaires, du seul groupe de cdc, mais les gca disparaissent.
    7. @ Nouveau bloc analogue au VI1 et VII1 de psor, sans gca, et qui n’existe pas chez cdc: 16s23s5s-tta-atgi. Avec ces 2 dernières remarques c'est comme si les remaniements des blocs à RNA consistaient à supprimer les gca des blocs 16sgca23s5s, et en le faisant ils laissaient des morceaux de 16s et 23s.
  • Décompte des rRNAs de cdc8 d'après Alignement sur cdc8.
Les RNAs		
16s	14	
16s’	2	
16s°	5	
23s	9	
23s’	4	
23s°	11	
5s	14	
taille d’un bloc normal		
16s	16	1508  soit 10/14
23s	13	2900  soit  9/9
5s	14	117   soit 14/14
  • Notes:
    - Les autres cds créés création de cds
    - Alignement sur cdc8: cdc8 résulte d'une recombinaison d'une clostridia de type cdc et d'une autre de type psor Alignement sur cdc8
    - Orientation des créations stats: soit création en masse par la mobilité et l'insertion des blocs 16s23s5s (cas de psor) puis dégradation de ces blocs dans une étape intermédiaire (cas de cdc8) qui aboutit à un état stable (cas de cdc), soit création par une évolution progressive de cdc vers psor en passant par cdc8. Le 1er cas serait soutenu la proportion très élevée des hp par rapport au total de 37% (voir stats) alors que le 2ème cas serait soutenu par par le type IV4 de cluster dans cdc8 et n'existe ni dans cdc ni dans psor, 16s23s5s-tta-atgi (voir alignement sur cdc8).
    - Les 3 types de création: avec altération des rRNAs (cdc8), dans les blocs 16s23s5s ou 16s-aaas-23s5s (décompte des cds dans un échantillon de clostridia) et après les blocs à la suite des tRNAs ou non (psor opérons).
    - Hypothèse de la création des gènes [8]

Clostridium botulinum CDC_297[modifier | modifier le wikicode]

  • Notes: Il n'y a pas de code KEGG pour ce génome, je lui ai donné le code cbc*, mais pour les têtes de chapitre je mets cbc.

cbc opérons[modifier | modifier le wikicode]

  • Lien tableur: cbc* opérons
  • Liens: gtRNAdb [9], NCBI [10], génome
  • Phylogénie: Bacteria; Firmicutes; Clostridia; Clostridiales; Clostridiaceae;Clostridium.
  • Légende:
    - cyan pour les doubles signalés par le signe + dans la colonne doubles.
    - cds, ce cds a la particularité d'être très court et collé au cluster à rRNA. Il fait 108 pbs et sa séquence est,
    MNEGCDRILIVVARWQVSKNKKMLTKIKKRATIIKH.
    - @ voir le chapitre remarques de ce génome.
C4. Clostridium botulinum CDC_297
28%GC 30.6.19 Paris  52  doubles intercal  aa  avec aa
comp 1309334..1309408 gag
comp 1385938..1386012 aac 8
comp 1386021..1386134 5s 108
comp 1386243..1389140 23s 228
comp 1389369..1390866 16s @1
comp 1392997..1393072 ttc 7
comp 1393080..1393193 5s 108
comp 1393302..1396199 23s 228
comp 1396428..1397925 16s
comp 1408673..1408762 tcc
comp 1412183..1412259 agg
comp 1415464..1415540 cgt 84 84
comp 1415625..1415715 agc + 20 20
comp 1415736..1415826 tca 2 agc 306 306
comp 1416133..1416223 agc 2 tca 20 20
comp 1416244..1416334 tca @4
comp 1425969..1426044 gca 3 3
comp 1426048..1426124 atgi 8
comp 1426133..1426246 5s 79
comp 1426326..1427823 16s @2 117
comp 1427941..1428051 cds
1694943..1695017 cag
comp 1722580..1722664 tac 5 5
comp 1722670..1722745 aca
comp 1841437..1841510 tgc
comp 1842698..1842811 5s 108
comp 1842920..1845817 23s 228
comp 1846046..1847543 16s
1890534..1890608 gaa + 17 17
1890626..1890701 gta 3 gaa 9 9
1890711..1890787 gac 3 gta 4 4
1890792..1890867 aca 3 gac 5 5
1890873..1890947 gaa 2 aca 18 18
1890966..1891041 gta 7 7
1891049..1891125 gac 57 57
1891183..1891257 gaa 17 17
1891275..1891350 gta 9 9
1891360..1891436 gac 4 4
1891441..1891516 aca
comp 1948153..1948228 cca
1969157..1969245 tta 4 4
1969250..1969325 atgf + 53 53
1969379..1969454 atgf 2 atgf 10 10
1969465..1969541 atg
1987541..1989040 16s @3 226
1989267..1992166 23s 93
1992260..1992375 5s 7
1992383..1992457 aac + 27 27
1992485..1992559 aac
2013239..2013313 ggg 18 18
2013332..2013407 acc
2222515..2222590 tgg
2294767..2294842 cca + 7 7
2294850..2294923 gga 2 cca 6 6
2294930..2295006 aga 2 gga 5 5
2295012..2295087 aag 26 26
2295114..2295189 cca 29 29
2295219..2295292 gga 24 24
2295317..2295393 cga
2402556..2402631 gta 5 5
2402637..2402713 gac 3 3
2402717..2402792 ttc 4 4
2402797..2402871 ggc 9 9
2402881..2402954 tgc
2517305..2517391 ttg
2548708..2548792 ctc
2583298..2583388 tga

cbc cumuls[modifier | modifier le wikicode]

C4. cumuls. Clostridium botulinum CDC_297
opérons Fréquences intercalaires tRNAs
effectif gammes sans rRNAs avec rRNAs
avec rRNA opérons 5 1 0 0
16 23 5s 0 1 20 22 1
16 atc gca 0 40 3 1
16 23 5s a 3 60 2 0
max a 2 80 0 0
a doubles 1 100 1 0
spéciaux 1 120 0 0
total aas 6 140 0 0
sans opérons 17 160 0 0
1 aa 10 180 0 0
max a 11 200 0 0
a doubles 4 0 0
total aas 46 28 2
total aas 52
remarques 4
avec jaune moyenne 17 15
variance 19
sans jaune moyenne 15
variance 14

cbc blocs[modifier | modifier le wikicode]

C4. Clostridium botulinum CDC_297, cbc* blocs
aac 8 7 -
5s 108 108 108 226
23s 228 228 228 93
16s - 7
gca 3
atgi 8
5s 79
16s

cbc remarques[modifier | modifier le wikicode]

@1	Les 4 blocs 16.23.5.aa ont des intercalaires identiques à 1 base près.
	- 1 a 0aa, 2 ont 1aa et 1 a 2aas (@3.
	
@2	C’est 1 bloc 16.23.5.aa qui a perdu 23s.
	- L'intercalaire 5s-aa est le même que pour les 4 blocs de @1.
	- Il a 2aas dont le 1er est atgi, rare avec les rRNAs.
	- Il est précédé d'une protéine de 36aas avec un intercalaire de 117.
	- Est-ce qu'elle appartient à l'opéron?
	
@3	C’est 1 bloc 16.23.5.aa  de @1 avec 1 aa double.
	- L'intercalaire 23-5  est très faible, 14% de moins par rapport à @1, 15/108.
	
@4	Dépassement de la règle des intercalaires, 210 bases, 306. 
	- Il se trouve entre 2 séquences de 2 aas.
	- Est-ce 2 opérons?
	
Séquences des doubles : 	
	- 1 opéron à 1 doublet.
	- 2 opérons à 2 séquences de 2 aas chacun.
	- 1 opéron de 11 aas avec 4 séquences de 3 aas, moins 1 aa.

Clostridium botulinum BKT015925[modifier | modifier le wikicode]

cbn opérons[modifier | modifier le wikicode]

  • Lien tableur: cbn opérons
  • Liens: gtRNAdb [11], NCBI [12], génome
  • Phylogénie: Bacteria; Firmicutes; Clostridia; Clostridiales; Clostridiaceae;Clostridium.
  • Légende:
    - cyan pour les doubles signalés par le signe + dans la colonne doubles.
    - @ voir le chapitre remarques de ce génome.
C5. Clostridium botulinum BKT015925
28%GC 30.6.19 Paris  86  doubles intercal  aa  avec aa
20666..20741 acg
36413..36487 gaa + 12 12
36500..36575 gta 2 gaa 13 13
36589..36665 gac 2 gta 5 5
36671..36746 aca 2 gac 18 18
36765..36839 gaa 2 aca 12 12
36852..36927 gta 13 13
36941..37017 gac 5 5
37023..37098 aca
137366..137441 cca
161964..162052 tta + 5 5
162058..162133 atgf 3 tta 5 5
162139..162215 atgj 3 atgf 46 46
162262..162350 tta 2 atgj 5 5
162356..162431 atgf 30 30
162462..162538 atgj 46 46
162585..162673 tta 5 5
162679..162754 atgf
76258..176332 aac
180177..181695 16s @5 233
181929..184836 23s 45
184882..184956 aac + 14
184971..185087 5s 7
185095..185169 aac 2 aac
222409..222484 acc
comp 578417..578492 cag
comp 944747..944833 ttg
955546..955630 ctt
1026946..1027021 gta 17 17 17
1027039..1027115 gac 14 14 14
1027130..1027205 ttc 4 4 4
1027210..1027284 ggc 8 8 8
1027293..1027367 tgc + 57 57 57
1027425..1027499 tgc 2 tgc
comp 2030816..2030890 aac 45
comp 2030936..2033842 23s 96
comp 2033939..2034015 atc 7 7
comp 2034023..2034098 gca 121
comp 2034220..2035734 16s
comp 2283768..2283884 5s 95
comp 2283980..2286886 23s 233
comp 2287120..2288638 16s @3 464
comp 2289103..2289176 gga 15 15
comp 2289192..2289268 atc 7 7
comp 2289276..2289351 gca
comp 2350598..2350674 cga + 21 21
comp 2350696..2350769 gga 4 gga 28 28
comp 2350798..2350873 aaa 2 aaa 4 4
comp 2350878..2350952 caa 2 caa 4 4
comp 2350957..2351032 cac 2 cac 5 5
comp 2351038..2351112 aag 3 aag 3 3
comp 2351116..2351192 aga 3 aga 6 6
comp 2351199..2351272 gga 2 cca 4 4
comp 2351277..2351352 cca 2 ggc 21 21
comp 2351374..2351449 aag 5 5
comp 2351455..2351531 aga 5 5
comp 2351537..2351610 gga 5 5
comp 2351616..2351690 ggc 3 3
comp 2351694..2351777 cta 22 22
comp 2351800..2351875 aaa 4 4
comp 2351880..2351954 caa 4 4
comp 2351959..2352034 cac 5 5
comp 2352040..2352115 aag 5 5
comp 2352121..2352197 aga 5 5
comp 2352203..2352276 gga 5 5
comp 2352282..2352356 ggc 6 6
comp 2352363..2352438 cca
comp 2432784..2432859 tgg
comp 2454880..2454964 tac + 39 39
comp 2455004..2455079 gta 2 tac 8 8
comp 2455088..2455172 tac 4 4
comp 2455177..2455252 aca
comp 2697795..2697911 5s @1 31
comp 2697943..2700847 23s 233
comp 2701081..2702599 16s
comp 2703946..2704021 aaa 311 311
comp 2704333..2704408 ttc 5
comp 2704414..2704530 5s 336
comp 2704867..2704942 ttc 5
comp 2704948..2705064 5s 97
comp 2705162..2708066 23s 233
comp 2708300..2709814 16s
comp 2721253..2721328 aaa @2 5
comp 2721334..2721450 5s 95
comp 2721546..2724452 23s 233
comp 2724686..2726203 16s
comp 2731902..2731976 gag 61 61
comp 2732038..2732112 caa 6 6
comp 2732119..2732195 aga 4 4
comp 2732200..2732273 gga 19 19
comp 2732293..2732376 cta 16 16
comp 2732393..2732467 gaa 4
comp 2732472..2732588 5s 97
comp 2732686..2735592 23s @4 94
comp 2735687..2735763 atc 3
comp 2735767..2735842 gca 74
comp 2735917..2737435 16s
comp 2742262..2742351 tcc
comp 2743220..2743312 tcg
comp 2743891..2743967 agg
comp 2748534..2748610 cgt 144 144
comp 2748755..2748845 agc 23 23
comp 2748869..2748959 tca + 69 69
comp 2749029..2749119 tca 2 tca
comp 2758688..2758763 gca 4 4
comp 2758768..2758844 atgi 3
comp 2758848..2758964 5s 73
comp 2759038..2761942 23s 233
comp 2762176..2763694 16s
comp 2150504..2150620 5s 31
comp 2150652..2153560 23s 233
comp 2153794..2155308 16s
comp 2169525..2169641 5s 32
comp 2169674..2172579 23s 233
comp 2172813..2174331 16s
sur plasmide tgg

cbn cumuls[modifier | modifier le wikicode]

C5. cumuls. Clostridium botulinum BKT015925
opérons Fréquences intercalaires tRNAs
effectif gammes sans rRNAs avec rRNAs
avec rRNA opérons 10 1 0 0
16 23 5s 0 3 20 34 9
16 gca atc 2 40 7 0
16 23 5s a 4 60 3 0
max a 8 80 1 1
a doubles 1 100 0 0
spéciaux 1 120 0 0
total aas 22 140 0 0
sans opérons 18 160 1 0
1 aa 12 180 0 0
max a 22 200 0 0
a doubles 6 0 0
total aas 64 46 10
total aas 86
remarques 5
avec jaune moyenne 17
variance 25
sans jaune moyenne 14 14
variance 15 17

cbn blocs[modifier | modifier le wikicode]

C5. Clostridium botulinum BKT015925, cbn blocs
5s 31 31 32
23s 233 233 233
16s
ttc 5
5s 336
aaa 5 3 ttc 5
5s 95 73 5s 95 5s 97
23s 233 233 23s 233 23s 233
16s aaa atgi 16s 464 16s
gga 15
16s 233
23s 45
aac 14
5s 7
aac
gaa 4
5s 97 aac 45
23s 94 23s 96
atc 3 atc 7
gca 74 gca 121
16s 16s

cbn remarques[modifier | modifier le wikicode]

*Remarques
@1	Les 3 opérons 16-23-5s ont les mêmes intercalaires, 233-31 bases.
	
@2	Les 4 opérons 16-23-5s -aa  ont tous à peu près les mêmes intercalaires 233-95-5.
	- Mais ils sont tous différents:
	+ 1 seul  opéron répond au critère des intercalaires, il a 1aa.
	+ 1 seul opéron ne répond pas strictement au critère des intercalaires.
	Ses 3aas sont du côté du 16s et l’intercalaire avec le 1er aa est très
	Élevé, 464.
	+ L'opéron à 2aas a l'intercalaire 23-5s très faible de 23% inférieur à 95, 22/95.
	+ L'opéron à 3aas répondant aux critères  a un 5s en plus.
	
@3	Le critère d’un intercalaire entre 2aas, supérieur à 210 bases, se trouve 
	dans le 4ème opéron à rRNA, mais il est accompagné d’un intercalaire très
	élevé entre 5s et le 1er aa, comme pour le 2ème opéron à rRNA.
	
@4	C’est un opéron à rRNA atypique : 2aas double entourant le 5s.
	- Mais coserve l’intercalaire 16-23s de 233 bases comme les 7 opérons de ce type.
	
@5	Les 2 opérons à 16-atc gca présentent, ici, la particularité d’inverser ses 2 aas, gca-atc.
	- Ils ont aussi, à peu près,  les mêmes intercalaires 16-gca-atc-23s, 74 4 94.
	- L'opéron à rRNA présentant le max d'aas, au nombre de 8, est de ce type.
	Il a le même intercalaire 23-5s que tous les autres opérons à rRNA, 97 bases.
	
*Séquences des doubles :  tous les opérons à plus de 3aas ont des doubles, 6/6.	
	- Les répétitions vont de 5 à 2.
	- 3 opérons sur 6 ont des séquences qui se répètent, avec 22aas et 2 avec 8aas.
	- L'opéron contenant le max d'aas, 22, a 2 séquences de 6 aas qui se répètent.
	- On peut repérer dans cet opéron d'autres séquences de 3 aas.
	- Ces séquences sont séparées par 1 ou 2 aas différents.

Clostridium lentocellum DSM 5427[modifier | modifier le wikicode]

cle opérons[modifier | modifier le wikicode]

  • Lien tableur: cle opérons
  • Liens: gtRNAdb, NCBI [13], génome
  • Phylogénie: Bacteria; Firmicutes; Clostridia; Clostridiales; Lachnospiraceae;Cellulosilyticum.
  • Légende:
    - cyan pour les doubles signalés par le signe + dans la colonne doubles.
    - @ voir le chapitre remarques de ce génome.
C6. Clostridium lentocellum DSM 5427
34.3%GC 30.6.19 Paris  104  doubles intercal  aa  avec aa
10157..10246 agc @1 202
10449..11981 16s 72
12054..12171 5s 4
12176..12248 gca 262
12511..15414 23s 55
15470..15543 gac 61 61
15605..15677 gta 7 7
15685..15757 aca 34 34
15792..15872 tac 12 12
15885..15961 atg 3 3
15965..16040 ttc 3 3
16044..16116 aaa
30118
46235..47767 16s @3 21284
69052..71964 23s
4873
76838..78371 16s 72
78444..78561 5s 5
78567..78639 gca 282
78922..81829 23s
904
82734..82851 5s 4
82856..82928 ggc
1463
84392..85929 16s 72
86002..86119 5s 4
86124..86196 gca 280
86477..89386 23s
7380
96767..96884 5s 89
96974..97047 ggc
5082
102130..102204 cag
104716..104799 tta 13 13
104813..104898 tca
141499..143034 16s 138
143173..143290 5s 7
143298..143374 atc 258
143633..146538 23s
150968..151085 5s @4 4
151090..151161 gaa 457
151619..153160 16s 605
153766..156671 23s 475
157147..157219 aaa 9 9
157229..157299 gga 6 6
157306..157379 aga
4223
161603..161720 5s 4
161725..161797 ggc
11104
172902..172973 gaa 23 23
172997..173071 cca 45 45
173117..173189 aaa 11 11
173201..173274 gac 56 56
173331..173403 gta 7 7
173411..173494 tta 187 187
173682..173754 aca 26 26
173781..173861 tac 10 10
173872..173948 atg 31 31
173980..174052 ttc
248498
422551..424086 16s
113898
537985..540890 23s
25153
566044..566117 cac 23 23
566141..566212 caa 32 32
566245..566330 tca
571984..573519 16s 72
573592..573709 5s 4
573714..573786 gca 282
574069..576975 23s
25302
602278..603812 16s 137
603950..604067 5s
11014
615082..617987 23s
21159
639147..639362 16s° @5
98139
737502..737619 5s 4
737624..737696 ggc
3291
740988..741058 gga
759839..759920 cta
911999..912083 ctt + 148 148
912232..912316 ctt 2 ctt
1035192..1035265 cga
1061152..1061225 agg
comp 1136376..1136448 ccc
1229184..1230718 16s @2 72
1230791..1230908 5s 7
1230916..1230989 atc 53 53
1231043..1231115 gca 261
1231377..1234282 23s 110
1234393..1234464 aac + 9 9
1234474..1234545 gaa 2 tgc 6 6
1234552..1234622 tgc 2 aac 23 23
1234646..1234717 aac 58 58
1234776..1234846 tgc
1280211..1280283 atg
1283250..1283320 gga + 5 5
1283326..1283399 aga 2 gga 5 5
1283405..1283478 cac 2 aga 31 31
1283510..1283581 caa 2 caa 23 23
1283605..1283677 aaa 30 30
1283708..1283792 cta 23 23
1283816..1283886 gga 5 5
1283892..1283965 aga 6 6
1283972..1284043 caa
1299560..1299632 ggc 4 4
1299637..1299711 cca
1346208..1346290 ctg
1363346..1363428 ctg
1515234..1515305 gaa 62 62
1515368..1515442 cca 22 22
1515465..1515537 aaa
1597292..1597364 acg
1611976..1612042 acg
2065352..2065425 ata
comp 2090478..2090550 acc
2394421..2394501 tac 3 3
2394505..2394577 ttc
2592342..2592422 ttg
2606024..2606104 ttg
comp 2737232..2737304 gcc
comp 2798802..2798874 aag
comp 2881571..2881642 gag
comp 3215471..3215545 cca
comp 3252582..3252655 atg 7 7
comp 3252663..3252735 gta 4 4
comp 3252740..3252813 gac 10 10
comp 3252824..3252896 tgg 20 20
comp 3252917..3252988 aac
683
comp 3253672..3253748 atg 7 7
comp 3253756..3253828 gta 9 9
comp 3253838..3253910 tgg 18 18
comp 3253929..3254000 aac 60
comp 3254061..3256967 23s
362637
comp 3619605..3619677 aca + 4 4
comp 3619682..3619755 cgt 2 cgt 50 50
comp 3619806..3619879 cgt 2 aca 27 27
comp 3619907..3619990 tta 3 3
comp 3619994..3620069 gta 47 47
comp 3620117..3620190 gac 22 22
comp 3620213..3620289 atg 23 23
comp 3620313..3620385 aca 14 14
comp 3620400..3620471 gaa 9 9
comp 3620481..3620552 aac 110
comp 3620663..3623568 23s 261
comp 3623830..3623902 gca 53 53
comp 3623956..3624029 atc 7
comp 3624037..3624154 5s 72
comp 3624227..3625761 16s 149
comp 3625911..3625999 tcc 33 33
comp 3626033..3626118 tca
comp 3714637..3714709 gta 1 1
comp 3714711..3714787 atg

cle cumuls[modifier | modifier le wikicode]

C7.cumuls. Clostridium lentocellum DSM 5427
opérons Fréquences intercalaires
effectifs gammes sans rRNAs avec rRNAs
avec rRNA opérons 19 1 1 0
16 5 aa 23 5 20 14 15
16 5 atc gca 2 40 10 6
solo 11 60 2 5
max a 14 80 1 1
a doubles 2 100 0 0
indéterminé 1 120 0 0
total aas 46 140 0 0
sans opérons 29 160 1 0
1 aa 19 180 0 0
max a 10 200 1 0
a doubles 2 0 0
total aas 59 30 27
total aas 105
remarques 5
avec jaune moyenne 29
variance 41
sans jaune moyenne 19 22
variance 16 19

cle blocs[modifier | modifier le wikicode]

C6. Clostridium lentocellum DSM 5427, cle blocs
Solitaires
16s *2 16s° @5
23s *3
5s 3*4 89
ggc
aac 60
23s
16s 137
5s
16s 72 72 72
5s 5 4 4
gca 282 280 282
23s
agc 202
16s 138 16s 72
5s 7 5s 4
atc 258 gca 262
23s 23s 55
gac 61
aac 110
16s 72 23s 261
5s 7 gca 53
atc 53 atc 7
gca 261 5s 72
23s 110 16s 149
aac 9 tcc 33
5s 4 @4
gaa 457
16s 605
23s 475
aaa 9

cle remarques[modifier | modifier le wikicode]

Remarques :	Pas de blocs 16-23-5s ni de séquence 16-atc-gca-23.
	
@1	5 blocs 16-5-aa-23s avec les mêmes intercalaires, à peu près, 72 4 280.
	- 4 blocs avec gca dont 3 à 1aa et 1 avec 9aas. 
	- Le bloc à 9aas a un aa avant le 16s, compatible.
	- 1 bloc avec atc seul et les intercalaires modifiées, 138 7 258.
	
@2	2 blocs 16-5-atc-gca-23s, avec les mêmes intercalaires, 72 7 53 261.
	- Les 2 blocs contiennent des doubles, 2 paires chacun avec 7 et 14aas.
	- Le bloc contenant le max de 14aas a 2aas avant le 16s compatibles.
	
@3	Les solos ne contiennent qu’un seul rRNA avec ou sans aas.
	- 5s-1aa, il y en a 4 et l'intercalaire est équivalente de celle des blocs.
	- 23s, il y en a 4 dont 1 seul avec 4aas
	- 16s, 2 sans aas et 1 du 16s5s avec une intercalaire comme le bloc atc, 137.
	
@4	Apparemment un trio de solos. Les 3 intercalaires supérieures à 450 permettent
	de diviser le groupe en 3 opérons, 5saa avec une intercalaire semblable aux 
	autres 5saa, 23s avec 3aas aux petites intercalaires et 1 16s sasns aas.
	
@5	16s°: 16S ribosomal RNA rRNA prediction is too short
	
Séquences des doubles : très peu de doublons. 	
	- 2 opérons avec rRNAs ont des doublons sur 5 possédant au moins 2 aas.
	- 2 opérons sans rRNAs sur 10 possédant au moins 2 aas.
	- 4 doublons pour chaque type d'opérons.
	- 1 seule paire répétée chez les opérons sans rRNAs.

Heliobacterium modesticaldum Ice1 ATCC 51547[modifier | modifier le wikicode]

hmo opérons[modifier | modifier le wikicode]

  • Lien tableur: hmo opérons
  • Liens: gtRNAdb [14], NCBI [15], génome [16]
  • Phylogénie: Bacteria; Firmicutes; Clostridia; Clostridiales; Heliobacteriaceae;Heliobacterium.
  • Légende: cdsa: cds aas, cdsd: cds dirigé
    -  cds : cds inséré dans un cluster avec ou sans rRNA.
C7. Heliobacterium modesticaldum Ice1 ATCC 51547
57%GC 24.7.19 Paris  109 doubles intercal  cds   aa  avec aa cdsa cdsd
103699..104088 CDS 380 130
104469..105695 CDS 186 186 409 186
comp 105882..105956 ggc 1 1
comp 105958..106044 ctg 321 321
comp 106366..106929 CDS @1 241 241 188 241
comp 107171..107246 aca 202 202 202
comp 107449..108183 CDS 111772 245
comp 219956..220483 CDS 260 260 176 260
comp 220744..220820 gac 5 5
comp 220826..220901 gta 10 10
comp 220912..220987 gaa 4 4
comp 220992..221067 aaa 18 18
comp 221086..221160 caa 103
comp 221264..224182 23s 237
comp 224420..224495 gcc 64
comp 224560..224676 5s @2 328
comp 225005..226536 16s 651 651
comp 227188..228162 CDS 98792 325
comp 326955..328340 CDS 178 178 462 178
comp 328519..328601 cta 65 65
comp 328667..328743 aga 60 60
comp 328804..328880 cca 568 568
comp 329449..330090 CDS 57730 214
comp 387821..388105 CDS 135 135 95
388241..388317 ccc 7 7
388325..388410 tac 47 47 47
comp 388458..388742 CDS 588493 95
comp 977236..978504 CDS 439 439 423
comp 978944..981860 23s 237
comp 982098..982173 gcc 64
comp 982238..982354 5s 328
comp 982683..984208 16s 460
comp 984669..984744 tgg @3 5 5
comp 984750..984824 cgg 207 207 207
comp 985032..987656 CDS 26258 875
comp 1013915..1014760 CDS 105 105 282 105
comp 1014866..1014942 gac 75 75
comp 1015018..1015093 gaa 265 265
comp 1015359..1016642 CDS 40115 428
1056758..1058014 CDS 121 121 419 121
comp 1058136..1058233 tga 173 173
1058407..1058733 CDS 62951 109
1121685..1122878 CDS 588 588 398
1123467..1124998 16s 328
1125327..1125443 5s 64
1125508..1125583 gcc 233
1125817..1128734 23s 337 337 337
> 1129072..1129785 CDS 24938 238
1154724..1155224 CDS 99 99 167
1155324..1155413 tca 56 56 56
comp 1155470..1156627 CDS 13350 386
1169978..1171828 CDS 129 129 617 129
1171958..1172034 cgt 85 85
1172120..1172196 agg 181 181
1172378..1172812 CDS 62 62 145 62
1172875..1172966 tcg 548 548
1173515..1174330 CDS 6655 272
comp 1180986..1182974 CDS 444 444 663
1183419..1183512 tcc 39 39 39
1183552..1183817 ncRNA 11908 89
1195726..1195998 CDS 181 181 91
1196180..1196255 gcg 151 151 151
1196407..1197051 CDS 86894 215
comp 1283946..1285331 CDS 177 177 462 177
1285509..1285584 atgf 5 5
1285590..1285667 atgj 7 7
1285675..1285750 gaa 542 542
1286293..1287630 CDS 63447 446
1351078..1352549 CDS 704 704 491
1353254..1354786 16s 252
1355039..1355155 5s 64
1355220..1355296 atc 194
1355491..1358408 23s 112
1358521..1358595 aac 109 109 109
comp 1358705..1358926 CDS 139555 74
1498482..1498898 CDS 535 535 139
comp 1499434..1499509 acg 238 238 238
1499748..1500836 CDS 262182 363
1763019..1763858 CDS 68 68 280 68
1763927..1764003 gac 4 4
1764008..1764083 ttc 3 3
1764087..1764161 ggc 92 92
comp 1764254..1764493 CDS 72 72 80 72
1764566..1764641 tgc 18 18
1764660..1764746 tta 253 253
comp 1765000..1765467 CDS 52131 156
1817599..1818318 CDS 487 487 240
1818806..1820337 16s 252
1820590..1820706 5s 64
1820771..1820847 atc 6 6
1820854..1820929 gca 229
1821159..1824076 23s 112
1824189..1824263 aac 6 6
1824270..1824345 atgf 243 243 243
1824589..1825014 CDS 168198 142
1993213..1994328 CDS 99 99 372
1994428..1994502 atgi 41 41 41
1994544..1995368 CDS 284281 275
2279650..2279997 CDS 541 541 116
2280539..2282070 16s 253
2282324..2282440 5s 64
2282505..2282580 gcc 234
2282815..2285735 23s 119
2285855..2285948 tcc 6 6
2285955..2286031 ccg 10 10
2286042..2286115 gga 14 14
2286130..2286205 cac 1 1
2286207..2286281 tgc 9 9
2286291..2286367 gtc 3 3
2286371..2286446 ttc 6 6
2286453..2286537 tac 4 4
2286542..2286616 caa 17 17
2286634..2286709 aaa 4 4
2286714..2286789 gaa 5 5
2286795..2286870 gta 5 5
2286876..2286952 gac 7 7
2286960..2287050 agc 43 43
2287094..2287170 ccc 30 30
2287201..2287287 ctg 3 3
2287291..2287365 ggc 4 4
2287370..2287446 cgt 4 4
2287451..2287526 acc 352 352 352
2287879..2288343 CDS 33184 155
comp 2321528..2322544 CDS 268 268 339
comp 2322813..2322889 gtc 9 9
comp 2322899..2322973 cgg 81 81 81
comp 2323055..2323243 CDS 3375 63
2326619..2327947 CDS 464 464 443 464
2328412..2329943 16s 327
2330271..2330387 5s 226
2330614..2333532 23s 98
2333631..2333706 aaa 4 4
2333711..2333786 acc 8 8
2333795..2333877 ctc 89 89 89
comp 2333967..2334704 CDS 7389 246
2342094..2342804 CDS 155 155 237 155
comp 2342960..2343030 ttc 213 213
2343244..2343936 CDS 563 563 231
2344500..2346025 16s 252
2346278..2346394 5s 64
2346459..2346535 atc 141
2346677..2349594 23s 100
2349695..2349769 aac 6 6
2349776..2349851 atgf 102 102 102
2349954..2350976 CDS 113601 341
2464578..2465114 CDS 271 271 179 271
comp 2465386..2465461 aca 432 432
2465894..2466226 CDS 4722 111
2470949..2471977 CDS 69 69 343 69
2472047..2472133 ctg 678 678
2472812..2473192 CDS 22232 127
2495425..2496048 CDS 402 402 208
comp 2496451..2496527 gtc 4 4
comp 2496532..2496609 atgj 175 175 175
2496785..2497120 CDS 217 217 112
comp 2497338..2497420 ctc 7 7
comp 2497428..2497503 acc 18 18
comp 2497522..2497596 tgg 14 14
comp 2497611..2497684 ggg 19 19
comp 2497704..2497778 ggc 7 7
comp 2497786..2497873 ttg 8 8
comp 2497882..2497958 gtg -10 -10 -10
comp 2497949..2498185 CDS 66 66 79 66
2498252..2498328 ccg 314 314
comp 2498643..2499506 CDS 55292 288
2554799..2554984 CDS 109 109 62 109
2555094..2555169 gaa 2 2
2555172..2555247 ttc 6 6
2555254..2555338 tac 4 4
2555343..2555417 caa 18 18
2555436..2555511 aaa 4 4
2555516..2555590 ggc 9 9
2555600..2555675 cac 117 117
comp 2555793..2557049 CDS 235940 419
comp 2792990..2793442 CDS 219 219 151 219
comp 2793662..2796583 23s 236
comp 2796820..2796895 gca 6 6
comp 2796902..2796978 atc 64
comp 2797043..2797159 5s 328
comp 2797488..2799019 16s 505
comp 2799525..2799599 ggc + 1 1
comp 2799601..2799687 ctg 2 ggc 32 32
comp 2799720..2799796 ccc 42 42
comp 2799839..2799915 cgt 4 4
comp 2799920..2799994 ggc 120 120
comp 2800115..2800192 atgj 42 42
comp 2800235..2800325 agc 16 16
comp 2800342..2800417 atgf 6 6
comp 2800424..2800498 aac 7 7
comp 2800506..2800581 gaa 4 4
comp 2800586..2800661 aaa 18 18
comp 2800680..2800754 caa 4 4
comp 2800759..2800843 tac 91 91
comp 2800935..2801011 gtc 7 7
comp 2801019..2801093 tgc 325 325
2801419..2801724 CDS 230813 102
3032538..3032729 CDS 109 109 64 109
comp 3032839..3035757 23s 233
comp 3035991..3036066 gcc 64
comp 3036131..3036247 5s 253
comp 3036501..3038026 16s 779 779
comp 3038806..3040017 CDS 232 404
comp 3040250..3042013 CDS 588

hmo cumuls[modifier | modifier le wikicode]

  • Lien tableur: hmo cumuls
  • Légende:
    - avec et sans rRNA, fréquences des intercalaires dans les clusters avec rRNA ou sans rRNA.
    - cdsd, je ne choisis que le cds avec l'intercalaire le plus faible d'un cluster donné, en supposant que ce cds a été créé par le cluster lors des conversions.
    - cdsa, longueur du cds en aas ici.
    -  1 : occurences exclues de la moyenne. Sont exclus de la moyenne les jaunes 554 de hmo opérons.
C7. cumuls. Heliobacterium modesticaldum Ice1 ATCC 51547
opérons Fréquences intercalaires tRNAs Fréquences intercalaires cds Fréquences aas cds
effectif gammes sans rRNAs avec rRNAs gammes cds gammes cdsd gammes cdsa
avec rRNA opérons 10 1 1 2 1 1 40 1 100 10
16 5s gcc 23 5 20 20 34 50 3 80 8 200 16
16 5s atc 23 2 40 0 2 100 11 120 7 300 14
16 5 23s a 1 60 1 3 150 9 160 4 400 8
max a 20 80 2 0 200 9 200 4 500 11
a doubles 1 100 1 1 250 8 240 4 600 0
16 5s atc gca 2 120 0 1 300 5 280 4 700 2
total aas 60 140 0 0 350 4 320 0 800 0
sans opérons 24 160 0 0 400 1 360 2 900 1
1 aa 12 180 0 0 450 4 400 0 1000 0
max a 7 200 0 0 500 2 440 0 1100 0
a doubles 0 0 0 11 1 0
total aas 49 21 38 56 32 59
total aas 109
remarques 3
avec jaune moyenne
variance
sans jaune moyenne 8 8 196 137 230
variance 6 7 120 71 128

hmo blocs[modifier | modifier le wikicode]

  • Lien tableur: hmo blocs
  • Légende:
    - tgg: L'intercalaire, en jaune aussi, est entre tgg et 16s.
  • Notes:
    - Les spécificités gcc atc atc-gca et tRNA avant 16s
    - Homogénéité des intercalaires intra bloc
C7. Heliobacterium modesticaldum Ice1 ATCC 51547, hmo blocs.
tgg
CDS 541 651 588 779 460
16s 253 328 328 253 328
5s 64 64 64 64 64
gcc 234 237 233 233 237
23s 119 103 337 109 439
tcc tcc caa cds cds cds
CDS 704 563 CDS 464
16s 252 252 16s 327
5s 64 64 5s 226
atc 194 141 23s 98
23s 112 100 aaa
aac aac aac
ggc
CDS 487 505
16s 252 328
5s 64 64
atc 6 6
gca 229 236
23s 112 219
aac aac cds

hmo remarques[modifier | modifier le wikicode]

  • Remarques des 3 @ dans opérons :
    1. @ Les cds en vert.
      - Ces cds sont insérés dans un cluster avec ou sans rRNA. Ce sont des candidats pour la création. Plus les 2 intercalaires avec les voisins sont petits plus ils sont intéressants. Il y en a 6 dont un seul, *, est accolé à un 16s. Un intercalaire est même négatif, c’est-à-dire que le cds démarre dans le tRNA, adresse 2497949. Dansl’ordre des adresses croissantes les intercalaires sont les suivants :  321-241   181-62   92-72   213-563*   175-217   -10-66.
      - Voir hmo cumuls : 9 intercalaires entre tRNAs dans un cluster ont plus de 40 pbs et 1 fait 120 pbs (adresse 2799920).
      - Dans hmo_opérons j'ai ajouté l'intercalaire entre 2 clusters, qui contient plusieurs autres gènes, pour faire ressortir la proximité des cds intra cluster avec les rRNAs et les tRNAs.
    2. @ Voir hmo blocs.
      - Il y a 10 blocs avec rRNA et tous sont complets. Cependant le 5s est anormalement positionné entre 16s et 23s au lieu d’être en 3ème position. Ce type de génome est rare, voir les statistiques des blocs à rRNAs.
      - Il n'y a qu'un seul bloc sans aas, adresse 2328412, mais ce génome a 5 blocs sur 10 qui est rare dans cette position, gcc, au lieu de gca, plus courant. Les 4 autres blocs arborent des aas courants dans cette position, 2 atc-gca et 2 atc.
    3. @ tRNAs avant 16s
      - Des tRNAs se trouvent avant le 16s, adresses 982683 et 2797488, le 1er avec 2 et le 2ème avec 15 tRNAs.
      - Les 2 intercalaires aa-16s sont du même de grandeur général qu'un cds-16s, 460 et 505 pbs ici.
  • Séquences des doubles: Voir hmo cumuls :beaucoup de séquences longues et à peine un double dans la séquence 15aas-16s5s-gcc-23s.
  • Notes:
    - Les 5 cds, candidats à la création, sont insérés dans des clusters sans rRNAs et 1 seul est collé à 16s.
    - Le 5s est positionné anormalement en 16s5s23s, dans les 10 blocs que possède le génome.
    - Un tRNA intra bloc très rare, gcc au lieu de gca, dans 5 cas sur 10. 4 autres sont courants, 2 atc et 2 atc-gca.

Clostridium beijerinckii strain NCIMB 14988[modifier | modifier le wikicode]

cbei opérons[modifier | modifier le wikicode]

  • Lien tableur: cbei opérons
  • Liens: gtRNAdb [], NCBI [17], génome []
  • Phylogénie: Bacteria; Firmicutes; Clostridia; Clostridiales; Clostridiaceae;Clostridium.
  • Légende: cdsa: cds aas, cdsd: cds dirigé
    - cyan pour les doubles signalés par le signe + dans la colonne doubles.
    - @ voir le chapitre remarques de ce génome.
  • Notes:
    - Les atg ont été résolus en comparant avec ceux de cdc avec stxt. A faire pour psor aussi.
C8. Clostridium beijerinckii strain NCIMB 14988
29.65%GC 29.7.19 Paris  93 doubles intercal  cds   aa  avec aa cdsa cdsd
6477551..6480031 CDS 496 496 827
6480528..6482044 16s 213
6482258..6485171 23s 108
6485280..6485394 5s 14
15..91 atgi 1 1
93..168 gca 85 85 85
254..769 CDS 1940 172
2710..2937 CDS 119 119 76 119
3057..3147 tca + 30 30
3178..3268 agc 2 tca 241 241
3510..3600 tca 2 agc 18 18
3619..3709 agc 125 125
3835..4350 CDS 9470 172
13821..14726 CDS 187 187 302
14914..14988 cgt 34 34 34
comp 15023..15913 CDS 109014 297
124928..125338 CDS 275 275 137 275
125614..125702 tta + 20 20
125723..125798 atgf 4 tta 7 7
125806..125882 atgj 4 atgf 6 6
125889..125977 tta 2 atgj 22 22
126000..126075 atgf 7 7
126083..126159 atgj 6 6
126166..126254 tta 21 21
126276..126351 atgf 70 70
126422..126510 tta 21 21
126532..126607 atgf 664 664
127272..129683 CDS 8954 804
138638..140143 CDS 307 307 502
140451..140525 aac + 234 234
140760..140834 aac 3 aac 439 439
141274..141348 aac @6 299 299 299
141648..143039 CDS 1587 464
comp 144627..145649 CDS 543 543 341
146193..147709 16s 140
147850..147925 gca 3 3
147929..148005 atc 111
148117..151030 23s 70
151101..151217 5s 5 5
151223..151298 ttc 4
151303..151377 tgc 167 167 167
151545..151841 CDS 25608 99
177450..178097 CDS 76 76 216
178174..178249 acc 65 65 65
178315..179508 CDS 134221 398
313730..316207 CDS 90 90 826 90
316298..316382 cta 4 4
316387..316461 ggg 120 120
comp 316582..316986 CDS 85487 135
402474..402953 CDS 125 125 160 125
403079..403154 cca + 17 17
403172..403245 gga 2* 149 149
403395..403471 aga cca gga aga 6 6
403478..403553 cca 16 16
403570..403643 gga 35 35
403679..403755 aga 5 5
403761..403836 cac 3 3
403840..403914 caa 2* 7 7
403922..403997 aaa caa aaa cta 18 18
404016..404100 cta ggc gga 5 5
404106..404180 ggc 25 25
404206..404279 gga 5 5
404285..404360 aag 57 57
404418..404492 caa 7 7
404500..404575 aaa 18 18
404594..404678 cta 5 5
404684..404758 ggc 25 25
404784..404857 gga 46 46
404904..404980 cga 325 325
< 405306..405467 CDS 8393 54
413861..415921 CDS 385 385 687
416307..417823 16s @5 132
417956..418032 atc 84
418117..421031 23s 71
421103..421177 aac 345 345 345
421523..422449 CDS 63814 309
486264..486668 CDS 159 159 135 159
486828..486912 tac + 9 9
486922..486997 gta 3 tac 27 27
487025..487099 aca 2 gta 12 12
487112..487196 tac 2 aca 9 9
487206..487281 gta 30 30
487312..487386 aca 12 12
487399..487483 tac 451 451
487935..489110 CDS 50956 392
540067..540969 CDS 187 187 301 187
541157..541231 tgg 208 208
541440..541820 CDS 97 127
comp 541918..542985 CDS 252 252 356 252
543238..543312 tgg 354 354
543667..544683 CDS 347735 339
892419..893339 CDS 560 560 307
893900..895416 16s 137
895554..895629 gca 118
895748..898661 23s 204
898866..898982 5s 552 552 552
899535..900446 CDS 351 304
900798..902048 CDS 704 704 417
902753..904269 16s 339
904609..907522 23s 273
907796..907912 5s 69 69 69
comp 907982..908449 CDS 43545 156
951995..952630 CDS 97 97 212 97
952728..952813 ctc 396 396
953210..954919 CDS 784414 570
1739334..1739933 CDS 380 380 200 380
1740314..1740389 cac 3 3
1740393..1740467 cag 5 5
1740473..1740548 aaa 443 443
comp 1740992..1742350 CDS 151829 453
1894180..1895406 CDS 34 34 409 34
comp 1895441..1895527 ttg 574 574
1896102..1896794 CDS 200701 231
2097496..2097915 CDS 722 722 140
2098638..2100154 16s 502
2100657..2103569 23s 205
2103775..2103891 5s 315 315 315
2104207..2104905 CDS 234313 233
2339219..2340322 CDS 662 662 368
2340985..2342501 16s 338
2342840..2345755 23s 140
2345896..2345970 aac 3
2345974..2346090 5s 429 429 429
2346520..2348088 CDS 3574 523
2351663..2352139 CDS 568 568 159
2352708..2354224 16s 338
2354563..2357477 23s 140
2357618..2357692 aac 3
2357696..2357812 5s 90 90 90
2357903..2358316 CDS 406783 138
2765100..2765525 CDS 625 625 142
2766151..2767667 16s 503
2768171..2771082 23s 202
2771285..2771401 5s 5
2771407..2771482 ttc 6 6
2771489..2771565 gac 25 25
2771591..2771665 gaa 448 448 448
2772114..2774864 CDS 781818 917
3556683..3557051 CDS 565 565 123 565
3557617..3557691 gag 925 925
comp 3558617..3559759 CDS 192275 381
comp 3752035..3752652 CDS 245 245 206 245
comp 3752898..3752985 agt @1 711 711
comp 3753697..3755112 CDS 501326 472
comp 4256439..4258403 CDS 267 267 655 267
comp 4258671..4258746 aaa 79 79
comp 4258826..4258901 cac 7 7
comp 4258909..4258985 aga 35 35
comp 4259021..4259094 gga 752 752
4259847..4260392 CDS 619853 182
comp 4880246..4880488 CDS 508 508 81 508
comp 4880997..4881113 5s 274
comp 4881388..4884300 23s 578
comp 4884879..4886395 16s 703 703
comp 4887099..4888034 CDS 1272704 312
comp 6160739..6161977 CDS 343 343 413
6162321..6162396 cca 242 242 242
6162639..6163283 CDS 2040 215
6165324..6165734 CDS 222 222 137
comp 6165957..6166032 ttc 5
comp 6166038..6166154 5s @2 188 188 188
6166343..6167074 CDS 8085 244
comp 6175160..6175597 CDS 249 249 146 249
comp 6175847..6175922 gca 1 1
comp 6175924..6176000 atgi 44
comp 6176045..6176161 5s 138
comp 6176300..6179216 23s 339
comp 6179556..6181072 16s 567 567
comp 6181640..6182446 CDS 223 269
6182670..6183419 CDS 190 190 250 190
comp 6183610..6183685 aaa + 5
comp 6183691..6183807 5s 2 aaa 159 159 159
comp 6183967..6184914 CDS @3 294 294 316 294
comp 6185209..6185284 aaa 7
comp 6185292..6185408 5s 138
comp 6185547..6188463 23s 339
comp 6188803..6190319 16s 771 771
comp 6191091..6192203 CDS 7306 371
comp 6199510..6202059 CDS 661 661 850
comp 6202721..6202837 5s @4 139
comp 6202977..6205893 23s 339
comp 6206233..6207749 16s 1102
comp 6208852..6208968 5s 138
comp 6209107..6212023 23s 339
comp 6212363..6213879 16s 502 502 502
comp 6214382..6215329 CDS 90019 316
comp 6305349..6306314 CDS 123 123 322 123
comp 6306438..6306527 tcc 281 281
comp 6306809..6307984 CDS 66527 392
6374512..6375684 CDS 125 125 391 125
comp 6375810..6375884 agg 303 303
comp 6376188..6378578 CDS 13398 797
comp 6391977..6392753 CDS 114 114 259 114
comp 6392868..6392984 5s 134
comp 6393119..6396033 23s 214
comp 6396248..6397764 16s 1120
comp 6398885..6399001 5s 139
comp 6399141..6402055 23s 214
comp 6402270..6403786 16s 748 748
comp 6404535..6405107 CDS 31702 191
6436810..6437790 CDS 192 192 327
comp 6437983..6438059 gac + 6 6
comp 6438066..6438141 gta 3* 14 14
comp 6438156..6438230 gaa gac gta 29 29
comp 6438260..6438334 aca gaa aca – 1 10 10
comp 6438345..6438421 gac 6 6
comp 6438428..6438503 gta 16 16
comp 6438520..6438594 gaa 29 29
comp 6438624..6438698 aca 10 10
comp 6438709..6438785 gac 6 6
comp 6438792..6438867 gta 14 14
comp 6438882..6438956 gaa 162 162 162
comp 6439119..6439685 CDS 37865 189

cbei cumuls[modifier | modifier le wikicode]

  • Lien tableur: cbei cumuls
  • Légende:
    - avec et sans rRNA, fréquences des intercalaires dans les clusters avec rRNA ou sans rRNA.
    - cdsd, je ne choisis que le cds avec l'intercalaire le plus faible d'un cluster donné, en supposant que ce cds a été créé par le cluster lors des conversions.
    - cdsa, longueur du cds en aas ici.
    -  1 : occurences exclues de la moyenne. Sont exclus de la moyenne les jaunes 554 de cbei opérons.
  • Notes:
C8. cumuls. Clostridium beijerinckii strain NCIMB 14988
opérons Fréquences intercalaires tRNAs Fréquences intercalaires cds Fréquences aas cds
effectif gammes sans rRNAs avec rRNAs gammes cds gammes cdsd gammes cdsa
avec rRNA opérons 17 1 0 2 1 0 1 0 100 4
16 23 5s 0 7 20 34 3 50 2 50 2 200 19
16 atc gca 1 40 12 1 100 7 100 6 300 11
16 5 23s a 3 60 2 0 150 7 150 5 400 20
max a 4 80 2 0 200 9 200 7 500 6
a doubles 1 100 0 0 250 5 250 3 600 3
autres 6 120 0 0 300 6 300 5 700 2
total aas 19 140 0 0 350 6 350 2 800 1
sans opérons 20 160 1 0 400 4 400 1 900 4
1 aa 11 180 0 0 450 3 450 2 1000 1
max a 19 200 0 0 500 2 500 0 1100 0
a doubles 5 3 0 21 4 0
total aas 74 54 6 72 37 71
total aas 93
remarques 6
avec jaune moyenne
variance
sans jaune moyenne 18 7 350 195 328
variance 17 9 225 111 206

cbei blocs[modifier | modifier le wikicode]

C8. Clostridium beijerinckii strain NCIMB 14988, cbei blocs.
16s 213 503 339
23s 108 202 138
5s 14 5 44
atgi atgi ttc atgi
16s 339 502 578
23s 273 205 274
5s
aaa 5
5s 159 5s 139 134
cds 294 23s 339 214
aaa 7 16s 1102 1120
5s 138 5s 138 139
23s 339 23s 339 214
16s 16s
16s 338 338 16s 140
23s 140 140 gca 3
aac 3 3 atc 111
5s aac aac 23s 70
5s 5
ttc
16s 137 16s 132
gca 118 atc 84
23s 204 23s 71
5s aac
ttc 5
5s

cbei remarques[modifier | modifier le wikicode]

  • Remarques des 6 @ de cbei opérons
    1. @ Un tRNA très rare même chez les eucaryotes, agt.
    2. @ Un 5s isolé avec un tRNA.
    3. @ Les cds candidats à la création
      - Un cds inséré dans un cluster, candidat pour la création. Ses 2 intercalaires sont faibles, 159 et 294, se trouvent dans les 36 1ers sur un total de 72 ( voir cbei cumuls ). C’est une protéine moyenne de 316 aas.
      - Les groupes de 2 clusters réunis par 2 cds. Ces cds sont colorés en vert comme candidats à la création:
      • le groupe contenant @3, adresse 6181640, intercalaires des cds 567 223 190, taille en aas 269 250 ;
      • le groupe d’ adresse 541440 contient 2 tgg, intercalaires des cds 208 97 252, taille en aas 127 356 ;
      • le groupe d’ adresse 899535, intercalaires des cds 552 351 704, taille en aas 304 417 ;
    4. @ Un cluster à 2 blocs complets en rRNAs, séparés par un intercalaire de 1102 pbs pouvant contenir un protéine moyenne comme @3. Adresse 6202721. Et le même cluster se retrouve à l’adresse 6392868 avec le même intercalaire 1120. Les 2 clusters se différencient, en intra, uniquement par l’intercalaire 23s-5s qui est le même pour les 2 blocs du premier, 339, et pour le deuxième, 214. Ce qui prouve que ce n’est pas une simple copie.
    5. @ Les blocs 16s-atc-23s5s sont relativement nombreux quand les 16s-atcgca-23s5s existent. Voir la fiche des clostridia. Ici le 5s est remplacé par un tRNA aac ce qui renforce l’hypothèse de 5s comme modèle.
    6. @ Un rare triplet pour un firmicutes et en plus les 2 intercalaires sont de la même longueur que les 2 intercalaires avec les 2 cds du cluster, 307 234 439 299, alors que la moyenne des intercalaires entre aas, sans rRNA, et sans jaunes n’est que de 18 (écart 17), celle des cds 350 (écart 225), voir cbei cumuls.
  • Séquence des doubles
    - Les doubles ne se trouvent que dans les clusters sans rRNAs puisqu’ils totalisent 74 tRNAs sur 93 et les tRNAs des clusters avec rRNA se trouvent à l’intérieur.
    - A part le triplet de @6 les clusters avec des doubles, signalés par le signe +, totalisent 5 sur 8 contenant plus d’un tRNA. Ce ne sont uniquement que des duplications de séquences colorées en cyan ou séparées par une bordure épaisse.
    - Les longueurs des séquences dupliquées sont:  2*2  4*3  1*4  1*5
  • Notes
    - Les blocs à rRNAs, voir cbei blocs. Ils sont caractérisés par très peu de tRNAs internes ou externes et par 5 groupes de 2 clusters chacun (@3), totalisant 10 blocs sur 16 . La distribution est la suivante :
    • 11 clusters complets sans tRNAs internes
    • 2 clusters peu courants avec un tRNA entre 23s et 5s,
    • 3 clusters avec tRNAs internes   gcaatc   gca   atc   voir la fiche des firmicutes.
    - 7 cds insérés dans les groupes à 2 clusters, candidats à la création .
    - Le 5s perçu comme un modèle dans @5, 16s-atc-23s-aac
    - Beaucoup de duplications dans les clusters sans rRNAs, caractéristique des firmicutes renforcée par la présence
    • d’un cluster avec un triplet aux intercalaires de type cds plutôt que tRNAs.
    • et des longueurs de séquences dupliquées variables:  2*2  4*3  1*4  1*5.
    • Ces longs clusters sans rRNAs seraient alors issus des clusters longs à rRNAs , qui , quand ils existent dans les autres génomes étudiés des firmicutes, présentent des duplications analogues.

Negativicutes[modifier | modifier le wikicode]

Acidaminococcus fermentans DSM 20731[modifier | modifier le wikicode]

afn opérons[modifier | modifier le wikicode]

  • Lien tableur: afn opérons
  • Liens: gtRNAdb [18], NCBI [19], génome []
  • Phylogénie: Bacteria; Firmicutes; Negativicutes; Acidaminococcales; Acidaminococcaceae; Acidaminococcus.
N1. Acidaminococcus fermentans DSM 20731
56%GC 30.6.19 Paris   60  doubles intercalaire
24678..26242 16s @1 359
26602..29507 23s 228
29736..29852 5s
36819..36894 acg
57713..59277 16s 359
59637..62543 23s 228
62772..62888 5s
169459..169534 gcc
249791..249867 agg
comp 274627..274703 cgt
311123..311198 aca 22
311221..311305 tac 5
311311..311386 atg 3
311390..311465 acc 6
311472..311548 atgf
380482..382046 16s 251
382298..385204 23s 229
385434..385550 5s
461553..461627 aac 3
461631..461705 gaa 8
461714..461789 gta 50
461840..461916 cca 11
461928..462001 gga 8
462010..462086 aga
526984..527070 ctg + 30
527101..527186 ctc 2 ctg 52
527239..527325 ctg
578049..578123 ggc
636984..638548 16s @2 94
638643..638719 atc 66
638786..638861 gca 273
639135..642040 23s 139
642180..642296 5s
712229..712304 cac 18
712323..712398 caa 3
712402..712477 aaa 16
712494..712577 cta
comp 724421..724497 gtc
774880..774956 gac 4
774961..775036 ttc 8
775045..775119 ggc 9
775129..775202 tgc 13
775216..775304 tta
796654..796728 cgg
842393..842469 gac 2
842472..842547 ttc 8
842556..842630 ggc 9
842640..842713 tgc
889670..889746 ccc
906136..906210 aac
1022783..1022859 gac 2
1022862..1022936 ggc 1
1022938..1023011 tgg
1555201..1555277 ccg
comp 1567911..1567999 tca
comp 1613773..1613863 agc
1702659..1702744 ttg
comp 1711770..1711886 5s 228
comp 1712115..1715021 23s 359
comp 1715381..1716945 16s
comp 1823852..1823927 gta 6
comp 1823934..1824008 gaa 8
comp 1824017..1824092 aag
1909446..1909536 tcc
comp 1911342..1911429 tcg
comp 1974984..1975058 atgi
comp 1984782..1984856 gag 12
comp 1984869..1984942 cag + 111
comp 1985054..1985127 cag 2 cag
comp 2072279..2072395 5s 228
comp 2072624..2075529 23s 298
comp 2075828..2075903 gca 66
comp 2075970..2076046 atc 94
comp 2076141..2077705 16s
2148343..2148418 gcg
comp 2287117..2287192 aaa
comp 2303018..2303094 gtg
comp 2323563..2323636 ggg

afn cumuls[modifier | modifier le wikicode]

cumuls. afn
opérons Fréquences
effectifs gammes sans rRNAs avec rRNAs
avec rRNA opérons 6 1 1 -
16 23 5s 0 4 20 21
16 atc gca 2 40 2
16 23 5s a 0 60 2
max a 2 80 0
a doubles 0 100 0
spéciaux 0 120 1
total aas 4 140 0
sans opérons 29 160 0
1 aa 20 180 0
max a 6 200 0
a doubles 2 0
total aas 56 27 0
total aas 60
remarques 2
avec jaune moyenne 16
variance 23
sans jaune moyenne 12
variance 13

afn blocs[modifier | modifier le wikicode]

N1. afn blocs
16s 359 1565 359 1565 251 1565
23s 228 2906 228 2907 229 2907
5s 117 117 117
16s 94 1565 5s 228 117
atc 66 23s 298 2906
gca 273 gca 66
23s 139 2906 atc 94
5s 117 16s 1565
5s 228 117
23s 359 2907
16s 1565

afn remarques[modifier | modifier le wikicode]

  • Lien tableur: afn remarques
  • Remarques : 4 blocs 16-23-5s sans aas et très peu de doubles. Très simple.
    1. @ 4 blocs 16-23-5s sans aas .
      - 3 opérons ont leurs intercalaires identiques, 359 228.
      - 1 opéron a son intercalaire 16s-23s diminué de 30%, 108/359, l’autre intercalaire est commune aux 4 opérons.
    2. @ 2 blocs 16-atc gca 23s-5s, classiques mais sans aas en plus.
      - 3 intercallaires sont identiques et celui entre 23s-5s varie du simple au double, 94 66 298 228 et 94 66 273 139.
  • Séquences des doubles : Très peu de doubles, 2 opérons à 2aas et plus sur 11 ont des doubles.
    - 2 doublets au total: opéron ctc + 2ctg et opéron gag + 2cag.
  • Tableau du code génétique de afn
    Légende: prélèvement de la base gtRNAdb le
    • - totaux en en-tête, 60 total de gtRNAdb contenant des pseudo et inconnus; 60 total du cumul.
    • - atgi, c'est Ile2, mis à la place de ttt, très rare chez les procaryotes.
    • - atgf, c'est Metf, mis à la place de tgt, très rare chez les procaryotes.
    • - atgj, c'est Met, remplace le atg standard qui est la somme Ile2 Metf Met.
    • - Voir la légende des tris et couleurs, g1 t1.
N1. afn, Acidaminococcus fermentans DSM 20731
g1    t1       60  60
atgi 1 tct tat atgf 1
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc 2 tcc 1 tac 1 tgc 2
atc 2 acc 1 aac 2 agc 1
ctc 1 ccc 1 cac 1 cgt 1
gtc 1 gcc 1 gac 3 ggc 4
tta 1 tca 1 taa tga
ata aca 1 aaa 2 aga 1
cta 1 cca 1 caa 1 cga
gta 2 gca 2 gaa 2 gga 1
ttg 1 tcg 1 tag tgg 1
atg 1 acg 1 aag 1 agg 1
ctg 2 ccg 1 cag 2 cgg 1
gtg 1 gcg 1 gag 1 ggg 1