Recherche:Les clusters de gènes tRNA et rRNA chez les procaryotes/Annexe/clostridia

Une page de Wikiversité.
Sauter à la navigation Sauter à la recherche
clostridia
Image logo représentative de la faculté
Annexe 4
Recherche : Les clusters de gènes tRNA et rRNA chez les procaryotes
Précédent :bacilli
Suivant :actino
Icon falscher Titel.svg
En raison de limitations techniques, la typographie souhaitable du titre, « Annexe : clostridia
Les clusters de gènes tRNA et rRNA chez les procaryotes/Annexe/clostridia
 », n'a pu être restituée correctement ci-dessus.



  • Annexe en préparation

Tanger le 3.11.19

Paeniclostridium sordellii AM370[modifier | modifier le wikicode]

psor opérons[modifier | modifier le wikicode]

  • Liens: gtRNAdb, NCBI [1], génome [2]
  • Lien tableur: psor opérons
  • Phylogénie: Bacteria; Firmicutes; Clostridia; Clostridiales;Peptostreptococcaceae; Paeniclostridium.
  • Légende: cdsa: cds aas, cdsj: cdsa sans jaune, cdsd: cdsa dirigé
    - @2, cds de 62 aas, hp, à allure répétitive susceptible d'être créé par contrainte lors des conversions ou d'autres réparations: MWLFFLFFFLFFFLFFFFFLFFFLFFFFFLFFFFFFPIVVLQTEINFRYGYIYTIHSGIIF
    - @4, riboswitch se trouve dans un bloc à rRNA. Concerne cette remarque aussi le RNA non codant, ncRNA, à l'adresse 19421..19685.
C1 Paeniclostridium sordellii AM370
27.3%GC 8.8.19 Paris  112   doubles intercal cds aa avec aa cdsa cdsd
9847..10620 CDS 205 205 258
10826..12332 16s 196
12529..15445 23s 78
15524..15640 5s 85 85 85
15726..15947 CDS 74
18845..19297 CDS 3 3 151 3
19301..19393 tcc 27
19421..19685 ncRNA 152 152
19838..21478 CDS *547
24343..24570 CDS 309 309 76
24880..26386 16s 196
26583..29499 23s 122
29622..29738 5s 5 5
29744..29832 tta + 13 13
29846..29921 atg 3 aaa 15 15
29937..30011 gaa 6 atg 9 9
30021..30094 gga 3 gta 6 6
30101..30176 gta 1 cgt 5 5
30182..30258 gac 1 ggc 16 16
30275..30350 aac 2 fois suite 4 4
30355..30429 aca aac aca aga 4 4
30434..30518 tac caa cac cca 15 15
30534..30617 cta cta gaa gac 14 14
30632..30708 aga gga tac tca 7 7
30716..30791 caa tgc tta ttc 11 11
30803..30878 aaa 6 6
30885..30973 tca 3 3
30977..31052 ttc 9 9
31062..31138 atg 8 8
31147..31223 atg 21 21
31245..31321 cca 6 6
31328..31404 cac 4 4
31409..31482 tgc 25 25
31508..31596 tta 13 13
31610..31685 atg 15 15
31701..31775 gaa 9 9
31785..31858 gga 6 6
31865..31940 gta 5 5
31946..32022 gac 16 16
32039..32114 aac 4 4
32119..32193 aca 4 4
32198..32282 tac 15 15
32298..32381 cta 11 11
32393..32467 ggc 13 13
32481..32557 aga 7 7
32565..32640 caa 11 11
32652..32727 aaa 6 6
32734..32822 tca 3 3
32826..32901 ttc 9 9
32911..32987 atg 8 8
32996..33072 atg 21 21
33094..33170 cca 6 6
33177..33253 cac 9 9
33263..33338 aaa 21 21
33360..33433 tgc 6 6
33440..33516 cgt 10
33527..33602 gta 162 162 162
33765..34016 CDS 84
34042..34455 CDS 249 249 138
34705..36211 16s 196
36408..39324 23s 78
39403..39519 5s 402 *402
comp 39922..40113 CDS 348 348 64
40462..41968 16s 196
42165..45081 23s 78
45160..45276 5s 180 180 *180
45457..47394 CDS *646
101428..102144 CDS 276 276 239
102421..103927 16s 54
103982..104057 gca 114
104172..107096 23s 41
107138..107211 gga 11
107223..107339 5s 99 99 99
comp 107439..108617 CDS 393
111345..111884 CDS 431 *431 180
112316..113822 16s 54
113877..113952 gca 114
114067..116982 23s 193
117176..117292 5s 5
117298..117386 tta 9 9
117396..117472 atg 123
117596..119102 16s 54
119157..119232 gca 114
119347..122263 23s 193
122457..122573 5s 5
122579..122667 tta 9 9
122677..122753 atg 123
122877..124383 16s 54
124438..124513 gca 114
124628..127549 23s 78
127628..127744 5s 100 100 100
127845..129260 CDS 472
215388..216260 CDS 264 264 291
216525..218030 16s 123
218154..218229 gca 152
218382..221296 23s 50
221347..221420 gga 12
221433..221549 5s 109 109 109
221659..221940 CDS 525 *525 94
222466..223972 16s 196
224169..227083 23s 144
227228..227344 5s 228 228 *228
227573..227989 CDS 139
449964..450266 CDS 253 253 101
450520..452026 16s 196
452223..455139 23s 144
455284..455400 5s 112 112 112
comp 455513..456616 CDS 368
498418..499074 CDS 189 189 219
499264..500770 16s 118
500889..500964 gca 95
501060..503976 23s 144
504121..504237 5s 131 131 131
504369..504551 CDS 61
546886..550416 CDS 41 41 *1177 *41
comp 550458..550544 ttg 138 138
550683..553325 CDS *881
608009..608683 CDS 195 195 225
608879..608975 tga 37 37 37
comp 609013..609732 CDS 240
815939..816655 CDS 71 71 239 71
816727..816800 tgc 12 12
816813..816888 aac 3 3
816892..816966 aca 285 285
817252..818727 CDS 492
1284870..1288097 CDS 111 111 *1076 *111
1288209..1288297 cta 426 *426
1288724..1290853 CDS *710
1445161..1445664 CDS 135 135 168 135
1445800..1445868 other @1 258 258
1446127..1446813 CDS 229
2267513..2267698 CDS @2 306 306 62 *306
comp 2268005..2268088 cta 404 *404
2268493..2269758 CDS 422
3094098..3094784 CDS 40 40 229 40
comp 3094825..3094941 5s 78
comp 3095020..3097936 23s 194
comp 3098131..3099637 16s 276 276
comp 3099914..3101161 CDS 416
3159922..3160827 CDS 37 37 302 37
comp 3160865..3160956 agc 120 120
comp 3161077..3161376 CDS 100
comp 3274188..3274733 CDS 245 245 182 *245
comp 3274979..3275095 5s @3 12
comp 3275108..3275181 gga 107
comp 3275289..3278214 23s 137
comp 3278352..3279858 16s 253 253
comp 3280112..3280690 CDS 193
comp 3303104..3304150 CDS 124 124 349 124
comp 3304275..3304459 riboswitch @4 96
comp 3304556..3304672 5s 11
comp 3304684..3304758 aca 116
comp 3304875..3307789 23s 196
comp 3307986..3309492 16s 364 *364
3309857..3310504 CDS 216
comp 3438683..3439531 CDS 142 142 283 142
comp 3439674..3439750 aga 7 7
comp 3439758..3439832 ggc 9 9
comp 3439842..3439918 gac 5 5
comp 3439924..3439999 gta 8 8
comp 3440008..3440082 gaa 5
comp 3440088..3440204 5s 40
comp 3440245..3443168 23s 112
comp 3443281..3443356 gca 109
comp 3443466..3444972 16s 138
comp 3445111..3445187 atg + 13 13
comp 3445201..3445276 ttc 3 atg 6 6
comp 3445283..3445359 atc 2 cca 6 6
comp 3445366..3445442 cca 2 gga 31 31
comp 3445474..3445549 tgg 2 aac 11 11
comp 3445561..3445637 atg 6 6
comp 3445644..3445720 cca 6 6
comp 3445727..3445817 agc 11 11
comp 3445829..3445917 tca 6 6
comp 3445924..3445999 aaa 12 12
comp 3446012..3446087 caa 6 6
comp 3446094..3446170 aga 19 19
comp 3446190..3446263 gga 11 11
comp 3446275..3446359 tac 4 4
comp 3446364..3446438 aca 4 4
comp 3446443..3446518 aac 31 31
comp 3446550..3446625 aac 16 16
comp 3446642..3446718 gac 5 5
comp 3446724..3446799 gta 6 6
comp 3446806..3446879 gga 9 9
comp 3446889..3446963 gaa 15 15
comp 3446979..3447054 atg 13 13
comp 3447068..3447156 tta 5
comp 3447162..3447278 5s 213
comp 3447492..3450406 23s 196
comp 3450603..3452109 16s 239 239
comp 3452349..3452552 CDS 68
comp 3523330..3524046 CDS 129 129 239 129
comp 3524176..3524251 gta + 8 8
comp 3524260..3524334 gaa 2 fois 20 20
comp 3524355..3524430 aaa gta gaa aaa 10 10
comp 3524441..3524515 aca 10 10
comp 3524526..3524602 gac 7 7
comp 3524610..3524685 gta 9 9
comp 3524695..3524769 gaa 5 5
comp 3524775..3524850 aaa 289 289
3525140..3526039 CDS 300

psor cumuls[modifier | modifier le wikicode]

cumuls. Paeniclostridium sordellii AM370
opérons Fréquences intercalaires tRNAs Fréquences intercalaires cds Fréquences aas cds
effectif gammes sans rRNAs avec rRNAs gammes cds gammes cdsd gammes cdsa
avec rRNA opérons 17 1 0 0 1 0 1 0 100 9
16 23 5s 0 6 20 9 65 50 5 20 1 200 8
16 atc gca 0 40 0 6 100 4 40 3 300 13
16 23 5s a 2 60 0 0 150 10 60 1 400 4
max a 44 80 0 0 200 5 80 1 500 4
a doubles 2 100 0 0 250 5 100 3 600 1
autres 9 120 0 0 300 8 120 3 700 1
total aas 87 140 0 0 350 3 140 4 800 1
sans opérons 7 160 0 0 400 1 160 1 900 1
1 aa 5 180 0 0 450 4 180 2 1000 0
max a 8 200 0 0 500 0 200 0 1100 1
a doubles 1 0 0 1 3 1
total aas 17 9 71 46 22 44
total aas 104
remarques 4
avec jaune moyenne 9 10 206 119 304
variance 5 6 121 73 257
sans jaune moyenne 173 95 220
variance 90 45 121

psor blocs[modifier | modifier le wikicode]

  • Lien tableur: psor blocs
  • Lien cdc blocs: le tabeau de cdc blocs est à comparer à celui de psor pour les types manquants, en gris dans cdc blocs.
  • Légende:
    - Les blocs sont rangés par type de I à IV pour les blocs 16s23s et de V à X pour les blocs 16sgca23s. Chaque bloc est noté par son type suivi d'un indice.
    - La 1ère partie du tableau représente la totalité des blocs; la 2ème les groupes où les blocs se suivent avec des intercalaires très faibles. Seul l'intercalaire séparant le bloc V2 de I4 est élevé et le plus grand du tableau, 525. Je considère qu'un intercalaire inférieur à 350 est faible relativement aux intercalaires intra bloc. Les intercalaires avec les CDS sont faibles ici puisque seulement 3 sont supérieurs à 350, 402 (I2), 431 (VI1) et 525 (I4). Voir le tableau des cumuls pour tout les intercalaires des cds où seulement 6 sur 46 dépassent 350, avec une moyenne de 173±90.
    - Les couleurs, rouge pour rRNA, vert pour une configuration peu courante, un gène tRNA entre 23s et 5s, et ribosw pour riboswitch. Le cyan pour repérer le même intercalaire par rapport à la direction 16s23s5s quand elle change quand on a des adresses complément.
  • Notes:
    - 3 blocs avec des tRNAs longs, 44 23 5, concentrant les 2/3 des tRNAs avec des blocs 16s23s. 15 tRNAs sont dans des blocs courts ou 16sgca23s. Les tRNAs extra blocs sont 17.
    - 10 blocs 16s23s contre 7 blocs 16sgca23s
    - Le regroupement des blocs par 3 et 2 concerne 10 blocs et restent donc 7 blocs solitaires, 3 sans tRNA et 4 avec 1 ou 2 tRNA.
    - Existence de 4 cds intra groupe de petite taille en aas, 84 138 64 pour le 2èmer groupe, et 94 pour le 4ème groupe.
    - Le 1er groupe de 3 blocs n'a pas de cds internes et est constitué de la duplication d'un même bloc.
    - Des intercalaires très faibles inter blocs
    - Des intercalaires intra blocs qui se répètent beaucoup mais peuvent être divisés ou multipliés par 2.
intercalaire				Total
16s-23s	9*196	137			10
23s-5s	5*78	4*144	3*193	40	13
16s-gca	4*54	3*120			7
gca-23s	5*114	95	152		7
5s-aas	4*5 (tta)	5 (gaa)		5
C1. Paeniclostridium sordellii AM370, blocs à rRNA
I I2 I3 I4 II III IV IV1 IV2
CDS 124
CDS 245 ribosw 96
CDS 205 249 348 525 253 40 5s 12 5s 11 CDS 309 5
16s 196 196 196 196 196 78 gga 107 aca 116 16s 196 213
23s 78 78 78 144 144 194 23s 137 23s 196 23s 122 196
5s 85 402 180 228 112 276 16s 253 16s 364 5s 5 239
CDS CDS CDS tta
V V2 VI VI1 VII VII1 VIII VIII1 IX X X1
CDS 276 264 CDS 431 CDS 189 gaa 5
16s 54 123 16s 54 16s 54 16s 54 16s 118 5s 40
gca 114 152 gca 114 gca 114 gca 114 gca 95 23s 112
23s 41 50 23s 193 23s 193 23s 78 23s 144 gca 109
gga 11 12 5s 5 5s 5 5s 100 5s 131 16s 138
5s 99 109 tta 9 tta 9 CDS CDS atg
CDS atg 123 atg 123
groupe1 groupe2 groupe3 groupe4
CDS 431 CDS 309 CDS 142 CDS 264
VI1 16s 54 IV1 16s 196 **4aas 8 V2 16s 123
gca 114 23s 122 gaa 5 gca 152
23s 193 5s 5 5s 40 23s 50
5s 5 tta 13 23s 112 gga 12
tta 9 **42aas 10 gca 109 5s 109
atg 123 gta 162 X1 16s 138 CDS 525
VII1 16s 54 CDS 25 atg 13 I4 16s 196
gca 114 CDS 249 **21aas 13 23s 144
23s 193 I2 16s 196 tta 5 5s 228
5s 5 23s 78 5s 213 CDS
tta 9 5s 402 23s 196
atg 123 CDS 348 IV2 16s 239
VIII1 16s 54 I3 16s 196 CDS
gca 114 23s 78
23s 78 5s 180
5s 100 CDS
CDS

psor remarques[modifier | modifier le wikicode]

  • Lien tableur: psor remarques
  • Nombre de gènes protéines: 3327 (NCBI)
  • Rmarques @:
  1. - Un tRNA nommé other, non déterminé
  2. - cds de 62 aas, hp, à allure répétitive susceptible d'être créé par contrainte lors des conversions ou d'autres réparations: MWLFFLFFFLFFFLFFFFFLFFFLFFFFFLFFFFFFPIVVLQTEINFRYGYIYTIHSGIIF
  3. - une configuration rare 23s-aas-5s concerne 3 gga et 1 aca
  4. - Les RNAs non codants: riboswitch dans un bloc à rRNA et ncRNA dans un bloc sans rRNA, adresse 19421..19685.
  • Configuration des blocs: voir psor blocs.
  • Les séquences des doubles: Il y a très peu de doubles mais des duplications de séquences. Le signe + dans psor opérons indique les doubles.
    - séquence 44 aas: voir psor opérons, la couleur cyan pour la duplication de 20 aas et la couleur verte pour les insertions. Je n'ai pas pu distingué les 3 types d'atg dans 6 atg, qui certainement doivent être départagés en 2 atgf 2 atgj 2 atgi. Ce qui laisse 2 doubles aaa et gta.
    - séquence 23 aas: voir ci-dessous l'analogie de séquence entre 23 aas et le début de 44 aas. Seuls 3 aas ont des doubles cca gga aac, aucune séquence n'est dupliquée.
    - séquence 5 aas, c'est une petite séquence simple à la suite du blocs 23aas. Est-ce le fait d'être dans un bloc 416s-gca-23s?
    - séquence 8 aas: voir psor opérons, adresse 3523330..3524046, duplication de 3 aas. Est-ce que ça ne serait pas une séquence détachée d'un bloc 16s23s5s comme les 2 autres longs blocs.
23aas	tta atg gaa gga gta gac aac aac aca tac gga aga caa aaa tca   agc cca atg tgg cca atc   ttc atg
44aas	tta atg gaa gga gta gac aac     aca tac cta aga caa aaa tca                             ttc atg   atg cca cac - - - -

Peptoclostridium difficile CD196[modifier | modifier le wikicode]

cdc opérons[modifier | modifier le wikicode]

  • Liens: gtRNAdb [3], NCBI [4], génome [orgn]
  • Lien tableur: cdc opérons
  • Phylogénie: Bacteria; Firmicutes; Clostridia; Clostridiales;Peptostreptococcaceae; Clostridioides.
  • Légende: cdsa: cds aas, cdsd: cds dirigé
C2 Peptoclostridium difficile CD196
28.6%GC 11.9.19 Paris  83   doubles intercal cds aa avec aa cdsa cdsd protéines
dir 9857..10630 cds 179 179 258 SigB/SigF/SigG family RNA polymerase sigma factor
dir 10810..12317 16s 52
dir 12370..12445 gca 249
dir 12695..15596 23s 111
dir 15708..15824 5s 126 126 126
dir 15951..16460 cds 170 transcription repressor NadR
dir 19402..19857 cds 0 0 152 0 nucleoside deaminase
dir 19858..19949 tcc 37
dir 19987..20251 ncRNA @1 76 76
dir 20328..21965 cds 546 DNA polymerase III subunit gamma/tau
comp 23419..24624 cds 505 *505 402 glycosyl transferase
dir 25130..26637 16s 279
dir 26917..29816 23s + 180
dir 29997..30113 5s 3 aaa 6
dir 30120..30194 aac 3 gta 6 6
dir 30201..30286 tta 15 15
dir 30302..30377 atgf 7 7
dir 30385..30459 gaa 9 9
dir 30469..30542 gga 5 5
dir 30548..30623 gta 5 5
dir 30629..30705 gac 9 9
dir 30715..30789 aca 14 14
dir 30804..30888 tac 8 8
dir 30897..30980 cta 29 29
dir 31010..31086 aga 7 7
dir 31094..31169 caa 88 88
dir 31258..31346 tca 3 3
dir 31350..31425 ttc 6 6
dir 31432..31508 atgj 11 11
dir 31520..31596 atgi 23 23
dir 31620..31696 cca 7 7
dir 31704..31780 cac 8 8
dir 31789..31864 aaa 7 7
dir 31872..31945 tgc 6 6
dir 31952..32026 aac 5 5
dir 32032..32117 tta 15 15
dir 32133..32208 atgf 7 7
dir 32216..32290 gaa 9 9
dir 32300..32373 gga 5 5
dir 32379..32454 gta 5 5
dir 32460..32536 gac 9 9
dir 32546..32620 aca 14 14
dir 32635..32719 tac 9 9
dir 32729..32812 cta 23 23
dir 32836..32910 ggc 24 24
dir 32935..33011 aga 9 9
dir 33021..33096 caa 8 8
dir 33105..33180 aaa 2 2
dir 33183..33271 tca 3 3
dir 33275..33350 ttc 6 6
dir 33357..33433 atgj 11 11
dir 33445..33521 atgi 17 17
dir 33539..33615 cac 8 8
dir 33624..33699 aaa 7 7
dir 33707..33780 tgc 7 7
dir 33788..33864 cgt 12 12
dir 33877..33952 gta 75 75 75
dir 34028..34441 cds 308 308 138 hp
dir 34750..38181 cds 1144 pyruvate carboxylase
dir 127011..127715 cds 281 281 235 N-acetylmuramoyl-L-alanine amidase CwlD
dir 127997..129505 16s 279
dir 129785..132685 23s + 131
dir 132817..132933 5s 2 cca 6
dir 132940..133014 aac 4 4
dir 133019..133093 gaa 5 5
dir 133099..133174 gta 5 5
dir 133180..133256 gac 10 10
dir 133267..133341 aca 14 14
dir 133356..133440 tac 9 9
dir 133450..133523 gga 10 10
dir 133534..133610 aga 9 9
dir 133620..133695 caa 11 11
dir 133707..133782 aaa 2 2
dir 133785..133873 tca 17 17
dir 133891..133981 agc 8 8
dir 133990..134066 cca 85 85
dir 134152..134227 tgg 60 60
dir 134288..134364 cca 6 6
dir 134371..134447 atc 3 3
dir 134451..134526 ttc 7 7
dir 134534..134610 atgj 114
dir 134725..136115 16s 68
dir 136184..136259 gca 271
dir 136531..139430 23s 126
dir 139557..139673 5s 213 213 213
comp 139887..141071 cds 372 *372 395 pyridoxal phosphate-dependent aminotransferase
dir 141444..143795 cds 21 21 784 anaerobic ribonucleoside triphosphate reductase
dir 143817..144356 cds 776 *776 180 anaerobic ribonucleoside-triphosphate reductase activating protein
dir 145133..146640 16s 52
dir 146693..146768 gca 373
dir 147142..150041 23s 126
dir 150168..150284 5s 7 7
dir 150292..150366 aac 5 5
dir 150372..150457 tta 15 15
dir 150473..150548 atgf 7 7
dir 150556..150630 gaa 14 14
dir 150645..150718 gga 5 5
dir 150724..150799 gta 5 5
dir 150805..150881 gac 10 10
dir 150892..150966 ggc 9 9
dir 150976..151049 aga 975 *975
dir 152025..152864 cds 280 TIGR00159 family protein
dir 378341..380728 cds 583 *583 796 cadmium-translocating P-type ATPase
dir 381312..382819 16s 311
dir 383131..386030 23s 126
dir 386157..386273 5s 177 177 177
dir 386451..387059 cds 203 DedA family protein
comp 833130..833894 cds 258 258 255 DeoR/GlpR transcriptional regulator
dir 834153..834243 agc 87 87 87
dir 834331..835119 cds 263 flagellar motor protein
dir 1089165..1090139 cds 239 239 325 239 Mannosyl-glycoprotein endo-beta-N-acetylglucosamidase
dir 1090379..1091886 16s 320
dir 1092207..1095106 23s 91
dir 1095198..1095271 gga @2 8
dir 1095280..1095396 5s 273 273
dir 1095670..1097688 cds 673 N-acetylmuramoyl-L-alanine amidase
comp 1181549..1182958 cds 1374 *1374 470 MBOAT family protein
comp 1184333..1184415 ttg 318 318 318
dir 1184734..1187382 cds 883 DNA polymerase I
dir 1835768..1837498 cds 109 109 577 109 Na+/H+ antiporter NhaC family protein
dir 1837608..1837688 cta 231 231
<dir 1837920..1838093 cds 58 HXXEE domain-containing protein
dir 2981767..2982444 cds 159 159 226 159 sortase SrtB
comp 2982604..2982678 aca @3 94
comp 2982773..2985672 23s 184
comp 2985857..2987364 16s 340 340
dir 2987705..2988643 cds 313 delta-lactam-biosynthetic de-N-acetylase
comp 3787361..3788431 cds 454 *454 357 ABC transporter ATP-binding protein
comp 3788886..3789002 5s 126
comp 3789129..3792028 23s 281
comp 3792310..3793817 16s 191 191 191
comp 3794009..3794587 cds 193 bifunctional precorrin-2 dehydrogenase/sirohydrochlorin ferrochelatase
comp 3944262..3944453 cds 119 119 64 119 DUF378 domain-containing protein
comp 3944573..3944689 5s 126
comp 3944816..3947715 23s 217
comp 3947933..3949440 16s 282 282
comp 3949723..3950004 cds 221 221 94 hp
comp 3950226..3951755 cds 510 lysine--tRNA ligase
dir 4084445..4085437 cds 382 *382 331 DNA replication protein DnaC
comp 4085820..4085894 aca 33
comp 4085928..4086003 gta 4
comp 4086008..4086082 gaa 6
comp 4086089..4086164 aaa 326 326 326
comp 4086491..4087780 cds 430 adenylosuccinate synthase

cdc cumuls[modifier | modifier le wikicode]

cumuls. Peptoclostridium difficile CD196
opérons Fréquences intercalaires tRNAs Fréquences intercalaires cds Fréquences aas cds
effectif gammes sans rRNAs avec rRNAs gammes cds gammes cdsd gammes cdsa
avec rRNA opérons 10 1 0 1 1 1 1 100 3
16 23 5s 0 3 20 2 61 50 1 20 0 200 5
16 gca 235 3 40 1 4 100 3 40 0 300 7
16 23 5s a 2 60 1 150 3 60 0 400 5
max a 43 80 0 200 4 80 1 500 3
a doubles 2 100 2 250 4 100 1 600 3
autres 2 120 0 300 4 120 2 700 1
total aas 75 140 0 350 4 140 1 800 2
sans opérons 5 160 0 400 2 160 1 900 1
1 aa 4 180 0 450 0 180 1 1000 0
max a 4 200 0 500 1 200 1 1100 0
a doubles 0 0 5 4 1
total aas 8 3 68 32 13 31
total aas 83
remarques 3
avec jaune moyenne 14 12 313 165 378
variance 15 283 94 259
sans jaune moyenne 9 206 286
variance 5 107 144

cdc blocs[modifier | modifier le wikicode]

  • Lien tableur: cdc blocs
  • Lien psor blocs: le tabeau de cdc blocs est à comparer à celui de psor pour les types manquants, ici en gris.
  • Légende: voir psor blocs.
  • Notes:
    - cdc a perdu 3 blocs de type I, 16s23s5s sans tRNAs; les 2 blocs de type V, 16s-gca-23sgga5s et les 2 blocs 16s-gca-23s5s-2aas de type VI et VII. Soit la moitié des blocs courts, 7 sur 14, et plus de la moitié des blocs 16s-gca, 4 sur 7. Les 3 blocs longs sont maintenus mais modifiés.
C2. cdc blocs
groupes types absents            
cds 281 I II III IV IV1 IV2
IV2 16s 279
23s 131 CDS 583 454 119 cds 239
5s 6 16s 311 126 126 16s 320 cds 159 cds 505 281
aac 4 23s 126 281 217 23s 91 aca 94 16s 279 279
**16aas 3 5s 177 191 282 gga 8 23s 184 23s 180 131
ttc 7 CDS 5s 273 16s 340 5s 6 6
atgj 114 cds cds aac 6 4
VIII1 16s 68
gca 271 V V2 VI VI1 VII VII1
23s 126
5s 213
cds 372
cds 21 VIII VIII1 IX X X1
cds 776 cds 21
X1 16s 52 atgj 114 cds 179 cds 776
gca 373 16s 68 16s 52 16s 52
23s 126 gca 271 gca 249 gca 373
5s 7 23s 126 23s 111 23s 126
aac 5 5s 213 5s 126 5s 7
**7aas 9 cds 372 cds aac 5
aga 975
cds

cdc psor[modifier | modifier le wikicode]

  • Lien tableur: cdc psor
  • Comparaison bsu-lmo: Les séquences, les cumuls.
  • Légende:
    - La couleur cyan pour les différents entre cdc et psor; bois pour les identiques entre les clusters 43aas et 18aas de cdc d'une part et les clusters 44aas et 23aas de psor. Le gène aaa du cluster 18aas de cdc a son identique dans la 2ème partie du cluster 43aas et non dans la 1ère partie, car la duplication n'est pas exacte.
    - Le bleu pour des intercalaires exceptionnels.
    - Les blocs 16s indiquent des rRNAs de bordure, l'équivalent d'un cds.
    - Le jaune pour la conservation des cds: je ne l'ai appliqué ici qu'aux petits clusters sans rRNAs; Comparer les cumuls des intercalaires et protéines des cds de cdc et psor montre clairement que les clusters soit, sont très mobiles ou bien qu'il y a de nombreuses recombinansons entre le cluster et ses cds. Le jaune indique ici des intercalaires et des protéines presque identiques.
    - Les bordures très épaisses noires encadrent les 7 gènes du cluster 9aas identiques dans les duplicata du 43aas, comparaison cdc-cdc. Les bordures très épaisses bleues encadrent les 4 gènes du cluster 9aas de cdc et ceux du 23aas de psor, comparaison cdc-psor.
  • Notes:
    - Les 3 blocs longs de cdc commencent tous par aac. Chez psor 2 blocs longs et 2 courts commencent par tta et 1 bloc long gca commence par gaa.
    - Le jaune encadré montre que le cluster cta conservé dans cdc est celui ayant une protéine identique, 58 contre 62 aas dans psor. Or dans psor ce cluster présente des répétitions caractéristiques des contraintes imposées aux réparations.
    - Les fréquences des différences entre intercalaires (diff) sont reportées dans le dernier tableau C24 et sont établies sur la plage des différences entre intercalaires cdc et psor du tableau C21 pour des couples identiques. 16% des différences sont nulles (8 sur 49) et 50% ne dépassent pas 2 paires de bases. Ces résultats sont à mettre en parallèle avec ceux de la omparaison bsu-lmo, avec les séquences et les cumuls. La faible variabilité des intercalaires cdc-psor par rapport à bsu-lmo est due à leur plus grande filiation, niveau genre contre le niveau famille pour bsu-lmo.
C2. Comparaison cdc-psor
C21. Comparaison cdc-psor
cdc intercal psor intercal diff
cds 505 cds 309
16s 279 16s 196
23s 180 23s 122
5s 6 5s 5
aac 6 tta 13
tta 15 atg 15 -2
atgf 7 gaa 9 8
gaa 9 gga 6 0
gga 5 gta 5 1
gta 5 gac 16
gac 9 aac 4
aca 14 aca 4 -10
tac 8 tac 15 7
cta 29 cta 14 -15
aga 7 aga 7 0
caa 88 caa 11
tca 3 aaa 6
ttc 6 tca 3 0
atgj 11 ttc 9 3
atgi 23 atg 8 -3
cca 7 atg 21 -2
cac 8 cca 6 -1
aaa 7 cac 4
tgc 6 tgc 25
aac 5 tta 13 -2
tta 15 atg 15 8
atgf 7 gaa 9 0
gaa 9 gga 6 1
gga 5 gta 5 0
gta 5 gac 16
gac 9 aac 4
aca 14 aca 4 -10
tac 9 tac 15 6
cta 23 cta 11 -12
ggc 24 ggc 13 -11
aga 9 aga 7 -2
caa 8 caa 11 3
aaa 2 aaa 6 4
tca 3 tca 3 0
ttc 6 ttc 9 3
atgj 11 atg 8 -3
atgi 17 atg 21
cac 8 cca 6
aaa 7 cac 9 1
tgc 7 aaa 21 14
cgt 12 tgc 6 -1
gta 75 cgt 10 -2
cds gta 162
cds
cds 776
16s 52
gca 373
23s 126
5s 7 atg 138
aac 5 16s 109
tta 15 gca 112
atgf 7 23s 40
gaa 14 5s 5
gga 5 gaa 8
gta 5 gta 5 0
gac 10 gac 9 -1
ggc 9 ggc 7 -2
aga 975 aga 142
cds cds
cds 281 cds 239
16s 279 16s 196
23s 131 23s 213
5s 6 5s 5
aac 4 tta 13
gaa 5 atg 15
gta 5 gaa 9
gac 10 gga 6
aca 14 gta 5
tac 9 gac 16
gga 10 aac 31
aga 9 aac 4
caa 11 aca 4 -10
aaa 2 tac 11 2
tca 17 gga 19 9
agc 8 aga 6 -3
cca 85 caa 12 1
tgg 60 aaa 6 4
cca 6 tca 11 -6
atc 3 agc 6 -2
ttc 7 cca 6
atgj 114 atg 11
16s tgg 31 -29
cca 6 0
atc 6 3
ttc 13 6
atg 138
16s
cds 129
gta 8
gaa 20
aaa 10
cds 382 aca 10
aca 33 gac 7
gta 4 gta 9 5
gaa 6 gaa 5 -1
aaa 326 aaa 289
cds cds
C22. Comparaisons internes
cdc intercal cdc intercal diff
cds 505 cds 281
16s 279 16s 279
23s 180 23s 131
5s 6 5s 6
aac 6 aac 4
tta 15 gaa 5
atgf 7 gta 5
gaa 9 gac 10
gga 5 aca 14
gta 5 tac 9 0
gac 9 gga 10 1
aca 14 aga 9 0
tac 8 caa 11
cta 29 aaa 2
aga 7 tca 17 2
caa 88 agc 8
tca 3 cca 85
ttc 6 tgg 60
atgj 11 cca 6
atgi 23 atc 3
cca 7 ttc 7
cac 8 atgj 114
aaa 7 16s
tgc 6 cds 776
aac 5 16s 52
tta 15 gca 373
atgf 7 23s 126
gaa 9 5s 7
gga 5 aac 5
gta 5 tta 15 0
gac 9 atgf 7 1
aca 14 gaa 14 0
tac 9 gga 5
cta 23 gta 5
ggc 24 gac 10
aga 9 ggc 9 0
caa 8 aga 975 3
aaa 2 cds 0
tca 3
ttc 6
atgj 11
atgi 17
cac 8
aaa 7
tgc 7
cgt 12
gta 75
cds
psor psor intercal diff
cds 309 cds 239
16s 196 16s 196
23s 122 23s 213
5s 5 5s 5
tta 13 tta 13 0
atg 15 atg 15 0
gaa 9 gaa 9 0
gga 6 gga 6 0
gta 5 gta 5 0
gac 16 gac 16 0
aac 4 aac 31
aca 4 aac 4
tac 15 aca 4 0
cta 14 tac 11 -4
aga 7 cta 19 5
caa 11 aga 6 -1
aaa 6 caa 12 1
tca 3 aaa 6 0
ttc 9 tca 11
atg 8 agc 6
atg 21 cca 6
cca 6 atg 11
cac 4 tgg 31
tgc 25 cca 6
tta 13 atc 6 0
atg 15 ttc 13 0
gaa 9 atg 138 0
gga 6 16s 0
gta 5 atg 138 0
gac 16 16s 109 0
aac 4 gca 112
aca 4 23s 40 0
tac 15 5s 5
cta 11 gaa 8
ggc 13 gta 5
aga 7 gac 9 -1
caa 11 ggc 7 1
aaa 6 aga 142 0
tca 3 cds
ttc 9
atg 8
atg 21
cca 6
cac 9
aaa 21
tgc 6
cgt 10
gta 162
cds
C23. Conservation des cds
cdc intercal psor intercal protéines
cds 0 cds 3 151 – 152
tcc 37 tcc 27
ncRNA 76 ncRNA 152 547 – 546
cds cds
cds 1374 cds 41 470 – 1177
ttg 318 ttg 138 883 – 881
cds cds
cds 109 cds 111 577 – 1076
cta 231 cta 426
cds cds 58 – 577
cds 258 cds 37 255 – 302
agc 87 agc 120
cds cds 263 – 100
cds 306 62
cta 404
cds 422
cds 135
other 258
cds
cds 195
tga 37
cds
cds 71
tgc 12
aac 3
aca 285
cds
C24. Fréquence des différences des intercalaires
gamme fréquence
-15 2
-14
-13
-12 1
-11 1
-10 3
-9
-8
-7
-6 1
-5
-4
-3 3
-2 7
-1 4
0 8
1 4
2 1
3 4
4 2
5 1
6 2
7 1
8 2
9 1
10
11
12
13
14 1
15
total 49
sous t. -2+2 24

cdc remarques[modifier | modifier le wikicode]

  • Nombre de gènes protéines: cdc 3615, psor 3327 (NCBI)
  • Comparaison bsu-lmo: Les séquences, les cumuls. bsu-lmo nouveau
  • Rmarques @: On retrouve une partie des remarques de psor
  1. - Les RNAs non codants: seul le bloc cds-tcc-ncRNA-cds est maintenu.
  2. - Une configuration rare 23s-gga-5s complète au lieu de 3.
  3. - La configuration 16s23s-aca-5s-riboswitch perd 5s-riboswitch et devient 16s23s-aca.
  • Comparaison cdc-psor
    1. Les blocs à rRNAs: Les blocs disparaissent au moment des divisions et ce sont les non protégés par des séquences de tRNAs qui disparaissent en 1er. 7 clusters simples disparaissent et les groupes se défont.
    2. Les séquences longues:
      • Comparaison entre les 2 génomes, cdc-psor: Très peu de modifications, plutôt des mutations que des recombinaisons et encore moins des créations. Le cas de la disparition de aaa qui apparaît dans un intercalaire est emblématique.
      • Comparaisons intra génome, cdc-cdc et psor-psor. Là les remaniements sont légions et puissants: duplication de 20 tRNAs d'un seul coup, recombinaisons par lots ou tRNA par tRNA.
  • Comparaison clostridia-bacilli entre cdc-psor et bsu-lmo: la comparaison est saisissante et on arrive à repérer une recombinaison après division, celle de 16s23s5s en 16s-atcgca-23s5s entre bsu et lmo. La mutation de cta en ctg, entre génome, qui conserve la longueur du tRNA, ainsi que la agc en tcc dans le petit bloc aac-**-gaa en intra.
    - Seul les clostridia présentent des cds dans les groupes, les bacilli non. Les autres génomes de clostridia (voir fiche) présentent beaucoup de cds dans les clusters alors que les bacilli (fiche) jamais.
  • Conclusion: Tout se passe comme si le processus se déroulait d'un seul coup dans un génome, en dehors de la division. Puis pendant la 1ère division et les divisions suivantes certains clusters disparaissent facilement alors que se produisent quelques rares mutations et recombinaisons. C'est avant tout un processus de création ordonné donnant des séquences qui peuvent se dupliquer et se recombiner. Les séquences de tRNA stabilisent et maintiennent les blocs de rRNAs, un seul cluster à 6 tRNAs disparaît entre bsu et lmo, et aucun entre cdc et psor.

Peptoclostridium difficile M68[modifier | modifier le wikicode]

cdc8 opérons[modifier | modifier le wikicode]

  • Liens: gtRNAdb [5], NCBI [6], génome [7]
  • Lien tableur: cdc8 opérons
  • Phylogénie: Bacteria; Firmicutes; Clostridia; Clostridiales;Peptostreptococcaceae; Clostridioides.
  • Légende: cdsa: cds aas, cdsd: cds dirigé
    - 23s': possible 23S ribosomal RNA but does not have good blast hits on one or both of the ends.
    - 23s°: 23S ribosomal RNA rRNA prediction is too short
  • Liens noms abrégéscdc8 remarques
C3 Peptoclostridium difficile M68
28.6%GC 11.9.19 Paris  110  doubles intercal cds aa avec aa cdsa cdsd protéines
dir 4299490..4300134 cds 214 214 645 tyrosine-type recombinase/integrase
dir 4300349..4300807 cds @1 554 554 459 helix-turn-helix domain-containing protein
dir 4301362..4303101 cds 0 0 1740 hypothetical protein
dir 4303102..4303305 cds 167 167 204 hp
dir 4303473..4304299 23s° 132 827
dir 4304432..4304548 5s + 6 117
dir 4304555..4304629 aac 4 4 75
dir 4304634..4304708 gaa 2 cca 5 5 75
dir 4304714..4304789 gta 5 5 76
dir 4304795..4304871 gac 11 11 77
dir 4304883..4304957 aca 14 14 75
dir 4304972..4305056 tac 9 9 85
dir 4305066..4305139 gga 10 10 74
dir 4305150..4305226 aga 9 9 77
dir 4305236..4305311 caa 11 11 76
dir 4305323..4305398 aaa 2 2 76
dir 4305401..4305489 tca 18 18 89
dir 4305508..4305598 agc 8 8 91
dir 4305607..4305683 cca 85 85 77
dir 4305769..4305844 tgg 60 60 76
dir 4305905..4305981 cca 5 5 77
dir 4305987..4306063 atc 3 3 77
dir 4306067..4306142 ttc 7 7 76
dir 4306150..4306226 atgj 114 77
dir 4306341..4307538 16s 0 0 1198 0
dir 4307539..4308225 cds 100 100 687 xylose isomerase
dir 1..796 23s° 181 796
dir 978..1094 5s 6 117
dir 1101..1175 aac + 6 6 75
dir 1182..1267 tta 3 aaa 15 15 86
dir 1283..1358 atgf 3 gta 7 7 76
dir 1366..1440 gaa 9 9 75
dir 1450..1523 gga 5 5 74
dir 1529..1604 gta 5 5 76
dir 1610..1686 gac 9 9 77
dir 1696..1770 aca 14 14 75
dir 1785..1869 tac 10 10 85
dir 1880..1963 cta 28 28 84
dir 1992..2068 aga 7 7 77
dir 2076..2151 caa 89 89 76
dir 2241..2329 tca 3 3 89
dir 2333..2408 ttc 6 6 76
dir 2415..2491 atgj 11 11 77
dir 2503..2579 atgi 29 29 77
dir 2609..2685 cca 7 7 77
dir 2693..2769 cac 8 8 77
dir 2778..2853 aaa 7 7 76
dir 2861..2934 tgc 6 6 74
dir 2941..3015 aac 6 6 75
dir 3022..3107 tta 15 15 86
dir 3123..3198 atgf 7 7 76
dir 3206..3280 gaa 9 9 75
dir 3290..3363 gga 5 5 74
dir 3369..3444 gta 5 5 76
dir 3450..3526 gac 9 9 77
dir 3536..3610 aca 14 14 75
dir 3625..3709 tac 9 9 85
dir 3719..3802 cta 24 24 84
dir 3827..3901 ggc 24 24 75
dir 3926..4002 aga 9 9 77
dir 4012..4087 caa 8 8 76
dir 4096..4171 aaa 2 2 76
dir 4174..4262 tca 3 3 89
dir 4266..4341 ttc 6 6 76
dir 4348..4424 atgj 11 11 77
dir 4436..4512 atgi 17 17 77
dir 4530..4606 cac 8 8 77
dir 4615..4690 aaa 7 7 76
dir 4698..4771 tgc 7 7 74
dir 4779..4855 cgt 12 12 77
dir 4868..4943 gta 75 75 76 75
dir 5019..5432 cds 308 308 414 hp
dir 5741..9172 cds 3432 pyruvate carboxylase
dir 94032..94736 cds 281 281 705 281 N-acetylmuramoyl-L-alanine amidase CwlD
dir 95018..95994 16s° 100 977
dir 96095..97613 23s° 126 1519
dir 97740..97856 5s 7 117
dir 97864..97938 aac 6 6 75
dir 97945..98030 tta 15 15 86
dir 98046..98121 atgf 7 7 76
dir 98129..98203 gaa 8 8 75
dir 98212..98285 gga 4 4 74
dir 98290..98365 gta 5 5 76
dir 98371..98447 gac 10 10 77
dir 98458..98532 ggc 9 9 75
dir 98542..98615 aga 954 954 74
dir 99570..100409 cds 840 TIGR00159 family protein
dir 306829..309216 cds 733 733 2388 cadmium-translocating P-type ATPase
<> comp 309950..310076 cds 1 1 127 1 glycine/sarcosine/betaine reductase complex selenoprotein A
dir 310078..311313 23s° 126 1236
dir 311440..311556 5s 177 177 117
dir 311734..312342 cds 609 DedA family protein
comp 861856..862620 cds 258 258 765 DeoR/GlpR transcriptional regulator
dir 862879..862969 agc 87 87 91 87
dir 863057..863845 cds 789 flagellar motor protein
dir 1106477..1107451 cds 238 238 975 238 Mannosyl-glycoprotein endo-beta-N-acetylglucosamidase
dir 1107690..1109197 16s @2 320 1508
dir 1109518..1112416 23s 91 2899
dir 1112508..1112581 gga 8 74
dir 1112590..1112706 5s 273 273 117
dir 1112980..1114998 cds 2019 N-acetylmuramoyl-L-alanine amidase
comp 1196804..1198213 cds 1378 1378 1410 MBOAT family protein
comp 1199592..1199674 ttg 318 318 83 318
dir 1199993..1202641 cds 2649 DNA polymerase I
dir 1850896..1852626 cds 109 109 1731 109 Na+/H+ antiporter NhaC family protein
dir 1852736..1852816 cta 334 334 81
dir 1853151..1853666 cds 516 HXXEE domain-containing protein
dir 3024038..3024715 cds 150 150 678 150 sortase SrtB
comp 3024866..3024940 aca @3 93 75
comp 3025034..3027933 23s 184 2900
comp 3028118..3029625 16s 374 374 1508
dir 3030000..3030938 cds 939 delta-lactam-biosynthetic de-N-acetylase
dir 3805298..3806743 cds 208 208 1446 tyrosine-type recombinase/integrase
comp 3806952..3807028 agg 61 61 77 61
<comp 3807090..3808790 cds 1701 formate dehydrogenase subunit alpha
comp 3875816..3876886 cds 452 452 1071 ABC transporter ATP-binding protein
comp 3877339..3877455 5s 125 117
comp 3877581..3880480 23s 261 2900
comp 3880742..3882249 16s 190 190 1508 190
comp 3882440..3883018 cds 579 bifunctional precorrin-2 dehydrogenase/sirohydrochlorin ferrochelatase
comp 4017523..4017714 cds 118 118 192 118 DUF378 domain-containing protein
comp 4017833..4017949 5s 126 117
comp 4018076..4020975 23s 321 2900
comp 4021297..4022804 16s 292 292 1508
comp 4023097..4023378 cds 221 221 282 hp
comp 4023600..4025129 cds 1530 lysine--tRNA ligase
dir 4135881..4136873 cds 383 383 993 DNA replication protein DnaC
comp 4137257..4137331 aca 33 33 75
comp 4137365..4137440 gta 4 4 76
comp 4137445..4137519 gaa 6 6 75
comp 4137526..4137601 aaa 331 331 76 331
comp 4137933..4139222 cds 1290 adenylosuccinate synthase
dir 4178197..4178970 cds 179 179 774 SigB/SigF/SigG family RNA polymerase sigma factor
dir 4179150..4180587 16s 161 1438
comp 4180749..4180865 5s 201 117
comp 4181067..4183959 23s 217 2893
comp 4184177..4185684 16s 108 1508
comp 4185793..4185869 atgi 11 11 77
comp 4185881..4185969 tta 5 89
comp 4185975..4186091 5s 201 117
comp 4186293..4189192 23s 375 2900
comp 4189568..4189643 gca 52 76
comp 4189696..4190959 16s’ @4 100 1264
dir 4191060..4192225 16s’ 52 1166
dir 4192278..4192353 gca 248 76
dir 4192602..4193197 23s° 100 596
dir 4193298..4193874 16s° 321 577
dir 4194196..4196423 23s’ 100 2228
dir 4196524..4197091 16s° 320 568
dir 4197412..4199044 23s° 100 1633
dir 4199145..4201593 23s’ 126 2449
dir 4201720..4201836 5s 127 127 117 127
dir 4201964..4202473 cds 510 transcription repressor NadR
dir 4205417..4205872 cds 0 0 456 0 nucleoside deaminase
dir 4205873..4205964 tcc @5 37 92
dir 4206002..4206266 ncRNA 76 76 265
dir 4206343..4207980 cds 1638 DNA polymerase III subunit gamma/tau
comp 4209435..4210639 cds 496 496 1205 glycosyl transferase
4211136..4212643 16s 321 1508
4212965..4213127 23s° 100 100 163 100
<>comp 4213228..4213849 cds 111 622 CHAP domain-containing protein
comp 4213961..4214620 cds 228 228 660 228 type A-1 chloramphenicol O-acetyltransferase
dir 4214849..4216199 16s 321 1351
dir 4216521..4217008 23s° 101 488
comp 4217110..4218529 23s° 250 1420
comp 4218780..4218855 gca 52 76
comp 4218908..4219471 16s° 100 564
comp 4219572..4219856 23s° 217 285
comp 4220074..4221581 16s 179 179 1508 179
>comp 4221761..4222206 cds 386 386 446 386 B/F/G family RNA polymerase sigma-70 factor
dir 4222593..4224100 16s 321 1508
dir 4224422..4227321 23s 181 2900
dir 4227503..4227619 5s 6 117
dir 4227626..4227700 aac 6 6 75
dir 4227707..4227792 tta 15 15 86
dir 4227808..4227883 atgf 7 7 76
dir 4227891..4227965 gaa 9 9 75
dir 4227975..4228048 gga 5 5 74
dir 4228054..4228129 gta 5 5 76
dir 4228135..4228211 gac 9 9 77
dir 4228221..4228295 aca 14 14 75
dir 4228310..4228394 tac 10 10 85
dir 4228405..4228488 cta 28 28 84
dir 4228517..4228593 aga 7 7 77
dir 4228601..4228676 caa 89 89 76
dir 4228766..4228854 tca 3 3 89
dir 4228858..4228933 ttc 6 6 76
dir 4228940..4229016 atgj 11 11 77
dir 4229028..4229104 atgi 29 29 77
dir 4229134..4229210 cca 7 7 77
dir 4229218..4229294 cac 8 8 77
dir 4229303..4229378 aaa 353 76
comp 4229732..4229848 5s 126 117
comp 4229975..4232010 23s' 582 2036
dir 4232593..4234098 16s @6 217 1506
dir 4234316..4237215 23s 126 2900
dir 4237342..4237458 5s 216 216 117 216
comp 4237675..4238859 cds 372 372 1185 pyridoxal phosphate-dependent aminotransferase
dir 4239232..4241583 cds 21 21 2352 anaerobic ribonucleoside triphosphate reductase
dir 4241605..4242144 cds 778 778 540 anaerobic ribonucleoside-triphosphate reductase activating protein
dir 4242923..4244459 16s @7 261 1537
dir 4244721..4247619 23s 201 2899
dir 4247821..4247937 5s 5 117
dir 4247943..4248031 tta 11 11 89
dir 4248043..4248119 atgi 108 77
dir 4248228..4249735 16s 184 1508
dir 4249920..4250564 23s° 100 100 645 100
<dir 4250665..4250923 cds 112 112 259 112 hp
comp 4251036..4253145 23s’ 375 2110
comp 4253521..4253596 gca 52 76
comp 4253649..4254226 16s° 282 282 578
dir 4254509..4254712 cds 12 12 204 hp
dir 4254725..4256002 cds 1278 phage portal protein

cdc8 cumuls[modifier | modifier le wikicode]

C3. cumuls. Peptoclostridium difficile M68
opérons Fréquences intercalaires tRNAs Fréquences intercalaires cds Fréquences aas cds
effectif gammes sans rRNAs avec rRNAs gammes cds gammes cdsd gammes cdsa
avec rRNA opérons 21 1 0 1 4 1 3 100 6
16 23 5s 0 4 20 2 77 50 2 20 0 200 8
16 gca 235 2 40 1 6 100 7 40 0 300 11
16 23 5s a 5 60 0 150 5 60 0 400 5
max a 43 80 1 200 5 80 2 500 5
a doubles 2 100 3 250 6 100 3 600 5
autres 10 120 0 300 5 120 3 700 1
total aas 98 140 0 350 4 140 1 800 1
sans opérons 6 160 0 400 4 160 1 900 1
1 aa 5 180 0 450 0 180 1 1000 0
max a 4 200 0 500 2 200 1 1100 0
a doubles 0 0 4 7 1
total aas 9 3 87 48 22 44
total aas 108
remarques 7
avec jaune moyenne 14 13 256 155 330
variance 16 252 109 234
sans jaune moyenne 10 182 208
variance 6 117 97

cdc8 blocs[modifier | modifier le wikicode]

  • Lien tableur: cdc8 blocs
  • Lien cdc blocs: le tabeau de cdc8 blocs est à comparer à celui de cdc pour les types.
C3. cdc8 blocs
Bloc type groupes intercal Bloc type groupes intercal Bloc type groupe intercal
cds 554 cds 150 cds 496
cds 0 aca 93 16s 321
cds 167 23s 184 23s° 100
23s° 132 III 16s 374 cds 111
IV2 5s 6 cds cds 228
aac 4 16s 321
**16aas 7 cds 452 23s° 101
atgj 114 5s 125 23s° 250
IV1 16s 0 23s 261 gca 52
cds 100 I2 16s 190 16s° 100
23s° 181 cds 23s° 217
5s 6 16s 179
aac 6 cds 118 cds 386
**41aas 12 5s 126 IV3 16s 321
gta 75 23s 321 23s 181
cds 308 I3 16s 292 5s 6
cds cds aac 6
**17aas 8
cds 281 cds 179 aaa 353
16s° 100 16s 161 5s 126
23s° 126 5s 201 23s' 582
X1 5s 7 I1 23s 217 I4 16s 217
aac 6 16s 108 23s 126
**7aas 9 atgi 11 5s 216
aga 954 tta 5 cds 372
cds 5s 201 cds 21
23s 375 cds 778
cds 733 VII1 gca 52 IV4 16s 261
cds 1 16s’ 100 23s 201
23s° 126 16s’ 52 5s 5
5s 177 gca 248 tta 11
cds 23s° 100 atgi 108
16s° 321 16s 184
cds 238 23s' 100 23s° 100
II 16s 320 16s° 320 cds 112
23s 91 23s° 100 23s’ 375
gga 8 23s’ 126 gca 52
5s 273 5s 127 16s° 282
cds cds cds

cdc8 cdc psor 43[modifier | modifier le wikicode]

C3. Comparaison cdc8-cdc-psor 43
C31. Comparaison cdc8-cdc 43
cdc8 43aas cdc 43aas
gene intercal gene intercal diff
16s 1
cds 100 16s 279
23s° 181 23s 180 -1
5s 6 5s 6 0
aac 6 aac 6 0
tta 15 tta 15 0
atgf 7 atgf 7 0
gaa 9 gaa 9 0
gga 5 gga 5 0
gta 5 gta 5 0
gac 9 gac 9 0
aca 14 aca 14 0
tac 10 tac 8 -2
cta 28 cta 29 1
aga 7 aga 7 0
caa 89 caa 88 -1
tca 3 tca 3 0
ttc 6 ttc 6 0
atgj 11 atgj 11 0
atgi 29 atgi 23 -6
cca 7 cca 7 0
cac 8 cac 8 0
aaa 7 aaa 7 0
tgc 6 tgc 6 0
aac 6 aac 5 -1
tta 15 tta 15 0
atgf 7 atgf 7 0
gaa 9 gaa 9 0
gga 5 gga 5 0
gta 5 gta 5 0
gac 9 gac 9 0
aca 14 aca 14 0
tac 9 tac 9 0
cta 24 cta 23 -1
ggc 24 ggc 24 0
aga 9 aga 9 0
caa 8 caa 8 0
aaa 2 aaa 2 0
tca 3 tca 3 0
ttc 6 ttc 6 0
atgj 11 atgj 11 0
atgi 17 atgi 17 0
cac 8 cac 8 0
aaa 7 aaa 7 0
tgc 7 tgc 7 0
cgt 12 cgt 12 0
gta 75 gta 75 0
cds cds
C32. Comparaison cdc8-psor 43
cdc8 43aas psor 44aas
gene intercal gene intercal diff
16s 1
cds 100 16s 196
23s° 181 23s 122
5s 6 5s 5
aac 6 tta 13 -2
tta 15 atg 15 8
atgf 7 gaa 9 0
gaa 9 gga 6 1
gga 5 gta 5 0
gta 5 gac 16
gac 9 aac 4
aca 14 aca 4 -10
tac 10 tac 15 5
cta 28 cta 14 -14
aga 7 aga 7 0
caa 89 caa 11
tca 3 aaa 6
ttc 6 tca 3 0
atgj 11 ttc 9 3
atgi 29 atg 8 -3
cca 7 atg 21 -8
cac 8 cca 6 -1
aaa 7 cac 4
tgc 6 tgc 25
aac 6 tta 13 -2
tta 15 atg 15 8
atgf 7 gaa 9 0
gaa 9 gga 6 1
gga 5 gta 5 0
gta 5 gac 16
gac 9 aac 4
aca 14 aca 4 -10
tac 9 tac 15 6
cta 24 cta 11 -13
ggc 24 ggc 13 -11
aga 9 aga 7 -2
caa 8 caa 11 3
aaa 2 aaa 6 4
tca 3 tca 3 0
ttc 6 ttc 9 3
atgj 11 atg 8 -3
atgi 17 atg 21
cac 8 cca 6
aaa 7 cac 9 1
tgc 7 aaa 21 14
cgt 12 tgc 6 -1
gta 75 cgt 10 -2
cds gta 162
cds

cdc8 cdc psor 18[modifier | modifier le wikicode]

C3. Comparaison cdc8-cdc-psor 18
C33. Comparaison cdc8-cdc-psor 18
cdc8 18aas cdc 18aas
gene intercal gene intercal diff
cds 214
cds 554
cds 0
cds 167 16s 279
23s° 132 23s 131 -1
5s 6 5s 6 0
aac 4 aac 4 0
gaa 5 gaa 5 0
gta 5 gta 5 0
gac 11 gac 10 -1
aca 14 aca 14 0
tac 9 tac 9 0
gga 10 gga 10 0
aga 9 aga 9 0
caa 11 caa 11 0
aaa 2 aaa 2 0
tca 18 tca 17 -1
agc 8 agc 8 0
cca 85 cca 85 0
tgg 60 tgg 60 0
cca 5 cca 6 1
atc 3 atc 3 0
ttc 7 ttc 7 0
atgj 114 atgj 114 0
cdc8 18aas psor 23aas
gène intercal gène intercal diff
16s 196
23s 213
cds 214 5s 5
cds 554 tta 13
cds 0 atg 15
cds 167 gaa 9
23s° 132 gga 6
5s 6 gta 5 0
aac 4 gac 16
gaa 5 aac 31
gta 5 aac 4
gac 11 aca 4 -10
aca 14 tac 11 2
tac 9 gga 19 9
gga 10 aga 6 -3
aga 9 caa 12 1
caa 11 aaa 6 4
aaa 2 tca 11 -7
tca 18 agc 6 -2
agc 8 cca 6
cca 85 atg 11
tgg 60 tgg 31 -29
cca 5 cca 6 1
atc 3 atc 6 3
ttc 7 ttc 13 6
atgj 114 atg 138 24
C34. Comparaison cdc8-cdc-psor 19
cdc8 19aas psor 23aas
gene intercal gene intercal diff
16s 321 16s 196
23s 181 23s 213
5s 6 5s 5
aac 6 tta 13 -2
tta 15 atg 15 8
atgf 7 gaa 9 0
gaa 9 gga 6 1
gga 5 gta 5 0
gta 5 gac 16
gac 9 aac 31
aca 14 aac 4
tac 10 aca 4 -10
cta 28 tac 11
aga 7 gga 19
caa 89 aga 6 -1
tca 3 caa 12
ttc 6 aaa 6
atgj 11 tca 11
atgi 29 agc 6
cca 7 cca 6
cac 8 atg 11
aaa 353 tgg 31
cca 6
atc 6
ttc 13
atg 138
cdc8 19aas cdc8 18aas
gène intercal gène intercal diff
cds 214
cds 554
cds 0
16s 321 cds 167
23s 181 23s° 132
5s 6 5s 6
aac 6 aac 4
tta 15 gaa 5
atgf 7 gta 5 0
gaa 9 gac 11 2
gga 5 aca 14 0
gta 5 tac 9
gac 9 gga 10
aca 14 aga 9 2
tac 10 caa 11
cta 28 aaa 2
aga 7 tca 18
caa 89 agc 8
tca 3 cca 85
ttc 6 tgg 60
atgj 11 cca 5
atgi 29 atc 3
cca 7 ttc 7
cac 8 atgj 114
aaa 353

cdc8 cdc psor 9[modifier | modifier le wikicode]

C3. Comparaison cdc8-cdc-psor 9
C35. Comparaison cdc8-cdc-psor 9
cdc8 18aas cdc8 9aas
gene intercal gene intercal diff
cds 214
cds 554
cds 0 cds 281
cds 167 16s° 100
23s° 132 23s° 126
5s 6 5s 7
aac 4 aac 6
gaa 5 tta 15
gta 5 atgf 7
gac 11 gaa 8
aca 14 gga 4
tac 9 gta 5 0
gga 10 gac 10
aga 9 ggc 9
caa 11 aga 954
aaa 2 cds
tca 18
agc 8
cca 85
tgg 60
cca 5
atc 3
ttc 7
atgj 114
cdc8 19aas cdc8 9aas
gene intercal gene intercal diff
cds 281
16s 321 16s° 100
23s 181 23s° 126
5s 6 5s 7
aac 6 aac 6 0
tta 15 tta 15 9
atgf 7 atgf 7 -8
gaa 9 gaa 8 1
gga 5 gga 4 -5
gta 5 gta 5 0
gac 9 gac 10
aca 14 ggc 9
tac 10 aga 954
cta 28 cds
aga 7
caa 89
tca 3
ttc 6
atgj 11
atgi 29
cca 7
cac 8
aaa 353
C36. Comparaison cdc8-cdc-psor groupe
cdc8 9aas cdc 9aas
gene intercal gene intercal diff
cds 281 16s 52
16s° 100 gca 373
23s° 126 23s 126
5s 7 5s 7
aac 6 aac 5 -1
tta 15 tta 15 0
atgf 7 atgf 7 0
gaa 8 gaa 14 6
gga 4 gga 5 1
gta 5 gta 5 0
gac 10 gac 10 0
ggc 9 ggc 9 0
aga 954 aga 975 21
cds cds
cdc8 I4 cdc VIII1
gene intercal gene intercal diff
16s 68
16s 217 gca 271
23s 126 23s 126 0
5s 216 5s 213 -3
cds 372 cds 372 0
cds 21 cds 21 0
cds 778 cds 776 -2
16s 261 16s 52
23s 201 gca 373
5s 5 23s 126 -75
5s 7 2
psor VII1 cdc8 VII1
gene intercal gene intercal diff
CDS 431 cds 179
16s 54 16s 161
gca 114 5s 201
23s 193 23s 217
5s 5 16s 108
tta 9 atgi 11 2
atg 123 tta 5 0
16s 54 5s 201 8
gca 114 23s 375 261
23s 193 gca 52 -2
5s 5 16s’ 100 -23
tta 9 16s’ 52
atg 123 gca 248
16s 54 23s° 100 -2
gca 114 16s° 321 134
23s 78 23s' 100
5s 100 16s° 320
CDS 23s° 100
23s’ 126
5s 127
cds

cdc8 cdc protéines[modifier | modifier le wikicode]

Alignement sur cdc[modifier | modifier le wikicode]

C3. cdc-cdc8, alignement des protéines sur cdc
C37. cdc protéines
ordre sens adresse gene intercal pbs abrégé
0 dir 9857..10630 cds 179 774 SigB
dir 10810..12317 16s 52 1508
dir 12370..12445 gca 249 76
1 dir 12695..15596 23s 111 2902
dir 15708..15824 5s 126 117
dir 15951..16460 cds 11 510 NadR
dir 16472..17353 cds 457 882 mecano
dir 17811..19082 cds 319 1272 K-ligase1
dir 19402..19857 cds 0 456 Nuc-de
dir 19858..19949 tcc 37 92
2 dir 19987..20251 ncRNA 76 265
dir 20328..21965 cds 1638 III-tau
comp 23419..24624 cds 505 1206 Glyco-tr
dir 25130..26637 16s 279 1508
dir 26917..29816 23s 180 2900
dir 29997..30113 5s 6 117
3 dir 30120..30194 aac 6 75
dir **41aas 12
dir 33877..33952 gta 75 76
dir 34028..34441 cds 308 414 hp-414
dir 34750..38181 cds 3432 pyruvate
dir 127011..127715 cds 281 705 CwlD
dir 127997..129505 16s 279 1509
dir 129785..132685 23s 131 2901
dir 132817..132933 5s 6 117
4 dir 132940..133014 aac 4 75
dir **16aas 8
dir 134534..134610 atgj 114 77
dir 134725..136115 16s 68 1391
dir 136184..136259 gca 271 76
dir 136531..139430 23s 126 2900
dir 139557..139673 5s 213 117
comp 139887..141071 cds 372 1185 B6
5 dir 141444..143795 cds 21 2352 Art-red
dir 143817..144356 cds 776 540 Art-reda
dir 145133..146640 16s 52 1508
dir 146693..146768 gca 373 76
dir 147142..150041 23s 126 2900
dir 150168..150284 5s 7 117
6 dir 150292..150366 aac 5 75
dir **7aas 6
dir 150976..151049 aga 975 74
dir 152025..152864 cds 840 TIGR
dir 378341..380728 cds 583 2388 cad
dir 381312..382819 16s 311 1508
dir 383131..386030 23s 126 2900
7 dir 386157..386273 5s 177 117
dir 386451..387059 cds 609 DedA
comp 833130..833894 cds 258 765 DeoR
8 dir 834153..834243 agc 87 91
dir 834331..835119 cds 789 flagellar
dir 1089165..1090139 cds 239 975 Mannosyl
dir 1090379..1091886 16s 320 1508
dir 1092207..1095106 23s 91 2900
dir 1095198..1095271 gga 8 74
9 dir 1095280..1095396 5s 273 117
dir 1095670..1097688 cds 2019 Ala amid
comp 1181549..1182958 cds 1374 1410 MBOAT
10 comp 1184333..1184415 ttg 318 83
dir 1184734..1187382 cds 2649 PolyI
dir 1835768..1837498 cds 109 1731 NhaC
11 dir 1837608..1837688 cta 231 81
<dir 1837920..1838093 cds 174 HXXEE
dir 2981767..2982444 cds 159 678 SrtB
comp 2982604..2982678 aca 94 75
comp 2982773..2985672 23s 184 2900
12 comp 2985857..2987364 16s 340 1508
dir 2987705..2988643 cds 939 lactam
comp 3787361..3788431 cds 454 1071 ABC
comp 3788886..3789002 5s 126 117
13 comp 3789129..3792028 23s 281 2900
comp 3792310..3793817 16s 191 1508
comp 3794009..3794587 cds 579 precorrin
comp 3944262..3944453 cds 119 192 DUF378
comp 3944573..3944689 5s 126 117
14 comp 3944816..3947715 23s 217 2900
comp 3947933..3949440 16s 282 1508
comp 3949723..3950004 cds 221 282 hp-282
comp 3950226..3951755 cds 1530 K-ligase
dir 4084445..4085437 cds 382 993 DnaC
comp 4085820..4085894 aca 33 75
15 comp 4085928..4086003 gta 4 76
comp 4086008..4086082 gaa 6 75
comp 4086089..4086164 aaa 326 76
comp 4086491..4087780 cds 1290 succinate
C38. cdc8 protéines
sens adresse gene intercal pbs abrégé
dir 4194196..4196423 23s’ 100 2228
dir 4196524..4197091 16s° 320 568
dir 4197412..4199044 23s° 100 1633
dir 4199145..4201593 23s’ 126 2449
dir 4201720..4201836 5s 127 117
dir 4201964..4202473 cds 11 510 NadR
dir 4202485..4203366 cds 458 882 mecano
dir 4203825..4205096 cds 320 1272 K-ligase1
dir 4205417..4205872 cds 0 456 Nuc-de
dir 4205873..4205964 tcc 37 92
dir 4206002..4206266 ncRNA 76 265
dir 4206343..4207980 cds 1638 III-tau
dir 4306341..4307538 16s 0 1198
dir 4307539..4308225 cds 100 687 xylose
dir 1..796 23s° 181 796
dir 978..1094 5s 6 117
dir 1101..1175 aac 6 75
dir **41aas 12
dir 4868..4943 gta 75 76
dir 5019..5432 cds 308 414 hp-414
dir 5741..9172 cds 3432 pyruvate
dir 4300349..4300807 cds 554 459 Helix
dir 4301362..4303101 cds 0 1740 hp-1740
dir 4303102..4303305 cds 167 204 hp-204
dir 4303473..4304299 23s° 132 827
dir 4304432..4304548 5s 6 117
dir 4304555..4304629 aac 4 75
dir **16aas 8
dir 4306150..4306226 atgj 114 77
dir 4232593..4234098 16s 217 1506
dir 4234316..4237215 23s 126 2900
dir 4237342..4237458 5s 216 117
comp 4237675..4238859 cds 372 1185 B6
dir 4239232..4241583 cds 21 2352 Art-red
dir 4241605..4242144 cds 778 540 Art-reda
dir 94032..94736 cds 281 705 CwlD
dir 95018..95994 16s° 100 977
dir 96095..97613 23s° 126 1519
dir 97740..97856 5s 7 117
dir 97864..97938 aac 6 75
dir **7aas 6
dir 98542..98615 aga 954 74
dir 99570..100409 cds 840 TIGR
dir 306829..309216 cds 733 2388 cad
<>comp 309950..310076 cds 1 127 seleno
dir 310078..311313 23s° 126 1236
dir 311440..311556 5s 177 117
dir 311734..312342 cds 609 DedA
comp 861856..862620 cds 258 765 DeoR
dir 862879..862969 agc 87 91
dir 863057..863845 cds 789 flagellar
dir 1106477..1107451 cds 238 975 Mannosyl
dir 1107690..1109197 16s 320 1508
dir 1109518..1112416 23s 91 2899
dir 1112508..1112581 gga 8 74
dir 1112590..1112706 5s 273 117
dir 1112980..1114998 cds 2019 Ala amid
comp 1196804..1198213 cds 1378 1410 MBOAT
comp 1199592..1199674 ttg 318 83
dir 1199993..1202641 cds 2649 PolyI
dir 1850896..1852626 cds 109 1731 NhaC
dir 1852736..1852816 cta 334 81
dir 1853151..1853666 cds 516 HXXEE
dir 3024038..3024715 cds 150 678 SrtB
comp 3024866..3024940 aca 93 75
comp 3025034..3027933 23s 184 2900
comp 3028118..3029625 16s 374 1508
dir 3030000..3030938 cds 939 lactam
comp 3875816..3876886 cds 452 1071 ABC
comp 3877339..3877455 5s 125 117
comp 3877581..3880480 23s 261 2900
comp 3880742..3882249 16s 190 1508
comp 3882440..3883018 cds 579 precorrin
comp 4017523..4017714 cds 118 192 DUF378
comp 4017833..4017949 5s 126 117
comp 4018076..4020975 23s 321 2900
comp 4021297..4022804 16s 292 1508
comp 4023097..4023378 cds 221 282 hp-282
comp 4023600..4025129 cds 1530 K-ligase
dir 4135881..4136873 cds 383 993 DnaC
comp 4137257..4137331 aca 33 75
comp 4137365..4137440 gta 4 76
comp 4137445..4137519 gaa 6 75
comp 4137526..4137601 aaa 331 76
comp 4137933..4139222 cds 1290 succinate

Alignement sur cdc8[modifier | modifier le wikicode]

C3. cdc-cdc8, alignement des protéines sur cdc8
C40. cdc8 début
cdc8
ordre cdc sens adresse gène intercal pbs abrégé
insert dir 4299490..4300134 cds 214 645 Y-r1
insert dir 4300349..4300807 cds 554 459 Helix
dir 4301362..4303101 cds 0 1740 hp-1740
dir 4303102..4303305 cds 167 204 hp-204
dir 4303473..4304299 23s° 132 827
4 dir 4304432..4304548 5s 6 117
dir 4304555..4304629 aac 4 75
dir 4304634..4304708 gaa 5 75
dir 4304555..4304629 aac 4 75
dir **16aas 8
dir 4306150..4306226 atgj 114 77
dir 4306341..4307538 16s 0 1198
dir 4307539..4308225 cds 100 687 xylose
dir 1..796 23s° 181 796
3 dir 978..1094 5s 6 117
dir 1101..1175 aac 6 75
dir **41aas 12
dir 4868..4943 gta 75 76
dir 5019..5432 cds 308 414 hp-414
dir 5741..9172 cds 3432 pyruvate
dir 94032..94736 cds 281 705 CwlD
dir 95018..95994 16s° 100 977
dir 96095..97613 23s° 126 1519
6 dir 97740..97856 5s 7 117
dir 97864..97938 aac 6 75
dir **7aas 6
dir 98542..98615 aga 954 74
dir 99570..100409 cds 840 TIGR
<> cp 309950..310076 cds 1 127 seleno
dir 310078..311313 23s° 126 1236
7 dir 311440..311556 5s 177 117
dir 311734..312342 cds 609 DedA
comp 861856..862620 cds 258 765 DeoR
8 dir 862879..862969 agc 87 91
dir 863057..863845 cds 789 flagellar
dir 1106477..1107451 cds 238 975 Mannosyl
dir 1107690..1109197 16s 320 1508
dir 1109518..1112416 23s 91 2899
dir 1112508..1112581 gga 8 74
9 dir 1112590..1112706 5s 273 117
dir 1112980..1114998 cds 2019 Ala amid
comp 1196804..1198213 cds 1378 1410 MBOAT
10 comp 1199592..1199674 ttg 318 83
dir 1199993..1202641 cds 2649 PolyI
dir 1850896..1852626 cds 109 1731 NhaC
11 dir 1852736..1852816 cta 334 81
dir 1853151..1853666 cds 516 HXXEE
dir 3024038..3024715 cds 150 678 SrtB
comp 3024866..3024940 aca 93 75
12 comp 3025034..3027933 23s 184 2900
comp 3028118..3029625 16s 374 1508
dir 3030000..3030938 cds 939 lactam
insert dir 3805298..3806743 cds 208 1446 Y-r2
insert comp 3806952..3807028 agg 61 77
insert <comp 3807090..3808790 cds 1701 fdHa
comp 3875816..3876886 cds 452 1071 ABC
comp 3877339..3877455 5s 125 117
13 comp 3877581..3880480 23s 261 2900
comp 3880742..3882249 16s 190 1508
comp 3882440..3883018 cds 579 precorrin
comp 4017523..4017714 cds 118 192 DUF378
comp 4017833..4017949 5s 126 117
14 comp 4018076..4020975 23s 321 2900
comp 4021297..4022804 16s 292 1508
comp 4023097..4023378 cds 221 282 hp-282
comp 4023600..4025129 cds 1530 K-ligase
dir 4135881..4136873 cds 383 993 DnaC
comp 4137257..4137331 aca 33 75
15 comp 4137365..4137440 gta 4 76
comp 4137445..4137519 gaa 6 75
comp 4137526..4137601 aaa 331 76
comp 4137933..4139222 cds 1290 succinate
C40. cdc8 suite
cdc8 psor
ordre cdc sens adresse gène intercal pbs abrégé adresse gène intercal pbs abrégé 
0 dir 4178197..4178970 cds 179 774 SigB 127845..129260 CDS 100 1416 R-deca
insert dir 4179150..4180587 16s 161 1438 127628..127744 5s 78
insert comp 4180749..4180865 5s 201 117 124628..127549 23s 114
insert comp 4181067..4183959 23s 217 2893 124438..124513 gca 54
insert comp 4184177..4185684 16s 108 1508 122877..124383 16s 123
insert comp 4185793..4185869 atgi 11 77 122677..122753 atg 9
insert comp 4185881..4185969 tta 5 89 122579..122667 tta 5
insert comp 4185975..4186091 5s 201 117 122457..122573 5s 193
insert comp 4186293..4189192 23s 375 2900 119347..122263 23s 114
insert comp 4189568..4189643 gca 52 76 119157..119232 gca 54
insert comp 4189696..4190959 16s’ 100 1264 117596..119102 16s 123
insert dir 4191060..4192225 16s’ 52 1166 117396..117472 atg 9
insert dir 4192278..4192353 gca 248 76 117298..117386 tta 5
insert dir 4192602..4193197 23s° 100 596 117176..117292 5s 193
insert dir 4193298..4193874 16s° 321 577 114067..116982 23s 114
insert dir 4194196..4196423 23s’ 100 2228 113877..113952 gca 54
dir 4196524..4197091 16s° 320 568 112316..113822 16s 431
1 dir 4197412..4199044 23s° 100 1633 111345..111884 CDS 540 Art-reda
dir 4199145..4201593 23s’ 126 2449
dir 4201720..4201836 5s 127 117
dir 4201964..4202473 cds 11 510 NadR
dir 4202485..4203366 cds 458 882 mecano
dir 4203825..4205096 cds 320 1272 K-ligase1
dir 4205417..4205872 cds 0 456 Nuc-de
dir 4205873..4205964 tcc 37 92
2 dir 4206002..4206266 ncRNA 76 265
dir 4206343..4207980 cds 1638 III-tau
insert comp 4209435..4210639 cds 496 1205 Glyco-tr
insert 4211136..4212643 16s 321 1508
insert 4212965..4213127 23s° 100 163
insert <>comp 4213228..4213849 cds 622 CHAP
insert comp 4213961..4214620 cds 228 660 A-1chlor
insert dir 4214849..4216199 16s 321 1351
insert dir 4216521..4217008 23s° 101 488
insert comp 4217110..4218529 23s° 250 1420
insert comp 4218780..4218855 gca 52 76
insert comp 4218908..4219471 16s° 100 564
insert comp 4219572..4219856 23s° 217 285
insert comp 4220074..4221581 16s 179 1508
insert >comp 4221761..4222206 cds 386 446 SigB2 3452349..3452552 CDS 239 204 hp-204
insert dir 4222593..4224100 16s 321 1508 3450603..3452109 16s 196
insert dir 4224422..4227321 23s 181 2900 3447492..3450406 23s 213
insert dir 4227503..4227619 5s 6 117 3447162..3447278 5s 5
insert dir 4227626..4227700 aac 6 75 3447068..3447156 tta 13
insert dir 4227707..4227792 tta 15 86 3446979..3447054 atg 15
insert dir 4227808..4227883 atgf 7 76 3446889..3446963 gaa 9
insert dir 4227891..4227965 gaa 9 75 3446806..3446879 gga 6
insert dir 4227975..4228048 gga 5 74 3446724..3446799 gta 5
insert dir 4228054..4228129 gta 5 76 3446642..3446718 gac 16
insert dir 4228135..4228211 gac 9 77 3446550..3446625 aac 31
insert dir 4228221..4228295 aca 14 75 3446443..3446518 aac 4
insert dir 4228310..4228394 tac 10 85 3446364..3446438 aca 4
insert dir 4228405..4228488 cta 28 84 3446275..3446359 tac 11
insert dir 4228517..4228593 aga 7 77 3446190..3446263 gga 19
insert dir 4228601..4228676 caa 89 76 3446094..3446170 aga 6
insert dir 4228766..4228854 tca 3 89 3446012..3446087 caa 12
insert dir 4228858..4228933 ttc 6 76 3445924..3445999 aaa 6
insert dir 4228940..4229016 atgj 11 77 3445829..3445917 tca 11
insert dir 4229028..4229104 atgi 29 77 3445727..3445817 agc 6
insert dir 4229134..4229210 cca 7 77 3445644..3445720 cca 6
insert dir 4229218..4229294 cac 8 77 3445561..3445637 atg 11
insert dir 4229303..4229378 aaa 353 76 3445474..3445549 tgg 31
insert comp 4229732..4229848 5s 126 117 3445366..3445442 cca 6
insert comp 4229975..4232010 23s’ 582 2036 3445283..3445359 atc 6
dir 4232593..4234098 16s 217 1506 3445201..3445276 ttc 13
dir 4234316..4237215 23s 126 2900 3445111..3445187 atg
dir 4237342..4237458 5s 216 117
comp 4237675..4238859 cds 372 1185 B6
5 dir 4239232..4241583 cds 21 2352 Art-red
dir 4241605..4242144 cds 778 540 Art-reda
insert dir 4242923..4244459 16s 261 1537
insert dir 4244721..4247619 23s 201 2899
insert dir 4247821..4247937 5s 5 117 111345..111884 CDS 431 540 Art-reda
insert dir 4247943..4248031 tta 11 89 112316..113822 16s 54
insert dir 4248043..4248119 atgi 108 77 113877..113952 gca 114
insert dir 4248228..4249735 16s 184 1508 114067..116982 23s 193
insert dir 4249920..4250564 23s° 100 645 117176..117292 5s 5
insert <dir 4250665..4250923 cds 112 259 hp-259 117298..117386 tta 9
insert comp 4251036..4253145 23s’ 375 2110 117396..117472 atg 123
insert comp 4253521..4253596 gca 52 76 117596..119102 16s 54
insert comp 4253649..4254226 16s° 282 578 119157..119232 gca 114
insert dir 4254509..4254712 cds 12 204 hp-204 119347..122263 23s 193
insert dir 4254725..4256002 cds 1278 phagePP 122457..122573 5s 5
122579..122667 tta 9
début début début début début début début 122677..122753 atg 123
insert dir 4299490..4300134 cds 214 645 Y-r1 122877..124383 16s 54
insert dir 4300349..4300807 cds 554 459 Helix 124438..124513 gca 114
dir 4301362..4303101 cds 0 1740 hp-1740 124628..127549 23s 78
dir 4303102..4303305 cds 167 204 hp-204 127628..127744 5s 100
4 dir 4303473..4304299 23s° 132 827 127845..129260 CDS 1416 R-deca

cdc8 cdc abrégé protéines[modifier | modifier le wikicode]

  • Lien tableur: cdc8 cdc abrégé protéines
  • Légende: R-deca
    - Helix: spécifique cdc8
    - R-deca: spécifique psor
    - SigB: délocalisé dans cdc8
C3. C39 abrégé des protéines
abrégé nom protéine
A-1chlor type A-1 chloramphenicol O-acetyltransferase
ABC ABC transporter ATP-binding protein
Ala amid N-acetylmuramoyl-L-alanine amidase
Art-red anaerobic ribonucleoside triphosphate reductase
Art-reda anaerobic ribonucleoside-triphosphate reductase activating protein
B6 pyridoxal phosphate-dependent aminotransferase
cad cadmium-translocating P-type ATPase
CHAP CHAP domain-containing protein
CwlD N-acetylmuramoyl-L-alanine amidase CwlD
DedA DedA family protein
DeoR DeoR/GlpR transcriptional regulator
DnaC DNA replication protein DnaC
DUF378 DUF378 domain-containing protein
fdHa formate dehydrogenase subunit alpha
flagellar flagellar motor protein
Glyco-tr glycosyl transferase
Helix helix-turn-helix domain-containing protein
hp-1740 hp-1740
hp-204 hp-204
hp-282 hp-282
hp-414 hp-414
HXXEE HXXEE domain-containing protein
III-tau DNA polymerase III subunit gamma/tau
K-ligase lysine--tRNA ligase
K-ligase1 serine--tRNA ligase
lactam delta-lactam-biosynthetic de-N-acetylase
Mannosyl Mannosyl-glycoprotein endo-beta-N-acetylglucosamidase
MBOAT MBOAT family protein
mecano mechanosensitive ion channel
NadR transcription repressor NadR
NhaC Na+/H+ antiporter NhaC family protein
Nuc-de nucleoside deaminase
phagePP phage portal protein
PolyI DNA polymerase I
precorrin bifunctional precorrin-2 dehydrogenase/sirohydrochlorin ferrochelatase
pyruvate pyruvate carboxylase
R-deca arginine decarboxylase
seleno glycine/sarcosine/betaine reductase complex selenoprotein A
SigB SigB/SigF/SigG family RNA polymerase sigma factor
SigB2 B/F/G family RNA polymerase sigma-70 factor
SrtB sortase SrtB
succinate adenylosuccinate synthase
TIGR TIGR00159 family protein
xylose xylose isomerase
Y-r1 tyrosine-type recombinase/integrase – 1
Y-r2 tyrosine-type recombinase/integrase – 2

cdc8 remarques[modifier | modifier le wikicode]

  • Lien noms abrégés
  • Liens pour ce chapitre:  noms abrégésopéronscumulsblocscdc8 cdc psor 43cdc8 cdc psor 18cdc8 cdc psor 9Alignement sur cdcAlignement sur cdc8.
  • Remarques des 7 @:
    1. @ Dans la comparaison cdc8-cdc du bloc à 18aas, les rRNAs 23s et 16s disparaissent. Les 4 cds récupérés et le 23s°
      - correspondraient à la somme des longueurs de 16s (1500 pbs) et 23s (2900 pbs), soit 4400 pbs
      - correspondraient à la longueur totale entre le 1er cds et le 5s, 4304299-4299490 = 4810 pbs
      - la somme des 4 cds récupérés et du 23s° est de 3875 pbs. Les longueurs des cds en aas sont dans l'ordre 215 153 580 68.
      - Le plus intéressant c'est que, si on suppose que les protéines hypothétiques 580 et 68 sont dues aux remaniements,
      - g
    2. @ configuration de bloc peu courante, avec gga: même bloc que cdc et psor.
    3. @ configuration de bloc peu courante, avec aca, et perte de 5s: même bloc que cdc et psor sans 5s.
    4. @ On retrouve le groupe1 de psor, avec 12 gca: VII1 en comp suivi de VIII1 en dir
      - L’intercalaire 23s-gca de VII1 est de 375, beaucoup plus élevé que celui de psor , 114.
      - De même pour VIII1, 248 contre 114.
    5. @ Conservation du bloc tcc-ncRNA dans cdc8 cdc et psor, avec les mêmes intercalaires.
    6. @ Conservation des 3 cds , avec leurs intercalaires, du seul groupe de cdc, mais les gca disparaissent.
    7. @ Nouveau bloc analogue au VI1 et VII1 de psor, sans gca, et qui n’existe pas chez cdc: 16s23s5s-tta-atgi.