Recherche:Les clusters de gènes tRNA et rRNA chez les procaryotes/Annexe/clostridia

Une page de Wikiversité.
Aller à la navigation Aller à la recherche
clostridia
Image logo représentative de la faculté
Annexe 4
Recherche : Les clusters de gènes tRNA et rRNA chez les procaryotes
Précédent :bacilli
Suivant :actino
Icon falscher Titel.svg
En raison de limitations techniques, la typographie souhaitable du titre, « Annexe : clostridia
Les clusters de gènes tRNA et rRNA chez les procaryotes/Annexe/clostridia
», n'a pu être restituée correctement ci-dessus.



  • Annexe en préparation

Tanger le 3.11.19

Paeniclostridium sordellii AM370[modifier | modifier le wikicode]

psor opérons[modifier | modifier le wikicode]

  • Liens: gtRNAdb, NCBI [1], génome [2]
  • Lien tableur: psor opérons
  • Phylogénie: Bacteria; Firmicutes; Clostridia; Clostridiales;Peptostreptococcaceae; Paeniclostridium.
  • Légende: cdsa: cds aas, cdsj: cdsa sans jaune, cdsd: cdsa dirigé
    - @2, cds de 62 aas, hp, à allure répétitive susceptible d'être créé par contrainte lors des conversions ou d'autres réparations: MWLFFLFFFLFFFLFFFFFLFFFLFFFFFLFFFFFFPIVVLQTEINFRYGYIYTIHSGIIF
    - @4, riboswitch se trouve dans un bloc à rRNA. Concerne cette remarque aussi le RNA non codant, ncRNA, à l'adresse 19421..19685.
  • Note: il n'y apas de gtRNAdb. Aussi j'ai comparé (EXACT NB.CAR STXT) les 1ers atgf atgi atgj du génome cdc, avec les atg de psor.
C1 Paeniclostridium sordellii AM370
27.3%GC 8.8.19 Paris  112   doubles intercal cds aa avec aa cdsa cdsd
9847..10620 CDS 205 205 258
10826..12332 16s 196
12529..15445 23s 78
15524..15640 5s 85 85 85
15726..15947 CDS 74
18845..19297 CDS 3 3 151 3
19301..19393 tcc 27
19421..19685 ncRNA 152 152
19838..21478 CDS *547
24343..24570 CDS 309 309 76
24880..26386 16s 196
26583..29499 23s 122
29622..29738 5s 5 5
29744..29832 tta + 13 13
29846..29921 atgf 3 aaa 15 15
29937..30011 gaa 6 atg 9 9
30021..30094 gga 3 gta 6 6
30101..30176 gta 1 cgt 5 5
30182..30258 gac 1 ggc 16 16
30275..30350 aac 2 fois suite 4 4
30355..30429 aca aac aca aga 4 4
30434..30518 tac caa cac cca 15 15
30534..30617 cta cta gaa gac 14 14
30632..30708 aga gga tac tca 7 7
30716..30791 caa tgc tta ttc 11 11
30803..30878 aaa 6 6
30885..30973 tca 3 3
30977..31052 ttc 9 9
31062..31138 atgj 8 8
31147..31223 atgi 21 21
31245..31321 cca 6 6
31328..31404 cac 4 4
31409..31482 tgc 25 25
31508..31596 tta 13 13
31610..31685 atgf 15 15
31701..31775 gaa 9 9
31785..31858 gga 6 6
31865..31940 gta 5 5
31946..32022 gac 16 16
32039..32114 aac 4 4
32119..32193 aca 4 4
32198..32282 tac 15 15
32298..32381 cta 11 11
32393..32467 ggc 13 13
32481..32557 aga 7 7
32565..32640 caa 11 11
32652..32727 aaa 6 6
32734..32822 tca 3 3
32826..32901 ttc 9 9
32911..32987 atgj 8 8
32996..33072 atgi 21 21
33094..33170 cca 6 6
33177..33253 cac 9 9
33263..33338 aaa 21 21
33360..33433 tgc 6 6
33440..33516 cgt 10
33527..33602 gta 162 162 162
33765..34016 CDS 84
34042..34455 CDS 249 249 138
34705..36211 16s 196
36408..39324 23s 78
39403..39519 5s 402 *402
comp 39922..40113 CDS 348 348 64
40462..41968 16s 196
42165..45081 23s 78
45160..45276 5s 180 180 *180
45457..47394 CDS *646
101428..102144 CDS 276 276 239
102421..103927 16s 54
103982..104057 gca 114
104172..107096 23s 41
107138..107211 gga 11
107223..107339 5s 99 99 99
comp 107439..108617 CDS 393
111345..111884 CDS 431 *431 180
112316..113822 16s 54
113877..113952 gca 114
114067..116982 23s 193
117176..117292 5s 5
117298..117386 tta 9 9
117396..117472 atgi 123
117596..119102 16s 54
119157..119232 gca 114
119347..122263 23s 193
122457..122573 5s 5
122579..122667 tta 9 9
122677..122753 atgi 123
122877..124383 16s 54
124438..124513 gca 114
124628..127549 23s 78
127628..127744 5s 100 100 100
127845..129260 CDS 472
215388..216260 CDS 264 264 291
216525..218030 16s 123
218154..218229 gca 152
218382..221296 23s 50
221347..221420 gga 12
221433..221549 5s 109 109 109
221659..221940 CDS 525 *525 94
222466..223972 16s 196
224169..227083 23s 144
227228..227344 5s 228 228 *228
227573..227989 CDS 139
449964..450266 CDS 253 253 101
450520..452026 16s 196
452223..455139 23s 144
455284..455400 5s 112 112 112
comp 455513..456616 CDS 368
498418..499074 CDS 189 189 219
499264..500770 16s 118
500889..500964 gca 95
501060..503976 23s 144
504121..504237 5s 131 131 131
504369..504551 CDS 61
546886..550416 CDS 41 41 *1177 *41
comp 550458..550544 ttg 138 138
550683..553325 CDS *881
608009..608683 CDS 195 195 225
608879..608975 tga 37 37 37
comp 609013..609732 CDS 240
815939..816655 CDS 71 71 239 71
816727..816800 tgc 12 12
816813..816888 aac 3 3
816892..816966 aca 285 285
817252..818727 CDS 492
1284870..1288097 CDS 111 111 *1076 *111
1288209..1288297 cta 426 *426
1288724..1290853 CDS *710
1445161..1445664 CDS 135 135 168 135
1445800..1445868 other @1 258 258
1446127..1446813 CDS 229
2267513..2267698 CDS @2 306 306 62 *306
comp 2268005..2268088 cta 404 *404
2268493..2269758 CDS 422
3094098..3094784 CDS 40 40 229 40
comp 3094825..3094941 5s 78
comp 3095020..3097936 23s 194
comp 3098131..3099637 16s 276 276
comp 3099914..3101161 CDS 416
3159922..3160827 CDS 37 37 302 37
comp 3160865..3160956 agc 120 120
comp 3161077..3161376 CDS 100
comp 3274188..3274733 CDS 245 245 182 *245
comp 3274979..3275095 5s @3 12
comp 3275108..3275181 gga 107
comp 3275289..3278214 23s 137
comp 3278352..3279858 16s 253 253
comp 3280112..3280690 CDS 193
comp 3303104..3304150 CDS 124 124 349 124
comp 3304275..3304459 riboswitch @4 96
comp 3304556..3304672 5s 11
comp 3304684..3304758 aca 116
comp 3304875..3307789 23s 196
comp 3307986..3309492 16s 364 *364
3309857..3310504 CDS 216
comp 3438683..3439531 CDS 142 142 283 142
comp 3439674..3439750 aga 7 7
comp 3439758..3439832 ggc 9 9
comp 3439842..3439918 gac 5 5
comp 3439924..3439999 gta 8 8
comp 3440008..3440082 gaa 5
comp 3440088..3440204 5s 40
comp 3440245..3443168 23s 112
comp 3443281..3443356 gca 109
comp 3443466..3444972 16s 138
comp 3445111..3445187 atgj + 13 13
comp 3445201..3445276 ttc 3 atg 6 6
comp 3445283..3445359 atc 2 cca 6 6
comp 3445366..3445442 cca 2 gga 31 31
comp 3445474..3445549 tgg 2 aac 11 11
comp 3445561..3445637 atgi 6 6
comp 3445644..3445720 cca 6 6
comp 3445727..3445817 agc 11 11
comp 3445829..3445917 tca 6 6
comp 3445924..3445999 aaa 12 12
comp 3446012..3446087 caa 6 6
comp 3446094..3446170 aga 19 19
comp 3446190..3446263 gga 11 11
comp 3446275..3446359 tac 4 4
comp 3446364..3446438 aca 4 4
comp 3446443..3446518 aac 31 31
comp 3446550..3446625 aac 16 16
comp 3446642..3446718 gac 5 5
comp 3446724..3446799 gta 6 6
comp 3446806..3446879 gga 9 9
comp 3446889..3446963 gaa 15 15
comp 3446979..3447054 atgf 13 13
comp 3447068..3447156 tta 5
comp 3447162..3447278 5s 213
comp 3447492..3450406 23s 196
comp 3450603..3452109 16s 239 239
comp 3452349..3452552 CDS 68
comp 3523330..3524046 CDS 129 129 239 129
comp 3524176..3524251 gta + 8 8
comp 3524260..3524334 gaa 2 fois 20 20
comp 3524355..3524430 aaa gta gaa aaa 10 10
comp 3524441..3524515 aca 10 10
comp 3524526..3524602 gac 7 7
comp 3524610..3524685 gta 9 9
comp 3524695..3524769 gaa 5 5
comp 3524775..3524850 aaa 289 289
3525140..3526039 CDS 300

psor cumuls[modifier | modifier le wikicode]

cumuls. Paeniclostridium sordellii AM370
opérons Fréquences intercalaires tRNAs Fréquences intercalaires cds Fréquences aas cds
effectif gammes sans rRNAs avec rRNAs gammes cds gammes cdsd gammes cdsa
avec rRNA opérons 17 1 0 0 1 0 1 0 100 9
16 23 5s 0 6 20 9 65 50 5 20 1 200 8
16 atc gca 0 40 0 6 100 4 40 3 300 13
16 23 5s a 2 60 0 0 150 10 60 1 400 4
max a 44 80 0 0 200 5 80 1 500 4
a doubles 2 100 0 0 250 5 100 3 600 1
autres 9 120 0 0 300 8 120 3 700 1
total aas 87 140 0 0 350 3 140 4 800 1
sans opérons 8 160 0 0 400 1 160 1 900 1
1 aa 6 180 0 0 450 4 180 2 1000 0
max a 8 200 0 0 500 0 200 0 1100 1
a doubles 1 0 0 1 3 1
total aas 17 9 71 46 22 44
total aas 104
remarques 4
avec jaune moyenne 9 10 206 119 304
variance 5 6 121 73 257
sans jaune moyenne 173 95 220
variance 90 45 121

psor blocs[modifier | modifier le wikicode]

  • Lien tableur: psor blocs
  • Lien cdc blocs: le tabeau de cdc blocs est à comparer à celui de psor pour les types manquants, en gris dans cdc blocs.
  • Légende:
    - Les blocs sont rangés par type de I à IV pour les blocs 16s23s et de V à X pour les blocs 16sgca23s. Chaque bloc est noté par son type suivi d'un indice.
    - La 1ère partie du tableau représente la totalité des blocs; la 2ème les groupes où les blocs se suivent avec des intercalaires très faibles. Seul l'intercalaire séparant le bloc V2 de I4 est élevé et le plus grand du tableau, 525. Je considère qu'un intercalaire inférieur à 350 est faible relativement aux intercalaires intra bloc. Les intercalaires avec les CDS sont faibles ici puisque seulement 3 sont supérieurs à 350, 402 (I2), 431 (VI1) et 525 (I4). Voir le tableau des cumuls pour tout les intercalaires des cds où seulement 6 sur 46 dépassent 350, avec une moyenne de 173±90.
    - Les couleurs, rouge pour rRNA, vert pour une configuration peu courante, un gène tRNA entre 23s et 5s, et ribosw pour riboswitch. Le cyan pour repérer le même intercalaire par rapport à la direction 16s23s5s quand elle change quand on a des adresses complément.
  • Notes:
    - 3 blocs avec des tRNAs longs, 44 23 5, concentrant les 2/3 des tRNAs avec des blocs 16s23s. 15 tRNAs sont dans des blocs courts ou 16sgca23s. Les tRNAs extra blocs sont 17.
    - 10 blocs 16s23s contre 7 blocs 16sgca23s
    - Le regroupement des blocs par 3 et 2 concerne 10 blocs et restent donc 7 blocs solitaires, 3 sans tRNA et 4 avec 1 ou 2 tRNA.
    - Existence de 4 cds intra groupe de petite taille en aas, 84 138 64 pour le 2èmer groupe, et 94 pour le 4ème groupe.
    - Le 1er groupe de 3 blocs n'a pas de cds internes et est constitué de la duplication d'un même bloc.
    - Des intercalaires très faibles inter blocs
    - Des intercalaires intra blocs qui se répètent beaucoup mais peuvent être divisés ou multipliés par 2.
intercalaire				Total
16s-23s	9*196	137			10
23s-5s	5*78	4*144	3*193	40	13
16s-gca	4*54	3*120			7
gca-23s	5*114	95	152		7
5s-aas	4*5 (tta)	5 (gaa)		5
C1. Paeniclostridium sordellii AM370, blocs à rRNA
I I2 I3 I4 II III IV IV1 IV2
CDS 124
CDS 245 ribosw 96
CDS 205 249 348 525 253 40 5s 12 5s 11 CDS 309 5
16s 196 196 196 196 196 78 gga 107 aca 116 16s 196 213
23s 78 78 78 144 144 194 23s 137 23s 196 23s 122 196
5s 85 402 180 228 112 276 16s 253 16s 364 5s 5 239
CDS CDS CDS tta
V V2 VI VI1 VII VII1 VIII VIII1 IX X X1
CDS 276 264 CDS 431 CDS 189 gaa 5
16s 54 123 16s 54 16s 54 16s 54 16s 118 5s 40
gca 114 152 gca 114 gca 114 gca 114 gca 95 23s 112
23s 41 50 23s 193 23s 193 23s 78 23s 144 gca 109
gga 11 12 5s 5 5s 5 5s 100 5s 131 16s 138
5s 99 109 tta 9 tta 9 CDS CDS atg
CDS atg 123 atg 123
groupe1 groupe2 groupe3 groupe4
CDS 431 CDS 309 CDS 142 CDS 264
VI1 16s 54 IV1 16s 196 **4aas 8 V2 16s 123
gca 114 23s 122 gaa 5 gca 152
23s 193 5s 5 5s 40 23s 50
5s 5 tta 13 23s 112 gga 12
tta 9 **42aas 10 gca 109 5s 109
atg 123 gta 162 X1 16s 138 CDS 525
VII1 16s 54 CDS 25 atg 13 I4 16s 196
gca 114 CDS 249 **21aas 13 23s 144
23s 193 I2 16s 196 tta 5 5s 228
5s 5 23s 78 5s 213 CDS
tta 9 5s 402 23s 196
atg 123 CDS 348 IV2 16s 239
VIII1 16s 54 I3 16s 196 CDS
gca 114 23s 78
23s 78 5s 180
5s 100 CDS
CDS

psor remarques[modifier | modifier le wikicode]

  • Lien tableur: psor remarques
  • Nombre de gènes protéines: 3327 (NCBI)
  • Rmarques @:
  1. - Un tRNA nommé other, non déterminé
  2. - cds de 62 aas, hp, à allure répétitive susceptible d'être créé par contrainte lors des conversions ou d'autres réparations: MWLFFLFFFLFFFLFFFFFLFFFLFFFFFLFFFFFFPIVVLQTEINFRYGYIYTIHSGIIF
  3. - une configuration rare 23s-aas-5s concerne 3 gga et 1 aca
  4. - Les RNAs non codants: riboswitch dans un bloc à rRNA et ncRNA dans un bloc sans rRNA, adresse 19421..19685.
  • Configuration des blocs: voir psor blocs.
  • Les séquences des doubles: Il y a très peu de doubles mais des duplications de séquences. Le signe + dans psor opérons indique les doubles.
    - séquence 44 aas: voir psor opérons, la couleur cyan pour la duplication de 20 aas et la couleur verte pour les insertions. Je n'ai pas pu distingué les 3 types d'atg dans 6 atg, qui certainement doivent être départagés en 2 atgf 2 atgj 2 atgi. Ce qui laisse 2 doubles aaa et gta.
    - séquence 23 aas: voir ci-dessous l'analogie de séquence entre 23 aas et le début de 44 aas. Seuls 3 aas ont des doubles cca gga aac, aucune séquence n'est dupliquée.
    - séquence 5 aas, c'est une petite séquence simple à la suite du blocs 23aas. Est-ce le fait d'être dans un bloc 416s-gca-23s?
    - séquence 8 aas: voir psor opérons, adresse 3523330..3524046, duplication de 3 aas. Est-ce que ça ne serait pas une séquence détachée d'un bloc 16s23s5s comme les 2 autres longs blocs.
23aas	tta atg gaa gga gta gac aac aac aca tac gga aga caa aaa tca   agc cca atg tgg cca atc   ttc atg
44aas	tta atg gaa gga gta gac aac     aca tac cta aga caa aaa tca                             ttc atg   atg cca cac - - - -

psor distribution[modifier | modifier le wikicode]

  • Lien tableur: psor distribution
  • Notes: tableau Cl12 blocs à de 3 tRNAs sauf
    - -5s: 3 gga et aca
    - 1-3 aas: 2 tta et 2 atgi
Cl1 psor, Paeniclostridium sordellii AM370. clostridia.
Cl11 psor. La distribution des tRNAs sans rRNA.
g1    t1       
atgi tct tat atgf
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc tcc tac tgc 1
atc acc 1 aac 1 agc 1
ctc ccc cac cgt
gtc gcc gac 1 ggc
tta tca taa tga 1
ata aca 2 aaa 2 aga
cta 2 cca caa cga
gta 2 gca gaa 2 gga
ttg 1 tcg tag tgg
atgj acg aag agg
ctg ccg cag cgg
gtg gcg gag ggg
clos >1aa =1aa -5s +5s -16s +16s total
psor 12 5* 17
Cl12 psor. La distribution des tRNAs avec rRNA.
g1    t1       
atgi 5 tct tat atgf 3
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc 3 tcc tac 3 tgc 2
atc 1 acc aac 4 agc 1
ctc ccc cac 2 cgt 1
gtc gcc gac 4 ggc 2
tta 5 tca 3 taa tga
ata aca 4 aaa 4 aga 4
cta 2 cca 4 caa 4 cga
gta 5 gca 7 gaa 4 gga 7
ttg tcg tag tgg 1
atgj 3 acg aag agg
ctg ccg cag cgg
gtg gcg gag ggg
clos >1aa =1aa -5s +5s -16s +16s total
psor 4* 76* 7 87

Peptoclostridium difficile CD196[modifier | modifier le wikicode]

cdc opérons[modifier | modifier le wikicode]

  • Liens: gtRNAdb [3], NCBI [4], génome [orgn]
  • Lien tableur: cdc opérons
  • Phylogénie: Bacteria; Firmicutes; Clostridia; Clostridiales;Peptostreptococcaceae; Clostridioides.
  • Légende: cdsa: cds aas, cdsd: cds dirigé
C2 Peptoclostridium difficile CD196
28.6%GC 11.9.19 Paris  83   doubles intercal cds aa avec aa cdsa cdsd protéines
dir 9857..10630 cds 179 179 258 SigB/SigF/SigG family RNA polymerase sigma factor
dir 10810..12317 16s 52
dir 12370..12445 gca 249
dir 12695..15596 23s 111
dir 15708..15824 5s 126 126 126
dir 15951..16460 cds 170 transcription repressor NadR
dir 19402..19857 cds 0 0 152 0 nucleoside deaminase
dir 19858..19949 tcc 37
dir 19987..20251 ncRNA @1 76 76
dir 20328..21965 cds 546 DNA polymerase III subunit gamma/tau
comp 23419..24624 cds 505 *505 402 glycosyl transferase
dir 25130..26637 16s 279
dir 26917..29816 23s + 180
dir 29997..30113 5s 3 aaa 6
dir 30120..30194 aac 3 gta 6 6
dir 30201..30286 tta 15 15
dir 30302..30377 atgf 7 7
dir 30385..30459 gaa 9 9
dir 30469..30542 gga 5 5
dir 30548..30623 gta 5 5
dir 30629..30705 gac 9 9
dir 30715..30789 aca 14 14
dir 30804..30888 tac 8 8
dir 30897..30980 cta 29 29
dir 31010..31086 aga 7 7
dir 31094..31169 caa 88 88
dir 31258..31346 tca 3 3
dir 31350..31425 ttc 6 6
dir 31432..31508 atgj 11 11
dir 31520..31596 atgi 23 23
dir 31620..31696 cca 7 7
dir 31704..31780 cac 8 8
dir 31789..31864 aaa 7 7
dir 31872..31945 tgc 6 6
dir 31952..32026 aac 5 5
dir 32032..32117 tta 15 15
dir 32133..32208 atgf 7 7
dir 32216..32290 gaa 9 9
dir 32300..32373 gga 5 5
dir 32379..32454 gta 5 5
dir 32460..32536 gac 9 9
dir 32546..32620 aca 14 14
dir 32635..32719 tac 9 9
dir 32729..32812 cta 23 23
dir 32836..32910 ggc 24 24
dir 32935..33011 aga 9 9
dir 33021..33096 caa 8 8
dir 33105..33180 aaa 2 2
dir 33183..33271 tca 3 3
dir 33275..33350 ttc 6 6
dir 33357..33433 atgj 11 11
dir 33445..33521 atgi 17 17
dir 33539..33615 cac 8 8
dir 33624..33699 aaa 7 7
dir 33707..33780 tgc 7 7
dir 33788..33864 cgt 12 12
dir 33877..33952 gta 75 75 75
dir 34028..34441 cds 308 308 138 hp
dir 34750..38181 cds 1144 pyruvate carboxylase
dir 127011..127715 cds 281 281 235 N-acetylmuramoyl-L-alanine amidase CwlD
dir 127997..129505 16s 279
dir 129785..132685 23s + 131
dir 132817..132933 5s 2 cca 6
dir 132940..133014 aac 4 4
dir 133019..133093 gaa 5 5
dir 133099..133174 gta 5 5
dir 133180..133256 gac 10 10
dir 133267..133341 aca 14 14
dir 133356..133440 tac 9 9
dir 133450..133523 gga 10 10
dir 133534..133610 aga 9 9
dir 133620..133695 caa 11 11
dir 133707..133782 aaa 2 2
dir 133785..133873 tca 17 17
dir 133891..133981 agc 8 8
dir 133990..134066 cca 85 85
dir 134152..134227 tgg 60 60
dir 134288..134364 cca 6 6
dir 134371..134447 atc 3 3
dir 134451..134526 ttc 7 7
dir 134534..134610 atgj 114
dir 134725..136115 16s 68
dir 136184..136259 gca 271
dir 136531..139430 23s 126
dir 139557..139673 5s 213 213 213
comp 139887..141071 cds 372 *372 395 pyridoxal phosphate-dependent aminotransferase
dir 141444..143795 cds 21 21 784 anaerobic ribonucleoside triphosphate reductase
dir 143817..144356 cds 776 *776 180 anaerobic ribonucleoside-triphosphate reductase activating protein
dir 145133..146640 16s 52
dir 146693..146768 gca 373
dir 147142..150041 23s 126
dir 150168..150284 5s 7 7
dir 150292..150366 aac 5 5
dir 150372..150457 tta 15 15
dir 150473..150548 atgf 7 7
dir 150556..150630 gaa 14 14
dir 150645..150718 gga 5 5
dir 150724..150799 gta 5 5
dir 150805..150881 gac 10 10
dir 150892..150966 ggc 9 9
dir 150976..151049 aga 975 *975
dir 152025..152864 cds 280 TIGR00159 family protein
dir 378341..380728 cds 583 *583 796 cadmium-translocating P-type ATPase
dir 381312..382819 16s 311
dir 383131..386030 23s 126
dir 386157..386273 5s 177 177 177
dir 386451..387059 cds 203 DedA family protein
comp 833130..833894 cds 258 258 255 DeoR/GlpR transcriptional regulator
dir 834153..834243 agc 87 87 87
dir 834331..835119 cds 263 flagellar motor protein
dir 1089165..1090139 cds 239 239 325 239 Mannosyl-glycoprotein endo-beta-N-acetylglucosamidase
dir 1090379..1091886 16s 320
dir 1092207..1095106 23s 91
dir 1095198..1095271 gga @2 8
dir 1095280..1095396 5s 273 273
dir 1095670..1097688 cds 673 N-acetylmuramoyl-L-alanine amidase
comp 1181549..1182958 cds 1374 *1374 470 MBOAT family protein
comp 1184333..1184415 ttg 318 318 318
dir 1184734..1187382 cds 883 DNA polymerase I
dir 1835768..1837498 cds 109 109 577 109 Na+/H+ antiporter NhaC family protein
dir 1837608..1837688 cta 231 231
<dir 1837920..1838093 cds 58 HXXEE domain-containing protein
dir 2981767..2982444 cds 159 159 226 159 sortase SrtB
comp 2982604..2982678 aca @3 94
comp 2982773..2985672 23s 184
comp 2985857..2987364 16s 340 340
dir 2987705..2988643 cds 313 delta-lactam-biosynthetic de-N-acetylase
comp 3787361..3788431 cds 454 *454 357 ABC transporter ATP-binding protein
comp 3788886..3789002 5s 126
comp 3789129..3792028 23s 281
comp 3792310..3793817 16s 191 191 191
comp 3794009..3794587 cds 193 bifunctional precorrin-2 dehydrogenase/sirohydrochlorin ferrochelatase
comp 3944262..3944453 cds 119 119 64 119 DUF378 domain-containing protein
comp 3944573..3944689 5s 126
comp 3944816..3947715 23s 217
comp 3947933..3949440 16s 282 282
comp 3949723..3950004 cds 221 221 94 hp
comp 3950226..3951755 cds 510 lysine--tRNA ligase
dir 4084445..4085437 cds 382 *382 331 DNA replication protein DnaC
comp 4085820..4085894 aca 33
comp 4085928..4086003 gta 4
comp 4086008..4086082 gaa 6
comp 4086089..4086164 aaa 326 326 326
comp 4086491..4087780 cds 430 adenylosuccinate synthase

cdc cumuls[modifier | modifier le wikicode]

cumuls. Peptoclostridium difficile CD196
opérons Fréquences intercalaires tRNAs Fréquences intercalaires cds Fréquences aas cds
effectif gammes sans rRNAs avec rRNAs gammes cds gammes cdsd gammes cdsa
avec rRNA opérons 10 1 0 1 1 1 1 100 3
16 23 5s 0 3 20 2 61 50 1 20 0 200 5
16 gca 235 3 40 1 4 100 3 40 0 300 7
16 23 5s a 2 60 1 150 3 60 0 400 5
max a 43 80 0 200 4 80 1 500 3
a doubles 2 100 2 250 4 100 1 600 3
autres 2 120 0 300 4 120 2 700 1
total aas 75 140 0 350 4 140 1 800 2
sans opérons 5 160 0 400 2 160 1 900 1
1 aa 4 180 0 450 0 180 1 1000 0
max a 4 200 0 500 1 200 1 1100 0
a doubles 0 0 5 4 1
total aas 8 3 68 32 13 31
total aas 83
remarques 3
avec jaune moyenne 14 12 313 165 378
variance 15 283 94 259
sans jaune moyenne 9 206 286
variance 5 107 144

cdc blocs[modifier | modifier le wikicode]

  • Lien tableur: cdc blocs
  • Lien psor blocs: le tabeau de cdc blocs est à comparer à celui de psor pour les types manquants, ici en gris.
  • Légende: voir psor blocs.
  • Notes:
    - cdc a perdu 3 blocs de type I, 16s23s5s sans tRNAs; les 2 blocs de type V, 16s-gca-23sgga5s et les 2 blocs 16s-gca-23s5s-2aas de type VI et VII. Soit la moitié des blocs courts, 7 sur 14, et plus de la moitié des blocs 16s-gca, 4 sur 7. Les 3 blocs longs sont maintenus mais modifiés.
C2. cdc blocs
groupes types absents            
cds 281 I II III IV IV1 IV2
IV2 16s 279
23s 131 CDS 583 454 119 cds 239
5s 6 16s 311 126 126 16s 320 cds 159 cds 505 281
aac 4 23s 126 281 217 23s 91 aca 94 16s 279 279
**16aas 3 5s 177 191 282 gga 8 23s 184 23s 180 131
ttc 7 CDS 5s 273 16s 340 5s 6 6
atgj 114 cds cds aac 6 4
VIII1 16s 68
gca 271 V V2 VI VI1 VII VII1
23s 126
5s 213
cds 372
cds 21 VIII VIII1 IX X X1
cds 776 cds 21
X1 16s 52 atgj 114 cds 179 cds 776
gca 373 16s 68 16s 52 16s 52
23s 126 gca 271 gca 249 gca 373
5s 7 23s 126 23s 111 23s 126
aac 5 5s 213 5s 126 5s 7
**7aas 9 cds 372 cds aac 5
aga 975
cds

cdc psor[modifier | modifier le wikicode]

  • Lien tableur: cdc psor
  • Comparaison bsu-lmo: Les séquences, les cumuls.
  • Légende:
    - La couleur cyan pour les différents entre cdc et psor; bois pour les identiques entre les clusters 43aas et 18aas de cdc d'une part et les clusters 44aas et 23aas de psor. Le gène aaa du cluster 18aas de cdc a son identique dans la 2ème partie du cluster 43aas et non dans la 1ère partie, car la duplication n'est pas exacte.
    - Le bleu pour des intercalaires exceptionnels.
    - Les blocs 16s indiquent des rRNAs de bordure, l'équivalent d'un cds.
    - Le jaune pour la conservation des cds: je ne l'ai appliqué ici qu'aux petits clusters sans rRNAs; Comparer les cumuls des intercalaires et protéines des cds de cdc et psor montre clairement que les clusters soit, sont très mobiles ou bien qu'il y a de nombreuses recombinansons entre le cluster et ses cds. Le jaune indique ici des intercalaires et des protéines presque identiques.
    - Les bordures très épaisses noires encadrent les 7 gènes du cluster 9aas identiques dans les duplicata du 43aas, comparaison cdc-cdc. Les bordures très épaisses bleues encadrent les 4 gènes du cluster 9aas de cdc et ceux du 23aas de psor, comparaison cdc-psor.
  • Notes:
    - Les 3 blocs longs de cdc commencent tous par aac. Chez psor 2 blocs longs et 2 courts commencent par tta et 1 bloc long gca commence par gaa.
    - Le jaune encadré montre que le cluster cta conservé dans cdc est celui ayant une protéine identique, 58 contre 62 aas dans psor. Or dans psor ce cluster présente des répétitions caractéristiques des contraintes imposées aux réparations.
    - Les fréquences des différences entre intercalaires (diff) sont reportées dans le dernier tableau C24 et sont établies sur la plage des différences entre intercalaires cdc et psor du tableau C21 pour des couples identiques. 16% des différences sont nulles (8 sur 49) et 50% ne dépassent pas 2 paires de bases. Ces résultats sont à mettre en parallèle avec ceux de la omparaison bsu-lmo, avec les séquences et les cumuls. La faible variabilité des intercalaires cdc-psor par rapport à bsu-lmo est due à leur plus grande filiation, niveau genre contre le niveau famille pour bsu-lmo.
C2. Comparaison cdc-psor
C21. Comparaison cdc-psor
cdc intercal psor intercal diff
cds 505 cds 309
16s 279 16s 196
23s 180 23s 122
5s 6 5s 5
aac 6 tta 13
tta 15 atg 15 -2
atgf 7 gaa 9 8
gaa 9 gga 6 0
gga 5 gta 5 1
gta 5 gac 16
gac 9 aac 4
aca 14 aca 4 -10
tac 8 tac 15 7
cta 29 cta 14 -15
aga 7 aga 7 0
caa 88 caa 11
tca 3 aaa 6
ttc 6 tca 3 0
atgj 11 ttc 9 3
atgi 23 atg 8 -3
cca 7 atg 21 -2
cac 8 cca 6 -1
aaa 7 cac 4
tgc 6 tgc 25
aac 5 tta 13 -2
tta 15 atg 15 8
atgf 7 gaa 9 0
gaa 9 gga 6 1
gga 5 gta 5 0
gta 5 gac 16
gac 9 aac 4
aca 14 aca 4 -10
tac 9 tac 15 6
cta 23 cta 11 -12
ggc 24 ggc 13 -11
aga 9 aga 7 -2
caa 8 caa 11 3
aaa 2 aaa 6 4
tca 3 tca 3 0
ttc 6 ttc 9 3
atgj 11 atg 8 -3
atgi 17 atg 21
cac 8 cca 6
aaa 7 cac 9 1
tgc 7 aaa 21 14
cgt 12 tgc 6 -1
gta 75 cgt 10 -2
cds gta 162
cds
cds 776
16s 52
gca 373
23s 126
5s 7 atg 138
aac 5 16s 109
tta 15 gca 112
atgf 7 23s 40
gaa 14 5s 5
gga 5 gaa 8
gta 5 gta 5 0
gac 10 gac 9 -1
ggc 9 ggc 7 -2
aga 975 aga 142
cds cds
cds 281 cds 239
16s 279 16s 196
23s 131 23s 213
5s 6 5s 5
aac 4 tta 13
gaa 5 atg 15
gta 5 gaa 9
gac 10 gga 6
aca 14 gta 5
tac 9 gac 16
gga 10 aac 31
aga 9 aac 4
caa 11 aca 4 -10
aaa 2 tac 11 2
tca 17 gga 19 9
agc 8 aga 6 -3
cca 85 caa 12 1
tgg 60 aaa 6 4
cca 6 tca 11 -6
atc 3 agc 6 -2
ttc 7 cca 6
atgj 114 atg 11
16s tgg 31 -29
cca 6 0
atc 6 3
ttc 13 6
atg 138
16s
cds 129
gta 8
gaa 20
aaa 10
cds 382 aca 10
aca 33 gac 7
gta 4 gta 9 5
gaa 6 gaa 5 -1
aaa 326 aaa 289
cds cds
C22. Comparaisons internes
cdc intercal cdc intercal diff
cds 505 cds 281
16s 279 16s 279
23s 180 23s 131
5s 6 5s 6
aac 6 aac 4
tta 15 gaa 5
atgf 7 gta 5
gaa 9 gac 10
gga 5 aca 14
gta 5 tac 9 0
gac 9 gga 10 1
aca 14 aga 9 0
tac 8 caa 11
cta 29 aaa 2
aga 7 tca 17 2
caa 88 agc 8
tca 3 cca 85
ttc 6 tgg 60
atgj 11 cca 6
atgi 23 atc 3
cca 7 ttc 7
cac 8 atgj 114
aaa 7 16s
tgc 6 cds 776
aac 5 16s 52
tta 15 gca 373
atgf 7 23s 126
gaa 9 5s 7
gga 5 aac 5
gta 5 tta 15 0
gac 9 atgf 7 1
aca 14 gaa 14 0
tac 9 gga 5
cta 23 gta 5
ggc 24 gac 10
aga 9 ggc 9 0
caa 8 aga 975 3
aaa 2 cds 0
tca 3
ttc 6
atgj 11
atgi 17
cac 8
aaa 7
tgc 7
cgt 12
gta 75
cds
psor psor intercal diff
cds 309 cds 239
16s 196 16s 196
23s 122 23s 213
5s 5 5s 5
tta 13 tta 13 0
atg 15 atg 15 0
gaa 9 gaa 9 0
gga 6 gga 6 0
gta 5 gta 5 0
gac 16 gac 16 0
aac 4 aac 31
aca 4 aac 4
tac 15 aca 4 0
cta 14 tac 11 -4
aga 7 cta 19 5
caa 11 aga 6 -1
aaa 6 caa 12 1
tca 3 aaa 6 0
ttc 9 tca 11
atg 8 agc 6
atg 21 cca 6
cca 6 atg 11
cac 4 tgg 31
tgc 25 cca 6
tta 13 atc 6 0
atg 15 ttc 13 0
gaa 9 atg 138 0
gga 6 16s 0
gta 5 atg 138 0
gac 16 16s 109 0
aac 4 gca 112
aca 4 23s 40 0
tac 15 5s 5
cta 11 gaa 8
ggc 13 gta 5
aga 7 gac 9 -1
caa 11 ggc 7 1
aaa 6 aga 142 0
tca 3 cds
ttc 9
atg 8
atg 21
cca 6
cac 9
aaa 21
tgc 6
cgt 10
gta 162
cds
C23. Conservation des cds
cdc intercal psor intercal protéines
cds 0 cds 3 151 – 152
tcc 37 tcc 27
ncRNA 76 ncRNA 152 547 – 546
cds cds
cds 1374 cds 41 470 – 1177
ttg 318 ttg 138 883 – 881
cds cds
cds 109 cds 111 577 – 1076
cta 231 cta 426
cds cds 58 – 577
cds 258 cds 37 255 – 302
agc 87 agc 120
cds cds 263 – 100
cds 306 62
cta 404
cds 422
cds 135
other 258
cds
cds 195
tga 37
cds
cds 71
tgc 12
aac 3
aca 285
cds
C24. Fréquence des différences des intercalaires
gamme fréquence
-15 2
-14
-13
-12 1
-11 1
-10 3
-9
-8
-7
-6 1
-5
-4
-3 3
-2 7
-1 4
0 8
1 4
2 1
3 4
4 2
5 1
6 2
7 1
8 2
9 1
10
11
12
13
14 1
15
total 49
sous t. -2+2 24

cdc remarques[modifier | modifier le wikicode]

  • Nombre de gènes protéines: cdc 3615, psor 3327 (NCBI)
  • Comparaison bsu-lmo: Les séquences, les cumuls. bsu-lmo nouveau
  • Rmarques @: On retrouve une partie des remarques de psor
  1. - Les RNAs non codants: seul le bloc cds-tcc-ncRNA-cds est maintenu.
  2. - Une configuration rare 23s-gga-5s complète au lieu de 3.
  3. - La configuration 16s23s-aca-5s-riboswitch perd 5s-riboswitch et devient 16s23s-aca.
  • Comparaison cdc-psor
    1. Les blocs à rRNAs: Les blocs disparaissent au moment des divisions et ce sont les non protégés par des séquences de tRNAs qui disparaissent en 1er. 7 clusters simples disparaissent et les groupes se défont.
    2. Les séquences longues:
      • Comparaison entre les 2 génomes, cdc-psor: Très peu de modifications, plutôt des mutations que des recombinaisons et encore moins des créations. Le cas de la disparition de aaa qui apparaît dans un intercalaire est emblématique.
      • Comparaisons intra génome, cdc-cdc et psor-psor. Là les remaniements sont légions et puissants: duplication de 20 tRNAs d'un seul coup, recombinaisons par lots ou tRNA par tRNA.
  • Comparaison clostridia-bacilli entre cdc-psor et bsu-lmo: la comparaison est saisissante et on arrive à repérer une recombinaison après division, celle de 16s23s5s en 16s-atcgca-23s5s entre bsu et lmo. La mutation de cta en ctg, entre génome, qui conserve la longueur du tRNA, ainsi que la agc en tcc dans le petit bloc aac-**-gaa en intra.
    - Seul les clostridia présentent des cds dans les groupes, les bacilli non. Les autres génomes de clostridia (voir fiche) présentent beaucoup de cds dans les clusters alors que les bacilli (fiche) jamais.
  • Conclusion: Tout se passe comme si le processus se déroulait d'un seul coup dans un génome, en dehors de la division. Puis pendant la 1ère division et les divisions suivantes certains clusters disparaissent facilement alors que se produisent quelques rares mutations et recombinaisons. C'est avant tout un processus de création ordonné donnant des séquences qui peuvent se dupliquer et se recombiner. Les séquences de tRNA stabilisent et maintiennent les blocs de rRNAs, un seul cluster à 6 tRNAs disparaît entre bsu et lmo, et aucun entre cdc et psor.

cdc distribution[modifier | modifier le wikicode]

Cl2 cdc, Peptoclostridium difficile CD196. clostridia.
Cl21 cdc. La distribution des tRNAs sans rRNA.
g1    t1       
atgi tct tat atgf
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc tcc 1 tac tgc
atc acc aac agc 1
ctc ccc cac cgt
gtc gcc gac ggc
tta tca taa tga
ata aca 1 aaa 1 aga
cta 1 cca caa cga
gta 1 gca gaa 1 gga
ttg 1 tcg tag tgg
atgj acg aag agg
ctg ccg cag cgg
gtg gcg gag ggg
clos >1aa =1aa -5s +5s -16s +16s total
cdc 4 4* 8
Cl22 psor. La distribution des tRNAs avec rRNA.
g1    t1       
atgi 2 tct tat atgf 3
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc 3 tcc tac 3 tgc 2
atc 1 acc 2 aac 2 agc 1
ctc ccc cac 2 cgt 1
gtc gcc gac 4 ggc 2
tta 3 tca 3 taa tga
ata aca 4 aaa 4 aga 4
cta 2 cca 3 caa 3 cga
gta 5 gca 3 gaa 4 gga 5
ttg tcg tag tgg 1
atgj 3 acg aag agg
ctg ccg cag cgg
gtg gcg gag ggg
clos >1aa =1aa -5s +5s -16s +16s total
cdc 2* 70 3 75

Peptoclostridium difficile M68[modifier | modifier le wikicode]

cdc8 opérons[modifier | modifier le wikicode]

  • Liens data bases: gtRNAdb [5], NCBI [6], génome [7]
  • Lien tableur: cdc8 opérons
  • Phylogénie: Bacteria; Firmicutes; Clostridia; Clostridiales;Peptostreptococcaceae; Clostridioides.
  • Liens internes: noms abrégéscdc8 remarquescdc8 cumuls
  • Légende: voir cdc8 cumuls pour cdsa: cds en pbs, cdsd: cds dirigé; voir cdc8 remarques pour @ et +
    - 23s': possible 23S ribosomal RNA but does not have good blast hits on one or both of the ends.
    - 23s°: 23S ribosomal RNA rRNA prediction is too short
    - cca: tRNA dupliqué dans le cluster 43aas (4306341).
    - cca: tRNA non dupliqué dans le cluster 43aas (4306341), ou remarques @2 et @3.
    - 554: voir cdc8 cumuls, veut dire sans jaune, exclu de la moyenne.
C3 Peptoclostridium difficile M68
28.6%GC 11.9.19 Paris  110  doubles intercal cds aa avec aa cdsa cdsd protéines
dir 4299490..4300134 cds 214 214 645 tyrosine-type recombinase/integrase
dir 4300349..4300807 cds @1 554 554 459 helix-turn-helix domain-containing protein
dir 4301362..4303101 cds 0 0 1740 hypothetical protein
dir 4303102..4303305 cds 167 167 204 hp
dir 4303473..4304299 23s° 132 827
dir 4304432..4304548 5s + 6 117
dir 4304555..4304629 aac 4 4 75
dir 4304634..4304708 gaa 2 cca 5 5 75
dir 4304714..4304789 gta 5 5 76
dir 4304795..4304871 gac 11 11 77
dir 4304883..4304957 aca 14 14 75
dir 4304972..4305056 tac 9 9 85
dir 4305066..4305139 gga 10 10 74
dir 4305150..4305226 aga 9 9 77
dir 4305236..4305311 caa 11 11 76
dir 4305323..4305398 aaa 2 2 76
dir 4305401..4305489 tca 18 18 89
dir 4305508..4305598 agc 8 8 91
dir 4305607..4305683 cca 85 85 77
dir 4305769..4305844 tgg 60 60 76
dir 4305905..4305981 cca 5 5 77
dir 4305987..4306063 atc 3 3 77
dir 4306067..4306142 ttc 7 7 76
dir 4306150..4306226 atgj 114 77
dir 4306341..4307538 16s 0 0 1198 0
dir 4307539..4308225 cds 100 100 687 xylose isomerase
dir 1..796 23s° 181 796
dir 978..1094 5s 6 117
dir 1101..1175 aac + 6 6 75
dir 1182..1267 tta 3 aaa 15 15 86
dir 1283..1358 atgf 3 gta 7 7 76
dir 1366..1440 gaa 9 9 75
dir 1450..1523 gga 5 5 74
dir 1529..1604 gta 5 5 76
dir 1610..1686 gac 9 9 77
dir 1696..1770 aca 14 14 75
dir 1785..1869 tac 10 10 85
dir 1880..1963 cta 28 28 84
dir 1992..2068 aga 7 7 77
dir 2076..2151 caa 89 89 76
dir 2241..2329 tca 3 3 89
dir 2333..2408 ttc 6 6 76
dir 2415..2491 atgj 11 11 77
dir 2503..2579 atgi 29 29 77
dir 2609..2685 cca 7 7 77
dir 2693..2769 cac 8 8 77
dir 2778..2853 aaa 7 7 76
dir 2861..2934 tgc 6 6 74
dir 2941..3015 aac 6 6 75
dir 3022..3107 tta 15 15 86
dir 3123..3198 atgf 7 7 76
dir 3206..3280 gaa 9 9 75
dir 3290..3363 gga 5 5 74
dir 3369..3444 gta 5 5 76
dir 3450..3526 gac 9 9 77
dir 3536..3610 aca 14 14 75
dir 3625..3709 tac 9 9 85
dir 3719..3802 cta 24 24 84
dir 3827..3901 ggc 24 24 75
dir 3926..4002 aga 9 9 77
dir 4012..4087 caa 8 8 76
dir 4096..4171 aaa 2 2 76
dir 4174..4262 tca 3 3 89
dir 4266..4341 ttc 6 6 76
dir 4348..4424 atgj 11 11 77
dir 4436..4512 atgi 17 17 77
dir 4530..4606 cac 8 8 77
dir 4615..4690 aaa 7 7 76
dir 4698..4771 tgc 7 7 74
dir 4779..4855 cgt 12 12 77
dir 4868..4943 gta 75 75 76 75
dir 5019..5432 cds 308 308 414 hp
dir 5741..9172 cds 3432 pyruvate carboxylase
dir 94032..94736 cds 281 281 705 281 N-acetylmuramoyl-L-alanine amidase CwlD
dir 95018..95994 16s° 100 977
dir 96095..97613 23s° 126 1519
dir 97740..97856 5s 7 117
dir 97864..97938 aac 6 6 75
dir 97945..98030 tta 15 15 86
dir 98046..98121 atgf 7 7 76
dir 98129..98203 gaa 8 8 75
dir 98212..98285 gga 4 4 74
dir 98290..98365 gta 5 5 76
dir 98371..98447 gac 10 10 77
dir 98458..98532 ggc 9 9 75
dir 98542..98615 aga 954 954 74
dir 99570..100409 cds 840 TIGR00159 family protein
dir 306829..309216 cds 733 733 2388 cadmium-translocating P-type ATPase
<> comp 309950..310076 cds 1 1 127 1 glycine/sarcosine/betaine reductase complex selenoprotein A
dir 310078..311313 23s° 126 1236
dir 311440..311556 5s 177 177 117
dir 311734..312342 cds 609 DedA family protein
comp 861856..862620 cds 258 258 765 DeoR/GlpR transcriptional regulator
dir 862879..862969 agc 87 87 91 87
dir 863057..863845 cds 789 flagellar motor protein
dir 1106477..1107451 cds 238 238 975 238 Mannosyl-glycoprotein endo-beta-N-acetylglucosamidase
dir 1107690..1109197 16s @2 320 1508
dir 1109518..1112416 23s 91 2899
dir 1112508..1112581 gga 8 74
dir 1112590..1112706 5s 273 273 117
dir 1112980..1114998 cds 2019 N-acetylmuramoyl-L-alanine amidase
comp 1196804..1198213 cds 1378 1378 1410 MBOAT family protein
comp 1199592..1199674 ttg 318 318 83 318
dir 1199993..1202641 cds 2649 DNA polymerase I
dir 1850896..1852626 cds 109 109 1731 109 Na+/H+ antiporter NhaC family protein
dir 1852736..1852816 cta 334 334 81
dir 1853151..1853666 cds 516 HXXEE domain-containing protein
dir 3024038..3024715 cds 150 150 678 150 sortase SrtB
comp 3024866..3024940 aca @3 93 75
comp 3025034..3027933 23s 184 2900
comp 3028118..3029625 16s 374 374 1508
dir 3030000..3030938 cds 939 delta-lactam-biosynthetic de-N-acetylase
dir 3805298..3806743 cds 208 208 1446 tyrosine-type recombinase/integrase
comp 3806952..3807028 agg 61 61 77 61
<comp 3807090..3808790 cds 1701 formate dehydrogenase subunit alpha
comp 3875816..3876886 cds 452 452 1071 ABC transporter ATP-binding protein
comp 3877339..3877455 5s 125 117
comp 3877581..3880480 23s 261 2900
comp 3880742..3882249 16s 190 190 1508 190
comp 3882440..3883018 cds 579 bifunctional precorrin-2 dehydrogenase/sirohydrochlorin ferrochelatase
comp 4017523..4017714 cds 118 118 192 118 DUF378 domain-containing protein
comp 4017833..4017949 5s 126 117
comp 4018076..4020975 23s 321 2900
comp 4021297..4022804 16s 292 292 1508
comp 4023097..4023378 cds 221 221 282 hp
comp 4023600..4025129 cds 1530 lysine--tRNA ligase
dir 4135881..4136873 cds 383 383 993 DNA replication protein DnaC
comp 4137257..4137331 aca 33 33 75
comp 4137365..4137440 gta 4 4 76
comp 4137445..4137519 gaa 6 6 75
comp 4137526..4137601 aaa 331 331 76 331
comp 4137933..4139222 cds 1290 adenylosuccinate synthase
dir 4178197..4178970 cds 179 179 774 SigB/SigF/SigG family RNA polymerase sigma factor
dir 4179150..4180587 16s 161 1438
comp 4180749..4180865 5s 201 117
comp 4181067..4183959 23s 217 2893
comp 4184177..4185684 16s 108 1508
comp 4185793..4185869 atgi 11 11 77
comp 4185881..4185969 tta 5 89
comp 4185975..4186091 5s 201 117
comp 4186293..4189192 23s 375 2900
comp 4189568..4189643 gca 52 76
comp 4189696..4190959 16s’ @4 100 1264
dir 4191060..4192225 16s’ 52 1166
dir 4192278..4192353 gca 248 76
dir 4192602..4193197 23s° 100 596
dir 4193298..4193874 16s° 321 577
dir 4194196..4196423 23s’ 100 2228
dir 4196524..4197091 16s° 320 568
dir 4197412..4199044 23s° 100 1633
dir 4199145..4201593 23s’ 126 2449
dir 4201720..4201836 5s 127 127 117 127
dir 4201964..4202473 cds 510 transcription repressor NadR
dir 4205417..4205872 cds 0 0 456 0 nucleoside deaminase
dir 4205873..4205964 tcc @5 37 92
dir 4206002..4206266 ncRNA 76 76 265
dir 4206343..4207980 cds 1638 DNA polymerase III subunit gamma/tau
comp 4209435..4210639 cds 496 496 1205 glycosyl transferase
4211136..4212643 16s 321 1508
4212965..4213127 23s° 100 100 163 100
<>comp 4213228..4213849 cds 111 622 CHAP domain-containing protein
comp 4213961..4214620 cds 228 228 660 228 type A-1 chloramphenicol O-acetyltransferase
dir 4214849..4216199 16s 321 1351
dir 4216521..4217008 23s° 101 488
comp 4217110..4218529 23s° 250 1420
comp 4218780..4218855 gca 52 76
comp 4218908..4219471 16s° 100 564
comp 4219572..4219856 23s° 217 285
comp 4220074..4221581 16s 179 179 1508 179
>comp 4221761..4222206 cds 386 386 446 386 B/F/G family RNA polymerase sigma-70 factor
dir 4222593..4224100 16s 321 1508
dir 4224422..4227321 23s 181 2900
dir 4227503..4227619 5s 6 117
dir 4227626..4227700 aac 6 6 75
dir 4227707..4227792 tta 15 15 86
dir 4227808..4227883 atgf 7 7 76
dir 4227891..4227965 gaa 9 9 75
dir 4227975..4228048 gga 5 5 74
dir 4228054..4228129 gta 5 5 76
dir 4228135..4228211 gac 9 9 77
dir 4228221..4228295 aca 14 14 75
dir 4228310..4228394 tac 10 10 85
dir 4228405..4228488 cta 28 28 84
dir 4228517..4228593 aga 7 7 77
dir 4228601..4228676 caa 89 89 76
dir 4228766..4228854 tca 3 3 89
dir 4228858..4228933 ttc 6 6 76
dir 4228940..4229016 atgj 11 11 77
dir 4229028..4229104 atgi 29 29 77
dir 4229134..4229210 cca 7 7 77
dir 4229218..4229294 cac 8 8 77
dir 4229303..4229378 aaa 353 76
comp 4229732..4229848 5s 126 117
comp 4229975..4232010 23s' 582 2036
dir 4232593..4234098 16s @6 217 1506
dir 4234316..4237215 23s 126 2900
dir 4237342..4237458 5s 216 216 117 216
comp 4237675..4238859 cds 372 372 1185 pyridoxal phosphate-dependent aminotransferase
dir 4239232..4241583 cds 21 21 2352 anaerobic ribonucleoside triphosphate reductase
dir 4241605..4242144 cds 778 778 540 anaerobic ribonucleoside-triphosphate reductase activating protein
dir 4242923..4244459 16s @7 261 1537
dir 4244721..4247619 23s 201 2899
dir 4247821..4247937 5s 5 117
dir 4247943..4248031 tta 11 11 89
dir 4248043..4248119 atgi 108 77
dir 4248228..4249735 16s 184 1508
dir 4249920..4250564 23s° 100 100 645 100
<dir 4250665..4250923 cds 112 112 259 112 hp
comp 4251036..4253145 23s’ 375 2110
comp 4253521..4253596 gca 52 76
comp 4253649..4254226 16s° 282 282 578
dir 4254509..4254712 cds 12 12 204 hp
dir 4254725..4256002 cds 1278 phage portal protein

cdc8 cumuls[modifier | modifier le wikicode]

  • Lien tableur: cdc8 cumuls
  • Liens internes: cdc8 opérons
  • Légende:
    - avec et sans rRNA, fréquences des intercalaires dans les clusters avec rRNA ou sans rRNA.
    - cdsd, je ne choisis que le cds avec l'intercalaire le plus faible d'un cluster donné, en supposant que ce cds a été créé par le cluster lors des conversions.
    - cdsa, longueur du cds en aas ici. C'est le cdsa de cdc8 opérons divisé par 3.
    -  1 : occurences exclues de la moyenne. Sont exclus de la moyenne les jaunes 554 de cdc8 opérons.
C3. cumuls. Peptoclostridium difficile M68
opérons Fréquences intercalaires tRNAs Fréquences intercalaires cds Fréquences aas cds
effectif gammes sans rRNAs avec rRNAs gammes cds gammes cdsd gammes cdsa
avec rRNA opérons 21 1 0 1 4 1 3 100 6
16 23 5s 0 4 20 2 77 50 2 20 0 200 8
16 gca 235 2 40 1 6 100 7 40 0 300 11
16 23 5s a 5 60 0 150 5 60 0 400 5
max a 43 80 1 200 5 80 2 500 5
a doubles 2 100 3 250 6 100 3 600 5
autres 10 120 0 300 5 120 3 700 1
total aas 98 140 0 350 4 140 1 800 1
sans opérons 6 160 0 400 4 160 1 900 1
1 aa 5 180 0 450 0 180 1 1000 0
max a 4 200 0 500 2 200 1 1100 0
a doubles 0 0 4 7 1
total aas 9 3 87 48 22 44
total aas 108
remarques 7
avec jaune moyenne 14 13 256 155 330
variance 16 252 109 234
sans jaune moyenne 10 182 208
variance 6 117 97

cdc8 blocs[modifier | modifier le wikicode]

  • Lien tableur: cdc8 blocs
  • Lien cdc blocs: La colonne "Bloc type" de cdc8 blocs correspond aux types définis dans cdc blocs.
  • Légende
    - 23s': possible 23S ribosomal RNA but does not have good blast hits on one or both of the ends.
    - 23s°: 23S ribosomal RNA rRNA prediction is too short
    - cca: remarques @2 et @3.
  • Notes:
    - Je définis le type de bloc en comparant avec un bloc de cdc_bloc ayant approximativement les mêmes intercalaires et quand c'est possible les tRNAs identiques qui l'accompagnent. L'identification des tRNAs est faite dans la comparaison entre cdc et cdc 8 dans 43aas, 18aas et 9aas.
    - Les groupes de clusters. Un groupe de cluster à rRNA, et ici avec les débris de rRNA aussi, est un ensemble de rRNAs espacés de tRNAs et de cds par des intercalaires faibles, inférieurs à 778 pbs ici. Les 2 intercalaires des cds terminaux peuvent être très élevés, indiquant que le cds n'est pas sous l'influence de la conversion appliquée au cluster. Au total cdc8 a 9 groupes dont 6 avec un seul bloc, et 3 avec plus de 2 comprenant la quasi totalité des rRNAs, 40/46.
    1. Les solitaires, 6 dont 5 bien typés, I2 I3 II III et X1.
    2. Le groupe à 2 blocs, IV1 et IV2 bien typés.
    3. Le groupe à 15 rRNAs dans lequel je n'ai pu typé que 2 blocs, I1 et VII1.
    4. Le groupe à 23 rRNAs dans lequel je n'ai pu typé que 3 blocs, I4 IV3 IV4.
    5. Le type IV4, 16s23s5s-tta-atgi, n'existe pas dans psor mais est ajouté ici parce qu'il est semblable aux types IV, 16s23s5s suivi de tRNAs. Mais en plus avec tta-atgi il est comparable aussi aux types VII1 et VIII1. Ce point est important quand on considère l'origine de cdc8 comme croisement de cdc et psor. Ce type IV4 va en faveur d'une évolution de cdc vers psor en passant par cdc8.
C3. cdc8 blocs
Bloc type groupes intercal Bloc type groupes intercal Bloc type groupe intercal
cds 554 cds 150 cds 496
cds 0 aca 93 16s 321
cds 167 23s 184 23s° 100
23s° 132 III 16s 374 cds 111
IV2 5s 6 cds cds 228
aac 4 16s 321
**16aas 7 cds 452 23s° 101
atgj 114 5s 125 23s° 250
IV1 16s 0 23s 261 gca 52
cds 100 I2 16s 190 16s° 100
23s° 181 cds 23s° 217
5s 6 16s 179
aac 6 cds 118 cds 386
**41aas 12 5s 126 IV3 16s 321
gta 75 23s 321 23s 181
cds 308 I3 16s 292 5s 6
cds cds aac 6
**17aas 8
cds 281 cds 179 aaa 353
16s° 100 16s 161 5s 126
23s° 126 5s 201 23s' 582
X1 5s 7 I1 23s 217 I4 16s 217
aac 6 16s 108 23s 126
**7aas 9 atgi 11 5s 216
aga 954 tta 5 cds 372
cds 5s 201 cds 21
23s 375 cds 778
cds 733 VII1 gca 52 IV4 16s 261
cds 1 16s’ 100 23s 201
23s° 126 16s’ 52 5s 5
5s 177 gca 248 tta 11
cds 23s° 100 atgi 108
16s° 321 16s 184
cds 238 23s' 100 23s° 100
II 16s 320 16s° 320 cds 112
23s 91 23s° 100 23s’ 375
gga 8 23s’ 126 gca 52
5s 273 5s 127 16s° 282
cds cds cds

cdc8 cdc psor 43[modifier | modifier le wikicode]

  • Lien tableur: cdc8 cdc psor 43
  • Lien cdc psor: le tableau de comparaison cdc-psor
  • Légende
    - 23s': possible 23S ribosomal RNA but does not have good blast hits on one or both of the ends.
    - 23s°: 23S ribosomal RNA rRNA prediction is too short
    - cca: marque les tRNAs différents entre les 2 génomes.
    - diff pour différence entre les intercalaires (intercal) cdc moins cdc8.
    - séquences identiques (bordure épaisse): Une séquence identique entre les 2 génomes est encadrée par 2 tRNAs différents (cyan) dans l'un et par 2 bordures épaisses dans l'autre.
  • Notes:
    - identité entre cdc et cdc8 avec de rares différences faibles entre les intercalaires.
    - Aussi on retrouve les différences entre cdc et psor dans le tableau de droite.
C3. Comparaison cdc8-cdc-psor 43
C31. Comparaison cdc8-cdc 43
cdc8 43aas cdc 43aas
gene intercal gene intercal diff
16s 1
cds 100 16s 279
23s° 181 23s 180 -1
5s 6 5s 6 0
aac 6 aac 6 0
tta 15 tta 15 0
atgf 7 atgf 7 0
gaa 9 gaa 9 0
gga 5 gga 5 0
gta 5 gta 5 0
gac 9 gac 9 0
aca 14 aca 14 0
tac 10 tac 8 -2
cta 28 cta 29 1
aga 7 aga 7 0
caa 89 caa 88 -1
tca 3 tca 3 0
ttc 6 ttc 6 0
atgj 11 atgj 11 0
atgi 29 atgi 23 -6
cca 7 cca 7 0
cac 8 cac 8 0
aaa 7 aaa 7 0
tgc 6 tgc 6 0
aac 6 aac 5 -1
tta 15 tta 15 0
atgf 7 atgf 7 0
gaa 9 gaa 9 0
gga 5 gga 5 0
gta 5 gta 5 0
gac 9 gac 9 0
aca 14 aca 14 0
tac 9 tac 9 0
cta 24 cta 23 -1
ggc 24 ggc 24 0
aga 9 aga 9 0
caa 8 caa 8 0
aaa 2 aaa 2 0
tca 3 tca 3 0
ttc 6 ttc 6 0
atgj 11 atgj 11 0
atgi 17 atgi 17 0
cac 8 cac 8 0
aaa 7 aaa 7 0
tgc 7 tgc 7 0
cgt 12 cgt 12 0
gta 75 gta 75 0
cds cds
C32. Comparaison cdc8-psor 43
cdc8 43aas psor 44aas
gene intercal gene intercal diff
16s 1
cds 100 16s 196
23s° 181 23s 122
5s 6 5s 5
aac 6 tta 13 -2
tta 15 atg 15 8
atgf 7 gaa 9 0
gaa 9 gga 6 1
gga 5 gta 5 0
gta 5 gac 16
gac 9 aac 4
aca 14 aca 4 -10
tac 10 tac 15 5
cta 28 cta 14 -14
aga 7 aga 7 0
caa 89 caa 11
tca 3 aaa 6
ttc 6 tca 3 0
atgj 11 ttc 9 3
atgi 29 atg 8 -3
cca 7 atg 21 -8
cac 8 cca 6 -1
aaa 7 cac 4
tgc 6 tgc 25
aac 6 tta 13 -2
tta 15 atg 15 8
atgf 7 gaa 9 0
gaa 9 gga 6 1
gga 5 gta 5 0
gta 5 gac 16
gac 9 aac 4
aca 14 aca 4 -10
tac 9 tac 15 6
cta 24 cta 11 -13
ggc 24 ggc 13 -11
aga 9 aga 7 -2
caa 8 caa 11 3
aaa 2 aaa 6 4
tca 3 tca 3 0
ttc 6 ttc 9 3
atgj 11 atg 8 -3
atgi 17 atg 21
cac 8 cca 6
aaa 7 cac 9 1
tgc 7 aaa 21 14
cgt 12 tgc 6 -1
gta 75 cgt 10 -2
cds gta 162
cds

cdc8 cdc psor 18[modifier | modifier le wikicode]

  • Lien tableur: cdc8 cdc psor 18
  • Lien cdc psor: le tableau de comparaison cdc-psor
  • Légende
    - 23s': possible 23S ribosomal RNA but does not have good blast hits on one or both of the ends.
    - 23s°: 23S ribosomal RNA rRNA prediction is too short
    - cca: marque les tRNAs différents entre les 2 génomes.
    - diff pour différence entre les intercalaires (intercal) colonne de droite moins colonne de gauche.
    - séquences identiques (bordure épaisse): Une séquence identique entre les 2 génomes est encadrée par 2 tRNAs différents (cyan) dans l'un et par 2 bordures épaisses dans l'autre.
  • Notes:
    - Sont comparés ici des suite de longueurs équivalentes entre les 3 génomes, 18aas 19aas 23aas,
    - avec 4 comparaisons cdc8 18aas/cdc 18aas, cdc8 19aas/psor 23aas, cdc8 18aas/psor 23aas, cdc8 19aas/cdc8 18aas,
    - cdc8 18aas et cdc 18aas sont identiques alors que, en intra, cdc8 19aas est très différent de cdc8 18aas.
    - cdc8 18aas est quasiment inclus dans psor 23aas: les 14 tRNAs de la fin de cdc8 se trouvent en fin de psor avec une seule insertion dans psor, mais les différences entre intercalaires sont élevées comme entre cdc et psor.
C3. Comparaison cdc8-cdc-psor 18
C33. Comparaison cdc8-cdc-psor 18
cdc8 18aas cdc 18aas
gene intercal gene intercal diff
cds 214
cds 554
cds 0
cds 167 16s 279
23s° 132 23s 131 -1
5s 6 5s 6 0
aac 4 aac 4 0
gaa 5 gaa 5 0
gta 5 gta 5 0
gac 11 gac 10 -1
aca 14 aca 14 0
tac 9 tac 9 0
gga 10 gga 10 0
aga 9 aga 9 0
caa 11 caa 11 0
aaa 2 aaa 2 0
tca 18 tca 17 -1
agc 8 agc 8 0
cca 85 cca 85 0
tgg 60 tgg 60 0
cca 5 cca 6 1
atc 3 atc 3 0
ttc 7 ttc 7 0
atgj 114 atgj 114 0
cdc8 18aas psor 23aas
gène intercal gène intercal diff
16s 196
23s 213
cds 214 5s 5
cds 554 tta 13
cds 0 atg 15
cds 167 gaa 9
23s° 132 gga 6
5s 6 gta 5 0
aac 4 gac 16
gaa 5 aac 31
gta 5 aac 4
gac 11 aca 4 -10
aca 14 tac 11 2
tac 9 gga 19 9
gga 10 aga 6 -3
aga 9 caa 12 1
caa 11 aaa 6 4
aaa 2 tca 11 -7
tca 18 agc 6 -2
agc 8 cca 6
cca 85 atg 11
tgg 60 tgg 31 -29
cca 5 cca 6 1
atc 3 atc 6 3
ttc 7 ttc 13 6
atgj 114 atg 138 24
C34. Comparaison cdc8-cdc-psor 19
cdc8 19aas psor 23aas
gene intercal gene intercal diff
16s 321 16s 196
23s 181 23s 213
5s 6 5s 5
aac 6 tta 13 -2
tta 15 atg 15 8
atgf 7 gaa 9 0
gaa 9 gga 6 1
gga 5 gta 5 0
gta 5 gac 16
gac 9 aac 31
aca 14 aac 4
tac 10 aca 4 -10
cta 28 tac 11
aga 7 gga 19
caa 89 aga 6 -1
tca 3 caa 12
ttc 6 aaa 6
atgj 11 tca 11
atgi 29 agc 6
cca 7 cca 6
cac 8 atg 11
aaa 353 tgg 31
cca 6
atc 6
ttc 13
atg 138
cdc8 19aas cdc8 18aas
gène intercal gène intercal diff
cds 214
cds 554
cds 0
16s 321 cds 167
23s 181 23s° 132
5s 6 5s 6
aac 6 aac 4
tta 15 gaa 5
atgf 7 gta 5 0
gaa 9 gac 11 2
gga 5 aca 14 0
gta 5 tac 9
gac 9 gga 10
aca 14 aga 9 2
tac 10 caa 11
cta 28 aaa 2
aga 7 tca 18
caa 89 agc 8
tca 3 cca 85
ttc 6 tgg 60
atgj 11 cca 5
atgi 29 atc 3
cca 7 ttc 7
cac 8 atgj 114
aaa 353

cdc8 cdc psor 9[modifier | modifier le wikicode]

  • Lien tableur: cdc8 cdc psor 9
  • Lien cdc psor: le tableau de comparaison cdc-psor
  • Légende
    - 23s': possible 23S ribosomal RNA but does not have good blast hits on one or both of the ends.
    - 23s°: 23S ribosomal RNA rRNA prediction is too short
    - cca: marque les tRNAs différents entre les 2 génomes.
    - diff pour différence entre les intercalaires (intercal) colonne de droite moins colonne de gauche.
    - séquences identiques (bordure épaisse): Une séquence identique entre les 2 génomes est encadrée par 2 tRNAs différents (cyan) dans l'un et par 2 bordures épaisses dans l'autre.
  • Notes:
    - Sont comparés ici des suites courtes, en intra cdc8 18aas/9aas et 19aas/9aas, cdc8 9aas/cdc 9aas et cdc8 VII1/psor VII1.
    - cdc8 9aas et cdc 9aas sont identiques
    - cdc8 9aas se retrouve entièrement (sauf 1 tRNA) dans cdc8 19aas avec cependant des diff élevés, mais il est très différent de cdc8 18aas (4 tRNAs différents).
    - La comparaison cdc8 VII1/psor VII1: le groupe de psor à 3 blocs 16s-gca-23s5s est caractérisé en plus par la séquence courte tta-atg (atg supposé atgi). On retrouve le bloc du milieu, VII1 dans cdc8, à l'envers (compléments) et on retrouve partiellement le bloc de fin VIII1 à l'endroit. Dans cdc8 ces blocs sont partiellement abîmés et se trouvent dans le groupe à 15 rRNAs (voir cdc8_blocs). Attention aux diff qui suivent le changement de sens.
    - 3 intercalaires sont préservés entre cdc8 VII1 et celui de psor, 16s-gca5s-ttatta-atgi. De même pour 16s-gca du bloc VIII1.
C3. Comparaison cdc8-cdc-psor 9
C35. Comparaison cdc8-cdc-psor 9
cdc8 18aas cdc8 9aas
gene intercal gene intercal diff
cds 214
cds 554
cds 0 cds 281
cds 167 16s° 100
23s° 132 23s° 126
5s 6 5s 7
aac 4 aac 6
gaa 5 tta 15
gta 5 atgf 7
gac 11 gaa 8
aca 14 gga 4
tac 9 gta 5 0
gga 10 gac 10
aga 9 ggc 9
caa 11 aga 954
aaa 2 cds
tca 18
agc 8
cca 85
tgg 60
cca 5
atc 3
ttc 7
atgj 114
cdc8 19aas cdc8 9aas
gene intercal gene intercal diff
cds 281
16s 321 16s° 100
23s 181 23s° 126
5s 6 5s 7
aac 6 aac 6 0
tta 15 tta 15 9
atgf 7 atgf 7 -8
gaa 9 gaa 8 1
gga 5 gga 4 -5
gta 5 gta 5 0
gac 9 gac 10
aca 14 ggc 9
tac 10 aga 954
cta 28 cds
aga 7
caa 89
tca 3
ttc 6
atgj 11
atgi 29
cca 7
cac 8
aaa 353
C36. Comparaison cdc8-cdc-psor groupe
cdc8 9aas cdc 9aas
gene intercal gene intercal diff
cds 281 16s 52
16s° 100 gca 373
23s° 126 23s 126
5s 7 5s 7
aac 6 aac 5 -1
tta 15 tta 15 0
atgf 7 atgf 7 0
gaa 8 gaa 14 6
gga 4 gga 5 1
gta 5 gta 5 0
gac 10 gac 10 0
ggc 9 ggc 9 0
aga 954 aga 975 21
cds cds
cdc8 I4 cdc VIII1
gene intercal gene intercal diff
16s 68
16s 217 gca 271
23s 126 23s 126 0
5s 216 5s 213 -3
cds 372 cds 372 0
cds 21 cds 21 0
cds 778 cds 776 -2
16s 261 16s 52
23s 201 gca 373
5s 5 23s 126 -75
5s 7 2
psor VII1 cdc8 VII1
gene intercal gene intercal diff
CDS 431 cds 179
16s 54 16s 161
gca 114 5s 201
23s 193 23s 217
5s 5 16s 108
tta 9 atgi 11 2
atg 123 tta 5 0
16s 54 5s 201 8
gca 114 23s 375 261
23s 193 gca 52 -2
5s 5 16s’ 100 -23
tta 9 16s’ 52
atg 123 gca 248
16s 54 23s° 100 -2
gca 114 16s° 321 134
23s 78 23s' 100
5s 100 16s° 320
CDS 23s° 100
23s’ 126
5s 127
cds

cdc8 cdc protéines[modifier | modifier le wikicode]

  • Notes:
    - L'altération poussée des rRNAs dans cdc8 qui saute aux yeux quand on comapre les blocs en tRNAs et intercalaires, m'a poussé à comparer les tailles en pbs ici des rRNAs et des cds qui les entourent avec l'idée que ces cds sont issus de la conversion de ces rRNAs. D'où l'idée de création de gène par conversion à l'instar du processus CRISPR.

Alignement sur cdc[modifier | modifier le wikicode]

  • Lien tableur: Alignement sur cdc
  • Lien noms abrégés
  • Légende: abrégé pour noms abrégés des protéines.
    - 23s': possible 23S ribosomal RNA but does not have good blast hits on one or both of the ends.
    - 23s°: 23S ribosomal RNA rRNA prediction is too short
    - SigB: Protéine existant dans cdc et cdc8 mais est décalée dans cdc8 par les grands remaniements. Voir alignement sur cdc8, tableau qui suit.
  • Notes:
    - cdc présente 15 clusters avec ou sans rRNAs. 5 clusters sans rRNAs sont reproduits tels quels dans cdc8. Les clusters avec rRNAs se répartissent en 3 16sgca23s et 7 16s23s. Dans cdc8 les 3 16sgca23s sont modifiés ou altérés, 3 16s23s sont altérés et les 4 autres sont reproduits tels quels.
    - Les 3 16sgca23s5s perdent leur gca mais gardent le 5s. Deux sont durement altérés dont un porte une séquence de 9 tRNAs et l'autre rien. La modification du 3ème consiste en la suppression du gca seulement sans tocher le reste. Cependant l'intercalaire 16s-23s de 415 pbs dans cdc est divisé par 2 dans cdc8, 217 pbs.
    - Les 3 16s23s5s altérés le sont fortement, 2 portent des séquences longues de tRNAs, 43 et 18, le 3ème est sans tRNAs.
    - La colonne "ordre dans cdc" servira à repérer les grands remaniement quand je ferai l'alignement sur cdc8. De même pour les protéines en bleu foncé.
C3. cdc-cdc8, alignement des protéines sur cdc
C37. cdc protéines
ordre sens adresse gene intercal pbs abrégé
0 dir 9857..10630 cds 179 774 SigB
dir 10810..12317 16s 52 1508
dir 12370..12445 gca 249 76
1 dir 12695..15596 23s 111 2902
dir 15708..15824 5s 126 117
dir 15951..16460 cds 11 510 NadR
dir 16472..17353 cds 457 882 mecano
dir 17811..19082 cds 319 1272 S-ligase
dir 19402..19857 cds 0 456 Nuc-de
dir 19858..19949 tcc 37 92
2 dir 19987..20251 ncRNA 76 265
dir 20328..21965 cds 1638 III-tau
comp 23419..24624 cds 505 1206 Glyco-tr
dir 25130..26637 16s 279 1508
dir 26917..29816 23s 180 2900
dir 29997..30113 5s 6 117
3 dir 30120..30194 aac 6 75
dir **41aas 12
dir 33877..33952 gta 75 76
dir 34028..34441 cds 308 414 hp-414
dir 34750..38181 cds 3432 pyruvate
dir 127011..127715 cds 281 705 CwlD
dir 127997..129505 16s 279 1509
dir 129785..132685 23s 131 2901
dir 132817..132933 5s 6 117
4 dir 132940..133014 aac 4 75
dir **16aas 8
dir 134534..134610 atgj 114 77
dir 134725..136115 16s 68 1391
dir 136184..136259 gca 271 76
dir 136531..139430 23s 126 2900
dir 139557..139673 5s 213 117
comp 139887..141071 cds 372 1185 B6
5 dir 141444..143795 cds 21 2352 Art-red
dir 143817..144356 cds 776 540 Art-reda
dir 145133..146640 16s 52 1508
dir 146693..146768 gca 373 76
dir 147142..150041 23s 126 2900
dir 150168..150284 5s 7 117
6 dir 150292..150366 aac 5 75
dir **7aas 6
dir 150976..151049 aga 975 74
dir 152025..152864 cds 840 TIGR
dir 378341..380728 cds 583 2388 cad
dir 381312..382819 16s 311 1508
dir 383131..386030 23s 126 2900
7 dir 386157..386273 5s 177 117
dir 386451..387059 cds 609 DedA
comp 833130..833894 cds 258 765 DeoR
8 dir 834153..834243 agc 87 91
dir 834331..835119 cds 789 flagellar
dir 1089165..1090139 cds 239 975 Mannosyl
dir 1090379..1091886 16s 320 1508
dir 1092207..1095106 23s 91 2900
dir 1095198..1095271 gga 8 74
9 dir 1095280..1095396 5s 273 117
dir 1095670..1097688 cds 2019 Ala amid
comp 1181549..1182958 cds 1374 1410 MBOAT
10 comp 1184333..1184415 ttg 318 83
dir 1184734..1187382 cds 2649 PolyI
dir 1835768..1837498 cds 109 1731 NhaC
11 dir 1837608..1837688 cta 231 81
<dir 1837920..1838093 cds 174 HXXEE
dir 2981767..2982444 cds 159 678 SrtB
comp 2982604..2982678 aca 94 75
comp 2982773..2985672 23s 184 2900
12 comp 2985857..2987364 16s 340 1508
dir 2987705..2988643 cds 939 lactam
comp 3787361..3788431 cds 454 1071 ABC
comp 3788886..3789002 5s 126 117
13 comp 3789129..3792028 23s 281 2900
comp 3792310..3793817 16s 191 1508
comp 3794009..3794587 cds 579 precorrin
comp 3944262..3944453 cds 119 192 DUF378
comp 3944573..3944689 5s 126 117
14 comp 3944816..3947715 23s 217 2900
comp 3947933..3949440 16s 282 1508
comp 3949723..3950004 cds 221 282 hp-282
comp 3950226..3951755 cds 1530 K-ligase
dir 4084445..4085437 cds 382 993 DnaC
comp 4085820..4085894 aca 33 75
15 comp 4085928..4086003 gta 4 76
comp 4086008..4086082 gaa 6 75
comp 4086089..4086164 aaa 326 76
comp 4086491..4087780 cds 1290 succinate
C38. cdc8 protéines
sens adresse gene intercal pbs abrégé
dir 4194196..4196423 23s’ 100 2228
dir 4196524..4197091 16s° 320 568
dir 4197412..4199044 23s° 100 1633
dir 4199145..4201593 23s’ 126 2449
dir 4201720..4201836 5s 127 117
dir 4201964..4202473 cds 11 510 NadR
dir 4202485..4203366 cds 458 882 mecano
dir 4203825..4205096 cds 320 1272 S-ligase
dir 4205417..4205872 cds 0 456 Nuc-de
dir 4205873..4205964 tcc 37 92
dir 4206002..4206266 ncRNA 76 265
dir 4206343..4207980 cds 1638 III-tau
dir 4306341..4307538 16s 0 1198
dir 4307539..4308225 cds 100 687 xylose
dir 1..796 23s° 181 796
dir 978..1094 5s 6 117
dir 1101..1175 aac 6 75
dir **41aas 12
dir 4868..4943 gta 75 76
dir 5019..5432 cds 308 414 hp-414
dir 5741..9172 cds 3432 pyruvate
dir 4300349..4300807 cds 554 459 Helix
dir 4301362..4303101 cds 0 1740 hp-1740
dir 4303102..4303305 cds 167 204 hp-204
dir 4303473..4304299 23s° 132 827
dir 4304432..4304548 5s 6 117
dir 4304555..4304629 aac 4 75
dir **16aas 8
dir 4306150..4306226 atgj 114 77
dir 4232593..4234098 16s 217 1506
dir 4234316..4237215 23s 126 2900
dir 4237342..4237458 5s 216 117
comp 4237675..4238859 cds 372 1185 B6
dir 4239232..4241583 cds 21 2352 Art-red
dir 4241605..4242144 cds 778 540 Art-reda
dir 94032..94736 cds 281 705 CwlD
dir 95018..95994 16s° 100 977
dir 96095..97613 23s° 126 1519
dir 97740..97856 5s 7 117
dir 97864..97938 aac 6 75
dir **7aas 6
dir 98542..98615 aga 954 74
dir 99570..100409 cds 840 TIGR
dir 306829..309216 cds 733 2388 cad
<>comp 309950..310076 cds 1 127 seleno
dir 310078..311313 23s° 126 1236
dir 311440..311556 5s 177 117
dir 311734..312342 cds 609 DedA
comp 861856..862620 cds 258 765 DeoR
dir 862879..862969 agc 87 91
dir 863057..863845 cds 789 flagellar
dir 1106477..1107451 cds 238 975 Mannosyl
dir 1107690..1109197 16s 320 1508
dir 1109518..1112416 23s 91 2899
dir 1112508..1112581 gga 8 74
dir 1112590..1112706 5s 273 117
dir 1112980..1114998 cds 2019 Ala amid
comp 1196804..1198213 cds 1378 1410 MBOAT
comp 1199592..1199674 ttg 318 83
dir 1199993..1202641 cds 2649 PolyI
dir 1850896..1852626 cds 109 1731 NhaC
dir 1852736..1852816 cta 334 81
dir 1853151..1853666 cds 516 HXXEE
dir 3024038..3024715 cds 150 678 SrtB
comp 3024866..3024940 aca 93 75
comp 3025034..3027933 23s 184 2900
comp 3028118..3029625 16s 374 1508
dir 3030000..3030938 cds 939 lactam
comp 3875816..3876886 cds 452 1071 ABC
comp 3877339..3877455 5s 125 117
comp 3877581..3880480 23s 261 2900
comp 3880742..3882249 16s 190 1508
comp 3882440..3883018 cds 579 precorrin
comp 4017523..4017714 cds 118 192 DUF378
comp 4017833..4017949 5s 126 117
comp 4018076..4020975 23s 321 2900
comp 4021297..4022804 16s 292 1508
comp 4023097..4023378 cds 221 282 hp-282
comp 4023600..4025129 cds 1530 K-ligase
dir 4135881..4136873 cds 383 993 DnaC
comp 4137257..4137331 aca 33 75
comp 4137365..4137440 gta 4 76
comp 4137445..4137519 gaa 6 75
comp 4137526..4137601 aaa 331 76
comp 4137933..4139222 cds 1290 succinate

Alignement sur cdc8[modifier | modifier le wikicode]

  • Lien tableur: Alignement sur cdc8
  • Lien noms abrégés
  • Légende:
    - 23s': possible 23S ribosomal RNA but does not have good blast hits on one or both of the ends.
    - 23s°: 23S ribosomal RNA rRNA prediction is too short
    - SigB: Protéine existant dans cdc et cdc8 mais est décalée dans cdc8 par les grands remaniements. Voir alignement sur cdc, tableau précédent.
  • Notes:
    - Ici je n'ai pas fait de parallélisme cdc8/cdc. Il suffit de voir la colonne ordre de cdc décrit dans le tableau précédent (alignement sur cdc) pour se rendre compte des grands remaniements du chromosome. Dans cette colonne j'ai ajouté "insert" pour insertion par rapport à cdc.
    - Pour comparer cdc8 à psor pour certains clusters j'ai du intervertir l'ordre des tableaux, le tableau de gauche doit être la suite de celui de droite.
    - Les insertions accumulent les 2 grands groupes qu'on a vu dans cdc8-blocs, à 15 et 23 rRNAs. Par contre en dehors des insertions on trouve 3 groupes altérés à 1 ou 2 clusters, et tous les groupes non altérés sauf l'ordre 5 de cdc.
    - comparaison avec psor: on devine les types VI VII VIII, mais il y a de nouveau type le IV4 par exemple qu'on a signalé dans cdc8-blocs.
C3. cdc-cdc8, alignement des protéines sur cdc8
C40. cdc8 début
cdc8
ordre cdc sens adresse gène intercal pbs abrégé
insert dir 4299490..4300134 cds 214 645 Y-r1
insert dir 4300349..4300807 cds 554 459 Helix
dir 4301362..4303101 cds 0 1740 hp-1740
dir 4303102..4303305 cds 167 204 hp-204
dir 4303473..4304299 23s° 132 827
4 dir 4304432..4304548 5s 6 117
dir 4304555..4304629 aac 4 75
dir 4304634..4304708 gaa 5 75
dir 4304555..4304629 aac 4 75
dir **16aas 8
dir 4306150..4306226 atgj 114 77
dir 4306341..4307538 16s 0 1198
dir 4307539..4308225 cds 100 687 xylose
dir 1..796 23s° 181 796
3 dir 978..1094 5s 6 117
dir 1101..1175 aac 6 75
dir **41aas 12
dir 4868..4943 gta 75 76
dir 5019..5432 cds 308 414 hp-414
dir 5741..9172 cds 3432 pyruvate
dir 94032..94736 cds 281 705 CwlD
dir 95018..95994 16s° 100 977
dir 96095..97613 23s° 126 1519
6 dir 97740..97856 5s 7 117
dir 97864..97938 aac 6 75
dir **7aas 6
dir 98542..98615 aga 954 74
dir 99570..100409 cds 840 TIGR
<> cp 309950..310076 cds 1 127 seleno
dir 310078..311313 23s° 126 1236
7 dir 311440..311556 5s 177 117
dir 311734..312342 cds 609 DedA
comp 861856..862620 cds 258 765 DeoR
8 dir 862879..862969 agc 87 91
dir 863057..863845 cds 789 flagellar
dir 1106477..1107451 cds 238 975 Mannosyl
dir 1107690..1109197 16s 320 1508
dir 1109518..1112416 23s 91 2899
dir 1112508..1112581 gga 8 74
9 dir 1112590..1112706 5s 273 117
dir 1112980..1114998 cds 2019 Ala amid
comp 1196804..1198213 cds 1378 1410 MBOAT
10 comp 1199592..1199674 ttg 318 83
dir 1199993..1202641 cds 2649 PolyI
dir 1850896..1852626 cds 109 1731 NhaC
11 dir 1852736..1852816 cta 334 81
dir 1853151..1853666 cds 516 HXXEE
dir 3024038..3024715 cds 150 678 SrtB
comp 3024866..3024940 aca 93 75
12 comp 3025034..3027933 23s 184 2900
comp 3028118..3029625 16s 374 1508
dir 3030000..3030938 cds 939 lactam
insert dir 3805298..3806743 cds 208 1446 Y-r2
insert comp 3806952..3807028 agg 61 77
insert <comp 3807090..3808790 cds 1701 fdHa
comp 3875816..3876886 cds 452 1071 ABC
comp 3877339..3877455 5s 125 117
13 comp 3877581..3880480 23s 261 2900
comp 3880742..3882249 16s 190 1508
comp 3882440..3883018 cds 579 precorrin
comp 4017523..4017714 cds 118 192 DUF378
comp 4017833..4017949 5s 126 117
14 comp 4018076..4020975 23s 321 2900
comp 4021297..4022804 16s 292 1508
comp 4023097..4023378 cds 221 282 hp-282
comp 4023600..4025129 cds 1530 K-ligase
dir 4135881..4136873 cds 383 993 DnaC
comp 4137257..4137331 aca 33 75
15 comp 4137365..4137440 gta 4 76
comp 4137445..4137519 gaa 6 75
comp 4137526..4137601 aaa 331 76
comp 4137933..4139222 cds 1290 succinate
C40. cdc8 suite
cdc8 psor
ordre cdc sens adresse gène intercal pbs abrégé adresse gène intercal pbs abrégé 
0 dir 4178197..4178970 cds 179 774 SigB 127845..129260 CDS 100 1416 R-deca
insert dir 4179150..4180587 16s 161 1438 127628..127744 5s 78
insert comp 4180749..4180865 5s 201 117 124628..127549 23s 114
insert comp 4181067..4183959 23s 217 2893 124438..124513 gca 54
insert comp 4184177..4185684 16s 108 1508 122877..124383 16s 123
insert comp 4185793..4185869 atgi 11 77 122677..122753 atg 9
insert comp 4185881..4185969 tta 5 89 122579..122667 tta 5
insert comp 4185975..4186091 5s 201 117 122457..122573 5s 193
insert comp 4186293..4189192 23s 375 2900 119347..122263 23s 114
insert comp 4189568..4189643 gca 52 76 119157..119232 gca 54
insert comp 4189696..4190959 16s’ 100 1264 117596..119102 16s 123
insert dir 4191060..4192225 16s’ 52 1166 117396..117472 atg 9
insert dir 4192278..4192353 gca 248 76 117298..117386 tta 5
insert dir 4192602..4193197 23s° 100 596 117176..117292 5s 193
insert dir 4193298..4193874 16s° 321 577 114067..116982 23s 114
insert dir 4194196..4196423 23s’ 100 2228 113877..113952 gca 54
dir 4196524..4197091 16s° 320 568 112316..113822 16s 431
1 dir 4197412..4199044 23s° 100 1633 111345..111884 CDS 540 Art-reda
dir 4199145..4201593 23s’ 126 2449
dir 4201720..4201836 5s 127 117
dir 4201964..4202473 cds 11 510 NadR
dir 4202485..4203366 cds 458 882 mecano
dir 4203825..4205096 cds 320 1272 S-ligase
dir 4205417..4205872 cds 0 456 Nuc-de
dir 4205873..4205964 tcc 37 92
2 dir 4206002..4206266 ncRNA 76 265
dir 4206343..4207980 cds 1638 III-tau
insert comp 4209435..4210639 cds 496 1205 Glyco-tr
insert 4211136..4212643 16s 321 1508
insert 4212965..4213127 23s° 100 163
insert <>comp 4213228..4213849 cds 622 CHAP
insert comp 4213961..4214620 cds 228 660 A-1chlor
insert dir 4214849..4216199 16s 321 1351
insert dir 4216521..4217008 23s° 101 488
insert comp 4217110..4218529 23s° 250 1420
insert comp 4218780..4218855 gca 52 76
insert comp 4218908..4219471 16s° 100 564
insert comp 4219572..4219856 23s° 217 285
insert comp 4220074..4221581 16s 179 1508
insert >comp 4221761..4222206 cds 386 446 SigB2 3452349..3452552 CDS 239 204 hp-204
insert dir 4222593..4224100 16s 321 1508 3450603..3452109 16s 196
insert dir 4224422..4227321 23s 181 2900 3447492..3450406 23s 213
insert dir 4227503..4227619 5s 6 117 3447162..3447278 5s 5
insert dir 4227626..4227700 aac 6 75 3447068..3447156 tta 13
insert dir 4227707..4227792 tta 15 86 3446979..3447054 atg 15
insert dir 4227808..4227883 atgf 7 76 3446889..3446963 gaa 9
insert dir 4227891..4227965 gaa 9 75 3446806..3446879 gga 6
insert dir 4227975..4228048 gga 5 74 3446724..3446799 gta 5
insert dir 4228054..4228129 gta 5 76 3446642..3446718 gac 16
insert dir 4228135..4228211 gac 9 77 3446550..3446625 aac 31
insert dir 4228221..4228295 aca 14 75 3446443..3446518 aac 4
insert dir 4228310..4228394 tac 10 85 3446364..3446438 aca 4
insert dir 4228405..4228488 cta 28 84 3446275..3446359 tac 11
insert dir 4228517..4228593 aga 7 77 3446190..3446263 gga 19
insert dir 4228601..4228676 caa 89 76 3446094..3446170 aga 6
insert dir 4228766..4228854 tca 3 89 3446012..3446087 caa 12
insert dir 4228858..4228933 ttc 6 76 3445924..3445999 aaa 6
insert dir 4228940..4229016 atgj 11 77 3445829..3445917 tca 11
insert dir 4229028..4229104 atgi 29 77 3445727..3445817 agc 6
insert dir 4229134..4229210 cca 7 77 3445644..3445720 cca 6
insert dir 4229218..4229294 cac 8 77 3445561..3445637 atg 11
insert dir 4229303..4229378 aaa 353 76 3445474..3445549 tgg 31
insert comp 4229732..4229848 5s 126 117 3445366..3445442 cca 6
insert comp 4229975..4232010 23s’ 582 2036 3445283..3445359 atc 6
dir 4232593..4234098 16s 217 1506 3445201..3445276 ttc 13
dir 4234316..4237215 23s 126 2900 3445111..3445187 atg
dir 4237342..4237458 5s 216 117
comp 4237675..4238859 cds 372 1185 B6
5 dir 4239232..4241583 cds 21 2352 Art-red
dir 4241605..4242144 cds 778 540 Art-reda
insert dir 4242923..4244459 16s 261 1537
insert dir 4244721..4247619 23s 201 2899
insert dir 4247821..4247937 5s 5 117 111345..111884 CDS 431 540 Art-reda
insert dir 4247943..4248031 tta 11 89 112316..113822 16s 54
insert dir 4248043..4248119 atgi 108 77 113877..113952 gca 114
insert dir 4248228..4249735 16s 184 1508 114067..116982 23s 193
insert dir 4249920..4250564 23s° 100 645 117176..117292 5s 5
insert <dir 4250665..4250923 cds 112 259 hp-259 117298..117386 tta 9
insert comp 4251036..4253145 23s’ 375 2110 117396..117472 atg 123
insert comp 4253521..4253596 gca 52 76 117596..119102 16s 54
insert comp 4253649..4254226 16s° 282 578 119157..119232 gca 114
insert dir 4254509..4254712 cds 12 204 hp-204 119347..122263 23s 193
insert dir 4254725..4256002 cds 1278 phagePP 122457..122573 5s 5
122579..122667 tta 9
début début début début début début début 122677..122753 atg 123
insert dir 4299490..4300134 cds 214 645 Y-r1 122877..124383 16s 54
insert dir 4300349..4300807 cds 554 459 Helix 124438..124513 gca 114
dir 4301362..4303101 cds 0 1740 hp-1740 124628..127549 23s 78
dir 4303102..4303305 cds 167 204 hp-204 127628..127744 5s 100
4 dir 4303473..4304299 23s° 132 827 127845..129260 CDS 1416 R-deca

cdc8 cdc création de cds[modifier | modifier le wikicode]

  • Lien tableur: cdc8 cdc création de cds
  • Lien abrégé
  • Notes:
    - Dans la colonne abrégé sont marqués les cds spécifiques à cdc8, cyan dans Alignement sur cdc8.
    - Certains de ces cds, étant donné leur position dans un bloc de rRNAs dégradés, seraient des candidats de gènes créés de novo lors des conversions qui ont altéré ce bloc. Il est évident qu'on peut toujours rétorquer que ce gène a été copié ou intégré à ce niveau par la conversion. Mais si ce gène ou plusieurs n'existaient pas dans cdc mais seulement dans cdc8, alors l'hypothèse de création de novo serait renforcée.
    - 7 gènes de cdc8, Y-r1 Helix xylose seleno CHAP A-1chlor sigB2, répondent aux critères de la conversion mais n'existent pas dans cdc. Ces cds sont colorés en jaunes et repérés par leur taille en pbs.
    - 4 gènes parmi les 7, seleno CHAP A-1chlor sigB2, n'existent qu'en un seul exemplaire, et ne peuvent donc être extraits à la limite que d'un cds hypothétique, hypothetical protein.
    - Les 3 gènes restants, Y-r1 Helix xylose, ont des cds analogues, c.a.d portant le même nom dans mes recherches et pourraient être extraits de ces analogues d'autant plus qu'ils ont des noms portant la mention type ou domaine.
    - Le gène PhagePP est à la limite du critère de conversion puisqu'il est en fin de bloc mais séparé de 12 pbs du cds hp-204 qui est plus proche de la création de novo puisqu'il est hypothétique. Il appartiendrait au 2ème groupe de gènes ayant des analogues. Cependant j'ai trouvé un gène dans cdc et un gène dans psor qui ont des tailles quasi identiques. Aussi j'ai recherché les cdcs encadrant ces gènes, ils sont tous différents dans les 3 génomes. PhagePP serait analogue donc à Y-r1 Helix xylose.
    Le nom complet du cds Clp est "Clp protéase" et celui de PhageHM est "phage head morphogenesis, SPP1 gp7 family domain protein".
    - J'ai inclue aussi 2 cds appartenant à un cluster sans rRNA, Y-r2 et fdhA. Y-r2 avec sa taille de 1446 se comporte comme Y-r1, il n'existe pas dans cdc. fdhA est le contre exemple de cds qui n'est pas créé de novo, il n'est pas dans une zone altérée par la conversion des rRNA, et il existe dans cdc, mais pas dans psor qui est plus loin phylogénétiquement.
C3. cdc8 cdc création de cds
abrégé cdc8 pbs cdc pbs psor pbs
seleno A 309950..310076 127 0 -
Y-r 457663..457878 216 457207..457422 216 -
1237414..1237986 573 1223841..1224413 573
1291413..1292327 915 1277836..1278750 915
1418672..1419580 909 1405262..1406170 909
2120221..2121348 1128
2785863..2786042 180
3564835..3565434 600
Y-r2 3805298..3806743 1446
Y-r1 4299490..4300134 645
Helix 351106..351336 231 391813..392001 189 -
379952..380503 552 429510..430061 552
456588..456776 189 461727..462398 672
1187185..1187736 552 1169984..1170535 552
1466364..1466783 420 1292255..1292926 672
1467749..1468147 399 1454375..1454773 399
1605760..1606344 585 1517855..1518619 765
1694358..1694750 393 1592306..1592890 585
1936722..1937267 546 1682266..1682658 393
2105662..2106711 1050 1695592..1696284 693
2196549..2198204 1656 1916424..1916630 207
2342487..2342690 204 1922813..1923358 546
2353934..2354578 645 2164151..2165806 1656
2378761..2379891 1131 2308386..2308589 204
2721795..2722316 522 2319833..2320477 645
3485137..3486024 888 2344477..2345607 1131
3570953..3571183 231 2501260..2501931 672
3571660..3571878 219 2688255..2688776 522
3804379..3804627 249 3459701..3460588 888
3804878..3805279 402 3475449..3475589 141
4286854..4287222 369
4288799..4289518 720
4300349..4300807 459
xylose 3383443..3384780 1338 3349843..3351180 1338 0
<4307539..4308225 687
CHAP <4213228..>4213849 622 0 -
A-1chlor 4213961..4214620 660 0 0
SigB2 4221761..4222206 446 0 0
fdHa 4221761..4222206 1701 3711229..3713373 2145 -
R-deca 0 0 127845..129260 1416
876023..877522 1500
phagePP 1448919..1449983 1065 1435547..1436611 1065 1489507..1490769 1263
1450539..1450985 447 1437167..1437613 447
1709611..1711050 1440 1697521..1698963 1443
1718404..1718844 441 1708192..1708632 441
3560756..3561910 1155 3841162..3842367 1206
4254725..4256002 1278
4260531..4261586 1056
4262058..4262474 417
hp-204 4254509..4254712 204
phagePP 4254725..4256002 1278
phageHM 4255980..4256741 762
hp-543 3840525..3841067 543
phagePP 3841162..3842367 1206
hydrolase 3842345..3842512 168
terminase 1487770..1489491 1722
phagePP 1489507..1490769 1263
Clp 1490762..1491607 846

cdc8 cdc abrégé protéines[modifier | modifier le wikicode]

C3. C39 abrégé des protéines
abrégé nom protéine
A-1chlor type A-1 chloramphenicol O-acetyltransferase
ABC ABC transporter ATP-binding protein
Ala amid N-acetylmuramoyl-L-alanine amidase
Art-red anaerobic ribonucleoside triphosphate reductase
Art-reda anaerobic ribonucleoside-triphosphate reductase activating protein
B6 pyridoxal phosphate-dependent aminotransferase
cad cadmium-translocating P-type ATPase
CHAP CHAP domain-containing protein
CwlD N-acetylmuramoyl-L-alanine amidase CwlD
DedA DedA family protein
DeoR DeoR/GlpR transcriptional regulator
DnaC DNA replication protein DnaC
DUF378 DUF378 domain-containing protein
fdHa formate dehydrogenase subunit alpha
flagellar flagellar motor protein
Glyco-tr glycosyl transferase
Helix helix-turn-helix domain-containing protein
hp-1740 hp-1740
hp-204 hp-204
hp-282 hp-282
hp-414 hp-414
HXXEE HXXEE domain-containing protein
III-tau DNA polymerase III subunit gamma/tau
K-ligase lysine--tRNA ligase
lactam delta-lactam-biosynthetic de-N-acetylase
Mannosyl Mannosyl-glycoprotein endo-beta-N-acetylglucosamidase
MBOAT MBOAT family protein
mecano mechanosensitive ion channel
NadR transcription repressor NadR
NhaC Na+/H+ antiporter NhaC family protein
Nuc-de nucleoside deaminase
phagePP phage portal protein
PolyI DNA polymerase I
precorrin bifunctional precorrin-2 dehydrogenase/sirohydrochlorin ferrochelatase
pyruvate pyruvate carboxylase
R-deca arginine decarboxylase
seleno glycine/sarcosine/betaine reductase complex selenoprotein A
SigB SigB/SigF/SigG family RNA polymerase sigma factor
SigB2 B/F/G family RNA polymerase sigma-70 factor
S-ligase serine--tRNA ligase
SrtB sortase SrtB
succinate adenylosuccinate synthase
TIGR TIGR00159 family protein
xylose xylose isomerase
Y-r1 tyrosine-type recombinase/integrase – 1
Y-r2 tyrosine-type recombinase/integrase – 2

cdc8 cdc psor stats[modifier | modifier le wikicode]

C3 cdc8 cdc psor base NCBI
NCBI du 13.11.19 cdc8 cdc psor
date 15-MAR-2017 18-MAY-2017 08-JAN-2018
DNA circulaire 4 308 325 4 110 554 3 550 458
Genes (total) 4 025 3 807 3 528
CDS (total) 3 870 3 691 3 368
Genes (coding) 3 763 3 615 3 327
CDS (coding) 3 763 3 615 3 327
Genes (RNA) 155 116 160
RRNAs (5S, 16S, 23S) 14, 16, 13 9, 10, 10 17, 17, 17
complete rRNAs 14, 16, 13 9, 10, 10 17, 17, 17
tRNAs 108 83 105
ncRNAs 4 4 4
Pseudo Genes (total) 107 76 41
Pseudo Genes (ambiguous residues) 0 of 107 0 of 76 0 of 41
Pseudo Genes (frameshifted) 60 of 107 42 of 76 4 of 41
Pseudo Genes (incomplete) 35 of 107 30 of 76 18 of 41
Pseudo Genes (internal stop) 31 of 107 18 of 76 22 of 41
Pseudo Genes (multiple problems) 18 of 107 12 of 76 3 of 41
CRISPR Arrays 4 9 -
Décompte du 19.11.19
hypothetical protein 609 523 1 256
hp / cds (total) 0,16 0,14 0,37

cdc8 remarques[modifier | modifier le wikicode]

  • Lien noms abrégés
  • Liens pour ce chapitre:  noms abrégésopéronscumulsblocscdc8 cdc psor 43cdc8 cdc psor 18cdc8 cdc psor 9Alignement sur cdcAlignement sur cdc8.
  • Remarques des 7 @ dans opérons :
    1. @ Dans la comparaison cdc8-cdc du bloc à 18aas, les rRNAs 23s et 16s disparaissent. Les 4 cds récupérés et le 23s° (voir opérons pour les noms et les longueurs des cds)
      - correspondraient à la somme des longueurs de 16s (1500 pbs) et 23s (2900 pbs), soit 4400 pbs
      - correspondraient à la longueur totale entre le 1er cds et le 5s, 4304299-4299490 = 4810 pbs
      - la somme des 4 cds récupérés et du 23s° est de 3875 pbs. Les longueurs des cds en aas sont dans l'ordre 215 153 580 68.
      - Le plus intéressant c'est que, si on suppose que les 2 protéines hypothétiques 580 et 68 sont dues aux remaniements,
      - les 2 protéines qui les précèdent sont qualifiées de type intégrase et de protéine contenant un domaine. C'est comme si les remaniements (certainement des conversions géniques) utilisaient une partie d'un gène protéique comme matrice de copie.
    2. @ configuration de bloc peu courante, avec gga: même bloc que cdc et psor.
    3. @ configuration de bloc peu courante, avec aca, et perte de 5s: même bloc que cdc et psor sans 5s.
    4. @ On retrouve le groupe1 de psor, avec 2 gca: VII1 en comp suivi de VIII1 en dir
      - L’intercalaire 23s-gca de VII1 est de 375, beaucoup plus élevé que celui de psor , 114.
      - De même pour VIII1, 248 contre 114.
    5. @ Conservation du bloc tcc-ncRNA dans cdc8 cdc et psor, avec les mêmes intercalaires.
    6. @ Conservation des 3 cds , avec leurs intercalaires, du seul groupe de cdc, mais les gca disparaissent.
    7. @ Nouveau bloc analogue au VI1 et VII1 de psor, sans gca, et qui n’existe pas chez cdc: 16s23s5s-tta-atgi. Avec ces 2 dernières remarques c'est comme si les remaniements des blocs à RNA consistaient à supprimer les gca des blocs 16sgca23s5s, et en le faisant ils laissaient des morceaux de 16s et 23s.
  • Décompte des rRNAs de cdc8 d'après Alignement sur cdc8.
Les RNAs		
16s	14	
16s’	2	
16s°	5	
23s	9	
23s’	4	
23s°	11	
5s	14	
taille d’un bloc normal		
16s	16	1508  soit 10/14
23s	13	2900  soit  9/9
5s	14	117   soit 14/14
  • Notes:
    - Les autres cds créés création de cds
    - Alignement sur cdc8: cdc8 résulte d'une recombinaison d'une clostridia de type cdc et d'une autre de type psor Alignement sur cdc8
    - Orientation des créations stats: soit création en masse par la mobilité et l'insertion des blocs 16s23s5s (cas de psor) puis dégradation de ces blocs dans une étape intermédiaire (cas de cdc8) qui aboutit à un état stable (cas de cdc), soit création par une évolution progressive de cdc vers psor en passant par cdc8. Le 1er cas serait soutenu la proportion très élevée des hp par rapport au total de 37% (voir stats) alors que le 2ème cas serait soutenu par par le type IV4 de cluster dans cdc8 et n'existe ni dans cdc ni dans psor, 16s23s5s-tta-atgi (voir alignement sur cdc8).
    - Les 3 types de création: avec altération des rRNAs (cdc8), dans les blocs 16s23s5s ou 16s-aaas-23s5s (décompte des cds dans un échantillon de clostridia) et après les blocs à la suite des tRNAs ou non (psor opérons).
    - Hypothèse de la création des gènes [8]

cdc8 distribution[modifier | modifier le wikicode]

  • Lien tableur: cdc8 distribution
  • Notes: Tableau Cl32
    - -5s: gga et aca
    - 1-3: 2 tta et 2 atgi
Cl3 cdc8, Peptoclostridium difficile M68. clostridia.
Cl31 cdc. La distribution des tRNAs sans rRNA.
g1    t1       
atgi tct tat atgf
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc tcc 1 tac tgc
atc acc aac agc 1
ctc ccc cac cgt
gtc gcc gac ggc
tta tca taa tga
ata aca 1 aaa 1 aga
cta 1 cca caa cga
gta 1 gca gaa 1 gga
ttg 1 tcg tag tgg
atgj acg aag agg 1
ctg ccg cag cgg
gtg gcg gag ggg
clos >1aa =1aa -5s +5s -16s +16s total
cdc8 4 5* 9
Cl32 psor. La distribution des tRNAs avec rRNA.
g1    t1       
atgi 5 tct tat atgf 4
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc 4 tcc tac 4 tgc 2
atc 1 acc aac 5 agc 1
ctc ccc cac 3 cgt 1
gtc gcc gac 5 ggc 2
tta 6 tca 4 taa tga
ata aca 5 aaa 5 aga 5
cta 3 cca 4 caa 4 cga
gta 6 gca 4 gaa 5 gga 6
ttg tcg tag tgg 1
atgj 4 acg aag agg
ctg ccg cag cgg
gtg gcg gag ggg
clos >1aa =1aa -5s +5s -16s +16s total
cdc8 2* 93* 4 99

Clostridium botulinum CDC_297[modifier | modifier le wikicode]

  • Notes: Il n'y a pas de code KEGG pour ce génome, je lui ai donné le code cbc*, mais pour les têtes de chapitre je mets cbc.

cbc opérons[modifier | modifier le wikicode]

  • Lien tableur: cbc* opérons
  • Liens: gtRNAdb [9], NCBI [10], génome
  • Phylogénie: Bacteria; Firmicutes; Clostridia; Clostridiales; Clostridiaceae;Clostridium.
  • Légende:
    - cyan pour les doubles signalés par le signe + dans la colonne doubles.
    - cds, ce cds a la particularité d'être très court et collé au cluster à rRNA. Il fait 108 pbs et sa séquence est,
    MNEGCDRILIVVARWQVSKNKKMLTKIKKRATIIKH.
    - @ voir le chapitre remarques de ce génome.
C4. Clostridium botulinum CDC_297
28%GC 30.6.19 Paris  52  doubles intercal  aa  avec aa
comp 1309334..1309408 gag
comp 1385938..1386012 aac 8
comp 1386021..1386134 5s 108
comp 1386243..1389140 23s 228
comp 1389369..1390866 16s @1
comp 1392997..1393072 ttc 7
comp 1393080..1393193 5s 108
comp 1393302..1396199 23s 228
comp 1396428..1397925 16s
comp 1408673..1408762 tcc
comp 1412183..1412259 agg
comp 1415464..1415540 cgt 84 84
comp 1415625..1415715 agc + 20 20
comp 1415736..1415826 tca 2 agc 306 306
comp 1416133..1416223 agc 2 tca 20 20
comp 1416244..1416334 tca @4
comp 1425969..1426044 gca 3 3
comp 1426048..1426124 atgi 8
comp 1426133..1426246 5s 79
comp 1426326..1427823 16s @2 117
comp 1427941..1428051 cds
1694943..1695017 cag
comp 1722580..1722664 tac 5 5
comp 1722670..1722745 aca
comp 1841437..1841510 tgc
comp 1842698..1842811 5s 108
comp 1842920..1845817 23s 228
comp 1846046..1847543 16s
1890534..1890608 gaa + 17 17
1890626..1890701 gta 3 gaa 9 9
1890711..1890787 gac 3 gta 4 4
1890792..1890867 aca 3 gac 5 5
1890873..1890947 gaa 2 aca 18 18
1890966..1891041 gta 7 7
1891049..1891125 gac 57 57
1891183..1891257 gaa 17 17
1891275..1891350 gta 9 9
1891360..1891436 gac 4 4
1891441..1891516 aca
comp 1948153..1948228 cca
1969157..1969245 tta 4 4
1969250..1969325 atgf + 53 53
1969379..1969454 atgf 2 atgf 10 10
1969465..1969541 atg
1987541..1989040 16s @3 226
1989267..1992166 23s 93
1992260..1992375 5s 7
1992383..1992457 aac + 27 27
1992485..1992559 aac
2013239..2013313 ggg 18 18
2013332..2013407 acc
2222515..2222590 tgg
2294767..2294842 cca + 7 7
2294850..2294923 gga 2 cca 6 6
2294930..2295006 aga 2 gga 5 5
2295012..2295087 aag 26 26
2295114..2295189 cca 29 29
2295219..2295292 gga 24 24
2295317..2295393 cga
2402556..2402631 gta 5 5
2402637..2402713 gac 3 3
2402717..2402792 ttc 4 4
2402797..2402871 ggc 9 9
2402881..2402954 tgc
2517305..2517391 ttg
2548708..2548792 ctc
2583298..2583388 tga

cbc cumuls[modifier | modifier le wikicode]

C4. cumuls. Clostridium botulinum CDC_297
opérons Fréquences intercalaires tRNAs
effectif gammes sans rRNAs avec rRNAs
avec rRNA opérons 5 1 0 0
16 23 5s 0 1 20 22 1
16 atc gca 0 40 3 1
16 23 5s a 3 60 2 0
max a 2 80 0 0
a doubles 1 100 1 0
spéciaux 1 120 0 0
total aas 6 140 0 0
sans opérons 17 160 0 0
1 aa 10 180 0 0
max a 11 200 0 0
a doubles 4 0 0
total aas 46 28 2
total aas 52
remarques 4
avec jaune moyenne 17 15
variance 19
sans jaune moyenne 15
variance 14

cbc blocs[modifier | modifier le wikicode]

C4. Clostridium botulinum CDC_297, cbc* blocs
aac 8 7 -
5s 108 108 108 226
23s 228 228 228 93
16s - 7
gca 3
atgi 8
5s 79
16s

cbc remarques[modifier | modifier le wikicode]

@1	Les 4 blocs 16.23.5.aa ont des intercalaires identiques à 1 base près.
	- 1 a 0aa, 2 ont 1aa et 1 a 2aas (@3.
	
@2	C’est 1 bloc 16.23.5.aa qui a perdu 23s.
	- L'intercalaire 5s-aa est le même que pour les 4 blocs de @1.
	- Il a 2aas dont le 1er est atgi, rare avec les rRNAs.
	- Il est précédé d'une protéine de 36aas avec un intercalaire de 117.
	- Est-ce qu'elle appartient à l'opéron?
	
@3	C’est 1 bloc 16.23.5.aa  de @1 avec 1 aa double.
	- L'intercalaire 23-5  est très faible, 14% de moins par rapport à @1, 15/108.
	
@4	Dépassement de la règle des intercalaires, 210 bases, 306. 
	- Il se trouve entre 2 séquences de 2 aas.
	- Est-ce 2 opérons?
	
Séquences des doubles : 	
	- 1 opéron à 1 doublet.
	- 2 opérons à 2 séquences de 2 aas chacun.
	- 1 opéron de 11 aas avec 4 séquences de 3 aas, moins 1 aa.

cbc distribution[modifier | modifier le wikicode]

  • Lien tableur: cbc distribution
  • Notes:
    - 1-3aas: gca atgi aac ttc aac2
    - >1aa: atgf2
Cl4 cbc. Clostridium botulinum CDC_297 . clostridia.
g1    t1       
atgi 1 tct tat atgf 2
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc 2 tcc 1 tac 1 tgc 2
atc acc 1 aac 3 agc 2
ctc 1 ccc cac cgt 1
gtc gcc gac 4 ggc 1
tta 1 tca 2 taa tga 1
ata aca 3 aaa aga 1
cta cca 3 caa cga 1
gta 4 gca 1 gaa 3 gga 2
ttg 1 tcg tag tgg 1
atgj 1 acg aag 1 agg 1
ctg ccg cag 1 cgg
gtg gcg gag 1 ggg 1
clos >1aa =1aa -5s +5s -16s +16s total
cbc* 36 10 6* 52

Clostridium botulinum BKT015925[modifier | modifier le wikicode]

cbn opérons[modifier | modifier le wikicode]

  • Lien tableur: cbn opérons
  • Liens: gtRNAdb [11], NCBI [12], génome
  • Phylogénie: Bacteria; Firmicutes; Clostridia; Clostridiales; Clostridiaceae;Clostridium.
  • Légende:
    - cyan pour les doubles signalés par le signe + dans la colonne doubles.
    - @ voir le chapitre remarques de ce génome.
C5. Clostridium botulinum BKT015925
28%GC 30.6.19 Paris  86  doubles intercal  aa  avec aa
20666..20741 acg
36413..36487 gaa + 12 12
36500..36575 gta 2 gaa 13 13
36589..36665 gac 2 gta 5 5
36671..36746 aca 2 gac 18 18
36765..36839 gaa 2 aca 12 12
36852..36927 gta 13 13
36941..37017 gac 5 5
37023..37098 aca
137366..137441 cca
161964..162052 tta + 5 5
162058..162133 atgf 3 tta 5 5
162139..162215 atgj 3 atgf 46 46
162262..162350 tta 2 atgj 5 5
162356..162431 atgf 30 30
162462..162538 atgj 46 46
162585..162673 tta 5 5
162679..162754 atgf
76258..176332 aac
180177..181695 16s @5 233
181929..184836 23s 45
184882..184956 aac + 14
184971..185087 5s 7
185095..185169 aac 2 aac
222409..222484 acc
comp 578417..578492 cag
comp 944747..944833 ttg
955546..955630 ctt
1026946..1027021 gta 17 17 17
1027039..1027115 gac 14 14 14
1027130..1027205 ttc 4 4 4
1027210..1027284 ggc 8 8 8
1027293..1027367 tgc + 57 57 57
1027425..1027499 tgc 2 tgc
comp 2030816..2030890 aac 45
comp 2030936..2033842 23s 96
comp 2033939..2034015 atc 7 7
comp 2034023..2034098 gca 121
comp 2034220..2035734 16s
comp 2283768..2283884 5s 95
comp 2283980..2286886 23s 233
comp 2287120..2288638 16s @3 464
comp 2289103..2289176 gga 15 15
comp 2289192..2289268 atc 7 7
comp 2289276..2289351 gca
comp 2350598..2350674 cga + 21 21
comp 2350696..2350769 gga 4 gga 28 28
comp 2350798..2350873 aaa 2 aaa 4 4
comp 2350878..2350952 caa 2 caa 4 4
comp 2350957..2351032 cac 2 cac 5 5
comp 2351038..2351112 aag 3 aag 3 3
comp 2351116..2351192 aga 3 aga 6 6
comp 2351199..2351272 gga 2 cca 4 4
comp 2351277..2351352 cca 2 ggc 21 21
comp 2351374..2351449 aag 5 5
comp 2351455..2351531 aga 5 5
comp 2351537..2351610 gga 5 5
comp 2351616..2351690 ggc 3 3
comp 2351694..2351777 cta 22 22
comp 2351800..2351875 aaa 4 4
comp 2351880..2351954 caa 4 4
comp 2351959..2352034 cac 5 5
comp 2352040..2352115 aag 5 5
comp 2352121..2352197 aga 5 5
comp 2352203..2352276 gga 5 5
comp 2352282..2352356 ggc 6 6
comp 2352363..2352438 cca
comp 2432784..2432859 tgg
comp 2454880..2454964 tac + 39 39
comp 2455004..2455079 gta 2 tac 8 8
comp 2455088..2455172 tac 4 4
comp 2455177..2455252 aca
comp 2697795..2697911 5s @1 31
comp 2697943..2700847 23s 233
comp 2701081..2702599 16s
comp 2703946..2704021 aaa 311 311
comp 2704333..2704408 ttc 5
comp 2704414..2704530 5s 336
comp 2704867..2704942 ttc 5
comp 2704948..2705064 5s 97
comp 2705162..2708066 23s 233
comp 2708300..2709814 16s
comp 2721253..2721328 aaa @2 5
comp 2721334..2721450 5s 95
comp 2721546..2724452 23s 233
comp 2724686..2726203 16s
comp 2731902..2731976 gag 61 61
comp 2732038..2732112 caa 6 6
comp 2732119..2732195 aga 4 4
comp 2732200..2732273 gga 19 19
comp 2732293..2732376 cta 16 16
comp 2732393..2732467 gaa 4
comp 2732472..2732588 5s 97
comp 2732686..2735592 23s @4 94
comp 2735687..2735763 atc 3
comp 2735767..2735842 gca 74
comp 2735917..2737435 16s
comp 2742262..2742351 tcc
comp 2743220..2743312 tcg
comp 2743891..2743967 agg
comp 2748534..2748610 cgt 144 144
comp 2748755..2748845 agc 23 23
comp 2748869..2748959 tca + 69 69
comp 2749029..2749119 tca 2 tca
comp 2758688..2758763 gca 4 4
comp 2758768..2758844 atgi 3
comp 2758848..2758964 5s 73
comp 2759038..2761942 23s 233
comp 2762176..2763694 16s
comp 2150504..2150620 5s 31
comp 2150652..2153560 23s 233
comp 2153794..2155308 16s
comp 2169525..2169641 5s 32
comp 2169674..2172579 23s 233
comp 2172813..2174331 16s
sur plasmide tgg

cbn cumuls[modifier | modifier le wikicode]

C5. cumuls. Clostridium botulinum BKT015925
opérons Fréquences intercalaires tRNAs
effectif gammes sans rRNAs avec rRNAs
avec rRNA opérons 10 1 0 0
16 23 5s 0 3 20 34 9
16 gca atc 2 40 7 0
16 23 5s a 4 60 3 0
max a 8 80 1 1
a doubles 1 100 0 0
spéciaux 1 120 0 0
total aas 22 140 0 0
sans opérons 18 160 1 0
1 aa 12 180 0 0
max a 22 200 0 0
a doubles 6 0 0
total aas 64 46 10
total aas 86
remarques 5
avec jaune moyenne 17
variance 25
sans jaune moyenne 14 14
variance 15 17

cbn blocs[modifier | modifier le wikicode]

C5. Clostridium botulinum BKT015925, cbn blocs
5s 31 31 32
23s 233 233 233
16s
ttc 5
5s 336
aaa 5 3 ttc 5
5s 95 73 5s 95 5s 97
23s 233 233 23s 233 23s 233
16s aaa atgi 16s 464 16s
gga 15
16s 233
23s 45
aac 14
5s 7
aac
gaa 4
5s 97 aac 45
23s 94 23s 96
atc 3 atc 7
gca 74 gca 121
16s 16s

cbn remarques[modifier | modifier le wikicode]

*Remarques
@1	Les 3 opérons 16-23-5s ont les mêmes intercalaires, 233-31 bases.
	
@2	Les 4 opérons 16-23-5s -aa  ont tous à peu près les mêmes intercalaires 233-95-5.
	- Mais ils sont tous différents:
	+ 1 seul  opéron répond au critère des intercalaires, il a 1aa.
	+ 1 seul opéron ne répond pas strictement au critère des intercalaires.
	Ses 3aas sont du côté du 16s et l’intercalaire avec le 1er aa est très
	Élevé, 464.
	+ L'opéron à 2aas a l'intercalaire 23-5s très faible de 23% inférieur à 95, 22/95.
	+ L'opéron à 3aas répondant aux critères  a un 5s en plus.
	
@3	Le critère d’un intercalaire entre 2aas, supérieur à 210 bases, se trouve 
	dans le 4ème opéron à rRNA, mais il est accompagné d’un intercalaire très
	élevé entre 5s et le 1er aa, comme pour le 2ème opéron à rRNA.
	
@4	C’est un opéron à rRNA atypique : 2aas double entourant le 5s.
	- Mais coserve l’intercalaire 16-23s de 233 bases comme les 7 opérons de ce type.
	
@5	Les 2 opérons à 16-atc gca présentent, ici, la particularité d’inverser ses 2 aas, gca-atc.
	- Ils ont aussi, à peu près,  les mêmes intercalaires 16-gca-atc-23s, 74 4 94.
	- L'opéron à rRNA présentant le max d'aas, au nombre de 8, est de ce type.
	Il a le même intercalaire 23-5s que tous les autres opérons à rRNA, 97 bases.
	
*Séquences des doubles :  tous les opérons à plus de 3aas ont des doubles, 6/6.	
	- Les répétitions vont de 5 à 2.
	- 3 opérons sur 6 ont des séquences qui se répètent, avec 22aas et 2 avec 8aas.
	- L'opéron contenant le max d'aas, 22, a 2 séquences de 6 aas qui se répètent.
	- On peut repérer dans cet opéron d'autres séquences de 3 aas.
	- Ces séquences sont séparées par 1 ou 2 aas différents.

cbn distribution[modifier | modifier le wikicode]

  • Lien tableur: cbn distribution
  • Notes:
    - Tableau Cl51: gca, 1-3aas et -16s. aac, 1aa et 1-3aas.
    - Tableau Cl52: 4-8aas, gag caa aga gga cta gaa. >1aa, tgc2 et tca2 en gras.
Cl5 cbn, Clostridium botulinum BKT015925. clostridia.
Cl51 cbc. 1aa -16s 1-3aas. clostridia.
g1    t1       
atgi 1 tct tat atgf
att act aat agt
ctt 1 cct cat cgc
gtt gct gat ggt
ttc 2 tcc 1 tac tgc
atc 1 acc 1 aac 2 agc
ctc ccc cac cgt
gtc gcc gac ggc
tta tca taa tga
ata aca aaa 2 aga
cta cca 1 caa cga
gta gca 2 gaa gga 1
ttg 1 tcg 1 tag tgg 2
atgj acg 1 aag agg 1
ctg ccg cag 1 cgg
gtg gcg gag ggg
clos >1aa =1aa -5s +5s -16s +16s total
cbn 12 7* 3* 22
Cl52 cbn. >1aa -5s 4-8aas +16s.
g1    t1       
atgi tct tat atgf 3
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc 1 tcc tac 2 tgc 2
atc 2 acc aac 2 agc 1
ctc ccc cac 2 cgt 1
gtc gcc gac 3 ggc 3
tta 3 tca 2 taa tga
ata aca 3 aaa 2 aga 4
cta 2 cca 2 caa 3 cga 1
gta 4 gca 2 gaa 3 gga 5
ttg tcg tag tgg
atgj 2 acg aag 3 agg
ctg ccg cag cgg
gtg gcg gag 1 ggg
clos >1aa =1aa -5s +5s -16s +16s total
cbn 52 2* 6* 4 64

cbn intercalaires entre cds[modifier | modifier le wikicode]

  • Lien NCBI [13]
  • Note: Pour les génomes des annexes j'ai relevé les intercalaires entre tRNAs et entre ceux-ci et les cds qui leur sont adjacents. L'exemple est celui de rru du clade alpha. L'idée de départ de ces prélèvements est la recherche d'opérons formés de tRNA et de protéine comme dans le cas d'E.coli: l'intercalaire entre le tRNA et la protéine devrait être faible. Voir l'exemple d'eco (remarque @3) avec tac-tac-tpr et aca-tac-gga-acc-tufB.

cbn les fréquences[modifier | modifier le wikicode]

  • Lien tableur: cbn intercalaires entre cds
  • Légende:   long, longueur en pbs,   intercal pour intercalaire
    - fréquence-1 1 5 6 f, respectivement fréquence des intercalaires négatives à l'unité, positives à l'unité, par blocs de 5, par blocs de 10 jusqu'à 600 pbs et f pour finales. Ces fréquences servent à faire les diagrammes. La fréquence fréquencez est l'étendue à 1200 de la fréquence6 pour certains grands génomes.
    - cumul,% colonne à la droite de frequence6, reprend les fréquences par plages et leurs pourcentages indiqués déjà dans la 1ère partie du tableau.
    - La couleur cyan des fréquences fréquence-1 et 1 sert à montrer leur périodicité ternaire.
    - intercaln intercalx, pour les intercalaires négatifs minimaux et intercalaires positifs maximaux.
    - colonne ADN pour la longueur totale du génome en pbs et intercals pour le total en pbs des intercalaires entre cds uniquement, d'après la méthode des prélèvements de NCBI du 31.1.14.
cbn Les fréquences des intercalaires entre cds
cbn intercalaires total % intercalaires moyenne ecartype plage ADN intercal frequence5
négatif 176 7.1 négatif -11 10 -1 à -47 2 773 157 -1 176
zéro 11 0.4 intercals 0 11
1 à 200 1767 70.9 0 à 200 71 60 313 764 5 116
201 à 370 394 15.8 201 à 370 266 48 11.3% 10 66
371 à 600 117 4.7 371 à 600 464 65 15 121
601 à max 26 1.0 601 à 1028 810 204 20 93
total 2491 <201 78.4 total 2491 125 141 -47 à 1443 25 87
adresse intercalx intercal fréquence1 intercal fréquence6 cumul,% intercal fréquence-1 30 79
624731 1443 -1 176 -70 0 0 11 35 50
834812 1270 0 11 -60 0 -1 34 40 64
1909773 1149 1 38 -50 0 -2 0 45 44
1395656 1025 2 32 -40 4 -3 0 50 50
1366434 952 3 15 -30 4 min à -1 -4 28 55 60
2662601 856 4 14 -20 21 176 -5 0 60 35
1385645 836 5 17 -10 47 7.1% -6 1 65 56
754437 826 6 13 0 111 -7 5 70 41
1803918 777 7 12 10 182 -8 31 75 32
1826878 759 8 9 20 214 -9 1 80 38
1307165 753 9 11 30 166 -10 6 85 35
627889 751 10 21 40 114 1 à 100 -11 15 90 37
1388755 748 11 22 50 94 1201 -12 1 95 40
2579132 747 12 32 60 95 48.2% -13 2 100 46
1789056 745 13 22 70 97 -14 7 105 28
1830367 730 14 22 80 70 -15 0 110 26
841754 723 15 23 90 72 -16 3 115 35
1855513 710 16 21 100 86 -17 11 120 31
2136552 703 17 17 110 54 -18 0 125 41
390878 696 18 20 120 66 -19 2 130 33
943107 680 19 15 130 74 -20 7 135 25
2674137 655 20 20 140 54 -21 1 140 29
1095841 652 21 20 150 61 -22 1 145 30
2644575 626 22 18 160 52 -23 2 150 31
261153 625 23 15 170 64 1 à 200 -24 0 155 21
1887215 619 24 14 180 52 1767 -25 1 160 31
2676061 600 25 20 190 54 70.9% -26 2 5 34
2443011 582 26 12 200 46 -27 1 170 30
1811650 581 27 20 210 38 -28 1 175 27
1933429 576 28 16 220 41 -29 5 180 25
1797999 574 29 14 230 41 -30 0 185 23
2550424 574 30 17 240 34 -31 1 190 31
2050753 573 31 13 250 28 -32 1 195 23
923904 572 32 7 260 30 0 à 200 181 200 23
313619 570 33 15 270 21 1778 reste 6 205 19
1471664 569 34 8 280 14 total 187 210 19
1133306 567 35 7 290 19 215 17
262285 563 36 11 300 32 intercal frequencef 220 24
37 13 310 11 600 2465 225 25
38 9 320 12 620 1 230 16
39 17 330 16 640 2 235 17
40 14 340 16 201 à 370 660 2 240 17
reste 1628 350 13 394 680 1 245 15
total 2491 360 14 15.8% 700 1 250 13
370 14 720 2 255 15
380 13 740 2 260 15
adresse intercaln décalage long 390 7 760 6 265 10
1144166 -47 shift 2 1795 400 9 780 1 270 11
369225 -46 shift 2 3395 410 5 800 0 275 9
1579583 -44 shift 2 487 420 6 820 0 280 5
430053 -41 430 3 840 2 285 9
1494403 -35 440 2 860 1 290 10
1957540 -35 450 8 880 0 295 15
733250 -32 460 6 900 0 300 17
271633 -31 470 5 920 0 305 6
913392 -29 480 5 940 0 310 5
1503608 -29 490 6 960 1 315 9
1620962 -29 500 7 980 0 320 3
1725747 -29 510 6 1000 0 325 13
1823162 -29 520 1 1020 0 330 3
2449289 -28 530 1 371 à 600 1040 1 335 5
1086603 -27 540 11 117 1060 0 340 11
783920 -26 550 2 4.7% 1080 0 345 4
2471206 -26 560 2 1100 0 350 9
2107067 -25 570 4 601 à max 1120 0 355 10
292336 -23 580 5 26 1140 0 360 4
2553714 -23 590 2 1.0% 1160 1 365 8
2686151 -22 600 1 24 370 6
1577865 -21 reste 26 reste 2 reste 143
500363 -20 total 2491 total 2491 total 2491

cbn autres intercalaires[modifier | modifier le wikicode]

  • Lien tableur: cbn autres intercalaires
  • Légende:  
    - comp, le gène est sur le brin complement
    - deb, fin sont respectivement dans le sens des adresses croissantes, le cds avant le 1er tRNA et le cds après le dernier tRNA du bloc.
    - misc_f, pour misc_feature
    - misc_R, pour misc_RNA
cbn Les autres intercalaires.
cbn1 adresses1
deb-fin gènes adresses intercal sens
deb CDS 20118 206 comp
tRNA 20666 214
fin CDS 20956
deb CDS 34861 307 comp
tRNA 36413 12
tRNA 36500 13
tRNA 36589 5
tRNA 36671 18
tRNA 36765 12
tRNA 36852 13
tRNA 36941 5
tRNA 37023 106
fin CDS 37205 comp
deb CDS 135851 168 comp
tRNA 137366 131 comp
fin CDS 137573 comp
deb CDS 161395 158
tRNA 161964 5
tRNA 162058 5
tRNA 162139 46
tRNA 162262 5
tRNA 162356 30
tRNA 162462 46
tRNA 162585 5
tRNA 162679 480
fin CDS 163235 comp
deb CDS 174610 115
tRNA 176258 275
fin CDS 176608
deb CDS 178351 453
rRNA 180181 237
rRNA 181930 48
tRNA 184882 14
rRNA 184971 7
tRNA 185095 435
fin CDS 185605 comp
deb CDS 221558 140
tRNA 222409 106
fin CDS 222591
deb CDS 577193 60
tRNA 578417 67 comp
fin CDS 578560 comp
deb CDS 943937 261 comp
tRNA 944747 348 comp
fin CDS 945182
deb CDS 954881 59
tRNA 955546 82
fin CDS 955713
deb CDS 1025682 379
tRNA 1026946 17
tRNA 1027039 14
tRNA 1027130 4
tRNA 1027210 8
tRNA 1027293 57
tRNA 1027425 265
fin CDS 1027765
deb CDS 1679540 6
gene 1680008 128 comp
fin CDS 1681704 comp
cbn2 adresses2
deb-fin gènes adresses intercal sens
deb CDS 1865810 45
gene 1866395 88
fin CDS 1867620 comp
deb CDS 2029941 104
tRNA 2030816 48 comp
rRNA 2030939 97 comp
tRNA 2033939 7 comp
tRNA 2034023 124 comp
rRNA 2034223 423 comp
fin CDS 2036154 comp
deb CDS 2149914 128 comp
rRNA 2150504 34 comp
rRNA 2150655 237 comp
rRNA 2153797 424 comp
fin CDS 2155729 comp
deb CDS 2168490 590
rRNA 2169533 35 comp
rRNA 2169677 237 comp
rRNA 2172816 111 comp
fin CDS 2174439
deb CDS 2281037 144
rRNA 2283779 98 comp
rRNA 2283983 237 comp
rRNA 2287123 111 comp
deb CDS 2288746 117 comp
tRNA 2289103 15 comp
tRNA 2289192 7 comp
tRNA 2289276 233 comp
fin CDS 2289585 comp
deb CDS 2349136 199 comp
tRNA 2350598 21 comp
tRNA 2350696 28 comp
tRNA 2350798 4 comp
tRNA 2350878 4 comp
tRNA 2350957 5 comp
tRNA 2351038 3 comp
tRNA 2351116 6 comp
tRNA 2351199 4 comp
tRNA 2351277 21 comp
tRNA 2351374 5 comp
tRNA 2351455 5 comp
tRNA 2351537 5 comp
tRNA 2351616 3 comp
tRNA 2351694 22 comp
tRNA 2351800 4 comp
tRNA 2351880 4 comp
tRNA 2351959 5 comp
tRNA 2352040 5 comp
tRNA 2352121 5 comp
tRNA 2352203 5 comp
tRNA 2352282 6 comp
tRNA 2352363 73 comp
fin CDS 2352512 comp
deb CDS 2430767 295 comp
tRNA 2432784 58 comp
fin CDS 2432918 comp
cbn3 adresses3
deb-fin gènes adresses intercal sens
deb CDS 2453380 324 comp
tRNA 2454880 39 comp
tRNA 2455004 8 comp
tRNA 2455088 4 comp
tRNA 2455177 255 comp
fin CDS 2455508
deb CDS 2696774 138 comp
rRNA 2697803 34 comp
rRNA 2697946 237 comp
rRNA 2701084 423 comp
deb CDS 2703019 183 comp
tRNA 2703946 311 comp
tRNA 2704333 13 comp
rRNA 2704422 336 comp
tRNA 2704867 15 comp
rRNA 2704958 100 comp
rRNA 2705165 237 comp
rRNA 2708303 346 comp
fin CDS 2710157 comp
deb CDS 2720030 80 comp
tRNA 2721253 5 comp
rRNA 2721334 98 comp
rRNA 2721549 237 comp
rRNA 2724689 393 comp
fin CDS 2726593 comp
deb CDS 2730964 245 comp
tRNA 2731902 61 comp
tRNA 2732038 6 comp
tRNA 2732119 4 comp
tRNA 2732200 19 comp
tRNA 2732293 16 comp
tRNA 2732393 4 comp
rRNA 2732472 100 comp
rRNA 2732689 95 comp
tRNA 2735687 3 comp
tRNA 2735767 77 comp
rRNA 2735920 402 comp
fin CDS 2737834 comp
deb CDS 2740228 408 comp
tRNA 2742262 111 comp
deb CDS 2742463 64 comp
tRNA 2743220 69 comp
deb CDS 2743382 65 comp
tRNA 2743891 130 comp
fin CDS 2744098
deb CDS 2746633 95 comp
tRNA 2748534 144 comp
tRNA 2748755 23 comp
tRNA 2748869 69 comp
tRNA 2749029 61 comp
fin CDS 2749181 comp
deb CDS 2758098 125 comp
tRNA 2758688 4 comp
tRNA 2758768 3 comp
rRNA 2758848 76 comp
rRNA 2759041 237 comp
rRNA 2762179 369 comp
fin CDS 2764060 comp

cbn intercalaires tRNA[modifier | modifier le wikicode]

cbn intercalaires tRNA-cds[modifier | modifier le wikicode]
  • Lien tableur: cbn intercalaires tRNA-cds
  • Légende:
    - comp', l'intercalaire est entre un gène comp (sur le complément) et un gène sur le brin direct. Continu les 2 gènes sont sur le même brin.
    - deb, fin sont les intercalaires des cds du tableau précédent, autres intercalaires: respectivement dans le sens des adresses croissantes, le cds avant le 1er tRNA et le cds après le dernier tRNA du bloc.
  • Cumuls comp'+continu du tableau
	deb	fin	total
<201	14	11	25
total	22	18	40
taux	64%	61%	63%
cbn intercalaires tRNA
cbn les relevés deb-fin
comp’ deb comp’ fin
comp’ 206 214
comp’ 307 comp’ 106
168 131
158 comp’ 480
115 275
comp’ 435
140 106
comp’ 60 67
261 comp’ 348
59 82
379 265
comp’ 104
199 73
295 58
324 comp’ 255
183
80
245
408 111
64 69
65 comp’ 130
98 61
125
cbn intercalaires inférieures à 201 pbs
deb fin continu cumuls
59 58
64 61 deb
65 67 <201 12
80 69 total 18
98 73 taux 67%
115 82
125 106 fin
140 111 <201 9
158 131 total 12
168 214 taux 75%
183 265
199 275 total
245 <201 21
261 total 30
295 taux 70%
324
379
408 comp’ cumuls
60 106 deb 2
104 130 4
206 255 fin 2
307 348 6
- 435 total
- 480 <201 4
total 10
taux 40%
cbn intercalaires tRNA-tRNA[modifier | modifier le wikicode]
  • Lien tableur: cbn intercalaires tRNA-tRNA
  • Légende:
    - comp', l'intercalaire est entre un gène comp (sur le complément) et un gène sur le brin direct. Continu les 2 gènes sont sur le même brin. Il n'y a pas d'intercalaire à cheval sur les 2 brins dans ce relevé.
    - 2 intercalaires entre tRNAs entourés de rRNAs ne sont pas dans ce relevé. ils ont respectivement 7 et 3 pbs.
inter	freq		inter	freq
3	2		18	1
4	9		19	1
5	14		21	2
6	3		22	1
7	1		23	1
8	2		28	1
9	0		30	1
10	0		39	1
11	0		46	2
12	2		57	1
13	2		61	1
14	1		69	1
15	1		144	1
16	1		311	1
17	1		total	55

cbn intercalaires rRNA[modifier | modifier le wikicode]

  • Voir la présentation des blocs à rRNA dans le chapitre cbn blocs de l'étude préliminaire. A comparer avec le tableau cbn autres intercalaires.
  • Remarque: Quand le 16s n'est pas précédé de tRNAs l'intercalaire cds-16s est élevé alors que l'intercalaire cds-bloc de l'autre côté du bloc est beaucoup plus faible. Cette orientation est quasiment générale chez tous les génomes que j'ai étudié ici. Je l'ai notée dans les chapitres génome-bloc de chaque génome. Pour cbn il y a 10 blocs et seulement 2 sont inversés. Voici ci-dessous les 10 blocs avec leur orientation dans l'ordre des adresses croissantes. La colonne +- indique la présence ou non de tRNAs après le 5s. Les blocs des rangs 4 et 5 sont inversés.
rang	cds-16s	5s-cds	tRNA
1	453	435	+
2	423	104	+
3	424	128	-
4	111	590	-
5	111	144	-
6	423	138	-
7	346	183	+
8	393	80	+
9	402	245	+
10	369	125	+
  • Note: J'ai supposé souvent que les blocs à tRNA sans rRNA sont aussi orientés de l'intercalaire le plus grand au plus petit. Dans cbn cumuls et de même pour les autres génomes, j'ai noté cette orientation dans la colonne cdsd, pour cds dirigé. Je n'ai conservé pour les calculs que le plus petit intercalaire des 2 cds bordant le bloc. L'idée était que cette orientation provoquait la création du cds en fin de bloc. Ces cds sont souvent de petites protéines et souvent hypothétiques. Aussi je présente ci-dessous la transformation deb-fin qui est imposée par l'adressage en intercalaire plus grand et plus petit.
deb	fin		tri	grand	petit
206	214		12	295	58
307	106		9	82	59
168	131		7	67	60
158	480		17	98	61
115	275		15	69	64
140	106		16	130	65
60	67		11	199	73
261	348		2	307	106
59	82		6	140	106
379	265		14	408	111
199	73		5	275	115
295	58		3	168	131
324	255		4	480	158
408	111		1	214	206
64	69		13	324	255
65	130		8	348	261
98	61		10	379	265

Clostridium lentocellum DSM 5427[modifier | modifier le wikicode]

cle opérons[modifier | modifier le wikicode]

  • Lien tableur: cle opérons
  • Liens: gtRNAdb, NCBI [14], génome
  • Phylogénie: Bacteria; Firmicutes; Clostridia; Clostridiales; Lachnospiraceae;Cellulosilyticum.
  • Légende:
    - cyan pour les doubles signalés par le signe + dans la colonne doubles.
    - @ voir le chapitre remarques de ce génome.
  • Note: il n'y apas de gtRNAdb. Aussi j'ai comparé (EXACT NB.CAR STXT) les 1ers atgf atgi atgj du génome cdc, avec les atg de cle.
C6. Clostridium lentocellum DSM 5427
34.3%GC 30.6.19 Paris  104  doubles intercal  aa  avec aa
10157..10246 agc @1 202
10449..11981 16s 72
12054..12171 5s 4
12176..12248 gca 262
12511..15414 23s 55
15470..15543 gac 61 61
15605..15677 gta 7 7
15685..15757 aca 34 34
15792..15872 tac 12 12
15885..15961 atgj 3 3
15965..16040 ttc 3 3
16044..16116 aaa
30118
46235..47767 16s @3 21284
69052..71964 23s
4873
76838..78371 16s 72
78444..78561 5s 5
78567..78639 gca 282
78922..81829 23s
904
82734..82851 5s 4
82856..82928 ggc
1463
84392..85929 16s 72
86002..86119 5s 4
86124..86196 gca 280
86477..89386 23s
7380
96767..96884 5s 89
96974..97047 ggc
5082
102130..102204 cag
104716..104799 tta 13 13
104813..104898 tca
141499..143034 16s 138
143173..143290 5s 7
143298..143374 atc 258
143633..146538 23s
150968..151085 5s @4 4
151090..151161 gaa 457
151619..153160 16s 605
153766..156671 23s 475
157147..157219 aaa 9 9
157229..157299 gga 6 6
157306..157379 aga
4223
161603..161720 5s 4
161725..161797 ggc
11104
172902..172973 gaa 23 23
172997..173071 cca 45 45
173117..173189 aaa 11 11
173201..173274 gac 56 56
173331..173403 gta 7 7
173411..173494 tta 187 187
173682..173754 aca 26 26
173781..173861 tac 10 10
173872..173948 atgj 31 31
173980..174052 ttc
248498
422551..424086 16s
113898
537985..540890 23s
25153
566044..566117 cac 23 23
566141..566212 caa 32 32
566245..566330 tca
571984..573519 16s 72
573592..573709 5s 4
573714..573786 gca 282
574069..576975 23s
25302
602278..603812 16s 137
603950..604067 5s
11014
615082..617987 23s
21159
639147..639362 16s° @5
98139
737502..737619 5s 4
737624..737696 ggc
3291
740988..741058 gga
759839..759920 cta
911999..912083 ctt + 148 148
912232..912316 ctt 2 ctt
1035192..1035265 cga
1061152..1061225 agg
comp 1136376..1136448 ccc
1229184..1230718 16s @2 72
1230791..1230908 5s 7
1230916..1230989 atc 53 53
1231043..1231115 gca 261
1231377..1234282 23s 110
1234393..1234464 aac + 9 9
1234474..1234545 gaa 2 tgc 6 6
1234552..1234622 tgc 2 aac 23 23
1234646..1234717 aac 58 58
1234776..1234846 tgc
1280211..1280283 atgf
1283250..1283320 gga + 5 5
1283326..1283399 aga 2 gga 5 5
1283405..1283478 cac 2 aga 31 31
1283510..1283581 caa 2 caa 23 23
1283605..1283677 aaa 30 30
1283708..1283792 cta 23 23
1283816..1283886 gga 5 5
1283892..1283965 aga 6 6
1283972..1284043 caa
1299560..1299632 ggc 4 4
1299637..1299711 cca
1346208..1346290 ctg
1363346..1363428 ctg
1515234..1515305 gaa 62 62
1515368..1515442 cca 22 22
1515465..1515537 aaa
1597292..1597364 acg
1611976..1612042 acg
2065352..2065425 ata
comp 2090478..2090550 acc
2394421..2394501 tac 3 3
2394505..2394577 ttc
2592342..2592422 ttg
2606024..2606104 ttg
comp 2737232..2737304 gcc
comp 2798802..2798874 aag
comp 2881571..2881642 gag
comp 3215471..3215545 cca
comp 3252582..3252655 atgj 7 7
comp 3252663..3252735 gta 4 4
comp 3252740..3252813 gac 10 10
comp 3252824..3252896 tgg 20 20
comp 3252917..3252988 aac
683
comp 3253672..3253748 atgj 7 7
comp 3253756..3253828 gta 9 9
comp 3253838..3253910 tgg 18 18
comp 3253929..3254000 aac 60
comp 3254061..3256967 23s
362637
comp 3619605..3619677 aca + 4 4
comp 3619682..3619755 cgt 2 cgt 50 50
comp 3619806..3619879 cgt 2 aca 27 27
comp 3619907..3619990 tta 3 3
comp 3619994..3620069 gta 47 47
comp 3620117..3620190 gac 22 22
comp 3620213..3620289 atgi 23 23
comp 3620313..3620385 aca 14 14
comp 3620400..3620471 gaa 9 9
comp 3620481..3620552 aac 110
comp 3620663..3623568 23s 261
comp 3623830..3623902 gca 53 53
comp 3623956..3624029 atc 7
comp 3624037..3624154 5s 72
comp 3624227..3625761 16s 149
comp 3625911..3625999 tcc 33 33
comp 3626033..3626118 tca
comp 3714637..3714709 gta 1 1
comp 3714711..3714787 atgj

cle cumuls[modifier | modifier le wikicode]

C7.cumuls. Clostridium lentocellum DSM 5427
opérons Fréquences intercalaires
effectifs gammes sans rRNAs avec rRNAs
avec rRNA opérons 19 1 1 0
16 5 aa 23 5 20 14 15
16 5 atc gca 2 40 10 6
solo 11 60 2 5
max a 14 80 1 1
a doubles 2 100 0 0
indéterminé 1 120 0 0
total aas 46 140 0 0
sans opérons 29 160 1 0
1 aa 19 180 0 0
max a 10 200 1 0
a doubles 2 0 0
total aas 59 30 27
total aas 105
remarques 5
avec jaune moyenne 29
variance 41
sans jaune moyenne 19 22
variance 16 19

cle blocs[modifier | modifier le wikicode]

C6. Clostridium lentocellum DSM 5427, cle blocs
Solitaires
16s *2 16s° @5
23s *3
5s 3*4 89
ggc
aac 60
23s
16s 137
5s
16s 72 72 72
5s 5 4 4
gca 282 280 282
23s
agc 202
16s 138 16s 72
5s 7 5s 4
atc 258 gca 262
23s 23s 55
gac 61
aac 110
16s 72 23s 261
5s 7 gca 53
atc 53 atc 7
gca 261 5s 72
23s 110 16s 149
aac 9 tcc 33
5s 4 @4
gaa 457
16s 605
23s 475
aaa 9

cle remarques[modifier | modifier le wikicode]

Remarques :	Pas de blocs 16-23-5s ni de séquence 16-atc-gca-23.
	
@1	5 blocs 16-5-aa-23s avec les mêmes intercalaires, à peu près, 72 4 280.
	- 4 blocs avec gca dont 3 à 1aa et 1 avec 9aas. 
	- Le bloc à 9aas a un aa avant le 16s, compatible.
	- 1 bloc avec atc seul et les intercalaires modifiées, 138 7 258.
	
@2	2 blocs 16-5-atc-gca-23s, avec les mêmes intercalaires, 72 7 53 261.
	- Les 2 blocs contiennent des doubles, 2 paires chacun avec 7 et 14aas.
	- Le bloc contenant le max de 14aas a 2aas avant le 16s compatibles.
	
@3	Les solos ne contiennent qu’un seul rRNA avec ou sans aas.
	- 5s-1aa, il y en a 4 et l'intercalaire est équivalente de celle des blocs.
	- 23s, il y en a 4 dont 1 seul avec 4aas
	- 16s, 2 sans aas et 1 du 16s5s avec une intercalaire comme le bloc atc, 137.
	
@4	Apparemment un trio de solos. Les 3 intercalaires supérieures à 450 permettent
	de diviser le groupe en 3 opérons, 5saa avec une intercalaire semblable aux 
	autres 5saa, 23s avec 3aas aux petites intercalaires et 1 16s sasns aas.
	
@5	16s°: 16S ribosomal RNA rRNA prediction is too short
	
Séquences des doubles : très peu de doublons. 	
	- 2 opérons avec rRNAs ont des doublons sur 5 possédant au moins 2 aas.
	- 2 opérons sans rRNAs sur 10 possédant au moins 2 aas.
	- 4 doublons pour chaque type d'opérons.
	- 1 seule paire répétée chez les opérons sans rRNAs.

cle distribution[modifier | modifier le wikicode]

  • Lien tableur: cle distribution
  • Notes:
    - Tableau Cl61: ctt2 en gras, très rare
    - Tableau Cl62
    1-3aas: aaa aga gga
    -5s: Ces 5s sont seuls sans 16s ni 23s. Ce sont 4 5s ggc et 1 5s gaa
    Blocs à rRNA: ils ont la forme 16s5saa23s
    cgt2 double en gras
Cl6 cle, Clostridium lentocellum DSM 5427. clostridia.
Cl61 cle. Distribution des blocs sans rRNA.
g1    t1       
atgi tct tat atgf 1
att act aat agt
ctt 2 cct cat cgc
gtt gct gat ggt
ttc 2 tcc tac 2 tgc
atc acc 1 aac 1 agc
ctc ccc 1 cac 2 cgt
gtc gcc 1 gac 2 ggc 1
tta 2 tca 2 taa tga
ata 1 aca 1 aaa 3 aga 2
cta 2 cca 4 caa 3 cga 1
gta 3 gca gaa 2 œ 3
ttg 2 tcg tag tgg 1
atgj 3 acg 2 aag 1 agg 1
ctg 2 ccg cag 1 cgg
gtg gcg gag 1 ggg
clos >1aa =1aa -5s +5s -16s +16s total
cle 40 19 59
Cl62 cle. Distribution des blocs avec rRNA.
g1    t1       
atgi 1 tct tat atgf
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc 1 tcc 1 tac 1 tgc 2
atc 3 acc aac 4 agc 1
ctc ccc cac cgt 2
gtc gcc gac 2 ggc 4
tta 1 tca 1 taa tga
ata aca 3 aaa 2 aga 1
cta cca caa cga
gta 3 gca 6 gaa 3 gga 1
ttg tcg tag tgg 1
atgj 2 acg aag agg
ctg ccg cag cgg
gtg gcg gag ggg
clos >1aa =1aa -5s +5s -16s +16s total
cle 34* 3 9 64

Heliobacterium modesticaldum Ice1 ATCC 51547[modifier | modifier le wikicode]

hmo opérons[modifier | modifier le wikicode]

  • Lien tableur: hmo opérons
  • Liens: gtRNAdb [15], NCBI [16], génome [17]
  • Phylogénie: Bacteria; Firmicutes; Clostridia; Clostridiales; Heliobacteriaceae;Heliobacterium.
  • Légende: cdsa: cds aas, cdsd: cds dirigé
    -  cds : cds inséré dans un cluster avec ou sans rRNA.
C7. Heliobacterium modesticaldum Ice1 ATCC 51547
57%GC 24.7.19 Paris  109 doubles intercal  cds   aa  avec aa cdsa cdsd
103699..104088 CDS 380 130
104469..105695 CDS 186 186 409 186
comp 105882..105956 ggc 1 1
comp 105958..106044 ctg 321 321
comp 106366..106929 CDS @1 241 241 188 241
comp 107171..107246 aca 202 202 202
comp 107449..108183 CDS 111772 245
comp 219956..220483 CDS 260 260 176 260
comp 220744..220820 gac 5 5
comp 220826..220901 gta 10 10
comp 220912..220987 gaa 4 4
comp 220992..221067 aaa 18 18
comp 221086..221160 caa 103
comp 221264..224182 23s 237
comp 224420..224495 gcc 64
comp 224560..224676 5s @2 328
comp 225005..226536 16s 651 651
comp 227188..228162 CDS 98792 325
comp 326955..328340 CDS 178 178 462 178
comp 328519..328601 cta 65 65
comp 328667..328743 aga 60 60
comp 328804..328880 cca 568 568
comp 329449..330090 CDS 57730 214
comp 387821..388105 CDS 135 135 95
388241..388317 ccc 7 7
388325..388410 tac 47 47 47
comp 388458..388742 CDS 588493 95
comp 977236..978504 CDS 439 439 423
comp 978944..981860 23s 237
comp 982098..982173 gcc 64
comp 982238..982354 5s 328
comp 982683..984208 16s 460
comp 984669..984744 tgg @3 5 5
comp 984750..984824 cgg 207 207 207
comp 985032..987656 CDS 26258 875
comp 1013915..1014760 CDS 105 105 282 105
comp 1014866..1014942 gac 75 75
comp 1015018..1015093 gaa 265 265
comp 1015359..1016642 CDS 40115 428
1056758..1058014 CDS 121 121 419 121
comp 1058136..1058233 tga 173 173
1058407..1058733 CDS 62951 109
1121685..1122878 CDS 588 588 398
1123467..1124998 16s 328
1125327..1125443 5s 64
1125508..1125583 gcc 233
1125817..1128734 23s 337 337 337
> 1129072..1129785 CDS 24938 238
1154724..1155224 CDS 99 99 167
1155324..1155413 tca 56 56 56
comp 1155470..1156627 CDS 13350 386
1169978..1171828 CDS 129 129 617 129
1171958..1172034 cgt 85 85
1172120..1172196 agg 181 181
1172378..1172812 CDS 62 62 145 62
1172875..1172966 tcg 548 548
1173515..1174330 CDS 6655 272
comp 1180986..1182974 CDS 444 444 663
1183419..1183512 tcc 39 39 39
1183552..1183817 ncRNA 11908 89
1195726..1195998 CDS 181 181 91
1196180..1196255 gcg 151 151 151
1196407..1197051 CDS 86894 215
comp 1283946..1285331 CDS 177 177 462 177
1285509..1285584 atgf 5 5
1285590..1285667 atgj 7 7
1285675..1285750 gaa 542 542
1286293..1287630 CDS 63447 446
1351078..1352549 CDS 704 704 491
1353254..1354786 16s 252
1355039..1355155 5s 64
1355220..1355296 atc 194
1355491..1358408 23s 112
1358521..1358595 aac 109 109 109
comp 1358705..1358926 CDS 139555 74
1498482..1498898 CDS 535 535 139
comp 1499434..1499509 acg 238 238 238
1499748..1500836 CDS 262182 363
1763019..1763858 CDS 68 68 280 68
1763927..1764003 gac 4 4
1764008..1764083 ttc 3 3
1764087..1764161 ggc 92 92
comp 1764254..1764493 CDS 72 72 80 72
1764566..1764641 tgc 18 18
1764660..1764746 tta 253 253
comp 1765000..1765467 CDS 52131 156
1817599..1818318 CDS 487 487 240
1818806..1820337 16s 252
1820590..1820706 5s 64
1820771..1820847 atc 6 6
1820854..1820929 gca 229
1821159..1824076 23s 112
1824189..1824263 aac 6 6
1824270..1824345 atgf 243 243 243
1824589..1825014 CDS 168198 142
1993213..1994328 CDS 99 99 372
1994428..1994502 atgi 41 41 41
1994544..1995368 CDS 284281 275
2279650..2279997 CDS 541 541 116
2280539..2282070 16s 253
2282324..2282440 5s 64
2282505..2282580 gcc 234
2282815..2285735 23s 119
2285855..2285948 tcc 6 6
2285955..2286031 ccg 10 10
2286042..2286115 gga 14 14
2286130..2286205 cac 1 1
2286207..2286281 tgc 9 9
2286291..2286367 gtc 3 3
2286371..2286446 ttc 6 6
2286453..2286537 tac 4 4
2286542..2286616 caa 17 17
2286634..2286709 aaa 4 4
2286714..2286789 gaa 5 5
2286795..2286870 gta 5 5
2286876..2286952 gac 7 7
2286960..2287050 agc 43 43
2287094..2287170 ccc 30 30
2287201..2287287 ctg 3 3
2287291..2287365 ggc 4 4
2287370..2287446 cgt 4 4
2287451..2287526 acc 352 352 352
2287879..2288343 CDS 33184 155
comp 2321528..2322544 CDS 268 268 339
comp 2322813..2322889 gtc 9 9
comp 2322899..2322973 cgg 81 81 81
comp 2323055..2323243 CDS 3375 63
2326619..2327947 CDS 464 464 443 464
2328412..2329943 16s 327
2330271..2330387 5s 226
2330614..2333532 23s 98
2333631..2333706 aaa 4 4
2333711..2333786 acc 8 8
2333795..2333877 ctc 89 89 89
comp 2333967..2334704 CDS 7389 246
2342094..2342804 CDS 155 155 237 155
comp 2342960..2343030 ttc 213 213
2343244..2343936 CDS 563 563 231
2344500..2346025 16s 252
2346278..2346394 5s 64
2346459..2346535 atc 141
2346677..2349594 23s 100
2349695..2349769 aac 6 6
2349776..2349851 atgf 102 102 102
2349954..2350976 CDS 113601 341
2464578..2465114 CDS 271 271 179 271
comp 2465386..2465461 aca 432 432
2465894..2466226 CDS 4722 111
2470949..2471977 CDS 69 69 343 69
2472047..2472133 ctg 678 678
2472812..2473192 CDS 22232 127
2495425..2496048 CDS 402 402 208
comp 2496451..2496527 gtc 4 4
comp 2496532..2496609 atgj 175 175 175
2496785..2497120 CDS 217 217 112
comp 2497338..2497420 ctc 7 7
comp 2497428..2497503 acc 18 18
comp 2497522..2497596 tgg 14 14
comp 2497611..2497684 ggg 19 19
comp 2497704..2497778 ggc 7 7
comp 2497786..2497873 ttg 8 8
comp 2497882..2497958 gtg -10 -10 -10
comp 2497949..2498185 CDS 66 66 79 66
2498252..2498328 ccg 314 314
comp 2498643..2499506 CDS 55292 288
2554799..2554984 CDS 109 109 62 109
2555094..2555169 gaa 2 2
2555172..2555247 ttc 6 6
2555254..2555338 tac 4 4
2555343..2555417 caa 18 18
2555436..2555511 aaa 4 4
2555516..2555590 ggc 9 9
2555600..2555675 cac 117 117
comp 2555793..2557049 CDS 235940 419
comp 2792990..2793442 CDS 219 219 151 219
comp 2793662..2796583 23s 236
comp 2796820..2796895 gca 6 6
comp 2796902..2796978 atc 64
comp 2797043..2797159 5s 328
comp 2797488..2799019 16s 505
comp 2799525..2799599 ggc + 1 1
comp 2799601..2799687 ctg 2 ggc 32 32
comp 2799720..2799796 ccc 42 42
comp 2799839..2799915 cgt 4 4
comp 2799920..2799994 ggc 120 120
comp 2800115..2800192 atgj 42 42
comp 2800235..2800325 agc 16 16
comp 2800342..2800417 atgf 6 6
comp 2800424..2800498 aac 7 7
comp 2800506..2800581 gaa 4 4
comp 2800586..2800661 aaa 18 18
comp 2800680..2800754 caa 4 4
comp 2800759..2800843 tac 91 91
comp 2800935..2801011 gtc 7 7
comp 2801019..2801093 tgc 325 325
2801419..2801724 CDS 230813 102
3032538..3032729 CDS 109 109 64 109
comp 3032839..3035757 23s 233
comp 3035991..3036066 gcc 64
comp 3036131..3036247 5s 253
comp 3036501..3038026 16s 779 779
comp 3038806..3040017 CDS 232 404
comp 3040250..3042013 CDS 588

hmo cumuls[modifier | modifier le wikicode]

  • Lien tableur: hmo cumuls
  • Légende:
    - avec et sans rRNA, fréquences des intercalaires dans les clusters avec rRNA ou sans rRNA.
    - cdsd, je ne choisis que le cds avec l'intercalaire le plus faible d'un cluster donné, en supposant que ce cds a été créé par le cluster lors des conversions.
    - cdsa, longueur du cds en aas ici.
    -  1 : occurences exclues de la moyenne. Sont exclus de la moyenne les jaunes 554 de hmo opérons.
C7. cumuls. Heliobacterium modesticaldum Ice1 ATCC 51547
opérons Fréquences intercalaires tRNAs Fréquences intercalaires cds Fréquences aas cds
effectif gammes sans rRNAs avec rRNAs gammes cds gammes cdsd gammes cdsa
avec rRNA opérons 10 1 1 2 1 1 40 1 100 10
16 5s gcc 23 5 20 20 34 50 3 80 8 200 16
16 5s atc 23 2 40 0 2 100 11 120 7 300 14
16 5 23s a 1 60 1 3 150 9 160 4 400 8
max a 20 80 2 0 200 9 200 4 500 11
a doubles 1 100 1 1 250 8 240 4 600 0
16 5s atc gca 2 120 0 1 300 5 280 4 700 2
total aas 60 140 0 0 350 4 320 0 800 0
sans opérons 24 160 0 0 400 1 360 2 900 1
1 aa 12 180 0 0 450 4 400 0 1000 0
max a 7 200 0 0 500 2 440 0 1100 0
a doubles 0 0 0 11 1 0
total aas 49 21 38 56 32 59
total aas 109
remarques 3
avec jaune moyenne
variance
sans jaune moyenne 8 8 196 137 230
variance 6 7 120 71 128

hmo blocs[modifier | modifier le wikicode]

  • Lien tableur: hmo blocs
  • Légende:
    - tgg: L'intercalaire, en jaune aussi, est entre tgg et 16s.
  • Notes:
    - Les spécificités gcc atc atc-gca et tRNA avant 16s
    - Homogénéité des intercalaires intra bloc
C7. Heliobacterium modesticaldum Ice1 ATCC 51547, hmo blocs.
tgg
CDS 541 651 588 779 460
16s 253 328 328 253 328
5s 64 64 64 64 64
gcc 234 237 233 233 237
23s 119 103 337 109 439
tcc tcc caa cds cds cds
CDS 704 563 CDS 464
16s 252 252 16s 327
5s 64 64 5s 226
atc 194 141 23s 98
23s 112 100 aaa
aac aac aac
ggc
CDS 487 505
16s 252 328
5s 64 64
atc 6 6
gca 229 236
23s 112 219
aac aac cds

hmo remarques[modifier | modifier le wikicode]

  • Remarques des 3 @ dans opérons :
    1. @ Les cds en vert.
      - Ces cds sont insérés dans un cluster avec ou sans rRNA. Ce sont des candidats pour la création. Plus les 2 intercalaires avec les voisins sont petits plus ils sont intéressants. Il y en a 6 dont un seul, *, est accolé à un 16s. Un intercalaire est même négatif, c’est-à-dire que le cds démarre dans le tRNA, adresse 2497949. Dansl’ordre des adresses croissantes les intercalaires sont les suivants :  321-241   181-62   92-72   213-563*   175-217   -10-66.
      - Voir hmo cumuls : 9 intercalaires entre tRNAs dans un cluster ont plus de 40 pbs et 1 fait 120 pbs (adresse 2799920).
      - Dans hmo_opérons j'ai ajouté l'intercalaire entre 2 clusters, qui contient plusieurs autres gènes, pour faire ressortir la proximité des cds intra cluster avec les rRNAs et les tRNAs.
    2. @ Voir hmo blocs.
      - Il y a 10 blocs avec rRNA et tous sont complets. Cependant le 5s est anormalement positionné entre 16s et 23s au lieu d’être en 3ème position. Ce type de génome est rare, voir les statistiques des blocs à rRNAs.
      - Il n'y a qu'un seul bloc sans aas, adresse 2328412, mais ce génome a 5 blocs sur 10 qui est rare dans cette position, gcc, au lieu de gca, plus courant. Les 4 autres blocs arborent des aas courants dans cette position, 2 atc-gca et 2 atc.
    3. @ tRNAs avant 16s
      - Des tRNAs se trouvent avant le 16s, adresses 982683 et 2797488, le 1er avec 2 et le 2ème avec 15 tRNAs.
      - Les 2 intercalaires aa-16s sont du même de grandeur général qu'un cds-16s, 460 et 505 pbs ici.
  • Séquences des doubles: Voir hmo cumuls :beaucoup de séquences longues et à peine un double dans la séquence 15aas-16s5s-gcc-23s.
  • Notes:
    - Les 5 cds, candidats à la création, sont insérés dans des clusters sans rRNAs et 1 seul est collé à 16s.
    - Le 5s est positionné anormalement en 16s5s23s, dans les 10 blocs que possède le génome.
    - Un tRNA intra bloc très rare, gcc au lieu de gca, dans 5 cas sur 10. 4 autres sont courants, 2 atc et 2 atc-gca.

hmo distribution[modifier | modifier le wikicode]

  • Lien tableur: hmo distribution
  • Notes: Tableau Cl72,
    - les 1-3aas sont au nombre de 10 et sont soulignés, aac est composé de 1 >3aas et 3 1-3aas alors que aaa est composé respectivement de 3 et 1, et atgf de 2 et 1 respectivement.
    - Les blocs à rRNA sont de la forme 16s5saa23s
Cl7 hmo, Heliobacterium modesticaldum Ice1 ATCC 51547. clostridia.
Cl71 hmo. Distribution des blocs sans rRNA.
g1    t1       
atgi 1 tct tat atgf 1
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc 3 tcc 1 tac 2 tgc 1
atc acc 1 aac agc
ctc 1 ccc 1 cac 1 cgt 1
gtc 2 gcc gac 2 ggc 4
tta 1 tca 1 taa tga 1
ata aca 2 aaa 1 aga 1
cta 1 cca 1 caa 1 cga
gta gca gaa 3 gga
ttg 1 tcg 1 tag tgg 1
atgj 2 acg 1 aag agg 1
ctg 2 ccg 1 cag cgg 1
gtg 1 gcg 1 gag ggg 1
clos >1aa =1aa -5s +5s -16s +16s total
hmo 37 12 49
Cl72 hmo. Distribution des blocs avec rRNA.
g1    t1       
atgi tct tat atgf 3
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc 1 tcc 1 tac 2 tgc 2
atc 4 acc 2 aac 4 agc 2
ctc 1 ccc 2 cac 1 cgt 2
gtc 2 gcc 5 gac 2 ggc 3
tta tca taa tga
ata aca aaa 4 aga
cta cca caa 3 cga
gta 2 gca 2 gaa 3 gga 1
ttg tcg tag tgg 1
atgj 1 acg aag agg
ctg 2 ccg 1 cag cgg 1
gtg gcg gag ggg
clos >1aa =1aa -5s +5s -16s +16s total
hmo 49 11 60

Clostridium beijerinckii strain NCIMB 14988[modifier | modifier le wikicode]

cbei opérons[modifier | modifier le wikicode]

  • Lien tableur: cbei opérons
  • Liens: gtRNAdb [], NCBI [18], génome []
  • Phylogénie: Bacteria; Firmicutes; Clostridia; Clostridiales; Clostridiaceae;Clostridium.
  • Légende: cdsa: cds aas, cdsd: cds dirigé
    - cyan pour les doubles signalés par le signe + dans la colonne doubles.
    - @ voir le chapitre remarques de ce génome.
  • Notes:
    - Les atg ont été résolus en comparant avec ceux de cdc avec stxt. A faire pour psor aussi.
C8. Clostridium beijerinckii strain NCIMB 14988
29.65%GC 29.7.19 Paris  93 doubles intercal  cds   aa  avec aa cdsa cdsd
6477551..6480031 CDS 496 496 827
6480528..6482044 16s 213
6482258..6485171 23s 108
6485280..6485394 5s 14
15..91 atgi 1 1
93..168 gca 85 85 85
254..769 CDS 1940 172
2710..2937 CDS 119 119 76 119
3057..3147 tca + 30 30
3178..3268 agc 2 tca 241 241
3510..3600 tca 2 agc 18 18
3619..3709 agc 125 125
3835..4350 CDS 9470 172
13821..14726 CDS 187 187 302
14914..14988 cgt 34 34 34
comp 15023..15913 CDS 109014 297
124928..125338 CDS 275 275 137 275
125614..125702 tta + 20 20
125723..125798 atgf 4 tta 7 7
125806..125882 atgj 4 atgf 6 6
125889..125977 tta 2 atgj 22 22
126000..126075 atgf 7 7
126083..126159 atgj 6 6
126166..126254 tta 21 21
126276..126351 atgf 70 70
126422..126510 tta 21 21
126532..126607 atgf 664 664
127272..129683 CDS 8954 804
138638..140143 CDS 307 307 502
140451..140525 aac + 234 234
140760..140834 aac 3 aac 439 439
141274..141348 aac @6 299 299 299
141648..143039 CDS 1587 464
comp 144627..145649 CDS 543 543 341
146193..147709 16s 140
147850..147925 gca 3 3
147929..148005 atc 111
148117..151030 23s 70
151101..151217 5s 5 5
151223..151298 ttc 4
151303..151377 tgc 167 167 167
151545..151841 CDS 25608 99
177450..178097 CDS 76 76 216
178174..178249 acc 65 65 65
178315..179508 CDS 134221 398
313730..316207 CDS 90 90 826 90
316298..316382 cta 4 4
316387..316461 ggg 120 120
comp 316582..316986 CDS 85487 135
402474..402953 CDS 125 125 160 125
403079..403154 cca + 17 17
403172..403245 gga 2* 149 149
403395..403471 aga cca gga aga 6 6
403478..403553 cca 16 16
403570..403643 gga 35 35
403679..403755 aga 5 5
403761..403836 cac 3 3
403840..403914 caa 2* 7 7
403922..403997 aaa caa aaa cta 18 18
404016..404100 cta ggc gga 5 5
404106..404180 ggc 25 25
404206..404279 gga 5 5
404285..404360 aag 57 57
404418..404492 caa 7 7
404500..404575 aaa 18 18
404594..404678 cta 5 5
404684..404758 ggc 25 25
404784..404857 gga 46 46
404904..404980 cga 325 325
< 405306..405467 CDS 8393 54
413861..415921 CDS 385 385 687
416307..417823 16s @5 132
417956..418032 atc 84
418117..421031 23s 71
421103..421177 aac 345 345 345
421523..422449 CDS 63814 309
486264..486668 CDS 159 159 135 159
486828..486912 tac + 9 9
486922..486997 gta 3 tac 27 27
487025..487099 aca 2 gta 12 12
487112..487196 tac 2 aca 9 9
487206..487281 gta 30 30
487312..487386 aca 12 12
487399..487483 tac 451 451
487935..489110 CDS 50956 392
540067..540969 CDS 187 187 301 187
541157..541231 tgg 208 208
541440..541820 CDS 97 127
comp 541918..542985 CDS 252 252 356 252
543238..543312 tgg 354 354
543667..544683 CDS 347735 339
892419..893339 CDS 560 560 307
893900..895416 16s 137
895554..895629 gca 118
895748..898661 23s 204
898866..898982 5s 552 552 552
899535..900446 CDS 351 304
900798..902048 CDS 704 704 417
902753..904269 16s 339
904609..907522 23s 273
907796..907912 5s 69 69 69
comp 907982..908449 CDS 43545 156
951995..952630 CDS 97 97 212 97
952728..952813 ctc 396 396
953210..954919 CDS 784414 570
1739334..1739933 CDS 380 380 200 380
1740314..1740389 cac 3 3
1740393..1740467 cag 5 5
1740473..1740548 aaa 443 443
comp 1740992..1742350 CDS 151829 453
1894180..1895406 CDS 34 34 409 34
comp 1895441..1895527 ttg 574 574
1896102..1896794 CDS 200701 231
2097496..2097915 CDS 722 722 140
2098638..2100154 16s 502
2100657..2103569 23s 205
2103775..2103891 5s 315 315 315
2104207..2104905 CDS 234313 233
2339219..2340322 CDS 662 662 368
2340985..2342501 16s 338
2342840..2345755 23s 140
2345896..2345970 aac 3
2345974..2346090 5s 429 429 429
2346520..2348088 CDS 3574 523
2351663..2352139 CDS 568 568 159
2352708..2354224 16s 338
2354563..2357477 23s 140
2357618..2357692 aac 3
2357696..2357812 5s 90 90 90
2357903..2358316 CDS 406783 138
2765100..2765525 CDS 625 625 142
2766151..2767667 16s 503
2768171..2771082 23s 202
2771285..2771401 5s 5
2771407..2771482 ttc 6 6
2771489..2771565 gac 25 25
2771591..2771665 gaa 448 448 448
2772114..2774864 CDS 781818 917
3556683..3557051 CDS 565 565 123 565
3557617..3557691 gag 925 925
comp 3558617..3559759 CDS 192275 381
comp 3752035..3752652 CDS 245 245 206 245
comp 3752898..3752985 agt @1 711 711
comp 3753697..3755112 CDS 501326 472
comp 4256439..4258403 CDS 267 267 655 267
comp 4258671..4258746 aaa 79 79
comp 4258826..4258901 cac 7 7
comp 4258909..4258985 aga 35 35
comp 4259021..4259094 gga 752 752
4259847..4260392 CDS 619853 182
comp 4880246..4880488 CDS 508 508 81 508
comp 4880997..4881113 5s 274
comp 4881388..4884300 23s 578
comp 4884879..4886395 16s 703 703
comp 4887099..4888034 CDS 1272704 312
comp 6160739..6161977 CDS 343 343 413
6162321..6162396 cca 242 242 242
6162639..6163283 CDS 2040 215
6165324..6165734 CDS 222 222 137
comp 6165957..6166032 ttc 5
comp 6166038..6166154 5s @2 188 188 188
6166343..6167074 CDS 8085 244
comp 6175160..6175597 CDS 249 249 146 249
comp 6175847..6175922 gca 1 1
comp 6175924..6176000 atgi 44
comp 6176045..6176161 5s 138
comp 6176300..6179216 23s 339
comp 6179556..6181072 16s 567 567
comp 6181640..6182446 CDS 223 269
6182670..6183419 CDS 190 190 250 190
comp 6183610..6183685 aaa + 5
comp 6183691..6183807 5s 2 aaa 159 159 159
comp 6183967..6184914 CDS @3 294 294 316 294
comp 6185209..6185284 aaa 7
comp 6185292..6185408 5s 138
comp 6185547..6188463 23s 339
comp 6188803..6190319 16s 771 771
comp 6191091..6192203 CDS 7306 371
comp 6199510..6202059 CDS 661 661 850
comp 6202721..6202837 5s @4 139
comp 6202977..6205893 23s 339
comp 6206233..6207749 16s 1102
comp 6208852..6208968 5s 138
comp 6209107..6212023 23s 339
comp 6212363..6213879 16s 502 502 502
comp 6214382..6215329 CDS 90019 316
comp 6305349..6306314 CDS 123 123 322 123
comp 6306438..6306527 tcc 281 281
comp 6306809..6307984 CDS 66527 392
6374512..6375684 CDS 125 125 391 125
comp 6375810..6375884 agg 303 303
comp 6376188..6378578 CDS 13398 797
comp 6391977..6392753 CDS 114 114 259 114
comp 6392868..6392984 5s 134
comp 6393119..6396033 23s 214
comp 6396248..6397764 16s 1120
comp 6398885..6399001 5s 139
comp 6399141..6402055 23s 214
comp 6402270..6403786 16s 748 748
comp 6404535..6405107 CDS 31702 191
6436810..6437790 CDS 192 192 327
comp 6437983..6438059 gac + 6 6
comp 6438066..6438141 gta 3* 14 14
comp 6438156..6438230 gaa gac gta 29 29
comp 6438260..6438334 aca gaa aca – 1 10 10
comp 6438345..6438421 gac 6 6
comp 6438428..6438503 gta 16 16
comp 6438520..6438594 gaa 29 29
comp 6438624..6438698 aca 10 10
comp 6438709..6438785 gac 6 6
comp 6438792..6438867 gta 14 14
comp 6438882..6438956 gaa 162 162 162
comp 6439119..6439685 CDS 37865 189

cbei cumuls[modifier | modifier le wikicode]

  • Lien tableur: cbei cumuls
  • Légende:
    - avec et sans rRNA, fréquences des intercalaires dans les clusters avec rRNA ou sans rRNA.
    - cdsd, je ne choisis que le cds avec l'intercalaire le plus faible d'un cluster donné, en supposant que ce cds a été créé par le cluster lors des conversions.
    - cdsa, longueur du cds en aas ici.
    -  1 : occurences exclues de la moyenne. Sont exclus de la moyenne les jaunes 554 de cbei opérons.
  • Notes:
C8. cumuls. Clostridium beijerinckii strain NCIMB 14988
opérons Fréquences intercalaires tRNAs Fréquences intercalaires cds Fréquences aas cds
effectif gammes sans rRNAs avec rRNAs gammes cds gammes cdsd gammes cdsa
avec rRNA opérons 17 1 0 2 1 0 1 0 100 4
16 23 5s 0 7 20 34 3 50 2 50 2 200 19
16 atc gca 1 40 12 1 100 7 100 6 300 11
16 23 5s a 4 60 2 0 150 7 150 5 400 20
max a 4 80 2 0 200 9 200 7 500 6
a doubles 1 100 0 0 250 5 250 3 600 3
autres 6 120 0 0 300 6 300 5 700 2
total aas 19 140 0 0 350 6 350 2 800 1
sans opérons 20 160 1 0 400 4 400 1 900 4
1 aa 11 180 0 0 450 3 450 2 1000 1
max a 19 200 0 0 500 2 500 0 1100 0
a doubles 5 3 0 21 4 0
total aas 74 54 6 72 37 71
total aas 93
remarques 6
avec jaune moyenne
variance
sans jaune moyenne 18 7 350 195 328
variance 17 9 225 111 206

cbei blocs[modifier | modifier le wikicode]

C8. Clostridium beijerinckii strain NCIMB 14988, cbei blocs.
16s 213 503 339
23s 108 202 138
5s 14 5 44
atgi atgi ttc atgi
16s 339 502 578
23s 273 205 274
5s
aaa 5
5s 159 5s 139 134
cds 294 23s 339 214
aaa 7 16s 1102 1120
5s 138 5s 138 139
23s 339 23s 339 214
16s 16s
16s 338 338 16s 140
23s 140 140 gca 3
aac 3 3 atc 111
5s aac aac 23s 70
5s 5
ttc
16s 137 16s 132
gca 118 atc 84
23s 204 23s 71
5s aac
ttc 5
5s

cbei remarques[modifier | modifier le wikicode]

  • Remarques des 6 @ de cbei opérons
    1. @ Un tRNA très rare même chez les eucaryotes, agt.
    2. @ Un 5s isolé avec un tRNA.
    3. @ Les cds candidats à la création
      - Un cds inséré dans un cluster, candidat pour la création. Ses 2 intercalaires sont faibles, 159 et 294, se trouvent dans les 36 1ers sur un total de 72 ( voir cbei cumuls ). C’est une protéine moyenne de 316 aas.
      - Les groupes de 2 clusters réunis par 2 cds. Ces cds sont colorés en vert comme candidats à la création:
      • le groupe contenant @3, adresse 6181640, intercalaires des cds 567 223 190, taille en aas 269 250 ;
      • le groupe d’ adresse 541440 contient 2 tgg, intercalaires des cds 208 97 252, taille en aas 127 356 ;
      • le groupe d’ adresse 899535, intercalaires des cds 552 351 704, taille en aas 304 417 ;
    4. @ Un cluster à 2 blocs complets en rRNAs, séparés par un intercalaire de 1102 pbs pouvant contenir un protéine moyenne comme @3. Adresse 6202721. Et le même cluster se retrouve à l’adresse 6392868 avec le même intercalaire 1120. Les 2 clusters se différencient, en intra, uniquement par l’intercalaire 23s-5s qui est le même pour les 2 blocs du premier, 339, et pour le deuxième, 214. Ce qui prouve que ce n’est pas une simple copie.
    5. @ Les blocs 16s-atc-23s5s sont relativement nombreux quand les 16s-atcgca-23s5s existent. Voir la fiche des clostridia. Ici le 5s est remplacé par un tRNA aac ce qui renforce l’hypothèse de 5s comme modèle.
    6. @ Un rare triplet pour un firmicutes et en plus les 2 intercalaires sont de la même longueur que les 2 intercalaires avec les 2 cds du cluster, 307 234 439 299, alors que la moyenne des intercalaires entre aas, sans rRNA, et sans jaunes n’est que de 18 (écart 17), celle des cds 350 (écart 225), voir cbei cumuls.
  • Séquence des doubles
    - Les doubles ne se trouvent que dans les clusters sans rRNAs puisqu’ils totalisent 74 tRNAs sur 93 et les tRNAs des clusters avec rRNA se trouvent à l’intérieur.
    - A part le triplet de @6 les clusters avec des doubles, signalés par le signe +, totalisent 5 sur 8 contenant plus d’un tRNA. Ce ne sont uniquement que des duplications de séquences colorées en cyan ou séparées par une bordure épaisse.
    - Les longueurs des séquences dupliquées sont:  2*2  4*3  1*4  1*5
  • Notes
    - Les blocs à rRNAs, voir cbei blocs. Ils sont caractérisés par très peu de tRNAs internes ou externes et par 5 groupes de 2 clusters chacun (@3), totalisant 10 blocs sur 16 . La distribution est la suivante :
    • 11 clusters complets sans tRNAs internes
    • 2 clusters peu courants avec un tRNA entre 23s et 5s,
    • 3 clusters avec tRNAs internes   gcaatc   gca   atc   voir la fiche des firmicutes.
    - 7 cds insérés dans les groupes à 2 clusters, candidats à la création .
    - Le 5s perçu comme un modèle dans @5, 16s-atc-23s-aac
    - Beaucoup de duplications dans les clusters sans rRNAs, caractéristique des firmicutes renforcée par la présence
    • d’un cluster avec un triplet aux intercalaires de type cds plutôt que tRNAs.
    • et des longueurs de séquences dupliquées variables:  2*2  4*3  1*4  1*5.
    • Ces longs clusters sans rRNAs seraient alors issus des clusters longs à rRNAs , qui , quand ils existent dans les autres génomes étudiés des firmicutes, présentent des duplications analogues.

cbei distribution[modifier | modifier le wikicode]

  • Lien tableur: cbei distribution
  • Notes:
    - Tous les +5s sont des 1-3aas
    - aaa es composé de 2 +5s et 4 >1aa
    - gca de 2 +16s, 2 +5s
    - aac de 3 -5s et de 3 >1aa
Cl8 cbei, Clostridium beijerinckii strain NCIMB 14988. clostridia.
g1    t1       
atgi 2 tct tat atgf 4
att act aat agt 1
ctt cct cat cgc
gtt gct gat ggt
ttc 3 tcc 1 tac 3 tgc 1
atc 2 acc 1 aac 6 agc 2
ctc 1 ccc cac 3 cgt 1
gtc gcc gac 4 ggc 2
tta 4 tca 2 taa tga
ata aca 4 aaa 6 aga 3
cta 3 cca 3 caa 2 cga 1
gta 5 gca 4 gaa 4 gga 5
ttg 1 tcg tag tgg 2
atgj 2 acg aag 1 agg 1
ctg ccg cag 1 cgg
gtg gcg gag 1 ggg 1
clos >1aa =1aa -5s +5s -16s +16s total
cbei 63 11 3 12* 4 93

cbei intercalaires entre cds[modifier | modifier le wikicode]

  • Lien NCBI [19]
  • Note: Pour les génomes des annexes j'ai relevé les intercalaires entre tRNAs et entre ceux-ci et les cds qui leur sont adjacents. L'exemple est celui de rru du clade alpha. L'idée de départ de ces prélèvements est la recherche d'opérons formés de tRNA et de protéine comme dans le cas d'E.coli: l'intercalaire entre le tRNA et la protéine devrait être faible. Voir l'exemple d'eco (remarque @3) avec tac-tac-tpr et aca-tac-gga-acc-tufB.

cbei les fréquences[modifier | modifier le wikicode]

  • Lien tableur: cbei intercalaires entre cds
  • Légende:   long, longueur en pbs,   intercal pour intercalaire
    - fréquence-1 1 5 6 f, respectivement fréquence des intercalaires négatives à l'unité, positives à l'unité, par blocs de 5, par blocs de 10 jusqu'à 600 pbs et f pour finales. Ces fréquences servent à faire les diagrammes. La fréquence fréquencez est l'étendue à 1200 de la fréquence6 pour certains grands génomes.
    - cumul,% colonne à la droite de frequence6, reprend les fréquences par plages et leurs pourcentages indiqués déjà dans la 1ère partie du tableau.
    - La couleur cyan des fréquences fréquence-1 et 1 sert à montrer leur périodicité ternaire.
    - intercaln intercalx, pour les intercalaires négatifs minimaux et intercalaires positifs maximaux.
    - colonne ADN pour la longueur totale du génome en pbs et intercals pour le total en pbs des intercalaires entre cds uniquement, d'après la méthode des prélèvements de NCBI du 31.7.20.
    - erreur à corriger à l'adresse 6477551. Un cds à retirer des statistiques. Il a été corrigé dans "autres intercalaires" et "intercalaires cds-rRNA".
cbei Les fréquences des intercalaires entre cds
cbei intercalaires total % intercalaires moyenne ecartype plage ADN intercal frequence5 intercal fréquencez
négatif 400 7.1 négatif -11 12 -1 à -64 6 485 394 -1 400 610 14
zéro 19 0.3 intercals 0 19 620 19
1 à 200 2957 52.6 0 à 200 83 61 1 158 919 5 174 630 8
201 à 370 1240 22.1 201 à 370 275 48 17.9% 10 81 640 14
371 à 600 714 12.7 371 à 600 464 66 15 236 650 10
601 à max 293 5.2 601 à 1028 808 203 20 151 660 8
total 5622 <201 60.0 total 5619 205 211 -64 à 1555 25 121 670 13
adresse intercalx intercal fréquence1 intercal fréquence6 cumul,% intercal fréquence-1 30 90 680 7
1860894 2121 -1 400 -70 1 0 19 35 71 690 9
1898453 1881 0 19 -60 4 -1 71 40 65 700 14
4639922 1555 1 58 -50 1 -2 0 45 61 710 7
6361933 1545 2 40 -40 8 -3 0 50 68 720 8
5176736 1499 3 23 -30 10 min à -1 -4 85 55 81 730 6
2532196 1482 4 36 -20 44 400 -5 1 60 69 740 12
3181990 1469 5 17 -10 94 7.1% -6 0 65 68 750 5
4033167 1431 6 17 0 257 -7 8 70 60 760 6
4590435 1429 7 8 10 255 -8 73 75 70 770 7
3571512 1391 8 15 20 387 -9 0 80 50 780 4
4428508 1372 9 23 30 211 -10 5 85 61 790 8
5504697 1348 10 18 40 136 -11 38 90 58 800 4
1486045 1326 11 51 50 129 -12 0 95 76 810 2
2570075 1302 12 53 60 150 -13 4 100 58 820 6
4602139 1289 13 41 70 128 1 à 200 -14 21 105 68 830 5
3981561 1239 14 47 80 120 1769 -15 0 110 69 840 5
4621836 1226 15 44 90 119 31.5% -16 3 115 53 850 3
4088892 1221 16 31 100 134 -17 21 120 65 860 2
4296061 1207 17 25 110 137 -18 0 125 48 870 2
6061011 1205 18 38 120 118 -19 2 130 65 880 5
2648455 1201 19 25 130 113 -20 11 135 65 890 2
4064421 1178 20 32 140 123 -21 1 140 58 900 4
4839562 1176 21 34 150 134 -22 1 145 67 910 4
3909835 1173 22 25 160 133 -23 9 150 67 920 4
2456047 1153 23 18 170 118 1 à 200 -24 0 155 65 930 1
3569689 1127 24 21 180 108 2957 -25 2 160 68 940 2
3023607 1112 25 23 190 101 52.6% -26 11 165 64 950 0
4726206 1107 26 23 200 103 -27 0 170 54 960 3
1550735 1102 27 18 210 101 -28 4 175 53 970 3
4395515 1078 28 12 220 99 -29 5 180 55 980 1
1099864 1072 29 18 230 88 -30 0 185 44 990 2
3075992 1065 30 19 240 86 -31 0 190 57 1000 4
3857530 1064 31 18 250 82 0 à 200 -32 0 195 51 1010 3
776201 1058 32 14 260 83 2976 395 200 52 1020 4
2291086 1058 33 12 270 79 reste 24 205 53 1030 2
5939293 1054 34 14 280 83 total 419 210 48 1040 3
2680682 1051 35 13 290 66 215 38 1050 0
3035780 1051 36 10 300 79 220 61 1060 5
4035399 1040 37 8 310 59 intercal frequencef 225 45 1070 2
6351672 1032 38 13 320 62 600 5329 230 43 1080 2
2453621 1031 39 17 330 69 650 65 235 40 1090 0
5871985 1027 40 17 340 53 201 à 370 700 51 240 46 1100 0
5197163 1021 reste 4214 350 58 1240 750 38 245 39 1110 2
total 5622 360 43 22.1% 800 29 250 43 1120 1
370 50 850 21 255 46 1130 1
380 53 900 15 260 37 1140 0
390 57 950 11 265 38 1150 0
adresse intercaln décalage long 400 38 1000 13 270 41 1160 1
4624137 -110 shift 2 673 410 48 1050 12 275 48 1170 0
1868484 -64 shift 2 608 420 44 1100 9 280 35 1180 3
3204859 -64 shift 2 665 430 32 1150 4 285 37 1190 0
2485518 -62 shift 2 184 440 36 1200 4 290 29 1200 0
3963063 -60 450 42 1250 6 295 41 reste 21
2029018 -50 460 39 1300 1 300 38 total 293
5912545 -49 470 28 1350 3 305 30
5354783 -47 480 27 1400 2 310 29
1515675 -46 490 24 1450 2 315 28
4067020 -44 500 28 1500 3 320 34
5920392 -44 510 22 1550 1 325 33
1552479 -43 520 19 1600 1 330 36
330305 -41 530 23 291 335 26
4488902 -40 540 27 371 à 600 340 27
2489800 -38 550 18 713 345 33
2856876 -38 560 27 12.7% 350 25
4401424 -38 570 21 355 26
4678887 -38 580 20 601 à max 360 17
5785183 -38 590 20 293 365 28
3964014 -37 600 20 5.2% 370 22
1257344 -35 reste 293 reste 2 reste 1007
4675094 -35 total 5622 total 5622 total 5622

cbei autres intercalaires[modifier | modifier le wikicode]

  • Lien tableur: cbei autres intercalaires
  • Légende:  
    - comp, le gène est sur le brin complement
    - deb, fin sont respectivement dans le sens des adresses croissantes, le cds avant le 1er tRNA et le cds après le dernier tRNA du bloc.
    - misc_f, pour misc_feature
    - misc_R, pour misc_RNA
    - gene, c'est un pseudo sans cds
cbei Les autres intercalaires.
cbei1 adresses1
deb-fin gènes adresses intercal sens
tRNA 15 1
tRNA 93 85
fin CDS 254
deb CDS 2710 119
tRNA 3057 30
tRNA 3178 241
tRNA 3510 18
tRNA 3619 125
fin CDS 3835
deb CDS 13821 187
tRNA 14914 34
fin CDS 15023 comp
deb CDS 124928 275
tRNA 125614 20
tRNA 125723 7
tRNA 125806 6
tRNA 125889 22
tRNA 126000 7
tRNA 126083 6
tRNA 126166 21
tRNA 126276 70
tRNA 126422 21
tRNA 126532 664
fin CDS 127272
deb CDS 138638 307
tRNA 140451 234
tRNA 140760 439
tRNA 141274 299
fin CDS 141648
deb CDS 144627 548
rRNA 146198 140
tRNA 147850 3
tRNA 147929 111
rRNA 148117 70
rRNA 151101 5
tRNA 151223 4
tRNA 151303 681
fin CDS 152059
deb CDS 177450 76
tRNA 178174 65
fin CDS 178315
deb CDS 313730 90
tRNA 316298 4
tRNA 316387 120
fin CDS 316582 comp
deb CDS 402474 125
tRNA 403079 17
tRNA 403172 149
tRNA 403395 6
tRNA 403478 16
tRNA 403570 35
tRNA 403679 5
tRNA 403761 3
tRNA 403840 7
tRNA 403922 18
tRNA 404016 5
tRNA 404106 25
tRNA 404206 5
tRNA 404285 57
tRNA 404418 7
tRNA 404500 18
tRNA 404594 5
tRNA 404684 25
tRNA 404784 46
tRNA 404904 325
fin CDS 405306
deb CDS 413861 390
rRNA 416312 132
tRNA 417956 84
rRNA 418117 71
tRNA 421103 345
fin CDS 421523
deb CDS 486264 159
tRNA 486828 9
tRNA 486922 27
tRNA 487025 12
tRNA 487112 9
tRNA 487206 30
tRNA 487312 12
tRNA 487399 451
fin CDS 487935
cbei2 adresses2
deb-fin gènes adresses intercal sens
deb CDS 540067 187
tRNA 541157 208
fin CDS 541440
deb CDS 541918 252 comp
tRNA 543238 354
fin CDS 543667
deb CDS 772270 262
tmRNA 774356 871
fin CDS 775585
deb CDS 892419 565
rRNA 893905 137
tRNA 895554 118
rRNA 895748 204
rRNA 898866 552
fin CDS 899535
deb CDS 900798 709
rRNA 902758 339
rRNA 904609 273
rRNA 907796 69
fin CDS 907982 comp
deb CDS 951995 97
tRNA 952728 396
fin CDS 953210
deb CDS 1017389 70
ncRNA 1017765 758
fin CDS 1018872
deb CDS 1646835 56
ncRNA 1647290 182
fin CDS 1647666 comp
deb CDS 1739334 380
tRNA 1740314 3
tRNA 1740393 5
tRNA 1740473 443
fin CDS 1740992 comp
deb CDS 1846157 -183
gene 1847876 588
fin CDS 1848647
deb CDS 1894180 34
tRNA 1895441 574 comp
fin CDS 1896102
deb CDS 2097496 727
rRNA 2098643 502
rRNA 2100657 205
rRNA 2103775 315
fin CDS 2104207
deb CDS 2296804 104
ncRNA 2297577 380 comp
fin CDS 2298150
deb CDS 2305297 275
ncRNA 2306778 230 comp
fin CDS 2307274
deb CDS 2339219 667
rRNA 2340990 338
rRNA 2342840 140
tRNA 2345896 3
rRNA 2345974 429
fin CDS 2346520
deb CDS 2351663 573
rRNA 2352713 338
rRNA 2354563 140
tRNA 2357618 3
rRNA 2357696 90
fin CDS 2357903
deb CDS 2765706 282
rRNA 2766156 503
rRNA 2768171 202
rRNA 2771285 5
tRNA 2771407 6
tRNA 2771489 25
tRNA 2771591 448
fin CDS 2772114
deb CDS 3556683 565
tRNA 3557617 505
fin CDS 3558197 comp
deb CDS 3752035 248 comp
tRNA 3752901 13 comp
fin CDS 3752999 comp
cbei3 adresses3
deb-fin gènes adresses intercal sens
deb CDS 4256439 267 comp
tRNA 4258671 79 comp
tRNA 4258826 7 comp
tRNA 4258909 35 comp
tRNA 4259021 752 comp
fin CDS 4259847
deb CDS 4880246 508 comp
rRNA 4880997 274 comp
rRNA 4881388 578 comp
rRNA 4884879 703 comp
fin CDS 4887099 comp
deb CDS 6160739 343 comp
tRNA 6162321 242
fin CDS 6162639
deb CDS 6165324 222
tRNA 6165957 5 comp
rRNA 6166038 188 comp
fin CDS 6166343
deb CDS 6175160 249 comp
tRNA 6175847 1 comp
tRNA 6175924 44 comp
rRNA 6176045 138 comp
rRNA 6176300 339 comp
rRNA 6179556 572 comp
fin CDS 6181640 comp
deb CDS 6182670 190
tRNA 6183610 5 comp
rRNA 6183691 159 comp
deb CDS 6183967 294 comp
tRNA 6185209 7 comp
rRNA 6185292 138 comp
rRNA 6185547 339 comp
rRNA 6188803 776 comp
fin CDS 6191091 comp
deb CDS 6199510 661 comp
rRNA 6202721 139 comp
rRNA 6202977 339 comp
rRNA 6206233 1107 comp
rRNA 6208852 138 comp
rRNA 6209107 339 comp
rRNA 6212363 507 comp
fin CDS 6214382 comp
deb CDS 6256716 154
ncRNA 6257755 316 comp
fin CDS 6258338 comp
deb CDS 6305349 135 comp
tRNA 6306438 281 comp
fin CDS 6306809 comp
deb CDS 6374512 125
tRNA 6375810 303 comp
fin CDS 6376188 comp
deb CDS 6391977 114 comp
rRNA 6392868 134 comp
rRNA 6393119 214 comp
rRNA 6396248 1125 comp
rRNA 6398885 139 comp
rRNA 6399141 214 comp
rRNA 6402270 753 comp
fin CDS 6404535 comp
deb CDS 6436810 192
tRNA 6437983 6 comp
tRNA 6438066 14 comp
tRNA 6438156 29 comp
tRNA 6438260 10 comp
tRNA 6438345 6 comp
tRNA 6438428 16 comp
tRNA 6438520 29 comp
tRNA 6438624 10 comp
tRNA 6438709 6 comp
tRNA 6438792 14 comp
tRNA 6438882 162 comp
fin CDS 6439119 comp
deb CDS 6477551 501
deb rRNA 6480533 213
rRNA 6482258 108
rRNA 6485280 14

cbei intercalaires tRNA[modifier | modifier le wikicode]

cbei intercalaires tRNA-cds[modifier | modifier le wikicode]
  • Lien tableur: cbei intercalaires tRNA-cds
  • Légende:
    - comp', l'intercalaire est entre un gène comp (sur le complément) et un gène sur le brin direct. Continu les 2 gènes sont sur le même brin.
    - deb, fin sont les intercalaires des cds du tableau précédent, autres intercalaires: respectivement dans le sens des adresses croissantes, le cds avant le 1er tRNA et le cds après le dernier tRNA du bloc.
  • Cumuls comp'+continu du tableau
	deb	fin	total
<201	13	6	19
total	24	23	47
taux	54%	26%	40%
cbei intercalaires tRNA
cbei les relevés deb-fin
comp’ deb comp’ fin
85
119 125
187 comp’ 34
275 664
307 299
681
76 65
90 comp’ 120
125 325
345
159 451
187 208
comp’ 252 354
97 396
380 comp’ 443
comp’ 34 comp’ 574
448
565 comp’ 505
248 13
267 comp’ 752
comp’ 343 242
comp’ 222
249
comp’ 190
294
135 281
comp’ 125 303
comp’ 192 162
cbei intercalaires inférieures à 201 pbs
deb fin continu cumuls
76 13
90 65 deb
97 85 <201 9
119 125 total 17
125 162 taux 53%
135 208
159 242 fin
187 281 <201 5
187 299 total 18
248 303 taux 28%
249 325
267 345 total
275 354 <201 14
294 396 total 35
307 448 taux 40%
380 451
565 664
- 681 comp’ cumuls
34 120 deb 4
125 443 7
190 505 fin 1
192 574 5
222 752 total
252 - <201 5
343 - total 12
taux 42%
cbei intercalaires tRNA-tRNA[modifier | modifier le wikicode]
  • Lien tableur: cbei intercalaires tRNA-tRNA
  • Légende:
    - comp', l'intercalaire est entre un gène comp (sur le complément) et un gène sur le brin direct. Continu les 2 gènes sont sur le même brin. Il n'y a pas d'intercalaire à cheval sur les 2 brins dans ce relevé.
    - 1 intercalaire de 3 pbs entre tRNAs entourés de rRNAs n'est pas dans ce relevé.
1	2		21	2
2	0		22	1
3	2		23	0
4	1		24	0
5	5		25	3
6	7		26	0
7	5		27	1
8	0		28	0
9	2		29	2
10	2		30	2
11	0		35	2
12	2		46	1
13	0		57	1
14	2		70	1
15	0		79	1
16	2		149	1
17	1		234	1
18	3		241	1
19	0		439	1
20	1		total	58

cbei intercalaires rRNA[modifier | modifier le wikicode]

  • Voir la présentation des blocs à rRNA dans le chapitre cbei blocs de l'étude préliminaire. A comparer avec le tableau cbei autres intercalaires.
  • Remarque: Quand le 16s n'est pas précédé de tRNAs l'intercalaire cds-16s est élevé alors que l'intercalaire cds-bloc de l'autre côté du bloc est beaucoup plus faible. Cette orientation est quasiment générale chez tous les génomes que j'ai étudié ici. Je l'ai notée dans les chapitres génome-bloc de chaque génome. Pour cbei il y a 15 blocs et seulement 2 sont inversés. Voici ci-dessous les 15 blocs avec leur orientation dans l'ordre des adresses croissantes. La colonne +- indique la présence ou non de tRNAs après le 5s. Les 2 blocs inversés sont de rang 1 et 7.
rang	cds-16s	5s-cds	tRNA	note
1	548	681	+	
2	565	552	-	
3	709	69	-	
4	727	315	-	
5	667	429	-	
6	573	90	-	
7	282	448	+	
8	703	508	-	
9	572	249	+	
10	776	294	+	
11	507	661	-	2 blocs 1107
12	753	114	-	2 blocs 1125
13	501	85	+	
  • Note: J'ai supposé souvent que les blocs à tRNA sans rRNA sont aussi orientés de l'intercalaire le plus grand au plus petit. Dans cbei cumuls et de même pour les autres génomes, j'ai noté cette orientation dans la colonne cdsd, pour cds dirigé. Je n'ai conservé pour les calculs que le plus petit intercalaire des 2 cds bordant le bloc. L'idée était que cette orientation provoquait la création du cds en fin de bloc. Ces cds sont souvent de petites protéines et souvent hypothétiques. Aussi je présente ci-dessous la transformation deb-fin qui est imposée par l'adressage en intercalaire plus grand et plus petit.
deb	fin		tri	grand	petit
119	125		15	248	13
187	34		2	187	34
275	664		13	574	34
307	299		5	76	65
76	65		6	120	90
90	120		11	396	97
125	325		1	125	119
159	451		7	325	125
187	208		19	303	125
252	354		18	281	135
97	396		8	451	159
380	443		20	192	162
34	574		9	208	187
565	505		17	343	242
248	13		10	354	252
267	752		16	752	267
343	242		3	664	275
135	281		4	307	299
125	303		12	443	380
192	162		14	565	505

Negativicutes[modifier | modifier le wikicode]

Acidaminococcus fermentans DSM 20731[modifier | modifier le wikicode]

afn opérons[modifier | modifier le wikicode]

  • Lien tableur: afn opérons
  • Liens: gtRNAdb [20], NCBI [21], génome []
  • Phylogénie: Bacteria; Firmicutes; Negativicutes; Acidaminococcales; Acidaminococcaceae; Acidaminococcus.
N1. Acidaminococcus fermentans DSM 20731
56%GC 30.6.19 Paris   60  doubles intercalaire
24678..26242 16s @1 359
26602..29507 23s 228
29736..29852 5s
36819..36894 acg
57713..59277 16s 359
59637..62543 23s 228
62772..62888 5s
169459..169534 gcc
249791..249867 agg
comp 274627..274703 cgt
311123..311198 aca 22
311221..311305 tac 5
311311..311386 atg 3
311390..311465 acc 6
311472..311548 atgf
380482..382046 16s 251
382298..385204 23s 229
385434..385550 5s
461553..461627 aac 3
461631..461705 gaa 8
461714..461789 gta 50
461840..461916 cca 11
461928..462001 gga 8
462010..462086 aga
526984..527070 ctg + 30
527101..527186 ctc 2 ctg 52
527239..527325 ctg
578049..578123 ggc
636984..638548 16s @2 94
638643..638719 atc 66
638786..638861 gca 273
639135..642040 23s 139
642180..642296 5s
712229..712304 cac 18
712323..712398 caa 3
712402..712477 aaa 16
712494..712577 cta
comp 724421..724497 gtc
774880..774956 gac 4
774961..775036 ttc 8
775045..775119 ggc 9
775129..775202 tgc 13
775216..775304 tta
796654..796728 cgg
842393..842469 gac 2
842472..842547 ttc 8
842556..842630 ggc 9
842640..842713 tgc
889670..889746 ccc
906136..906210 aac
1022783..1022859 gac 2
1022862..1022936 ggc 1
1022938..1023011 tgg
1555201..1555277 ccg
comp 1567911..1567999 tca
comp 1613773..1613863 agc
1702659..1702744 ttg
comp 1711770..1711886 5s 228
comp 1712115..1715021 23s 359
comp 1715381..1716945 16s
comp 1823852..1823927 gta 6
comp 1823934..1824008 gaa 8
comp 1824017..1824092 aag
1909446..1909536 tcc
comp 1911342..1911429 tcg
comp 1974984..1975058 atgi
comp 1984782..1984856 gag 12
comp 1984869..1984942 cag + 111
comp 1985054..1985127 cag 2 cag
comp 2072279..2072395 5s 228
comp 2072624..2075529 23s 298
comp 2075828..2075903 gca 66
comp 2075970..2076046 atc 94
comp 2076141..2077705 16s
2148343..2148418 gcg
comp 2287117..2287192 aaa
comp 2303018..2303094 gtg
comp 2323563..2323636 ggg

afn cumuls[modifier | modifier le wikicode]

cumuls. afn
opérons Fréquences
effectifs gammes sans rRNAs avec rRNAs
avec rRNA opérons 6 1 1 -
16 23 5s 0 4 20 21
16 atc gca 2 40 2
16 23 5s a 0 60 2
max a 2 80 0
a doubles 0 100 0
spéciaux 0 120 1
total aas 4 140 0
sans opérons 29 160 0
1 aa 20 180 0
max a 6 200 0
a doubles 2 0
total aas 56 27 0
total aas 60
remarques 2
avec jaune moyenne 16
variance 23
sans jaune moyenne 12
variance 13

afn blocs[modifier | modifier le wikicode]

N1. afn blocs
16s 359 1565 359 1565 251 1565
23s 228 2906 228 2907 229 2907
5s 117 117 117
16s 94 1565 5s 228 117
atc 66 23s 298 2906
gca 273 gca 66
23s 139 2906 atc 94
5s 117 16s 1565
5s 228 117
23s 359 2907
16s 1565

afn remarques[modifier | modifier le wikicode]

  • Lien tableur: afn remarques
  • Remarques : 4 blocs 16-23-5s sans aas et très peu de doubles. Très simple.
    1. @ 4 blocs 16-23-5s sans aas .
      - 3 opérons ont leurs intercalaires identiques, 359 228.
      - 1 opéron a son intercalaire 16s-23s diminué de 30%, 108/359, l’autre intercalaire est commune aux 4 opérons.
    2. @ 2 blocs 16-atc gca 23s-5s, classiques mais sans aas en plus.
      - 3 intercallaires sont identiques et celui entre 23s-5s varie du simple au double, 94 66 298 228 et 94 66 273 139.
  • Séquences des doubles : Très peu de doubles, 2 opérons à 2aas et plus sur 11 ont des doubles.
    - 2 doublets au total: opéron ctc + 2ctg et opéron gag + 2cag.

afn distribution[modifier | modifier le wikicode]

  • Lien tableur: afn distribution
  • Notes:
    - cag2 est un double, en gras
    - ggc est composé de 1 1aa et 3 >1aa, les autres soulignés contiennent 1 et 1 respectivement.
Cl9 afn, Acidaminococcus fermentans DSM 20731. Negativicutes.
Cl91 distribution du total
g1    t1       
atgi 1 tct tat atgf 1
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc 1 tcc 2 tac 1 tgc 2
atc 2 acc 1 aac 2 agc 1
ctc 1 ccc 1 cac 1 cgt 1
gtc 1 gcc 1 gac 3 ggc 4
tta 1 tca 1 taa tga
ata aca 1 aaa 2 aga 1
cta 1 cca 1 caa 1 cga
gta 2 gca 2 gaa 2 gga 1
ttg 1 tcg 1 tag tgg 1
atgj 1 acg 1 aag 1 agg 1
ctg 2 ccg 1 cag 2 cgg 1
gtg 1 gcg 1 gag 1 ggg 1
clos >1aa 1aa -5s +5s -16s +16s total
afn 36 20 4 60
Cl92 afn, distribution des solitaires
g1    t1       
atgi 1 tct tat atgf
att act aat agt
ctt cct cat cgt
gtt gct gat ggt
ttc tcc 1 tac tgc
atc acc aac 1 agc 1
ctc ccc 1 cac cgc 1
gtc 1 gcc 1 gac ggc 1
tta tca 1 taa tga
ata aca aaa 1 aga
cta cca caa cga
gta gca gaa gga
ttg 1 tcg 1 tag tgg
atgj acg 1 aag agg 1
ctg ccg 1 cag cgg 1
gtg 1 gcg 1 gag ggg 1
afn >1aa 1aa -5s +5s -16s +16s total
type 20 20
Cl93 afn, distribution des >1aa et duplicata
g1    t1       
atgi tct tat atgf 1
att act aat agt
ctt cct cat cgt
gtt gct gat ggt
ttc 1 tcc 1 tac 1 tgc 2
atc acc 1 aac 1 agc
ctc 1 ccc cac 1 cgc
gtc gcc gac 3 ggc 3
tta 1 tca taa tga
ata aca 1 aaa 1 aga 1
cta 1 cca 1 caa 1 cga
gta 2 gca gaa 2 gga 1
ttg tcg tag tgg 1
atgj 1 acg aag 1 agg
ctg 2 ccg cag 2 cgg
gtg gcg gag 1 ggg
ade >1aa dupli -5s +5s -16s +16s total
type 34 2 36

afn intercalaires entre cds[modifier | modifier le wikicode]

  • Lien NCBI [22]
  • Note: Pour les génomes des annexes j'ai relevé les intercalaires entre tRNAs et entre ceux-ci et les cds qui leur sont adjacents. L'exemple est celui de rru du clade alpha. L'idée de départ de ces prélèvements est la recherche d'opérons formés de tRNA et de protéine comme dans le cas d'E.coli: l'intercalaire entre le tRNA et la protéine devrait être faible. Voir l'exemple d'eco (remarque @3) avec tac-tac-tpr et aca-tac-gga-acc-tufB.

afn les fréquences[modifier | modifier le wikicode]

  • Lien tableur: afn intercalaires entre cds
  • Légende:   long, longueur en pbs,   intercal pour intercalaire
    - fréquence-1 1 5 6 f, respectivement fréquence des intercalaires négatives à l'unité, positives à l'unité, par blocs de 5, par blocs de 10 jusqu'à 600 pbs et f pour finales. Ces fréquences servent à faire les diagrammes. La fréquence fréquence6 est étendue à 1200 pour certains grands génomes.
    - cumul,% colonne à la droite de frequence6, reprend les fréquences par plages et leurs pourcentages indiqués déjà dans la 1ère partie du tableau.
    - La couleur cyan des fréquences fréquence-1 et 1 sert à montrer leur périodicité ternaire.
    - intercaln intercalx, pour les intercalaires négatifs minimaux et intercalaires positifs maximaux.
    - colonne ADN pour la longueur totale du génome en pbs et intercals pour le total en pbs des intercalaires entre cds uniquement, d'après la méthode des prélèvements de NCBI du 30.8.20.
afn Les fréquences des intercalaires entre cds
afn intercalaires total % intercalaires moyenne ecartype plage ADN intercal frequence5
négatif 307 15.1 négatif -10 14 -1 à -83 2 329 769 -1 307
zéro 11 0.5 intercals 0 11
1 à 200 1325 65.0 0 à 200 66 58 220 467 5 127
201 à 370 304 14.9 201 à 370 267 49 9.5% 10 57
371 à 600 69 3.4 371 à 600 449 59 15 164
601 à max 23 1.1 601 à 992 743 108 20 87
total 2039 <201 80.6 total 2035 105 133 -83 à 992 25 65
adresse intercalx intercal fréquence1 intercal fréquence6 cumul,% intercal fréquence-1 30 47
1555671 2261 -1 307 -70 5 0 11 35 37
1949615 1154 0 11 -60 3 -1 38 40 32
1841522 1130 1 39 -50 3 -2 0 45 25
1001677 992 2 27 -40 4 -3 0 50 28
434858 957 3 20 -30 10 min à -1 -4 130 55 31
865205 922 4 28 -20 17 307 -5 0 60 29
463581 845 5 13 -10 48 15.1% -6 1 65 23
1969579 795 6 9 0 228 -7 6 70 25
1287774 772 7 5 10 184 -8 41 75 32
843665 744 8 7 20 251 -9 1 80 17
1081454 736 9 20 30 112 -10 1 85 25
34 721 10 16 40 69 -11 19 90 28
1347444 718 11 29 50 53 -12 0 95 16
2155062 701 12 46 60 60 -13 5 100 29
1227328 693 13 30 70 48 -14 8 105 20
893831 683 14 22 80 49 -15 0 110 22
1185969 679 15 37 90 53 1 à 100 -16 3 115 28
1657318 677 16 24 100 45 924 -17 10 120 22
1282010 667 17 10 110 42 36.3% -18 0 125 29
872797 649 18 25 120 50 -19 2 130 29
1240102 647 19 13 130 58 -20 6 135 24
1246797 636 20 15 140 55 -21 0 140 31
117980 628 21 21 150 42 -22 0 145 20
867763 580 22 14 160 41 -23 4 150 22
406827 567 23 11 170 38 1 à 200 -24 0 155 18
1121221 551 24 10 180 24 1325 -25 0 160 23
2231462 551 25 9 190 26 65% -26 4 165 21
901417 550 26 6 200 25 -27 0 170 17
39288 548 27 15 210 25 -28 0 175 11
791634 544 28 10 220 32 -29 3 180 13
1481233 542 29 5 230 34 -30 0 185 8
691218 519 30 11 240 33 0 à 200 -31 2 190 18
1388835 517 31 7 250 18 1336 -32 2 195 16
2163709 515 32 7 260 16 total 297 200 9
1189403 513 33 5 270 21 reste 21 205 15
1783994 508 34 10 280 16 318 210 10
1749779 507 35 8 290 11 215 18
847959 503 36 6 300 17 intercal fréquencef 220 14
1268481 502 37 8 310 15 600 2016 225 23
38 6 320 8 620 230 11
39 8 330 13 640 2 235 14
40 4 340 9 201 à 370 660 2 240 19
reste 1105 350 12 304 680 3 245 7
total 2039 360 10 14.9% 700 2 250 11
adresse intercaln décalage long 370 14 720 2 255 5
2109623 -113 shift2 425 380 8 740 2 260 11
598105 -83 comp 390 7 760 1 265 7
1667526 -79 shift2 915 400 7 780 1 270 14
2031132 -74 shift2 614 410 1 800 1 275 5
935587 -71 shift2 518 420 5 820 280 11
2283155 -68 shift2 1952 430 2 840 285 8
846262 -67 shift2 132 440 4 860 1 290 3
1528664 -67 shift2 108 450 4 880 295 7
1794682 -59 shift2 1601 460 3 900 300 10
808710 -53 shift2 1034 470 1 920 305 10
1101239 -50 shift2 2423 480 5 940 1 310 5
287845 -45 490 1 960 1 315 4
532761 -44 500 5 980 320 4
50634 -41 510 4 1000 1 325 8
434100 -40 520 4 1020 330 5
276227 -38 530 0 1040 335 3
629222 -38 540 0 371 à 600 1060 340 6
1090320 -37 550 4 69 1080 345 9
503812 -35 560 2 3.4% 1100 350 3
1225885 -35 570 1 1120 355 3
1260789 -35 580 1 601 à max 1140 1 360 7
706234 -32 590 0 23 1160 1 365 8
2148489 -32 600 0 1.1% 22 370 6
460032 -31 reste 23 reste 1 reste 92
1743849 -31 total 2039 total 2039 total 2039

afn autres intercalaires[modifier | modifier le wikicode]

  • Lien tableur: afn autres intercalaires
  • Légende:  
    - comp, le gène est sur le brin complement
    - deb, fin sont respectivement dans le sens des adresses croissantes, le cds avant le 1er tRNA et le cds après le dernier tRNA du bloc.
afn Les autres intercalaires.
afn1 adresses1
deb-fin gènes adresses intercal sens
deb CDS 23699 319
rRNA 24678 359
rRNA 26602 228
rRNA 29736 286
fin CDS 30139
deb CDS 35919 105
tRNA 36819 105
fin CDS 37000
deb CDS 56077 346
rRNA 57713 359
rRNA 59637 228
rRNA 62772 266
fin CDS 63155 comp
deb CDS 168443 122
tRNA 169459 361
fin CDS 169896 comp
deb CDS 181646 89 comp
misc_binding 182746 130 comp
fin CDS 183117 comp
deb CDS 183775 510 comp
misc_binding 185671 146
fin CDS 186056
deb CDS 249164 195
tRNA 249791 51
fin CDS 249919 comp
deb CDS 253385 90
misc_binding 254915 84
fin CDS 255255
deb CDS 273899 200 comp
tRNA 274627 188 comp
fin CDS 274892
deb CDS 310188 131
tRNA 311123 22
tRNA 311221 5
tRNA 311311 3
tRNA 311390 6
tRNA 311472 74
fin CDS 311623
deb CDS 359181 58
regulatory 360286 52
fin CDS 360447
deb CDS 378908 485
rRNA 380482 251
rRNA 382298 229
rRNA 385434 262
fin CDS 385813 comp
deb CDS 414288 246
regulatory 416478 98
fin CDS 416689
deb CDS 460654 266
tRNA 461553 3
tRNA 461631 8
tRNA 461714 50
tRNA 461840 11
tRNA 461928 8
tRNA 462010 145
fin CDS 462232
deb CDS 466993 232
misc_binding 468950 36
fin CDS 469185
deb CDS 526396 54
tRNA 526984 30
tRNA 527101 52
tRNA 527239 268
fin CDS 527594 comp
deb CDS 570200 65 comp
regulatory 571573 209 comp
fin CDS 571879
deb CDS 577378 131
tRNA 578049 194
fin CDS 578318
afn2 adresses2
deb-fin gènes adresses intercal sens
deb CDS 635289 300
rRNA 636984 94
tRNA 638643 66
tRNA 638786 273
rRNA 639135 139
rRNA 642180 296
fin CDS 642593
deb CDS 677296 181
misc_feature 678359 368
fin CDS 678779
deb CDS 711704 96
tRNA 712229 18
tRNA 712323 3
tRNA 712402 16
tRNA 712494 61
fin CDS 712639 comp
deb CDS 723480 80
tRNA 724421 134 comp
fin CDS 724632
deb CDS 774399 214
tRNA 774880 4
tRNA 774961 8
tRNA 775045 9
tRNA 775129 13
tRNA 775216 111
fin CDS 775416
deb CDS 796146 73
tRNA 796654 159
fin CDS 796888
deb CDS 841590 119
tRNA 842393 2
tRNA 842472 8
tRNA 842556 9
tRNA 842640 127
fin CDS 842841
deb CDS 881739 121
repeat_region 882151 278
fin CDS 886449
deb CDS 889017 71
tRNA 889670 156
fin CDS 889903
deb CDS 905286 58
tRNA 906136 102
fin CDS 906313
deb CDS 913707 78
regulatory 916065 91
fin CDS 916256
deb CDS 947642 32
ncRNA 948598 38
fin CDS 948982
deb CDS 1017827 92 comp
misc_binding 1018936 36
fin CDS 1019167
deb CDS 1020207 137
tRNA 1022783 2
tRNA 1022862 1
tRNA 1022938 112
fin CDS 1023124
deb CDS 1111497 73 comp
misc_binding 1112790 267 comp
fin CDS 1113303
deb CDS 1305277 298
regulatory 1306436 70
fin CDS 1306616
deb CDS 1328649 26
tmRNA 1328957 406
fin CDS 1329712 comp
deb CDS 1403493 52 comp
misc_binding 1404547 111 comp
fin CDS 1404901 comp
afn3 adresses3
deb-fin gènes adresses intercal sens
deb CDS 1485384 59 comp
misc_binding 1487132 146 comp
fin CDS 1487523 comp
deb CDS 1536256 68
regulatory 1537998 113
fin CDS 1538188
deb CDS 1553542 24
tRNA 1555201 393
fin CDS 1555671 comp
deb CDS 1567689 21 comp
tRNA 1567911 93 comp
fin CDS 1568093 comp
deb CDS 1612826 158
tRNA 1613773 215 comp
fin CDS 1614079 comp
deb CDS 1668440 42 comp
ncRNA 1668962 51 comp
fin CDS 1669196 comp
deb CDS 1701767 76
tRNA 1702659 91
fin CDS 1702836 comp
deb CDS 1710214 512
rRNA 1711770 228 comp
rRNA 1712115 359 comp
rRNA 1715381 391 comp
fin CDS 1717337 comp
deb CDS 1823002 379 comp
tRNA 1823852 6 comp
tRNA 1823934 8 comp
tRNA 1824017 83 comp
fin CDS 1824176 comp
deb CDS 1907578 182 comp
tRNA 1909446 53 comp
ncRNA 1909590 115
deb CDS 1909805 136
tRNA 1911342 23
fin CDS 1911453
deb CDS 1912058 43 comp
misc_binding 1913025 130 comp
fin CDS 1913387
deb CDS 1973889 222 comp
tRNA 1974984 39 comp
fin CDS 1975098 comp
deb CDS 1983694 122 comp
tRNA 1984782 12 comp
tRNA 1984869 111 comp
tRNA 1985054 106 comp
fin CDS 1985234 comp
deb CDS 2070538 193
rRNA 2072279 228 comp
rRNA 2072624 298 comp
tRNA 2075828 66 comp
tRNA 2075970 94 comp
rRNA 2076141 265 comp
fin CDS 2077971 comp
deb CDS 2147697 91
tRNA 2148343 70
fin CDS 2148489 comp
deb CDS 2285667 451 comp
tRNA 2287117 45 comp
fin CDS 2287238 comp
deb CDS 2301950 486 comp
tRNA 2303018 45 comp
fin CDS 2303140 comp
deb CDS 2322585 393 comp
tRNA 2323563 196 comp
fin CDS 2323833

afn intercalaires tRNA[modifier | modifier le wikicode]

  • Lien tableur: afn intercalaires tRNA
  • Légende:
    - comp', l'intercalaire est entre un gène comp (sur le complément) et un gène sur le brin direct. Continu les 2 gènes sont sur le même brin.
    - deb, fin sont les intercalaires des cds du tableau précédent, autres intercalaires: respectivement dans le sens des adresses croissantes, le cds avant le 1er tRNA et le cds après le dernier tRNA du bloc.
  • Cumuls comp'+continu du tableau
	deb	fin	total
<201	22	22	44
total	27	26	53
%	81	85	83
afn intercalaires tRNA
afn les relevés deb-fin
comp’ entre tRNAs comp’ deb comp’ fin
105 105
122 comp’ 361
195 comp’ 51
3 8 50 11 8 200 comp’ 188
131 145
30 52 54 comp’ 268
131 194
18 3 16 96 comp’ 61
comp’ 80 comp’ 134
4 8 9 13 214 111
73 159
2 8 9 119 127
71 156
58 102
2 1 137 112
24 comp’ 393
21 93
comp’ 158 215
76 comp’ 91
6 8 379 83
182
136 23
222 39
12 111 122 106
91 comp’ 70
451 45
393 comp’ 196
afn intercalaires inférieures à 201 pbs
deb fin continu cumuls
21 23 deb
24 39 <201 20
54 45 total 25
58 70 % 80%
71 83
73 93 fin
76 102 <201 17
91 105 total 18
96 106 % 94%
105 111
119 112 total
122 127 <201 37
122 145 total 43
131 156 % 86%
131 159
136 194
137 196
182 215
195
200
214
222
379
393
451 comp’ cumuls
80 51 deb 2
158 61 <201 100%
91 fin
134 <201 5
188 total 8
268 % 63%
361 total 10
393 <201 70%

afn intercalaires rRNA[modifier | modifier le wikicode]

  • Voir la présentation des blocs à rRNA dans le chapitre afn blocs de l'étude préliminaire. A comparer avec le tableau afn autres intercalaires.
  • Remarque: Quand le 16s n'est pas précédé de tRNAs l'intercalaire cds-16s est élevé, pour le 1er bloc il est ici de 319 pbs. L'intercalaire cds-bloc de l'autre côté du bloc est beaucoup plus faible, ici 286 pbs. Cette orientation est quasiment générale chez tous les génomes que j'ai étudié ici. Je l'ai notée dans les chapitres génome-bloc de chaque génome.
  • Note: J'ai supposé souvent que les blocs à tRNA sans rRNA sont aussi orientés de l'intercalaire le plus grand au plus petit. Dans afn cumuls et de même pour les autres génomes, j'ai noté cette orientation dans la colonne cdsd, pour cds dirigé. Je n'ai conservé pour les calculs que le plus petit intercalaire des 2 cds bordant le bloc. L'idée était que cette orientation provoquait la création du cds en fin de bloc. Ces cds sont souvent de petites protéines et souvent hypothétiques. Aussi je présente ci-dessous la transformation deb-fin qui est imposée par l'adressage en intercalaire plus grand et plus petit.
deb	fin		tri	grand	petit		deb	fin		tri	grand	petit
105	105		17	93	21		58	102		9	134	80
122	361		21	136	23		137	112		20	379	83
195	51		16	393	24		24	393		1	105	105
200	188		22	222	39		21	93		23	122	106
131	145		25	451	45		158	215		10	214	111
54	268		3	195	51		76	91		15	137	112
131	194		6	268	54		379	83		12	127	119
96	61		14	102	58		136	23		2	361	122
80	134		8	96	61		222	39		5	145	131
214	111		24	91	70		122	106		7	194	131
73	159		13	156	71		91	70		18	215	158
119	127		11	159	73		451	45		4	200	188
71	156		19	91	76		393	196		26	393	196

afn par rapport au groupe de référence[modifier | modifier le wikicode]

Comparaison avec la référence
tRNAs blocs tRNAs blocs rRNAs
afn 1aa >1aa dup +5s 1-3aas autres total
21 faible 11 3 2 16
16 moyen 5 12 4 21
14 fort 4 19 23
20 34 2 4 60
10 g+cga 6 2 2 10
2 agg+cgg 2 2
4 carre ccc 3 1 4
5 autres
11 3 2 16
total tRNAs ‰
afn 1aa >1aa dup +5s 1-3aas autres afn ‰ ref.‰
21 faible 183 50 33 267 26
16 moyen 83 200 0 67 350 324
14 fort 67 317 0 383 650
333 567 33 67 60 729
10 g+cgg 100 33 33 167 10
2 agg+cga 33 33
4 carre ccc 50 17 67 16
5 autres
183 50 33 267
blocs tRNAs ‰ total colonne %
afn 1aa >1aa dup total ref.‰ 1aa >1aa dup
21 faible 196 54 36 286 26 55 9
16 moyen 89 214 304 324 25 35
14 fort 71 339 411 650 20 56
357 607 36 56 729 20 34
10 g+cgg 107 36 36 179 10 55
2 agg+cga 36 36 18
4 carre ccc 54 18 71 16 27
5 autres
196 54 36 286 11

negativicutes distribution[modifier | modifier le wikicode]

  • Lien tableur: negativicutes distribution
  • Liens fiche:   1-3aas9-23aas
  • Légende: prélèvement de la base gtRNAdb le 22.1.21
    - ttt et tgt sont nuls partout
    - atgi, c'est Ile2, mis à la place de ttt, très rare chez les procaryotes.
    - atgf, c'est Metf, mis à la place de tgt, très rare chez les procaryotes.
    - atgj, c'est Met, remplace le atg standard qui est la somme Ile2 Met fMet.
    - Voir la légende des tris, g1 t1 et des couleurs
  • Notes: attention tableau neg4, atc est négatif et n'est pas contenu dans le total de 423. Le tableau neg4 est égal à neg1-neg2-neg3. Dans neg2 le rouge est totalement +16s.
neg Negativicutes 9 génomes
neg1 total du 22.1.21 de gtRNAdb
g1    t1       
atgi 8 tct tat atgf 15
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc 17 tcc 10 tac 16 tgc 13
atc 17 acc 11 aac 26 agc 11
ctc 11 ccc 7 cac 10 cgt 16
gtc 8 gcc 7 gac 24 ggc 33
tta 11 tca 10 taa tga 1
ata aca 13 aaa 20 aga 9
cta 9 cca 11 caa 13 cga 2
gta 24 gca 21 gaa 25 gga 10
ttg 11 tcg 9 tag tgg 13
atgj 12 acg 9 aag 10 agg 9
ctg 10 ccg 7 cag 11 cgg 9
gtg 4 gcg 5 gag 5 ggg 8
9-23aas inter max min total
186 263 122 571
neg2 distribution des 1-3aas
g1    t1       
atgi tct tat atgf
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc tcc tac 1 tgc
atc 18 acc aac 6 agc 1
ctc ccc cac cgt 2
gtc gcc gac ggc
tta tca taa tga
ata aca aaa aga
cta cca caa 1 cga
gta gca 21 gaa 1 gga
ttg tcg tag tgg 4
atgj acg 1 aag agg
ctg ccg cag cgg
gtg gcg gag ggg
1-3aas inter max min total
7 11 1 19
neg3 distribution des 9-23aas
g1    t1       
atgi 1 tct tat atgf 3
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc 6 tcc 2 tac 3 tgc 2
atc 1 acc aac 5 agc 2
ctc 2 ccc cac 3 cgt 4
gtc gcc gac 7 ggc 3
tta 4 tca 1 taa tga
ata aca 5 aaa 5 aga
cta 1 cca 2 caa 5 cga
gta 7 gca gaa 5 gga 4
ttg 2 tcg tag tgg 2
atgj 1 acg aag 2 agg
ctg 2 ccg cag cgg
gtg gcg gag ggg
9-23aas inter max min total
24 64 4 92
neg4 distribution des -rRNA
g1    t1       
atgi 7 tct tat atgf 12
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc 11 tcc 8 tac 12 tgc 11
atc -2 acc 11 aac 15 agc 8
ctc 9 ccc 7 cac 5 cgt 10
gtc 8 gcc 7 gac 17 ggc 30
tta 7 tca 9 taa tga 1
ata aca 8 aaa 15 aga 9
cta 8 cca 9 caa 7 cga 2
gta 17 gca 0 gaa 19 gga 6
ttg 9 tcg 9 tag tgg 7
atgj 11 acg 8 aag 8 agg 9
ctg 8 ccg 7 cag 11 cgg 9
gtg 4 gcg 5 gag 5 ggg 8
-rRNA inter max min total
118 188 117 423
  • Discussion
    - La comparaison avec le classement des tRNAs montre que les effectifs élevés des -rRNAs correspondraient à des duplications. Il faut tenir compte aussi des doubles qui ne sont pas des duplications comme dans le génome afn avec le bloc ctg ctc ctg.
    - pour les 1-3aas aac est élevé alors que atgf est absent.
    - Les tRNAs faibles (cyan) seraient plutôt des 1aa.
    - La méthode de comparaison, ici, sans passer par les indices, c'est à dire une fiche de la totalité des génomes, montre qu'il y a des différences entre le décompte total et la fiche des +rRNAs. Notamment pour le +16s atc avec une valeur négative dans la différence. Pour les comparaions avec indices, pour les autres clades, il faut que ces valeurs négatives soient les plus petites possible en valeur absolue. Sinon il faut vérifier les calculs et les relevés. Voir la comparaison du clade avec le tRNA afn.

negativicutes, estimation des -rRNAs[modifier | modifier le wikicode]

  • Lien tableur: negativicutes, estimation des -rRNAs
  • Liens fiche:   1-3aas9-23aas
  • Légende: prélèvement de la base gtRNAdb le 22.1.21
    - ttt et tgt sont nuls partout
    - atgi, c'est Ile2, mis à la place de ttt, très rare chez les procaryotes.
    - atgf, c'est Metf, mis à la place de tgt, très rare chez les procaryotes.
    - atgj, c'est Met, remplace le atg standard qui est la somme Ile2 Met fMet.
    - Voir la légende des tris, g1 t1 et des couleurs

negativicutes, calcul des -rRNAs[modifier | modifier le wikicode]

neg Negativicutes 9 génomes
neg1 cumul des +rRNAs de la fiche négativicutes pour 9 génomes
g1    t1        0  0
atgi 1 tct tat atgf 3
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc 6 tcc 2 tac 4 tgc 2
atc 18 acc aac 11 agc 3
ctc 2 ccc cac 5 cgt 6
gtc gcc gac 7 ggc 3
tta 4 tca 1 taa tga
ata aca 5 aaa 5 aga
cta 1 cca 2 caa 6 cga
gta 7 gca 21 gaa 6 gga 4
ttg 2 tcg tag tgg 6
atgj 1 acg 1 aag 2 agg
ctg 2 ccg cag cgg
gtg gcg gag ggg
nega9 inter max min total
69 75 5 149
neg2 indices du clade negativicutes du 22.1.21 de gtRNAdb pour 100 génomes
g1    t1        0  0
atgi 89 tct tat atgf 167
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc 189 tcc 111 tac 178 tgc 144
atc 189 acc 122 aac 289 agc 122
ctc 122 ccc 78 cac 111 cgt 178
gtc 89 gcc 78 gac 267 ggc 367
tta 122 tca 111 taa tga 11
ata aca 144 aaa 222 aga 100
cta 100 cca 122 caa 144 cga 22
gta 267 gca 233 gaa 278 gga 111
ttg 122 tcg 100 tag tgg 144
atgj 133 acg 100 aag 111 agg 100
ctg 111 ccg 78 cag 122 cgg 100
gtg 44 gcg 56 gag 56 ggg 89
gtRNA inter max min total
2667 2922 1356 6344
neg3 cumul des -rRNAs de l'annexe afn pour 1 génome
g1    t1        0  0
atgi 1 tct tat atgf 1
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc 2 tcc 1 tac 1 tgc 2
atc acc 1 aac 2 agc 1
ctc 1 ccc 1 cac 1 cgt 1
gtc 1 gcc 1 gac 3 ggc 4
tta 1 tca 1 taa tga
ata aca 1 aaa 2 aga 1
cta 1 cca 1 caa 1 cga
gta 2 gca gaa 2 gga 1
ttg 1 tcg 1 tag tgg 1
atgj 1 acg 1 aag 1 agg 1
ctg 2 ccg 1 cag 2 cgg 1
gtg 1 gcg 1 gag 1 ggg 1
afn inter max min total
16 24 16 56
neg4 indices des +rRNAs de la fiche negativicutes pour 100 génomes
g1    t1        0  0
atgi 11 tct tat atgf 33
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc 67 tcc 22 tac 44 tgc 22
atc 200 acc aac 122 agc 33
ctc 22 ccc cac 56 cgt 67
gtc gcc gac 78 ggc 33
tta 44 tca 11 taa tga
ata aca 56 aaa 56 aga 1
cta 11 cca 22 caa 67 cga
gta 78 gca 233 gaa 67 gga 44
ttg 22 tcg tag tgg 67
atgj 11 acg 11 aag 22 agg 1
ctg 22 ccg cag cgg 1
gtg gcg gag ggg 1
nega9 inter max min total
767 833 56 1656
neg5 estimation des -rRNA du clade negativicutes pour 100 génomes
g1    t1       
atgi 78 tct tat atgf 133
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc 122 tcc 89 tac 133 tgc 122
atc -11 acc 122 aac 167 agc 89
ctc 100 ccc 78 cac 56 cgt 111
gtc 89 gcc 78 gac 189 ggc 333
tta 78 tca 100 taa tga 11
ata aca 89 aaa 167 aga 100
cta 89 cca 100 caa 78 cga 22
gta 189 gca 0 gaa 211 gga 67
ttg 100 tcg 100 tag tgg 78
atgj 122 acg 89 aag 89 agg 100
ctg 89 ccg 78 cag 122 cgg 100
gtg 44 gcg 56 gag 56 ggg 89
-rRNA inter max min total
1300 2089 1300 4689
neg6 indices des -rRNAs de l'annexe afn pour 100 génomes
g1    t1       
atgi 100 tct tat atgf 100
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc 200 tcc 100 tac 100 tgc 200
atc acc 100 aac 200 agc 100
ctc 100 ccc 100 cac 100 cgt 100
gtc 100 gcc 100 gac 300 ggc 400
tta 100 tca 100 taa tga
ata aca 100 aaa 200 aga 100
cta 100 cca 100 caa 100 cga
gta 200 gca gaa 200 gga 100
ttg 100 tcg 100 tag tgg 100
atgj 100 acg 100 aag 100 agg 100
ctg 200 ccg 100 cag 200 cgg 100
gtg 100 gcg 100 gag 100 ggg 100
afn inter max min total
1600 2400 1600 5600

negativicutes, comparaison clade-annexe des -rRNAs[modifier | modifier le wikicode]

  • Lien tableur: negativicutes, comparaison clade-annexe des -rRNAs
  • Légende
    - neg7. diff, somme des couleurs de neg7. La différence entre tRNAs est faite entre neg5 et neg6 du tableau précédent. Elle est exprimée en % et rapporté à la plus grande valeur des 2 termes de la différence. Ce qui fait quand un tRNA est à zéro la différence en % est égale à 100.
    - neg8. rap, rapport des sommes couleurs neg5/neg2. Le rapport -rRNA/total est celui du tRNA de neg5 sur celui de neg2.
  • Fréquences des différences en % du tableau neg7
gamme		0/0	10	20	30	40	50	60	70	80	90	100			total
fréquence		2	11	13	9	5	3	2	0	0	0	3	0	48
tot ≤ 50							41							
  • Comparaison avec le nombre de tRNAs de la fiche du clade: L’estimation des -rRNA par l'annexe est 10% au dessus de celle de la fiche des negativicutes.
tRNAs		fiche		annexe
sans		456		56
avec		152		4
genomes		9		1
indice %	51		56
neg Negativicutes 9 génomes
neg7 negativicutes, différence clade-annexe des -rRNAs
g1    t1       
atgi 22 tct tat atgf 25
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc 39 tcc 11 tac 25 tgc 39
atc 100 acc 18 aac 17 agc 11
ctc 0 ccc 22 cac 44 cgt 10
gtc 11 gcc 22 gac 37 ggc 17
tta 22 tca 0 taa tga 100
ata aca 11 aaa 17 aga 0
cta 11 cca 0 caa 22 cga 100
gta 6 gca gaa 5 gga 33
ttg 0 tcg 0 tag tgg 22
atgj 18 acg 11 aag 11 agg 0
ctg 56 ccg 22 cag 39 cgg 0
gtg 56 gcg 44 gag 44 ggg 11
diff inter max min total
275 263 294 833
neg8 negativicutes, rapports -rRNA/total
g1    t1       
atgi 88 tct tat atgf 80
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc 65 tcc 80 tac 75 tgc 85
atc -6 acc aac 58 agc 73
ctc 82 ccc cac 50 cgt 62
gtc gcc gac 71 ggc 91
tta 64 tca 90 taa tga
ata aca 62 aaa 75 aga
cta 89 cca 82 caa 54 cga
gta 71 gca 0 gaa 76 gga 60
ttg 82 tcg tag tgg 54
atgj 92 acg 89 aag 80 agg
ctg 80 ccg cag cgg
gtg gcg gag ggg
rap inter max min total
63 71 96 74

clostridia synthèse[modifier | modifier le wikicode]

clostridia distribution par génome[modifier | modifier le wikicode]

clostridia distribution par génome
baci >1aa 1aa -5s +5s -16s +16s duplica 1-3aas total
psor 12 5 4 72 7 4 104
cdc 4 4 2 70 3 83
cdc8 4 5 2 89 4 4 108
cbc* 34 10 0 0 2 6 54
cbn 48 12 2 6 3 4 4 7 90
cle 38 19 26 3 9 2 8 107
hmo 37 12 39 11 10 109
cbei 63 11 3 0 4 12 93
total 240 78 13 302 6 42 8 51 748

clostridia distribution du total[modifier | modifier le wikicode]

  • Lien tableur: clostridia distribution du total
  • Légende:
    - Couleurs du 1er tableau: voir la distribution des bacilli
    - Couleurs du 2ème tableau: d'après les couleurs du pieds du tableau
    - Couleurs du 3ème tableau: comme le tableau 2. Cependant les duplicata ne sont pas comptés dans le total de 55 mais dans le total des >1aa du 1er tableau.
    - Tableau des indices, en-tête: total des génomes, total des tRNAs, indice ttt, indice tgt.
Clostridia. Distribution du total.
clostridia. Distribution du total: >1aa 1aa +5s >3.
g1    t1       
atgi 10 tct tat atgf 32
att act aat agt
ctt 3 cct cat cgt
gtt gct gat ggt
ttc 19 tcc 7 tac 23 tgc 16
atc 3 acc 9 aac 22 agc 13
ctc 3 ccc 4 cac 16 cgc 11
gtc 4 gcc 1 gac 32 ggc 20
tta 22 tca 19 taa tga 3
ata 1 aca 30 aaa 31 aga 24
cta 19 cca 25 caa 22 cga 4
gta 41 gca gaa 36 gga 29
ttg 9 tcg 2 tag tgg 11
atgj 23 acg 4 aag 6 agg 6
ctg 6 ccg 2 cag 4 cgg 1
gtg 1 gcg 1 gag 4 ggg 3
clos8 >1aa 1aa -5s +5s -16s +16s total
type 248 78 302 628
clostridia. Distribution du total. -16s +5s <4
g1    t1       
atgi 8 tct tat atgf 2
att act aat agt
ctt cct cat cgt
gtt gct gat ggt
ttc 6 tcc 1 tac tgc 1
atc 1 acc 1 aac 7 agc 1
ctc 1 ccc cac cgc
gtc gcc gac 1 ggc 4
tta 4 tca 1 taa tga
ata aca aaa 6 aga 1
cta cca caa cga
gta gca 5 gaa 2 gga 2
ttg tcg tag tgg 1
atgj acg aag agg
ctg ccg cag cgg 1
gtg gcg gag ggg
clos8 >1aa 1aa -5s +5s -16s +16s total
type 51 6 57
clostridia. Distribution du total. duplica -5s +16s
g1    t1       
atgi tct tat atgf 2
att act aat agt
ctt 2 cct cat cgc
gtt gct gat ggt
ttc tcc tac tgc 2
atc 11 acc aac 5 agc
ctc ccc cac cgc
gtc gcc 5 gac ggc
tta tca 2 taa tga
ata aca 3 aaa aga
cta cca caa cga
gta gca 26 gaa gga 5
ttg tcg tag tgg
atgj acg aag agg
ctg ccg cag cgg
gtg gcg gag ggg
clos8 dupli 1aa -5s +5s -16s +16s total
type 8 13 42 55
clostridia. indices du 27.5.20 174 génomes
g1 t1 618 11144 4,0  0,6
atgi 159 tct 1,1 tat atgf 187
att 1,1 act aat agt 0,6
ctt 15,5 cct 2,3 cat cgc
gtt 0,6 gct gat ggt
ttc 206 tcc 103 tac 187 tgc 151
atc 152 acc 102 aac 248 agc 133
ctc 81 ccc 62 cac 140 cgt 116
gtc 53 gcc 61 gac 242 ggc 220
tta 172 tca 142 taa 1,1 tga 55
ata 2,9 aca 218 aaa 271 aga 174
cta 148 cca 163 caa 156 cga 48
gta 286 gca 219 gaa 239 gga 243
ttg 108 tcg 83 tag 2,3 tgg 120
atgj 132 acg 77 aag 120 agg 96
ctg 76 ccg 64 cag 77 cgg 60
gtg 34 gcg 35 gag 83 ggg 70
inter max min total

clostridia distribution par type[modifier | modifier le wikicode]

Clostridia. Distribution par type.
clostridia. distribution des solitaires
g1    t1          
atgi 1 tct tat atgf 1
att act aat agt 1
ctt 1 cct cat cgt
gtt gct gat ggt
ttc 1 tcc 6 tac tgc 1
atc acc 3 aac 1 agc 3
ctc 2 ccc 1 cac cgc 1
gtc gcc 1 gac ggc
tta tca 1 taa tga 3
ata 1 aca 2 aaa aga
cta 5 cca 4 caa cga 1
gta gca gaa gga 1
ttg 8 tcg 2 tag tgg 5
atgj acg 4 aag 1 agg 5
ctg 3 ccg 1 cag 3 cgg
gtg gcg 1 gag 3 ggg
clos8 1aa 78
clostridia. distribution du type >1aa sans duplicata.
g1    t1          
atgi tct tat atgf 8
att act aat agt
ctt cct cat cgt
gtt gct gat ggt
ttc 6 tcc tac 10 tgc 3
atc acc 3 aac 5 agc 5
ctc 1 ccc 1 cac 8 cgc 3
gtc 2 gcc gac 15 ggc 11
tta 11 tca 6 taa tga
ata aca 15 aaa 14 aga 10
cta 6 cca 10 caa 8 cga 3
gta 20 gca gaa 17 gga 13
ttg 1 tcg tag tgg 2
atgj 10 acg aag 5 agg 1
ctg 1 ccg cag 1 cgg 1
gtg 1 gcg gag ggg 3
clos8 >1aa 240
clostridia. distribution du type +5s >3.
g1    t1          
atgi 9 tct tat atgf 11
att act aat agt
ctt cct cat cgt
gtt gct gat ggt
ttc 12 tcc 1 tac 13 tgc 10
atc 3 acc 3 aac 16 agc 5
ctc ccc 2 cac 8 cgc 7
gtc 2 gcc gac 17 ggc 9
tta 11 tca 10 taa tga
ata aca 13 aaa 17 aga 14
cta 8 cca 11 caa 14 cga
gta 21 gca gaa 19 gga 15
ttg tcg tag tgg 4
atgj 13 acg aag agg
ctg 2 ccg 1 cag cgg
gtg gcg gag 1 ggg
clos8 +5s 302

clostridia par rapport au groupe de référence[modifier | modifier le wikicode]

Comparaison avec la référence
tRNAs blocs tRNAs blocs rRNAs
clos8 1aa >1aa dup +5s 1-3aas autres total
21 faible 31 19 2 6 2 5 65
16 moyen 36 66 4 101 20 42 269
14 fort 11 155 2 195 29 14 406
78 240 8 302 51 61 740
10 g+cga 16 13 2 31
2 agg+cgg 5 2 1 8
4 carre ccc 4 4 4 1 5 13
5 autres 6 2 8
31 19 2 6 2 5 65
total tRNAs ‰
clos8 1aa >1aa dup +5s 1-3aas autres clos ‰ ref.‰
21 faible 42 26 3 8 3 7 88 26
16 moyen 49 89 5 136 27 57 364 324
14 fort 15 209 3 264 39 19 549 650
105 324 11 408 69 82 740 729
10 g+cga 22 18 3 42 10
2 agg+cgg 7 3 1 11
4 carre ccc 5 5 5 1 7 18 16
5 autres 8 0 3 0 11
42 26 3 8 3 7 88
blocs tRNAs ‰ total colonne %
clos8 1aa >1aa dup total ref.‰ 1aa >1aa dup
21 faible 95 58 6 160 26 40 8
16 moyen 110 202 12 325 324 46 28
14 fort 34 475 6 515 650 14 65
239 736 25 326 729 78 240
10 g+cga 49 40 89 10 52
2 agg+cgg 15 6 21 16
4 carre ccc 12 12 25 16 13
5 autres 18 6 25 19
95 58 6 160 31

clostridia, estimation des -rRNAs[modifier | modifier le wikicode]

  • Lien tableur: clostridia, estimation des -rRNAs
  • Liens fiche:   typage
  • Légende: prélèvement de la base gtRNAdb le 27.5.20
    - ttt et tgt sont nuls partout
    - atgi, c'est Ile2, mis à la place de ttt, très rare chez les procaryotes.
    - atgf, c'est Metf, mis à la place de tgt, très rare chez les procaryotes.
    - atgj, c'est Met, remplace le atg standard qui est la somme Ile2 Met fMet.
    - Voir la légende des tris, g1 t1 et des couleurs

clostridia, calcul des -rRNAs[modifier | modifier le wikicode]

clo clostridia 63 génomes
clo1 cumul des +rRNAs de la fiche clostridia pour 43 génomes
g1    t1       
atgi 29 tct tat atgf 30
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc 44 tcc 1 tac 26 tgc 16
atc 72 acc 10 aac 64 agc 11
ctc 2 ccc 3 cac 12 cgt 8
gtc 4 gcc 12 gac 40 ggc 23
tta 19 tca 13 taa tga
ata aca 29 aaa 48 aga 21
cta 18 cca 17 caa 25 cga 1
gta 38 gca 92 gaa 45 gga 31
ttg tcg 1 tag tgg 9
atgj 18 acg 3 aag 2 agg 1
ctg 5 ccg 2 cag 1 cgg 3
gtg 1 gcg gag 4 ggg 2
clos43 inter max min total
346 468 42 856
clo2 indices du clade clostridia du 27.5.20 de gtRNAdb pour 100 génomes
g1    t1      174 4.0  0.6
atgi 159 tct 1.1 tat atgf 187
att 1.1 act aat agt 0.6
ctt 16 cct 2.3 cat cgc
gtt 0.6 gct gat ggt
ttc 206 tcc 103 tac 187 tgc 151
atc 152 acc 102 aac 248 agc 133
ctc 81 ccc 62 cac 140 cgt 116
gtc 53 gcc 61 gac 242 ggc 220
tta 172 tca 142 taa 1.1 tga 55
ata 2.9 aca 218 aaa 271 aga 174
cta 148 cca 163 caa 156 cga 48
gta 286 gca 219 gaa 239 gga 243
ttg 108 tcg 83 tag 2.3 tgg 120
atgj 132 acg 77 aag 120 agg 96
ctg 76 ccg 64 cag 77 cgg 60
gtg 34 gcg 35 gag 83 ggg 70
gtRNA inter max min total
2231 2982 1177 6390
clo3 cumul des -rRNAs de l'annexe archeo 8 génomes
g1    t1       
atgi 1 tct tat atgf 11
att act aat agt 1
ctt 3 cct cat cgc
gtt gct gat ggt
ttc 7 tcc 6 tac 10 tgc 6
atc acc 6 aac 6 agc 8
ctc 3 ccc 2 cac 8 cgt 4
gtc 2 gcc 1 gac 15 ggc 11
tta 11 tca 9 taa tga 3
ata 1 aca 17 aaa 14 aga 10
cta 11 cca 14 caa 8 cga 4
gta 20 gca gaa 17 gga 14
ttg 9 tcg 2 tag tgg 7
atgj 10 acg 4 aag 6 agg 6
ctg 4 ccg 1 cag 4 cgg 1
gtg 1 gcg 1 gag 3 ggg 3
clos8 inter max min total
107 168 51 326
clo4 indices des +rRNAs de la fiche clostridia pour 100 génomes
g1    t1       
atgi 67 tct tat atgf 70
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc 102 tcc 2.3 tac 60 tgc 37
atc 167 acc 23 aac 149 agc 26
ctc 4.7 ccc 7 cac 28 cgt 19
gtc 9.3 gcc 28 gac 93 ggc 53
tta 44 tca 30 taa tga 3.0
ata aca 67 aaa 112 aga 49
cta 42 cca 40 caa 58 cga 2.3
gta 88 gca 214 gaa 105 gga 72
ttg tcg 2.3 tag tgg 21
atgj 42 acg 7.0 aag 4.7 agg 2.3
ctg 12 ccg 4.7 cag 2.3 cgg 7.0
gtg 2.3 gcg gag 9.3 ggg 4.7
clos43 inter max min total
805 1088 98 1991
clo5 estimation des -rRNA du clade clostridia pour 100 génomes
g1    t1       
atgi 92 tct 1.1 tat atgf 117
att 1.1 act aat agt 0.6
ctt 16 cct 2.3 cat cgc
gtt 0.6 gct gat ggt
ttc 104 tcc 101 tac 127 tgc 114
atc -15 acc 79 aac 99 agc 107
ctc 76 ccc 55 cac 112 cgt 97
gtc 44 gcc 33 gac 149 ggc 167
tta 128 tca 112 taa 1.1 tga 55
ata 2.9 aca 151 aaa 159 aga 125
cta 106 cca 123 caa 98 cga 46
gta 198 gca 5 gaa 134 gga 171
ttg 108 tcg 81 tag 2.3 tgg 99
atgj 90 acg 70 aag 115 agg 94
ctg 64 ccg 59 cag 75 cgg 53
gtg 32 gcg 35 gag 74 ggg 65
-rRNA inter max min total
1426 1894 1080 4400
clo6 indices des -rRNAs de l'annexe archeo pour 100 génomes
g1    t1       
atgi 13 tct tat atgf 138
att act aat agt 13
ctt 38 cct cat cgc
gtt gct gat ggt
ttc 88 tcc 75 tac 125 tgc 75
atc acc 75 aac 75 agc 100
ctc 38 ccc 25 cac 100 cgt 50
gtc 25 gcc 13 gac 188 ggc 138
tta 138 tca 113 taa tga 38
ata 13 aca 213 aaa 175 aga 125
cta 138 cca 175 caa 100 cga 50
gta 250 gca gaa 213 gga 175
ttg 113 tcg 25 tag tgg 88
atgj 125 acg 50 aag 75 agg 75
ctg 50 ccg 13 cag 50 cgg 13
gtg 13 gcg 13 gag 38 ggg 38
clos8 inter max min total
1325 2100 638 4063

clostridia, comparaison clade-annexe des -rRNAs[modifier | modifier le wikicode]

  • Lien tableur: clostridia, comparaison clade-annexe des -rRNAs
  • Légende
    - clo7. diff, somme des couleurs de clo7. La différence entre tRNAs est faite entre clo5 et clo6 du tableau précédent. Elle est exprimée en % et rapporté à la plus grande valeur des 2 termes de la différence. Ce qui fait quand un tRNA est à zéro la différence en % est égale à 100.
    - clo8. rap, rapport des sommes couleurs clo5/clo2. Le rapport -rRNA/total est celui du tRNA de clo5 sur celui de clo2.
  • Fréquences des différences en % du tableau clo7
gamme		0/0	10	20	30	40	50	60	70	80	90	100		total
fréquence	0	11	6	10	5	4	3	4	3	1	2	0	49
tot ≤ 50						41							
  • Comparaison avec le nombre de tRNAs de la fiche du clade: L’estimation des -rRNA par l'annexe est 15% en dessous de celle de la fiche des clostridia.
tRNAs		fiche		annexe
sans		2050		326
avec		888		752
genomes		43		8
indice %	48		41
clo clostridia 63 génomes
clo7 clostridia, différence clade-annexe des -rRNAs
g1    t1       
atgi 86 tct 100 tat atgf 15
att 100 act aat agt 95
ctt 59 cct 100 cat cgc
gtt 100 gct gat ggt
ttc 16 tcc 26 tac 1 tgc 34
atc 100 acc 5 aac 24 agc 7
ctc 51 ccc 55 cac 11 cgt 49
gtc 43 gcc 62 gac 21 ggc 17
tta 7 tca 1 taa 100 tga 32
ata 77 aca 29 aaa 9 aga 0
cta 23 cca 29 caa 2 cga 9
gta 21 gca 100 gaa 37 gga 2
ttg 4 tcg 69 tag 100 tgg 12
atgj 28 acg 29 aag 35 agg 20
ctg 22 ccg 79 cag 33 cgg 76
gtg 61 gcg 64 gag 49 ggg 43
diff inter max min total
265 272 944 1481
clo8 clostridia, rapports -rRNA/total
g1    t1       
atgi 58 tct tat atgf 63
att act aat agt 95
ctt 100 cct cat cgc
gtt gct gat ggt
ttc 50 tcc 98 tac 68 tgc 75
atc -10 acc 77 aac 40 agc 81
ctc 94 ccc 89 cac 80 cgt 84
gtc 82 gcc 54 gac 62 ggc 76
tta 74 tca 79 taa tga 100
ata 100 aca 69 aaa 59 aga 72
cta 72 cca 75.7 caa 63 cga 95
gta 69 gca 2 gaa 56 gga 70
ttg 100 tcg 97 tag tgg 83
atgj 68 acg 91 aag 96 agg 98
ctg 85 ccg 93 cag 97 cgg 88
gtg 93 gcg 100 gag 89 ggg 93
rap inter max min total
64 64 92 69