En raison de limitations techniques, la typographie souhaitable du titre, «
Annexe : clostridia
Les clusters de gènes tRNA et rRNA chez les procaryotes/Annexe/clostridia », n'a pu être restituée correctement ci-dessus.
Tanger le 3.11.19
Paeniclostridium sordellii AM370
psor opérons
- Liens: gtRNAdb, NCBI [1], génome [2]
- Lien tableur: psor opérons
- Phylogénie: Bacteria; Firmicutes; Clostridia; Clostridiales;Peptostreptococcaceae; Paeniclostridium.
- Légende: cdsa: cds aas, cdsj: cdsa sans jaune, cdsd: cdsa dirigé
- - @2, cds de 62 aas, hp, à allure répétitive susceptible d'être créé par contrainte lors des conversions ou d'autres réparations: MWLFFLFFFLFFFLFFFFFLFFFLFFFFFLFFFFFFPIVVLQTEINFRYGYIYTIHSGIIF
- - @4, riboswitch se trouve dans un bloc à rRNA. Concerne cette remarque aussi le RNA non codant, ncRNA, à l'adresse 19421..19685.
- Note: il n'y apas de gtRNAdb. Aussi j'ai comparé (EXACT NB.CAR STXT) les 1ers atgf atgi atgj du génome cdc, avec les atg de psor.
C1 Paeniclostridium sordellii AM370
27.3%GC |
8.8.19 Paris |
112 |
doubles |
intercal |
cds |
aa |
avec aa |
cdsa |
cdsd
|
|
9847..10620 |
CDS |
|
205 |
205 |
|
|
258 |
|
|
10826..12332 |
16s |
|
196 |
|
|
|
|
|
|
12529..15445 |
23s |
|
78 |
|
|
|
|
|
|
15524..15640 |
5s |
|
85 |
85 |
|
|
|
85
|
|
15726..15947 |
CDS |
|
|
|
|
|
74 |
|
|
|
|
|
|
|
|
|
|
|
18845..19297 |
CDS |
|
3 |
3 |
|
|
151 |
3
|
|
19301..19393 |
tcc |
|
27 |
|
|
|
|
|
|
19421..19685 |
ncRNA |
|
152 |
152 |
|
|
|
|
|
19838..21478 |
CDS |
|
|
|
|
|
*547 |
|
|
|
|
|
|
|
|
|
|
|
24343..24570 |
CDS |
|
309 |
309 |
|
|
76 |
|
|
24880..26386 |
16s |
|
196 |
|
|
|
|
|
|
26583..29499 |
23s |
|
122 |
|
|
|
|
|
|
29622..29738 |
5s |
|
5 |
|
|
5 |
|
|
|
29744..29832 |
tta |
+ |
13 |
|
|
13 |
|
|
|
29846..29921 |
atgf |
3 aaa |
15 |
|
|
15 |
|
|
|
29937..30011 |
gaa |
6 atg |
9 |
|
|
9 |
|
|
|
30021..30094 |
gga |
3 gta |
6 |
|
|
6 |
|
|
|
30101..30176 |
gta |
1 cgt |
5 |
|
|
5 |
|
|
|
30182..30258 |
gac |
1 ggc |
16 |
|
|
16 |
|
|
|
30275..30350 |
aac |
2 fois suite |
4 |
|
|
4 |
|
|
|
30355..30429 |
aca |
aac aca aga |
4 |
|
|
4 |
|
|
|
30434..30518 |
tac |
caa cac cca |
15 |
|
|
15 |
|
|
|
30534..30617 |
cta |
cta gaa gac |
14 |
|
|
14 |
|
|
|
30632..30708 |
aga |
gga tac tca |
7 |
|
|
7 |
|
|
|
30716..30791 |
caa |
tgc tta ttc |
11 |
|
|
11 |
|
|
|
30803..30878 |
aaa |
|
6 |
|
|
6 |
|
|
|
30885..30973 |
tca |
|
3 |
|
|
3 |
|
|
|
30977..31052 |
ttc |
|
9 |
|
|
9 |
|
|
|
31062..31138 |
atgj |
|
8 |
|
|
8 |
|
|
|
31147..31223 |
atgi |
|
21 |
|
|
21 |
|
|
|
31245..31321 |
cca |
|
6 |
|
|
6 |
|
|
|
31328..31404 |
cac |
|
4 |
|
|
4 |
|
|
|
31409..31482 |
tgc |
|
25 |
|
|
25 |
|
|
|
31508..31596 |
tta |
|
13 |
|
|
13 |
|
|
|
31610..31685 |
atgf |
|
15 |
|
|
15 |
|
|
|
31701..31775 |
gaa |
|
9 |
|
|
9 |
|
|
|
31785..31858 |
gga |
|
6 |
|
|
6 |
|
|
|
31865..31940 |
gta |
|
5 |
|
|
5 |
|
|
|
31946..32022 |
gac |
|
16 |
|
|
16 |
|
|
|
32039..32114 |
aac |
|
4 |
|
|
4 |
|
|
|
32119..32193 |
aca |
|
4 |
|
|
4 |
|
|
|
32198..32282 |
tac |
|
15 |
|
|
15 |
|
|
|
32298..32381 |
cta |
|
11 |
|
|
11 |
|
|
|
32393..32467 |
ggc |
|
13 |
|
|
13 |
|
|
|
32481..32557 |
aga |
|
7 |
|
|
7 |
|
|
|
32565..32640 |
caa |
|
11 |
|
|
11 |
|
|
|
32652..32727 |
aaa |
|
6 |
|
|
6 |
|
|
|
32734..32822 |
tca |
|
3 |
|
|
3 |
|
|
|
32826..32901 |
ttc |
|
9 |
|
|
9 |
|
|
|
32911..32987 |
atgj |
|
8 |
|
|
8 |
|
|
|
32996..33072 |
atgi |
|
21 |
|
|
21 |
|
|
|
33094..33170 |
cca |
|
6 |
|
|
6 |
|
|
|
33177..33253 |
cac |
|
9 |
|
|
9 |
|
|
|
33263..33338 |
aaa |
|
21 |
|
|
21 |
|
|
|
33360..33433 |
tgc |
|
6 |
|
|
6 |
|
|
|
33440..33516 |
cgt |
|
10 |
|
|
|
|
|
|
33527..33602 |
gta |
|
162 |
162 |
|
|
|
162
|
|
33765..34016 |
CDS |
|
|
|
|
|
84 |
|
|
|
|
|
|
|
|
|
|
|
34042..34455 |
CDS |
|
249 |
249 |
|
|
138 |
|
|
34705..36211 |
16s |
|
196 |
|
|
|
|
|
|
36408..39324 |
23s |
|
78 |
|
|
|
|
|
|
39403..39519 |
5s |
|
402 |
*402 |
|
|
|
|
comp |
39922..40113 |
CDS |
|
348 |
348 |
|
|
64 |
|
|
40462..41968 |
16s |
|
196 |
|
|
|
|
|
|
42165..45081 |
23s |
|
78 |
|
|
|
|
|
|
45160..45276 |
5s |
|
180 |
180 |
|
|
|
*180
|
|
45457..47394 |
CDS |
|
|
|
|
|
*646 |
|
|
|
|
|
|
|
|
|
|
|
101428..102144 |
CDS |
|
276 |
276 |
|
|
239 |
|
|
102421..103927 |
16s |
|
54 |
|
|
|
|
|
|
103982..104057 |
gca |
|
114 |
|
|
|
|
|
|
104172..107096 |
23s |
|
41 |
|
|
|
|
|
|
107138..107211 |
gga |
|
11 |
|
|
|
|
|
|
107223..107339 |
5s |
|
99 |
99 |
|
|
|
99
|
comp |
107439..108617 |
CDS |
|
|
|
|
|
393 |
|
|
|
|
|
|
|
|
|
|
|
111345..111884 |
CDS |
|
431 |
*431 |
|
|
180 |
|
|
112316..113822 |
16s |
|
54 |
|
|
|
|
|
|
113877..113952 |
gca |
|
114 |
|
|
|
|
|
|
114067..116982 |
23s |
|
193 |
|
|
|
|
|
|
117176..117292 |
5s |
|
5 |
|
|
|
|
|
|
117298..117386 |
tta |
|
9 |
|
|
9 |
|
|
|
117396..117472 |
atgi |
|
123 |
|
|
|
|
|
|
117596..119102 |
16s |
|
54 |
|
|
|
|
|
|
119157..119232 |
gca |
|
114 |
|
|
|
|
|
|
119347..122263 |
23s |
|
193 |
|
|
|
|
|
|
122457..122573 |
5s |
|
5 |
|
|
|
|
|
|
122579..122667 |
tta |
|
9 |
|
|
9 |
|
|
|
122677..122753 |
atgi |
|
123 |
|
|
|
|
|
|
122877..124383 |
16s |
|
54 |
|
|
|
|
|
|
124438..124513 |
gca |
|
114 |
|
|
|
|
|
|
124628..127549 |
23s |
|
78 |
|
|
|
|
|
|
127628..127744 |
5s |
|
100 |
100 |
|
|
|
100
|
|
127845..129260 |
CDS |
|
|
|
|
|
472 |
|
|
|
|
|
|
|
|
|
|
|
215388..216260 |
CDS |
|
264 |
264 |
|
|
291 |
|
|
216525..218030 |
16s |
|
123 |
|
|
|
|
|
|
218154..218229 |
gca |
|
152 |
|
|
|
|
|
|
218382..221296 |
23s |
|
50 |
|
|
|
|
|
|
221347..221420 |
gga |
|
12 |
|
|
|
|
|
|
221433..221549 |
5s |
|
109 |
109 |
|
|
|
109
|
|
221659..221940 |
CDS |
|
525 |
*525 |
|
|
94 |
|
|
222466..223972 |
16s |
|
196 |
|
|
|
|
|
|
224169..227083 |
23s |
|
144 |
|
|
|
|
|
|
227228..227344 |
5s |
|
228 |
228 |
|
|
|
*228
|
|
227573..227989 |
CDS |
|
|
|
|
|
139 |
|
|
|
|
|
|
|
|
|
|
|
449964..450266 |
CDS |
|
253 |
253 |
|
|
101 |
|
|
450520..452026 |
16s |
|
196 |
|
|
|
|
|
|
452223..455139 |
23s |
|
144 |
|
|
|
|
|
|
455284..455400 |
5s |
|
112 |
112 |
|
|
|
112
|
comp |
455513..456616 |
CDS |
|
|
|
|
|
368 |
|
|
|
|
|
|
|
|
|
|
|
498418..499074 |
CDS |
|
189 |
189 |
|
|
219 |
|
|
499264..500770 |
16s |
|
118 |
|
|
|
|
|
|
500889..500964 |
gca |
|
95 |
|
|
|
|
|
|
501060..503976 |
23s |
|
144 |
|
|
|
|
|
|
504121..504237 |
5s |
|
131 |
131 |
|
|
|
131
|
|
504369..504551 |
CDS |
|
|
|
|
|
61 |
|
|
|
|
|
|
|
|
|
|
|
546886..550416 |
CDS |
|
41 |
41 |
|
|
*1177 |
*41
|
comp |
550458..550544 |
ttg |
|
138 |
138 |
|
|
|
|
|
550683..553325 |
CDS |
|
|
|
|
|
*881 |
|
|
|
|
|
|
|
|
|
|
|
608009..608683 |
CDS |
|
195 |
195 |
|
|
225 |
|
|
608879..608975 |
tga |
|
37 |
37 |
|
|
|
37
|
comp |
609013..609732 |
CDS |
|
|
|
|
|
240 |
|
|
|
|
|
|
|
|
|
|
|
815939..816655 |
CDS |
|
71 |
71 |
|
|
239 |
71
|
|
816727..816800 |
tgc |
|
12 |
|
12 |
|
|
|
|
816813..816888 |
aac |
|
3 |
|
3 |
|
|
|
|
816892..816966 |
aca |
|
285 |
285 |
|
|
|
|
|
817252..818727 |
CDS |
|
|
|
|
|
492 |
|
|
|
|
|
|
|
|
|
|
|
1284870..1288097 |
CDS |
|
111 |
111 |
|
|
*1076 |
*111
|
|
1288209..1288297 |
cta |
|
426 |
*426 |
|
|
|
|
|
1288724..1290853 |
CDS |
|
|
|
|
|
*710 |
|
|
|
|
|
|
|
|
|
|
|
1445161..1445664 |
CDS |
|
135 |
135 |
|
|
168 |
135
|
|
1445800..1445868 |
other |
@1 |
258 |
258 |
|
|
|
|
|
1446127..1446813 |
CDS |
|
|
|
|
|
229 |
|
|
|
|
|
|
|
|
|
|
|
2267513..2267698 |
CDS |
@2 |
306 |
306 |
|
|
62 |
*306
|
comp |
2268005..2268088 |
cta |
|
404 |
*404 |
|
|
|
|
|
2268493..2269758 |
CDS |
|
|
|
|
|
422 |
|
|
|
|
|
|
|
|
|
|
|
3094098..3094784 |
CDS |
|
40 |
40 |
|
|
229 |
40
|
comp |
3094825..3094941 |
5s |
|
78 |
|
|
|
|
|
comp |
3095020..3097936 |
23s |
|
194 |
|
|
|
|
|
comp |
3098131..3099637 |
16s |
|
276 |
276 |
|
|
|
|
comp |
3099914..3101161 |
CDS |
|
|
|
|
|
416 |
|
|
|
|
|
|
|
|
|
|
|
3159922..3160827 |
CDS |
|
37 |
37 |
|
|
302 |
37
|
comp |
3160865..3160956 |
agc |
|
120 |
120 |
|
|
|
|
comp |
3161077..3161376 |
CDS |
|
|
|
|
|
100 |
|
|
|
|
|
|
|
|
|
|
comp |
3274188..3274733 |
CDS |
|
245 |
245 |
|
|
182 |
*245
|
comp |
3274979..3275095 |
5s |
@3 |
12 |
|
|
|
|
|
comp |
3275108..3275181 |
gga |
|
107 |
|
|
|
|
|
comp |
3275289..3278214 |
23s |
|
137 |
|
|
|
|
|
comp |
3278352..3279858 |
16s |
|
253 |
253 |
|
|
|
|
comp |
3280112..3280690 |
CDS |
|
|
|
|
|
193 |
|
|
|
|
|
|
|
|
|
|
comp |
3303104..3304150 |
CDS |
|
124 |
124 |
|
|
349 |
124
|
comp |
3304275..3304459 |
riboswitch |
@4 |
96 |
|
|
|
|
|
comp |
3304556..3304672 |
5s |
|
11 |
|
|
|
|
|
comp |
3304684..3304758 |
aca |
|
116 |
|
|
|
|
|
comp |
3304875..3307789 |
23s |
|
196 |
|
|
|
|
|
comp |
3307986..3309492 |
16s |
|
364 |
*364 |
|
|
|
|
|
3309857..3310504 |
CDS |
|
|
|
|
|
216 |
|
|
|
|
|
|
|
|
|
|
comp |
3438683..3439531 |
CDS |
|
142 |
142 |
|
|
283 |
142
|
comp |
3439674..3439750 |
aga |
|
7 |
|
|
7 |
|
|
comp |
3439758..3439832 |
ggc |
|
9 |
|
|
9 |
|
|
comp |
3439842..3439918 |
gac |
|
5 |
|
|
5 |
|
|
comp |
3439924..3439999 |
gta |
|
8 |
|
|
8 |
|
|
comp |
3440008..3440082 |
gaa |
|
5 |
|
|
|
|
|
comp |
3440088..3440204 |
5s |
|
40 |
|
|
|
|
|
comp |
3440245..3443168 |
23s |
|
112 |
|
|
|
|
|
comp |
3443281..3443356 |
gca |
|
109 |
|
|
|
|
|
comp |
3443466..3444972 |
16s |
|
138 |
|
|
|
|
|
comp |
3445111..3445187 |
atgj |
+ |
13 |
|
|
13 |
|
|
comp |
3445201..3445276 |
ttc |
3 atg |
6 |
|
|
6 |
|
|
comp |
3445283..3445359 |
atc |
2 cca |
6 |
|
|
6 |
|
|
comp |
3445366..3445442 |
cca |
2 gga |
31 |
|
|
31 |
|
|
comp |
3445474..3445549 |
tgg |
2 aac |
11 |
|
|
11 |
|
|
comp |
3445561..3445637 |
atgi |
|
6 |
|
|
6 |
|
|
comp |
3445644..3445720 |
cca |
|
6 |
|
|
6 |
|
|
comp |
3445727..3445817 |
agc |
|
11 |
|
|
11 |
|
|
comp |
3445829..3445917 |
tca |
|
6 |
|
|
6 |
|
|
comp |
3445924..3445999 |
aaa |
|
12 |
|
|
12 |
|
|
comp |
3446012..3446087 |
caa |
|
6 |
|
|
6 |
|
|
comp |
3446094..3446170 |
aga |
|
19 |
|
|
19 |
|
|
comp |
3446190..3446263 |
gga |
|
11 |
|
|
11 |
|
|
comp |
3446275..3446359 |
tac |
|
4 |
|
|
4 |
|
|
comp |
3446364..3446438 |
aca |
|
4 |
|
|
4 |
|
|
comp |
3446443..3446518 |
aac |
|
31 |
|
|
31 |
|
|
comp |
3446550..3446625 |
aac |
|
16 |
|
|
16 |
|
|
comp |
3446642..3446718 |
gac |
|
5 |
|
|
5 |
|
|
comp |
3446724..3446799 |
gta |
|
6 |
|
|
6 |
|
|
comp |
3446806..3446879 |
gga |
|
9 |
|
|
9 |
|
|
comp |
3446889..3446963 |
gaa |
|
15 |
|
|
15 |
|
|
comp |
3446979..3447054 |
atgf |
|
13 |
|
|
13 |
|
|
comp |
3447068..3447156 |
tta |
|
5 |
|
|
|
|
|
comp |
3447162..3447278 |
5s |
|
213 |
|
|
|
|
|
comp |
3447492..3450406 |
23s |
|
196 |
|
|
|
|
|
comp |
3450603..3452109 |
16s |
|
239 |
239 |
|
|
|
|
comp |
3452349..3452552 |
CDS |
|
|
|
|
|
68 |
|
|
|
|
|
|
|
|
|
|
comp |
3523330..3524046 |
CDS |
|
129 |
129 |
|
|
239 |
129
|
comp |
3524176..3524251 |
gta |
+ |
8 |
|
8 |
|
|
|
comp |
3524260..3524334 |
gaa |
2 fois |
20 |
|
20 |
|
|
|
comp |
3524355..3524430 |
aaa |
gta gaa aaa |
10 |
|
10 |
|
|
|
comp |
3524441..3524515 |
aca |
|
10 |
|
10 |
|
|
|
comp |
3524526..3524602 |
gac |
|
7 |
|
7 |
|
|
|
comp |
3524610..3524685 |
gta |
|
9 |
|
9 |
|
|
|
comp |
3524695..3524769 |
gaa |
|
5 |
|
5 |
|
|
|
comp |
3524775..3524850 |
aaa |
|
289 |
289 |
|
|
|
|
|
3525140..3526039 |
CDS |
|
|
|
|
|
300 |
|
psor cumuls
cumuls. Paeniclostridium sordellii AM370
opérons |
Fréquences intercalaires tRNAs |
Fréquences intercalaires cds |
Fréquences aas cds
|
|
|
effectif |
gammes |
sans rRNAs |
avec rRNAs |
gammes |
cds |
gammes |
cdsd |
gammes |
cdsa
|
avec rRNA |
opérons |
17 |
1 |
0 |
0 |
1 |
0 |
1 |
0 |
100 |
9
|
|
16 23 5s 0 |
6 |
20 |
9 |
65 |
50 |
5 |
20 |
1 |
200 |
8
|
|
16 atc gca |
0 |
40 |
0 |
6 |
100 |
4 |
40 |
3 |
300 |
13
|
|
16 23 5s a |
2 |
60 |
0 |
0 |
150 |
10 |
60 |
1 |
400 |
4
|
|
max a |
44 |
80 |
0 |
0 |
200 |
5 |
80 |
1 |
500 |
4
|
|
a doubles |
2 |
100 |
0 |
0 |
250 |
5 |
100 |
3 |
600 |
1
|
|
autres |
9 |
120 |
0 |
0 |
300 |
8 |
120 |
3 |
700 |
1
|
|
total aas |
87 |
140 |
0 |
0 |
350 |
3 |
140 |
4 |
800 |
1
|
sans |
opérons |
8 |
160 |
0 |
0 |
400 |
1 |
160 |
1 |
900 |
1
|
|
1 aa |
6 |
180 |
0 |
0 |
450 |
4 |
180 |
2 |
1000 |
0
|
|
max a |
8 |
200 |
0 |
0 |
500 |
0 |
200 |
0 |
1100 |
1
|
|
a doubles |
1 |
|
0 |
0 |
|
1 |
|
3 |
|
1
|
|
total aas |
17 |
|
9 |
71 |
|
46 |
|
22 |
|
44
|
total aas |
|
104 |
|
|
|
|
|
|
|
|
|
remarques |
|
4 |
|
|
|
|
|
|
|
|
|
avec jaune |
|
|
moyenne |
9 |
10 |
|
206 |
|
119 |
|
304
|
|
|
|
variance |
5 |
6 |
|
121 |
|
73 |
|
257
|
sans jaune |
|
|
moyenne |
|
|
|
173 |
|
95 |
|
220
|
|
|
|
variance |
|
|
|
90 |
|
45 |
|
121
|
psor blocs
- Lien tableur: psor blocs
- Lien cdc blocs: le tabeau de cdc blocs est à comparer à celui de psor pour les types manquants, en gris dans cdc blocs.
- Légende:
- - Les blocs sont rangés par type de I à IV pour les blocs 16s23s et de V à X pour les blocs 16sgca23s. Chaque bloc est noté par son type suivi d'un indice.
- - La 1ère partie du tableau représente la totalité des blocs; la 2ème les groupes où les blocs se suivent avec des intercalaires très faibles. Seul l'intercalaire séparant le bloc V2 de I4 est élevé et le plus grand du tableau, 525. Je considère qu'un intercalaire inférieur à 350 est faible relativement aux intercalaires intra bloc. Les intercalaires avec les CDS sont faibles ici puisque seulement 3 sont supérieurs à 350, 402 (I2), 431 (VI1) et 525 (I4). Voir le tableau des cumuls pour tout les intercalaires des cds où seulement 6 sur 46 dépassent 350, avec une moyenne de 173±90.
- - Les couleurs, rouge pour rRNA, vert pour une configuration peu courante, un gène tRNA entre 23s et 5s, et ribosw pour riboswitch. Le cyan pour repérer le même intercalaire par rapport à la direction 16s23s5s quand elle change quand on a des adresses complément.
- Notes:
- - 3 blocs avec des tRNAs longs, 44 23 5, concentrant les 2/3 des tRNAs avec des blocs 16s23s. 15 tRNAs sont dans des blocs courts ou 16sgca23s. Les tRNAs extra blocs sont 17.
- - 10 blocs 16s23s contre 7 blocs 16sgca23s
- - Le regroupement des blocs par 3 et 2 concerne 10 blocs et restent donc 7 blocs solitaires, 3 sans tRNA et 4 avec 1 ou 2 tRNA.
- - Existence de 4 cds intra groupe de petite taille en aas, 84 138 64 pour le 2èmer groupe, et 94 pour le 4ème groupe.
- - Le 1er groupe de 3 blocs n'a pas de cds internes et est constitué de la duplication d'un même bloc.
- - Des intercalaires très faibles inter blocs
- - Des intercalaires intra blocs qui se répètent beaucoup mais peuvent être divisés ou multipliés par 2.
intercalaire Total
16s-23s 9*196 137 10
23s-5s 5*78 4*144 3*193 40 13
16s-gca 4*54 3*120 7
gca-23s 5*114 95 152 7
5s-aas 4*5 (tta) 5 (gaa) 5
C1. Paeniclostridium sordellii AM370, blocs à rRNA
I |
|
I2 |
I3 |
I4 |
|
|
II |
|
III |
|
IV |
IV1 |
IV2
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
CDS |
124 |
|
|
|
|
|
|
|
|
|
|
CDS |
245 |
ribosw |
96 |
|
|
|
CDS |
205 |
249 |
348 |
525 |
253 |
40 |
5s |
12 |
5s |
11 |
CDS |
309 |
5
|
16s |
196 |
196 |
196 |
196 |
196 |
78 |
gga |
107 |
aca |
116 |
16s |
196 |
213
|
23s |
78 |
78 |
78 |
144 |
144 |
194 |
23s |
137 |
23s |
196 |
23s |
122 |
196
|
5s |
85 |
402 |
180 |
228 |
112 |
276 |
16s |
253 |
16s |
364 |
5s |
5 |
239
|
CDS |
|
|
|
|
|
|
CDS |
|
CDS |
|
tta |
|
|
V |
|
V2 |
VI |
VI1 |
VII |
VII1 |
VIII |
VIII1 |
IX |
|
X |
X1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
CDS |
276 |
264 |
CDS |
431 |
|
|
|
|
CDS |
189 |
gaa |
5 |
|
16s |
54 |
123 |
16s |
54 |
16s |
54 |
16s |
54 |
16s |
118 |
5s |
40 |
|
gca |
114 |
152 |
gca |
114 |
gca |
114 |
gca |
114 |
gca |
95 |
23s |
112 |
|
23s |
41 |
50 |
23s |
193 |
23s |
193 |
23s |
78 |
23s |
144 |
gca |
109 |
|
gga |
11 |
12 |
5s |
5 |
5s |
5 |
5s |
100 |
5s |
131 |
16s |
138 |
|
5s |
99 |
109 |
tta |
9 |
tta |
9 |
CDS |
|
CDS |
|
atg |
|
|
CDS |
|
|
atg |
123 |
atg |
123 |
|
|
|
|
|
|
|
groupe1 |
groupe2 |
groupe3 |
groupe4 |
|
|
|
CDS |
431 |
|
CDS |
309 |
|
CDS |
142 |
|
CDS |
264 |
|
|
VI1 |
16s |
54 |
IV1 |
16s |
196 |
|
**4aas |
8 |
V2 |
16s |
123 |
|
|
|
gca |
114 |
|
23s |
122 |
|
gaa |
5 |
|
gca |
152 |
|
|
|
23s |
193 |
|
5s |
5 |
|
5s |
40 |
|
23s |
50 |
|
|
|
5s |
5 |
|
tta |
13 |
|
23s |
112 |
|
gga |
12 |
|
|
|
tta |
9 |
|
**42aas |
10 |
|
gca |
109 |
|
5s |
109 |
|
|
|
atg |
123 |
|
gta |
162 |
X1 |
16s |
138 |
|
CDS |
525 |
|
|
VII1 |
16s |
54 |
|
CDS |
25 |
|
atg |
13 |
I4 |
16s |
196 |
|
|
|
gca |
114 |
|
CDS |
249 |
|
**21aas |
13 |
|
23s |
144 |
|
|
|
23s |
193 |
I2 |
16s |
196 |
|
tta |
5 |
|
5s |
228 |
|
|
|
5s |
5 |
|
23s |
78 |
|
5s |
213 |
|
CDS |
|
|
|
|
tta |
9 |
|
5s |
402 |
|
23s |
196 |
|
|
|
|
|
|
atg |
123 |
|
CDS |
348 |
IV2 |
16s |
239 |
|
|
|
|
|
VIII1 |
16s |
54 |
I3 |
16s |
196 |
|
CDS |
|
|
|
|
|
|
|
gca |
114 |
|
23s |
78 |
|
|
|
|
|
|
|
|
|
23s |
78 |
|
5s |
180 |
|
|
|
|
|
|
|
|
|
5s |
100 |
|
CDS |
|
|
|
|
|
|
|
|
|
|
CDS |
|
|
|
|
|
|
|
|
|
|
|
|
psor remarques
- Lien tableur: psor remarques
- Nombre de gènes protéines: 3327 (NCBI)
- Rmarques @:
- - Un tRNA nommé other, non déterminé
- - cds de 62 aas, hp, à allure répétitive susceptible d'être créé par contrainte lors des conversions ou d'autres réparations: MWLFFLFFFLFFFLFFFFFLFFFLFFFFFLFFFFFFPIVVLQTEINFRYGYIYTIHSGIIF
- - une configuration rare 23s-aas-5s concerne 3 gga et 1 aca
- - Les RNAs non codants: riboswitch dans un bloc à rRNA et ncRNA dans un bloc sans rRNA, adresse 19421..19685.
- Configuration des blocs: voir psor blocs.
- Les séquences des doubles: Il y a très peu de doubles mais des duplications de séquences. Le signe + dans psor opérons indique les doubles.
- - séquence 44 aas: voir psor opérons, la couleur cyan pour la duplication de 20 aas et la couleur verte pour les insertions. Je n'ai pas pu distingué les 3 types d'atg dans 6 atg, qui certainement doivent être départagés en 2 atgf 2 atgj 2 atgi. Ce qui laisse 2 doubles aaa et gta.
- - séquence 23 aas: voir ci-dessous l'analogie de séquence entre 23 aas et le début de 44 aas. Seuls 3 aas ont des doubles cca gga aac, aucune séquence n'est dupliquée.
- - séquence 5 aas, c'est une petite séquence simple à la suite du blocs 23aas. Est-ce le fait d'être dans un bloc 416s-gca-23s?
- - séquence 8 aas: voir psor opérons, adresse 3523330..3524046, duplication de 3 aas. Est-ce que ça ne serait pas une séquence détachée d'un bloc 16s23s5s comme les 2 autres longs blocs.
23aas tta atg gaa gga gta gac aac aac aca tac gga aga caa aaa tca agc cca atg tgg cca atc ttc atg
44aas tta atg gaa gga gta gac aac aca tac cta aga caa aaa tca ttc atg atg cca cac - - - -
psor distribution
- Lien tableur: psor distribution
- Notes: tableau Cl12 blocs à de 3 tRNAs sauf
- - -5s: 3 gga et aca
- - 1-3 aas: 2 tta et 2 atgi
Cl1 psor, Paeniclostridium sordellii AM370. clostridia.
Cl11 psor. La distribution des tRNAs sans rRNA.
g1 |
|
t1 |
|
|
|
|
|
a atgi |
|
a tct |
|
tat |
|
atgf |
|
b att |
|
i act |
|
aat |
|
agt |
|
c ctt |
|
e cct |
|
cat |
|
cgc |
|
d gtt |
|
m gct |
|
gat |
|
ggt |
|
e ttc |
|
b tcc |
|
tac |
|
tgc |
1
|
f atc |
|
j acc |
1 |
aac |
1 |
agc |
1
|
g ctc |
|
f ccc |
|
cac |
|
cgt |
|
h gtc |
|
n gcc |
|
gac |
1 |
ggc |
|
i tta |
|
c tca |
|
taa |
|
tga |
1
|
j ata |
|
k aca |
2 |
aaa |
2 |
aga |
|
k cta |
2 |
g cca |
|
caa |
|
cga |
|
l gta |
2 |
o gca |
|
gaa |
2 |
gga |
|
m ttg |
1 |
d tcg |
|
tag |
|
tgg |
|
n atgj |
|
l acg |
|
aag |
|
agg |
|
o ctg |
|
h ccg |
|
cag |
|
cgg |
|
p gtg |
|
p gcg |
|
gag |
|
ggg |
|
clos |
>1aa |
=1aa |
-5s |
+5s |
-16s |
+16s |
total
|
psor |
12 |
5* |
|
|
|
|
17
|
|
Cl12 psor. La distribution des tRNAs avec rRNA.
g1 |
|
t1 |
|
|
|
|
|
a atgi |
5 |
a tct |
|
tat |
|
atgf |
3
|
b att |
|
i act |
|
aat |
|
agt |
|
c ctt |
|
e cct |
|
cat |
|
cgc |
|
d gtt |
|
m gct |
|
gat |
|
ggt |
|
e ttc |
3 |
b tcc |
|
tac |
3 |
tgc |
2
|
f atc |
1 |
j acc |
|
aac |
4 |
agc |
1
|
g ctc |
|
f ccc |
|
cac |
2 |
cgt |
1
|
h gtc |
|
n gcc |
|
gac |
4 |
ggc |
2
|
i tta |
5 |
c tca |
3 |
taa |
|
tga |
|
j ata |
|
k aca |
4 |
aaa |
4 |
aga |
4
|
k cta |
2 |
g cca |
4 |
caa |
4 |
cga |
|
l gta |
5 |
o gca |
7 |
gaa |
4 |
gga |
7
|
m ttg |
|
d tcg |
|
tag |
|
tgg |
1
|
n atgj |
3 |
l acg |
|
aag |
|
agg |
|
o ctg |
|
h ccg |
|
cag |
|
cgg |
|
p gtg |
|
p gcg |
|
gag |
|
ggg |
|
clos |
>1aa |
=1aa |
-5s |
+5s |
-16s |
+16s |
total
|
psor |
|
|
4* |
76* |
|
7 |
87
|
|
Peptoclostridium difficile CD196
cdc opérons
- Liens: gtRNAdb [3], NCBI [4], génome [orgn]
- Lien tableur: cdc opérons
- Phylogénie: Bacteria; Firmicutes; Clostridia; Clostridiales;Peptostreptococcaceae; Clostridioides.
- Légende: cdsa: cds aas, cdsd: cds dirigé
C2 Peptoclostridium difficile CD196
28.6%GC |
11.9.19 Paris |
83 |
doubles |
intercal |
cds |
aa |
avec aa |
cdsa |
cdsd |
protéines
|
dir |
9857..10630 |
cds |
|
179 |
179 |
|
|
258 |
|
SigB/SigF/SigG family RNA polymerase sigma factor
|
dir |
10810..12317 |
16s |
|
52 |
|
|
|
|
|
|
dir |
12370..12445 |
gca |
|
249 |
|
|
|
|
|
|
dir |
12695..15596 |
23s |
|
111 |
|
|
|
|
|
|
dir |
15708..15824 |
5s |
|
126 |
126 |
|
|
|
126 |
|
dir |
15951..16460 |
cds |
|
|
|
|
|
170 |
|
transcription repressor NadR
|
|
|
|
|
|
|
|
|
|
|
|
dir |
19402..19857 |
cds |
|
0 |
0 |
|
|
152 |
0 |
nucleoside deaminase
|
dir |
19858..19949 |
tcc |
|
37 |
|
|
|
|
|
|
dir |
19987..20251 |
ncRNA |
@1 |
76 |
76 |
|
|
|
|
|
dir |
20328..21965 |
cds |
|
|
|
|
|
546 |
|
DNA polymerase III subunit gamma/tau
|
|
|
|
|
|
|
|
|
|
|
|
comp |
23419..24624 |
cds |
|
505 |
*505 |
|
|
402 |
|
glycosyl transferase
|
dir |
25130..26637 |
16s |
|
279 |
|
|
|
|
|
|
dir |
26917..29816 |
23s |
+ |
180 |
|
|
|
|
|
|
dir |
29997..30113 |
5s |
3 aaa |
6 |
|
|
|
|
|
|
dir |
30120..30194 |
aac |
3 gta |
6 |
|
|
6 |
|
|
|
dir |
30201..30286 |
tta |
|
15 |
|
|
15 |
|
|
|
dir |
30302..30377 |
atgf |
|
7 |
|
|
7 |
|
|
|
dir |
30385..30459 |
gaa |
|
9 |
|
|
9 |
|
|
|
dir |
30469..30542 |
gga |
|
5 |
|
|
5 |
|
|
|
dir |
30548..30623 |
gta |
|
5 |
|
|
5 |
|
|
|
dir |
30629..30705 |
gac |
|
9 |
|
|
9 |
|
|
|
dir |
30715..30789 |
aca |
|
14 |
|
|
14 |
|
|
|
dir |
30804..30888 |
tac |
|
8 |
|
|
8 |
|
|
|
dir |
30897..30980 |
cta |
|
29 |
|
|
29 |
|
|
|
dir |
31010..31086 |
aga |
|
7 |
|
|
7 |
|
|
|
dir |
31094..31169 |
caa |
|
88 |
|
|
88 |
|
|
|
dir |
31258..31346 |
tca |
|
3 |
|
|
3 |
|
|
|
dir |
31350..31425 |
ttc |
|
6 |
|
|
6 |
|
|
|
dir |
31432..31508 |
atgj |
|
11 |
|
|
11 |
|
|
|
dir |
31520..31596 |
atgi |
|
23 |
|
|
23 |
|
|
|
dir |
31620..31696 |
cca |
|
7 |
|
|
7 |
|
|
|
dir |
31704..31780 |
cac |
|
8 |
|
|
8 |
|
|
|
dir |
31789..31864 |
aaa |
|
7 |
|
|
7 |
|
|
|
dir |
31872..31945 |
tgc |
|
6 |
|
|
6 |
|
|
|
dir |
31952..32026 |
aac |
|
5 |
|
|
5 |
|
|
|
dir |
32032..32117 |
tta |
|
15 |
|
|
15 |
|
|
|
dir |
32133..32208 |
atgf |
|
7 |
|
|
7 |
|
|
|
dir |
32216..32290 |
gaa |
|
9 |
|
|
9 |
|
|
|
dir |
32300..32373 |
gga |
|
5 |
|
|
5 |
|
|
|
dir |
32379..32454 |
gta |
|
5 |
|
|
5 |
|
|
|
dir |
32460..32536 |
gac |
|
9 |
|
|
9 |
|
|
|
dir |
32546..32620 |
aca |
|
14 |
|
|
14 |
|
|
|
dir |
32635..32719 |
tac |
|
9 |
|
|
9 |
|
|
|
dir |
32729..32812 |
cta |
|
23 |
|
|
23 |
|
|
|
dir |
32836..32910 |
ggc |
|
24 |
|
|
24 |
|
|
|
dir |
32935..33011 |
aga |
|
9 |
|
|
9 |
|
|
|
dir |
33021..33096 |
caa |
|
8 |
|
|
8 |
|
|
|
dir |
33105..33180 |
aaa |
|
2 |
|
|
2 |
|
|
|
dir |
33183..33271 |
tca |
|
3 |
|
|
3 |
|
|
|
dir |
33275..33350 |
ttc |
|
6 |
|
|
6 |
|
|
|
dir |
33357..33433 |
atgj |
|
11 |
|
|
11 |
|
|
|
dir |
33445..33521 |
atgi |
|
17 |
|
|
17 |
|
|
|
dir |
33539..33615 |
cac |
|
8 |
|
|
8 |
|
|
|
dir |
33624..33699 |
aaa |
|
7 |
|
|
7 |
|
|
|
dir |
33707..33780 |
tgc |
|
7 |
|
|
7 |
|
|
|
dir |
33788..33864 |
cgt |
|
12 |
|
|
12 |
|
|
|
dir |
33877..33952 |
gta |
|
75 |
75 |
|
|
|
75 |
|
dir |
34028..34441 |
cds |
|
308 |
308 |
|
|
138 |
|
hp
|
dir |
34750..38181 |
cds |
|
|
|
|
|
1144 |
|
pyruvate carboxylase
|
|
|
|
|
|
|
|
|
|
|
|
dir |
127011..127715 |
cds |
|
281 |
281 |
|
|
235 |
|
N-acetylmuramoyl-L-alanine amidase CwlD
|
dir |
127997..129505 |
16s |
|
279 |
|
|
|
|
|
|
dir |
129785..132685 |
23s |
+ |
131 |
|
|
|
|
|
|
dir |
132817..132933 |
5s |
2 cca |
6 |
|
|
|
|
|
|
dir |
132940..133014 |
aac |
|
4 |
|
|
4 |
|
|
|
dir |
133019..133093 |
gaa |
|
5 |
|
|
5 |
|
|
|
dir |
133099..133174 |
gta |
|
5 |
|
|
5 |
|
|
|
dir |
133180..133256 |
gac |
|
10 |
|
|
10 |
|
|
|
dir |
133267..133341 |
aca |
|
14 |
|
|
14 |
|
|
|
dir |
133356..133440 |
tac |
|
9 |
|
|
9 |
|
|
|
dir |
133450..133523 |
gga |
|
10 |
|
|
10 |
|
|
|
dir |
133534..133610 |
aga |
|
9 |
|
|
9 |
|
|
|
dir |
133620..133695 |
caa |
|
11 |
|
|
11 |
|
|
|
dir |
133707..133782 |
aaa |
|
2 |
|
|
2 |
|
|
|
dir |
133785..133873 |
tca |
|
17 |
|
|
17 |
|
|
|
dir |
133891..133981 |
agc |
|
8 |
|
|
8 |
|
|
|
dir |
133990..134066 |
cca |
|
85 |
|
|
85 |
|
|
|
dir |
134152..134227 |
tgg |
|
60 |
|
|
60 |
|
|
|
dir |
134288..134364 |
cca |
|
6 |
|
|
6 |
|
|
|
dir |
134371..134447 |
atc |
|
3 |
|
|
3 |
|
|
|
dir |
134451..134526 |
ttc |
|
7 |
|
|
7 |
|
|
|
dir |
134534..134610 |
atgj |
|
114 |
|
|
|
|
|
|
dir |
134725..136115 |
16s |
|
68 |
|
|
|
|
|
|
dir |
136184..136259 |
gca |
|
271 |
|
|
|
|
|
|
dir |
136531..139430 |
23s |
|
126 |
|
|
|
|
|
|
dir |
139557..139673 |
5s |
|
213 |
213 |
|
|
|
213 |
|
comp |
139887..141071 |
cds |
|
372 |
*372 |
|
|
395 |
|
pyridoxal phosphate-dependent aminotransferase
|
dir |
141444..143795 |
cds |
|
21 |
21 |
|
|
784 |
|
anaerobic ribonucleoside triphosphate reductase
|
dir |
143817..144356 |
cds |
|
776 |
*776 |
|
|
180 |
|
anaerobic ribonucleoside-triphosphate reductase activating protein
|
dir |
145133..146640 |
16s |
|
52 |
|
|
|
|
|
|
dir |
146693..146768 |
gca |
|
373 |
|
|
|
|
|
|
dir |
147142..150041 |
23s |
|
126 |
|
|
|
|
|
|
dir |
150168..150284 |
5s |
|
7 |
|
|
7 |
|
|
|
dir |
150292..150366 |
aac |
|
5 |
|
|
5 |
|
|
|
dir |
150372..150457 |
tta |
|
15 |
|
|
15 |
|
|
|
dir |
150473..150548 |
atgf |
|
7 |
|
|
7 |
|
|
|
dir |
150556..150630 |
gaa |
|
14 |
|
|
14 |
|
|
|
dir |
150645..150718 |
gga |
|
5 |
|
|
5 |
|
|
|
dir |
150724..150799 |
gta |
|
5 |
|
|
5 |
|
|
|
dir |
150805..150881 |
gac |
|
10 |
|
|
10 |
|
|
|
dir |
150892..150966 |
ggc |
|
9 |
|
|
9 |
|
|
|
dir |
150976..151049 |
aga |
|
975 |
*975 |
|
|
|
|
|
dir |
152025..152864 |
cds |
|
|
|
|
|
280 |
|
TIGR00159 family protein
|
|
|
|
|
|
|
|
|
|
|
|
dir |
378341..380728 |
cds |
|
583 |
*583 |
|
|
796 |
|
cadmium-translocating P-type ATPase
|
dir |
381312..382819 |
16s |
|
311 |
|
|
|
|
|
|
dir |
383131..386030 |
23s |
|
126 |
|
|
|
|
|
|
dir |
386157..386273 |
5s |
|
177 |
177 |
|
|
|
177 |
|
dir |
386451..387059 |
cds |
|
|
|
|
|
203 |
|
DedA family protein
|
|
|
|
|
|
|
|
|
|
|
|
comp |
833130..833894 |
cds |
|
258 |
258 |
|
|
255 |
|
DeoR/GlpR transcriptional regulator
|
dir |
834153..834243 |
agc |
|
87 |
87 |
|
|
|
87 |
|
dir |
834331..835119 |
cds |
|
|
|
|
|
263 |
|
flagellar motor protein
|
|
|
|
|
|
|
|
|
|
|
|
dir |
1089165..1090139 |
cds |
|
239 |
239 |
|
|
325 |
239 |
Mannosyl-glycoprotein endo-beta-N-acetylglucosamidase
|
dir |
1090379..1091886 |
16s |
|
320 |
|
|
|
|
|
|
dir |
1092207..1095106 |
23s |
|
91 |
|
|
|
|
|
|
dir |
1095198..1095271 |
gga |
@2 |
8 |
|
|
|
|
|
|
dir |
1095280..1095396 |
5s |
|
273 |
273 |
|
|
|
|
|
dir |
1095670..1097688 |
cds |
|
|
|
|
|
673 |
|
N-acetylmuramoyl-L-alanine amidase
|
|
|
|
|
|
|
|
|
|
|
|
comp |
1181549..1182958 |
cds |
|
1374 |
*1374 |
|
|
470 |
|
MBOAT family protein
|
comp |
1184333..1184415 |
ttg |
|
318 |
318 |
|
|
|
318 |
|
dir |
1184734..1187382 |
cds |
|
|
|
|
|
883 |
|
DNA polymerase I
|
|
|
|
|
|
|
|
|
|
|
|
dir |
1835768..1837498 |
cds |
|
109 |
109 |
|
|
577 |
109 |
Na+/H+ antiporter NhaC family protein
|
dir |
1837608..1837688 |
cta |
|
231 |
231 |
|
|
|
|
|
<dir |
1837920..1838093 |
cds |
|
|
|
|
|
58 |
|
HXXEE domain-containing protein
|
|
|
|
|
|
|
|
|
|
|
|
dir |
2981767..2982444 |
cds |
|
159 |
159 |
|
|
226 |
159 |
sortase SrtB
|
comp |
2982604..2982678 |
aca |
@3 |
94 |
|
|
|
|
|
|
comp |
2982773..2985672 |
23s |
|
184 |
|
|
|
|
|
|
comp |
2985857..2987364 |
16s |
|
340 |
340 |
|
|
|
|
|
dir |
2987705..2988643 |
cds |
|
|
|
|
|
313 |
|
delta-lactam-biosynthetic de-N-acetylase
|
|
|
|
|
|
|
|
|
|
|
|
comp |
3787361..3788431 |
cds |
|
454 |
*454 |
|
|
357 |
|
ABC transporter ATP-binding protein
|
comp |
3788886..3789002 |
5s |
|
126 |
|
|
|
|
|
|
comp |
3789129..3792028 |
23s |
|
281 |
|
|
|
|
|
|
comp |
3792310..3793817 |
16s |
|
191 |
191 |
|
|
|
191 |
|
comp |
3794009..3794587 |
cds |
|
|
|
|
|
193 |
|
bifunctional precorrin-2 dehydrogenase/sirohydrochlorin ferrochelatase
|
|
|
|
|
|
|
|
|
|
|
|
comp |
3944262..3944453 |
cds |
|
119 |
119 |
|
|
64 |
119 |
DUF378 domain-containing protein
|
comp |
3944573..3944689 |
5s |
|
126 |
|
|
|
|
|
|
comp |
3944816..3947715 |
23s |
|
217 |
|
|
|
|
|
|
comp |
3947933..3949440 |
16s |
|
282 |
282 |
|
|
|
|
|
comp |
3949723..3950004 |
cds |
|
221 |
221 |
|
|
94 |
|
hp
|
comp |
3950226..3951755 |
cds |
|
|
|
|
|
510 |
|
lysine--tRNA ligase
|
|
|
|
|
|
|
|
|
|
|
|
dir |
4084445..4085437 |
cds |
|
382 |
*382 |
|
|
331 |
|
DNA replication protein DnaC
|
comp |
4085820..4085894 |
aca |
|
|
|
33 |
|
|
|
|
comp |
4085928..4086003 |
gta |
|
|
|
4 |
|
|
|
|
comp |
4086008..4086082 |
gaa |
|
|
|
6 |
|
|
|
|
comp |
4086089..4086164 |
aaa |
|
326 |
326 |
|
|
|
326 |
|
comp |
4086491..4087780 |
cds |
|
|
|
|
|
430 |
|
adenylosuccinate synthase
|
cdc cumuls
cumuls. Peptoclostridium difficile CD196
opérons |
Fréquences intercalaires tRNAs |
Fréquences intercalaires cds |
Fréquences aas cds
|
|
|
effectif |
gammes |
sans rRNAs |
avec rRNAs |
gammes |
cds |
gammes |
cdsd |
gammes |
cdsa
|
avec rRNA |
opérons |
10 |
1 |
|
0 |
1 |
1 |
1 |
1 |
100 |
3
|
|
16 23 5s 0 |
3 |
20 |
2 |
61 |
50 |
1 |
20 |
0 |
200 |
5
|
|
16 gca 235 |
3 |
40 |
1 |
4 |
100 |
3 |
40 |
0 |
300 |
7
|
|
16 23 5s a |
2 |
60 |
|
1 |
150 |
3 |
60 |
0 |
400 |
5
|
|
max a |
43 |
80 |
|
0 |
200 |
4 |
80 |
1 |
500 |
3
|
|
a doubles |
2 |
100 |
|
2 |
250 |
4 |
100 |
1 |
600 |
3
|
|
autres |
2 |
120 |
|
0 |
300 |
4 |
120 |
2 |
700 |
1
|
|
total aas |
75 |
140 |
|
0 |
350 |
4 |
140 |
1 |
800 |
2
|
sans |
opérons |
5 |
160 |
|
0 |
400 |
2 |
160 |
1 |
900 |
1
|
|
1 aa |
4 |
180 |
|
0 |
450 |
0 |
180 |
1 |
1000 |
0
|
|
max a |
4 |
200 |
|
0 |
500 |
1 |
200 |
1 |
1100 |
0
|
|
a doubles |
0 |
|
|
0 |
|
5 |
|
4 |
|
1
|
|
total aas |
8 |
|
3 |
68 |
|
32 |
|
13 |
|
31
|
total aas |
|
83 |
|
|
|
|
|
|
|
|
|
remarques |
|
3 |
|
|
|
|
|
|
|
|
|
avec jaune |
|
|
moyenne |
14 |
12 |
|
313 |
|
165 |
|
378
|
|
|
|
variance |
|
15 |
|
283 |
|
94 |
|
259
|
sans jaune |
|
|
moyenne |
|
9 |
|
206 |
|
|
|
286
|
|
|
|
variance |
|
5 |
|
107 |
|
|
|
144
|
cdc blocs
- Lien tableur: cdc blocs
- Lien psor blocs: le tabeau de cdc blocs est à comparer à celui de psor pour les types manquants, ici en gris.
- Légende: voir psor blocs.
- Notes:
- - cdc a perdu 3 blocs de type I, 16s23s5s sans tRNAs; les 2 blocs de type V, 16s-gca-23sgga5s et les 2 blocs 16s-gca-23s5s-2aas de type VI et VII. Soit la moitié des blocs courts, 7 sur 14, et plus de la moitié des blocs 16s-gca, 4 sur 7. Les 3 blocs longs sont maintenus mais modifiés.
C2. cdc blocs
|
groupes |
|
types |
|
|
|
absents |
|
|
|
|
|
|
|
|
cds |
281 |
I |
|
|
|
|
II |
|
III |
|
IV |
IV1 |
IV2
|
IV2 |
16s |
279 |
|
|
|
|
|
|
|
|
|
|
|
|
|
23s |
131 |
CDS |
583 |
454 |
119 |
|
cds |
239 |
|
|
|
|
|
|
5s |
6 |
16s |
311 |
126 |
126 |
|
16s |
320 |
cds |
159 |
cds |
505 |
281
|
|
aac |
4 |
23s |
126 |
281 |
217 |
|
23s |
91 |
aca |
94 |
16s |
279 |
279
|
|
**16aas |
3 |
5s |
177 |
191 |
282 |
|
gga |
8 |
23s |
184 |
23s |
180 |
131
|
|
ttc |
7 |
CDS |
|
|
|
|
5s |
273 |
16s |
340 |
5s |
6 |
6
|
|
atgj |
114 |
|
|
|
|
|
cds |
|
cds |
|
aac |
6 |
4
|
VIII1 |
16s |
68 |
|
|
|
|
|
|
|
|
|
|
|
|
|
gca |
271 |
|
|
|
|
|
V |
|
V2 |
VI |
VI1 |
VII |
VII1
|
|
23s |
126 |
|
|
|
|
|
|
|
|
|
|
|
|
|
5s |
213 |
|
|
|
|
|
|
|
|
|
|
|
|
|
cds |
372 |
|
|
|
|
|
|
|
|
|
|
|
|
|
cds |
21 |
|
|
|
|
|
VIII |
VIII1 |
IX |
|
X |
X1 |
|
|
cds |
776 |
|
|
|
|
|
|
|
|
|
cds |
21 |
|
X1 |
16s |
52 |
|
|
|
|
|
atgj |
114 |
cds |
179 |
cds |
776 |
|
|
gca |
373 |
|
|
|
|
|
16s |
68 |
16s |
52 |
16s |
52 |
|
|
23s |
126 |
|
|
|
|
|
gca |
271 |
gca |
249 |
gca |
373 |
|
|
5s |
7 |
|
|
|
|
|
23s |
126 |
23s |
111 |
23s |
126 |
|
|
aac |
5 |
|
|
|
|
|
5s |
213 |
5s |
126 |
5s |
7 |
|
|
**7aas |
9 |
|
|
|
|
|
cds |
372 |
cds |
|
aac |
5 |
|
|
aga |
975 |
|
|
|
|
|
|
|
|
|
|
|
|
|
cds |
|
|
|
|
|
|
|
|
|
|
|
|
|
cdc psor
- Lien tableur: cdc psor
- Comparaison bsu-lmo: Les séquences, les cumuls.
- Légende:
- - La couleur cyan pour les différents entre cdc et psor; bois pour les identiques entre les clusters 43aas et 18aas de cdc d'une part et les clusters 44aas et 23aas de psor. Le gène aaa du cluster 18aas de cdc a son identique dans la 2ème partie du cluster 43aas et non dans la 1ère partie, car la duplication n'est pas exacte.
- - Le bleu pour des intercalaires exceptionnels.
- - Les blocs 16s indiquent des rRNAs de bordure, l'équivalent d'un cds.
- - Le jaune pour la conservation des cds: je ne l'ai appliqué ici qu'aux petits clusters sans rRNAs; Comparer les cumuls des intercalaires et protéines des cds de cdc et psor montre clairement que les clusters soit, sont très mobiles ou bien qu'il y a de nombreuses recombinansons entre le cluster et ses cds. Le jaune indique ici des intercalaires et des protéines presque identiques.
- - Les bordures très épaisses noires encadrent les 7 gènes du cluster 9aas identiques dans les duplicata du 43aas, comparaison cdc-cdc. Les bordures très épaisses bleues encadrent les 4 gènes du cluster 9aas de cdc et ceux du 23aas de psor, comparaison cdc-psor.
- Notes:
- - Les 3 blocs longs de cdc commencent tous par aac. Chez psor 2 blocs longs et 2 courts commencent par tta et 1 bloc long gca commence par gaa.
- - Le jaune encadré montre que le cluster cta conservé dans cdc est celui ayant une protéine identique, 58 contre 62 aas dans psor. Or dans psor ce cluster présente des répétitions caractéristiques des contraintes imposées aux réparations.
- - Les fréquences des différences entre intercalaires (diff) sont reportées dans le dernier tableau C24 et sont établies sur la plage des différences entre intercalaires cdc et psor du tableau C21 pour des couples identiques. 16% des différences sont nulles (8 sur 49) et 50% ne dépassent pas 2 paires de bases. Ces résultats sont à mettre en parallèle avec ceux de la omparaison bsu-lmo, avec les séquences et les cumuls. La faible variabilité des intercalaires cdc-psor par rapport à bsu-lmo est due à leur plus grande filiation, niveau genre contre le niveau famille pour bsu-lmo.
C2. Comparaison cdc-psor
C21. Comparaison cdc-psor
cdc |
intercal |
psor |
intercal |
diff
|
cds |
505 |
cds |
309 |
|
16s |
279 |
16s |
196 |
|
23s |
180 |
23s |
122 |
|
5s |
6 |
5s |
5 |
|
aac |
6 |
tta |
13 |
|
tta |
15 |
atg |
15 |
-2
|
atgf |
7 |
gaa |
9 |
8
|
gaa |
9 |
gga |
6 |
0
|
gga |
5 |
gta |
5 |
1
|
gta |
5 |
gac |
16 |
|
gac |
9 |
aac |
4 |
|
aca |
14 |
aca |
4 |
-10
|
tac |
8 |
tac |
15 |
7
|
cta |
29 |
cta |
14 |
-15
|
aga |
7 |
aga |
7 |
0
|
caa |
88 |
caa |
11 |
|
tca |
3 |
aaa |
6 |
|
ttc |
6 |
tca |
3 |
0
|
atgj |
11 |
ttc |
9 |
3
|
atgi |
23 |
atg |
8 |
-3
|
cca |
7 |
atg |
21 |
-2
|
cac |
8 |
cca |
6 |
-1
|
aaa |
7 |
cac |
4 |
|
tgc |
6 |
tgc |
25 |
|
aac |
5 |
tta |
13 |
-2
|
tta |
15 |
atg |
15 |
8
|
atgf |
7 |
gaa |
9 |
0
|
gaa |
9 |
gga |
6 |
1
|
gga |
5 |
gta |
5 |
0
|
gta |
5 |
gac |
16 |
|
gac |
9 |
aac |
4 |
|
aca |
14 |
aca |
4 |
-10
|
tac |
9 |
tac |
15 |
6
|
cta |
23 |
cta |
11 |
-12
|
ggc |
24 |
ggc |
13 |
-11
|
aga |
9 |
aga |
7 |
-2
|
caa |
8 |
caa |
11 |
3
|
aaa |
2 |
aaa |
6 |
4
|
tca |
3 |
tca |
3 |
0
|
ttc |
6 |
ttc |
9 |
3
|
atgj |
11 |
atg |
8 |
-3
|
atgi |
17 |
atg |
21 |
|
cac |
8 |
cca |
6 |
|
aaa |
7 |
cac |
9 |
1
|
tgc |
7 |
aaa |
21 |
14
|
cgt |
12 |
tgc |
6 |
-1
|
gta |
75 |
cgt |
10 |
-2
|
cds |
|
gta |
162 |
|
|
|
cds |
|
|
|
|
|
|
|
cds |
776 |
|
|
|
16s |
52 |
|
|
|
gca |
373 |
|
|
|
23s |
126 |
|
|
|
5s |
7 |
atg |
138 |
|
aac |
5 |
16s |
109 |
|
tta |
15 |
gca |
112 |
|
atgf |
7 |
23s |
40 |
|
gaa |
14 |
5s |
5 |
|
gga |
5 |
gaa |
8 |
|
gta |
5 |
gta |
5 |
0
|
gac |
10 |
gac |
9 |
-1
|
ggc |
9 |
ggc |
7 |
-2
|
aga |
975 |
aga |
142 |
|
cds |
|
cds |
|
|
|
|
|
|
|
cds |
281 |
cds |
239 |
|
16s |
279 |
16s |
196 |
|
23s |
131 |
23s |
213 |
|
5s |
6 |
5s |
5 |
|
aac |
4 |
tta |
13 |
|
gaa |
5 |
atg |
15 |
|
gta |
5 |
gaa |
9 |
|
gac |
10 |
gga |
6 |
|
aca |
14 |
gta |
5 |
|
tac |
9 |
gac |
16 |
|
gga |
10 |
aac |
31 |
|
aga |
9 |
aac |
4 |
|
caa |
11 |
aca |
4 |
-10
|
aaa |
2 |
tac |
11 |
2
|
tca |
17 |
gga |
19 |
9
|
agc |
8 |
aga |
6 |
-3
|
cca |
85 |
caa |
12 |
1
|
tgg |
60 |
aaa |
6 |
4
|
cca |
6 |
tca |
11 |
-6
|
atc |
3 |
agc |
6 |
-2
|
ttc |
7 |
cca |
6 |
|
atgj |
114 |
atg |
11 |
|
16s |
|
tgg |
31 |
-29
|
|
|
cca |
6 |
0
|
|
|
atc |
6 |
3
|
|
|
ttc |
13 |
6
|
|
|
atg |
138 |
|
|
|
16s |
|
|
|
|
|
|
|
|
|
cds |
129 |
|
|
|
gta |
8 |
|
|
|
gaa |
20 |
|
|
|
aaa |
10 |
|
cds |
382 |
aca |
10 |
|
aca |
33 |
gac |
7 |
|
gta |
4 |
gta |
9 |
5
|
gaa |
6 |
gaa |
5 |
-1
|
aaa |
326 |
aaa |
289 |
|
cds |
|
cds |
|
|
|
C22. Comparaisons internes
cdc |
intercal |
cdc |
intercal |
diff
|
cds |
505 |
cds |
281 |
|
16s |
279 |
16s |
279 |
|
23s |
180 |
23s |
131 |
|
5s |
6 |
5s |
6 |
|
aac |
6 |
aac |
4 |
|
tta |
15 |
gaa |
5 |
|
atgf |
7 |
gta |
5 |
|
gaa |
9 |
gac |
10 |
|
gga |
5 |
aca |
14 |
|
gta |
5 |
tac |
9 |
0
|
gac |
9 |
gga |
10 |
1
|
aca |
14 |
aga |
9 |
0
|
tac |
8 |
caa |
11 |
|
cta |
29 |
aaa |
2 |
|
aga |
7 |
tca |
17 |
2
|
caa |
88 |
agc |
8 |
|
tca |
3 |
cca |
85 |
|
ttc |
6 |
tgg |
60 |
|
atgj |
11 |
cca |
6 |
|
atgi |
23 |
atc |
3 |
|
cca |
7 |
ttc |
7 |
|
cac |
8 |
atgj |
114 |
|
aaa |
7 |
16s |
|
|
tgc |
6 |
cds |
776 |
|
aac |
5 |
16s |
52 |
|
tta |
15 |
gca |
373 |
|
atgf |
7 |
23s |
126 |
|
gaa |
9 |
5s |
7 |
|
gga |
5 |
aac |
5 |
|
gta |
5 |
tta |
15 |
0
|
gac |
9 |
atgf |
7 |
1
|
aca |
14 |
gaa |
14 |
0
|
tac |
9 |
gga |
5 |
|
cta |
23 |
gta |
5 |
|
ggc |
24 |
gac |
10 |
|
aga |
9 |
ggc |
9 |
0
|
caa |
8 |
aga |
975 |
3
|
aaa |
2 |
cds |
|
0
|
tca |
3 |
|
|
|
ttc |
6 |
|
|
|
atgj |
11 |
|
|
|
atgi |
17 |
|
|
|
cac |
8 |
|
|
|
aaa |
7 |
|
|
|
tgc |
7 |
|
|
|
cgt |
12 |
|
|
|
gta |
75 |
|
|
|
cds |
|
|
|
|
|
|
|
|
|
psor |
|
psor |
intercal |
diff
|
cds |
309 |
cds |
239 |
|
16s |
196 |
16s |
196 |
|
23s |
122 |
23s |
213 |
|
5s |
5 |
5s |
5 |
|
tta |
13 |
tta |
13 |
0
|
atg |
15 |
atg |
15 |
0
|
gaa |
9 |
gaa |
9 |
0
|
gga |
6 |
gga |
6 |
0
|
gta |
5 |
gta |
5 |
0
|
gac |
16 |
gac |
16 |
0
|
aac |
4 |
aac |
31 |
|
aca |
4 |
aac |
4 |
|
tac |
15 |
aca |
4 |
0
|
cta |
14 |
tac |
11 |
-4
|
aga |
7 |
cta |
19 |
5
|
caa |
11 |
aga |
6 |
-1
|
aaa |
6 |
caa |
12 |
1
|
tca |
3 |
aaa |
6 |
0
|
ttc |
9 |
tca |
11 |
|
atg |
8 |
agc |
6 |
|
atg |
21 |
cca |
6 |
|
cca |
6 |
atg |
11 |
|
cac |
4 |
tgg |
31 |
|
tgc |
25 |
cca |
6 |
|
tta |
13 |
atc |
6 |
0
|
atg |
15 |
ttc |
13 |
0
|
gaa |
9 |
atg |
138 |
0
|
gga |
6 |
16s |
|
0
|
gta |
5 |
atg |
138 |
0
|
gac |
16 |
16s |
109 |
0
|
aac |
4 |
gca |
112 |
|
aca |
4 |
23s |
40 |
0
|
tac |
15 |
5s |
5 |
|
cta |
11 |
gaa |
8 |
|
ggc |
13 |
gta |
5 |
|
aga |
7 |
gac |
9 |
-1
|
caa |
11 |
ggc |
7 |
1
|
aaa |
6 |
aga |
142 |
0
|
tca |
3 |
cds |
|
|
ttc |
9 |
|
|
|
atg |
8 |
|
|
|
atg |
21 |
|
|
|
cca |
6 |
|
|
|
cac |
9 |
|
|
|
aaa |
21 |
|
|
|
tgc |
6 |
|
|
|
cgt |
10 |
|
|
|
gta |
162 |
|
|
|
cds |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
C23. Conservation des cds
cdc |
intercal |
psor |
intercal |
protéines
|
cds |
0 |
cds |
3 |
151 – 152
|
tcc |
37 |
tcc |
27 |
|
ncRNA |
76 |
ncRNA |
152 |
547 – 546
|
cds |
|
cds |
|
|
|
|
|
|
|
cds |
1374 |
cds |
41 |
470 – 1177
|
ttg |
318 |
ttg |
138 |
883 – 881
|
cds |
|
cds |
|
|
|
|
|
|
|
cds |
109 |
cds |
111 |
577 – 1076
|
cta |
231 |
cta |
426 |
|
cds |
|
cds |
|
58 – 577
|
|
|
|
|
|
cds |
258 |
cds |
37 |
255 – 302
|
agc |
87 |
agc |
120 |
|
cds |
|
cds |
|
263 – 100
|
|
|
|
|
|
|
|
cds |
306 |
62
|
|
|
cta |
404 |
|
|
|
cds |
|
422
|
|
|
|
|
|
|
|
cds |
135 |
|
|
|
other |
258 |
|
|
|
cds |
|
|
|
|
|
|
|
|
|
cds |
195 |
|
|
|
tga |
37 |
|
|
|
cds |
|
|
|
|
|
|
|
|
|
cds |
71 |
|
|
|
tgc |
12 |
|
|
|
aac |
3 |
|
|
|
aca |
285 |
|
|
|
cds |
|
|
|
C24. Fréquence des différences des intercalaires
|
gamme |
fréquence |
|
|
|
-15 |
2 |
|
|
|
-14 |
|
|
|
|
-13 |
|
|
|
|
-12 |
1 |
|
|
|
-11 |
1 |
|
|
|
-10 |
3 |
|
|
|
-9 |
|
|
|
|
-8 |
|
|
|
|
-7 |
|
|
|
|
-6 |
1 |
|
|
|
-5 |
|
|
|
|
-4 |
|
|
|
|
-3 |
3 |
|
|
|
-2 |
7 |
|
|
|
-1 |
4 |
|
|
|
0 |
8 |
|
|
|
1 |
4 |
|
|
|
2 |
1 |
|
|
|
3 |
4 |
|
|
|
4 |
2 |
|
|
|
5 |
1 |
|
|
|
6 |
2 |
|
|
|
7 |
1 |
|
|
|
8 |
2 |
|
|
|
9 |
1 |
|
|
|
10 |
|
|
|
|
11 |
|
|
|
|
12 |
|
|
|
|
13 |
|
|
|
|
14 |
1 |
|
|
|
15 |
|
|
|
|
|
|
|
|
|
total |
49 |
|
|
|
sous t. -2+2 |
24 |
|
|
|
cdc remarques
- Nombre de gènes protéines: cdc 3615, psor 3327 (NCBI)
- Comparaison bsu-lmo: Les séquences, les cumuls. bsu-lmo nouveau
- Rmarques @: On retrouve une partie des remarques de psor
- - Les RNAs non codants: seul le bloc cds-tcc-ncRNA-cds est maintenu.
- - Une configuration rare 23s-gga-5s complète au lieu de 3.
- - La configuration 16s23s-aca-5s-riboswitch perd 5s-riboswitch et devient 16s23s-aca.
- Comparaison cdc-psor
- Les blocs à rRNAs: Les blocs disparaissent au moment des divisions et ce sont les non protégés par des séquences de tRNAs qui disparaissent en 1er. 7 clusters simples disparaissent et les groupes se défont.
- Les séquences longues:
- Comparaison entre les 2 génomes, cdc-psor: Très peu de modifications, plutôt des mutations que des recombinaisons et encore moins des créations. Le cas de la disparition de aaa qui apparaît dans un intercalaire est emblématique.
- Comparaisons intra génome, cdc-cdc et psor-psor. Là les remaniements sont légions et puissants: duplication de 20 tRNAs d'un seul coup, recombinaisons par lots ou tRNA par tRNA.
- Comparaison clostridia-bacilli entre cdc-psor et bsu-lmo: la comparaison est saisissante et on arrive à repérer une recombinaison après division, celle de 16s23s5s en 16s-atcgca-23s5s entre bsu et lmo. La mutation de cta en ctg, entre génome, qui conserve la longueur du tRNA, ainsi que la agc en tcc dans le petit bloc aac-**-gaa en intra.
- - Seul les clostridia présentent des cds dans les groupes, les bacilli non. Les autres génomes de clostridia (voir fiche) présentent beaucoup de cds dans les clusters alors que les bacilli (fiche) jamais.
- Conclusion: Tout se passe comme si le processus se déroulait d'un seul coup dans un génome, en dehors de la division. Puis pendant la 1ère division et les divisions suivantes certains clusters disparaissent facilement alors que se produisent quelques rares mutations et recombinaisons. C'est avant tout un processus de création ordonné donnant des séquences qui peuvent se dupliquer et se recombiner. Les séquences de tRNA stabilisent et maintiennent les blocs de rRNAs, un seul cluster à 6 tRNAs disparaît entre bsu et lmo, et aucun entre cdc et psor.
cdc distribution
Cl2 cdc, Peptoclostridium difficile CD196. clostridia.
Cl21 cdc. La distribution des tRNAs sans rRNA.
g1 |
|
t1 |
|
|
|
|
|
a atgi |
|
a tct |
|
tat |
|
atgf |
|
b att |
|
i act |
|
aat |
|
agt |
|
c ctt |
|
e cct |
|
cat |
|
cgc |
|
d gtt |
|
m gct |
|
gat |
|
ggt |
|
e ttc |
|
b tcc |
1 |
tac |
|
tgc |
|
f atc |
|
j acc |
|
aac |
|
agc |
1
|
g ctc |
|
f ccc |
|
cac |
|
cgt |
|
h gtc |
|
n gcc |
|
gac |
|
ggc |
|
i tta |
|
c tca |
|
taa |
|
tga |
|
j ata |
|
k aca |
1 |
aaa |
1 |
aga |
|
k cta |
1 |
g cca |
|
caa |
|
cga |
|
l gta |
1 |
o gca |
|
gaa |
1 |
gga |
|
m ttg |
1 |
d tcg |
|
tag |
|
tgg |
|
n atgj |
|
l acg |
|
aag |
|
agg |
|
o ctg |
|
h ccg |
|
cag |
|
cgg |
|
p gtg |
|
p gcg |
|
gag |
|
ggg |
|
clos |
>1aa |
=1aa |
-5s |
+5s |
-16s |
+16s |
total
|
cdc |
4 |
4* |
|
|
|
|
8
|
|
Cl22 psor. La distribution des tRNAs avec rRNA.
g1 |
|
t1 |
|
|
|
|
|
a atgi |
2 |
a tct |
|
tat |
|
atgf |
3
|
b att |
|
i act |
|
aat |
|
agt |
|
c ctt |
|
e cct |
|
cat |
|
cgc |
|
d gtt |
|
m gct |
|
gat |
|
ggt |
|
e ttc |
3 |
b tcc |
|
tac |
3 |
tgc |
2
|
f atc |
1 |
j acc |
2 |
aac |
2 |
agc |
1
|
g ctc |
|
f ccc |
|
cac |
2 |
cgt |
1
|
h gtc |
|
n gcc |
|
gac |
4 |
ggc |
2
|
i tta |
3 |
c tca |
3 |
taa |
|
tga |
|
j ata |
|
k aca |
4 |
aaa |
4 |
aga |
4
|
k cta |
2 |
g cca |
3 |
caa |
3 |
cga |
|
l gta |
5 |
o gca |
3 |
gaa |
4 |
gga |
5
|
m ttg |
|
d tcg |
|
tag |
|
tgg |
1
|
n atgj |
3 |
l acg |
|
aag |
|
agg |
|
o ctg |
|
h ccg |
|
cag |
|
cgg |
|
p gtg |
|
p gcg |
|
gag |
|
ggg |
|
clos |
>1aa |
=1aa |
-5s |
+5s |
-16s |
+16s |
total
|
cdc |
|
|
2* |
70 |
|
3 |
75
|
|
Peptoclostridium difficile M68
cdc8 opérons
- Liens data bases: gtRNAdb [5], NCBI [6], génome [7]
- Lien tableur: cdc8 opérons
- Phylogénie: Bacteria; Firmicutes; Clostridia; Clostridiales;Peptostreptococcaceae; Clostridioides.
- Liens internes: noms abrégés cdc8 remarques cdc8 cumuls
- Légende: voir cdc8 cumuls pour cdsa: cds en pbs, cdsd: cds dirigé; voir cdc8 remarques pour @ et +
- - 23s': possible 23S ribosomal RNA but does not have good blast hits on one or both of the ends.
- - 23s°: 23S ribosomal RNA rRNA prediction is too short
- - cca: tRNA dupliqué dans le cluster 43aas (4306341).
- - cca: tRNA non dupliqué dans le cluster 43aas (4306341), ou remarques @2 et @3.
- - 554: voir cdc8 cumuls, veut dire sans jaune, exclu de la moyenne.
C3 Peptoclostridium difficile M68
28.6%GC |
11.9.19 Paris |
110 |
doubles |
intercal |
cds |
aa |
avec aa |
cdsa |
cdsd |
protéines
|
dir |
4299490..4300134 |
cds |
|
214 |
214 |
|
|
645 |
|
tyrosine-type recombinase/integrase
|
dir |
4300349..4300807 |
cds |
@1 |
554 |
554 |
|
|
459 |
|
helix-turn-helix domain-containing protein
|
dir |
4301362..4303101 |
cds |
|
0 |
0 |
|
|
1740 |
|
hypothetical protein
|
dir |
4303102..4303305 |
cds |
|
167 |
167 |
|
|
204 |
|
hp
|
dir |
4303473..4304299 |
23s° |
|
132 |
|
|
|
827 |
|
|
dir |
4304432..4304548 |
5s |
+ |
6 |
|
|
|
117 |
|
|
dir |
4304555..4304629 |
aac |
|
4 |
|
|
4 |
75 |
|
|
dir |
4304634..4304708 |
gaa |
2 cca |
5 |
|
|
5 |
75 |
|
|
dir |
4304714..4304789 |
gta |
|
5 |
|
|
5 |
76 |
|
|
dir |
4304795..4304871 |
gac |
|
11 |
|
|
11 |
77 |
|
|
dir |
4304883..4304957 |
aca |
|
14 |
|
|
14 |
75 |
|
|
dir |
4304972..4305056 |
tac |
|
9 |
|
|
9 |
85 |
|
|
dir |
4305066..4305139 |
gga |
|
10 |
|
|
10 |
74 |
|
|
dir |
4305150..4305226 |
aga |
|
9 |
|
|
9 |
77 |
|
|
dir |
4305236..4305311 |
caa |
|
11 |
|
|
11 |
76 |
|
|
dir |
4305323..4305398 |
aaa |
|
2 |
|
|
2 |
76 |
|
|
dir |
4305401..4305489 |
tca |
|
18 |
|
|
18 |
89 |
|
|
dir |
4305508..4305598 |
agc |
|
8 |
|
|
8 |
91 |
|
|
dir |
4305607..4305683 |
cca |
|
85 |
|
|
85 |
77 |
|
|
dir |
4305769..4305844 |
tgg |
|
60 |
|
|
60 |
76 |
|
|
dir |
4305905..4305981 |
cca |
|
5 |
|
|
5 |
77 |
|
|
dir |
4305987..4306063 |
atc |
|
3 |
|
|
3 |
77 |
|
|
dir |
4306067..4306142 |
ttc |
|
7 |
|
|
7 |
76 |
|
|
dir |
4306150..4306226 |
atgj |
|
114 |
|
|
|
77 |
|
|
dir |
4306341..4307538 |
16s |
|
0 |
0 |
|
|
1198 |
0 |
|
dir |
4307539..4308225 |
cds |
|
100 |
100 |
|
|
687 |
|
xylose isomerase
|
dir |
1..796 |
23s° |
|
181 |
|
|
|
796 |
|
|
dir |
978..1094 |
5s |
|
6 |
|
|
|
117 |
|
|
dir |
1101..1175 |
aac |
+ |
6 |
|
|
6 |
75 |
|
|
dir |
1182..1267 |
tta |
3 aaa |
15 |
|
|
15 |
86 |
|
|
dir |
1283..1358 |
atgf |
3 gta |
7 |
|
|
7 |
76 |
|
|
dir |
1366..1440 |
gaa |
|
9 |
|
|
9 |
75 |
|
|
dir |
1450..1523 |
gga |
|
5 |
|
|
5 |
74 |
|
|
dir |
1529..1604 |
gta |
|
5 |
|
|
5 |
76 |
|
|
dir |
1610..1686 |
gac |
|
9 |
|
|
9 |
77 |
|
|
dir |
1696..1770 |
aca |
|
14 |
|
|
14 |
75 |
|
|
dir |
1785..1869 |
tac |
|
10 |
|
|
10 |
85 |
|
|
dir |
1880..1963 |
cta |
|
28 |
|
|
28 |
84 |
|
|
dir |
1992..2068 |
aga |
|
7 |
|
|
7 |
77 |
|
|
dir |
2076..2151 |
caa |
|
89 |
|
|
89 |
76 |
|
|
dir |
2241..2329 |
tca |
|
3 |
|
|
3 |
89 |
|
|
dir |
2333..2408 |
ttc |
|
6 |
|
|
6 |
76 |
|
|
dir |
2415..2491 |
atgj |
|
11 |
|
|
11 |
77 |
|
|
dir |
2503..2579 |
atgi |
|
29 |
|
|
29 |
77 |
|
|
dir |
2609..2685 |
cca |
|
7 |
|
|
7 |
77 |
|
|
dir |
2693..2769 |
cac |
|
8 |
|
|
8 |
77 |
|
|
dir |
2778..2853 |
aaa |
|
7 |
|
|
7 |
76 |
|
|
dir |
2861..2934 |
tgc |
|
6 |
|
|
6 |
74 |
|
|
dir |
2941..3015 |
aac |
|
6 |
|
|
6 |
75 |
|
|
dir |
3022..3107 |
tta |
|
15 |
|
|
15 |
86 |
|
|
dir |
3123..3198 |
atgf |
|
7 |
|
|
7 |
76 |
|
|
dir |
3206..3280 |
gaa |
|
9 |
|
|
9 |
75 |
|
|
dir |
3290..3363 |
gga |
|
5 |
|
|
5 |
74 |
|
|
dir |
3369..3444 |
gta |
|
5 |
|
|
5 |
76 |
|
|
dir |
3450..3526 |
gac |
|
9 |
|
|
9 |
77 |
|
|
dir |
3536..3610 |
aca |
|
14 |
|
|
14 |
75 |
|
|
dir |
3625..3709 |
tac |
|
9 |
|
|
9 |
85 |
|
|
dir |
3719..3802 |
cta |
|
24 |
|
|
24 |
84 |
|
|
dir |
3827..3901 |
ggc |
|
24 |
|
|
24 |
75 |
|
|
dir |
3926..4002 |
aga |
|
9 |
|
|
9 |
77 |
|
|
dir |
4012..4087 |
caa |
|
8 |
|
|
8 |
76 |
|
|
dir |
4096..4171 |
aaa |
|
2 |
|
|
2 |
76 |
|
|
dir |
4174..4262 |
tca |
|
3 |
|
|
3 |
89 |
|
|
dir |
4266..4341 |
ttc |
|
6 |
|
|
6 |
76 |
|
|
dir |
4348..4424 |
atgj |
|
11 |
|
|
11 |
77 |
|
|
dir |
4436..4512 |
atgi |
|
17 |
|
|
17 |
77 |
|
|
dir |
4530..4606 |
cac |
|
8 |
|
|
8 |
77 |
|
|
dir |
4615..4690 |
aaa |
|
7 |
|
|
7 |
76 |
|
|
dir |
4698..4771 |
tgc |
|
7 |
|
|
7 |
74 |
|
|
dir |
4779..4855 |
cgt |
|
12 |
|
|
12 |
77 |
|
|
dir |
4868..4943 |
gta |
|
75 |
75 |
|
|
76 |
75 |
|
dir |
5019..5432 |
cds |
|
308 |
308 |
|
|
414 |
|
hp
|
dir |
5741..9172 |
cds |
|
|
|
|
|
3432 |
|
pyruvate carboxylase
|
|
|
|
|
|
|
|
|
|
|
|
dir |
94032..94736 |
cds |
|
281 |
281 |
|
|
705 |
281 |
N-acetylmuramoyl-L-alanine amidase CwlD
|
dir |
95018..95994 |
16s° |
|
100 |
|
|
|
977 |
|
|
dir |
96095..97613 |
23s° |
|
126 |
|
|
|
1519 |
|
|
dir |
97740..97856 |
5s |
|
7 |
|
|
|
117 |
|
|
dir |
97864..97938 |
aac |
|
6 |
|
|
6 |
75 |
|
|
dir |
97945..98030 |
tta |
|
15 |
|
|
15 |
86 |
|
|
dir |
98046..98121 |
atgf |
|
7 |
|
|
7 |
76 |
|
|
dir |
98129..98203 |
gaa |
|
8 |
|
|
8 |
75 |
|
|
dir |
98212..98285 |
gga |
|
4 |
|
|
4 |
74 |
|
|
dir |
98290..98365 |
gta |
|
5 |
|
|
5 |
76 |
|
|
dir |
98371..98447 |
gac |
|
10 |
|
|
10 |
77 |
|
|
dir |
98458..98532 |
ggc |
|
9 |
|
|
9 |
75 |
|
|
dir |
98542..98615 |
aga |
|
954 |
954 |
|
|
74 |
|
|
dir |
99570..100409 |
cds |
|
|
|
|
|
840 |
|
TIGR00159 family protein
|
|
|
|
|
|
|
|
|
|
|
|
dir |
306829..309216 |
cds |
|
733 |
733 |
|
|
2388 |
|
cadmium-translocating P-type ATPase
|
<> comp |
309950..310076 |
cds |
|
1 |
1 |
|
|
127 |
1 |
glycine/sarcosine/betaine reductase complex selenoprotein A
|
dir |
310078..311313 |
23s° |
|
126 |
|
|
|
1236 |
|
|
dir |
311440..311556 |
5s |
|
177 |
177 |
|
|
117 |
|
|
dir |
311734..312342 |
cds |
|
|
|
|
|
609 |
|
DedA family protein
|
|
|
|
|
|
|
|
|
|
|
|
comp |
861856..862620 |
cds |
|
258 |
258 |
|
|
765 |
|
DeoR/GlpR transcriptional regulator
|
dir |
862879..862969 |
agc |
|
87 |
87 |
|
|
91 |
87 |
|
dir |
863057..863845 |
cds |
|
|
|
|
|
789 |
|
flagellar motor protein
|
|
|
|
|
|
|
|
|
|
|
|
dir |
1106477..1107451 |
cds |
|
238 |
238 |
|
|
975 |
238 |
Mannosyl-glycoprotein endo-beta-N-acetylglucosamidase
|
dir |
1107690..1109197 |
16s |
@2 |
320 |
|
|
|
1508 |
|
|
dir |
1109518..1112416 |
23s |
|
91 |
|
|
|
2899 |
|
|
dir |
1112508..1112581 |
gga |
|
8 |
|
|
|
74 |
|
|
dir |
1112590..1112706 |
5s |
|
273 |
273 |
|
|
117 |
|
|
dir |
1112980..1114998 |
cds |
|
|
|
|
|
2019 |
|
N-acetylmuramoyl-L-alanine amidase
|
|
|
|
|
|
|
|
|
|
|
|
comp |
1196804..1198213 |
cds |
|
1378 |
1378 |
|
|
1410 |
|
MBOAT family protein
|
comp |
1199592..1199674 |
ttg |
|
318 |
318 |
|
|
83 |
318 |
|
dir |
1199993..1202641 |
cds |
|
|
|
|
|
2649 |
|
DNA polymerase I
|
|
|
|
|
|
|
|
|
|
|
|
dir |
1850896..1852626 |
cds |
|
109 |
109 |
|
|
1731 |
109 |
Na+/H+ antiporter NhaC family protein
|
dir |
1852736..1852816 |
cta |
|
334 |
334 |
|
|
81 |
|
|
dir |
1853151..1853666 |
cds |
|
|
|
|
|
516 |
|
HXXEE domain-containing protein
|
|
|
|
|
|
|
|
|
|
|
|
dir |
3024038..3024715 |
cds |
|
150 |
150 |
|
|
678 |
150 |
sortase SrtB
|
comp |
3024866..3024940 |
aca |
@3 |
93 |
|
|
|
75 |
|
|
comp |
3025034..3027933 |
23s |
|
184 |
|
|
|
2900 |
|
|
comp |
3028118..3029625 |
16s |
|
374 |
374 |
|
|
1508 |
|
|
dir |
3030000..3030938 |
cds |
|
|
|
|
|
939 |
|
delta-lactam-biosynthetic de-N-acetylase
|
|
|
|
|
|
|
|
|
|
|
|
dir |
3805298..3806743 |
cds |
|
208 |
208 |
|
|
1446 |
|
tyrosine-type recombinase/integrase
|
comp |
3806952..3807028 |
agg |
|
61 |
61 |
|
|
77 |
61 |
|
<comp |
3807090..3808790 |
cds |
|
|
|
|
|
1701 |
|
formate dehydrogenase subunit alpha
|
|
|
|
|
|
|
|
|
|
|
|
comp |
3875816..3876886 |
cds |
|
452 |
452 |
|
|
1071 |
|
ABC transporter ATP-binding protein
|
comp |
3877339..3877455 |
5s |
|
125 |
|
|
|
117 |
|
|
comp |
3877581..3880480 |
23s |
|
261 |
|
|
|
2900 |
|
|
comp |
3880742..3882249 |
16s |
|
190 |
190 |
|
|
1508 |
190 |
|
comp |
3882440..3883018 |
cds |
|
|
|
|
|
579 |
|
bifunctional precorrin-2 dehydrogenase/sirohydrochlorin ferrochelatase
|
|
|
|
|
|
|
|
|
|
|
|
comp |
4017523..4017714 |
cds |
|
118 |
118 |
|
|
192 |
118 |
DUF378 domain-containing protein
|
comp |
4017833..4017949 |
5s |
|
126 |
|
|
|
117 |
|
|
comp |
4018076..4020975 |
23s |
|
321 |
|
|
|
2900 |
|
|
comp |
4021297..4022804 |
16s |
|
292 |
292 |
|
|
1508 |
|
|
comp |
4023097..4023378 |
cds |
|
221 |
221 |
|
|
282 |
|
hp
|
comp |
4023600..4025129 |
cds |
|
|
|
|
|
1530 |
|
lysine--tRNA ligase
|
|
|
|
|
|
|
|
|
|
|
|
dir |
4135881..4136873 |
cds |
|
383 |
383 |
|
|
993 |
|
DNA replication protein DnaC
|
comp |
4137257..4137331 |
aca |
|
33 |
|
33 |
|
75 |
|
|
comp |
4137365..4137440 |
gta |
|
4 |
|
4 |
|
76 |
|
|
comp |
4137445..4137519 |
gaa |
|
6 |
|
6 |
|
75 |
|
|
comp |
4137526..4137601 |
aaa |
|
331 |
331 |
|
|
76 |
331 |
|
comp |
4137933..4139222 |
cds |
|
|
|
|
|
1290 |
|
adenylosuccinate synthase
|
|
|
|
|
|
|
|
|
|
|
|
dir |
4178197..4178970 |
cds |
|
179 |
179 |
|
|
774 |
|
SigB/SigF/SigG family RNA polymerase sigma factor
|
dir |
4179150..4180587 |
16s |
|
161 |
|
|
|
1438 |
|
|
comp |
4180749..4180865 |
5s |
|
201 |
|
|
|
117 |
|
|
comp |
4181067..4183959 |
23s |
|
217 |
|
|
|
2893 |
|
|
comp |
4184177..4185684 |
16s |
|
108 |
|
|
|
1508 |
|
|
comp |
4185793..4185869 |
atgi |
|
11 |
|
|
11 |
77 |
|
|
comp |
4185881..4185969 |
tta |
|
5 |
|
|
|
89 |
|
|
comp |
4185975..4186091 |
5s |
|
201 |
|
|
|
117 |
|
|
comp |
4186293..4189192 |
23s |
|
375 |
|
|
|
2900 |
|
|
comp |
4189568..4189643 |
gca |
|
52 |
|
|
|
76 |
|
|
comp |
4189696..4190959 |
16s’ |
@4 |
100 |
|
|
|
1264 |
|
|
dir |
4191060..4192225 |
16s’ |
|
52 |
|
|
|
1166 |
|
|
dir |
4192278..4192353 |
gca |
|
248 |
|
|
|
76 |
|
|
dir |
4192602..4193197 |
23s° |
|
100 |
|
|
|
596 |
|
|
dir |
4193298..4193874 |
16s° |
|
321 |
|
|
|
577 |
|
|
dir |
4194196..4196423 |
23s’ |
|
100 |
|
|
|
2228 |
|
|
dir |
4196524..4197091 |
16s° |
|
320 |
|
|
|
568 |
|
|
dir |
4197412..4199044 |
23s° |
|
100 |
|
|
|
1633 |
|
|
dir |
4199145..4201593 |
23s’ |
|
126 |
|
|
|
2449 |
|
|
dir |
4201720..4201836 |
5s |
|
127 |
127 |
|
|
117 |
127 |
|
dir |
4201964..4202473 |
cds |
|
|
|
|
|
510 |
|
transcription repressor NadR
|
|
|
|
|
|
|
|
|
|
|
|
dir |
4205417..4205872 |
cds |
|
0 |
0 |
|
|
456 |
0 |
nucleoside deaminase
|
dir |
4205873..4205964 |
tcc |
@5 |
37 |
|
|
|
92 |
|
|
dir |
4206002..4206266 |
ncRNA |
|
76 |
76 |
|
|
265 |
|
|
dir |
4206343..4207980 |
cds |
|
|
|
|
|
1638 |
|
DNA polymerase III subunit gamma/tau
|
|
|
|
|
|
|
|
|
|
|
|
comp |
4209435..4210639 |
cds |
|
496 |
496 |
|
|
1205 |
|
glycosyl transferase
|
|
4211136..4212643 |
16s |
|
321 |
|
|
|
1508 |
|
|
|
4212965..4213127 |
23s° |
|
100 |
100 |
|
|
163 |
100 |
|
<>comp |
4213228..4213849 |
cds |
|
111 |
|
|
|
622 |
|
CHAP domain-containing protein
|
|
|
|
|
|
|
|
|
|
|
|
comp |
4213961..4214620 |
cds |
|
228 |
228 |
|
|
660 |
228 |
type A-1 chloramphenicol O-acetyltransferase
|
dir |
4214849..4216199 |
16s |
|
321 |
|
|
|
1351 |
|
|
dir |
4216521..4217008 |
23s° |
|
101 |
|
|
|
488 |
|
|
comp |
4217110..4218529 |
23s° |
|
250 |
|
|
|
1420 |
|
|
comp |
4218780..4218855 |
gca |
|
52 |
|
|
|
76 |
|
|
comp |
4218908..4219471 |
16s° |
|
100 |
|
|
|
564 |
|
|
comp |
4219572..4219856 |
23s° |
|
217 |
|
|
|
285 |
|
|
comp |
4220074..4221581 |
16s |
|
179 |
179 |
|
|
1508 |
179 |
|
>comp |
4221761..4222206 |
cds |
|
386 |
386 |
|
|
446 |
386 |
B/F/G family RNA polymerase sigma-70 factor
|
dir |
4222593..4224100 |
16s |
|
321 |
|
|
|
1508 |
|
|
dir |
4224422..4227321 |
23s |
|
181 |
|
|
|
2900 |
|
|
dir |
4227503..4227619 |
5s |
|
6 |
|
|
|
117 |
|
|
dir |
4227626..4227700 |
aac |
|
6 |
|
|
6 |
75 |
|
|
dir |
4227707..4227792 |
tta |
|
15 |
|
|
15 |
86 |
|
|
dir |
4227808..4227883 |
atgf |
|
7 |
|
|
7 |
76 |
|
|
dir |
4227891..4227965 |
gaa |
|
9 |
|
|
9 |
75 |
|
|
dir |
4227975..4228048 |
gga |
|
5 |
|
|
5 |
74 |
|
|
dir |
4228054..4228129 |
gta |
|
5 |
|
|
5 |
76 |
|
|
dir |
4228135..4228211 |
gac |
|
9 |
|
|
9 |
77 |
|
|
dir |
4228221..4228295 |
aca |
|
14 |
|
|
14 |
75 |
|
|
dir |
4228310..4228394 |
tac |
|
10 |
|
|
10 |
85 |
|
|
dir |
4228405..4228488 |
cta |
|
28 |
|
|
28 |
84 |
|
|
dir |
4228517..4228593 |
aga |
|
7 |
|
|
7 |
77 |
|
|
dir |
4228601..4228676 |
caa |
|
89 |
|
|
89 |
76 |
|
|
dir |
4228766..4228854 |
tca |
|
3 |
|
|
3 |
89 |
|
|
dir |
4228858..4228933 |
ttc |
|
6 |
|
|
6 |
76 |
|
|
dir |
4228940..4229016 |
atgj |
|
11 |
|
|
11 |
77 |
|
|
dir |
4229028..4229104 |
atgi |
|
29 |
|
|
29 |
77 |
|
|
dir |
4229134..4229210 |
cca |
|
7 |
|
|
7 |
77 |
|
|
dir |
4229218..4229294 |
cac |
|
8 |
|
|
8 |
77 |
|
|
dir |
4229303..4229378 |
aaa |
|
353 |
|
|
|
76 |
|
|
comp |
4229732..4229848 |
5s |
|
126 |
|
|
|
117 |
|
|
comp |
4229975..4232010 |
23s' |
|
582 |
|
|
|
2036 |
|
|
dir |
4232593..4234098 |
16s |
@6 |
217 |
|
|
|
1506 |
|
|
dir |
4234316..4237215 |
23s |
|
126 |
|
|
|
2900 |
|
|
dir |
4237342..4237458 |
5s |
|
216 |
216 |
|
|
117 |
216 |
|
comp |
4237675..4238859 |
cds |
|
372 |
372 |
|
|
1185 |
|
pyridoxal phosphate-dependent aminotransferase
|
dir |
4239232..4241583 |
cds |
|
21 |
21 |
|
|
2352 |
|
anaerobic ribonucleoside triphosphate reductase
|
dir |
4241605..4242144 |
cds |
|
778 |
778 |
|
|
540 |
|
anaerobic ribonucleoside-triphosphate reductase activating protein
|
dir |
4242923..4244459 |
16s |
@7 |
261 |
|
|
|
1537 |
|
|
dir |
4244721..4247619 |
23s |
|
201 |
|
|
|
2899 |
|
|
dir |
4247821..4247937 |
5s |
|
5 |
|
|
|
117 |
|
|
dir |
4247943..4248031 |
tta |
|
11 |
|
|
11 |
89 |
|
|
dir |
4248043..4248119 |
atgi |
|
108 |
|
|
|
77 |
|
|
dir |
4248228..4249735 |
16s |
|
184 |
|
|
|
1508 |
|
|
dir |
4249920..4250564 |
23s° |
|
100 |
100 |
|
|
645 |
100 |
|
<dir |
4250665..4250923 |
cds |
|
112 |
112 |
|
|
259 |
112 |
hp
|
comp |
4251036..4253145 |
23s’ |
|
375 |
|
|
|
2110 |
|
|
comp |
4253521..4253596 |
gca |
|
52 |
|
|
|
76 |
|
|
comp |
4253649..4254226 |
16s° |
|
282 |
282 |
|
|
578 |
|
|
dir |
4254509..4254712 |
cds |
|
12 |
12 |
|
|
204 |
|
hp
|
dir |
4254725..4256002 |
cds |
|
|
|
|
|
1278 |
|
phage portal protein
|
cdc8 cumuls
- Lien tableur: cdc8 cumuls
- Liens internes: cdc8 opérons
- Légende:
- - avec et sans rRNA, fréquences des intercalaires dans les clusters avec rRNA ou sans rRNA.
- - cdsd, je ne choisis que le cds avec l'intercalaire le plus faible d'un cluster donné, en supposant que ce cds a été créé par le cluster lors des conversions.
- - cdsa, longueur du cds en aas ici. C'est le cdsa de cdc8 opérons divisé par 3.
- - 1 : occurences exclues de la moyenne. Sont exclus de la moyenne les jaunes 554 de cdc8 opérons.
C3. cumuls. Peptoclostridium difficile M68
opérons |
Fréquences intercalaires tRNAs |
Fréquences intercalaires cds |
Fréquences aas cds
|
|
|
effectif |
gammes |
sans rRNAs |
avec rRNAs |
gammes |
cds |
gammes |
cdsd |
gammes |
cdsa
|
avec rRNA |
opérons |
21 |
1 |
|
0 |
1 |
4 |
1 |
3 |
100 |
6
|
|
16 23 5s 0 |
4 |
20 |
2 |
77 |
50 |
2 |
20 |
0 |
200 |
8
|
|
16 gca 235 |
2 |
40 |
1 |
6 |
100 |
7 |
40 |
0 |
300 |
11
|
|
16 23 5s a |
5 |
60 |
|
0 |
150 |
5 |
60 |
0 |
400 |
5
|
|
max a |
43 |
80 |
|
1 |
200 |
5 |
80 |
2 |
500 |
5
|
|
a doubles |
2 |
100 |
|
3 |
250 |
6 |
100 |
3 |
600 |
5
|
|
autres |
10 |
120 |
|
0 |
300 |
5 |
120 |
3 |
700 |
1
|
|
total aas |
98 |
140 |
|
0 |
350 |
4 |
140 |
1 |
800 |
1
|
sans |
opérons |
6 |
160 |
|
0 |
400 |
4 |
160 |
1 |
900 |
1
|
|
1 aa |
5 |
180 |
|
0 |
450 |
0 |
180 |
1 |
1000 |
0
|
|
max a |
4 |
200 |
|
0 |
500 |
2 |
200 |
1 |
1100 |
0
|
|
a doubles |
0 |
|
|
0 |
|
4 |
|
7 |
|
1
|
|
total aas |
9 |
|
3 |
87 |
|
48 |
|
22 |
|
44
|
total aas |
|
108 |
|
|
|
|
|
|
|
|
|
remarques |
|
7 |
|
|
|
|
|
|
|
|
|
avec jaune |
|
|
moyenne |
14 |
13 |
|
256 |
|
155 |
|
330
|
|
|
|
variance |
|
16 |
|
252 |
|
109 |
|
234
|
sans jaune |
|
|
moyenne |
|
10 |
|
182 |
|
|
|
208
|
|
|
|
variance |
|
6 |
|
117 |
|
|
|
97
|
cdc8 blocs
- Lien tableur: cdc8 blocs
- Lien cdc blocs: La colonne "Bloc type" de cdc8 blocs correspond aux types définis dans cdc blocs.
- Légende
- - 23s': possible 23S ribosomal RNA but does not have good blast hits on one or both of the ends.
- - 23s°: 23S ribosomal RNA rRNA prediction is too short
- - cca: remarques @2 et @3.
- Notes:
- - Je définis le type de bloc en comparant avec un bloc de cdc_bloc ayant approximativement les mêmes intercalaires et quand c'est possible les tRNAs identiques qui l'accompagnent. L'identification des tRNAs est faite dans la comparaison entre cdc et cdc 8 dans 43aas, 18aas et 9aas.
- - Les groupes de clusters. Un groupe de cluster à rRNA, et ici avec les débris de rRNA aussi, est un ensemble de rRNAs espacés de tRNAs et de cds par des intercalaires faibles, inférieurs à 778 pbs ici. Les 2 intercalaires des cds terminaux peuvent être très élevés, indiquant que le cds n'est pas sous l'influence de la conversion appliquée au cluster. Au total cdc8 a 9 groupes dont 6 avec un seul bloc, et 3 avec plus de 2 comprenant la quasi totalité des rRNAs, 40/46.
- Les solitaires, 6 dont 5 bien typés, I2 I3 II III et X1.
- Le groupe à 2 blocs, IV1 et IV2 bien typés.
- Le groupe à 15 rRNAs dans lequel je n'ai pu typé que 2 blocs, I1 et VII1.
- Le groupe à 23 rRNAs dans lequel je n'ai pu typé que 3 blocs, I4 IV3 IV4.
- Le type IV4, 16s23s5s-tta-atgi, n'existe pas dans psor mais est ajouté ici parce qu'il est semblable aux types IV, 16s23s5s suivi de tRNAs. Mais en plus avec tta-atgi il est comparable aussi aux types VII1 et VIII1. Ce point est important quand on considère l'origine de cdc8 comme croisement de cdc et psor. Ce type IV4 va en faveur d'une évolution de cdc vers psor en passant par cdc8.
C3. cdc8 blocs
Bloc type |
groupes |
intercal |
Bloc type |
groupes |
intercal |
Bloc type |
groupe |
intercal
|
|
cds |
554 |
|
cds |
150 |
|
cds |
496
|
|
cds |
0 |
|
aca |
93 |
|
16s |
321
|
|
cds |
167 |
|
23s |
184 |
|
23s° |
100
|
|
23s° |
132 |
III |
16s |
374 |
|
cds |
111
|
IV2 |
5s |
6 |
|
cds |
|
|
cds |
228
|
|
aac |
4 |
|
|
|
|
16s |
321
|
|
**16aas |
7 |
|
cds |
452 |
|
23s° |
101
|
|
atgj |
114 |
|
5s |
125 |
|
23s° |
250
|
IV1 |
16s |
0 |
|
23s |
261 |
|
gca |
52
|
|
cds |
100 |
I2 |
16s |
190 |
|
16s° |
100
|
|
23s° |
181 |
|
cds |
|
|
23s° |
217
|
|
5s |
6 |
|
|
|
|
16s |
179
|
|
aac |
6 |
|
cds |
118 |
|
cds |
386
|
|
**41aas |
12 |
|
5s |
126 |
IV3 |
16s |
321
|
|
gta |
75 |
|
23s |
321 |
|
23s |
181
|
|
cds |
308 |
I3 |
16s |
292 |
|
5s |
6
|
|
cds |
|
|
cds |
|
|
aac |
6
|
|
|
|
|
|
|
|
**17aas |
8
|
|
cds |
281 |
|
cds |
179 |
|
aaa |
353
|
|
16s° |
100 |
|
16s |
161 |
|
5s |
126
|
|
23s° |
126 |
|
5s |
201 |
|
23s' |
582
|
X1 |
5s |
7 |
I1 |
23s |
217 |
I4 |
16s |
217
|
|
aac |
6 |
|
16s |
108 |
|
23s |
126
|
|
**7aas |
9 |
|
atgi |
11 |
|
5s |
216
|
|
aga |
954 |
|
tta |
5 |
|
cds |
372
|
|
cds |
|
|
5s |
201 |
|
cds |
21
|
|
|
|
|
23s |
375 |
|
cds |
778
|
|
cds |
733 |
VII1 |
gca |
52 |
IV4 |
16s |
261
|
|
cds |
1 |
|
16s’ |
100 |
|
23s |
201
|
|
23s° |
126 |
|
16s’ |
52 |
|
5s |
5
|
|
5s |
177 |
|
gca |
248 |
|
tta |
11
|
|
cds |
|
|
23s° |
100 |
|
atgi |
108
|
|
|
|
|
16s° |
321 |
|
16s |
184
|
|
cds |
238 |
|
23s' |
100 |
|
23s° |
100
|
II |
16s |
320 |
|
16s° |
320 |
|
cds |
112
|
|
23s |
91 |
|
23s° |
100 |
|
23s’ |
375
|
|
gga |
8 |
|
23s’ |
126 |
|
gca |
52
|
|
5s |
273 |
|
5s |
127 |
|
16s° |
282
|
|
cds |
|
|
cds |
|
|
cds |
|
cdc8 cdc psor 43
- Lien tableur: cdc8 cdc psor 43
- Lien cdc psor: le tableau de comparaison cdc-psor
- Légende
- - 23s': possible 23S ribosomal RNA but does not have good blast hits on one or both of the ends.
- - 23s°: 23S ribosomal RNA rRNA prediction is too short
- - cca: marque les tRNAs différents entre les 2 génomes.
- - diff pour différence entre les intercalaires (intercal) cdc moins cdc8.
- - séquences identiques (bordure épaisse): Une séquence identique entre les 2 génomes est encadrée par 2 tRNAs différents (cyan) dans l'un et par 2 bordures épaisses dans l'autre.
- Notes:
- - identité entre cdc et cdc8 avec de rares différences faibles entre les intercalaires.
- - Aussi on retrouve les différences entre cdc et psor dans le tableau de droite.
C3. Comparaison cdc8-cdc-psor 43
C31. Comparaison cdc8-cdc 43
cdc8 |
43aas |
cdc |
43aas |
|
gene |
intercal |
gene |
intercal |
diff
|
16s |
1 |
|
|
|
cds |
100 |
16s |
279 |
|
23s° |
181 |
23s |
180 |
-1
|
5s |
6 |
5s |
6 |
0
|
aac |
6 |
aac |
6 |
0
|
tta |
15 |
tta |
15 |
0
|
atgf |
7 |
atgf |
7 |
0
|
gaa |
9 |
gaa |
9 |
0
|
gga |
5 |
gga |
5 |
0
|
gta |
5 |
gta |
5 |
0
|
gac |
9 |
gac |
9 |
0
|
aca |
14 |
aca |
14 |
0
|
tac |
10 |
tac |
8 |
-2
|
cta |
28 |
cta |
29 |
1
|
aga |
7 |
aga |
7 |
0
|
caa |
89 |
caa |
88 |
-1
|
tca |
3 |
tca |
3 |
0
|
ttc |
6 |
ttc |
6 |
0
|
atgj |
11 |
atgj |
11 |
0
|
atgi |
29 |
atgi |
23 |
-6
|
cca |
7 |
cca |
7 |
0
|
cac |
8 |
cac |
8 |
0
|
aaa |
7 |
aaa |
7 |
0
|
tgc |
6 |
tgc |
6 |
0
|
aac |
6 |
aac |
5 |
-1
|
tta |
15 |
tta |
15 |
0
|
atgf |
7 |
atgf |
7 |
0
|
gaa |
9 |
gaa |
9 |
0
|
gga |
5 |
gga |
5 |
0
|
gta |
5 |
gta |
5 |
0
|
gac |
9 |
gac |
9 |
0
|
aca |
14 |
aca |
14 |
0
|
tac |
9 |
tac |
9 |
0
|
cta |
24 |
cta |
23 |
-1
|
ggc |
24 |
ggc |
24 |
0
|
aga |
9 |
aga |
9 |
0
|
caa |
8 |
caa |
8 |
0
|
aaa |
2 |
aaa |
2 |
0
|
tca |
3 |
tca |
3 |
0
|
ttc |
6 |
ttc |
6 |
0
|
atgj |
11 |
atgj |
11 |
0
|
atgi |
17 |
atgi |
17 |
0
|
cac |
8 |
cac |
8 |
0
|
aaa |
7 |
aaa |
7 |
0
|
tgc |
7 |
tgc |
7 |
0
|
cgt |
12 |
cgt |
12 |
0
|
gta |
75 |
gta |
75 |
0
|
cds |
|
cds |
|
|
|
|
|
|
|
|
C32. Comparaison cdc8-psor 43
cdc8 |
43aas |
psor |
44aas |
|
gene |
intercal |
gene |
intercal |
diff
|
16s |
1 |
|
|
|
cds |
100 |
16s |
196 |
|
23s° |
181 |
23s |
122 |
|
5s |
6 |
5s |
5 |
|
aac |
6 |
tta |
13 |
-2
|
tta |
15 |
atg |
15 |
8
|
atgf |
7 |
gaa |
9 |
0
|
gaa |
9 |
gga |
6 |
1
|
gga |
5 |
gta |
5 |
0
|
gta |
5 |
gac |
16 |
|
gac |
9 |
aac |
4 |
|
aca |
14 |
aca |
4 |
-10
|
tac |
10 |
tac |
15 |
5
|
cta |
28 |
cta |
14 |
-14
|
aga |
7 |
aga |
7 |
0
|
caa |
89 |
caa |
11 |
|
tca |
3 |
aaa |
6 |
|
ttc |
6 |
tca |
3 |
0
|
atgj |
11 |
ttc |
9 |
3
|
atgi |
29 |
atg |
8 |
-3
|
cca |
7 |
atg |
21 |
-8
|
cac |
8 |
cca |
6 |
-1
|
aaa |
7 |
cac |
4 |
|
tgc |
6 |
tgc |
25 |
|
aac |
6 |
tta |
13 |
-2
|
tta |
15 |
atg |
15 |
8
|
atgf |
7 |
gaa |
9 |
0
|
gaa |
9 |
gga |
6 |
1
|
gga |
5 |
gta |
5 |
0
|
gta |
5 |
gac |
16 |
|
gac |
9 |
aac |
4 |
|
aca |
14 |
aca |
4 |
-10
|
tac |
9 |
tac |
15 |
6
|
cta |
24 |
cta |
11 |
-13
|
ggc |
24 |
ggc |
13 |
-11
|
aga |
9 |
aga |
7 |
-2
|
caa |
8 |
caa |
11 |
3
|
aaa |
2 |
aaa |
6 |
4
|
tca |
3 |
tca |
3 |
0
|
ttc |
6 |
ttc |
9 |
3
|
atgj |
11 |
atg |
8 |
-3
|
atgi |
17 |
atg |
21 |
|
cac |
8 |
cca |
6 |
|
aaa |
7 |
cac |
9 |
1
|
tgc |
7 |
aaa |
21 |
14
|
cgt |
12 |
tgc |
6 |
-1
|
gta |
75 |
cgt |
10 |
-2
|
cds |
|
gta |
162 |
|
|
|
cds |
|
|
|
cdc8 cdc psor 18
- Lien tableur: cdc8 cdc psor 18
- Lien cdc psor: le tableau de comparaison cdc-psor
- Légende
- - 23s': possible 23S ribosomal RNA but does not have good blast hits on one or both of the ends.
- - 23s°: 23S ribosomal RNA rRNA prediction is too short
- - cca: marque les tRNAs différents entre les 2 génomes.
- - diff pour différence entre les intercalaires (intercal) colonne de droite moins colonne de gauche.
- - séquences identiques (bordure épaisse): Une séquence identique entre les 2 génomes est encadrée par 2 tRNAs différents (cyan) dans l'un et par 2 bordures épaisses dans l'autre.
- Notes:
- - Sont comparés ici des suite de longueurs équivalentes entre les 3 génomes, 18aas 19aas 23aas,
- - avec 4 comparaisons cdc8 18aas/cdc 18aas, cdc8 19aas/psor 23aas, cdc8 18aas/psor 23aas, cdc8 19aas/cdc8 18aas,
- - cdc8 18aas et cdc 18aas sont identiques alors que, en intra, cdc8 19aas est très différent de cdc8 18aas.
- - cdc8 18aas est quasiment inclus dans psor 23aas: les 14 tRNAs de la fin de cdc8 se trouvent en fin de psor avec une seule insertion dans psor, mais les différences entre intercalaires sont élevées comme entre cdc et psor.
C3. Comparaison cdc8-cdc-psor 18
C33. Comparaison cdc8-cdc-psor 18
cdc8 |
18aas |
cdc |
18aas |
|
gene |
intercal |
gene |
intercal |
diff
|
cds |
214 |
|
|
|
cds |
554 |
|
|
|
cds |
0 |
|
|
|
cds |
167 |
16s |
279 |
|
23s° |
132 |
23s |
131 |
-1
|
5s |
6 |
5s |
6 |
0
|
aac |
4 |
aac |
4 |
0
|
gaa |
5 |
gaa |
5 |
0
|
gta |
5 |
gta |
5 |
0
|
gac |
11 |
gac |
10 |
-1
|
aca |
14 |
aca |
14 |
0
|
tac |
9 |
tac |
9 |
0
|
gga |
10 |
gga |
10 |
0
|
aga |
9 |
aga |
9 |
0
|
caa |
11 |
caa |
11 |
0
|
aaa |
2 |
aaa |
2 |
0
|
tca |
18 |
tca |
17 |
-1
|
agc |
8 |
agc |
8 |
0
|
cca |
85 |
cca |
85 |
0
|
tgg |
60 |
tgg |
60 |
0
|
cca |
5 |
cca |
6 |
1
|
atc |
3 |
atc |
3 |
0
|
ttc |
7 |
ttc |
7 |
0
|
atgj |
114 |
atgj |
114 |
0
|
|
|
|
|
|
|
|
|
|
|
cdc8 |
18aas |
psor |
23aas |
|
gène |
intercal |
gène |
intercal |
diff
|
|
|
16s |
196 |
|
|
|
23s |
213 |
|
cds |
214 |
5s |
5 |
|
cds |
554 |
tta |
13 |
|
cds |
0 |
atg |
15 |
|
cds |
167 |
gaa |
9 |
|
23s° |
132 |
gga |
6 |
|
5s |
6 |
gta |
5 |
0
|
aac |
4 |
gac |
16 |
|
gaa |
5 |
aac |
31 |
|
gta |
5 |
aac |
4 |
|
gac |
11 |
aca |
4 |
-10
|
aca |
14 |
tac |
11 |
2
|
tac |
9 |
gga |
19 |
9
|
gga |
10 |
aga |
6 |
-3
|
aga |
9 |
caa |
12 |
1
|
caa |
11 |
aaa |
6 |
4
|
aaa |
2 |
tca |
11 |
-7
|
tca |
18 |
agc |
6 |
-2
|
agc |
8 |
cca |
6 |
|
cca |
85 |
atg |
11 |
|
tgg |
60 |
tgg |
31 |
-29
|
cca |
5 |
cca |
6 |
1
|
atc |
3 |
atc |
6 |
3
|
ttc |
7 |
ttc |
13 |
6
|
atgj |
114 |
atg |
138 |
24
|
|
C34. Comparaison cdc8-cdc-psor 19
cdc8 |
19aas |
psor |
23aas |
|
gene |
intercal |
gene |
intercal |
diff
|
16s |
321 |
16s |
196 |
|
23s |
181 |
23s |
213 |
|
5s |
6 |
5s |
5 |
|
aac |
6 |
tta |
13 |
-2
|
tta |
15 |
atg |
15 |
8
|
atgf |
7 |
gaa |
9 |
0
|
gaa |
9 |
gga |
6 |
1
|
gga |
5 |
gta |
5 |
0
|
gta |
5 |
gac |
16 |
|
gac |
9 |
aac |
31 |
|
aca |
14 |
aac |
4 |
|
tac |
10 |
aca |
4 |
-10
|
cta |
28 |
tac |
11 |
|
aga |
7 |
gga |
19 |
|
caa |
89 |
aga |
6 |
-1
|
tca |
3 |
caa |
12 |
|
ttc |
6 |
aaa |
6 |
|
atgj |
11 |
tca |
11 |
|
atgi |
29 |
agc |
6 |
|
cca |
7 |
cca |
6 |
|
cac |
8 |
atg |
11 |
|
aaa |
353 |
tgg |
31 |
|
|
|
cca |
6 |
|
|
|
atc |
6 |
|
|
|
ttc |
13 |
|
|
|
atg |
138 |
|
cdc8 |
19aas |
cdc8 |
18aas |
|
gène |
intercal |
gène |
intercal |
diff
|
|
|
cds |
214 |
|
|
|
cds |
554 |
|
|
|
cds |
0 |
|
16s |
321 |
cds |
167 |
|
23s |
181 |
23s° |
132 |
|
5s |
6 |
5s |
6 |
|
aac |
6 |
aac |
4 |
|
tta |
15 |
gaa |
5 |
|
atgf |
7 |
gta |
5 |
0
|
gaa |
9 |
gac |
11 |
2
|
gga |
5 |
aca |
14 |
0
|
gta |
5 |
tac |
9 |
|
gac |
9 |
gga |
10 |
|
aca |
14 |
aga |
9 |
2
|
tac |
10 |
caa |
11 |
|
cta |
28 |
aaa |
2 |
|
aga |
7 |
tca |
18 |
|
caa |
89 |
agc |
8 |
|
tca |
3 |
cca |
85 |
|
ttc |
6 |
tgg |
60 |
|
atgj |
11 |
cca |
5 |
|
atgi |
29 |
atc |
3 |
|
cca |
7 |
ttc |
7 |
|
cac |
8 |
atgj |
114 |
|
aaa |
353 |
|
|
|
|
|
|
|
|
|
cdc8 cdc psor 9
- Lien tableur: cdc8 cdc psor 9
- Lien cdc psor: le tableau de comparaison cdc-psor
- Légende
- - 23s': possible 23S ribosomal RNA but does not have good blast hits on one or both of the ends.
- - 23s°: 23S ribosomal RNA rRNA prediction is too short
- - cca: marque les tRNAs différents entre les 2 génomes.
- - diff pour différence entre les intercalaires (intercal) colonne de droite moins colonne de gauche.
- - séquences identiques (bordure épaisse): Une séquence identique entre les 2 génomes est encadrée par 2 tRNAs différents (cyan) dans l'un et par 2 bordures épaisses dans l'autre.
- Notes:
- - Sont comparés ici des suites courtes, en intra cdc8 18aas/9aas et 19aas/9aas, cdc8 9aas/cdc 9aas et cdc8 VII1/psor VII1.
- - cdc8 9aas et cdc 9aas sont identiques
- - cdc8 9aas se retrouve entièrement (sauf 1 tRNA) dans cdc8 19aas avec cependant des diff élevés, mais il est très différent de cdc8 18aas (4 tRNAs différents).
- - La comparaison cdc8 VII1/psor VII1: le groupe de psor à 3 blocs 16s-gca-23s5s est caractérisé en plus par la séquence courte tta-atg (atg supposé atgi). On retrouve le bloc du milieu, VII1 dans cdc8, à l'envers (compléments) et on retrouve partiellement le bloc de fin VIII1 à l'endroit. Dans cdc8 ces blocs sont partiellement abîmés et se trouvent dans le groupe à 15 rRNAs (voir cdc8_blocs). Attention aux diff qui suivent le changement de sens.
- - 3 intercalaires sont préservés entre cdc8 VII1 et celui de psor, 16s-gca 5s-tta tta-atgi. De même pour 16s-gca du bloc VIII1.
C3. Comparaison cdc8-cdc-psor 9
C35. Comparaison cdc8-cdc-psor 9
cdc8 |
18aas |
cdc8 |
9aas |
|
gene |
intercal |
gene |
intercal |
diff
|
cds |
214 |
|
|
|
cds |
554 |
|
|
|
cds |
0 |
cds |
281 |
|
cds |
167 |
16s° |
100 |
|
23s° |
132 |
23s° |
126 |
|
5s |
6 |
5s |
7 |
|
aac |
4 |
aac |
6 |
|
gaa |
5 |
tta |
15 |
|
gta |
5 |
atgf |
7 |
|
gac |
11 |
gaa |
8 |
|
aca |
14 |
gga |
4 |
|
tac |
9 |
gta |
5 |
0
|
gga |
10 |
gac |
10 |
|
aga |
9 |
ggc |
9 |
|
caa |
11 |
aga |
954 |
|
aaa |
2 |
cds |
|
|
tca |
18 |
|
|
|
agc |
8 |
|
|
|
cca |
85 |
|
|
|
tgg |
60 |
|
|
|
cca |
5 |
|
|
|
atc |
3 |
|
|
|
ttc |
7 |
|
|
|
atgj |
114 |
|
|
|
cdc8 |
19aas |
cdc8 |
9aas |
|
gene |
intercal |
gene |
intercal |
diff
|
|
|
cds |
281 |
|
16s |
321 |
16s° |
100 |
|
23s |
181 |
23s° |
126 |
|
5s |
6 |
5s |
7 |
|
aac |
6 |
aac |
6 |
0
|
tta |
15 |
tta |
15 |
9
|
atgf |
7 |
atgf |
7 |
-8
|
gaa |
9 |
gaa |
8 |
1
|
gga |
5 |
gga |
4 |
-5
|
gta |
5 |
gta |
5 |
0
|
gac |
9 |
gac |
10 |
|
aca |
14 |
ggc |
9 |
|
tac |
10 |
aga |
954 |
|
cta |
28 |
cds |
|
|
aga |
7 |
|
|
|
caa |
89 |
|
|
|
tca |
3 |
|
|
|
ttc |
6 |
|
|
|
atgj |
11 |
|
|
|
atgi |
29 |
|
|
|
cca |
7 |
|
|
|
cac |
8 |
|
|
|
aaa |
353 |
|
|
|
|
|
|
|
|
|
C36. Comparaison cdc8-cdc-psor groupe
cdc8 |
9aas |
cdc |
9aas |
|
gene |
intercal |
gene |
intercal |
diff
|
cds |
281 |
16s |
52 |
|
16s° |
100 |
gca |
373 |
|
23s° |
126 |
23s |
126 |
|
5s |
7 |
5s |
7 |
|
aac |
6 |
aac |
5 |
-1
|
tta |
15 |
tta |
15 |
0
|
atgf |
7 |
atgf |
7 |
0
|
gaa |
8 |
gaa |
14 |
6
|
gga |
4 |
gga |
5 |
1
|
gta |
5 |
gta |
5 |
0
|
gac |
10 |
gac |
10 |
0
|
ggc |
9 |
ggc |
9 |
0
|
aga |
954 |
aga |
975 |
21
|
cds |
|
cds |
|
|
cdc8 |
I4 |
cdc |
VIII1 |
|
gene |
intercal |
gene |
intercal |
diff
|
|
|
16s |
68 |
|
16s |
217 |
gca |
271 |
|
23s |
126 |
23s |
126 |
0
|
5s |
216 |
5s |
213 |
-3
|
cds |
372 |
cds |
372 |
0
|
cds |
21 |
cds |
21 |
0
|
cds |
778 |
cds |
776 |
-2
|
16s |
261 |
16s |
52 |
|
23s |
201 |
gca |
373 |
|
5s |
5 |
23s |
126 |
-75
|
|
|
5s |
7 |
2
|
psor |
VII1 |
cdc8 |
VII1 |
|
gene |
intercal |
gene |
intercal |
diff
|
CDS |
431 |
cds |
179 |
|
16s |
54 |
16s |
161 |
|
gca |
114 |
5s |
201 |
|
23s |
193 |
23s |
217 |
|
5s |
5 |
16s |
108 |
|
tta |
9 |
atgi |
11 |
2
|
atg |
123 |
tta |
5 |
0
|
16s |
54 |
5s |
201 |
8
|
gca |
114 |
23s |
375 |
261
|
23s |
193 |
gca |
52 |
-2
|
5s |
5 |
16s’ |
100 |
-23
|
tta |
9 |
16s’ |
52 |
|
atg |
123 |
gca |
248 |
|
16s |
54 |
23s° |
100 |
-2
|
gca |
114 |
16s° |
321 |
134
|
23s |
78 |
23s' |
100 |
|
5s |
100 |
16s° |
320 |
|
CDS |
|
23s° |
100 |
|
|
|
23s’ |
126 |
|
|
|
5s |
127 |
|
|
|
cds |
|
|
|
cdc8 cdc protéines
- Notes:
- - L'altération poussée des rRNAs dans cdc8 qui saute aux yeux quand on comapre les blocs en tRNAs et intercalaires, m'a poussé à comparer les tailles en pbs ici des rRNAs et des cds qui les entourent avec l'idée que ces cds sont issus de la conversion de ces rRNAs. D'où l'idée de création de gène par conversion à l'instar du processus CRISPR.
Alignement sur cdc
- Lien tableur: Alignement sur cdc
- Lien noms abrégés
- Légende: abrégé pour noms abrégés des protéines.
- - 23s': possible 23S ribosomal RNA but does not have good blast hits on one or both of the ends.
- - 23s°: 23S ribosomal RNA rRNA prediction is too short
- - SigB: Protéine existant dans cdc et cdc8 mais est décalée dans cdc8 par les grands remaniements. Voir alignement sur cdc8, tableau qui suit.
- Notes:
- - cdc présente 15 clusters avec ou sans rRNAs. 5 clusters sans rRNAs sont reproduits tels quels dans cdc8. Les clusters avec rRNAs se répartissent en 3 16sgca23s et 7 16s23s. Dans cdc8 les 3 16sgca23s sont modifiés ou altérés, 3 16s23s sont altérés et les 4 autres sont reproduits tels quels.
- - Les 3 16sgca23s5s perdent leur gca mais gardent le 5s. Deux sont durement altérés dont un porte une séquence de 9 tRNAs et l'autre rien. La modification du 3ème consiste en la suppression du gca seulement sans tocher le reste. Cependant l'intercalaire 16s-23s de 415 pbs dans cdc est divisé par 2 dans cdc8, 217 pbs.
- - Les 3 16s23s5s altérés le sont fortement, 2 portent des séquences longues de tRNAs, 43 et 18, le 3ème est sans tRNAs.
- - La colonne "ordre dans cdc" servira à repérer les grands remaniement quand je ferai l'alignement sur cdc8. De même pour les protéines en bleu foncé.
C3. cdc-cdc8, alignement des protéines sur cdc
C37. cdc protéines
ordre |
sens |
adresse |
gene |
intercal |
pbs |
abrégé
|
0 |
dir |
9857..10630 |
cds |
179 |
774 |
SigB
|
|
dir |
10810..12317 |
16s |
52 |
1508 |
|
|
dir |
12370..12445 |
gca |
249 |
76 |
|
1 |
dir |
12695..15596 |
23s |
111 |
2902 |
|
|
dir |
15708..15824 |
5s |
126 |
117 |
|
|
dir |
15951..16460 |
cds |
11 |
510 |
NadR
|
|
dir |
16472..17353 |
cds |
457 |
882 |
mecano
|
|
dir |
17811..19082 |
cds |
319 |
1272 |
S-ligase
|
|
dir |
19402..19857 |
cds |
0 |
456 |
Nuc-de
|
|
dir |
19858..19949 |
tcc |
37 |
92 |
|
2 |
dir |
19987..20251 |
ncRNA |
76 |
265 |
|
|
dir |
20328..21965 |
cds |
|
1638 |
III-tau
|
|
|
|
|
|
|
|
|
comp |
23419..24624 |
cds |
505 |
1206 |
Glyco-tr
|
|
dir |
25130..26637 |
16s |
279 |
1508 |
|
|
dir |
26917..29816 |
23s |
180 |
2900 |
|
|
dir |
29997..30113 |
5s |
6 |
117 |
|
3 |
dir |
30120..30194 |
aac |
6 |
75 |
|
|
dir |
|
**41aas |
12 |
|
|
|
dir |
33877..33952 |
gta |
75 |
76 |
|
|
dir |
34028..34441 |
cds |
308 |
414 |
hp-414
|
|
dir |
34750..38181 |
cds |
|
3432 |
pyruvate
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
dir |
127011..127715 |
cds |
281 |
705 |
CwlD
|
|
dir |
127997..129505 |
16s |
279 |
1509 |
|
|
dir |
129785..132685 |
23s |
131 |
2901 |
|
|
dir |
132817..132933 |
5s |
6 |
117 |
|
4 |
dir |
132940..133014 |
aac |
4 |
75 |
|
|
dir |
|
**16aas |
8 |
|
|
|
dir |
134534..134610 |
atgj |
114 |
77 |
|
|
dir |
134725..136115 |
16s |
68 |
1391 |
|
|
dir |
136184..136259 |
gca |
271 |
76 |
|
|
dir |
136531..139430 |
23s |
126 |
2900 |
|
|
dir |
139557..139673 |
5s |
213 |
117 |
|
|
comp |
139887..141071 |
cds |
372 |
1185 |
B6
|
5 |
dir |
141444..143795 |
cds |
21 |
2352 |
Art-red
|
|
dir |
143817..144356 |
cds |
776 |
540 |
Art-reda
|
|
dir |
145133..146640 |
16s |
52 |
1508 |
|
|
dir |
146693..146768 |
gca |
373 |
76 |
|
|
dir |
147142..150041 |
23s |
126 |
2900 |
|
|
dir |
150168..150284 |
5s |
7 |
117 |
|
6 |
dir |
150292..150366 |
aac |
5 |
75 |
|
|
dir |
|
**7aas |
6 |
|
|
|
dir |
150976..151049 |
aga |
975 |
74 |
|
|
dir |
152025..152864 |
cds |
|
840 |
TIGR
|
|
|
|
|
|
|
|
|
dir |
378341..380728 |
cds |
583 |
2388 |
cad
|
|
dir |
381312..382819 |
16s |
311 |
1508 |
|
|
dir |
383131..386030 |
23s |
126 |
2900 |
|
7 |
dir |
386157..386273 |
5s |
177 |
117 |
|
|
dir |
386451..387059 |
cds |
|
609 |
DedA
|
|
|
|
|
|
|
|
|
comp |
833130..833894 |
cds |
258 |
765 |
DeoR
|
8 |
dir |
834153..834243 |
agc |
87 |
91 |
|
|
dir |
834331..835119 |
cds |
|
789 |
flagellar
|
|
|
|
|
|
|
|
|
dir |
1089165..1090139 |
cds |
239 |
975 |
Mannosyl
|
|
dir |
1090379..1091886 |
16s |
320 |
1508 |
|
|
dir |
1092207..1095106 |
23s |
91 |
2900 |
|
|
dir |
1095198..1095271 |
gga |
8 |
74 |
|
9 |
dir |
1095280..1095396 |
5s |
273 |
117 |
|
|
dir |
1095670..1097688 |
cds |
|
2019 |
Ala amid
|
|
|
|
|
|
|
|
|
comp |
1181549..1182958 |
cds |
1374 |
1410 |
MBOAT
|
10 |
comp |
1184333..1184415 |
ttg |
318 |
83 |
|
|
dir |
1184734..1187382 |
cds |
|
2649 |
PolyI
|
|
|
|
|
|
|
|
|
dir |
1835768..1837498 |
cds |
109 |
1731 |
NhaC
|
11 |
dir |
1837608..1837688 |
cta |
231 |
81 |
|
|
<dir |
1837920..1838093 |
cds |
|
174 |
HXXEE
|
|
|
|
|
|
|
|
|
dir |
2981767..2982444 |
cds |
159 |
678 |
SrtB
|
|
comp |
2982604..2982678 |
aca |
94 |
75 |
|
|
comp |
2982773..2985672 |
23s |
184 |
2900 |
|
12 |
comp |
2985857..2987364 |
16s |
340 |
1508 |
|
|
dir |
2987705..2988643 |
cds |
|
939 |
lactam
|
|
|
|
|
|
|
|
|
comp |
3787361..3788431 |
cds |
454 |
1071 |
ABC
|
|
comp |
3788886..3789002 |
5s |
126 |
117 |
|
13 |
comp |
3789129..3792028 |
23s |
281 |
2900 |
|
|
comp |
3792310..3793817 |
16s |
191 |
1508 |
|
|
comp |
3794009..3794587 |
cds |
|
579 |
precorrin
|
|
|
|
|
|
|
|
|
comp |
3944262..3944453 |
cds |
119 |
192 |
DUF378
|
|
comp |
3944573..3944689 |
5s |
126 |
117 |
|
14 |
comp |
3944816..3947715 |
23s |
217 |
2900 |
|
|
comp |
3947933..3949440 |
16s |
282 |
1508 |
|
|
comp |
3949723..3950004 |
cds |
221 |
282 |
hp-282
|
|
comp |
3950226..3951755 |
cds |
|
1530 |
K-ligase
|
|
|
|
|
|
|
|
|
dir |
4084445..4085437 |
cds |
382 |
993 |
DnaC
|
|
comp |
4085820..4085894 |
aca |
33 |
75 |
|
15 |
comp |
4085928..4086003 |
gta |
4 |
76 |
|
|
comp |
4086008..4086082 |
gaa |
6 |
75 |
|
|
comp |
4086089..4086164 |
aaa |
326 |
76 |
|
|
comp |
4086491..4087780 |
cds |
|
1290 |
succinate
|
|
C38. cdc8 protéines
sens |
adresse |
gene |
intercal |
pbs |
abrégé
|
dir |
4194196..4196423 |
23s’ |
100 |
2228 |
|
dir |
4196524..4197091 |
16s° |
320 |
568 |
|
dir |
4197412..4199044 |
23s° |
100 |
1633 |
|
dir |
4199145..4201593 |
23s’ |
126 |
2449 |
|
dir |
4201720..4201836 |
5s |
127 |
117 |
|
dir |
4201964..4202473 |
cds |
11 |
510 |
NadR
|
dir |
4202485..4203366 |
cds |
458 |
882 |
mecano
|
dir |
4203825..4205096 |
cds |
320 |
1272 |
S-ligase
|
dir |
4205417..4205872 |
cds |
0 |
456 |
Nuc-de
|
dir |
4205873..4205964 |
tcc |
37 |
92 |
|
dir |
4206002..4206266 |
ncRNA |
76 |
265 |
|
dir |
4206343..4207980 |
cds |
|
1638 |
III-tau
|
|
|
|
|
|
|
dir |
4306341..4307538 |
16s |
0 |
1198 |
|
dir |
4307539..4308225 |
cds |
100 |
687 |
xylose
|
dir |
1..796 |
23s° |
181 |
796 |
|
dir |
978..1094 |
5s |
6 |
117 |
|
dir |
1101..1175 |
aac |
6 |
75 |
|
dir |
|
**41aas |
12 |
|
|
dir |
4868..4943 |
gta |
75 |
76 |
|
dir |
5019..5432 |
cds |
308 |
414 |
hp-414
|
dir |
5741..9172 |
cds |
|
3432 |
pyruvate
|
|
|
|
|
|
|
dir |
4300349..4300807 |
cds |
554 |
459 |
Helix
|
dir |
4301362..4303101 |
cds |
0 |
1740 |
hp-1740
|
dir |
4303102..4303305 |
cds |
167 |
204 |
hp-204
|
dir |
4303473..4304299 |
23s° |
132 |
827 |
|
dir |
4304432..4304548 |
5s |
6 |
117 |
|
dir |
4304555..4304629 |
aac |
4 |
75 |
|
dir |
|
**16aas |
8 |
|
|
dir |
4306150..4306226 |
atgj |
114 |
77 |
|
|
|
|
|
|
|
dir |
4232593..4234098 |
16s |
217 |
1506 |
|
dir |
4234316..4237215 |
23s |
126 |
2900 |
|
dir |
4237342..4237458 |
5s |
216 |
117 |
|
comp |
4237675..4238859 |
cds |
372 |
1185 |
B6
|
dir |
4239232..4241583 |
cds |
21 |
2352 |
Art-red
|
dir |
4241605..4242144 |
cds |
778 |
540 |
Art-reda
|
dir |
94032..94736 |
cds |
281 |
705 |
CwlD
|
dir |
95018..95994 |
16s° |
100 |
977 |
|
dir |
96095..97613 |
23s° |
126 |
1519 |
|
dir |
97740..97856 |
5s |
7 |
117 |
|
dir |
97864..97938 |
aac |
6 |
75 |
|
dir |
|
**7aas |
6 |
|
|
dir |
98542..98615 |
aga |
954 |
74 |
|
dir |
99570..100409 |
cds |
|
840 |
TIGR
|
|
|
|
|
|
|
dir |
306829..309216 |
cds |
733 |
2388 |
cad
|
<>comp |
309950..310076 |
cds |
1 |
127 |
seleno
|
dir |
310078..311313 |
23s° |
126 |
1236 |
|
dir |
311440..311556 |
5s |
177 |
117 |
|
dir |
311734..312342 |
cds |
|
609 |
DedA
|
|
|
|
|
|
|
comp |
861856..862620 |
cds |
258 |
765 |
DeoR
|
dir |
862879..862969 |
agc |
87 |
91 |
|
dir |
863057..863845 |
cds |
|
789 |
flagellar
|
|
|
|
|
|
|
dir |
1106477..1107451 |
cds |
238 |
975 |
Mannosyl
|
dir |
1107690..1109197 |
16s |
320 |
1508 |
|
dir |
1109518..1112416 |
23s |
91 |
2899 |
|
dir |
1112508..1112581 |
gga |
8 |
74 |
|
dir |
1112590..1112706 |
5s |
273 |
117 |
|
dir |
1112980..1114998 |
cds |
|
2019 |
Ala amid
|
|
|
|
|
|
|
comp |
1196804..1198213 |
cds |
1378 |
1410 |
MBOAT
|
comp |
1199592..1199674 |
ttg |
318 |
83 |
|
dir |
1199993..1202641 |
cds |
|
2649 |
PolyI
|
|
|
|
|
|
|
dir |
1850896..1852626 |
cds |
109 |
1731 |
NhaC
|
dir |
1852736..1852816 |
cta |
334 |
81 |
|
dir |
1853151..1853666 |
cds |
|
516 |
HXXEE
|
|
|
|
|
|
|
dir |
3024038..3024715 |
cds |
150 |
678 |
SrtB
|
comp |
3024866..3024940 |
aca |
93 |
75 |
|
comp |
3025034..3027933 |
23s |
184 |
2900 |
|
comp |
3028118..3029625 |
16s |
374 |
1508 |
|
dir |
3030000..3030938 |
cds |
|
939 |
lactam
|
|
|
|
|
|
|
comp |
3875816..3876886 |
cds |
452 |
1071 |
ABC
|
comp |
3877339..3877455 |
5s |
125 |
117 |
|
comp |
3877581..3880480 |
23s |
261 |
2900 |
|
comp |
3880742..3882249 |
16s |
190 |
1508 |
|
comp |
3882440..3883018 |
cds |
|
579 |
precorrin
|
|
|
|
|
|
|
comp |
4017523..4017714 |
cds |
118 |
192 |
DUF378
|
comp |
4017833..4017949 |
5s |
126 |
117 |
|
comp |
4018076..4020975 |
23s |
321 |
2900 |
|
comp |
4021297..4022804 |
16s |
292 |
1508 |
|
comp |
4023097..4023378 |
cds |
221 |
282 |
hp-282
|
comp |
4023600..4025129 |
cds |
|
1530 |
K-ligase
|
|
|
|
|
|
|
dir |
4135881..4136873 |
cds |
383 |
993 |
DnaC
|
comp |
4137257..4137331 |
aca |
33 |
75 |
|
comp |
4137365..4137440 |
gta |
4 |
76 |
|
comp |
4137445..4137519 |
gaa |
6 |
75 |
|
comp |
4137526..4137601 |
aaa |
331 |
76 |
|
comp |
4137933..4139222 |
cds |
|
1290 |
succinate
|
|
Alignement sur cdc8
- Lien tableur: Alignement sur cdc8
- Lien noms abrégés
- Légende:
- - 23s': possible 23S ribosomal RNA but does not have good blast hits on one or both of the ends.
- - 23s°: 23S ribosomal RNA rRNA prediction is too short
- - SigB: Protéine existant dans cdc et cdc8 mais est décalée dans cdc8 par les grands remaniements. Voir alignement sur cdc, tableau précédent.
- Notes:
- - Ici je n'ai pas fait de parallélisme cdc8/cdc. Il suffit de voir la colonne ordre de cdc décrit dans le tableau précédent (alignement sur cdc) pour se rendre compte des grands remaniements du chromosome. Dans cette colonne j'ai ajouté "insert" pour insertion par rapport à cdc.
- - Pour comparer cdc8 à psor pour certains clusters j'ai du intervertir l'ordre des tableaux, le tableau de gauche doit être la suite de celui de droite.
- - Les insertions accumulent les 2 grands groupes qu'on a vu dans cdc8-blocs, à 15 et 23 rRNAs. Par contre en dehors des insertions on trouve 3 groupes altérés à 1 ou 2 clusters, et tous les groupes non altérés sauf l'ordre 5 de cdc.
- - comparaison avec psor: on devine les types VI VII VIII, mais il y a de nouveau type le IV4 par exemple qu'on a signalé dans cdc8-blocs.
C3. cdc-cdc8, alignement des protéines sur cdc8
C40. cdc8 début
cdc8 |
|
|
|
|
|
|
ordre cdc |
sens |
adresse |
gène |
intercal |
pbs |
abrégé
|
insert |
dir |
4299490..4300134 |
cds |
214 |
645 |
Y-r1
|
insert |
dir |
4300349..4300807 |
cds |
554 |
459 |
Helix
|
|
dir |
4301362..4303101 |
cds |
0 |
1740 |
hp-1740
|
|
dir |
4303102..4303305 |
cds |
167 |
204 |
hp-204
|
|
dir |
4303473..4304299 |
23s° |
132 |
827 |
|
4 |
dir |
4304432..4304548 |
5s |
6 |
117 |
|
|
dir |
4304555..4304629 |
aac |
4 |
75 |
|
|
dir |
4304634..4304708 |
gaa |
5 |
75 |
|
|
dir |
4304555..4304629 |
aac |
4 |
75 |
|
|
dir |
|
**16aas |
8 |
|
|
|
dir |
4306150..4306226 |
atgj |
114 |
77 |
|
|
dir |
4306341..4307538 |
16s |
0 |
1198 |
|
|
dir |
4307539..4308225 |
cds |
100 |
687 |
xylose
|
|
dir |
1..796 |
23s° |
181 |
796 |
|
3 |
dir |
978..1094 |
5s |
6 |
117 |
|
|
dir |
1101..1175 |
aac |
6 |
75 |
|
|
dir |
|
**41aas |
12 |
|
|
|
dir |
4868..4943 |
gta |
75 |
76 |
|
|
dir |
5019..5432 |
cds |
308 |
414 |
hp-414
|
|
dir |
5741..9172 |
cds |
|
3432 |
pyruvate
|
|
|
|
|
|
|
|
|
dir |
94032..94736 |
cds |
281 |
705 |
CwlD
|
|
dir |
95018..95994 |
16s° |
100 |
977 |
|
|
dir |
96095..97613 |
23s° |
126 |
1519 |
|
6 |
dir |
97740..97856 |
5s |
7 |
117 |
|
|
dir |
97864..97938 |
aac |
6 |
75 |
|
|
dir |
|
**7aas |
6 |
|
|
|
dir |
98542..98615 |
aga |
954 |
74 |
|
|
dir |
99570..100409 |
cds |
|
840 |
TIGR
|
|
|
|
|
|
|
|
|
<> cp |
309950..310076 |
cds |
1 |
127 |
seleno
|
|
dir |
310078..311313 |
23s° |
126 |
1236 |
|
7 |
dir |
311440..311556 |
5s |
177 |
117 |
|
|
dir |
311734..312342 |
cds |
|
609 |
DedA
|
|
|
|
|
|
|
|
|
comp |
861856..862620 |
cds |
258 |
765 |
DeoR
|
8 |
dir |
862879..862969 |
agc |
87 |
91 |
|
|
dir |
863057..863845 |
cds |
|
789 |
flagellar
|
|
|
|
|
|
|
|
|
dir |
1106477..1107451 |
cds |
238 |
975 |
Mannosyl
|
|
dir |
1107690..1109197 |
16s |
320 |
1508 |
|
|
dir |
1109518..1112416 |
23s |
91 |
2899 |
|
|
dir |
1112508..1112581 |
gga |
8 |
74 |
|
9 |
dir |
1112590..1112706 |
5s |
273 |
117 |
|
|
dir |
1112980..1114998 |
cds |
|
2019 |
Ala amid
|
|
|
|
|
|
|
|
|
comp |
1196804..1198213 |
cds |
1378 |
1410 |
MBOAT
|
10 |
comp |
1199592..1199674 |
ttg |
318 |
83 |
|
|
dir |
1199993..1202641 |
cds |
|
2649 |
PolyI
|
|
|
|
|
|
|
|
|
dir |
1850896..1852626 |
cds |
109 |
1731 |
NhaC
|
11 |
dir |
1852736..1852816 |
cta |
334 |
81 |
|
|
dir |
1853151..1853666 |
cds |
|
516 |
HXXEE
|
|
|
|
|
|
|
|
|
dir |
3024038..3024715 |
cds |
150 |
678 |
SrtB
|
|
comp |
3024866..3024940 |
aca |
93 |
75 |
|
12 |
comp |
3025034..3027933 |
23s |
184 |
2900 |
|
|
comp |
3028118..3029625 |
16s |
374 |
1508 |
|
|
dir |
3030000..3030938 |
cds |
|
939 |
lactam
|
|
|
|
|
|
|
|
insert |
dir |
3805298..3806743 |
cds |
208 |
1446 |
Y-r2
|
insert |
comp |
3806952..3807028 |
agg |
61 |
77 |
|
insert |
<comp |
3807090..3808790 |
cds |
|
1701 |
fdHa
|
|
|
|
|
|
|
|
|
comp |
3875816..3876886 |
cds |
452 |
1071 |
ABC
|
|
comp |
3877339..3877455 |
5s |
125 |
117 |
|
13 |
comp |
3877581..3880480 |
23s |
261 |
2900 |
|
|
comp |
3880742..3882249 |
16s |
190 |
1508 |
|
|
comp |
3882440..3883018 |
cds |
|
579 |
precorrin
|
|
|
|
|
|
|
|
|
comp |
4017523..4017714 |
cds |
118 |
192 |
DUF378
|
|
comp |
4017833..4017949 |
5s |
126 |
117 |
|
14 |
comp |
4018076..4020975 |
23s |
321 |
2900 |
|
|
comp |
4021297..4022804 |
16s |
292 |
1508 |
|
|
comp |
4023097..4023378 |
cds |
221 |
282 |
hp-282
|
|
comp |
4023600..4025129 |
cds |
|
1530 |
K-ligase
|
|
|
|
|
|
|
|
|
dir |
4135881..4136873 |
cds |
383 |
993 |
DnaC
|
|
comp |
4137257..4137331 |
aca |
33 |
75 |
|
15 |
comp |
4137365..4137440 |
gta |
4 |
76 |
|
|
comp |
4137445..4137519 |
gaa |
6 |
75 |
|
|
comp |
4137526..4137601 |
aaa |
331 |
76 |
|
|
comp |
4137933..4139222 |
cds |
|
1290 |
succinate
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
C40. cdc8 suite
cdc8 |
|
|
|
|
|
|
psor |
|
|
|
|
ordre cdc |
sens |
adresse |
gène |
intercal |
pbs |
abrégé |
adresse |
gène |
intercal |
pbs |
abrégé
|
0 |
dir |
4178197..4178970 |
cds |
179 |
774 |
SigB |
127845..129260 |
CDS |
100 |
1416 |
R-deca
|
insert |
dir |
4179150..4180587 |
16s |
161 |
1438 |
|
127628..127744 |
5s |
78 |
|
|
insert |
comp |
4180749..4180865 |
5s |
201 |
117 |
|
124628..127549 |
23s |
114 |
|
|
insert |
comp |
4181067..4183959 |
23s |
217 |
2893 |
|
124438..124513 |
gca |
54 |
|
|
insert |
comp |
4184177..4185684 |
16s |
108 |
1508 |
|
122877..124383 |
16s |
123 |
|
|
insert |
comp |
4185793..4185869 |
atgi |
11 |
77 |
|
122677..122753 |
atg |
9 |
|
|
insert |
comp |
4185881..4185969 |
tta |
5 |
89 |
|
122579..122667 |
tta |
5 |
|
|
insert |
comp |
4185975..4186091 |
5s |
201 |
117 |
|
122457..122573 |
5s |
193 |
|
|
insert |
comp |
4186293..4189192 |
23s |
375 |
2900 |
|
119347..122263 |
23s |
114 |
|
|
insert |
comp |
4189568..4189643 |
gca |
52 |
76 |
|
119157..119232 |
gca |
54 |
|
|
insert |
comp |
4189696..4190959 |
16s’ |
100 |
1264 |
|
117596..119102 |
16s |
123 |
|
|
insert |
dir |
4191060..4192225 |
16s’ |
52 |
1166 |
|
117396..117472 |
atg |
9 |
|
|
insert |
dir |
4192278..4192353 |
gca |
248 |
76 |
|
117298..117386 |
tta |
5 |
|
|
insert |
dir |
4192602..4193197 |
23s° |
100 |
596 |
|
117176..117292 |
5s |
193 |
|
|
insert |
dir |
4193298..4193874 |
16s° |
321 |
577 |
|
114067..116982 |
23s |
114 |
|
|
insert |
dir |
4194196..4196423 |
23s’ |
100 |
2228 |
|
113877..113952 |
gca |
54 |
|
|
|
dir |
4196524..4197091 |
16s° |
320 |
568 |
|
112316..113822 |
16s |
431 |
|
|
1 |
dir |
4197412..4199044 |
23s° |
100 |
1633 |
|
111345..111884 |
CDS |
|
540 |
Art-reda
|
|
dir |
4199145..4201593 |
23s’ |
126 |
2449 |
|
|
|
|
|
|
|
dir |
4201720..4201836 |
5s |
127 |
117 |
|
|
|
|
|
|
|
dir |
4201964..4202473 |
cds |
11 |
510 |
NadR |
|
|
|
|
|
|
dir |
4202485..4203366 |
cds |
458 |
882 |
mecano |
|
|
|
|
|
|
dir |
4203825..4205096 |
cds |
320 |
1272 |
S-ligase |
|
|
|
|
|
|
dir |
4205417..4205872 |
cds |
0 |
456 |
Nuc-de |
|
|
|
|
|
|
dir |
4205873..4205964 |
tcc |
37 |
92 |
|
|
|
|
|
|
2 |
dir |
4206002..4206266 |
ncRNA |
76 |
265 |
|
|
|
|
|
|
|
dir |
4206343..4207980 |
cds |
|
1638 |
III-tau |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
insert |
comp |
4209435..4210639 |
cds |
496 |
1205 |
Glyco-tr |
|
|
|
|
|
insert |
|
4211136..4212643 |
16s |
321 |
1508 |
|
|
|
|
|
|
insert |
|
4212965..4213127 |
23s° |
100 |
163 |
|
|
|
|
|
|
insert |
<>comp |
4213228..4213849 |
cds |
|
622 |
CHAP |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
insert |
comp |
4213961..4214620 |
cds |
228 |
660 |
A-1chlor |
|
|
|
|
|
insert |
dir |
4214849..4216199 |
16s |
321 |
1351 |
|
|
|
|
|
|
insert |
dir |
4216521..4217008 |
23s° |
101 |
488 |
|
|
|
|
|
|
insert |
comp |
4217110..4218529 |
23s° |
250 |
1420 |
|
|
|
|
|
|
insert |
comp |
4218780..4218855 |
gca |
52 |
76 |
|
|
|
|
|
|
insert |
comp |
4218908..4219471 |
16s° |
100 |
564 |
|
|
|
|
|
|
insert |
comp |
4219572..4219856 |
23s° |
217 |
285 |
|
|
|
|
|
|
insert |
comp |
4220074..4221581 |
16s |
179 |
1508 |
|
|
|
|
|
|
insert |
>comp |
4221761..4222206 |
cds |
386 |
446 |
SigB2 |
3452349..3452552 |
CDS |
239 |
204 |
hp-204
|
insert |
dir |
4222593..4224100 |
16s |
321 |
1508 |
|
3450603..3452109 |
16s |
196 |
|
|
insert |
dir |
4224422..4227321 |
23s |
181 |
2900 |
|
3447492..3450406 |
23s |
213 |
|
|
insert |
dir |
4227503..4227619 |
5s |
6 |
117 |
|
3447162..3447278 |
5s |
5 |
|
|
insert |
dir |
4227626..4227700 |
aac |
6 |
75 |
|
3447068..3447156 |
tta |
13 |
|
|
insert |
dir |
4227707..4227792 |
tta |
15 |
86 |
|
3446979..3447054 |
atg |
15 |
|
|
insert |
dir |
4227808..4227883 |
atgf |
7 |
76 |
|
3446889..3446963 |
gaa |
9 |
|
|
insert |
dir |
4227891..4227965 |
gaa |
9 |
75 |
|
3446806..3446879 |
gga |
6 |
|
|
insert |
dir |
4227975..4228048 |
gga |
5 |
74 |
|
3446724..3446799 |
gta |
5 |
|
|
insert |
dir |
4228054..4228129 |
gta |
5 |
76 |
|
3446642..3446718 |
gac |
16 |
|
|
insert |
dir |
4228135..4228211 |
gac |
9 |
77 |
|
3446550..3446625 |
aac |
31 |
|
|
insert |
dir |
4228221..4228295 |
aca |
14 |
75 |
|
3446443..3446518 |
aac |
4 |
|
|
insert |
dir |
4228310..4228394 |
tac |
10 |
85 |
|
3446364..3446438 |
aca |
4 |
|
|
insert |
dir |
4228405..4228488 |
cta |
28 |
84 |
|
3446275..3446359 |
tac |
11 |
|
|
insert |
dir |
4228517..4228593 |
aga |
7 |
77 |
|
3446190..3446263 |
gga |
19 |
|
|
insert |
dir |
4228601..4228676 |
caa |
89 |
76 |
|
3446094..3446170 |
aga |
6 |
|
|
insert |
dir |
4228766..4228854 |
tca |
3 |
89 |
|
3446012..3446087 |
caa |
12 |
|
|
insert |
dir |
4228858..4228933 |
ttc |
6 |
76 |
|
3445924..3445999 |
aaa |
6 |
|
|
insert |
dir |
4228940..4229016 |
atgj |
11 |
77 |
|
3445829..3445917 |
tca |
11 |
|
|
insert |
dir |
4229028..4229104 |
atgi |
29 |
77 |
|
3445727..3445817 |
agc |
6 |
|
|
insert |
dir |
4229134..4229210 |
cca |
7 |
77 |
|
3445644..3445720 |
cca |
6 |
|
|
insert |
dir |
4229218..4229294 |
cac |
8 |
77 |
|
3445561..3445637 |
atg |
11 |
|
|
insert |
dir |
4229303..4229378 |
aaa |
353 |
76 |
|
3445474..3445549 |
tgg |
31 |
|
|
insert |
comp |
4229732..4229848 |
5s |
126 |
117 |
|
3445366..3445442 |
cca |
6 |
|
|
insert |
comp |
4229975..4232010 |
23s’ |
582 |
2036 |
|
3445283..3445359 |
atc |
6 |
|
|
|
dir |
4232593..4234098 |
16s |
217 |
1506 |
|
3445201..3445276 |
ttc |
13 |
|
|
|
dir |
4234316..4237215 |
23s |
126 |
2900 |
|
3445111..3445187 |
atg |
|
|
|
|
dir |
4237342..4237458 |
5s |
216 |
117 |
|
|
|
|
|
|
|
comp |
4237675..4238859 |
cds |
372 |
1185 |
B6 |
|
|
|
|
|
5 |
dir |
4239232..4241583 |
cds |
21 |
2352 |
Art-red |
|
|
|
|
|
|
dir |
4241605..4242144 |
cds |
778 |
540 |
Art-reda |
|
|
|
|
|
insert |
dir |
4242923..4244459 |
16s |
261 |
1537 |
|
|
|
|
|
|
insert |
dir |
4244721..4247619 |
23s |
201 |
2899 |
|
|
|
|
|
|
insert |
dir |
4247821..4247937 |
5s |
5 |
117 |
|
111345..111884 |
CDS |
431 |
540 |
Art-reda
|
insert |
dir |
4247943..4248031 |
tta |
11 |
89 |
|
112316..113822 |
16s |
54 |
|
|
insert |
dir |
4248043..4248119 |
atgi |
108 |
77 |
|
113877..113952 |
gca |
114 |
|
|
insert |
dir |
4248228..4249735 |
16s |
184 |
1508 |
|
114067..116982 |
23s |
193 |
|
|
insert |
dir |
4249920..4250564 |
23s° |
100 |
645 |
|
117176..117292 |
5s |
5 |
|
|
insert |
<dir |
4250665..4250923 |
cds |
112 |
259 |
hp-259 |
117298..117386 |
tta |
9 |
|
|
insert |
comp |
4251036..4253145 |
23s’ |
375 |
2110 |
|
117396..117472 |
atg |
123 |
|
|
insert |
comp |
4253521..4253596 |
gca |
52 |
76 |
|
117596..119102 |
16s |
54 |
|
|
insert |
comp |
4253649..4254226 |
16s° |
282 |
578 |
|
119157..119232 |
gca |
114 |
|
|
insert |
dir |
4254509..4254712 |
cds |
12 |
204 |
hp-204 |
119347..122263 |
23s |
193 |
|
|
insert |
dir |
4254725..4256002 |
cds |
|
1278 |
phagePP |
122457..122573 |
5s |
5 |
|
|
|
|
|
|
|
|
|
122579..122667 |
tta |
9 |
|
|
début |
début |
début |
début |
début |
début |
début |
122677..122753 |
atg |
123 |
|
|
insert |
dir |
4299490..4300134 |
cds |
214 |
645 |
Y-r1 |
122877..124383 |
16s |
54 |
|
|
insert |
dir |
4300349..4300807 |
cds |
554 |
459 |
Helix |
124438..124513 |
gca |
114 |
|
|
|
dir |
4301362..4303101 |
cds |
0 |
1740 |
hp-1740 |
124628..127549 |
23s |
78 |
|
|
|
dir |
4303102..4303305 |
cds |
167 |
204 |
hp-204 |
127628..127744 |
5s |
100 |
|
|
4 |
dir |
4303473..4304299 |
23s° |
132 |
827 |
|
127845..129260 |
CDS |
|
1416 |
R-deca
|
|
cdc8 cdc création de cds
- Lien tableur: cdc8 cdc création de cds
- Lien abrégé
- Notes:
- - Dans la colonne abrégé sont marqués les cds spécifiques à cdc8, cyan dans Alignement sur cdc8.
- - Certains de ces cds, étant donné leur position dans un bloc de rRNAs dégradés, seraient des candidats de gènes créés de novo lors des conversions qui ont altéré ce bloc. Il est évident qu'on peut toujours rétorquer que ce gène a été copié ou intégré à ce niveau par la conversion. Mais si ce gène ou plusieurs n'existaient pas dans cdc mais seulement dans cdc8, alors l'hypothèse de création de novo serait renforcée.
- - 7 gènes de cdc8, Y-r1 Helix xylose seleno CHAP A-1chlor sigB2, répondent aux critères de la conversion mais n'existent pas dans cdc. Ces cds sont colorés en jaunes et repérés par leur taille en pbs.
- - 4 gènes parmi les 7, seleno CHAP A-1chlor sigB2, n'existent qu'en un seul exemplaire, et ne peuvent donc être extraits à la limite que d'un cds hypothétique, hypothetical protein.
- - Les 3 gènes restants, Y-r1 Helix xylose, ont des cds analogues, c.a.d portant le même nom dans mes recherches et pourraient être extraits de ces analogues d'autant plus qu'ils ont des noms portant la mention type ou domaine.
- - Le gène PhagePP est à la limite du critère de conversion puisqu'il est en fin de bloc mais séparé de 12 pbs du cds hp-204 qui est plus proche de la création de novo puisqu'il est hypothétique. Il appartiendrait au 2ème groupe de gènes ayant des analogues. Cependant j'ai trouvé un gène dans cdc et un gène dans psor qui ont des tailles quasi identiques. Aussi j'ai recherché les cdcs encadrant ces gènes, ils sont tous différents dans les 3 génomes. PhagePP serait analogue donc à Y-r1 Helix xylose.
- Le nom complet du cds Clp est "Clp protéase" et celui de PhageHM est "phage head morphogenesis, SPP1 gp7 family domain protein".
- - J'ai inclue aussi 2 cds appartenant à un cluster sans rRNA, Y-r2 et fdhA. Y-r2 avec sa taille de 1446 se comporte comme Y-r1, il n'existe pas dans cdc. fdhA est le contre exemple de cds qui n'est pas créé de novo, il n'est pas dans une zone altérée par la conversion des rRNA, et il existe dans cdc, mais pas dans psor qui est plus loin phylogénétiquement.
C3. cdc8 cdc création de cds
abrégé |
cdc8 |
pbs |
cdc |
pbs |
psor |
pbs
|
seleno A |
309950..310076 |
127 |
0 |
|
- |
|
Y-r |
457663..457878 |
216 |
457207..457422 |
216 |
- |
|
|
1237414..1237986 |
573 |
1223841..1224413 |
573 |
|
|
|
1291413..1292327 |
915 |
1277836..1278750 |
915 |
|
|
|
1418672..1419580 |
909 |
1405262..1406170 |
909 |
|
|
|
2120221..2121348 |
1128 |
|
|
|
|
|
2785863..2786042 |
180 |
|
|
|
|
|
3564835..3565434 |
600 |
|
|
|
|
Y-r2 |
3805298..3806743 |
1446 |
|
|
|
|
Y-r1 |
4299490..4300134 |
645 |
|
|
|
|
Helix |
351106..351336 |
231 |
391813..392001 |
189 |
- |
|
|
379952..380503 |
552 |
429510..430061 |
552 |
|
|
|
456588..456776 |
189 |
461727..462398 |
672 |
|
|
|
1187185..1187736 |
552 |
1169984..1170535 |
552 |
|
|
|
1466364..1466783 |
420 |
1292255..1292926 |
672 |
|
|
|
1467749..1468147 |
399 |
1454375..1454773 |
399 |
|
|
|
1605760..1606344 |
585 |
1517855..1518619 |
765 |
|
|
|
1694358..1694750 |
393 |
1592306..1592890 |
585 |
|
|
|
1936722..1937267 |
546 |
1682266..1682658 |
393 |
|
|
|
2105662..2106711 |
1050 |
1695592..1696284 |
693 |
|
|
|
2196549..2198204 |
1656 |
1916424..1916630 |
207 |
|
|
|
2342487..2342690 |
204 |
1922813..1923358 |
546 |
|
|
|
2353934..2354578 |
645 |
2164151..2165806 |
1656 |
|
|
|
2378761..2379891 |
1131 |
2308386..2308589 |
204 |
|
|
|
2721795..2722316 |
522 |
2319833..2320477 |
645 |
|
|
|
3485137..3486024 |
888 |
2344477..2345607 |
1131 |
|
|
|
3570953..3571183 |
231 |
2501260..2501931 |
672 |
|
|
|
3571660..3571878 |
219 |
2688255..2688776 |
522 |
|
|
|
3804379..3804627 |
249 |
3459701..3460588 |
888 |
|
|
|
3804878..3805279 |
402 |
3475449..3475589 |
141 |
|
|
|
4286854..4287222 |
369 |
|
|
|
|
|
4288799..4289518 |
720 |
|
|
|
|
|
4300349..4300807 |
459 |
|
|
|
|
xylose |
3383443..3384780 |
1338 |
3349843..3351180 |
1338 |
0 |
|
|
<4307539..4308225 |
687 |
|
|
|
|
CHAP |
<4213228..>4213849 |
622 |
0 |
|
- |
|
A-1chlor |
4213961..4214620 |
660 |
0 |
|
0 |
|
SigB2 |
4221761..4222206 |
446 |
0 |
|
0 |
|
fdHa |
4221761..4222206 |
1701 |
3711229..3713373 |
2145 |
- |
|
R-deca |
0 |
|
0 |
|
127845..129260 |
1416
|
|
|
|
|
|
876023..877522 |
1500
|
phagePP |
1448919..1449983 |
1065 |
1435547..1436611 |
1065 |
1489507..1490769 |
1263
|
|
1450539..1450985 |
447 |
1437167..1437613 |
447 |
|
|
|
1709611..1711050 |
1440 |
1697521..1698963 |
1443 |
|
|
|
1718404..1718844 |
441 |
1708192..1708632 |
441 |
|
|
|
3560756..3561910 |
1155 |
3841162..3842367 |
1206 |
|
|
|
4254725..4256002 |
1278 |
|
|
|
|
|
4260531..4261586 |
1056 |
|
|
|
|
|
4262058..4262474 |
417 |
|
|
|
|
hp-204 |
4254509..4254712 |
204 |
|
|
|
|
phagePP |
4254725..4256002 |
1278 |
|
|
|
|
phageHM |
4255980..4256741 |
762 |
|
|
|
|
hp-543 |
|
|
3840525..3841067 |
543 |
|
|
phagePP |
|
|
3841162..3842367 |
1206 |
|
|
hydrolase |
|
|
3842345..3842512 |
168 |
|
|
terminase |
|
|
|
|
1487770..1489491 |
1722
|
phagePP |
|
|
|
|
1489507..1490769 |
1263
|
Clp |
|
|
|
|
1490762..1491607 |
846
|
cdc8 cdc abrégé protéines
- Lien tableur: cdc8 cdc abrégé protéines
- Légende:
- - Helix: spécifique cdc8
- - R-deca: spécifique psor
- - SigB: délocalisé dans cdc8
C3. C39 abrégé des protéines
abrégé |
nom protéine
|
A-1chlor |
type A-1 chloramphenicol O-acetyltransferase
|
ABC |
ABC transporter ATP-binding protein
|
Ala amid |
N-acetylmuramoyl-L-alanine amidase
|
Art-red |
anaerobic ribonucleoside triphosphate reductase
|
Art-reda |
anaerobic ribonucleoside-triphosphate reductase activating protein
|
B6 |
pyridoxal phosphate-dependent aminotransferase
|
cad |
cadmium-translocating P-type ATPase
|
CHAP |
CHAP domain-containing protein
|
CwlD |
N-acetylmuramoyl-L-alanine amidase CwlD
|
DedA |
DedA family protein
|
DeoR |
DeoR/GlpR transcriptional regulator
|
DnaC |
DNA replication protein DnaC
|
DUF378 |
DUF378 domain-containing protein
|
fdHa |
formate dehydrogenase subunit alpha
|
flagellar |
flagellar motor protein
|
Glyco-tr |
glycosyl transferase
|
Helix |
helix-turn-helix domain-containing protein
|
hp-1740 |
hp-1740
|
hp-204 |
hp-204
|
hp-282 |
hp-282
|
hp-414 |
hp-414
|
HXXEE |
HXXEE domain-containing protein
|
III-tau |
DNA polymerase III subunit gamma/tau
|
K-ligase |
lysine--tRNA ligase
|
lactam |
delta-lactam-biosynthetic de-N-acetylase
|
Mannosyl |
Mannosyl-glycoprotein endo-beta-N-acetylglucosamidase
|
MBOAT |
MBOAT family protein
|
mecano |
mechanosensitive ion channel
|
NadR |
transcription repressor NadR
|
NhaC |
Na+/H+ antiporter NhaC family protein
|
Nuc-de |
nucleoside deaminase
|
phagePP |
phage portal protein
|
PolyI |
DNA polymerase I
|
precorrin |
bifunctional precorrin-2 dehydrogenase/sirohydrochlorin ferrochelatase
|
pyruvate |
pyruvate carboxylase
|
R-deca |
arginine decarboxylase
|
seleno |
glycine/sarcosine/betaine reductase complex selenoprotein A
|
SigB |
SigB/SigF/SigG family RNA polymerase sigma factor
|
SigB2 |
B/F/G family RNA polymerase sigma-70 factor
|
S-ligase |
serine--tRNA ligase
|
SrtB |
sortase SrtB
|
succinate |
adenylosuccinate synthase
|
TIGR |
TIGR00159 family protein
|
xylose |
xylose isomerase
|
Y-r1 |
tyrosine-type recombinase/integrase – 1
|
Y-r2 |
tyrosine-type recombinase/integrase – 2
|
cdc8 cdc psor stats
C3 cdc8 cdc psor base NCBI
NCBI du 13.11.19 |
cdc8 |
cdc |
psor
|
date |
15-MAR-2017 |
18-MAY-2017 |
08-JAN-2018
|
DNA circulaire |
4 308 325 |
4 110 554 |
3 550 458
|
Genes (total) |
4 025 |
3 807 |
3 528
|
CDS (total) |
3 870 |
3 691 |
3 368
|
Genes (coding) |
3 763 |
3 615 |
3 327
|
CDS (coding) |
3 763 |
3 615 |
3 327
|
Genes (RNA) |
155 |
116 |
160
|
RRNAs (5S, 16S, 23S) |
14, 16, 13 |
9, 10, 10 |
17, 17, 17
|
complete rRNAs |
14, 16, 13 |
9, 10, 10 |
17, 17, 17
|
tRNAs |
108 |
83 |
105
|
ncRNAs |
4 |
4 |
4
|
Pseudo Genes (total) |
107 |
76 |
41
|
Pseudo Genes (ambiguous residues) |
0 of 107 |
0 of 76 |
0 of 41
|
Pseudo Genes (frameshifted) |
60 of 107 |
42 of 76 |
4 of 41
|
Pseudo Genes (incomplete) |
35 of 107 |
30 of 76 |
18 of 41
|
Pseudo Genes (internal stop) |
31 of 107 |
18 of 76 |
22 of 41
|
Pseudo Genes (multiple problems) |
18 of 107 |
12 of 76 |
3 of 41
|
CRISPR Arrays |
4 |
9 |
-
|
|
|
|
Décompte du 19.11.19 |
|
|
|
hypothetical protein |
609 |
523 |
1 256
|
hp / cds (total) |
0,16 |
0,14 |
0,37
|
cdc8 remarques
- Lien noms abrégés
- Liens pour ce chapitre: noms abrégés opérons cumuls blocs cdc8 cdc psor 43 cdc8 cdc psor 18 cdc8 cdc psor 9 Alignement sur cdc Alignement sur cdc8.
- Remarques des 7 @ dans opérons :
- @ Dans la comparaison cdc8-cdc du bloc à 18aas, les rRNAs 23s et 16s disparaissent. Les 4 cds récupérés et le 23s° (voir opérons pour les noms et les longueurs des cds)
- - correspondraient à la somme des longueurs de 16s (1500 pbs) et 23s (2900 pbs), soit 4400 pbs
- - correspondraient à la longueur totale entre le 1er cds et le 5s, 4304299-4299490 = 4810 pbs
- - la somme des 4 cds récupérés et du 23s° est de 3875 pbs. Les longueurs des cds en aas sont dans l'ordre 215 153 580 68.
- - Le plus intéressant c'est que, si on suppose que les 2 protéines hypothétiques 580 et 68 sont dues aux remaniements,
- - les 2 protéines qui les précèdent sont qualifiées de type intégrase et de protéine contenant un domaine. C'est comme si les remaniements (certainement des conversions géniques) utilisaient une partie d'un gène protéique comme matrice de copie.
- @ configuration de bloc peu courante, avec gga: même bloc que cdc et psor.
- @ configuration de bloc peu courante, avec aca, et perte de 5s: même bloc que cdc et psor sans 5s.
- @ On retrouve le groupe1 de psor, avec 2 gca: VII1 en comp suivi de VIII1 en dir
- - L’intercalaire 23s-gca de VII1 est de 375, beaucoup plus élevé que celui de psor , 114.
- - De même pour VIII1, 248 contre 114.
- @ Conservation du bloc tcc-ncRNA dans cdc8 cdc et psor, avec les mêmes intercalaires.
- @ Conservation des 3 cds , avec leurs intercalaires, du seul groupe de cdc, mais les gca disparaissent.
- @ Nouveau bloc analogue au VI1 et VII1 de psor, sans gca, et qui n’existe pas chez cdc: 16s23s5s-tta-atgi. Avec ces 2 dernières remarques c'est comme si les remaniements des blocs à RNA consistaient à supprimer les gca des blocs 16sgca23s5s, et en le faisant ils laissaient des morceaux de 16s et 23s.
- Décompte des rRNAs de cdc8 d'après Alignement sur cdc8.
Les RNAs
16s 14
16s’ 2
16s° 5
23s 9
23s’ 4
23s° 11
5s 14
taille d’un bloc normal
16s 16 1508 soit 10/14
23s 13 2900 soit 9/9
5s 14 117 soit 14/14
- Notes:
- - Les autres cds créés création de cds
- - Alignement sur cdc8: cdc8 résulte d'une recombinaison d'une clostridia de type cdc et d'une autre de type psor Alignement sur cdc8
- - Orientation des créations stats: soit création en masse par la mobilité et l'insertion des blocs 16s23s5s (cas de psor) puis dégradation de ces blocs dans une étape intermédiaire (cas de cdc8) qui aboutit à un état stable (cas de cdc), soit création par une évolution progressive de cdc vers psor en passant par cdc8. Le 1er cas serait soutenu la proportion très élevée des hp par rapport au total de 37% (voir stats) alors que le 2ème cas serait soutenu par par le type IV4 de cluster dans cdc8 et n'existe ni dans cdc ni dans psor, 16s23s5s-tta-atgi (voir alignement sur cdc8).
- - Les 3 types de création: avec altération des rRNAs (cdc8), dans les blocs 16s23s5s ou 16s-aaas-23s5s (décompte des cds dans un échantillon de clostridia) et après les blocs à la suite des tRNAs ou non (psor opérons).
- - Hypothèse de la création des gènes [8]
cdc8 distribution
- Lien tableur: cdc8 distribution
- Notes: Tableau Cl32
- - -5s: gga et aca
- - 1-3: 2 tta et 2 atgi
Cl3 cdc8, Peptoclostridium difficile M68. clostridia.
Cl31 cdc. La distribution des tRNAs sans rRNA.
g1 |
|
t1 |
|
|
|
|
|
a atgi |
|
a tct |
|
tat |
|
atgf |
|
b att |
|
i act |
|
aat |
|
agt |
|
c ctt |
|
e cct |
|
cat |
|
cgc |
|
d gtt |
|
m gct |
|
gat |
|
ggt |
|
e ttc |
|
b tcc |
1 |
tac |
|
tgc |
|
f atc |
|
j acc |
|
aac |
|
agc |
1
|
g ctc |
|
f ccc |
|
cac |
|
cgt |
|
h gtc |
|
n gcc |
|
gac |
|
ggc |
|
i tta |
|
c tca |
|
taa |
|
tga |
|
j ata |
|
k aca |
1 |
aaa |
1 |
aga |
|
k cta |
1 |
g cca |
|
caa |
|
cga |
|
l gta |
1 |
o gca |
|
gaa |
1 |
gga |
|
m ttg |
1 |
d tcg |
|
tag |
|
tgg |
|
n atgj |
|
l acg |
|
aag |
|
agg |
1
|
o ctg |
|
h ccg |
|
cag |
|
cgg |
|
p gtg |
|
p gcg |
|
gag |
|
ggg |
|
clos |
>1aa |
=1aa |
-5s |
+5s |
-16s |
+16s |
total
|
cdc8 |
4 |
5* |
|
|
|
|
9
|
|
Cl32 psor. La distribution des tRNAs avec rRNA.
g1 |
|
t1 |
|
|
|
|
|
a atgi |
5 |
a tct |
|
tat |
|
atgf |
4
|
b att |
|
i act |
|
aat |
|
agt |
|
c ctt |
|
e cct |
|
cat |
|
cgc |
|
d gtt |
|
m gct |
|
gat |
|
ggt |
|
e ttc |
4 |
b tcc |
|
tac |
4 |
tgc |
2
|
f atc |
1 |
j acc |
|
aac |
5 |
agc |
1
|
g ctc |
|
f ccc |
|
cac |
3 |
cgt |
1
|
h gtc |
|
n gcc |
|
gac |
5 |
ggc |
2
|
i tta |
6 |
c tca |
4 |
taa |
|
tga |
|
j ata |
|
k aca |
5 |
aaa |
5 |
aga |
5
|
k cta |
3 |
g cca |
4 |
caa |
4 |
cga |
|
l gta |
6 |
o gca |
4 |
gaa |
5 |
gga |
6
|
m ttg |
|
d tcg |
|
tag |
|
tgg |
1
|
n atgj |
4 |
l acg |
|
aag |
|
agg |
|
o ctg |
|
h ccg |
|
cag |
|
cgg |
|
p gtg |
|
p gcg |
|
gag |
|
ggg |
|
clos |
>1aa |
=1aa |
-5s |
+5s |
-16s |
+16s |
total
|
cdc8 |
|
|
2* |
93* |
|
4 |
99
|
|
Clostridium botulinum CDC_297
- Notes: Il n'y a pas de code KEGG pour ce génome, je lui ai donné le code cbc*, mais pour les têtes de chapitre je mets cbc.
cbc opérons
- Lien tableur: cbc* opérons
- Liens: gtRNAdb [9], NCBI [10], génome
- Phylogénie: Bacteria; Firmicutes; Clostridia; Clostridiales; Clostridiaceae;Clostridium.
- Légende:
- - cyan pour les doubles signalés par le signe + dans la colonne doubles.
- - cds, ce cds a la particularité d'être très court et collé au cluster à rRNA. Il fait 108 pbs et sa séquence est,
MNEGCDRILIVVARWQVSKNKKMLTKIKKRATIIKH.
- - @ voir le chapitre remarques de ce génome.
C4. Clostridium botulinum CDC_297
28%GC |
30.6.19 Paris |
52 |
doubles |
intercal |
aa |
avec aa
|
comp |
1309334..1309408 |
gag |
|
|
|
|
|
|
|
|
|
|
|
comp |
1385938..1386012 |
aac |
|
8 |
|
|
comp |
1386021..1386134 |
5s |
|
108 |
|
|
comp |
1386243..1389140 |
23s |
|
228 |
|
|
comp |
1389369..1390866 |
16s |
@1 |
|
|
|
|
|
|
|
|
|
|
comp |
1392997..1393072 |
ttc |
|
7 |
|
|
comp |
1393080..1393193 |
5s |
|
108 |
|
|
comp |
1393302..1396199 |
23s |
|
228 |
|
|
comp |
1396428..1397925 |
16s |
|
|
|
|
|
|
|
|
|
|
|
comp |
1408673..1408762 |
tcc |
|
|
|
|
|
|
|
|
|
|
|
comp |
1412183..1412259 |
agg |
|
|
|
|
|
|
|
|
|
|
|
comp |
1415464..1415540 |
cgt |
|
84 |
84 |
|
comp |
1415625..1415715 |
agc |
+ |
20 |
20 |
|
comp |
1415736..1415826 |
tca |
2 agc |
306 |
306 |
|
comp |
1416133..1416223 |
agc |
2 tca |
20 |
20 |
|
comp |
1416244..1416334 |
tca |
@4 |
|
|
|
|
|
|
|
|
|
|
comp |
1425969..1426044 |
gca |
|
3 |
|
3
|
comp |
1426048..1426124 |
atgi |
|
8 |
|
|
comp |
1426133..1426246 |
5s |
|
79 |
|
|
comp |
1426326..1427823 |
16s |
@2 |
117 |
|
|
comp |
1427941..1428051 |
cds |
|
|
|
|
|
|
|
|
|
|
|
|
1694943..1695017 |
cag |
|
|
|
|
|
|
|
|
|
|
|
comp |
1722580..1722664 |
tac |
|
5 |
5 |
|
comp |
1722670..1722745 |
aca |
|
|
|
|
|
|
|
|
|
|
|
comp |
1841437..1841510 |
tgc |
|
|
|
|
|
|
|
|
|
|
|
comp |
1842698..1842811 |
5s |
|
108 |
|
|
comp |
1842920..1845817 |
23s |
|
228 |
|
|
comp |
1846046..1847543 |
16s |
|
|
|
|
|
|
|
|
|
|
|
|
1890534..1890608 |
gaa |
+ |
17 |
17 |
|
|
1890626..1890701 |
gta |
3 gaa |
9 |
9 |
|
|
1890711..1890787 |
gac |
3 gta |
4 |
4 |
|
|
1890792..1890867 |
aca |
3 gac |
5 |
5 |
|
|
1890873..1890947 |
gaa |
2 aca |
18 |
18 |
|
|
1890966..1891041 |
gta |
|
7 |
7 |
|
|
1891049..1891125 |
gac |
|
57 |
57 |
|
|
1891183..1891257 |
gaa |
|
17 |
17 |
|
|
1891275..1891350 |
gta |
|
9 |
9 |
|
|
1891360..1891436 |
gac |
|
4 |
4 |
|
|
1891441..1891516 |
aca |
|
|
|
|
|
|
|
|
|
|
|
comp |
1948153..1948228 |
cca |
|
|
|
|
|
|
|
|
|
|
|
|
1969157..1969245 |
tta |
|
4 |
4 |
|
|
1969250..1969325 |
atgf |
+ |
53 |
53 |
|
|
1969379..1969454 |
atgf |
2 atgf |
10 |
10 |
|
|
1969465..1969541 |
atg |
|
|
|
|
|
|
|
|
|
|
|
|
1987541..1989040 |
16s |
@3 |
226 |
|
|
|
1989267..1992166 |
23s |
|
93 |
|
|
|
1992260..1992375 |
5s |
|
7 |
|
|
|
1992383..1992457 |
aac |
+ |
27 |
|
27
|
|
1992485..1992559 |
aac |
|
|
|
|
|
|
|
|
|
|
|
|
2013239..2013313 |
ggg |
|
18 |
18 |
|
|
2013332..2013407 |
acc |
|
|
|
|
|
|
|
|
|
|
|
|
2222515..2222590 |
tgg |
|
|
|
|
|
|
|
|
|
|
|
|
2294767..2294842 |
cca |
+ |
7 |
7 |
|
|
2294850..2294923 |
gga |
2 cca |
6 |
6 |
|
|
2294930..2295006 |
aga |
2 gga |
5 |
5 |
|
|
2295012..2295087 |
aag |
|
26 |
26 |
|
|
2295114..2295189 |
cca |
|
29 |
29 |
|
|
2295219..2295292 |
gga |
|
24 |
24 |
|
|
2295317..2295393 |
cga |
|
|
|
|
|
|
|
|
|
|
|
|
2402556..2402631 |
gta |
|
5 |
5 |
|
|
2402637..2402713 |
gac |
|
3 |
3 |
|
|
2402717..2402792 |
ttc |
|
4 |
4 |
|
|
2402797..2402871 |
ggc |
|
9 |
9 |
|
|
2402881..2402954 |
tgc |
|
|
|
|
|
|
|
|
|
|
|
|
2517305..2517391 |
ttg |
|
|
|
|
|
|
|
|
|
|
|
|
2548708..2548792 |
ctc |
|
|
|
|
|
|
|
|
|
|
|
|
2583298..2583388 |
tga |
|
|
|
|
cbc cumuls
C4. cumuls. Clostridium botulinum CDC_297
opérons |
Fréquences intercalaires tRNAs
|
|
|
effectif |
gammes |
sans rRNAs |
avec rRNAs
|
avec rRNA |
opérons |
5 |
1 |
0 |
0
|
|
16 23 5s 0 |
1 |
20 |
22 |
1
|
|
16 atc gca |
0 |
40 |
3 |
1
|
|
16 23 5s a |
3 |
60 |
2 |
0
|
|
max a |
2 |
80 |
0 |
0
|
|
a doubles |
1 |
100 |
1 |
0
|
|
spéciaux |
1 |
120 |
0 |
0
|
|
total aas |
6 |
140 |
0 |
0
|
sans |
opérons |
17 |
160 |
0 |
0
|
|
1 aa |
10 |
180 |
0 |
0
|
|
max a |
11 |
200 |
0 |
0
|
|
a doubles |
4 |
|
0 |
0
|
|
total aas |
46 |
|
28 |
2
|
total aas |
|
52 |
|
|
|
remarques |
|
4 |
|
|
|
avec jaune |
|
|
moyenne |
17 |
15
|
|
|
|
variance |
19 |
|
sans jaune |
|
|
moyenne |
15 |
|
|
|
|
variance |
14 |
|
cbc blocs
C4. Clostridium botulinum CDC_297, cbc* blocs
aac |
8 |
7 |
- |
|
5s |
108 |
108 |
108 |
226
|
23s |
228 |
228 |
228 |
93
|
16s |
|
|
- |
7
|
|
|
|
|
|
gca |
3 |
|
|
|
atgi |
8 |
|
|
|
5s |
79 |
|
|
|
16s |
|
|
|
|
cbc remarques
@1 Les 4 blocs 16.23.5.aa ont des intercalaires identiques à 1 base près.
- 1 a 0aa, 2 ont 1aa et 1 a 2aas (@3.
@2 C’est 1 bloc 16.23.5.aa qui a perdu 23s.
- L'intercalaire 5s-aa est le même que pour les 4 blocs de @1.
- Il a 2aas dont le 1er est atgi, rare avec les rRNAs.
- Il est précédé d'une protéine de 36aas avec un intercalaire de 117.
- Est-ce qu'elle appartient à l'opéron?
@3 C’est 1 bloc 16.23.5.aa de @1 avec 1 aa double.
- L'intercalaire 23-5 est très faible, 14% de moins par rapport à @1, 15/108.
@4 Dépassement de la règle des intercalaires, 210 bases, 306.
- Il se trouve entre 2 séquences de 2 aas.
- Est-ce 2 opérons?
Séquences des doubles :
- 1 opéron à 1 doublet.
- 2 opérons à 2 séquences de 2 aas chacun.
- 1 opéron de 11 aas avec 4 séquences de 3 aas, moins 1 aa.
cbc distribution
- Lien tableur: cbc distribution
- Notes:
- - 1-3aas: gca atgi aac ttc aac2
- - >1aa: atgf2
Cl4 cbc. Clostridium botulinum CDC_297 . clostridia.
g1 |
|
t1 |
|
|
|
|
|
a atgi |
1 |
a tct |
|
tat |
|
atgf |
2
|
b att |
|
i act |
|
aat |
|
agt |
|
c ctt |
|
e cct |
|
cat |
|
cgc |
|
d gtt |
|
m gct |
|
gat |
|
ggt |
|
e ttc |
2 |
b tcc |
1 |
tac |
1 |
tgc |
2
|
f atc |
|
j acc |
1 |
aac |
3 |
agc |
2
|
g ctc |
1 |
f ccc |
|
cac |
|
cgt |
1
|
h gtc |
|
n gcc |
|
gac |
4 |
ggc |
1
|
i tta |
1 |
c tca |
2 |
taa |
|
tga |
1
|
j ata |
|
k aca |
3 |
aaa |
|
aga |
1
|
k cta |
|
g cca |
3 |
caa |
|
cga |
1
|
l gta |
4 |
o gca |
1 |
gaa |
3 |
gga |
2
|
m ttg |
1 |
d tcg |
|
tag |
|
tgg |
1
|
n atgj |
1 |
l acg |
|
aag |
1 |
agg |
1
|
o ctg |
|
h ccg |
|
cag |
1 |
cgg |
|
p gtg |
|
p gcg |
|
gag |
1 |
ggg |
1
|
clos |
>1aa |
=1aa |
-5s |
+5s |
-16s |
+16s |
total
|
cbc* |
36 |
10 |
|
6* |
|
|
52
|
Clostridium botulinum BKT015925
cbn opérons
- Lien tableur: cbn opérons
- Liens: gtRNAdb [11], NCBI [12], génome
- Phylogénie: Bacteria; Firmicutes; Clostridia; Clostridiales; Clostridiaceae;Clostridium.
- Légende:
- - cyan pour les doubles signalés par le signe + dans la colonne doubles.
- - @ voir le chapitre remarques de ce génome.
C5. Clostridium botulinum BKT015925
28%GC |
30.6.19 Paris |
86 |
doubles |
intercal |
aa |
avec aa
|
|
20666..20741 |
acg |
|
|
|
|
|
|
|
|
|
|
|
|
36413..36487 |
gaa |
+ |
12 |
12 |
|
|
36500..36575 |
gta |
2 gaa |
13 |
13 |
|
|
36589..36665 |
gac |
2 gta |
5 |
5 |
|
|
36671..36746 |
aca |
2 gac |
18 |
18 |
|
|
36765..36839 |
gaa |
2 aca |
12 |
12 |
|
|
36852..36927 |
gta |
|
13 |
13 |
|
|
36941..37017 |
gac |
|
5 |
5 |
|
|
37023..37098 |
aca |
|
|
|
|
|
|
|
|
|
|
|
|
137366..137441 |
cca |
|
|
|
|
|
|
|
|
|
|
|
|
161964..162052 |
tta |
+ |
5 |
5 |
|
|
162058..162133 |
atgf |
3 tta |
5 |
5 |
|
|
162139..162215 |
atgj |
3 atgf |
46 |
46 |
|
|
162262..162350 |
tta |
2 atgj |
5 |
5 |
|
|
162356..162431 |
atgf |
|
30 |
30 |
|
|
162462..162538 |
atgj |
|
46 |
46 |
|
|
162585..162673 |
tta |
|
5 |
5 |
|
|
162679..162754 |
atgf |
|
|
|
|
|
|
|
|
|
|
|
|
76258..176332 |
aac |
|
|
|
|
|
|
|
|
|
|
|
|
180177..181695 |
16s |
@5 |
233 |
|
|
|
181929..184836 |
23s |
|
45 |
|
|
|
184882..184956 |
aac |
+ |
14 |
|
|
|
184971..185087 |
5s |
|
7 |
|
|
|
185095..185169 |
aac |
2 aac |
|
|
|
|
|
|
|
|
|
|
|
222409..222484 |
acc |
|
|
|
|
|
|
|
|
|
|
|
comp |
578417..578492 |
cag |
|
|
|
|
|
|
|
|
|
|
|
comp |
944747..944833 |
ttg |
|
|
|
|
|
|
|
|
|
|
|
|
955546..955630 |
ctt |
|
|
|
|
|
|
|
|
|
|
|
|
1026946..1027021 |
gta |
|
17 |
17 |
17
|
|
1027039..1027115 |
gac |
|
14 |
14 |
14
|
|
1027130..1027205 |
ttc |
|
4 |
4 |
4
|
|
1027210..1027284 |
ggc |
|
8 |
8 |
8
|
|
1027293..1027367 |
tgc |
+ |
57 |
57 |
57
|
|
1027425..1027499 |
tgc |
2 tgc |
|
|
|
|
|
|
|
|
|
|
comp |
2030816..2030890 |
aac |
|
45 |
|
|
comp |
2030936..2033842 |
23s |
|
96 |
|
|
comp |
2033939..2034015 |
atc |
|
7 |
|
7
|
comp |
2034023..2034098 |
gca |
|
121 |
|
|
comp |
2034220..2035734 |
16s |
|
|
|
|
|
|
|
|
|
|
|
comp |
2283768..2283884 |
5s |
|
95 |
|
|
comp |
2283980..2286886 |
23s |
|
233 |
|
|
comp |
2287120..2288638 |
16s |
@3 |
464 |
|
|
comp |
2289103..2289176 |
gga |
|
15 |
|
15
|
comp |
2289192..2289268 |
atc |
|
7 |
|
7
|
comp |
2289276..2289351 |
gca |
|
|
|
|
|
|
|
|
|
|
|
comp |
2350598..2350674 |
cga |
+ |
21 |
21 |
|
comp |
2350696..2350769 |
gga |
4 gga |
28 |
28 |
|
comp |
2350798..2350873 |
aaa |
2 aaa |
4 |
4 |
|
comp |
2350878..2350952 |
caa |
2 caa |
4 |
4 |
|
comp |
2350957..2351032 |
cac |
2 cac |
5 |
5 |
|
comp |
2351038..2351112 |
aag |
3 aag |
3 |
3 |
|
comp |
2351116..2351192 |
aga |
3 aga |
6 |
6 |
|
comp |
2351199..2351272 |
gga |
2 cca |
4 |
4 |
|
comp |
2351277..2351352 |
cca |
2 ggc |
21 |
21 |
|
comp |
2351374..2351449 |
aag |
|
5 |
5 |
|
comp |
2351455..2351531 |
aga |
|
5 |
5 |
|
comp |
2351537..2351610 |
gga |
|
5 |
5 |
|
comp |
2351616..2351690 |
ggc |
|
3 |
3 |
|
comp |
2351694..2351777 |
cta |
|
22 |
22 |
|
comp |
2351800..2351875 |
aaa |
|
4 |
4 |
|
comp |
2351880..2351954 |
caa |
|
4 |
4 |
|
comp |
2351959..2352034 |
cac |
|
5 |
5 |
|
comp |
2352040..2352115 |
aag |
|
5 |
5 |
|
comp |
2352121..2352197 |
aga |
|
5 |
5 |
|
comp |
2352203..2352276 |
gga |
|
5 |
5 |
|
comp |
2352282..2352356 |
ggc |
|
6 |
6 |
|
comp |
2352363..2352438 |
cca |
|
|
|
|
|
|
|
|
|
|
|
comp |
2432784..2432859 |
tgg |
|
|
|
|
|
|
|
|
|
|
|
comp |
2454880..2454964 |
tac |
+ |
39 |
39 |
|
comp |
2455004..2455079 |
gta |
2 tac |
8 |
8 |
|
comp |
2455088..2455172 |
tac |
|
4 |
4 |
|
comp |
2455177..2455252 |
aca |
|
|
|
|
|
|
|
|
|
|
|
comp |
2697795..2697911 |
5s |
@1 |
31 |
|
|
comp |
2697943..2700847 |
23s |
|
233 |
|
|
comp |
2701081..2702599 |
16s |
|
|
|
|
|
|
|
|
|
|
|
comp |
2703946..2704021 |
aaa |
|
311 |
|
311
|
comp |
2704333..2704408 |
ttc |
|
5 |
|
|
comp |
2704414..2704530 |
5s |
|
336 |
|
|
comp |
2704867..2704942 |
ttc |
|
5 |
|
|
comp |
2704948..2705064 |
5s |
|
97 |
|
|
comp |
2705162..2708066 |
23s |
|
233 |
|
|
comp |
2708300..2709814 |
16s |
|
|
|
|
|
|
|
|
|
|
|
comp |
2721253..2721328 |
aaa |
@2 |
5 |
|
|
comp |
2721334..2721450 |
5s |
|
95 |
|
|
comp |
2721546..2724452 |
23s |
|
233 |
|
|
comp |
2724686..2726203 |
16s |
|
|
|
|
|
|
|
|
|
|
|
comp |
2731902..2731976 |
gag |
|
61 |
|
61
|
comp |
2732038..2732112 |
caa |
|
6 |
|
6
|
comp |
2732119..2732195 |
aga |
|
4 |
|
4
|
comp |
2732200..2732273 |
gga |
|
19 |
|
19
|
comp |
2732293..2732376 |
cta |
|
16 |
|
16
|
comp |
2732393..2732467 |
gaa |
|
4 |
|
|
comp |
2732472..2732588 |
5s |
|
97 |
|
|
comp |
2732686..2735592 |
23s |
@4 |
94 |
|
|
comp |
2735687..2735763 |
atc |
|
3 |
|
|
comp |
2735767..2735842 |
gca |
|
74 |
|
|
comp |
2735917..2737435 |
16s |
|
|
|
|
|
|
|
|
|
|
|
comp |
2742262..2742351 |
tcc |
|
|
|
|
|
|
|
|
|
|
|
comp |
2743220..2743312 |
tcg |
|
|
|
|
|
|
|
|
|
|
|
comp |
2743891..2743967 |
agg |
|
|
|
|
|
|
|
|
|
|
|
comp |
2748534..2748610 |
cgt |
|
144 |
144 |
|
comp |
2748755..2748845 |
agc |
|
23 |
23 |
|
comp |
2748869..2748959 |
tca |
+ |
69 |
69 |
|
comp |
2749029..2749119 |
tca |
2 tca |
|
|
|
|
|
|
|
|
|
|
comp |
2758688..2758763 |
gca |
|
4 |
|
4
|
comp |
2758768..2758844 |
atgi |
|
3 |
|
|
comp |
2758848..2758964 |
5s |
|
73 |
|
|
comp |
2759038..2761942 |
23s |
|
233 |
|
|
comp |
2762176..2763694 |
16s |
|
|
|
|
|
|
|
|
|
|
|
comp |
2150504..2150620 |
5s |
|
31 |
|
|
comp |
2150652..2153560 |
23s |
|
233 |
|
|
comp |
2153794..2155308 |
16s |
|
|
|
|
|
|
|
|
|
|
|
comp |
2169525..2169641 |
5s |
|
32 |
|
|
comp |
2169674..2172579 |
23s |
|
233 |
|
|
comp |
2172813..2174331 |
16s |
|
|
|
|
|
|
|
|
|
|
|
sur plasmide |
|
tgg |
|
|
|
|
cbn cumuls
C5. cumuls. Clostridium botulinum BKT015925
opérons |
Fréquences intercalaires tRNAs
|
|
|
effectif |
gammes |
sans rRNAs |
avec rRNAs
|
avec rRNA |
opérons |
10 |
1 |
0 |
0
|
|
16 23 5s 0 |
3 |
20 |
34 |
9
|
|
16 gca atc |
2 |
40 |
7 |
0
|
|
16 23 5s a |
4 |
60 |
3 |
0
|
|
max a |
8 |
80 |
1 |
1
|
|
a doubles |
1 |
100 |
0 |
0
|
|
spéciaux |
1 |
120 |
0 |
0
|
|
total aas |
22 |
140 |
0 |
0
|
sans |
opérons |
18 |
160 |
1 |
0
|
|
1 aa |
12 |
180 |
0 |
0
|
|
max a |
22 |
200 |
0 |
0
|
|
a doubles |
6 |
|
0 |
0
|
|
total aas |
64 |
|
46 |
10
|
total aas |
|
86 |
|
|
|
remarques |
|
5 |
|
|
|
avec jaune |
|
|
moyenne |
17 |
|
|
|
|
variance |
25 |
|
sans jaune |
|
|
moyenne |
14 |
14
|
|
|
|
variance |
15 |
17
|
cbn blocs
C5. Clostridium botulinum BKT015925, cbn blocs
5s |
31 |
31 |
32 |
|
|
|
23s |
233 |
233 |
233 |
|
|
|
16s |
|
|
|
|
|
|
|
|
|
|
|
ttc |
5
|
|
|
|
|
|
5s |
336
|
aaa |
5 |
3 |
|
|
ttc |
5
|
5s |
95 |
73 |
5s |
95 |
5s |
97
|
23s |
233 |
233 |
23s |
233 |
23s |
233
|
16s |
aaa |
atgi |
16s |
464 |
16s |
|
|
|
|
gga |
15 |
|
|
16s |
233 |
|
|
|
|
|
23s |
45 |
|
|
|
|
|
aac |
14 |
|
|
|
|
|
5s |
7 |
|
|
|
|
|
aac |
|
|
|
|
|
|
gaa |
4 |
|
|
|
|
|
5s |
97 |
aac |
45 |
|
|
|
23s |
94 |
23s |
96 |
|
|
|
atc |
3 |
atc |
7 |
|
|
|
gca |
74 |
gca |
121 |
|
|
|
16s |
|
16s |
|
|
|
|
cbn remarques
*Remarques
@1 Les 3 opérons 16-23-5s ont les mêmes intercalaires, 233-31 bases.
@2 Les 4 opérons 16-23-5s -aa ont tous à peu près les mêmes intercalaires 233-95-5.
- Mais ils sont tous différents:
+ 1 seul opéron répond au critère des intercalaires, il a 1aa.
+ 1 seul opéron ne répond pas strictement au critère des intercalaires.
Ses 3aas sont du côté du 16s et l’intercalaire avec le 1er aa est très
Élevé, 464.
+ L'opéron à 2aas a l'intercalaire 23-5s très faible de 23% inférieur à 95, 22/95.
+ L'opéron à 3aas répondant aux critères a un 5s en plus.
@3 Le critère d’un intercalaire entre 2aas, supérieur à 210 bases, se trouve
dans le 4ème opéron à rRNA, mais il est accompagné d’un intercalaire très
élevé entre 5s et le 1er aa, comme pour le 2ème opéron à rRNA.
@4 C’est un opéron à rRNA atypique : 2aas double entourant le 5s.
- Mais coserve l’intercalaire 16-23s de 233 bases comme les 7 opérons de ce type.
@5 Les 2 opérons à 16-atc gca présentent, ici, la particularité d’inverser ses 2 aas, gca-atc.
- Ils ont aussi, à peu près, les mêmes intercalaires 16-gca-atc-23s, 74 4 94.
- L'opéron à rRNA présentant le max d'aas, au nombre de 8, est de ce type.
Il a le même intercalaire 23-5s que tous les autres opérons à rRNA, 97 bases.
*Séquences des doubles : tous les opérons à plus de 3aas ont des doubles, 6/6.
- Les répétitions vont de 5 à 2.
- 3 opérons sur 6 ont des séquences qui se répètent, avec 22aas et 2 avec 8aas.
- L'opéron contenant le max d'aas, 22, a 2 séquences de 6 aas qui se répètent.
- On peut repérer dans cet opéron d'autres séquences de 3 aas.
- Ces séquences sont séparées par 1 ou 2 aas différents.
cbn distribution
- Lien tableur: cbn distribution
- Notes:
- - Tableau Cl51: gca, 1-3aas et -16s. aac, 1aa et 1-3aas.
- - Tableau Cl52: 4-8aas, gag caa aga gga cta gaa. >1aa, tgc2 et tca2 en gras.
Cl5 cbn, Clostridium botulinum BKT015925. clostridia.
Cl51 cbc. 1aa -16s 1-3aas. clostridia.
g1 |
|
t1 |
|
|
|
|
|
a atgi |
1 |
a tct |
|
tat |
|
atgf |
|
b att |
|
i act |
|
aat |
|
agt |
|
c ctt |
1 |
e cct |
|
cat |
|
cgc |
|
d gtt |
|
m gct |
|
gat |
|
ggt |
|
e ttc |
2 |
b tcc |
1 |
tac |
|
tgc |
|
f atc |
1 |
j acc |
1 |
aac |
2 |
agc |
|
g ctc |
|
f ccc |
|
cac |
|
cgt |
|
h gtc |
|
n gcc |
|
gac |
|
ggc |
|
i tta |
|
c tca |
|
taa |
|
tga |
|
j ata |
|
k aca |
|
aaa |
2 |
aga |
|
k cta |
|
g cca |
1 |
caa |
|
cga |
|
l gta |
|
o gca |
2 |
gaa |
|
gga |
1
|
m ttg |
1 |
d tcg |
1 |
tag |
|
tgg |
2
|
n atgj |
|
l acg |
1 |
aag |
|
agg |
1
|
o ctg |
|
h ccg |
|
cag |
1 |
cgg |
|
p gtg |
|
p gcg |
|
gag |
|
ggg |
|
clos |
>1aa |
=1aa |
-5s |
+5s |
-16s |
+16s |
total
|
cbn |
|
12 |
|
7* |
3* |
|
22
|
|
Cl52 cbn. >1aa -5s 4-8aas +16s.
g1 |
|
t1 |
|
|
|
|
|
a atgi |
|
a tct |
|
tat |
|
atgf |
3
|
b att |
|
i act |
|
aat |
|
agt |
|
c ctt |
|
e cct |
|
cat |
|
cgc |
|
d gtt |
|
m gct |
|
gat |
|
ggt |
|
e ttc |
1 |
b tcc |
|
tac |
2 |
tgc |
2
|
f atc |
2 |
j acc |
|
aac |
2 |
agc |
1
|
g ctc |
|
f ccc |
|
cac |
2 |
cgt |
1
|
h gtc |
|
n gcc |
|
gac |
3 |
ggc |
3
|
i tta |
3 |
c tca |
2 |
taa |
|
tga |
|
j ata |
|
k aca |
3 |
aaa |
2 |
aga |
4
|
k cta |
2 |
g cca |
2 |
caa |
3 |
cga |
1
|
l gta |
4 |
o gca |
2 |
gaa |
3 |
gga |
5
|
m ttg |
|
d tcg |
|
tag |
|
tgg |
|
n atgj |
2 |
l acg |
|
aag |
3 |
agg |
|
o ctg |
|
h ccg |
|
cag |
|
cgg |
|
p gtg |
|
p gcg |
|
gag |
1 |
ggg |
|
clos |
>1aa |
=1aa |
-5s |
+5s |
-16s |
+16s |
total
|
cbn |
52 |
|
2* |
6* |
|
4 |
64
|
|
cbn intercalaires entre cds
- Lien NCBI [13]
- Note: Pour les génomes des annexes j'ai relevé les intercalaires entre tRNAs et entre ceux-ci et les cds qui leur sont adjacents. L'exemple est celui de rru du clade alpha. L'idée de départ de ces prélèvements est la recherche d'opérons formés de tRNA et de protéine comme dans le cas d'E.coli: l'intercalaire entre le tRNA et la protéine devrait être faible. Voir l'exemple d'eco (remarque @3) avec tac-tac-tpr et aca-tac-gga-acc-tufB.
Fréquences: gammes, moyennes et variances
intercalaires total % intercalaires moyenne ecartype plage ADN
négatif 176 7.0 négatif -11 10 -1 à -47 2,773,157
zéro 11 0.4 intercals
1 à 200 1767 70 0 à 200 75 58 385,308
201 à 370 399 16 201 à 370 266 48 14%
371 à 600 122 4.8 371 à 600 465 65 12%
601 à max 46 1.8 601 à 1702 879 275
Total 2521 Total 2510 130 154 -47 à 1702
cbn les fréquences
- Lien tableur: cbn intercalaires entre cds
- Légende: long, longueur en pbs.
- - 16s, 23s5s, blocs à rRNAs seuls.Voir cbn opérons pour leurs intercalaires
- - agc, aaa-atc, blocs à tRNAs seuls. Voir cbn opérons pour leurs intercalaires
cbn Les fréquences des intercalaires entre cds
adresse |
intercal |
inter-gène |
long |
intercal |
fréquence |
cumul/% |
intercal |
fréquence
|
2703019 |
6394 |
16s 4aas |
5865 |
-70 |
0 |
|
0 |
11
|
2730964 |
6177 |
|
|
-60 |
0 |
|
-1 |
34
|
178351 |
5877 |
|
|
-50 |
0 |
|
-2 |
0
|
2758098 |
5497 |
|
|
-40 |
4 |
|
-3 |
0
|
2168490 |
5496 |
|
|
-30 |
4 |
min à -1 |
-4 |
28
|
2029941 |
5442 |
|
|
-20 |
21 |
176 |
-5 |
0
|
2720030 |
5420 |
|
|
-10 |
47 |
7% |
-6 |
1
|
2696774 |
5354 |
|
|
0 |
111 |
|
-7 |
5
|
2149914 |
5353 |
|
|
10 |
182 |
|
-8 |
31
|
2281037 |
5111 |
16s |
4856 |
20 |
214 |
|
-9 |
1
|
2349136 |
2113 |
22aas |
1840 |
30 |
166 |
|
-10 |
6
|
1679540 |
1702 |
néant |
|
40 |
114 |
|
-11 |
15
|
624731 |
1443 |
néant |
|
50 |
94 |
|
-12 |
1
|
161395 |
1429 |
8aas |
791 |
60 |
95 |
|
-13 |
2
|
834812 |
1270 |
néant |
|
70 |
97 |
|
-14 |
7
|
1865810 |
1270 |
pseudo |
1136 |
80 |
70 |
|
-15 |
0
|
1025682 |
1198 |
6aas |
553 |
90 |
72 |
|
-16 |
3
|
1909773 |
1149 |
néant |
|
100 |
86 |
|
-17 |
11
|
34861 |
1099 |
8aas |
686 |
110 |
54 |
|
-18 |
0
|
1395656 |
1025 |
néant |
|
120 |
66 |
|
-19 |
2
|
1366434 |
952 |
néant |
|
130 |
74 |
|
-20 |
7
|
2453380 |
952 |
4aas |
373 |
140 |
54 |
|
-21 |
1
|
2662601 |
856 |
néant |
|
150 |
61 |
|
-22 |
1
|
1385645 |
836 |
néant |
|
160 |
52 |
|
-23 |
2
|
754437 |
826 |
néant |
|
170 |
64 |
1 à 200 |
-24 |
0
|
1803918 |
777 |
néant |
|
180 |
52 |
1767 |
-25 |
1
|
1826878 |
759 |
néant |
|
190 |
54 |
70% |
-26 |
2
|
1307165 |
753 |
néant |
|
200 |
46 |
|
-27 |
1
|
627889 |
751 |
|
|
210 |
39 |
|
-28 |
1
|
1388755 |
748 |
|
|
220 |
41 |
|
-29 |
5
|
2579132 |
747 |
|
|
230 |
43 |
|
-30 |
0
|
1789056 |
745 |
|
|
240 |
34 |
|
-31 |
1
|
2746633 |
742 |
|
|
250 |
28 |
|
-32 |
1
|
1830367 |
730 |
|
|
260 |
30 |
|
|
181
|
841754 |
723 |
|
|
270 |
21 |
|
reste |
6
|
1855513 |
710 |
|
|
280 |
15 |
|
|
187
|
2136552 |
703 |
|
|
290 |
19 |
|
|
|
|
|
|
|
300 |
32 |
|
600 |
2475
|
|
|
|
|
310 |
11 |
|
650 |
4
|
1144166 |
-47 |
shift 2g |
1795 |
320 |
12 |
|
700 |
5
|
369225 |
-46 |
shift 2g |
3395 |
330 |
17 |
|
750 |
8
|
1579583 |
-44 |
shift 2g |
487 |
340 |
16 |
201 à 370 |
800 |
4
|
430053 |
-41 |
|
|
350 |
13 |
399 |
850 |
2
|
1494403 |
-35 |
|
|
360 |
14 |
16% |
900 |
1
|
1957540 |
-35 |
|
|
370 |
14 |
|
950 |
0
|
733250 |
-32 |
|
|
380 |
14 |
|
1000 |
2
|
271633 |
-31 |
|
|
390 |
7 |
|
1050 |
1
|
913392 |
-29 |
|
|
400 |
9 |
|
1100 |
1
|
1503608 |
-29 |
|
|
410 |
5 |
|
1150 |
1
|
1620962 |
-29 |
|
|
420 |
6 |
|
1200 |
1
|
1725747 |
-29 |
|
|
430 |
4 |
|
1250 |
0
|
1823162 |
-29 |
|
|
440 |
2 |
|
1300 |
2
|
2449289 |
-28 |
|
|
450 |
8 |
|
1350 |
0
|
1086603 |
-27 |
|
|
460 |
6 |
|
1400 |
0
|
783920 |
-26 |
|
|
470 |
6 |
|
1450 |
2
|
2471206 |
-26 |
|
|
480 |
5 |
|
1500 |
0
|
2107067 |
-25 |
|
|
490 |
6 |
|
1550 |
0
|
292336 |
-23 |
|
|
500 |
8 |
|
1600 |
0
|
2553714 |
-23 |
|
|
510 |
6 |
|
1650 |
0
|
2686151 |
-22 |
|
|
520 |
1 |
|
1700 |
0
|
1577865 |
-21 |
|
|
530 |
1 |
|
1750 |
1
|
500363 |
-20 |
|
|
540 |
11 |
371 à 600 |
|
35
|
1136818 |
-20 |
|
|
550 |
2 |
122 |
|
|
1210782 |
-20 |
|
|
560 |
2 |
4.8% |
|
|
2249407 |
-20 |
|
|
570 |
4 |
|
|
|
2508380 |
-20 |
|
|
580 |
5 |
601 à max |
|
|
2619392 |
-20 |
|
|
590 |
2 |
46 |
|
|
2670513 |
-20 |
|
|
600 |
2 |
1.8% |
|
|
Clostridium lentocellum DSM 5427
cle opérons
- Lien tableur: cle opérons
- Liens: gtRNAdb, NCBI [14], génome
- Phylogénie: Bacteria; Firmicutes; Clostridia; Clostridiales; Lachnospiraceae;Cellulosilyticum.
- Légende:
- - cyan pour les doubles signalés par le signe + dans la colonne doubles.
- - @ voir le chapitre remarques de ce génome.
- Note: il n'y apas de gtRNAdb. Aussi j'ai comparé (EXACT NB.CAR STXT) les 1ers atgf atgi atgj du génome cdc, avec les atg de cle.
C6. Clostridium lentocellum DSM 5427
34.3%GC |
30.6.19 Paris |
104 |
doubles |
intercal |
aa |
avec aa
|
|
10157..10246 |
agc |
@1 |
202 |
|
|
|
10449..11981 |
16s |
|
72 |
|
|
|
12054..12171 |
5s |
|
4 |
|
|
|
12176..12248 |
gca |
|
262 |
|
|
|
12511..15414 |
23s |
|
55 |
|
|
|
15470..15543 |
gac |
|
61 |
|
61
|
|
15605..15677 |
gta |
|
7 |
|
7
|
|
15685..15757 |
aca |
|
34 |
|
34
|
|
15792..15872 |
tac |
|
12 |
|
12
|
|
15885..15961 |
atgj |
|
3 |
|
3
|
|
15965..16040 |
ttc |
|
3 |
|
3
|
|
16044..16116 |
aaa |
|
|
|
|
|
|
|
|
30118 |
|
|
|
46235..47767 |
16s |
@3 |
21284 |
|
|
|
|
|
|
|
|
|
|
69052..71964 |
23s |
|
|
|
|
|
|
|
|
4873 |
|
|
|
76838..78371 |
16s |
|
72 |
|
|
|
78444..78561 |
5s |
|
5 |
|
|
|
78567..78639 |
gca |
|
282 |
|
|
|
78922..81829 |
23s |
|
|
|
|
|
|
|
|
904 |
|
|
|
82734..82851 |
5s |
|
4 |
|
|
|
82856..82928 |
ggc |
|
|
|
|
|
|
|
|
1463 |
|
|
|
84392..85929 |
16s |
|
72 |
|
|
|
86002..86119 |
5s |
|
4 |
|
|
|
86124..86196 |
gca |
|
280 |
|
|
|
86477..89386 |
23s |
|
|
|
|
|
|
|
|
7380 |
|
|
|
96767..96884 |
5s |
|
89 |
|
|
|
96974..97047 |
ggc |
|
|
|
|
|
|
|
|
5082 |
|
|
|
102130..102204 |
cag |
|
|
|
|
|
|
|
|
|
|
|
|
104716..104799 |
tta |
|
13 |
13 |
|
|
104813..104898 |
tca |
|
|
|
|
|
|
|
|
|
|
|
|
141499..143034 |
16s |
|
138 |
|
|
|
143173..143290 |
5s |
|
7 |
|
|
|
143298..143374 |
atc |
|
258 |
|
|
|
143633..146538 |
23s |
|
|
|
|
|
|
|
|
|
|
|
|
150968..151085 |
5s |
@4 |
4 |
|
|
|
151090..151161 |
gaa |
|
457 |
|
|
|
151619..153160 |
16s |
|
605 |
|
|
|
153766..156671 |
23s |
|
475 |
|
|
|
157147..157219 |
aaa |
|
9 |
|
9
|
|
157229..157299 |
gga |
|
6 |
|
6
|
|
157306..157379 |
aga |
|
|
|
|
|
|
|
|
4223 |
|
|
|
161603..161720 |
5s |
|
4 |
|
|
|
161725..161797 |
ggc |
|
|
|
|
|
|
|
|
11104 |
|
|
|
172902..172973 |
gaa |
|
23 |
23 |
|
|
172997..173071 |
cca |
|
45 |
45 |
|
|
173117..173189 |
aaa |
|
11 |
11 |
|
|
173201..173274 |
gac |
|
56 |
56 |
|
|
173331..173403 |
gta |
|
7 |
7 |
|
|
173411..173494 |
tta |
|
187 |
187 |
|
|
173682..173754 |
aca |
|
26 |
26 |
|
|
173781..173861 |
tac |
|
10 |
10 |
|
|
173872..173948 |
atgj |
|
31 |
31 |
|
|
173980..174052 |
ttc |
|
|
|
|
|
|
|
|
248498 |
|
|
|
422551..424086 |
16s |
|
|
|
|
|
|
|
|
113898 |
|
|
|
537985..540890 |
23s |
|
|
|
|
|
|
|
|
25153 |
|
|
|
566044..566117 |
cac |
|
23 |
23 |
|
|
566141..566212 |
caa |
|
32 |
32 |
|
|
566245..566330 |
tca |
|
|
|
|
|
|
|
|
|
|
|
|
571984..573519 |
16s |
|
72 |
|
|
|
573592..573709 |
5s |
|
4 |
|
|
|
573714..573786 |
gca |
|
282 |
|
|
|
574069..576975 |
23s |
|
|
|
|
|
|
|
|
25302 |
|
|
|
602278..603812 |
16s |
|
137 |
|
|
|
603950..604067 |
5s |
|
|
|
|
|
|
|
|
11014 |
|
|
|
615082..617987 |
23s |
|
|
|
|
|
|
|
|
21159 |
|
|
|
639147..639362 |
16s° |
@5 |
|
|
|
|
|
|
|
98139 |
|
|
|
737502..737619 |
5s |
|
4 |
|
|
|
737624..737696 |
ggc |
|
|
|
|
|
|
|
|
3291 |
|
|
|
740988..741058 |
gga |
|
|
|
|
|
|
|
|
|
|
|
|
759839..759920 |
cta |
|
|
|
|
|
|
|
|
|
|
|
|
911999..912083 |
ctt |
+ |
148 |
148 |
|
|
912232..912316 |
ctt |
2 ctt |
|
|
|
|
|
|
|
|
|
|
|
1035192..1035265 |
cga |
|
|
|
|
|
|
|
|
|
|
|
|
1061152..1061225 |
agg |
|
|
|
|
|
|
|
|
|
|
|
comp |
1136376..1136448 |
ccc |
|
|
|
|
|
|
|
|
|
|
|
|
1229184..1230718 |
16s |
@2 |
72 |
|
|
|
1230791..1230908 |
5s |
|
7 |
|
|
|
1230916..1230989 |
atc |
|
53 |
|
53
|
|
1231043..1231115 |
gca |
|
261 |
|
|
|
1231377..1234282 |
23s |
|
110 |
|
|
|
1234393..1234464 |
aac |
+ |
9 |
|
9
|
|
1234474..1234545 |
gaa |
2 tgc |
6 |
|
6
|
|
1234552..1234622 |
tgc |
2 aac |
23 |
|
23
|
|
1234646..1234717 |
aac |
|
58 |
|
58
|
|
1234776..1234846 |
tgc |
|
|
|
|
|
|
|
|
|
|
|
|
1280211..1280283 |
atgf |
|
|
|
|
|
|
|
|
|
|
|
|
1283250..1283320 |
gga |
+ |
5 |
5 |
|
|
1283326..1283399 |
aga |
2 gga |
5 |
5 |
|
|
1283405..1283478 |
cac |
2 aga |
31 |
31 |
|
|
1283510..1283581 |
caa |
2 caa |
23 |
23 |
|
|
1283605..1283677 |
aaa |
|
30 |
30 |
|
|
1283708..1283792 |
cta |
|
23 |
23 |
|
|
1283816..1283886 |
gga |
|
5 |
5 |
|
|
1283892..1283965 |
aga |
|
6 |
6 |
|
|
1283972..1284043 |
caa |
|
|
|
|
|
|
|
|
|
|
|
|
1299560..1299632 |
ggc |
|
4 |
4 |
|
|
1299637..1299711 |
cca |
|
|
|
|
|
|
|
|
|
|
|
|
1346208..1346290 |
ctg |
|
|
|
|
|
|
|
|
|
|
|
|
1363346..1363428 |
ctg |
|
|
|
|
|
|
|
|
|
|
|
|
1515234..1515305 |
gaa |
|
62 |
62 |
|
|
1515368..1515442 |
cca |
|
22 |
22 |
|
|
1515465..1515537 |
aaa |
|
|
|
|
|
|
|
|
|
|
|
|
1597292..1597364 |
acg |
|
|
|
|
|
|
|
|
|
|
|
|
1611976..1612042 |
acg |
|
|
|
|
|
|
|
|
|
|
|
|
2065352..2065425 |
ata |
|
|
|
|
|
|
|
|
|
|
|
comp |
2090478..2090550 |
acc |
|
|
|
|
|
|
|
|
|
|
|
|
2394421..2394501 |
tac |
|
3 |
3 |
|
|
2394505..2394577 |
ttc |
|
|
|
|
|
|
|
|
|
|
|
|
2592342..2592422 |
ttg |
|
|
|
|
|
|
|
|
|
|
|
|
2606024..2606104 |
ttg |
|
|
|
|
|
|
|
|
|
|
|
comp |
2737232..2737304 |
gcc |
|
|
|
|
|
|
|
|
|
|
|
comp |
2798802..2798874 |
aag |
|
|
|
|
|
|
|
|
|
|
|
comp |
2881571..2881642 |
gag |
|
|
|
|
|
|
|
|
|
|
|
comp |
3215471..3215545 |
cca |
|
|
|
|
|
|
|
|
|
|
|
comp |
3252582..3252655 |
atgj |
|
7 |
7 |
|
comp |
3252663..3252735 |
gta |
|
4 |
4 |
|
comp |
3252740..3252813 |
gac |
|
10 |
10 |
|
comp |
3252824..3252896 |
tgg |
|
20 |
20 |
|
comp |
3252917..3252988 |
aac |
|
|
|
|
|
|
|
|
683 |
|
|
comp |
3253672..3253748 |
atgj |
|
7 |
|
7
|
comp |
3253756..3253828 |
gta |
|
9 |
|
9
|
comp |
3253838..3253910 |
tgg |
|
18 |
|
18
|
comp |
3253929..3254000 |
aac |
|
60 |
|
|
comp |
3254061..3256967 |
23s |
|
|
|
|
|
|
|
|
362637 |
|
|
comp |
3619605..3619677 |
aca |
+ |
4 |
|
4
|
comp |
3619682..3619755 |
cgt |
2 cgt |
50 |
|
50
|
comp |
3619806..3619879 |
cgt |
2 aca |
27 |
|
27
|
comp |
3619907..3619990 |
tta |
|
3 |
|
3
|
comp |
3619994..3620069 |
gta |
|
47 |
|
47
|
comp |
3620117..3620190 |
gac |
|
22 |
|
22
|
comp |
3620213..3620289 |
atgi |
|
23 |
|
23
|
comp |
3620313..3620385 |
aca |
|
14 |
|
14
|
comp |
3620400..3620471 |
gaa |
|
9 |
|
9
|
comp |
3620481..3620552 |
aac |
|
110 |
|
|
comp |
3620663..3623568 |
23s |
|
261 |
|
|
comp |
3623830..3623902 |
gca |
|
53 |
|
53
|
comp |
3623956..3624029 |
atc |
|
7 |
|
|
comp |
3624037..3624154 |
5s |
|
72 |
|
|
comp |
3624227..3625761 |
16s |
|
149 |
|
|
comp |
3625911..3625999 |
tcc |
|
33 |
|
33
|
comp |
3626033..3626118 |
tca |
|
|
|
|
|
|
|
|
|
|
|
comp |
3714637..3714709 |
gta |
|
1 |
1 |
|
comp |
3714711..3714787 |
atgj |
|
|
|
|
cle cumuls
C7.cumuls. Clostridium lentocellum DSM 5427
opérons |
Fréquences intercalaires
|
|
|
effectifs |
gammes |
sans rRNAs |
avec rRNAs
|
avec rRNA |
opérons |
19 |
1 |
1 |
0
|
|
16 5 aa 23 |
5 |
20 |
14 |
15
|
|
16 5 atc gca |
2 |
40 |
10 |
6
|
|
solo |
11 |
60 |
2 |
5
|
|
max a |
14 |
80 |
1 |
1
|
|
a doubles |
2 |
100 |
0 |
0
|
|
indéterminé |
1 |
120 |
0 |
0
|
|
total aas |
46 |
140 |
0 |
0
|
sans |
opérons |
29 |
160 |
1 |
0
|
|
1 aa |
19 |
180 |
0 |
0
|
|
max a |
10 |
200 |
1 |
0
|
|
a doubles |
2 |
|
0 |
0
|
|
total aas |
59 |
|
30 |
27
|
total aas |
|
105 |
|
|
|
remarques |
|
5 |
|
|
|
avec jaune |
|
|
moyenne |
29 |
|
|
|
|
variance |
41 |
|
sans jaune |
|
|
moyenne |
19 |
22
|
|
|
|
variance |
16 |
19
|
cle blocs
C6. Clostridium lentocellum DSM 5427, cle blocs
Solitaires |
|
|
|
16s |
*2 |
16s° |
@5
|
|
|
|
|
23s |
*3 |
|
|
|
|
|
|
5s |
3*4 |
89 |
|
ggc |
|
|
|
|
|
|
|
aac |
60 |
|
|
23s |
|
|
|
|
|
|
|
16s |
137 |
|
|
5s |
|
|
|
|
|
|
|
16s |
72 |
72 |
72
|
5s |
5 |
4 |
4
|
gca |
282 |
280 |
282
|
23s |
|
|
|
|
|
|
|
|
|
agc |
202
|
16s |
138 |
16s |
72
|
5s |
7 |
5s |
4
|
atc |
258 |
gca |
262
|
23s |
|
23s |
55
|
|
|
gac |
61
|
|
|
|
|
|
|
aac |
110
|
16s |
72 |
23s |
261
|
5s |
7 |
gca |
53
|
atc |
53 |
atc |
7
|
gca |
261 |
5s |
72
|
23s |
110 |
16s |
149
|
aac |
9 |
tcc |
33
|
|
|
|
|
|
|
|
|
5s |
4 |
|
@4
|
gaa |
457 |
|
|
16s |
605 |
|
|
23s |
475 |
|
|
aaa |
9 |
|
|
cle remarques
Remarques : Pas de blocs 16-23-5s ni de séquence 16-atc-gca-23.
@1 5 blocs 16-5-aa-23s avec les mêmes intercalaires, à peu près, 72 4 280.
- 4 blocs avec gca dont 3 à 1aa et 1 avec 9aas.
- Le bloc à 9aas a un aa avant le 16s, compatible.
- 1 bloc avec atc seul et les intercalaires modifiées, 138 7 258.
@2 2 blocs 16-5-atc-gca-23s, avec les mêmes intercalaires, 72 7 53 261.
- Les 2 blocs contiennent des doubles, 2 paires chacun avec 7 et 14aas.
- Le bloc contenant le max de 14aas a 2aas avant le 16s compatibles.
@3 Les solos ne contiennent qu’un seul rRNA avec ou sans aas.
- 5s-1aa, il y en a 4 et l'intercalaire est équivalente de celle des blocs.
- 23s, il y en a 4 dont 1 seul avec 4aas
- 16s, 2 sans aas et 1 du 16s5s avec une intercalaire comme le bloc atc, 137.
@4 Apparemment un trio de solos. Les 3 intercalaires supérieures à 450 permettent
de diviser le groupe en 3 opérons, 5saa avec une intercalaire semblable aux
autres 5saa, 23s avec 3aas aux petites intercalaires et 1 16s sasns aas.
@5 16s°: 16S ribosomal RNA rRNA prediction is too short
Séquences des doubles : très peu de doublons.
- 2 opérons avec rRNAs ont des doublons sur 5 possédant au moins 2 aas.
- 2 opérons sans rRNAs sur 10 possédant au moins 2 aas.
- 4 doublons pour chaque type d'opérons.
- 1 seule paire répétée chez les opérons sans rRNAs.
cle distribution
- Lien tableur: cle distribution
- Notes:
- - Tableau Cl61: ctt2 en gras, très rare
- - Tableau Cl62
- 1-3aas: aaa aga gga
- -5s: Ces 5s sont seuls sans 16s ni 23s. Ce sont 4 5s ggc et 1 5s gaa
- Blocs à rRNA: ils ont la forme 16s5saa23s
- cgt2 double en gras
Cl6 cle, Clostridium lentocellum DSM 5427. clostridia.
Cl61 cle. Distribution des blocs sans rRNA.
g1 |
|
t1 |
|
|
|
|
|
a atgi |
|
a tct |
|
tat |
|
atgf |
1
|
b att |
|
i act |
|
aat |
|
agt |
|
c ctt |
2 |
e cct |
|
cat |
|
cgc |
|
d gtt |
|
m gct |
|
gat |
|
ggt |
|
e ttc |
2 |
b tcc |
|
tac |
2 |
tgc |
|
f atc |
|
j acc |
1 |
aac |
1 |
agc |
|
g ctc |
|
f ccc |
1 |
cac |
2 |
cgt |
|
h gtc |
|
n gcc |
1 |
gac |
2 |
ggc |
1
|
i tta |
2 |
c tca |
2 |
taa |
|
tga |
|
j ata |
1 |
k aca |
1 |
aaa |
3 |
aga |
2
|
k cta |
2 |
g cca |
4 |
caa |
3 |
cga |
1
|
l gta |
3 |
o gca |
|
gaa |
2 |
œ |
3
|
m ttg |
2 |
d tcg |
|
tag |
|
tgg |
1
|
n atgj |
3 |
l acg |
2 |
aag |
1 |
agg |
1
|
o ctg |
2 |
h ccg |
|
cag |
1 |
cgg |
|
p gtg |
|
p gcg |
|
gag |
1 |
ggg |
|
clos |
>1aa |
=1aa |
-5s |
+5s |
-16s |
+16s |
total
|
cle |
40 |
19 |
|
|
|
|
59
|
|
Cl62 cle. Distribution des blocs avec rRNA.
g1 |
|
t1 |
|
|
|
|
|
a atgi |
1 |
a tct |
|
tat |
|
atgf |
|
b att |
|
i act |
|
aat |
|
agt |
|
c ctt |
|
e cct |
|
cat |
|
cgc |
|
d gtt |
|
m gct |
|
gat |
|
ggt |
|
e ttc |
1 |
b tcc |
1 |
tac |
1 |
tgc |
2
|
f atc |
3 |
j acc |
|
aac |
4 |
agc |
1
|
g ctc |
|
f ccc |
|
cac |
|
cgt |
2
|
h gtc |
|
n gcc |
|
gac |
2 |
ggc |
4
|
i tta |
1 |
c tca |
1 |
taa |
|
tga |
|
j ata |
|
k aca |
3 |
aaa |
2 |
aga |
1
|
k cta |
|
g cca |
|
caa |
|
cga |
|
l gta |
3 |
o gca |
6 |
gaa |
3 |
gga |
1
|
m ttg |
|
d tcg |
|
tag |
|
tgg |
1
|
n atgj |
2 |
l acg |
|
aag |
|
agg |
|
o ctg |
|
h ccg |
|
cag |
|
cgg |
|
p gtg |
|
p gcg |
|
gag |
|
ggg |
|
clos |
>1aa |
=1aa |
-5s |
+5s |
-16s |
+16s |
total
|
cle |
|
|
|
34* |
3 |
9 |
64
|
|
Heliobacterium modesticaldum Ice1 ATCC 51547
hmo opérons
- Lien tableur: hmo opérons
- Liens: gtRNAdb [15], NCBI [16], génome [17]
- Phylogénie: Bacteria; Firmicutes; Clostridia; Clostridiales; Heliobacteriaceae;Heliobacterium.
- Légende: cdsa: cds aas, cdsd: cds dirigé
- - cds : cds inséré dans un cluster avec ou sans rRNA.
C7. Heliobacterium modesticaldum Ice1 ATCC 51547
57%GC |
24.7.19 Paris |
109 |
doubles |
intercal |
cds |
aa |
avec aa |
cdsa |
cdsd
|
|
103699..104088 |
CDS |
|
380 |
|
|
|
130 |
|
|
|
|
|
|
|
|
|
|
|
|
104469..105695 |
CDS |
|
186 |
186 |
|
|
409 |
186
|
comp |
105882..105956 |
ggc |
|
1 |
|
1 |
|
|
|
comp |
105958..106044 |
ctg |
|
321 |
321 |
|
|
|
|
comp |
106366..106929 |
CDS |
@1 |
241 |
241 |
|
|
188 |
241
|
comp |
107171..107246 |
aca |
|
202 |
202 |
|
|
|
202
|
comp |
107449..108183 |
CDS |
|
111772 |
|
|
|
245 |
|
|
|
|
|
|
|
|
|
|
|
comp |
219956..220483 |
CDS |
|
260 |
260 |
|
|
176 |
260
|
comp |
220744..220820 |
gac |
|
5 |
|
|
5 |
|
|
comp |
220826..220901 |
gta |
|
10 |
|
|
10 |
|
|
comp |
220912..220987 |
gaa |
|
4 |
|
|
4 |
|
|
comp |
220992..221067 |
aaa |
|
18 |
|
|
18 |
|
|
comp |
221086..221160 |
caa |
|
103 |
|
|
|
|
|
comp |
221264..224182 |
23s |
|
237 |
|
|
|
|
|
comp |
224420..224495 |
gcc |
|
64 |
|
|
|
|
|
comp |
224560..224676 |
5s |
@2 |
328 |
|
|
|
|
|
comp |
225005..226536 |
16s |
|
651 |
651 |
|
|
|
|
comp |
227188..228162 |
CDS |
|
98792 |
|
|
|
325 |
|
|
|
|
|
|
|
|
|
|
|
comp |
326955..328340 |
CDS |
|
178 |
178 |
|
|
462 |
178
|
comp |
328519..328601 |
cta |
|
65 |
|
65 |
|
|
|
comp |
328667..328743 |
aga |
|
60 |
|
60 |
|
|
|
comp |
328804..328880 |
cca |
|
568 |
568 |
|
|
|
|
comp |
329449..330090 |
CDS |
|
57730 |
|
|
|
214 |
|
|
|
|
|
|
|
|
|
|
|
comp |
387821..388105 |
CDS |
|
135 |
135 |
|
|
95 |
|
|
388241..388317 |
ccc |
|
7 |
|
7 |
|
|
|
|
388325..388410 |
tac |
|
47 |
47 |
|
|
|
47
|
comp |
388458..388742 |
CDS |
|
588493 |
|
|
|
95 |
|
|
|
|
|
|
|
|
|
|
|
comp |
977236..978504 |
CDS |
|
439 |
439 |
|
|
423 |
|
comp |
978944..981860 |
23s |
|
237 |
|
|
|
|
|
comp |
982098..982173 |
gcc |
|
64 |
|
|
|
|
|
comp |
982238..982354 |
5s |
|
328 |
|
|
|
|
|
comp |
982683..984208 |
16s |
|
460 |
|
|
|
|
|
comp |
984669..984744 |
tgg |
@3 |
5 |
|
|
5 |
|
|
comp |
984750..984824 |
cgg |
|
207 |
207 |
|
|
|
207
|
comp |
985032..987656 |
CDS |
|
26258 |
|
|
|
875 |
|
|
|
|
|
|
|
|
|
|
|
comp |
1013915..1014760 |
CDS |
|
105 |
105 |
|
|
282 |
105
|
comp |
1014866..1014942 |
gac |
|
75 |
|
75 |
|
|
|
comp |
1015018..1015093 |
gaa |
|
265 |
265 |
|
|
|
|
comp |
1015359..1016642 |
CDS |
|
40115 |
|
|
|
428 |
|
|
|
|
|
|
|
|
|
|
|
|
1056758..1058014 |
CDS |
|
121 |
121 |
|
|
419 |
121
|
comp |
1058136..1058233 |
tga |
|
173 |
173 |
|
|
|
|
|
1058407..1058733 |
CDS |
|
62951 |
|
|
|
109 |
|
|
|
|
|
|
|
|
|
|
|
|
1121685..1122878 |
CDS |
|
588 |
588 |
|
|
398 |
|
|
1123467..1124998 |
16s |
|
328 |
|
|
|
|
|
|
1125327..1125443 |
5s |
|
64 |
|
|
|
|
|
|
1125508..1125583 |
gcc |
|
233 |
|
|
|
|
|
|
1125817..1128734 |
23s |
|
337 |
337 |
|
|
|
337
|
> |
1129072..1129785 |
CDS |
|
24938 |
|
|
|
238 |
|
|
|
|
|
|
|
|
|
|
|
|
1154724..1155224 |
CDS |
|
99 |
99 |
|
|
167 |
|
|
1155324..1155413 |
tca |
|
56 |
56 |
|
|
|
56
|
comp |
1155470..1156627 |
CDS |
|
13350 |
|
|
|
386 |
|
|
|
|
|
|
|
|
|
|
|
|
1169978..1171828 |
CDS |
|
129 |
129 |
|
|
617 |
129
|
|
1171958..1172034 |
cgt |
|
85 |
|
85 |
|
|
|
|
1172120..1172196 |
agg |
|
181 |
181 |
|
|
|
|
|
1172378..1172812 |
CDS |
|
62 |
62 |
|
|
145 |
62
|
|
1172875..1172966 |
tcg |
|
548 |
548 |
|
|
|
|
|
1173515..1174330 |
CDS |
|
6655 |
|
|
|
272 |
|
|
|
|
|
|
|
|
|
|
|
comp |
1180986..1182974 |
CDS |
|
444 |
444 |
|
|
663 |
|
|
1183419..1183512 |
tcc |
|
39 |
39 |
|
|
|
39
|
|
1183552..1183817 |
ncRNA |
|
11908 |
|
|
|
89 |
|
|
|
|
|
|
|
|
|
|
|
|
1195726..1195998 |
CDS |
|
181 |
181 |
|
|
91 |
|
|
1196180..1196255 |
gcg |
|
151 |
151 |
|
|
|
151
|
|
1196407..1197051 |
CDS |
|
86894 |
|
|
|
215 |
|
|
|
|
|
|
|
|
|
|
|
comp |
1283946..1285331 |
CDS |
|
177 |
177 |
|
|
462 |
177
|
|
1285509..1285584 |
atgf |
|
5 |
|
5 |
|
|
|
|
1285590..1285667 |
atgj |
|
7 |
|
7 |
|
|
|
|
1285675..1285750 |
gaa |
|
542 |
542 |
|
|
|
|
|
1286293..1287630 |
CDS |
|
63447 |
|
|
|
446 |
|
|
|
|
|
|
|
|
|
|
|
|
1351078..1352549 |
CDS |
|
704 |
704 |
|
|
491 |
|
|
1353254..1354786 |
16s |
|
252 |
|
|
|
|
|
|
1355039..1355155 |
5s |
|
64 |
|
|
|
|
|
|
1355220..1355296 |
atc |
|
194 |
|
|
|
|
|
|
1355491..1358408 |
23s |
|
112 |
|
|
|
|
|
|
1358521..1358595 |
aac |
|
109 |
109 |
|
|
|
109
|
comp |
1358705..1358926 |
CDS |
|
139555 |
|
|
|
74 |
|
|
|
|
|
|
|
|
|
|
|
|
1498482..1498898 |
CDS |
|
535 |
535 |
|
|
139 |
|
comp |
1499434..1499509 |
acg |
|
238 |
238 |
|
|
|
238
|
|
1499748..1500836 |
CDS |
|
262182 |
|
|
|
363 |
|
|
|
|
|
|
|
|
|
|
|
|
1763019..1763858 |
CDS |
|
68 |
68 |
|
|
280 |
68
|
|
1763927..1764003 |
gac |
|
4 |
|
4 |
|
|
|
|
1764008..1764083 |
ttc |
|
3 |
|
3 |
|
|
|
|
1764087..1764161 |
ggc |
|
92 |
92 |
|
|
|
|
comp |
1764254..1764493 |
CDS |
|
72 |
72 |
|
|
80 |
72
|
|
1764566..1764641 |
tgc |
|
18 |
|
18 |
|
|
|
|
1764660..1764746 |
tta |
|
253 |
253 |
|
|
|
|
comp |
1765000..1765467 |
CDS |
|
52131 |
|
|
|
156 |
|
|
|
|
|
|
|
|
|
|
|
|
1817599..1818318 |
CDS |
|
487 |
487 |
|
|
240 |
|
|
1818806..1820337 |
16s |
|
252 |
|
|
|
|
|
|
1820590..1820706 |
5s |
|
64 |
|
|
|
|
|
|
1820771..1820847 |
atc |
|
6 |
|
|
6 |
|
|
|
1820854..1820929 |
gca |
|
229 |
|
|
|
|
|
|
1821159..1824076 |
23s |
|
112 |
|
|
|
|
|
|
1824189..1824263 |
aac |
|
6 |
|
|
6 |
|
|
|
1824270..1824345 |
atgf |
|
243 |
243 |
|
|
|
243
|
|
1824589..1825014 |
CDS |
|
168198 |
|
|
|
142 |
|
|
|
|
|
|
|
|
|
|
|
|
1993213..1994328 |
CDS |
|
99 |
99 |
|
|
372 |
|
|
1994428..1994502 |
atgi |
|
41 |
41 |
|
|
|
41
|
|
1994544..1995368 |
CDS |
|
284281 |
|
|
|
275 |
|
|
|
|
|
|
|
|
|
|
|
|
2279650..2279997 |
CDS |
|
541 |
541 |
|
|
116 |
|
|
2280539..2282070 |
16s |
|
253 |
|
|
|
|
|
|
2282324..2282440 |
5s |
|
64 |
|
|
|
|
|
|
2282505..2282580 |
gcc |
|
234 |
|
|
|
|
|
|
2282815..2285735 |
23s |
|
119 |
|
|
|
|
|
|
2285855..2285948 |
tcc |
|
6 |
|
|
6 |
|
|
|
2285955..2286031 |
ccg |
|
10 |
|
|
10 |
|
|
|
2286042..2286115 |
gga |
|
14 |
|
|
14 |
|
|
|
2286130..2286205 |
cac |
|
1 |
|
|
1 |
|
|
|
2286207..2286281 |
tgc |
|
9 |
|
|
9 |
|
|
|
2286291..2286367 |
gtc |
|
3 |
|
|
3 |
|
|
|
2286371..2286446 |
ttc |
|
6 |
|
|
6 |
|
|
|
2286453..2286537 |
tac |
|
4 |
|
|
4 |
|
|
|
2286542..2286616 |
caa |
|
17 |
|
|
17 |
|
|
|
2286634..2286709 |
aaa |
|
4 |
|
|
4 |
|
|
|
2286714..2286789 |
gaa |
|
5 |
|
|
5 |
|
|
|
2286795..2286870 |
gta |
|
5 |
|
|
5 |
|
|
|
2286876..2286952 |
gac |
|
7 |
|
|
7 |
|
|
|
2286960..2287050 |
agc |
|
43 |
|
|
43 |
|
|
|
2287094..2287170 |
ccc |
|
30 |
|
|
30 |
|
|
|
2287201..2287287 |
ctg |
|
3 |
|
|
3 |
|
|
|
2287291..2287365 |
ggc |
|
4 |
|
|
4 |
|
|
|
2287370..2287446 |
cgt |
|
4 |
|
|
4 |
|
|
|
2287451..2287526 |
acc |
|
352 |
352 |
|
|
|
352
|
|
2287879..2288343 |
CDS |
|
33184 |
|
|
|
155 |
|
|
|
|
|
|
|
|
|
|
|
comp |
2321528..2322544 |
CDS |
|
268 |
268 |
|
|
339 |
|
comp |
2322813..2322889 |
gtc |
|
9 |
|
9 |
|
|
|
comp |
2322899..2322973 |
cgg |
|
81 |
81 |
|
|
|
81
|
comp |
2323055..2323243 |
CDS |
|
3375 |
|
|
|
63 |
|
|
|
|
|
|
|
|
|
|
|
|
2326619..2327947 |
CDS |
|
464 |
464 |
|
|
443 |
464
|
|
2328412..2329943 |
16s |
|
327 |
|
|
|
|
|
|
2330271..2330387 |
5s |
|
226 |
|
|
|
|
|
|
2330614..2333532 |
23s |
|
98 |
|
|
|
|
|
|
2333631..2333706 |
aaa |
|
4 |
|
|
4 |
|
|
|
2333711..2333786 |
acc |
|
8 |
|
|
8 |
|
|
|
2333795..2333877 |
ctc |
|
89 |
89 |
|
|
|
89
|
comp |
2333967..2334704 |
CDS |
|
7389 |
|
|
|
246 |
|
|
|
|
|
|
|
|
|
|
|
|
2342094..2342804 |
CDS |
|
155 |
155 |
|
|
237 |
155
|
comp |
2342960..2343030 |
ttc |
|
213 |
213 |
|
|
|
|
|
2343244..2343936 |
CDS |
|
563 |
563 |
|
|
231 |
|
|
2344500..2346025 |
16s |
|
252 |
|
|
|
|
|
|
2346278..2346394 |
5s |
|
64 |
|
|
|
|
|
|
2346459..2346535 |
atc |
|
141 |
|
|
|
|
|
|
2346677..2349594 |
23s |
|
100 |
|
|
|
|
|
|
2349695..2349769 |
aac |
|
6 |
|
|
6 |
|
|
|
2349776..2349851 |
atgf |
|
102 |
102 |
|
|
|
102
|
|
2349954..2350976 |
CDS |
|
113601 |
|
|
|
341 |
|
|
|
|
|
|
|
|
|
|
|
|
2464578..2465114 |
CDS |
|
271 |
271 |
|
|
179 |
271
|
comp |
2465386..2465461 |
aca |
|
432 |
432 |
|
|
|
|
|
2465894..2466226 |
CDS |
|
4722 |
|
|
|
111 |
|
|
|
|
|
|
|
|
|
|
|
|
2470949..2471977 |
CDS |
|
69 |
69 |
|
|
343 |
69
|
|
2472047..2472133 |
ctg |
|
678 |
678 |
|
|
|
|
|
2472812..2473192 |
CDS |
|
22232 |
|
|
|
127 |
|
|
|
|
|
|
|
|
|
|
|
|
2495425..2496048 |
CDS |
|
402 |
402 |
|
|
208 |
|
comp |
2496451..2496527 |
gtc |
|
4 |
|
4 |
|
|
|
comp |
2496532..2496609 |
atgj |
|
175 |
175 |
|
|
|
175
|
|
2496785..2497120 |
CDS |
|
217 |
217 |
|
|
112 |
|
comp |
2497338..2497420 |
ctc |
|
7 |
|
7 |
|
|
|
comp |
2497428..2497503 |
acc |
|
18 |
|
18 |
|
|
|
comp |
2497522..2497596 |
tgg |
|
14 |
|
14 |
|
|
|
comp |
2497611..2497684 |
ggg |
|
19 |
|
19 |
|
|
|
comp |
2497704..2497778 |
ggc |
|
7 |
|
7 |
|
|
|
comp |
2497786..2497873 |
ttg |
|
8 |
|
8 |
|
|
|
comp |
2497882..2497958 |
gtg |
|
-10 |
-10 |
|
|
|
-10
|
comp |
2497949..2498185 |
CDS |
|
66 |
66 |
|
|
79 |
66
|
|
2498252..2498328 |
ccg |
|
314 |
314 |
|
|
|
|
comp |
2498643..2499506 |
CDS |
|
55292 |
|
|
|
288 |
|
|
|
|
|
|
|
|
|
|
|
|
2554799..2554984 |
CDS |
|
109 |
109 |
|
|
62 |
109
|
|
2555094..2555169 |
gaa |
|
2 |
|
2 |
|
|
|
|
2555172..2555247 |
ttc |
|
6 |
|
6 |
|
|
|
|
2555254..2555338 |
tac |
|
4 |
|
4 |
|
|
|
|
2555343..2555417 |
caa |
|
18 |
|
18 |
|
|
|
|
2555436..2555511 |
aaa |
|
4 |
|
4 |
|
|
|
|
2555516..2555590 |
ggc |
|
9 |
|
9 |
|
|
|
|
2555600..2555675 |
cac |
|
117 |
117 |
|
|
|
|
comp |
2555793..2557049 |
CDS |
|
235940 |
|
|
|
419 |
|
|
|
|
|
|
|
|
|
|
|
comp |
2792990..2793442 |
CDS |
|
219 |
219 |
|
|
151 |
219
|
comp |
2793662..2796583 |
23s |
|
236 |
|
|
|
|
|
comp |
2796820..2796895 |
gca |
|
6 |
|
|
6 |
|
|
comp |
2796902..2796978 |
atc |
|
64 |
|
|
|
|
|
comp |
2797043..2797159 |
5s |
|
328 |
|
|
|
|
|
comp |
2797488..2799019 |
16s |
|
505 |
|
|
|
|
|
comp |
2799525..2799599 |
ggc |
+ |
1 |
|
|
1 |
|
|
comp |
2799601..2799687 |
ctg |
2 ggc |
32 |
|
|
32 |
|
|
comp |
2799720..2799796 |
ccc |
|
42 |
|
|
42 |
|
|
comp |
2799839..2799915 |
cgt |
|
4 |
|
|
4 |
|
|
comp |
2799920..2799994 |
ggc |
|
120 |
|
|
120 |
|
|
comp |
2800115..2800192 |
atgj |
|
42 |
|
|
42 |
|
|
comp |
2800235..2800325 |
agc |
|
16 |
|
|
16 |
|
|
comp |
2800342..2800417 |
atgf |
|
6 |
|
|
6 |
|
|
comp |
2800424..2800498 |
aac |
|
7 |
|
|
7 |
|
|
comp |
2800506..2800581 |
gaa |
|
4 |
|
|
4 |
|
|
comp |
2800586..2800661 |
aaa |
|
18 |
|
|
18 |
|
|
comp |
2800680..2800754 |
caa |
|
4 |
|
|
4 |
|
|
comp |
2800759..2800843 |
tac |
|
91 |
|
|
91 |
|
|
comp |
2800935..2801011 |
gtc |
|
7 |
|
|
7 |
|
|
comp |
2801019..2801093 |
tgc |
|
325 |
325 |
|
|
|
|
|
2801419..2801724 |
CDS |
|
230813 |
|
|
|
102 |
|
|
|
|
|
|
|
|
|
|
|
|
3032538..3032729 |
CDS |
|
109 |
109 |
|
|
64 |
109
|
comp |
3032839..3035757 |
23s |
|
233 |
|
|
|
|
|
comp |
3035991..3036066 |
gcc |
|
64 |
|
|
|
|
|
comp |
3036131..3036247 |
5s |
|
253 |
|
|
|
|
|
comp |
3036501..3038026 |
16s |
|
779 |
779 |
|
|
|
|
comp |
3038806..3040017 |
CDS |
|
232 |
|
|
|
404 |
|
|
|
|
|
|
|
|
|
|
|
comp |
3040250..3042013 |
CDS |
|
|
|
|
|
588 |
|
hmo cumuls
- Lien tableur: hmo cumuls
- Légende:
- - avec et sans rRNA, fréquences des intercalaires dans les clusters avec rRNA ou sans rRNA.
- - cdsd, je ne choisis que le cds avec l'intercalaire le plus faible d'un cluster donné, en supposant que ce cds a été créé par le cluster lors des conversions.
- - cdsa, longueur du cds en aas ici.
- - 1 : occurences exclues de la moyenne. Sont exclus de la moyenne les jaunes 554 de hmo opérons.
C7. cumuls. Heliobacterium modesticaldum Ice1 ATCC 51547
opérons |
Fréquences intercalaires tRNAs |
Fréquences intercalaires cds |
Fréquences aas cds
|
|
|
effectif |
gammes |
sans rRNAs |
avec rRNAs |
gammes |
cds |
gammes |
cdsd |
gammes |
cdsa
|
avec rRNA |
opérons |
10 |
1 |
1 |
2 |
1 |
1 |
40 |
1 |
100 |
10
|
|
16 5s gcc 23 |
5 |
20 |
20 |
34 |
50 |
3 |
80 |
8 |
200 |
16
|
|
16 5s atc 23 |
2 |
40 |
0 |
2 |
100 |
11 |
120 |
7 |
300 |
14
|
|
16 5 23s a |
1 |
60 |
1 |
3 |
150 |
9 |
160 |
4 |
400 |
8
|
|
max a |
20 |
80 |
2 |
0 |
200 |
9 |
200 |
4 |
500 |
11
|
|
a doubles |
1 |
100 |
1 |
1 |
250 |
8 |
240 |
4 |
600 |
0
|
|
16 5s atc gca |
2 |
120 |
0 |
1 |
300 |
5 |
280 |
4 |
700 |
2
|
|
total aas |
60 |
140 |
0 |
0 |
350 |
4 |
320 |
0 |
800 |
0
|
sans |
opérons |
24 |
160 |
0 |
0 |
400 |
1 |
360 |
2 |
900 |
1
|
|
1 aa |
12 |
180 |
0 |
0 |
450 |
4 |
400 |
0 |
1000 |
0
|
|
max a |
7 |
200 |
0 |
0 |
500 |
2 |
440 |
0 |
1100 |
0
|
|
a doubles |
0 |
|
0 |
0 |
|
11 |
|
1 |
|
0
|
|
total aas |
49 |
|
21 |
38 |
|
56 |
|
32 |
|
59
|
total aas |
|
109 |
|
|
|
|
|
|
|
|
|
remarques |
|
3 |
|
|
|
|
|
|
|
|
|
avec jaune |
|
|
moyenne |
|
|
|
|
|
|
|
|
|
|
|
variance |
|
|
|
|
|
|
|
|
sans jaune |
|
|
moyenne |
8 |
8 |
|
196 |
|
137 |
|
230
|
|
|
|
variance |
6 |
7 |
|
120 |
|
71 |
|
128
|
hmo blocs
- Lien tableur: hmo blocs
- Légende:
- - tgg: L'intercalaire, en jaune aussi, est entre tgg et 16s.
- Notes:
- - Les spécificités gcc atc atc-gca et tRNA avant 16s
- - Homogénéité des intercalaires intra bloc
C7. Heliobacterium modesticaldum Ice1 ATCC 51547, hmo blocs.
|
|
|
|
|
tgg
|
CDS |
541 |
651 |
588 |
779 |
460
|
16s |
253 |
328 |
328 |
253 |
328
|
5s |
64 |
64 |
64 |
64 |
64
|
gcc |
234 |
237 |
233 |
233 |
237
|
23s |
119 |
103 |
337 |
109 |
439
|
tcc |
tcc |
caa |
cds |
cds |
cds
|
|
|
|
|
|
|
CDS |
704 |
563 |
|
CDS |
464
|
16s |
252 |
252 |
|
16s |
327
|
5s |
64 |
64 |
|
5s |
226
|
atc |
194 |
141 |
|
23s |
98
|
23s |
112 |
100 |
|
aaa |
|
aac |
aac |
aac |
|
|
|
|
|
|
|
|
|
|
|
ggc |
|
|
|
CDS |
487 |
505 |
|
|
|
16s |
252 |
328 |
|
|
|
5s |
64 |
64 |
|
|
|
atc |
6 |
6 |
|
|
|
gca |
229 |
236 |
|
|
|
23s |
112 |
219 |
|
|
|
aac |
aac |
cds |
|
|
|
hmo remarques
- Remarques des 3 @ dans opérons :
- @ Les cds en vert.
- - Ces cds sont insérés dans un cluster avec ou sans rRNA. Ce sont des candidats pour la création. Plus les 2 intercalaires avec les voisins sont petits plus ils sont intéressants. Il y en a 6 dont un seul, *, est accolé à un 16s. Un intercalaire est même négatif, c’est-à-dire que le cds démarre dans le tRNA, adresse 2497949. Dansl’ordre des adresses croissantes les intercalaires sont les suivants : 321-241 181-62 92-72 213-563* 175-217 -10-66.
- - Voir hmo cumuls : 9 intercalaires entre tRNAs dans un cluster ont plus de 40 pbs et 1 fait 120 pbs (adresse 2799920).
- - Dans hmo_opérons j'ai ajouté l'intercalaire entre 2 clusters, qui contient plusieurs autres gènes, pour faire ressortir la proximité des cds intra cluster avec les rRNAs et les tRNAs.
- @ Voir hmo blocs.
- - Il y a 10 blocs avec rRNA et tous sont complets. Cependant le 5s est anormalement positionné entre 16s et 23s au lieu d’être en 3ème position. Ce type de génome est rare, voir les statistiques des blocs à rRNAs.
- - Il n'y a qu'un seul bloc sans aas, adresse 2328412, mais ce génome a 5 blocs sur 10 qui est rare dans cette position, gcc, au lieu de gca, plus courant. Les 4 autres blocs arborent des aas courants dans cette position, 2 atc-gca et 2 atc.
- @ tRNAs avant 16s
- - Des tRNAs se trouvent avant le 16s, adresses 982683 et 2797488, le 1er avec 2 et le 2ème avec 15 tRNAs.
- - Les 2 intercalaires aa-16s sont du même de grandeur général qu'un cds-16s, 460 et 505 pbs ici.
- Séquences des doubles: Voir hmo cumuls :beaucoup de séquences longues et à peine un double dans la séquence 15aas-16s5s-gcc-23s.
- Notes:
- - Les 5 cds, candidats à la création, sont insérés dans des clusters sans rRNAs et 1 seul est collé à 16s.
- - Le 5s est positionné anormalement en 16s5s23s, dans les 10 blocs que possède le génome.
- - Un tRNA intra bloc très rare, gcc au lieu de gca, dans 5 cas sur 10. 4 autres sont courants, 2 atc et 2 atc-gca.
hmo distribution
- Lien tableur: hmo distribution
- Notes: Tableau Cl72,
- - les 1-3aas sont au nombre de 10 et sont soulignés, aac est composé de 1 >3aas et 3 1-3aas alors que aaa est composé respectivement de 3 et 1, et atgf de 2 et 1 respectivement.
- - Les blocs à rRNA sont de la forme 16s5saa23s
Cl7 hmo, Heliobacterium modesticaldum Ice1 ATCC 51547. clostridia.
Cl71 hmo. Distribution des blocs sans rRNA.
g1 |
|
t1 |
|
|
|
|
|
a atgi |
1 |
a tct |
|
tat |
|
atgf |
1
|
b att |
|
i act |
|
aat |
|
agt |
|
c ctt |
|
e cct |
|
cat |
|
cgc |
|
d gtt |
|
m gct |
|
gat |
|
ggt |
|
e ttc |
3 |
b tcc |
1 |
tac |
2 |
tgc |
1
|
f atc |
|
j acc |
1 |
aac |
|
agc |
|
g ctc |
1 |
f ccc |
1 |
cac |
1 |
cgt |
1
|
h gtc |
2 |
n gcc |
|
gac |
2 |
ggc |
4
|
i tta |
1 |
c tca |
1 |
taa |
|
tga |
1
|
j ata |
|
k aca |
2 |
aaa |
1 |
aga |
1
|
k cta |
1 |
g cca |
1 |
caa |
1 |
cga |
|
l gta |
|
o gca |
|
gaa |
3 |
gga |
|
m ttg |
1 |
d tcg |
1 |
tag |
|
tgg |
1
|
n atgj |
2 |
l acg |
1 |
aag |
|
agg |
1
|
o ctg |
2 |
h ccg |
1 |
cag |
|
cgg |
1
|
p gtg |
1 |
p gcg |
1 |
gag |
|
ggg |
1
|
clos |
>1aa |
=1aa |
-5s |
+5s |
-16s |
+16s |
total
|
hmo |
37 |
12 |
|
|
|
|
49
|
|
Cl72 hmo. Distribution des blocs avec rRNA.
g1 |
|
t1 |
|
|
|
|
|
a atgi |
|
a tct |
|
tat |
|
atgf |
3
|
b att |
|
i act |
|
aat |
|
agt |
|
c ctt |
|
e cct |
|
cat |
|
cgc |
|
d gtt |
|
m gct |
|
gat |
|
ggt |
|
e ttc |
1 |
b tcc |
1 |
tac |
2 |
tgc |
2
|
f atc |
4 |
j acc |
2 |
aac |
4 |
agc |
2
|
g ctc |
1 |
f ccc |
2 |
cac |
1 |
cgt |
2
|
h gtc |
2 |
n gcc |
5 |
gac |
2 |
ggc |
3
|
i tta |
|
c tca |
|
taa |
|
tga |
|
j ata |
|
k aca |
|
aaa |
4 |
aga |
|
k cta |
|
g cca |
|
caa |
3 |
cga |
|
l gta |
2 |
o gca |
2 |
gaa |
3 |
gga |
1
|
m ttg |
|
d tcg |
|
tag |
|
tgg |
1
|
n atgj |
1 |
l acg |
|
aag |
|
agg |
|
o ctg |
2 |
h ccg |
1 |
cag |
|
cgg |
1
|
p gtg |
|
p gcg |
|
gag |
|
ggg |
|
clos |
>1aa |
=1aa |
-5s |
+5s |
-16s |
+16s |
total
|
hmo |
|
|
|
49 |
|
11 |
60
|
|
Clostridium beijerinckii strain NCIMB 14988
cbei opérons
- Lien tableur: cbei opérons
- Liens: gtRNAdb [], NCBI [18], génome []
- Phylogénie: Bacteria; Firmicutes; Clostridia; Clostridiales; Clostridiaceae;Clostridium.
- Légende: cdsa: cds aas, cdsd: cds dirigé
- - cyan pour les doubles signalés par le signe + dans la colonne doubles.
- - @ voir le chapitre remarques de ce génome.
- Notes:
- - Les atg ont été résolus en comparant avec ceux de cdc avec stxt. A faire pour psor aussi.
C8. Clostridium beijerinckii strain NCIMB 14988
29.65%GC |
29.7.19 Paris |
93 |
doubles |
intercal |
cds |
aa |
avec aa |
cdsa |
cdsd
|
|
6477551..6480031 |
CDS |
|
496 |
496 |
|
|
827 |
|
|
6480528..6482044 |
16s |
|
213 |
|
|
|
|
|
|
6482258..6485171 |
23s |
|
108 |
|
|
|
|
|
|
6485280..6485394 |
5s |
|
14 |
|
|
|
|
|
|
15..91 |
atgi |
|
1 |
|
|
1 |
|
|
|
93..168 |
gca |
|
85 |
85 |
|
|
|
85
|
|
254..769 |
CDS |
|
1940 |
|
|
|
172 |
|
|
|
|
|
|
|
|
|
|
|
|
2710..2937 |
CDS |
|
119 |
119 |
|
|
76 |
119
|
|
3057..3147 |
tca |
+ |
30 |
|
30 |
|
|
|
|
3178..3268 |
agc |
2 tca |
241 |
|
241 |
|
|
|
|
3510..3600 |
tca |
2 agc |
18 |
|
18 |
|
|
|
|
3619..3709 |
agc |
|
125 |
125 |
|
|
|
|
|
3835..4350 |
CDS |
|
9470 |
|
|
|
172 |
|
|
|
|
|
|
|
|
|
|
|
|
13821..14726 |
CDS |
|
187 |
187 |
|
|
302 |
|
|
14914..14988 |
cgt |
|
34 |
34 |
|
|
|
34
|
comp |
15023..15913 |
CDS |
|
109014 |
|
|
|
297 |
|
|
|
|
|
|
|
|
|
|
|
|
124928..125338 |
CDS |
|
275 |
275 |
|
|
137 |
275
|
|
125614..125702 |
tta |
+ |
20 |
|
20 |
|
|
|
|
125723..125798 |
atgf |
4 tta |
7 |
|
7 |
|
|
|
|
125806..125882 |
atgj |
4 atgf |
6 |
|
6 |
|
|
|
|
125889..125977 |
tta |
2 atgj |
22 |
|
22 |
|
|
|
|
126000..126075 |
atgf |
|
7 |
|
7 |
|
|
|
|
126083..126159 |
atgj |
|
6 |
|
6 |
|
|
|
|
126166..126254 |
tta |
|
21 |
|
21 |
|
|
|
|
126276..126351 |
atgf |
|
70 |
|
70 |
|
|
|
|
126422..126510 |
tta |
|
21 |
|
21 |
|
|
|
|
126532..126607 |
atgf |
|
664 |
664 |
|
|
|
|
|
127272..129683 |
CDS |
|
8954 |
|
|
|
804 |
|
|
|
|
|
|
|
|
|
|
|
|
138638..140143 |
CDS |
|
307 |
307 |
|
|
502 |
|
|
140451..140525 |
aac |
+ |
234 |
|
234 |
|
|
|
|
140760..140834 |
aac |
3 aac |
439 |
|
439 |
|
|
|
|
141274..141348 |
aac |
@6 |
299 |
299 |
|
|
|
299
|
|
141648..143039 |
CDS |
|
1587 |
|
|
|
464 |
|
|
|
|
|
|
|
|
|
|
|
comp |
144627..145649 |
CDS |
|
543 |
543 |
|
|
341 |
|
|
146193..147709 |
16s |
|
140 |
|
|
|
|
|
|
147850..147925 |
gca |
|
3 |
|
|
3 |
|
|
|
147929..148005 |
atc |
|
111 |
|
|
|
|
|
|
148117..151030 |
23s |
|
70 |
|
|
|
|
|
|
151101..151217 |
5s |
|
5 |
|
|
5 |
|
|
|
151223..151298 |
ttc |
|
4 |
|
|
|
|
|
|
151303..151377 |
tgc |
|
167 |
167 |
|
|
|
167
|
|
151545..151841 |
CDS |
|
25608 |
|
|
|
99 |
|
|
|
|
|
|
|
|
|
|
|
|
177450..178097 |
CDS |
|
76 |
76 |
|
|
216 |
|
|
178174..178249 |
acc |
|
65 |
65 |
|
|
|
65
|
|
178315..179508 |
CDS |
|
134221 |
|
|
|
398 |
|
|
|
|
|
|
|
|
|
|
|
|
313730..316207 |
CDS |
|
90 |
90 |
|
|
826 |
90
|
|
316298..316382 |
cta |
|
4 |
|
4 |
|
|
|
|
316387..316461 |
ggg |
|
120 |
120 |
|
|
|
|
comp |
316582..316986 |
CDS |
|
85487 |
|
|
|
135 |
|
|
|
|
|
|
|
|
|
|
|
|
402474..402953 |
CDS |
|
125 |
125 |
|
|
160 |
125
|
|
403079..403154 |
cca |
+ |
17 |
|
17 |
|
|
|
|
403172..403245 |
gga |
2* |
149 |
|
149 |
|
|
|
|
403395..403471 |
aga |
cca gga aga |
6 |
|
6 |
|
|
|
|
403478..403553 |
cca |
|
16 |
|
16 |
|
|
|
|
403570..403643 |
gga |
|
35 |
|
35 |
|
|
|
|
403679..403755 |
aga |
|
5 |
|
5 |
|
|
|
|
403761..403836 |
cac |
|
3 |
|
3 |
|
|
|
|
403840..403914 |
caa |
2* |
7 |
|
7 |
|
|
|
|
403922..403997 |
aaa |
caa aaa cta |
18 |
|
18 |
|
|
|
|
404016..404100 |
cta |
ggc gga |
5 |
|
5 |
|
|
|
|
404106..404180 |
ggc |
|
25 |
|
25 |
|
|
|
|
404206..404279 |
gga |
|
5 |
|
5 |
|
|
|
|
404285..404360 |
aag |
|
57 |
|
57 |
|
|
|
|
404418..404492 |
caa |
|
7 |
|
7 |
|
|
|
|
404500..404575 |
aaa |
|
18 |
|
18 |
|
|
|
|
404594..404678 |
cta |
|
5 |
|
5 |
|
|
|
|
404684..404758 |
ggc |
|
25 |
|
25 |
|
|
|
|
404784..404857 |
gga |
|
46 |
|
46 |
|
|
|
|
404904..404980 |
cga |
|
325 |
325 |
|
|
|
|
< |
405306..405467 |
CDS |
|
8393 |
|
|
|
54 |
|
|
|
|
|
|
|
|
|
|
|
|
413861..415921 |
CDS |
|
385 |
385 |
|
|
687 |
|
|
416307..417823 |
16s |
@5 |
132 |
|
|
|
|
|
|
417956..418032 |
atc |
|
84 |
|
|
|
|
|
|
418117..421031 |
23s |
|
71 |
|
|
|
|
|
|
421103..421177 |
aac |
|
345 |
345 |
|
|
|
345
|
|
421523..422449 |
CDS |
|
63814 |
|
|
|
309 |
|
|
|
|
|
|
|
|
|
|
|
|
486264..486668 |
CDS |
|
159 |
159 |
|
|
135 |
159
|
|
486828..486912 |
tac |
+ |
9 |
|
9 |
|
|
|
|
486922..486997 |
gta |
3 tac |
27 |
|
27 |
|
|
|
|
487025..487099 |
aca |
2 gta |
12 |
|
12 |
|
|
|
|
487112..487196 |
tac |
2 aca |
9 |
|
9 |
|
|
|
|
487206..487281 |
gta |
|
30 |
|
30 |
|
|
|
|
487312..487386 |
aca |
|
12 |
|
12 |
|
|
|
|
487399..487483 |
tac |
|
451 |
451 |
|
|
|
|
|
487935..489110 |
CDS |
|
50956 |
|
|
|
392 |
|
|
|
|
|
|
|
|
|
|
|
|
540067..540969 |
CDS |
|
187 |
187 |
|
|
301 |
187
|
|
541157..541231 |
tgg |
|
208 |
208 |
|
|
|
|
|
541440..541820 |
CDS |
|
97 |
|
|
|
127 |
|
|
|
|
|
|
|
|
|
|
|
comp |
541918..542985 |
CDS |
|
252 |
252 |
|
|
356 |
252
|
|
543238..543312 |
tgg |
|
354 |
354 |
|
|
|
|
|
543667..544683 |
CDS |
|
347735 |
|
|
|
339 |
|
|
|
|
|
|
|
|
|
|
|
|
892419..893339 |
CDS |
|
560 |
560 |
|
|
307 |
|
|
893900..895416 |
16s |
|
137 |
|
|
|
|
|
|
895554..895629 |
gca |
|
118 |
|
|
|
|
|
|
895748..898661 |
23s |
|
204 |
|
|
|
|
|
|
898866..898982 |
5s |
|
552 |
552 |
|
|
|
552
|
|
899535..900446 |
CDS |
|
351 |
|
|
|
304 |
|
|
|
|
|
|
|
|
|
|
|
|
900798..902048 |
CDS |
|
704 |
704 |
|
|
417 |
|
|
902753..904269 |
16s |
|
339 |
|
|
|
|
|
|
904609..907522 |
23s |
|
273 |
|
|
|
|
|
|
907796..907912 |
5s |
|
69 |
69 |
|
|
|
69
|
comp |
907982..908449 |
CDS |
|
43545 |
|
|
|
156 |
|
|
|
|
|
|
|
|
|
|
|
|
951995..952630 |
CDS |
|
97 |
97 |
|
|
212 |
97
|
|
952728..952813 |
ctc |
|
396 |
396 |
|
|
|
|
|
953210..954919 |
CDS |
|
784414 |
|
|
|
570 |
|
|
|
|
|
|
|
|
|
|
|
|
1739334..1739933 |
CDS |
|
380 |
380 |
|
|
200 |
380
|
|
1740314..1740389 |
cac |
|
3 |
|
3 |
|
|
|
|
1740393..1740467 |
cag |
|
5 |
|
5 |
|
|
|
|
1740473..1740548 |
aaa |
|
443 |
443 |
|
|
|
|
comp |
1740992..1742350 |
CDS |
|
151829 |
|
|
|
453 |
|
|
|
|
|
|
|
|
|
|
|
|
1894180..1895406 |
CDS |
|
34 |
34 |
|
|
409 |
34
|
comp |
1895441..1895527 |
ttg |
|
574 |
574 |
|
|
|
|
|
1896102..1896794 |
CDS |
|
200701 |
|
|
|
231 |
|
|
|
|
|
|
|
|
|
|
|
|
2097496..2097915 |
CDS |
|
722 |
722 |
|
|
140 |
|
|
2098638..2100154 |
16s |
|
502 |
|
|
|
|
|
|
2100657..2103569 |
23s |
|
205 |
|
|
|
|
|
|
2103775..2103891 |
5s |
|
315 |
315 |
|
|
|
315
|
|
2104207..2104905 |
CDS |
|
234313 |
|
|
|
233 |
|
|
|
|
|
|
|
|
|
|
|
|
2339219..2340322 |
CDS |
|
662 |
662 |
|
|
368 |
|
|
2340985..2342501 |
16s |
|
338 |
|
|
|
|
|
|
2342840..2345755 |
23s |
|
140 |
|
|
|
|
|
|
2345896..2345970 |
aac |
|
3 |
|
|
|
|
|
|
2345974..2346090 |
5s |
|
429 |
429 |
|
|
|
429
|
|
2346520..2348088 |
CDS |
|
3574 |
|
|
|
523 |
|
|
|
|
|
|
|
|
|
|
|
|
2351663..2352139 |
CDS |
|
568 |
568 |
|
|
159 |
|
|
2352708..2354224 |
16s |
|
338 |
|
|
|
|
|
|
2354563..2357477 |
23s |
|
140 |
|
|
|
|
|
|
2357618..2357692 |
aac |
|
3 |
|
|
|
|
|
|
2357696..2357812 |
5s |
|
90 |
90 |
|
|
|
90
|
|
2357903..2358316 |
CDS |
|
406783 |
|
|
|
138 |
|
|
|
|
|
|
|
|
|
|
|
|
2765100..2765525 |
CDS |
|
625 |
625 |
|
|
142 |
|
|
2766151..2767667 |
16s |
|
503 |
|
|
|
|
|
|
2768171..2771082 |
23s |
|
202 |
|
|
|
|
|
|
2771285..2771401 |
5s |
|
5 |
|
|
|
|
|
|
2771407..2771482 |
ttc |
|
6 |
|
|
6 |
|
|
|
2771489..2771565 |
gac |
|
25 |
|
|
25 |
|
|
|
2771591..2771665 |
gaa |
|
448 |
448 |
|
|
|
448
|
|
2772114..2774864 |
CDS |
|
781818 |
|
|
|
917 |
|
|
|
|
|
|
|
|
|
|
|
|
3556683..3557051 |
CDS |
|
565 |
565 |
|
|
123 |
565
|
|
3557617..3557691 |
gag |
|
925 |
925 |
|
|
|
|
comp |
3558617..3559759 |
CDS |
|
192275 |
|
|
|
381 |
|
|
|
|
|
|
|
|
|
|
|
comp |
3752035..3752652 |
CDS |
|
245 |
245 |
|
|
206 |
245
|
comp |
3752898..3752985 |
agt |
@1 |
711 |
711 |
|
|
|
|
comp |
3753697..3755112 |
CDS |
|
501326 |
|
|
|
472 |
|
|
|
|
|
|
|
|
|
|
|
comp |
4256439..4258403 |
CDS |
|
267 |
267 |
|
|
655 |
267
|
comp |
4258671..4258746 |
aaa |
|
79 |
|
79 |
|
|
|
comp |
4258826..4258901 |
cac |
|
7 |
|
7 |
|
|
|
comp |
4258909..4258985 |
aga |
|
35 |
|
35 |
|
|
|
comp |
4259021..4259094 |
gga |
|
752 |
752 |
|
|
|
|
|
4259847..4260392 |
CDS |
|
619853 |
|
|
|
182 |
|
|
|
|
|
|
|
|
|
|
|
comp |
4880246..4880488 |
CDS |
|
508 |
508 |
|
|
81 |
508
|
comp |
4880997..4881113 |
5s |
|
274 |
|
|
|
|
|
comp |
4881388..4884300 |
23s |
|
578 |
|
|
|
|
|
comp |
4884879..4886395 |
16s |
|
703 |
703 |
|
|
|
|
comp |
4887099..4888034 |
CDS |
|
1272704 |
|
|
|
312 |
|
|
|
|
|
|
|
|
|
|
|
comp |
6160739..6161977 |
CDS |
|
343 |
343 |
|
|
413 |
|
|
6162321..6162396 |
cca |
|
242 |
242 |
|
|
|
242
|
|
6162639..6163283 |
CDS |
|
2040 |
|
|
|
215 |
|
|
|
|
|
|
|
|
|
|
|
|
6165324..6165734 |
CDS |
|
222 |
222 |
|
|
137 |
|
comp |
6165957..6166032 |
ttc |
|
5 |
|
|
|
|
|
comp |
6166038..6166154 |
5s |
@2 |
188 |
188 |
|
|
|
188
|
|
6166343..6167074 |
CDS |
|
8085 |
|
|
|
244 |
|
|
|
|
|
|
|
|
|
|
|
comp |
6175160..6175597 |
CDS |
|
249 |
249 |
|
|
146 |
249
|
comp |
6175847..6175922 |
gca |
|
1 |
|
|
1 |
|
|
comp |
6175924..6176000 |
atgi |
|
44 |
|
|
|
|
|
comp |
6176045..6176161 |
5s |
|
138 |
|
|
|
|
|
comp |
6176300..6179216 |
23s |
|
339 |
|
|
|
|
|
comp |
6179556..6181072 |
16s |
|
567 |
567 |
|
|
|
|
comp |
6181640..6182446 |
CDS |
|
223 |
|
|
|
269 |
|
|
|
|
|
|
|
|
|
|
|
|
6182670..6183419 |
CDS |
|
190 |
190 |
|
|
250 |
190
|
comp |
6183610..6183685 |
aaa |
+ |
5 |
|
|
|
|
|
comp |
6183691..6183807 |
5s |
2 aaa |
159 |
159 |
|
|
|
159
|
comp |
6183967..6184914 |
CDS |
@3 |
294 |
294 |
|
|
316 |
294
|
comp |
6185209..6185284 |
aaa |
|
7 |
|
|
|
|
|
comp |
6185292..6185408 |
5s |
|
138 |
|
|
|
|
|
comp |
6185547..6188463 |
23s |
|
339 |
|
|
|
|
|
comp |
6188803..6190319 |
16s |
|
771 |
771 |
|
|
|
|
comp |
6191091..6192203 |
CDS |
|
7306 |
|
|
|
371 |
|
|
|
|
|
|
|
|
|
|
|
comp |
6199510..6202059 |
CDS |
|
661 |
661 |
|
|
850 |
|
comp |
6202721..6202837 |
5s |
@4 |
139 |
|
|
|
|
|
comp |
6202977..6205893 |
23s |
|
339 |
|
|
|
|
|
comp |
6206233..6207749 |
16s |
|
1102 |
|
|
|
|
|
comp |
6208852..6208968 |
5s |
|
138 |
|
|
|
|
|
comp |
6209107..6212023 |
23s |
|
339 |
|
|
|
|
|
comp |
6212363..6213879 |
16s |
|
502 |
502 |
|
|
|
502
|
comp |
6214382..6215329 |
CDS |
|
90019 |
|
|
|
316 |
|
|
|
|
|
|
|
|
|
|
|
comp |
6305349..6306314 |
CDS |
|
123 |
123 |
|
|
322 |
123
|
comp |
6306438..6306527 |
tcc |
|
281 |
281 |
|
|
|
|
comp |
6306809..6307984 |
CDS |
|
66527 |
|
|
|
392 |
|
|
|
|
|
|
|
|
|
|
|
|
6374512..6375684 |
CDS |
|
125 |
125 |
|
|
391 |
125
|
comp |
6375810..6375884 |
agg |
|
303 |
303 |
|
|
|
|
comp |
6376188..6378578 |
CDS |
|
13398 |
|
|
|
797 |
|
|
|
|
|
|
|
|
|
|
|
comp |
6391977..6392753 |
CDS |
|
114 |
114 |
|
|
259 |
114
|
comp |
6392868..6392984 |
5s |
|
134 |
|
|
|
|
|
comp |
6393119..6396033 |
23s |
|
214 |
|
|
|
|
|
comp |
6396248..6397764 |
16s |
|
1120 |
|
|
|
|
|
comp |
6398885..6399001 |
5s |
|
139 |
|
|
|
|
|
comp |
6399141..6402055 |
23s |
|
214 |
|
|
|
|
|
comp |
6402270..6403786 |
16s |
|
748 |
748 |
|
|
|
|
comp |
6404535..6405107 |
CDS |
|
31702 |
|
|
|
191 |
|
|
|
|
|
|
|
|
|
|
|
|
6436810..6437790 |
CDS |
|
192 |
192 |
|
|
327 |
|
comp |
6437983..6438059 |
gac |
+ |
6 |
|
6 |
|
|
|
comp |
6438066..6438141 |
gta |
3* |
14 |
|
14 |
|
|
|
comp |
6438156..6438230 |
gaa |
gac gta |
29 |
|
29 |
|
|
|
comp |
6438260..6438334 |
aca |
gaa aca – 1 |
10 |
|
10 |
|
|
|
comp |
6438345..6438421 |
gac |
|
6 |
|
6 |
|
|
|
comp |
6438428..6438503 |
gta |
|
16 |
|
16 |
|
|
|
comp |
6438520..6438594 |
gaa |
|
29 |
|
29 |
|
|
|
comp |
6438624..6438698 |
aca |
|
10 |
|
10 |
|
|
|
comp |
6438709..6438785 |
gac |
|
6 |
|
6 |
|
|
|
comp |
6438792..6438867 |
gta |
|
14 |
|
14 |
|
|
|
comp |
6438882..6438956 |
gaa |
|
162 |
162 |
|
|
|
162
|
comp |
6439119..6439685 |
CDS |
|
37865 |
|
|
|
189 |
|
cbei cumuls
- Lien tableur: cbei cumuls
- Légende:
- - avec et sans rRNA, fréquences des intercalaires dans les clusters avec rRNA ou sans rRNA.
- - cdsd, je ne choisis que le cds avec l'intercalaire le plus faible d'un cluster donné, en supposant que ce cds a été créé par le cluster lors des conversions.
- - cdsa, longueur du cds en aas ici.
- - 1 : occurences exclues de la moyenne. Sont exclus de la moyenne les jaunes 554 de cbei opérons.
- Notes:
C8. cumuls. Clostridium beijerinckii strain NCIMB 14988
opérons |
Fréquences intercalaires tRNAs |
Fréquences intercalaires cds |
Fréquences aas cds
|
|
|
effectif |
gammes |
sans rRNAs |
avec rRNAs |
gammes |
cds |
gammes |
cdsd |
gammes |
cdsa
|
avec rRNA |
opérons |
17 |
1 |
0 |
2 |
1 |
0 |
1 |
0 |
100 |
4
|
|
16 23 5s 0 |
7 |
20 |
34 |
3 |
50 |
2 |
50 |
2 |
200 |
19
|
|
16 atc gca |
1 |
40 |
12 |
1 |
100 |
7 |
100 |
6 |
300 |
11
|
|
16 23 5s a |
4 |
60 |
2 |
0 |
150 |
7 |
150 |
5 |
400 |
20
|
|
max a |
4 |
80 |
2 |
0 |
200 |
9 |
200 |
7 |
500 |
6
|
|
a doubles |
1 |
100 |
0 |
0 |
250 |
5 |
250 |
3 |
600 |
3
|
|
autres |
6 |
120 |
0 |
0 |
300 |
6 |
300 |
5 |
700 |
2
|
|
total aas |
19 |
140 |
0 |
0 |
350 |
6 |
350 |
2 |
800 |
1
|
sans |
opérons |
20 |
160 |
1 |
0 |
400 |
4 |
400 |
1 |
900 |
4
|
|
1 aa |
11 |
180 |
0 |
0 |
450 |
3 |
450 |
2 |
1000 |
1
|
|
max a |
19 |
200 |
0 |
0 |
500 |
2 |
500 |
0 |
1100 |
0
|
|
a doubles |
5 |
|
3 |
0 |
|
21 |
|
4 |
|
0
|
|
total aas |
74 |
|
54 |
6 |
|
72 |
|
37 |
|
71
|
total aas |
|
93 |
|
|
|
|
|
|
|
|
|
remarques |
|
6 |
|
|
|
|
|
|
|
|
|
avec jaune |
|
|
moyenne |
|
|
|
|
|
|
|
|
|
|
|
variance |
|
|
|
|
|
|
|
|
sans jaune |
|
|
moyenne |
18 |
7 |
|
350 |
|
195 |
|
328
|
|
|
|
variance |
17 |
9 |
|
225 |
|
111 |
|
206
|
cbei blocs
C8. Clostridium beijerinckii strain NCIMB 14988, cbei blocs.
16s |
213 |
503 |
339 |
|
23s |
108 |
202 |
138 |
|
5s |
14 |
5 |
44 |
|
atgi |
atgi |
ttc |
atgi |
|
|
|
|
|
|
16s |
339 |
502 |
578 |
|
23s |
273 |
205 |
274 |
|
5s |
|
|
|
|
|
|
|
|
|
aaa |
5 |
|
|
|
5s |
159 |
5s |
139 |
134
|
cds |
294 |
23s |
339 |
214
|
aaa |
7 |
16s |
1102 |
1120
|
5s |
138 |
5s |
138 |
139
|
23s |
339 |
23s |
339 |
214
|
16s |
|
16s |
|
|
|
|
|
|
|
16s |
338 |
338 |
16s |
140
|
23s |
140 |
140 |
gca |
3
|
aac |
3 |
3 |
atc |
111
|
5s |
aac |
aac |
23s |
70
|
|
|
|
5s |
5
|
|
|
|
ttc |
|
|
|
|
|
|
16s |
137 |
|
16s |
132
|
gca |
118 |
|
atc |
84
|
23s |
204 |
|
23s |
71
|
5s |
|
|
aac |
|
|
|
|
|
|
ttc |
5 |
|
|
|
5s |
|
|
|
|
cbei remarques
- Remarques des 6 @ de cbei opérons
- @ Un tRNA très rare même chez les eucaryotes, agt.
- @ Un 5s isolé avec un tRNA.
- @ Les cds candidats à la création
- - Un cds inséré dans un cluster, candidat pour la création. Ses 2 intercalaires sont faibles, 159 et 294, se trouvent dans les 36 1ers sur un total de 72 ( voir cbei cumuls ). C’est une protéine moyenne de 316 aas.
- - Les groupes de 2 clusters réunis par 2 cds. Ces cds sont colorés en vert comme candidats à la création:
- le groupe contenant @3, adresse 6181640, intercalaires des cds 567 223 190, taille en aas 269 250 ;
- le groupe d’ adresse 541440 contient 2 tgg, intercalaires des cds 208 97 252, taille en aas 127 356 ;
- le groupe d’ adresse 899535, intercalaires des cds 552 351 704, taille en aas 304 417 ;
- @ Un cluster à 2 blocs complets en rRNAs, séparés par un intercalaire de 1102 pbs pouvant contenir un protéine moyenne comme @3. Adresse 6202721. Et le même cluster se retrouve à l’adresse 6392868 avec le même intercalaire 1120. Les 2 clusters se différencient, en intra, uniquement par l’intercalaire 23s-5s qui est le même pour les 2 blocs du premier, 339, et pour le deuxième, 214. Ce qui prouve que ce n’est pas une simple copie.
- @ Les blocs 16s-atc-23s5s sont relativement nombreux quand les 16s-atcgca-23s5s existent. Voir la fiche des clostridia. Ici le 5s est remplacé par un tRNA aac ce qui renforce l’hypothèse de 5s comme modèle.
- @ Un rare triplet pour un firmicutes et en plus les 2 intercalaires sont de la même longueur que les 2 intercalaires avec les 2 cds du cluster, 307 234 439 299, alors que la moyenne des intercalaires entre aas, sans rRNA, et sans jaunes n’est que de 18 (écart 17), celle des cds 350 (écart 225), voir cbei cumuls.
- Séquence des doubles
- - Les doubles ne se trouvent que dans les clusters sans rRNAs puisqu’ils totalisent 74 tRNAs sur 93 et les tRNAs des clusters avec rRNA se trouvent à l’intérieur.
- - A part le triplet de @6 les clusters avec des doubles, signalés par le signe +, totalisent 5 sur 8 contenant plus d’un tRNA. Ce ne sont uniquement que des duplications de séquences colorées en cyan ou séparées par une bordure épaisse.
- - Les longueurs des séquences dupliquées sont: 2*2 4*3 1*4 1*5
- Notes
- - Les blocs à rRNAs, voir cbei blocs. Ils sont caractérisés par très peu de tRNAs internes ou externes et par 5 groupes de 2 clusters chacun (@3), totalisant 10 blocs sur 16 . La distribution est la suivante :
- 11 clusters complets sans tRNAs internes
- 2 clusters peu courants avec un tRNA entre 23s et 5s,
- 3 clusters avec tRNAs internes gcaatc gca atc voir la fiche des firmicutes.
- - 7 cds insérés dans les groupes à 2 clusters, candidats à la création .
- - Le 5s perçu comme un modèle dans @5, 16s-atc-23s-aac
- - Beaucoup de duplications dans les clusters sans rRNAs, caractéristique des firmicutes renforcée par la présence
- d’un cluster avec un triplet aux intercalaires de type cds plutôt que tRNAs.
- et des longueurs de séquences dupliquées variables: 2*2 4*3 1*4 1*5.
- Ces longs clusters sans rRNAs seraient alors issus des clusters longs à rRNAs , qui , quand ils existent dans les autres génomes étudiés des firmicutes, présentent des duplications analogues.
cbei distribution
- Lien tableur: cbei distribution
- Notes:
- - Tous les +5s sont des 1-3aas
- - aaa es composé de 2 +5s et 4 >1aa
- - gca de 2 +16s, 2 +5s
- - aac de 3 -5s et de 3 >1aa
Cl8 cbei, Clostridium beijerinckii strain NCIMB 14988. clostridia.
g1 |
|
t1 |
|
|
|
|
|
a atgi |
2 |
a tct |
|
tat |
|
atgf |
4
|
b att |
|
i act |
|
aat |
|
agt |
1
|
c ctt |
|
e cct |
|
cat |
|
cgc |
|
d gtt |
|
m gct |
|
gat |
|
ggt |
|
e ttc |
3 |
b tcc |
1 |
tac |
3 |
tgc |
1
|
f atc |
2 |
j acc |
1 |
aac |
6 |
agc |
2
|
g ctc |
1 |
f ccc |
|
cac |
3 |
cgt |
1
|
h gtc |
|
n gcc |
|
gac |
4 |
ggc |
2
|
i tta |
4 |
c tca |
2 |
taa |
|
tga |
|
j ata |
|
k aca |
4 |
aaa |
6 |
aga |
3
|
k cta |
3 |
g cca |
3 |
caa |
2 |
cga |
1
|
l gta |
5 |
o gca |
4 |
gaa |
4 |
gga |
5
|
m ttg |
1 |
d tcg |
|
tag |
|
tgg |
2
|
n atgj |
2 |
l acg |
|
aag |
1 |
agg |
1
|
o ctg |
|
h ccg |
|
cag |
1 |
cgg |
|
p gtg |
|
p gcg |
|
gag |
1 |
ggg |
1
|
clos |
>1aa |
=1aa |
-5s |
+5s |
-16s |
+16s |
total
|
cbei |
63 |
11 |
3 |
12* |
|
4 |
93
|
cbei intercalaires entre cds
- Lien NCBI [19]
- Note: Pour les génomes des annexes j'ai relevé les intercalaires entre tRNAs et entre ceux-ci et les cds qui leur sont adjacents. L'exemple est celui de rru du clade alpha. L'idée de départ de ces prélèvements est la recherche d'opérons formés de tRNA et de protéine comme dans le cas d'E.coli: l'intercalaire entre le tRNA et la protéine devrait être faible. Voir l'exemple d'eco (remarque @3) avec tac-tac-tpr et aca-tac-gga-acc-tufB.
Fréquences: gammes, moyennes et variances
intercalaires total % intercalaires moyenne ecartype plage ADN
négatif 329 5.8 négatif -12 11 -1 à -63 6,485,394
zéro 74 1.3 intercals
1 à 200 3041 54 0 à 200 81 61 1,281,294
201 à 370 1256 22 201 à 370 275 48 20%
371 à 600 724 12.8 371 à 600 465 66 18%
601 à max 326 5.7 601 à 1556 818 215
Total 5676 Total 5658 208 216 -63 à 1556
cbei les fréquences
- Lien tableur: cbei intercalaires entre cds
- Légende: long, longueur en pbs.
- - 16s, 23s5s, blocs à rRNAs seuls.Voir cbei opérons pour leurs intercalaires
- - agc, aaa-atc, blocs à tRNAs seuls. Voir cbei opérons pour leurs intercalaires
cbei Les fréquences des intercalaires entre cds
adresse |
intercal |
inter-gène |
long |
intercal |
fréquence |
cumul/% |
intercal |
fréquence
|
6199510 |
12323 |
2x16s |
11154 |
-70 |
1 |
|
0 |
74
|
6391977 |
11782 |
2x16s |
10914 |
-60 |
3 |
|
-1 |
0
|
4880246 |
6611 |
16s |
7038 |
-50 |
1 |
|
-2 |
0
|
144627 |
6410 |
|
|
-40 |
8 |
|
-3 |
85
|
2097496 |
6292 |
|
|
-30 |
11 |
min à -1 |
-4 |
1
|
2765706 |
6241 |
|
|
-20 |
33 |
329 |
-5 |
0
|
2339219 |
6198 |
|
|
-10 |
100 |
5.8% |
-6 |
8
|
892419 |
6196 |
|
|
0 |
246 |
|
-7 |
73
|
6183967 |
6177 |
|
|
10 |
264 |
|
-8 |
0
|
6175160 |
6043 |
|
|
20 |
373 |
|
-9 |
5
|
900798 |
5934 |
|
|
30 |
224 |
|
-10 |
38
|
2351663 |
5764 |
|
|
40 |
138 |
|
-11 |
0
|
413861 |
5602 |
16s 2aas |
4866 |
50 |
131 |
|
-12 |
4
|
402474 |
2353 |
19aas |
1902 |
60 |
154 |
|
-13 |
21
|
1860894 |
2122 |
néant |
|
70 |
123 |
|
-14 |
0
|
124928 |
1934 |
10aas |
994 |
80 |
121 |
|
-15 |
3
|
1898453 |
1882 |
néant |
|
90 |
126 |
|
-16 |
21
|
4639922 |
1556 |
néant |
|
100 |
129 |
|
-17 |
0
|
6361933 |
1546 |
néant |
|
110 |
135 |
|
-18 |
2
|
138638 |
1505 |
3aas |
898 |
120 |
122 |
|
-19 |
11
|
5176736 |
1500 |
néant |
|
130 |
115 |
|
-20 |
1
|
772270 |
1492 |
tmRNA |
358 |
140 |
116 |
|
-21 |
1
|
2532196 |
1483 |
néant |
|
150 |
137 |
|
-22 |
9
|
3181990 |
1470 |
néant |
|
160 |
132 |
|
-23 |
0
|
4256439 |
1444 |
4aas |
424 |
170 |
119 |
1 à 200 |
-24 |
2
|
4033167 |
1432 |
néant |
|
180 |
109 |
3041 |
-25 |
11
|
4590435 |
1430 |
néant |
|
190 |
103 |
54% |
-26 |
0
|
3571512 |
1392 |
néant |
|
200 |
96 |
|
-27 |
4
|
4428508 |
1373 |
néant |
|
210 |
111 |
|
-28 |
5
|
5504697 |
1349 |
néant |
|
220 |
92 |
|
-29 |
0
|
6436810 |
1329 |
11aas |
974 |
230 |
93 |
|
-30 |
0
|
1486045 |
1327 |
néant |
|
240 |
89 |
|
-31 |
0
|
2570075 |
1303 |
néant |
|
250 |
85 |
|
-32 |
0
|
4602139 |
1290 |
néant |
|
260 |
81 |
|
|
379
|
486264 |
1267 |
|
|
270 |
82 |
|
reste |
24
|
3981561 |
1240 |
|
|
280 |
83 |
|
|
403
|
4621836 |
1227 |
|
|
290 |
63 |
|
|
|
4088892 |
1222 |
|
|
300 |
77 |
|
600 |
5350
|
4296061 |
1208 |
|
|
310 |
60 |
|
650 |
67
|
6061011 |
1206 |
|
|
320 |
67 |
|
700 |
54
|
2648455 |
1202 |
|
|
330 |
62 |
|
750 |
41
|
|
|
|
|
340 |
60 |
201 à 370 |
800 |
30
|
|
|
|
|
350 |
58 |
1256 |
850 |
21
|
|
|
|
|
360 |
44 |
22% |
900 |
16
|
4624137 |
-109 |
shift 2 |
673 |
370 |
49 |
|
950 |
11
|
1868484 |
-63 |
shift 2 |
608 |
380 |
54 |
|
1000 |
13
|
3204859 |
-63 |
shift 2 |
665 |
390 |
55 |
|
1050 |
12
|
2485518 |
-61 |
shift 2 |
184 |
400 |
42 |
|
1100 |
10
|
3963063 |
-59 |
|
|
410 |
45 |
|
1150 |
5
|
2029018 |
-49 |
|
|
420 |
46 |
|
1200 |
5
|
5912545 |
-48 |
|
|
430 |
33 |
|
1250 |
6
|
5354783 |
-46 |
|
|
440 |
38 |
|
1300 |
2
|
1515675 |
-45 |
|
|
450 |
38 |
|
1350 |
4
|
4067020 |
-43 |
|
|
460 |
40 |
|
1400 |
2
|
5920392 |
-43 |
|
|
470 |
33 |
|
1450 |
3
|
1552479 |
-42 |
|
|
480 |
26 |
|
1500 |
4
|
330305 |
-40 |
|
|
490 |
24 |
|
1550 |
2
|
4488902 |
-39 |
|
|
500 |
28 |
|
1600 |
1
|
2489800 |
-37 |
|
|
510 |
25 |
|
|
17
|
2856876 |
-37 |
|
|
520 |
19 |
|
|
|
4401424 |
-37 |
|
|
530 |
23 |
|
|
|
4678887 |
-37 |
|
|
540 |
27 |
371 à 600 |
|
|
5785183 |
-37 |
|
|
550 |
18 |
724 |
|
|
3964014 |
-36 |
|
|
560 |
23 |
12.8% |
|
|
1257344 |
-34 |
|
|
570 |
25 |
|
|
|
4675094 |
-34 |
|
|
580 |
22 |
601 à max |
|
|
5049699 |
-34 |
|
|
590 |
21 |
326 |
|
|
5333371 |
-34 |
|
|
600 |
19 |
5.7% |
|
|
Negativicutes
Acidaminococcus fermentans DSM 20731
afn opérons
- Lien tableur: afn opérons
- Liens: gtRNAdb [20], NCBI [21], génome []
- Phylogénie: Bacteria; Firmicutes; Negativicutes; Acidaminococcales; Acidaminococcaceae; Acidaminococcus.
N1. Acidaminococcus fermentans DSM 20731
56%GC |
30.6.19 Paris |
60 |
doubles |
intercalaire
|
|
24678..26242 |
16s |
@1 |
359
|
|
26602..29507 |
23s |
|
228
|
|
29736..29852 |
5s |
|
|
|
|
|
|
|
|
36819..36894 |
acg |
|
|
|
|
|
|
|
|
57713..59277 |
16s |
|
359
|
|
59637..62543 |
23s |
|
228
|
|
62772..62888 |
5s |
|
|
|
|
|
|
|
|
169459..169534 |
gcc |
|
|
|
|
|
|
|
|
249791..249867 |
agg |
|
|
|
|
|
|
|
comp |
274627..274703 |
cgt |
|
|
|
|
|
|
|
|
311123..311198 |
aca |
|
22
|
|
311221..311305 |
tac |
|
5
|
|
311311..311386 |
atg |
|
3
|
|
311390..311465 |
acc |
|
6
|
|
311472..311548 |
atgf |
|
|
|
|
|
|
|
|
380482..382046 |
16s |
|
251
|
|
382298..385204 |
23s |
|
229
|
|
385434..385550 |
5s |
|
|
|
|
|
|
|
|
461553..461627 |
aac |
|
3
|
|
461631..461705 |
gaa |
|
8
|
|
461714..461789 |
gta |
|
50
|
|
461840..461916 |
cca |
|
11
|
|
461928..462001 |
gga |
|
8
|
|
462010..462086 |
aga |
|
|
|
|
|
|
|
|
526984..527070 |
ctg |
+ |
30
|
|
527101..527186 |
ctc |
2 ctg |
52
|
|
527239..527325 |
ctg |
|
|
|
|
|
|
|
|
578049..578123 |
ggc |
|
|
|
|
|
|
|
|
636984..638548 |
16s |
@2 |
94
|
|
638643..638719 |
atc |
|
66
|
|
638786..638861 |
gca |
|
273
|
|
639135..642040 |
23s |
|
139
|
|
642180..642296 |
5s |
|
|
|
|
|
|
|
|
712229..712304 |
cac |
|
18
|
|
712323..712398 |
caa |
|
3
|
|
712402..712477 |
aaa |
|
16
|
|
712494..712577 |
cta |
|
|
|
|
|
|
|
comp |
724421..724497 |
gtc |
|
|
|
|
|
|
|
|
774880..774956 |
gac |
|
4
|
|
774961..775036 |
ttc |
|
8
|
|
775045..775119 |
ggc |
|
9
|
|
775129..775202 |
tgc |
|
13
|
|
775216..775304 |
tta |
|
|
|
|
|
|
|
|
796654..796728 |
cgg |
|
|
|
|
|
|
|
|
842393..842469 |
gac |
|
2
|
|
842472..842547 |
ttc |
|
8
|
|
842556..842630 |
ggc |
|
9
|
|
842640..842713 |
tgc |
|
|
|
|
|
|
|
|
889670..889746 |
ccc |
|
|
|
|
|
|
|
|
906136..906210 |
aac |
|
|
|
|
|
|
|
|
1022783..1022859 |
gac |
|
2
|
|
1022862..1022936 |
ggc |
|
1
|
|
1022938..1023011 |
tgg |
|
|
|
|
|
|
|
|
1555201..1555277 |
ccg |
|
|
|
|
|
|
|
comp |
1567911..1567999 |
tca |
|
|
|
|
|
|
|
comp |
1613773..1613863 |
agc |
|
|
|
|
|
|
|
|
1702659..1702744 |
ttg |
|
|
|
|
|
|
|
comp |
1711770..1711886 |
5s |
|
228
|
comp |
1712115..1715021 |
23s |
|
359
|
comp |
1715381..1716945 |
16s |
|
|
|
|
|
|
|
comp |
1823852..1823927 |
gta |
|
6
|
comp |
1823934..1824008 |
gaa |
|
8
|
comp |
1824017..1824092 |
aag |
|
|
|
|
|
|
|
|
1909446..1909536 |
tcc |
|
|
|
|
|
|
|
comp |
1911342..1911429 |
tcg |
|
|
|
|
|
|
|
comp |
1974984..1975058 |
atgi |
|
|
|
|
|
|
|
comp |
1984782..1984856 |
gag |
|
12
|
comp |
1984869..1984942 |
cag |
+ |
111
|
comp |
1985054..1985127 |
cag |
2 cag |
|
|
|
|
|
|
comp |
2072279..2072395 |
5s |
|
228
|
comp |
2072624..2075529 |
23s |
|
298
|
comp |
2075828..2075903 |
gca |
|
66
|
comp |
2075970..2076046 |
atc |
|
94
|
comp |
2076141..2077705 |
16s |
|
|
|
|
|
|
|
|
2148343..2148418 |
gcg |
|
|
|
|
|
|
|
comp |
2287117..2287192 |
aaa |
|
|
|
|
|
|
|
comp |
2303018..2303094 |
gtg |
|
|
|
|
|
|
|
comp |
2323563..2323636 |
ggg |
|
|
afn cumuls
cumuls. afn
opérons |
Fréquences
|
|
|
effectifs |
gammes |
sans rRNAs |
avec rRNAs
|
avec rRNA |
opérons |
6 |
1 |
1 |
-
|
|
16 23 5s 0 |
4 |
20 |
21 |
|
|
16 atc gca |
2 |
40 |
2 |
|
|
16 23 5s a |
0 |
60 |
2 |
|
|
max a |
2 |
80 |
0 |
|
|
a doubles |
0 |
100 |
0 |
|
|
spéciaux |
0 |
120 |
1 |
|
|
total aas |
4 |
140 |
0 |
|
sans |
opérons |
29 |
160 |
0 |
|
|
1 aa |
20 |
180 |
0 |
|
|
max a |
6 |
200 |
0 |
|
|
a doubles |
2 |
|
0 |
|
|
total aas |
56 |
|
27 |
0
|
total aas |
|
60 |
|
|
|
remarques |
|
2 |
|
|
|
avec jaune |
|
|
moyenne |
16 |
|
|
|
|
variance |
23 |
|
sans jaune |
|
|
moyenne |
12 |
|
|
|
|
variance |
13 |
|
afn blocs
N1. afn blocs
16s |
359 |
1565 |
359 |
1565 |
251 |
1565
|
23s |
228 |
2906 |
228 |
2907 |
229 |
2907
|
5s |
|
117 |
|
117 |
|
117
|
|
|
|
|
|
|
|
16s |
94 |
1565 |
|
5s |
228 |
117
|
atc |
66 |
|
|
23s |
298 |
2906
|
gca |
273 |
|
|
gca |
66 |
|
23s |
139 |
2906 |
|
atc |
94 |
|
5s |
|
117 |
|
16s |
|
1565
|
|
|
|
|
|
|
|
5s |
228 |
117 |
|
|
|
|
23s |
359 |
2907 |
|
|
|
|
16s |
|
1565 |
|
|
|
|
afn remarques
- Lien tableur: afn remarques
- Remarques : 4 blocs 16-23-5s sans aas et très peu de doubles. Très simple.
- @ 4 blocs 16-23-5s sans aas .
- - 3 opérons ont leurs intercalaires identiques, 359 228.
- - 1 opéron a son intercalaire 16s-23s diminué de 30%, 108/359, l’autre intercalaire est commune aux 4 opérons.
- @ 2 blocs 16-atc gca 23s-5s, classiques mais sans aas en plus.
- - 3 intercallaires sont identiques et celui entre 23s-5s varie du simple au double, 94 66 298 228 et 94 66 273 139.
- Séquences des doubles : Très peu de doubles, 2 opérons à 2aas et plus sur 11 ont des doubles.
- - 2 doublets au total: opéron ctc + 2ctg et opéron gag + 2cag.
afn distribution
- Lien tableur: afn distribution
- Notes:
- - cag2 est un double, en gras
- - ggc est composé de 1 1aa et 3 >1aa, les autres soulignés contiennent 1 et 1 respectivement.
Cl9 afn, Acidaminococcus fermentans DSM 20731. Negativicutes.
Cl91 distribution du total
g1 |
|
t1 |
|
|
|
|
|
a atgi |
1 |
a tct |
|
tat |
|
atgf |
1
|
b att |
|
i act |
|
aat |
|
agt |
|
c ctt |
|
e cct |
|
cat |
|
cgc |
|
d gtt |
|
m gct |
|
gat |
|
ggt |
|
e ttc |
1 |
b tcc |
2 |
tac |
1 |
tgc |
2
|
f atc |
2 |
j acc |
1 |
aac |
2 |
agc |
1
|
g ctc |
1 |
f ccc |
1 |
cac |
1 |
cgt |
1
|
h gtc |
1 |
n gcc |
1 |
gac |
3 |
ggc |
4
|
i tta |
1 |
c tca |
1 |
taa |
|
tga |
|
j ata |
|
k aca |
1 |
aaa |
2 |
aga |
1
|
k cta |
1 |
g cca |
1 |
caa |
1 |
cga |
|
l gta |
2 |
o gca |
2 |
gaa |
2 |
gga |
1
|
m ttg |
1 |
d tcg |
1 |
tag |
|
tgg |
1
|
n atgj |
1 |
l acg |
1 |
aag |
1 |
agg |
1
|
o ctg |
2 |
h ccg |
1 |
cag |
2 |
cgg |
1
|
p gtg |
1 |
p gcg |
1 |
gag |
1 |
ggg |
1
|
clos |
>1aa |
1aa |
-5s |
+5s |
-16s |
+16s |
total
|
afn |
36 |
20 |
|
|
|
4 |
60
|
|
Cl92 afn, distribution des solitaires
g1 |
|
t1 |
|
|
|
|
|
a atgi |
1 |
a tct |
|
tat |
|
atgf |
|
b att |
|
i act |
|
aat |
|
agt |
|
c ctt |
|
e cct |
|
cat |
|
cgt |
|
d gtt |
|
m gct |
|
gat |
|
ggt |
|
e ttc |
|
b tcc |
1 |
tac |
|
tgc |
|
f atc |
|
j acc |
|
aac |
1 |
agc |
1
|
g ctc |
|
f ccc |
1 |
cac |
|
cgc |
1
|
h gtc |
1 |
n gcc |
1 |
gac |
|
ggc |
1
|
i tta |
|
c tca |
1 |
taa |
|
tga |
|
j ata |
|
k aca |
|
aaa |
1 |
aga |
|
k cta |
|
g cca |
|
caa |
|
cga |
|
l gta |
|
o gca |
|
gaa |
|
gga |
|
m ttg |
1 |
d tcg |
1 |
tag |
|
tgg |
|
n atgj |
|
l acg |
1 |
aag |
|
agg |
1
|
o ctg |
|
h ccg |
1 |
cag |
|
cgg |
1
|
p gtg |
1 |
p gcg |
1 |
gag |
|
ggg |
1
|
afn |
>1aa |
1aa |
-5s |
+5s |
-16s |
+16s |
total
|
type |
|
20 |
|
|
|
|
20
|
|
Cl93 afn, distribution des >1aa et duplicata
g1 |
|
t1 |
|
|
|
|
|
a atgi |
|
a tct |
|
tat |
|
atgf |
1
|
b att |
|
i act |
|
aat |
|
agt |
|
c ctt |
|
e cct |
|
cat |
|
cgt |
|
d gtt |
|
m gct |
|
gat |
|
ggt |
|
e ttc |
1 |
b tcc |
1 |
tac |
1 |
tgc |
2
|
f atc |
|
j acc |
1 |
aac |
1 |
agc |
|
g ctc |
1 |
f ccc |
|
cac |
1 |
cgc |
|
h gtc |
|
n gcc |
|
gac |
3 |
ggc |
3
|
i tta |
1 |
c tca |
|
taa |
|
tga |
|
j ata |
|
k aca |
1 |
aaa |
1 |
aga |
1
|
k cta |
1 |
g cca |
1 |
caa |
1 |
cga |
|
l gta |
2 |
o gca |
|
gaa |
2 |
gga |
1
|
m ttg |
|
d tcg |
|
tag |
|
tgg |
1
|
n atgj |
1 |
l acg |
|
aag |
1 |
agg |
|
o ctg |
2 |
h ccg |
|
cag |
2 |
cgg |
|
p gtg |
|
p gcg |
|
gag |
1 |
ggg |
|
ade |
>1aa |
dupli |
-5s |
+5s |
-16s |
+16s |
total
|
type |
34 |
2 |
|
|
|
|
36
|
|
afn intercalaires entre cds
- Lien NCBI [22]
- Note: Pour les génomes des annexes j'ai relevé les intercalaires entre tRNAs et entre ceux-ci et les cds qui leur sont adjacents. L'exemple est celui de rru du clade alpha. L'idée de départ de ces prélèvements est la recherche d'opérons formés de tRNA et de protéine comme dans le cas d'E.coli: l'intercalaire entre le tRNA et la protéine devrait être faible. Voir l'exemple d'eco (remarque @3) avec tac-tac-tpr et aca-tac-gga-acc-tufB.
afn les fréquences
- Lien tableur: afn intercalaires entre cds
- Légende: long, longueur en pbs, intercal pour intercalaire
- - fréquence-1 1 5 6 f, respectivement fréquence des intercalaires négatives à l'unité, positives à l'unité, par blocs de 5, par blocs de 10 jusqu'à 600 pbs et f pour finales. Ces fréquences servent à faire les diagrammes. La fréquence fréquence6 est étendue à 1200 pour certains grands génomes.
- - cumul,% colonne à la droite de frequence6, reprend les fréquences par plages et leurs pourcentages indiqués déjà dans la 1ère partie du tableau.
- - La couleur cyan des fréquences fréquence-1 et 1 sert à montrer leur périodicité ternaire.
- - intercaln intercalx, pour les intercalaires négatifs minimaux et intercalaires positifs maximaux.
- - colonne ADN pour la longueur totale du génome en pbs et intercals pour le total en pbs des intercalaires entre cds uniquement, d'après la méthode des prélèvements de NCBI du 30.8.20.
afn Les fréquences des intercalaires entre cds
afn |
intercalaires |
total |
% |
intercalaires |
moyenne |
ecartype |
plage |
ADN |
intercal |
frequence5
|
|
négatif |
307 |
15.1 |
négatif |
-10 |
14 |
-1 à -83 |
2 329 769 |
-1 |
307
|
|
zéro |
11 |
0.5 |
|
|
|
|
intercals |
0 |
11
|
|
1 à 200 |
1325 |
65.0 |
0 à 200 |
66 |
58 |
|
220 467 |
5 |
127
|
|
201 à 370 |
304 |
14.9 |
201 à 370 |
267 |
49 |
|
9.5% |
10 |
57
|
|
371 à 600 |
69 |
3.4 |
371 à 600 |
449 |
59 |
|
|
15 |
164
|
|
601 à max |
23 |
1.1 |
601 à 992 |
743 |
108 |
|
|
20 |
87
|
|
total 2039 |
<201 |
80.6 |
total 2035 |
105 |
133 |
-83 à 992 |
|
25 |
65
|
adresse |
intercalx |
intercal |
fréquence1 |
intercal |
fréquence6 |
cumul,% |
intercal |
fréquence-1 |
30 |
47
|
1555671 |
2261 |
-1 |
307 |
-70 |
5 |
|
0 |
11 |
35 |
37
|
1949615 |
1154 |
0 |
11 |
-60 |
3 |
|
-1 |
38 |
40 |
32
|
1841522 |
1130 |
1 |
39 |
-50 |
3 |
|
-2 |
0 |
45 |
25
|
1001677 |
992 |
2 |
27 |
-40 |
4 |
|
-3 |
0 |
50 |
28
|
434858 |
957 |
3 |
20 |
-30 |
10 |
min à -1 |
-4 |
130 |
55 |
31
|
865205 |
922 |
4 |
28 |
-20 |
17 |
307 |
-5 |
0 |
60 |
29
|
463581 |
845 |
5 |
13 |
-10 |
48 |
15.1% |
-6 |
1 |
65 |
23
|
1969579 |
795 |
6 |
9 |
0 |
228 |
|
-7 |
6 |
70 |
25
|
1287774 |
772 |
7 |
5 |
10 |
184 |
|
-8 |
41 |
75 |
32
|
843665 |
744 |
8 |
7 |
20 |
251 |
|
-9 |
1 |
80 |
17
|
1081454 |
736 |
9 |
20 |
30 |
112 |
|
-10 |
1 |
85 |
25
|
34 |
721 |
10 |
16 |
40 |
69 |
|
-11 |
19 |
90 |
28
|
1347444 |
718 |
11 |
29 |
50 |
53 |
|
-12 |
0 |
95 |
16
|
2155062 |
701 |
12 |
46 |
60 |
60 |
|
-13 |
5 |
100 |
29
|
1227328 |
693 |
13 |
30 |
70 |
48 |
|
-14 |
8 |
105 |
20
|
893831 |
683 |
14 |
22 |
80 |
49 |
|
-15 |
0 |
110 |
22
|
1185969 |
679 |
15 |
37 |
90 |
53 |
1 à 100 |
-16 |
3 |
115 |
28
|
1657318 |
677 |
16 |
24 |
100 |
45 |
924 |
-17 |
10 |
120 |
22
|
1282010 |
667 |
17 |
10 |
110 |
42 |
36.3% |
-18 |
0 |
125 |
29
|
872797 |
649 |
18 |
25 |
120 |
50 |
|
-19 |
2 |
130 |
29
|
1240102 |
647 |
19 |
13 |
130 |
58 |
|
-20 |
6 |
135 |
24
|
1246797 |
636 |
20 |
15 |
140 |
55 |
|
-21 |
0 |
140 |
31
|
117980 |
628 |
21 |
21 |
150 |
42 |
|
-22 |
0 |
145 |
20
|
867763 |
580 |
22 |
14 |
160 |
41 |
|
-23 |
4 |
150 |
22
|
406827 |
567 |
23 |
11 |
170 |
38 |
1 à 200 |
-24 |
0 |
155 |
18
|
1121221 |
551 |
24 |
10 |
180 |
24 |
1325 |
-25 |
0 |
160 |
23
|
2231462 |
551 |
25 |
9 |
190 |
26 |
65% |
-26 |
4 |
165 |
21
|
901417 |
550 |
26 |
6 |
200 |
25 |
|
-27 |
0 |
170 |
17
|
39288 |
548 |
27 |
15 |
210 |
25 |
|
-28 |
0 |
175 |
11
|
791634 |
544 |
28 |
10 |
220 |
32 |
|
-29 |
3 |
180 |
13
|
1481233 |
542 |
29 |
5 |
230 |
34 |
|
-30 |
0 |
185 |
8
|
691218 |
519 |
30 |
11 |
240 |
33 |
0 à 200 |
-31 |
2 |
190 |
18
|
1388835 |
517 |
31 |
7 |
250 |
18 |
1336 |
-32 |
2 |
195 |
16
|
2163709 |
515 |
32 |
7 |
260 |
16 |
|
total |
297 |
200 |
9
|
1189403 |
513 |
33 |
5 |
270 |
21 |
|
reste |
21 |
205 |
15
|
1783994 |
508 |
34 |
10 |
280 |
16 |
|
|
318 |
210 |
10
|
1749779 |
507 |
35 |
8 |
290 |
11 |
|
|
|
215 |
18
|
847959 |
503 |
36 |
6 |
300 |
17 |
|
intercal |
fréquencef |
220 |
14
|
1268481 |
502 |
37 |
8 |
310 |
15 |
|
600 |
2016 |
225 |
23
|
|
|
38 |
6 |
320 |
8 |
|
620 |
|
230 |
11
|
|
|
39 |
8 |
330 |
13 |
|
640 |
2 |
235 |
14
|
|
|
40 |
4 |
340 |
9 |
201 à 370 |
660 |
2 |
240 |
19
|
|
|
reste |
1105 |
350 |
12 |
304 |
680 |
3 |
245 |
7
|
|
|
total |
2039 |
360 |
10 |
14.9% |
700 |
2 |
250 |
11
|
adresse |
intercaln |
décalage |
long |
370 |
14 |
|
720 |
2 |
255 |
5
|
2109623 |
-113 |
shift2 |
425 |
380 |
8 |
|
740 |
2 |
260 |
11
|
598105 |
-83 |
comp |
|
390 |
7 |
|
760 |
1 |
265 |
7
|
1667526 |
-79 |
shift2 |
915 |
400 |
7 |
|
780 |
1 |
270 |
14
|
2031132 |
-74 |
shift2 |
614 |
410 |
1 |
|
800 |
1 |
275 |
5
|
935587 |
-71 |
shift2 |
518 |
420 |
5 |
|
820 |
|
280 |
11
|
2283155 |
-68 |
shift2 |
1952 |
430 |
2 |
|
840 |
|
285 |
8
|
846262 |
-67 |
shift2 |
132 |
440 |
4 |
|
860 |
1 |
290 |
3
|
1528664 |
-67 |
shift2 |
108 |
450 |
4 |
|
880 |
|
295 |
7
|
1794682 |
-59 |
shift2 |
1601 |
460 |
3 |
|
900 |
|
300 |
10
|
808710 |
-53 |
shift2 |
1034 |
470 |
1 |
|
920 |
|
305 |
10
|
1101239 |
-50 |
shift2 |
2423 |
480 |
5 |
|
940 |
1 |
310 |
5
|
287845 |
-45 |
|
|
490 |
1 |
|
960 |
1 |
315 |
4
|
532761 |
-44 |
|
|
500 |
5 |
|
980 |
|
320 |
4
|
50634 |
-41 |
|
|
510 |
4 |
|
1000 |
1 |
325 |
8
|
434100 |
-40 |
|
|
520 |
4 |
|
1020 |
|
330 |
5
|
276227 |
-38 |
|
|
530 |
0 |
|
1040 |
|
335 |
3
|
629222 |
-38 |
|
|
540 |
0 |
371 à 600 |
1060 |
|
340 |
6
|
1090320 |
-37 |
|
|
550 |
4 |
69 |
1080 |
|
345 |
9
|
503812 |
-35 |
|
|
560 |
2 |
3.4% |
1100 |
|
350 |
3
|
1225885 |
-35 |
|
|
570 |
1 |
|
1120 |
|
355 |
3
|
1260789 |
-35 |
|
|
580 |
1 |
601 à max |
1140 |
1 |
360 |
7
|
706234 |
-32 |
|
|
590 |
0 |
23 |
1160 |
1 |
365 |
8
|
2148489 |
-32 |
|
|
600 |
0 |
1.1% |
|
22 |
370 |
6
|
460032 |
-31 |
|
|
reste |
23 |
|
reste |
1 |
reste |
92
|
1743849 |
-31 |
|
|
total |
2039 |
|
total |
2039 |
total |
2039
|
afn autres intercalaires
- Lien tableur: afn autres intercalaires
- Légende:
- - comp, le gène est sur le brin complement
- - deb, fin sont respectivement dans le sens des adresses croissantes, le cds avant le 1er tRNA et le cds après le dernier tRNA du bloc.
afn Les autres intercalaires.
afn1 adresses1
deb-fin |
gènes |
adresses |
intercal |
sens
|
deb |
CDS |
23699 |
319 |
|
|
rRNA |
24678 |
359 |
|
|
rRNA |
26602 |
228 |
|
|
rRNA |
29736 |
286 |
|
fin |
CDS |
30139 |
|
|
deb |
CDS |
35919 |
105 |
|
|
tRNA |
36819 |
105 |
|
fin |
CDS |
37000 |
|
|
deb |
CDS |
56077 |
346 |
|
|
rRNA |
57713 |
359 |
|
|
rRNA |
59637 |
228 |
|
|
rRNA |
62772 |
266 |
|
fin |
CDS |
63155 |
|
comp
|
deb |
CDS |
168443 |
122 |
|
|
tRNA |
169459 |
361 |
|
fin |
CDS |
169896 |
|
comp
|
deb |
CDS |
181646 |
89 |
comp
|
|
misc_binding |
182746 |
130 |
comp
|
fin |
CDS |
183117 |
|
comp
|
deb |
CDS |
183775 |
510 |
comp
|
|
misc_binding |
185671 |
146 |
|
fin |
CDS |
186056 |
|
|
deb |
CDS |
249164 |
195 |
|
|
tRNA |
249791 |
51 |
|
fin |
CDS |
249919 |
|
comp
|
deb |
CDS |
253385 |
90 |
|
|
misc_binding |
254915 |
84 |
|
fin |
CDS |
255255 |
|
|
deb |
CDS |
273899 |
200 |
comp
|
|
tRNA |
274627 |
188 |
comp
|
fin |
CDS |
274892 |
|
|
deb |
CDS |
310188 |
131 |
|
|
tRNA |
311123 |
22 |
|
|
tRNA |
311221 |
5 |
|
|
tRNA |
311311 |
3 |
|
|
tRNA |
311390 |
6 |
|
|
tRNA |
311472 |
74 |
|
fin |
CDS |
311623 |
|
|
deb |
CDS |
359181 |
58 |
|
|
regulatory |
360286 |
52 |
|
fin |
CDS |
360447 |
|
|
deb |
CDS |
378908 |
485 |
|
|
rRNA |
380482 |
251 |
|
|
rRNA |
382298 |
229 |
|
|
rRNA |
385434 |
262 |
|
fin |
CDS |
385813 |
|
comp
|
deb |
CDS |
414288 |
246 |
|
|
regulatory |
416478 |
98 |
|
fin |
CDS |
416689 |
|
|
deb |
CDS |
460654 |
266 |
|
|
tRNA |
461553 |
3 |
|
|
tRNA |
461631 |
8 |
|
|
tRNA |
461714 |
50 |
|
|
tRNA |
461840 |
11 |
|
|
tRNA |
461928 |
8 |
|
|
tRNA |
462010 |
145 |
|
fin |
CDS |
462232 |
|
|
deb |
CDS |
466993 |
232 |
|
|
misc_binding |
468950 |
36 |
|
fin |
CDS |
469185 |
|
|
deb |
CDS |
526396 |
54 |
|
|
tRNA |
526984 |
30 |
|
|
tRNA |
527101 |
52 |
|
|
tRNA |
527239 |
268 |
|
fin |
CDS |
527594 |
|
comp
|
deb |
CDS |
570200 |
65 |
comp
|
|
regulatory |
571573 |
209 |
comp
|
fin |
CDS |
571879 |
|
|
deb |
CDS |
577378 |
131 |
|
|
tRNA |
578049 |
194 |
|
fin |
CDS |
578318 |
|
|
|
afn2 adresses2
deb-fin |
gènes |
adresses |
intercal |
sens
|
deb |
CDS |
635289 |
300 |
|
|
rRNA |
636984 |
94 |
|
|
tRNA |
638643 |
66 |
|
|
tRNA |
638786 |
273 |
|
|
rRNA |
639135 |
139 |
|
|
rRNA |
642180 |
296 |
|
fin |
CDS |
642593 |
|
|
deb |
CDS |
677296 |
181 |
|
|
misc_feature |
678359 |
368 |
|
fin |
CDS |
678779 |
|
|
deb |
CDS |
711704 |
96 |
|
|
tRNA |
712229 |
18 |
|
|
tRNA |
712323 |
3 |
|
|
tRNA |
712402 |
16 |
|
|
tRNA |
712494 |
61 |
|
fin |
CDS |
712639 |
|
comp
|
deb |
CDS |
723480 |
80 |
|
|
tRNA |
724421 |
134 |
comp
|
fin |
CDS |
724632 |
|
|
deb |
CDS |
774399 |
214 |
|
|
tRNA |
774880 |
4 |
|
|
tRNA |
774961 |
8 |
|
|
tRNA |
775045 |
9 |
|
|
tRNA |
775129 |
13 |
|
|
tRNA |
775216 |
111 |
|
fin |
CDS |
775416 |
|
|
deb |
CDS |
796146 |
73 |
|
|
tRNA |
796654 |
159 |
|
fin |
CDS |
796888 |
|
|
deb |
CDS |
841590 |
119 |
|
|
tRNA |
842393 |
2 |
|
|
tRNA |
842472 |
8 |
|
|
tRNA |
842556 |
9 |
|
|
tRNA |
842640 |
127 |
|
fin |
CDS |
842841 |
|
|
deb |
CDS |
881739 |
121 |
|
|
repeat_region |
882151 |
278 |
|
fin |
CDS |
886449 |
|
|
deb |
CDS |
889017 |
71 |
|
|
tRNA |
889670 |
156 |
|
fin |
CDS |
889903 |
|
|
deb |
CDS |
905286 |
58 |
|
|
tRNA |
906136 |
102 |
|
fin |
CDS |
906313 |
|
|
deb |
CDS |
913707 |
78 |
|
|
regulatory |
916065 |
91 |
|
fin |
CDS |
916256 |
|
|
deb |
CDS |
947642 |
32 |
|
|
ncRNA |
948598 |
38 |
|
fin |
CDS |
948982 |
|
|
deb |
CDS |
1017827 |
92 |
comp
|
|
misc_binding |
1018936 |
36 |
|
fin |
CDS |
1019167 |
|
|
deb |
CDS |
1020207 |
137 |
|
|
tRNA |
1022783 |
2 |
|
|
tRNA |
1022862 |
1 |
|
|
tRNA |
1022938 |
112 |
|
fin |
CDS |
1023124 |
|
|
deb |
CDS |
1111497 |
73 |
comp
|
|
misc_binding |
1112790 |
267 |
comp
|
fin |
CDS |
1113303 |
|
|
deb |
CDS |
1305277 |
298 |
|
|
regulatory |
1306436 |
70 |
|
fin |
CDS |
1306616 |
|
|
deb |
CDS |
1328649 |
26 |
|
|
tmRNA |
1328957 |
406 |
|
fin |
CDS |
1329712 |
|
comp
|
deb |
CDS |
1403493 |
52 |
comp
|
|
misc_binding |
1404547 |
111 |
comp
|
fin |
CDS |
1404901 |
|
comp
|
|
|
|
|
|
|
afn3 adresses3
deb-fin |
gènes |
adresses |
intercal |
sens
|
deb |
CDS |
1485384 |
59 |
comp
|
|
misc_binding |
1487132 |
146 |
comp
|
fin |
CDS |
1487523 |
|
comp
|
deb |
CDS |
1536256 |
68 |
|
|
regulatory |
1537998 |
113 |
|
fin |
CDS |
1538188 |
|
|
deb |
CDS |
1553542 |
24 |
|
|
tRNA |
1555201 |
393 |
|
fin |
CDS |
1555671 |
|
comp
|
deb |
CDS |
1567689 |
21 |
comp
|
|
tRNA |
1567911 |
93 |
comp
|
fin |
CDS |
1568093 |
|
comp
|
deb |
CDS |
1612826 |
158 |
|
|
tRNA |
1613773 |
215 |
comp
|
fin |
CDS |
1614079 |
|
comp
|
deb |
CDS |
1668440 |
42 |
comp
|
|
ncRNA |
1668962 |
51 |
comp
|
fin |
CDS |
1669196 |
|
comp
|
deb |
CDS |
1701767 |
76 |
|
|
tRNA |
1702659 |
91 |
|
fin |
CDS |
1702836 |
|
comp
|
deb |
CDS |
1710214 |
512 |
|
|
rRNA |
1711770 |
228 |
comp
|
|
rRNA |
1712115 |
359 |
comp
|
|
rRNA |
1715381 |
391 |
comp
|
fin |
CDS |
1717337 |
|
comp
|
deb |
CDS |
1823002 |
379 |
comp
|
|
tRNA |
1823852 |
6 |
comp
|
|
tRNA |
1823934 |
8 |
comp
|
|
tRNA |
1824017 |
83 |
comp
|
fin |
CDS |
1824176 |
|
comp
|
deb |
CDS |
1907578 |
182 |
comp
|
|
tRNA |
1909446 |
53 |
comp
|
|
ncRNA |
1909590 |
115 |
|
deb |
CDS |
1909805 |
136 |
|
|
tRNA |
1911342 |
23 |
|
fin |
CDS |
1911453 |
|
|
deb |
CDS |
1912058 |
43 |
comp
|
|
misc_binding |
1913025 |
130 |
comp
|
fin |
CDS |
1913387 |
|
|
deb |
CDS |
1973889 |
222 |
comp
|
|
tRNA |
1974984 |
39 |
comp
|
fin |
CDS |
1975098 |
|
comp
|
deb |
CDS |
1983694 |
122 |
comp
|
|
tRNA |
1984782 |
12 |
comp
|
|
tRNA |
1984869 |
111 |
comp
|
|
tRNA |
1985054 |
106 |
comp
|
fin |
CDS |
1985234 |
|
comp
|
deb |
CDS |
2070538 |
193 |
|
|
rRNA |
2072279 |
228 |
comp
|
|
rRNA |
2072624 |
298 |
comp
|
|
tRNA |
2075828 |
66 |
comp
|
|
tRNA |
2075970 |
94 |
comp
|
|
rRNA |
2076141 |
265 |
comp
|
fin |
CDS |
2077971 |
|
comp
|
deb |
CDS |
2147697 |
91 |
|
|
tRNA |
2148343 |
70 |
|
fin |
CDS |
2148489 |
|
comp
|
deb |
CDS |
2285667 |
451 |
comp
|
|
tRNA |
2287117 |
45 |
comp
|
fin |
CDS |
2287238 |
|
comp
|
deb |
CDS |
2301950 |
486 |
comp
|
|
tRNA |
2303018 |
45 |
comp
|
fin |
CDS |
2303140 |
|
comp
|
deb |
CDS |
2322585 |
393 |
comp
|
|
tRNA |
2323563 |
196 |
comp
|
fin |
CDS |
2323833 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
afn intercalaires tRNA
- Lien tableur: afn intercalaires tRNA
- Légende:
- - comp', l'intercalaire est entre un gène comp (sur le complément) et un gène sur le brin direct. Continu les 2 gènes sont sur le même brin.
- - deb, fin sont les intercalaires des cds du tableau précédent, autres intercalaires: respectivement dans le sens des adresses croissantes, le cds avant le 1er tRNA et le cds après le dernier tRNA du bloc.
- Cumuls comp'+continu du tableau
deb fin total
<201 22 22 44
total 27 26 53
% 81 85 83
afn intercalaires tRNA
afn les relevés deb-fin
comp’ |
entre tRNAs |
comp’ |
deb |
comp’ |
fin
|
|
|
|
105 |
|
105
|
|
|
|
122 |
comp’ |
361
|
|
|
|
195 |
comp’ |
51
|
|
3 8 50 11 8 |
|
200 |
comp’ |
188
|
|
|
|
131 |
|
145
|
|
30 52 |
|
54 |
comp’ |
268
|
|
|
|
131 |
|
194
|
|
18 3 16 |
|
96 |
comp’ |
61
|
|
|
comp’ |
80 |
comp’ |
134
|
|
4 8 9 13 |
|
214 |
|
111
|
|
|
|
73 |
|
159
|
|
2 8 9 |
|
119 |
|
127
|
|
|
|
71 |
|
156
|
|
|
|
58 |
|
102
|
|
2 1 |
|
137 |
|
112
|
|
|
|
24 |
comp’ |
393
|
|
|
|
21 |
|
93
|
|
|
comp’ |
158 |
|
215
|
|
|
|
76 |
comp’ |
91
|
|
6 8 |
|
379 |
|
83
|
|
|
|
182 |
|
|
|
|
|
136 |
|
23
|
|
|
|
222 |
|
39
|
|
12 111 |
|
122 |
|
106
|
|
|
|
91 |
comp’ |
70
|
|
|
|
451 |
|
45
|
|
|
|
393 |
comp’ |
196
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
afn intercalaires inférieures à 201 pbs
deb |
fin |
continu |
cumuls
|
21 |
23 |
deb |
|
24 |
39 |
<201 |
20
|
54 |
45 |
total |
25
|
58 |
70 |
% |
80%
|
71 |
83 |
|
|
73 |
93 |
fin |
|
76 |
102 |
<201 |
17
|
91 |
105 |
total |
18
|
96 |
106 |
% |
94%
|
105 |
111 |
|
|
119 |
112 |
total |
|
122 |
127 |
<201 |
37
|
122 |
145 |
total |
43
|
131 |
156 |
% |
86%
|
131 |
159 |
|
|
136 |
194 |
|
|
137 |
196 |
|
|
182 |
215 |
|
|
195 |
|
|
|
200 |
|
|
|
214 |
|
|
|
222 |
|
|
|
379 |
|
|
|
393 |
|
|
|
451 |
|
comp’ |
cumuls
|
80 |
51 |
deb |
2
|
158 |
61 |
<201 |
100%
|
|
91 |
fin |
|
|
134 |
<201 |
5
|
|
188 |
total |
8
|
|
268 |
% |
63%
|
|
361 |
total |
10
|
|
393 |
<201 |
70%
|
|
afn intercalaires rRNA
- Voir la présentation des blocs à rRNA dans le chapitre afn blocs de l'étude préliminaire. A comparer avec le tableau afn autres intercalaires.
- Remarque: Quand le 16s n'est pas précédé de tRNAs l'intercalaire cds-16s est élevé, pour le 1er bloc il est ici de 319 pbs. L'intercalaire cds-bloc de l'autre côté du bloc est beaucoup plus faible, ici 286 pbs. Cette orientation est quasiment générale chez tous les génomes que j'ai étudié ici. Je l'ai notée dans les chapitres génome-bloc de chaque génome.
- Note: J'ai supposé souvent que les blocs à tRNA sans rRNA sont aussi orientés de l'intercalaire le plus grand au plus petit. Dans afn cumuls et de même pour les autres génomes, j'ai noté cette orientation dans la colonne cdsd, pour cds dirigé. Je n'ai conservé pour les calculs que le plus petit intercalaire des 2 cds bordant le bloc. L'idée était que cette orientation provoquait la création du cds en fin de bloc. Ces cds sont souvent de petites protéines et souvent hypothétiques. Aussi je présente ci-dessous la transformation deb-fin qui est imposée par l'adressage en intercalaire plus grand et plus petit.
deb fin tri grand petit deb fin tri grand petit
105 105 17 93 21 58 102 9 134 80
122 361 21 136 23 137 112 20 379 83
195 51 16 393 24 24 393 1 105 105
200 188 22 222 39 21 93 23 122 106
131 145 25 451 45 158 215 10 214 111
54 268 3 195 51 76 91 15 137 112
131 194 6 268 54 379 83 12 127 119
96 61 14 102 58 136 23 2 361 122
80 134 8 96 61 222 39 5 145 131
214 111 24 91 70 122 106 7 194 131
73 159 13 156 71 91 70 18 215 158
119 127 11 159 73 451 45 4 200 188
71 156 19 91 76 393 196 26 393 196
afn par rapport au groupe de référence
Comparaison avec la référence
tRNAs |
|
blocs tRNAs |
blocs rRNAs |
|
|
afn |
1aa |
>1aa |
dup |
+5s |
1-3aas |
autres |
total |
|
21 |
faible |
11 |
3 |
2 |
|
|
|
16
|
16 |
moyen |
5 |
12 |
|
|
|
4 |
21
|
14 |
fort |
4 |
19 |
|
|
|
|
23
|
|
|
20 |
34 |
2 |
|
|
4 |
60
|
10 |
g+cga |
6 |
2 |
2 |
|
|
|
10
|
2 |
agg+cgg |
2 |
|
|
|
|
|
2
|
4 |
carre ccc |
3 |
1 |
|
|
|
|
4
|
5 |
autres |
|
|
|
|
|
|
|
|
|
11 |
3 |
2 |
|
|
|
16
|
|
|
total tRNAs ‰ |
|
|
|
|
|
afn |
1aa |
>1aa |
dup |
+5s |
1-3aas |
autres |
afn ‰ |
ref.‰
|
21 |
faible |
183 |
50 |
33 |
|
|
|
267 |
26
|
16 |
moyen |
83 |
200 |
0 |
|
|
67 |
350 |
324
|
14 |
fort |
67 |
317 |
0 |
|
|
|
383 |
650
|
|
|
333 |
567 |
33 |
|
|
67 |
60 |
729
|
10 |
g+cgg |
100 |
33 |
33 |
|
|
|
167 |
10
|
2 |
agg+cga |
33 |
|
|
|
|
|
33 |
|
4 |
carre ccc |
50 |
17 |
|
|
|
|
67 |
16
|
5 |
autres |
|
|
|
|
|
|
|
|
|
|
183 |
50 |
33 |
|
|
|
267 |
|
|
|
blocs tRNAs ‰ |
|
total colonne %
|
|
afn |
1aa |
>1aa |
dup |
total |
ref.‰ |
1aa |
>1aa |
dup
|
21 |
faible |
196 |
54 |
36 |
286 |
26 |
55 |
9
|
16 |
moyen |
89 |
214 |
|
304 |
324 |
25 |
35
|
14 |
fort |
71 |
339 |
|
411 |
650 |
20 |
56
|
|
|
357 |
607 |
36 |
56 |
729 |
20 |
34
|
10 |
g+cgg |
107 |
36 |
36 |
179 |
10 |
55 |
|
2 |
agg+cga |
36 |
|
|
36 |
|
18 |
|
4 |
carre ccc |
54 |
18 |
|
71 |
16 |
27 |
|
5 |
autres |
|
|
|
|
|
|
|
|
|
196 |
54 |
36 |
286 |
|
11 |
|
negativicutes distribution
- Lien tableur: negativicutes distribution
- Liens fiche: 1-3aas 9-23aas
- Légende: prélèvement de la base gtRNAdb le 22.1.21
- - ttt et tgt sont nuls partout
- - atgi, c'est Ile2, mis à la place de ttt, très rare chez les procaryotes.
- - atgf, c'est Metf, mis à la place de tgt, très rare chez les procaryotes.
- - atgj, c'est Met, remplace le atg standard qui est la somme Ile2 Met fMet.
- - Voir la légende des tris, g1 t1 et des couleurs
- Notes: attention tableau neg4, atc est négatif et n'est pas contenu dans le total de 423. Le tableau neg4 est égal à neg1-neg2-neg3. Dans neg2 le rouge est totalement +16s.
neg Negativicutes 9 génomes
neg1 total du 22.1.21 de gtRNAdb
g1 |
|
t1 |
|
|
|
|
|
a atgi |
8 |
a tct |
|
tat |
|
atgf |
15
|
b att |
|
i act |
|
aat |
|
agt |
|
c ctt |
|
e cct |
|
cat |
|
cgc |
|
d gtt |
|
m gct |
|
gat |
|
ggt |
|
e ttc |
17 |
b tcc |
10 |
tac |
16 |
tgc |
13
|
f atc |
17 |
j acc |
11 |
aac |
26 |
agc |
11
|
g ctc |
11 |
f ccc |
7 |
cac |
10 |
cgt |
16
|
h gtc |
8 |
n gcc |
7 |
gac |
24 |
ggc |
33
|
i tta |
11 |
c tca |
10 |
taa |
|
tga |
1
|
j ata |
|
k aca |
13 |
aaa |
20 |
aga |
9
|
k cta |
9 |
g cca |
11 |
caa |
13 |
cga |
2
|
l gta |
24 |
o gca |
21 |
gaa |
25 |
gga |
10
|
m ttg |
11 |
d tcg |
9 |
tag |
|
tgg |
13
|
n atgj |
12 |
l acg |
9 |
aag |
10 |
agg |
9
|
o ctg |
10 |
h ccg |
7 |
cag |
11 |
cgg |
9
|
p gtg |
4 |
p gcg |
5 |
gag |
5 |
ggg |
8
|
9-23aas |
inter |
|
max |
|
min |
|
total
|
|
186 |
|
263 |
|
122 |
|
571
|
|
neg2 distribution des 1-3aas
g1 |
|
t1 |
|
|
|
|
|
a atgi |
|
a tct |
|
tat |
|
atgf |
|
b att |
|
i act |
|
aat |
|
agt |
|
c ctt |
|
e cct |
|
cat |
|
cgc |
|
d gtt |
|
m gct |
|
gat |
|
ggt |
|
e ttc |
|
b tcc |
|
tac |
1 |
tgc |
|
f atc |
18 |
j acc |
|
aac |
6 |
agc |
1
|
g ctc |
|
f ccc |
|
cac |
|
cgt |
2
|
h gtc |
|
n gcc |
|
gac |
|
ggc |
|
i tta |
|
c tca |
|
taa |
|
tga |
|
j ata |
|
k aca |
|
aaa |
|
aga |
|
k cta |
|
g cca |
|
caa |
1 |
cga |
|
l gta |
|
o gca |
21 |
gaa |
1 |
gga |
|
m ttg |
|
d tcg |
|
tag |
|
tgg |
4
|
n atgj |
|
l acg |
1 |
aag |
|
agg |
|
o ctg |
|
h ccg |
|
cag |
|
cgg |
|
p gtg |
|
p gcg |
|
gag |
|
ggg |
|
1-3aas |
inter |
|
max |
|
min |
|
total
|
|
7 |
|
11 |
|
1 |
|
19
|
|
neg3 distribution des 9-23aas
g1 |
|
t1 |
|
|
|
|
|
a atgi |
1 |
a tct |
|
tat |
|
atgf |
3
|
b att |
|
i act |
|
aat |
|
agt |
|
c ctt |
|
e cct |
|
cat |
|
cgc |
|
d gtt |
|
m gct |
|
gat |
|
ggt |
|
e ttc |
6 |
b tcc |
2 |
tac |
3 |
tgc |
2
|
f atc |
1 |
j acc |
|
aac |
5 |
agc |
2
|
g ctc |
2 |
f ccc |
|
cac |
3 |
cgt |
4
|
h gtc |
|
n gcc |
|
gac |
7 |
ggc |
3
|
i tta |
4 |
c tca |
1 |
taa |
|
tga |
|
j ata |
|
k aca |
5 |
aaa |
5 |
aga |
|
k cta |
1 |
g cca |
2 |
caa |
5 |
cga |
|
l gta |
7 |
o gca |
|
gaa |
5 |
gga |
4
|
m ttg |
2 |
d tcg |
|
tag |
|
tgg |
2
|
n atgj |
1 |
l acg |
|
aag |
2 |
agg |
|
o ctg |
2 |
h ccg |
|
cag |
|
cgg |
|
p gtg |
|
p gcg |
|
gag |
|
ggg |
|
9-23aas |
inter |
|
max |
|
min |
|
total
|
|
24 |
|
64 |
|
4 |
|
92
|
|
neg4 distribution des -rRNA
g1 |
|
t1 |
|
|
|
|
|
a atgi |
7 |
a tct |
|
tat |
|
atgf |
12
|
b att |
|
i act |
|
aat |
|
agt |
|
c ctt |
|
e cct |
|
cat |
|
cgc |
|
d gtt |
|
m gct |
|
gat |
|
ggt |
|
e ttc |
11 |
b tcc |
8 |
tac |
12 |
tgc |
11
|
f atc |
-2 |
j acc |
11 |
aac |
15 |
agc |
8
|
g ctc |
9 |
f ccc |
7 |
cac |
5 |
cgt |
10
|
h gtc |
8 |
n gcc |
7 |
gac |
17 |
ggc |
30
|
i tta |
7 |
c tca |
9 |
taa |
|
tga |
1
|
j ata |
|
k aca |
8 |
aaa |
15 |
aga |
9
|
k cta |
8 |
g cca |
9 |
caa |
7 |
cga |
2
|
l gta |
17 |
o gca |
0 |
gaa |
19 |
gga |
6
|
m ttg |
9 |
d tcg |
9 |
tag |
|
tgg |
7
|
n atgj |
11 |
l acg |
8 |
aag |
8 |
agg |
9
|
o ctg |
8 |
h ccg |
7 |
cag |
11 |
cgg |
9
|
p gtg |
4 |
p gcg |
5 |
gag |
5 |
ggg |
8
|
-rRNA |
inter |
|
max |
|
min |
|
total
|
|
118 |
|
188 |
|
117 |
|
423
|
|
- Discussion
- - La comparaison avec le classement des tRNAs montre que les effectifs élevés des -rRNAs correspondraient à des duplications. Il faut tenir compte aussi des doubles qui ne sont pas des duplications comme dans le génome afn avec le bloc ctg ctc ctg.
- - pour les 1-3aas aac est élevé alors que atgf est absent.
- - Les tRNAs faibles (cyan) seraient plutôt des 1aa.
- - La méthode de comparaison, ici, sans passer par les indices, c'est à dire une fiche de la totalité des génomes, montre qu'il y a des différences entre le décompte total et la fiche des +rRNAs. Notamment pour le +16s atc avec une valeur négative dans la différence. Pour les comparaions avec indices, pour les autres clades, il faut que ces valeurs négatives soient les plus petites possible en valeur absolue. Sinon il faut vérifier les calculs et les relevés. Voir la comparaison du clade avec le tRNA afn.
negativicutes, estimation des -rRNAs
- Lien tableur: negativicutes, estimation des -rRNAs
- Liens fiche: 1-3aas 9-23aas
- Légende: prélèvement de la base gtRNAdb le 22.1.21
- - ttt et tgt sont nuls partout
- - atgi, c'est Ile2, mis à la place de ttt, très rare chez les procaryotes.
- - atgf, c'est Metf, mis à la place de tgt, très rare chez les procaryotes.
- - atgj, c'est Met, remplace le atg standard qui est la somme Ile2 Met fMet.
- - Voir la légende des tris, g1 t1 et des couleurs
negativicutes, calcul des -rRNAs
neg Negativicutes 9 génomes
neg1 cumul des +rRNAs de la fiche négativicutes pour 9 génomes
g1 |
|
t1 |
|
|
|
0 |
0
|
a atgi |
1 |
a tct |
|
tat |
|
atgf |
3
|
b att |
|
i act |
|
aat |
|
agt |
|
c ctt |
|
e cct |
|
cat |
|
cgc |
|
d gtt |
|
m gct |
|
gat |
|
ggt |
|
e ttc |
6 |
b tcc |
2 |
tac |
4 |
tgc |
2
|
f atc |
18 |
j acc |
|
aac |
11 |
agc |
3
|
g ctc |
2 |
f ccc |
|
cac |
5 |
cgt |
6
|
h gtc |
|
n gcc |
|
gac |
7 |
ggc |
3
|
i tta |
4 |
c tca |
1 |
taa |
|
tga |
|
j ata |
|
k aca |
5 |
aaa |
5 |
aga |
|
k cta |
1 |
g cca |
2 |
caa |
6 |
cga |
|
l gta |
7 |
o gca |
21 |
gaa |
6 |
gga |
4
|
m ttg |
2 |
d tcg |
|
tag |
|
tgg |
6
|
n atgj |
1 |
l acg |
1 |
aag |
2 |
agg |
|
o ctg |
2 |
h ccg |
|
cag |
|
cgg |
|
p gtg |
|
p gcg |
|
gag |
|
ggg |
|
nega9 |
inter |
|
max |
|
min |
|
total
|
|
69 |
|
75 |
|
5 |
|
149
|
|
neg2 indices du clade negativicutes du 22.1.21 de gtRNAdb pour 100 génomes
g1 |
|
t1 |
|
|
|
0 |
0
|
a atgi |
89 |
a tct |
|
tat |
|
atgf |
167
|
b att |
|
i act |
|
aat |
|
agt |
|
c ctt |
|
e cct |
|
cat |
|
cgc |
|
d gtt |
|
m gct |
|
gat |
|
ggt |
|
e ttc |
189 |
b tcc |
111 |
tac |
178 |
tgc |
144
|
f atc |
189 |
j acc |
122 |
aac |
289 |
agc |
122
|
g ctc |
122 |
f ccc |
78 |
cac |
111 |
cgt |
178
|
h gtc |
89 |
n gcc |
78 |
gac |
267 |
ggc |
367
|
i tta |
122 |
c tca |
111 |
taa |
|
tga |
11
|
j ata |
|
k aca |
144 |
aaa |
222 |
aga |
100
|
k cta |
100 |
g cca |
122 |
caa |
144 |
cga |
22
|
l gta |
267 |
o gca |
233 |
gaa |
278 |
gga |
111
|
m ttg |
122 |
d tcg |
100 |
tag |
|
tgg |
144
|
n atgj |
133 |
l acg |
100 |
aag |
111 |
agg |
100
|
o ctg |
111 |
h ccg |
78 |
cag |
122 |
cgg |
100
|
p gtg |
44 |
p gcg |
56 |
gag |
56 |
ggg |
89
|
gtRNA |
inter |
|
max |
|
min |
|
total
|
|
2667 |
|
2922 |
|
1356 |
|
6344
|
|
neg3 cumul des -rRNAs de l'annexe afn pour 1 génome
g1 |
|
t1 |
|
|
|
0 |
0
|
a atgi |
1 |
a tct |
|
tat |
|
atgf |
1
|
b att |
|
i act |
|
aat |
|
agt |
|
c ctt |
|
e cct |
|
cat |
|
cgc |
|
d gtt |
|
m gct |
|
gat |
|
ggt |
|
e ttc |
2 |
b tcc |
1 |
tac |
1 |
tgc |
2
|
f atc |
|
j acc |
1 |
aac |
2 |
agc |
1
|
g ctc |
1 |
f ccc |
1 |
cac |
1 |
cgt |
1
|
h gtc |
1 |
n gcc |
1 |
gac |
3 |
ggc |
4
|
i tta |
1 |
c tca |
1 |
taa |
|
tga |
|
j ata |
|
k aca |
1 |
aaa |
2 |
aga |
1
|
k cta |
1 |
g cca |
1 |
caa |
1 |
cga |
|
l gta |
2 |
o gca |
|
gaa |
2 |
gga |
1
|
m ttg |
1 |
d tcg |
1 |
tag |
|
tgg |
1
|
n atgj |
1 |
l acg |
1 |
aag |
1 |
agg |
1
|
o ctg |
2 |
h ccg |
1 |
cag |
2 |
cgg |
1
|
p gtg |
1 |
p gcg |
1 |
gag |
1 |
ggg |
1
|
afn |
inter |
|
max |
|
min |
|
total
|
|
16 |
|
24 |
|
16 |
|
56
|
|
neg4 indices des +rRNAs de la fiche negativicutes pour 100 génomes
g1 |
|
t1 |
|
|
|
0 |
0
|
a atgi |
11 |
a tct |
|
tat |
|
atgf |
33
|
b att |
|
i act |
|
aat |
|
agt |
|
c ctt |
|
e cct |
|
cat |
|
cgc |
|
d gtt |
|
m gct |
|
gat |
|
ggt |
|
e ttc |
67 |
b tcc |
22 |
tac |
44 |
tgc |
22
|
f atc |
200 |
j acc |
|
aac |
122 |
agc |
33
|
g ctc |
22 |
f ccc |
|
cac |
56 |
cgt |
67
|
h gtc |
|
n gcc |
|
gac |
78 |
ggc |
33
|
i tta |
44 |
c tca |
11 |
taa |
|
tga |
|
j ata |
|
k aca |
56 |
aaa |
56 |
aga |
1
|
k cta |
11 |
g cca |
22 |
caa |
67 |
cga |
|
l gta |
78 |
o gca |
233 |
gaa |
67 |
gga |
44
|
m ttg |
22 |
d tcg |
|
tag |
|
tgg |
67
|
n atgj |
11 |
l acg |
11 |
aag |
22 |
agg |
1
|
o ctg |
22 |
h ccg |
|
cag |
|
cgg |
1
|
p gtg |
|
p gcg |
|
gag |
|
ggg |
1
|
nega9 |
inter |
|
max |
|
min |
|
total
|
|
767 |
|
833 |
|
56 |
|
1656
|
|
neg5 estimation des -rRNA du clade negativicutes pour 100 génomes
g1 |
|
t1 |
|
|
|
|
|
a atgi |
78 |
a tct |
|
tat |
|
atgf |
133
|
b att |
|
i act |
|
aat |
|
agt |
|
c ctt |
|
e cct |
|
cat |
|
cgc |
|
d gtt |
|
m gct |
|
gat |
|
ggt |
|
e ttc |
122 |
b tcc |
89 |
tac |
133 |
tgc |
122
|
f atc |
-11 |
j acc |
122 |
aac |
167 |
agc |
89
|
g ctc |
100 |
f ccc |
78 |
cac |
56 |
cgt |
111
|
h gtc |
89 |
n gcc |
78 |
gac |
189 |
ggc |
333
|
i tta |
78 |
c tca |
100 |
taa |
|
tga |
11
|
j ata |
|
k aca |
89 |
aaa |
167 |
aga |
100
|
k cta |
89 |
g cca |
100 |
caa |
78 |
cga |
22
|
l gta |
189 |
o gca |
0 |
gaa |
211 |
gga |
67
|
m ttg |
100 |
d tcg |
100 |
tag |
|
tgg |
78
|
n atgj |
122 |
l acg |
89 |
aag |
89 |
agg |
100
|
o ctg |
89 |
h ccg |
78 |
cag |
122 |
cgg |
100
|
p gtg |
44 |
p gcg |
56 |
gag |
56 |
ggg |
89
|
-rRNA |
inter |
|
max |
|
min |
|
total
|
|
1300 |
|
2089 |
|
1300 |
|
4689
|
|
neg6 indices des -rRNAs de l'annexe afn pour 100 génomes
g1 |
|
t1 |
|
|
|
|
|
a atgi |
100 |
a tct |
|
tat |
|
atgf |
100
|
b att |
|
i act |
|
aat |
|
agt |
|
c ctt |
|
e cct |
|
cat |
|
cgc |
|
d gtt |
|
m gct |
|
gat |
|
ggt |
|
e ttc |
200 |
b tcc |
100 |
tac |
100 |
tgc |
200
|
f atc |
|
j acc |
100 |
aac |
200 |
agc |
100
|
g ctc |
100 |
f ccc |
100 |
cac |
100 |
cgt |
100
|
h gtc |
100 |
n gcc |
100 |
gac |
300 |
ggc |
400
|
i tta |
100 |
c tca |
100 |
taa |
|
tga |
|
j ata |
|
k aca |
100 |
aaa |
200 |
aga |
100
|
k cta |
100 |
g cca |
100 |
caa |
100 |
cga |
|
l gta |
200 |
o gca |
|
gaa |
200 |
gga |
100
|
m ttg |
100 |
d tcg |
100 |
tag |
|
tgg |
100
|
n atgj |
100 |
l acg |
100 |
aag |
100 |
agg |
100
|
o ctg |
200 |
h ccg |
100 |
cag |
200 |
cgg |
100
|
p gtg |
100 |
p gcg |
100 |
gag |
100 |
ggg |
100
|
afn |
inter |
|
max |
|
min |
|
total
|
|
1600 |
|
2400 |
|
1600 |
|
5600
|
|
negativicutes, comparaison clade-annexe des -rRNAs
- Lien tableur: negativicutes, comparaison clade-annexe des -rRNAs
- Légende
- - neg7. diff, somme des couleurs de neg7. La différence entre tRNAs est faite entre neg5 et neg6 du tableau précédent. Elle est exprimée en % et rapporté à la plus grande valeur des 2 termes de la différence. Ce qui fait quand un tRNA est à zéro la différence en % est égale à 100.
- - neg8. rap, rapport des sommes couleurs neg5/neg2. Le rapport -rRNA/total est celui du tRNA de neg5 sur celui de neg2.
- Fréquences des différences en % du tableau neg7
gamme 0/0 10 20 30 40 50 60 70 80 90 100 total
fréquence 2 11 13 9 5 3 2 0 0 0 3 0 48
tot ≤ 50 41
- Comparaison avec le nombre de tRNAs de la fiche du clade: L’estimation des -rRNA par l'annexe est 10% au dessus de celle de la fiche des negativicutes.
tRNAs fiche annexe
sans 456 56
avec 152 4
genomes 9 1
indice % 51 56
neg Negativicutes 9 génomes
neg7 negativicutes, différence clade-annexe des -rRNAs
g1 |
|
t1 |
|
|
|
|
|
a atgi |
22 |
a tct |
|
tat |
|
atgf |
25
|
b att |
|
i act |
|
aat |
|
agt |
|
c ctt |
|
e cct |
|
cat |
|
cgc |
|
d gtt |
|
m gct |
|
gat |
|
ggt |
|
e ttc |
39 |
b tcc |
11 |
tac |
25 |
tgc |
39
|
f atc |
100 |
j acc |
18 |
aac |
17 |
agc |
11
|
g ctc |
0 |
f ccc |
22 |
cac |
44 |
cgt |
10
|
h gtc |
11 |
n gcc |
22 |
gac |
37 |
ggc |
17
|
i tta |
22 |
c tca |
0 |
taa |
|
tga |
100
|
j ata |
|
k aca |
11 |
aaa |
17 |
aga |
0
|
k cta |
11 |
g cca |
0 |
caa |
22 |
cga |
100
|
l gta |
6 |
o gca |
|
gaa |
5 |
gga |
33
|
m ttg |
0 |
d tcg |
0 |
tag |
|
tgg |
22
|
n atgj |
18 |
l acg |
11 |
aag |
11 |
agg |
0
|
o ctg |
56 |
h ccg |
22 |
cag |
39 |
cgg |
0
|
p gtg |
56 |
p gcg |
44 |
gag |
44 |
ggg |
11
|
diff |
inter |
|
max |
|
min |
|
total
|
|
275 |
|
263 |
|
294 |
|
833
|
|
neg8 negativicutes, rapports -rRNA/total
g1 |
|
t1 |
|
|
|
|
|
a atgi |
88 |
a tct |
|
tat |
|
atgf |
80
|
b att |
|
i act |
|
aat |
|
agt |
|
c ctt |
|
e cct |
|
cat |
|
cgc |
|
d gtt |
|
m gct |
|
gat |
|
ggt |
|
e ttc |
65 |
b tcc |
80 |
tac |
75 |
tgc |
85
|
f atc |
-6 |
j acc |
|
aac |
58 |
agc |
73
|
g ctc |
82 |
f ccc |
|
cac |
50 |
cgt |
62
|
h gtc |
|
n gcc |
|
gac |
71 |
ggc |
91
|
i tta |
64 |
c tca |
90 |
taa |
|
tga |
|
j ata |
|
k aca |
62 |
aaa |
75 |
aga |
|
k cta |
89 |
g cca |
82 |
caa |
54 |
cga |
|
l gta |
71 |
o gca |
0 |
gaa |
76 |
gga |
60
|
m ttg |
82 |
d tcg |
|
tag |
|
tgg |
54
|
n atgj |
92 |
l acg |
89 |
aag |
80 |
agg |
|
o ctg |
80 |
h ccg |
|
cag |
|
cgg |
|
p gtg |
|
p gcg |
|
gag |
|
ggg |
|
rap |
inter |
|
max |
|
min |
|
total
|
|
63 |
|
71 |
|
96 |
|
74
|
|
clostridia synthèse
clostridia distribution par génome
clostridia distribution par génome
baci |
>1aa |
1aa |
-5s |
+5s |
-16s |
+16s |
duplica |
1-3aas |
total
|
psor |
12 |
5 |
4 |
72 |
|
7 |
|
4 |
104
|
cdc |
4 |
4 |
2 |
70 |
|
3 |
|
|
83
|
cdc8 |
4 |
5 |
2 |
89 |
|
4 |
|
4 |
108
|
cbc* |
34 |
10 |
|
0 |
|
0 |
2 |
6 |
54
|
cbn |
48 |
12 |
2 |
6 |
3 |
4 |
4 |
7 |
90
|
cle |
38 |
19 |
|
26 |
3 |
9 |
2 |
8 |
107
|
hmo |
37 |
12 |
|
39 |
|
11 |
|
10 |
109
|
cbei |
63 |
11 |
3 |
0 |
|
4 |
|
12 |
93
|
total |
240 |
78 |
13 |
302 |
6 |
42 |
8 |
51 |
748
|
clostridia distribution du total
- Lien tableur: clostridia distribution du total
- Légende:
- - Couleurs du 1er tableau: voir la distribution des bacilli
- - Couleurs du 2ème tableau: d'après les couleurs du pieds du tableau
- - Couleurs du 3ème tableau: comme le tableau 2. Cependant les duplicata ne sont pas comptés dans le total de 55 mais dans le total des >1aa du 1er tableau.
- - Tableau des indices, en-tête: total des génomes, total des tRNAs, indice ttt, indice tgt.
Clostridia. Distribution du total.
clostridia. Distribution du total: >1aa 1aa +5s >3.
g1 |
|
t1 |
|
|
|
|
|
a atgi |
10 |
a tct |
|
tat |
|
atgf |
32
|
b att |
|
i act |
|
aat |
|
agt |
|
c ctt |
3 |
e cct |
|
cat |
|
cgt |
|
d gtt |
|
m gct |
|
gat |
|
ggt |
|
e ttc |
19 |
b tcc |
7 |
tac |
23 |
tgc |
16
|
f atc |
3 |
j acc |
9 |
aac |
22 |
agc |
13
|
g ctc |
3 |
f ccc |
4 |
cac |
16 |
cgc |
11
|
h gtc |
4 |
n gcc |
1 |
gac |
32 |
ggc |
20
|
i tta |
22 |
c tca |
19 |
taa |
|
tga |
3
|
j ata |
1 |
k aca |
30 |
aaa |
31 |
aga |
24
|
k cta |
19 |
g cca |
25 |
caa |
22 |
cga |
4
|
l gta |
41 |
o gca |
|
gaa |
36 |
gga |
29
|
m ttg |
9 |
d tcg |
2 |
tag |
|
tgg |
11
|
n atgj |
23 |
l acg |
4 |
aag |
6 |
agg |
6
|
o ctg |
6 |
h ccg |
2 |
cag |
4 |
cgg |
1
|
p gtg |
1 |
p gcg |
1 |
gag |
4 |
ggg |
3
|
clos8 |
>1aa |
1aa |
-5s |
+5s |
-16s |
+16s |
total
|
type |
248 |
78 |
|
302 |
|
|
628
|
|
clostridia. Distribution du total. -16s +5s <4
g1 |
|
t1 |
|
|
|
|
|
a atgi |
8 |
a tct |
|
tat |
|
atgf |
2
|
b att |
|
i act |
|
aat |
|
agt |
|
c ctt |
|
e cct |
|
cat |
|
cgt |
|
d gtt |
|
m gct |
|
gat |
|
ggt |
|
e ttc |
6 |
b tcc |
1 |
tac |
|
tgc |
1
|
f atc |
1 |
j acc |
1 |
aac |
7 |
agc |
1
|
g ctc |
1 |
f ccc |
|
cac |
|
cgc |
|
h gtc |
|
n gcc |
|
gac |
1 |
ggc |
4
|
i tta |
4 |
c tca |
1 |
taa |
|
tga |
|
j ata |
|
k aca |
|
aaa |
6 |
aga |
1
|
k cta |
|
g cca |
|
caa |
|
cga |
|
l gta |
|
o gca |
5 |
gaa |
2 |
gga |
2
|
m ttg |
|
d tcg |
|
tag |
|
tgg |
1
|
n atgj |
|
l acg |
|
aag |
|
agg |
|
o ctg |
|
h ccg |
|
cag |
|
cgg |
1
|
p gtg |
|
p gcg |
|
gag |
|
ggg |
|
clos8 |
>1aa |
1aa |
-5s |
+5s |
-16s |
+16s |
total
|
type |
|
|
|
51 |
6 |
|
57
|
|
clostridia. Distribution du total. duplica -5s +16s
g1 |
|
t1 |
|
|
|
|
|
a atgi |
|
a tct |
|
tat |
|
atgf |
2
|
b att |
|
i act |
|
aat |
|
agt |
|
c ctt |
2 |
e cct |
|
cat |
|
cgc |
|
d gtt |
|
m gct |
|
gat |
|
ggt |
|
e ttc |
|
b tcc |
|
tac |
|
tgc |
2
|
f atc |
11 |
j acc |
|
aac |
5 |
agc |
|
g ctc |
|
f ccc |
|
cac |
|
cgc |
|
h gtc |
|
n gcc |
5 |
gac |
|
ggc |
|
i tta |
|
c tca |
2 |
taa |
|
tga |
|
j ata |
|
k aca |
3 |
aaa |
|
aga |
|
k cta |
|
g cca |
|
caa |
|
cga |
|
l gta |
|
o gca |
26 |
gaa |
|
gga |
5
|
m ttg |
|
d tcg |
|
tag |
|
tgg |
|
n atgj |
|
l acg |
|
aag |
|
agg |
|
o ctg |
|
h ccg |
|
cag |
|
cgg |
|
p gtg |
|
p gcg |
|
gag |
|
ggg |
|
clos8 |
dupli |
1aa |
-5s |
+5s |
-16s |
+16s |
total
|
type |
8 |
|
13 |
|
|
42 |
55
|
|
clostridia. indices du 27.5.20 174 génomes
g1 |
|
t1 |
|
618 |
11144 |
4,0 |
0,6
|
a atgi |
159 |
a tct |
1,1 |
tat |
|
atgf |
187
|
b att |
1,1 |
i act |
|
aat |
|
agt |
0,6
|
c ctt |
15,5 |
e cct |
2,3 |
cat |
|
cgc |
|
d gtt |
0,6 |
m gct |
|
gat |
|
ggt |
|
e ttc |
206 |
b tcc |
103 |
tac |
187 |
tgc |
151
|
f atc |
152 |
j acc |
102 |
aac |
248 |
agc |
133
|
g ctc |
81 |
f ccc |
62 |
cac |
140 |
cgt |
116
|
h gtc |
53 |
n gcc |
61 |
gac |
242 |
ggc |
220
|
i tta |
172 |
c tca |
142 |
taa |
1,1 |
tga |
55
|
j ata |
2,9 |
k aca |
218 |
aaa |
271 |
aga |
174
|
k cta |
148 |
g cca |
163 |
caa |
156 |
cga |
48
|
l gta |
286 |
o gca |
219 |
gaa |
239 |
gga |
243
|
m ttg |
108 |
d tcg |
83 |
tag |
2,3 |
tgg |
120
|
n atgj |
132 |
l acg |
77 |
aag |
120 |
agg |
96
|
o ctg |
76 |
h ccg |
64 |
cag |
77 |
cgg |
60
|
p gtg |
34 |
p gcg |
35 |
gag |
83 |
ggg |
70
|
|
inter |
|
max |
|
min |
|
total
|
|
|
|
|
|
|
|
|
|
clostridia distribution par type
Clostridia. Distribution par type.
clostridia. distribution des solitaires
g1 |
|
t1 |
|
|
|
|
|
a atgi |
1 |
a tct |
|
tat |
|
atgf |
1
|
b att |
|
i act |
|
aat |
|
agt |
1
|
c ctt |
1 |
e cct |
|
cat |
|
cgt |
|
d gtt |
|
m gct |
|
gat |
|
ggt |
|
e ttc |
1 |
b tcc |
6 |
tac |
|
tgc |
1
|
f atc |
|
j acc |
3 |
aac |
1 |
agc |
3
|
g ctc |
2 |
f ccc |
1 |
cac |
|
cgc |
1
|
h gtc |
|
n gcc |
1 |
gac |
|
ggc |
|
i tta |
|
c tca |
1 |
taa |
|
tga |
3
|
j ata |
1 |
k aca |
2 |
aaa |
|
aga |
|
k cta |
5 |
g cca |
4 |
caa |
|
cga |
1
|
l gta |
|
o gca |
|
gaa |
|
gga |
1
|
m ttg |
8 |
d tcg |
2 |
tag |
|
tgg |
5
|
n atgj |
|
l acg |
4 |
aag |
1 |
agg |
5
|
o ctg |
3 |
h ccg |
1 |
cag |
3 |
cgg |
|
p gtg |
|
p gcg |
1 |
gag |
3 |
ggg |
|
clos8 |
1aa |
78 |
|
|
|
|
|
|
clostridia. distribution du type >1aa sans duplicata.
g1 |
|
t1 |
|
|
|
|
|
a atgi |
|
a tct |
|
tat |
|
atgf |
8
|
b att |
|
i act |
|
aat |
|
agt |
|
c ctt |
|
e cct |
|
cat |
|
cgt |
|
d gtt |
|
m gct |
|
gat |
|
ggt |
|
e ttc |
6 |
b tcc |
|
tac |
10 |
tgc |
3
|
f atc |
|
j acc |
3 |
aac |
5 |
agc |
5
|
g ctc |
1 |
f ccc |
1 |
cac |
8 |
cgc |
3
|
h gtc |
2 |
n gcc |
|
gac |
15 |
ggc |
11
|
i tta |
11 |
c tca |
6 |
taa |
|
tga |
|
j ata |
|
k aca |
15 |
aaa |
14 |
aga |
10
|
k cta |
6 |
g cca |
10 |
caa |
8 |
cga |
3
|
l gta |
20 |
o gca |
|
gaa |
17 |
gga |
13
|
m ttg |
1 |
d tcg |
|
tag |
|
tgg |
2
|
n atgj |
10 |
l acg |
|
aag |
5 |
agg |
1
|
o ctg |
1 |
h ccg |
|
cag |
1 |
cgg |
1
|
p gtg |
1 |
p gcg |
|
gag |
|
ggg |
3
|
clos8 |
>1aa |
240 |
|
|
|
|
|
|
clostridia. distribution du type +5s >3.
g1 |
|
t1 |
|
|
|
|
|
a atgi |
9 |
a tct |
|
tat |
|
atgf |
11
|
b att |
|
i act |
|
aat |
|
agt |
|
c ctt |
|
e cct |
|
cat |
|
cgt |
|
d gtt |
|
m gct |
|
gat |
|
ggt |
|
e ttc |
12 |
b tcc |
1 |
tac |
13 |
tgc |
10
|
f atc |
3 |
j acc |
3 |
aac |
16 |
agc |
5
|
g ctc |
|
f ccc |
2 |
cac |
8 |
cgc |
7
|
h gtc |
2 |
n gcc |
|
gac |
17 |
ggc |
9
|
i tta |
11 |
c tca |
10 |
taa |
|
tga |
|
j ata |
|
k aca |
13 |
aaa |
17 |
aga |
14
|
k cta |
8 |
g cca |
11 |
caa |
14 |
cga |
|
l gta |
21 |
o gca |
|
gaa |
19 |
gga |
15
|
m ttg |
|
d tcg |
|
tag |
|
tgg |
4
|
n atgj |
13 |
l acg |
|
aag |
|
agg |
|
o ctg |
2 |
h ccg |
1 |
cag |
|
cgg |
|
p gtg |
|
p gcg |
|
gag |
1 |
ggg |
|
clos8 |
+5s |
302 |
|
|
|
|
|
|
clostridia par rapport au groupe de référence
Comparaison avec la référence
tRNAs |
|
blocs tRNAs |
blocs rRNAs |
|
|
clos8 |
1aa |
>1aa |
dup |
+5s |
1-3aas |
autres |
total |
|
21 |
faible |
31 |
19 |
2 |
6 |
2 |
5 |
65 |
|
16 |
moyen |
36 |
66 |
4 |
101 |
20 |
42 |
269 |
|
14 |
fort |
11 |
155 |
2 |
195 |
29 |
14 |
406 |
|
|
|
78 |
240 |
8 |
302 |
51 |
61 |
740 |
|
10 |
g+cga |
16 |
13 |
|
2 |
|
|
31 |
|
2 |
agg+cgg |
5 |
2 |
|
|
1 |
|
8 |
|
4 |
carre ccc |
4 |
4 |
|
4 |
1 |
5 |
13 |
|
5 |
autres |
6 |
|
2 |
|
|
|
8 |
|
|
|
31 |
19 |
2 |
6 |
2 |
5 |
65 |
|
|
|
total tRNAs ‰ |
|
|
|
|
|
clos8 |
1aa |
>1aa |
dup |
+5s |
1-3aas |
autres |
clos ‰ |
ref.‰
|
21 |
faible |
42 |
26 |
3 |
8 |
3 |
7 |
88 |
26
|
16 |
moyen |
49 |
89 |
5 |
136 |
27 |
57 |
364 |
324
|
14 |
fort |
15 |
209 |
3 |
264 |
39 |
19 |
549 |
650
|
|
|
105 |
324 |
11 |
408 |
69 |
82 |
740 |
729
|
10 |
g+cga |
22 |
18 |
|
3 |
|
|
42 |
10
|
2 |
agg+cgg |
7 |
3 |
|
|
1 |
|
11 |
|
4 |
carre ccc |
5 |
5 |
|
5 |
1 |
7 |
18 |
16
|
5 |
autres |
8 |
0 |
3 |
0 |
|
|
11 |
|
|
|
42 |
26 |
3 |
8 |
3 |
7 |
88 |
|
|
|
blocs tRNAs ‰ |
|
total colonne %
|
|
clos8 |
1aa |
>1aa |
dup |
total |
ref.‰ |
1aa |
>1aa |
dup
|
21 |
faible |
95 |
58 |
6 |
160 |
26 |
40 |
8 |
|
16 |
moyen |
110 |
202 |
12 |
325 |
324 |
46 |
28 |
|
14 |
fort |
34 |
475 |
6 |
515 |
650 |
14 |
65 |
|
|
|
239 |
736 |
25 |
326 |
729 |
78 |
240 |
|
10 |
g+cga |
49 |
40 |
|
89 |
10 |
52 |
|
|
2 |
agg+cgg |
15 |
6 |
|
21 |
|
16 |
|
|
4 |
carre ccc |
12 |
12 |
|
25 |
16 |
13 |
|
|
5 |
autres |
18 |
|
6 |
25 |
|
19 |
|
|
|
|
95 |
58 |
6 |
160 |
|
31 |
|
|
clostridia, estimation des -rRNAs
- Lien tableur: clostridia, estimation des -rRNAs
- Liens fiche: typage
- Légende: prélèvement de la base gtRNAdb le 27.5.20
- - ttt et tgt sont nuls partout
- - atgi, c'est Ile2, mis à la place de ttt, très rare chez les procaryotes.
- - atgf, c'est Metf, mis à la place de tgt, très rare chez les procaryotes.
- - atgj, c'est Met, remplace le atg standard qui est la somme Ile2 Met fMet.
- - Voir la légende des tris, g1 t1 et des couleurs
clostridia, calcul des -rRNAs
clo clostridia 63 génomes
clo1 cumul des +rRNAs de la fiche clostridia pour 43 génomes
g1 |
|
t1 |
|
|
|
|
|
a atgi |
29 |
a tct |
|
tat |
|
atgf |
30
|
b att |
|
i act |
|
aat |
|
agt |
|
c ctt |
|
e cct |
|
cat |
|
cgc |
|
d gtt |
|
m gct |
|
gat |
|
ggt |
|
e ttc |
44 |
b tcc |
1 |
tac |
26 |
tgc |
16
|
f atc |
72 |
j acc |
10 |
aac |
64 |
agc |
11
|
g ctc |
2 |
f ccc |
3 |
cac |
12 |
cgt |
8
|
h gtc |
4 |
n gcc |
12 |
gac |
40 |
ggc |
23
|
i tta |
19 |
c tca |
13 |
taa |
|
tga |
|
j ata |
|
k aca |
29 |
aaa |
48 |
aga |
21
|
k cta |
18 |
g cca |
17 |
caa |
25 |
cga |
1
|
l gta |
38 |
o gca |
92 |
gaa |
45 |
gga |
31
|
m ttg |
|
d tcg |
1 |
tag |
|
tgg |
9
|
n atgj |
18 |
l acg |
3 |
aag |
2 |
agg |
1
|
o ctg |
5 |
h ccg |
2 |
cag |
1 |
cgg |
3
|
p gtg |
1 |
p gcg |
|
gag |
4 |
ggg |
2
|
clos43 |
inter |
|
max |
|
min |
|
total
|
|
346 |
|
468 |
|
42 |
|
856
|
|
clo2 indices du clade clostridia du 27.5.20 de gtRNAdb pour 100 génomes
g1 |
|
t1 |
|
|
174 |
4.0 |
0.6
|
a atgi |
159 |
a tct |
1.1 |
tat |
|
atgf |
187
|
b att |
1.1 |
i act |
|
aat |
|
agt |
0.6
|
c ctt |
16 |
e cct |
2.3 |
cat |
|
cgc |
|
d gtt |
0.6 |
m gct |
|
gat |
|
ggt |
|
e ttc |
206 |
b tcc |
103 |
tac |
187 |
tgc |
151
|
f atc |
152 |
j acc |
102 |
aac |
248 |
agc |
133
|
g ctc |
81 |
f ccc |
62 |
cac |
140 |
cgt |
116
|
h gtc |
53 |
n gcc |
61 |
gac |
242 |
ggc |
220
|
i tta |
172 |
c tca |
142 |
taa |
1.1 |
tga |
55
|
j ata |
2.9 |
k aca |
218 |
aaa |
271 |
aga |
174
|
k cta |
148 |
g cca |
163 |
caa |
156 |
cga |
48
|
l gta |
286 |
o gca |
219 |
gaa |
239 |
gga |
243
|
m ttg |
108 |
d tcg |
83 |
tag |
2.3 |
tgg |
120
|
n atgj |
132 |
l acg |
77 |
aag |
120 |
agg |
96
|
o ctg |
76 |
h ccg |
64 |
cag |
77 |
cgg |
60
|
p gtg |
34 |
p gcg |
35 |
gag |
83 |
ggg |
70
|
gtRNA |
inter |
|
max |
|
min |
|
total
|
|
2231 |
|
2982 |
|
1177 |
|
6390
|
|
clo3 cumul des -rRNAs de l'annexe archeo 8 génomes
g1 |
|
t1 |
|
|
|
|
|
a atgi |
1 |
a tct |
|
tat |
|
atgf |
11
|
b att |
|
i act |
|
aat |
|
agt |
1
|
c ctt |
3 |
e cct |
|
cat |
|
cgc |
|
d gtt |
|
m gct |
|
gat |
|
ggt |
|
e ttc |
7 |
b tcc |
6 |
tac |
10 |
tgc |
6
|
f atc |
|
j acc |
6 |
aac |
6 |
agc |
8
|
g ctc |
3 |
f ccc |
2 |
cac |
8 |
cgt |
4
|
h gtc |
2 |
n gcc |
1 |
gac |
15 |
ggc |
11
|
i tta |
11 |
c tca |
9 |
taa |
|
tga |
3
|
j ata |
1 |
k aca |
17 |
aaa |
14 |
aga |
10
|
k cta |
11 |
g cca |
14 |
caa |
8 |
cga |
4
|
l gta |
20 |
o gca |
|
gaa |
17 |
gga |
14
|
m ttg |
9 |
d tcg |
2 |
tag |
|
tgg |
7
|
n atgj |
10 |
l acg |
4 |
aag |
6 |
agg |
6
|
o ctg |
4 |
h ccg |
1 |
cag |
4 |
cgg |
1
|
p gtg |
1 |
p gcg |
1 |
gag |
3 |
ggg |
3
|
clos8 |
inter |
|
max |
|
min |
|
total
|
|
107 |
|
168 |
|
51 |
|
326
|
|
clo4 indices des +rRNAs de la fiche clostridia pour 100 génomes
g1 |
|
t1 |
|
|
|
|
|
a atgi |
67 |
a tct |
|
tat |
|
atgf |
70
|
b att |
|
i act |
|
aat |
|
agt |
|
c ctt |
|
e cct |
|
cat |
|
cgc |
|
d gtt |
|
m gct |
|
gat |
|
ggt |
|
e ttc |
102 |
b tcc |
2.3 |
tac |
60 |
tgc |
37
|
f atc |
167 |
j acc |
23 |
aac |
149 |
agc |
26
|
g ctc |
4.7 |
f ccc |
7 |
cac |
28 |
cgt |
19
|
h gtc |
9.3 |
n gcc |
28 |
gac |
93 |
ggc |
53
|
i tta |
44 |
c tca |
30 |
taa |
|
tga |
3.0
|
j ata |
|
k aca |
67 |
aaa |
112 |
aga |
49
|
k cta |
42 |
g cca |
40 |
caa |
58 |
cga |
2.3
|
l gta |
88 |
o gca |
214 |
gaa |
105 |
gga |
72
|
m ttg |
|
d tcg |
2.3 |
tag |
|
tgg |
21
|
n atgj |
42 |
l acg |
7.0 |
aag |
4.7 |
agg |
2.3
|
o ctg |
12 |
h ccg |
4.7 |
cag |
2.3 |
cgg |
7.0
|
p gtg |
2.3 |
p gcg |
|
gag |
9.3 |
ggg |
4.7
|
clos43 |
inter |
|
max |
|
min |
|
total
|
|
805 |
|
1088 |
|
98 |
|
1991
|
|
clo5 estimation des -rRNA du clade clostridia pour 100 génomes
g1 |
|
t1 |
|
|
|
|
|
a atgi |
92 |
a tct |
1.1 |
tat |
|
atgf |
117
|
b att |
1.1 |
i act |
|
aat |
|
agt |
0.6
|
c ctt |
16 |
e cct |
2.3 |
cat |
|
cgc |
|
d gtt |
0.6 |
m gct |
|
gat |
|
ggt |
|
e ttc |
104 |
b tcc |
101 |
tac |
127 |
tgc |
114
|
f atc |
-15 |
j acc |
79 |
aac |
99 |
agc |
107
|
g ctc |
76 |
f ccc |
55 |
cac |
112 |
cgt |
97
|
h gtc |
44 |
n gcc |
33 |
gac |
149 |
ggc |
167
|
i tta |
128 |
c tca |
112 |
taa |
1.1 |
tga |
55
|
j ata |
2.9 |
k aca |
151 |
aaa |
159 |
aga |
125
|
k cta |
106 |
g cca |
123 |
caa |
98 |
cga |
46
|
l gta |
198 |
o gca |
5 |
gaa |
134 |
gga |
171
|
m ttg |
108 |
d tcg |
81 |
tag |
2.3 |
tgg |
99
|
n atgj |
90 |
l acg |
70 |
aag |
115 |
agg |
94
|
o ctg |
64 |
h ccg |
59 |
cag |
75 |
cgg |
53
|
p gtg |
32 |
p gcg |
35 |
gag |
74 |
ggg |
65
|
-rRNA |
inter |
|
max |
|
min |
|
total
|
|
1426 |
|
1894 |
|
1080 |
|
4400
|
|
clo6 indices des -rRNAs de l'annexe archeo pour 100 génomes
g1 |
|
t1 |
|
|
|
|
|
a atgi |
13 |
a tct |
|
tat |
|
atgf |
138
|
b att |
|
i act |
|
aat |
|
agt |
13
|
c ctt |
38 |
e cct |
|
cat |
|
cgc |
|
d gtt |
|
m gct |
|
gat |
|
ggt |
|
e ttc |
88 |
b tcc |
75 |
tac |
125 |
tgc |
75
|
f atc |
|
j acc |
75 |
aac |
75 |
agc |
100
|
g ctc |
38 |
f ccc |
25 |
cac |
100 |
cgt |
50
|
h gtc |
25 |
n gcc |
13 |
gac |
188 |
ggc |
138
|
i tta |
138 |
c tca |
113 |
taa |
|
tga |
38
|
j ata |
13 |
k aca |
213 |
aaa |
175 |
aga |
125
|
k cta |
138 |
g cca |
175 |
caa |
100 |
cga |
50
|
l gta |
250 |
o gca |
|
gaa |
213 |
gga |
175
|
m ttg |
113 |
d tcg |
25 |
tag |
|
tgg |
88
|
n atgj |
125 |
l acg |
50 |
aag |
75 |
agg |
75
|
o ctg |
50 |
h ccg |
13 |
cag |
50 |
cgg |
13
|
p gtg |
13 |
p gcg |
13 |
gag |
38 |
ggg |
38
|
clos8 |
inter |
|
max |
|
min |
|
total
|
|
1325 |
|
2100 |
|
638 |
|
4063
|
|
clostridia, comparaison clade-annexe des -rRNAs
- Lien tableur: clostridia, comparaison clade-annexe des -rRNAs
- Légende
- - clo7. diff, somme des couleurs de clo7. La différence entre tRNAs est faite entre clo5 et clo6 du tableau précédent. Elle est exprimée en % et rapporté à la plus grande valeur des 2 termes de la différence. Ce qui fait quand un tRNA est à zéro la différence en % est égale à 100.
- - clo8. rap, rapport des sommes couleurs clo5/clo2. Le rapport -rRNA/total est celui du tRNA de clo5 sur celui de clo2.
- Fréquences des différences en % du tableau clo7
gamme 0/0 10 20 30 40 50 60 70 80 90 100 total
fréquence 0 11 6 10 5 4 3 4 3 1 2 0 49
tot ≤ 50 41
- Comparaison avec le nombre de tRNAs de la fiche du clade: L’estimation des -rRNA par l'annexe est 15% en dessous de celle de la fiche des clostridia.
tRNAs fiche annexe
sans 2050 326
avec 888 752
genomes 43 8
indice % 48 41
clo clostridia 63 génomes
clo7 clostridia, différence clade-annexe des -rRNAs
g1 |
|
t1 |
|
|
|
|
|
a atgi |
86 |
a tct |
100 |
tat |
|
atgf |
15
|
b att |
100 |
i act |
|
aat |
|
agt |
95
|
c ctt |
59 |
e cct |
100 |
cat |
|
cgc |
|
d gtt |
100 |
m gct |
|
gat |
|
ggt |
|
e ttc |
16 |
b tcc |
26 |
tac |
1 |
tgc |
34
|
f atc |
100 |
j acc |
5 |
aac |
24 |
agc |
7
|
g ctc |
51 |
f ccc |
55 |
cac |
11 |
cgt |
49
|
h gtc |
43 |
n gcc |
62 |
gac |
21 |
ggc |
17
|
i tta |
7 |
c tca |
1 |
taa |
100 |
tga |
32
|
j ata |
77 |
k aca |
29 |
aaa |
9 |
aga |
0
|
k cta |
23 |
g cca |
29 |
caa |
2 |
cga |
9
|
l gta |
21 |
o gca |
100 |
gaa |
37 |
gga |
2
|
m ttg |
4 |
d tcg |
69 |
tag |
100 |
tgg |
12
|
n atgj |
28 |
l acg |
29 |
aag |
35 |
agg |
20
|
o ctg |
22 |
h ccg |
79 |
cag |
33 |
cgg |
76
|
p gtg |
61 |
p gcg |
64 |
gag |
49 |
ggg |
43
|
diff |
inter |
|
max |
|
min |
|
total
|
|
265 |
|
272 |
|
944 |
|
1481
|
|
clo8 clostridia, rapports -rRNA/total
g1 |
|
t1 |
|
|
|
|
|
a atgi |
58 |
a tct |
|
tat |
|
atgf |
63
|
b att |
|
i act |
|
aat |
|
agt |
95
|
c ctt |
100 |
e cct |
|
cat |
|
cgc |
|
d gtt |
|
m gct |
|
gat |
|
ggt |
|
e ttc |
50 |
b tcc |
98 |
tac |
68 |
tgc |
75
|
f atc |
-10 |
j acc |
77 |
aac |
40 |
agc |
81
|
g ctc |
94 |
f ccc |
89 |
cac |
80 |
cgt |
84
|
h gtc |
82 |
n gcc |
54 |
gac |
62 |
ggc |
76
|
i tta |
74 |
c tca |
79 |
taa |
|
tga |
100
|
j ata |
100 |
k aca |
69 |
aaa |
59 |
aga |
72
|
k cta |
72 |
g cca |
75.7 |
caa |
63 |
cga |
95
|
l gta |
69 |
o gca |
2 |
gaa |
56 |
gga |
70
|
m ttg |
100 |
d tcg |
97 |
tag |
|
tgg |
83
|
n atgj |
68 |
l acg |
91 |
aag |
96 |
agg |
98
|
o ctg |
85 |
h ccg |
93 |
cag |
97 |
cgg |
88
|
p gtg |
93 |
p gcg |
100 |
gag |
89 |
ggg |
93
|
rap |
inter |
|
max |
|
min |
|
total
|
|
64 |
|
64 |
|
92 |
|
69
|
|