Une page de Wikiversité, la communauté pédagogique libre.
En raison de limitations techniques, la typographie souhaitable du titre, «
Annexe : spiroLes clusters de gènes tRNA et rRNA chez les procaryotes/Annexe/spiro », n'a pu être restituée correctement ci-dessus.
Spirochetes
Sphaerochaeta coccoides DSM 17374
scc opérons
Lien tableur: scc opérons
Liens: gtRNAdb [1] , NCBI [2] , génome [orgn ]
Phylogénie: Bacteria; Spirochaetes; Spirochaetales; Spirochaetaceae; Sphaerochaeta.
Légende:
Sp1. scc opérons, Sphaerochaeta coccoides DSM 17374.
50.6%GC
12.1.21 Paris
3.16s
doubles
intercal
cds
aa
avec.aa
cdsa
cdsd
protéines
comp
215073..215231
cds
1194
1194
53
hp
comp
216426..216498
gcg
@1
369
369
369
comp
216868..217047
cds
60
hp
243358..244170
cds
@2
812
812
271
HAD-IIB family hydrolase
244983..246519
16s
132
132
246652..246725
atc
79
79
246805..249778
23s
72
249851..249962
5s
175
175
175
250138..250947
cds
270
metal ABC transporter permease
300128..301798
cds
669
669
557
formate--tetrahydrofolate ligase
302468..302539
ggg
452
452
452
302992..304032
cds
347
ABC transporter substrate-binding protein
comp
316296..317216
cds
152
152
307
152
phosphatase PAP2 family protein
317369..317442
gac
176
176
317619..318692
cds
358
tRNA 2-thiouridine(34) synthase MnmA
330207..331004
cds
16
16
266
16
class I SAM-dependent methyltransferase
comp
331021..331104
ttg
251
251
331356..333446
cds
697
patatin-like phospholipase family protein
comp
345290..346216
cds
228
228
309
hp
comp
346445..346517
ccg
182
182
182
comp
346700..347059
cds
120
hp
422975..424363
cds
71
71
463
71
sulfatase-like hydrolase/transferase
comp
424435..424506
gtc
252
252
424759..426600
cds
614
hp
436852..438168
cds
237
237
439
MFS transporter
comp
438406..438477
gtg
202
202
202
438680..440152
cds
491
hp
comp
481186..482484
cds
180
180
433
HD domain-containing protein
482665..482737
atgj
82
82
82
482820..483494
cds
225
hp
530805..532313
cds
82
82
503
82
IMP dehydrogenase
532396..532467
gta
310
310
532778..533485
cds
236
YggS family pyridoxal phosphate-dependent enzyme
568939..569700
cds
102
102
254
102
NAD-dependent deacetylase
569803..569874
gga
412
412
570287..570952
cds
222
hp
636017..636391
cds
52
52
125
52
chorismate mutase
636444..636517
aca
334
334
comp
636852..637013
cds
54
hp
comp
717326..717772
cds
66
66
149
66
YkgJ family cysteine cluster protein
comp
717839..717920
tac
230
230
718151..719386
cds
412
aminopeptidase
comp
721419..723056
cds
@3
67
67
546
67
ATP-binding cassette domain-containing protein
comp
723124..723195
gag
10
10
comp
723206..723276
cag
104
104
comp
723381..723911
cds
177
adenine phosphoribosyltransferase
comp
724974..725225
cds
236
236
84
hp
comp
725462..725533
acg
124
124
124
comp
725658..728366
cds
903
pyruvate, phosphate dikinase
comp
767509..768549
cds
350
350
347
350
DegT/DnrJ/EryC1/StrS aminotransferase family protein
comp
768900..769011
5s
72
comp
769084..772057
23s
40
40
comp
772098..772171
gca
137
137
comp
772309..773845
16s
535
535
774381..774947
cds
189
peroxiredoxin
783089..784627
cds
273
273
513
glycoside hydrolase family 43 protein
comp
784901..784972
gaa
43
43
comp
785016..785088
aaa
223
223
223
785312..787483
cds
724
cadmium-translocating P-type ATPase
comp
877367..879202
cds
447
447
612
447
translational GTPase TypA
comp
879650..879761
5s
72
comp
879834..882807
23s
40
40
comp
882848..882921
gca
137
137
comp
883059..884595
16s
648
648
885244..885867
cds
208
GNAT family N-acetyltransferase
900855..901490
cds
73
73
212
73
Fic family protein
comp
901564..901637
ccc
214
214
901852..903519
cds
556
Alpha-glucosidase
928254..930545
cds
138
138
764
138
AAA family ATPase
930684..930755
cac
32
32
930788..930861
cga
38
38
930900..930972
aag
37
37
931010..931091
cta
36
36
931128..931199
ggc
423
423
931623..932981
cds
453
trigger factor
937885..939693
cds
171
171
603
171
oligoendopeptidase F
939865..939938
aga
437
437
940376..940579
cds
68
helix-turn-helix domain-containing protein
comp
974079..974468
cds
@4
223
223
130
tyrosine-type recombinase/integrase
comp
974692..974775
ctc
153
153
153
comp
974929..975384
cds
112
112
152
VOC family protein
comp
975497..975569
cca
95
95
95
975665..976339
cds
225
endonuclease III
1069506..1069922
cds
81
81
139
hp
comp
1070004..1070087
tta
78
78
78
1070166..1070981
cds
272
TatD family hydrolase
comp
1113338..1113928
cds
247
247
197
247
NAD(P)H-dependent oxidoreductase
1114176..1114248
aac
247
247
comp
1114496..1117318
cds
941
5'-nucleotidase C-terminal domain-containing protein
comp
1126672..1127604
cds
173
173
311
173
DUF362 domain-containing protein
1127778..1127850
caa
193
193
comp
1128044..1128334
cds
97
septation regulator SpoVG
comp
1257969..1258763
cds
140
140
265
nucleotidyltransferase domain-containing protein
1258904..1258977
agg
79
79
79
1259057..1259779
cds
241
nitroreductase family protein
comp
1273039..1273944
cds
217
217
302
DNA-protecting protein DprA
1274162..1274234
ttc
103
103
103
comp
1274338..1274865
cds
176
cysteine hydrolase
comp
1363097..1364389
cds
432
432
431
H(+)-transporting two-sector ATPase
1364822..1364894
atgf
213
213
213
1365108..1366457
cds
450
Trk system potassium transporter TrkA
comp
1478531..1479448
cds
196
196
306
196
hp
1479645..1479718
cgg
256
256
comp
1479975..1481738
cds
588
ABC transporter ATP-binding protein
comp
1522454..1523143
cds
86
86
230
hp
1523230..1523301
tgc
34
34
34
comp
1523336..1523890
cds
185
hp
comp
1540671..1541807
cds
186
186
379
186
DUF2974 domain-containing protein
comp
1541994..1542066
gcc
351
351
1542418..1544223
cds
602
IS1634 family transposase
1691238..1692578
cds
189
189
447
189
sn-glycerol-1-phosphate dehydrogenase
1692768..1692851
ctg
564
564
1693416..1693646
cds
77
helix-turn-helix domain-containing protein
comp
1760709..1761905
cds
185
185
399
185
hp
1762091..1762164
atgi
316
316
comp
1762481..1765135
cds
885
valine--tRNA ligase
comp
2034849..2035028
cds
@4
32
32
60
preprotein translocase subunit SecE
comp
2035061..2035134
tgg
26
26
26
comp
2035161..2035337
cds
64
64
59
64
50S ribosomal protein L33
comp
2035402..2035474
acc
246
246
2035721..2036506
cds
262
HAD family hydrolase
2185380..2186171
cds
@5
84
84
264
84
16S rRNA (uracil(1498)-N(3))-methyltransferase
2186256..2186340
tca
40
40
2186381..2186467
agc
25
25
2186493..2186566
cgc
16
16
2186583..2186669
tcg
40
40
2186710..2186795
tcc
13
2186809..2186906
ncRNA
133
133
33
comp
2187040..2188236
cds
399
transposase
scc cumuls
cumuls. scc.
opérons
Fréquences intercalaires tRNAs
Fréquences intercalaires cds
Fréquences aas cds
effectif
gammes
sans rRNAs
avec rRNAs
gammes
cds
gammes
cdsd
gammes
cdsa
gammes
cdsa 300
avec rRNA
opérons
3
1
0
1
0
1
0
100
9
-
-
16 23 5s 0
20
2
50
4
20
1
200
11
16 atc23s5s
1
40
7
2
100
14
40
2
300
16
16gca23s5s
2
60
1
0
150
8
60
1
400
11
max a
1
80
1
200
13
80
7
500
9
a doubles
100
0
250
13
100
4
600
6
autres
120
0
300
4
120
2
700
5
total aas
3
140
3
350
4
140
2
800
2
sans
opérons
34
160
400
2
160
2
900
1
1 aa
30
180
450
5
180
3
1000
2
max a
5
200
500
1
200
5
1100
a doubles
0
6
4
total aas
44
10
6
74
33
72
total aas
47
remarques
5
avec jaune
moyenne
32
94
236
154
343
variance
11
47
196
108
215
sans jaune
moyenne
188
124
299
variance
110
64
164
scc blocs
Sp1. Sphaerochaeta coccoides
cds
812
cds
350
447
16s
132
5s
72
72
atc
79
23s
40
40
23s
72
gca
137
137
5s
175
16s
535
648
cds
cds
scc remarques
Lien tableur: scc remarques
Remarques : Ce génome se distingue par ses 3 blocs à rRNA avec 1 seul aa et le grand nombre de solitaires.
@ Sur les 30 solitaires 9 sont rares dont ccc. Deux autres rares sont dans un blocs de 2 aas. Les 2 blocs de 5aas contiennent chacun un rare, tcg aag.
@ Il n’y a pas plus d’un aa entre 16s et 23s et qui sont les plus communs, atc et gca comme les archées qui n’ont que gca. Les intercalaires, à par les cds, sont identiques sauf pour l’intercalaire aa-23s qui est différent entre atc et gca, du double, 40/79.
@ Les 2 rares ne sont pas solitaires comme les 9 autres. Ils appartiennent à la même colonne, xag qui est plus fréquentes que la colonne xcg.
@ 2 blocs avec 2 opérons solitaires séparés par un petit cds de 152 et 59 aas. Les intercalaires sont moyens pour le 1er (120 pbs) et faibles (30 pbs) pour le second.
@ 2 blocs de 5 aas. Le dernier contient un aa rare et cgc au lieu de cgt.
Séquences des doubles: pas de doubles.
scc distribution
sp1 scc, Sphaerochaeta coccoides DSM 17374. spirochète.
sp11 scc, distribution par type
g1
t1
a atgi
1
a tct
tat
atgf
1
b att
i act
aat
agt
c ctt
e cct
cat
cgc
1
d gtt
m gct
gat
ggt
e ttc
1
b tcc
1
tac
1
tgc
1
f atc
1
j acc
1
aac
1
agc
1
g ctc
1
f ccc
1
cac
1
cgt
0
h gtc
1
n gcc
1
gac
1
ggc
1
i tta
1
c tca
1
taa
tga
j ata
k aca
1
aaa
1
aga
1
k cta
1
g cca
1
caa
1
cga
1
l gta
1
o gca
2
gaa
1
gga
1
m ttg
1
d tcg
1
tag
tgg
1
n atgj
1
l acg
1
aag
1
agg
1
o ctg
1
h ccg
1
cag
1
cgg
1
p gtg
1
p gcg
1
gag
1
ggg
1
spiro
>1aa
=1aa
-5s
+5s
-16s
+16s
total
scc
14
30
3
47
sp12 scc, distribution sur référence
g1
t1
a atgi
1
a tct
tat
atgf
1
b att
i act
aat
agt
c ctt
e cct
cat
cgc
1
d gtt
m gct
gat
ggt
e ttc
1
b tcc
1
tac
1
tgc
1
f atc
1
j acc
1
aac
1
agc
1
g ctc
1
f ccc
1
cac
1
cgt
0
h gtc
1
n gcc
1
gac
1
ggc
1
i tta
1
c tca
1
taa
tga
j ata
k aca
1
aaa
1
aga
1
k cta
1
g cca
1
caa
1
cga
1
l gta
1
o gca
2
gaa
1
gga
1
m ttg
1
d tcg
1
tag
tgg
1
n atgj
1
l acg
1
aag
1
agg
1
o ctg
1
h ccg
1
cag
1
cgg
1
p gtg
1
p gcg
1
gag
1
ggg
1
inter
max
min
total
17
13
17
47
spiro2. indices du 11.1.21 73 génomes
g1
t1
73
2823
0
0
a atgi
96
a tct
tat
atgf
96
b att
i act
aat
agt
c ctt
e cct
cat
cgc
90
d gtt
m gct
gat
ggt
e ttc
125
b tcc
100
tac
100
tgc
100
f atc
100
j acc
100
aac
100
agc
100
g ctc
103
f ccc
55
cac
100
cgt
12
h gtc
55
n gcc
59
gac
107
ggc
103
i tta
100
c tca
100
taa
tga
16
j ata
1
k aca
100
aaa
100
aga
101
k cta
100
g cca
100
caa
100
cga
92
l gta
101
o gca
114
gaa
82
gga
100
m ttg
100
d tcg
41
tag
tgg
100
n atgj
97
l acg
58
aag
78
agg
66
o ctg
52
h ccg
42
cag
42
cgg
47
p gtg
34
p gcg
41
gag
40
ggg
21
inter
max
min
total
scc intercalaires entre cds
Lien NCBI [3]
Note : Pour les génomes des annexes j'ai relevé les intercalaires entre tRNAs et entre ceux-ci et les cds qui leur sont adjacents. L'exemple est celui de rru du clade alpha. L'idée de départ de ces prélèvements est la recherche d'opérons formés de tRNA et de protéine comme dans le cas d'E.coli: l'intercalaire entre le tRNA et la protéine devrait être faible. Voir l'exemple d'eco (remarque @3) avec tac-tac-tpr et aca-tac-gga-acc-tufB .
scc les fréquences
Lien tableur: scc intercalaires entre cds
Légende: long, longueur en pbs, intercal pour intercalaire
- fréquence-1 1 5 6 f, respectivement fréquence des intercalaires négatives à l'unité, positives à l'unité, par blocs de 5, par blocs de 10 jusqu'à 600 pbs et f pour finales. Ces fréquences servent à faire les diagrammes. La fréquence fréquence6 est étendue à 1200 pour certains grands génomes.
- cumul,% colonne à la droite de frequence6, reprend les fréquences par plages et leurs pourcentages indiqués déjà dans la 1ère partie du tableau.
- La couleur cyan des fréquences fréquence-1 et 1 sert à montrer leur périodicité ternaire.
- intercaln intercalx, pour les intercalaires négatifs minimaux et intercalaires positifs maximaux.
- colonne ADN pour la longueur totale du génome en pbs et intercals pour le total en pbs des intercalaires entre cds uniquement, d'après la méthode des prélèvements de NCBI du 16.7.20 .
scc Les fréquences des intercalaires entre cds
scc
intercalaires
total
%
intercalaires
moyenne
ecartype
plage
ADN
intercal
frequence5
négatif
347
19.2
négatif
-10
13
-1 à -74
2 227 296
-1
347
zéro
8
0.4
intercals
0
8
1 à 200
1112
61.6
0 à 200
69
57
195 310
5
106
201 à 370
241
13.4
201 à 370
269
49
8.8%
10
67
371 à 600
78
4.3
371 à 600
445
63
15
78
601 à max
19
1.1
601 à 1048
779
145
20
57
total 1805
<201
81
total 1800
103
136
-74 à 1048
25
44
adresse
intercalx
intercal
fréquence1
intercal
fréquence6
cumul,%
intercal
fréquence-1
30
36
1398976
1670
-1
347
-70
2
0
8
35
30
1167746
1666
0
8
-60
2
-1
39
40
31
1943263
1598
1
32
-50
3
-2
1
45
39
2221165
1229
2
27
-40
6
-3
0
50
33
940376
1048
3
26
-30
6
min à -1
-4
158
55
27
2116721
960
4
8
-20
27
347
-5
0
60
14
1197192
959
5
13
-10
62
19.2%
-6
2
65
36
1728512
916
6
4
0
247
-7
6
70
26
1917725
874
7
10
10
173
-8
31
75
22
972954
867
8
11
20
135
-9
2
80
31
1554925
775
9
21
30
80
-10
5
85
26
1997696
715
10
21
40
61
1 à 100
-11
19
90
27
1693573
700
11
12
50
72
793
-12
2
95
33
1314184
671
12
17
60
41
44%
-13
3
100
22
1528150
655
13
18
70
62
-14
17
105
23
1659099
643
14
18
80
53
-15
1
110
21
1773078
643
15
13
90
53
-16
5
115
20
1732369
635
16
8
100
55
0 à 200
-17
9
120
21
356981
617
17
8
110
44
1120
-18
1
125
20
137346
590
18
15
120
41
-19
0
130
18
1639500
590
19
11
130
38
-20
10
135
20
977451
580
20
15
140
39
-21
0
140
19
661808
579
21
7
150
30
-22
0
145
16
1611095
565
22
6
160
30
-23
4
150
14
1590201
563
23
10
170
27
1 à 200
-24
2
155
17
1330173
561
24
12
180
28
1112
-25
2
160
13
379215
558
25
9
190
22
62%
-26
7
165
15
1755945
548
26
12
200
28
-27
0
170
12
191845
527
27
7
210
21
-28
0
175
12
1897378
525
28
5
220
27
-29
2
180
16
72886
522
29
6
230
19
-30
0
185
12
1978592
521
30
6
240
22
-31
2
190
10
511329
515
31
9
250
17
-32
3
195
14
220737
512
32
3
260
12
42
200
14
1410834
511
33
4
270
15
reste
14
205
11
34
8
280
10
total
355
210
10
35
6
290
15
215
20
36
6
300
12
intercal
frequencef
220
7
37
4
310
11
600
1786
225
11
38
9
320
16
620
1
230
8
39
10
330
8
640
1
235
10
40
2
340
11
201 à 370
660
3
240
12
reste
1001
350
7
241
680
1
245
8
total
1638
360
12
13.4%
700
1
250
9
370
6
720
1
255
7
380
8
740
260
5
adresse
intercaln
décalage
long
390
10
760
265
8
438680
-120
comp
400
6
780
1
270
7
1693416
-74
shift2
158
410
7
800
275
4
277564
-68
shift2
1487
420
8
820
280
6
1935981
-68
shift2
686
430
4
840
285
6
964418
-59
shift2
296
440
4
860
290
9
1721260
-59
shift2
1127
450
1
880
2
295
8
482820
-53
shift2
623
460
1
900
300
4
1283977
-47
comp
470
5
920
1
305
6
1310625
-46
shift2
417
480
3
940
310
5
1544483
-44
shift2
374
490
2
960
2
315
9
1705959
-44
shift2
1007
500
2
980
320
7
950419
-41
510
1
1000
325
4
1249575
-41
520
3
1020
330
4
2054241
-34
530
4
1040
335
4
937251
-32
540
0
371 à 600
1060
1
340
7
1154295
-32
550
1
78
15
345
2
1972305
-32
560
1
4.3%
350
5
485333
-31
570
3
355
4
1666650
-31
580
2
601 à max
360
8
952193
-29
590
2
19
365
4
1123783
-29
600
0
1.1%
370
2
669889
-26
reste
19
reste
4
reste
97
733006
-26
total
1805
total
1805
total
1805
scc autres intercalaires
Lien tableur: scc autres intercalaires
Légende:
- comp, le gène est sur le brin complement
- deb, fin sont respectivement dans le sens des adresses croissantes, le cds avant le 1er tRNA et le cds après le dernier tRNA du bloc.
scc Les autres intercalaires.
scc1 adresses1
deb-fin
gènes
adresses
intercal
sens
deb
CDS
215073
1194
comp
tRNA
216426
369
comp
fin
CDS
216868
comp
deb
CDS
243358
812
rRNA
244983
132
tRNA
246652
79
rRNA
246805
72
rRNA
249851
175
fin
CDS
250138
comp
deb
CDS
300128
669
tRNA
302468
452
fin
CDS
302992
deb
CDS
316296
152
comp
tRNA
317369
176
fin
CDS
317619
deb
CDS
330207
16
tRNA
331021
251
comp
fin
CDS
331356
deb
CDS
345290
228
comp
tRNA
346445
182
comp
fin
CDS
346700
comp
deb
CDS
422975
71
tRNA
424435
252
comp
fin
CDS
424759
deb
CDS
436852
237
tRNA
438406
202
comp
fin
CDS
438680
deb
CDS
481186
180
comp
tRNA
482665
82
fin
CDS
482820
deb
CDS
530805
82
tRNA
532396
310
fin
CDS
532778
deb
CDS
568939
102
tRNA
569803
412
fin
CDS
570287
deb
CDS
636017
52
tRNA
636444
334
fin
CDS
636852
comp
deb
CDS
640192
79
tmRNA
640610
334
fin
CDS
641322
comp
deb
CDS
711173
51
ncRNA
712064
10
comp
fin
CDS
712417
comp
deb
CDS
717326
66
tRNA
717839
230
fin
CDS
718151
scc2 adresses2
deb-fin
gènes
adresses
intercal
sens
deb
CDS
721419
67
comp
tRNA
723124
10
comp
tRNA
723206
104
comp
fin
CDS
723381
comp
deb
CDS
724974
236
comp
tRNA
725462
124
comp
fin
CDS
725658
comp
deb
CDS
767509
350
comp
rRNA
768900
72
comp
rRNA
769084
40
comp
tRNA
772098
137
comp
rRNA
772309
535
comp
fin
CDS
774381
deb
CDS
783089
273
tRNA
784901
43
comp
tRNA
785016
223
comp
fin
CDS
785312
deb
CDS
877367
447
comp
rRNA
879650
72
comp
rRNA
879834
40
comp
tRNA
882848
137
comp
rRNA
883059
648
comp
fin
CDS
885244
deb
CDS
900855
73
tRNA
901564
214
comp
fin
CDS
901852
deb
CDS
928254
138
tRNA
930684
32
tRNA
930788
38
tRNA
930900
37
tRNA
931010
36
tRNA
931128
423
fin
CDS
931623
deb
CDS
937885
171
tRNA
939865
437
fin
CDS
940376
deb
CDS
974079
223
comp
tRNA
974692
153
comp
deb
CDS
974929
112
comp
tRNA
975497
95
comp
fin
CDS
975665
deb
CDS
1069506
81
tRNA
1070004
78
comp
fin
CDS
1070166
deb
CDS
1084097
24
regulatory
1084535
39
fin
CDS
1084670
scc3 adresses3
deb-fin
gènes
adresses
intercal
sens
deb
CDS
1113338
247
comp
tRNA
1114176
247
fin
CDS
1114496
comp
deb
CDS
1126672
173
comp
tRNA
1127778
193
fin
CDS
1128044
comp
deb
CDS
1257969
140
comp
tRNA
1258904
79
fin
CDS
1259057
deb
CDS
1273039
217
comp
tRNA
1274162
103
fin
CDS
1274338
comp
deb
CDS
1301674
54
repeat_region
1302007
4
fin
CDS
1306496
deb
CDS
1319568
73
repeat_region
1319986
84
fin
CDS
1322087
comp
deb
CDS
1363097
432
comp
tRNA
1364822
213
fin
CDS
1365108
deb
CDS
1478531
196
comp
tRNA
1479645
256
fin
CDS
1479975
comp
deb
CDS
1522454
86
comp
tRNA
1523230
34
fin
CDS
1523336
comp
deb
CDS
1540671
186
comp
tRNA
1541994
351
comp
fin
CDS
1542418
deb
CDS
1691238
189
tRNA
1692768
564
fin
CDS
1693416
deb
CDS
1760709
185
comp
tRNA
1762091
316
fin
CDS
1762481
comp
deb
CDS
2034849
32
comp
tRNA
2035061
26
comp
deb
CDS
2035161
64
comp
tRNA
2035402
246
comp
fin
CDS
2035721
deb
CDS
2185380
84
tRNA
2186256
40
tRNA
2186381
25
tRNA
2186493
16
tRNA
2186583
40
tRNA
2186710
13
ncRNA
2186809
133
fin
CDS
2187040
comp
scc intercalaires tRNA
Lien tableur: scc intercalaires tRNA
Légende:
- comp', l'intercalaire est entre un gène comp (sur le complément) et un gène sur le brin direct. Continu les 2 gènes sont sur le même brin.
- deb, fin sont les intercalaires des cds du tableau précédent, autres intercalaires: respectivement dans le sens des adresses croissantes, le cds avant le 1er tRNA et le cds après le dernier tRNA du bloc.
Cumuls comp'+continu du tableau
deb fin total
<201 24 13 37
total 34 33 67
% 71 39 55
scc intercalaires tRNA
scc les relevés deb-fin
comp’
entre tRNAs
comp’
deb
comp’
fin
1194
369
669
452
comp’
152
176
comp’
16
comp’
251
228
182
comp’
71
comp’
252
comp’
237
comp’
202
comp’
180
82
82
310
102
412
52
comp’
334
66
230
10
67
104
236
124
43
comp’
273
comp’
223
comp’
73
comp’
214
32 38 37 36
138
423
171
437
223
153
112
comp’
95
comp’
81
comp’
78
comp’
247
comp’
247
comp’
173
comp’
193
comp’
140
79
comp’
217
comp’
103
comp’
432
213
comp’
196
comp’
256
comp’
86
comp’
34
186
comp’
351
189
564
comp’
185
comp’
316
32
26
64
comp’
246
40 25 16 40 13
84
scc intercalaires inférieures à 201 pbs
deb
fin
continu
cumuls
32
26
deb
52
79
<201
13
64
82
total
18
66
104
taux
72%
67
124
82
153
fin
84
176
<201
8
102
182
total
17
112
213
taux
47%
138
230
171
310
total
186
369
<201
21
189
412
total
35
223
423
taux
60%
228
437
236
452
669
564
1194
comp’
cumuls
16
34
deb
71
78
<201
11
73
95
total
16
81
103
taux
69%
86
193
140
202
fin
152
214
<201
5
173
223
total
16
180
246
taux
31%
185
247
196
251
total
217
252
<201
16
237
256
total
32
247
316
taux
50%
273
334
432
351
scc intercalaires rRNA
Voir la présentation des blocs à rRNA dans le chapitre scc blocs de l'étude préliminaire. A comparer avec le tableau scc autres intercalaires .
Remarque: Quand le 16s n'est pas précédé de tRNAs l'intercalaire cds-16s est élevé, il est ici de 812 pbs pour le 1er boc. L'intercalaire cds-bloc de l'autre côté du bloc est beaucoup plus faible, ici 175 pbs. Cette orientation est quasiment générale chez tous les génomes que j'ai étudié ici. Je l'ai notée dans les chapitres génome-bloc de chaque génome.
Note: J'ai supposé souvent que les blocs à tRNA sans rRNA sont aussi orientés de l'intercalaire le plus grand au plus petit. Dans scc cumuls et de même pour les autres génomes, j'ai noté cette orientation dans la colonne cdsd, pour cds dirigé. Je n'ai conservé pour les calculs que le plus petit intercalaire des 2 cds bordant le bloc. L'idée était que cette orientation provoquait la création du cds en fin de bloc. Ces cds sont souvent de petites protéines et souvent hypothétiques. Aussi je présente ci-dessous la transformation deb-fin qui est imposée par l'adressage en intercalaire plus grand et plus petit.
deb fin tri grand petit deb fin tri grand petit
1194 369 4 251 16 171 437 17 423 138
669 452 32 32 26 223 153 3 176 152
152 176 28 86 34 112 95 19 223 153
16 251 11 334 52 81 78 18 437 171
228 182 33 246 64 247 247 23 193 173
71 252 12 230 66 173 193 5 228 182
237 202 13 104 67 140 79 31 316 185
180 82 6 252 71 217 103 29 351 186
82 310 16 214 73 432 213 30 564 189
102 412 21 81 78 196 256 27 256 196
52 334 24 140 79 86 34 7 237 202
66 230 8 180 82 186 351 26 432 213
67 104 9 310 82 189 564 15 273 223
236 124 20 112 95 185 316 22 247 247
273 223 10 412 102 32 26 1 1194 369
73 214 25 217 103 64 246 2 669 452
138 423 14 236 124 - - - - -
scc par rapport au groupe de référence
scc: Comparaison avec la référence
tRNAs
blocs tRNAs
blocs rRNAs
scc
1aa
>1aa
dup
+5s
1-3aas
autres
total
21
faible
11
6
17
16
moyen
9
5
3
17
14
fort
10
3
13
30
14
0
0
0
3
47
10
g+cga
5
6
11
2
agg+cgg
2
2
4
carre ccc
4
4
5
autres
0
11
6
0
0
0
0
17
total tRNAs ‰
scc
1aa
>1aa
dup
+5s
1-3aas
autres
scc ‰
ref.‰
21
faible
234
128
362
26
16
moyen
191
106
64
362
324
14
fort
213
64
277
650
638
298
64
47
729
10
g+cga
106
128
234
10
2
agg+cgg
43
43
4
carre ccc
85
85
16
5
autres
234
128
362
blocs tRNAs ‰
total colonne %
scc
1aa
>1aa
dup
total
ref.‰
1aa
>1aa
dup
21
faible
250
136
386
26
37
43
16
moyen
205
114
318
324
30
36
14
fort
227
68
295
650
33
21
682
318
44
729
30
14
10
g+cga
114
136
250
10
45
100
2
agg+cgg
45
45
18
4
carre ccc
91
91
16
36
5
autres
250
136
386
11
6
spirochetes, estimation des -rRNAs
Lien tableur: spirochetes, estimation des -rRNAs
Liens fiche: typage
Légende: prélèvement de la base gtRNAdb le 11.1.21
- ttt et tgt sont nuls partout
- atgi , c'est Ile2, mis à la place de ttt, très rare chez les procaryotes.
- atgf , c'est Metf, mis à la place de tgt, très rare chez les procaryotes.
- atgj , c'est Met, remplace le atg standard qui est la somme Ile2 Met fMet.
- Voir la légende des tris, g1 t1 et des couleurs
spirochetes, calcul des -rRNAs
spi spirochetes 13 génomes
spi1 cumul des +rRNAs de la fiche spirochetes pour 13 génomes
g1
t1
a atgi
a tct
tat
atgf
b att
i act
aat
agt
c ctt
e cct
cat
cgc
d gtt
m gct
gat
ggt
e ttc
b tcc
tac
tgc
f atc
9
j acc
aac
agc
g ctc
f ccc
cac
cgt
h gtc
n gcc
gac
ggc
i tta
c tca
taa
tga
j ata
k aca
aaa
aga
k cta
g cca
caa
cga
l gta
o gca
12
gaa
gga
m ttg
d tcg
tag
tgg
n atgj
l acg
aag
agg
o ctg
h ccg
cag
cgg
p gtg
p gcg
gag
ggg
spir13
inter
max
min
total
13
21
spi2 indices du clade spirochetes du 11.1.21 de gtRNAdb pour 100 génomes
g1
t1
a atgi
96
a tct
tat
atgf
96
b att
i act
aat
agt
c ctt
e cct
cat
cgc
d gtt
m gct
gat
ggt
e ttc
125
b tcc
100
tac
100
tgc
100
f atc
100
j acc
100
aac
100
agc
100
g ctc
103
f ccc
55
cac
100
cgt
12
h gtc
55
n gcc
59
gac
107
ggc
103
i tta
100
c tca
100
taa
tga
16
j ata
1
k aca
100
aaa
100
aga
101
k cta
100
g cca
100
caa
100
cga
92
l gta
101
o gca
114
gaa
82
gga
100
m ttg
100
d tcg
41
tag
tgg
100
n atgj
97
l acg
58
aag
78
agg
66
o ctg
52
h ccg
42
cag
42
cgg
47
p gtg
34
p gcg
41
gag
40
ggg
21
gtRNA
inter
max
min
total
1560
1326
891
3777
spi3 cumul des -rRNAs de l'annexe spiro de 1 génome
g1
t1
a atgi
1
a tct
tat
atgf
1
b att
i act
aat
agt
c ctt
e cct
cat
cgc
1
d gtt
m gct
gat
ggt
e ttc
1
b tcc
1
tac
1
tgc
1
f atc
j acc
1
aac
1
agc
1
g ctc
1
f ccc
1
cac
1
cgt
h gtc
1
n gcc
1
gac
1
ggc
1
i tta
1
c tca
1
taa
tga
j ata
k aca
1
aaa
1
aga
1
k cta
1
g cca
1
caa
1
cga
1
l gta
1
o gca
gaa
1
gga
1
m ttg
1
d tcg
1
tag
tgg
1
n atgj
1
l acg
1
aag
1
agg
1
o ctg
1
h ccg
1
cag
1
cgg
1
p gtg
1
p gcg
1
gag
1
ggg
1
spir1
inter
max
min
total
14
14
16
44
spi4 indices des +rRNAs de la fiche spirochetes pour 100 génomes
g1
t1
a atgi
a tct
tat
atgf
b att
i act
aat
agt
c ctt
e cct
cat
cgc
d gtt
m gct
gat
ggt
e ttc
b tcc
tac
tgc
f atc
69
j acc
aac
agc
g ctc
f ccc
cac
cgc
h gtc
n gcc
gac
ggc
i tta
c tca
taa
tga
j ata
k aca
aaa
aga
k cta
g cca
caa
cga
l gta
o gca
92
gaa
gga
m ttg
d tcg
tag
tgg
n atgj
l acg
aag
agg
o ctg
h ccg
cag
cgg
p gtg
p gcg
gag
ggg
spir13
inter
max
min
total
162
0
0
162
spi5 estimation des -rRNA du clade spirochetes pour 100 génomes
g1
t1
a atgi
96
a tct
tat
atgf
96
b att
i act
aat
agt
c ctt
e cct
cat
cgc
90
d gtt
m gct
gat
ggt
e ttc
125
b tcc
100
tac
100
tgc
100
f atc
31
j acc
100
aac
100
agc
100
g ctc
103
f ccc
55
cac
100
cgt
12
h gtc
55
n gcc
59
gac
107
ggc
103
i tta
100
c tca
100
taa
tga
16
j ata
1
k aca
100
aaa
100
aga
101
k cta
100
g cca
100
caa
100
cga
92
l gta
101
o gca
22
gaa
82
gga
100
m ttg
100
d tcg
41
tag
tgg
100
n atgj
97
l acg
58
aag
78
agg
66
o ctg
52
h ccg
42
cag
42
cgg
47
p gtg
34
p gcg
41
gag
40
ggg
21
-rRNA
inter
max
min
total
1398
1326
891
3615
spi6 indices des -rRNAs de l'annexe archeo pour 100 génomes
g1
t1
a atgi
100
a tct
tat
atgf
100
b att
i act
aat
agt
c ctt
e cct
cat
cgc
100
d gtt
m gct
gat
ggt
e ttc
100
b tcc
100
tac
100
tgc
100
f atc
j acc
100
aac
100
agc
100
g ctc
100
f ccc
100
cac
100
cgt
h gtc
100
n gcc
100
gac
100
ggc
100
i tta
100
c tca
100
taa
tga
j ata
k aca
100
aaa
100
aga
100
k cta
100
g cca
100
caa
100
cga
100
l gta
100
o gca
gaa
100
gga
100
m ttg
100
d tcg
100
tag
tgg
100
n atgj
100
l acg
100
aag
100
agg
100
o ctg
100
h ccg
100
cag
100
cgg
100
p gtg
100
p gcg
100
gag
100
ggg
100
spir1
inter
max
min
total
1400
1400
1600
4400
spirochetes, comparaison clade-annexe des -rRNAs
Lien tableur: spirochetes, comparaison clade-annexe des -rRNAs
Légende
- spi7. diff, somme des couleurs de spi7. La différence entre tRNAs est faite entre spi5 et spi6 du tableau précédent. Elle est exprimée en % et rapporté à la plus grande valeur des 2 termes de la différence. Ce qui fait quand un tRNA est à zéro la différence en % est égale à 100.
- spi8. rap, rapport des sommes couleurs spi5/spi2. Le rapport -rRNA/total est celui du tRNA de spi5 sur celui de spi2.
Fréquences des différences en % du tableau spi7
gamme 0/0 10 20 30 40 50 60 70 80 90 100 total
fréquence 27 2 1 1 5 6 1 1 0 5 0 49
tot ≤ 50 36
Comparaison avec le nombre de tRNAs de la fiche du clade: L’estimation des -rRNA par l'annexe est 18% au dessus de celle de la fiche des spirochetes.
tRNAs fiche annexe
sans 485 44
avec 22 3
genomes 13 1
indice % 37 44
spi spirochetes 13 génomes
spi7 spirochetes, différence clade-annexe des -rRNAs
g1
t1
a atgi
4
a tct
tat
atgf
4
b att
i act
aat
agt
c ctt
e cct
cat
cgc
d gtt
m gct
gat
ggt
e ttc
20
b tcc
0
tac
0
tgc
0
f atc
100
j acc
0
aac
0
agc
0
g ctc
3
f ccc
45
cac
0
cgt
100
h gtc
45
n gcc
41
gac
7
ggc
3
i tta
0
c tca
0
taa
tga
100
j ata
100
k aca
0
aaa
0
aga
1
k cta
0
g cca
0
caa
0
cga
8
l gta
1
o gca
100
gaa
18
gga
0
m ttg
0
d tcg
59
tag
tgg
0
n atgj
3
l acg
42
aag
22
agg
34
o ctg
48
h ccg
58
cag
58
cgg
53
p gtg
66
p gcg
59
gag
60
ggg
79
diff
inter
max
min
total
56
62
732
850
spi8 spirochetes, rapports -rRNA/total
g1
t1
a atgi
a tct
tat
atgf
b att
i act
aat
agt
c ctt
e cct
cat
cgc
d gtt
m gct
gat
ggt
e ttc
b tcc
tac
tgc
f atc
31
j acc
aac
agc
g ctc
f ccc
cac
cgc
h gtc
n gcc
gac
ggc
i tta
c tca
taa
tga
j ata
k aca
aaa
aga
k cta
g cca
caa
cga
l gta
o gca
19
gaa
gga
m ttg
d tcg
tag
tgg
n atgj
l acg
aag
agg
o ctg
h ccg
cag
cgg
p gtg
p gcg
gag
ggg
rap
inter
max
min
total
50
0
0
50