Une page de Wikiversité, la communauté pédagogique libre.
En raison de limitations techniques, la typographie souhaitable du titre, «
Annexe : archeoLes clusters de gènes tRNA et rRNA chez les procaryotes/Annexe/archeo », n'a pu être restituée correctement ci-dessus.
Methanobacterium formicicum DSM1535
mfi opérons
Lien tableur: mfi opérons
Liens: gtRNAdb [1] , NCBI [2] , génome [orgn ]
Phylogénie: Archaea; Euryarchaeota; Methanomada group; Methanobacteria; Methanobacteriales; Methanobacteriaceae; Methanobacterium.
Légende: cdsa: cds aas, cdsd: cds dirigé
Ar1. mfi opérons, Methanobacterium formicicum DSM1535
41.2%GC
17.8.19 Paris
47
doubles
intercal
cds
aa
avec aa
cdsa
cdsd
protéines
157153..157563
CDS
36
36
137
comp
157600..157683
ctc
246
246
157930..158232
CDS
101
comp
211693..213681
CDS
206
206
663
213888..213971
tcg
281
281
214253..215677
CDS
475
comp
314088..314264
CDS
50
50
59
comp
314315..314487
caa
@1
-1
-1
comp
314487..314654
CDS
56
comp
317759..318211
CDS
198
198
151
comp
318410..318494
tcc
177
177
comp
318672..319634
CDS
321
comp
419250..419975
CDS
156
156
242
comp
420132..420204
aac
29
29
comp
420234..420545
CDS
104
comp
466570..467484
CDS
223
223
305
comp
467708..467792
agc
186
186
comp
467979..468294
ncRNA
@2
122
122
316
468417..469397
CDS
327
681116..681676
CDS
37
37
187
comp
681714..681786
gcg
195
195
comp
681982..682488
CDS
169
695936..696538
CDS
939
939
201
comp
697478..697600
5s
305
123
comp
697906..700772
23s
233
2867
comp
701006..701079
gca
87
comp
701167..702646
16s
724
724
1480
703371..704336
CDS
322
comp
746487..747290
CDS
155
155
268
comp
747446..747518
acc
85
85
comp
747604..747686
tta
303
303
747990..748163
CDS
58
comp
800615..801820
CDS
43
43
402
comp
801864..801935
caa
72
72
comp
802008..802697
CDS
230
comp
963425..964432
CDS
273
273
336
964706..964778
aac
5
5
964784..964857
atgi
58
58
964916..964990
gaa
53
53
965044..965127
cta
29
29
965157..965232
cac
146
146
965379..965717
CDS
113
comp
974621..974842
CDS
564
564
74
975407..975480
aag
90
90
975571..975653
ttg
504
504
976158..976231
aaa
148
148
comp
976380..976679
CDS
100
comp
1006329..1008095
CDS
397
397
589
1008493..1008614
5s
@3
748
122
1009363..1009485
5s
286
123
1009772..1012638
23s
233
2867
1012872..1012945
gca
72
1013018..1014497
16s
454
454
1480
1014952..1016097
CDS
382
comp
1088211..1088831
CDS
53
53
207
comp
1088885..1089038
tgg
@1
40
40
comp
1089079..1089150
tgc
212
212
comp
1089363..1089746
CDS
128
1143658..1144137
CDS
166
166
160
comp
1144304..1144610
ncRNA
@2
14
14
307
comp
1144625..1144699
atgf
139
139
comp
1144839..1145162
CDS
108
1153368..1154087
CDS
56
56
240
1154144..1154217
aga
62
62
1154280..1154354
agg
552
552
comp
1154907..1156157
CDS
417
1247204..1247659
CDS
4
4
152
comp
1247664..1247739
cga
133
133
comp
1247873..1248481
CDS
203
comp
1320721..1321641
CDS
183
183
307
1321825..1321896
gta
99
99
1321996..1322067
gtg
228
228
comp
1322296..1323084
CDS
263
comp
1403886..1409507
CDS
351
351
1874
comp
1409859..1409930
cgc
222
222
comp
1410153..1410620
CDS
156
1532795..1533088
CDS
127
127
98
comp
1533216..1533325
atgj
@1
246
246
1533572..1534402
CDS
277
1541929..1542321
CDS
127
127
131
1542449..1542522
ggg
1
1
comp
1542524..1543528
CDS
335
1602054..1603277
CDS
257
257
408
1603535..1603608
aca
76
76
1603685..1603759
cca
44
44
1603804..1603877
tac
170
170
1604048..1604119
gac
7
7
1604127..1604200
aaa
24
24
1604225..1604461
CDS
79
1617553..1617861
CDS
187
187
103
1618049..1618133
tca
252
252
1618386..1619444
CDS
353
comp
1692202..1692552
CDS
271
271
117
comp
1692824..1692895
cag
156
156
comp
1693052..1693972
CDS
307
1887796..1888038
CDS
136
136
81
1888175..1888257
ctg
193
193
1888451..1891267
CDS
939
2057488..2057883
CDS
230
230
132
2058114..2058184
tgc
143
143
2058328..2059713
CDS
462
2128536..2129312
CDS
123
123
259
2129436..2129509
acg
362
362
comp
2129872..2130963
CDS
comp
2204492..2204932
CDS
178
178
147
2205111..2205182
gtc
4
4
2205187..2205259
ttc
283
283
comp
2205543..2205875
CDS
111
2317208..2317498
CDS
271
271
97
2317770..2317842
atc
460
460
2318303..2318863
CDS
187
comp
2414821..2415903
CDS
491
491
361
2416395..2416468
gcc
303
303
comp
2416772..2417797
CDS
342
comp
2432399..2432848
CDS
537
537
150
2433386..2433459
ggc
2
2
2433462..2433535
gga
326
326
comp
2433862..2434263
CDS
134
mfi cumuls
cumuls. mfi.
opérons
Fréquences intercalaires tRNAs
Fréquences intercalaires cds
Fréquences aas cds chromosome
effectif
gammes
sans rRNAs
avec rRNAs
gammes
cds
gammes
cdsd
gammes
cdsa
gammes
cdsa 300
avec rRNA
opérons
2
1
0
-
1
2
1
100
9
30
0
16 23 5s 0
0
20
4
50
8
20
200
21
60
3
16 gca 235
2
40
2
100
3
40
300
10
90
3
16 23 5s a
0
60
3
150
10
60
400
12
120
10
max a
1
80
2
200
12
80
500
5
150
7
a doubles
0
100
3
250
8
100
600
1
180
5
autres
2
120
0
300
7
120
700
1
210
5
total aas
2
140
0
350
3
140
800
0
240
2
sans
opérons
29
160
0
400
3
160
900
0
270
4
1 aa
20
180
1
450
0
180
1000
1
300
1
max a
5
200
0
500
3
200
1100
0
330
6
a doubles
0
1
5
1
15
total aas
45
16
0
64
0
61
61
total aas
47
remarques
3
avec jaune
moyenne
83
224
266
variance
121
176
265
sans jaune
moyenne
35
178
213
171
variance
27
96
115
81
mfi blocs
Ar1. mfi blocs, Methanobacterium formicicum DSM1535
CDS
939
201
5s
305
123
23s
233
2867
gca
87
16s
724
1480
CDS
322
CDS
397
589
5s
748
!122
5s
286
123
23s
233
2867
gca
72
16s
454
1480
CDS
382
mfi remarques
Lien tableur: mfi remarques
Remarques: pas de doubles mais des séquences. Il n’y a pas de cgt, on est avec les archées.
@ Les introns des(gtRNAdb) archées existent pour tgg et atgj tujours. Ici en plus il y a un caa.
- caa (Join(314315..314349,314448..314487)), l’intron empiète sur le cds d’où l’intercalaire négatif.
- tgg ( join(1088885..1088919,1089000..1089038)), l’intron mais n’empiète pas sur les cds.
- atgj Join(1533216..1533251,1533288..1533325), n’empiète pas sur les cds. C’est Met mais pas Il2 ni atgf.
@ Ces ncRNAs sont dans le même cluster, sur le même brin qu’ un tRNA et très proche de lui, agc 186 et atgf 14. Ils sont petits respectivement 316 et 307 pbs.
@ Le 5s collé au cluster du 16sgca23s5s, il se comporte comme un tRNA. Il a une pb de moins que les 2 autres 5s.
Séquence des doubles: aucun double dans une séquence. Les doubles exitants sont gca aac aaa caa tgc.
Tableau du code génétique de mfi
Légende: prélèvement de la base gtRNAdb le 17.8.19
- totaux en en-tête, 47 total de gtRNAdb contenant des pseudo et inconnus; 47 total du cumul .
- atgi , c'est Ile2, mis à la place de ttt, très rare chez les procaryotes.
- atgf , c'est Metf, mis à la place de tgt, très rare chez les procaryotes.
- atgj , c'est Met, remplace le atg standard qui est la somme Ile2 Metf Met.
- Voir la légende des tris et couleurs, g1 t1 .
Ar1. mfi, Methanobacterium formicicum DSM1535
g1
t1
47
47
a atgi
1
a tct
tat
atgf
1
b att
i act
aat
agt
c ctt
e cct
cat
cgt
d gtt
m gct
gat
ggt
e ttc
1
b tcc
1
tac
1
tgc
2
f atc
1
j acc
1
aac
2
agc
1
g ctc
1
f ccc
cac
1
cgc
1
h gtc
1
n gcc
1
gac
1
ggc
1
i tta
1
c tca
1
taa
tga
j ata
k aca
1
aaa
2
aga
1
k cta
1
g cca
1
caa
2
cga
1
l gta
1
o gca
2
gaa
1
gga
1
m ttg
1
d tcg
1
tag
tgg
1
n atgj
1
l acg
1
aag
1
agg
1
o ctg
1
h ccg
cag
1
cgg
p gtg
1
p gcg
1
gag
ggg
1
mfi distribution
Ar1. mfi distribution. Methanobacterium formicicum DSM1535. Archée
g1
t1
a atgi
1
a tct
tat
atgf
1
b att
i act
aat
agt
c ctt
e cct
cat
cgt
d gtt
m gct
gat
ggt
e ttc
1
b tcc
1
tac
1
tgc
2
f atc
1
j acc
1
aac
2
agc
1
g ctc
1
f ccc
cac
1
cgc
1
h gtc
1
n gcc
1
gac
1
ggc
1
i tta
1
c tca
1
taa
tga
j ata
k aca
1
aaa
2
aga
1
k cta
1
g cca
1
caa
2
cga
1
l gta
1
o gca
2
gaa
1
gga
1
m ttg
1
d tcg
1
tag
tgg
1
n atgj
1
l acg
1
aag
1
agg
1
o ctg
1
h ccg
cag
1
cgg
p gtg
1
p gcg
1
gag
ggg
1
arch
>1aa
=1aa
-5s
+5s
-16s
+16s
total
mfi
25
20 *
2
47
Methanocaldococcus jannaschii DSM 2661
mja opérons
Lien tableur: mja opérons
Liens: gtRNAdb [3] , NCBI [4] , génome [5]
Phylogénie: Archaea; Euryarchaeota; Methanomada group; Methanococci; Methanococcales; Methanocaldococcaceae; Methanocaldococcus.
Légende: cdsa: cds aas, cdsd: cds dirigé
Ar2. mja opérons, Methanocaldococcus jannaschii DSM 2661
31.3%GC
17.8.19 Paris
37
doubles
intercal
cds
aa
avec aa
cdsa
cdsd
protéines
comp
96499..97053
CDS
372
372
185
comp
97426..97537
atgj
@1
91
91
97629..97716
ctc
241
241
97958..99259
CDS
434
comp
110328..111545
CDS
222
222
406
111768..111852
tga
21
21
111874..112785
CDS
304
137244..138245
CDS
98
98
334
comp
138344..138419
gtg
59
59
comp
138479..138781
CDS
101
153070..154479
CDS
182
182
470
comp
154662..157639
23s
207
2978
comp
157847..157919
gca
64
comp
157984..159463
16s
340
340
1480
159804..160085
CDS
94
comp
185874..186671
CDS
306
306
266
186978..187066
tcc
71
71
187138..187590
CDS
151
190579..190800
CDS
31
31
74
190832..190908
ccc
32
32
190941..191114
CDS
58
comp
214560..215060
CDS
149
149
167
215210..215297
tta
154
154
215452..216240
CDS
263
226386..227639
CDS
64
64
418
comp
227704..227780
gcc
239
239
228020..229720
CDS
567
303613..303927
CDS
64
64
105
303992..304081
tca
230
230
comp
304312..304752
CDS
147
comp
357984..358547
CDS
220
220
188
358768..358845
aga
23
23
358869..358943
gaa
164
164
359108..359923
CDS
272
359108..359923
CDS
48
48
272
comp
359972..360047
atgf
103
103
comp
360151..361485
CDS
445
401945..402796
CDS
171
171
284
comp
402968..403044
gtc
229
229
403274..403834
CDS
187
comp
618311..618757
CDS
402
402
149
comp
619160..619234
tgc
63
63
comp
619298..619915
CDS
206
636394..637449
CDS
133
133
352
637583..637659
ttc
7
7
637667..637742
aac
29
29
637772..637849
atgi
18
18
637868..637942
gaa
39
39
637982..638069
cta
11
11
638081..638152
cac
295
638448..639930
16s
64
1483
639995..640067
gca
207
640275..643254
23s
78
2980
643333..643447
5s
56
115
643504..643761
ncRNA
@2
232
232
258
643994..644962
CDS
323
762859..763608
CDS
157
157
250
comp
763766..763842
acc
178
178
764021..764096
caa
50
50
764147..764818
CDS
224
862207..862410
CDS
179
179
68
862590..862661
cga
41
41
862703..863392
CDS
86
86
230
863479..863555
aca
14
14
863570..863647
cca
8
8
863656..863732
tac
83
83
863816..863889
aaa
13
863903..864017
5s
@3
46
115
864064..864141
gac
80
80
864222..864842
CDS
207
871492..873447
CDS
238
238
652
comp
873686..873763
atc
102
102
comp
873866..875110
CDS
415
comp
882566..883615
CDS
65
65
350
883681..883754
gta
123
123
comp
883878..884297
CDS
140
comp
1037197..1038504
CDS
39
39
436
comp
1038544..1038620
cgc
@4
1
1
comp
1038622..1039386
CDS
255
comp
1148669..1149934
CDS
210
210
422
1150145..1150220
ggc
34
34
1150255..1150330
gga
243
243
1150574..1151254
CDS
227
comp
1188906..1189772
CDS
172
172
289
1189945..1190055
tgg
@1
95
95
1190151..1190684
CDS
178
comp
1312335..1312781
CDS
383
383
149
1313165..1313249
agc
177
177
1313427..1314617
CDS
397
mja cumuls
cumuls. mja.
opérons
Fréquences intercalaires tRNAs
Fréquences intercalaires cds
Fréquences aas cds chromosome
effectif
gammes
sans rRNAs
avec rRNAs
gammes
cds
gammes
cdsd
gammes
cdsa
gammes
cdsa 300
avec rRNA
opérons
2
1
0
0
1
1
1
100
4
30
0
16 23 5s 0
0
20
0
5
50
7
20
200
12
60
1
16 atc gca
0
40
2
2
100
10
40
300
13
90
2
16 23 5s a
0
60
0
0
150
5
60
400
6
120
3
max a
7
80
0
0
200
8
80
500
8
150
4
a doubles
0
100
1
1
250
10
100
600
1
180
3
autres
2
120
0
0
300
0
120
700
1
210
5
total aas
13
140
0
0
350
2
140
800
0
240
3
sans
opérons
20
160
0
0
400
2
160
900
0
270
4
1 aa
16
180
1
0
450
1
180
1000
0
300
4
max a
2
200
0
0
500
0
200
1100
0
330
2
a doubles
0
0
0
0
0
14
total aas
24
4
8
46
0
45
45
total aas
37
remarques
4
avec jaune
moyenne
82
26
154
269
variance
71
25
102
137
sans jaune
moyenne
29
18
152
253
194
variance
8
12
95
117
74
mja blocs
Ar2. mja blocs, Methanocaldococcus jannaschii DSM 2661
CDS
182
23s
207
2978
gca
64
16s
340
1480
CDS
cac
295
16s
64
1483
gca
207
23s
78
2980
5s
56
115
ncRNA
232
258
CDS
aaa
13
5s
46
115
gac
80
CDS
mja remarques
Lien tableur: mja remarques
Remarques: pas de doubles mais des séquences. Il n’y a pas de cgt, on est avec les archées.
@ Les introns (gtRNAdb) des archées existent toujours pour tgg et atgj.
- tgg, Join(1189945..1189984,1190018..1190055), l’ intron mais n’empiète pas sur les cds.
- atgj, Join(97426..97464,97500..97537), n’empiète pas sur les cds. C’est Met mais pas Il2 ni atgf.
@ Ce ncRNA est dans et sur le même brin que le cluster et très proche de lui, 56 au lieu de 232 avec cds. Il est petit, 258 pbs comme pour mfi.
@ Le 5s est décollé du cluster du 16sgca23s, il se comporte comme un tRNA et est dans leur séquence. C’est pour ça que j’ai ces aas dans la colonne “avec rRNAs”.
@ cgc très collé à ses 2 cds
Séquence des doubles: aucun double dans une séquence. Les doubles exitants sont gca gaa.
Tableau du code génétique de mja
Légende: prélèvement de la base gtRNAdb le 17.8.19
- totaux en en-tête, 37 total de gtRNAdb contenant des pseudo et inconnus; 37 total du cumul .
- atgi , c'est Ile2, mis à la place de ttt, très rare chez les procaryotes.
- atgf , c'est Metf, mis à la place de tgt, très rare chez les procaryotes.
- atgj , c'est Met, remplace le atg standard qui est la somme Ile2 Metf Met.
- Voir la légende des tris et couleurs, g1 t1 .
Ar2. mja, Methanocaldococcus jannaschii DSM 2661
g1
t1
37
37
a atgi
1
a tct
tat
atgf
1
b att
i act
aat
agt
c ctt
e cct
cat
cgt
d gtt
m gct
gat
ggt
e ttc
1
b tcc
1
tac
1
tgc
1
f atc
1
j acc
1
aac
1
agc
1
g ctc
1
f ccc
1
cac
1
cgc
1
h gtc
1
n gcc
1
gac
1
ggc
1
i tta
1
c tca
1
taa
tga
1
j ata
k aca
1
aaa
1
aga
1
k cta
1
g cca
1
caa
1
cga
1
l gta
1
o gca
2
gaa
2
gga
1
m ttg
d tcg
tag
tgg
1
n atg
1
l acg
aag
agg
o ctg
h ccg
cag
cgg
p gtg
1
p gcg
gag
ggg
mja distribution
Ar2. mja distribution, Methanocaldococcus jannaschii DSM 2661. Archée
g1
t1
a atgi
1
a tct
tat
atgf
1
b att
i act
aat
agt
c ctt
e cct
cat
cgt
d gtt
m gct
gat
ggt
e ttc
1
b tcc
1
tac
1
tgc
1
f atc
1
j acc
1
aac
1
agc
1
g ctc
1
f ccc
1
cac
1
cgc
1
h gtc
1
n gcc
1
gac
1
ggc
1
i tta
1
c tca
1
taa
tga
1
j ata
k aca
1
aaa
1
aga
1
k cta
1
g cca
1
caa
1
cga
1
l gta
1
o gca
2
gaa
2
gga
1
m ttg
d tcg
tag
tgg
1
n atgj
1
l acg
aag
agg
o ctg
h ccg
cag
cgg
p gtg
1
p gcg
gag
ggg
arch
>1aa
=1aa
-5s
+5s
-16s
+16s
total
mja
8
16
1
4
6 *
2
37
mja intercalaires entre cds
Lien NCBI [6] 9.4.20
Note : Pour les génomes des annexes j'ai relevé les intercalaires entre tRNAs et entre ceux-ci et les cds qui leur sont adjacents. L'exemple est celui de rru du clade alpha. L'idée de départ de ces prélèvements est la recherche d'opérons formés de tRNA et de protéine comme dans le cas d'E.coli: l'intercalaire entre le tRNA et la protéine devrait être faible. Voir l'exemple d'eco (remarque @3) avec tac-tac-tpr et aca-tac-gga-acc-tufB .
mja les fréquences
Lien tableur: mja intercalaires entre cds
Légende: long, longueur en pbs, intercal pour intercalaire
- fréquence-1 1 5 6 f, respectivement fréquence des intercalaires négatives à l'unité, positives à l'unité, par blocs de 5, par blocs de 10 jusqu'à 600 pbs et f pour finales. Ces fréquences servent à faire les diagrammes. La fréquence fréquence6 est étendue à 1200 pour certains grands génomes.
- cumul,% colonne à la droite de frequence6, reprend les fréquences par plages et leurs pourcentages indiqués déjà dans la 1ère partie du tableau.
- La couleur cyan des fréquences fréquence-1 et 1 sert à montrer leur périodicité ternaire.
- intercaln intercalx, pour les intercalaires négatifs minimaux et intercalaires positifs maximaux.
- colonne ADN pour la longueur totale du génome en pbs et intercals pour le total en pbs des intercalaires entre cds uniquement, d'après la méthode des prélèvements de NCBI du 9.4.20 .
mja Les fréquences des intercalaires entre cds
mja
intercalaires
total
%
intercalaires
moyenne
ecartype
plage
ADN
intercal
frequence5
négatif
219
12.7
négatif
-13
14
-1 à -83
1 664 970
-1
219
zéro
21
1.2
intercals
0
21
1 à 200
1275
73.7
0 à 200
64
56
151 580
5
128
201 à 370
166
9.6
201 à 370
265
47
9.1%
10
100
371 à 600
37
2.1
371 à 600
438
51
15
102
601 à max
12
0.7
601 à 1028
675
39
20
83
total 1730
<201
88
total 1727
85
109
-83 à 724
25
73
adresse
intercalx
intercal
fréquence1
intercal
fréquence6
cumul,%
intercal
fréquence-1
30
35
470326
1019
-1
219
-70
3
0
21
35
39
47370
859
0
21
-60
3
-1
25
40
27
451281
848
1
30
-50
1
-2
0
45
36
449897
724
2
40
-40
5
-3
0
50
25
291222
711
3
9
-30
10
min à -1
-4
77
55
18
623421
694
4
38
-20
25
219
-5
2
60
37
1432395
694
5
11
-10
44
12.7%
-6
4
65
22
694012
687
6
9
0
149
-7
3
70
36
1461617
685
7
7
10
228
-8
14
75
21
1176472
629
8
20
20
185
-9
3
80
27
328329
625
9
35
30
108
-10
1
85
27
911715
622
10
29
40
66
1 à 200
-11
12
90
44
106958
542
11
23
50
61
935
-12
3
95
22
91672
527
12
26
60
55
54.0%
-13
4
100
33
692428
522
13
20
70
58
-14
10
105
21
256182
501
14
18
80
48
-15
3
110
17
1370826
495
15
15
90
71
-16
2
115
21
15863
490
16
15
100
55
-17
5
120
25
424100
489
17
12
110
38
-18
2
125
22
1547813
489
18
19
120
46
-19
2
130
20
73799
487
19
21
130
42
-20
6
135
25
1128054
479
20
16
140
51
-21
1
140
26
777753
478
21
20
150
34
-22
0
145
18
983847
478
22
15
160
31
-23
7
150
16
1338520
474
23
10
170
21
1 à 200
-24
1
155
15
518562
472
24
14
180
28
1275
-25
4
160
16
410085
456
25
14
190
24
74%
-26
1
165
11
1291124
450
26
10
200
25
-27
0
170
10
1607321
446
27
8
210
15
-28
1
175
16
1596121
439
28
3
220
22
-29
4
180
12
439827
431
29
6
230
17
-30
0
185
10
489906
417
30
8
240
12
-31
0
190
14
966335
417
31
7
250
12
0 à 200
-32
5
195
16
7338
412
32
6
260
7
1296
223
200
9
325298
411
33
12
270
13
reste
17
205
6
1119539
406
34
13
280
9
total
240
210
9
258119
400
35
1
290
14
215
11
36
5
300
4
220
11
37
4
310
5
225
5
38
6
320
12
230
12
39
11
330
3
235
5
40
1
340
6
201 à 370
240
7
reste
903
350
3
166
245
6
total
1730
360
6
9.6%
250
6
370
6
255
4
380
6
260
3
390
3
265
7
adresse
intercaln
décalage
long
400
4
270
6
349543
-83
shift2
635
410
1
275
7
541115
-73
shift2
498
420
4
280
2
575292
-71
shift2
146
430
0
285
9
125178
-64
shift2
246
440
2
290
5
1600078
-62
comp
450
2
295
3
1611178
-62
shift2
1499
460
1
300
1
28018
-59
shift2
497
470
0
305
4
316817
-49
shift2
495
480
5
310
1
1478759
-48
comp
490
4
315
6
739648
-44
shift2
851
500
1
320
6
875683
-41
shift2
635
510
1
325
3
1378478
-41
shift2
1910
520
0
330
0
12869
-39
530
2
335
5
1051112
-38
540
0
371 à 600
340
1
1285398
-38
550
1
37
345
2
1623026
-38
560
0
2.1%
350
1
697374
-35
570
0
355
3
1152607
-34
580
0
601 à max
360
3
1328814
-34
590
0
12
365
4
139527
-32
600
0
0.7%
370
2
312088
-32
reste
12
reste
49
352843
-32
total
1730
total
1730
mja autres intercalaires
Lien tableur: mja autres intercalaires
Légende:
- comp, le gène est sur le brin complement
- deb, fin sont respectivement dans le sens des adresses croissantes, le cds avant le 1er tRNA et le cds après le dernier tRNA du bloc.
mja Les autres intercalaires.
mja1 adresses1
deb-fin
gènes
adresses
intercal
sens
deb
CDS
1664008
?
comp
repeat_region
378
89
fin
CDS
2216
comp
deb
CDS
96499
372
comp
tRNA
97426
91
comp
tRNA
97629
241
fin
CDS
97958
deb
CDS
110328
250
comp
tRNA
111766
19
fin
CDS
111874
deb
CDS
131467
369
repeat_region
132922
114
fin
CDS
134114
comp
deb
CDS
137244
98
tRNA
138344
59
comp
fin
CDS
138479
comp
deb
CDS
153070
182
rRNA
154662
207
comp
tRNA
157847
64
comp
rRNA
157984
340
comp
fin
CDS
159804
deb
CDS
185874
306
comp
tRNA
186978
71
fin
CDS
187138
deb
CDS
190579
31
tRNA
190832
32
fin
CDS
190941
deb
CDS
214560
149
comp
tRNA
215210
154
fin
CDS
215452
deb
CDS
226386
64
tRNA
227704
239
comp
fin
CDS
228020
deb
CDS
235984
394
repeat_region
236564
97
fin
CDS
238282
comp
deb
CDS
303622
64
tRNA
303992
230
fin
CDS
304312
comp
deb
CDS
351301
129
comp
repeat_region
351694
374
fin
CDS
352843
comp
deb
CDS
357984
220
comp
tRNA
358768
23
tRNA
358869
164
deb
CDS
359108
48
tRNA
359972
103
comp
fin
CDS
360151
comp
mja2 adresses2
deb-fin
gènes
adresses
intercal
sens
deb
CDS
862207
179
tRNA
862590
41
deb
CDS
862703
86
tRNA
863479
14
tRNA
863570
8
tRNA
863656
83
tRNA
863816
13
rRNA
863903
46
tRNA
864064
80
fin
CDS
864222
deb
CDS
401945
171
tRNA
402968
229
comp
fin
CDS
403274
deb
CDS
427091
467
repeat_region
428572
39
fin
CDS
429676
comp
deb
CDS
498208
604
comp
repeat_region
501491
52
fin
CDS
502042
comp
deb
CDS
506108
484
comp
repeat_region
507264
282
fin
CDS
508398
deb
CDS
551189
251
comp
ncRNA
552541
28
fin
CDS
552885
deb
CDS
618311
402
comp
tRNA
619160
63
comp
fin
CDS
619298
comp
deb
CDS
636394
133
tRNA
637583
7
tRNA
637667
29
tRNA
637772
18
tRNA
637868
39
tRNA
637982
11
tRNA
638081
295
rRNA
638448
64
tRNA
639995
207
rRNA
640275
78
rRNA
643333
56
ncRNA
643504
232
fin
CDS
643994
deb
CDS
762859
157
tRNA
763766
178
comp
tRNA
764021
50
fin
CDS
764147
mja3 adresses3
deb-fin
gènes
adresses
intercal
sens
deb
CDS
857400
118
comp
repeat_region
858112
532
fin
CDS
858876
deb
CDS
871492
238
tRNA
873686
102
comp
fin
CDS
873866
comp
deb
CDS
882566
65
comp
tRNA
883681
123
fin
CDS
883878
comp
deb
CDS
1033083
474
comp
repeat_region
1034820
93
fin
CDS
1035848
comp
deb
CDS
1037197
39
comp
tRNA
1038544
1
comp
fin
CDS
1038622
comp
deb
CDS
1047158
568
comp
repeat_region
1049373
181
fin
CDS
1050484
deb
CDS
1148669
210
comp
tRNA
1150145
34
tRNA
1150255
243
fin
CDS
1150574
deb
CDS
1188906
172
comp
tRNA
1189945
95
fin
CDS
1190151
deb
CDS
1218598
79
repeat_region
1219844
479
fin
CDS
1220645
comp
deb
CDS
1266436
484
repeat_region
1267046
79
fin
CDS
1267794
comp
deb
CDS
1312335
383
comp
tRNA
1313165
177
fin
CDS
1313427
deb
CDS
1455222
68
repeat_region
1456715
384
fin
CDS
1457720
comp
deb
CDS
1568600
484
repeat_region
1570374
121
fin
CDS
1571017
comp
deb
CDS
1574035
473
repeat_region
1575519
223
fin
CDS
1576607
mja intercalaires tRNA
Lien tableur: mja intercalaires tRNA
Légende:
- comp', l'intercalaire est entre un gène comp (sur le complément) et un gène sur le brin direct. Continu les 2 gènes sont sur le même brin.
- deb, fin sont les intercalaires des cds du tableau précédent, autres intercalaires: respectivement dans le sens des adresses croissantes, le cds avant le 1er tRNA et le cds après le dernier tRNA du bloc.
Cumuls comp'+continu du tableau
deb fin total
<201 14 16 30
total 22 21 43
taux 64% 76% 70%
mja intercalaires tRNA
mja les relevés deb-fin
comp’
entre tRNAs
comp’
deb
comp’
fin
comp’
91
372
241
23
comp’
250
19
7
comp’
98
59
29
comp’
306
71
18
31
32
39
comp’
149
154
11
comp’
64
comp’
239
comp’
178
64
comp’
230
14
comp’
220
164
8
comp’
48
103
83
comp’
171
comp’
229
34
402
63
133
comp’
157
50
179
41
86
80
comp’
238
102
comp’
65
comp’
123
39
1
comp’
210
243
comp’
172
95
comp’
383
177
mja intercalaires inférieures à 201 pbs
deb
fin
continu
cumuls
31
1
deb
39
19
<201
6
64
32
total
8
86
41
taux
75%
133
50
179
59
fin
372
63
<201
15
402
71
total
17
-
80
taux
88%
-
95
-
102
total
-
103
<201
21
-
154
total
25
-
164
taux
84%
-
177
-
241
-
243
comp’
cumuls
48
123
deb
64
229
<201
8
65
230
total
14
98
239
taux
57%
149
-
157
-
fin
171
-
<201
1
172
-
total
4
210
-
taux
25%
220
-
238
-
total
250
-
<201
9
306
-
total
18
383
-
taux
50%
mja intercalaires rRNA
Voir la présentation des blocs à rRNA dans le chapitre mja blocs de l'étude préliminaire. A comparer avec le tableau mja autres intercalaires .
Remarque: Quand le 16s n'est pas précédé de tRNAs l'intercalaire cds-16s est élevé, il est ici pour les 2 blocs de 340 295 pbs. L'intercalaire cds-bloc de l'autre côté du bloc est beaucoup plus faible, il est ici pour les 2 blocs de, respectivement, 182 232 pbs. Cette orientation est quasiment générale chez tous les génomes que j'ai étudié ici. Je l'ai notée dans les chapitres génome-bloc de chaque génome.
Note: J'ai supposé souvent que les blocs à tRNA sans rRNA sont aussi orientés de l'intercalaire le plus grand au plus petit. Dans mja cumuls et de même pour les autres génomes, j'ai noté cette orientation dans la colonne cdsd, pour cds dirigé. Je n'ai conservé pour les calculs que le plus petit intercalaire des 2 cds bordant le bloc. L'idée était que cette orientation provoquait la création du cds en fin de bloc. Ces cds sont souvent de petites protéines et souvent hypothétiques. Aussi je présente ci-dessous la transformation deb-fin qui est imposée par l'adressage en intercalaire plus grand et plus petit.
deb fin tri grand petit
372 241 18 39 1
250 19 2 250 19
98 59 5 32 31
306 71 14 179 41
31 32 10 103 48
149 154 13 157 50
64 239 3 98 59
64 230 12 402 63
220 164 7 239 64
48 103 8 230 64
171 229 17 123 65
402 63 4 306 71
157 50 15 86 80
179 41 20 172 95
86 80 16 238 102
238 102 6 154 149
65 123 9 220 164
39 1 11 229 171
210 243 21 383 177
172 95 19 243 210
383 177 1 372 241
Methanosarcina barkeri str. Fusaro
mba opérons
Lien tableur: mba opérons
Liens: gtRNAdb [7] , NCBI [8] , génome [9]
Phylogénie: Archaea; Euryarchaeota; Stenosarchaea group; Methanomicrobia; Methanosarcinales; Methanosarcinaceae; Methanosarcina.
Légende: cdsa: cds aas, cdsd: cds dirigé
Ar3. mba opérons, Methanosarcina barkeri str. Fusaro
39.2%GC
2.2.20 Paris
62
doubles
intercal
cds
aa
avec aa
cdsa
cdsd
protéines
91192..91938
cds
137
137
249
DUF429 domain-containing protein
comp
92076..92160
ctc
+
132
132
comp
92293..92377
ctc
2 ctc
298
298
comp
92676..93476
cds
267
DNA-directed RNA polymerase subunit D
comp
98630..99337
cds
535
535
236
ABC transporter ATP-binding protein
comp
99873..99955
tcc
222
222
comp
100178..101194
cds
339
RNA-guided pseudouridylation complex pseudouridine synthase subunit Cbf5
comp
146979..147518
cds
80
80
180
tyrosine-type recombinase/integrase
comp
147599..147670
acc
198
198
comp
147869..148381
cds
171
DUF98 domain-containing protein
comp
199345..200268
cds
492
492
308
aldolase
comp
200761..200833
aac
+
71
71
comp
200905..200979
atgi
2 aac
119
119
comp
201099..201171
aac
964
964
202136..202366
cds
77
hp
260990..261532
cds
173
173
181
nitroreductase family protein"
261706..261777
cgg
673
673
262451..262960
cds
170
hp
comp
463836..464723
cds
2075
2075
296
polyprenyl synthetase family protein
466799..466870
gga
94
94
466965..467049
cta
221
221
comp
467271..468818
cds
516
MBL fold metallo-hydrolase
473154..473723
cds
298
298
190
hp
comp
474022..474096
gag
246
246
comp
474343..475584
cds
414
proteasome-activating nucleotidase
comp
692109..692987
cds
349
349
293
branched-chain-amino-acid transaminase
693337..693411
aga
400
400
comp
693812..694420
cds
203
sulfite exporter TauE/SafE family protein
comp
703446..703958
cds
488
488
171
biotin transporter BioY
704447..704521
agg
283
283
704805..705284
cds
160
N-acetyltransferase
comp
800463..800642
cds
799
799
60
hp
comp
801442..801526
agc
137
137
comp
801664..801978
ncRNA
@1
327
327
315
802306..803931
cds
542
methylamine methyltransferase corrinoid protein reductive activase
1109819..1110013
cds
15
15
65
hp
1110029..1110103
atgf
+
63
63
1110167..1110241
atgf
3 atg
63
63
1110305..1110379
atgf
273
273
1110653..1111984
cds
444
signal recognition particle protein
comp
1134460..1135074
cds
235
235
205
endonuclease III
comp
1135310..1135381
tgc
+
65
65
comp
1135447..1135518
tgc
2 tgc
126
126
comp
1135645..1136277
cds
211
hp
1137210..1137680
cds
488
488
157
P-bacterioferritin
comp
1138169..1138290
5s
129
122
comp
1138420..1141252
23s
222
2833
comp
1141475..1142963
16s
830
830
1489
1143794..1145302
cds
503
2-isopropylmalate synthase
comp
1249870..1250040
cds
423
423
57
CopG family transcriptional regulator
comp
1250464..1250537
aag
546
546
1251084..1251290
cds
69
TRAM domain-containing protein
1315521..1315691
cds
@2
-12
-12
57
hp
comp
1315680..1315751
cgc
174
174
1315926..1317110
cds
395
redox-regulated ATPase YchF
<comp
1514831..1515373
cds
1133
1133
181
ArsR family transcriptional regulator
1516507..1516579
caa
760
760
comp
1517340..1517663
cds
108
hp
comp
1538879..1539286
cds
36
36
136
sensor histidine kinase
comp
1539323..1539395
other
@3
1249
1249
73
>comp
1540645..1540794
cds
50
PKD domain-containing protein
comp
1546247..1547791
cds
576
576
515
aminotransferase class V-fold PLP-dependent enzyme
comp
1548368..1548441
aca
448
448
<
1548890..1549093
cds
68
matrixin family metalloprotease
1550566..1550760
cds
745
745
65
DeoR family transcriptional regulator
comp
1551506..1551579
aca
506
506
1552086..1552640
cds
185
YkgJ family cysteine cluster protein
1621639..1622835
cds
433
433
399
methionine adenosyltransferase
1623269..1623384
tac
@4
112
112
1623497..1623569
gac
300
300
comp
1623870..1624067
cds
66
hp
1714788..1715069
cds
154
154
94
hp
comp
1715224..1715295
acg
187
187
comp
1715483..1716493
cds
337
class I SAM-dependent methyltransferase family protein
comp
1755811..1755993
cds
113
113
61
DNA-directed RNA polymerase subunit K
comp
1756107..1756181
ccg
@5
0
0
comp
1756182..1756370
cds
63
DNA-directed RNA polymerase subunit N
1842058..1842195
cds
16
16
46
hp
comp
1842212..1842285
gtg
717
717
1843003..1843767
cds
255
peptidase A24
comp
1852573..1852896
cds
1364
1364
108
PadR family transcriptional regulator
comp
1854261..1854338
ccc
198
198
comp
1854537..1855097
cds
187
CDP-alcohol phosphatidyltransferase family protein
comp
1908225..1908989
cds
349
349
255
hp
comp
1909339..1909530
tgg
445
445
>
1909976..1910152
cds
59
nitrogenase reductase
1926717..1927178
cds
183
183
154
DUF4145 domain-containing protein
comp
1927362..1927445
tcg
125
125
comp
1927571..1928944
cds
458
endonuclease Q family protein
comp
2005431..2007053
cds
2315
2315
541
PKD domain-containing protein
comp
2009369..2009443
cca
199
199
comp
2009643..2010194
cds
184
UbiX family flavin prenyltransferase
comp
2026807..2028456
cds
314
314
550
ATP-dependent DNA ligase
2028771..2028842
ggg
513
513
comp
2029356..2029766
cds
137
PaaI family thioesterase
2157926..2158684
cds
567
567
253
hp
2159252..2159362
atgj
349
349
2159712..2160225
cds
171
amidohydrolase family protein
comp
2194967..2195302
cds
713
713
112
translation initiation factor eIF-1A
2196016..2197504
16s
222
1489
2197727..2200559
23s
129
2833
2200689..2200810
5s
607
607
122
comp
2201418..2201615
cds
66
hp
>comp
2434335..2434609
cds
603
603
92
nucleoside deaminase
comp
2435213..2435284
gcc
223
223
2435508..2435584
atc
+
74
74
2435659..2435735
atc
2 atc
241
241
comp
2435977..2436390
cds
138
transcriptional regulator
2622097..2624025
cds
1489
1489
643
replication factor C large subunit
2625515..2625588
gta
1102
1102
2626691..2626918
cds
76
hp
2650514..2651296
cds
164
164
261
thiazole biosynthesis protein
2651461..2651532
cac
218
218
2651751..2653460
cds
570
radical SAM protein
2663547..2664668
cds
318
318
374
PGF-pre-PGF domain-containing protein
comp
2664987..2665058
ggc
263
263
2665322..2666563
cds
414
hp
2856552..2857409
cds
134
134
286
hp
comp
2857544..2857628
tca
153
153
comp
2857782..2858546
cds
255
peptidylprolyl isomerase
3326036..3326557
cds
539
539
174
hp
3327097..3327168
tgc
995
995
3328164..3328898
cds
245
hp
3994472..3994921
cds
514
514
150
IS200/IS605 family transposase
comp
3995436..3995529
cga
477
477
3996007..3996714
cds
236
hp
4005709..4006026
cds
269
269
106
divalent-cation tolerance protein CutA
4006296..4006378
ttg
860
860
4007239..4009012
rpr
@6
169
169
1774
Family CRISPR
comp
4009182..4009478
cds
99
CRISPR-associated endonuclease Cas2
comp
4031590..4031871
cds
1075
1075
94
hp
4032947..4033019
cag
182
182
comp
4033202..4033765
cds
188
hp
comp
4041205..4041960
cds
96
96
252
MBL fold metallo-hydrolase
4042057..4042141
tta
375
375
comp
4042517..4044976
cds
820
beta-propeller fold lactonase family protein
comp
4045359..4048274
cds
718
718
972
PKD domain-containing protein
4048993..4049077
tta
35
35
comp
4049113..4052403
cds
241
241
1097
PGF-pre-PGF domain-containing protein
4052645..4052729
tta
177
177
comp
4052907..4053395
cds
163
MarR family transcriptional regulator
4407561..4407830
cds
64
64
90
elongation factor 1-beta
4407895..4407966
gcg
675
675
comp
4408642..4409715
cds
358
radical SAM protein
comp
4504139..4504300
cds
536
536
54
hp
comp
4504837..4504921
ctg
220
220
comp
4505142..4506050
cds
303
ornithine carbamoyltransferase
comp
4551177..4551851
cds
566
566
225
MBL fold metallo-hydrolase
4552418..4552491
gtc
+
94
94
4552586..4552660
ttc
2 gtc
7
7
4552668..4552739
ggc
2 ttc
61
61
4552801..4552874
gtc
2 ggc
94
94
4552969..4553043
ttc
7
7
4553051..4553122
ggc
717
717
4553840..4554052
cds
71
MoaD/ThiS family protein
4617920..4618339
cds
200
200
140
hp
4618540..4618617
gaa
351
351
4618969..4619190
cds
377
377
74
hp
4619568..4619645
gaa
214
214
comp
4619860..4620678
cds
273
hp
4673041..4673643
cds
289
289
201
adenosylcobinamide amidohydrolase
comp
4673933..4674054
5s
129
122
comp
4674184..4677016
23s
135
2833
comp
4677152..4677224
gca
79
comp
4677304..4678792
16s
1242
1242
1489
4680035..4680817
cds
261
methanol-5-hydroxybenzimidazolylcobamide methyltransferase
comp
4759174..4759410
cds
89
89
79
DNA-directed RNA polymerase subunit H
comp
4759500..4759576
aaa
655
655
comp
4760232..4760801
cds
190
DJ-1/PfpI family protein
mba cumuls
cumuls. mba.
opérons
Fréquences intercalaires tRNAs
Fréquences intercalaires cds
Fréquences aas cds chromosome
effectif
gammes
sans rRNAs
avec rRNAs
gammes
cds
gammes
cdsd
gammes
cdsa
gammes
cdsa 300
avec rRNA
opérons
3
1
0
-
1
2
1
100
25
30
0
16 23 5s 0
2
20
2
50
4
20
200
27
60
7
16 gca 235
1
40
0
100
4
40
300
21
90
14
16 23 5s a
0
60
0
150
6
60
400
8
120
8
max a
1
80
6
200
14
80
500
4
150
5
a doubles
0
100
3
250
9
100
600
7
180
10
autres
0
120
2
300
8
120
700
1
210
11
total aas
1
140
1
350
6
140
800
0
240
4
sans
opérons
44
160
0
400
4
160
900
1
270
10
1 aa
37
180
0
450
4
180
1000
1
300
4
max a
6
200
0
500
4
200
1100
1
330
2
a doubles
6
1
35
0
21
total aas
61
15
0
100
0
96
96
total aas
62
remarques
6
avec jaune
moyenne
85
457
240
variance
52
407
194
sans jaune
moyenne
51
210
186
158
variance
28
98
106
78
mba blocs
Ar3. mba blocs, Methanosarcina barkeri str. Fusaro
cds
289
201
adenosylcobinamide amidohydrolase
5s
129
122
23s
135
2833
gca
79
16s
1242
1489
cds
261
methanol-5-hydroxybenzimidazolylcobamide methyltransferase
cds
713
112
translation initiation factor eIF-1A
16s
222
1489
23s
129
2833
5s
607
122
cds
66
hp
cds
488
157
P-bacterioferritin
5s
129
122
23s
222
2833
16s
830
1489
cds
503
2-isopropylmalate synthase
mba remarques
Lien tableur: mba remarques
Remarques un génome avec beaucoup de doubles dont une séquence de 3 aas.
@ ncRNA, dans le même ques l que’aa, taille de 315 pbs.
@ intercalaire négatif du au changement de sens
@ un autre aa, other
@ 4 introns
- tac 1623269..1623304,1623349..1623384
- tgg 1909339..1909374,1909493..1909530
- atgj 2159252..2159289,2159327..2159362
- cga 3995436..3995470,3995491..3995529
@ un intercalaire nul sans changement de sens
@ rpr, repeat région famille CRISPR, assez grand 1774 pbs. Dans le même sens que l’aa.
Séquence des doubles: 6 clusters avec des doubles dont une séquence de 3 aas et un triplet.
- 2 doublets seuls ctc tgc
- gcc 2atc
- aac atgi aac
- 3 atgf
- 2 (gtc ttc ggc)
Tableau du code génétique de mba
Légende: prélèvement de la base gtRNAdb le 2.2.20
- totaux en en-tête, 62 total de gtRNAdb contenant des pseudo et inconnus; 62 total du cumul .
- atgi , c'est Ile2, mis à la place de ttt, très rare chez les procaryotes.
- atgf , c'est Metf, mis à la place de tgt, très rare chez les procaryotes.
- atgj , c'est Met, remplace le atg standard qui est la somme Ile2 Metf Met.
- Voir la légende des tris et couleurs, g1 t1 .
Ar3. mba, Methanosarcina barkeri str. Fusaro
g1
t1
62
62
a atgi
1
a tct
tat
atgf
3
b att
i act
aat
agt
c ctt
e cct
cat
cgt
d gtt
m gct
gat
ggt
e ttc
2
b tcc
1
tac
1
tgc
4
f atc
2
j acc
1
aac
2
agc
1
g ctc
2
f ccc
1
cac
1
cgc
1
h gtc
2
n gcc
1
gac
1
ggc
3
i tta
3
c tca
1
taa
tga
j ata
k aca
2
aaa
1
aga
1
k cta
1
g cca
1
caa
1
cga
1
l gta
1
o gca
1
gaa
2
gga
1
m ttg
1
d tcg
1
tag
tgg
1
n atg
1
l acg
1
aag
1
agg
1
o ctg
1
h ccg
1
cag
1
cgg
1
p gtg
1
p gcg
1
gag
1
ggg
1
intercalaires élevés avec le cds 43/100
1315680 cgc -12 comp
1756107 ccg 0
1250464 aag 423
1623269 tac 433
1909339 tgg 445 comp
1548368 aca 448 comp
3995436 cga 477 comp
704447 agg 488 comp
1138169 5s 488 comp
200761 aac 492
1551506 aca 506 comp
2028771 ggg 513 comp
3995436 cga 514 comp
99873 tcc 535
4504837 ctg 536
3327097 tgc 539
1250464 aag 546 comp
4552418 gtc 566 comp
2159252 atgj 567
1548368 aca 576
2435213 gcc 603
2200689 5s 607 comp
4759500 aaa 655
261706 cgg 673
4407895 gcg 675 comp
2194967 16s 713 comp
1842212 gtg 717 comp
4553840 ggc 717
4048993 tta 718 comp
1551506 aca 745 comp
1516507 caa 760 comp
801442 agc 799
1141475 16s 830 comp
4006296 ttg 860
201099 aac 964 comp
3327097 tgc 995
4032947 cag 1075 comp
2625515 gta 1102
1516507 caa 1133 comp
4677304 16s 1242 comp
1539323 other 1249
1854261 ccc 1364
2625515 gta 1489
466799 gga 2075
2009369 cca 2315
moyenne 795
écart 415
intercalaires élevés entre aas
ttc-ggc 7
ttc-ggc 7
ggc-gtc 61
atgf-atgf 63
atgf-atgf 63
tgc-tgc 65
aac-atgi 71
atc-atc 74
-- --
gga-cta 94
gtc-ttc 94
gtc-ttc 94
tac-gac 112 intron
atgi-aac 119 intron
ctc-ctc 132
gcc-atc 223
mba distribution
Ar3. mba distribution, Methanosarcina barkeri str. Fusaro. Archée
g1
t1
a atgi
1
a tct
tat
atgf
3
b att
i act
aat
agt
c ctt
e cct
cat
cgt
d gtt
m gct
gat
ggt
e ttc
2
b tcc
1
tac
1
tgc
3
f atc
2
j acc
1
aac
2
agc
1
g ctc
2
f ccc
1
cac
1
cgc
1
h gtc
2
n gcc
1
gac
1
ggc
3
i tta
3
c tca
1
taa
tga
j ata
k aca
2
aaa
1
aga
1
k cta
1
g cca
1
caa
1
cga
1
l gta
1
o gca
1
gaa
2
gga
1
m ttg
1
d tcg
1
tag
tgg
1
n atgj
1
l acg
1
aag
1
agg
1
o ctg
1
h ccg
1
cag
1
cgg
1
p gtg
1
p gcg
1
gag
1
ggg
1
arch
>1aa
=1aa
-5s
+5s
-16s
+16s
total
mba
23 *
37 *
1
61
mba intercalaires entre cds
Lien NCBI [10] 17.12.20
Note : Pour les génomes des annexes j'ai relevé les intercalaires entre tRNAs et entre ceux-ci et les cds qui leur sont adjacents. L'exemple est celui de rru du clade alpha. L'idée de départ de ces prélèvements est la recherche d'opérons formés de tRNA et de protéine comme dans le cas d'E.coli: l'intercalaire entre le tRNA et la protéine devrait être faible. Voir l'exemple d'eco (remarque @3) avec tac-tac-tpr et aca-tac-gga-acc-tufB .
mba les fréquences
Lien tableur: mba intercalaires entre cds
Légende: long, longueur en pbs, intercal pour intercalaire
- fréquence-1 1 5 6 f, respectivement fréquence des intercalaires négatives à l'unité, positives à l'unité, par blocs de 5, par blocs de 10 jusqu'à 600 pbs et f pour finales. Ces fréquences servent à faire les diagrammes. La fréquence fréquencez est l'étendue à 1200 de la fréquence6 pour certains grands génomes.
- cumul,% colonne à la droite de frequence6, reprend les fréquences par plages et leurs pourcentages indiqués déjà dans la 1ère partie du tableau.
- La couleur cyan des fréquences fréquence-1 et 1 sert à montrer leur périodicité ternaire.
- intercaln intercalx, pour les intercalaires négatifs minimaux et intercalaires positifs maximaux.
- colonne ADN pour la longueur totale du génome en pbs et intercals pour le total en pbs des intercalaires entre cds uniquement, d'après la méthode des prélèvements de NCBI du 17.12.20 .
mba Les fréquences des intercalaires entre cds
mba
intercalaires
total
%
intercalaires
moyenne
ecartype
plage
ADN
intercal
frequence5
intercal
fréquencez
négatif
329
8.3
négatif
-12
13
-1 à -74
4 837 408
-1
329
610
21
zéro
22
0.6
intercals
0
22
620
23
1 à 200
1478
37.5
0 à 200
85
62
1 292 909
5
110
630
21
201 à 370
782
19.8
201 à 370
278
48
26.7%
10
53
640
20
371 à 600
643
16.3
371 à 600
475
66
15
73
650
14
601 à max
689
17.5
601 à 1028
920
310
20
67
660
22
total 3943
<201
46
total 3938
324
341
-74 à 2323
25
46
670
14
adresse
intercalx
intercal
fréquence1
intercal
fréquence6
cumul,%
intercal
fréquence-1
30
37
680
28
3095040
2919
-1
329
-70
1
0
22
35
39
690
6
526434
2894
0
22
-60
0
-1
33
40
54
700
11
1788553
2705
1
22
-50
8
-2
2
45
35
710
20
2002090
2693
2
33
-40
7
-3
2
50
31
720
14
4631335
2517
3
12
-30
14
min à -1
-4
120
55
34
730
7
818173
2323
4
19
-20
34
329
-5
1
60
45
740
16
2797830
2322
5
24
-10
66
8.3%
-6
2
65
34
750
20
3799612
2309
6
15
0
221
-7
5
70
25
760
12
376145
2299
7
4
10
163
-8
33
75
34
770
18
3653740
2282
8
6
20
140
-9
1
80
36
780
12
4809596
2233
9
8
30
83
-10
4
85
41
790
8
1187952
2165
10
20
40
93
1 à 100
-11
13
90
30
800
7
4415180
2161
11
18
50
66
900
-12
0
95
27
810
6
3268995
2076
12
8
60
79
22.8%
-13
5
100
27
820
8
372411
1964
13
19
70
59
-14
18
105
23
830
8
3552425
1946
14
15
80
70
-15
0
110
31
840
9
3151269
1901
15
13
90
71
-16
5
115
32
850
13
3603917
1870
16
14
100
54
-17
12
120
41
860
6
542032
1854
17
11
110
54
-18
5
125
25
870
18
682785
1848
18
16
120
73
-19
4
130
25
880
8
3195397
1797
19
8
130
50
-20
8
135
24
890
10
2484625
1761
20
18
140
55
-21
0
140
31
900
9
3100209
1754
21
9
150
71
-22
1
145
42
910
7
2724177
1733
22
12
160
47
-23
6
150
29
920
5
912406
1712
23
6
170
58
1 à 200
-24
0
155
23
930
4
2448660
1707
24
14
180
60
1478
-25
5
160
24
940
7
2750853
1677
25
5
190
75
37.5%
-26
9
165
22
950
15
4703857
1624
26
6
200
57
-27
1
170
36
960
9
974831
1613
27
11
210
39
-28
3
175
29
970
5
4637075
1600
28
5
220
74
-29
1
180
31
980
9
2503952
1596
29
5
230
51
-30
0
185
39
990
8
511626
1595
30
10
240
47
-31
0
190
36
1000
9
2705610
1569
31
3
250
51
0 à 200
-32
4
195
33
1010
3
3908084
1568
32
6
260
59
1500
325
200
24
1020
9
2490112
1557
33
8
270
53
reste
26
205
19
1030
4
63786
1555
34
10
280
55
total
351
210
20
1040
7
136653
1553
35
12
290
42
215
46
1050
3
958597
1549
36
14
300
35
220
28
1060
7
301149
1548
37
9
310
43
225
29
1070
10
1165546
1516
38
11
320
44
intercal
frequencef
230
22
1080
5
39
10
330
37
600
3254
235
24
1090
3
40
10
340
49
201 à 370
700
180
240
23
1100
1
reste
3113
350
40
782
800
134
245
29
1110
8
total
3943
360
32
19.8%
900
95
250
22
1120
4
370
31
1000
78
255
30
1130
3
adresses
intercaln
décalage
long
380
36
1100
52
260
29
1140
4
4403838
-74
comp
390
23
1200
41
265
26
1150
3
1874377
-59
shift2
688
400
37
1300
30
270
27
1160
5
4136612
-59
shift2
694
410
34
1400
22
275
22
1170
4
493240
-56
shift2
127
420
31
1500
15
280
33
1180
3
942901
-56
shift2
601
430
43
1600
13
285
20
1190
3
4169341
-56
shift2
238
440
34
1700
3
290
22
1200
4
4335751
-56
shift2
445
450
30
1800
6
295
20
580
4374865
-55
comp
460
27
1900
3
300
15
reste
109
2801727
-51
comp
470
31
2000
3
305
18
total
3943
1742959
-49
shift2
2660
480
28
2100
1
310
25
2882494
-49
shift2
1325
490
28
2200
2
315
24
3292321
-49
shift2
101
500
26
2300
3
320
20
2440972
-47
shift2
664
510
22
2400
3
325
19
4561346
-44
shift2
1744
520
32
2500
0
330
18
1057681
-41
shift2
394
530
25
2600
1
335
21
1723225
-41
comp
540
20
371 à 600
2700
1
340
28
82489
-38
550
23
643
2800
1
345
21
222695
-38
560
22
16.3%
2900
1
350
19
3533580
-38
570
22
3000
1
355
19
1573832
-35
580
28
601 à max
689
360
13
1931905
-35
590
18
689
365
15
3122151
-35
600
23
17.5%
370
16
3337334
-35
reste
689
reste
0
reste
1332
4054645
-35
total
3943
total
3943
total
3943
mba autres intercalaires
Lien tableur: mba autres intercalaires
Légende:
- comp, le gène est sur le brin complement
- deb, fin sont respectivement dans le sens des adresses croissantes, le cds avant le 1er tRNA et le cds après le dernier tRNA du bloc.
mba Les autres intercalaires.
mba1 adresses1
deb-fin
gènes
adresses
intercal
sens
deb
CDS
91192
137
tRNA
92076
132
comp
tRNA
92293
298
comp
fin
CDS
92676
comp
deb
CDS
98630
535
comp
tRNA
99873
222
comp
fin
CDS
100178
comp
deb
CDS
146979
80
comp
tRNA
147599
198
comp
fin
CDS
147869
comp
deb
CDS
199345
492
comp
tRNA
200761
71
comp
tRNA
200905
119
comp
tRNA
201099
790
comp
fin
CDS
201962
deb
CDS
260990
173
tRNA
261706
673
fin
CDS
262451
deb
CDS
355894
309
repeat_region
356467
137
fin
CDS
359947
deb
CDS
463836
2075
comp
tRNA
466799
94
tRNA
466965
221
fin
CDS
467271
comp
deb
CDS
473154
298
tRNA
474022
246
comp
fin
CDS
474343
comp
deb
CDS
692109
349
comp
tRNA
693337
400
fin
CDS
693812
comp
deb
CDS
703446
488
comp
tRNA
704447
307
fin
CDS
704829
deb
CDS
800463
799
comp
tRNA
801442
137
comp
ncRNA
801664
327
comp
fin
CDS
802306
deb
CDS
1109819
15
tRNA
1110029
63
tRNA
1110167
63
tRNA
1110305
273
fin
CDS
1110653
deb
CDS
1134460
235
comp
tRNA
1135310
65
comp
tRNA
1135447
126
comp
fin
CDS
1135645
comp
deb
CDS
1137210
488
rRNA
1138169
74
comp
rRNA
1138365
209
comp
rRNA
1141481
835
comp
fin
CDS
1143794
deb
CDS
1249870
423
comp
tRNA
1250464
546
comp
fin
CDS
1251084
deb
CDS
1315521
-12
tRNA
1315680
174
comp
fin
CDS
1315926
mba2 adresses2
deb-fin
gènes
adresses
intercal
sens
deb
CDS
1516050
286
comp
tRNA
1516507
760
fin
CDS
1517340
comp
deb
CDS
1538879
36
comp
tRNA
1539323
1249
comp
fin
CDS
1540645
comp
deb
CDS
1546247
576
comp
tRNA
1548368
448
comp
fin
CDS
1548890
deb
CDS
1550566
745
tRNA
1551506
506
comp
fin
CDS
1552086
deb
CDS
1621639
433
tRNA
1623269
112
tRNA
1623497
300
fin
CDS
1623870
comp
deb
CDS
1657967
616
comp
repeat_region
1660242
74
fin
CDS
1661656
deb
CDS
1714788
154
tRNA
1715224
187
comp
fin
CDS
1715483
comp
deb
CDS
1755811
113
comp
tRNA
1756107
0
comp
fin
CDS
1756182
comp
deb
CDS
1842058
16
tRNA
1842212
717
comp
fin
CDS
1843003
deb
CDS
1852573
1379
comp
tRNA
1854261
198
comp
fin
CDS
1854537
comp
deb
CDS
1908225
349
comp
tRNA
1909339
445
comp
fin
CDS
1909976
deb
CDS
1926495
183
tRNA
1927362
125
comp
fin
CDS
1927571
comp
deb
CDS
1975038
78
ncRNA
1976292
428
comp
fin
CDS
1977078
deb
CDS
2005431
2315
comp
tRNA
2009369
199
comp
fin
CDS
2009643
comp
deb
CDS
2026807
314
comp
tRNA
2028771
513
fin
CDS
2029356
comp
deb
CDS
2157926
567
tRNA
2159252
349
fin
CDS
2159712
deb
CDS
2194967
718
comp
rRNA
2196021
209
rRNA
2197708
74
rRNA
2200689
607
fin
CDS
2201418
comp
deb
CDS
2434335
603
comp
tRNA
2435213
223
comp
tRNA
2435508
74
tRNA
2435659
241
fin
CDS
2435977
comp
mba3 adresses3
deb-fin
gènes
adresses
intercal
sens
deb
CDS
2622097
1489
tRNA
2625515
1102
fin
CDS
2626691
deb
CDS
2650514
164
tRNA
2651461
218
fin
CDS
2651751
deb
CDS
2663547
318
tRNA
2664987
263
comp
fin
CDS
2665322
deb
CDS
2856552
134
tRNA
2857544
153
comp
fin
CDS
2857782
comp
deb
CDS
3326036
539
tRNA
3327097
995
fin
CDS
3328164
deb
CDS
3994472
514
tRNA
3995436
477
comp
fin
CDS
3996007
deb
CDS
4005709
269
tRNA
4006296
860
repeat_region
4007239
169
fin
CDS
4009182
comp
deb
CDS
4031590
1075
comp
tRNA
4032947
182
fin
CDS
4033202
comp
deb
CDS
4041205
96
comp
tRNA
4042057
375
fin
CDS
4042517
comp
deb
CDS
4045359
718
comp
tRNA
4048993
35
deb
CDS
4049113
241
comp
tRNA
4052645
177
fin
CDS
4052907
comp
deb
CDS
4407561
64
tRNA
4407895
675
fin
CDS
4408642
comp
deb
CDS
4504139
536
comp
tRNA
4504837
220
comp
fin
CDS
4505142
comp
deb
CDS
4551177
566
comp
tRNA
4552418
94
tRNA
4552586
7
tRNA
4552668
61
tRNA
4552801
94
tRNA
4552969
7
tRNA
4553051
717
fin
CDS
4553840
deb
CDS
4617920
200
tRNA
4618540
351
deb
CDS
4618969
377
tRNA
4619568
214
fin
CDS
4619860
comp
deb
CDS
4673041
289
rRNA
4673933
74
comp
rRNA
4674129
116
comp
tRNA
4677152
85
comp
rRNA
4677310
1247
comp
fin
CDS
4680035
deb
CDS
4759174
89
comp
tRNA
4759500
655
comp
fin
CDS
4760232
comp
mba intercalaires tRNA
Lien tableur: mba intercalaires tRNA
Légende:
- comp', l'intercalaire est entre un gène comp (sur le complément) et un gène sur le brin direct. Continu les 2 gènes sont sur le même brin.
- deb, fin sont les intercalaires des cds du tableau précédent, autres intercalaires: respectivement dans le sens des adresses croissantes, le cds avant le 1er tRNA et le cds après le dernier tRNA du bloc.
Cumuls comp'+continu du tableau
deb fin toal
<201 16 12 28
total 46 44 90
taux 35% 27% 31%
mba intercalaires tRNA
mba les relevés deb-fin
comp’
entre tRNAs
comp’
deb
comp’
fin
132
comp’
137
298
535
222
80
198
71 119
492
comp’
790
173
673
94
comp’
2075
comp’
221
comp’
298
246
comp’
349
comp’
400
comp’
488
307
799
63 63
15
273
65
235
126
423
comp’
546
comp’
-12
comp’
174
comp’
286
comp’
760
36
1249
576
comp’
448
comp’
745
comp’
506
112
433
comp’
300
comp’
154
187
113
0
comp’
16
comp’
717
1379
198
349
comp’
445
comp’
183
125
2315
199
comp’
314
comp’
513
567
349
comp’
223
603
comp’
241
74
1489
1102
164
218
comp’
318
comp’
263
comp’
134
153
539
995
comp’
514
comp’
477
269
comp’
1075
comp’
182
comp’
96
comp’
375
comp’
718
comp’
35
comp’
241
comp’
177
64
comp’
675
536
220
94 7 61 94 7
comp’
566
717
200
351
377
comp’
214
89
655
mba intercalaires inférieures à 201 pbs
deb
fin
continu
cumuls
15
0
deb
36
125
<201
9
64
126
total
25
80
153
taux
36%
89
187
113
198
fin
164
198
<201
8
173
199
total
23
200
218
taux
35%
235
220
269
222
total
349
246
<201
17
377
273
total
48
423
298
taux
35%
433
307
535
349
536
351
539
655
567
673
576
717
603
995
799
1102
1379
1249
1489
-
2315
-
comp’
cumuls
-12
35
16
174
deb
96
177
<201
7
134
182
total
21
137
214
taux
33%
154
221
183
241
fin
241
263
<201
4
286
300
total
21
298
375
taux
19%
314
400
318
445
total
349
448
<201
11
488
477
total
42
492
506
taux
26%
514
513
566
546
718
675
745
717
1075
760
2075
790
mba intercalaires rRNA
Voir la présentation des blocs à rRNA dans le chapitre mba blocs de l'étude préliminaire. A comparer avec le tableau mba autres intercalaires .
Remarque: Quand le 16s n'est pas précédé de tRNAs l'intercalaire cds-16s est élevé, il est ici pour les 3 blocs de 1242 713 830. L'intercalaire cds-bloc de l'autre côté du bloc est beaucoup plus faible, il est ici pour les 3 blocs de, respectivement, 289 607 488 pbs. Cette orientation est quasiment générale chez tous les génomes que j'ai étudié ici. Je l'ai notée dans les chapitres génome-bloc de chaque génome.
Note: J'ai supposé souvent que les blocs à tRNA sans rRNA sont aussi orientés de l'intercalaire le plus grand au plus petit. Dans mba cumuls et de même pour les autres génomes, j'ai noté cette orientation dans la colonne cdsd, pour cds dirigé. Je n'ai conservé pour les calculs que le plus petit intercalaire des 2 cds bordant le bloc. L'idée était que cette orientation provoquait la création du cds en fin de bloc. Ces cds sont souvent de petites protéines et souvent hypothétiques. Aussi je présente ci-dessous la transformation deb-fin qui est imposée par l'adressage en intercalaire plus grand et plus petit.
deb fin tri grand petit deb fin tri grand petit
137 298 13 174 -12 349 445 43 377 214
535 222 20 113 0 183 125 40 536 220
80 198 10 273 15 2315 199 6 2075 221
492 790 21 717 16 314 513 2 535 222
173 673 37 718 35 567 349 28 603 241
2075 221 15 1249 36 603 241 7 298 246
298 246 39 675 64 1489 1102 31 318 263
349 400 3 198 80 164 218 14 760 286
488 307 44 655 89 318 263 18 433 300
15 273 36 375 96 134 153 9 488 307
235 126 24 183 125 539 995 26 513 314
423 546 11 235 126 514 477 8 400 349
-12 174 32 153 134 1075 182 23 445 349
286 760 1 298 137 96 375 27 567 349
36 1249 19 187 154 718 35 12 546 423
576 448 30 218 164 241 177 16 576 448
745 506 5 673 173 64 675 34 514 477
433 300 38 241 177 536 220 4 790 492
154 187 35 1075 182 566 717 17 745 506
113 0 22 1379 198 200 351 33 995 539
16 717 25 2315 199 377 214 41 717 566
1379 198 42 351 200 89 655 29 1489 1102
Methanosarcina sp. WH1
mfe opérons
Lien tableur: mfe opérons
Liens: gtRNAdb [11] , NCBI [12] , génome [13] , %GC 41.80 [14]
Phylogénie: Archaea; Euryarchaeota; Stenosarchaea group; Methanomicrobia; Methanosarcinales; Methanosarcinaceae; Methanosarcina; unclassified Methanosarcina
Légende: cdsa: cds aas, cdsd: cds dirigé
Ar4. mfe opérons, Methanosarcina sp. WH1
40.2%GC
2.2.20 Paris
56
doubles
intercal
cds
aa
avec aa
cdsa
cdsd
protéines
comp
38726..40264
cds
698
698
513
2-isopropylmalate synthase
40963..42450
16s
208
1488
42659..45491
23s
130
2833
45622..45743
5s
857
857
122
46601..47164
cds
102
102
188
hp
47267..47338
tgc
+
72
72
47411..47482
tgc
2 tgc
411
411
47894..48508
cds
205
endonuclease III
comp
71092..72423
cds
384
384
444
signal recognition particle protein
comp
72808..72882
atgf
+
89
89
comp
72972..73046
atgf
2 atgf
234
234
73281..73472
cds
64
hp
comp
175573..176153
cds
163
163
194
hp
comp
176317..176389
gac
111
111
comp
176501..176614
tac
@1
295
295
176910..177248
cds
113
hp
comp
214884..215966
cds
801
801
361
hp
comp
216768..216841
aca
150
150
216992..217582
cds
197
aldolase
comp
372219..373091
cds
558
558
291
hp
comp
373650..373723
gtg
340
340
374064..374828
cds
255
peptidase A24
comp
379248..381950
cds
1076
1076
901
DNA mismatch repair protein MutS
comp
383027..383104
ccc
193
193
comp
383298..383882
cds
195
CDP-alcohol phosphatidyltransferase family protein
comp
532751..533176
cds
356
356
142
hp
comp
533533..533607
cca
149
149
comp
533757..534308
cds
184
UbiX family flavin prenyltransferase
comp
598666..599850
cds
170
170
395
redox-regulated ATPase YchF
600021..600092
cgc
341
341
600434..600868
cds
145
cell surface lipoprotein
680493..681734
cds
185
185
414
proteasome-activating nucleotidase
681920..681994
gag
242
242
>
682237..682560
cds
108
p-IS200/IS605 family transposase
689062..689631
cds
36
36
190
phosphatase PAP2 family protein
comp
689668..689752
cta
73
73
comp
689826..689897
gga
1481
1481
691379..691483
cds
35
CcmD family protein
comp
793563..795017
cds
111
111
485
p-IS66 family transposase
comp
795129..795213
ctc
+
117
117
comp
795331..795418
ctc
2 ctc
235
235
comp
795654..796454
cds
267
DNA-directed RNA polymerase subunit D
810088..810471
cds
861
861
128
hp
comp
811333..811415
tcc
123
123
comp
811539..812555
cds
339
RNA-guided pseudouridylation complex pseudouridine synthase subunit Cbf5
comp
893309..894232
cds
391
391
308
aldolase
comp
894624..894696
aac
+
87
87
comp
894784..894858
atgi
2 aac
110
110
comp
894969..895041
aac
1415
1415
comp
896457..897506
cds
350
TIGR00303 family protein
949570..950112
cds
208
208
181
nitroreductase family protein
950321..950392
cgg
498
498
comp
950891..952300
cds
470
NADPH-dependent glutamate synthase
1088496..1090946
cds
360
360
817
PGF-pre-PGF domain-containing protein
comp
1091307..1091378
gcc
227
227
1091606..1091682
atc
+
62
62
1091745..1091818
atc
2 atc
353
353
comp
1092172..1092585
cds
138
transcriptional regulator
1155736..1156137
cds
210
210
134
AsnC family transcriptional regulator
1156348..1156425
gaa
+
718
718
1157144..1157221
gaa
2 gaa
233
233
comp
1157455..1158645
cds
@4
397
ISH3 family transposase
comp
1199367..1200149
cds
967
967
261
methanol-5-hydroxybenzimidazolylcobamide methyltransferase
1201117..1202604
16s
80
1488
1202685..1202757
gca
135
1202893..1205725
23s
130
2833
1205856..1205977
5s
5
5
122
comp
1205983..1206231
cds
83
hp
1207508..1211485
cds
12
12
1326
PAS domain S-box protein
comp
1211498..1211582
ctg
190
190
comp
1211773..1212681
cds
303
ornithine carbamoyltransferase
comp
1220571..1220783
cds
596
596
71
MoaD/ThiS family protein
comp
1221380..1221451
ggc
+
25
25
comp
1221477..1221551
ttc
2 ggc
57
57
comp
1221609..1221682
gtc
2 ttc
71
71
comp
1221754..1221825
ggc
2 gtc
25
25
comp
1221851..1221925
ttc
118
118
comp
1222044..1222117
gtc
358
358
1222476..1223792
cds
439
methanogenesis marker 16 metalloprotein
1400830..1401773
cds
914
914
315
helix-turn-helix domain-containing protein
1402688..1402761
gta
287
287
1403049..1403276
cds
76
hp
comp
1504221..1505630
cds
686
686
470
F0F1 ATP synthase subunit beta
comp
1506317..1506410
cga
750
750
1507161..1508039
cds
293
response regulator
1513245..1513562
cds
213
213
106
divalent-cation tolerance protein CutA
1513776..1513858
ttg
268
268
>
1514127..1514647
cds
174
p-IS1634 family transposase
1887880..1888338
cds
392
392
153
pyridoxamine 5'-phosphate oxidase family protein
comp
1888731..1888802
ggc
378
378
1889181..1890518
cds
446
DHH family phosphoesterase
1962666..1963553
cds
130
130
296
hp
comp
1963684..1963768
tta
235
235
1964004..1964759
cds
252
MBL fold metallo-hydrolase
1971331..1971852
cds
319
319
174
hp
comp
1972172..1972244
cag
204
204
comp
1972449..1972850
cds
134
hp
comp
2170713..2172446
cds
156
156
578
radical SAM protein
comp
2172603..2172674
cac
174
174
comp
2172849..2173631
cds
261
thiazole biosynthesis protein
<comp
2320809..2321131
cds
141
141
108
p-IS200/IS605 family transposase
comp
2321273..2321344
gcg
65
65
comp
2321410..2321679
cds
90
elongation factor 1-beta
2387890..2388675
cds
150
150
262
peptidylprolyl isomerase
2388826..2388911
tca
326
326
comp
2389238..2389453
cds
72
hp
comp
2678132..2678368
cds
85
85
79
DNA-directed RNA polymerase subunit H
comp
2678454..2678530
aaa
824
824
comp
2679355..2679537
cds
61
hp
3091524..3091754
cds
271
271
77
hp
comp
3092026..3092147
5s
130
122
comp
3092278..3095110
23s
208
2833
comp
3095319..3096806
16s
839
839
1488
3097646..3097975
cds
110
translation initiation factor eIF-1A
comp
3153517..3155214
cds
599
599
566
diguanylate phosphodiesterase
comp
3155814..3155923
atgj
799
799
3156723..3157106
cds
128
tRNA CCA-pyrophosphorylase
comp
3241682..3242944
cds
473
473
421
diaminopimelate decarboxylase
3243418..3243489
ggg
377
377
3243867..3244073
cds
69
hp
3341829..3342017
cds
@2
0
0
63
DNA-directed RNA polymerase subunit N
3342018..3342092
ccg
112
112
3342205..3342387
cds
61
DNA-directed RNA polymerase subunit K
3358176..3359186
cds
533
533
337
class I SAM-dependent methyltransferase family protein
3359720..3359791
acg
52
52
comp
3359844..3360305
cds
154
peroxiredoxin
comp
3397316..3398947
cds
422
422
544
methylamine methyltransferase corrinoid protein reductive activase
3399370..3399684
ncRNA
@3
149
149
315
3399834..3399918
agc
230
230
3400149..3400847
cds
233
ATPase
3435506..3436918
cds
181
181
471
phosphotransferase
3437100..3437183
tcg
273
273
3437457..3437948
cds
870
870
164
rubrerythrin family protein
3438819..3438989
cds
107
107
57
hp
3439097..3439289
tgg
42
42
comp
3439332..3439484
cds
51
hp MLELDILDLDILDLDILDLKILELEILELEVLELEILELEILELEVLVQS
3456114..3456473
cds
260
260
120
hp
comp
3456734..3456805
acc
200
200
comp
3457006..3457518
cds
171
DUF98 domain-containing protein
comp
3583589..3584044
cds
295
295
152
N-acetyltransferase
comp
3584340..3584414
agg
339
339
3584754..3585317
cds
188
biotin transporter BioY
3593430..3593861
cds
343
343
144
PspC domain-containing protein
comp
3594205..3594279
aga
348
348
3594628..3595506
cds
293
branched-chain-amino-acid transaminase
3603458..3603697
cds
389
389
80
type II toxin-antitoxin system HicB family antitoxin
3604087..3604159
caa
633
633
comp
3604793..3606301
cds
503
lipopolysaccharide biosynthesis protein
comp
3856073..3856279
cds
402
402
69
TRAM domain-containing protein
3856682..3856755
aag
498
498
3857254..3857424
cds
57
CopG family transcriptional regulator
mfe cumuls
cumuls. mfe.
opérons
Fréquences intercalaires tRNAs
Fréquences intercalaires cds
Fréquences aas cds chromosome
effectif
gammes
sans rRNAs
avec rRNAs
gammes
cds
gammes
cdsd
gammes
cdsa
gammes
cdsa 300
avec rRNA
opérons
3
1
0
-
1
1
1
100
18
30
0
16 23 5s 0
2
20
0
50
4
20
200
29
60
4
16 gca 235
1
40
2
100
3
40
300
12
90
14
16 23 5s a
0
60
1
150
11
60
400
9
120
6
max a
1
80
4
200
9
80
500
9
150
8
a doubles
0
100
2
250
10
100
600
5
180
7
autres
0
120
4
300
7
120
700
0
210
9
total aas
1
140
0
350
7
140
800
0
240
1
sans
opérons
40
160
0
400
10
160
900
1
270
6
1 aa
31
180
0
450
3
180
1000
1
300
4
max a
6
200
0
500
3
200
1100
0
330
3
a doubles
7
2
20
1
23
total aas
55
15
0
88
0
85
85
total aas
56
remarques
avec jaune
moyenne
131
376
255
variance
169
299
210
sans jaune
moyenne
55
223
207
157
variance
21
108
127
80
mfe blocs
Ar4. mfe blocs, Methanosarcina sp. WH1
cds
698
513
2-isopropylmalate synthase
16s
208
1488
23s
130
2833
5s
857
122
cds
102
188
hp
cds
967
261
methanol-5-hydroxybenzimidazolylcobamide methyltransferase
16s
80
1488
gca
135
23s
130
2833
5s
5
122
cds
83
hp
cds
271
77
hp
5s
130
122
23s
208
2833
16s
839
1488
cds
110
translation initiation factor eIF-1A
mfe remarques
Lien tableur: mfe remarques
Remarques un génome avec beaucoup de doubles dont une séquence de 3 aas.
@ ncRNA, dans le même ques l que’aa, taille de 315 pbs.
@ 4 introns
- tac 176501..176536,176579..176614
- tgg 3439097..3439134,3439254..3439289
- atgj 3155814..3155849,3155886..3155923
- cga 1506317..1506351,1506372..1506410
@ un intercalaire nul sans changement de sens
@ intercalaire très élevé 718 pbs entre 2 aas, le nouveau doublet gaa.
Séquence des doubles: 7 clusters avec des doubles dont une séquence de 3 aas
- 4 doublets seuls ctc tgc atgf gaa
- gcc 2atc
- aac atgi aac
- 2 (gtc ttc ggc)
- par rapport à mja un noveau doublet, gaa. Le triplet atgf est changé en doublet. Les autres restent identiques.
Tableau du code génétique de mfe
Légende: prélèvement de la base gtRNAdb le 2.2.20
- totaux en en-tête, 56 total de gtRNAdb contenant des pseudo et inconnus; 56 total du cumul .
- atgi , c'est Ile2, mis à la place de ttt, très rare chez les procaryotes.
- atgf , c'est Metf, mis à la place de tgt, très rare chez les procaryotes.
- atgj , c'est Met, remplace le atg standard qui est la somme Ile2 Metf Met.
- Voir la légende des tris et couleurs, g1 t1 .
Ar4. mfe, Methanosarcina sp. WH1
g1
t1
56
56
a atgi
1
a tct
tat
atgf
2
b att
i act
aat
agt
c ctt
e cct
cat
cgt
d gtt
m gct
gat
ggt
e ttc
2
b tcc
1
tac
1
tgc
2
f atc
2
j acc
1
aac
2
agc
1
g ctc
2
f ccc
1
cac
1
cgc
1
h gtc
2
n gcc
1
gac
1
ggc
3
i tta
1
c tca
1
taa
tga
j ata
k aca
1
aaa
1
aga
1
k cta
1
g cca
1
caa
1
cga
1
l gta
1
o gca
1
gaa
2
gga
1
m ttg
1
d tcg
1
tag
tgg
1
n atg
1
l acg
1
aag
1
agg
1
o ctg
1
h ccg
1
cag
1
cgg
1
p gtg
1
p gcg
1
gag
1
ggg
1
intercalaires élevés avec le cds 26/88
3856682 aag 402 comp
47411 tgc 411
3399370 ncRNA 422 comp
3243418 ggg 473 comp
950321 cgg 498 comp
3856682 aag 498
3359720 acg 533
373650 gtg 558
1221380 ggc 596
3155814 atgj 599
3604087 caa 633 comp
1506317 cga 686
40963 16s 698 comp
1506317 cga 750 comp
3155814 atgj 799 comp
216768 aca 801
2678454 aaa 824
3095319 16s 839 comp
45622 5s 857
811333 tcc 861 comp
3438819 cds 870
1402688 gta 914
1201117 16s 967 comp
383027 ccc 1076
894969 aac 1415
689826 gga 1481 comp
intercalaires élevés entre aas
ggc-ttc 25
ggc-ttc 25
ttc-gtc 57
atc-atc 62
gtc-ggc 71
tgc-tgc 72
cta-gga 73
aac-atgi 87
atgf-atgf 89
atgi-aac 110
gac-tac 111
ctc-ctc 117
ttc-gtc 118
gcc-atc 227
gaa-gaa 718
mfe distribution
Ar4. mfe distribution, Methanosarcina sp. WH1. Archée
g1
t1
a atgi
1
a tct
tat
atgf
2
b att
i act
aat
agt
c ctt
e cct
cat
cgt
d gtt
m gct
gat
ggt
e ttc
2
b tcc
1
tac
1
tgc
2
f atc
2
j acc
1
aac
2
agc
1
g ctc
2
f ccc
1
cac
1
cgc
1
h gtc
2
n gcc
1
gac
1
ggc
3
i tta
1
c tca
1
taa
tga
j ata
k aca
1
aaa
1
aga
1
k cta
1
g cca
1
caa
1
cga
1
l gta
1
o gca
1
gaa
2
gga
1
m ttg
1
d tcg
1
tag
tgg
1
n atgj
1
l acg
1
aag
1
agg
1
o ctg
1
h ccg
1
cag
1
cgg
1
p gtg
1
p gcg
1
gag
1
ggg
1
arch
>1aa
=1aa
-5s
+5s
-16s
+16s
total
mfe
24 *
31 *
1
56
archées synthèse
archées distribution par génome
archées distribution par génome
arch
>1aa
1aa
-5s
+5s
-16s
+16s
duplica
1-3aas
total
mba
14
37
1
9
61
mfe
14
31
1
10
56
mfi
25
20
2
47
mja
8
16
1
4
6
2
37
total
61
104
1
4
6
6
19
0
201
archées distribution du total
Lien tableur: archées distribution du total
Liens indices: euryarchaeota
Notes: Les -5s +5s et -16s sont colorés et correspondent à un seul tRNA du génome mja. Les +16s sont tout les 6 des gca. Les -16s sont d'un seul bloc de 6 aas. Les -5s et +5s sont inversés dans le bloc 4aas-5s-gac.
Légende: Tableau des indices, en-tête: total des génomes, total des tRNAs, indice ttt, indice tgt.
Euryarcheota. distribution et indices.
Euryarcheota. distribution du total
g1
t1
a atgi
4
a tct
tat
atgf
7
b att
i act
aat
agt
c ctt
e cct
cat
cgt
d gtt
m gct
gat
ggt
e ttc
6
b tcc
4
tac
4
tgc
8
f atc
6
j acc
4
aac
7
agc
4
g ctc
6
f ccc
3
cac
4
cgc
4
h gtc
6
n gcc
4
gac
4
ggc
8
i tta
6
c tca
4
taa
tga
1
j ata
k aca
5
aaa
5
aga
4
k cta
4
g cca
4
caa
5
cga
4
l gta
4
o gca
6
gaa
7
gga
4
m ttg
3
d tcg
3
tag
tgg
4
n atgj
4
l acg
3
aag
3
agg
3
o ctg
3
h ccg
2
cag
3
cgg
2
p gtg
4
p gcg
3
gag
2
ggg
3
arch
>1aa
=1aa
-5s
+5s
-16s
+16s
total
total
80
104
1
4
6
6
201
Euryarchaeota. indices du 16.1.21 143 génomes
g1
t1
143
6935
0
0
a atgi
99
a tct
tat
atgf
127
b att
i act
aat
agt
c ctt
0.7
e cct
cat
cgt
0.7
d gtt
m gct
gat
ggt
0.7
e ttc
122
b tcc
106
tac
104
tgc
181
f atc
121
j acc
104
aac
122
agc
104
g ctc
122
f ccc
93
cac
101
cgc
102
h gtc
121
n gcc
101
gac
124
ggc
141
i tta
107
c tca
101
taa
tga
13
j ata
k aca
110
aaa
110
aga
103
k cta
103
g cca
102
caa
108
cga
103
l gta
103
o gca
151
gaa
132
gga
103
m ttg
87
d tcg
87
tag
tgg
102
n atgj
101
l acg
90
aag
87
agg
88
o ctg
85
h ccg
78
cag
87
cgg
71
p gtg
91
p gcg
84
gag
84
ggg
79
inter
max
min
total
eury
archées distribution par type
Lien tableur: archées distribution par type
Notes: Le cyan pour les effectifs élevés des solitaires, le jaune celui des multiples sans duplicata et le blanc, le reste. En rapportant au total de chaque type je constate que les 3 processus sont distincts et se chevauchent très peu, respectivement pour 1aa >1aa duplicata, % 65 61 79.
1aa >1aa duplica %
104 % 61 % 19
jaune 4 4 37 61 0 0
cyan 68 65 7 11 4 21
blanc 32 31 17 28 15 79
Archées. Distribution par type.
Archées. distribution des solitaires
g1
t1
a atgi
a tct
tat
atgf
2
b att
i act
aat
agt
c ctt
e cct
cat
cgt
d gtt
m gct
gat
ggt
e ttc
b tcc
4
tac
tgc
3
f atc
2
j acc
2
aac
1
agc
4
g ctc
1
f ccc
3
cac
2
cgc
4
h gtc
1
n gcc
2
gac
ggc
2
i tta
5
c tca
4
taa
tga
1
j ata
k aca
3
aaa
2
aga
2
k cta
g cca
2
caa
4
cga
4
l gta
3
o gca
gaa
2
gga
2
m ttg
2
d tcg
3
tag
tgg
3
n atgj
3
l acg
3
aag
2
agg
2
o ctg
3
h ccg
2
cag
3
cgg
2
p gtg
3
p gcg
3
gag
2
ggg
3
arch
1aa
104
Archées. distribution du type >1aa sans duplicata.
g1
t1
a atgi
3
a tct
tat
atgf
b att
i act
aat
agt
c ctt
e cct
cat
cgt
d gtt
m gct
gat
ggt
e ttc
5
b tcc
tac
3
tgc
1
f atc
j acc
2
aac
5
agc
g ctc
1
f ccc
cac
1
cgc
h gtc
5
n gcc
2
gac
3
ggc
i tta
1
c tca
taa
tga
j ata
k aca
1
aaa
2
aga
2
k cta
3
g cca
1
caa
1
cga
l gta
1
o gca
gaa
2
gga
4
m ttg
1
d tcg
tag
tgg
1
n atgj
1
l acg
aag
1
agg
1
o ctg
h ccg
cag
cgg
p gtg
1
p gcg
gag
ggg
arch
>1aa
61
Archées. distribution des duplicata
g1
t1
a atgi
a tct
tat
atgf
5
b att
i act
aat
agt
c ctt
e cct
cat
cgt
d gtt
m gct
gat
ggt
e ttc
b tcc
tac
tgc
4
f atc
4
j acc
aac
agc
g ctc
4
f ccc
cac
cgc
h gtc
n gcc
gac
ggc
i tta
c tca
taa
tga
j ata
k aca
aaa
aga
k cta
g cca
caa
cga
l gta
o gca
gaa
2
gga
m ttg
d tcg
tag
tgg
n atgj
l acg
aag
agg
o ctg
h ccg
cag
cgg
p gtg
p gcg
gag
ggg
arch
dupl
19
archées par rapport au groupe de référence
Comparaison avec la référence
tRNAs
blocs tRNAs
blocs rRNAs
archeo4
1aa
>1aa
dup
+5s
1-3aas
autres
total
21
faible
40
11
4
55
16
moyen
39
16
8
9
72
14
fort
25
34
7
4
4
74
104
61
19
4
13
201
10
g+cgg
26
2
28
2
agg+cga
6
1
7
4
carre ccc
7
8
4
19
5
autres
1
1
40
11
4
55
total tRNAs ‰
archeo4
1aa
>1aa
dup
+5s
1-3aas
autres
archeo ‰
ref.‰
21
faible
199
55
20
274
26
16
moyen
194
80
40
45
358
324
14
fort
124
169
35
20
20
368
650
517
303
95
20
65
201
729
10
g+cgg
129
10
139
10
2
agg+cga
30
5
35
4
carre ccc
35
40
20
95
16
5
autres
5
5
199
55
20
274
blocs tRNAs ‰
total colonne %
archeo4
1aa
>1aa
dup
total
ref.‰
1aa
>1aa
dup
21
faible
217
60
22
299
26
38
18
16
moyen
212
87
43
342
324
38
26
14
fort
136
185
38
359
650
24
56
565
332
103
184
729
104
61
10
g+cgg
141
11
152
10
65
2
agg+cga
33
5
38
15
4
carre ccc
38
43
22
103
16
18
5
autres
5
5
3
217
60
22
299
40
euryarchaeota, estimation des -rRNAs
Lien tableur: euryarchaeota, estimation des -rRNAs
Liens fiche: typage
Légende: prélèvement de la base gtRNAdb le 16.1.21
- ttt et tgt sont nuls partout
- atgi , c'est Ile2, mis à la place de ttt, très rare chez les procaryotes.
- atgf , c'est iMet, mis à la place de tgt, très rare chez les procaryotes.
- atgj , c'est Met, remplace le atg standard qui est la somme Ile2 Met iMet.
- Voir la légende des tris, g1 t1 et des couleurs
euryarchaeota, calcul des -rRNAs
eur euryarchaeota 63 génomes
eur1 cumul des +rRNAs de la fiche euryarchaeota pour 63 génomes
g1
t1
0
0
a atgi
a tct
tat
atgf
b att
i act
aat
agt
c ctt
e cct
cat
cgt
d gtt
m gct
gat
ggt
e ttc
b tcc
2
tac
tgc
28
f atc
1
j acc
aac
agc
g ctc
f ccc
cac
0
cgc
h gtc
n gcc
gac
ggc
i tta
c tca
taa
tga
j ata
k aca
aaa
3
aga
k cta
g cca
caa
cga
l gta
o gca
87
gaa
gga
m ttg
d tcg
tag
tgg
n atgj
l acg
aag
1
agg
o ctg
h ccg
cag
cgg
2
p gtg
p gcg
gag
ggg
eury63
inter
max
min
total
118
3
3
124
eur2 indices du clade euryarchaeota du 16.1.21 de gtRNAdb pour 100 génomes
g1
t1
a atgi
99
a tct
tat
atgf
127
b att
i act
°
aat
agt
c ctt
°0.7
e cct
cat
cgt
0.7
d gtt
m gct
gat
ggt
0.7
e ttc
122
b tcc
106
tac
104
tgc
181
f atc
121
j acc
104
aac
122
agc
104
g ctc
°122
f ccc
°93
cac
101
cgc
102
h gtc
°121
n gcc
°101
gac
124
ggc
141
i tta
107
c tca
101
taa
tga
°13
j ata
°
k aca
110
aaa
110
aga
103
k cta
103
g cca
102
caa
108
cga
°103
l gta
103
o gca
151
gaa
132
gga
103
m ttg
87
d tcg
°87
tag
tgg
102
n atgj
101
l acg
°90
aag
°87
agg
°88
o ctg
85
h ccg
°78
cag
°87
cgg
°71
p gtg
°91
p gcg
°84
gag
°84
ggg
°79
gtRNA
inter
max
min
total
1757
1612
1480
4848
eur3 cumul des -rRNAs de l'annexe archeo 4 génomes
g1
t1
a atgi
3
a tct
tat
atgf
7
b att
i act
aat
agt
c ctt
e cct
cat
cgc
d gtt
m gct
gat
ggt
e ttc
5
b tcc
4
tac
3
tgc
8
f atc
6
j acc
4
aac
6
agc
4
g ctc
6
f ccc
3
cac
3
cgc
4
h gtc
6
n gcc
4
gac
3
ggc
8
i tta
6
c tca
4
taa
tga
1
j ata
k aca
4
aaa
4
aga
4
k cta
3
g cca
3
caa
5
cga
4
l gta
4
o gca
gaa
6
gga
4
m ttg
3
d tcg
3
tag
tgg
4
n atgj
4
l acg
3
aag
3
agg
3
o ctg
3
h ccg
2
cag
3
cgg
2
p gtg
4
p gcg
3
gag
2
ggg
3
eury4
inter
max
min
total
63
66
55
184
eur4 indices des +rRNAs de la fiche euryarchaeota pour 100 génomes
g1
t1
a atgi
a tct
tat
atgf
b att
i act
aat
agt
c ctt
e cct
cat
cgc
d gtt
m gct
gat
ggt
e ttc
b tcc
3
tac
tgc
44
f atc
2
j acc
aac
agc
g ctc
f ccc
cac
cgc
h gtc
n gcc
gac
ggc
i tta
c tca
taa
tga
j ata
k aca
aaa
5
aga
k cta
g cca
caa
cga
l gta
o gca
138
gaa
gga
m ttg
d tcg
tag
tgg
n atgj
l acg
aag
2
agg
o ctg
h ccg
cag
cgg
3
p gtg
p gcg
gag
ggg
eury63
inter
max
min
total
187
5
5
197
eur5 estimation des -rRNA du clade euryarchaeota pour 100 génomes
g1
t1
a atgi
99
a tct
tat
atgf
127
b att
i act
aat
agt
c ctt
0.7
e cct
cat
cgc
0.7
d gtt
m gct
gat
ggt
0.7
e ttc
122
b tcc
102
tac
104
tgc
137
f atc
119
j acc
104
aac
122
agc
104
g ctc
122
f ccc
93
cac
101
cgc
102
h gtc
121
n gcc
101
gac
124
ggc
141
i tta
107
c tca
101
taa
tga
13
j ata
k aca
110
aaa
106
aga
103
k cta
103
g cca
102
caa
108
cga
103
l gta
103
o gca
13
gaa
132
gga
103
m ttg
87
d tcg
87
tag
tgg
102
n atgj
101
l acg
90
aag
85
agg
88
o ctg
85
h ccg
78
cag
87
cgg
68
p gtg
91
p gcg
84
gag
84
ggg
79
-rRNA
inter
max
min
total
1569
1607
1475
4651
eur6 indices des -rRNAs de l'annexe archeo pour 100 génomes
g1
t1
a atgi
75
a tct
tat
atgf
175
b att
i act
aat
agt
c ctt
e cct
cat
cgc
d gtt
m gct
gat
ggt
e ttc
125
b tcc
100
tac
75
tgc
200
f atc
150
j acc
100
aac
150
agc
100
g ctc
150
f ccc
75
cac
75
cgc
100
h gtc
150
n gcc
100
gac
75
ggc
200
i tta
150
c tca
100
taa
tga
25
j ata
k aca
100
aaa
100
aga
100
k cta
75
g cca
75
caa
125
cga
100
l gta
100
o gca
gaa
150
gga
100
m ttg
75
d tcg
75
tag
tgg
100
n atgj
100
l acg
75
aag
75
agg
75
o ctg
75
h ccg
50
cag
75
cgg
50
p gtg
100
p gcg
75
gag
50
ggg
75
eury4
inter
max
min
total
1575
1650
1375
4600
euryarchaeota, comparaison clade-annexe des -rRNAs
Lien tableur: euryarchaeota, comparaison clade-annexe des -rRNAs
Légende
- eur7. diff, somme des couleurs de eur7. La différence entre tRNAs est faite entre eur5 et eur6 du tableau précédent. Elle est exprimée en % et rapporté à la plus grande valeur des 2 termes de la différence. Ce qui fait quand un tRNA est à zéro la différence en % est égale à 100.
- eur8. rap, rapport des sommes couleurs eur5/eur2. Le rapport -rRNA/total est celui du tRNA de eur5 sur celui de eur2.
Fréquences des différences en % du tableau eur7
gamme 0/0 10 20 30 40 50 60 70 80 90 100 total
fréquence 1 17 14 10 3 2 0 0 0 0 0 1 48
tot ≤ 50 41
Comparaison avec le nombre de tRNAs de la fiche du clade: L’estimation des -rRNA par l'annexe est 10% au dessus de celle de la fiche des archées.
tRNAs fiche annexe
sans 2642 184
avec 150 17
genomes 63 4
indice % 42 46
eur euryarchaeota 63 génomes
eur7 euryarchaeota, différence clade-annexe des -rRNAs
g1
t1
a atgi
24
a tct
tat
atgf
28
b att
i act
aat
agt
c ctt
e cct
cat
cgc
d gtt
m gct
gat
ggt
e ttc
2
b tcc
2
tac
28
tgc
32
f atc
20
j acc
4
aac
19
agc
4
g ctc
19
f ccc
19
cac
26
cgc
2
h gtc
19
n gcc
1
gac
39
ggc
29
i tta
29
c tca
1
taa
tga
50
j ata
k aca
9
aaa
5
aga
3
k cta
27
g cca
27
caa
13
cga
3
l gta
3
o gca
100
gaa
12
gga
3
m ttg
14
d tcg
14
tag
tgg
2
n atgj
1
l acg
17
aag
12
agg
15
o ctg
12
h ccg
36
cag
14
cgg
27
p gtg
9
p gcg
11
gag
40
ggg
5
diff
inter
max
min
total
361
220
311
832
eur8 euryarchaeota, rapports -rRNA/total
g1
t1
a atgi
a tct
tat
atgf
b att
i act
aat
agt
c ctt
e cct
cat
cgc
d gtt
m gct
gat
ggt
e ttc
b tcc
97
tac
tgc
75
f atc
99
j acc
aac
agc
g ctc
f ccc
cac
cgc
2
h gtc
n gcc
gac
ggc
i tta
c tca
taa
tga
j ata
k aca
aaa
96
aga
k cta
g cca
caa
cga
l gta
o gca
9
gaa
gga
m ttg
d tcg
tag
tgg
n atgj
l acg
aag
98
agg
o ctg
h ccg
cag
cgg
96
p gtg
p gcg
gag
ggg
rap
inter
max
min
total
89
100
100
96