Une page de Wikiversité, la communauté pédagogique libre.
En raison de limitations techniques, la typographie souhaitable du titre, «
Annexe : actinoLes clusters de gènes tRNA et rRNA chez les procaryotes/Annexe/actino », n'a pu être restituée correctement ci-dessus.
Actinoplanes sp. SE50/110
ase opérons
Liens: gtRNAdb [1] , NCBI [2] , génome [3]
Lien tableur: ase opérons
Phylogénie: Bacteria; Actinobacteria; Micromonosporales; Micromonosporaceae;Actinoplanes; unclassified Actinoplanes.
Légende: cdsa: cds aas, cdsd: cds dirigé
Ac1. Actinoplanes sp. SE50/110
71.15%GC
13.8.19 Paris
98
doubles
intercal
cds
aa
avec aa
cdsa
cdsd
protéines
12658..13392
CDS
78
78
245
13471..13547
atc
@1
242
242
13790..13862
gca
202
202
comp
14065..14607
CDS
181
153733..155094
CDS
556
556
454
155651..157174
16s
308
1524
157483..160591
23s
99
3109
160691..160807
5s
134
134
117
comp
160942..161988
CDS
349
comp
45153..45968
CDS
276
276
272
comp
46245..46330
ctg
257
257
46588..47385
CDS
266
568633..569007
CDS
492
492
125
569500..571022
16s
308
1523
571331..574439
23s
108
3109
574548..574664
5s
245
245
117
574910..576340
CDS
477
comp
66324..66533
CDS
177
177
70
comp
66711..66784
ggg
151
151
comp
66936..67442
CDS
169
comp
145264..145572
CDS
595
595
103
comp
146168..146244
ttc
12
12
comp
146257..146333
gac
62
62
comp
146396..146468
gaa
338
338
comp
146807..148066
CDS
420
164168..164716
CDS
92
92
183
164809..164883
aaa
250
250
165134..166444
CDS
437
comp
457033..458760
CDS
116
116
576
458877..458950
acg
74
74
comp
459025..460758
CDS
578
627485..628396
CDS
42
42
304
628439..628515
gac
5
5
comp
628521..629174
CDS
218
645098..645421
CDS
355
355
108
645777..645849
agg
459
459
comp
646309..648462
CDS
718
747312..748337
CDS
430
430
342
comp
748768..748851
tac
148
148
749000..749491
CDS
164
752175..754703
CDS
94
94
843
754798..754873
acc
44
44
754918..754990
atgj
138
138
755129..755296
CDS
56
755829..756224
CDS
79
79
132
756304..756376
tgg
103
103
756480..756857
CDS
126
940643..942004
CDS
55
55
454
942060..942142
tta
221
221
942364..943218
CDS
285
comp
1155560..1155901
CDS
200
200
114
comp
1156102..1156177
gcc
89
89
comp
1156267..1156824
CDS
186
1222705..1223634
CDS
259
259
310
comp
1223894..1223980
cta
244
244
comp
1224225..1224701
CDS
159
1237525..1238115
CDS
91
91
197
1238207..1238282
cac
54
54
comp
1238337..1238684
CDS
116
comp
1248040..1249266
CDS
132
132
409
1249399..1249474
aag
+
118
118
1249593..1249668
aag
2 aag
-15
-15
comp
1249654..1249878
CDS
@2
75
1335812..1336096
CDS
296
296
95
comp
1336393..1336465
aga
13
13
comp
1336479..1337558
CDS
360
comp
1399552..1400070
CDS
376
376
173
comp
1400447..1400520
gga
130
130
1400651..1400724
cca
38
38
1400763..1402112
CDS
450
comp
1406634..1406849
CDS
586
586
72
1407436..1408958
16s
307
1523
1409266..1412374
23s
99
3109
1412474..1412590
5s
122
122
117
comp
1412713..1413510
CDS
266
comp
1519931..1520254
CDS
217
217
108
1520472..1520544
aac
315
315
1520860..1522122
CDS
236
236
421
1522359..1522432
atgi
1097
1097
< comp
1523530..1523919
CDS
130
1604562..1605026
CDS
38
38
155
1605065..1605139
gta
357
357
<>
1605497..1605583
CDS
29
comp
1935668..1936510
CDS
317
317
281
comp
1936828..1936904
ttg
131
131
1937036..1937656
CDS
207
2434408..2435559
CDS
19
19
384
comp
2435579..2435661
ctc
151
151
2435813..2438881
CDS
1023
comp
2570204..2570824
CDS
794
794
207
2571619..2573141
16s
315
1523
2573457..2576562
23s
98
3106
2576661..2576777
5s
247
247
117
comp
2577025..2577462
CDS
146
comp
4900233..4901780
CDS
19
19
516
comp
4901800..4901878
tgc
29
29
comp
4901908..4901981
gcg
19
19
comp
4902001..4902321
CDS
23
23
107
comp
4902345..4902417
gac
31
31
comp
4902449..4903369
CDS
307
5443888..5444526
CDS
409
409
213
5444936..5445012
ctc
17
17
5445030..5445114
tac
29
29
comp
5445144..5446565
CDS
474
6208479..6209489
CDS
101
101
337
comp
6209591..6209666
cgg
9
9
comp
6209676..6209749
cca
17
17
comp
6209767..6209859
agc
5
5
comp
6209865..6209939
ctg
4
4
comp
6209944..6210015
cag
8
8
comp
6210024..6210100
ggc
4
4
comp
6210105..6210177
cgt
3
3
comp
6210181..6210254
gcc
43
43
comp
6210298..6210369
tgg
562
562
comp
6210932..6212365
CDS
478
6397923..6398423
CDS
699
699
167
6399123..6399196
tgg
199
199
6399396..6399468
ggg
157
157
6399626..6399701
gcc
61
61
6399763..6399837
gag
78
78
6399916..6399992
gga
359
359
6400352..6400426
ttg
1
1
6400428..6400500
acc
5
5
6400506..6400577
ggc
25
25
6400603..6401055
CDS
35
35
151
6401091..6401163
cag
110
110
6401274..6401350
ctc
1
1
6401352..6401427
acg
1
1
6401429..6401503
ctg
5
5
6401509..6401584
gcg
30
30
6401615..6401686
gac
5
5
6401692..6401779
agc
1
1
6401781..6401854
atc
6
6
6401861..6402227
ncRNA
@3
7
7
6402235..6402309
cgt
10
10
6402320..6402395
other
@4
11
11
6402407..6402477
aag
14
14
6402492..6402565
aga
11
11
6402577..6402650
aaa
1
1
6402652..6402727
atgf
1
1
6402729..6402804
gtc
1
1
6402806..6402879
gaa
5
5
6402885..6402958
aac
44
44
6403003..6403088
tcc
1
1
6403090..6403163
gtg
2
2
6403166..6403239
cac
93
93
6403333..6403405
other
411
411
comp
6403817..6404185
CDS
123
6543230..6543619
CDS
412
412
130
6544032..6544106
ctg
152
152
6544259..6544331
gca
410
410
6544742..6545917
CDS
392
6934653..6935819
CDS
69
69
389
comp
6935889..6935962
ccc
51
51
comp
6936014..6937450
CDS
479
comp
6991952..6992437
CDS
174
174
162
comp
6992612..6992728
5s
170
117
comp
6992899..6996006
23s
307
3108
comp
6996314..6997836
16s
531
531
1523
comp
6998368..6999624
CDS
419
7455514..7456608
CDS
167
167
365
comp
7456776..7456847
gtg
55
55
comp
7456903..7457310
CDS
136
7481671..7483989
CDS
83
83
773
comp
7484073..7484189
5s
169
117
comp
7484359..7487466
23s
315
3108
comp
7487782..7489304
16s
800
800
1523
comp
7490105..7490731
CDS
209
7670534..7671652
CDS
136
136
373
comp
7671789..7671863
gtc
18
18
comp
7671882..7671952
tgc
38
38
comp
7671991..7672063
ggc
116
116
comp
7672180..7674045
CDS
622
7710075..7711193
CDS
136
136
373
comp
7711330..7711404
gtc
28
28
comp
7711433..7711503
tgc
38
38
comp
7711542..7711614
ggc
112
112
7711727..7712905
CDS
393
8111157..8111843
CDS
546
546
229
comp
8112390..8112465
gag
+
532
532
comp
8112998..8113070
gag
2 gag
57
57
comp
8113128..8113199
cag
451
451
comp
8113651..8114457
CDS
269
8275151..8275810
CDS
65
65
220
8275876..8275950
cgg
416
416
comp
8276367..8276921
CDS
185
comp
8391343..8392530
CDS
255
255
396
comp
8392786..8392862
atgf
296
296
comp
8393159..8394607
CDS
483
comp
8397029..8399113
CDS
596
596
695
comp
8399710..8399786
atgf
71
71
comp
8399858..8402857
CDS
1000
comp
8601686..8603128
CDS
81
81
481
comp
8603210..8603280
caa
37
37
comp
8603318..8604199
CDS
294
8623005..8623730
CDS
64
64
242
comp
8623795..8623871
gcg
171
171
comp
8624043..8624792
CDS
250
comp
8821061..8822146
CDS
136
136
362
8822283..8822356
aca
175
175
comp
8822532..8824421
CDS
630
8945870..8946763
CDS
190
190
298
8946954..8947030
ccg
204
204
comp
8947235..8947531
CDS
99
comp
8963177..8966704
CDS
104
104
1176
comp
8966809..8966904
ncRNA
83
83
83
8966988..8967075
tcc
270
270
comp
8967346..8967687
CDS
114
8968639..8969070
CDS
521
521
144
comp
8969592..8969681
tcg
116
116
8969798..8970505
CDS
236
9077764..9078855
CDS
326
326
364
comp
9079182..9079256
cgt
370
370
comp
9079627..9082830
CDS
1068
comp
9084051..9086675
CDS
560
560
875
comp
9087236..9087311
cgt
40
40
comp
9087352..9087442
agc
399
399
9087842..9089017
CDS
392
comp
9100587..9101549
CDS
77
77
321
9101627..9101714
tca
144
144
comp
9101859..9102145
CDS
96
ase cumuls
cumuls. ase.
opérons
Fréquences intercalaires tRNAs
Fréquences intercalaires cds
Fréquences aas cds chromosome
effectif
gammes
sans rRNAs
avec rRNAs
gammes
cds
gammes
cdsd
gammes
cdsa
gammes
cdsa 300
avec rRNA
opérons
6
1
8
-
1
1
1
100
8
30
1
16 23 5s 0
6
20
19
50
16
20
200
29
60
1
16 atc gca
0
40
6
100
19
40
300
19
90
3
16 23 5s a
0
60
4
150
17
60
400
19
120
10
max a
0
80
3
200
9
80
500
14
150
9
a doubles
0
100
2
250
9
100
600
3
180
8
autres
0
120
2
300
7
120
700
3
210
8
total aas
0
140
1
350
4
140
800
2
240
5
sans
opérons
45
160
2
400
5
160
900
2
270
6
1 aa
31
180
0
450
6
180
1000
1
300
5
max a
29
200
1
500
3
200
1100
2
330
4
a doubles
2
3
13
1
43
total aas
98
40
0
86
0
89
60
total aas
98
remarques
4
avec jaune
moyenne
58
229
328
variance
98
206
173
sans jaune
moyenne
19
147
254
179
variance
21
104
111
62
ase blocs
Ac1. Actinoplanes sp. SE50/110
CDS
556
454
492
125
586
72
16s
308
1524
308
1523
307
1523
23s
99
3109
108
3109
99
3109
5s
134
117
245
117
122
117
CDS
349
477
266
CDS
794
207
531
419
800
209
16s
315
1523
307
1523
315
1523
23s
98
3106
170
3108
169
3108
5s
247
117
174
117
83
117
CDS
146
162
773
ase remarques
ase distribution
Ac1 ase, Actinoplanes sp. SE50/110. actinomycete.
Ac11 ase. La distribution des tRNAs solitaires.
g1
t1
a atgi
1
a tct
tat
atgf
2
b att
i act
aat
agt
c ctt
e cct
cat
cgc
d gtt
m gct
gat
ggt
e ttc
b tcc
1
tac
1
tgc
f atc
j acc
aac
1
agc
g ctc
1
f ccc
1
cac
1
cgt
1
h gtc
n gcc
1
gac
2
ggc
i tta
1
c tca
1
taa
tga
j ata
k aca
1
aaa
1
aga
1
k cta
1
g cca
caa
1
cga
l gta
1
o gca
gaa
gga
m ttg
1
d tcg
1
tag
tgg
1
n atgj
l acg
1
aag
agg
1
o ctg
1
h ccg
1
cag
cgg
1
p gtg
1
p gcg
1
gag
ggg
1
actino
>1aa
=1aa
-5s
+5s
-16s
+16s
total
ase
32
32
Ac12 ase. La distribution des tRNAs multiples.
g1
t1
a atgi
a tct
tat
atgf
1
b att
i act
aat
agt
c ctt
e cct
cat
cgc
d gtt
m gct
gat
ggt
e ttc
1
b tcc
1
tac
1
tgc
3
f atc
2
j acc
2
aac
1
agc
3
g ctc
2
f ccc
cac
1
cgt
3
h gtc
3
n gcc
2
gac
2
ggc
4
i tta
c tca
taa
tga
j ata
k aca
aaa
1
aga
1
k cta
g cca
2
caa
cga
l gta
o gca
2
gaa
2
gga
2
m ttg
1
d tcg
tag
tgg
2
n atgj
1
l acg
1
aag
3
agg
o ctg
3
h ccg
cag
3
cgg
1
p gtg
1
p gcg
2
gag
3
ggg
1
actino
>1aa
=1aa
-5s
+5s
-16s
+16s
total
ase
64
64
ase intercalaires entre cds
Lien NCBI [4]
Note : Pour les génomes des annexes j'ai relevé les intercalaires entre tRNAs et entre ceux-ci et les cds qui leur sont adjacents. L'exemple est celui de rru du clade alpha. L'idée de départ de ces prélèvements est la recherche d'opérons formés de tRNA et de protéine comme dans le cas d'E.coli: l'intercalaire entre le tRNA et la protéine devrait être faible. Voir l'exemple d'eco (remarque @3) avec tac-tac-tpr et aca-tac-gga-acc-tufB .
ase les fréquences
Lien tableur: ase intercalaires entre cds
Légende: long, longueur en pbs, intercal pour intercalaire
- fréquence-1 1 5 6 f, respectivement fréquence des intercalaires négatives à l'unité, positives à l'unité, par blocs de 5, par blocs de 10 jusqu'à 600 pbs et f pour finales. Ces fréquences servent à faire les diagrammes. La fréquence fréquencez est l'étendue à 1200 de la fréquence6 pour certains grands génomes.
- cumul,% colonne à la droite de frequence6, reprend les fréquences par plages et leurs pourcentages indiqués déjà dans la 1ère partie du tableau.
- La couleur cyan des fréquences fréquence-1 et 1 sert à montrer leur périodicité ternaire.
- intercaln intercalx, pour les intercalaires négatifs minimaux et intercalaires positifs maximaux.
- colonne ADN pour la longueur totale du génome en pbs et intercals pour le total en pbs des intercalaires entre cds uniquement, d'après la méthode des prélèvements de NCBI du 17.12.20 .
ase Les fréquences des intercalaires entre cds
ase
intercalaires
total
%
intercalaires
moyenne
ecartype
plage
ADN
intercal
frequence5
intercal
fréquencez
négatif
1652
20.2
négatif
-11
18
-1 à -120
9 239 851
-1
1652
610
9
zéro
35
0.4
intercals
0
35
620
10
1 à 200
4832
58.9
0 à 200
76
56
1 063 558
5
327
630
11
201 à 370
1047
12.8
201 à 370
270
48
11.5%
10
278
640
9
371 à 600
399
4.9
371 à 600
466
64
15
208
650
8
601 à max
232
2.8
601 à 1028
901
335
20
164
660
5
total 8197
<201
79.5
total 8191
125
189
-120 à 2272
25
153
670
10
adresse
intercalx
intercal
fréquence1
intercal
fréquence6
cumul,%
intercal
fréquence-1
30
135
680
7
3108649
3760
-1
1652
-70
42
0
35
35
146
690
2
5950001
3290
0
35
-60
13
-1
168
40
143
700
3
9227973
3263
1
80
-50
29
-2
18
45
135
710
4
5776402
3118
2
64
-40
23
-3
0
50
144
720
4
6218652
2918
3
61
-30
39
min à -1
-4
976
55
169
730
4
2517961
2663
4
69
-20
73
1652
-5
1
60
144
740
5
7134889
2272
5
53
-10
159
20.2%
-6
2
65
154
750
6
355339
2255
6
40
0
1309
-7
29
70
176
760
4
6142216
2155
7
43
10
605
-8
77
75
138
770
5
744687
2103
8
46
20
372
-9
3
80
148
780
3
7132107
2080
9
70
30
288
-10
13
85
145
790
4
713737
2014
10
79
40
289
1 à 100
-11
39
90
130
800
5
56486
1991
11
58
50
279
3299
-12
5
95
123
810
3
7915401
1920
12
44
60
313
40.2%
-13
18
100
104
820
5
1728815
1782
13
41
70
330
-14
30
105
106
830
3
6917877
1616
14
31
80
286
-15
12
110
111
840
5
3627392
1532
15
34
90
275
-16
9
115
101
850
3
6902269
1526
16
45
100
227
-17
18
120
79
860
1
7156539
1508
17
29
110
217
-18
4
125
101
870
4
4817485
1484
18
20
120
180
-19
11
130
91
880
4
3228912
1467
19
27
130
192
-20
11
135
89
890
4
1528987
1458
20
43
140
177
-21
1
140
88
900
1
8078456
1411
21
35
150
140
-22
5
145
76
910
1
8199307
1409
22
35
160
155
-23
15
150
64
920
1
5463416
1395
23
30
170
137
1 à 200
-24
7
155
89
930
1
1188761
1392
24
24
180
116
4832
-25
6
160
66
940
1
9239126
1338
25
29
190
131
58.9%
-26
13
165
76
950
2
3240125
1331
26
26
200
123
-27
1
170
61
960
0
1083604
1320
27
31
210
100
-28
7
175
58
970
7
6788001
1297
28
20
220
85
-29
7
180
58
980
0
3417418
1292
29
32
230
95
-30
2
185
67
990
3
6304514
1289
30
26
240
76
0 à 200
-31
5
190
64
1000
4
8425004
1285
31
23
250
89
4867
-32
11
195
72
1010
0
5338257
1267
32
40
260
53
1559
200
51
1020
1
204079
1263
33
30
270
76
reste
128
205
54
1030
1
6897972
1260
34
27
280
67
total
1687
210
46
1040
2
35
26
290
52
215
45
1050
3
36
26
300
51
intercal
frequence5
220
40
1060
2
37
30
310
52
600
7965
225
50
1070
0
38
36
320
44
650
47
230
45
1080
0
39
21
330
36
700
27
235
43
1090
3
40
30
340
52
201 à 370
750
23
240
33
1100
0
reste
4956
350
46
1047
800
21
245
45
1110
1
total
8197
360
43
12.8%
850
19
250
44
1120
1
370
30
900
14
255
28
1130
1
380
25
950
6
260
25
1140
0
adresses
intercaln
décalage
long
390
27
1000
14
265
34
1150
0
1905626
-120
comp
400
25
1050
7
270
42
1160
0
1623585
-119
shift2
1160
410
16
1100
5
275
37
1170
0
3648339
-119
comp
420
36
1150
3
280
30
1180
2
5459717
-119
shift2
533
430
19
1200
4
285
23
1190
1
2592786
-111
comp
440
20
1250
2
290
29
1200
1
7166313
-110
shift2
3494
450
19
1300
11
295
24
reste
42
2954690
-109
460
19
1350
3
300
27
total
8197
3376872
-109
470
16
1400
2
305
28
1386988
-107
480
20
1450
2
310
24
1241468
-106
490
21
1500
3
315
23
2667462
-106
500
13
1550
3
320
21
5582768
-106
510
22
1600
0
325
19
4986287
-105
520
14
1650
1
330
17
5304717
-101
530
4
1700
0
335
33
3730598
-100
540
16
371 à 600
1750
0
340
19
5353721
-97
550
11
399
1800
1
345
22
6351308
-97
560
10
4.9%
1850
0
350
24
9179797
-95
570
12
1900
0
355
21
594603
-94
580
14
601 à max
1950
1
360
22
6906822
-94
590
12
232
2000
1
365
12
323356
-93
600
8
2.8%
220
370
18
1310874
-93
reste
232
reste
12
reste
631
5450079
-91
total
8197
total
8197
total
8197
ase autres intercalaires
Lien tableur: ase autres intercalaires
Légende:
- comp, le gène est sur le brin complement
- deb, fin sont respectivement dans le sens des adresses croissantes, le cds avant le 1er tRNA et le cds après le dernier tRNA du bloc.
ase Les autres intercalaires.
ase1 adresses1
deb-fin
gènes
adresses
intercal
sens
deb
CDS
12497
78
tRNA
13471
245
tRNA
13790
202
fin
CDS
14065
comp
deb
CDS
45153
279
comp
tRNA
46248
257
comp
fin
CDS
46588
deb
CDS
65469
387
comp
tRNA
66711
151
comp
fin
CDS
66936
comp
deb
CDS
145264
595
comp
tRNA
146168
15
comp
tRNA
146260
62
comp
tRNA
146396
338
comp
fin
CDS
146807
comp
deb
CDS
153733
555
rRNA
155650
345
rRNA
157512
105
rRNA
160691
377
fin
CDS
161185
comp
deb
CDS
164168
92
tRNA
164809
274
fin
CDS
165158
deb
CDS
261106
434
tRNA
262062
817
fin
CDS
262948
deb
CDS
457033
185
comp
tRNA
458877
74
fin
CDS
459025
comp
deb
CDS
568633
491
rRNA
569499
345
rRNA
571360
114
rRNA
574548
245
fin
CDS
574910
deb
CDS
627485
42
tRNA
628439
8
fin
CDS
628521
comp
deb
CDS
643285
1343
tRNA
645777
459
fin
CDS
646309
comp
deb
CDS
747348
430
tRNA
748768
148
comp
fin
CDS
749000
deb
CDS
752175
94
tRNA
754798
47
tRNA
754918
138
fin
CDS
755129
deb
CDS
755829
79
tRNA
756304
103
fin
CDS
756480
deb
CDS
940643
55
tRNA
942060
221
fin
CDS
942364
deb
CDS
1120784
33
tmRNA
1121477
553
fin
CDS
1122412
comp
deb
CDS
1155560
203
comp
tRNA
1156105
89
comp
fin
CDS
1156267
comp
deb
CDS
1222705
262
tRNA
1223897
244
comp
fin
CDS
1224225
comp
deb
CDS
1237525
91
tRNA
1238207
54
fin
CDS
1238337
comp
deb
CDS
1248040
132
comp
tRNA
1249399
118
tRNA
1249593
-12
fin
CDS
1249654
comp
deb
CDS
1335812
296
tRNA
1336393
13
comp
fin
CDS
1336479
comp
deb
CDS
1399552
373
comp
tRNA
1400450
130
comp
tRNA
1400651
38
fin
CDS
1400763
deb
CDS
1406634
585
comp
rRNA
1407435
344
rRNA
1409295
105
rRNA
1412474
122
fin
CDS
1412713
comp
ase2 adresses2
deb-fin
gènes
adresses
intercal
sens
deb
CDS
1519931
217
comp
tRNA
1520472
315
fin
CDS
1520860
deb
CDS
1522138
47
tRNA
1522359
827
fin
CDS
1523260
comp
deb
CDS
1604562
38
tRNA
1605065
1132
fin
CDS
1606269
deb
CDS
1618796
261
comp
ncRNA
1619690
61
comp
fin
CDS
1620155
deb
CDS
1935668
362
comp
tRNA
1936828
131
comp
fin
CDS
1937036
deb
CDS
2434657
19
tRNA
2435579
151
comp
fin
CDS
2435813
deb
CDS
2570204
793
comp
rRNA
2571618
352
rRNA
2573486
100
rRNA
2576661
247
fin
CDS
2577025
comp
deb
CDS
4900233
19
comp
tRNA
4901800
29
comp
tRNA
4901908
19
comp
deb
CDS
4902001
23
comp
tRNA
4902345
31
comp
fin
CDS
4902449
comp
deb
CDS
4989030
22
tRNA
4989784
278
fin
CDS
4990157
comp
deb
CDS
5443888
409
tRNA
5444936
20
tRNA
5445030
32
fin
CDS
5445144
comp
deb
CDS
6208479
104
tRNA
6209594
9
comp
tRNA
6209676
17
comp
tRNA
6209767
5
comp
tRNA
6209865
4
comp
tRNA
6209944
11
comp
tRNA
6210027
4
comp
tRNA
6210105
3
comp
tRNA
6210181
43
comp
tRNA
6210298
345
comp
fin
CDS
6210715
comp
deb
CDS
6288256
317
comp
tRNA
6290910
43
comp
fin
CDS
6291049
deb
CDS
6397947
699
tRNA
6399123
199
tRNA
6399396
157
tRNA
6399626
64
tRNA
6399763
81
tRNA
6399916
141
tRNA
6400131
144
tRNA
6400352
1
tRNA
6400428
5
tRNA
6400506
34
deb
CDS
6400612
35
tRNA
6401091
110
tRNA
6401274
4
tRNA
6401352
1
tRNA
6401429
5
tRNA
6401509
30
tRNA
6401615
5
tRNA
6401692
1
tRNA
6401781
6
ncRNA
6401861
7
tRNA
6402235
97
tRNA
6402407
14
tRNA
6402492
11
tRNA
6402577
1
tRNA
6402652
1
tRNA
6402729
1
tRNA
6402806
5
tRNA
6402885
44
tRNA
6403003
1
tRNA
6403090
2
tRNA
6403166
96
tRNA
6403333
411
fin
CDS
6403817
comp
ase3 adresses3
deb-fin
gènes
adresses
intercal
sens
deb
CDS
6543191
412
tRNA
6544032
152
tRNA
6544259
380
deb
CDS
6544712
113
tRNA
6546031
178
fin
CDS
6546284
deb
CDS
6934653
69
tRNA
6935889
51
comp
fin
CDS
6936014
comp
deb
CDS
6991353
983
comp
rRNA
6992612
176
comp
rRNA
6992905
344
comp
rRNA
6996322
530
comp
fin
CDS
6998368
comp
deb
CDS
7455514
167
tRNA
7456776
55
comp
fin
CDS
7456903
comp
deb
CDS
7481701
83
rRNA
7484073
175
comp
rRNA
7484365
352
comp
rRNA
7487790
799
comp
fin
CDS
7490105
comp
deb
CDS
7670534
136
tRNA
7671789
18
comp
tRNA
7671882
38
comp
tRNA
7671991
116
comp
fin
CDS
7672180
comp
deb
CDS
7710075
136
tRNA
7711330
28
comp
tRNA
7711433
38
comp
tRNA
7711542
112
comp
fin
CDS
7711727
deb
CDS
8111157
546
tRNA
8112390
532
comp
tRNA
8112998
57
comp
tRNA
8113128
451
comp
fin
CDS
8113651
comp
deb
CDS
8275151
65
tRNA
8275876
419
fin
CDS
8276367
comp
deb
CDS
8391343
135
comp
tRNA
8392786
296
comp
fin
CDS
8393159
comp
deb
CDS
8397029
599
comp
tRNA
8399713
71
comp
fin
CDS
8399858
comp
deb
CDS
8601686
81
comp
tRNA
8603210
37
comp
fin
CDS
8603318
comp
deb
CDS
8623005
64
tRNA
8623795
171
comp
fin
CDS
8624043
comp
deb
CDS
8821061
136
comp
tRNA
8822283
175
fin
CDS
8822532
comp
deb
CDS
8945870
190
tRNA
8946954
204
fin
CDS
8947235
comp
deb
CDS
8963177
104
comp
ncRNA
8966809
83
comp
tRNA
8966988
273
fin
CDS
8967346
comp
deb
CDS
8969168
91
tRNA
8969592
116
comp
fin
CDS
8969798
deb
CDS
9077764
329
tRNA
9079185
370
comp
fin
CDS
9079627
comp
deb
CDS
9084051
524
comp
tRNA
9087239
40
comp
tRNA
9087352
408
comp
fin
CDS
9087851
deb
CDS
9100587
77
comp
tRNA
9101627
1017
fin
CDS
9102729
comp
ase intercalaires tRNA
Lien tableur: ase intercalaires tRNA
Légende:
- comp', l'intercalaire est entre un gène comp (sur le complément) et un gène sur le brin direct. Continu les 2 gènes sont sur le même brin.
- deb, fin sont les intercalaires des cds du tableau précédent, autres intercalaires: respectivement dans le sens des adresses croissantes, le cds avant le 1er tRNA et le cds après le dernier tRNA du bloc.
Cumuls comp'+continu du tableau
deb fin total
deb fin total
<201 30 28 58
total 50 51 101
taux 60% 55% 57%
ase intercalaires tRNA
ase les relevés deb-fin
comp’
entre tRNAs
comp’
deb
comp’
fin
245
78
comp’
202
279
comp’
257
387
151
15
595
338
62
92
274
434
817
comp’
185
comp’
74
42
comp’
8
1343
comp’
459
comp’
430
comp’
148
47
94
138
79
103
55
221
203
89
comp’
262
244
91
comp’
54
118
comp’
132
comp’
-12
comp’
296
13
comp’
130
373
38
comp’
217
315
47
comp’
827
38
1132
362
comp’
131
comp’
19
comp’
151
29
19
19
23
31
22
comp’
278
20
409
comp’
32
5 aas
9 17 5 4 11
comp’
104
345
3 aas
4 3 43
317
comp’
43
8 aas
199 157 64 81 141 144 1 5
699
34
7 aas
110 4 1 5 30 5 1 6ncRNA 7
35
comp’
411
11 aas
97 14 11 1 1 1 5 44 1 2 96
152
412
380
113
178
comp’
69
51
comp’
167
55
18 38
comp’
136
116
28 38
comp’
136
comp’
112
532 57
comp’
546
451
65
comp’
419
135
296
599
71
81
37
comp’
64
171
comp’
136
comp’
175
190
comp’
204
comp’
273
comp’
91
comp’
116
comp’
329
370
40
524
comp’
408
comp’
77
comp’
1017
ase intercalaires inférieures à 201 pbs
deb
fin
continu
cumuls
19
13
22
19
deb
23
31
<201
18
35
34
total
32
38
37
taux
56%
42
38
47
51
fin
55
55
<201
16
65
71
total
28
78
89
taux
57%
79
103
81
116
total
91
138
<201
34
92
151
total
60
94
171
taux
57%
113
178
135
221
190
244
203
274
279
296
317
315
362
338
373
345
387
370
409
380
412
451
434
817
524
1132
595
-
599
-
699
-
1343
-
comp’
cumuls
19
-12
64
8
deb
69
32
<201
12
77
43
total
18
91
54
taux
67%
104
74
132
112
fin
136
116
<201
12
136
131
total
23
136
148
taux
34%
167
151
185
175
total
217
202
<201
24
262
204
total
41
296
257
taux
59%
329
273
430
278
546
408
-
411
-
419
-
459
-
827
-
1017
ase intercalaires rRNA
Voir la présentation des blocs à rRNA dans le chapitre ase blocs de l'étude préliminaire. A comparer avec le tableau ase autres intercalaires .
Remarque: ase a 6 blocs à rRNAs seuls. Trois sont sur le brin de référence et les 3 autres sur le brin complément. Les intercalaires cds-16s sont tous plus grands que ceux 5s-cds. Par exemple le 1er bloc a 556 et 134 pbs pour respectivement cds-16s et 5s-cds. Cette orientation est quasiment générale chez tous les génomes que j'ai étudié ici. Je l'ai notée dans les chapitres génome-bloc de chaque génome.
Note: J'ai supposé souvent que les blocs à tRNA sans rRNA sont aussi orientés de l'intercalaire le plus grand au plus petit. Dans ase cumuls et de même pour les autres génomes, j'ai noté cette orientation dans la colonne cdsd, pour cds dirigé. Je n'ai conservé pour les calculs que le plus petit intercalaire des 2 cds bordant le bloc. L'idée était que cette orientation provoquait la création du cds en fin de bloc. Ces cds sont souvent de petites protéines et souvent hypothétiques. Aussi je présente ci-dessous la transformation deb-fin qui est imposée par l'adressage en intercalaire plus grand et plus petit.
deb fin tri grand petit deb fin tri grand petit
78 202 17 132 -12 23 31 12 103 79
279 257 8 42 8 22 278 14 203 89
387 151 18 296 13 409 32 47 116 91
595 338 24 151 19 104 345 5 274 92
92 274 25 19 19 317 43 11 138 94
434 817 27 278 22 699 34 29 345 104
185 74 26 31 23 35 411 38 136 112
42 8 28 409 32 412 380 34 178 113
1343 459 31 699 34 113 178 37 136 116
430 148 32 411 35 69 51 23 362 131
94 138 43 81 37 167 55 41 296 135
79 103 19 373 38 136 116 45 175 136
55 221 22 1132 38 136 112 10 430 148
203 89 30 317 43 546 451 3 387 151
262 244 21 827 47 65 419 46 204 190
91 54 35 69 51 135 296 20 315 217
132 -12 16 91 54 599 71 15 262 244
296 13 13 221 55 81 37 2 279 257
373 38 36 167 55 64 171 48 370 329
217 315 44 171 64 136 175 4 595 338
47 827 40 419 65 190 204 33 412 380
38 1132 42 599 71 91 116 49 524 408
362 131 7 185 74 329 370 6 817 434
19 151 50 1017 77 524 408 39 546 451
19 19 1 202 78 77 1017 9 1343 459
Bifidobacterium longum NCC2705
blo opérons
Liens: gtRNAdb [5] , NCBI [6] , génome [7]
Lien tableur: blo opérons
Phylogénie: Bacteria; Actinobacteria; Bifidobacteriales; Bifidobacteriaceae; Bifidobacterium.
Ac2. Bifidobacterium longum NCC2705
60%GC
30.6.19 Paris
57
doubles
intercal
115187..115260
gta
159243..160772
16s
@1
430
161203..164268
23s
168
164437..164556
5s
comp
207382..207457
tgg
comp
382849..382924
aac
+
43
comp
382968..383040
aac
2 aac
comp
440078..440150
aac
503549..503624
ggc
+
24
503649..503719
tgc
2 ggc
41
503761..503835
gtc
45
503881..503953
gtg
31
503985..504060
ggc
521008..521084
ccc
648764..648851
ctc
comp
747296..747369
cgt
+
29
comp
747399..747472
cgt
2 cgt
775646..775716
caa
778709..778784
gcc
+
86
778871..778946
gcc
2 gcc
793729..793805
cca
comp
804390..804463
ttg
comp
841055..841136
tta
937056..937131
cac
comp
981177..981253
aga
1202433..1202505
acg
87
1202593..1202676
cta
1208139..1208211
acg
comp
1264390..1264465
gtg
48
comp
1264514..1264585
gtc
46
comp
1264632..1264704
ggc
comp
1280591..1280666
cgg
1295466..1295542
atgf
comp
1350001..1350074
aag
comp
1388875..1388950
aaa
1410594..1410681
tcc
comp
1424793..1424867
cag
36
comp
1424904..1424979
gag
comp
1524142..1524215
ggg
1534802..1534887
ctg
1606163..1606236
atc
42
1606279..1606351
gca
comp
1646835..1646911
aca
1705902..1707431
16s
429
1707861..1710926
23s
168
1711095..1711215
5s
1712083..1713614
16s
422
1714037..1717102
23s
168
1717271..1717390
5s
1769952..1770027
gcg
1905665..1905740
tgg
1908902..1910431
16s
428
1910860..1913926
23s
168
1914095..1914214
5s
1936132..1936205
gga
1971396..1971477
tac
1
1971479..1971550
acc
4
1971555..1971631
atgj
1979312..1979401
agc
2016025..2016112
tcg
2047072..2047159
tca
comp
2068637..2068713
ccg
comp
2085402..2085473
gaa
2087969..2088042
gac
47
2088090..2088165
ttc
2110850..2110926
gac
2130626..2130699
atgi
2171440..2171512
agg
blo cumuls
cumuls. blo.
opérons
Fréquences intercalaires tRNAs
effectif
gammes
sans rRNAs
avec rRNAs
avec rRNA
opérons
4
1
1
-
16 23 5s 0
4
20
1
16 atc gca
0
40
4
16 23 5s a
0
60
7
max a
0
80
0
a doubles
0
100
2
spéciaux
0
120
0
total aas
0
140
0
sans
opérons
41
160
0
1 aa
31
180
0
max a
5
200
0
a doubles
4
0
total aas
55
15
0
total aas
55
remarques
1
avec jaune
moyenne
41
variance
24
sans jaune
moyenne
34
variance
16
blo blocs
Ac2. Bifidobacterium longum, blocs rRNA.
16s
430
1530
422
1532
23s
168
3066
168
3066
5s
120
120
16s
429
1530
428
1530
23s
168
3066
168
3067
5s
121
120
blo remarques
Remarques : 4 blocs 16-23-5s sans aas, en tout, et très peu de doubles. Très simple.
@ 4 blocs 16-23-5s sans aas .
- Leurs intercalaires sont identiques, 428 168.
Séquences des doubles : Très peu de doubles, 4 opérons à 2aas et plus sur 10 ont des doubles.
- 4 doublets au total: 2aac 2cgt 2gcc et (3aas + 2ggc).
Notes :
blo distribution
Lien tableur: blo distribution
Notes:
- cgt2 aac2 gcc2
- Les soulignés ont 1 seul tRNA solitaire
Ac2 blo. La distribution. Actinoplanes sp. SE50/110. actinomycete.
g1
t1
a atgi
1
a tct
tat
atgf
1
b att
i act
aat
agt
c ctt
e cct
cat
cgc
d gtt
m gct
gat
ggt
e ttc
1
b tcc
1
tac
1
tgc
1
f atc
1
j acc
1
aac
3
agc
1
g ctc
1
f ccc
1
cac
1
cgt
2
h gtc
2
n gcc
2
gac
2
ggc
3
i tta
1
c tca
1
taa
tga
j ata
k aca
1
aaa
1
aga
1
k cta
1
g cca
1
caa
1
cga
l gta
1
o gca
1
gaa
1
gga
1
m ttg
1
d tcg
1
tag
tgg
2
n atgj
1
l acg
2
aag
1
agg
1
o ctg
1
h ccg
1
cag
1
cgg
1
p gtg
2
p gcg
1
gag
1
ggg
1
actino
>1aa
=1aa
-5s
+5s
-16s
+16s
total
blo
25
31
56
blo intercalaires entre cds
Lien NCBI [8]
Note : Pour les génomes des annexes j'ai relevé les intercalaires entre tRNAs et entre ceux-ci et les cds qui leur sont adjacents. L'exemple est celui de rru du clade alpha. L'idée de départ de ces prélèvements est la recherche d'opérons formés de tRNA et de protéine comme dans le cas d'E.coli: l'intercalaire entre le tRNA et la protéine devrait être faible. Voir l'exemple d'eco (remarque @3) avec tac-tac-tpr et aca-tac-gga-acc-tufB .
blo les fréquences
Lien tableur: blo intercalaires entre cds
Légende: long, longueur en pbs, intercal pour intercalaire
- fréquence-1 1 5 6 f, respectivement fréquence des intercalaires négatives à l'unité, positives à l'unité, par blocs de 5, par blocs de 10 jusqu'à 600 pbs et f pour finales. Ces fréquences servent à faire les diagrammes. La fréquence fréquence6 est étendue à 1200 pour certains grands génomes.
- cumul,% colonne à la droite de frequence6, reprend les fréquences par plages et leurs pourcentages indiqués déjà dans la 1ère partie du tableau.
- La couleur cyan des fréquences fréquence-1 et 1 sert à montrer leur périodicité ternaire.
- intercaln intercalx, pour les intercalaires négatifs minimaux et intercalaires positifs maximaux.
- colonne ADN pour la longueur totale du génome en pbs et intercals pour le total en pbs des intercalaires entre cds uniquement, d'après la méthode des prélèvements de NCBI du 15.10.20 .
blo Les fréquences des intercalaires entre cds
blo
intercalaires
total
%
intercalaires
moyenne
ecartype
plage
ADN
intercal
frequence5
négatif
228
12.9
négatif
-8
13
-1 à -102
2 256 640
-1
228
zéro
3
0.2
intercals
0
3
1 à 200
1141
64.4
0 à 200
88
57
240 201
5
57
201 à 370
281
15.9
201 à 370
265
46
10.6%
10
47
371 à 600
85
4.8
371 à 600
459
65
15
46
601 à max
34
1.9
601 à 1028
732
131
20
32
total 1172
<201
77.4
total 1170
133
145
-102 à 1039
25
39
adresse
intercalx
intercal
fréquence1
intercal
fréquence6
cumul,%
intercal
fréquence-1
30
26
1260892
1331
-1
228
-70
3
0
3
35
25
249292
1253
0
3
-60
0
-1
52
40
23
620443
1039
1
13
-50
1
-2
1
45
27
1772723
1037
2
16
-40
1
-3
0
50
29
605939
1003
3
9
-30
5
min à -1
-4
111
55
26
1482011
982
4
7
-20
7
228
-5
0
60
42
2120197
922
5
12
-10
35
12.9%
-6
1
65
34
1612791
831
6
10
0
179
-7
1
70
25
1661121
780
7
5
10
104
-8
10
75
29
1176021
773
8
9
20
78
-9
0
80
29
934521
765
9
10
30
65
-10
3
85
31
1783600
752
10
13
40
48
1 à 100
-11
9
90
43
1589918
746
11
11
50
56
661
-12
0
95
20
550195
745
12
7
60
68
56.4%
-13
0
100
28
1622403
735
13
8
70
59
-14
11
105
34
2035292
729
14
5
80
58
-15
0
110
23
1358695
698
15
15
90
74
-16
1
115
36
1450919
688
16
8
100
48
-17
8
120
21
1873696
679
17
9
110
57
-18
0
125
32
1968887
673
18
6
120
57
-19
3
130
24
1571609
667
19
4
130
56
-20
2
135
33
2192649
666
20
5
140
54
-21
0
140
21
543951
653
21
7
150
45
-22
1
145
20
551929
649
22
8
160
49
-23
0
150
25
1166018
635
23
10
170
55
1 à 200
-24
0
155
24
1199447
631
24
7
180
53
1141
-25
1
160
25
132442
628
25
7
190
23
64.4%
-26
1
165
27
1498961
627
26
10
200
34
-27
0
170
28
24634
626
27
4
210
29
-28
2
175
28
1942663
620
28
4
220
32
-29
0
180
25
1750223
618
29
5
230
23
-30
0
185
10
1648197
606
30
3
240
22
-31
1
190
13
716378
605
31
8
250
21
0 à 200
-32
1
195
20
1804621
603
32
4
260
17
1144
223
200
14
2208591
593
33
6
270
23
reste
8
205
17
332770
589
34
5
280
22
total
231
210
12
1653948
587
35
2
290
7
215
17
618810
586
36
4
300
17
220
15
598849
559
37
4
310
13
intercal
frequencef
225
12
1698789
559
38
3
320
16
600
1738
230
11
1425641
557
39
10
330
6
620
5
235
14
1925114
557
40
2
340
12
201 à 370
640
5
240
8
1592846
554
reste
1246
350
5
281
660
2
245
11
733957
552
total
1686
360
12
15.9%
680
4
250
10
986367
549
370
4
700
2
255
9
1178750
549
380
9
720
260
8
1832484
546
390
4
740
2
265
11
400
6
760
3
270
12
410
5
780
3
275
15
420
11
800
280
7
430
3
820
285
4
440
3
840
1
290
3
adresse
intercaln
décalage
long
450
2
860
295
8
516682
-102
comp
460
4
880
300
9
267103
-86
shift2
131
470
3
900
305
8
822434
-85
comp
480
3
920
310
5
513572
-53
comp
490
5
940
1
315
7
287052
-43
shift2
936
500
3
960
320
9
398186
-39
comp
510
2
980
325
2
1553080
-38
520
3
1000
1
330
4
1313073
-35
530
3
1020
1
335
5
1110610
-32
540
3
371 à 600
1040
2
340
7
2249673
-31
550
3
85
32
345
1
946203
-28
560
6
4.8%
350
4
2164932
-28
570
0
355
7
1823782
-26
580
0
601 à max
360
5
794270
-25
590
3
34
365
2
2058333
-22
600
1
1.9%
370
2
268522
-20
reste
34
reste
2
reste
119
1310253
-20
total
1772
total
1772
total
1772
blo autres intercalaires
Lien tableur: blo autres intercalaires
Légende:
- comp, le gène est sur le brin complement
- deb, fin sont respectivement dans le sens des adresses croissantes, le cds avant le 1er tRNA et le cds après le dernier tRNA du bloc.
blo Les autres intercalaires.
blo1 adresses1
deb-fin
gènes
adresses
intercal
sens
deb
CDS
54774
6
comp
regulatory
55434
84
comp
fin
CDS
55670
deb
CDS
114598
163
tRNA
115187
231
fin
CDS
115492
deb
CDS
139965
-10
comp
regulatory
140900
336
comp
fin
CDS
141345
deb
CDS
158126
618
rRNA
159245
432
rRNA
161203
170
rRNA
164439
188
fin
CDS
164744
comp
deb
CDS
205431
187
tmRNA
206548
238
deb
CDS
207183
-17
comp
tRNA
207388
154
comp
fin
CDS
207612
comp
deb
CDS
327271
8
ncRNA
327873
493
comp
fin
CDS
328741
deb
CDS
381615
190
tRNA
382849
43
comp
tRNA
382968
284
comp
fin
CDS
383325
deb
CDS
439838
-39
tRNA
440078
558
comp
fin
CDS
440709
deb
CDS
502556
159
comp
tRNA
503549
27
tRNA
503649
41
tRNA
503761
48
tRNA
503881
31
tRNA
503985
148
fin
CDS
504209
deb
CDS
518814
64
tRNA
521008
216
fin
CDS
521298
deb
CDS
647871
95
comp
tRNA
648764
60
fin
CDS
648912
deb
CDS
745690
187
comp
tRNA
747296
29
comp
tRNA
747399
117
comp
fin
CDS
747590
comp
deb
CDS
774507
116
tRNA
775646
94
fin
CDS
775811
deb
CDS
777792
218
tRNA
778709
89
tRNA
778871
206
fin
CDS
779150
deb
CDS
790385
272
tRNA
793729
467
fin
CDS
794270
deb
CDS
803537
67
comp
tRNA
804390
204
comp
fin
CDS
804668
blo2 adresses2
deb-fin
gènes
adresses
intercal
sens
deb
CDS
840296
192
comp
tRNA
841058
158
comp
fin
CDS
841295
comp
deb
CDS
884674
174
comp
regulatory
885043
70
comp
fin
CDS
885217
comp
deb
CDS
902480
104
comp
regulatory
903184
90
comp
fin
CDS
903379
comp
deb
CDS
935658
336
comp
tRNA
937056
149
fin
CDS
937281
deb
CDS
980173
251
comp
tRNA
981180
76
comp
fin
CDS
981330
deb
CDS
1200444
288
comp
tRNA
1202433
87
tRNA
1202593
192
fin
CDS
1202866
deb
CDS
1206664
206
comp
tRNA
1208139
167
fin
CDS
1208379
comp
deb
CDS
1263240
256
comp
tRNA
1264393
48
comp
tRNA
1264514
46
comp
tRNA
1264632
193
comp
fin
CDS
1264898
deb
CDS
1279836
365
comp
tRNA
1280591
97
comp
fin
CDS
1280764
deb
CDS
1294216
215
comp
tRNA
1295466
433
fin
CDS
1295976
deb
CDS
1349627
113
comp
tRNA
1350001
199
comp
fin
CDS
1350274
comp
deb
CDS
1387168
75
comp
tRNA
1388878
175
comp
fin
CDS
1389126
deb
CDS
1408202
580
comp
tRNA
1410594
469
fin
CDS
1411148
comp
deb
CDS
1424162
142
comp
tRNA
1424793
39
comp
tRNA
1424907
-8
comp
fin
CDS
1424972
deb
CDS
1446913
71
comp
ncRNA
1448136
433
comp
fin
CDS
1448664
deb
CDS
1477877
47
comp
regulatory
1479277
128
comp
fin
CDS
1479502
comp
deb
CDS
1523012
62
tRNA
1524142
74
comp
fin
CDS
1524290
comp
deb
CDS
1533182
306
tRNA
1534802
871
fin
CDS
1535759
deb
CDS
1605867
102
tRNA
1606163
42
tRNA
1606279
356
fin
CDS
1606708
comp
blo3 adresses3
deb-fin
gènes
adresses
intercal
sens
deb
CDS
1645027
314
comp
tRNA
1646838
130
comp
fin
CDS
1647042
comp
deb
CDS
1704570
578
comp
rRNA
1705904
431
rRNA
1707861
170
rRNA
1711097
866
rRNA
1712080
431
rRNA
1714037
170
rRNA
1717273
251
fin
CDS
1717641
comp
deb
CDS
1769786
55
tRNA
1769952
329
fin
CDS
1770354
deb
CDS
1904329
130
tRNA
1905665
37
fin
CDS
1905778
deb
CDS
1907638
573
rRNA
1908904
431
rRNA
1910861
170
rRNA
1914097
375
fin
CDS
1914589
deb
CDS
1935774
178
tRNA
1936132
519
fin
CDS
1936725
deb
CDS
1969854
309
comp
tRNA
1971396
1
tRNA
1971479
4
tRNA
1971555
61
fin
CDS
1971690
deb
CDS
1978293
71
tRNA
1979312
376
fin
CDS
1979775
deb
CDS
2014827
397
tRNA
2016025
327
fin
CDS
2016437
deb
CDS
2045606
179
tRNA
2047072
245
fin
CDS
2047402
deb
CDS
2067227
222
comp
tRNA
2068640
204
comp
fin
CDS
2068918
deb
CDS
2084303
271
comp
tRNA
2085402
69
comp
fin
CDS
2085543
comp
deb
CDS
2086731
224
tRNA
2087969
47
tRNA
2088090
519
fin
CDS
2088685
comp
deb
CDS
2108837
333
comp
tRNA
2110850
422
fin
CDS
2111349
deb
CDS
2129279
117
tRNA
2130626
137
fin
CDS
2130837
deb
CDS
2170074
253
comp
tRNA
2171440
156
fin
CDS
2171669
blo intercalaires tRNA
Lien tableur: blo intercalaires tRNA
Légende:
- comp', l'intercalaire est entre un gène comp (sur le complément) et un gène sur le brin direct. Continu les 2 gènes sont sur le même brin.
- deb, fin sont les intercalaires des cds du tableau précédent, autres intercalaires: respectivement dans le sens des adresses croissantes, le cds avant le 1er tRNA et le cds après le dernier tRNA du bloc.
Cumuls comp'+continu du tableau
deb fin total
<201 20 21 41
total 39 39 78
taux 51% 54% 53%
blo intercalaires tRNA
blo les relevés deb-fin
comp’
entre tRNAs
comp’
deb
comp’
fin
163
231
-17
154
43
comp’
190
comp’
284
comp’
-39
comp’
558
27 41 48 31
comp’
159
148
24
216
comp’
95
60
29
187
117
116
94
89
218
206
212
467
67
comp’
204
192
158
comp’
336
149
251
comp’
76
87
comp’
288
192
comp’
206
comp’
167
48 46
256
comp’
193
365
comp’
97
comp’
215
433
113
199
75
comp’
175
comp’
580
comp’
469
39
142
comp’
-8
comp’
62
74
306
871
42
102
comp’
356
314
130
65
329
1 4
comp’
309
61
71
376
397
327
179
245
222
comp’
204
271
69
47
224
comp’
519
comp’
333
422
117
137
comp’
253
156
blo intercalaires inférieures à 201 pbs
deb
fin
continu
cumuls
-17
60
24
61
deb
65
69
<201
15
67
74
total
26
71
94
taux
58%
75
117
102
130
fin
113
137
<201
15
116
148
total
26
117
149
taux
58%
142
154
163
156
total
179
158
<201
30
187
192
total
52
192
199
taux
58%
212
206
218
216
222
231
224
245
251
327
256
329
271
376
306
422
314
433
365
467
397
871
comp’
cumuls
-39
-8
deb
62
76
<201
5
95
97
total
13
159
167
taux
38%
190
175
fin
206
193
<201
6
215
204
total
13
253
204
taux
46%
288
284
309
356
total
333
469
<201
11
336
519
total
26
580
558
taux
42%
blo intercalaires rRNA
Voir la présentation des blocs à rRNA dans le chapitre blo blocs de l'étude préliminaire. A comparer avec le tableau blo autres intercalaires .
Remarque: Les 4 blocs sont à rRNAs seuls. Leurs intercalaires avec les 2 cds sont orientés. C'est à dire que le cds-16s est plus grand que le 5s-cds qu'il y ait un complément ou non. Ainsi pour les 2 blocs non contigus on a respectivement 618-188 et 573-375. Les 2 blocs contigus ont la configuration cds1-16s23s5s-cds2-16s23s5s-cds3 avec les intercalaires cds 578-866-251. Cette configuration est toujours orientée. Cette orientation est quasiment générale chez tous les génomes que j'ai étudié ici. Je l'ai notée dans les chapitres génome-bloc de chaque génome.
Note: J'ai supposé souvent que les blocs à tRNA sans rRNA sont aussi orientés de l'intercalaire le plus grand au plus petit. Dans blo cumuls et de même pour les autres génomes, j'ai noté cette orientation dans la colonne cdsd, pour cds dirigé. Je n'ai conservé pour les calculs que le plus petit intercalaire des 2 cds bordant le bloc. L'idée était que cette orientation provoquait la création du cds en fin de bloc. Ces cds sont souvent de petites protéines et souvent hypothétiques. Aussi je présente ci-dessous la transformation deb-fin qui est imposée par l'adressage en intercalaire plus grand et plus petit.
deb fin tri grand petit deb fin tri grand petit
163 231 4 558 -39 113 199 5 159 148
-17 154 2 154 -17 75 175 14 336 149
190 284 24 142 -8 580 469 39 253 156
-39 558 6 216 24 142 -8 13 192 158
159 148 7 95 60 62 74 1 231 163
24 216 30 309 61 306 871 17 206 167
95 60 25 74 62 102 356 33 245 179
187 117 29 329 65 314 130 3 284 190
116 94 12 204 67 65 329 16 288 192
218 206 35 271 69 309 61 18 256 193
212 467 31 376 71 71 376 34 222 204
67 204 22 175 75 397 327 10 218 206
192 158 15 251 76 179 245 11 467 212
336 149 9 116 94 222 204 20 433 215
251 76 19 365 97 271 69 36 519 224
288 192 27 356 102 224 519 26 871 306
206 167 21 199 113 333 422 32 397 327
256 193 8 187 117 117 137 37 422 333
365 97 38 137 117 253 156 23 580 469
215 433 28 314 130
618 188
578 866 251
573 375
Streptomyces avermitilis MA-4680
sma opérons
Liens: gtRNAdb [9] , NCBI [10] , génome []
Lien tableur: sma opérons
Phylogénie: Bacteria; Actinobacteria; Streptomycetales; Streptomycetaceae; Streptomyces.
Ac3. Streptomyces avermitilis MA-4680
70%GC
30.6.19 Paris
74
doubles
intercal
357776..357847
gtg
comp
1219274..1219346
gga
comp
1225751..1225823
gga
1675869..1675942
atgf
comp
1965347..1965423
ccc
comp
1992012..1992088
ccc
comp
2222599..2222686
ctc
comp
3072632..3072707
acc
comp
3073568..3073684
5s
@1
84
comp
3073769..3076918
23s
288
comp
3077207..3078737
16s
comp
3295252..3295324
gag
+
20
comp
3295345..3295416
cag
3 gag
21
comp
3295438..3295510
gag
2 cag
62
comp
3295573..3295645
gag
42
comp
3295688..3295759
cag
3655871..3655942
cgg
comp
3813093..3813166
atgf
comp
3815457..3815530
atgf
comp
4362610..4362695
tta
4410534..4410608
caa
comp
4542466..4542542
gcg
4589760..4589835
agg
comp
4886830..4886906
aca
comp
5024109..5024225
5s
84
comp
5024310..5027458
23s
288
comp
5027747..5029277
16s
comp
5051970..5052043
atgf
comp
5055486..5055561
aaa
5063087..5063159
gaa
47
5063207..5063281
gac
24
5063306..5063382
ttc
5068123..5068197
gac
5081640..5081711
gga
79
5081791..5081866
ggc
5085779..5085854
ggc
5095224..5095311
tcc
5129698..5129782
tcg
comp
5154937..5155009
cgt
205
comp
5155215..5155305
agc
comp
5177691..5177777
tca
comp
5206939..5207028
agc
comp
5299302..5299378
atc
5304905..5304977
gca
5322106..5322192
ctg
comp
5452769..5452842
ggg
comp
5594481..5594554
ccg
5650316..5650389
acg
5759342..5760872
16s
288
5761161..5764309
23s
84
5764394..5764510
5s
5950170..5950251
tac
5956602..5956674
acc
46
5956721..5956793
atgj
5964532..5964607
tgg
6124386..6125916
16s
288
6126205..6129353
23s
84
6129438..6129554
5s
comp
6242261..6242335
tgc
comp
6279029..6279112
cta
comp
6329202..6329278
aag
comp
6335068..6335141
aag
comp
6349312..6349385
aag
comp
6372705..6372777
cac
comp
6501509..6501584
aga
comp
6604435..6604508
gga
153
comp
6604662..6604738
cca
6653846..6653918
gcc
6658303..6658375
gcc
6875603..6875675
aac
+
5
6875681..6875753
aac
2 aac
166
6875920..6875996
atgi
7021984..7022058
gta
7025336..7025415
gtg
comp
7471270..7471342
ttg
7765513..7767043
16s
284
7767328..7770477
23s
133
7770611..7770727
5s
comp
7937463..7937550
ctc
comp
8122352..8122426
gtc
+
40
comp
8122467..8122538
gtc
3 gtc
19
comp
8122558..8122629
gtc
1
comp
8122631..8122704
tgc
38
comp
8122743..8122815
ggc
8129564..8129635
gtg
8139938..8140012
gtg
8328596..8330126
16s
288
8330415..8333563
23s
84
8333648..8333764
5s
8576989..8577062
ccc
sma cumuls
cumuls. sam.
opérons
Fréquences intercalaires tRNAs
effectif
gammes
sans rRNAs
avec rRNAs
avec rRNA
opérons
6
1
1
-
16 23 5s 0
6
20
3
16 atc gca
0
40
4
16 23 5s a
0
60
3
max a
0
80
2
a doubles
0
100
0
spéciaux
0
120
0
total aas
0
140
0
sans
opérons
56
160
1
1 aa
48
180
1
max a
5
200
0
a doubles
3
1
total aas
72
16
0
total aas
72
remarques
1
avec jaune
moyenne
61
variance
61
sans jaune
moyenne
34
variance
22
sma blocs
Ac3. Streptomyces avermitilis MA-4680, blocs rRNAs
5s
84
117
84
117
288
1531
23s
288
3150
288
3149
84
3149
16s
1531
1531
117
16s
288
1531
284
1531
288
1531
23s
84
3149
133
3150
84
3149
5s
117
117
117
sma remarques
Remarques : 6 blocs 16-23-5s. Beaucoup de tRNAs solitaires.
@ 6 blocs 16-23-5s sans aas.
- 5 opérons ont les mêmes intercalaires, 288 84
- 1 opéron a l'intercalaire 23s-5s 58% plus élevée, 49/84. L'autre est commune aux 6 opérons, 284.
Séquences des doubles : 48 des 56 opérons à tRNAs sont des tRNAs solitaires.
- Il n'y a que 3 opérons contenant des doubles:
- (3gag 2cag) avec une répétition de séquence 2*2
- (ggc tgc 3gtc), répétition triple
- (atgi 2aac) avec 1 doublet
- Au total 2 doublets et 2 triplets. Ce qui est très peu, alors que le total des tRNAs est de 72. C’est donc que ce sont les opérons qui se répètent et non les tRNAs. Les opérons à rRNAs font de même, avec 6 blocs quasi identiques même dans la longueur de leurs intercalaires.
sma distribution
Lien tableur: sma distribution
Notes:
- gag2 gtc3 gag2
- gga a 2 tRNAs solitaires et 2 multiples (>1aa) les autres soulignes ont 1 seul solitaire.
Ac3 sma. La distribution. Streptomyces avermitilis MA-4680. actinomycete.
g1
t1
a atgi
1
a tct
tat
atgf
4
b att
i act
aat
agt
c ctt
e cct
cat
cgc
d gtt
m gct
gat
ggt
e ttc
1
b tcc
1
tac
1
tgc
2
f atc
1
j acc
2
aac
2
agc
2
g ctc
2
f ccc
3
cac
1
cgt
1
h gtc
3
n gcc
2
gac
2
ggc
3
i tta
1
c tca
1
taa
tga
j ata
k aca
1
aaa
1
aga
1
k cta
1
g cca
1
caa
1
cga
l gta
1
o gca
1
gaa
1
gga
4
m ttg
1
d tcg
1
tag
tgg
1
n atgj
1
l acg
1
aag
3
agg
1
o ctg
1
h ccg
1
cag
2
cgg
1
p gtg
4
p gcg
1
gag
3
ggg
1
actino
>1aa
=1aa
-5s
+5s
-16s
+16s
total
sma
24
48
72
Kitasatospora setae KM-6054
ksk opérons
Liens: gtRNAdb [11] , NCBI [12] , génome []
Lien tableur: ksk opérons
Phylogénie: Bacteria; Actinobacteria; Streptomycetales; Streptomycetaceae; Kitasatospora.
Ac4. Kitasatospora setae KM-6054
72%GC
30.6.19 Paris
74
doubles
intercal
comp
631024..631098
act
976172..976245
tgc
comp
1615691..1615765
gtg
+
206
comp
1615972..1616046
gtg
2 gtg
1621501..1621576
ggc
76
1621653..1621726
tgc
36
1621763..1621834
gtc
+
34
1621869..1621940
gtc
3 gtc
37
1621978..1622052
gtc
comp
1707344..1707460
5s
@1
73
comp
1707534..1710667
23s
267
comp
1710935..1712463
16s
comp
1888620..1888736
5s
73
comp
1888810..1891942
23s
267
comp
1892210..1893738
16s
1970574..1970661
ctc
2264495..2264580
ttg
comp
2741186..2741257
gta
comp
2788071..2788147
atgi
comp
2790422..2790494
aac
+
5
comp
2790500..2790572
aac
2 aac
comp
2887231..2887303
gcc
+
269
comp
2887573..2887645
gcc
3 gcc
38
comp
2887684..2887756
gcc
@2
comp
2932411..2932487
cca
151
direct
2932639..2932712
gga
comp
2982955..2983071
5s
73
comp
2983145..2986276
23s
266
comp
2986543..2988071
16s
3018063..3018138
cac
3036654..3036730
aag
3044201..3044277
aag
3111827..3111900
aag
129
3112030..3112103
aag
3157748..3157834
cta
3210241..3210315
tgc
comp
3289891..3290007
5s
73
comp
3290081..3293213
23s
267
comp
3293481..3295009
16s
comp
3608705..3608777
tgg
comp
3616894..3616969
atgj
42
comp
3617012..3617084
acc
comp
3618677..3618757
tac
comp
3851412..3851488
aca
comp
3987214..3987290
acg
4071208..4071281
ccg
4095099..4095186
tcc
4142544..4142633
tcg
comp
4160864..4160939
cgt
+
35
comp
4160975..4161050
cgt
2 cgt
240
comp
4161291..4161381
agc
comp
4177523..4177608
tca
comp
4240397..4240470
ggg
4285828..4285900
ggc
+
51
4285952..4286027
ggc
2 ggc
4383368..4383444
atc
4385556..4385631
gca
4401492..4401575
ctg
comp
4622975..4623048
gac
comp
4640883..4640959
ttc
34
comp
4640994..4641067
gac
42
comp
4641110..4641182
gaa
4651832..4651904
aaa
comp
4773547..4773620
atgf
comp
4774128..4774201
atgf
4796510..4798038
16s
267
4798306..4801439
23s
71
4801511..4801627
5s
5027433..5027508
agg
5076388..5076464
gcg
5123784..5123856
acc
5132819..5132892
caa
comp
5216466..5216550
tta
5430075..5430148
atgf
comp
5530949..5531020
cgg
5714968..5715039
cag
21
5715061..5715133
gag
+
38
5715172..5715244
gag
3 gag
13
5715258..5715330
gag
2 cag
4
5715335..5715409
cag
5853168..5854696
16s
256
5854953..5858085
23s
73
5858159..5858275
5s
5932168..5933696
16s
256
5933953..5937085
23s
71
5937157..5937273
5s
6074082..6075610
16s
264
6075875..6079006
23s
73
6079080..6079196
5s
comp
6104344..6104419
aga
6400221..6401749
16s
267
6402017..6405146
23s
106
6405253..6405369
5s
6485836..6485909
ccc
7355279..7355354
tgc
19
7355374..7355449
ggc
comp
7461078..7461165
ctc
ksk cumuls
cumuls. ksk.
opérons
Fréquences intercalaires tRNAs
effectif
gammes
sans rRNAs
avec rRNAs
avec rRNA
opérons
9
1
0
-
16 23 5s 0
9
20
4
16 atc gca
0
40
8
16 23 5s a
0
60
3
max a
0
80
1
a doubles
0
100
0
spéciaux
0
120
0
total aas
0
140
1
sans
opérons
49
160
1
1 aa
37
180
0
max a
5
200
0
a doubles
7
3
total aas
70
21
0
total aas
70
remarques
2
avec jaune
moyenne
72
variance
79
sans jaune
moyenne
33
variance
18
ksk blocs
Ac4. Kitasatospora setae KM-6054, blocs rRNA.
5s
73
117
73
117
73
117
23s
267
3134
267
3133
266
3132
16s
1529
1529
1529
16s
73
117
267
1529
256
1529
23s
267
3133
71
3134
73
3133
5s
1529
117
117
16s
256
1529
264
1529
267
1529
23s
71
3133
73
3132
106
3130
5s
117
117
117
ksk remarques
Remarques : 9 blocs 16-23-5s. Beaucoup de tRNAs solitaires. Analogue à sma.
@ 9 blocs 16-23-5s sans aas.
- 8 opérons ont des intercalaires identiques, 267 73.
- 1 opéron a l'intercalaire 23s-5s 45% plus élevée, 33/73. L'autre est commune aux 9 opérons, 267.
@ Les intercalaires élevés ne touchent que 2 opérons sans rRNAs et sont à la limite de la règle de 210 bases, et sont équivalents à l’intercalaire 16s-23s, 269 et 240.
Séquences des doubles : 48 des 56 opérons à tRNAs sont des tRNAs solitaires.
- Il n'y a que 7 opérons contenant des doubles:
- (3gag 2cag) avec une répétition de séquence 2*2 , comme sma.
- (ggc tgc 3gtc), répétition triple comme sma, plus (3gcc).
- (atgi 2aac) est remplacé par 4 doublets, 2gtg 2aac 2ggc et (agc 2cgt).
- Au total 5 doublets et 3 triplets. Ce qui est très peu, alors que le total des tRNAs est de 70. C’est donc que ce sont les opérons qui se répètent et non les tRNAs. Les opérons à rRNAs font de même, avec 9 blocs quasi identiques même dans la longueur de leurs intercalaires.
ksk distribution
Lien tableur: ksk distribution
Notes:
- Les doubles et les triples, gtg2 gcc3 ggc2 gtc3 aag2 gag3 aac2 cgt2, font 19 tRNas sur les 33 multiples, soit 58%. Ne sont pas accompagnés de solitaires.
- Tableau Ac42, ggc a 1 double et 2 non doubles appartenant à 2 blocs multiples.
- 3 tRNAs ont 1 solitaire et 1 multiple, acc cca gac. Le tRNA tgc a 2 multiples non doubles et 2 solitaires.
Ac4 ksk, Kitasatospora setae KM-6054. actinomycete.
Ac41 ase. La distribution des tRNAs solitaires.
g1
t1
a atgi
1
a tct
tat
atgf
3
b att
i act
1
aat
agt
c ctt
e cct
cat
cgc
d gtt
m gct
gat
ggt
e ttc
b tcc
1
tac
1
tgc
2
f atc
1
j acc
1
aac
agc
g ctc
2
f ccc
1
cac
1
cgt
h gtc
n gcc
gac
1
ggc
i tta
1
c tca
1
taa
tga
j ata
k aca
1
aaa
1
aga
1
k cta
1
g cca
1
caa
cga
l gta
1
o gca
1
gaa
gga
m ttg
1
d tcg
1
tag
tgg
1
n atgj
l acg
1
aag
2
agg
1
o ctg
1
h ccg
1
cag
cgg
1
p gtg
p gcg
1
gag
ggg
1
actino
>1aa
=1aa
-5s
+5s
-16s
+16s
total
ksk
37
37
Ac42 ksk. La distribution des tRNAs multiples.
g1
t1
a atgi
a tct
tat
atgf
b att
i act
aat
agt
c ctt
e cct
cat
cgc
d gtt
m gct
gat
ggt
e ttc
1
b tcc
tac
tgc
2
f atc
j acc
1
aac
2
agc
1
g ctc
f ccc
cac
cgt
2
h gtc
3
n gcc
3
gac
1
ggc
4
i tta
c tca
taa
tga
j ata
k aca
aaa
aga
k cta
g cca
1
caa
cga
l gta
o gca
gaa
1
gga
1
m ttg
d tcg
tag
tgg
n atgj
1
l acg
aag
2
agg
o ctg
h ccg
cag
2
cgg
p gtg
2
p gcg
gag
3
ggg
actino
>1aa
=1aa
-5s
+5s
-16s
+16s
total
ksk
33
33
actino synthèse
actino distribution par génome
Actino distribution par génome
actino
>1aa
1aa
-5s
+5s
-16s
+16s
duplica
1-3aas
total
ase
58
32
0
6
96
blo
19
31
0
6
56
sma
17
48
0
7
72
ksk
14
37
0
19
70
total
108
148
0
0
0
0
38
0
294
actino distribution du total
actino. Distribution et indices
actino. Distribution du total: >1aa 1aa duplicata.
g1
t1
a atgi
4
a tct
tat
atgf
11
b att
i act
1
aat
agt
c ctt
e cct
cat
cgt
d gtt
m gct
gat
ggt
e ttc
5
b tcc
5
tac
5
tgc
10
f atc
5
j acc
7
aac
9
agc
7
g ctc
8
f ccc
6
cac
5
cgc
9
h gtc
11
n gcc
10
gac
10
ggc
14
i tta
4
c tca
4
taa
tga
j ata
k aca
4
aaa
5
aga
5
k cta
4
g cca
6
caa
3
cga
l gta
4
o gca
5
gaa
5
gga
7
m ttg
5
d tcg
4
tag
tgg
7
n atgj
4
l acg
6
aag
11
agg
4
o ctg
7
h ccg
4
cag
8
cgg
5
p gtg
10
p gcg
6
gag
10
ggg
5
actino4
>1aa
1aa
-5s
+5s
-16s
+16s
total
type
146
148
0
294
actino. indices du 26.5.20 434 génomes
g1
t1
618
21937
0,5
0,2
a atgi
104
a tct
0,2
tat
atgf
135
b att
i act
0,7
aat
agt
0,2
c ctt
0,9
e cct
0,5
cat
0,9
cgc
1,4
d gtt
0,2
m gct
0,2
gat
0,9
ggt
0,2
e ttc
106
b tcc
100
tac
104
tgc
118
f atc
104
j acc
111
aac
126
agc
104
g ctc
113
f ccc
106
cac
100
cgt
131
h gtc
145
n gcc
129
gac
138
ggc
184
i tta
100
c tca
100
taa
tga
19
j ata
1,2
k aca
100
aaa
104
aga
103
k cta
100
g cca
100
caa
99
cga
1,4
l gta
98
o gca
119
gaa
101
gga
108
m ttg
105
d tcg
125
tag
0,9
tgg
109
n atgj
102
l acg
104
aag
126
agg
104
o ctg
100
h ccg
99
cag
110
cgg
105
p gtg
114
p gcg
86
gag
143
ggg
104
inter
max
min
total
actino distribution par type
Actino. Distribution par type.
actino. distribution des solitaires
g1
t1
a atgi
3
a tct
tat
atgf
10
b att
i act
1
aat
agt
c ctt
e cct
cat
cgc
d gtt
m gct
gat
ggt
e ttc
1
b tcc
4
tac
3
tgc
3
f atc
2
j acc
2
aac
2
agc
2
g ctc
6
f ccc
6
cac
4
cgt
1
h gtc
n gcc
3
gac
5
ggc
1
i tta
4
c tca
4
taa
tga
j ata
k aca
4
aaa
4
aga
4
k cta
3
g cca
2
caa
3
cga
l gta
4
o gca
2
gaa
1
gga
2
m ttg
4
d tcg
4
tag
tgg
5
n atgj
l acg
4
aag
6
agg
4
o ctg
4
h ccg
4
cag
cgg
4
p gtg
5
p gcg
4
gag
ggg
4
actino4
1aa
148
actino. distribution du type >1aa sans duplicata.
g1
t1
a atgi
1
a tct
tat
atgf
1
b att
i act
aat
agt
c ctt
e cct
cat
cgc
d gtt
m gct
gat
ggt
e ttc
4
b tcc
1
tac
2
tgc
7
f atc
3
j acc
5
aac
1
agc
5
g ctc
2
f ccc
cac
1
cgt
4
h gtc
5
n gcc
2
gac
5
ggc
11
i tta
c tca
taa
tga
j ata
k aca
aaa
1
aga
1
k cta
1
g cca
4
caa
cga
l gta
o gca
3
gaa
4
gga
5
m ttg
1
d tcg
tag
tgg
2
n atgj
4
l acg
2
aag
agg
o ctg
3
h ccg
cag
8
cgg
1
p gtg
3
p gcg
2
gag
2
ggg
1
actino
>1aa
108
actino. distribution des duplicata
g1
t1
a atgi
a tct
tat
atgf
b att
i act
aat
agt
c ctt
e cct
cat
cgc
d gtt
m gct
gat
ggt
e ttc
b tcc
tac
tgc
f atc
j acc
aac
6
agc
g ctc
f ccc
cac
cgt
4
h gtc
6
n gcc
5
gac
ggc
2
i tta
c tca
taa
tga
j ata
k aca
aaa
aga
k cta
g cca
caa
cga
l gta
o gca
gaa
gga
m ttg
d tcg
tag
tgg
n atgj
l acg
aag
5
agg
o ctg
h ccg
cag
cgg
p gtg
2
p gcg
gag
8
ggg
actino
dupli
38
actino par rapport au groupe de référence
Comparaison avec la référence
tRNAs
blocs tRNAs
blocs rRNAs
actino4
1aa
>1aa
dup
+5s
1-3aas
autres
total
21
faible
55
28
26
109
16
moyen
50
38
88
14
fort
43
42
12
97
148
108
38
294
10
g+cga
31
18
15
64
2
agg+cgg
8
1
9
4
carre ccc
15
9
11
35
5
autres
1
1
55
28
26
109
total tRNAs ‰
actino4
1aa
>1aa
dup
+5s
1-3aas
autres
actino ‰
ref.‰
21
faible
187
95
88
371
26
16
moyen
170
129
299
324
14
fort
146
143
41
330
650
503
367
129
294
729
10
g+cga
105
61
51
218
10
2
agg+cgg
27
3
31
4
carre ccc
51
31
37
119
16
5
autres
3
3
187
95
88
371
blocs tRNAs ‰
total colonne %
actino4
1aa
>1aa
dup
total
ref.‰
1aa
>1aa
dup
21
faible
187
95
88
371
26
37
26
68
16
moyen
170
129
299
324
34
35
14
fort
146
143
41
330
650
29
39
32
503
367
129
294
729
148
108
38
10
g+cga
105
61
51
218
10
56
64
58
2
agg+cgg
27
3
31
15
4
4
carre ccc
51
31
37
119
16
27
32
42
5
autres
3
3
2
187
95
88
371
55
28
26
actinobacteria, estimation des -rRNAs
Lien tableur: actinobacteria, estimation des -rRNAs
Liens fiche: typage
Légende: prélèvement de la base gtRNAdb le 22.1.21
- ttt et tgt sont nuls partout
- atgi , c'est Ile2, mis à la place de ttt, très rare chez les procaryotes.
- atgf , c'est Metf, mis à la place de tgt, très rare chez les procaryotes.
- atgj , c'est Met, remplace le atg standard qui est la somme Ile2 Met fMet.
- Voir la légende des tris, g1 t1 et des couleurs
actinobacteria, calcul des -rRNAs
act actinobacteria 63 génomes
act1 cumul des +rRNAs de la fiche actinobacteria pour 99 génomes
g1
t1
a atgi
a tct
tat
atgf
b att
i act
aat
agt
c ctt
e cct
cat
cgc
d gtt
m gct
gat
ggt
e ttc
b tcc
2
tac
tgc
f atc
j acc
aac
agc
g ctc
f ccc
cac
cgt
h gtc
n gcc
gac
ggc
i tta
c tca
taa
tga
j ata
k aca
aaa
aga
k cta
g cca
caa
cga
l gta
o gca
gaa
gga
m ttg
d tcg
tag
tgg
n atgj
l acg
aag
agg
o ctg
h ccg
cag
cgg
p gtg
p gcg
gag
ggg
acti99
inter
max
min
total
2
0
0
2
act2 indices du clade actinobacteria du 26.5.20 de gtRNAdb pour 100 génomes
g1
t1
618
0.5
0.2
a atgi
104
a tct
0.2
tat
atgf
135
b att
i act
0.7
aat
agt
0.2
c ctt
0.9
e cct
0.5
cat
0.9
cgc
1.4
d gtt
0.2
m gct
0.2
gat
0.9
ggt
0.2
e ttc
106
b tcc
100
tac
104
tgc
118
f atc
104
j acc
111
aac
126
agc
104
g ctc
113
f ccc
106
cac
100
cgt
131
h gtc
145
n gcc
129
gac
138
ggc
184
i tta
100
c tca
100
taa
tga
19
j ata
1.2
k aca
100
aaa
104
aga
103
k cta
100
g cca
100
caa
99
cga
1.4
l gta
98
o gca
119
gaa
101
gga
108
m ttg
105
d tcg
125
tag
tgg
109
n atgj
102
l acg
104
aag
126
agg
104
o ctg
100
h ccg
99
cag
110
cgg
105
p gtg
114
p gcg
86
gag
143
ggg
104
gtRNA
inter
max
min
total
1679
1634
1736
5049
act3 cumul des -rRNAs de l'annexe archeo 4 génomes
g1
t1
a atgi
4
a tct
tat
atgf
11
b att
i act
1.0
aat
agt
c ctt
e cct
cat
cgc
d gtt
m gct
gat
ggt
e ttc
5
b tcc
5
tac
5
tgc
10
f atc
5
j acc
7
aac
9
agc
7
g ctc
8
f ccc
6
cac
5
cgt
9
h gtc
11
n gcc
10
gac
10
ggc
14
i tta
4
c tca
4
taa
tga
j ata
k aca
4
aaa
5
aga
5
k cta
4
g cca
6
caa
3
cga
l gta
4
o gca
5
gaa
5
gga
7
m ttg
5
d tcg
4
tag
tgg
7
n atgj
4
l acg
6
aag
11
agg
4
o ctg
7
h ccg
4
cag
8
cgg
5
p gtg
10
p gcg
6
gag
10
ggg
5
acti4
inter
max
min
total
88
97
109
294
act4 indices des +rRNAs de la fiche actinobacteria pour 100 génomes
g1
t1
a atgi
a tct
tat
atgf
b att
i act
aat
agt
c ctt
e cct
cat
cgc
d gtt
m gct
gat
ggt
e ttc
b tcc
2
tac
tgc
f atc
j acc
aac
agc
g ctc
f ccc
cac
cgt
h gtc
n gcc
gac
ggc
i tta
c tca
taa
tga
j ata
k aca
aaa
aga
k cta
g cca
caa
cga
l gta
o gca
gaa
gga
m ttg
d tcg
tag
tgg
n atgj
l acg
aag
agg
o ctg
h ccg
cag
cgg
p gtg
p gcg
gag
ggg
acti99
inter
max
min
total
2
0
0
2
act5 estimation des -rRNA du clade actinobacteria pour 100 génomes
g1
t1
a atgi
104
a tct
0.2
tat
atgf
135
b att
i act
0.7
aat
agt
0.2
c ctt
0.9
e cct
0.5
cat
0.9
cgc
1.4
d gtt
0.2
m gct
0.2
gat
0.9
ggt
0.2
e ttc
106
b tcc
98
tac
104
tgc
118
f atc
104
j acc
111
aac
126
agc
104
g ctc
113
f ccc
106
cac
100
cgt
131
h gtc
145
n gcc
129
gac
138
ggc
184
i tta
100
c tca
100
taa
tga
19
j ata
1.2
k aca
100
aaa
104
aga
103
k cta
100
g cca
100
caa
99
cga
1.4
l gta
98
o gca
119
gaa
101
gga
108
m ttg
105
d tcg
125
tag
tgg
109
n atgj
102
l acg
104
aag
126
agg
104
o ctg
100
h ccg
99
cag
110
cgg
105
p gtg
114
p gcg
86
gag
143
ggg
104
-rRNA
inter
max
min
total
1677
1634
1736
5047
act6 indices des -rRNAs de l'annexe archeo pour 100 génomes
g1
t1
a atgi
100
a tct
tat
atgf
275
b att
i act
25
aat
agt
c ctt
e cct
cat
cgc
d gtt
m gct
gat
ggt
e ttc
125
b tcc
125
tac
125
tgc
250
f atc
125
j acc
175
aac
225
agc
175
g ctc
200
f ccc
150
cac
125
cgt
225
h gtc
275
n gcc
250
gac
250
ggc
350
i tta
100
c tca
100
taa
tga
j ata
k aca
100
aaa
125
aga
125
k cta
100
g cca
150
caa
75
cga
l gta
100
o gca
125
gaa
125
gga
175
m ttg
125
d tcg
100
tag
tgg
175
n atgj
100
l acg
150
aag
275
agg
100
o ctg
175
h ccg
100
cag
200
cgg
125
p gtg
250
p gcg
150
gag
250
ggg
125
acti4
inter
max
min
total
2200
2425
2725
7350
actinobacteria, comparaison clade-annexe des -rRNAs
Lien tableur: actinobacteria, comparaison clade-annexe des -rRNAs
Légende
- act7. diff, somme des couleurs de act7. La différence entre tRNAs est faite entre act5 et act6 du tableau précédent. Elle est exprimée en % et rapporté à la plus grande valeur des 2 termes de la différence. Ce qui fait quand un tRNA est à zéro la différence en % est égale à 100.
- act8. rap, rapport des sommes couleurs act5/act2. Le rapport -rRNA/total est celui du tRNA de act5 sur celui de act2.
Fréquences des différences en % du tableau act7
gamme 0/0 10 20 30 40 50 60 70 80 90 100 total
fréquence 0 10 12 2 5 12 4 0 0 0 3 0 48
tot ≤ 50 41
Comparaison avec le nombre de tRNAs de la fiche du clade: L’estimation des -rRNA par l'annexe est 36% au dessus de celle de la fiche des actinobacteria.
tRNAs fiche annexe
sans 5354 294
avec 2 0
genomes 99 4
indice % 54 75
act actinobacteria 99 génomes
act7 actinobacteria, différence clade-annexe des -rRNAs
g1
t1
a atgi
4
a tct
100
tat
atgf
51
b att
i act
97
aat
agt
100
c ctt
100
e cct
100
cat
100
cgc
100
d gtt
100
m gct
100
gat
100
ggt
100
e ttc
15
b tcc
22
tac
17
tgc
53
f atc
17
j acc
37
aac
44
agc
41
g ctc
44
f ccc
29
cac
20
cgt
42
h gtc
47
n gcc
48
gac
45
ggc
47
i tta
0
c tca
0
taa
tga
100
j ata
100
k aca
0
aaa
17
aga
18
k cta
0
g cca
33
caa
24
cga
100
l gta
2
o gca
5
gaa
19
gga
38
m ttg
16
d tcg
20
tag
tgg
38
n atgj
2
l acg
31
aag
54
agg
4
o ctg
43
h ccg
1
cag
45
cgg
16
p gtg
54
p gcg
43
gag
43
ggg
17
diff
inter
max
min
total
313
395
593
1301
act8 actinobacteria, rapports -rRNA/total
g1
t1
a atgi
a tct
tat
atgf
b att
i act
aat
agt
c ctt
e cct
cat
cgc
d gtt
m gct
gat
ggt
e ttc
b tcc
98
tac
tgc
f atc
j acc
aac
agc
g ctc
f ccc
cac
cgt
h gtc
n gcc
gac
ggc
i tta
c tca
taa
tga
j ata
k aca
aaa
aga
k cta
g cca
caa
cga
l gta
o gca
gaa
gga
m ttg
d tcg
tag
tgg
n atgj
l acg
aag
agg
o ctg
h ccg
cag
cgg
p gtg
p gcg
gag
ggg
rap
inter
max
min
total
100
100
100
100