Aller au contenu

Recherche:Les clusters de gènes tRNA et rRNA chez les procaryotes/Annexe/bacilli

Une page de Wikiversité, la communauté pédagogique libre.
bacilli
Image logo représentative de la faculté
Annexe 3
Recherche : Les clusters de gènes tRNA et rRNA chez les procaryotes
Précédent :alpha
Suivant :clostridia
En raison de limitations techniques, la typographie souhaitable du titre, « Annexe : bacilli
Les clusters de gènes tRNA et rRNA chez les procaryotes/Annexe/bacilli
 », n'a pu être restituée correctement ci-dessus.



  • Annexe en préparation

Tanger le 21.10.19

Bacillus subtilis

bsu opérons

B1. Bacillus subtilis subsp. subtilis str. 168
43.6%GC 7.3.19 Paris   86  doubles intercal
9810..11364 16s @2 99
11464..11540 atc 11
11552..11627 gca 81
11709..14636 23s 55
14692..14810 5s
22292..22384 tca
30279..31832 16s 99
31932..32008 atc 11
32020..32095 gca 81
32177..35103 23s 133
35237..35355 5s
70181..70257 atg 9
70267..70338 gaa
90536..92089 16s @1 164
92254..95181 23s 55
95237..95354 5s 20
95375..95450 gta 4
95455..95530 aca 36
95567..95642 aaa 6
95649..95731 cta 40
95772..95846 ggc 14
95861..95946 tta 9
95956..96032 cgt 27
96060..96136 cca 9
96146..96221 gca 170
96392..97945 16s 164
98110..101037 23s 55
101093..101211 5s
160893..162445 16s 164
162610..165535 23s 55
165591..165707 5s 46
165754..165825 aac 4
165830..165902 acc 56
165959..166033 ggc 30
166064..166140 cgt 27
166168..166244 cca 8
166253..166328 gca 171
166500..168053 16s 164
168218..171141 23s 55
171197..171314 5s 183
171498..173049 16s 164
173214..176141 23s 55
176197..176315 5s
194205..194279 gaa 3
194283..194358 gta 4
194363..194435 aca 22
194458..194542 tac 4
194547..194621 caa
528704..528778 aac 4
528783..528873 agc 29
528903..528974 gaa 11
528986..529060 caa 26
529087..529162 aaa 11
529174..529255 cta 80
529336..529422 ctc
635110..635186 cgt 13
635200..635273 gga 159
635433..636987 16s 167
637155..640082 23s 55
640138..640254 5s 13
640268..640344 atgf 60
640405..640481 gac
946696..948250 16s 167
948418..951345 23s 111
951457..951572 5s 9
951582..951656 aac 5
951662..951753 tcc 34
951788..951859 gaa 9
951869..951944 gta 9
951954..952030 atgf 11
952042..952118 gac 12
952131..952206 ttc 5
952212..952284 aca 22
952307..952391 tac 5
952397..952470 tgg 24
952495..952570 cac 9
952580..952651 caa 49
952701..952775 ggc 5
952781..952851 tgc 7
952859..952947 tta @3 265
953213..953294 ttg
967065..967138 gga
1262789..1262861 gtc
comp 2003276..2003348 agg
2563889..2563959 caa
comp 2899816..2899889 aga
comp 3171879..3171950 gaa 25
comp 3171976..3172066 agc 3
comp 3172070..3172144 aac 10
comp 3172155..3172231 atc 15
comp 3172247..3172320 gga 10
comp 3172331..3172406 cac 17
comp 3172424..3172499 ttc 12
comp 3172512..3172588 gac 11
comp 3172600..3172676 atgf 17
comp 3172694..3172786 tca 6
comp 3172793..3172869 atgi 2
comp 3172872..3172948 atgj 19
comp 3172968..3173040 gca 5
comp 3173046..3173122 cca 15
comp 3173138..3173214 cgt 9
comp 3173224..3173309 tta 14
comp 3173324..3173398 ggc 5
comp 3173404..3173490 ctg 10
comp 3173501..3173576 aaa 37
comp 3173614..3173689 aca 32
comp 3173722..3173797 gta 20
comp 3173818..3173935 5s 55
comp 3173991..3176918 23s 167
comp 3177086..3178640 16s
comp 3194455..3194527 gcc
comp 3545889..3545964 cgg
comp 4154787..4154859 ttc 35
comp 4154895..4154971 gac 81
comp 4155053..4155124 gaa 9
comp 4155134..4155209 aaa

bsu cumuls

cumuls. Bacillus subtilis subsp. subtilis str. 168
opérons Fréquences Moyenne
effectifs gammes sans rRNAs avec rRNAs sans jaune
avec rRNA opérons 10 1 0 0
16 23 5s 0 3 20 8 37
16 atc gca 2 40 4 11
16 23 5s a 5 60 0 3
max a 21 80 1 0
a doubles 0 100 1 0
spéciaux 0 120 0 0
total aas 60 140 0 0
sans rRNAs opérons 12 160 0 0
1 aa 8 180 0 0
max a 7 200 0 0
a doubles 0 220 0 0
total aas 26 total 14 51
total aas 86 moyenne 23 17 14
remarques 3 variance 26 14 11

bsu remarques

  • Nombre de gènes protéines: 4174 (KEGG)
*Remarques : lmo-bsu (ref. sont les 1ers génomes de cette étude qui m’ont poussé à étendre	
	l’échantillon. Lma* lmo et bsu sont des bacilli et donc ont des points communs
	en terme d’opréons à RNAs avec des taux %GC très proches 38-44 %.
	
@1	Blocs 16-23-5s : il y en a 8 avec 2 dans l’opéron 9aas et 3 dans 6aas.
	Soit le double de lmo.
	- Dans la 1ère étude ces blocs paraissaient arborer les séquences les plus longues 
	d’aas et j’attribuait la longueur de 16 aas de l’opéron 16-act-gca à un remaniement 
	entre opérons.  Ce n’est plus le cas puisqu’il s’est avéré que ces derniers sont plus 
	courants et peuvent être aussi long que les premiers avec 18 aas chez lam (ref..
	- Les intercalaires sont les mêmes pour les 4 blocs 16-23-5s,  164 55 20.
	- L'opéron 16aas a un intercalaire 23s-5s double des autres blocs, 111 contre 55.
	- L'opéron 4aas contient 2 aas avant le 16s et 2 après le 5s. L'intercalaire aa-16s 
	est à peu près égale à celui de 16s-23s, 159 contre 167.
	- Les intercalaires qui séparent les blocs surnuméraires sont aussi du même ordre
	que celui de 16s-23s, 170 171 183 contre 164 pour le 16s-23s.
	- Les 5 opérons avec ces blocs ont 4 6 9 16 21 aas.
	
@2	Blocs 16-atc-gca : il y en a 2 et n’ont pas d’autres aas comme l’opéron 
	16aas de lmo.
	- Les intercalaires sont les mêmes pour les 2 opérons, 99 11 81, sauf pour  celui de 
	23s-5s, 55 bases pour l’un, comme 7 blocs 16-23-5s, et le double pour l’autre, 
	113 comme pour l’opéron 16aas.
	
@3	intercalaire élevé pour 2 aas. Est-ce que le dernier aa est solitaire ?
	
Séquences des doubles : aucun double sur 7 opérons à 2 aas et plus. Comme lmo.	

bsu distribution

  • Lien tableur: bsu distribution
  • Notes:
    - Les 1-3aas après 5s, +5s, sont soulignés:atgf gac.
Bc1 bsu, Bacillus subtilis subsp. subtilis str. 168. bacilli.
bc11 bsu, distribution des blocs sans rRNA
g1    t1       
atgi tct tat atgf
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc 1 tcc tac 1 tgc
atc 2 acc aac 1 agc 1
ctc 1 ccc cac cgt
gtc 1 gcc 1 gac 1 ggc
tta tca 1 taa tga
ata aca 1 aaa 2 aga 1
cta 1 cca caa 3 cga
gta 1 gca 2 gaa 4 gga 1
ttg tcg tag tgg
atgj 1 acg aag agg 1
ctg ccg cag cgg 1
gtg gcg gag ggg
baci >1aa =1aa -5s +5s -16s +16s total
bsu 18 8 4 30
bc12 bsu. Distribution des blocs avec rRNA.
g1    t1       
atgi 1 tct tat atgf 3
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc 2 tcc 1 tac 1 tgc 1
atc 1 acc 1 aac 3 agc 1
ctc ccc cac 2 cgt 4
gtc gcc gac 3 ggc 4
tta 3 tca 1 taa tga
ata aca 3 aaa 2 aga
cta 1 cca 3 caa 1 cga
gta 3 gca 3 gaa 2 gga 2
ttg 1 tcg tag tgg 1
atgj 1 acg aag agg
ctg 1 ccg cag cgg
gtg gcg gag ggg
baci >1aa =1aa -5s +5s -16s +16s total
bsu 54 2 56

bsu lmo

  • Lien tableur: bsu lmo
  • Légende:
    - La couleur cyan pour les différents entre bsu et lmo; bois pour les identiques entre les clusters 21 16 9 aas de bsu d'une part et ceux de lmo. Le gène cac est conservé dans les 3 clusters.
    - Le bleu pour des intercalaires exceptionnels.
    - Les bordures très épaisses noires encadrent 3 gènes pour les distingués entre eux.
  • Notes:
    - Les fréquences des différences entre intercalaires (diff) sont reportées dans le dernier tableau B14 et sont établies sur la plage des différences entre intercalaires bsu et lmo du tableau B11 pour des couples identiques (entre génomes), et entre intercalaires bsu-bsu et lmo-lmo (intra génome). Ces résultats sont à mettre en parallèle avec ceux de la comparaison cdc-psor. La faible variabilité des intercalaires cdc-psor par rapport à bsu-lmo est due à leur plus grande filiation, niveau genre contre le niveau famille pour bsu-lmo.
B1. Comparaison bsu-lmo
B11. Comparaison bsu-lmo
bsu intercal lmo intercal diff
gaa 25 gaa 5 -20
agc 3 agc 34 31
aac 10 aac 6 -4
atc 15 atc 25 10
gga 10 gga 23 13
cac 17 cac 28 11
ttc 12 ttc 4 -8
gac 11 gac 4 -7
atgf 17 atgf 42 25
tca 6 tca 22 16
atgi 2 atgi 11 9
atgj 19 atgj 42 23
gca 5 gca 22 17
cca 15 cca 10 -5
cgt 9 cgt 9 0
tta 14 tta 14 0
ggc 5 ggc 15 10
ctg 10 cta 5 -5
aaa 37 aaa 41 4
aca 32 aca 8 -24
gta 20 gta 13
5s 55 5s 81
23s 167 23s 244
16s 16s
16s 167 16s 127
23s 111 atc 46
5s 9 gca 172
aac 5 23s 80
tcc 34 5s 14
gaa 9 aac 6 1
gta 9 tcc 33 -1
atgf 11 gaa 56 47
gac 12 gta 21 12
ttc 5 atgf 6 -5
aca 22 gac 4 -8
tac 5 ttc 20
tgg 24 tac 7 2
cac 9 tgg 15 -9
caa 49 cac 29 20
ggc 5 caa 5 -44
tgc 7 ggc 19 14
tta 265 tgc 45
ttg ttg
16s 164 16s 244
23s 55 23s 80
5s 20 5s 13
gta 4 gta 8 4
aca 36 aca 41 5
aaa 6 aaa 5 -1
cta 40 cta 14 -26
ggc 14 ggc 21 7
tta 9 tta 12 3
cgt 27 cgt 10 -17
cca 9 cca 19 10
gca 170 gca 341
B12. Comparaisons internes
bsu intercal bsu intercal diff
16s 167 16s 167
23s 55 23s 111
5s 20 5s 9
gta 32 aac 5
aca 37 tcc 34
aaa 10 gaa 9
ctg 5 gta 9
ggc 14 atgf 11 0
tta 9 gac 12 0
cgt 15 ttc 5
cca 5 aca 22
gca 19 tac 5
atgj 2 tgg 24
atgi 6 cac 9
tca 17 caa 49
atgf 11 ggc 5
gac 12 tgc 7
ttc 17 tta 265
cac 10 ttg
gga 15
atc 10 16s 164
aac 3 23s 55
agc 25 5s 20
gaa gta 4 -28
aca 36 -1
aaa 6 -4
cta 40 35
ggc 14 0
tta 9 0
cgt 27 12
cca 9 4
gca 170
lmo intercal lmo intercal diff
16s 244 16s 127
23s 81 atc 46
5s 13 gca 172
gta 8 23s 80
aca 41 5s 14
aaa 5 aac 6
cta 15 tcc 33
ggc 14 gaa 56
tta 9 gta 21
cgt 10 atgf 6 2
cca 22 gac 4 0
gca 42 ttc 20
atgj 11 tac 7
atgi 22 tgg 15
tca 42 cac 29
atgf 4 caa 5
gac 4 ggc 19
ttc 28 tgc 45
cac 23 ttg
gga 25
atc 6 16s 244
aac 34 23s 80
agc 5 5s 13
gaa gta 8 0
aca 41 0
aaa 5 0
cta 14 -1
ggc 21 7
tta 12 3
cgt 10 0
cca 19 -3
gca 341
B13. Petits clusters
bsu intercal lmo intercal
gaa 3 gaa 157
gta 4 acg 9
aca 22 tac 11
tac 4 caa 6
caa aaa
aga aga
cgg cgg
gga gga
gtc gtc
agg cgt
caa ctc
gcc tcg
tca
atg 9 aac 3
gaa agc
gaa 27
gac
cgt 13 16s 127
gga 159 atc 46
16s 167 gca 172
23s 55 23s 80
5s 13 5s 14
atgf 60 aac 24
gac acc
B14. Fréquence des différences des intercalaires
Entre génomes intra génome
gamme fréquence    gamme fréquence
-15 5 -7 1
-14 -6
-13 -5
-12 -4 1
-11 -3 1
-10 -2
-9 1 -1 2
-8 2 0 9
-7 1 1
-6 2 1
-5 3 3 1
-4 1 4 1
-3 5
-2 6
-1 2 7 1
0 2 2
1 1 total 20
2 1 -2+2 11
3 1
4 2
5 1
6
7 1
8
9 1
10 3
11 1
12 1
13 1
14 1
15
7
total 39
-2+2 6

bsu blocs

B1. Bacillus subtilis subsp. subtilis str. 168, blocs à rRNA.
Types
I I1 I2 I3 I4 II II1 II2 II3
16s 167 167 164 164 16s 164 164 164
23s 111 55 55 55 23s 55 55 55
5s 9 20 46 20 5s
5 32 4 4
aac gta aac gta
**15aas **20aas **5aas ** 8aas
III IV
16s 99 99 cgt 13
atc 11 11 gga 159
gca 81 81 16s 167
23s 55 133 23s 55
5s 5s 13
atgf 60
gac
groupe1 groupe2
16s 164 16s 164
I3 23s 55 I4 23s 55
5s 46 5s 20
aac 4 gta 4
**4aas 8 ** 7aas 9
gca 171 gca 170
II1 16s 164 II3 16s 164
23s 55 23s 55
II2 5s 183 5s
16s 164
23s 55
5s

bsu intercalaires entre cds

  • Lien NCBI [4]
  • Note: Pour les génomes des annexes j'ai relevé les intercalaires entre tRNAs et entre ceux-ci et les cds qui leur sont adjacents. L'exemple est celui de rru du clade alpha. L'idée de départ de ces prélèvements est la recherche d'opérons formés de tRNA et de protéine comme dans le cas d'E.coli: l'intercalaire entre le tRNA et la protéine devrait être faible. Voir l'exemple d'eco (remarque @3) avec tac-tac-tpr et aca-tac-gga-acc-tufB.

Fréquences: gammes, moyennes et variances

intercalaires	total	%	intercalaires	moyenne	ecartype	plage
négatif		609	14	négatif 	-12	19		-1 à -164
zéro		27	0.4				
1 à 200		3043	70	0 à 200		72	56	
201 à 370	463	11	201 à 370	262	46	
371 à 600	150	3.5	371 à 600	457	65	
601 à max	36	0.8	601 à 1306	774	170	
Total 4328			Total 4316	99	124		-164 à 1306

bsu les fréquences

  • Lien tableur: bsu intercalaires entre cds
  • Légende:   long, longueur en pbs.
    - 16s, 23s5s, blocs à rRNAs seuls.Voir bsu opérons pour leurs intercalaires
    - agc, aaa-atc, blocs à tRNAs seuls. Voir bsu opérons pour leurs intercalaires
bsu Les fréquences des intercalaires entre cds
adresse intercal inter-gène long intercal fréquence cumul/% intercal fréquence
159779 16539 2x16s 15423 -70 19 0 27
88727 11222 2x16s 10676 -60 2 -1 72
3169763 7659 16s 21aas 6762 -50 5 -2 4
390880 7511 néant -40 19 -3 0
945520 6968 16s 16aas 6599 -30 11 min à -1 -4 243
634651 5885 16s 4aas 5372 -20 38 609 -5 0
29772 5495 néant -10 105 14% -6 2
6994 5387 néant 0 437 -7 12
3671416 1306 néant 10 260 -8 76
1261426 1085 gtc 20 445 -9 1
4153696 1029 4aas 423 30 255 -10 6
2221061 952 néant 40 279 -11 44
2226176 950 50 165 -12 0
528129 923 60 114 -13 6
1886057 824 70 140 -14 20
193570 823 80 154 -15 0
2895248 815 90 134 -16 6
2733772 809 100 116 -17 18
785543 783 110 131 -18 0
3699446 783 120 126 -19 5
2060817 777 130 127 -20 12
1218113 743 140 94 -21 0
875428 731 150 112 -22 2
3449732 721 160 100 -23 8
559264 686 170 92 1 à 200 -24 0
1446317 682 180 84 3043 -25 2
2051329 669 190 60 70% -26 8
1482248 645 200 55 -27 0
3544642 629 210 61 -28 0
2054599 627 220 32 -29 6
873402 625 230 49 -30 0
1872812 623 240 43 -31 1
1278565 619 250 37 -32 2
4004288 615 260 31 74
3854256 609 270 36 reste 53
1900080 602 280 30 636
290 20
300 17 600 4292
310 18 650 9
320 14 700 3
330 21 750 3
340 21 201 à 370 800 3
350 15 463 850 4
360 10 11% 900 0
370 8 950 2
380 13 1000 1
390 14 1050 1
400 8 1100 1
387744 -7616 shift 2 gènes 3135 410 14 1150 0
3717238 -500 shift 2 gènes 88 420 10 1200 0
2909520 -492 tronq 2 gènes 0 430 10 1250 0
2601528 -361 comp 440 5 1300 0
1252815 -164 shift 2 gènes 43 450 10 1350 1
2466721 -154 shift 2 gènes 1079 460 1 8
1916663 -143 shift 2 gènes 292 470 5 total 36
3666841 -127 comp 480 7
2693597 -119 shift 2 gènes 823 490 8
538322 -113 shift 2 gènes 412 500 4
1322014 -101 shift 2 gènes 736 510 6
238164 -95 520 4
1526859 -94 530 4
2652993 -93 540 3 371 à 600
2758043 -92 550 5 150
3755967 -91 560 5 3.5%
2154781 -86 570 3
2705398 -82 580 4 601 à max
2154705 -71 590 5 36
989712 -69 600 2 0.8%

Listeria monocytogenes

lmo opérons

  • Liens: gtRNAdb [5], NCBI [6]
  • Lien tableur: lmo
B2. Listeria monocytogenes EGD-e
37.9%GC 7.3.19 Paris  67  doubles intercal
82705..82777 aag
237466..239020 16s @1 244
239265..242195 23s 80
242276..242385 5s 13
242399..242471 gta 8
242480..242555 aca 41
242597..242669 aaa 5
242675..242756 cta 14
242771..242842 ggc 21
242864..242949 tta 12
242962..243035 cgt 10
243046..243119 cca 19
243139..243214 gca 341
243556..245041 16s 244
245286..248216 23s 80
248297..248406 5s
677464..677553 tcg
936656..936728 aac 3
936732..936819 agc
940017..940088 gaa 27
940116..940188 gac
970867..970937 gga
1266675..1266748 aga
comp 1740916..1740987 gaa 5
comp 1740993..1741083 agc 34
comp 1741118..1741190 aac 6
comp 1741197..1741270 atc 25
comp 1741296..1741366 gga 23
comp 1741390..1741462 cac 28
comp 1741491..1741563 ttc 4
comp 1741568..1741643 gac 4
comp 1741648..1741721 atgf 42
comp 1741764..1741853 tca 22
comp 1741876..1741949 atgi 11
comp 1741961..1742034 atgj 42
comp 1742077..1742149 gca 22
comp 1742172..1742245 cca 10
comp 1742256..1742329 cgt 9
comp 1742339..1742424 tta 14
comp 1742439..1742513 ggc 15
comp 1742529..1742610 cta 5
comp 1742616..1742688 aaa 41
comp 1742730..1742805 aca 8
comp 1742814..1742886 gta 13
comp 1742900..1743009 5s 81
comp 1743091..1746021 23s 244
comp 1746266..1747811 16s
1776112..1776183 cgt
comp 1848821..1848930 5s 81
comp 1849012..1851942 23s 244
comp 1852187..1853732 16s
2162187..2162273 ctc
2215375..2215446 gaa 157
2215604..2215677 acg 9
2215687..2215770 tac 11
2215782..2215856 caa 6
2215863..2215935 aaa
comp 2436493..2436576 ttg 45
comp 2436622..2436695 tgc 19
comp 2436715..2436786 ggc 5
comp 2436792..2436863 caa 29
comp 2436893..2436965 cac 15
comp 2436981..2437054 tgg 7
comp 2437062..2437145 tac 20
comp 2437166..2437238 ttc 4
comp 2437243..2437318 gac 6
comp 2437325..2437398 atgf 21
comp 2437420..2437495 gta 56
comp 2437552..2437623 gaa 33
comp 2437657..2437745 tcc 6
comp 2437752..2437827 aac 14
comp 2437842..2437951 5s 80
comp 2438032..2440962 23s 172
comp 2441135..2441210 gca 46
comp 2441257..2441330 atc 127
comp 2441458..2443003 16s @2
comp 2540230..2540301 cgg
comp 2672664..2672736 acc 24
comp 2672761..2672836 aac 14
comp 2672851..2672960 5s 80
comp 2673041..2675971 23s 172
comp 2676144..2676219 gca 46
comp 2676266..2676339 atc 127
comp 2676467..2678012 16s
2930362..2930434 gtc

lmo cumuls

cumuls. Listeria monocytogenes EGD-e
opérons Fréquences Moyenne
effectifs gammes sans rRNAs avec rRNAs sans jaune
avec rRNA opérons 6 1 0 0
16 23 5s 0 2 20 4 25
16 atc gca 2 40 1 11
16 23 5s a 2 60 0 8
max a 21 80 0 0
a doubles 0 100 0 0
spéciaux 0 120 0 0
total aas 50 140 0 0
sans opérons 11 160 1 0
1 aa 8 180 0 0
max a 5 200 0 0
a doubles 0 220 0 0
total aas 17 6 44
total aas 67 moyenne 36 20 11
remarques 2 variance 36 12 9

lmo blocs

B2. Listeria monocytogenes EGD-e, blocs à rRNA.
Types
I I1 I2  I3 I4    II II1 II2
16s 244 244 16s 244 244
23s 81 80 23s 80 81
5s 13 13 5s
8 8
gta gta
**20aas **8aas
III IV
16s 127 127
atc 46 46
gca 172 172
23s 80 80
5s 14 14
6 24
aac aac
**13aas acc
Groupes
16s 244
I4 23s 80
5s 13
gta 8
**7aas 19
gca 341
16s 244
II1 23s 80
5s

lmo remarques

  • Nombre de gènes protéines: 2867 (KEGG)
*Remarques : lmo-bsu (ref. sont les 1ers génomes de cette étude qui m’ont poussé à étendre	
	l’échantillon. Lma* lmo et bsu sont des bacilli et donc ont des points communs
	en terme d’opréons à RNAs avec des taux %GC très proches 38-44 %.
	
@1	Blocs 16-23-5s : il y en a 4 dont 1 sans aas et 2 réunis dans un seul opéron.
	- Dans la 1ère étude ces blocs paraissaient arborer les séquences les plus longues 
	d’aas et j’attribuait la longueur de 16 aas de l’opéron 16-act-gca à un remaniement 
	entre opérons.  Ce n’est plus le cas puisqu’il s’est avéré que ces derniers sont plus 
	courants et peuvent être aussi long que les premiers avec 18 aas chez lam (ref..
	- Les intercalaires sont les mêmes pour les 4 blocs 16-23-5s,  244 80 13.
	- L'opéron à 2 blocs: le 2ème n'ayant pas d'aa à la suite de 5s et ayant une
	intercalaire du côté de 16s, très élevée, 341 bases, pourrait être un solitaire.
	
@2	Blocs 16-atc-gca : il y en a 2 dont un  le fameux 16aas et l’autre avec 4 aas.
	- Les intercalaires sont les mêmes pour les 2 opérons, 127 46 172 80 14.
	- Ils partagent les mêmes intercalaires 5s-aa avec les blocs 16-23-5s-aa, 80 13.
	
Séquences des doubles : aucun double sur 7 opérons à 2 aas et plus. Comme bsu.	

lmo distribution

  • Lien tableur: lmo distribution
  • Notes:
    - Les 1-3aas après 5s, +5s, sont soulignés:aac acc.
Bc2 lmo, Listeria monocytogenes EGD-e. bacilli.
bc21 lmo, distribution des blocs sans rRNA
g1    t1       
atgi tct tat atgf
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc tcc tac 1 tgc
atc 2 acc aac 1 agc 1
ctc 1 ccc cac cgt 1
gtc 1 gcc gac 1 ggc
tta tca taa tga
ata aca aaa 1 aga 1
cta cca caa 1 cga
gta gca 2 gaa 2 gga 1
ttg tcg 1 tag tgg
atgj acg 1 aag 1 agg
ctg ccg cag cgg 1
gtg gcg gag ggg
baci >1aa =1aa -5s +5s -16s +16s total
lmo 9 8 4 21
bc22 lmo. Distribution des blocs avec rRNA.
g1    t1       
atgi 1 tct tat atgf 2
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc 2 tcc 1 tac 1 tgc 1
atc 1 acc 1 aac 3 agc 1
ctc ccc cac 2 cgt 2
gtc gcc gac 2 ggc 3
tta 2 tca 1 taa tga
ata aca 2 aaa 2 aga
cta 2 cca 2 caa 1 cga
gta 3 gca 2 gaa 2 gga 1
ttg 1 tcg tag tgg 1
atgj 1 acg aag agg
ctg ccg cag cgg
gtg gcg gag ggg
baci >1aa =1aa -5s +5s -16s +16s total
lmo 46 46

Lactobacillus amylovorus strain 30SC

lam opérons

  • Liens: gtRNAdb [7], NCBI [8]
  • Lien tableur: lam
  • Légende:
    -cds1, hp 186: hypothetical protein, 186 pb, MESRNTKRSIQSKRKHTEKLCLVLRVVPQGVSTLKTEYNPSKKPRQSKRTDCRATEKRILE
    -cds2, hp 186: hypothetical protein, 186 pb, MESRNTKRSIQSKRKHTEKLCLVLRVVPQRVSTLKTEYNPSKKPRQSKRTDCRATEKRILE
B3. Lactobacillus amylovorus strain 30SC
38%GC 30.6.19 Paris 63 doubles intercal
447399..448972 16s @1 125
449098..449172 atc 52
449225..449297 gca 115
449413..452324 23s 68
452393..452509 5s 4
452514..452586 gta 2
452589..452661 aaa 13
452675..452756 cta 23
452780..452852 aca 10
452863..452934 ggc 11
452946..453031 tta 8
453040..453113 cgt 5
453119..453192 cca 29
453222..453295 atg 12
453308..453381 atgi 27
453409..453482 atgf 3
453486..453559 gac 6
453566..453638 ttc 19
453658..453728 gga 5
453734..453808 atc 2
453811..453900 agc
57091..58664 16s 125
58790..58864 atc 52
58917..58989 gca 115
59105..62016 23s 68
62085..62201 5s 13
62215..62287 aac
469566..471139 16s @2 9
471149..471334 cds1 hp 186 -3
471332..474243 23s 68
474312..474428 5s 13
474442..474514 aac
comp 1709284..1709374 tcc 10
comp 1709385..1709457 aac 13
comp 1709471..1709587 5s 68
comp 1709656..1712567 23s -3
comp 1712565..1712750 cds2 hp 186 9
comp 1712760..1714333 16s
comp 79386..79458 aag
comp 79913..79985 aag
193922..193994 acc
comp 210866..210939 ggg
287678..287752 ggc + 111
287864..287938 ggc 3 ggc 109
288048..288122 ggc 35
288158..288231 ccg
457611..457682 gaa 35
457718..457804 tca 9
457814..457887 atgf 3
457891..457964 gac 6
457971..458046 ttc 4
458051..458132 tac 4
458137..458207 tgg 12
458220..458295 cac 4
458300..458371 caa 23
458395..458465 tgc 40
458506..458590 ttg
474442..474514 aac
507688..507760 acg
526886..526957 caa
551550..551631 tac 34
551666..551737 caa
567329..567416 ctt
583327..583413 tca 6
583420..583493 gac 7
583501..583576 cac 4
583581..583653 gta
642034..642106 agg
comp 729370..729441 cgg
784793..784864 gag
917887..917975 tcg
1456724..1456800 aga
1681218..1681301 ctg
comp 1707998..1708070 gta 5
comp 1708076..1708147 gaa
1987190..1987263 cgt 8
1987272..1987345 cca

lam cumuls

cumuls. Lactobacillus amylovorus strain 30SC
opérons Fréquences Moyenne
effectifs gammes sans rRNAs avec rRNAs sans jaune
avec rRNA total 4 1 0 0
16 23 5s 0 0 20 12 12
16 atc gca 2 40 5 3
16 23 5s a 0 60 0 0
max a 18 80 0 0
a doubles 0 100 0 0
spéciaux 2 120 2 0
total aas 24 140 0 0
sans total 20 160 0 0
1 aa 14 180 0 0
max a 11 200 0 0
a doubles 1 220 0 0
total aas 39 19 15
total aas 63 moyenne 24 12 14
remarques 2 variance 33 9 13

lam blocs

B3. lam, blocs à rRNA.
16s 125 1574 16s 9 1574
atc 52 cds1 -3 62
gca 115 23s 68 2912
23s 68 2912 5s 13 117
5s 4 117 aac
gta
16s 125 1574 16s 9 1574
atc 52 cds2 -3 62
gca 115 23s 68 2912
23s 68 2912 5s 13 117
5s 13 117 aac
aac

lam remarques

*Remarques : pratiquement pas de doublons, 1 seul triplet dans 1 opéron sur 11.	
	- Que des blocs de type 16-atcgca, il y en a 4.
	
@1	Les 2 blocs 16-atcgca sont standard comme dans bsu et lmo (ref..
	- Ils ont les mêmes intercalaires du début, 125 52 115 68 13.
	- un opéron avec 1 aa en plus, aac comme dans bsu-lmo.
	- un opéron à 18 aas plus grand que celui de lmo avec 16.
	
@2	Les 2 blocs 16s-protéine-23s-5s.  Ressemblance avec  EFTU.
	- très petite protéine, 62 aas.
	- Dans les 2 cas les intercalaires sont les mêmes, 9 -3 68 13
	- Notez le -3 pour le stop.
	- les intercalaires 25s-5s-aac sont à peu près les mêmes que les 
	Blocs 16 atc gca 23-5s-aa, 68 13.
	contrôle du 3.10.20: les 2 cds ont disparus dans NCBI du 31.7.2020.
Séquences des doubles :  pratiquement pas de doublons, 1 seul triplet dans 1 opéron sur 11	
	opérons à plus de 2 aas.

lam distribution

  • Lien tableur: lam distribution
  • Notes:
    - Les 1-3aas après 5s, +5s, sont soulignés: 3 aac et tcc.
    - duplicata: ggc3
Bc3 lam, Lactobacillus amylovorus strain 30SC. bacilli.
bc31 lam, distribution des blocs sans rRNA
g1    t1       
atgi tct tat atgf 1
att act aat agt
ctt 1 cct cat cgc
gtt gct gat ggt
ttc 1 tcc tac 2 tgc 1
atc 2 acc 1 aac 1 agc
ctc ccc cac 2 cgt 1
gtc gcc gac 2 ggc 3
tta tca 2 taa tga
ata aca aaa aga 1
cta cca 1 caa 3 cga
gta 2 gca 2 gaa 2 gga
ttg 1 tcg 1 tag tgg 1
atgj acg 1 aag 2 agg 1
ctg 1 ccg 1 cag cgg 1
gtg gcg gag 1 ggg 1
baci >1aa =1aa -5s +5s -16s +16s total
lam 25 14 4 43
bc32 lam. Distribution des blocs avec rRNA.
g1    t1       
atgi 1 tct tat atgf 1
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc 1 tcc 1 tac tgc
atc 1 acc aac 3 agc 1
ctc ccc cac cgt 1
gtc gcc gac 1 ggc 1
tta 1 tca taa tga
ata aca 1 aaa 1 aga
cta 1 cca 1 caa cga
gta 1 gca gaa gga 1
ttg tcg tag tgg
atgj 1 acg aag agg
ctg ccg cag cgg
gtg gcg gag ggg
baci >1aa =1aa -5s +5s -16s +16s total
lam 20 20

Paenibacillus polymyxa SC2

ppm opérons

ppm opérons chromosome

  • Liens: gtRNAdb [9], NCBI [10]
  • Lien tableur: ppm
  • Légende: cdsa: cds aas, cdsj: cdsa sans jaune, cdsd: cdsa dirigé
B4 Paenibacillus polymyxa SC2 Chromosome
45.5%GC 26.7.19 Paris  110   doubles intercal cds aa avec aa cdsa cdsd
10545..11633 CDS 327 327 363
11961..13519 16s 280
13800..16728 23s 143
16872..16988 5s 232 232 232
17221..17640 CDS 93 855 140
comp 111496..112530 CDS 616 345
113147..114705 16s 207
114913..117843 23s 76
117920..118036 5s 343 343
118380..119837 CDS 3 348 486
123186..124469 CDS 90 90 428 90
124560..124648 tca 145 145
124794..125135 CDS 55 592 114
180728..181003 CDS 412 92
181416..182974 16s 108
183083..183199 5s @1 39
183239..183315 atc 20 20
183336..183411 gca 128
183540..186468 23s 130
186599..186690 agc 28 28
186719..186795 atgj 10 10
186806..186881 gta 4 4
186886..186961 aca 19 19
186981..187057 gac 77 77
187135..187210 ttc 6 6
187217..187302 tac 7 7
187310..187385 aaa 154 154 154
187540..188682 CDS 24 062 381
comp 212745..213341 CDS 211 211 199 211
comp 213553..213624 cgg 259 259
213884..214921 CDS 238 832 346
453754..455364 CDS 392 537
455757..457315 16s 207
457523..460453 23s 76
460530..460646 5s 34
460681..460757 atc 22 22
460780..460855 gca 4 4
460860..460935 aac 34 34
460970..461043 atgj 3 3
461047..461138 agc 31 31
461170..461241 gaa 6 6
461248..461323 gta 10 10
461334..461407 atgf 25 25
461433..461509 gac 50 50
461560..461635 ttc 22 22
461658..461733 aca 5 5
461739..461824 tac 16 16
461841..461913 cac 18 18
461932..462006 caa 4 4
462011..462086 aaa 15 15
462102..462189 ctg 6 6
462196..462270 ggc 10 10
462281..462351 tgc 26 26
462378..462454 cgt 22 22
462477..462550 cca 9 9
462560..462630 gga 204 204 204
comp 462835..463938 CDS 1 537 368
465476..466216 CDS 524 247
466741..468299 16s 207
468507..471434 23s 76
471511..471627 5s 629
472257..473588 CDS 103 459 444
577048..577794 CDS 1 116 249
578911..580469 16s 207
580677..583607 23s 76
583684..583800 5s 82
583883..583958 gca 4 4
583963..584038 aac 3 3
584042..584133 tcc 19 19
584153..584224 gaa 9 9
584234..584309 gta 29 29
584339..584412 atgf 25 25
584438..584514 gac 13 13
584528..584603 aca 4 4
584608..584693 tac 102 102
584796..584870 caa 4 4
584875..584950 aaa 12 12
584963..585043 cta 10 10
585054..585128 ggc 5 5
585134..585210 cgt 12 12
585223..585302 ttg 7 7
585310..585386 cca 7 7
585394..585464 gga 1 133
586598..587560 CDS 22 016 321
609577..609924 CDS 73 73 116 73
609998..610069 acg 1 613
comp 611683..612030 CDS 140 810 116
752841..754124 CDS 611 428
754736..756294 16s 208
756503..759431 23s 75
759507..759623 5s 183 183 183
comp 759807..760232 CDS 173 078 142
933311..934681 CDS 449 457
935131..936689 16s 221
936911..939839 23s 76
939916..940032 5s 216 216 216
940249..941241 CDS 521 183 331
1462425..1462937 CDS 44 44 171 44
1462982..1463057 aac 1 1
1463059..1463147 agc 122 122
comp 1463270..1464145 CDS 74 292
comp 1464220..1464981 CDS 246 246 254
1465228..1465299 gaa 86 86
1465386..1465461 aaa 15 15
1465477..1465562 ctc 162 162 162
1465725..1466180 CDS 1 667 152
comp 1467848..1468585 CDS 262 262 246
1468848..1468930 ctc 148 148 148
comp 1469079..1469564 CDS 112 990 162
1582555..1583361 CDS 490 269
1583852..1583925 ccc 244 244
comp 1584170..1585441 CDS 32 099 424
1617541..1619682 CDS 107 107 714 107
1619790..1619860 gga 265 265
1620126..1621163 CDS 254 529 346
1875693..1876160 CDS 129 129 156 129
1876290..1876365 gcc 11 11
1876377..1876449 aag 520
comp 1876970..1877974 CDS 55 215 335
comp 1933190..1933630 CDS 381 147
1934012..1934096 ctg 91 91 91
comp 1934188..1934718 CDS 74 847 177
comp 2009566..2010102 CDS 222 222 179
2010325..2010409 ctg 213 213
2010623..2011135 CDS 432 608 171
2443744..2448333 CDS 540 1530
2448874..2450432 16s 400
2450833..2453761 23s 143
2453905..2454021 5s 236 236 236
comp 2454258..2455367 CDS 186 804 370
2642172..2643329 CDS 426 386
2643756..2645314 16s 343
2645658..2648586 23s 144
2648731..2648847 5s 156 156 156
2649004..2649228 CDS 884 577 75
comp 3533806..3534249 CDS 139 139 148 139
3534389..3534460 gtc 279 279
comp 3534740..3535069 CDS 103 837 110
3638907..3639338 CDS 728 144
comp 3640067..3640152 tta 249 249 249
3640402..3640560 CDS 28 092 53
3668653..3669450 CDS 247 247 266
comp 3669698..3669766 atg 267 267
comp 3670034..3670234 CDS 54 456 67
3724691..3725086 CDS 122 122 132 122
comp 3725209..3725282 atgi 435
comp 3725718..3726359 CDS 612 148 214
comp 4338508..4339209 CDS 107 107 234 107
comp 4339317..4339390 cca 7 7
comp 4339398..4339477 ttg 12 12
comp 4339490..4339566 cgt 5 5
comp 4339572..4339646 ggc 35 35
comp 4339682..4339757 aaa 28 28
comp 4339786..4339862 gac 26 26
comp 4339889..4339965 atgf 30 30
comp 4339996..4340071 gta 9 9
comp 4340081..4340152 gaa 17 17
comp 4340170..4340261 tcc 3 3
comp 4340265..4340340 aac 18
comp 4340359..4340475 5s 76
comp 4340552..4343482 23s 400
comp 4343883..4345441 16s 493
comp 4345935..4347563 CDS 46 596 543
comp 4394160..4395092 CDS 238 238 311
4395331..4395404 aga 214 214
4395619..4396383 CDS 49 894 255
4446278..4447621 CDS 207 207 448
comp 4447829..4447902 aga 174 174
4448077..4448370 CDS 256 556 98
4704927..4705187 CDS 361 87
comp 4705549..4705627 ttg 11 11
comp 4705639..4705713 tgc 11 11
comp 4705725..4705796 ggc 6 6
comp 4705803..4705877 caa 9 9
comp 4705887..4705959 cac 17 17
comp 4705977..4706050 tgg 7 7
comp 4706058..4706143 tac 4 4
comp 4706148..4706223 aca 22 22
comp 4706246..4706318 ttc 35 35
comp 4706354..4706430 gac 15 15
comp 4706446..4706522 atgf 25 25
comp 4706548..4706623 gta 58 58
comp 4706682..4706753 gaa 17 17
comp 4706771..4706862 tcc 3 3
comp 4706866..4706941 aac 326 326
comp 4707268..4707597 CDS 279 544 110
comp 4987142..4989934 CDS 726 931
comp 4990661..4990731 gga 9 9
comp 4990741..4990814 cca 22 22
comp 4990837..4990913 cgt 5 5
comp 4990919..4990993 ggc 10 10
comp 4991004..4991084 cta 11 11
comp 4991096..4991171 aaa 4 4
comp 4991176..4991250 caa 55 55
comp 4991306..4991381 gta 11 11
comp 4991393..4991464 gaa 11 11
comp 4991476..4991548 acc 3 3
comp 4991552..4991627 aac 18
comp 4991646..4991762 5s 76
comp 4991839..4994768 23s 129
comp 4994898..4994973 gca 20 20
comp 4994994..4995070 atc 38
comp 4995109..4995225 5s 93
comp 4995319..4996877 16s 367
comp 4997245..4997475 CDS 60 140 77
comp 5057616..5058803 CDS 163 163 396 163
comp 5058967..5059083 5s 76
comp 5059160..5062089 23s 185
comp 5062275..5062350 gca 89
comp 5062440..5063998 16s 380
comp 5064379..5066394 CDS 647 899 672
5714294..5714611 CDS 206 206 106
comp 5714818..5714908 tcg 77 77 77
comp 5714986..5715210 CDS 75

ppm opérons plasmide

  • Liens: gtRNAdb [11], NCBI [12]
  • Lien tableur: ppm
  • Légende: cdsa: cds aas, cdsj: cdsa sans jaune, cdsd: cdsa dirigé
B4 Paenibacillus polymyxa SC2 plasmide
B4 Paenibacillus polymyxa SC2 plasmide MAJ
comp 23.10.19 Tanger 49 aas doubles intercal
3920..4174 cds hp
4711..4803 agc +
4809..4883 tgc 3 aac
4947..5021 gaa 2 atc
5029..5105 ctt 2 cca
5112..5186 cca 2 cga
5288..5361 tgg 2 gaa
5366..5441 tat 3 tgg 7
5449..5522 caa
5529..5605 cac
5611..5686 gac
5812..5887 gga
5898..5973 aac @1
5978..6066 tac ctt
6076..6153 ata ata 82
**** tat
6236..6311 atgi
6317..6392 aac
6397..6470 tgg
6602..6678 gaa
6684..6757 ggc
6813..6885 ttc
6908..6980 cga 7
6988..7065 cca
7071..7155 ttg
7161..7235 atc 4
7240..7317 atgf
7323..7398 gca
7508..7584 cga
7588..7668 cta
7682..7758 atc
7767..7841 aac
7846..7919 tgg
7953..8324 cds hp
8301..8378 gac
8387..8473 tac
8560..8632 aaa
8647..8720 gga
8725..8800 ttc
8808..8882 acg @2
comp 8983..9600 cds hp acg
9690..9771 tta
9775..9849 aca
comp 9885..10169 cds hp
comp 10320..10622 cds hp
10739..10813 aca
comp 10832..11146 cds hp
comp 11363..11599 cds hp
11694..11765 aga 85
11851..12312 cds rev-trans
comp 12508..12756 cds trans-rg 442
**** ****
13199..14083 cds hp
14310..14385 tcg +
14394..14481 tcc 2 tcg
14489..14560 ctt @3 6
14567..14654 tcg tcg
14660..14751 tca ctt
14871..15080 cds hp
comp 227125..227388 cds hp
comp 227833..227903 gga
comp 228152..228391 cds hp
comp 229793..229999 cds hp
comp 230024..230108 tca 783
**** ****
comp 230872..231393 cds hp
comp 231558..231640 tta
232618..233067 cds hp
510118..1
B4 Paenibacillus polymyxa SC2 plasmide
37.6%GC 26.7.19 Paris  51   doubles intercal CDS aa avec aa cdsa cdsd
3920..4174 CDS 536 536 85
4711..4803 agc + 5 5
4809..4883 tgc 3 aac 63 63
4947..5021 gaa 2 atc 7 7
5029..5105 ctt 2 caa 6 6
5112..5186 cca 2 cca 101 101
5288..5361 tgg 2 cga 4 4
5366..5444 tac 2 gaa 4 4
5449..5522 caa 2 tac 6 6
5529..5605 cac 3 tgg 5 5
5611..5686 gac 125 125
5812..5887 gga 10 10
5898..5973 aac @1 4 4
5978..6066 tac ctt 9 9
6076..6153 ata ata 4 4
6158..6231 caa 4 4
6236..6311 atgi 5 5
6317..6392 aac 4 4
6397..6470 tgg 131 131
6602..6678 gaa 5 5
6684..6757 ggc 55 55
6813..6885 ttc 22 22
6908..6983 cga 4 4
6988..7065 cca 5 5
7071..7155 ttg 5 5
7161..7235 atc 5 5
7241..7317 atgf 5 5
7323..7398 gca 109 109
7508..7584 cga 3 3
7588..7668 cta 13 13
7682..7758 atc 8 8
7767..7841 aac 4 4
7846..7919 tgg 33 33 33
7953..8324 CDS @4 -24 -24 124
8301..8378 gac 8 8
8387..8473 tac 86 86
8560..8632 aaa 14 14
8647..8720 gga 4 4
8725..8800 ttc 7 7
8808..8882 acg @2 100 100
comp 8983..9600 CDS acg 89 89 206
9690..9771 tta 3 3
9775..9849 aca 35 35 35
comp 9885..10169 CDS 150 95
comp 10320..10622 CDS 116 116 101
10739..10813 aca 18 18 18
comp 10832..11146 CDS 216 105
comp 11363..11599 CDS 94 94 79 94
11694..11768 aga 103 103
11872..12312 CDS 195 147
comp 12508..12756 CDS 293 293 83
13050..13126 atc 72 72 72
13199..14083 CDS 226 226 295
14310..14385 tcg + 8 8
14394..14481 tcc 2 tcg 7 7
14489..14563 ctt @3 3 3
14567..14654 tcg tcg 5 5
14660..14751 tca ctt 119 119 119
14871..15080 CDS 212044 70
comp 227125..227388 CDS 444 444 88
comp 227833..227903 gga 248 248 248
comp 228152..228391 CDS 1401 80
comp 229793..229999 CDS 24 24 69 24
comp 230024..230108 tca 289 289
comp 230398..230640 CDS 231 81
comp 230872..231393 CDS 161 161 174 161
comp 231555..231640 tta 977 977
232618..233067 CDS 277050 150
510118..1

ppm cumuls

Chromosome

  • Légende: cdsa: cds aas, cdsj: cdsa sans jaune, cdsd: cdsa dirigé
cumuls. Paenibacillus polymyxa SC2, chromosome.
Opérons Fréquences intercalaires Fréquences aas cds
effectifs gammes sans rRNAs avec rRNAs gammes cds gammes cdsa cdsj gammes cdsd
avec rRNA opérons 13 1 1 0 1 0 100 8 5 40 0
16 23 5s 0 7 20 12 46 50 1 200 20 17 60 1
16 5 atc gca 2 40 3 15 100 4 300 10 6 80 2
16 23 5s a 3 60 1 2 150 8 400 13 9 100 2
max a 21 80 0 1 200 6 500 7 4 120 2
a doubles 0 100 1 0 250 15 600 2 0 140 3
16 gca 23 5s 1 120 0 1 300 5 700 1 0 160 3
total aas 73 140 0 0 350 3 800 1 1 180 2
sans opérons 19 160 0 0 400 5 900 0 0 200 1
1 aa 15 180 0 0 450 4 1000 1 0 220 3
max a 15 200 0 0 500 2 1100 0 0 240 2
a doubles 0 0 0 11 1 0 1
total aas 37 18 65 64 64 42 22
total aas 110 moyenne 20 17 193 292 229 150
remarques 1 variance 21 17 73 234 123 58
jaune sans sans

Plasmide

  • Légende: cdsa: cds aas, cdsj: cdsa sans jaune, cdsd: cdsa dirigé
cumuls. Paenibacillus polymyxa SC2, plasmide.
Opérons Fréquences intercalaires Fréquences aas cds
effectifs gammes sans rRNAs avec rRNAs gammes cds gammes cdsa cdsj gammes cdsd
avec rRNA opérons 0 1 0 1 1 60 0 40 4
16 23 5s 0 20 33 50 4 80 4 60 0
16 5 atc gca 40 1 100 4 100 5 80 1
16 23 5s a 60 1 150 3 120 2 100 1
max a 80 1 200 1 140 1 120 1
a doubles 100 1 250 2 160 2 140 0
16 gca 23 5s 120 2 300 2 180 1 160 0
total aas 140 2 350 0 200 0 180 1
sans opérons 10 160 0 400 0 220 1 200 0
1 aa 6 180 0 450 1 240 0 220 0
max a 32 200 0 500 0 260 0 240 0
a doubles 2 0 2 1 1
total aas 51 41 20 17 9
total aas 51 moyenne 6 126 102 89
remarques 3 variance 3 92 32 77
jaune sans sans sans

ppm blocs

B4. Paenibacillus polymyxa SC2, blocs à rRNA.
tRNAs 21 17 11
16s 207 207 400
23s 76 76 76
5s 34 82 18
tRNAs 13 _ _ 10
16s 93 _ 16s 108 16s 89
5s 38 5s 39 gca 185
atc 20 atc 20 23s 76
gca 129 gca 128 5s
23s 76 23s 130
5s 18
16s 280 207 207 208 221 400 343
23s 143 76 76 75 76 143 144
5s
5s constant 39 aas 117 pbs

ppm remarques

ppm chromosome

tRNAs	21	17	11				
16s	207	207	400				
23s	76	76	76				
5s	34	82	18				
							
tRNAs	13	-	-	10			
16s	93		16s	108		16s	89
5s	38		5s	39		gca	185
atc	20		atc	20		23s	76
gca	129		gca	128		5s	
23s	76		23s	130			
5s	18						
														
16s	280	207	207	208	221	400	343
23s	143	76	76	75	76	143	144
5s							
							
5s	constant	39 aas	117 pb				
											
*Remarques :Il n’y a pas de doublons dans les 13 blocs à rRNA, ni dans les blocs sans rRNA.						
	- La majorité des tRNAs se trouvent dans les clusters à rRNA 73 contre 37.						
	- Les blocs 16s23s5s sont majoritaires , 10 sur 13, dont 7 ne portent pas de tRNAs.						
	- Les intercalaires 16s-23s sont quasiment identiques pour 7 blocs/10 les 3 autres sont doubles.						
	- Les intercalaires 23s-5s sont aussi quasiment identiques pour 10/12 les autres sont doubles.						
	- Les 2 intercalaires 16s-5s sont moitié de ceux de23s-5s.						
	- Voir la liste ci-dessus pour les intercalaires et le nombre de tRNAs.						
							
@1	- Le bloc 16s5s-atcgca-23s-10aas a son 5s anormalement positionné, pas après 23s						
	mais après 16s. Certains génomes (ref.) n’ont que que ce type.						
	-Le bloc 16s5s-atcgca-23s5s-13aas porte les 2 types de position alors que en général						
	un bloc à 2 5s est du type 16s23s5s5s, avec les 2 5s du même côté du 23s.						
							
Séquences des doubles :  Il n’y a pas de doublons dans les 13 blocs à rRNA, ni dans les blocs sans rRNA. 	

ppm plasmide

Plasmide		
24.10.19 Tanger		
*Remarques : 		
	- Il n'y a pas de cluster avec des gènes rRNAs, mais il existe au moins un plasmide  avec ce type	
	de cluster (ref.) chez les bactéries.	

	- 46 gènes de tRNA sur 49 sont regroupés en 11 152 pb pour une longueur de plasmide de 510 118.	
	Soit 2 % seulement de la taille du plasmide.	

	- Ces 46 gènes sont répartis en 4 clusters dont le principal avec 39 gènes contient 2 cds entourés	
	chacun par 2 tRNAs. Les 3 autres ne contiennent pas de cds à l’intérieur . Les 3 1ers clusters sont contigus	
	et entre le 3ème et le 4ème existe un seul cds particulier  de 83 aas, trans-rg, transcription regulator.	
	Il est précédé d’une transcriptase reverse, rev-trans, de154 aas.	

	- Particularité du cluster principal: régularité qui n'existe pas chez les clusters du chromosome.	
		+ dans le chromosome les intercalaires des clusters avec ou sans rRNA,
		moyenne et variance sont égales et du même ordre que la moyenne du cluster principal,
		à peu près 20, alors que sa variance est quasiment double, 36 pb. 
		+ 33 des intercalaires faibles du plasmide ont 6 et 3 pour respectivement moyenne et variance
		+ Les intercalaires élevés sont répartis régulièrement et sont du même ordre que ceux
		entre tRNA-cds. Voir la liste ci-dessous où les intercalaires avec cds sont signalés en gras.

	- Les intercalaires entre les cds d'encadrement des 4 clusters sont aussi du même ordre que ceux à l'intérieur du cluster principal.	
	Cette similitude et la contiguité entre les cds militent pour le regroupent de ces 4 clusters.	

	- Les 3 derniers tRNAs du plasmide, aux adresses élevées, ne semblent pas former un groupe de clusters :	
	Chaque tRNA est, à peu près, aussi proche d’un cds d’encadrement que dans le cluster principal (248 24 161),	
	mais il est très éloigné de l’autre cds d’encadrement (444 783 977). De même la distance entre les cds est très élevées, 1401.	

	- Si l'on considère le groupe des 4 clusters à 46 gènes de tRNA comme encadré par 2 cds, les intercalaires proches et éloignés 	
	équivalents respectivement à ceux des 3 tRNA à adresses élevées, sont du même ordre, 109 et 536. Et dans ce groupe	
	la distance entre 2 cds contigus reste largement inférieure aux 1401 des gènes à adresses élevées, 442 qui est une exception	
	par la fonction régulatrice d’un des 2 cds de l’intercalaire, « cds  trans-rg », alors que les autres intercalaires 	
	sont inférieurs à 216.	

	- Dans la série de 31 gènes il y a très peu de doublons comme le chromosome: Ils sont signalés par le signe +. 	
	Mais ils ne présentent pas de séries de gènes identiques ou de répétitions de séquences comme dans d’autres génomes, 	
	(ref.) à part la séquence cca-tgg répétée 2 fois. Sinon les doublons sont séparés par de nombreux autres gènes.	
	Si l’on compare par rapport aux séries longues des clusters avec rRNA du chromosome, 21 aas,  ou sans rRNA, 15 aas, 	
	les 31 aas de la série du plasmide, de part sa longueur et le nombre limité de type de gènes (ceux se terminant par a et c) 	
	candidats à la création dans le cluster, il est normal qu’il y ait des doublons. D’autant plus que la série fait appel 	
	à des gènes rares, ctt ata tat.	
	Donc le plasmide ne déroge pas à l’absence  des doublons du génome en entier.	
		
	- @1,2 aas rares, acg et ctt, ou très rares, tat et ata.	
		
	- @3 regroupement de 5 gènes de tRNA longs dont 4 Ser,  3 rares et un doublets de rares. Alors qu’aucun gène de ser n’est 	
	présent dans la série de 31 gènes.	
		
	- @4 l’intercalaire négatif élevé entre le cds (124aas) et le gène de gac  illustre bien l’intégration des cds du groupe des 4 clusters
	au processus de création de gènes.	
	
entre aas et cds du	
cluster principal	
1-2 	cds	536
2-3 	tgc	63
5-6 	cca	101
10-11 	gac	125
18-19 	tgg	131
20-21 	ggc	55
21-22 	ttc	22
27-28 	gca	109
31-32 	tgg	33
33-34 	cds	-24
35-36 	tac	86
39-40 	acg	100
40-41 	cds	89
42-43 	aca	35
	
entre cds de clusters	
cl1-cl2		150
cl2-cl3		216
cl3-trans rg	195
trans rg-cl4	442

ppm distribution

Bc4 ppm, Paenibacillus polymyxa SC2. bacilli.
bc41 ppm, distribution des blocs sans rRNA. Chromosome
g1    t1       
atgi 1 tct tat atgf 1
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc 1 tcc 1 tac 1 tgc 1
atc 2 acc aac 2 agc 1
ctc 2 ccc 1 cac 1 cgt
gtc 1 gcc 1 gac 1 ggc 1
tta 1 tca 1 taa tga
ata aca 1 aaa 1 aga 2
cta cca caa 1 cga
gta 1 gca 3 gaa 2 gga 1
ttg 1 tcg 1 tag tgg 1
atgj 1 acg 1 aag 1 agg
ctg 2 ccg cag cgg 1
gtg gcg gag ggg
baci >1aa =1aa -5s +5s -16s +16s total
ppm 22 15 5 42
bc42 ppm. Distribution des blocs avec rRNA. Chromosome
g1    t1       
atgi tct tat atgf 3
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc 2 tcc 2 tac 3 tgc 1
atc 1 acc 1 aac 4 agc 2
ctc ccc cac 1 cgt 4
gtc gcc gac 4 ggc 4
tta tca taa tga
ata aca 3 aaa 5 aga
cta 2 cca 4 caa 3 cga
gta 5 gca 2 gaa 4 gga 3
ttg 2 tcg tag tgg
atgj 2 acg aag agg
ctg 1 ccg cag cgg
gtg gcg gag ggg
baci >1aa =1aa -5s +5s -16s +16s total
ppm 68 68
bc43 ppm. Distribution des blocs sans rRNA. Plasmide
g1    t1       
atgi 1 tct tat atgf 1
att act aat agt
ctt 2 cct cat cgc
gtt gct gat ggt
ttc 2 tcc 1 tac 3 tgc 1
atc 3 acc aac 3 agc 1
ctc ccc cac 1 cgt
gtc gcc gac 2 ggc 1
tta 2 tca 2 taa tga
ata 1 aca 2 aaa 1 aga 1
cta 1 cca 2 caa 2 cga 2
gta gca 1 gaa 2 gga 3
ttg 1 tcg 2 tag tgg 3
atgj acg 1 aag agg
ctg ccg cag cgg
gtg gcg gag ggg
baci >1aa =1aa -5s +5s -16s +16s total
ppm 45 6 51

Paenibacillus mucilaginosus 3016

pmq opérons

  • Liens: gtRNAdb [13], NCBI [14], génome [15]
  • Lien tableur: pmq opérons
  • Légende: cdsa: cds aas, cdsj: cdsa sans jaune, cdsd: cdsa dirigé
B5 Paenibacillus mucilaginosus 3016
58.3%GC 24.7.19 Paris  110   doubles intercal cds aa avec aa cdsa cdsd
9206..10276 CDS 322 322 357
10599..12139 16s 269
12409..15343 23s 95
15439..15555 5s 178 178 178
15734..17190 CDS 3061 486
20252..21532 CDS 47 47 427 47
21580..21666 tca 140 140
21807..22157 CDS hp @1 17 117
22175..22357 CDS hp 23 *61
22381..22524 CDS hp 86 *48
comp 22611..22796 CDS hp 138 *62
comp 22935..25265 replicase 156 *777
25422..26165 CDS 220 220 248
comp 26386..26460 cgg 183 183 183
26644..27168 CDS 151287 175
178456..179454 CDS 298 298 333
179753..181299 16s 254
181554..184488 23s 168
184657..184773 5s 15
184789..184876 agc 29 29
184906..184982 atgj 39 39
185022..185097 gta 15 15
185113..185189 atgf 14 14
185204..185280 gac 48 48
185329..185404 ttc 5 5
185410..185485 aca 9 9
185495..185579 tac 15 15
185595..185670 aaa 183 183 183
comp 185854..187104 CDS 30460 417
comp 217565..218146 CDS 129 129 194 129
comp 218276..218350 cgg 261 261
218612..219643 CDS 34238 344
253882..254526 CDS 677 *677 215
255204..256745 16s 268
257014..259948 23s 95
260044..260160 5s 55
260216..260292 atc 19 19
260312..260387 gca + 16 16
260404..260475 gaa 2 gca 9 9
260485..260569 tac 20 20
260590..260665 aac 3 3
260669..260744 gta 19 19
260764..260840 gac 20 20
260861..260933 ttc 15 15
260949..261021 aaa 10 10
261032..261118 ctg 3 3
261122..261196 ggc 12 12
261209..261280 tgc 15 15
261296..261369 cgt 5 5
261375..261448 cca 158 *158
261607..261682 gca 4 4
261687..261759 acc 5 5
261765..261854 tcg 19 19
261874..261961 agc 17 17
261979..262054 gtc 5 5
262060..262134 acg 39 39
262174..262262 tcc 41 41
262304..262386 ctc 283 283 *283
262670..263515 CDS 314679 282
578195..579055 CDS 324 324 287
579380..580921 16s 258
581180..584114 23s 166
584281..584397 5s 31
584429..584505 aac 6 6
584512..584600 tcc 38 38
584639..584710 gaa 11 11
584722..584797 gta 17 17
584815..584891 atgf 15 15
584907..584983 gac 67 67
585051..585125 acg 11 11
585137..585212 cac 10 10
585223..585297 caa 5 5
585303..585378 aaa 17 17
585396..585470 ggc + 40 40
585511..585585 ggc 2 ggc 24 24
585610..585692 ttg 5 5
585698..585774 cca 19 19
585794..585867 gga 1 1
585869..585942 aga 187 187 187
586130..586885 CDS 85587 252
672473..672949 CDS 18 18 159 18
672968..673043 aac 7 7
673051..673138 agc @2 297 297
673436..673507 gaa 9 9
673517..673599 ctc 180 180
673780..674199 CDS 182 140
674382..675278 CDS 159 159 299
675438..675520 ctc 64 64 64
675585..675833 CDS 18450 83
694284..695636 CDS 797 *797 451
696434..697974 16s 261
698236..701170 23s 94
701265..701381 5s 43
701425..701498 atc 11 11
701510..701584 gaa 5 5
701590..701665 gtc 5 5
701671..701747 atgf 4 4
701752..701825 tgg 9 9
701835..701909 caa 8 8
701918..701990 aaa 18 18
702009..702095 ctg 4 4
702100..702174 ggc 11 11
702186..702259 cgt 12 12
702272..702348 cca 577 *577 *577
702926..703120 CDS 370320 65
1073441..1074214 CDS 373 373 258
1074588..1076136 16s 260
1076397..1079331 23s 168
1079500..1079616 5s 9
1079626..1079701 aac 6 6
1079708..1079796 tcc 38 38
1079835..1079906 gaa 11 11
1079918..1079993 gta 17 17
1080011..1080087 atgf 13 13
1080101..1080177 gac 49 49
1080227..1080302 ttc 4 4
1080307..1080382 aca 13 13
1080396..1080481 tac 8 8
1080490..1080560 tgg 13 13
1080574..1080649 cac 26 26
1080676..1080747 caa 9 9
1080757..1080831 ggc 12 12
1080844..1080917 tgc 10 10
1080928..1081016 tta 20 20
1081037..1081113 cgt 3 3
1081117..1081199 ttg 147 147 147
1081347..1081973 CDS 128630 209
1210604..1213519 CDS 354 354 972
1213874..1213949 gca 16 16
1213966..1214037 gaa 12 12
1214050..1214125 gta 16 16
1214142..1214218 gac 17 17
1214236..1214311 cac 9 9
1214321..1214395 caa 9 9
1214405..1214477 aaa 8 8
1214486..1214572 ctg 3 3
1214576..1214647 ggc 169 169 169
comp 1214817..1215602 CDS 378784 262
1594387..1594665 CDS 537 *537 93
1595203..1596743 16s 252
1596996..1599930 23s 94
1600025..1600141 5s 43
1600185..1600261 atc 19 19
1600281..1600356 gca 17 17
1600374..1600445 gaa 8 8
1600454..1600529 gta + 5 5
1600535..1600610 aca 2 gta 10 10
1600621..1600705 tac 18 18
1600724..1600799 aac 4 4
1600804..1600879 gta 21 21
1600901..1600977 atgf 12 12
1600990..1601066 gac 34 34
1601101..1601176 cac 13 13
1601190..1601264 caa 8 8
1601273..1601345 aaa 17 17
1601363..1601448 ctc 13 13
1601462..1601548 ctg 5 5
1601554..1601628 ggc 14 14
1601643..1601713 tgc 10 10
1601724..1601797 cgt 5 5
1601803..1601876 cca 105 105 105
1601982..1602245 CDS 232535 88
1834781..1835260 CDS 106 106 160 106
1835367..1835439 gcc 137 137
comp 1835577..1835978 CDS 371114 134
comp 2207093..2208091 CDS 192 192 333 192
2208284..2208367 ctg + 49 49
2208417..2208500 ctg 2 ctg 315 315
2208816..2209952 CDS 1246561 379
3456514..3456786 CDS 256 256 91
3457043..3457119 ccc 142 142 142
3457262..3457483 CDS 1547757 74
comp 5005241..5005426 CDS 127 127 62 127
comp 5005554..5005636 ctc 40 40
comp 5005677..5005765 tcc 13 13
comp 5005779..5005852 atg 19 19
comp 5005872..5005958 tcg 167 167
5006126..5006220 ncRNA 1377035 32
comp 6383256..6384173 CDS 228 228 306
6384402..6384477 gtc 69 69 69
comp 6384547..6385458 CDS 5453 304
comp 6390912..6391130 CDS 142 142 73 142
comp 6391273..6391358 tta 7 7
comp 6391366..6391442 atgi 19 19
comp 6391462..6391538 atgf 370 370
comp 6391909..6392460 CDS 962046 184
7354507..7354737 CDS 342 342 77 *342
comp 7355080..7355162 ctc 28 28
comp 7355191..7355279 tcc 12 12
comp 7355292..7355368 atgf 14 14
comp 7355383..7355459 atgj 14 14
comp 7355474..7355561 agc 8 8
comp 7355570..7355659 tcg 4 4
comp 7355664..7355736 acc 4 4
comp 7355741..7355816 gca 119
7355936..7356030 ncRNA @3 36
comp 7356067..7356140 cca 6 6
comp 7356147..7356220 cgt 104 *104
comp 7356325..7356396 ggc 7 7
comp 7356404..7356490 ctg 9 9
comp 7356500..7356572 aaa 9 9
comp 7356582..7356656 caa 9 9
comp 7356666..7356741 cac 17 17
comp 7356759..7356835 gac 12 12
comp 7356848..7356923 gta 4 4
comp 7356928..7357003 aac 15 15
comp 7357019..7357103 tac 8 8
comp 7357112..7357187 aca 5 5
comp 7357193..7357264 gaa 15 15
comp 7357280..7357355 gcc 9 9
comp 7357365..7357438 atc 54
comp 7357493..7357609 5s 112
comp 7357722..7360655 23s 258
comp 7360914..7362454 16s 403 *403
7362858..7363397 CDS 254752 180
7618150..7618842 CDS 280 280 231 *280
comp 7619123..7619193 ggg 335 335
7619529..7620461 CDS 46171 311
comp 7666633..7668069 CDS 104 104 479 104
comp 7668174..7668244 ggg 5 5
comp 7668250..7668326 cca 106 *106
comp 7668433..7668506 cgt 11 11
comp 7668518..7668592 ggc 5 5
comp 7668598..7668684 ctg 13 13
comp 7668698..7668783 ctc 16 16
comp 7668800..7668872 aaa 10 10
comp 7668883..7668967 tac 28 28
comp 7668996..7669071 ttc 12
comp 7669084..7669200 5s 159
comp 7669360..7672297 23s 256
comp 7672554..7674095 16s 537 *537
7674633..7675382 CDS 177794 250
comp 7853177..7853761 CDS 57 57 195 57
comp 7853819..7853892 cac 230 230
comp 7854123..7854196 cac 404 *404
comp 7854601..7854801 CDS 245639 67
comp 8100441..8100854 CDS 123 123 138 123
comp 8100978..8101094 5s 167
comp 8101262..8104180 23s 248
comp 8104429..8105969 16s 325 325
comp 8106295..8106636 CDS 45281 114
comp 8151918..8152448 CDS 460 *460 177 *460
comp 8152909..8153031 5s 94
comp 8153126..8156060 23s 258
comp 8156319..8157859 16s 456 *456
8158316..8158642 CDS 98285 109
8256928..8257746 CDS 83 83 273 83
comp 8257830..8257903 gga 5 5
comp 8257909..8257985 cca 16 16
comp 8258002..8258078 cgt 4 4
comp 8258083..8258157 ggc 8 8
comp 8258166..8258248 cta 42 42
comp 8258291..8258366 aaa 8 8
comp 8258375..8258449 caa 9 9
comp 8258459..8258532 tgg 4 4
comp 8258537..8258613 atgf 5 5
comp 8258619..8258694 gtc 5 5
comp 8258700..8258774 gaa 11 11
comp 8258786..8258859 atc 43
comp 8258903..8259019 5s 94
comp 8259114..8262048 23s 255
comp 8262304..8263845 16s 306 306
comp 8264152..8264370 CDS 58373 73
comp 8322744..8323205 CDS 393 393 154 *393
comp 8323599..8323715 5s 94
comp 8323810..8326748 23s 258
comp 8327007..8328547 16s 369 369
comp 8328917..8330413 CDS 21505 499
comp 8351919..8354414 CDS 396 396 832
comp 8354811..8354884 atg 149 149 149
comp 8355034..8355537 CDS 34450 168
8389988..8390512 CDS 296 296 175 *296
comp 8390809..8390925 5s 94
comp 8391020..8393954 23s 259
comp 8394214..8395754 16s 234 234
comp 8395989..8396255 CDS 220222 89
comp 8616478..8616924 CDS 417 *417 149
8617342..8617418 gac 157 157 157
8617576..8618541 CDS 105821 322
8724363..8724614 CDS 455 *455 84
comp 8725070..8725160 tcg 165 165 165
comp 8725326..8725559 CDS 9205 78
opéron doubles intercalaires cds aa avec aa cdsa cdsd

pmq cumuls

cumuls. Paenibacillus mucilaginosus 3016
opérons Fréquences intercalaires tRNAs Fréquences intercalaires cds Fréquences aas cds
effectif gammes sans rRNAs avec rRNAs gammes cds gammes cds dirigé gammes cdsa cdsd
avec rRNA opérons 14 1 0 1 1 0 1 0 100 15 8
16 23 5s 0 5 20 14 107 50 3 20 1 200 18 10
16 atc gca 0 40 1 12 100 4 40 0 300 12 6
16 23 5s a 9 60 1 4 150 11 60 2 400 9 3
max a 23 80 0 1 200 11 80 2 500 6 4
a doubles 3 100 0 0 250 3 100 1 600 0 0
spéciaux 0 120 0 2 300 6 120 3 700 0 0
total aas 138 140 0 0 350 7 140 3 800 0 0
sans opérons 17 160 0 1 400 6 160 5 900 1 0
1 aa 11 180 0 0 450 3 180 3 1000 1 0
max a 9 200 0 0 500 3 200 4 1100 0 0
a doubles 1 2 0 5 7 0 0
total aas 35 18 128 62 31 62 31
total aas 173
remarques 3
avec jaune moyenne 16 235 213
variance 20 184 122
sans jaune moyenne 16 14 207 126
variance 12 11 106 49

pmq blocs

B5 Paenibacillus mucilaginosus 3016, RNAs blocs
CDS 298 324 373 12
16s 254 258 260 159
23s 168 166 168 256
5s 15 31 9 537
1er aa agc aac aac ttc
aas 9 16 17 9
CDS 183 187 147 104
CDS 677 797 537 54 43
16s 268 261 252 112 94
23s 95 94 94 258 255
5s 55 43 43 403 306
atc / aas 22 11 19 23 12
CDS 283 577 105 342 83
CDS 322 123 460 393 296
16s 269 167 94 94 94
23s 95 248 258 258 259
5s 178 325 456 369 234

pmq remarques

*Remarques : 										
 Que des blocs 16-23-5s, 14. Très peu d’opérons sans rRNA, 35 aas pour 17 opérons. Très peu de doubles, 4 doublets.
#@1	Suite aux gènes de protéines cotranscrits avec les gènes de tRNA, voir eco, j’ai entouré les  opérons tRNA, dans les 7 génomes suivants, 
	Par 2 CDS, un avant et un après. Dans cette remarque j’ai voulu montré les intercalalires et les tailles des CDS qui suivent l’opéron. 
	Ce sont pour la plupart de petites protéines hypothétiques, largement plus petites que FT-U mais plus grandes que tpr (voir eco). 
										
#@2	L’intercalaire maximum qui laisserait penser qu’on a affaire à 2 opérons différents. Une recherche simple des promoteurs me paraît 
	difficile dans les bases de données , sauf dans BioCyc qui est payant, aussi je me base sur le regroupement des gènes pour  
	décider que je suis en présence d’un opéron ou non. Mais arrivé à  ce stade de ma réflexion, comme je l’expiciterai plus tard, je ne  
	m’interesse plus à l’existence de l’opéron mais seulement au regroupement CDS-séquence à t-rRNAs-CDS qu’il soit sur 1 ou 2 brins. 
	Ce sont seulement les statistiques des intercalaires et, surtout, le sens 16s-23s qui paraît prévilégier les intercalaires courts, 
	qui m’ontpoussé à changer cette limite vers 400 pb au lieu de 210, limite basée sur l’intercalaire max de 264 entre les 2 derniers 
        tRNAs du 21aas de bsu qui est bien un opéron dans BioCyc.
										
#@3	Voici une séquence qui n’est pas un CDS et pas sur le même brin que le reste du groupe, mais qui répond aux niveaux critères 
	de la remarque @2 précédente. L’intercalaire entre les 2 tRNAs du même brin qui enjambent cette séquence est de 250 pb. 
										
#Séquence des doubles : Très peu de doubles. 3 doublets se trouvent avec les rRNAs dont 1 est successif, un 4ème doublet successif se trouve dans 
	un opéron sans rRNAs. Les doublets dans ce génome sont rares mais se répartissent proportionnellement sur les 2 types d’opérons.

#Les intercalaires dans les blocs : rappel des opérons à bloc chez eco	voir	sigma FIS	362	162	Terminateur
	#: - CDS-16s		234, 298-537, 677 797		voir ici	sigma FIS	442	322	rien
	#: - 16s-23s		258				néant		sigma FIS	473	228	Terminateur
	#: - 23s-5s		168*4, 112, 94*9		93*7		sigma FIS	480	95	Terminateur
	#: - 5s-tRNA		9-15*3	31-54*6			8-12*2, 52	Sigma Lrp-leu	377	228	rien
	#: - L’orientation CDS-16s, CDS de fin de bloc.		83-105*3	Sigma Lrp-leu	373	300	Terminateur
								123-187*5	sigma FIS	614	74	Terminateur
								283-577*6					
										
#Les intercalaires entre tRNAs										
	#: - Dans les opérons sans rRNAs	inf à 20 14/18		16±12				
	#: - Dans les opérons à rRNAs		inf à 20 107/128	16±20				
										
#Les intercalaires avec les CDS des bordures										
	#: - tous les CDS									
	#: - Les CDS orientés									
										
#Taille des CDS de bordure en aas										
	#: - tous les CDS									
	#: - Les CDS orientés									
										
Notes : l’opéron de BioCyc et la direction 16s-23s dans les statistiques des intercalaires des CDS. Promoteur et terminateur. 

Les cds					
Bacteria; Firmicutes; Bacilli; Bacillales; Paenibacillaceae;Paenibacillus.					
bloc				protein		interc	aas
268	262304..262386		ctc		283	-
95	262670..263515		PRD domain	267	282
55	263783..265834		GlcT		179	684
atc	266014..266286		Hpr		-8	91
22	266279..268003		PeP			575
					
258	585869..585942		aga		187	-
166	586130..586885		biotine Stase	40	252
31	586926..587918		BioB		8	331
aac	587927..589093		nanoate		176	389
16	589270..589914		hydrolase		215
					
	20252..21532		Ser ligase	47	427
	21580..21666		tca		140	
	21807..22157		CDS hp		17	117
	22175..22357		CDS hp		23	61
	22381..22524		CDS hp		86	48
	22611..22796		CDS hp		138	62
	22935..25265		Replicase	156	777
	25422..26165		Peptidase	220	248
comp	26386..26460		cgg		183	
	26644..27168		sigma factor	151287	175

Les blocs à rRNAs					
CDS	298	324	373	12	
16s	254	258	260	159	
23s	168	166	168	256	
5s	15	31	9	537	
1er aa	agc	aac	aac	ttc	
aas	9	16	17	9	
CDS	183	187	147	104	
					
CDS	677	797	537	54	43
16s	268	261	252	112	94
23s	95	94	94	258	255
5s	55	43	43	403	306
atc/aas	22	11	19	23	12
CDS	283	577	105	342	83
					
CDS	322	123	460	393	296
16s	269	167	94	94	94
23s	95	248	258	258	259
5s	178	325	456	369	234

pmq distribution

Bc5 pmq, Paenibacillus mucilaginosus 3016. bacilli.
bc51 pmq, distribution des blocs sans rRNA
g1    t1       
atgi 1 tct tat atgf 1
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc tcc 1 tac tgc
atc acc aac 1 agc 1
ctc 3 ccc 1 cac 3 cgt
gtc 1 gcc 1 gac 2 ggc 1
tta 1 tca 1 taa tga
ata aca aaa 1 aga
cta cca caa 1 cga
gta 1 gca 1 gaa 2 gga
ttg tcg 2 tag tgg
atgj 2 acg aag agg
ctg 3 ccg cag cgg 2
gtg gcg gag ggg 1
baci >1aa =1aa -5s +5s -16s +16s total
pmq 24 11 35
bc52 pmq. Distribution des blocs avec rRNA.
g1    t1       
atgi tct tat atgf 7
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc 4 tcc 4 tac 6 tgc 3
atc 5 acc 2 aac 4 agc 3
ctc 4 ccc cac 4 cgt 7
gtc 3 gcc 1 gac 6 ggc 9
tta 1 tca taa tga
ata aca 4 aaa 8 aga 1
cta 1 cca 7 caa 4 cga
gta 7 gca 4 gaa 4 gga 2
ttg 2 tcg 2 tag tgg 3
atgj 2 acg 2 aag agg
ctg 5 ccg cag cgg
gtg gcg gag ggg 1
baci >1aa =1aa -5s +5s -16s +16s total
pmq 138 138

pmq intercalaires entre cds

  • Lien NCBI [16]
  • Note: Pour les génomes des annexes j'ai relevé les intercalaires entre tRNAs et entre ceux-ci et les cds qui leur sont adjacents. L'exemple est celui de rru du clade alpha. L'idée de départ de ces prélèvements est la recherche d'opérons formés de tRNA et de protéine comme dans le cas d'E.coli: l'intercalaire entre le tRNA et la protéine devrait être faible. Voir l'exemple d'eco (remarque @3) avec tac-tac-tpr et aca-tac-gga-acc-tufB.

Fréquences: gammes, moyennes et variances

intercalaires	total	%	intercalaires	moyenne	ecartype	plage
négatif		487	11	négatif 	-12	17		-1 à -119
zéro		22	0.5				
1 à 200		2560	57	0 à 200		87	59	
201 à 370	920	21	201 à 370	266	47	
371 à 600	315	7.1	371 à 600	463	66	
601 à max	157	3.5	601 à 1613	868	250	
Total 4461			Total 4454	166	192		-119 à 1613

pmq les fréquences

  • Lien tableur: pmq intercalaires entre cds
  • Légende:   long, longueur en pbs.
    - 16s, 23s5s, blocs à rRNAs seuls.Voir lmo opérons pour leurs intercalaires
    - agc, aaa-atc, blocs à tRNAs seuls. Voir pmq opérons pour leurs intercalaires
pmq Les fréquences des intercalaires entre cds
adresse intercal inter-gène long intercal fréquence cumul/% intercal fréquence
253921 8143 16s 22aas 7187 -70 11 0 22
1594387 7316 16s 19aas 6678 -60 2 -1 41
694284 7289 16s 11aas 5918 -50 3 -2 3
1073441 7132 16s 17aas 6605 -40 9 -3 1
578195 7074 16s 16aas 6567 -30 18 min à -1 -4 241
178456 6399 16s 9aas 5917 -20 43 487 -5 0
9206 5457 néant -10 61 11% -6 4
4375163 1613 néant 0 362 -7 2
3234976 1576 néant 10 185 -8 47
1433663 1551 néant 20 221 -9 1
1961332 1546 néant 30 193 -10 6
1948392 1534 néant 40 172 -11 22
4064508 1497 néant 50 126 -12 0
1735863 1485 néant 60 107 -13 3
4067449 1378 néant 70 107 -14 17
2875626 1352 néant 80 148 -15 0
896926 1351 néant 90 130 -16 3
1210625 1297 100 122 -17 10
2069562 1279 110 115 -18 0
1529184 1277 120 110 -19 0
1897252 1277 130 128 -20 8
2910237 1276 140 100 -21 0
3749065 1276 150 111 -22 3
4906359 1270 160 89 -23 10
1921516 1263 170 103 1 à 200 -24 0
880003 1252 180 99 2560 -25 3
5004536 1193 190 95 57% -26 13
359256 1184 200 99 -27 0
1773925 1157 210 97 -28 0
3687367 1141 220 89 -29 6
1886363 1109 230 83 -30 0
5259590 1088 240 86 -31 1
3089348 1087 250 71 -32 6
3287601 1084 260 56 52
933373 1077 270 65 reste 14
1233491 1054 280 54 487
1379835 1052 290 36
1438197 1052 300 37 600 4304
2970387 1045 310 44 650 31
247705 1038 320 42 700 18
1687282 1027 330 41 750 11
2362680 1013 340 32 201 à 370 800 17
350 33 920 850 9
4544722 -119 shift 2gènes 16105 360 30 21% 900 12
5318942 -119 shift 2gènes 18655 370 24 950 11
1976860 -116 shift 2gènes 1615 380 30 1000 6
5337597 -115 shift 2gènes 1973 390 22 1050 4
3673911 -113 shift 2gènes 419 400 20 1100 7
5433750 -101 shift 2gènes 5002 410 16 1150 2
2131496 -95 shift 2gènes 1189 420 15 1200 3
4669248 -95 430 18 1250 0
2553569 -89 440 20 1300 9
2198194 -75 450 12 1350 0
1029214 -74 460 12 1400 3
1297148 -65 470 13 1450 0
3921139 -65 480 15 1500 2
4451392 -56 490 11 1550 2
4115825 -53 500 17 1600 2
4456706 -51 510 8 1650 1
2961518 -49 520 12 150
5210453 -49 530 9
1644157 -47 540 14 371 à 600
2542276 -46 550 12 315
1663382 -44 560 9 7.1%
3095318 -44 570 11
4122676 -41 580 4 601 à max
4613340 -41 590 9 157
4039349 -40 600 6 3.5%

Lactobacillus delbrueckii subsp. bulgaricus ATCC BAA-365

lbu opérons

  • Liens: gtRNAdb [17], NCBI [18]
  • Lien tableur: lbu opérons
  • Légende: cdsa: cds aas, cdsj: cdsa sans jaune, cdsd: cdsa dirigé
B6 Lactobacillus delbrueckii subsp. bulgaricus ATCC BAA-365
49.8%GC 29.7.19 Paris  110   doubles intercal cds aa avec aa cdsa cdsd
comp 18533..19237 CDS 128 128 235 128
19366..19438 act @1 195 195
19634..20371 CDS 6912 246
27284..29785 CDS 276 276 *834
30062..30134 act 134 134 134
30269..30907 CDS 11768 213
42676..43248 cds hp 451 *451 *191
43700..45271 16s 209
45481..48391 23s 69
48461..48577 5s 275 275 275
48853..49091 cds hp 56679 80
comp 105771..106547 CDS 56 56 259 56
comp 106604..106679 aag 125 125
106805..107533 CDS 103754 243
211288..212553 CDS 94 94 422
212648..212720 acc 23 23 23
comp< 212744..213262 CDS 64997 173
278260..278928 CDS 69 69 223 69
comp 278998..279068 ggg 181 181
279250..280275 CDS 44047 342
comp 324323..324949 CDS 117 117 209 117
325067..325138 ggc + 4 4
325143..325216 ccg 2 ggc 108
325325..325399 ggc 155 155
325555..326016 CDS 37886 154
363903..364394 CDS 98 98 164 98
364493..364564 caa 614 *614
365179..366360 CDS -14 *394
366347..367402 CDS 75 75 352
367478..367559 tac 5 5
367565..367636 caa 62 62 62
< 367699..368318 CDS 14127 207
382446..382907 CDS 30 30 154 30
382938..383026 ctt 118 118
383145..383768 CDS 70441 208
454210..455529 CDS 61 61 440 61
455591..455665 agg 341 341
456007..457035 CDS 75557 343
532593..533285 CDS 82 82 231 82
comp 533368..533442 cgg 296 296
533739..534782 CDS 48963 348
583746..584728 CDS 57 57 328 57
comp 584786..584858 cag 5 5
comp 584864..584935 gag 170 170
585106..586110 CDS 94988 335
681099..682741 CDS 518 *518 *548
683260..684831 16s 106
684938..685011 atc 69 69
685081..685153 gca 127
685281..688191 23s 68
688260..688376 5s 208 208 208
comp 688585..689801 CDS 55794 406
comp 745596..745821 CDS 134 134 75 134
comp 745956..746044 tcg 787 *787
746832..749597 CDS 36741 *922
786339..787004 CDS 54 54 222 54
787059..787142 ctg 109 109
comp 787252..787872 CDS 2072 207
comp 789945..791867 CDS 613 *613 *641
792481..794052 16s 105
794158..794231 atc 69 69
794301..794373 gca 126
794500..797410 23s 69
797480..797596 5s 87 87 87
797684..798559 CDS 36 292
comp 798596..800178 CDS 530 *530 *528
800709..800781 aac @2 3 3
800785..800858 cca 24 24
800883..800954 ggc 30 30
800985..801058 cgt 2 2
801061..801133 gta 3 3
801137..801208 gaa 42 42
801251..801338 tca 9 9
801348..801421 atgf 3 3
801425..801498 gac 6 6
801505..801577 ttc 8 8
801586..801667 tac 4 4
801672..801742 tgg 13 13
801756..801831 cac 26 26
801858..801928 tgc 28 28
801957..802041 ttg 356 356 356
802398..802961 CDS 284259 188
comp 1087221..1088531 CDS 157 157 437 157
comp 1088689..1088760 caa 656 *656
comp 1089417..1090313 CDS 173317 *299
comp 1263631..1265769 CDS 188 188 *713 188
comp 1265958..1266031 aga 222 222
1266254..1268632 CDS 84103 *793
comp 1352736..1354022 CDS 98 98 429 98
1354121..1354204 ctg 204 204
comp 1354409..1354928 CDS 13182 173
comp 1368111..1369307 CDS 161 161 399 161
comp 1369469..1369541 gta 3 3
comp 1369545..1369616 gaa 138 *138
comp 1369755..1369828 atgj 6 6
comp 1369835..1369925 tcc 8 8
comp 1369934..1370006 aac 7
comp 1370014..1370130 5s 69
comp 1370200..1373111 23s 126
comp 1373238..1373310 gca 69 69
comp 1373380..1373453 atc 105
comp 1373559..1375130 16s 547 *547
1375678..1376604 CDS 102845 *309
comp 1479450..1479824 CDS 200 200 125
comp 1480025..1480101 gac 26 26
comp 1480128..1480199 gaa 3 3
comp 1480203..1480275 gta 2 2
comp 1480278..1480351 cgt 35 35
comp 1480387..1480458 ggc 36
comp 1480495..1480611 5s 68
comp 1480680..1483590 23s 208
comp 1483799..1485370 16s 153 153 153
comp 1485524..1485716 CDS 20944 64
comp 1506661..1507464 CDS 270 270 268
comp 1507735..1507807 aag + 34 34
comp 1507842..1507914 aag 5 aag 33 33
comp 1507948..1508020 aag 33 33
comp 1508054..1508126 aag @3 33 33
comp 1508160..1508232 aag 130 130 130
comp 1508363..1509226 CDS 167 288
1509394..1510872 CDS 106 106 493 106
comp 1510979..1511051 gta 3 3
comp 1511055..1511126 gaa 151 *151
1511278..1511366 ctt 113 113
1511480..1512010 CDS 21195 177
comp 1533206..1534129 CDS 355 355 308
comp 1534485..1534557 acg 154 154 154
comp 1534712..1535950 CDS 18502 413
1554453..1554638 CDS 303 303 62 303
comp 1554942..1555029 agc 673 *673
comp 1555703..1556203 CDS 595 *167
1556799..1558178 CDS 277 277 460
comp 1558456..1558572 5s 68
comp 1558641..1561551 23s 126
comp 1561678..1561750 gca 69 69
comp 1561820..1561893 atc 105
comp 1561999..1563570 16s 189 189 189
1563760..1563948 CDS 19274 63
comp 1583223..1584392 CDS 151 151 390 151
comp 1584544..1584628 ttg + 17 17
comp 1584646..1584730 ttg 2 ttg 28 28
comp 1584759..1584829 tgc 2 ttc 26 26
comp 1584856..1584931 cac 2 atgf 13 13
comp 1584945..1585015 tgg 4 4
comp 1585020..1585101 tac 8 8
comp 1585110..1585182 ttc 6 6
comp 1585189..1585262 gac 3 3
comp 1585266..1585339 atgf 9 9
comp 1585349..1585436 tca 42 42
comp 1585479..1585550 gaa 258 *258
comp 1585809..1585899 agc 2 2
comp 1585902..1585975 atc 3 3
comp 1585979..1586049 gga 14 14
comp 1586064..1586136 ttc 17 17
comp 1586154..1586227 atgf 11 11
comp 1586239..1586312 atgi 12 12
comp 1586325..1586398 atg 36 36
comp 1586435..1586508 cca 6 6
comp 1586515..1586588 cgt 5 5
comp 1586594..1586679 tta 15 15
comp 1586695..1586766 ggc 4 4
comp 1586771..1586843 aca 11 11
comp 1586855..1586936 cta 12 12
comp 1586949..1587021 aaa 2 2
comp 1587024..1587096 gta 157 157
comp 1587254..1588681 CDS 539 476
comp 1589221..1590557 CDS 156 156 446 156
comp 1590714..1590830 5s 68
comp 1590899..1593809 23s 126
comp 1593936..1594008 gca 69 69
comp 1594078..1594151 atc 105
comp 1594257..1595828 16s 581 *581
comp 1596410..1597276 CDS 189853 *289
comp 1787130..1788440 CDS 298 298 437 298
comp 1788739..1788855 5s 68
comp 1788924..1791834 23s @4 208
comp 1792043..1793614 16s 436 *436
comp 1794051..1794596 CDS -8 *182
comp 1794589..1795436 CDS 138 138 283 138
comp 1795575..1795648 gac 3 3
comp 1795652..1795724 gta 2 2
comp 1795727..1795800 cgt 35 35
comp 1795836..1795907 ggc 19 19
comp 1795927..1796000 cca 3 3
comp 1796004..1796076 aac 7
comp 1796084..1796200 5s 68
comp 1796269..1799179 23s 208
comp 1799388..1800959 16s 501 *501
comp 1801461..1802087 CDS *209

lbu cumuls

cumuls. Lactobacillus delbrueckii subsp. bulgaricus ATCC BAA-365
opérons Fréquences intercalaires tRNAs Fréquences intercalaires cds Fréquences aas cds
effectif gammes sans rRNAs avec rRNAs gammes cds gammes cdsd gammes cdsa
avec rRNA opérons 9 1 0 0 1 0 1 0 100 5
16 23 5s 0 2 20 33 9 50 2 20 0 200 11
16 atc gca 5 40 11 3 100 12 40 2 300 19
16 23 5s a 2 60 2 0 150 11 60 3 400 11
max a 7 80 0 5 200 14 80 3 500 11
a doubles 0 100 0 0 250 3 100 4 600 2
autres 0 120 0 0 300 6 120 2 700 1
total aas 26 140 0 1 350 2 140 5 800 2
sans opérons 23 160 1 0 400 2 160 5 900 1
1 aa 16 180 0 0 450 1 180 1 1000 1
max a 26 200 0 0 500 1 200 2 1100 0
a doubles 3 1 0 10 5 0
total aas 72 48 18 64 32 64
total aas 98
remarques
avec jaune moyenne 138 320
variance 81 182
sans jaune moyenne 14 29 159 114 275
variance 12 29 85 50 122

lbu blocs

B6 Lactobacillus delbrueckii, RNAs blocs
5s 68 5s 68
23s 126 23s 126
gca 69 gca 69
atc 105 atc 105
16s 16s
aac 7
16s 106 16s 105 5s 69
atc 69 atc 69 23s 126
gca 127 gca 126 gca 69
23s 68 23s 69 atc 105
5s 5s 16s
ggc 36 aac 7
5s 68 5s 68 5s 68 16s 209
23s 208 23s 208 23s 208 23s 69
16s 16s 16s 5s

lbu remarques

*Remarques : Ce génome se distingue par un indice 4 fois supérieur des gènes de tRNAs 					
	par rapport à ceux du total des bacilli.				
					
@1	Les gènes de tRNA se terminant par g et t sont rares chez les 				
	et ont un indice total de 5 par génome. Ce génome en a 20.				
	La plus part sont isolés, seuls ou dans de petits clusters sans rRNA.				
	aag se distingue par sa fréquence élevée, 6, et surtout par sa répétition de 5				
	dans un seul cluster.				
	Cependant  chez les bacilli les gènes présents ont un indice plus élevés que 				
	les très rares. J’ai repéré 4 groupes :	
		
			indice		présents			absents
	rares moyens	99>ind>43	aag6 cgg agg ctt2 ctg2 		(ctc gtc)
					tcg acg (acc tcc)		
	rares		26>ind>11	ggg ccg cag gag act2		(gcc)
	très rares	7,9>ind>0,6					gtg gcg ttt cct (ccc ata)
	nuls		0,6>ind						autres xxt, tous absents
					
@2	Les clusters sans rRNAs sont beaucoup plus longs que ceux avec rRNA, 26 15 5,				
	contre 6 5 5.	Les petits clusters sont en grande partie ceux de @1.			
	Les clusters  26 et 15 n’ont pas de doublons ou très peu et se comportent comme				
	les clusters avec rRNAs longs des bacilli (ppm bsu lmo lma* pmq ban*) :				
	 pas de répétition, pas de séquence et doublons séparés. 				
					
@3	répétition de 5 de aag, voir @1 ci-dessus.				
					
@4	5 blocs 635 et 4 blocs 6-atcgca-35 avec des intercalaires identiques. Très peu de 				
	gènes tRNA à la suite de ces blocs (6 5 5 )  contrairement aux autres bacilli étudiés qui 				
	dépassent les 21 aas : ppm bsu lmo lma* pmq ban*.				
					
Séquences des doubles (indiqués par le signe + dans le tableau): 
  Les doubles, peu nombreux, se trouvent dans les clusters sans rRNAs. pas de séquences mais une répétition de 5 chez les gènes  rares.
  Voir ci-dessus @2.		

lbu distribution

Bc6 lbu, Lactobacillus delbrueckii subsp. bulgaricus ATCC BAA-365. bacilli.
bc61 lbu, distribution des blocs sans rRNA.
g1    t1       
atgi 1 tct tat atgf 3
att act aat agt
ctt 1 cct cat cgc
gtt gct gat ggt
ttc 3 tcc 2 tac 3 tgc 2
atc 1 acc 1 aac 1 agc 1
ctc ccc 2 cac 2 cgt 2
gtc gcc gac 2 ggc 4
tta 1 tca taa tga
ata aca aaa 1 aga
cta 1 cca 1 caa 1 cga
gta 3 gca gaa 3 gga 1
ttg 3 tcg tag tgg 2
atgj 1 acg aag 5 agg
ctg ccg cag 1 cgg
gtg gcg gag 1 ggg
baci >1aa =1aa -5s +5s -16s +16s total
lbu 56 56
bc62 lbu. Distribution des blocs avec rRNA.
g1    t1       
atgi tct tat atgf
att act 2 aat agt
ctt 1 cct cat cgc
gtt gct gat ggt
ttc tcc 1 tac tgc
atc 5 acc 1 aac 2 agc 1
ctc ccc cac cgt 2
gtc gcc gac 2 ggc 2
tta tca taa tga
ata aca aaa aga 1
cta cca 1 caa 2 cga
gta 3 gca 5 gaa 2 gga
ttg tcg 1 tag tgg
atgj 1 acg 1 aag 1 agg 1
ctg 2 ccg cag cgg 1
gtg gcg gag ggg 1
baci >1aa =1aa -5s +5s -16s +16s total
lbu 16 16 10 42

ban* Bacillus anthracis strain 2002013094

  • Attention: la notation KEGG pour ce génome n'existe pas. Elle est remplacée par ban*. Mais par commodité j'ai mis ban pour la suite. Ce n'est pas le génome ban de KEGG Bacillus anthracis Ames

ban opérons

  • Liens: gtRNAdb [19], NCBI [20], génome [orgn]
  • Lien tableur: ban opérons
  • Légende: cdsa: cds aas, cdsj: cdsa sans jaune, cdsd: cdsa dirigé
B7 Bacillus anthracis strain 2002013094
35.1%GC 15.8.19 Paris  112   doubles intercal cds aa avec aa cdsa cdsd
618142..618366 CDS 188 188 75 188
618555..618627 gtc 419 *419
comp 619047..619235 CDS 63
comp 1102183..1102602 CDS 130 130 140 130
comp 1102733..1102804 gaa + 1 1
comp 1102806..1102880 aac 2 aca 8 8
comp 1102889..1102965 atc 2 tca 11 11
comp 1102977..1103047 tgg 6 6
comp 1103054..1103126 aca 9 9
comp 1103136..1103211 ttc 9 9
comp 1103221..1103296 gac 4 4
comp 1103301..1103377 atgf 20 20
comp 1103398..1103490 tca 54 54
comp 1103545..1103637 tca 20 20
comp 1103658..1103730 gca 16 16
comp 1103747..1103820 cca 10 10
comp 1103831..1103904 cgt 3 3
comp 1103908..1103996 tta 16 16
comp 1104013..1104087 ggc 29 29
comp 1104117..1104197 cta 22 22
comp 1104220..1104295 cac 9 9
comp 1104305..1104380 aca 4 4
comp 1104385..1104460 gta 4
comp 1104465..1104580 5s 97
comp 1104678..1107604 23s 141
comp 1107746..1109299 16s 694 *694
1109994..1113038 CDS *1015
comp 1306706..1307848 CDS 198 198 381
comp 1308047..1308120 gga 115 115 115
comp 1308236..1308889 CDS 218
1312025..1312345 CDS 207 207 107 207
comp 1312553..1312637 ttg 10 10
comp 1312648..1312718 tgc 14 14
comp 1312733..1312807 ggc 5 5
comp 1312813..1312887 caa 63 63
comp 1312951..1313026 cac 19 19
comp 1313046..1313119 tgg 7 7
comp 1313127..1313210 tac 17 17
comp 1313228..1313303 gta 5 5
comp 1313309..1313383 gaa 24 24
comp 1313408..1313480 acc 4 4
comp 1313485..1313559 aac 9
comp 1313569..1313684 5s 96
comp 1313781..1316709 23s 141
comp 1316851..1318405 16s 386 *386
1318792..1319148 CDS 119
1556278..1556507 CDS 57 57 77 57
comp 1556565..1556680 5s 49
comp 1556730..1560126 23s 173
comp 1560300..1562132 16s 476 *476
1562609..1563322 CDS 238
> 1566949..1567219 CDS 99 99 90 99
comp 1567319..1567434 5s 46
comp 1567481..1570409 23s 142
comp 1570552..1572115 16s 451 *451
1572567..1574498 CDS *644
1579539..1580615 CDS 14 14 359 14
comp 1580630..1580745 5s 45
comp 1580791..1583912 23s 153
comp 1584066..1585720 16s 294 294
comp 1586015..1587520 CDS *502
comp 1600693..1601166 CDS 174 174 158
comp 1601341..1601416 gac 3 3
comp 1601420..1601496 atgf 12
comp 1601509..1601624 5s @1 46
comp 1601671..1604598 23s 141
comp 1604740..1606294 16s 75
comp 1606370..1606440 gga 1 1
comp 1606442..1606518 cca + 4 4
comp 1606523..1606599 cgt Séquence 10 3 3
comp 1606603..1606691 tta 16 16
comp 1606708..1606782 ggc 29 29
comp 1606812..1606892 cta 14 14
comp 1606907..1606982 aaa 5 5
comp 1606988..1607062 caa 87 *87
comp 1607150..1607225 gac 46 46
comp 1607272..1607347 gta 4 4
comp 1607352..1607426 gaa 1 1
comp 1607428..1607502 aac 2 aac 8 8
comp 1607511..1607587 atc 11 11
comp 1607599..1607669 tgg 6 6
comp 1607676..1607748 aca 9 9
comp 1607758..1607833 ttc 8 8
comp 1607842..1607917 gac 4 4
comp 1607922..1607998 atgf 20 20
comp 1608019..1608111 tca 2 tca 54 54
comp 1608166..1608258 tca 20 20
comp 1608279..1608351 gca 16 16
comp 1608368..1608441 cca 10 10
comp 1608452..1608525 cgt 3 3
comp 1608529..1608617 tta 16 16
comp 1608634..1608708 ggc 29 29
comp 1608738..1608818 cta 13 13
comp 1608832..1608907 aaa 5 5
comp 1608913..1608987 caa 87 *87
comp 1609075..1609150 gac 46 46
comp 1609197..1609272 gta 4 4
comp 1609277..1609351 gaa 8 8
comp 1609360..1609450 agc 3 3
comp 1609454..1609528 aac 114 114 114
comp 1609643..1610101 CDS 153
comp 1702642..1703788 CDS 114 114 382 114
comp 1703903..1703975 gca 10 10
comp 1703986..1704057 ggc 5 5
comp 1704063..1704138 aaa 5 5
comp 1704144..1704218 caa 65 65
comp 1704284..1704366 tac 17 17
comp 1704384..1704459 gta 5 5
comp 1704465..1704539 gaa 24 24
comp 1704564..1704636 acc 4 4
comp 1704641..1704715 aac 9
comp 1704725..1704840 5s 82
comp 1704923..1707851 23s 141
comp 1707993..1709545 16s 223 223
comp 1709769..1709987 CDS 73
comp 1767157..1767618 CDS 206 206 154 206
comp 1767825..1767940 5s 45
comp 1767986..1770913 23s 141
comp 1771055..1772608 16s 372 *372
comp 1772981..1774480 CDS *500
comp 1787717..1790188 CDS 259 259 *824
comp 1790448..1790519 gaa 13 13
comp 1790533..1790606 atgj @2 160 160 160
comp 1790767..1791249 CDS 161
comp 1820538..1820717 CDS 190 190 60 190
comp 1820908..1821023 5s 44
comp 1821068..1823996 23s 77
comp 1824074..1824149 gca 8 8
comp 1824158..1824234 atc 130
comp 1824365..1825919 16s 217 217
comp 1826137..1826406 CDS 90
comp 1832600..1832992 CDS 166 166 131
comp 1833159..1833251 tca 156 156 156
comp 1833408..1834682 CDS 425
1839668..1840669 CDS 34 34 334 34
comp 1840704..1840819 5s 44
comp 1840864..1843791 23s 76
comp 1843868..1843943 gca 8 8
comp 1843952..1844028 atc 130
comp 1844159..1845713 16s 240 240
comp 1845954..1848425 CDS *824
1873838..1875127 CDS 139 139 430 139
1875267..1875342 aaa 13 13
1875356..1875427 gaa 21 21
1875449..1875524 gac 41 41
1875566..1875638 ttc 403 *403
1876042..1876749 CDS 236
comp 2217640..2217846 CDS 205 205 69 205
2218052..2218130 cgg 255 255
2218386..2219693 CDS 436
comp 2428815..2429495 CDS 404 *404 227
2429900..2431456 16s 139
2431596..2434524 23s 97
2434622..2434737 5s 4
2434742..2434817 gta + 4 4
2434822..2434897 aca 2 cta 9 9
2434907..2434982 cac 2 aca 22 22
2435005..2435085 cta 29 29
2435115..2435189 ggc 16 16
2435206..2435294 tta 3 3
2435298..2435371 cgt 10 10
2435382..2435455 cca 16 16
2435472..2435544 gca 20 20
2435565..2435657 tca 54 54
2435712..2435805 cta 20 20
2435826..2435902 atgf 1 1
2435904..2435979 gac 12 12
2435992..2436067 ttc 14 14
2436082..2436157 aca 10 10
2436168..2436243 aaa 13 13
2436257..2436327 gga 10 10
2436338..2436414 atc 7 7
2436422..2436496 aac 7 7
2436504..2436594 agc 6 6
2436601..2436672 gaa 59 59 59
2436732..2436842 CDS 37
2798971..2799474 CDS 109 109 168 109
2799584..2799657 gga 1 1
2799659..2799735 aga 407 *407
2800143..2800343 CDS 67
comp 2991608..2992366 CDS 242 242 253
2992609..2992682 atgi 221 221 221
2992904..2993515 CDS 204

ban cumuls

  • Lien tableur: ban cumuls
  • Note du 16.11.20: attention le @1 doit être intégré dans les rRNA et non dans les sans. Refaire les calculs.
cumuls. Bacillus anthracis strain 2002013094
opérons Fréquences intercalaires tRNAs Fréquences intercalaires cds Fréquences aas cds
effectif gammes sans rRNAs avec rRNAs gammes cds gammes cdsd gammes cdsa
avec rRNA opérons 11 1 3 2 1 0 1 0 100 10
16 23 5s 0 4 20 25 47 50 2 20 1 200 9
16 atc gca 2 40 3 6 100 3 40 1 300 6
16 23 5s a 5 60 4 2 150 6 60 2 400 4
max a 21 80 0 2 200 7 80 0 500 4
a doubles 2 100 2 0 250 8 100 1 600 1
autres 0 120 0 0 300 3 120 4 700 1
total aas 66 140 0 0 350 0 140 2 800 0
sans opérons 9 160 0 0 400 2 160 2 900 2
1 aa 5 180 0 0 450 3 180 0 1000 0
max a 33 200 0 0 500 0 200 2 1100 1
a doubles 1 0 0 0 4 0
total aas 46 37 59 34 19 38
total aas 112
remarques 2
avec jaune moyenne 18 15 232 132 274
variance 21 14 143 62 238
sans jaune moyenne 14 165 191
variance 14 71 124

ban blocs

B7 Bacillus anthracis, RNAs blocs
aa gta aac atgf aac CDS
inter aa 4 9 12 9 404
5s 97 96 46 82 139
23s 141 141 141 141 97
16s 694 386 75 223 4
CDS CDS CDS gga CDS gta
CDS 57 99 14 206
5s 49 46 45 45
23s 173 142 153 141
16s 476 451 294 372
CDS 190 34
5s 44 44
23s 77 76
gca 8 8
atc 130 130
16s 217 240
CDS

ban séquences

  • Lien au tableau ban opérons
  • Lien tableur: ban séquences
  • Lien bsu-lmo
  • Légende: 33 aas, cluster à 33 gènes de tRNA
    - répétitions de séquence intra bloc: Dans le bloc 33aas uniquement, il y a une séquence de 10aas répétée. Elle est divisée de 2 séquences de 5 chacune, cyan et bleu.
    - répétitions de séquence entre blocs
    • - entre les clusters 11aas et 9aas: une séquence de 5 se répète, le jaune.
    • - entre les clusters 33aas 21aas et 19aas je repère 3 grandes séquences qui se répètent, contenant des sous séquences qui se répètent aussi: séquence de 16 (cadre solide) commune à 33aas et 19aas, séquence de 15 (cadre en tirets) commune à 21aas et 19aas et une séquence de 12 commune aux 3 clusters et composée de la séquence 5 cyan et d'une séquence de 7aas (rouge) contenant atgf et un doublet tca. Il faut noter ici que tca est modifié en cta alors que les intercalaires atgf-cta-tca et atgf-tca-tca ne changement pas, 20-54. C'est que cta et tca sont des tRNAs de même longueur, seule une mutation ponctuelle est en cause.
    • - entre le cluster 33aas et 21aas existe un bloc commun de 3 gènes gaa-agc-acc qu'on ne peut mettre en parallèle. A-t-il un rôle important dans les recombinaisons?
    - Les intercalaires qui changent: la plus part des intercalaires se répètent comme les gènes sauf les intercalaires de aca-ttc-gac-atgf qui sont constants dans les clusters 33aas et 19aas et diffèrent dans le 21aas. De même pour cca-cgt (cyan) qui diffèrent dans 33as mais restent constants entre les 3 clusters. Ce qui différencie les 2 séquences cyan de 33aas. En fin de 33aas le triplet gaa-agc-aac se répète au début de 21aas mais avec des intercalaires changeant, 8-3 contre 6-7. Ces changements dans les intercalaires laissent penser qu'ils se produisent lors des recombinaisons des blocs intra cluster (cyan 1 et 2 de 33aas) ou entre clusters.
B7. Bacillus anthracis strain 2002013094,
séquences des gènes tRNA dans les clusters à rRNA.
33 aas inter 21 aas inter 19 aas inter 11 aas inter
gga 1 ttg 10
cca 4 tgc 14
cgt 3 ggc 5
tta 16 caa 63
ggc 29 cac 19
cta 14 tgg 7
aaa 5 tac 17
caa 87 gta 5
gac 46 gaa 6 gaa 24
gta 4 agc 7 acc 4
gaa 1 aac 7 gaa 1 aac
aac 8 atc 10 aac 8
atc 11 gga 13 atc 11
tgg 6 aaa 10 tgg 6
aca 9 aca 14 aca 9
ttc 8 ttc 12 ttc 9
gac 4 gac 1 gac 4
atgf 20 atgf 20 atgf 20
tca 54 cta 54 tca 54 9 aas inter
tca 20 tca 20 tca 20
gca 16 gca 16 gca 16 gca 10
cca 10 cca 10 cca 10 ggc 5
cgt 3 cgt 3 cgt 3 aaa 5
tta 16 tta 16 tta 16 caa 65
ggc 29 ggc 29 ggc 29 tac 17
cta 13 cta 22 cta 22 gta 5
aaa 5 cac 9 cac 9 gaa 24
caa 87 aca 4 aca 4 acc 4
gac 46 gta gta aac
gta 4
gaa 8
agc 3
aac

ban occurrences

  • Légende: atgi pour Ile2, atgf pour fMet et atgj pour Met
I11. Occurrence des gènes tRNA chez ban*
ttt tct    tat    tgt   
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc 4 tcc tac 2 tgc 1
atc 5 acc 2 aac 6 agc 2
ctc ccc cac 3 cgt 4
gtc 1 gcc gac 7 ggc 6
tta 4 tca 6 taa tga
atgi 1 aca 5 aaa 5 aga 1
cta 5 cca 4 caa 4 cga
gta 6 gca 6 gaa 8 gga 4
ttg 1 tcg tag tgg 3
atgf/j 4/1 acg aag agg
ctg ccg cag cgg 1
gtg gcg gag ggg

ban intercalaires

  • Légende: aa pour gène tRNA, inter aa pour intercalaire rRNA-aa
I11. Intercalaires des rRNAs chez ban*
aa gta aac atgf aac CDS
inter aa 4 9 12 9 404
5s 97 96 46 82 139
23s 141 141 141 141 97
16s 694 386 75 223 4
CDS CDS CDS gga CDS gta
CDS 57 99 14 206
5s 49 46 45 45
23s 173 142 153 141
16s 476 451 294 372
CDS
CDS 190 34
5s 44 44
23s 77 76
gca 8 8
atc 130 130
16s 217 240
CDS

ban remarques

  • Liens:    ban séquences,    ban intercalaires,    ban occurrences,    indices bacilli
  • Note du 16.11.20: attention le @1 doit être intégré dans les rRNA et non dans les sans. Refaire les calculs.
  • Remarques:
    1. @1 Existence des blocs à rRNA inversés
      - Ce sont des blocs dont les gènes tRNAs se trouvent juste après le rRNA 16s au lieu d’être après le 5s ou parfois le 23s dans le sens 16s23s5s. J’en ai rencontré beaucoup dans les génomes détaillés dans ces annexes. Mais leurs présences systématiques dans les études exhaustives des fiches me laissaient penser à croire en leur existence.
      - En effet, le comportement des blocs normaux laissait penser que la juxtaposition des gènes tRNAs et du 16s était fortuite, le bloc 16s serait mobile et s’introduirait au hasard à côté d’une séquence de gènes tRNA. Dans l’étude des intercalaires entre gènes de tRNA, je voulais savoir s’il y avait une différence entre les blocs à rRNA et les blocs sans. Tout au début, je considérais les gènes de tRNA des blocs inversés comme appartenant aux blocs sans rRNA. Cependant l’intercalaire entre le 16s et le 1er aa était si faible quelquefois que cela me gênait de l’en séparer. Dans les cumuls de ce génome ban*, j’ai considéré la séquence de 33aas comme n’appartenant pas au bloc 16s adjacent. Cependant la moyenne et la variance des intercalaires sont les mêmes que celles des blocs 16s normaux.
      -Avec le génome ban* j’ai pu comparer les séquences des gènes tRNA ici et il est évident qu’avec la disposition des sous séquences et leurs intercalaires tout se passe comme si les réarrangements étaient dus à l’existence des blocs 16s. Et donc que la séquence des 33aas devait se trouver à la suite du 5s et a été déplacée par retournement, ce qui a facilité l’homogénéisation des séquences 12aas (cadres en tirets) par conversion dans les 3 blocs. Ensuite une conversion entre blocs 2 à 2 s’est faite séparément. Donc avant les conversions, il y a eu le retournement de 33aas et avant d’être 33aas, il y a eu duplication du bloc cyan+bleu.
      - Donc après cette analyse des séquences, je considérerai tous les blocs inversés comme appartenant au bloc 16s quelle que soit la distance de juxtaposition. Il reste cependant une inconnue : est-ce que l’espace entre 16s et le 1er aa est dû à notre incapacité à reconnaître une séquence fonctionnelle, ou bien effectivement dans certains rares cas li y a eu juxtaposition au hasard.
    2. @2 Il n’y a que 13 tRNAs sans rRNA. Tous les atgf se trouvent avec rRNA alors qu’il n’y a qu’un seul exemplaire de atgi et atgj. Voir le tableau des occurrences totales de ban* et le tableau ci-dessous pour les gènes rares.
      - Ils se répartissent en 8 clusters dont 5 ne contiennent qu’un seul gène. Trois gènes rares chez les bacilli s’y trouvent, gtc cgg aga.
      - Par comparaison les clusters à rRNAs ne contiennent que 3 gènes rares sur 99, 2 acc et tgc.
      - Le plus grand cluster à 4 gènes ressemble beaucoup au au bloc bleu du cluster 33aas, aaa gaa gac ttc contre aaa caa gac gta gaa pour le bloc bleu.
      - Au tableau des indices bacilliles 3527 gènes atg ne sont pas différenciés pour 672 génomes. Le décompte suivant montre que atgi et agj ont un indice moyen, un gène par génome, donc c’est un gène obligatoire comme l’est tgc.
		
Les gènes rares chez les bacilli				Clusters sans rRNAs de ban*
	indice pour 100 génomes	   occurrence chez ban*			
	tcc		108			0			aaa  gaa  gac  ttc
	acc		83			2			gtc
	ccc		5,7			0			gga
	gcc		26			0			gaa atgj
	tgc		106			1			tca
	aga		108			1			cgg
	cga		5,4			0			gga  aga
	agg		66			0			atgi
	cgg		99			1			
	ctc		67			0			
	gtc		47			1			

Décompte des atg pour 678 génomes, 30.10.19 Tanger .			
	atg	indice	décompte	
	fMet	260	1762	
	Ile2	133	901	
	Met	139	941	
	total		3604
  • Les intercalaires des clusters à rRNAs. Dans le tableau ban intercalaires, je ne mets en valeur que les intercalaires faisant intervenir les rRNAs.
    - les intercalaires 5s-23s: 4 blocs avec des gènes tRNA ont un intercalaire double des 7 autres et le bloc inversé se comporte comme les autres: 97-82 contre 49-44.
    - L'intercalaire 23s-16s: il est constant pour 7 blocs, 142-139 les 2 autres ont 10% (153) et 20% (173) de plus.
    - L'intercalaire aa-5s: il est très faible, 4-12. L’intercalaire aa-16s du bloc inversé est du même ordre que le 5s-23s et cela est du au retournement de la séquence des 33aas.
    - L'intercalaire cds-5s : sur les 6 blocs qui le portent 3 sont très faibles, 57 34 14 et les 3 autres sont moyens relativement aux cds-16s, 99 190 206, et restent orientés cds-16s-5s-cds.
    - L'intercalaire cds-16s: ils sont très élevés mais peu variables. 5 blocs ne contenant pas d'aas tournent autour de 420, 476-372, un sixième a 50% de plus, 694. Les 4 restants ont un intercalaire faible et se répartissent en 2 avec aas, 217 240, et 2 sans aas, 223 294.
    - L'homogénéité de ces blocs est comparable avec celle de bsu.
  • Séquence des doubles : Très peu de doubles, si l’on ne tient pas compte de la duplication des blocs cyan et bleu de 10 aas dans le cluster à 33aas. Dans celui-ci il y a 2 doubles gac aac et une répétition tca-tca. Si l’on tient compte des aas proche du 5s, il faut ajouter atgf (double) et gac (triple). Pour le cluster 21aas aca et cta sont doubles, et pour le 19aas aca est double et tca répété. Les clusters 11aas et 9aas n’ont pas de doubles.

ban distribution

  • Lien tableur: ban distribution
  • Notes:
    - Les avant 16s, -16s, sont comptés comme les après 5s, +5s. Ils sont au nombre de 33 et ne sont pas soulignés.
    - Les 1-3aas après 5s, +5s, sont soulignés: atgf gac
    - duplicata: tca2
Bc7 ban, Bacillus anthracis strain 2002013094. bacilli.
bc71 ban, distribution des blocs sans rRNA.
g1    t1       
atgi 1 tct tat atgf
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc 1 tcc tac tgc
atc 2 acc aac agc 1
ctc ccc cac cgt
gtc 1 gcc gac 1 ggc 2
tta tca 1 taa tga
ata aca aaa 1 aga
cta cca caa cga 1
gta gca 2 gaa 2 gga
ttg tcg tag tgg
atgj 1 acg aag agg
ctg ccg cag cgg
gtg gcg gag ggg
baci >1aa =1aa -5s +5s -16s +16s total
ban 8 5 4 17
bc72 ban. Distribution des blocs avec rRNA.
g1    t1       
atgi tct tat atgf 4
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc 3 tcc tac 2 tgc 1
atc 3 acc 2 aac 6 agc 2
ctc ccc cac 3 cgt 4
gtc gcc gac 6 ggc 6
tta 4 tca 5 taa tga
ata aca 5 aaa 4 aga
cta 5 cca 4 caa 4 cga
gta 6 gca 4 gaa 6 gga 2
ttg 1 tcg tag tgg 3
atgj acg aag agg
ctg ccg cag cgg
gtg gcg gag ggg
baci >1aa =1aa -5s +5s -16s +16s total
ban 95 95

bacilli synthèse

bacilli distribution par génome

bacilli distribution par génome
baci >1aa 1aa -5s +5s -16s +16s duplica 1-3aas total
bsu 18 8 52 2 4 2 86
lmo 9 8 44 4 2 67
lam 22 14 16 4 3 4 63
ppm 67 21 68 5 161
pmq 22 11 138 0 2 173
lbu 49 16 16 10 7 98
ban 8 5 60 33 4 2 112
total 195 83 0 394 35 31 12 10 760

bacilli distribution du total

  • Lien tableur: bacilli distribution du total
  • Légende:
  • Tableau de gauche
    - Les couleurs cyan et jaune sont les emplacements des >3 des +5s de bacilli + clostridia
    Cyan pour les valeurs faibles, total 82.
    Jaune pour les valeurs fortes et en gras les plus fortes, total 410.
    blanc pour les valeurs intermédiaires, gca et atc le sont aussi, total 225.
    - Le rouge pour l'emplacement des +16s occupés, gca et atc.
    - Les encadrés sont les emplacements des 1-3aas des +5s de alpha + gamma.
    - Le -16s de 33 aas est compté ici comme un +5s long (inversion).
  • Tableau de droite: Les duplicata ne sont pas comptés dans le total de 43 mais dans le total des >1aa du tableau de gauche.
  • Tableau des indices, en-tête: total des génomes, total des tRNAs, indice ttt, indice tgt.
Bacilli. Distribution du total.
bacilli. Distribution du total: >1aa 1aa +5s >3
g1    t1       
atgi 8 tct tat atgf 34
att act 2 aat agt
ctt 5 cct cat cgc
gtt gct gat ggt
ttc 23 tcc 12 tac 24 tgc 12
atc 16 acc 8 aac 32 agc 17
ctc 11 ccc 2 cac 21 cgt 27
gtc 8 gcc 4 gac 34 ggc 39
tta 16 tca 17 taa tga
ata 1 aca 23 aaa 30 aga 9
cta 15 cca 27 caa 29 cga 2
gta 36 gca 17 gaa 42 gga 19
ttg 13 tcg 10 tag tgg 15
atgj 14 acg 7 aag 10 agg 3
ctg 15 ccg 2 cag 1 cgg 8
gtg gcg gag 2 ggg 4
baci7 >1aa 1aa -5s +5s -16s +16s total
type 207 83 0 394 33 0 717
bacilli. Distribution du total: +16s -16s +5s <4 dupli
g1    t1       
atgi tct tat atgf 2
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc tcc 1 tac tgc
atc 15 acc 1 aac 4 agc
ctc ccc cac cgt 1
gtc gcc gac 2 ggc 3
tta tca taa tga
ata aca aaa aga
cta cca caa cga
gta gca 16 gaa gga 1
ttg 2 tcg tag tgg
atgj acg aag 5 agg
ctg 2 ccg cag cgg
gtg gcg gag ggg
baci7 dupli 1aa -5s +5s -16s +16s total
type 12 10 2 31 43
bacilli. indices du 29.5.20 618 génomes
g1 t1 618 49366 0,2  0
atgi 146 tct 0,3 tat 0,5 atgf 285
att 0,2 act 11 aat 0,5 agt
ctt 47 cct 0,6 cat 0,2 cgc 0,2
gtt 0,2 gct 0,5 gat ggt
ttc 272 tcc 120 tac 239 tgc 117
atc 310 acc 92 aac 378 agc 159
ctc 75 ccc 6,1 cac 186 cgt 288
gtc 53 gcc 30 gac 386 ggc 310
tta 211 tca 244 taa 1,1 tga 1,8
ata 2,1 aca 294 aaa 340 aga 119
cta 199 cca 243 caa 299 cga 6,3
gta 397 gca 443 gaa 468 gga 305
ttg 125 tcg 47 tag 0,8 tgg 137
atgj 152 acg 47 aag 73 agg 72
ctg 60 ccg 19 cag 17 cgg 109
gtg 0,8 gcg 8,6 gag 16 ggg 18
inter max min total
2820 4504 634 7958

bacilli distribution par type

Bacilli. Distribution par type.
bacilli. distribution des solitaires
g1    t1          
atgi 2 tct tat atgf
att act 2 aat agt
ctt 2 cct cat cgt
gtt gct gat ggt
ttc tcc tac tgc
atc 1 acc 2 aac 1 agc 1
ctc 3 ccc 2 cac cgc 1
gtc 5 gcc 2 gac 1 ggc
tta 2 tca 5 taa tga
ata aca 1 aaa aga 7
cta cca caa 4 cga
gta gca gaa gga 5
ttg tcg 5 tag tgg
atgj 2 acg 3 aag 4 agg 3
ctg 5 ccg cag cgg 8
gtg gcg gag 1 ggg 3
baci7 inter max min total
1aa 27 13 43 83
bacilli. distribution du type >1aa sans duplicata.
g1    t1          
atgi 3 tct tat atgf 7
att act aat agt
ctt 3 cct cat cgt
gtt gct gat ggt
ttc 9 tcc 3 tac 11 tgc 5
atc 3 acc aac 9 agc 6
ctc 4 ccc cac 9 cgc 3
gtc gcc 1 gac 11 ggc 7
tta 3 tca 5 taa tga
ata 1 aca 4 aaa 8 aga 1
cta 3 cca 5 caa 10 cga 2
gta 8 gca 2 gaa 19 gga 4
ttg 4 tcg 3 tag tgg 7
atgj 4 acg 2 aag 1 agg
ctg 1 ccg 2 cag 1 cgg
gtg gcg gag 1 ggg
baci7 inter max min total
>1aa 59 115 21 195
bacilli. distribution des +5s >3
g1    t1          
atgi 3 tct tat atgf 18
att act aat agt
ctt cct cat cgt
gtt gct gat ggt
ttc 14 tcc 9 tac 13 tgc 7
atc 12 acc 6 aac 22 agc 10
ctc 4 ccc cac 12 cgc 23
gtc 3 gcc 1 gac 22 ggc 29
tta 11 tca 7 taa tga
ata aca 18 aaa 22 aga 1
cta 12 cca 22 caa 15 cga
gta 28 gca 15 gaa 23 gga 10
ttg 7 tcg 2 tag tgg 8
atgj 8 acg 2 aag agg
ctg 7 ccg cag cgg
gtg gcg gag ggg 1
baci7 inter max min total
+5s>3 135 279 13 427

bacilli par rapport au groupe de référence

Comparaison avec la référence
tRNAs blocs tRNAs blocs rRNAs
baci8 1aa >1aa dup +5s 1-3aas autres total
21 faible 43 21 5 13 82
16 moyen 27 59 4 135 2 31 227
14 fort 13 115 3 279 8 2 418
83 195 12 427 10 33 760
10 g+cga 16 12 5 5 38
2 agg+cgg 11 0 11
4 carre ccc 12 5 8 25
5 autres 4 4 8
43 21 5 13 82
total tRNAs ‰
baci8 1aa >1aa dup +5s 1-3aas autres baci ‰ ref.‰
21 faible 57 28 7 17 108 26
16 moyen 36 78 5 178 3 41 299 324
14 fort 17 151 4 367 11 3 550 650
109 257 16 562 13 43 760 729
10 g+cga 21 16 7 7 50 10
2 agg+cgg 14 14
4 carre ccc 16 7 11 33 16
5 autres 5 5 11
57 28 7 17 108
blocs tRNAs ‰ total colonne %
baci8 1aa >1aa dup total ref.‰ 1aa >1aa dup
21 faible 148 72 17 238 26 52 11
16 moyen 93 203 14 310 324 33 30
14 fort 45 397 10 452 650 16 59
286 672 41 290 729 83 195
10 g+cga 55 41 17 114 10 37
2 agg+cgg 38 38 26
4 carre ccc 41 17 59 16 28
5 autres 14 14 28 9
148 72 17 238 43

bacilli, estimation des -rRNAs

  • Lien tableur: bacilli, estimation des -rRNAs
  • Liens fiche:   typage
  • Légende: prélèvement de la base gtRNAdb le 29.5.20
    - ttt et tgt sont nuls partout
    - atgi, c'est Ile2, mis à la place de ttt, très rare chez les procaryotes.
    - atgf, c'est Metf, mis à la place de tgt, très rare chez les procaryotes.
    - atgj, c'est Met, remplace le atg standard qui est la somme Ile2 Met fMet.
    - Voir la légende des tris, g1 t1 et des couleurs

bacilli, calcul des -rRNAs

bac bacilli 32 génomes
bac1 cumul des +rRNAs de la fiche bacilli pour 32 génomes
g1    t1       
atgi 20 tct tat atgf 91
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc 63 tcc 30 tac 56 tgc 30
atc 92 acc 27 aac 99 agc 38
ctc 15 ccc cac 53 cgt 82
gtc 3 gcc 1 gac 106 ggc 101
tta 59 tca 49 taa tga
ata aca 87 aaa 84 aga 1
cta 54 cca 77 caa 69 cga
gta 113 gca 122 gaa 94 gga 49
ttg 32 tcg 2 tag tgg 42
atgj 32 acg 3 aag agg
ctg 12 ccg cag cgg
gtg gcg gag ggg 1
baci32 inter max min total
693 1171 25 1889
bac2 indices du clade bacilli du 29.5.20 de gtRNAdb pour 100 génomes
g1    t1      618 0.2  0
atgi 146 tct 0.3 tat 0.5 atgf 285
att 0.2 act 11 aat 0.5 agt
ctt 47 cct 0.6 cat 0.2 cgc 0.2
gtt 0.2 gct 0.5 gat ggt
ttc 272 tcc 120 tac 239 tgc 117
atc 310 acc 92 aac 378 agc 159
ctc 75 ccc 6.1 cac 186 cgt 288
gtc 53 gcc 30 gac 386 ggc 310
tta 211 tca 244 taa 1.1 tga 1.8
ata 2.1 aca 294 aaa 340 aga 119
cta 199 cca 243 caa 299 cga 6.3
gta 397 gca 443 gaa 468 gga 305
ttg 125 tcg 47 tag 0.8 tgg 137
atgj 152 acg 47 aag 73 agg 72
ctg 60 ccg 19 cag 17 cgg 109
gtg 0.8 gcg 8.6 gag 16 ggg 18
gtRNA inter max min total
2820 4504 660 7984
bac3 cumul des -rRNAs de l'annexe bacilli 7 génomes
g1    t1       
atgi 5 tct tat atgf 7
att act 2 aat agt
ctt 5 cct cat cgc
gtt gct gat ggt
ttc 9 tcc 3 tac 11 tgc 5
atc 4 acc 2 aac 10 agc 7
ctc 7 ccc 2 cac 9 cgt 4
gtc 5 gcc 3 gac 12 ggc 10
tta 5 tca 10 taa tga
ata 1 aca 5 aaa 8 aga 8
cta 3 cca 5 caa 14 cga 2
gta 8 gca 2 gaa 19 gga 9
ttg 6 tcg 8 tag tgg 7
atgj 6 acg 5 aag 10 agg 3
ctg 8 ccg 2 cag 1 cgg 8
gtg gcg gag 2 ggg 3
baci7 inter max min total
90 131 69 290
bac4 indices des +rRNAs de la fiche bacilli pour 100 génomes
g1    t1       
atgi 63 tct tat atgf 284
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc 197 tcc 94 tac 175 tgc 94
atc 288 acc 84 aac 309 agc 119
ctc 47 ccc cac 166 cgt 256
gtc 9.4 gcc 3.1 gac 331 ggc 316
tta 184 tca 153 taa tga
ata aca 272 aaa 263 aga 3.1
cta 169 cca 241 caa 216 cga 2.0
gta 353 gca 381 gaa 294 gga 153
ttg 100 tcg 6.3 tag tgg 131
atgj 100 acg 9.4 aag agg 3.0
ctg 38 ccg cag cgg 8.0
gtg gcg gag ggg 3.1
baci32 inter max min total
2166 3659 78 5903
bac5 estimation des -rRNA du clade bacilli pour 100 génomes
g1    t1       
atgi 84 tct 0.3 tat 0.5 atgf 1
att 0.2 act 11 aat 0.5 agt
ctt 47 cct 0.6 cat 0.2 cgc 0.2
gtt 0.2 gct 0.5 gat ggt
ttc 75 tcc 26 tac 64 tgc 23
atc 23 acc 8 aac 69 agc 40
ctc 28 ccc 6.1 cac 20 cgt 32
gtc 44 gcc 27 gac 55 ggc -6
tta 27 tca 91 taa 1.1 tga 1.8
ata 2.1 aca 22 aaa 78 aga 116
cta 30 cca 2.0 caa 83 cga 6.3
gta 44 gca 62 gaa 174 gga 152
ttg 25 tcg 41 tag 0.8 tgg 6.0
atgj 52 acg 38 aag 73 agg 72
ctg 23 ccg 19 cag 17 cgg 109
gtg 0.8 gcg 8.6 gag 16 ggg 15
-rRNA inter max min total
654 845 582 2081
bac6 indices des -rRNAs de l'annexe archeo pour 100 génomes
g1    t1       
atgi 71 tct tat atgf 100
att act 29 aat agt
ctt 71 cct cat cgc 0.2
gtt gct gat ggt
ttc 129 tcc 43 tac 157 tgc 71
atc 57 acc 29 aac 143 agc 100
ctc 100 ccc 29 cac 129 cgt 57
gtc 71 gcc 43 gac 171 ggc 143
tta 71 tca 143 taa tga 1.8
ata 14 aca 71 aaa 114 aga 114
cta 43 cca 71 caa 200 cga 29
gta 114 gca 29 gaa 271 gga 129
ttg 86 tcg 114 tag tgg 100
atgj 86 acg 71 aag 143 agg 43
ctg 114 ccg 29 cag 14 cgg 114
gtg gcg gag 29 ggg 43
baci7 inter max min total
1286 1871 986 4143

bacilli, comparaison clade-annexe des -rRNAs

  • Lien tableur: bacilli, comparaison clade-annexe des -rRNAs
  • Légende
    - bac7. diff, somme des couleurs de bac7. La différence entre tRNAs est faite entre bac5 et bac6 du tableau précédent. Elle est exprimée en % et rapporté à la plus grande valeur des 2 termes de la différence. Ce qui fait quand un tRNA est à zéro la différence en % est égale à 100.
    - bac8. rap, rapport des sommes couleurs bac5/bac2. Le rapport -rRNA/total est celui du tRNA de bac5 sur celui de bac2.
  • Fréquences des différences en % du tableau bac7
gamme		0/0	10	20	30	40	50	60	70	80	90	100		total
fréquence	0	2	3	1	9	6	5	9	5	3	6	1	50
tot ≤ 50						21							
  • Comparaison avec le nombre de tRNAs de la fiche du clade: L’estimation des -rRNA par l'annexe est 43% au dessus de celle de la fiche des bacilli.
tRNAs		fiche		annexe
sans		925		290
avec		1902		470
genomes		32		7
indice %	29		41
bac bacilli 32 génomes
bac7 bacilli, différence clade-annexe des -rRNAs
g1    t1       
atgi 14 tct 100 tat 100 atgf 99
att 100 act 62 aat 100 agt
ctt 34 cct 100 cat 100 cgc 100
gtt 100 gct 100 gat ggt
ttc 42 tcc 39 tac 59 tgc 67
atc 61 acc 73 aac 52 agc 60
ctc 72 ccc 79 cac 84 cgt 44
gtc 39 gcc 37 gac 68 ggc 104
tta 63 tca 36 taa 100 tga 100
ata 85 aca 69 aaa 32 aga 1
cta 29 cca 97 caa 58 cga 78
gta 62 gca 54 gaa 36 gga 15
ttg 71 tcg 64 tag 100 tgg 94
atgj 39 acg 47 aag 49 agg 40
ctg 80 ccg 34 cag 16 cgg 5
gtg 100 gcg 100 gag 44 ggg 65
diff inter max min total
867 838 850 2554
bac8 bacilli, rapports -rRNA/total
g1    t1       
atgi 57 tct tat atgf 0.2
att act 100 aat agt
ctt 100 cct cat cgc 100
gtt gct gat ggt
ttc 28 tcc 22 tac 27 tgc 20
atc 7 acc 8 aac 18 agc 25
ctc 38 ccc 100 cac 11 cgt 11
gtc 82 gcc 90 gac 14 ggc -2
tta 13 tca 37 taa tga 100
ata 100 aca 8 aaa 23 aga 97
cta 15 cca 1 caa 28 cga 100
gta 11 gca 14 gaa 37 gga 50
ttg 20 tcg 87 tag tgg 4
atgj 34 acg 80 aag 100 agg 100
ctg 38 ccg 100 cag 100 cgg 100
gtg 100 gcg 100 gag 100 ggg 83
rap inter max min total
23 19 88 26

bacilli discussion