Aller au contenu

Recherche:Les clusters de gènes tRNA et rRNA chez les procaryotes/Annexe/bacilli

Une page de Wikiversité, la communauté pédagogique libre.
bacilli
Image logo représentative de la faculté
Annexe 3
Recherche : Les clusters de gènes tRNA et rRNA chez les procaryotes
Précédent :alpha
Suivant :clostridia
En raison de limitations techniques, la typographie souhaitable du titre, « Annexe : bacilli
Les clusters de gènes tRNA et rRNA chez les procaryotes/Annexe/bacilli
 », n'a pu être restituée correctement ci-dessus.



  • Annexe en préparation

Tanger le 21.10.19

Bacillus subtilis

[modifier | modifier le wikicode]
B1. Bacillus subtilis subsp. subtilis str. 168
43.6%GC 7.3.19 Paris   86  doubles intercal
9810..11364 16s @2 99
11464..11540 atc 11
11552..11627 gca 81
11709..14636 23s 55
14692..14810 5s
22292..22384 tca
30279..31832 16s 99
31932..32008 atc 11
32020..32095 gca 81
32177..35103 23s 133
35237..35355 5s
70181..70257 atg 9
70267..70338 gaa
90536..92089 16s @1 164
92254..95181 23s 55
95237..95354 5s 20
95375..95450 gta 4
95455..95530 aca 36
95567..95642 aaa 6
95649..95731 cta 40
95772..95846 ggc 14
95861..95946 tta 9
95956..96032 cgt 27
96060..96136 cca 9
96146..96221 gca 170
96392..97945 16s 164
98110..101037 23s 55
101093..101211 5s
160893..162445 16s 164
162610..165535 23s 55
165591..165707 5s 46
165754..165825 aac 4
165830..165902 acc 56
165959..166033 ggc 30
166064..166140 cgt 27
166168..166244 cca 8
166253..166328 gca 171
166500..168053 16s 164
168218..171141 23s 55
171197..171314 5s 183
171498..173049 16s 164
173214..176141 23s 55
176197..176315 5s
194205..194279 gaa 3
194283..194358 gta 4
194363..194435 aca 22
194458..194542 tac 4
194547..194621 caa
528704..528778 aac 4
528783..528873 agc 29
528903..528974 gaa 11
528986..529060 caa 26
529087..529162 aaa 11
529174..529255 cta 80
529336..529422 ctc
635110..635186 cgt 13
635200..635273 gga 159
635433..636987 16s 167
637155..640082 23s 55
640138..640254 5s 13
640268..640344 atgf 60
640405..640481 gac
946696..948250 16s 167
948418..951345 23s 111
951457..951572 5s 9
951582..951656 aac 5
951662..951753 tcc 34
951788..951859 gaa 9
951869..951944 gta 9
951954..952030 atgf 11
952042..952118 gac 12
952131..952206 ttc 5
952212..952284 aca 22
952307..952391 tac 5
952397..952470 tgg 24
952495..952570 cac 9
952580..952651 caa 49
952701..952775 ggc 5
952781..952851 tgc 7
952859..952947 tta @3 265
953213..953294 ttg
967065..967138 gga
1262789..1262861 gtc
comp 2003276..2003348 agg
2563889..2563959 caa
comp 2899816..2899889 aga
comp 3171879..3171950 gaa 25
comp 3171976..3172066 agc 3
comp 3172070..3172144 aac 10
comp 3172155..3172231 atc 15
comp 3172247..3172320 gga 10
comp 3172331..3172406 cac 17
comp 3172424..3172499 ttc 12
comp 3172512..3172588 gac 11
comp 3172600..3172676 atgf 17
comp 3172694..3172786 tca 6
comp 3172793..3172869 atgi 2
comp 3172872..3172948 atgj 19
comp 3172968..3173040 gca 5
comp 3173046..3173122 cca 15
comp 3173138..3173214 cgt 9
comp 3173224..3173309 tta 14
comp 3173324..3173398 ggc 5
comp 3173404..3173490 ctg 10
comp 3173501..3173576 aaa 37
comp 3173614..3173689 aca 32
comp 3173722..3173797 gta 20
comp 3173818..3173935 5s 55
comp 3173991..3176918 23s 167
comp 3177086..3178640 16s
comp 3194455..3194527 gcc
comp 3545889..3545964 cgg
comp 4154787..4154859 ttc 35
comp 4154895..4154971 gac 81
comp 4155053..4155124 gaa 9
comp 4155134..4155209 aaa
  • Note: Les statistiques sur les intercalaires entre tRNA ne sont pas correctes. Se reporter à intergen51.bsu. Il n'y a aucun commentaire sur les CDS. J'ai réduit le tableau aux clusters à rRNA. L'intitulé opéron doit d'être compris dans le sens cluster ou bloc de RNA, rRNA ou tRNA.
bsu cumuls	opérons		effectif
avec rRNA	opérons		10
		16 23 5s 0	3
		16 atc gca	2
		16 23 5s a	5
		max a		21
		a doubles	0
		spéciaux	0
		total aas	60
sans 		opérons		12
		1 aa		8
		max a		7
		a doubles	0
		total aas	26
total aas			86
remarques			3
  • Nombre de gènes protéines: 4174 (KEGG)
*Remarques : lmo-bsu (ref. sont les 1ers génomes de cette étude qui m’ont poussé à étendre	
	l’échantillon. Lma* lmo et bsu sont des bacilli et donc ont des points communs
	en termes d’opréons à RNAs avec des taux %GC très proches 38-44 %.
	
@1	Blocs 16-23-5s : il y en a 8 avec 2 dans l’opéron 9aas et 3 dans 6aas.
	Soit le double de lmo.
	- Dans la 1ère étude ces blocs paraissaient arborer les séquences les plus longues 
	d’aas et j’attribuait la longueur de 16 aas de l’opéron 16-act-gca à un remaniement 
	entre opérons.  Ce n’est plus le cas puisqu’il s’est avéré que ces derniers sont plus 
	courants et peuvent être aussi long que les premiers avec 18 aas chez lam (ref..
	- Les intercalaires sont les mêmes pour les 4 blocs 16-23-5s,  164 55 20.
	- L'opéron 16aas a un intercalaire 23s-5s double des autres blocs, 111 contre 55.
	- L'opéron 4aas contient 2 aas avant le 16s et 2 après le 5s. L'intercalaire aa-16s 
	est à peu près égale à celui de 16s-23s, 159 contre 167.
	- Les intercalaires qui séparent les blocs surnuméraires sont aussi du même ordre
	que celui de 16s-23s, 170 171 183 contre 164 pour le 16s-23s.
	- Les 5 opérons avec ces blocs ont 4 6 9 16 21 aas.
	
@2	Blocs 16-atc-gca : il y en a 2 et n’ont pas d’autres aas comme l’opéron 
	16aas de lmo.
	- Les intercalaires sont les mêmes pour les 2 opérons, 99 11 81, sauf pour  celui de 
	23s-5s, 55 bases pour l’un, comme 7 blocs 16-23-5s, et le double pour l’autre, 
	113 comme pour l’opéron 16aas.
	
@3	intercalaire élevé pour 2 aas. Est-ce que le dernier aa est solitaire ?
	
Séquences des doubles : aucun double sur 7 opérons à 2 aas et plus. Comme lmo.	

bsu distribution

[modifier | modifier le wikicode]
  • Lien tableur: bsu distribution
  • Notes:
    - Les 1-3aas après 5s, +5s, sont soulignés:atgf gac.
Bc1 bsu, Bacillus subtilis subsp. subtilis str. 168. bacilli.
bc11 bsu, distribution des blocs sans rRNA
g1    t1       
atgi tct tat atgf
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc 1 tcc tac 1 tgc
atc 2 acc aac 1 agc 1
ctc 1 ccc cac cgt
gtc 1 gcc 1 gac 1 ggc
tta tca 1 taa tga
ata aca 1 aaa 2 aga 1
cta 1 cca caa 3 cga
gta 1 gca 2 gaa 4 gga 1
ttg tcg tag tgg
atgj 1 acg aag agg 1
ctg ccg cag cgg 1
gtg gcg gag ggg
baci >1aa =1aa -5s +5s -16s +16s total
bsu 18 8 4 30
bc12 bsu. Distribution des blocs avec rRNA.
g1    t1       
atgi 1 tct tat atgf 3
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc 2 tcc 1 tac 1 tgc 1
atc 1 acc 1 aac 3 agc 1
ctc ccc cac 2 cgt 4
gtc gcc gac 3 ggc 4
tta 3 tca 1 taa tga
ata aca 3 aaa 2 aga
cta 1 cca 3 caa 1 cga
gta 3 gca 3 gaa 2 gga 2
ttg 1 tcg tag tgg 1
atgj 1 acg aag agg
ctg 1 ccg cag cgg
gtg gcg gag ggg
baci >1aa =1aa -5s +5s -16s +16s total
bsu 54 2 56
  • Lien tableur: bsu lmo
  • Légende:
    - La couleur cyan pour les différents entre bsu et lmo; bois pour les identiques entre les clusters 21 16 9 aas de bsu d'une part et ceux de lmo. Le gène cac est conservé dans les 3 clusters.
    - Le bleu pour des intercalaires exceptionnels.
    - Les bordures très épaisses noires encadrent 3 gènes pour les distingués entre eux.
  • Notes:
    - Les fréquences des différences entre intercalaires (diff) sont reportées dans le dernier tableau B14 et sont établies sur la plage des différences entre intercalaires bsu et lmo du tableau B11 pour des couples identiques (entre génomes), et entre intercalaires bsu-bsu et lmo-lmo (intra génome). Ces résultats sont à mettre en parallèle avec ceux de la comparaison cdc-psor. La faible variabilité des intercalaires cdc-psor par rapport à bsu-lmo est due à leur plus grande filiation, niveau genre contre le niveau famille pour bsu-lmo.
B1. Comparaison bsu-lmo
B11. Comparaison bsu-lmo
bsu intercal lmo intercal diff
gaa 25 gaa 5 -20
agc 3 agc 34 31
aac 10 aac 6 -4
atc 15 atc 25 10
gga 10 gga 23 13
cac 17 cac 28 11
ttc 12 ttc 4 -8
gac 11 gac 4 -7
atgf 17 atgf 42 25
tca 6 tca 22 16
atgi 2 atgi 11 9
atgj 19 atgj 42 23
gca 5 gca 22 17
cca 15 cca 10 -5
cgt 9 cgt 9 0
tta 14 tta 14 0
ggc 5 ggc 15 10
ctg 10 cta 5 -5
aaa 37 aaa 41 4
aca 32 aca 8 -24
gta 20 gta 13
5s 55 5s 81
23s 167 23s 244
16s 16s
16s 167 16s 127
23s 111 atc 46
5s 9 gca 172
aac 5 23s 80
tcc 34 5s 14
gaa 9 aac 6 1
gta 9 tcc 33 -1
atgf 11 gaa 56 47
gac 12 gta 21 12
ttc 5 atgf 6 -5
aca 22 gac 4 -8
tac 5 ttc 20
tgg 24 tac 7 2
cac 9 tgg 15 -9
caa 49 cac 29 20
ggc 5 caa 5 -44
tgc 7 ggc 19 14
tta 265 tgc 45
ttg ttg
16s 164 16s 244
23s 55 23s 80
5s 20 5s 13
gta 4 gta 8 4
aca 36 aca 41 5
aaa 6 aaa 5 -1
cta 40 cta 14 -26
ggc 14 ggc 21 7
tta 9 tta 12 3
cgt 27 cgt 10 -17
cca 9 cca 19 10
gca 170 gca 341
B12. Comparaisons internes
bsu intercal bsu intercal diff
16s 167 16s 167
23s 55 23s 111
5s 20 5s 9
gta 32 aac 5
aca 37 tcc 34
aaa 10 gaa 9
ctg 5 gta 9
ggc 14 atgf 11 0
tta 9 gac 12 0
cgt 15 ttc 5
cca 5 aca 22
gca 19 tac 5
atgj 2 tgg 24
atgi 6 cac 9
tca 17 caa 49
atgf 11 ggc 5
gac 12 tgc 7
ttc 17 tta 265
cac 10 ttg
gga 15
atc 10 16s 164
aac 3 23s 55
agc 25 5s 20
gaa gta 4 -28
aca 36 -1
aaa 6 -4
cta 40 35
ggc 14 0
tta 9 0
cgt 27 12
cca 9 4
gca 170
lmo intercal lmo intercal diff
16s 244 16s 127
23s 81 atc 46
5s 13 gca 172
gta 8 23s 80
aca 41 5s 14
aaa 5 aac 6
cta 15 tcc 33
ggc 14 gaa 56
tta 9 gta 21
cgt 10 atgf 6 2
cca 22 gac 4 0
gca 42 ttc 20
atgj 11 tac 7
atgi 22 tgg 15
tca 42 cac 29
atgf 4 caa 5
gac 4 ggc 19
ttc 28 tgc 45
cac 23 ttg
gga 25
atc 6 16s 244
aac 34 23s 80
agc 5 5s 13
gaa gta 8 0
aca 41 0
aaa 5 0
cta 14 -1
ggc 21 7
tta 12 3
cgt 10 0
cca 19 -3
gca 341
B13. Petits clusters
bsu intercal lmo intercal
gaa 3 gaa 157
gta 4 acg 9
aca 22 tac 11
tac 4 caa 6
caa aaa
aga aga
cgg cgg
gga gga
gtc gtc
agg cgt
caa ctc
gcc tcg
tca
atg 9 aac 3
gaa agc
gaa 27
gac
cgt 13 16s 127
gga 159 atc 46
16s 167 gca 172
23s 55 23s 80
5s 13 5s 14
atgf 60 aac 24
gac acc
B14. Fréquence des différences des intercalaires
Entre génomes intra génome
gamme fréquence    gamme fréquence
-15 5 -7 1
-14 -6
-13 -5
-12 -4 1
-11 -3 1
-10 -2
-9 1 -1 2
-8 2 0 9
-7 1 1
-6 2 1
-5 3 3 1
-4 1 4 1
-3 5
-2 6
-1 2 7 1
0 2 2
1 1 total 20
2 1 -2+2 11
3 1
4 2
5 1
6
7 1
8
9 1
10 3
11 1
12 1
13 1
14 1
15
7
total 39
-2+2 6
B1. Bacillus subtilis subsp. subtilis str. 168, blocs à rRNA.
Types
I I1 I2 I3 I4 II II1 II2 II3
16s 167 167 164 164 16s 164 164 164
23s 111 55 55 55 23s 55 55 55
5s 9 20 46 20 5s
5 32 4 4
aac gta aac gta
**15aas **20aas **5aas ** 8aas
III IV
16s 99 99 cgt 13
atc 11 11 gga 159
gca 81 81 16s 167
23s 55 133 23s 55
5s 5s 13
atgf 60
gac
groupe1 groupe2
16s 164 16s 164
I3 23s 55 I4 23s 55
5s 46 5s 20
aac 4 gta 4
**4aas 8 ** 7aas 9
gca 171 gca 170
II1 16s 164 II3 16s 164
23s 55 23s 55
II2 5s 183 5s
16s 164
23s 55
5s

bsu. Intergen51

[modifier | modifier le wikicode]

Intergen51. bsu. Le génome

[modifier | modifier le wikicode]
  • bsu Le prélèvement: Aspl
  • Le nom et le lien NCBI: bsu, Bacillus subtilis subsp. subtilis str. 168, NCBI [4], date 08.02.18.
  • bsu La longueur totale des intercalaires, longueur du génome et taux intercalaires/génome:
Nom	intercals	génome		taux en %			
bsu	434,723		4,215,606	10.3
bsu données intercalaires
[modifier | modifier le wikicode]
bsu données intercalaires 200
[modifier | modifier le wikicode]
bsu autres intercalaires aas
[modifier | modifier le wikicode]

Intergen51. bsu. Les différents types d'intercalaires

[modifier | modifier le wikicode]
  • Lien au tableur: Intergen51. bsu les différents types d'intercalaires.
  • Légende:
    - S pour intercalaire CDS-CDS et R pour tRNA-CDS,
    - c pour intercalaire continu (les 2 gènes sont sur le même brin) et x pour discontinu (les 2 gènes sont sur 2 brins différents, le brin et son complément)
    - %reste = 100*reste/total, le reste étant ce qui reste du total après la fin du diagramme, gamme.
    - %t30 = 100*t30/total, t30 étant le total des fréquences 10 20 30
    - %t5 = 100*t/total, t5 étant le total des fréquences de -1 à -5 dans le diagramme des S-.
Int51.2 bsu les différents types d'intercalaires entre gène
Int51.21 Les différents types
intercalaires CDS-CDS * autres intercalaires
continu S+ S- S0 total c/x RNA-RNA CDS-rRNA total
c 2,487 573 25 3,085 2.7 96 8 104
x 1,091 35 2 1,128 0 2 2
t 3,578 608 27 4,213 96 10 106
% 84.9 14.4 0.6
Int51.22 Détail des * autres intercalaires
intercalaires tRNA-CDS récapitulatif des * autres intercalaires
continu R+ R- R0 total c/x * autres total %
c 12 0 0 12 0.8 tRNA-CDS 28 9
x 16 0 0 16 RNA-RNA 96 30
t 28 0 0 28 CDS-rRNA 10 3
% 100.0 0.0 0.0 non RNA 190 59
- total 324 100
Int51.23 Les taux remarquables
taux %reste %t30 %t5 %0
type S+ R+ S- S+ R+ S- S+ R+
gamme 400 400 6-50 - - - - -
type S+ R+ S- S+ R+ S- S+ R+
c 2.0 0.0 3.0 32.4 0.0 53 0.8 0.0
x 5.5 6.3 20.0 13.1 0.0 40 0.2 0.0

Intergen51. bsu. Les diagrammes CDS-CDS positifs

[modifier | modifier le wikicode]
  • Lien tableur: bsu données intercalaires
  • Diagrammes:
    - fc40, CDS-CDS continu, fréquence unitaire en abscisses et effectif en ordonnées bsu fc40
    - fx%, CDS-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et pourcentage en ‰ par rapport au total, en ordonnées. bsu fx1
  • Équations des courbes de tendance en pour 1000: colonnes %fx %fc
Courbes de tendances pour les diagrammes en pour 1000			Calculs des f.41	bsu
R2	x3		x2		x		c		Inflexion poly3	x	c
0.457	-4.94E-07	5.75E-04	-3.05E-01	62.5	fx1	abscisse	218.1	166.0
0.790	-4.03E-06	3.46E-03	-1.02E+00	109.0	fc1	ordonnée	19.2	23.8
								
0.620	4.31E-07	-2.82E-04	-5.47E-02	40.1	fx41			
0.936	2.33E-06	-1.16E-03	-1.36E-02	47.4	fc41
  • Le rfin après 400 est de 49 sur un total de 2512. Jusqu'à 1% les freq10 sont en continu jusqu'à 510, reste 25. L'indice i.rfin1 = 24/110 = 0.218.
  • Moyennes glissantes fc+400, diagonale. Voir le détail des calculs dans abs.
données	bsu		calculs			poly3	bsu
effect	2512		R2.21	847		abscis	400
xm	45		pte	14,09		flexa	151
ym	8		cste	3,82		flexo	2,59
x1m	200		r400l	200		xm	45
y1m	1		restp	110,67		sup4	137,9
rfin	19,51		%sd	37,55		sup4t	398,1
bornf	138		lond	155		%	34,6
supd	184,6		%sf	37,24		long	106
supdt	491,6		lonf	93		R2	715
xmp	397,69		sf/lf	1,45			
r400	91,16		sr/lr	0,80			
supf	135,1		sd/ld	1,19			
supft	362,7		i.r400	0,46									

Intergen51. bsu. Les CDS-CDS négatifs

[modifier | modifier le wikicode]
Sous-totaux	bsu			totale	
fréquence	x-	c-		x-	c-
 - 1		0	72		4	4140
 - 2		0	4		85	11
 - 3		0	0		3	12
 - 4		14	229		717	10938
 - 5		0	0		5	19
sp6		21	268		1642	8424
total		35	573		2,456	23,544
reste		7	17		264	420
s6		4	0		361	41
s7		6	42		321	1438
s8		4	209		696	6525
rappot s1-5						
4/2/1		-	3.2		8.4	2.6
% / sp6						
s6/sp6		19.0	0.0		22.0	0.5
s7/sp6		28.6	15.7		19.5	17.1
s8/sp6		19.0	78.0		42.4	77.5
reste/sp6	33.3	6.3		16.1	5.0
						
total s1-5	14	305		814	15120
% / total						
%s1-5		40.0	53.2		33.1	64.2
%sp6		60.0	46.8		66.9	35.8

Intergen51. bsu. Les intercalaires des blocs

[modifier | modifier le wikicode]
  • Le détail
RNA-RNA		c	x		CDS-RNA		c	x
23s 5s		10			CDS 16s		4	1
16s 23s		8			5s CDS		3	1
16s tRNA	2			16 CDS			
tRNA 23s	2			CDS 5s			
5s tRNA		5			23s CDS			
tRNA in		2			CDS 23s			
tRNA contig	50			5s 16s		1	
tRNA hors	14			16s16s			
tRNA 16s	3						
23s tRNA								
tRNA 5s								
16s 5s								
5s 23s								
5s 5s								
total		96	0		total		8	2
  • Les rares voir gamma pour la longueur des intercalaires
  • Les tRNA-CDS compris, comparaison dans le clade et dans l'étude.

Intergen51. bsu. Les intercalaires tRNA-tRNA extra bloc

[modifier | modifier le wikicode]
Int51.31 bsu. Les intercalaires tRNA-tRNA extra blocs
contig contig contig hors
inter aa    inter aa    inter aa    inter aa
4 gta 5 aac 25 gaa 9 atgj
36 aca 34 tcc 3 agc ** gaa
6 aaa 9 gaa 10 aac 3 gaa
40 cta 9 gta 15 atc 4 gta
14 ggc 11 atgf 10 gga 22 aca
9 tta 12 gac 17 cac 4 tac
27 cgt 5 ttc 12 ttc ** caa
9 cca 22 aca 11 gac 4 aac
** gca 5 tac 17 atgf 29 agc
4 aac 24 tgg 6 tca 11 gaa
56 acc 9 cac 2 atgi 26 caa
30 ggc 49 caa 19 atgj 11 aaa
27 cgt 5 ggc 5 gca 80 cta
8 cca 7 tgc 15 cca ** ctc
** gca 265 tta 9 cgt 35 ttc
13 cgt ** ttg 14 tta 81 gac
** gga 5 ggc 9 gaa
60 atgf 10 ctg ** aaa
** gac 37 aaa
32 aca
** gta

bsu intercalaires entre cds

[modifier | modifier le wikicode]
  • Lien NCBI [5]
  • Note: Pour les génomes des annexes j'ai relevé les intercalaires entre tRNAs et entre ceux-ci et les cds qui leur sont adjacents. L'exemple est celui de rru du clade alpha. L'idée de départ de ces prélèvements est la recherche d'opérons formés de tRNA et de protéine comme dans le cas d'E.coli: l'intercalaire entre le tRNA et la protéine devrait être faible. Voir l'exemple d'eco (remarque @3) avec tac-tac-tpr et aca-tac-gga-acc-tufB.

bsu intercalaires positifs S+

[modifier | modifier le wikicode]
bsu. Sx+ Sc+ Les diagrammes 400
bsu Sx+ Sc+
Poly3 -7 -5 -3 1 R2 flex x+ comment. -7 -5 -3 1 R2 flex c+ comment.
1 à 400 -6.4 69 -338 67 458 359 max40 -41 352 -1040 112 790 286 min50
51 à 400 48 -359 711 -11 861 249 2 parties 12 -27 -230 64 954 75 2 parties
droite -a cste - R2 note R2’ -a cste - R2 note R2’
1 à 400 152 56 - 440 dte 18 max40 211 68 617 poly 173 SF
51 à 400 94 40 - 694 poly 167 tF 145 50 - 850 poly 104 tF
  • Légende du tableau corrélations et faibles fréquences
bsu. Sx+ Sc+ Les diagrammes 400. Corrélations et les fréquences faibles 1-30
effectifs diagramme corrélation x+ c+, 41-n corrélation x+ c+, 1-n
gen minima x+ c+ total 400 200 250 diff 200 250 400
eco min20 1003 2130 3133 735 296 440 144 -178 -64 287
bsu min10 1028 2444 3472 659 8 282 274 152 257 470
rtb min30 118 402 520 536 -105 148 253 -277 -165 202
1-30 ‰ effectifs 0 ‰ <0 ‰ effectifs 1-40 corel
1-30 x+ 1-30 c+ x+/c+ x c x c x- c- x+ c+ x+/c+
63 348 0.18 1169 2855 11 6 80 226 126 821 -119
140 333 0.42 1125 3091 2 8 31 186 302 936 -432
51 294 0.17 189 604 5 7 21 162 8 131 -81
  • Diagrammes 400:  bsu eco,   diagramme 1-40: c+ bsuc+ ecox+ bsux+ ecototal,   texte: eco.
  • Résumé: J’ai classé les 21 génomes suivant la forme des diagrammes x+ 1-400. J’ai obtenu 3 groupes,
    1. Les tildes au nombre de 5. Ils sont réguliers et forts, tF, avec un R2’ supérieur à 138 pour 4 d’entre eux et scc avec 71. Ce sont, cbei mba pmq et blo scc.
    2. Les formes S au nombre de 6. Leurs forces (R2’) sont variables, ade rru Sf 20-39, ant mja Sm 70-78, pmg pub SF 179-249.
    3. Les diagrammes à pyramide, c’est à dire présentant une bosse avec 4 ou 5 points contigus. Ils sont au nombre de 10 dont 9 sont des tildes et bsu est un Sf très faible (R2’18). abra rtb spl afn sont des tF avec plus de 96, ase cbn cvi sont des tf avec moins de 30, eco myr sont des tm 43 68.
    - bsu ressemble beaucoup à eco comme on vient de le voir avec des courbes x+ 1-400 à pyramide et de forme tilde moyen pour eco (R2’ 43) et Sf pour bsu (R2’ 18). Ils ont des effectifs égaux 3133 contre 3472.
    - Les diagrammes 400
    • x+ 1-400:
      + Les 2 génomes ont une pyramide à 4 fréquences avec un maximum à 50 pour eco contre 40 pour bsu. Quand j’enlève les 3 fréquences faibles de eco pour ne laisser que la pyramide, sa courbe devient une S faible, Sf, R2’ à 36 et la courbe bsu sans la fréquence 10 devient une S moyenne, Sm, R2’ à 60. Je n’ai pas représenté les courbes x+ 31-400 à cause des taux peu élevés des fréquences faibles 1-30, 65 pour eco et 140 pour bsu.
      + Les fréquences faibles 1-30 sont en opposition avec celles de bsu c+1-400 et en parallèle avec eco. Cette différence va impacter différemment les corrélations 1-n qu’on verra plus loin.
      + Les points d’inflexion sont normaux mais nettement différents, 359 pour bsu contre 230 pour eco, différence due à la différence de forme.
    • c+ 1-400: Ce sont 2 courbes presque identiques de formes S fort avec un R2’ de 173 pour bsu contre 265 et des 2 points d’inflexion normaux, 286 pour bsu et 255 pour eco.
    • x+ 31-400: Je n’ai pas représenté les courbes x+ 31-400 à cause des taux peu élevés des fréquences faibles 1-30, 140 et 65. Il faudrait les remplacer par les courbes avec pyramide seule sans les fréquences faibles 1-30, voir le paragraphe x+ 1-400 ci-dessus. Néanmoins j’ai fait la courbe qui donne un SF avec un R2’ de 121 (R2 554 433 pour la droite) et celle d’eco qui a donné un Sf de 36 (R2 742 706 pour la droite). Il y a encore une bonne ressemblance.
    • x+ 51-400: A la place de 31-400 j’ai fait pour bsu 51-400, sans la pyramide et j’ai obtenu un tilde très fort, tF, avec un R2’ de 167 (861 694). Avec eco j’ai fait la courbe 71-400 pour respecter la modification faite sur bsu et j’ai obtenu là aussi un tilde très fort, tF, avec un R2’ de 120 (835 715) donc on a le même ordre de grandeur.
    • c+ 31-400: j’ai fait la courbe de bsu qui a donné un tilde fort, tF, avec un R2’ de 80 (942 862). La courbe d’eco avait donné un tilde moyen, R2’ 67 (948 881). Encore même ordre de grandeur. La différence entre les courbes est le point d’inflexion, négatif et grand chez eco -407, positif et normal chez bsu 150 environ.
    • c+ 51-400: A la place de 31-400 j’ai fait pour bsu 51-400, sans la pyramide et j’ai obtenu un tilde très fort, tF, avec un R2’ de 104 (954 850). Avec eco j’ai fait la courbe 71-400 pour respecter la modification faite sur bsu et j’ai obtenu par contre là, un S fort, SF, avec un R2’ de 94 (956 862) donc là les 2 génomes diffèrent.
    - Les corrélations:
    • Sur les plages 41-n: Les 2 corrélations sur 41-250 sont nettement différentes, la corrélation de bsu devient faible, 282, alors qu’eco reste moyenne, 440. Sur 41-200, elles chutent toutes les 2 fortement avec une différence (diff) de 144 pour eco et 274 pour bsu qui devient quasi nulle, 8. 178 -64
    • Sur les plages 1-n: Le rapport x+/c+ des faibles fréquences que j’ai mentionnées au paragraphe x+ 1-400 agissent fortement sur les corrélations 1-n.
      + Chez eco il y a très peu de faibles fréquences 1-30, avec un rapport de 0.18, d’où des corrélations sur 1-n négatives, -178 pour 1-200 et -64 pour 1-250.
      + Chez bsu il y a beaucoup plus de faibles fréquences 1-30, avec un rapport de 0.42, d’où des corrélations sur les plages 1-n positives qui améliorent celles des plages 41-n. La corrélation de 282 sur 41-250 est maintenue à 257, grâces aux taux élevés des fréquences faibles dans x+ 1-400.
    - Les faibles fréquences: Les faibles fréquences 1-30 ne sont intéressantes à comparer que pour les génomes à courbes 1-400 semblables où le taux de ces fréquences sont élevés et évoluent en parallèle comme entre pmg et pub où le rapport x+/c+ passe de 0.78 à 0.51. Bsu en a beaucoup dans x+ par rapport à eco, 0.42 contre 0.18. Ce rapport explique bien le comportement des corrélations de bsu sur les plages 1-n où les faibles fréquences maintiennent et améliorent même celles des plages 41-n. L’absence notable des faibles fréquences de eco explique la chute de ses corrélations sur les plages 1-n par rapport à celles des plages. Les zéros sont à 10‰ pour bsu et 17‰ pour eco, avantage donné par les x+. Le taux des négatifs est presque le même pour les 2 génomes, 217‰ contre 306‰ pour eco, avec un déficit en x- chez bsu.
    - Les courbes 1-40:
    • c+ 1-40: Les 2 courbes sont semblables et très proches de celle du total des c+ 1-40.
    • x+ 1-40: Avec des effectifs élevés, 302 pour bsu et 126 pour eco, et des corrélations (corel) fortement négatives, l’éloignement du modèle c+ 1-40 est sans équivoques, les 2 courbes croissent régulièrement au lieu de présenter un creux à la fréquence 7 suivi d’une bosse à la fréquence 11.

bsu autres intercalaires

[modifier | modifier le wikicode]
  • Lien tableur: bsu autres intercalaires aas
  • Légende:  
    - comp, le gène est sur le brin complement
    - deb, fin sont respectivement dans le sens des adresses croissantes, le cds avant le 1er tRNA et le cds après le dernier tRNA du bloc.
    - misc_f, pour misc_feature
    - misc_R, pour misc_RNA
  • Totaux
tRNA-cds 			tRNA-tRNA		autres-cds		total	
gen	c+	x+	x-	c+	x+	c-	c+	x+	c-		
	19	19		97			169	1	17	322	2 misc-misc
  • Méthode de calculs des intercalaires autres que les CDS-CDS voir le cas de amed.

Listeria monocytogenes

[modifier | modifier le wikicode]
  • Liens: gtRNAdb [6], NCBI [7]
  • Lien tableur: lmo
B2. Listeria monocytogenes EGD-e
37.9%GC 7.3.19 Paris  67  doubles intercal
82705..82777 aag
237466..239020 16s @1 244
239265..242195 23s 80
242276..242385 5s 13
242399..242471 gta 8
242480..242555 aca 41
242597..242669 aaa 5
242675..242756 cta 14
242771..242842 ggc 21
242864..242949 tta 12
242962..243035 cgt 10
243046..243119 cca 19
243139..243214 gca 341
243556..245041 16s 244
245286..248216 23s 80
248297..248406 5s
677464..677553 tcg
936656..936728 aac 3
936732..936819 agc
940017..940088 gaa 27
940116..940188 gac
970867..970937 gga
1266675..1266748 aga
comp 1740916..1740987 gaa 5
comp 1740993..1741083 agc 34
comp 1741118..1741190 aac 6
comp 1741197..1741270 atc 25
comp 1741296..1741366 gga 23
comp 1741390..1741462 cac 28
comp 1741491..1741563 ttc 4
comp 1741568..1741643 gac 4
comp 1741648..1741721 atgf 42
comp 1741764..1741853 tca 22
comp 1741876..1741949 atgi 11
comp 1741961..1742034 atgj 42
comp 1742077..1742149 gca 22
comp 1742172..1742245 cca 10
comp 1742256..1742329 cgt 9
comp 1742339..1742424 tta 14
comp 1742439..1742513 ggc 15
comp 1742529..1742610 cta 5
comp 1742616..1742688 aaa 41
comp 1742730..1742805 aca 8
comp 1742814..1742886 gta 13
comp 1742900..1743009 5s 81
comp 1743091..1746021 23s 244
comp 1746266..1747811 16s
1776112..1776183 cgt
comp 1848821..1848930 5s 81
comp 1849012..1851942 23s 244
comp 1852187..1853732 16s
2162187..2162273 ctc
2215375..2215446 gaa 157
2215604..2215677 acg 9
2215687..2215770 tac 11
2215782..2215856 caa 6
2215863..2215935 aaa
comp 2436493..2436576 ttg 45
comp 2436622..2436695 tgc 19
comp 2436715..2436786 ggc 5
comp 2436792..2436863 caa 29
comp 2436893..2436965 cac 15
comp 2436981..2437054 tgg 7
comp 2437062..2437145 tac 20
comp 2437166..2437238 ttc 4
comp 2437243..2437318 gac 6
comp 2437325..2437398 atgf 21
comp 2437420..2437495 gta 56
comp 2437552..2437623 gaa 33
comp 2437657..2437745 tcc 6
comp 2437752..2437827 aac 14
comp 2437842..2437951 5s 80
comp 2438032..2440962 23s 172
comp 2441135..2441210 gca 46
comp 2441257..2441330 atc 127
comp 2441458..2443003 16s @2
comp 2540230..2540301 cgg
comp 2672664..2672736 acc 24
comp 2672761..2672836 aac 14
comp 2672851..2672960 5s 80
comp 2673041..2675971 23s 172
comp 2676144..2676219 gca 46
comp 2676266..2676339 atc 127
comp 2676467..2678012 16s
2930362..2930434 gtc
  • Note: Les statistiques sur les intercalaires entre tRNA ne sont pas correctes. Se reporter à intergen51.lmo. Il n'y a aucun commentaire sur les CDS. J'ai réduit le tableau aux clusters à rRNA. L'intitulé opéron doit d'être compris dans le sens cluster ou bloc de RNA, rRNA ou tRNA.
lmo cumuls	opérons		effectif
avec rRNA	opérons		6
		16 23 5s 0	2
		16 atc gca	2
		16 23 5s a	2
		max a		21
		a doubles	0
		spéciaux	0
		total aas	50
sans 		opérons		11
		1 aa		8
		max a		5
		a doubles	0
		total aas	17
total aas			67
remarques			2
B2. Listeria monocytogenes EGD-e, blocs à rRNA.
Types
I I1 I2  I3 I4    II II1 II2
16s 244 244 16s 244 244
23s 81 80 23s 80 81
5s 13 13 5s
8 8
gta gta
**20aas **8aas
III IV
16s 127 127
atc 46 46
gca 172 172
23s 80 80
5s 14 14
6 24
aac aac
**13aas acc
Groupes
16s 244
I4 23s 80
5s 13
gta 8
**7aas 19
gca 341
16s 244
II1 23s 80
5s
  • Nombre de gènes protéines: 2867 (KEGG)
*Remarques : lmo-bsu (ref. sont les 1ers génomes de cette étude qui m’ont poussé à étendre	
	l’échantillon. Lma* lmo et bsu sont des bacilli et donc ont des points communs
	en termes d’opréons à RNAs avec des taux %GC très proches 38-44 %.
	
@1	Blocs 16-23-5s : il y en a 4 dont 1 sans aas et 2 réunis dans un seul opéron.
	- Dans la 1ère étude ces blocs paraissaient arborer les séquences les plus longues 
	d’aas et j’attribuait la longueur de 16 aas de l’opéron 16-act-gca à un remaniement 
	entre opérons.  Ce n’est plus le cas puisqu’il s’est avéré que ces derniers sont plus 
	courants et peuvent être aussi long que les premiers avec 18 aas chez lam (ref..
	- Les intercalaires sont les mêmes pour les 4 blocs 16-23-5s,  244 80 13.
	- L'opéron à 2 blocs: le 2ème n'ayant pas d'aa à la suite de 5s et ayant une
	intercalaire du côté de 16s, très élevée, 341 bases, pourrait être un solitaire.
	
@2	Blocs 16-atc-gca : il y en a 2 dont un  le fameux 16aas et l’autre avec 4 aas.
	- Les intercalaires sont les mêmes pour les 2 opérons, 127 46 172 80 14.
	- Ils partagent les mêmes intercalaires 5s-aa avec les blocs 16-23-5s-aa, 80 13.
	
Séquences des doubles : aucun double sur 7 opérons à 2 aas et plus. Comme bsu.	

lmo distribution

[modifier | modifier le wikicode]
  • Lien tableur: lmo distribution
  • Notes:- Les 1-3aas après 5s, +5s, sont soulignés:aac acc.
Bc2 lmo, Listeria monocytogenes EGD-e. bacilli.
bc21 lmo, distribution des blocs sans rRNA
g1    t1       
atgi tct tat atgf
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc tcc tac 1 tgc
atc 2 acc aac 1 agc 1
ctc 1 ccc cac cgt 1
gtc 1 gcc gac 1 ggc
tta tca taa tga
ata aca aaa 1 aga 1
cta cca caa 1 cga
gta gca 2 gaa 2 gga 1
ttg tcg 1 tag tgg
atgj acg 1 aag 1 agg
ctg ccg cag cgg 1
gtg gcg gag ggg
baci >1aa =1aa -5s +5s -16s +16s total
lmo 9 8 4 21
bc22 lmo. Distribution des blocs avec rRNA.
g1    t1       
atgi 1 tct tat atgf 2
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc 2 tcc 1 tac 1 tgc 1
atc 1 acc 1 aac 3 agc 1
ctc ccc cac 2 cgt 2
gtc gcc gac 2 ggc 3
tta 2 tca 1 taa tga
ata aca 2 aaa 2 aga
cta 2 cca 2 caa 1 cga
gta 3 gca 2 gaa 2 gga 1
ttg 1 tcg tag tgg 1
atgj 1 acg aag agg
ctg ccg cag cgg
gtg gcg gag ggg
baci >1aa =1aa -5s +5s -16s +16s total
lmo 46 46

lmo. Intergen51

[modifier | modifier le wikicode]

Intergen51. lmo. Le génome

[modifier | modifier le wikicode]
  • lmo Le prélèvement: Abacilli
  • Le nom et le lien NCBI: lmo, Listeria monocytogenes EGD-e, NCBI [8], date 27.2.15.
  • lmo La longueur totale des intercalaires, longueur du génome et taux intercalaires/génome:
Nom	intercals	génome		taux en %			
lmo	288,032		2,944,528	9.8	
lmo données intercalaires
[modifier | modifier le wikicode]
lmo autres intercalaires aas
[modifier | modifier le wikicode]

Intergen51. lmo. Les différents types d'intercalaires

[modifier | modifier le wikicode]
  • Lien au tableur: Intergen51. lmo les différents types d'intercalaires.
  • Légende:
    - S pour intercalaire CDS-CDS et R pour tRNA-CDS,
    - c pour intercalaire continu (les 2 gènes sont sur le même brin) et x pour discontinu (les 2 gènes sont sur 2 brins différents, le brin et son complément)
    - %reste = 100*reste/total, le reste étant ce qui reste du total après la fin du diagramme, gamme.
    - %t30 = 100*t30/total, t30 étant le total des fréquences 10 20 30
    - %t5 = 100*t/total, t5 étant le total des fréquences de -1 à -5 dans le diagramme des S-.
Int51.2 lmo les différents types d'intercalaires entre gène
Int51.21 Les différents types
intercalaires CDS-CDS * autres intercalaires
continu S+ S- S0 total c/x RNA-RNA CDS-rRNA total
c 1,822 393 27 2,242 3.8 69 7 76
x 586 10 1 597 0 0 0
t 2,408 403 28 2,839 69 7 76
% 84.8 14.2 1.0
Int51.22 Détail des * autres intercalaires
intercalaires tRNA-CDS récapitulatif des * autres intercalaires
continu R+ R- R0 total c/x * autres total %
c 15 0 0 15 1.5 tRNA-CDS 25 25
x 10 0 0 10 RNA-RNA 69 68
t 25 0 0 25 CDS-rRNA 7 7
% 100.0 0.0 0.0 non RNA 0 0
- total 101 100
Int51.23 Les taux remarquables
taux %reste %t30 %t5 %0
type S+ R+ S- S+ R+ S- S+ R+
gamme 400 400 6-50 - - - - -
type S+ R+ S- S+ R+ S- S+ R+
c 2.8 0.0 1.8 36.5 6.7 60 1.2 0.0
x 6.3 10.0 10.0 8.5 0.0 30 0.2 0.0

Intergen51. lmo. Les diagrammes CDS-CDS positifs

[modifier | modifier le wikicode]
  • Lien tableur: lmo données intercalaires
  • Diagrammes:
    - fc40, CDS-CDS continu, fréquence unitaire en abscisses et effectif en ordonnées lmo fc40
    - fx%, CDS-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et pourcentage en ‰ par rapport au total, en ordonnées. lmo fx1
  • Équations des courbes de tendance en pour 1000: colonnes %fx %fc
Courbes de tendances pour les diagrammes en pour 1000			Calculs des f.41	lmo
R2	x3		x2		x		c		Inflexion poly3	x	c
0.325	1.78E-07	2.12E-04	-2.46E-01	59.10	fx1	abscisse	255.6	201.9
0.671	-6.21E-06	4.88E-03	-1.27E+00	118.0	fc1	ordonnée	14.4	17.0
								
0.418	-5.23E-06	4.01E-03	-1.03E+00	103.0	fx41			
0.850	3.17E-06	-1.92E-03	2.08E-01	27.2	fc41
  • Le rfin après 400 est de 51 sur un total de 1849. Jusqu'à 1% les freq10 sont en continu jusqu'à 600, reste 19. L'indice i.rfin1 = 32/200 = 0.160.
  • Moyennes glissantes fc+400, diagonale. Voir le détail des calculs dans abs.
données	lmo		calculs			poly3	lmo
effect	1849		R2.21	816		abscis	400
xm	45		pte	6,10		flexa	193
ym	3,70		cste	2,28		flexo	1,78
x1m	209		r400l	191		xm	45
y1m	1		restp	125,47		sup4	188,0
rfin	27,58		%sd	48,43		sup4t	427,3
bornf	140		lond	164		%	44,0
supd	217,7		%sf	51,37		long	148
supdt	449,4		lonf	95		R2	626
xmp	425,09		sf/lf	1,76			
r400	97,89		sr/lr	0,73			
supf	167,5		sd/ld	1,33			
supft	326,1		i.r400	0,51										

Intergen51. lmo. Les CDS-CDS négatifs

[modifier | modifier le wikicode]
Sous-totaux	lmo			totale	
fréquence	x-	c-		x-	c-
 - 1		0	61		4	4140
 - 2		0	0		85	11
 - 3		0	0		3	12
 - 4		3	173		717	10938
 - 5		0	0		5	19
sp6		7	159		1642	8424
total		10	393		2,456	23,544
reste		1	7		264	420
s6		1	0		361	41
s7		3	18		321	1438
s8		2	134		696	6525
rappot s1-5						
4/2/1		-	2.8		8.4	2.6
% / sp6						
s6/sp6		14.3	0.0		22.0	0.5
s7/sp6		42.9	11.3		19.5	17.1
s8/sp6		28.6	84.3		42.4	77.5
reste/sp6	14.3	4.4		16.1	5.0
						
total s1-5	3	234		814	15120
% / total						
%s1-5		30.0	59.5		33.1	64.2
%sp6		70.0	40.5		66.9	35.8

Intergen51. lmo. Les intercalaires des blocs

[modifier | modifier le wikicode]
  • Le détail
RNA-RNA		c	x		CDS-RNA		c	x
23s 5s		6			CDS 16s		5	
16s 23s		4			5s CDS		2	
16s tRNA	2			16 CDS			
tRNA 23s	2			CDS 5s			
5s tRNA		4			23s CDS			
tRNA in		2			CDS 23s			
tRNA contig	42			5s 16s			
tRNA hors	6			16s16s			
tRNA 16s	1						
23s tRNA								
tRNA 5s								
16s 5s								
5s 23s								
5s 5s								
total		69	0		total		7	0
  • Les rares voir gamma pour la longueur des intercalaires
  • Les tRNA-CDS compris, comparaison dans le clade et dans l'étude.

Intergen51. lmo. Les intercalaires tRNA-tRNA extra bloc

[modifier | modifier le wikicode]
Int51.31 lmo. Les intercalaires tRNA-tRNA extra blocs
cont1 cont2 cont3
inter aa    inter aa    inter aa
5 gaa 45 ttg 8 gta
34 agc 19 tgc 41 aca
6 aac 5 ggc 5 aaa
25 atc 29 caa 14 cta
23 gga 15 cac 21 ggc
28 cac 7 tgg 12 tta
4 ttc 20 tac 10 cgt
4 gac 4 ttc 19 cca
42 atgf 6 gac ** gca
22 tca 21 atgf 24 acc
11 atgi 56 gta ** aac
42 atgj 33 gaa hors
22 gca 6 tcc 3 aac
10 cca ** aac ** agc
9 cgt 27 gaa
14 tta ** gac
15 ggc 157 gaa
5 cta 9 acg
41 aaa 11 tac
8 aca 6 caa
** gta ** aaa
-

Lactobacillus amylovorus strain 30SC

[modifier | modifier le wikicode]
  • Liens: gtRNAdb [9], NCBI [10]
  • Lien tableur: lam
  • Légende:
    -cds1, hp 186: hypothetical protein, 186 pb, MESRNTKRSIQSKRKHTEKLCLVLRVVPQGVSTLKTEYNPSKKPRQSKRTDCRATEKRILE
    -cds2, hp 186: hypothetical protein, 186 pb, MESRNTKRSIQSKRKHTEKLCLVLRVVPQRVSTLKTEYNPSKKPRQSKRTDCRATEKRILE
B3. Lactobacillus amylovorus strain 30SC
38%GC 30.6.19 Paris 63 doubles intercal
447399..448972 16s @1 125
449098..449172 atc 52
449225..449297 gca 115
449413..452324 23s 68
452393..452509 5s 4
452514..452586 gta 2
452589..452661 aaa 13
452675..452756 cta 23
452780..452852 aca 10
452863..452934 ggc 11
452946..453031 tta 8
453040..453113 cgt 5
453119..453192 cca 29
453222..453295 atg 12
453308..453381 atgi 27
453409..453482 atgf 3
453486..453559 gac 6
453566..453638 ttc 19
453658..453728 gga 5
453734..453808 atc 2
453811..453900 agc
57091..58664 16s 125
58790..58864 atc 52
58917..58989 gca 115
59105..62016 23s 68
62085..62201 5s 13
62215..62287 aac
469566..471139 16s @2 9
471149..471334 cds1 hp 186 -3
471332..474243 23s 68
474312..474428 5s 13
474442..474514 aac
comp 1709284..1709374 tcc 10
comp 1709385..1709457 aac 13
comp 1709471..1709587 5s 68
comp 1709656..1712567 23s -3
comp 1712565..1712750 cds2 hp 186 9
comp 1712760..1714333 16s
comp 79386..79458 aag
comp 79913..79985 aag
193922..193994 acc
comp 210866..210939 ggg
287678..287752 ggc + 111
287864..287938 ggc 3 ggc 109
288048..288122 ggc 35
288158..288231 ccg
457611..457682 gaa 35
457718..457804 tca 9
457814..457887 atgf 3
457891..457964 gac 6
457971..458046 ttc 4
458051..458132 tac 4
458137..458207 tgg 12
458220..458295 cac 4
458300..458371 caa 23
458395..458465 tgc 40
458506..458590 ttg
474442..474514 aac
507688..507760 acg
526886..526957 caa
551550..551631 tac 34
551666..551737 caa
567329..567416 ctt
583327..583413 tca 6
583420..583493 gac 7
583501..583576 cac 4
583581..583653 gta
642034..642106 agg
comp 729370..729441 cgg
784793..784864 gag
917887..917975 tcg
1456724..1456800 aga
1681218..1681301 ctg
comp 1707998..1708070 gta 5
comp 1708076..1708147 gaa
1987190..1987263 cgt 8
1987272..1987345 cca
  • Note: Les statistiques sur les intercalaires entre tRNA ne sont pas correctes. Se reporter à intergen51.lam. Il n'y a aucun commentaire sur les CDS. J'ai réduit le tableau aux clusters à rRNA. L'intitulé opéron doit d'être compris dans le sens cluster ou bloc de RNA, rRNA ou tRNA.
lam cumuls	opérons		effectif
avec rRNA	opérons		4
		16 23 5s 0	0
		16 atc gca	2
		16 23 5s a	0
		max a		18
		a doubles	0
		spéciaux	2
		total aas	24
sans 		opérons		20
		1 aa		14
		max a		11
		a doubles	1
		total aas	39
total aas			63
remarques			2
B3. lam, blocs à rRNA.
16s 125 1574 16s 9 1574
atc 52 cds1 -3 62
gca 115 23s 68 2912
23s 68 2912 5s 13 117
5s 4 117 aac
gta
16s 125 1574 16s 9 1574
atc 52 cds2 -3 62
gca 115 23s 68 2912
23s 68 2912 5s 13 117
5s 13 117 aac
aac
*Remarques : pratiquement pas de doublons, 1 seul triplet dans 1 opéron sur 11.	
	- Que des blocs de type 16-atcgca, il y en a 4.
	
@1	Les 2 blocs 16-atcgca sont standard comme dans bsu et lmo (ref..
	- Ils ont les mêmes intercalaires du début, 125 52 115 68 13.
	- un opéron avec 1 aa en plus, aac comme dans bsu-lmo.
	- un opéron à 18 aas plus grand que celui de lmo avec 16.
	
@2	Les 2 blocs 16s-protéine-23s-5s.  Ressemblance avec  EFTU.
	- très petite protéine, 62 aas.
	- Dans les 2 cas les intercalaires sont les mêmes, 9 -3 68 13
	- Notez le -3 pour le stop.
	- les intercalaires 25s-5s-aac sont à peu près les mêmes que les 
	Blocs 16 atc gca 23-5s-aa, 68 13.
	contrôle du 3.10.20: les 2 cds ont disparus dans NCBI du 31.7.2020.
Séquences des doubles :  pratiquement pas de doublons, 1 seul triplet dans 1 opéron sur 11	
	opérons à plus de 2 aas.

lam distribution

[modifier | modifier le wikicode]
  • Lien tableur: lam distribution
  • Notes:
    - Les 1-3aas après 5s, +5s, sont soulignés: 3 aac et tcc.
    - duplicata: ggc3
Bc3 lam, Lactobacillus amylovorus strain 30SC. bacilli.
bc31 lam, distribution des blocs sans rRNA
g1    t1       
atgi tct tat atgf 1
att act aat agt
ctt 1 cct cat cgc
gtt gct gat ggt
ttc 1 tcc tac 2 tgc 1
atc 2 acc 1 aac 1 agc
ctc ccc cac 2 cgt 1
gtc gcc gac 2 ggc 3
tta tca 2 taa tga
ata aca aaa aga 1
cta cca 1 caa 3 cga
gta 2 gca 2 gaa 2 gga
ttg 1 tcg 1 tag tgg 1
atgj acg 1 aag 2 agg 1
ctg 1 ccg 1 cag cgg 1
gtg gcg gag 1 ggg 1
baci >1aa =1aa -5s +5s -16s +16s total
lam 25 14 4 43
bc32 lam. Distribution des blocs avec rRNA.
g1    t1       
atgi 1 tct tat atgf 1
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc 1 tcc 1 tac tgc
atc 1 acc aac 3 agc 1
ctc ccc cac cgt 1
gtc gcc gac 1 ggc 1
tta 1 tca taa tga
ata aca 1 aaa 1 aga
cta 1 cca 1 caa cga
gta 1 gca gaa gga 1
ttg tcg tag tgg
atgj 1 acg aag agg
ctg ccg cag cgg
gtg gcg gag ggg
baci >1aa =1aa -5s +5s -16s +16s total
lam 20 20

lam. Intergen51

[modifier | modifier le wikicode]

Intergen51. lam. Le génome

[modifier | modifier le wikicode]
  • lam Le prélèvement: Abacilli
  • Le nom et le lien NCBI: lam, Lactobacillus amylovorus, NCBI [11], date 6.3.22.
  • lam La longueur totale des intercalaires, longueur du génome et taux intercalaires/génome:
Nom	intercals	génome		taux en %			
lam	210,907		2,078,001	10.1	
lam données intercalaires
[modifier | modifier le wikicode]
lam données intercalaires 200
[modifier | modifier le wikicode]
lam autres intercalaires aas
[modifier | modifier le wikicode]

Intergen51. lam. Les différents types d'intercalaires

[modifier | modifier le wikicode]
  • Lien au tableur: Intergen51. lam les différents types d'intercalaires.
  • Légende:
    - S pour intercalaire CDS-CDS et R pour tRNA-CDS,
    - c pour intercalaire continu (les 2 gènes sont sur le même brin) et x pour discontinu (les 2 gènes sont sur 2 brins différents, le brin et son complément)
    - %reste = 100*reste/total, le reste étant ce qui reste du total après la fin du diagramme, gamme.
    - %t30 = 100*t30/total, t30 étant le total des fréquences 10 20 30
    - %t5 = 100*t/total, t5 étant le total des fréquences de -1 à -5 dans le diagramme des S-.
Int51.2 lam les différents types d'intercalaires entre gène
Int51.21 Les différents types
intercalaires CDS-CDS * autres intercalaires
continu S+ S- S0 total c/x RNA-RNA CDS-rRNA total
c 1,232 272 16 1,520 3.1 51 2 53
x 481 15 2 498 0 2 2
t 1,713 287 18 2,018 51 4 55
% 84.9 14.2 0.9
Int51.22 Détail des * autres intercalaires
intercalaires tRNA-CDS récapitulatif des * autres intercalaires
continu R+ R- R0 total c/x * autres total %
c 28 0 0 28 1.9 tRNA-CDS 43 28
x 15 0 0 15 RNA-RNA 51 34
t 43 0 0 43 CDS-rRNA 4 3
% 100.0 0.0 0.0 non RNA 54 36
- total 152 100
Int51.23 Les taux remarquables
taux %reste %t30 %t5 %0
type S+ R+ S- S+ R+ S- S+ R+
gamme 400 400 6-50 - - - - -
type S+ R+ S- S+ R+ S- S+ R+
c 2.0 0.0 0.0 34.8 0.0 53 1.1 0.0
x 5.6 0.0 0.0 4.8 0.0 53 0.4 0.0

Intergen51. lam. Les diagrammes CDS-CDS positifs

[modifier | modifier le wikicode]
  • Lien tableur: lam données intercalaires
  • Diagrammes:
    - fc40, CDS-CDS continu, fréquence unitaire en abscisses et effectif en ordonnées lam fc40
    - fx%, CDS-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et pourcentage en ‰ par rapport au total, en ordonnées. lam fx1
    - fc%, CDS-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et pourcentage en ‰ par rapport au total, en ordonnées. lam fc1
  • Équations des courbes de tendance en pour 1000: colonnes %fx %fc
Courbes de tendances pour les diagrammes en pour 1000			Calculs des f.41	lam
R2	x3		x2		x		c		Inflexion poly3	x	c
0.608	4.90E-06	-3.13E-03	4.29E-01	26.70	fx1	abscisse	295.7	148,9	
0.769	-6.64E-06	5.24E-03	-1.36E+00	123.0	fc1	ordonnée	11.2	24,9
								
0.835	-2.66E-06	2.36E-03	-7.69E-01	101.0	fx41			
0.840	1,85E-06	-8,25E-04	-6,50E-02	46.8	fc31
  • Le rfin après 400 est de 25 sur un total de 1248. Jusqu'à 1% les freq10 sont en continu jusqu'à 520, reste 12. L'indice i.rfin1 = 13/120 = 0.108.
  • Moyennes glissantes fc+400, diagonale. Voir le détail des calculs dans abs.
données	lam		calculs			poly3	lam
effect	1248		R2.21	838		abscis	400
xm	35		pte	9,96		flexa	120
ym	3,25		cste	2,95		flexo	2,93
x1m	196		r400l	204		xm	35
y1m	1		restp	140,22		sup4	120,0
rfin	20,03		%sd	45,44		sup4t	349,4
bornf	128		lond	161		%	34,4
supd	221,0		%sf	48,43		long	85
supdt	486,4		lonf	93		R2	544
xmp	373,40		sf/lf	1,94			
r400	120,19		sr/lr	0,60			
supf	180,1		sd/ld	1,37			
supft	371,8		i.r400	0,59							

Intergen51. lam. Les CDS-CDS négatifs

[modifier | modifier le wikicode]
Sous-totaux	lam			totale	
fréquence	x-	c-		x-	c-
 - 1		0	96		4	4140
 - 2		0	0		85	11
 - 3		0	0		3	12
 - 4		8	49		717	10938
 - 5		0	0		5	19
sp6		7	127		1642	8424
total		15	272		2,456	23,544
reste		0	0		264	420
s6		0	0		361	41
s7		1	13		321	1438
s8		6	114		696	6525
rappot s1-5						
4/2/1		-	0.5		8.4	2.6
% / sp6						
s6/sp6		0.0	0.0		22.0	0.5
s7/sp6		14.3	10.2		19.5	17.1
s8/sp6		85.7	89.8		42.4	77.5
reste/sp6	0.0	0.0		16.1	5.0
						
total s1-5	8	145		814	15120
% / total						
%s1-5		53.3	53.3		33.1	64.2
%sp6		46.7	46.7		66.9	35.8

Intergen51. lam. Les intercalaires des blocs

[modifier | modifier le wikicode]
  • Le détail
RNA-RNA		c	x		CDS-RNA		c	x
23s 5s		4			CDS 16s		2	2
16s 23s		2			5s CDS			
16s tRNA	2			16 CDS			
tRNA 23s	2			CDS 5s			
5s tRNA		4			23s CDS			
tRNA in		2			CDS 23s			
tRNA contig	16			5s 16s			
tRNA hors	19			16s16s			
tRNA 16s								
23s tRNA								
tRNA 5s								
16s 5s								
5s 23s								
5s 5s								
total		51	0		total		2	2
  • Les rares voir gamma pour la longueur des intercalaires
  • Les tRNA-CDS compris, comparaison dans le clade et dans l'étude.

Intergen51. lam. Les intercalaires tRNA-tRNA extra bloc

[modifier | modifier le wikicode]
Int51.31 lam. Les intercalaires tRNA-tRNA extra blocs
cont hors hors
inter aa    inter aa    inter aa
2 gta 111 ggc 34 tac
13 aaa 112 ggc ** caa
23 cta 35 ggc 6 tca
10 aca ** ccg 7 gac
11 ggc 35 gaa 4 cac
8 tta 9 tca ** gta
5 cgt 3 atgf 5 gta
29 cca 6 gac ** gaa
12 atgj 7 ttc 8 cgt
27 atgi 4 tac ** cca
3 atgf 12 tgg
6 gac 7 cac
19 ttc 23 caa
5 gga 40 tgc
2 atc ** ttg
** agc
10 tcc
** aac
-

Paenibacillus polymyxa SC2

[modifier | modifier le wikicode]

ppm opérons chromosome

[modifier | modifier le wikicode]
  • Liens: gtRNAdb [12], NCBI [13]
  • Lien tableur: ppm
  • Légende: cdsa: cds aas, cdsj: cdsa sans jaune, cdsd: cdsa dirigé
B4 Paenibacillus polymyxa SC2 Chromosome
45.5%GC 26.7.19 Paris  110   doubles intercal cds aa avec aa cdsa cdsd
10545..11633 CDS 327 327 363
11961..13519 16s 280
13800..16728 23s 143
16872..16988 5s 232 232 232
17221..17640 CDS 93 855 140
comp 111496..112530 CDS 616 345
113147..114705 16s 207
114913..117843 23s 76
117920..118036 5s 343 343
118380..119837 CDS 3 348 486
123186..124469 CDS 90 90 428 90
124560..124648 tca 145 145
124794..125135 CDS 55 592 114
180728..181003 CDS 412 92
181416..182974 16s 108
183083..183199 5s @1 39
183239..183315 atc 20 20
183336..183411 gca 128
183540..186468 23s 130
186599..186690 agc 28 28
186719..186795 atgj 10 10
186806..186881 gta 4 4
186886..186961 aca 19 19
186981..187057 gac 77 77
187135..187210 ttc 6 6
187217..187302 tac 7 7
187310..187385 aaa 154 154 154
187540..188682 CDS 24 062 381
comp 212745..213341 CDS 211 211 199 211
comp 213553..213624 cgg 259 259
213884..214921 CDS 238 832 346
453754..455364 CDS 392 537
455757..457315 16s 207
457523..460453 23s 76
460530..460646 5s 34
460681..460757 atc 22 22
460780..460855 gca 4 4
460860..460935 aac 34 34
460970..461043 atgj 3 3
461047..461138 agc 31 31
461170..461241 gaa 6 6
461248..461323 gta 10 10
461334..461407 atgf 25 25
461433..461509 gac 50 50
461560..461635 ttc 22 22
461658..461733 aca 5 5
461739..461824 tac 16 16
461841..461913 cac 18 18
461932..462006 caa 4 4
462011..462086 aaa 15 15
462102..462189 ctg 6 6
462196..462270 ggc 10 10
462281..462351 tgc 26 26
462378..462454 cgt 22 22
462477..462550 cca 9 9
462560..462630 gga 204 204 204
comp 462835..463938 CDS 1 537 368
465476..466216 CDS 524 247
466741..468299 16s 207
468507..471434 23s 76
471511..471627 5s 629
472257..473588 CDS 103 459 444
577048..577794 CDS 1 116 249
578911..580469 16s 207
580677..583607 23s 76
583684..583800 5s 82
583883..583958 gca 4 4
583963..584038 aac 3 3
584042..584133 tcc 19 19
584153..584224 gaa 9 9
584234..584309 gta 29 29
584339..584412 atgf 25 25
584438..584514 gac 13 13
584528..584603 aca 4 4
584608..584693 tac 102 102
584796..584870 caa 4 4
584875..584950 aaa 12 12
584963..585043 cta 10 10
585054..585128 ggc 5 5
585134..585210 cgt 12 12
585223..585302 ttg 7 7
585310..585386 cca 7 7
585394..585464 gga 1 133
586598..587560 CDS 22 016 321
609577..609924 CDS 73 73 116 73
609998..610069 acg 1 613
comp 611683..612030 CDS 140 810 116
752841..754124 CDS 611 428
754736..756294 16s 208
756503..759431 23s 75
759507..759623 5s 183 183 183
comp 759807..760232 CDS 173 078 142
933311..934681 CDS 449 457
935131..936689 16s 221
936911..939839 23s 76
939916..940032 5s 216 216 216
940249..941241 CDS 521 183 331
1462425..1462937 CDS 44 44 171 44
1462982..1463057 aac 1 1
1463059..1463147 agc 122 122
comp 1463270..1464145 CDS 74 292
comp 1464220..1464981 CDS 246 246 254
1465228..1465299 gaa 86 86
1465386..1465461 aaa 15 15
1465477..1465562 ctc 162 162 162
1465725..1466180 CDS 1 667 152
comp 1467848..1468585 CDS 262 262 246
1468848..1468930 ctc 148 148 148
comp 1469079..1469564 CDS 112 990 162
1582555..1583361 CDS 490 269
1583852..1583925 ccc 244 244
comp 1584170..1585441 CDS 32 099 424
1617541..1619682 CDS 107 107 714 107
1619790..1619860 gga 265 265
1620126..1621163 CDS 254 529 346
1875693..1876160 CDS 129 129 156 129
1876290..1876365 gcc 11 11
1876377..1876449 aag 520
comp 1876970..1877974 CDS 55 215 335
comp 1933190..1933630 CDS 381 147
1934012..1934096 ctg 91 91 91
comp 1934188..1934718 CDS 74 847 177
comp 2009566..2010102 CDS 222 222 179
2010325..2010409 ctg 213 213
2010623..2011135 CDS 432 608 171
2443744..2448333 CDS 540 1530
2448874..2450432 16s 400
2450833..2453761 23s 143
2453905..2454021 5s 236 236 236
comp 2454258..2455367 CDS 186 804 370
2642172..2643329 CDS 426 386
2643756..2645314 16s 343
2645658..2648586 23s 144
2648731..2648847 5s 156 156 156
2649004..2649228 CDS 884 577 75
comp 3533806..3534249 CDS 139 139 148 139
3534389..3534460 gtc 279 279
comp 3534740..3535069 CDS 103 837 110
3638907..3639338 CDS 728 144
comp 3640067..3640152 tta 249 249 249
3640402..3640560 CDS 28 092 53
3668653..3669450 CDS 247 247 266
comp 3669698..3669766 atg 267 267
comp 3670034..3670234 CDS 54 456 67
3724691..3725086 CDS 122 122 132 122
comp 3725209..3725282 atgi 435
comp 3725718..3726359 CDS 612 148 214
comp 4338508..4339209 CDS 107 107 234 107
comp 4339317..4339390 cca 7 7
comp 4339398..4339477 ttg 12 12
comp 4339490..4339566 cgt 5 5
comp 4339572..4339646 ggc 35 35
comp 4339682..4339757 aaa 28 28
comp 4339786..4339862 gac 26 26
comp 4339889..4339965 atgf 30 30
comp 4339996..4340071 gta 9 9
comp 4340081..4340152 gaa 17 17
comp 4340170..4340261 tcc 3 3
comp 4340265..4340340 aac 18
comp 4340359..4340475 5s 76
comp 4340552..4343482 23s 400
comp 4343883..4345441 16s 493
comp 4345935..4347563 CDS 46 596 543
comp 4394160..4395092 CDS 238 238 311
4395331..4395404 aga 214 214
4395619..4396383 CDS 49 894 255
4446278..4447621 CDS 207 207 448
comp 4447829..4447902 aga 174 174
4448077..4448370 CDS 256 556 98
4704927..4705187 CDS 361 87
comp 4705549..4705627 ttg 11 11
comp 4705639..4705713 tgc 11 11
comp 4705725..4705796 ggc 6 6
comp 4705803..4705877 caa 9 9
comp 4705887..4705959 cac 17 17
comp 4705977..4706050 tgg 7 7
comp 4706058..4706143 tac 4 4
comp 4706148..4706223 aca 22 22
comp 4706246..4706318 ttc 35 35
comp 4706354..4706430 gac 15 15
comp 4706446..4706522 atgf 25 25
comp 4706548..4706623 gta 58 58
comp 4706682..4706753 gaa 17 17
comp 4706771..4706862 tcc 3 3
comp 4706866..4706941 aac 326 326
comp 4707268..4707597 CDS 279 544 110
comp 4987142..4989934 CDS 726 931
comp 4990661..4990731 gga 9 9
comp 4990741..4990814 cca 22 22
comp 4990837..4990913 cgt 5 5
comp 4990919..4990993 ggc 10 10
comp 4991004..4991084 cta 11 11
comp 4991096..4991171 aaa 4 4
comp 4991176..4991250 caa 55 55
comp 4991306..4991381 gta 11 11
comp 4991393..4991464 gaa 11 11
comp 4991476..4991548 acc 3 3
comp 4991552..4991627 aac 18
comp 4991646..4991762 5s 76
comp 4991839..4994768 23s 129
comp 4994898..4994973 gca 20 20
comp 4994994..4995070 atc 38
comp 4995109..4995225 5s 93
comp 4995319..4996877 16s 367
comp 4997245..4997475 CDS 60 140 77
comp 5057616..5058803 CDS 163 163 396 163
comp 5058967..5059083 5s 76
comp 5059160..5062089 23s 185
comp 5062275..5062350 gca 89
comp 5062440..5063998 16s 380
comp 5064379..5066394 CDS 647 899 672
5714294..5714611 CDS 206 206 106
comp 5714818..5714908 tcg 77 77 77
comp 5714986..5715210 CDS 75

ppm opérons plasmide

[modifier | modifier le wikicode]
  • Liens: gtRNAdb [14], NCBI [15]
  • Lien tableur: ppm
  • Légende: cdsa: cds aas, cdsj: cdsa sans jaune, cdsd: cdsa dirigé
B4 Paenibacillus polymyxa SC2 plasmide
B4 Paenibacillus polymyxa SC2 plasmide MAJ
comp 23.10.19 Tanger 49 aas doubles intercal
3920..4174 cds hp
4711..4803 agc +
4809..4883 tgc 3 aac
4947..5021 gaa 2 atc
5029..5105 ctt 2 cca
5112..5186 cca 2 cga
5288..5361 tgg 2 gaa
5366..5441 tat 3 tgg 7
5449..5522 caa
5529..5605 cac
5611..5686 gac
5812..5887 gga
5898..5973 aac @1
5978..6066 tac ctt
6076..6153 ata ata 82
**** tat
6236..6311 atgi
6317..6392 aac
6397..6470 tgg
6602..6678 gaa
6684..6757 ggc
6813..6885 ttc
6908..6980 cga 7
6988..7065 cca
7071..7155 ttg
7161..7235 atc 4
7240..7317 atgf
7323..7398 gca
7508..7584 cga
7588..7668 cta
7682..7758 atc
7767..7841 aac
7846..7919 tgg
7953..8324 cds hp
8301..8378 gac
8387..8473 tac
8560..8632 aaa
8647..8720 gga
8725..8800 ttc
8808..8882 acg @2
comp 8983..9600 cds hp acg
9690..9771 tta
9775..9849 aca
comp 9885..10169 cds hp
comp 10320..10622 cds hp
10739..10813 aca
comp 10832..11146 cds hp
comp 11363..11599 cds hp
11694..11765 aga 85
11851..12312 cds rev-trans
comp 12508..12756 cds trans-rg 442
**** ****
13199..14083 cds hp
14310..14385 tcg +
14394..14481 tcc 2 tcg
14489..14560 ctt @3 6
14567..14654 tcg tcg
14660..14751 tca ctt
14871..15080 cds hp
comp 227125..227388 cds hp
comp 227833..227903 gga
comp 228152..228391 cds hp
comp 229793..229999 cds hp
comp 230024..230108 tca 783
**** ****
comp 230872..231393 cds hp
comp 231558..231640 tta
232618..233067 cds hp
510118..1
B4 Paenibacillus polymyxa SC2 plasmide
37.6%GC 26.7.19 Paris  51   doubles intercal CDS aa avec aa cdsa cdsd
3920..4174 CDS 536 536 85
4711..4803 agc + 5 5
4809..4883 tgc 3 aac 63 63
4947..5021 gaa 2 atc 7 7
5029..5105 ctt 2 caa 6 6
5112..5186 cca 2 cca 101 101
5288..5361 tgg 2 cga 4 4
5366..5444 tac 2 gaa 4 4
5449..5522 caa 2 tac 6 6
5529..5605 cac 3 tgg 5 5
5611..5686 gac 125 125
5812..5887 gga 10 10
5898..5973 aac @1 4 4
5978..6066 tac ctt 9 9
6076..6153 ata ata 4 4
6158..6231 caa 4 4
6236..6311 atgi 5 5
6317..6392 aac 4 4
6397..6470 tgg 131 131
6602..6678 gaa 5 5
6684..6757 ggc 55 55
6813..6885 ttc 22 22
6908..6983 cga 4 4
6988..7065 cca 5 5
7071..7155 ttg 5 5
7161..7235 atc 5 5
7241..7317 atgf 5 5
7323..7398 gca 109 109
7508..7584 cga 3 3
7588..7668 cta 13 13
7682..7758 atc 8 8
7767..7841 aac 4 4
7846..7919 tgg 33 33 33
7953..8324 CDS @4 -24 -24 124
8301..8378 gac 8 8
8387..8473 tac 86 86
8560..8632 aaa 14 14
8647..8720 gga 4 4
8725..8800 ttc 7 7
8808..8882 acg @2 100 100
comp 8983..9600 CDS acg 89 89 206
9690..9771 tta 3 3
9775..9849 aca 35 35 35
comp 9885..10169 CDS 150 95
comp 10320..10622 CDS 116 116 101
10739..10813 aca 18 18 18
comp 10832..11146 CDS 216 105
comp 11363..11599 CDS 94 94 79 94
11694..11768 aga 103 103
11872..12312 CDS 195 147
comp 12508..12756 CDS 293 293 83
13050..13126 atc 72 72 72
13199..14083 CDS 226 226 295
14310..14385 tcg + 8 8
14394..14481 tcc 2 tcg 7 7
14489..14563 ctt @3 3 3
14567..14654 tcg tcg 5 5
14660..14751 tca ctt 119 119 119
14871..15080 CDS 212044 70
comp 227125..227388 CDS 444 444 88
comp 227833..227903 gga 248 248 248
comp 228152..228391 CDS 1401 80
comp 229793..229999 CDS 24 24 69 24
comp 230024..230108 tca 289 289
comp 230398..230640 CDS 231 81
comp 230872..231393 CDS 161 161 174 161
comp 231555..231640 tta 977 977
232618..233067 CDS 277050 150
510118..1
  • Légende: cdsa: cds aas, cdsj: cdsa sans jaune, cdsd: cdsa dirigé
cumuls. Paenibacillus polymyxa SC2, chromosome.
Opérons Fréquences intercalaires Fréquences aas cds
effectifs gammes sans rRNAs avec rRNAs gammes cds gammes cdsa cdsj gammes cdsd
avec rRNA opérons 13 1 1 0 1 0 100 8 5 40 0
16 23 5s 0 7 20 12 46 50 1 200 20 17 60 1
16 5 atc gca 2 40 3 15 100 4 300 10 6 80 2
16 23 5s a 3 60 1 2 150 8 400 13 9 100 2
max a 21 80 0 1 200 6 500 7 4 120 2
a doubles 0 100 1 0 250 15 600 2 0 140 3
16 gca 23 5s 1 120 0 1 300 5 700 1 0 160 3
total aas 73 140 0 0 350 3 800 1 1 180 2
sans opérons 19 160 0 0 400 5 900 0 0 200 1
1 aa 15 180 0 0 450 4 1000 1 0 220 3
max a 15 200 0 0 500 2 1100 0 0 240 2
a doubles 0 0 0 11 1 0 1
total aas 37 18 65 64 64 42 22
total aas 110 moyenne 20 17 193 292 229 150
remarques 1 variance 21 17 73 234 123 58
jaune sans sans
  • Légende: cdsa: cds aas, cdsj: cdsa sans jaune, cdsd: cdsa dirigé
cumuls. Paenibacillus polymyxa SC2, plasmide.
Opérons Fréquences intercalaires Fréquences aas cds
effectifs gammes sans rRNAs avec rRNAs gammes cds gammes cdsa cdsj gammes cdsd
avec rRNA opérons 0 1 0 1 1 60 0 40 4
16 23 5s 0 20 33 50 4 80 4 60 0
16 5 atc gca 40 1 100 4 100 5 80 1
16 23 5s a 60 1 150 3 120 2 100 1
max a 80 1 200 1 140 1 120 1
a doubles 100 1 250 2 160 2 140 0
16 gca 23 5s 120 2 300 2 180 1 160 0
total aas 140 2 350 0 200 0 180 1
sans opérons 10 160 0 400 0 220 1 200 0
1 aa 6 180 0 450 1 240 0 220 0
max a 32 200 0 500 0 260 0 240 0
a doubles 2 0 2 1 1
total aas 51 41 20 17 9
total aas 51 moyenne 6 126 102 89
remarques 3 variance 3 92 32 77
jaune sans sans sans
  • Note: intercalaires prélevés de la colonne cds de ppm opérons dans un bloc de tRNAs uniquement. Le début du bloc est dans l'ordre des adresses, deb intercalaire entre le cds et le 1er tRNA dd bloc, fin entre le dernier tRNA et le cds terminal. J'ai procédé, dans les colonnes petit et grand, à la réorientation des blocs d'après la constatation que les blocs à rRNA ont leurs cds de début et de fin sont orientés du cds-16s au 5s-tRNAs-cds, l'intercalaire cds-16s étant plus grands que l'intercalaire avec le cds terminal. En tête de colonne est le % du nombre des intercalaires inférieurs à 201 pbs.
ppm	45			48			21			72
deb	fin		deb	fin		grand	petit		grand	petit
-24	100		116	18		100	35		100	-24
24	289		536	33		100	-24		116	18
44	122		100	35		103	94		289	24
73	1613		293	72		116	18		536	33
90	145		206	77		122	44		100	35
94	103		381	91		145	90		122	44
100	35		-24	100		206	77		293	72
107	265		94	103		207	174		1613	73
116	18		226	119		222	213		206	77
122	435		44	122		226	119		145	90
129	520		90	145		238	214		381	91
139	279		262	148		246	162		103	94
161	977		246	162		259	211		265	107
206	77		207	174		262	148		226	119
207	174		222	213		265	107		435	122
211	259		238	214		267	247		520	129
222	213		490	244		279	139		279	139
226	119		444	248		289	24		262	148
238	214		728	249		293	72		977	161
246	162		211	259		361	326		246	162
247	267		107	265		381	91		207	174
262	148		247	267		435	122		259	211
293	72		139	279		444	248		222	213
361	326		24	289		490	244		238	214
381	91		361	326		520	129		490	244
444	248		122	435		536	33		267	247
490	244		129	520		728	249		444	248
536	33		161	977		977	161		728	249
728	249		73	1613		1613	73		361	326
  • Comparaison cds-cds tRNA-cds: deb fin, c'est l'ordre des adresses et grand petit l'ordre après réorientation. Leur pourcentage est calculé par rapport à la colonne, c'est-à-dire la moitié du total des tRNA-cds.
bacilli	cds total	total	<0	0-200	201-370	371-600	>600	deb	fin	grand	petit
ppm	5,384		58	1	26	22	6	3	12	14	6	20
ppm ‰				17	448	379	103	52	414	483	207	690
B4. Paenibacillus polymyxa SC2, blocs à rRNA.
cds 392 cds 1116 cds 493
16s 207 16s 207 16s 400
23s 76 23s 76 23s 76
5s 34 5s 82 5s 18
atc 22 gca 4 aac 3
19aas * 15aas * 9aas *
gga 204’ gga 1133 cca 107
cds cds cds
cds 367 cds 412 cds 380
16s 93 16s 108 16s 89
5s 38 5s 39 gca 185
atc 20 atc 20 23s 76
gca 129 gca 128 5s 163
23s 76 23s 130 cds
5s 18 agc 28
aac 3 6aas *
9aas * aaa 154
gga 726 cds
cds
cds 327 616’ 524 611 449 540 426
16s 280 207 207 208 221 400 343
23s 143 76 76 75 76 143 144
5s 232 343 629 183’ 216 236’ 156
cds
5s constant 39 aas 117 pbs

ppm chromosome

[modifier | modifier le wikicode]
tRNAs	21	17	11				
16s	207	207	400				
23s	76	76	76				
5s	34	82	18				
							
tRNAs	13	-	-	10			
16s	93		16s	108		16s	89
5s	38		5s	39		gca	185
atc	20		atc	20		23s	76
gca	129		gca	128		5s	
23s	76		23s	130			
5s	18						
														
16s	280	207	207	208	221	400	343
23s	143	76	76	75	76	143	144
5s							
							
5s	constant	39 aas	117 pb				
											
*Remarques :Il n’y a pas de doublons dans les 13 blocs à rRNA, ni dans les blocs sans rRNA.						
	- La majorité des tRNAs se trouvent dans les clusters à rRNA 73 contre 37.						
	- Les blocs 16s23s5s sont majoritaires , 10 sur 13, dont 7 ne portent pas de tRNAs.						
	- Les intercalaires 16s-23s sont quasiment identiques pour 7 blocs/10 les 3 autres sont doubles.						
	- Les intercalaires 23s-5s sont aussi quasiment identiques pour 10/12 les autres sont doubles.						
	- Les 2 intercalaires 16s-5s sont moitié de ceux de23s-5s.						
	- Voir la liste ci-dessus pour les intercalaires et le nombre de tRNAs.						
							
@1	- Le bloc 16s5s-atcgca-23s-10aas a son 5s anormalement positionné, pas après 23s						
	mais après 16s. Certains génomes (ref.) n’ont que que ce type.						
	-Le bloc 16s5s-atcgca-23s5s-13aas porte les 2 types de position alors que en général						
	un bloc à 2 5s est du type 16s23s5s5s, avec les 2 5s du même côté du 23s.						
							
Séquences des doubles :  Il n’y a pas de doublons dans les 13 blocs à rRNA, ni dans les blocs sans rRNA. 	
Plasmide		
24.10.19 Tanger		
*Remarques : 		
	- Il n'y a pas de cluster avec des gènes rRNAs, mais il existe au moins un plasmide  avec ce type	
	de cluster (ref.) chez les bactéries.	

	- 46 gènes de tRNA sur 49 sont regroupés en 11 152 pb pour une longueur de plasmide de 510 118.	
	Soit 2 % seulement de la taille du plasmide.	

	- Ces 46 gènes sont répartis en 4 clusters dont le principal avec 39 gènes contient 2 cds entourés	
	chacun par 2 tRNAs. Les 3 autres ne contiennent pas de cds à l’intérieur . Les 3 1ers clusters sont contigus	
	et entre le 3ème et le 4ème existe un seul cds particulier  de 83 aas, trans-rg, transcription regulator.	
	Il est précédé d’une transcriptase reverse, rev-trans, de154 aas.	

	- Particularité du cluster principal: régularité qui n'existe pas chez les clusters du chromosome.	
		+ dans le chromosome les intercalaires des clusters avec ou sans rRNA,
		moyenne et variance sont égales et du même ordre que la moyenne du cluster principal,
		à peu près 20, alors que sa variance est quasiment double, 36 pb. 
		+ 33 des intercalaires faibles du plasmide ont 6 et 3 pour respectivement moyenne et variance
		+ Les intercalaires élevés sont répartis régulièrement et sont du même ordre que ceux
		entre tRNA-cds. Voir la liste ci-dessous où les intercalaires avec cds sont signalés en gras.

	- Les intercalaires entre les cds d'encadrement des 4 clusters sont aussi du même ordre que ceux à l'intérieur du cluster principal.	
	Cette similitude et la contiguité entre les cds militent pour le regroupent de ces 4 clusters.	

	- Les 3 derniers tRNAs du plasmide, aux adresses élevées, ne semblent pas former un groupe de clusters :	
	Chaque tRNA est, à peu près, aussi proche d’un cds d’encadrement que dans le cluster principal (248 24 161),	
	mais il est très éloigné de l’autre cds d’encadrement (444 783 977). De même la distance entre les cds est très élevées, 1401.	

	- Si l'on considère le groupe des 4 clusters à 46 gènes de tRNA comme encadré par 2 cds, les intercalaires proches et éloignés 	
	équivalents respectivement à ceux des 3 tRNA à adresses élevées, sont du même ordre, 109 et 536. Et dans ce groupe	
	la distance entre 2 cds contigus reste largement inférieure aux 1401 des gènes à adresses élevées, 442 qui est une exception	
	par la fonction régulatrice d’un des 2 cds de l’intercalaire, « cds  trans-rg », alors que les autres intercalaires 	
	sont inférieurs à 216.	

	- Dans la série de 31 gènes il y a très peu de doublons comme le chromosome: Ils sont signalés par le signe +. 	
	Mais ils ne présentent pas de séries de gènes identiques ou de répétitions de séquences comme dans d’autres génomes, 	
	(ref.) à part la séquence cca-tgg répétée 2 fois. Sinon les doublons sont séparés par de nombreux autres gènes.	
	Si l’on compare par rapport aux séries longues des clusters avec rRNA du chromosome, 21 aas,  ou sans rRNA, 15 aas, 	
	les 31 aas de la série du plasmide, de part sa longueur et le nombre limité de type de gènes (ceux se terminant par a et c) 	
	candidats à la création dans le cluster, il est normal qu’il y ait des doublons. D’autant plus que la série fait appel 	
	à des gènes rares, ctt ata tat.	
	Donc le plasmide ne déroge pas à l’absence  des doublons du génome en entier.	
		
	- @1,2 aas rares, acg et ctt, ou très rares, tat et ata.	
		
	- @3 regroupement de 5 gènes de tRNA longs dont 4 Ser,  3 rares et un doublets de rares. Alors qu’aucun gène de ser n’est 	
	présent dans la série de 31 gènes.	
		
	- @4 l’intercalaire négatif élevé entre le cds (124aas) et le gène de gac  illustre bien l’intégration des cds du groupe des 4 clusters
	au processus de création de gènes.	
	
entre aas et cds du	
cluster principal	
1-2 	cds	536
2-3 	tgc	63
5-6 	cca	101
10-11 	gac	125
18-19 	tgg	131
20-21 	ggc	55
21-22 	ttc	22
27-28 	gca	109
31-32 	tgg	33
33-34 	cds	-24
35-36 	tac	86
39-40 	acg	100
40-41 	cds	89
42-43 	aca	35
	
entre cds de clusters	
cl1-cl2		150
cl2-cl3		216
cl3-trans rg	195
trans rg-cl4	442

ppm distribution

[modifier | modifier le wikicode]
Bc4 ppm, Paenibacillus polymyxa SC2. bacilli.
bc41 ppm, distribution des blocs sans rRNA. Chromosome
g1    t1       
atgi 1 tct tat atgf 1
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc 1 tcc 1 tac 1 tgc 1
atc 2 acc aac 2 agc 1
ctc 2 ccc 1 cac 1 cgt
gtc 1 gcc 1 gac 1 ggc 1
tta 1 tca 1 taa tga
ata aca 1 aaa 1 aga 2
cta cca caa 1 cga
gta 1 gca 3 gaa 2 gga 1
ttg 1 tcg 1 tag tgg 1
atgj 1 acg 1 aag 1 agg
ctg 2 ccg cag cgg 1
gtg gcg gag ggg
baci >1aa =1aa -5s +5s -16s +16s total
ppm 22 15 5 42
bc42 ppm. Distribution des blocs avec rRNA. Chromosome
g1    t1       
atgi tct tat atgf 3
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc 2 tcc 2 tac 3 tgc 1
atc 1 acc 1 aac 4 agc 2
ctc ccc cac 1 cgt 4
gtc gcc gac 4 ggc 4
tta tca taa tga
ata aca 3 aaa 5 aga
cta 2 cca 4 caa 3 cga
gta 5 gca 2 gaa 4 gga 3
ttg 2 tcg tag tgg
atgj 2 acg aag agg
ctg 1 ccg cag cgg
gtg gcg gag ggg
baci >1aa =1aa -5s +5s -16s +16s total
ppm 68 68
bc43 ppm. Distribution des blocs sans rRNA. Plasmide
g1    t1       
atgi 1 tct tat atgf 1
att act aat agt
ctt 2 cct cat cgc
gtt gct gat ggt
ttc 2 tcc 1 tac 3 tgc 1
atc 3 acc aac 3 agc 1
ctc ccc cac 1 cgt
gtc gcc gac 2 ggc 1
tta 2 tca 2 taa tga
ata 1 aca 2 aaa 1 aga 1
cta 1 cca 2 caa 2 cga 2
gta gca 1 gaa 2 gga 3
ttg 1 tcg 2 tag tgg 3
atgj acg 1 aag agg
ctg ccg cag cgg
gtg gcg gag ggg
baci >1aa =1aa -5s +5s -16s +16s total
ppm 45 6 51

ppm. Intergen51

[modifier | modifier le wikicode]

Intergen51. ppm. Le génome

[modifier | modifier le wikicode]
  • ppm Le prélèvement: Abacilli
  • Le nom et le lien NCBI: ppm, Paenibacillus polymyxa SC2, NCBI [16], date 10.11.21.
  • ppm La longueur totale des intercalaires, longueur du génome et taux intercalaires/génome:
Nom	intercals	génome		taux en %			
ppm	791,310		5,728,392	13.8	
ppm données intercalaires
[modifier | modifier le wikicode]
ppm données intercalaires 200
[modifier | modifier le wikicode]
ppm autres intercalaires aas
[modifier | modifier le wikicode]

Intergen51. ppm. Les différents types d'intercalaires

[modifier | modifier le wikicode]
  • Lien au tableur: Intergen51. ppm les différents types d'intercalaires.
  • Légende:
    - S pour intercalaire CDS-CDS et R pour tRNA-CDS,
    - c pour intercalaire continu (les 2 gènes sont sur le même brin) et x pour discontinu (les 2 gènes sont sur 2 brins différents, le brin et son complément)
    - %reste = 100*reste/total, le reste étant ce qui reste du total après la fin du diagramme, gamme.
    - %t30 = 100*t30/total, t30 étant le total des fréquences 10 20 30
    - %t5 = 100*t/total, t5 étant le total des fréquences de -1 à -5 dans le diagramme des S-.
Int51.2 ppm les différents types d'intercalaires entre gène
Int51.21 Les différents types
intercalaires CDS-CDS * autres intercalaires
continu S+ S- S0 total c/x RNA-RNA CDS-rRNA total
c 3,157 523 19 3,699 2.9 118 16 134
x 1,267 29 0 1,296 0 5 5
t 4,424 552 19 4,995 118 21 139
% 88.6 11.1 0.4
Int51.22 Détail des * autres intercalaires
intercalaires tRNA-CDS récapitulatif des * autres intercalaires
continu R+ R- R0 total c/x * autres total %
c 20 0 0 20 0.9 tRNA-CDS 43 23
x 23 0 0 23 RNA-RNA 118 62
t 43 0 0 43 CDS-rRNA 21 11
% 100.0 0.0 0.0 non RNA 8 4
- total 190 100
Int51.23 Les taux remarquables
taux %reste %t30 %t5 %0
type S+ R+ S- S+ R+ S- S+ R+
gamme 400 400 6-50 - - - - -
type S+ R+ S- S+ R+ S- S+ R+
c 7.0 20.0 1.3 21.3 0.0 55 0.5 0.0
x 11.9 8.7 10.3 3.7 0.0 24 0.0 0.0

Intergen51. ppm. Les diagrammes CDS-CDS positifs

[modifier | modifier le wikicode]
  • Lien tableur: ppm données intercalaires
  • Diagrammes:
    - fc40, CDS-CDS continu, fréquence unitaire en abscisses et effectif en ordonnées ppm fc40
    - fx%, CDS-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et pourcentage en ‰ par rapport au total, en ordonnées. ppm fx1
  • Équations des courbes de tendance en pour 1000: colonnes %fx %fc
Courbes de tendances pour les diagrammes en pour 1000			Calculs des f.41	ppm
R2	x3		x2		x		c		Inflexion poly3	x	c
0.802	4.30E-06	-3.28E-03	6.47E-01	-1.18	fx1	abscisse	251.3	201.3
0.917	-2.23E-06	1.78E-03	-5.37E-01	72.1	fc1	ordonnée	22.1	20.7
								
0.823	5.20E-06	-3.92E-03	7.79E-01	-8.61	fx41			
0.956	1.25E-06	-7.55E-04	1.74E-02	37.6	fc41
  • Le rfin après 400 est de 221 sur un total de 3176. Jusqu'à 1% les freq10 sont en continu jusqu'à 830, reste 32. L'indice i.rfin1 = 189/430 = 0.440.
  • Moyennes glissantes fc+400, diagonale. Voir le détail des calculs dans abs.
données	ppm		calculs			poly3	ppm
effect	3176		R2.21	831		abscis	400
xm	60		pte	9,21		flexa	209
ym	9		cste	3,39		flexo	1,93
x1m	259		r400l	141		xm	55
y1m	1		restp	162,15		sup4	158,2
rfin	69,58		%sd	28,76		sup4t	442,4
bornf	147		lond	199		%	35,8
supd	144,2		%sf	26,30		long	154
supdt	501,6		lonf	87		R2	670
xmp	336,27		sf/lf	0,83			
r400	92,57		sr/lr	0,64			
supf	72,5		sd/ld	0,72			
supft	275,8		i.r400	0,66						

Intergen51. ppm. Les CDS-CDS négatifs

[modifier | modifier le wikicode]
Sous-totaux	ppm			totale	
fréquence	x-	c-		x-	c-
 - 1		0	59		4	4140
 - 2		0	0		85	11
 - 3		0	0		3	12
 - 4		7	229		717	10938
 - 5		0	0		5	19
sp6		22	235		1642	8424
total		29	523		2,456	23,544
reste		3	7		264	420
s6		4	1		361	41
s7		3	24		321	1438
s8		12	203		696	6525
rappot s1-5						
4/2/1		-	3.9		8.4	2.6
% / sp6						
s6/sp6		18.2	0.4		22.0	0.5
s7/sp6		13.6	10.2		19.5	17.1
s8/sp6		54.5	86.4		42.4	77.5
reste/sp6	13.6	3.0		16.1	5.0
						
total s1-5	7	288		814	15120
% / total						
%s1-5		24.1	55.1		33.1	64.2
%sp6		75.9	44.9		66.9	35.8

Intergen51. ppm. Les intercalaires des blocs

[modifier | modifier le wikicode]
  • Le détail
RNA-RNA		c	x		CDS-RNA		c	x
23s 5s		12			CDS 16s		11	2
16s 23s		10			5s CDS		5	3
16s tRNA	1			16 CDS			
tRNA 23s	3			CDS 5s			
5s tRNA		6			23s CDS			
tRNA in		2			CDS 23s			
tRNA contig	63			5s 16s			
tRNA hors	18			16s16s			
tRNA 16s								
23s tRNA	1						
tRNA 5s								
16s 5s		2						
5s 23s								
5s 5s								
total		118	0		total		16	5
  • Les rares voir gamma pour la longueur des intercalaires
  • Les tRNA-CDS compris, comparaison dans le clade et dans l'étude.

Intergen51. ppm. Les intercalaires tRNA-tRNA extra bloc

[modifier | modifier le wikicode]
Int51.31 ppm. Les intercalaires tRNA-tRNA extra blocs
cont1 cont2 cont3 cont4 hors
inter aa    inter aa    inter aa    inter aa    inter aa
28 agc 22 atc 4 gca 7 cca 1 aac
10 atgj 4 gca 3 aac 12 ttg ** agc
4 gta 34 aac 19 tcc 5 cgt 86 gaa
19 aca 3 atgj 9 gaa 38 ggc 15 aaa
77 gac 31 agc 29 gta 28 aaa ** ctc
9 ttc 6 gaa 25 atgf 26 gac 11 gcc
7 tac 10 gta 13 gac 30 atgf ** aag
** aaa 25 atgf 4 aca 9 gta 11 ttg
50 gac 102 tac 17 gaa 11 tgc
25 ttc 4 caa 3 tcc 6 ggc
5 aca 12 aaa ** aac 9 caa
16 tac 10 cta 9 gga 17 cac
18 cac 5 ggc 22 cca 7 tgg
4 caa 12 cgt 5 cgt 4 tac
15 aaa 7 ttg 10 ggc 22 aca
6 ctg 7 cca 11 cta 35 ttc
10 ggc ** gga 4 aaa 15 gac
26 tgc 55 caa 25 atgf
22 cgt 11 gta 58 gta
9 cca 11 gaa 17 gaa
** gga 3 acc 3 tcc
** aac ** aac
-

ppmp. Intergen51

[modifier | modifier le wikicode]

Intergen51. ppmp. Le génome

[modifier | modifier le wikicode]
  • ppmp Le prélèvement: Abacilli
  • Le nom et le lien NCBI: ppmp, Paenibacillus polymyxa SC2, plasmid pSC2., NCBI [17], date 10.11.21.
  • ppmp La longueur totale des intercalaires, longueur du génome et taux intercalaires/génome:
Nom	intercals	génome		taux en %			
ppmp	119,608		510,118		23.4	
ppmp données intercalaires
[modifier | modifier le wikicode]
ppmp données intercalaires 200
[modifier | modifier le wikicode]
ppmp autres intercalaires aas
[modifier | modifier le wikicode]

Intergen51. ppmp. Les différents types d'intercalaires

[modifier | modifier le wikicode]
  • Lien au tableur: Intergen51. ppmp les différents types d'intercalaires.
  • Légende:
    - S pour intercalaire CDS-CDS et R pour tRNA-CDS,
    - c pour intercalaire continu (les 2 gènes sont sur le même brin) et x pour discontinu (les 2 gènes sont sur 2 brins différents, le brin et son complément)
    - %reste = 100*reste/total, le reste étant ce qui reste du total après la fin du diagramme, gamme.
    - %t30 = 100*t30/total, t30 étant le total des fréquences 10 20 30
    - %t5 = 100*t/total, t5 étant le total des fréquences de -1 à -5 dans le diagramme des S-.
Int51.2 ppmp les différents types d'intercalaires entre gène
Int51.21 Les différents types
intercalaires CDS-CDS * autres intercalaires
continu S+ S- S0 total c/x RNA-RNA CDS-rRNA total
c 435 32 3 470 4.4 41 0 41
x 107 0 0 107 0 0 0
t 542 32 3 577 41 0 41
% 93.9 5.5 0.5
Int51.22 Détail des * autres intercalaires
intercalaires tRNA-CDS récapitulatif des * autres intercalaires
continu R+ R- R0 total c/x * autres total %
c 12 0 0 12 1.7 tRNA-CDS 19 31
x 7 0 0 7 RNA-RNA 41 66
t 19 0 0 19 CDS-rRNA 0 0
% 100.0 0.0 0.0 non RNA 2 3
- total 62 100
Int51.23 Les taux remarquables
taux %reste %t30 %t5 %0
type S+ R+ S- S+ R+ S- S+ R+
gamme 400 400 6-50 - - - - -
type S+ R+ S- S+ R+ S- S+ R+
c 12.3 23.1 6.3 14.8 7.7 47 0.6 0.0
x 23.4 14.3 - 3.7 14.3 - 0.0 0.0

Intergen51. ppmp. Les diagrammes CDS-CDS positifs

[modifier | modifier le wikicode]
  • Lien tableur: ppmp données intercalaires
  • Diagrammes:
    - fc40, CDS-CDS continu, fréquence unitaire en abscisses et effectif en ordonnées ppm fc40
    - fx%, CDS-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et pourcentage en ‰ par rapport au total, en ordonnées. ppm fx1
  • Équations des courbes de tendance en pour 1000: colonnes %fx %fc
Courbes de tendances pour les diagrammes en pour 1000			Calculs des f.41	ppmp
R2	x3		x2		x		c		Inflexion poly3	x	c
0.257	2.11E-06	-1.88E-03	4.14E-01	2.61	fx1	abscisse	322.2	196.4
0.794	2.49E-08	1.91E-04	-1.99E-01	51.6	fc1	ordonnée	12.0	21.1
								
0.247	1.50E-06	-1.45E-03	3.25E-01	7.65	fx41			
0.726	1.31E-06	-7.72E-04	2.02E-02	37.0	fc41
  • Le rfin après 400 est de 54 sur un total de 438. Jusqu'à 1% les freq10 sont en continu jusqu'à 1020, reste 4. L'indice i.rfin1 = 50/620 = 0.081.
  • Moyennes glissantes fc+400, diagonale. Voir le détail des calculs dans abs.
données	ppmp		calculs			poly3	ppmp
effect	438		R2.21	331		abscis	400
xm	45		pte	4,88		flexa	133
ym	0,876		cste	2,22		flexo	2,83
x1m	250		r400l	150		xm	45
y1m	1		restp	230,59		sup4	111,5
rfin	123,29		%sd	60,31		sup4t	292,2
bornf	108		lond	205		%	38,2
supd	334,6		%sf	58,72		long	88
supdt	554,8		lonf	63		R2	241
xmp	214,61		sf/lf	2,17			
r400	107,31		sr/lr	1,39			
supf	136,7		sd/ld	1,63			
supft	232,9		i.r400	0,72					

Intergen51. ppmp. Les CDS-CDS négatifs

[modifier | modifier le wikicode]
Sous-totaux	ppmp			totale	
fréquence	x-	c-		x-	c-
 - 1		0	4		4	4140
 - 2		0	0		85	11
 - 3		0	0		3	12
 - 4		0	11		717	10938
 - 5		0	0		5	19
sp6		0	17		1642	8424
total		0	32		2,456	23,544
reste		0	2		264	420
s6		0	1		361	41
s7		0	2		321	1438
s8		0	12		696	6525
rappot s1-5						
4/2/1		-	2.8		8.4	2.6
% / sp6						
s6/sp6		-	5.9		22.0	0.5
s7/sp6		-	11.8		19.5	17.1
s8/sp6		-	70.6		42.4	77.5
reste/sp6	-	11.8		16.1	5.0
						
total s1-5	0	15		814	15120
% / total						
%s1-5		-	46.9		33.1	64.2
%sp6		-	53.1		66.9	35.8

Intergen51. ppmp. Les intercalaires des blocs

[modifier | modifier le wikicode]
  • Le détail
RNA-RNA		c	x		CDS-RNA		c	x
23s 5s					CDS 16s			
16s 23s					5s CDS			
16s tRNA				16 CDS			
tRNA 23s				CDS 5s			
5s tRNA					23s CDS			
tRNA in					CDS 23s			
tRNA contig	36			5s 16s			
tRNA hors	5			16s16s			
tRNA 16s								
23s tRNA								
tRNA 5s								
16s 5s								
5s 23s								
5s 5s								
total		41	0		total		0	0
  • Les rares voir gamma pour la longueur des intercalaires
  • Les tRNA-CDS compris, comparaison dans le clade et dans l'étude.

Intergen51. ppmp. Les intercalaires tRNA-tRNA extra bloc

[modifier | modifier le wikicode]
Int51.31 ppmp. Les intercalaires tRNA-tRNA extra blocs
cont1 cont1 hors
inter aa    inter aa    inter aa
5 agc 55 ggc 3 tta
63 tgc 22 ttc ** aca
7 gaa 7 cga 8 tcg
6 ctt 5 cca 7 tcc
101 cca 5 ttg 6 ctt
4 tgg 4 atc 5 tcg
7 tat 5 atgf ** tca
6 caa 109 gca
5 cac 3 cga
125 gac 13 cta
10 gga 8 atc
4 aac 4 aac
9 tac ** tgg
82 ata 8 gac
5 atgi 86 tac
4 aac 14 aaa
131 tgg 4 gga
5 gaa 7 ttc
** acg
-

Paenibacillus mucilaginosus 3016

[modifier | modifier le wikicode]
  • Liens: gtRNAdb [18], NCBI [19], génome [20]
  • Lien tableur: pmq opérons
  • Légende: cdsa: cds aas, cdsj: cdsa sans jaune, cdsd: cdsa dirigé
B5 Paenibacillus mucilaginosus 3016
58.3%GC 24.7.19 Paris  110   doubles intercal cds aa avec aa cdsa cdsd
9206..10276 CDS 322 322 357
10599..12139 16s 269
12409..15343 23s 95
15439..15555 5s 178 178 178
15734..17190 CDS 3061 486
20252..21532 CDS 47 47 427 47
21580..21666 tca 140 140
21807..22157 CDS hp @1 17 117
22175..22357 CDS hp 23 *61
22381..22524 CDS hp 86 *48
comp 22611..22796 CDS hp 138 *62
comp 22935..25265 replicase 156 *777
25422..26165 CDS 220 220 248
comp 26386..26460 cgg 183 183 183
26644..27168 CDS 151287 175
178456..179454 CDS 298 298 333
179753..181299 16s 254
181554..184488 23s 168
184657..184773 5s 15
184789..184876 agc 29 29
184906..184982 atgj 39 39
185022..185097 gta 15 15
185113..185189 atgf 14 14
185204..185280 gac 48 48
185329..185404 ttc 5 5
185410..185485 aca 9 9
185495..185579 tac 15 15
185595..185670 aaa 183 183 183
comp 185854..187104 CDS 30460 417
comp 217565..218146 CDS 129 129 194 129
comp 218276..218350 cgg 261 261
218612..219643 CDS 34238 344
253882..254526 CDS 677 *677 215
255204..256745 16s 268
257014..259948 23s 95
260044..260160 5s 55
260216..260292 atc 19 19
260312..260387 gca + 16 16
260404..260475 gaa 2 gca 9 9
260485..260569 tac 20 20
260590..260665 aac 3 3
260669..260744 gta 19 19
260764..260840 gac 20 20
260861..260933 ttc 15 15
260949..261021 aaa 10 10
261032..261118 ctg 3 3
261122..261196 ggc 12 12
261209..261280 tgc 15 15
261296..261369 cgt 5 5
261375..261448 cca 158 *158
261607..261682 gca 4 4
261687..261759 acc 5 5
261765..261854 tcg 19 19
261874..261961 agc 17 17
261979..262054 gtc 5 5
262060..262134 acg 39 39
262174..262262 tcc 41 41
262304..262386 ctc 283 283 *283
262670..263515 CDS 314679 282
578195..579055 CDS 324 324 287
579380..580921 16s 258
581180..584114 23s 166
584281..584397 5s 31
584429..584505 aac 6 6
584512..584600 tcc 38 38
584639..584710 gaa 11 11
584722..584797 gta 17 17
584815..584891 atgf 15 15
584907..584983 gac 67 67
585051..585125 acg 11 11
585137..585212 cac 10 10
585223..585297 caa 5 5
585303..585378 aaa 17 17
585396..585470 ggc + 40 40
585511..585585 ggc 2 ggc 24 24
585610..585692 ttg 5 5
585698..585774 cca 19 19
585794..585867 gga 1 1
585869..585942 aga 187 187 187
586130..586885 CDS 85587 252
672473..672949 CDS 18 18 159 18
672968..673043 aac 7 7
673051..673138 agc @2 297 297
673436..673507 gaa 9 9
673517..673599 ctc 180 180
673780..674199 CDS 182 140
674382..675278 CDS 159 159 299
675438..675520 ctc 64 64 64
675585..675833 CDS 18450 83
694284..695636 CDS 797 *797 451
696434..697974 16s 261
698236..701170 23s 94
701265..701381 5s 43
701425..701498 atc 11 11
701510..701584 gaa 5 5
701590..701665 gtc 5 5
701671..701747 atgf 4 4
701752..701825 tgg 9 9
701835..701909 caa 8 8
701918..701990 aaa 18 18
702009..702095 ctg 4 4
702100..702174 ggc 11 11
702186..702259 cgt 12 12
702272..702348 cca 577 *577 *577
702926..703120 CDS 370320 65
1073441..1074214 CDS 373 373 258
1074588..1076136 16s 260
1076397..1079331 23s 168
1079500..1079616 5s 9
1079626..1079701 aac 6 6
1079708..1079796 tcc 38 38
1079835..1079906 gaa 11 11
1079918..1079993 gta 17 17
1080011..1080087 atgf 13 13
1080101..1080177 gac 49 49
1080227..1080302 ttc 4 4
1080307..1080382 aca 13 13
1080396..1080481 tac 8 8
1080490..1080560 tgg 13 13
1080574..1080649 cac 26 26
1080676..1080747 caa 9 9
1080757..1080831 ggc 12 12
1080844..1080917 tgc 10 10
1080928..1081016 tta 20 20
1081037..1081113 cgt 3 3
1081117..1081199 ttg 147 147 147
1081347..1081973 CDS 128630 209
1210604..1213519 CDS 354 354 972
1213874..1213949 gca 16 16
1213966..1214037 gaa 12 12
1214050..1214125 gta 16 16
1214142..1214218 gac 17 17
1214236..1214311 cac 9 9
1214321..1214395 caa 9 9
1214405..1214477 aaa 8 8
1214486..1214572 ctg 3 3
1214576..1214647 ggc 169 169 169
comp 1214817..1215602 CDS 378784 262
1594387..1594665 CDS 537 *537 93
1595203..1596743 16s 252
1596996..1599930 23s 94
1600025..1600141 5s 43
1600185..1600261 atc 19 19
1600281..1600356 gca 17 17
1600374..1600445 gaa 8 8
1600454..1600529 gta + 5 5
1600535..1600610 aca 2 gta 10 10
1600621..1600705 tac 18 18
1600724..1600799 aac 4 4
1600804..1600879 gta 21 21
1600901..1600977 atgf 12 12
1600990..1601066 gac 34 34
1601101..1601176 cac 13 13
1601190..1601264 caa 8 8
1601273..1601345 aaa 17 17
1601363..1601448 ctc 13 13
1601462..1601548 ctg 5 5
1601554..1601628 ggc 14 14
1601643..1601713 tgc 10 10
1601724..1601797 cgt 5 5
1601803..1601876 cca 105 105 105
1601982..1602245 CDS 232535 88
1834781..1835260 CDS 106 106 160 106
1835367..1835439 gcc 137 137
comp 1835577..1835978 CDS 371114 134
comp 2207093..2208091 CDS 192 192 333 192
2208284..2208367 ctg + 49 49
2208417..2208500 ctg 2 ctg 315 315
2208816..2209952 CDS 1246561 379
3456514..3456786 CDS 256 256 91
3457043..3457119 ccc 142 142 142
3457262..3457483 CDS 1547757 74
comp 5005241..5005426 CDS 127 127 62 127
comp 5005554..5005636 ctc 40 40
comp 5005677..5005765 tcc 13 13
comp 5005779..5005852 atg 19 19
comp 5005872..5005958 tcg 167 167
5006126..5006220 ncRNA 1377035 32
comp 6383256..6384173 CDS 228 228 306
6384402..6384477 gtc 69 69 69
comp 6384547..6385458 CDS 5453 304
comp 6390912..6391130 CDS 142 142 73 142
comp 6391273..6391358 tta 7 7
comp 6391366..6391442 atgi 19 19
comp 6391462..6391538 atgf 370 370
comp 6391909..6392460 CDS 962046 184
7354507..7354737 CDS 342 342 77 *342
comp 7355080..7355162 ctc 28 28
comp 7355191..7355279 tcc 12 12
comp 7355292..7355368 atgf 14 14
comp 7355383..7355459 atgj 14 14
comp 7355474..7355561 agc 8 8
comp 7355570..7355659 tcg 4 4
comp 7355664..7355736 acc 4 4
comp 7355741..7355816 gca 119
7355936..7356030 ncRNA @3 36
comp 7356067..7356140 cca 6 6
comp 7356147..7356220 cgt 104 *104
comp 7356325..7356396 ggc 7 7
comp 7356404..7356490 ctg 9 9
comp 7356500..7356572 aaa 9 9
comp 7356582..7356656 caa 9 9
comp 7356666..7356741 cac 17 17
comp 7356759..7356835 gac 12 12
comp 7356848..7356923 gta 4 4
comp 7356928..7357003 aac 15 15
comp 7357019..7357103 tac 8 8
comp 7357112..7357187 aca 5 5
comp 7357193..7357264 gaa 15 15
comp 7357280..7357355 gcc 9 9
comp 7357365..7357438 atc 54
comp 7357493..7357609 5s 112
comp 7357722..7360655 23s 258
comp 7360914..7362454 16s 403 *403
7362858..7363397 CDS 254752 180
7618150..7618842 CDS 280 280 231 *280
comp 7619123..7619193 ggg 335 335
7619529..7620461 CDS 46171 311
comp 7666633..7668069 CDS 104 104 479 104
comp 7668174..7668244 ggg 5 5
comp 7668250..7668326 cca 106 *106
comp 7668433..7668506 cgt 11 11
comp 7668518..7668592 ggc 5 5
comp 7668598..7668684 ctg 13 13
comp 7668698..7668783 ctc 16 16
comp 7668800..7668872 aaa 10 10
comp 7668883..7668967 tac 28 28
comp 7668996..7669071 ttc 12
comp 7669084..7669200 5s 159
comp 7669360..7672297 23s 256
comp 7672554..7674095 16s 537 *537
7674633..7675382 CDS 177794 250
comp 7853177..7853761 CDS 57 57 195 57
comp 7853819..7853892 cac 230 230
comp 7854123..7854196 cac 404 *404
comp 7854601..7854801 CDS 245639 67
comp 8100441..8100854 CDS 123 123 138 123
comp 8100978..8101094 5s 167
comp 8101262..8104180 23s 248
comp 8104429..8105969 16s 325 325
comp 8106295..8106636 CDS 45281 114
comp 8151918..8152448 CDS 460 *460 177 *460
comp 8152909..8153031 5s 94
comp 8153126..8156060 23s 258
comp 8156319..8157859 16s 456 *456
8158316..8158642 CDS 98285 109
8256928..8257746 CDS 83 83 273 83
comp 8257830..8257903 gga 5 5
comp 8257909..8257985 cca 16 16
comp 8258002..8258078 cgt 4 4
comp 8258083..8258157 ggc 8 8
comp 8258166..8258248 cta 42 42
comp 8258291..8258366 aaa 8 8
comp 8258375..8258449 caa 9 9
comp 8258459..8258532 tgg 4 4
comp 8258537..8258613 atgf 5 5
comp 8258619..8258694 gtc 5 5
comp 8258700..8258774 gaa 11 11
comp 8258786..8258859 atc 43
comp 8258903..8259019 5s 94
comp 8259114..8262048 23s 255
comp 8262304..8263845 16s 306 306
comp 8264152..8264370 CDS 58373 73
comp 8322744..8323205 CDS 393 393 154 *393
comp 8323599..8323715 5s 94
comp 8323810..8326748 23s 258
comp 8327007..8328547 16s 369 369
comp 8328917..8330413 CDS 21505 499
comp 8351919..8354414 CDS 396 396 832
comp 8354811..8354884 atg 149 149 149
comp 8355034..8355537 CDS 34450 168
8389988..8390512 CDS 296 296 175 *296
comp 8390809..8390925 5s 94
comp 8391020..8393954 23s 259
comp 8394214..8395754 16s 234 234
comp 8395989..8396255 CDS 220222 89
comp 8616478..8616924 CDS 417 *417 149
8617342..8617418 gac 157 157 157
8617576..8618541 CDS 105821 322
8724363..8724614 CDS 455 *455 84
comp 8725070..8725160 tcg 165 165 165
comp 8725326..8725559 CDS 9205 78
opéron doubles intercalaires cds aa avec aa cdsa cdsd
cumuls. Paenibacillus mucilaginosus 3016
opérons Fréquences intercalaires tRNAs Fréquences intercalaires cds Fréquences aas cds
effectif gammes sans rRNAs avec rRNAs gammes cds gammes cds dirigé gammes cdsa cdsd
avec rRNA opérons 14 1 0 1 1 0 1 0 100 15 8
16 23 5s 0 5 20 14 107 50 3 20 1 200 18 10
16 atc gca 0 40 1 12 100 4 40 0 300 12 6
16 23 5s a 9 60 1 4 150 11 60 2 400 9 3
max a 23 80 0 1 200 11 80 2 500 6 4
a doubles 3 100 0 0 250 3 100 1 600 0 0
spéciaux 0 120 0 2 300 6 120 3 700 0 0
total aas 138 140 0 0 350 7 140 3 800 0 0
sans opérons 17 160 0 1 400 6 160 5 900 1 0
1 aa 11 180 0 0 450 3 180 3 1000 1 0
max a 9 200 0 0 500 3 200 4 1100 0 0
a doubles 1 2 0 5 7 0 0
total aas 35 18 128 62 31 62 31
total aas 173
remarques 3
avec jaune moyenne 16 235 213
variance 20 184 122
sans jaune moyenne 16 14 207 126
variance 12 11 106 49
B5 Paenibacillus mucilaginosus 3016, RNAs blocs
CDS 298 324 373 12
16s 254 258 260 159
23s 168 166 168 256
5s 15 31 9 537
1er aa agc aac aac ttc
aas 9 16 17 9
CDS 183 187 147 104
CDS 677 797 537 54 43
16s 268 261 252 112 94
23s 95 94 94 258 255
5s 55 43 43 403 306
atc / aas 22 11 19 23 12
CDS 283 577 105 342 83
CDS 322 123 460 393 296
16s 269 167 94 94 94
23s 95 248 258 258 259
5s 178 325 456 369 234
*Remarques : 										
 Que des blocs 16-23-5s, 14. Très peu d’opérons sans rRNA, 35 aas pour 17 opérons. Très peu de doubles, 4 doublets.
#@1	Suite aux gènes de protéines cotranscrits avec les gènes de tRNA, voir eco, j’ai entouré les  opérons tRNA, dans les 7 génomes suivants, 
	Par 2 CDS, un avant et un après. Dans cette remarque j’ai voulu montré les intercalalires et les tailles des CDS qui suivent l’opéron. 
	Ce sont pour la plupart de petites protéines hypothétiques, largement plus petites que FT-U mais plus grandes que tpr (voir eco). 
										
#@2	L’intercalaire maximum qui laisserait penser qu’on a affaire à 2 opérons différents. Une recherche simple des promoteurs me paraît 
	difficile dans les bases de données , sauf dans BioCyc qui est payant, aussi je me base sur le regroupement des gènes pour  
	décider que je suis en présence d’un opéron ou non. Mais arrivé à  ce stade de ma réflexion, comme je l’expiciterai plus tard, je ne  
	m’interesse plus à l’existence de l’opéron mais seulement au regroupement CDS-séquence à t-rRNAs-CDS qu’il soit sur 1 ou 2 brins. 
	Ce sont seulement les statistiques des intercalaires et, surtout, le sens 16s-23s qui paraît prévilégier les intercalaires courts, 
	qui m’ontpoussé à changer cette limite vers 400 pb au lieu de 210, limite basée sur l’intercalaire max de 264 entre les 2 derniers 
        tRNAs du 21aas de bsu qui est bien un opéron dans BioCyc.
										
#@3	Voici une séquence qui n’est pas un CDS et pas sur le même brin que le reste du groupe, mais qui répond aux niveaux critères 
	de la remarque @2 précédente. L’intercalaire entre les 2 tRNAs du même brin qui enjambent cette séquence est de 250 pb. 
										
#Séquence des doubles : Très peu de doubles. 3 doublets se trouvent avec les rRNAs dont 1 est successif, un 4ème doublet successif se trouve dans 
	un opéron sans rRNAs. Les doublets dans ce génome sont rares mais se répartissent proportionnellement sur les 2 types d’opérons.

#Les intercalaires dans les blocs : rappel des opérons à bloc chez eco	voir	sigma FIS	362	162	Terminateur
	#: - CDS-16s		234, 298-537, 677 797		voir ici	sigma FIS	442	322	rien
	#: - 16s-23s		258				néant		sigma FIS	473	228	Terminateur
	#: - 23s-5s		168*4, 112, 94*9		93*7		sigma FIS	480	95	Terminateur
	#: - 5s-tRNA		9-15*3	31-54*6			8-12*2, 52	Sigma Lrp-leu	377	228	rien
	#: - L’orientation CDS-16s, CDS de fin de bloc.		83-105*3	Sigma Lrp-leu	373	300	Terminateur
								123-187*5	sigma FIS	614	74	Terminateur
								283-577*6					
										
#Les intercalaires entre tRNAs										
	#: - Dans les opérons sans rRNAs	inf à 20 14/18		16±12				
	#: - Dans les opérons à rRNAs		inf à 20 107/128	16±20				
										
#Les intercalaires avec les CDS des bordures										
	#: - tous les CDS									
	#: - Les CDS orientés									
										
#Taille des CDS de bordure en aas										
	#: - tous les CDS									
	#: - Les CDS orientés									
										
Notes : l’opéron de BioCyc et la direction 16s-23s dans les statistiques des intercalaires des CDS. Promoteur et terminateur. 

Les cds					
Bacteria; Firmicutes; Bacilli; Bacillales; Paenibacillaceae;Paenibacillus.					
bloc				protein		interc	aas
268	262304..262386		ctc		283	-
95	262670..263515		PRD domain	267	282
55	263783..265834		GlcT		179	684
atc	266014..266286		Hpr		-8	91
22	266279..268003		PeP			575
					
258	585869..585942		aga		187	-
166	586130..586885		biotine Stase	40	252
31	586926..587918		BioB		8	331
aac	587927..589093		nanoate		176	389
16	589270..589914		hydrolase		215
					
	20252..21532		Ser ligase	47	427
	21580..21666		tca		140	
	21807..22157		CDS hp		17	117
	22175..22357		CDS hp		23	61
	22381..22524		CDS hp		86	48
	22611..22796		CDS hp		138	62
	22935..25265		Replicase	156	777
	25422..26165		Peptidase	220	248
comp	26386..26460		cgg		183	
	26644..27168		sigma factor	151287	175

Les blocs à rRNAs					
CDS	298	324	373	12	
16s	254	258	260	159	
23s	168	166	168	256	
5s	15	31	9	537	
1er aa	agc	aac	aac	ttc	
aas	9	16	17	9	
CDS	183	187	147	104	
					
CDS	677	797	537	54	43
16s	268	261	252	112	94
23s	95	94	94	258	255
5s	55	43	43	403	306
atc/aas	22	11	19	23	12
CDS	283	577	105	342	83
					
CDS	322	123	460	393	296
16s	269	167	94	94	94
23s	95	248	258	258	259
5s	178	325	456	369	234

pmq distribution

[modifier | modifier le wikicode]
Bc5 pmq, Paenibacillus mucilaginosus 3016. bacilli.
bc51 pmq, distribution des blocs sans rRNA
g1    t1       
atgi 1 tct tat atgf 1
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc tcc 1 tac tgc
atc acc aac 1 agc 1
ctc 3 ccc 1 cac 3 cgt
gtc 1 gcc 1 gac 2 ggc 1
tta 1 tca 1 taa tga
ata aca aaa 1 aga
cta cca caa 1 cga
gta 1 gca 1 gaa 2 gga
ttg tcg 2 tag tgg
atgj 2 acg aag agg
ctg 3 ccg cag cgg 2
gtg gcg gag ggg 1
baci >1aa =1aa -5s +5s -16s +16s total
pmq 24 11 35
bc52 pmq. Distribution des blocs avec rRNA.
g1    t1       
atgi tct tat atgf 7
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc 4 tcc 4 tac 6 tgc 3
atc 5 acc 2 aac 4 agc 3
ctc 4 ccc cac 4 cgt 7
gtc 3 gcc 1 gac 6 ggc 9
tta 1 tca taa tga
ata aca 4 aaa 8 aga 1
cta 1 cca 7 caa 4 cga
gta 7 gca 4 gaa 4 gga 2
ttg 2 tcg 2 tag tgg 3
atgj 2 acg 2 aag agg
ctg 5 ccg cag cgg
gtg gcg gag ggg 1
baci >1aa =1aa -5s +5s -16s +16s total
pmq 138 138

pmq. Intergen51

[modifier | modifier le wikicode]

Intergen51. pmq. Le génome

[modifier | modifier le wikicode]
  • pmq Le prélèvement: Apmq
  • Le nom et le lien NCBI: pmq, Paenibacillus mucilaginosus 3016, NCBI [21], date 07.02.21.
  • pmq La longueur totale des intercalaires, longueur du génome et taux intercalaires/génome:
Nom	intercals	génome		taux en %			
pmq	1,228,719	8,739,048	14.1	
pmq données intercalaires
[modifier | modifier le wikicode]
pmq données intercalaires 200
[modifier | modifier le wikicode]
pmq autres intercalaires aas
[modifier | modifier le wikicode]

Intergen51. pmq. Les différents types d'intercalaires

[modifier | modifier le wikicode]
  • Lien au tableur: Intergen51. pmq les différents types d'intercalaires.
  • Légende:
    - S pour intercalaire CDS-CDS et R pour tRNA-CDS,
    - c pour intercalaire continu (les 2 gènes sont sur le même brin) et x pour discontinu (les 2 gènes sont sur 2 brins différents, le brin et son complément)
    - %reste = 100*reste/total, le reste étant ce qui reste du total après la fin du diagramme, gamme.
    - %t30 = 100*t30/total, t30 étant le total des fréquences 10 20 30
    - %t5 = 100*t/total, t5 étant le total des fréquences de -1 à -5 dans le diagramme des S-.
Int51.2 pmq les différents types d'intercalaires entre gène
Int51.21 Les différents types
intercalaires CDS-CDS * autres intercalaires
continu S+ S- S0 total c/x RNA-RNA CDS-rRNA total
c 4,514 753 26 5,293 2.7 183 15 198
x 1,883 42 5 1,930 0 4 4
t 6,397 795 31 7,223 183 19 202
% 88.6 11.0 0.4
Int51.22 Détail des * autres intercalaires
intercalaires tRNA-CDS récapitulatif des * autres intercalaires
continu R+ R- R0 total c/x * autres total %
c 27 0 0 27 1.8 tRNA-CDS 42 16
x 15 0 0 15 RNA-RNA 183 71
t 42 0 0 42 CDS-rRNA 19 7
% 100.0 0.0 0.0 non RNA 12 5
- total 256 100
Int51.23 Les taux remarquables
taux %reste %t30 %t5 %0
type S+ R+ S- S+ R+ S- S+ R+
gamme 400 400 6-50 - - - - -
type S+ R+ S- S+ R+ S- S+ R+
c 7.8 7.4 2.1 20.0 3.7 62 0.5 0.0
x 14.0 13.3 11.9 2.7 0.0 33 0.3 0.0

Intergen51. pmq. Les diagrammes CDS-CDS positifs

[modifier | modifier le wikicode]
  • Lien tableur: pmq données intercalaires
  • Diagrammes:
    - fc40, CDS-CDS continu, fréquence unitaire en abscisses et effectif en ordonnées pmq fc40
    - fx%, CDS-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et pourcentage en ‰ par rapport au total, en ordonnées. pmq fx1
    - fc%, CDS-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et pourcentage en ‰ par rapport au total, en ordonnées. pmq fc1
  • Équations des courbes de tendance en pour 1000: colonnes %fx %fc
Courbes de tendances pour les diagrammes en pour 1000			Calculs des f.41	pmq
R2	x3		x2		x		c		Inflexion poly3	x	c
0.878	2.70E-06	-2.45E-03	5.77E-01	-6.46	fx1	abscisse	27.4	387.5
0.946	-2.70E-06	2.12E-03	-5.95E-01	73.0	fc1	ordonnée	-3.3	5.0
								
0.502	5.02E-06	-4.13E-04	9.41E-01	-28.9	fx41			
0.950	-3.20E-07	3.72E-04	-2.08E-01	48.4	fc41
  • Le rfin après 400 est de 354 sur un total de 4540. Jusqu'à 1% les freq10 sont en continu jusqu'à 910, reste 45. L'indice i.rfin1 = 309/510 = 0.606.
  • Le reste après 910 est de 45 sur un total de 4540. Jusqu'à 2‰ les freq10 sont en continu jusqu'à 1280, reste 9. L'indice i.rf2 = 36/370 = 0.097.
  • Moyennes glissantes fc+400, diagonale. Voir le détail des calculs dans abs.
données	pmq		calculs			poly3	pmq
effect	4540		R2.21	839		abscis	300
xm	54		pte	10,02		flexa	186
ym	15		cste	3,84		flexo	2,08
x1m	284		r400l	116		xm	45
y1m	1		restp	159,25		sup4	118,0
rfin	77,97		%sd	14,91		sup4t	397,8
bornf	155		lond	230		%	29,7
supd	78,5		%sf	12,42		long	141
supdt	526,4		lonf	101		R2	577
xmp	314,32		sf/lf	0,36			
r400	81,28		sr/lr	0,32			
supf	36,7		sd/ld	0,34			
supft	295,8		i.r400	0,70								

Intergen51. pmq. Les CDS-CDS négatifs

[modifier | modifier le wikicode]
Sous-totaux	pmq			totale	
fréquence	x-	c-		x-	c-
 - 1		0	80		4	4140
 - 2		3	0		85	11
 - 3		0	1		3	12
 - 4		11	384		717	10938
 - 5		0	1		5	19
sp6		28	287		1642	8424
total		42	753		2,456	23,544
reste		5	16		264	420
s6		6	1		361	41
s7		4	44		321	1438
s8		13	226		696	6525
rappot s1-5						
4/2/1		3.7	4.8		8.4	2.6
% / sp6						
s6/sp6		21.4	0.3		22.0	0.5
s7/sp6		14.3	15.3		19.5	17.1
s8/sp6		46.4	78.7		42.4	77.5
reste/sp6	17.9	5.6		16.1	5.0
						
total s1-5	14	466		814	15120
% / total						
%s1-5		33.3	61.9		33.1	64.2
%sp6		66.7	38.1		66.9	35.8

Intergen51. pmq. Les intercalaires des blocs

[modifier | modifier le wikicode]
  • Le détail
RNA-RNA		c	x		CDS-RNA		c	x
23s 5s		14			CDS 16s		11	3
16s 23s		14			5s CDS		4	1
16s tRNA				16 CDS			
tRNA 23s				CDS 5s			
5s tRNA		9			23s CDS			
tRNA in					CDS 23s			
tRNA contig	128			5s 16s			
tRNA hors	18			16s16s			
tRNA 16s								
23s tRNA								
tRNA 5s								
16s 5s								
5s 23s								
5s 5s								
total		183	0		total		15	4
  • Les rares voir gamma pour la longueur des intercalaires
  • Les tRNA-CDS compris, comparaison dans le clade et dans l'étude.

Intergen51. pmq. Les intercalaires tRNA-tRNA extra bloc

[modifier | modifier le wikicode]
Int51.31 pmq. Les intercalaires tRNA-tRNA extra blocs
cont1 cont1 cont2 cont2 cont3 cont4 hors
inter aa    inter aa    inter aa    inter aa    inter aa    inter aa    inter aa
29 agc 5 acc 11 atc 10 tgc 28 ctc 5 ggg 7 aac
39 atgj 19 tcg 5 gaa 20 tta 12 tcc 106 cca 297 agc
15 gta 17 agc 5 gtc 3 cgt 14 atgf 11 cgt 9 gaa
14 atgf 5 gtc 4 atgf ** ttg 14 atgj 5 ggc ** ctc
48 gac 39 acg 9 tgg 19 atc 8 agc 13 ctg 16 gca
5 ttc 41 tcc 8 caa 17 gca 4 tcg 16 ctc 12 gaa
9 aca ** ctc 18 aaa 8 gaa 4 acc 10 aaa 16 gta
15 tac 10 aac 7 ctg 5 gta x119 gca 28 tac 17 gac
** aaa 38 tcc 11 ggc 10 aca x36 ncRNA ** ttc 9 cac
19 atc 11 gaa 12 cgt 18 tac 6 cca 5 gga 9 caa
16 gca 17 gta ** cca 4 aac 104 cgt 16 cca 8 aaa
9 gaa 15 atgf 6 aac 21 gta 7 ggc 4 cgt 3 ctg
20 tac 67 gac 38 tcc 12 atgf 9 ctg 8 ggc ** ggc
3 aac 11 acg 11 gaa 34 gac 9 aaa 42 cta 49 ctg
19 gta 10 cac 17 gta 13 cac 9 caa 8 aaa ** ctg
20 gac 5 caa 13 atgf 8 caa 17 cac 9 caa 40 ctc
15 ttc 17 aaa 49 gac 17 aaa 12 gac 4 tgg 13 tcc
10 aaa 40 ggc 4 ttc 13 ctc 4 gta 5 atgf 19 atgj
3 ctg 24 ggc 13 aca 5 ctg 15 aac 5 gtc ** tcg
12 ggc 8 ttg 8 tac 14 ggc 8 tac 11 gaa 7 tta
15 tgc 19 cca 13 tgg 10 tgc 5 aca ** atc 19 atgi
5 cgt 1 gga 26 cac 5 cgt 15 gaa ** atgf
158 cca ** aga 9 caa ** cca 9 gcc 230 cac
4 gca 12 ggc ** atc ** cac
-

pmq intercalaires entre cds

[modifier | modifier le wikicode]
  • Lien NCBI [22]
  • Note: Pour les génomes des annexes j'ai relevé les intercalaires entre tRNAs et entre ceux-ci et les cds qui leur sont adjacents. L'exemple est celui de rru du clade alpha. L'idée de départ de ces prélèvements est la recherche d'opérons formés de tRNA et de protéine comme dans le cas d'E.coli: l'intercalaire entre le tRNA et la protéine devrait être faible. Voir l'exemple d'eco (remarque @3) avec tac-tac-tpr et aca-tac-gga-acc-tufB.

pmq intercalaires positifs S+

[modifier | modifier le wikicode]
pmq. Sx+ Sc+ Les diagrammes 400
pmq Sx+ Sc+
Poly3 -7 -5 -3 1 R2 flex x+ comment. -7 -5 -3 1 R2 flex c+ comment.
1 à 400 31 -283 664 -7.0 878 304 max190 -29 229 -645 79 946 263 min70
31 à 400 2 parties -13 112 -388 63 937 287 2 parties
droite -a cste - R2 note R2’ -a cste - R2 note R2’
1 à 400 28 31 - 65 poly 813 tF 143 54 806 poly 140 SF
31 à 400 113 46 - 886 dte 51 Sf
  • Légende du tableau des corrélations et des fréquences faibles
pmq. Sx+ Sc+ Les diagrammes 400. Corrélations et les fréquences faibles 1-30
effectifs diagramme corrélation x+ c+, 41-n corrélation x+ c+, 1-n
gen minima x+ c+ total 400 200 250 diff 200 250 400
mba min10 705 1651 2356 154 -330 -221 109 -512 -477 -223
cbei min10 950 3395 4345 402 -509 -375 134 -649 -648 -290
pmq min10 1614 4164 5778 458 -832 -651 181 -866 -825 -61
1-30 ‰ effectifs 0 ‰ <0 ‰ effectifs 1-40 corel
1-30 x+ 1-30 c+ x+/c+ x c x c x- c- x+ c+ x+/c+
45 214 0.21 1255 2688 1 8 18 114 51 428 -74
26 244 0.11 1212 4400 0 4 8 89 35 954 272
32 218 0.15 1927 5296 3 5 22 140 68 1156 -207
  • Diagrammes 400:  pmq cbei,   diagramme 1-40: c+ pmqc+ cbeitotal,   texte: cbei.
  • Résumé: J’ai classé les 21 génomes suivant la forme des diagrammes x+ 1-400. J’ai obtenu 3 groupes,
    1. Les tildes au nombre de 5. Ils sont réguliers et forts, tF, avec un R2’ supérieur à 138 pour 4 d’entre eux et scc avec 71. Ce sont, cbei mba pmq et blo scc.
    2. Les formes S au nombre de 6. Leurs forces (R2’) sont variables, ade rru Sf 20-39, ant mja Sm 70-78, pmg pub SF 179-249.
    3. Les diagrammes à pyramide, c’est à dire présentant une bosse avec 4 ou 5 points contigus. Ils sont au nombre de 10 dont 9 sont des tildes et bsu est un Sf très faible (R2’18). abra rtb spl afn sont des tF avec plus de 96, ase cbn cvi sont des tf avec moins de 30, eco myr sont des tm 43 68.
    - pmq / cbei: Les 2 génomes se ressemblent beaucoup, totaux des effectifs très élevés et diffèrent à peine de 33%, 5778 contre 4345; corrélations sur 41-250 les plus négatives des 21 génomes,-651 contre -377 et les courbes sur x+ 1-400 sont presque identiques avec les tildes très forts, tF, 813 contre 708 et de même sur c+ 31-400 avec la forme S faible, Sf, 8 contre 51.
    - Les diagrammes 400
    • x+ 1-400:
      + Les 2 courbes se ressemblent beaucoup, de forme tilde fort, avec un R2’ de 813 pour pmq contre 708. Cependant les allures sont différentes, plus grande variabilité chez cbei avec un R2 de 712 contre 878 pour pmq et la courbe cbei est plus étirée à la fin car le reste de l’effectif non pris en compte dans le diagramme (reste) est plus élevé que chez pmq, dans un rapport de 0.28 (262/946) contre 0.16 (266/1614 ) pour pmq. De ce point de vue cbei est plus proche de mba que ne l’est pmq, avec un rapport de 0.75 (527/705).
      + Les taux des fréquences faibles 1-30 sont parmi les plus faibles des 21 génomes, 32‰ pour pmq contre 26 pour cbei , et expliquent la forte chute des corrélations sur 1-250 par rapport à 41-250.
      + Les points d’inflexion sont normaux, 304 pour pmq contre 269 pour cbei. Avec pmq, le point d’inflexion élevé et le reste faible non pris en compte dans le diagramme fait que la courbe est arrondie.
    • c+ 1-400: Ce sont 2 courbes semblables de forme S fort, cbei avec un R2’ de 213 et pmq avec un R2’ de 140. Les 2 points d’inflexion sont normaux, 263 pour pmq et 245 pour cbei. Les fréquences faibles sont concentrées à la fréquence 20 qui est maximum local pour cbei. C’est un maximum pour pmq mais les taux sont répartis régulièrement de 10 à 40. Les minima locaux sont différents pour les 2 génomes, min70 pour pmq et min50 pour cbei.
    • x+ 31-400: Je n’ai pas représenté les courbes x+ 31-400 à cause des taux peu élevés des fréquences faibles 1-30.
    • c+ 31-400: Les 2 formes sont 2 S faibles, Sf, très faible pour cbei avec un R2’ de 8 (935 927) et faible pour pmq avec un R2’ de 51 (937 886). Les points d’inflexion sont aussi différents, il est normal pour pmq à la fréquence 287 et très faible pour cbei à 38. La courbe de pmq présente bien 2 parties avec un début renflé, alors que cbei se confond avec une droite d’un seul tenant sans renflement au début d’où le commentaire de “1 partie”.
    - Les corrélations:
    • Sur les plages 41-n: Les 2 corrélations sur 41-250 sont négatives et du même ordre de grandeur, -651 pour pmq et -377 pour cbei. Elles chutent fortement pour les 2 génomes sur 41-200, avec une différence (diff) de 181 pour pmq et 133 pour cbei.
    • Sur les plages 1-n: les 2 génomes chutent fortement aussi, -825 pour pmq et -646 pour cbei.
    - Les faibles fréquences: Les faibles fréquences 1-30 ne sont intéressantes à comparer que pour les génomes à courbes 1-400 semblables où le taux de ces fréquences sont élevés et évoluent en parallèle comme entre pmg et pub où le rapport x+/c+ passe de 0.78 à 0.51. Ici pmq et cbei se comportent de la même façon, respectivement, le rapport x+/c+ fait 0.15 et 0.11, les zéros sont très faibles, 8‰ et 4‰. Les négatifs sont faibles par rapport aux autres génomes mais chez pmq ils sont nettement plus élevés que chez cbei, 162‰ contre 97‰.
    - Les courbes 1-40:
    • c+ 1-40: Les 2 courbes sont très proche de celle du total des c+ 1-40.
    • x+ 1-40: Avec un effectif commun de 68 pour les 2 génomes, les courbes ne peuvent pas être significatives.

pmq autres intercalaires

[modifier | modifier le wikicode]
  • Lien tableur: pmq autres intercalaires aas
  • Légende:  
    - comp, le gène est sur le brin complement
    - deb, fin sont respectivement dans le sens des adresses croissantes, le cds avant le 1er tRNA et le cds après le dernier tRNA du bloc.
    - misc_f, pour misc_feature
    - misc_R, pour misc_RNA
  • Totaux: 1 tmRNA 3 ncRNA
tRNA-cds		tRNA-tRNA		autres-cds		total	
c+	x+	x-	c+	x+	c-	c+	x+	c-		
44	19		185			7			255	1 ax+
  • Méthode de calculs des intercalaires autres que les CDS-CDS voir le cas de amed.

Lactobacillus delbrueckii subsp. bulgaricus ATCC BAA-365

[modifier | modifier le wikicode]
  • Liens: gtRNAdb [23], NCBI [24]
  • Lien tableur: lbu opérons
  • Légende: cdsa: cds aas, cdsj: cdsa sans jaune, cdsd: cdsa dirigé
B6 Lactobacillus delbrueckii subsp. bulgaricus ATCC BAA-365
49.8%GC 29.7.19 Paris  110   doubles intercal cds aa avec aa cdsa cdsd
comp 18533..19237 CDS 128 128 235 128
19366..19438 act @1 195 195
19634..20371 CDS 6912 246
27284..29785 CDS 276 276 *834
30062..30134 act 134 134 134
30269..30907 CDS 11768 213
42676..43248 cds hp 451 *451 *191
43700..45271 16s 209
45481..48391 23s 69
48461..48577 5s 275 275 275
48853..49091 cds hp 56679 80
comp 105771..106547 CDS 56 56 259 56
comp 106604..106679 aag 125 125
106805..107533 CDS 103754 243
211288..212553 CDS 94 94 422
212648..212720 acc 23 23 23
comp< 212744..213262 CDS 64997 173
278260..278928 CDS 69 69 223 69
comp 278998..279068 ggg 181 181
279250..280275 CDS 44047 342
comp 324323..324949 CDS 117 117 209 117
325067..325138 ggc + 4 4
325143..325216 ccg 2 ggc 108
325325..325399 ggc 155 155
325555..326016 CDS 37886 154
363903..364394 CDS 98 98 164 98
364493..364564 caa 614 *614
365179..366360 CDS -14 *394
366347..367402 CDS 75 75 352
367478..367559 tac 5 5
367565..367636 caa 62 62 62
< 367699..368318 CDS 14127 207
382446..382907 CDS 30 30 154 30
382938..383026 ctt 118 118
383145..383768 CDS 70441 208
454210..455529 CDS 61 61 440 61
455591..455665 agg 341 341
456007..457035 CDS 75557 343
532593..533285 CDS 82 82 231 82
comp 533368..533442 cgg 296 296
533739..534782 CDS 48963 348
583746..584728 CDS 57 57 328 57
comp 584786..584858 cag 5 5
comp 584864..584935 gag 170 170
585106..586110 CDS 94988 335
681099..682741 CDS 518 *518 *548
683260..684831 16s 106
684938..685011 atc 69 69
685081..685153 gca 127
685281..688191 23s 68
688260..688376 5s 208 208 208
comp 688585..689801 CDS 55794 406
comp 745596..745821 CDS 134 134 75 134
comp 745956..746044 tcg 787 *787
746832..749597 CDS 36741 *922
786339..787004 CDS 54 54 222 54
787059..787142 ctg 109 109
comp 787252..787872 CDS 2072 207
comp 789945..791867 CDS 613 *613 *641
792481..794052 16s 105
794158..794231 atc 69 69
794301..794373 gca 126
794500..797410 23s 69
797480..797596 5s 87 87 87
797684..798559 CDS 36 292
comp 798596..800178 CDS 530 *530 *528
800709..800781 aac @2 3 3
800785..800858 cca 24 24
800883..800954 ggc 30 30
800985..801058 cgt 2 2
801061..801133 gta 3 3
801137..801208 gaa 42 42
801251..801338 tca 9 9
801348..801421 atgf 3 3
801425..801498 gac 6 6
801505..801577 ttc 8 8
801586..801667 tac 4 4
801672..801742 tgg 13 13
801756..801831 cac 26 26
801858..801928 tgc 28 28
801957..802041 ttg 356 356 356
802398..802961 CDS 284259 188
comp 1087221..1088531 CDS 157 157 437 157
comp 1088689..1088760 caa 656 *656
comp 1089417..1090313 CDS 173317 *299
comp 1263631..1265769 CDS 188 188 *713 188
comp 1265958..1266031 aga 222 222
1266254..1268632 CDS 84103 *793
comp 1352736..1354022 CDS 98 98 429 98
1354121..1354204 ctg 204 204
comp 1354409..1354928 CDS 13182 173
comp 1368111..1369307 CDS 161 161 399 161
comp 1369469..1369541 gta 3 3
comp 1369545..1369616 gaa 138 *138
comp 1369755..1369828 atgj 6 6
comp 1369835..1369925 tcc 8 8
comp 1369934..1370006 aac 7
comp 1370014..1370130 5s 69
comp 1370200..1373111 23s 126
comp 1373238..1373310 gca 69 69
comp 1373380..1373453 atc 105
comp 1373559..1375130 16s 547 *547
1375678..1376604 CDS 102845 *309
comp 1479450..1479824 CDS 200 200 125
comp 1480025..1480101 gac 26 26
comp 1480128..1480199 gaa 3 3
comp 1480203..1480275 gta 2 2
comp 1480278..1480351 cgt 35 35
comp 1480387..1480458 ggc 36
comp 1480495..1480611 5s 68
comp 1480680..1483590 23s 208
comp 1483799..1485370 16s 153 153 153
comp 1485524..1485716 CDS 20944 64
comp 1506661..1507464 CDS 270 270 268
comp 1507735..1507807 aag + 34 34
comp 1507842..1507914 aag 5 aag 33 33
comp 1507948..1508020 aag 33 33
comp 1508054..1508126 aag @3 33 33
comp 1508160..1508232 aag 130 130 130
comp 1508363..1509226 CDS 167 288
1509394..1510872 CDS 106 106 493 106
comp 1510979..1511051 gta 3 3
comp 1511055..1511126 gaa 151 *151
1511278..1511366 ctt 113 113
1511480..1512010 CDS 21195 177
comp 1533206..1534129 CDS 355 355 308
comp 1534485..1534557 acg 154 154 154
comp 1534712..1535950 CDS 18502 413
1554453..1554638 CDS 303 303 62 303
comp 1554942..1555029 agc 673 *673
comp 1555703..1556203 CDS 595 *167
1556799..1558178 CDS 277 277 460
comp 1558456..1558572 5s 68
comp 1558641..1561551 23s 126
comp 1561678..1561750 gca 69 69
comp 1561820..1561893 atc 105
comp 1561999..1563570 16s 189 189 189
1563760..1563948 CDS 19274 63
comp 1583223..1584392 CDS 151 151 390 151
comp 1584544..1584628 ttg + 17 17
comp 1584646..1584730 ttg 2 ttg 28 28
comp 1584759..1584829 tgc 2 ttc 26 26
comp 1584856..1584931 cac 2 atgf 13 13
comp 1584945..1585015 tgg 4 4
comp 1585020..1585101 tac 8 8
comp 1585110..1585182 ttc 6 6
comp 1585189..1585262 gac 3 3
comp 1585266..1585339 atgf 9 9
comp 1585349..1585436 tca 42 42
comp 1585479..1585550 gaa 258 *258
comp 1585809..1585899 agc 2 2
comp 1585902..1585975 atc 3 3
comp 1585979..1586049 gga 14 14
comp 1586064..1586136 ttc 17 17
comp 1586154..1586227 atgf 11 11
comp 1586239..1586312 atgi 12 12
comp 1586325..1586398 atg 36 36
comp 1586435..1586508 cca 6 6
comp 1586515..1586588 cgt 5 5
comp 1586594..1586679 tta 15 15
comp 1586695..1586766 ggc 4 4
comp 1586771..1586843 aca 11 11
comp 1586855..1586936 cta 12 12
comp 1586949..1587021 aaa 2 2
comp 1587024..1587096 gta 157 157
comp 1587254..1588681 CDS 539 476
comp 1589221..1590557 CDS 156 156 446 156
comp 1590714..1590830 5s 68
comp 1590899..1593809 23s 126
comp 1593936..1594008 gca 69 69
comp 1594078..1594151 atc 105
comp 1594257..1595828 16s 581 *581
comp 1596410..1597276 CDS 189853 *289
comp 1787130..1788440 CDS 298 298 437 298
comp 1788739..1788855 5s 68
comp 1788924..1791834 23s @4 208
comp 1792043..1793614 16s 436 *436
comp 1794051..1794596 CDS -8 *182
comp 1794589..1795436 CDS 138 138 283 138
comp 1795575..1795648 gac 3 3
comp 1795652..1795724 gta 2 2
comp 1795727..1795800 cgt 35 35
comp 1795836..1795907 ggc 19 19
comp 1795927..1796000 cca 3 3
comp 1796004..1796076 aac 7
comp 1796084..1796200 5s 68
comp 1796269..1799179 23s 208
comp 1799388..1800959 16s 501 *501
comp 1801461..1802087 CDS *209
cumuls. Lactobacillus delbrueckii subsp. bulgaricus ATCC BAA-365
opérons Fréquences intercalaires tRNAs Fréquences intercalaires cds Fréquences aas cds
effectif gammes sans rRNAs avec rRNAs gammes cds gammes cdsd gammes cdsa
avec rRNA opérons 9 1 0 0 1 0 1 0 100 5
16 23 5s 0 2 20 33 9 50 2 20 0 200 11
16 atc gca 5 40 11 3 100 12 40 2 300 19
16 23 5s a 2 60 2 0 150 11 60 3 400 11
max a 7 80 0 5 200 14 80 3 500 11
a doubles 0 100 0 0 250 3 100 4 600 2
autres 0 120 0 0 300 6 120 2 700 1
total aas 26 140 0 1 350 2 140 5 800 2
sans opérons 23 160 1 0 400 2 160 5 900 1
1 aa 16 180 0 0 450 1 180 1 1000 1
max a 26 200 0 0 500 1 200 2 1100 0
a doubles 3 1 0 10 5 0
total aas 72 48 18 64 32 64
total aas 98
remarques
avec jaune moyenne 138 320
variance 81 182
sans jaune moyenne 14 29 159 114 275
variance 12 29 85 50 122
  • Note: intercalaires prélevés de la colonne cds de lbu opérons dans un bloc de tRNAs uniquement. Le début du bloc est dans l'ordre des adresses, deb intercalaire entre le cds et le 1er tRNA dd bloc, fin entre le dernier tRNA et le cds terminal. J'ai procédé, dans les colonnes petit et grand, à la réorientation des blocs d'après la constatation que les blocs à rRNA ont leurs cds de début et de fin sont orientés du cds-16s au 5s-tRNAs-cds, l'intercalaire cds-16s étant plus grands que l'intercalaire avec le cds terminal. En tête de colonne est le % du nombre des intercalaires inférieurs à 201 pbs.
lbu	78			61			48			91
deb	fin		deb	fin		grand	petit		grand	petit
30	118		94	23		75	62		94	23
54	109		75	62		94	23		118	30
56	125		54	109		109	54		109	54
57	170		106	113		113	106		125	56
61	341		30	118		118	30		170	57
69	181		56	125		125	56		341	61
75	62		270	130		155	117		75	62
82	296		276	134		157	151		181	69
94	23		355	154		170	57		296	82
98	614		117	155		181	69		204	98
98	204		151	157		195	128		614	98
106	113		57	170		204	98		113	106
117	155		69	181		222	188		155	117
128	195		128	195		270	130		195	128
134	787		98	204		276	134		270	130
151	157		188	222		296	82		276	134
157	656		82	296		341	61		787	134
188	222		61	341		355	154		157	151
270	130		530	356		530	356		355	154
276	134		98	614		614	98		656	157
303	673		157	656		656	157		222	188
355	154		303	673		673	303		673	303
530	356		134	787		787	134		530	356
  • Comparaison cds-cds tRNA-cds: deb fin, c'est l'ordre des adresses et grand petit l'ordre après réorientation. Leur pourcentage est calculé par rapport à la colonne, c'est-à-dire la moitié du total des tRNA-cds.
bacilli	cds total	total	<0	0-200	201-370	371-600	>600	deb	fin	grand	petit
lbu	1,838		46		32	9	1	4	18	14	11	21
lbu ‰					696	196	22	87	783	609	478	913
B6 Lactobacillus delbrueckii, RNAs blocs
cds 277’    cds 156    cds 298
5s 68 5s 68 5s 68
23s 126 23s 126 23s 208
gca 69 gca 69 16s 436
atc 105 atc 105 cds -8
16s 189’ 16s 581 cds 138
cds cds gac 3
4aas *
cds 518 cds 613’ aac 7
16s 106 16s 105 5s 68
atc 69 atc 69 23s 208
gca 127 gca 126 16s 501
23s 68 23s 69 cds
5s 208’ 5s 87
cds cds
cds 161 cds hp 451 cds 200
gta 3 16s 209 gac 26
3aas * 23s 69 3aas *
aac 7 5s 275 ggc 36
5s 69 cds hp 5s 68
23s 126 23s 208
gca 69 16s 153
atc 105 cds
16s 547’
cds
*Remarques : Ce génome se distingue par un indice 4 fois supérieur des gènes de tRNAs 					
	par rapport à ceux du total des bacilli.				
					
@1	Les gènes de tRNA se terminant par g et t sont rares chez les 				
	et ont un indice total de 5 par génome. Ce génome en a 20.				
	La plupart sont isolés, seuls ou dans de petits clusters sans rRNA.				
	aag se distingue par sa fréquence élevée, 6, et surtout par sa répétition de 5				
	dans un seul cluster.				
	Cependant  chez les bacilli les gènes présents ont un indice plus élevés que 				
	les très rares. J’ai repéré 4 groupes :	
		
			indice		présents			absents
	rares moyens	99>ind>43	aag6 cgg agg ctt2 ctg2 		(ctc gtc)
					tcg acg (acc tcc)		
	rares		26>ind>11	ggg ccg cag gag act2		(gcc)
	très rares	7,9>ind>0,6					gtg gcg ttt cct (ccc ata)
	nuls		0,6>ind						autres xxt, tous absents
					
@2	Les clusters sans rRNAs sont beaucoup plus longs que ceux avec rRNA, 26 15 5,				
	contre 6 5 5.	Les petits clusters sont en grande partie ceux de @1.			
	Les clusters  26 et 15 n’ont pas de doublons ou très peu et se comportent comme				
	les clusters avec rRNAs longs des bacilli (ppm bsu lmo lma* pmq ban*) :				
	 pas de répétition, pas de séquence et doublons séparés. 				
					
@3	répétition de 5 de aag, voir @1 ci-dessus.				
					
@4	5 blocs 635 et 4 blocs 6-atcgca-35 avec des intercalaires identiques. Très peu de 				
	gènes tRNA à la suite de ces blocs (6 5 5 )  contrairement aux autres bacilli étudiés qui 				
	dépassent les 21 aas : ppm bsu lmo lma* pmq ban*.				
					
Séquences des doubles (indiqués par le signe + dans le tableau): 
  Les doubles, peu nombreux, se trouvent dans les clusters sans rRNAs. pas de séquences mais une répétition de 5 chez les gènes  rares.
  Voir ci-dessus @2.		

lbu distribution

[modifier | modifier le wikicode]
Bc6 lbu, Lactobacillus delbrueckii subsp. bulgaricus ATCC BAA-365. bacilli.
bc61 lbu, distribution des blocs sans rRNA.
g1    t1       
atgi 1 tct tat atgf 3
att act aat agt
ctt 1 cct cat cgc
gtt gct gat ggt
ttc 3 tcc 2 tac 3 tgc 2
atc 1 acc 1 aac 1 agc 1
ctc ccc 2 cac 2 cgt 2
gtc gcc gac 2 ggc 4
tta 1 tca taa tga
ata aca aaa 1 aga
cta 1 cca 1 caa 1 cga
gta 3 gca gaa 3 gga 1
ttg 3 tcg tag tgg 2
atgj 1 acg aag 5 agg
ctg ccg cag 1 cgg
gtg gcg gag 1 ggg
baci >1aa =1aa -5s +5s -16s +16s total
lbu 56 56
bc62 lbu. Distribution des blocs avec rRNA.
g1    t1       
atgi tct tat atgf
att act 2 aat agt
ctt 1 cct cat cgc
gtt gct gat ggt
ttc tcc 1 tac tgc
atc 5 acc 1 aac 2 agc 1
ctc ccc cac cgt 2
gtc gcc gac 2 ggc 2
tta tca taa tga
ata aca aaa aga 1
cta cca 1 caa 2 cga
gta 3 gca 5 gaa 2 gga
ttg tcg 1 tag tgg
atgj 1 acg 1 aag 1 agg 1
ctg 2 ccg cag cgg 1
gtg gcg gag ggg 1
baci >1aa =1aa -5s +5s -16s +16s total
lbu 16 16 10 42

lbu. Intergen51

[modifier | modifier le wikicode]

Intergen51. lbu. Le génome

[modifier | modifier le wikicode]
  • lbu Le prélèvement: Abacilli
  • Le nom et le lien NCBI: lbu, Lactobacillus delbrueckii subsp. bulgaricus ATCC BAA-365, NCBI [25], date 13.2.22.
  • lbu La longueur totale des intercalaires, longueur du génome et taux intercalaires/génome:
Nom	intercals	génome		taux en %			
lbu	222,489		1,856,951	12.0	
lbu données intercalaires
[modifier | modifier le wikicode]
lbu données intercalaires 200
[modifier | modifier le wikicode]
lbu autres intercalaires aas
[modifier | modifier le wikicode]

Intergen51. lbu. Les différents types d'intercalaires

[modifier | modifier le wikicode]
  • Lien au tableur: Intergen51. lbu les différents types d'intercalaires.
  • Légende:
    - S pour intercalaire CDS-CDS et R pour tRNA-CDS,
    - c pour intercalaire continu (les 2 gènes sont sur le même brin) et x pour discontinu (les 2 gènes sont sur 2 brins différents, le brin et son complément)
    - %reste = 100*reste/total, le reste étant ce qui reste du total après la fin du diagramme, gamme.
    - %t30 = 100*t30/total, t30 étant le total des fréquences 10 20 30
    - %t5 = 100*t/total, t5 étant le total des fréquences de -1 à -5 dans le diagramme des S-.
Int51.2 lbu les différents types d'intercalaires entre gène
Int51.21 Les différents types
intercalaires CDS-CDS * autres intercalaires
continu S+ S- S0 total c/x RNA-RNA CDS-rRNA total
c 1,088 280 10 1,378 3.2 92 10 102
x 409 20 2 431 1 5 6
t 1,497 300 12 1,809 93 15 108
% 82.8 16.6 0.7
Int51.22 Détail des * autres intercalaires
intercalaires tRNA-CDS récapitulatif des * autres intercalaires
continu R+ R- R0 total c/x * autres total %
c 30 0 0 30 1.7 tRNA-CDS 48 24
x 18 0 0 18 RNA-RNA 93 47
t 48 0 0 48 CDS-rRNA 15 8
% 100.0 0.0 0.0 non RNA 42 21
- total 198 100
Int51.23 Les taux remarquables
taux %reste %t30 %t5 %0
type S+ R+ S- S+ R+ S- S+ R+
gamme 400 400 6-50 - - - - -
type S+ R+ S- S+ R+ S- S+ R+
c 4.6 3.3 0.0 31.7 3.3 49 0.7 0.0
x 7.8 11.1 30.0 2.9 5.6 30 0.5 0.0

Intergen51. lbu. Les diagrammes CDS-CDS positifs

[modifier | modifier le wikicode]
  • Lien tableur: lbu données intercalaires
  • Diagrammes:
    - fc40, CDS-CDS continu, fréquence unitaire en abscisses et effectif en ordonnées lbu fc40
    - fx%, CDS-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et pourcentage en ‰ par rapport au total, en ordonnées. lbu fx1
  • Équations des courbes de tendance en pour 1000: colonnes %fx %fc
Courbes de tendances pour les diagrammes en pour 1000			Calculs des f.41	lbu
R2	x3		x2		x		c		Inflexion poly3	x	c
0.582	5.83E-06	-3.82E-03	5.83E-01	17.0	fx1	abscisse	296.7	162.1
0.815	-5.52E-06	4.32E-03	-1.12E+00	108.0	fc1	ordonnée	11.3	23.2
								
0.837	-2.64E-06	2.35E-03	-7.67E-01	101.0	fx41			
0.936	1.54E-06	-7.49E-04	-4.16E-02	43.1	fc41
  • Le rfin après 400 est de 51 sur un total de 1098. Jusqu'à 1% les freq10 sont en continu jusqu'à 670, reste 11. L'indice i.rfin1 = 40/270 = 0.148.
  • Moyennes glissantes fc+400, diagonale. Voir le détail des calculs dans abs.
données	lbu		calculs			poly3	lbu
effect	1098		R2.21	777		abscis	400
xm	35		pte	11,36		flexa	177
ym	3,405		cste	3,50		flexo	2,05
x1m	220		r400l	180		xm	35
y1m	1		restp	152,09		sup4	190,3
rfin	46,45		%sd	36,46		sup4t	445,4
bornf	171		lond	185		%	42,7
supd	184,9		%sf	36,62		long	142
supdt	507,3		lonf	136		R2	504
xmp	340,62		sf/lf	1,17			
r400	105,65		sr/lr	0,53			
supf	159,1		sd/ld	1,00			
supft	434,4		i.r400	0,59											

Intergen51. lbu. Les CDS-CDS négatifs

[modifier | modifier le wikicode]
Sous-totaux	lbu			totale	
fréquence	x-	c-		x-	c-
 - 1		1	80		4	4140
 - 2		1	0		85	11
 - 3		0	1		3	12
 - 4		4	55		717	10938
 - 5		0	0		5	19
sp6		14	144		1642	8424
total		20	280		2,456	23,544
reste		6	0		264	420
s6		3	1		361	41
s7		0	19		321	1438
s8		5	124		696	6525
rappot s1-5						
4/2/1		4.0	0.7		8.4	2.6
% / sp6						
s6/sp6		21.4	0.7		22.0	0.5
s7/sp6		0.0	13.2		19.5	17.1
s8/sp6		35.7	86.1		42.4	77.5
reste/sp6	42.9	0.0		16.1	5.0
						
total s1-5	6	136		814	15120
% / total						
%s1-5		30.0	48.6		33.1	64.2
%sp6		70.0	51.4		66.9	35.8

Intergen51. lbu. Les intercalaires des blocs

[modifier | modifier le wikicode]
  • Le détail
RNA-RNA		c	x		CDS-RNA		c	x
23s 5s		9			CDS 16s		6	3
16s 23s		4			5s CDS		4	2
16s tRNA	5			16 CDS			
tRNA 23s	5			CDS 5s			
5s tRNA		3			23s CDS			
tRNA in		5			CDS 23s			
tRNA contig	13			5s 16s			
tRNA hors	48	1		16s16s			
tRNA 16s								
23s tRNA								
tRNA 5s								
16s 5s								
5s 23s								
5s 5s								
total		92	1		total		10	5
  • Les rares voir gamma pour la longueur des intercalaires
  • Les tRNA-CDS compris, comparaison dans le clade et dans l'étude.

Intergen51. lbu. Les intercalaires tRNA-tRNA extra bloc

[modifier | modifier le wikicode]
Int51.31 lbu. Les intercalaires tRNA-tRNA extra blocs
contig hors hors hors
inter aa    inter aa    inter aa    inter aa
3 gta 4 ggc 34 aag 17 ttg
138 gaa 108 ccg 33 aag 28 ttg
6 atgj ** ggc 33 aag 29 tgc
8 tcc 5 tac 33 aag 13 cac
** aac ** caa ** aag 4 tgg
26 gac 5 cag 3 gta 8 tac
3 gaa ** gag x151 gaa 6 ttc
2 gta 3 aac ** ctt 3 gac
35 cgt 24 cca 9 atgf
** ggc 30 ggc 42 tca
3 gac 2 cgt 261 gaa
2 gta 3 gta 2 agc
35 cgt 42 gaa 3 atc
19 ggc 9 tca 14 gga
3 cca 3 atgf 17 ttc
** aac 6 gac 11 atgf
8 ttc 12 atgi
4 tac 36 atgj
13 tgg 6 cca
29 cac 5 cgt
28 tgc 15 tta
** ttg 4 ggc
11 aca
12 cta
2 aaa
** gta
-

ban* Bacillus anthracis strain 2002013094

[modifier | modifier le wikicode]
  • Attention: la notation KEGG pour ce génome n'existe pas. Elle est remplacée par ban*. Mais par commodité j'ai mis ban pour la suite. Ce n'est pas le génome ban de KEGG Bacillus anthracis Ames
  • Liens: gtRNAdb [26], NCBI [27], génome [orgn]
  • Lien tableur: ban opérons
  • Légende: cdsa: cds aas, cdsj: cdsa sans jaune, cdsd: cdsa dirigé
B7 Bacillus anthracis strain 2002013094
35.1%GC 15.8.19 Paris  112   doubles intercal cds aa avec aa cdsa cdsd
618142..618366 CDS 188 188 75 188
618555..618627 gtc 419 *419
comp 619047..619235 CDS 63
comp 1102183..1102602 CDS 130 130 140 130
comp 1102733..1102804 gaa + 1 1
comp 1102806..1102880 aac 2 aca 8 8
comp 1102889..1102965 atc 2 tca 11 11
comp 1102977..1103047 tgg 6 6
comp 1103054..1103126 aca 9 9
comp 1103136..1103211 ttc 9 9
comp 1103221..1103296 gac 4 4
comp 1103301..1103377 atgf 20 20
comp 1103398..1103490 tca 54 54
comp 1103545..1103637 tca 20 20
comp 1103658..1103730 gca 16 16
comp 1103747..1103820 cca 10 10
comp 1103831..1103904 cgt 3 3
comp 1103908..1103996 tta 16 16
comp 1104013..1104087 ggc 29 29
comp 1104117..1104197 cta 22 22
comp 1104220..1104295 cac 9 9
comp 1104305..1104380 aca 4 4
comp 1104385..1104460 gta 4
comp 1104465..1104580 5s 97
comp 1104678..1107604 23s 141
comp 1107746..1109299 16s 694 *694
1109994..1113038 CDS *1015
comp 1306706..1307848 CDS 198 198 381
comp 1308047..1308120 gga 115 115 115
comp 1308236..1308889 CDS 218
1312025..1312345 CDS 207 207 107 207
comp 1312553..1312637 ttg 10 10
comp 1312648..1312718 tgc 14 14
comp 1312733..1312807 ggc 5 5
comp 1312813..1312887 caa 63 63
comp 1312951..1313026 cac 19 19
comp 1313046..1313119 tgg 7 7
comp 1313127..1313210 tac 17 17
comp 1313228..1313303 gta 5 5
comp 1313309..1313383 gaa 24 24
comp 1313408..1313480 acc 4 4
comp 1313485..1313559 aac 9
comp 1313569..1313684 5s 96
comp 1313781..1316709 23s 141
comp 1316851..1318405 16s 386 *386
1318792..1319148 CDS 119
1556278..1556507 CDS 57 57 77 57
comp 1556565..1556680 5s 49
comp 1556730..1560126 23s 173
comp 1560300..1562132 16s 476 *476
1562609..1563322 CDS 238
> 1566949..1567219 CDS 99 99 90 99
comp 1567319..1567434 5s 46
comp 1567481..1570409 23s 142
comp 1570552..1572115 16s 451 *451
1572567..1574498 CDS *644
1579539..1580615 CDS 14 14 359 14
comp 1580630..1580745 5s 45
comp 1580791..1583912 23s 153
comp 1584066..1585720 16s 294 294
comp 1586015..1587520 CDS *502
comp 1600693..1601166 CDS 174 174 158
comp 1601341..1601416 gac 3 3
comp 1601420..1601496 atgf 12
comp 1601509..1601624 5s @1 46
comp 1601671..1604598 23s 141
comp 1604740..1606294 16s 75
comp 1606370..1606440 gga 1 1
comp 1606442..1606518 cca + 4 4
comp 1606523..1606599 cgt Séquence 10 3 3
comp 1606603..1606691 tta 16 16
comp 1606708..1606782 ggc 29 29
comp 1606812..1606892 cta 14 14
comp 1606907..1606982 aaa 5 5
comp 1606988..1607062 caa 87 *87
comp 1607150..1607225 gac 46 46
comp 1607272..1607347 gta 4 4
comp 1607352..1607426 gaa 1 1
comp 1607428..1607502 aac 2 aac 8 8
comp 1607511..1607587 atc 11 11
comp 1607599..1607669 tgg 6 6
comp 1607676..1607748 aca 9 9
comp 1607758..1607833 ttc 8 8
comp 1607842..1607917 gac 4 4
comp 1607922..1607998 atgf 20 20
comp 1608019..1608111 tca 2 tca 54 54
comp 1608166..1608258 tca 20 20
comp 1608279..1608351 gca 16 16
comp 1608368..1608441 cca 10 10
comp 1608452..1608525 cgt 3 3
comp 1608529..1608617 tta 16 16
comp 1608634..1608708 ggc 29 29
comp 1608738..1608818 cta 13 13
comp 1608832..1608907 aaa 5 5
comp 1608913..1608987 caa 87 *87
comp 1609075..1609150 gac 46 46
comp 1609197..1609272 gta 4 4
comp 1609277..1609351 gaa 8 8
comp 1609360..1609450 agc 3 3
comp 1609454..1609528 aac 114 114 114
comp 1609643..1610101 CDS 153
comp 1702642..1703788 CDS 114 114 382 114
comp 1703903..1703975 gca 10 10
comp 1703986..1704057 ggc 5 5
comp 1704063..1704138 aaa 5 5
comp 1704144..1704218 caa 65 65
comp 1704284..1704366 tac 17 17
comp 1704384..1704459 gta 5 5
comp 1704465..1704539 gaa 24 24
comp 1704564..1704636 acc 4 4
comp 1704641..1704715 aac 9
comp 1704725..1704840 5s 82
comp 1704923..1707851 23s 141
comp 1707993..1709545 16s 223 223
comp 1709769..1709987 CDS 73
comp 1767157..1767618 CDS 206 206 154 206
comp 1767825..1767940 5s 45
comp 1767986..1770913 23s 141
comp 1771055..1772608 16s 372 *372
comp 1772981..1774480 CDS *500
comp 1787717..1790188 CDS 259 259 *824
comp 1790448..1790519 gaa 13 13
comp 1790533..1790606 atgj @2 160 160 160
comp 1790767..1791249 CDS 161
comp 1820538..1820717 CDS 190 190 60 190
comp 1820908..1821023 5s 44
comp 1821068..1823996 23s 77
comp 1824074..1824149 gca 8 8
comp 1824158..1824234 atc 130
comp 1824365..1825919 16s 217 217
comp 1826137..1826406 CDS 90
comp 1832600..1832992 CDS 166 166 131
comp 1833159..1833251 tca 156 156 156
comp 1833408..1834682 CDS 425
1839668..1840669 CDS 34 34 334 34
comp 1840704..1840819 5s 44
comp 1840864..1843791 23s 76
comp 1843868..1843943 gca 8 8
comp 1843952..1844028 atc 130
comp 1844159..1845713 16s 240 240
comp 1845954..1848425 CDS *824
1873838..1875127 CDS 139 139 430 139
1875267..1875342 aaa 13 13
1875356..1875427 gaa 21 21
1875449..1875524 gac 41 41
1875566..1875638 ttc 403 *403
1876042..1876749 CDS 236
comp 2217640..2217846 CDS 205 205 69 205
2218052..2218130 cgg 255 255
2218386..2219693 CDS 436
comp 2428815..2429495 CDS 404 *404 227
2429900..2431456 16s 139
2431596..2434524 23s 97
2434622..2434737 5s 4
2434742..2434817 gta + 4 4
2434822..2434897 aca 2 cta 9 9
2434907..2434982 cac 2 aca 22 22
2435005..2435085 cta 29 29
2435115..2435189 ggc 16 16
2435206..2435294 tta 3 3
2435298..2435371 cgt 10 10
2435382..2435455 cca 16 16
2435472..2435544 gca 20 20
2435565..2435657 tca 54 54
2435712..2435805 cta 20 20
2435826..2435902 atgf 1 1
2435904..2435979 gac 12 12
2435992..2436067 ttc 14 14
2436082..2436157 aca 10 10
2436168..2436243 aaa 13 13
2436257..2436327 gga 10 10
2436338..2436414 atc 7 7
2436422..2436496 aac 7 7
2436504..2436594 agc 6 6
2436601..2436672 gaa 59 59 59
2436732..2436842 CDS 37
2798971..2799474 CDS 109 109 168 109
2799584..2799657 gga 1 1
2799659..2799735 aga 407 *407
2800143..2800343 CDS 67
comp 2991608..2992366 CDS 242 242 253
2992609..2992682 atgi 221 221 221
2992904..2993515 CDS 204
  • Lien tableur: ban cumuls
  • Note du 16.11.20: attention le @1 doit être intégré dans les rRNA et non dans les sans. Refaire les calculs.
cumuls. Bacillus anthracis strain 2002013094
opérons Fréquences intercalaires tRNAs Fréquences intercalaires cds Fréquences aas cds
effectif gammes sans rRNAs avec rRNAs gammes cds gammes cdsd gammes cdsa
avec rRNA opérons 11 1 3 2 1 0 1 0 100 10
16 23 5s 0 4 20 25 47 50 2 20 1 200 9
16 atc gca 2 40 3 6 100 3 40 1 300 6
16 23 5s a 5 60 4 2 150 6 60 2 400 4
max a 21 80 0 2 200 7 80 0 500 4
a doubles 2 100 2 0 250 8 100 1 600 1
autres 0 120 0 0 300 3 120 4 700 1
total aas 66 140 0 0 350 0 140 2 800 0
sans opérons 9 160 0 0 400 2 160 2 900 2
1 aa 5 180 0 0 450 3 180 0 1000 0
max a 33 200 0 0 500 0 200 2 1100 1
a doubles 1 0 0 0 4 0
total aas 46 37 59 34 19 38
total aas 112
remarques 2
avec jaune moyenne 18 15 232 132 274
variance 21 14 143 62 238
sans jaune moyenne 14 165 191
variance 14 71 124
  • Note: intercalaires prélevés de la colonne cds de ban opérons dans un bloc de tRNAs uniquement. Le début du bloc est dans l'ordre des adresses, deb intercalaire entre le cds et le 1er tRNA dd bloc, fin entre le dernier tRNA et le cds terminal. J'ai procédé, dans les colonnes petit et grand, à la réorientation des blocs d'après la constatation que les blocs à rRNA ont leurs cds de début et de fin sont orientés du cds-16s au 5s-tRNAs-cds, l'intercalaire cds-16s étant plus grands que l'intercalaire avec le cds terminal. En tête de colonne est le % du nombre des intercalaires inférieurs à 201 pbs.
ban	63			38			25			75
deb	fin		deb	fin		grand	petit		grand	petit
109	407		198	115		166	156		407	109
139	403		166	156		198	115		198	115
166	156		259	160		242	221		403	139
188	419		242	221		255	205		166	156
198	115		205	255		259	160		259	160
205	255		139	403		403	139		419	188
242	221		109	407		407	109		255	205
259	160		188	419		419	188		242	221
  • Comparaison cds-cds tRNA-cds: deb fin, c'est l'ordre des adresses et grand petit l'ordre après réorientation. Leur pourcentage est calculé par rapport à la colonne, c'est-à-dire la moitié du total des tRNA-cds.
bacilli	cds total	total	<0	0-200	201-370	371-600	>600	deb	fin	grand	petit
ban	5,700		16		8	5	3		5	3	2	6
ban ‰					500	312.5	187.5	0	625	375	250	750
B7 Bacillus anthracis, RNAs blocs
cds 694’ cds 386’ cds 114
16s 141 16s 141 aac *
23s 97 23s 96 31aas 1
5s 4 5s 9 gga 75
gta * aac * 16s 141
17aas 1 9aas 10 23s 46
gaa 130 ttg 207’ 5s 12
cds cds atgf 3
gac 174
cds 223 cds 404’ cds
16s 141 16s 139
23s 82 23s 97 cds 217 240
5s 9 5s 4 16s 130 130
aac * gta 4 atc 8 8
7aas 10 19aas * gca 77 76
gca 114 gaa 59 23s 44 44
cds cds 5s 190 34’
cds
cds 476’ 451’ 294 372
16s 173 142 153 141
23s 49 46 45 45
5s 57’ 99’ 14’ 206
cds

ban séquences

[modifier | modifier le wikicode]
  • Lien au tableau ban opérons
  • Lien tableur: ban séquences
  • Lien bsu-lmo
  • Légende: 33 aas, cluster à 33 gènes de tRNA
    - répétitions de séquence intra bloc: Dans le bloc 33aas uniquement, il y a une séquence de 10aas répétée. Elle est divisée de 2 séquences de 5 chacune, cyan et bleu.
    - répétitions de séquence entre blocs
    • - entre les clusters 11aas et 9aas: une séquence de 5 se répète, le jaune.
    • - entre les clusters 33aas 21aas et 19aas je repère 3 grandes séquences qui se répètent, contenant des sous séquences qui se répètent aussi: séquence de 16 (cadre solide) commune à 33aas et 19aas, séquence de 15 (cadre en tirets) commune à 21aas et 19aas et une séquence de 12 commune aux 3 clusters et composée de la séquence 5 cyan et d'une séquence de 7aas (rouge) contenant atgf et un doublet tca. Il faut noter ici que tca est modifié en cta alors que les intercalaires atgf-cta-tca et atgf-tca-tca ne changement pas, 20-54. C'est que cta et tca sont des tRNAs de même longueur, seule une mutation ponctuelle est en cause.
    • - entre le cluster 33aas et 21aas existe un bloc commun de 3 gènes gaa-agc-acc qu'on ne peut mettre en parallèle. A-t-il un rôle important dans les recombinaisons?
    - Les intercalaires qui changent: la plupart des intercalaires se répètent comme les gènes sauf les intercalaires de aca-ttc-gac-atgf qui sont constants dans les clusters 33aas et 19aas et diffèrent dans le 21aas. De même pour cca-cgt (cyan) qui diffèrent dans 33as mais restent constants entre les 3 clusters. Ce qui différencie les 2 séquences cyan de 33aas. En fin de 33aas le triplet gaa-agc-aac se répète au début de 21aas mais avec des intercalaires changeant, 8-3 contre 6-7. Ces changements dans les intercalaires laissent penser qu'ils se produisent lors des recombinaisons des blocs intra cluster (cyan 1 et 2 de 33aas) ou entre clusters.
B7. Bacillus anthracis strain 2002013094,
séquences des gènes tRNA dans les clusters à rRNA.
33 aas inter 21 aas inter 19 aas inter 11 aas inter
gga 1 ttg 10
cca 4 tgc 14
cgt 3 ggc 5
tta 16 caa 63
ggc 29 cac 19
cta 14 tgg 7
aaa 5 tac 17
caa 87 gta 5
gac 46 gaa 6 gaa 24
gta 4 agc 7 acc 4
gaa 1 aac 7 gaa 1 aac
aac 8 atc 10 aac 8
atc 11 gga 13 atc 11
tgg 6 aaa 10 tgg 6
aca 9 aca 14 aca 9
ttc 8 ttc 12 ttc 9
gac 4 gac 1 gac 4
atgf 20 atgf 20 atgf 20
tca 54 cta 54 tca 54 9 aas inter
tca 20 tca 20 tca 20
gca 16 gca 16 gca 16 gca 10
cca 10 cca 10 cca 10 ggc 5
cgt 3 cgt 3 cgt 3 aaa 5
tta 16 tta 16 tta 16 caa 65
ggc 29 ggc 29 ggc 29 tac 17
cta 13 cta 22 cta 22 gta 5
aaa 5 cac 9 cac 9 gaa 24
caa 87 aca 4 aca 4 acc 4
gac 46 gta gta aac
gta 4
gaa 8
agc 3
aac

ban occurrences

[modifier | modifier le wikicode]
  • Légende: atgi pour Ile2, atgf pour fMet et atgj pour Met
I11. Occurrence des gènes tRNA chez ban*
ttt tct    tat    tgt   
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc 4 tcc tac 2 tgc 1
atc 5 acc 2 aac 6 agc 2
ctc ccc cac 3 cgt 4
gtc 1 gcc gac 7 ggc 6
tta 4 tca 6 taa tga
atgi 1 aca 5 aaa 5 aga 1
cta 5 cca 4 caa 4 cga
gta 6 gca 6 gaa 8 gga 4
ttg 1 tcg tag tgg 3
atgf/j 4/1 acg aag agg
ctg ccg cag cgg 1
gtg gcg gag ggg

ban intercalaires

[modifier | modifier le wikicode]
  • Légende: aa pour gène tRNA, inter aa pour intercalaire rRNA-aa
I11. Intercalaires des rRNAs chez ban*
aa gta aac atgf aac CDS
inter aa 4 9 12 9 404
5s 97 96 46 82 139
23s 141 141 141 141 97
16s 694 386 75 223 4
CDS CDS CDS gga CDS gta
CDS 57 99 14 206
5s 49 46 45 45
23s 173 142 153 141
16s 476 451 294 372
CDS
CDS 190 34
5s 44 44
23s 77 76
gca 8 8
atc 130 130
16s 217 240
CDS
  • Liens:    ban séquences,    ban intercalaires,    ban occurrences,    indices bacilli
  • Note du 16.11.20: attention le @1 doit être intégré dans les rRNA et non dans les sans. Refaire les calculs.
  • Remarques:
    1. @1 Existence des blocs à rRNA inversés
      - Ce sont des blocs dont les gènes tRNAs se trouvent juste après le rRNA 16s au lieu d’être après le 5s ou parfois le 23s dans le sens 16s23s5s. J’en ai rencontré beaucoup dans les génomes détaillés dans ces annexes. Mais leurs présences systématiques dans les études exhaustives des fiches me laissaient penser à croire en leur existence.
      - En effet, le comportement des blocs normaux laissait penser que la juxtaposition des gènes tRNAs et du 16s était fortuite, le bloc 16s serait mobile et s’introduirait au hasard à côté d’une séquence de gènes tRNA. Dans l’étude des intercalaires entre gènes de tRNA, je voulais savoir s’il y avait une différence entre les blocs à rRNA et les blocs sans. Tout au début, je considérais les gènes de tRNA des blocs inversés comme appartenant aux blocs sans rRNA. Cependant l’intercalaire entre le 16s et le 1er aa était si faible quelquefois que cela me gênait de l’en séparer. Dans les cumuls de ce génome ban*, j’ai considéré la séquence de 33aas comme n’appartenant pas au bloc 16s adjacent. Cependant la moyenne et la variance des intercalaires sont les mêmes que celles des blocs 16s normaux.
      -Avec le génome ban* j’ai pu comparer les séquences des gènes tRNA ici et il est évident qu’avec la disposition des sous séquences et leurs intercalaires tout se passe comme si les réarrangements étaient dus à l’existence des blocs 16s. Et donc que la séquence des 33aas devait se trouver à la suite du 5s et a été déplacée par retournement, ce qui a facilité l’homogénéisation des séquences 12aas (cadres en tirets) par conversion dans les 3 blocs. Ensuite une conversion entre blocs 2 à 2 s’est faite séparément. Donc avant les conversions, il y a eu le retournement de 33aas et avant d’être 33aas, il y a eu duplication du bloc cyan+bleu.
      - Donc après cette analyse des séquences, je considérerai tous les blocs inversés comme appartenant au bloc 16s quelle que soit la distance de juxtaposition. Il reste cependant une inconnue : est-ce que l’espace entre 16s et le 1er aa est dû à notre incapacité à reconnaître une séquence fonctionnelle, ou bien effectivement dans certains rares cas li y a eu juxtaposition au hasard.
    2. @2 Il n’y a que 13 tRNAs sans rRNA. Tous les atgf se trouvent avec rRNA alors qu’il n’y a qu’un seul exemplaire de atgi et atgj. Voir le tableau des occurrences totales de ban* et le tableau ci-dessous pour les gènes rares.
      - Ils se répartissent en 8 clusters dont 5 ne contiennent qu’un seul gène. Trois gènes rares chez les bacilli s’y trouvent, gtc cgg aga.
      - Par comparaison les clusters à rRNAs ne contiennent que 3 gènes rares sur 99, 2 acc et tgc.
      - Le plus grand cluster à 4 gènes ressemble beaucoup au au bloc bleu du cluster 33aas, aaa gaa gac ttc contre aaa caa gac gta gaa pour le bloc bleu.
      - Au tableau des indices bacilliles 3527 gènes atg ne sont pas différenciés pour 672 génomes. Le décompte suivant montre que atgi et agj ont un indice moyen, un gène par génome, donc c’est un gène obligatoire comme l’est tgc.
		
Les gènes rares chez les bacilli				Clusters sans rRNAs de ban*
	indice pour 100 génomes	   occurrence chez ban*			
	tcc		108			0			aaa  gaa  gac  ttc
	acc		83			2			gtc
	ccc		5,7			0			gga
	gcc		26			0			gaa atgj
	tgc		106			1			tca
	aga		108			1			cgg
	cga		5,4			0			gga  aga
	agg		66			0			atgi
	cgg		99			1			
	ctc		67			0			
	gtc		47			1			

Décompte des atg pour 678 génomes, 30.10.19 Tanger .			
	atg	indice	décompte	
	fMet	260	1762	
	Ile2	133	901	
	Met	139	941	
	total		3604
  • Les intercalaires des clusters à rRNAs. Dans le tableau ban intercalaires, je ne mets en valeur que les intercalaires faisant intervenir les rRNAs.
    - les intercalaires 5s-23s: 4 blocs avec des gènes tRNA ont un intercalaire double des 7 autres et le bloc inversé se comporte comme les autres: 97-82 contre 49-44.
    - L'intercalaire 23s-16s: il est constant pour 7 blocs, 142-139 les 2 autres ont 10% (153) et 20% (173) de plus.
    - L'intercalaire aa-5s: il est très faible, 4-12. L’intercalaire aa-16s du bloc inversé est du même ordre que le 5s-23s et cela est du au retournement de la séquence des 33aas.
    - L'intercalaire cds-5s : sur les 6 blocs qui le portent 3 sont très faibles, 57 34 14 et les 3 autres sont moyens relativement aux cds-16s, 99 190 206, et restent orientés cds-16s-5s-cds.
    - L'intercalaire cds-16s: ils sont très élevés mais peu variables. 5 blocs ne contenant pas d'aas tournent autour de 420, 476-372, un sixième a 50% de plus, 694. Les 4 restants ont un intercalaire faible et se répartissent en 2 avec aas, 217 240, et 2 sans aas, 223 294.
    - L'homogénéité de ces blocs est comparable avec celle de bsu.
  • Séquence des doubles : Très peu de doubles, si l’on ne tient pas compte de la duplication des blocs cyan et bleu de 10 aas dans le cluster à 33aas. Dans celui-ci il y a 2 doubles gac aac et une répétition tca-tca. Si l’on tient compte des aas proche du 5s, il faut ajouter atgf (double) et gac (triple). Pour le cluster 21aas aca et cta sont doubles, et pour le 19aas aca est double et tca répété. Les clusters 11aas et 9aas n’ont pas de doubles.

ban distribution

[modifier | modifier le wikicode]
  • Lien tableur: ban distribution
  • Notes:
    - Les avant 16s, -16s, sont comptés comme les après 5s, +5s. Ils sont au nombre de 33 et ne sont pas soulignés.
    - Les 1-3aas après 5s, +5s, sont soulignés: atgf gac
    - duplicata: tca2
Bc7 ban, Bacillus anthracis strain 2002013094. bacilli.
bc71 ban, distribution des blocs sans rRNA.
g1    t1       
atgi 1 tct tat atgf
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc 1 tcc tac tgc
atc 2 acc aac agc 1
ctc ccc cac cgt
gtc 1 gcc gac 1 ggc 2
tta tca 1 taa tga
ata aca aaa 1 aga
cta cca caa cga 1
gta gca 2 gaa 2 gga
ttg tcg tag tgg
atgj 1 acg aag agg
ctg ccg cag cgg
gtg gcg gag ggg
baci >1aa =1aa -5s +5s -16s +16s total
ban 8 5 4 17
bc72 ban. Distribution des blocs avec rRNA.
g1    t1       
atgi tct tat atgf 4
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc 3 tcc tac 2 tgc 1
atc 3 acc 2 aac 6 agc 2
ctc ccc cac 3 cgt 4
gtc gcc gac 6 ggc 6
tta 4 tca 5 taa tga
ata aca 5 aaa 4 aga
cta 5 cca 4 caa 4 cga
gta 6 gca 4 gaa 6 gga 2
ttg 1 tcg tag tgg 3
atgj acg aag agg
ctg ccg cag cgg
gtg gcg gag ggg
baci >1aa =1aa -5s +5s -16s +16s total
ban 95 95

ban. Intergen51

[modifier | modifier le wikicode]

Intergen51. ban. Le génome

[modifier | modifier le wikicode]
  • ban Le prélèvement: Abacilli
  • Le nom et le lien NCBI: ban, Bacillus anthracis strain 2002013094 chromosome, NCBI [28], date 21.1.22.
  • ban La longueur totale des intercalaires, longueur du génome et taux intercalaires/génome:
Nom	intercals	génome		taux en %			
ban	749,857		5,321,900	14.1	
ban données intercalaires
[modifier | modifier le wikicode]
ban données intercalaires 200
[modifier | modifier le wikicode]
ban autres intercalaires aas
[modifier | modifier le wikicode]

Intergen51. ban. Les différents types d'intercalaires

[modifier | modifier le wikicode]
  • Lien au tableur: Intergen51. ban les différents types d'intercalaires.
  • Légende:
    - S pour intercalaire CDS-CDS et R pour tRNA-CDS,
    - c pour intercalaire continu (les 2 gènes sont sur le même brin) et x pour discontinu (les 2 gènes sont sur 2 brins différents, le brin et son complément)
    - %reste = 100*reste/total, le reste étant ce qui reste du total après la fin du diagramme, gamme.
    - %t30 = 100*t30/total, t30 étant le total des fréquences 10 20 30
    - %t5 = 100*t/total, t5 étant le total des fréquences de -1 à -5 dans le diagramme des S-.
Int51.2 ban les différents types d'intercalaires entre gène
Int51.21 Les différents types
intercalaires CDS-CDS * autres intercalaires
continu S+ S- S0 total c/x RNA-RNA CDS-rRNA total
c 3,256 564 33 3,853 2.4 125 7 132
x 1,579 13 0 1,592 0 9 9
t 4,835 577 33 5,445 125 16 141
% 88.8 10.6 0.6
Int51.22 Détail des * autres intercalaires
intercalaires tRNA-CDS récapitulatif des * autres intercalaires
continu R+ R- R0 total c/x * autres total %
c 18 0 0 18 4.5 tRNA-CDS 22 13
x 4 0 0 4 RNA-RNA 126 73
t 22 0 0 22 CDS-rRNA 16 9
% 100.0 0.0 0.0 non RNA 9 5
- total 173 100
Int51.23 Les taux remarquables
taux %reste %t30 %t5 %0
type S+ R+ S- S+ R+ S- S+ R+
gamme 400 400 6-50 - - - - -
type S+ R+ S- S+ R+ S- S+ R+
c 5.1 16.7 0.0 25.9 0.0 56 0.9 0.0
x 10.3 25.0 7.7 8.7 0.0 23 0.0 0.0

Intergen51. ban. Les diagrammes CDS-CDS positifs

[modifier | modifier le wikicode]
  • Lien tableur: ban données intercalaires
  • Diagrammes:
    - fc40, CDS-CDS continu, fréquence unitaire en abscisses et effectif en ordonnées ban fc40
    - fx%, CDS-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et pourcentage en ‰ par rapport au total, en ordonnées. ban fx1
  • Équations des courbes de tendance en pour 1000: colonnes %fx %fc
Courbes de tendances pour les diagrammes en pour 1000			Calculs des f.41	ban
R2	x3		x2		x		c		Inflexion poly3	x	c
0.541	1.52E-06	-8.89E-04	3.90E-02	38.1	fx1	abscisse	431.0	198.3
0.739	-3.16E-06	2.60E-03	-7.46E-01	85.6	fc1	ordonnée	3.5	19.9
								
0.772	-1.98E-07	2.56E-04	-1.76E-01	47.7	fx41			
0.900	2.37E-06	-1.41E-03	1.28E-01	31.5	fc41
  • Le rfin après 400 est de 168 sur un total de 3289. Jusqu'à 1% les freq10 sont en continu jusqu'à 640, reste 33. L'indice i.rfin1 = 135/240 = 0.562.
  • Moyennes glissantes fc+400, diagonale. Voir le détail des calculs dans abs.
données	ban		calculs			poly3	ban
effect	3289		R2.21	800		abscis	400
xm	45		pte	9,81		flexa	194
ym	9		cste	3,18		flexo	1,98
x1m	222		r400l	178		xm	45
y1m	1		restp	191,24		sup4	162,8
rfin	51,08		%sd	34,88		sup4t	437,5
bornf	152		lond	177		%	37,2
supd	169,0		%sf	35,81		long	149
supdt	484,3		lonf	107		R2	645
xmp	324,41		sf/lf	1,19			
r400	140,16		sr/lr	0,59			
supf	127,5		sd/ld	0,95			
supft	356,0		i.r400	0,79									

Intergen51. ban. Les CDS-CDS négatifs

[modifier | modifier le wikicode]
Sous-totaux	ban			totale	
fréquence	x-	c-		x-	c-
 - 1		0	73		4	4140
 - 2		0	1		85	11
 - 3		0	0		3	12
 - 4		3	241		717	10938
 - 5		0	0		5	19
sp6		10	249		1642	8424
total		13	564		2,456	23,544
reste		1	0		264	420
s6		4	0		361	41
s7		2	40		321	1438
s8		3	209		696	6525
rappot s1-5						
4/2/1		-	3.3		8.4	2.6
% / sp6						
s6/sp6		40.0	0.0		22.0	0.5
s7/sp6		20.0	16.1		19.5	17.1
s8/sp6		30.0	83.9		42.4	77.5
reste/sp6	10.0	0.0		16.1	5.0
						
total s1-5	3	315		814	15120
% / total						
%s1-5		23.1	55.9		33.1	64.2
%sp6		76.9	44.1		66.9	35.8

Intergen51. ban. Les intercalaires des blocs

[modifier | modifier le wikicode]
  • Le détail
RNA-RNA		c	x		CDS-RNA		c	x
23s 5s		11			CDS 16s		5	5
16s 23s		9			5s CDS		2	4
16s tRNA	2			16 CDS			
tRNA 23s	2			CDS 5s			
5s tRNA		5			23s CDS			
tRNA in		2			CDS 23s			
tRNA contig	89			5s 16s			
tRNA hors	5			16s16s			
tRNA 16s	1						
23s tRNA								
tRNA 5s								
16s 5s								
5s 23s								
5s 5s								
total		126	0		total		7	9
  • Les rares voir gamma pour la longueur des intercalaires
  • Les tRNA-CDS compris, comparaison dans le clade et dans l'étude.

Intergen51. ban. Les intercalaires tRNA-tRNA extra bloc

[modifier | modifier le wikicode]
Int51.31 ban. Les intercalaires tRNA-tRNA extra blocs
cont1 cont2 cont3 cont3 cont4
inter aa    inter aa    inter aa    inter aa    inter aa
1 gaa 10 ttg 1 gga 20 atgf 4 gta
8 aac 14 tgc 4 cca 54 tca 9 aca
11 atc 5 ggc 3 cgt 20 tca 22 cac
6 tgg 63 caa 16 tta 16 gca 29 cta
9 aca 19 cac 29 ggc 10 cca 16 ggc
9 ttc 7 tgg 14 cta 3 cgt 3 tta
4 gac 17 tac 5 aaa 16 tta 10 cgt
20 atgf 5 gta 87 caa 29 ggc 16 cca
54 tca 24 gaa 46 gac 13 cta 20 gca
20 tca 4 acc 4 gta 5 aaa 54 tca
16 gca ** aac 1 gaa 87 caa 20 cta
10 cca 3 gac 8 aac 46 gac 1 atgf
3 cgt ** atgf 11 atc 4 gta 12 gac
16 tta hors 6 tgg 8 gaa 14 ttc
29 ggc 13 gaa 9 aca 3 agc 10 aca
22 cta ** atgj 8 ttc ** aac 13 aaa
9 cac 13 aaa 4 gac 10 gga
4 aca 21 gaa 7 atc
** gta 41 gac 7 aac
** ttc 6 agc
1 gga ** gaa
** aga
-

bacilli synthèse

[modifier | modifier le wikicode]

bacilli distribution par génome

[modifier | modifier le wikicode]
bacilli distribution par génome
baci >1aa 1aa -5s +5s -16s +16s duplica 1-3aas total
bsu 18 8 52 2 4 2 86
lmo 9 8 44 4 2 67
lam 22 14 16 4 3 4 63
ppm 67 21 68 5 161
pmq 22 11 138 0 2 173
lbu 49 16 16 10 7 98
ban 8 5 60 33 4 2 112
total 195 83 0 394 35 31 12 10 760

bacilli distribution du total

[modifier | modifier le wikicode]
  • Lien tableur: bacilli distribution du total
  • Légende:
  • Tableau de gauche
    - Les couleurs cyan et jaune sont les emplacements des >3 des +5s de bacilli + clostridia
    Cyan pour les valeurs faibles, total 82.
    Jaune pour les valeurs fortes et en gras les plus fortes, total 410.
    blanc pour les valeurs intermédiaires, gca et atc le sont aussi, total 225.
    - Le rouge pour l'emplacement des +16s occupés, gca et atc.
    - Les encadrés sont les emplacements des 1-3aas des +5s de alpha + gamma.
    - Le -16s de 33 aas est compté ici comme un +5s long (inversion).
  • Tableau de droite: Les duplicata ne sont pas comptés dans le total de 43 mais dans le total des >1aa du tableau de gauche.
  • Tableau des indices, en-tête: total des génomes, total des tRNAs, indice ttt, indice tgt.
Bacilli. Distribution du total.
bacilli. Distribution du total: >1aa 1aa +5s >3
g1    t1       
atgi 8 tct tat atgf 34
att act 2 aat agt
ctt 5 cct cat cgc
gtt gct gat ggt
ttc 23 tcc 12 tac 24 tgc 12
atc 16 acc 8 aac 32 agc 17
ctc 11 ccc 2 cac 21 cgt 27
gtc 8 gcc 4 gac 34 ggc 39
tta 16 tca 17 taa tga
ata 1 aca 23 aaa 30 aga 9
cta 15 cca 27 caa 29 cga 2
gta 36 gca 17 gaa 42 gga 19
ttg 13 tcg 10 tag tgg 15
atgj 14 acg 7 aag 10 agg 3
ctg 15 ccg 2 cag 1 cgg 8
gtg gcg gag 2 ggg 4
baci7 >1aa 1aa -5s +5s -16s +16s total
type 207 83 0 394 33 0 717
bacilli. Distribution du total: +16s -16s +5s <4 dupli
g1    t1       
atgi tct tat atgf 2
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc tcc 1 tac tgc
atc 15 acc 1 aac 4 agc
ctc ccc cac cgt 1
gtc gcc gac 2 ggc 3
tta tca taa tga
ata aca aaa aga
cta cca caa cga
gta gca 16 gaa gga 1
ttg 2 tcg tag tgg
atgj acg aag 5 agg
ctg 2 ccg cag cgg
gtg gcg gag ggg
baci7 dupli 1aa -5s +5s -16s +16s total
type 12 10 2 31 43
bacilli. indices du 29.5.20 618 génomes
g1 t1 618 49366 0,2  0
atgi 146 tct 0,3 tat 0,5 atgf 285
att 0,2 act 11 aat 0,5 agt
ctt 47 cct 0,6 cat 0,2 cgc 0,2
gtt 0,2 gct 0,5 gat ggt
ttc 272 tcc 120 tac 239 tgc 117
atc 310 acc 92 aac 378 agc 159
ctc 75 ccc 6,1 cac 186 cgt 288
gtc 53 gcc 30 gac 386 ggc 310
tta 211 tca 244 taa 1,1 tga 1,8
ata 2,1 aca 294 aaa 340 aga 119
cta 199 cca 243 caa 299 cga 6,3
gta 397 gca 443 gaa 468 gga 305
ttg 125 tcg 47 tag 0,8 tgg 137
atgj 152 acg 47 aag 73 agg 72
ctg 60 ccg 19 cag 17 cgg 109
gtg 0,8 gcg 8,6 gag 16 ggg 18
inter max min total
2820 4504 634 7958

bacilli distribution par type

[modifier | modifier le wikicode]
Bacilli. Distribution par type.
bacilli. distribution des solitaires
g1    t1          
atgi 2 tct tat atgf
att act 2 aat agt
ctt 2 cct cat cgt
gtt gct gat ggt
ttc tcc tac tgc
atc 1 acc 2 aac 1 agc 1
ctc 3 ccc 2 cac cgc 1
gtc 5 gcc 2 gac 1 ggc
tta 2 tca 5 taa tga
ata aca 1 aaa aga 7
cta cca caa 4 cga
gta gca gaa gga 5
ttg tcg 5 tag tgg
atgj 2 acg 3 aag 4 agg 3
ctg 5 ccg cag cgg 8
gtg gcg gag 1 ggg 3
baci7 inter max min total
1aa 27 13 43 83
bacilli. distribution du type >1aa sans duplicata.
g1    t1          
atgi 3 tct tat atgf 7
att act aat agt
ctt 3 cct cat cgt
gtt gct gat ggt
ttc 9 tcc 3 tac 11 tgc 5
atc 3 acc aac 9 agc 6
ctc 4 ccc cac 9 cgc 3
gtc gcc 1 gac 11 ggc 7
tta 3 tca 5 taa tga
ata 1 aca 4 aaa 8 aga 1
cta 3 cca 5 caa 10 cga 2
gta 8 gca 2 gaa 19 gga 4
ttg 4 tcg 3 tag tgg 7
atgj 4 acg 2 aag 1 agg
ctg 1 ccg 2 cag 1 cgg
gtg gcg gag 1 ggg
baci7 inter max min total
>1aa 59 115 21 195
bacilli. distribution des +5s >3
g1    t1          
atgi 3 tct tat atgf 18
att act aat agt
ctt cct cat cgt
gtt gct gat ggt
ttc 14 tcc 9 tac 13 tgc 7
atc 12 acc 6 aac 22 agc 10
ctc 4 ccc cac 12 cgc 23
gtc 3 gcc 1 gac 22 ggc 29
tta 11 tca 7 taa tga
ata aca 18 aaa 22 aga 1
cta 12 cca 22 caa 15 cga
gta 28 gca 15 gaa 23 gga 10
ttg 7 tcg 2 tag tgg 8
atgj 8 acg 2 aag agg
ctg 7 ccg cag cgg
gtg gcg gag ggg 1
baci7 inter max min total
+5s>3 135 279 13 427

bacilli par rapport au groupe de référence

[modifier | modifier le wikicode]
Comparaison avec la référence
tRNAs blocs tRNAs blocs rRNAs
baci8 1aa >1aa dup +5s 1-3aas autres total
21 faible 43 21 5 13 82
16 moyen 27 59 4 135 2 31 227
14 fort 13 115 3 279 8 2 418
83 195 12 427 10 33 760
10 g+cga 16 12 5 5 38
2 agg+cgg 11 0 11
4 carre ccc 12 5 8 25
5 autres 4 4 8
43 21 5 13 82
total tRNAs ‰
baci8 1aa >1aa dup +5s 1-3aas autres baci ‰ ref.‰
21 faible 57 28 7 17 108 26
16 moyen 36 78 5 178 3 41 299 324
14 fort 17 151 4 367 11 3 550 650
109 257 16 562 13 43 760 729
10 g+cga 21 16 7 7 50 10
2 agg+cgg 14 14
4 carre ccc 16 7 11 33 16
5 autres 5 5 11
57 28 7 17 108
blocs tRNAs ‰ total colonne %
baci8 1aa >1aa dup total ref.‰ 1aa >1aa dup
21 faible 148 72 17 238 26 52 11
16 moyen 93 203 14 310 324 33 30
14 fort 45 397 10 452 650 16 59
286 672 41 290 729 83 195
10 g+cga 55 41 17 114 10 37
2 agg+cgg 38 38 26
4 carre ccc 41 17 59 16 28
5 autres 14 14 28 9
148 72 17 238 43

bacilli, estimation des -rRNAs

[modifier | modifier le wikicode]
  • Lien tableur: bacilli, estimation des -rRNAs
  • Liens fiche:   typage
  • Légende: prélèvement de la base gtRNAdb le 29.5.20
    - ttt et tgt sont nuls partout
    - atgi, c'est Ile2, mis à la place de ttt, très rare chez les procaryotes.
    - atgf, c'est Metf, mis à la place de tgt, très rare chez les procaryotes.
    - atgj, c'est Met, remplace le atg standard qui est la somme Ile2 Met fMet.
    - Voir la légende des tris, g1 t1 et des couleurs

bacilli, calcul des -rRNAs

[modifier | modifier le wikicode]
bac bacilli 32 génomes
bac1 cumul des +rRNAs de la fiche bacilli pour 32 génomes
g1    t1       
atgi 20 tct tat atgf 91
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc 63 tcc 30 tac 56 tgc 30
atc 92 acc 27 aac 99 agc 38
ctc 15 ccc cac 53 cgt 82
gtc 3 gcc 1 gac 106 ggc 101
tta 59 tca 49 taa tga
ata aca 87 aaa 84 aga 1
cta 54 cca 77 caa 69 cga
gta 113 gca 122 gaa 94 gga 49
ttg 32 tcg 2 tag tgg 42
atgj 32 acg 3 aag agg
ctg 12 ccg cag cgg
gtg gcg gag ggg 1
baci32 inter max min total
693 1171 25 1889
bac2 indices du clade bacilli du 29.5.20 de gtRNAdb pour 100 génomes
g1    t1      618 0.2  0
atgi 146 tct 0.3 tat 0.5 atgf 285
att 0.2 act 11 aat 0.5 agt
ctt 47 cct 0.6 cat 0.2 cgc 0.2
gtt 0.2 gct 0.5 gat ggt
ttc 272 tcc 120 tac 239 tgc 117
atc 310 acc 92 aac 378 agc 159
ctc 75 ccc 6.1 cac 186 cgt 288
gtc 53 gcc 30 gac 386 ggc 310
tta 211 tca 244 taa 1.1 tga 1.8
ata 2.1 aca 294 aaa 340 aga 119
cta 199 cca 243 caa 299 cga 6.3
gta 397 gca 443 gaa 468 gga 305
ttg 125 tcg 47 tag 0.8 tgg 137
atgj 152 acg 47 aag 73 agg 72
ctg 60 ccg 19 cag 17 cgg 109
gtg 0.8 gcg 8.6 gag 16 ggg 18
gtRNA inter max min total
2820 4504 660 7984
bac3 cumul des -rRNAs de l'annexe bacilli 7 génomes
g1    t1       
atgi 5 tct tat atgf 7
att act 2 aat agt
ctt 5 cct cat cgc
gtt gct gat ggt
ttc 9 tcc 3 tac 11 tgc 5
atc 4 acc 2 aac 10 agc 7
ctc 7 ccc 2 cac 9 cgt 4
gtc 5 gcc 3 gac 12 ggc 10
tta 5 tca 10 taa tga
ata 1 aca 5 aaa 8 aga 8
cta 3 cca 5 caa 14 cga 2
gta 8 gca 2 gaa 19 gga 9
ttg 6 tcg 8 tag tgg 7
atgj 6 acg 5 aag 10 agg 3
ctg 8 ccg 2 cag 1 cgg 8
gtg gcg gag 2 ggg 3
baci7 inter max min total
90 131 69 290
bac4 indices des +rRNAs de la fiche bacilli pour 100 génomes
g1    t1       
atgi 63 tct tat atgf 284
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc 197 tcc 94 tac 175 tgc 94
atc 288 acc 84 aac 309 agc 119
ctc 47 ccc cac 166 cgt 256
gtc 9.4 gcc 3.1 gac 331 ggc 316
tta 184 tca 153 taa tga
ata aca 272 aaa 263 aga 3.1
cta 169 cca 241 caa 216 cga 2.0
gta 353 gca 381 gaa 294 gga 153
ttg 100 tcg 6.3 tag tgg 131
atgj 100 acg 9.4 aag agg 3.0
ctg 38 ccg cag cgg 8.0
gtg gcg gag ggg 3.1
baci32 inter max min total
2166 3659 78 5903
bac5 estimation des -rRNA du clade bacilli pour 100 génomes
g1    t1       
atgi 84 tct 0.3 tat 0.5 atgf 1
att 0.2 act 11 aat 0.5 agt
ctt 47 cct 0.6 cat 0.2 cgc 0.2
gtt 0.2 gct 0.5 gat ggt
ttc 75 tcc 26 tac 64 tgc 23
atc 23 acc 8 aac 69 agc 40
ctc 28 ccc 6.1 cac 20 cgt 32
gtc 44 gcc 27 gac 55 ggc -6
tta 27 tca 91 taa 1.1 tga 1.8
ata 2.1 aca 22 aaa 78 aga 116
cta 30 cca 2.0 caa 83 cga 6.3
gta 44 gca 62 gaa 174 gga 152
ttg 25 tcg 41 tag 0.8 tgg 6.0
atgj 52 acg 38 aag 73 agg 72
ctg 23 ccg 19 cag 17 cgg 109
gtg 0.8 gcg 8.6 gag 16 ggg 15
-rRNA inter max min total
654 845 582 2081
bac6 indices des -rRNAs de l'annexe archeo pour 100 génomes
g1    t1       
atgi 71 tct tat atgf 100
att act 29 aat agt
ctt 71 cct cat cgc 0.2
gtt gct gat ggt
ttc 129 tcc 43 tac 157 tgc 71
atc 57 acc 29 aac 143 agc 100
ctc 100 ccc 29 cac 129 cgt 57
gtc 71 gcc 43 gac 171 ggc 143
tta 71 tca 143 taa tga 1.8
ata 14 aca 71 aaa 114 aga 114
cta 43 cca 71 caa 200 cga 29
gta 114 gca 29 gaa 271 gga 129
ttg 86 tcg 114 tag tgg 100
atgj 86 acg 71 aag 143 agg 43
ctg 114 ccg 29 cag 14 cgg 114
gtg gcg gag 29 ggg 43
baci7 inter max min total
1286 1871 986 4143

bacilli, comparaison clade-annexe des -rRNAs

[modifier | modifier le wikicode]
  • Lien tableur: bacilli, comparaison clade-annexe des -rRNAs
  • Légende
    - bac7. diff, somme des couleurs de bac7. La différence entre tRNAs est faite entre bac5 et bac6 du tableau précédent. Elle est exprimée en % et rapporté à la plus grande valeur des 2 termes de la différence. Ce qui fait quand un tRNA est à zéro la différence en % est égale à 100.
    - bac8. rap, rapport des sommes couleurs bac5/bac2. Le rapport -rRNA/total est celui du tRNA de bac5 sur celui de bac2.
  • Fréquences des différences en % du tableau bac7
gamme		0/0	10	20	30	40	50	60	70	80	90	100		total
fréquence	0	2	3	1	9	6	5	9	5	3	6	1	50
tot ≤ 50						21							
  • Comparaison avec le nombre de tRNAs de la fiche du clade: L’estimation des -rRNA par l'annexe est 43% au dessus de celle de la fiche des bacilli.
tRNAs		fiche		annexe
sans		925		290
avec		1902		470
genomes		32		7
indice %	29		41
bac bacilli 32 génomes
bac7 bacilli, différence clade-annexe des -rRNAs
g1    t1       
atgi 14 tct 100 tat 100 atgf 99
att 100 act 62 aat 100 agt
ctt 34 cct 100 cat 100 cgc 100
gtt 100 gct 100 gat ggt
ttc 42 tcc 39 tac 59 tgc 67
atc 61 acc 73 aac 52 agc 60
ctc 72 ccc 79 cac 84 cgt 44
gtc 39 gcc 37 gac 68 ggc 104
tta 63 tca 36 taa 100 tga 100
ata 85 aca 69 aaa 32 aga 1
cta 29 cca 97 caa 58 cga 78
gta 62 gca 54 gaa 36 gga 15
ttg 71 tcg 64 tag 100 tgg 94
atgj 39 acg 47 aag 49 agg 40
ctg 80 ccg 34 cag 16 cgg 5
gtg 100 gcg 100 gag 44 ggg 65
diff inter max min total
867 838 850 2554
bac8 bacilli, rapports -rRNA/total
g1    t1       
atgi 57 tct tat atgf 0.2
att act 100 aat agt
ctt 100 cct cat cgc 100
gtt gct gat ggt
ttc 28 tcc 22 tac 27 tgc 20
atc 7 acc 8 aac 18 agc 25
ctc 38 ccc 100 cac 11 cgt 11
gtc 82 gcc 90 gac 14 ggc -2
tta 13 tca 37 taa tga 100
ata 100 aca 8 aaa 23 aga 97
cta 15 cca 1 caa 28 cga 100
gta 11 gca 14 gaa 37 gga 50
ttg 20 tcg 87 tag tgg 4
atgj 34 acg 80 aag 100 agg 100
ctg 38 ccg 100 cag 100 cgg 100
gtg 100 gcg 100 gag 100 ggg 83
rap inter max min total
23 19 88 26

Bacilli. Intergen51

[modifier | modifier le wikicode]

Intergen51. Bacilli. Introduction

[modifier | modifier le wikicode]

Intergen51. Bacilli. Historique des pré-études

[modifier | modifier le wikicode]

Intergen51. Bacilli. Formatage des résultats pour les 7 génomes

[modifier | modifier le wikicode]

bacilli données intercalaires

[modifier | modifier le wikicode]
	total	max1	reste	max2	un
bsu	2512	582	13	1021	7511
lmo	1849	767	9	913	949
lam	1248	558	6	1100	1332
ppm	3176	1020	16	1614	2159
ppmp	438	1053	2	1137	1882
pmq	4540	1141	23	1613	1742
lbu	1098	755	5	1005	1054
ban	3289	721	16	1078	1152

bacilli données intercalaires 200

[modifier | modifier le wikicode]

Intergen51. Bacilli. Vue de l'ensemble

[modifier | modifier le wikicode]

Intergen51. Bacilli. La longueur totale des intercalaires d'un génome

[modifier | modifier le wikicode]
  • Note: Seul le plasmide ppmp sort de la médiane des 51 génomes qui est de 12.6%.
Nom	intercalaires	génome		taux en %
bacilli	
ban	749,857		5,321,900	14.1
bsu	434,723		4,215,606	10.3
lam	210,907		2,078,001	10.1
lbu	222,489		1,856,951	12.0
lmo	288,032		2,944,528	9.8
pmq	1,228,719	8,739,048	14.1			
ppm	791,310		5,728,392	13.8			
ppmp	119,608		510,118		23.4	

Intergen51. Bacilli. Les différents types d'intercalaires

[modifier | modifier le wikicode]
  • Lien au tableur: Intergen51. bacilli les différents types d'intercalaires.
  • Légende:
    - S pour intercalaire CDS-CDS et R pour tRNA-CDS,
    - c pour intercalaire continu (les 2 gènes sont sur le même brin) et x pour discontinu (les 2 gènes sont sur 2 brins différents, le brin et son complément)
    - %reste = 100*reste/total, le reste étant ce qui reste du total après la fin du diagramme, gamme.
    - %t30 = 100*t30/total, t30 étant le total des fréquences 10 20 30
    - %t5 = 100*t/total, t5 étant le total des fréquences de -1 à -5 dans le diagramme des S-.
  • Note:
    - taux des R-: c-/c = 100*1/163 = 0.9 et x-/x = 100*0/108 = 0.
Int51.2 Bacilli les différents types d'intercalaires entre gène de 7 génomes
Int51.21 Les différents types
intercalaires CDS-CDS * autres intercalaires
continu S+ S- S0 total c/x RNA-RNA CDS-rRNA total
c 17 991 3 390 159 21 540 2,8 775 65 840
x 7 403 164 12 7 579 1 27 28
t 25 394 3 554 171 29 119 776 92 868
% 87,2 12,2 0,6
Int51.22 Détail des * autres intercalaires
intercalaires tRNA-CDS récapitulatif des * autres intercalaires
continu R+ R- R0 total c/x * autres total %
c 162 1 0 163 1,5 tRNA-CDS 271 19
x 108 0 0 108 RNA-RNA 776 53
t 270 1 0 271 CDS-rRNA 92 6
% 99,6 0,4 0,0 non RNA 317 22
Int51.23 Les taux remarquables
taux %reste %t30 %t5 %0
type S+ R+ S- S+ R+ S- S+ R+
gamme 400 400 6-50 - - - - -
c 5,4 8,0 1,4 26,3 2,5 56 0,7 0,0
x 10,2 9,3 14,0 6,3 1,9 34 0,2 0,0

Intergen51. Bacilli. Détail des intercalaires RNA-RNA et CDS-rRNA

[modifier | modifier le wikicode]
RNA-RNA		c	x		CDS-RNA		c	x
23s5s		66			CDS 16s		44	16
16s23s		51			5s CDS		20	11
16stRNA		14			16 CDS			
tRNA23s		16			CDS 5s			
5stRNA		36			23s CDS			
tRNAin		24			CDS 23s			
tRNAcontig	391			5s 16s		1	
tRNAhors	169	1		16s16s			
tRNA16s		5						
23stRNA		1						
tRNA5s								
16s5s		2						
5s23s								
5s5s								
total		775	1		total		65	27

Intergen51. Bacilli. Les intercalaires rares

[modifier | modifier le wikicode]
tRNA-CDS	c-
ppmp		-24
tRNAhors 	x+
lbu		151
5s16s		c
bsu		183
16s 5s		c
ppm		102
ppm		117
23stRNA		c
ppm		131
tRNA16s		c
ban		76
bsu		159
bsu		170
bsu		171
lmo		341

Intergen51. Bacilli. Les diagrammes des bacilli

[modifier | modifier le wikicode]

Intergen51. Bacilli. Les diagrammes CDS-CDS et tRNA-CDS

[modifier | modifier le wikicode]
Intergen51. Bacilli. Les diagrammes CDS-CDS et tRNA-CDS positifs
[modifier | modifier le wikicode]
  • Lien aux données intercalaires.
  • Diagrammes des bacilli:  tbl présente 4 diagrammes
    - fc40, CDS-CDS continu, fréquence unitaire en abscisses et effectif en ordonnées
    - fx%, CDS-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et pourcentage en ‰ par rapport au total, en ordonnées.
    - ftc, tRNA-CDS continu, fréquences regroupées par 10 (freq10) en abscisses et effectif en ordonnées
    - ftx, tRNA-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et effectif en ordonnées
  • Équations des courbes de tendance en pour 1000: colonnes %fx %fc
Courbes de tendances pour les diagrammes en pour 1000				Calculs des f.41 et autres R2 des f.1		
R2	x3		x2		x		c			Inflexion poly3	x	c
0,738	2,36E-06	-1,72E-03	2,68E-01	22,9	fx1		abscisse	254,5	170,3
0,857	-3,62E-06	2,91E-03	-8,14E-01	89,8	fc1		ordonnée	19,1	23,0
										poly3/droite	18,6	23,4
0,901	1,48E-06	-1,13E-03	1,58E-01	27,7	fx41				
0,979	1,37E-06	-7,00E-04	-2,94E-02	41,5	fc41		R2 f.1	x	c
										Poly 3	738	857
0,873					-0,097		43,3	fx41		Poly 6	812	915
0,935					-0,110		42,2	fc41		Poly 9	864	942
0,614					-0,082		39,2	fx1				
0,687					-0,162		56,6	fc1				
Intergen51. Bacilli. Les diagrammes CDS-CDS négatifs
[modifier | modifier le wikicode]
Intergen51. Bacilli. comparaison avec la totale
[modifier | modifier le wikicode]
  • Lien aux données intercalaires.
  • Comparaison avec la totale: bacilli et la totale sont comparables notamment le 4/2/1 des c-, égale à 2.6.
Sous-totaux	bacilli			totale	
fréquence	x-	c-		x-	c-
-1		1	525		4	4140
-2		4	5		85	11
-3		0	2		3	12
-4		50	1371		717	10938
-5		0	1		5	19
sp6		109	1486		1642	8424
total		164	3390		2 456	23 544
reste		23	49		264	420
s6		22	4		361	41
s7		19	202		321	1438
s8		45	1231		696	6525
rappot s1-5						
4/2/1		12,5	2,6		8,4	2,6
% / sp6						
s6/sp6		20,2	0,3		22,0	0,5
s7/sp6		17,4	13,6		19,5	17,1
s8/sp6		41,3	82,8		42,4	77,5
reste/sp6	21,1	3,3		16,1	5,0
						
total s1-5	55	1904		814	15120
% / total						
%s1-5		33,5	56,2		33,1	64,2
%sp6		66,5	43,8		66,9	35,8
Intergen51. Bacilli. Homogénéité des génomes
[modifier | modifier le wikicode]
  • Lien aux données intercalaires de chaque génome
  • Homogénéité: Les 8 génomes sont homogènes dans l'ensemble, sauf lam et lbu qui se distinguent par leur rapport 4/1 inverse des autres, 0.5 et 0.7 contre 2.6 du total. Pour compenser ce rapport ppm et pmq se distinguent par le leur très élevé, 3.9 et 4.8 respectivement.
négatifs x	bsu	ban	lam	lbu	lmo	pmq	ppm	ppmp	total
total		35	13	15	20	10	42	29	0	164
s1-5		14	3	8	6	3	14	7		55
sp6		21	10	7	14	7	28	22		109
rapport s1-5										
4/2		-	-	-	4.0	-	3.7	-		12.5
% / sp6										
s6		19	40	0	21	14	21	18		20
s7		29	20	14	0	43	14	14		17
s8		19	30	86	36	29	46	55		41
reste		33	10	0	43	14	18	14		21
% / total										
s1-5		40	23	53	30	30	33	24		34
sp6		60	77	47	70	70	67	76		66
										
										
négatifs c	bsu	ban	lam	lbu	lmo	pmq	ppm	ppmp	total
total		573	564	272	280	393	753	523	32	3390
s1-5		305	315	145	136	234	466	288	15	1904
sp6		268	249	127	144	159	287	235	17	1486
rapport s1-5										
4/1		3.2	3.3	0.5	0.7	2.8	4.8	3.9	2.8	2.6
% / sp6										
s6		0	0	0	1	0	0	0	6	0
s7		16	16	10	13	11	15	10	12	14
s8		78	84	90	86	84	79	86	71	83
reste		6	0	0	0	4	6	3	12	3
% / total										
s1-5		53	56	53	49	60	62	55	47	56
sp6		47	44	47	51	40	38	45	53	44
Intergen51. Bacilli. Les grands négatifs inférieurs à -120
[modifier | modifier le wikicode]

Intergen51. Bacilli. Les diagrammes CDS-rRNA

[modifier | modifier le wikicode]
Intergen51. Bacilli. Les diagrammes CDS-16s
[modifier | modifier le wikicode]
CDS16sc		CDS16sx		5sCDSc		5sCDSx
0,542		-		-		-
353,9		499,7		232,9		146,9
210-540		270-720		60-480		30-300
40		15		19		11
91		94		95		100
4		1		1		0
9		6		5		0
0		0		0		0
0		0		0		0
390;7		540;2		180;4		60;3
44		16		20		11
30		30		30		30
  • Les moyennes par génome
Intergen51.bacilli. Moyennes CDS-16s
CDS16sx. discontinu
CDS16sx moyenne écart m/e intercalaires haut bas
ban 483,0 123,9 3,9 4x387:477 695 86,8 16,8
bsu 349 349 220,8 -117,2
lam 581,0 96,2 6,0 513 649 -11,2 114,8
lbu 485,0 167,8 2,9 295 547:613 84,8 18,8
lmo
pmq 575,0 200,3 2,9 399 533:534 -5,2 108,8
ppm 591,0 29,7 19,9 570 612 -21,2 124,8
ppmp
total 518,0 135,3 3,8 569,8 466,2
CDS16sc. continu
CDS16sc moyenne écart m/e intercalaires haut bas
ban 270,2 65,0 4,2 3x218-241 295:373 159,0 -80,9
bsu 298,3 44,3 6,7 243 291:309 350 130,9 -52,9
lam 653,0 128,7 5,1 562 744 -223,9 301,9
lbu 422,7 115,2 3,7 258:298 451 3x501-518 6,5 71,5
lmo 378,6 69,1 5,5 289 344:354 445:451 50,6 27,5
pmq 364,5 128,3 2,8 230:272 7x299-377 533:673 64,6 13,4
ppm 443,4 85,8 5,2 6x323:422 4x445:536 607 -14,2 92,2
ppmp
total 390,1 123,2 3,2 429,2 351,1
Intergen51. Bacilli. Les diagrammes 5s-CDS
[modifier | modifier le wikicode]
  • Lien aux données intercalaires.
  • Comparaison avec les tRNA-CDS
    - Les équations des polynômes de d°3
    fct    f(X) = 5.93E-07 x3 –4.32E-04 x2 + 8.03E-02 x – 7.27E-02
    fxt    f(x) = 1.63E-06 x3 – 1.11E-03 x2 + 1.98E-01 x – 2.83
    - Les caractéristiques des courbes: xs abscisse calculée du maximum de la courbe en pbs, plage des effectifs forts et max de l'effectif maximum et son abscisse.
bacilli		ftc		ftx		5sCDSc		5sCDSx
R2		0,662		0,427		-		-
xs		121,9		125,2		232,9		146,9
plage		60-230		50-280		60-480		30-300
total-p		118		85		19		11
%		72		79		95		100
queue		35		19		1		0
%		21		18		5		0
tête		9		4		0		0
%		6		3		0		0
max		130;13		90;9		180;4		60;3
total7		163		108		20		11
freq		10		10		30		30
Intergen51.bacilli. Comparaison 5s-CDS tRNA-CDS CDS-CDS
[modifier | modifier le wikicode]
  • Lien tableur: Intergen51.bacilli. Comparaison 5s-CDS tRNA-CDS CDS-CDS.
  • Légende:
    - Inf40, Sup700: nombre d'intercalaires du génome inférieurs à 41 et supérieurs à 700. Dans les tableaux 5sCDS ils sont notés en gras avec un *. A voir aux données intercalaires du génome.
    - moyenne: elle est calculée pour tous les intercalaires compris entre inf40 et sup700, 40 exclu. Et son écart est la fonction ecartype.
    - haut, bas: pour estimer que la moyenne du génome est très élevée ou trop basse par rapport à celle du total des alpha.
    + la référence du haut est égale à (total + total/10), indiquée sur la ligne total.
    + la référence du bas est égale à (total - total/10), indiquée sur la ligne total.
    + Pour un génome le haut est égal à (haut référence - sa moyenne): si cette différence est négative la moyenne est considérée trop élevée.
    + Pour un génome le bas est égal à (sa moyenne - haut référence): si cette différence est négative la moyenne est considérée trop basse.
    + pour les tableaux 5sCDS les références sont sur la ligne du total précédés du signe ++
    - Les colonnes ft*-f* représentent la différence entre les 2 moyennes.
    - intercalaires: pour les tableaux 5sCDS où les effectifs sont très faibles. Une plage continue de plus de 2 effectifs est représentée par un tiret, inférieur - supérieur. S'il n'y a que 2 intercalaires, ils sont séparés par 2 points, :.
  • Note: Sommes des différences ft*-f*, positives et négatives, dans les tableaux correspondants
ftc-fc	145,5
ftc-fc	-42,1
	
ftx-fx	75,9 
ftx-fx	-271,8
Intergen51.bacilli Comparaison 5s-CDS tRNA-CDS CDS-CDS
ftx. tRNA-CDS discontinu
ftx moyenne écart m/e Inf 40 Sup 700 haut bas
ban 269,0 101,3 2,65 0 0 -68,3 104,8
bsu 147,0 87,6 1,68 0 1 53,7 -17,2
lam 119,6 56,2 2,13 1 0 81,1 -44,6
lbu 175,0 120,1 1,46 1 1 25,7 10,8
lmo 138,1 124,9 1,11 0 1 62,6 -26,1
pmq 237,5 112,1 2,12 0 0 -36,7 73,2
ppm 229,9 112,5 2,04 0 0 -29,2 65,7
ppmp 99,8 11,7 8,50 2 1 101,0 -64,5
total 182,5 111,1 1,64 ++ 200,7 164,2
5sCDSx. 5s-CDS discontinu
5sCDSx moyenne écart m/e intercalaires  -
ban 78,0 29,7 2,6 *'14:34 57:99
bsu 36 *36
lam
lbu 242,5 48,8 5,0 208 277
lmo
pmq 296 296
ppm 198,3 32,8 6,0 176:183 236
ppmp
total 191,5 82,3 2,3 ++ 210,7 172,4 -
ftc. tRNA-CDS continu
ftc moyenne écart m/e Inf 40 Sup 700 haut bas
ban 220,6 141,1 1,56 0 0 -23,1 59,0
bsu 179,8 84,3 2,13 0 0 17,7 18,2
lam 138,3 72,7 1,90 1 0 59,2 -23,3
lbu 175,2 126,3 1,39 1 0 22,3 13,6
lmo 172,6 112,2 1,54 1 0 24,8 11,1
pmq 202,3 131,3 1,54 1 0 -4,9 40,8
ppm 150,3 69,6 2,16 0 4 47,2 -11,3
ppmp 231,7 156,4 1,48 2 1 -34,2 70,1
total 179,5 115,3 1,56 ++ 197,5 161,6
5sCDSc. 5s-CDS continu
5sCDSc moyenne écart m/e intercalaires  -
ban 198,0 11,3 17,5 190 206
bsu 393 325,4 1,2 175:237 767
lam
lbu 212,3 108,6 2,0 87 156 298:308
lmo 139,0 12,7 10,9 130 148
pmq 288,5 163,2 1,8 123:178 393:460
ppm 267,4 92,0 2,9 163 216:232 343:383
ppmp
total 259,7 156,3 1,7 ++ 285,6 233,7 -
fx. CDS-CDS discontinu
fx moyenne écart m/e ftx-fx Sup 700 haut bas
ban 205,6 138,6 1,5 63,4 25 18,7 22,1
bsu 180,7 117,1 1,5 -33,7 4 43,6 -2,9
lam 164,5 116,4 1,4 -44,8 2 59,8 -19,
lbu 172,4 127,9 1,3 2,6 4 51,9 -11,1
lmo 180,5 131,1 1,4 -42,4 4 43,8 -3,1
pmq 227,6 129,1 1,8 9,9 72 -3,3 44,0
ppm 212,2 133,2 1,6 17,8 26 12,1 28,6
ppmp 250,7 160,8 1,6 -150,9 6 -26,4 67,1
total 203,9 132,0 1,5 -21,4 ++ 224,3 183,5
fc. CDS-CDS continu
fc moyenne écart m/e ftc-fc Sup 700 haut bas
ban 181,4 123,6 1,5 39,2 18 11,0 23,9
bsu 141,8 94,4 1,5 37,9 7 50,6 -15,6
lam 148,3 103,9 1,4 -10,0 3 44,2 -9,2
lbu 166,8 117,2 1,4 8,3 9 25,6 9,4
lmo 156,2 104,3 1,5 16,5 12 36,3 -1,3
pmq 192,7 131,4 1,5 9,7 85 -0,2 35,2
ppm 182,4 123,0 1,5 -32,1 57 10,0 25,0
ppmp 197,8 138,7 1,4 33,9 19 -5,4 40,3
total 174,9 121,1 1,4 4,6 ++ 192,4 157,4
Intergen51. Bacilli. Les CDS-rRNA rares
[modifier | modifier le wikicode]

Intergen51. Bacilli. Les diagrammes RNA-RNA

[modifier | modifier le wikicode]
Intergen51. Bacilli. Les diagrammes rRNA-rRNA
[modifier | modifier le wikicode]
bacilli		16s23s		16stRNA		tRNA23s		23s5s
R2		0,312		-		-		0,845
xs		183,7		117,6		123,9		77,1
plage		140-300		100-140		80-200		40-180
total-p		48		14		16		66
%		94		100		100		100
queue		3		0		0		0
%		6		0		0		0
tête		0		0		0		0
%		0		0		0		0
max		280;13		140;6		140;7		80;26
total7		51		14		16		66
freq		20		20		20		20
Intergen51. Bacilli. Les diagrammes tRNA-rRNA
[modifier | modifier le wikicode]
Intergen51.bacilli. Moyennes rRNA-RNA
16s23s.
16s23s moyenne écart m/e intercalaires haut bas
ban 150,7 10,7 14,1 7x144-147 158:177 96,9 -51,9
bsu 165,1 1,6 106,4 5x 164 3x 167 82,5 -37,5
lam 203 2x 203 44,6 0,4
lbu 217,3 0,5 434,5 3x 217 218 30,4 14,7
lmo 244 4x 244 3,6 41,4
pmq 269,4 5,6 48,4 259:263 10x266-272 2x280 -21,8 66,8
ppm 278,0 82,5 3,4 6x217-231 290:353 2x410 -30,4 75,4
ppmp
total 225,1 63,2 3,6 247,6 202,6
23s5s.
23s5s moyenne écart m/e intercalaires haut bas
ban 66,5 24,5 2,7 7x48-50 86 2x100-101 27,8 -10,6
bsu 68,4 28,7 2,4 8x 55 111 133 25,9 -8,8
lam 69 4x 69 25,3 -8,2
lbu 70,3 0,5 140,7 6x 70 3x 71 24,0 -6,8
lmo 80,3 0,5 155,6 4x 80 2x 81 14,0 3,2
pmq 122,9 34,9 3,5 8x96-97 113 5x161-170 -28,6 45,8
ppm 94,2 30,5 3,1 9x77-78 3x144-145 0,1 17,0
ppmp
total 85,7 32,9 2,6 94,3 77,2
16stRNA.
16stRNA moyenne écart m/e intercalaires haut bas
ban 132 2x 132    -2,7 26,2
bsu 99 2x 99 30,3 -6,8
lam 133 2x 133 -3,7 27,2
lbu 113,2 0,4 253,1 4x 113 114 16,1 7,4
lmo 127 2x 127 2,3 21,2
pmq
ppm 98 98 31,3 -7,8
ppmp
total 117,6 13,1 9,0 129,3 105,8
tRNA23s.
tRNA23s moyenne écart m/e intercalaires haut bas
ban 79,5 0,7 112,4 79 80    56,8 -32,0
bsu 81 2x 81 55,3 -30,5
lam 118 2x 118 18,3 6,5
lbu 127,2 0,4 284,4 4x 127 128 9,1 15,7
lmo 172 2x 172 -35,7 60,5
pmq
ppm 148,3 32,6 4,5 129:130 186 -12,1 36,8
ppmp
total 123,9 33,0 3,8 136,3 111,5
Intergen51. Bacilli. Les diagrammes tRNA-tRNA
[modifier | modifier le wikicode]
Les diagrammes des tRNA-tRNA
[modifier | modifier le wikicode]
type c		S40	%	R2	diag	total	reste	x+	restes	5stRNA	hors	contig	HC	HC
hors		145	86	0,901	145	169	4	151		82	157	138	101	157
contig		360	92	0,973	115	391	3	-			230	158	109	261
in		14	58	-	70	24	0	-			261	265	125	297
5stRNA		29	81	0,315	55	36	1	-			297		131	
HC		115	87	0,959	95	132	7	-						
Les pourcentages des tRNA-tRNA hors blocs
[modifier | modifier le wikicode]
tRNA h 		bsu	pmq	ppm	ppmp	lmo	lam	lbu	ban	total	%
20		8	14	12	5	4	12	33	3	91	68.4
40		4	1	5		1	5	11	1	28	21.1
60		0	1					2	1	4	3.0
80		1								1	0.8
100		1		1						2	1.5
120		0					2	1		3	2.3
140										0	
160						1				1	0.8
240			1							1	0.8
260								1		1	0.8
restes			1							1	0.8
total		14	18	18	5	6	19	48	5	133	100
											
repete		0	2	0	0	0	1	1	0	4	11
séquence	0	0	0	0	0	0	1	0	1	3
sans		4	4	4	1	3	5	4	3	28	80
éclaté		0	0	0	1	0	0	1	0	2	6
clusters	4	6	4	2	3	6	7	3	35	100
											
5		4	1	4	2	1	4	16	1	33	24
10		2	6	7	3	2	7	7	0	34	25
15		2	2	1	0	1	1	8	2	17	12
20		0	5	0	0	0	0	2	0	7	5
Les pourcentages des tRNA-tRNA contigus aux blocs
[modifier | modifier le wikicode]
tRNA cont 	bsu	pmq	ppm	ppmp	lmo	lam	lbu	ban	total	%
20		35	108	13	26	25	13	9	72	301	77.4
40		11	12	3	1	11	3	3	8	52	13.4
60		3	4		1	6			5	19	4.9
80			1		1				2	4	1.0
100					2				2	4	1.0
120			2		2					4	1.0
140					2			1		3	0.8
160			1							1	0.3
180										0	
200										0	
220										0	
240										0	
260										0	
restes		1								1	0.3
total		50	128	16	35	42	16	13	89	389	100
											
repete		0	0	0	0	0	0	0	0	0	0
séquence	0	0	0	0	0	0	0	0	0	0
sans		6	6	4	1	4	2	3	3	29	78
éclaté		0	3	1	1	0	0	0	3	8	22
clusters	6	9	5	2	4	2	3	6	37	100
											
5		10	29	5	14	7	5	6	26	102	26
10		13	29	4	10	9	4	2	22	93	24
15		9	30	3	2	6	3	0	8	61	16
20		3	20	1	0	3	1	1	16	45	12
Les moyennes des tRNA-tRNA par génome
[modifier | modifier le wikicode]
Intergen51.bacilli. Moyennes tRNA-tRNA
5stRNA
5stRNA moyenne écart m/e intercalaires haut bas
ban 7,6 3,5 2,2 2x4 2x9 12 17,7 -13,1
bsu 21,6 14,4 1,5 9:13 2x20 46 3,7 0,9
lam 10,8 4,5 2,4 4 3x13 14,5 -9,9
lbu 16,7 16,7 1,0 2x7 36 8,6 -4,0
lmo 13,5 0,6 23,4 2x13 2x14 11,8 -7,2
pmq 33,9 21,8 1,6 3x9-15 31 5x43-55 -8,6 13,2
ppm 38,2 23,8 1,6 2x18 3x34-39 82 -12,9 17,5
ppmp
total 23,0 18,2 1,3 25,3 20,7
tRNA contigu
tRNA cont moyenne écart m/e total S60% sup120 haut bas
ban 16,1 17,7 0,9 88 95 1 2,0 1,3
bsu 16,8 14,0 1,2 50 98 1,3 2,0
lam 11,6 8,6 1,3 16 100 6,6 -3,3
lbu 12,1 13,1 0,9 13 92 1 6,0 -2,7
lmo 18,8 13,6 1,4 42 100 -0,7 4,0
pmq 15,4 15,8 1,0 128 97 1 2,7 0,6
ppm 17,1 17,6 1,0 63 97 1,0 2,3
ppmp 20,7 31,0 0,7 35 80 2 -2,5 5,8
total 16,5 17,4 0,9 435 96 5 18,1 14,8
tRNA intra cluster
tRNA in moyenne écart m/e intercalaires haut bas
ban 8 2x8 atc    37,4 -29,1
bsu 11 2x11 atc 34,4 -26,1
lam 52 2x52 atc -6,6 14,9
lbu 69 5x69 atc -23,6 31,9
lmo 46 2x46 atc -0,6 8,9
pmq
ppm 20 2x20 atc 25,4 -17,1
ppmp
total 41,3 25,5 1,6 45,4 37,1
tRNA hors cluster
tRNA hors moyenne écart m/e total S60% sup120 haut bas
ban 17,8 14,8 1,2 6 83 1 2,2 1,4
bsu 23,4 26,3 0,9 14 86 -3,4 7,1
lam 24,6 33,0 0,7 19 89 -4,6 8,3
lbu 16,4 18,3 0,9 48 96 1 3,6 0,0
lmo 11,2 9,3 1,2 6 83 1 8,8 -5,2
pmq 15,8 12,2 1,3 18 89 2 4,2 -0,6
ppm 19,6 21,4 0,9 18 94 0,4 3,2
ppmp 5,8 1,9 3,0 5 100 14,2 -10,6
total 18,2 21,2 0,9 134 92 5 20,0 16,4
Intergen51. Bacilli. Les RNA-RNA rares
[modifier | modifier le wikicode]