Recherche:Les clusters de gènes tRNA et rRNA chez les procaryotes/Annexe/génomes synthèse

**génomes synthèse**
Recherche : Les clusters de gènes tRNA et rRNA chez les procaryotes

Annexe 11


Précédent :	archeo
Suivant :	Atableur

En raison de limitations techniques, la typographie souhaitable du titre, « Annexe : génomes synthèse
Les clusters de gènes tRNA et rRNA chez les procaryotes/Annexe/génomes synthèse », n'a pu être restituée correctement ci-dessus.

Les blocs à tRNA

Les cds dans les blocs à tRNA

Lien tableur: cds
Légende:

fréquences intercalaires	fréquences cds en aa	
autour du cds				
	9				2
10	20			50	20
50	21			100	9
90	21			150	10
130	21			200	4
170	5			250	5
210	6			300	3
250	2			350	8
290	8			400	9
	113				70

génomes. Les cds dans les blocs à tRNA
génome	sens	adresse	nom	cds aa	intercal
gamma	autres rien
eal	comp	2042057..2043241	tuf1	395	117
	comp	2043359..2043431		acc gga tac aca
eco	comp	1287087..1287176	tpr	30	67
	comp	1287244..1287328		tac tac
		4175754..4175829		acc aca tac gga	114
		4175944..4177128	tufb	395
ecoN	comp	2192566..2192655		tcg	93
		2192749..2193546	DgsA	266	100
		2193647..2193722		aac
	comp	2236186..2236261		aac	4
		2236266..2237909	YeeO	548	100
		2238010..2238085		aac
amed	comp	3913378..3913454		tgg	52
	comp	3913507..3914691	cds	395	171
	comp	3914863..3914937		gga
alpha
rpm	comp	659042..659116		gtc	155
	comp	659272..660159	hydrolase	296	106
	comp	660266..660340		gtc
	comp	2114823..2114899		aga	55
	comp	2114955..2115251	ETC	96	71
	comp	2115323..2115399		cca
		2632171..2632246		gcc	166
	<	2632413..2632965	transposase	184	-41
		2632925..2633473	hp	183	30
	comp	2633504..2633579		aca	93
	comp	2633673..2634200	transferase	176	271
	comp	2634472..2634561		tcg
		2863981..2864056	aca		15
		2864072..2864317	DUF2829	82	8
		2864326..2864401	aaa
rru		1934224..1934300		cca	63
		1934364..1934663	ETC	100	12
		1934676..1934752		aga
	comp	3124836..3125033	translocase	66	151
	comp	3125185..3125260		tgg	343
	comp	3125604..3126794	ef tu	397	93
	comp	3126888..3126961		gga
	comp	3126989..3127074		tac	37
		3127112..3128158	RlmB	349	57
		3128216..3128291		aca	127
		3128419..3128652	hp	78
		3378495..3378569		acc	237
		3378807..3379370	hp	188	234
oan	comp	2040234..2040453	hp	73	91
		2040545..2040629		tac
		2040654..2040727		gga	6
	comp	2040734..2040916	hp	61	-50
		2040867..2042042	ef Tu	392	65
		2042108..2042183		tgg	420
		2042604..2042804	translocase	67
	comp	2697238..2697314		aga	123
	comp	2697438..2697743	ETC	102	156
	comp	2697900..2697976		cca
abq	comp	748703..749161	hp	153	38
	comp	749200..749275		aca	91
	comp	749367..750221	RlmB	285	144
		750366..750451		tac
		750512..750585		gga	81
		750667..751857	ef Tu	397	153
		752011..752086		tgg	69
		752156..752353	Translocase	66
		872533..872608		atgi	5
	comp	872614..873093	GNAT	160	134
	comp	873228..873304		cgt
		1354014..1354091		cca	49
		1354141..1354437	ETC	99	10
		1354448..1354524		aga
abs	comp	1500772..1501110	P-II	113	338
		1501449..1501524		cac
		1501634..1501709		cac	129
		1501839..1503305	epimerase	489	106
		1503412..1504977	Manolyl CoA	522	173
		1505151..1505235		cta	91
		1505327..1506661	trigger factor	445
		1808815..1808892		cca	49
		1808942..1809238	ETC	99	10
		1809249..1809325		aga
		2293805..2293881		cgt	137
		2294019..2294495	GNAT	159	5
	comp	2294501..2294576		atgi
	comp	2418203..2418400	translocase	66	69
	comp	2418470..2418545		tgg	152
	comp	2418698..2419888	ef Tu	397	81
	comp	2419970..2420043		gga
	comp	2420104..2420189		tac	144
		2420334..2421188	RlmB	285	91
		2421280..2421355		aca	137
		2421493..2423187	integrase	565
agr		1532381..1532455		gaa	121
		1532577..1532818	P-hp	81	89
		1532908..1532982		gaa
		1770727..1772280	integrase	518	91
	comp	1772372..1772448		cca	265
		1772714..1773019	ETC	102	51
		1773071..1773147		aga	7
	comp	1773155..1773892	DUF429	246
aua		2368353..2368429		cca	43
		2368473..2368778	cds	102	36
		2368815..2368890		aga
	comp	2641950..2642023		tgc	153
	comp <	2642177..2642443	cds	89	296
		2642740..2642814		aac
beta	néant
delta	néant
bacilli	autres rien
pmq		20252..21532	cds	427	47
		21580..21666		tca	140
		21807..22157	hp	117	17
		22175..22357	hp	61	23
		22381..22524	hp	48	86
	comp	22611..22796	hp	62	138
	comp	22935..25265	replicase	777	156
		25422..26165	hp	248	220
	comp	26386..26460		cgg	183
		26644..27168	replicase	175
clostridia	autres rien
hmo	comp	105958..106044		ctg	321
	comp	106366..106929	cds	188	241
	comp	107171..107246		aca
		1172120..1172196		agg	181
		1172378..1172812	cds	145	62
		1172875..1172966		tcg
		1764087..1764161		ggc	92
	comp	1764254..1764493	cds	80	72
		1764566..1764641		tgc
	comp	2496451..2496527		gtc
	comp	2496532..2496609		atgj	175
		2496785..2497120	cds	112	217
	comp	2497338..2497420		ctc
	* Suivent 5 tRNAs comp *
	comp	2497882..2497958		gtg	-10
	comp	2497949..2498185	cds	79	66
		2498252..2498328		ccg
actino	autres rien
ase		1520472..1520544		aac	315
		1520860..1522122	cds	421	236
		1522359..1522432		atg
	comp	4901908..4901981		gcg	19
	comp	4902001..4902321	cds	107	23
	comp	4902345..4902417		gac
	* 7 tRNAs ggc cds cag 20 tRNAs *
		6400506..6400577		ggc	25
		6400603..6401055	cds	151	35
		6401091..6401163		cag
bacteroide	fps rien
myr	comp	719769..719842		tgg	60
	comp	719903..721090	cds	396	58
	comp	721149..721220		acc
	omp	1929840..1929925		tta	147
	comp	1930073..1930444	cds	124	108
	comp	1930553..1930638		tta
	comp	2208797..2208872		atgf	106
	comp	2208979..2209605	cds	209	147
	comp	2209753..2209829		atgj
cyano	npu rien
pmg	comp	435678..435751		gac	149
	comp	435901..436095	cds	65	35
	comp	436131..436203		tgg
tenericutes
abra	comp	1540706..1540780		tgg	47
	comp	1540828..1541754	cds	309	137
		1541892..1541967		cac
apal	comp	205299..205373		tgg	73
	comp	205447..206382	cds	312	133
		206516..206591		cac
	comp	1457388..1457463		gac	40
	comp	1457504..1458355	cds	284	154
	comp	1458510..1458585		ttc
	* 10 tRNAs 5s23s *
archeo	mfi mfe rien
mja		862590..862661		cga	41
		862703..863392	cds	230	86
		863479..863555		aca
	* 3 tRNAs 5s gac *
mba		4618540..4618617		gaa	351
		4618969..4619190	hp	74	377
		4619568..4619645		gaa

Les totaux des génomes par type

Les six types sont: les solitaires, les multiples, les duplicata, avant 5s, après 5s >3, après 5s <4, avant 16s et après 16s. En abrégé, respectivement, 1aa >1aa dup -5s +5s >3, 5s <4 (ou 1-3aas), -16s +16s.
Note: le tableau de contrôle est dans le tableur
Lien tableur: Les totaux des génomes par type

Les totaux des types

Lien tableur: Les totaux des types

Les totaux des types
actino	>1aa	1aa	-5s	+5s	-16s	+16s	duplica	1-3aas	total
total	1047	912	13	751	11	304	493	135	3666

Note: le -16s long de 33 est compté dans les +5s >3.

La référence +5s >3

Lien tableur: La référence +5s >3
Ce sont ceux des bacilli plus ceux des clostridia parce qu'ils sont nombreux et réduits à 2 clades, donc homogènes. Tenericutes en possèdent 2 fois 11. Les arcchées en possèdent aussi, mais seulement 1 de 6aas. Voir les études plus détaillées dans les fiches qui ne concernent que les blocs à rRNA.
Légende:
- Cyan pour les valeurs faibles, total 19 pour 21 tRNAs.

- Jaune pour les valeurs fortes et en gras les plus fortes, total 474 pour 14 tRNAs

- blanc pour les valeurs intermédiaires, gca et atc le sont aussi, total 236 pour 16 tRNAs.

- Le rouge pour l'emplacement des +16s occupés, gca et atc.

- Les encadrés sont les emplacements des 1-3aas des +5s de alpha + gamma.

- Le -16s de 33 aas est compté ici comme un +5s long (inversion).

Bacilli + clostridia. Les +5s >3 de référence.
g1		t1
a atgi	12	a tct		tat		atgf	29
b att		i act		aat		agt
c ctt		e cct		cat		cgt
d gtt		m gct		gat		ggt
e ttc	26	b tcc	10	tac	26	tgc	17
f atc	15	j acc	9	aac	38	agc	15
g ctc	4	f ccc	2	cac	20	cgc	30
h gtc	5	n gcc	1	gac	39	ggc	38
i tta	22	c tca	17	taa		tga
j ata		k aca	31	aaa	39	aga	15
k cta	20	g cca	33	caa	29	cga
l gta	49	o gca	15	gaa	42	gga	25
m ttg	7	d tcg	2	tag		tgg	12
n atgj	21	l acg	2	aag		agg
o ctg	9	h ccg	1	cag		cgg
p gtg		p gcg		gag	1	ggg	1
5s-bc	inter		min		max		total
total	236		19		474		729

totaux par rapport au groupe de référence

Lien tableur: totaux par rapport au groupe de référence
Le groupe de référence: voir la référence
Légende:
- carré ccc, c'est ctc gtc ccc gcc

- g+cga, c'est gtg xcg xag ggg cga (dans l'hypothèse de la bascule des cgx, cgt/cgc cga/cgg)

bacts. Comparaison avec la référence
	bacts	1aa	>1aa	dup	+5s	1-3aas	autres	total
tRNAs		blocs tRNAs			blocs rRNAs
21	faible	317	124	114	19	2	7	583
16	moyen	345	327	80	246	43	253	1294
14	fort	250	596	299	486	90	68	1789
		912	1047	493	751	135	328	3666
10	g+cga	151	68	57	7			283
2	agg+cgg	55	11		12	1		79
4	carre ccc	93	41	55		1	7	197
5	autres	18	4	2				24
		317	124	114	19	2	7	583
		total tRNAs ‰
	bacts	1aa	>1aa	dup	+5s	1-3aas	autres	bacts ‰	ref.‰
21	faible	86	34	31	5	1	2	159	26
16	moyen	94	89	22	67	12	69	353	324
14	fort	68	163	82	133	25	19	488	650
		249	286	134	205	37	89	3666	729
10	g+cgg	41	19	16	2			77	10
2	agg+cga	15	3		3	0.3		22
4	carre ccc	25	11	15		0.3	2	54	16
5	autres	5	1.1	0.5				7
		86	34	31	5	0.5	2	159
		blocs tRNAs ‰					total colonne %
	bacts	1aa	>1aa	dup	total	ref.‰	1aa	>1aa	dup
21	faible	129	51	46	226	26	35	12	23
16	moyen	141	133	33	307	324	38	31	16
14	fort	102	243	122	467	650	27	57	61
		372	427	201	2452	729	912	1047	493
10	g+cgg	62	28	23	113	10	48	55	50
2	agg+cga	22	4		27		17	9
4	carre ccc	38	17	22	77	16	29	33	48
5	autres	7	2	0.8	10		6	3	2
		129	51	46	226		317	124	114

Caractérisation des tRNAs

Caractérisation d'un tRNA par les 4 processus +5s 1aa >1aa duplication

Lien tableur: Caractérisation d'un tRNA par les 4 processus +5s 1aa >1aa duplication
Le groupe de référence: voir la référence. Ici les intermédiaires sont remplacés par le vert au lieu du blanc. La colonne +5s représente la référence (729) plus ceux des tenericutes (22, 2*11) ce qui ne change pas l'ordre de son classement: atgijf ttc tta gta aaa tca aca gca gac.
Légende:
- carré ccc, c'est ctc gtc ccc gcc

- g+cga, c'est gtg xcg xag ggg cga (dans l'hypothèse de la bascule des cgx, cgt/cgc cga/cgg)

Synthèse des 44 génomes. Caractérisation de chaque tRNA par les 4 processus: +5s 1aa >1aa duplication

Caractérisation par les effectifs
g1	+5s	1aa	>1aa	dup	t1	+5s	1aa	>1aa	dup		+5s	1aa	>1aa	dup		+5s	1aa	>1aa	dup
a atgi	14	30	7	2	a tct					tat					atgf	31	30	36	30
b att					i act		3			aat					agt		1
c ctt		4	3	2	e cct					cat					cgc
d gtt					m gct					gat					ggt
e ttc	28	21	35	9	b tcc	10	37	6	2	tac	26	7	44	28	tgc	17	16	38	4
f atc	15	4	7	2	j acc	9	18	22	5	aac	38	28	35	22	agc	15	18	34
g ctc	4	30	15	2	f ccc	2	28	1		cac	20	14	34	11	cgt	30	15	19	49
h gtc	5	19	11	28	n gcc	1	16	14	25	gac	41	14	54	13	ggc	38	17	59	43
i tta	24	18	31	2	c tca	19	36	12	4	taa					tga		9
j ata		1	1	0	k aca	33	19	43	7	aaa	41	17	44	25	aga	15	29	21	2
k cta	20	21	32	8	g cca	33	20	39	4	caa	29	19	37	12	cga		3	7
l gta	51	13	54	26	o gca	17	4	7		gaa	42	15	52	25	gga	25	15	45	6
m ttg	7	34	8	2	d tcg	2	26	5		tag					tgg	12	31	13	2
n atgj	23	15	39	6	l acg	2	28	5		aag		18	12	16	agg		31	1
o ctg	9	20	16	28	h ccg	1	15	4	8	cag		9	14	10	cgg		24	10
p gtg		10	5	8	p gcg		13	5	3	gag	1	9	5	12	ggg	1	20	6

Caractérisation par la relativité des 4 processus: chaque processus est rapporté à 1000 tRNAs.
g1	+5s	1aa	>1aa	dup	t1	+5s	1aa	>1aa	dup		+5s	1aa	>1aa	dup		+5s	1aa	>1aa	dup
a atgi	19	33	7	4	a tct					tat					atgf	41	33	34	61
b att					i act	0	3	0	0	aat					agt		*1
c ctt	0	4	3	4	e cct					cat					cgc
d gtt					m gct					gat					ggt
e ttc	37	23	33	18	b tcc	13	41	6	4	tac	35	8	42	57	tgc	23	18	36	8
f atc	20	4	7	4	j acc	12	20	21	10	aac	51	31	33	45	agc	20	20	32	0
g ctc	5	33	14	4	f ccc	3	31	1	0	cac	27	15	32	22	cgt	40	16	18	99
h gtc	7	21	11	57	n gcc	1	18	13	51	gac	55	15	52	26	ggc	51	19	56	87
i tta	32	20	30	4	c tca	25	39	11	8	taa					tga	0	10	0	0
j ata		*1	*1		k aca	44	21	41	14	aaa	55	19	42	51	aga	20	32	20	4
k cta	27	23	31	16	g cca	44	22	37	8	caa	39	21	35	24	cga	0	3	7	0
l gta	68	14	52	53	o gca	23	4	7	0	gaa	56	16	50	51	gga	33	16	43	12
m ttg	9	37	8	4	d tcg	3	29	5	0	tag					tgg	16	34	12	4
n atgj	31	16	37	12	l acg	3	31	5	0	aag	0	20	11	32	agg	0	34	1	0
o ctg	12	22	15	57	h ccg	1	16	4	16	cag	0	10	13	20	cgg	0	26	10	0
p gtg	0	11	5	16	p gcg	0	14	5	6	gag	1	10	5	24	ggg	1	22	6	0

Construction du tableau avec les sous-totaux

Lien tableur: Construction du tableau avec les sous-totaux

Définition des classes pour les 4 types

Notes: Dans le tableau ci-dessus de la caractérisation des tRNAs rapportée à 1000 pour chaque type, 2ème tableau, les nombres en gras commencent à partir de 26 et sont au nombre de 64. Ce sont les plus élevés, ils incluent les nombres non gras des +5s colorés en jaune. On peut les diviser en
- forts (les jaunes sans gras de la référence) de 26 à 37 au nombre de 32.

- très forts (les gras jaunes de la références) de 39/1000 et plus, au nombre de 32

- Les valeurs les plus faibles seraient inférieures à 10/1000 et sont au nombre de 68 dont 23 zéros. Les tRNAs ata et agt ne sont pas pris en compte (*). Le reste est divisé en

- moyen faibles de 10 à 16 au nombre de 33, et en

- moyen forts de 18 à 25 au nombre de 31.

- Les nombres en gras du 1er tableau sont ceux de la référence (+5s) relativisés pour les duplications qui ont un total 50% inférieur à la référence. Les ruptures des types rapportés à 1000 tRNAs confirment et harmonisent le 1er tableau.

- NB.SI, fonction calc utilisée.

0	23		16	9		32	5		48	0	
1	6		17	0		33	6		49	0	
2	0		18	4		34	3		50	1	
3	6		19	3		35	2		51	5	
4	13		20	9		36	1		52	2	
5	6		21	4		37	4		53	1	
6	3		22	4		38	0		54	0	
7	5		23	4		39	2		55	2	
8	5		24	2		40	1		56	2	
9	1		25	1		41	3		57	3	
10	5		26	2		42	2		61	1	
11	4		27	2		43	1		68	1	
12	5		28	0		44	2		87	1	
13	3		29	1		45	1		99	1	
14	4		30	1		46	0				
15	3		31	5		47	0				
	92			51			33			20	196

Les processus +16s -16s -5s 1-3aas

Récapitulatifs

D'après les distributions des totaux: liens

gama alpha baci clos bact actino cyano tener

Légendes: alpha* pour alpha+beta+delta, btc pour bacteroide tenericutes cyano

+16s	gca	atc	aaa	gta	gcc	gaa	total
gama	29	23	8	8	2	33	103
clos	26	11			5		42
afn	2	2					4
baci	16	15					31
alpha*	37	43					80
b t c	21	23					44
actino	0	0	0	0	0	0	0
total	131	117	8	8	7	33	304

total 1-3aas					
	alpha	gama	baci	clos	tener
atgf	23		2	2	
gac		23	2	1	
aac			4	7	6
acc		9	1	1	
tgg		8		1	
tca		4			
gaa		1		2	
tcc			1		
total	23	45	10	14	6
autres				37

-16s	2gga 2tac aac agc atc cgt gca tca tcc		
-5s	3aca 5gga 5aac

Les processus +16s -16s 1-3aas -5s comparés à la référence

Lien tableur: Les processus +16s -16s 1-3aas -5s comparés à la référence
Le groupe de référence: voir la référence
Légende:
- carré ccc, c'est ctc gtc ccc gcc

- g+cga, c'est gtg xcg xag ggg cga (dans l'hypothèse de la bascule des cgx, cgt/cgc cga/cgg)

- Les soulignés du 1er tableau sont la somme de 2 à 3 clades: voir le récapitulatif ci-dessus.

Distribution des totaux 1-3aas +16s -16s -5s.

Total 1-3aas
g1		t1
a atgi	8	a tct		tat		atgf	27
b att		i act		aat		agt
c ctt		e cct		cat		cgt
d gtt		m gct		gat		ggt
e ttc	6	b tcc	1	tac		tgc	1
f atc		j acc	11	aac	17	agc
g ctc	1	f ccc		cac		cgc
h gtc		n gcc		gac	26	ggc	4
i tta	4	c tca	4	taa		tga
j ata		k aca		aaa	6	aga	1
k cta		g cca		caa		cga
l gta		o gca	4	gaa	3	gga	1
m ttg		d tcg		tag		tgg	9
n atgj		l acg		aag		agg
o ctg		h ccg		cag		cgg	1
p gtg		p gcg		gag		ggg
	baci	clos	clos	alpha	tener	gama	total
	10	47	4	23	6	45	135

Total 1-3aas avec la référence +5s
g1		t1
a atgi	8	a tct		tat		atgf	27
b att		i act		aat		agt
c ctt		e cct		cat		cgt
d gtt		m gct		gat		ggt
e ttc	6	b tcc	1	tac		tgc	1
f atc		j acc	11	aac	17	agc
g ctc	1	f ccc		cac	0	cgc
h gtc		n gcc		gac	26	ggc	4
i tta	4	c tca	4	taa		tga
j ata		k aca		aaa	6	aga	1
k cta		g cca		caa		cga
l gta		o gca	4	gaa	3	gga	1
m ttg		d tcg		tag		tgg	9
n atgj		l acg		aag		agg
o ctg		h ccg		cag		cgg	1
p gtg		p gcg		gag		ggg
	inter		max		min		total
	43		90		2		135

Total +16s avec la référence +5s
g1		t1
a atgi		a tct		tat		atgf
b att		i act		aat		agt
c ctt		e cct		cat		cgt
d gtt		m gct		gat		ggt
e ttc		b tcc		tac		tgc
f atc	117	j acc		aac		agc
g ctc		f ccc		cac		cgc
h gtc		n gcc	7	gac		ggc
i tta		c tca		taa		tga
j ata		k aca		aaa	8	aga
k cta		g cca		caa		cga
l gta	8	o gca	131	gaa	33	gga
m ttg		d tcg		tag		tgg
n atgj		l acg		aag		agg
o ctg		h ccg		cag		cgg
p gtg		p gcg		gag		ggg
	inter		max		min		total
	248		49		7		304

Total -16s -5s avec la référence +5s
g1		t1
a atgi		a tct		tat		atgf
b att		i act		aat		agt
c ctt		e cct		cat		cgt
d gtt		m gct		gat		ggt
e ttc		b tcc	1	tac	2	tgc
f atc	1	j acc		aac	6	agc	1
g ctc		f ccc		cac		cgc	1
h gtc		n gcc		gac		ggc
i tta		c tca	1	taa		tga
j ata		k aca	3	aaa		aga
k cta		g cca		caa		cga
l gta		o gca	1	gaa		gga	7
m ttg		d tcg		tag		tgg
n atgj		l acg		aag		agg
o ctg		h ccg		cag		cgg
p gtg		p gcg		gag		ggg
	inter		max		min		total
	5		19		0		24

Les processus +16s et 1-3aas des fiches mémoires

Lien tableur: Les processus +16s et 1-3aas des fiches mémoires
Le groupe de référence: voir la référence
Légende:
- carré ccc, c'est ctc gtc ccc gcc

- g+cga, c'est gtg xcg xag ggg cga (dans l'hypothèse de la bascule des cgx, cgt/cgc cga/cgg)
Note: Ces 2 processus ont été comptabilisés sur de plus grands effectifs dans les fiches mémoires par clade. La comparaison des effectifs avec ceux des annexes montrent qu'ils sont semblables statistiquement. Voir la synthèse des +16s et des 1-3aas.

Distribution des +16s et des 1-3aas des fiches mémoires, avec la référence +5s.

Effectifs des +16s
g1		t1
a atgi		a cds	121	16s	1039	atgf	2
b att		i act		aat		agt
c ctt		e cct		cat		cgc
d gtt		m gct		gat		ggt
e ttc		b tcc		tac		tgc
f atc	1235	j acc		aac		agc
g ctc		f ccc		cac		cgt
h gtc		n gcc	11	gac		ggc
i tta		c tca		taa		tga
j ata		k aca		aaa	11	aga
k cta		g cca	4	caa		cga
l gta	13	o gca	1249	gaa	272	gga
m ttg		d tcg		tag		tgg
n atgj		l acg		aag		agg
o ctg		h ccg		cag		cgg
p gtg		p gcg		gag		ggg
	inter		max		min		total
	2484		302		11		2797

Les +16s rapportés à 1000 tRNAs.
g1		t1
a atgi		a tct		tat		atgf	1
b att		i act		aat		agt
c ctt		e cct		cat		cgc
d gtt		m gct		gat		ggt
e ttc		b tcc		tac		tgc
f atc	442	j acc		aac		agc
g ctc		f ccc		cac		cgt
h gtc		n gcc	4	gac		ggc
i tta		c tca		taa		tga
j ata		k aca		aaa	4	aga
k cta		g cca	1	caa		cga
l gta	5	o gca	447	gaa	97	gga
m ttg		d tcg		tag		tgg
n atgj		l acg		aag		agg
o ctg		h ccg		cag		cgg
p gtg		p gcg		gag		ggg
	inter		max		min		total
	888		108		4		1000

Effectifs des 1-3aas
g1		t1
a atgi	15	a tct		tat		atgf	172
b att		i act		aat		agt
c ctt		e cct		cat		cgc
d gtt		m gct		gat		ggt
e ttc	21	b tcc	2	tac	12	tgc	7
f atc	3	j acc	82	aac	73	agc	1
g ctc	2	f ccc		cac	2	cgt	4
h gtc		n gcc		gac	172	ggc	12
i tta	5	c tca	5	taa		tga
j ata		k aca	1	aaa	17	aga	1
k cta		g cca	1	caa	1	cga
l gta	5	o gca	14	gaa	7	gga	12
m ttg		d tcg		tag		tgg	78
n atgj	1	l acg	1	aag		agg
o ctg	1	h ccg		cag		cgg	2
p gtg	1	p gcg		gag		ggg	2
	inter		max		min		total
	218		510		8		736

Les 1-3aas rapportés à 1000 tRNAs.
g1		t1
a atgi	20	a tct		tat		atgf	234
b att		i act		aat		agt
c ctt		e cct		cat		cgc
d gtt		m gct		gat		ggt
e ttc	29	b tcc	3	tac	16	tgc	10
f atc	4	j acc	111	aac	99	agc	1
g ctc	3	f ccc		cac	3	cgt	5
h gtc		n gcc		gac	234	ggc	16
i tta	7	c tca	7	taa		tga
j ata		k aca	1	aaa	23	aga	1
k cta		g cca	1	caa	1	cga
l gta	7	o gca	19	gaa	10	gga	16
m ttg		d tcg		tag		tgg	106
n atgj	1	l acg	1	aag		agg
o ctg	1	h ccg		cag		cgg	3
p gtg	1	p gcg		gag		ggg	3
	inter		max		min		total
	296		693		11		1000

Classement des tRNAs avec les 8 processus

Lien tableur: Classement des tRNAs avec les 8 processus
Liens aux indices des clades: alpha bacilli gamma actino clostridia bacteroide cyano tener spiro beta epsilon delta bactéries

Classement des tRNAs rapportés à 1000 par processus

Classement avec les processus +5s et >1aa.
tRNA	+5s	1aa	>1aa	dup	1-3aas	+16s
atgf	41	33	34	61	234	1
aac	51	31	33	45	99	-
I
gaa	56	16	50	51	10	97
gac	55	15	52	26	234	-
gta	68	14	52	53	7	5
aaa	55	19	42	51	23	4
ggc	51	19	56	87	16	-
tac	35	8	42	57	7	-
II
aca	44	21	41	14	1	-
cca	44	22	37	8	1	2
caa	39	21	35	24	1	-
ttc	37	23	33	18	29	-
gga	33	16	43	12	16	-
tta	32	20	30	4	7	-
atgj	31	16	37	12	1	-
cta	27	23	31	16	-	-
cac	27	15	32	22	3	-
III
tgc	23	18	36	8	10	-
agc	20	20	32	0	1	-
IV
cgt	40	16	18	99	5	-
V
gca	23	4	7	0	19	447
atc	20	4	7	4	4	442

VI
acc	12	20	21	10	111	-
tgg	16	34	12	4	106	-

Classement avec les processus 1aa et dup
tRNA	+5s	1aa	>1aa	dup	1-3aas	+16s
tca	25	39	11	8	7	-
aga	20	32	20	4	1	-
atgi	19	33	7	4	20	-
tcc	13	41	6	4	3	-
ttg	9	37	8	4	-	-
ctc	5	33	14	4	3	-
I
ccc	3	31	1	0	-	-
tcg	3	29	5	0	-	-
acg	3	31	5	0	1	-
agg	0	34	1	0	-	-
cgg	0	26	10	0	3	-
ggg	1	22	6	0	3	-
II
ctg	12	22	15	57	1	-
gtc	7	21	11	57	-	-
gcc	1	18	13	51	-	4
aag	0	20	11	32	-	-
gag	1	10	5	24	-	-
cag	0	10	13	20	-	-
ccg	1	16	4	16	-	-
gtg	0	11	5	16	1	-
gcg	0	14	5	6	-	-
III
cga	0	3	7	0	-	-
ata	0	1	1	0	-	-
tga	0	10	0	0	-	-
IV
ctt	0	4	3	4	-	-
act	0	3	0	0	-	-
agt	0	1	0	0	-	-

Les intercalaires entre cds d'un génome

Note: Pour les génomes des annexes j'ai relevé les intercalaires entre tRNAs et entre ceux-ci et les cds qui leur sont adjacents. L'exemple est celui de rru du clade alpha. L'idée de départ de ces prélèvements est la recherche d'opérons formés de tRNA et de protéine comme dans le cas d'E.coli: l'intercalaire entre le tRNA et la protéine devrait être faible. Voir l'exemple d'eco (remarque @3) avec tac-tac-tpr et aca-tac-gga-acc-tufB.

Méthode de prélèvement

Afficher le NCBI et relever taille et date
Copier dans txt et rechercher join( et résoudre ses adresses en adresses uniques
copier dans un calc temporaire pour faciliter les sélecitions début ou fin
select ctrl+Maj+fin et trier croissant. Le curseur est à la fin. Rechercher (ctrl+H) tRNA précédent.
select ctrl+Maj+fin et supprimer
se posirionner au début ctrl+début et rechercher (ctrl+H) ‘ CDS ‘ suivant sans les cotes
mettre le curseur loin à droite et effacer le début, ctrl+Maj+début.
Le curseur est au début rechercher CDS suivant puis sélectionner ctrl+Maj+fin et coller au début de la feuille
sans séléction remplacer CDS gene rRNA tRNA en ajoutant (;)
rechercher tRNA; suivant et ajouter (;) aux gènes restants, ncRNA misc regulatory. Vérifier s’il n’y a pas d’autres entre CDS; et gene; .
suprimer la ligne où le gène est ‘source’.
sélect tout ctrl+Maj+fin, copier dans txt puis dans le calc temporaire à de la première colonne avec les (;)
Sélect la colonne contenant les adresses, ctrl+H et enlever les blancs ( <)> et lexpression régulière [:alph:] .
remplacer les 2 points des adresses .. en ; en copiant la colonne dans txt et ctrl H . Puis copier le tout en 2 colonnes dans calc en écrasant la colonne des adresses modifiée.
sur la colonne à gauche des adresses en colonne numéroter en séquence gene puis CDS puis le reste 1 puis formule cellule de 1, + 1. Couper la formule et select la plage, coller et couper coller format.
sauvegarder le tout dans le calc de travail. Copier les 4 dernières colonnes dans le calc temporaire nettoyé.
dans le temporaire, trier d’abord sur la colonne 1 des numéros, puis trier sur 1ère et 2ème adresse
A ce moment gene et CDS sont dans ce sens pour la même adresse.
Dans le cas où la 1ère adresse est identique à celle du gène et que les 2 2èmes adresses sont différentes, dans le cas où le CDS n’existe pas, les 2 différences entre 2 lignes succesives pour les 2 1ères adresses et les 2 2èmes adresses, sur la ligne gene, seront différentes. Les différences sur la ligne suivante seront différentes en général.
En triant sur les 2 différences tous les gene avec 0 et 0 sur leur ligne sont à suprimer.
On supprime les 2 colonnes des différences et on trie le reste sur 1ère et 2ème adresse. On calcule les intercalaires toujours: écriture de la formule, la couper, ctrl+Maj+fin, réduire à la colonne et coller puis couper et coller format.
on colorie les CDS de la colonne des gènes. Les gènes différents apparaissent en clair
Sur la colonne de gauche du pavé deb à côté du CDS du début et fin à côté du CDS de fin encadrant le gène en clair
deb-fin
- Trier en 1er sur la colonne deb-fin et en 2ème la colonne CDS, copier les lignes avec deb et fin et les sauvegarder plus loin.

- Suprimer du pavé principal les lignes deb.

- Copier les lignes en clair qui se trouvent à la fin du pave et les coller sous les lignes du pavé deb-fin sauvegardé.

- Trier le reste du pavé sur adresse1 et 2 et le positionner en haut de la feuille. C’est le pavé du travail qui suit.