Recherche:Corrélation entre les codons dans les gènes de protéines/Annexe/Tableaux

**Tableaux**
Recherche : Corrélation entre les codons dans les gènes de protéines

Annexe 1


Précédent :	Sommaire
Suivant :	Diagrammes

En raison de limitations techniques, la typographie souhaitable du titre, « Annexe : Tableaux
Corrélation entre les codons dans les gènes de protéines/Annexe/Tableaux », n'a pu être restituée correctement ci-dessus.

Paris le 8.12.16

Diagrammes codons-GC-DRNA[modifier | modifier le wikicode]

Compilation DRNA[modifier | modifier le wikicode]

codons DRNA[modifier | modifier le wikicode]

Lien tableur: codons DRNA
Résultats directs de la compilation des 111 bactéries. A copier dans un tableur avec une largeur de colonne de 1,3 cm.

Total codons DRNA[modifier | modifier le wikicode]

Lien Tableur: Total codons DRNA
Sommation des résultats directs du chapitre précédent. A copier dans un tableur avec une largeur de colonne de 1,3 cm.

acides aminés DRNA[modifier | modifier le wikicode]

Lien Tableur: acides aminés DRNA
Résultats directs de la compilation. A copier dans un tableur avec une largeur de colonne de 1,3 cm.

Total acides aminés DRNA[modifier | modifier le wikicode]

Lien Tableur: Total acides aminés DRNA
Sommation des résultats directs du chapitre précédent. A copier dans un tableur avec une largeur de colonne de 1,3 cm.

Contenu en GC des génomes DRNA[modifier | modifier le wikicode]

Lien Tableur: Contenu en GC des génomes DRNA
Le contenu en GC (%GC) de 80 bactéries sont tirés des tableaux numériques de l'article "répétition des bases dans l'ADN des procaryotes". Pour la cyanobactérie synd voir dans cyanobactérie de la même annexe.
synd
aae, aba, ade, age, amd, amo, apt, bae, bla, bmf, bmv, bsu, cad, cbd, cbl, cff, cgq, chp, cje, cmi, cmn, crp, cta, dba, ddr, dpt, dvl, eal, eco, eno, fnc, gau, gva, kpn, ksk, lat, liv, ljf, lla, lpl, mcac, mts, opr, pac, pae, pgd, pgi, ple, ppoy, ret, rip, roa, rpr, rru, saci, salb, say, sbn, sbz, sep, sgr, sho, sma, smk, spi, spl, sty, sus, tai, tde, tma, tme, tos, tpas, tsu, uur, vin, xcb, ype, zin.
J'ai soumis le programme repete.pl pour les 30 autres bactéries dont les résultats sont ci-dessous:

Contenu en GC des 111 génomes DRNA[modifier | modifier le wikicode]

Lien Tableur: Contenu en GC des 111 génomes DRNA
Regroupement des contenus en GC du chapitre précédent. A copier dans un tableur avec une largeur de colonne de 1,3 cm.

Tableau des diagrammes des codons DRNA[modifier | modifier le wikicode]

Lien Tableur: Tableau des diagrammes des codons DRNA
Construction du tableau d'après le tableau des totaux des codons:

récupération des contenus en GC (%GC) des résultats du chapitre précédent.
Création de la colonne %AT (100-%GC)
Somme de tous les codons (codons stops compris) d'une bactérie donnée, colonne aas. La colonne Trp isole les tga donnant du Trp, des tga donnant des stops.
Moyenne des aas par bactérie: 6 550 aas par bactérie, avec un écart type de 304.
Recalcul du codon: 6550*codon/aas.

Le tableau est suivi de la moyenne des codons.

Maximum et 75% DRNA[modifier | modifier le wikicode]

Le nombre de codons est calculé d'après les équations des courbes de tendance pour caractériser chaque codon par un maximum de la courbe et, s'il n'existe pas (équation du second degré sans solution), par la valeur à 75% GC ou AT.

constantes des courbes DRNA[modifier | modifier le wikicode]

Lien Tableur: constantes des courbes DRNA
Ces constantes sont relevées à la main parce que le format de l'équation dans Libreoffice/calc est une image. Ces équations sont représentées dans les diagrammes.

abscisse du maximum DRNA[modifier | modifier le wikicode]

Lien Tableur: abscisse du maximum DRNA
C'est la solution qui annule la dérivée de l'équation de degré 3. C'est une équation du second degré qui quelque fois n'a pas de solution. Mais quand il y en a 1 ou 2 solutions, une seule est valable et doit être supérieure à 50 et inférieur à 100 %GC ou %AT. J'ai éliminé les abscisses supérieures à 90% pour tenir compte des valeurs extrêmes trouvées chez les bactéries étudiées.
La fonction dans calc est: "=(-2*P345-RACINE(((2*P345)^2)-12*O345*Q345))/(6*O345)" où P345 désigne la cellule de la 2ème constante, O345 la 1ère et Q345 la 3ème.

maximum DRNA[modifier | modifier le wikicode]

Lien Tableur: maximum DRNA
Il est calculé avec l'équation du diagramme: "=P387*(O345*P387^2+P345*P387+Q345)" voir abscisse ci-dessus et P387 étant la cellule de l'abscisse (%AT ou %GC)

Caractérisation des codons par les courbes et les coefficients de corrélation[modifier | modifier le wikicode]

Les queues. À partir du tableau original normé des 111 bactéries[modifier | modifier le wikicode]

Lien Tableur: Les queues. À partir du tableau original normé des 111 bactéries
Tableau partiel pour illustration. Les queues sont en orange. Voir le tableau original normé.
Légende:

queue: nombre de bactéries ayant des effectifs faibles de leur codon (en rouge)
moyenne queue: total des effectifs faibles divisé par le nombre de la queue
moyenne codon: total du codon divisé par 111.
%queue: total effectifs faibles de la queue divisé par (moyenne codon x 111) en %.

**111 bactéries: Caractérisation des codons** . Les queues à partir du tableau original.
aas	KEGG	%AT	%GC	tta	ttg*	ctt	cta	ctg	ctc	aaa	aag	ttt	ttc	tct	tca	agt	tcg	tcc	agc
5710	zin	86,5	13,5	564	9	8	10	0	0	1241	22	452	9	146	99	57	1	2	3
5760	crp	83,4	16,6	532	55	38	40	2	1	935	44	575	24	164	131	84	14	3	13
5864	hcr	77,5	22,5	417	32	156	22	0	4	729	54	296	26	135	165	41	7	13	10
6157	mcac	76,3	23,7	502	40	38	51	0	0	579	43	261	16	101	151	114	1	0	12
6041	ssdc	75,8	24,2	503	40	65	16	1	3	539	66	279	13	182	113	54	13	12	12
6132	sbw	74,9	25,1	414	34	76	34	9	9	634	27	300	18	171	94	63	12	12	28
5709	uur	74,5	25,5	442	55	40	55	1	2	535	65	255	23	55	181	102	14	6	10
6361	ple	73,8	26,2	414	107	45	53	9	5	577	81	267	10	105	136	94	13	10	18
6600	smf	73,7	26,3	376	23	133	38	6	0	532	112	212	41	117	142	75	7	2	16
6345	fnc	72,9	27,1	364	74	121	51	3	3	514	119	189	43	129	137	58	5	4	15
6697	bfl	72,6	27,4	424	124	49	26	11	7	414	74	246	10	175	99	78	18	19	12
6334	cbl	71,7	28,3	337	38	114	65	3	2	462	118	198	54	127	103	87	3	17	17
6762	rip	71,5	28,5	247	112	81	65	33	32	504	127	236	90	220	109	51	36	49	15
6715	rpr	71,0	29,0	306	47	141	67	26	24	421	112	250	46	120	114	88	21	18	45
6569	pub	70,3	29,7	316	59	126	72	18	4	571	103	266	43	128	151	81	14	13	27
6265	cad	70,1	29,9	251	32	121	120	15	4	420	142	181	64	105	117	97	18	5	27
6706	cje	69,5	30,5	273	91	228	25	4	12	569	85	269	22	91	54	128	13	8	67
6431	pmh	68,9	31,1	275	99	159	78	15	25	417	110	190	46	160	137	89	20	24	34
__	__	__	__	__	__	__	__	__	__	__	__	__	__	__	__	__	__	__	__
6490	din	43,9	56,1	3	23	69	4	387	123	115	258	108	142	22	24	44	30	141	87
5844	say	43,2	56,8	112	228	44	18	154	108	139	90	122	75	17	9	39	112	54	50
6773	bmf	42,8	57,2	2	49	120	7	262	123	51	309	52	182	20	15	8	136	88	47
6638	kpn	42,5	57,5	7	20	38	4	486	74	241	138	61	153	58	4	9	46	112	76
6820	aba	41,6	58,4	6	85	48	11	173	272	88	334	27	210	15	14	12	109	67	85
6546	dba	41,4	58,6	5	63	92	6	322	135	90	301	73	189	20	18	10	59	139	91
6472	synd	40,9	59,1	0	69	55	3	386	180	74	230	17	154	11	21	38	60	117	120
6745	pgd	40,4	59,6	1	35	46	10	380	84	129	218	84	152	18	14	8	101	85	45
6549	pac	40,0	60,0	5	93	82	20	227	154	47	250	41	171	40	18	15	108	112	39
6780	bla	39,5	60,5	1	61	31	3	248	221	34	272	8	217	5	16	12	119	114	62
6795	ret	38,7	61,3	0	29	63	5	290	196	42	319	30	198	12	7	3	156	96	44
6566	sus	38,1	61,9	3	79	34	7	334	145	59	337	34	203	7	4	12	115	60	89
6672	saci	37,7	62,3	2	85	45	4	190	329	62	295	16	195	5	5	11	127	50	118
6805	smk	37,3	62,7	1	22	74	4	221	228	33	313	20	221	9	6	4	169	91	41
6720	dvl	37,0	63,0	1	14	64	3	256	294	20	329	8	221	12	10	6	129	90	65
6859	ddr	36,6	63,4	3	14	20	3	473	89	44	252	34	187	9	16	22	49	71	159
6582	tai	36,2	63,8	7	46	82	18	347	164	9	300	23	202	11	4	9	54	209	96
7021	gau	35,7	64,3	1	86	16	5	284	239	11	291	35	201	13	16	21	142	59	49
6764	xcb	35,0	65,0	1	51	7	1	511	72	17	284	16	194	6	0	11	122	69	98
6688	rru	34,6	65,4	3	66	64	3	381	84	29	292	21	209	2	1	3	132	65	76
6845	dpt	33,8	66,2	0	21	7	8	519	69	70	216	52	159	8	5	12	84	76	146
6664	pae	33,4	66,6	0	23	4	6	501	118	29	330	1	222	1	4	3	86	98	100
6576	roa	32,6	67,4	0	27	8	0	331	237	5	289	0	204	5	1	8	150	104	60
7207	bmv	31,9	68,1	1	35	19	3	293	257	19	316	15	205	1	4	3	193	22	46
6617	tos	31,4	68,6	10	32	69	26	286	331	18	323	49	189	1	1	0	22	126	70
7209	vin	31,1	68,9	0	4	12	5	197	395	5	343	5	231	9	2	1	134	104	63
6713	age	30,6	69,4	0	11	2	0	337	298	3	448	1	225	7	0	6	92	107	94
6646	opr	30,0	70,0	0	27	21	1	342	288	18	302	10	223	1	1	1	85	39	100
6487	mts	29,7	70,3	0	10	11	2	271	326	15	285	0	232	3	3	3	173	65	76
6581	sma	29,3	70,7	0	5	11	0	374	208	1	310	1	230	3	2	1	121	142	43
6465	amd	28,7	71,3	0	11	7	1	399	190	3	252	1	215	3	3	2	157	87	41
6559	sho	28,0	72,0	0	5	11	0	385	187	0	295	4	223	0	1	0	98	152	45
6561	sgr	27,8	72,2	0	2	7	0	368	210	1	301	2	227	2	1	2	114	146	34
6452	cmi	27,3	72,7	0	5	1	1	240	387	0	248	0	215	0	0	0	117	113	108
6571	salb	26,7	73,3	0	2	4	0	354	240	0	287	1	227	1	0	1	116	144	39
6532	ksk	25,8	74,2	0	6	3	0	401	201	0	260	1	217	1	0	0	134	137	44
6733	ade	25,1	74,9	0	2	3	0	296	305	4	362	0	220	0	0	0	129	85	54
moyenne queue				1,7	3,7	3,6	3,0	3,8	3,1	1,1	-	2,1	-	2,8	1,5	1,9	5,6	4,8	-
moyenne codon				120	81	97	30	180	104	247	202	123	125	69	50	38	58	66	55
codon				tta	ttg	ctt	cta	ctg	ctc	aaa	aag	ttt	ttc	tct	tca	agt	tcg	tcc	agc
queue				35	6	5	20	12	12	8	0	12	0	19	19	16	4	4	1
%queue				0,4	0,2	0,2	1,8	0,2	0,3	0,0	-	0,2	-	0,7	0,5	0,7	0,3	0,3	-

Les queues au complet à copier dans un tableur avec une largeur de colonne de 1,3 cm. Voir le tableur.

Les queues. Les courbes à partir des équations de tendance[modifier | modifier le wikicode]

Lien Tableur: Les queues. Les courbes à partir des équations de tendance
Tableau partiel pour illustration. Les queues sont en orange pour les valeurs définies au chapitre précédent. Les constantes des courbes sont là.
Tableau non formaté:le tableau complet à copier dans un tableur avec une largeur de colonne de 1,3 cm.

**111 bactéries: Caractérisation des codons** . Les courbes à partir des équations de tendance.
aas	KEGG	%AT	%GC	tta	ttg*	ctt	cta	ctg	ctc	aaa	aag	ttt	ttc	tct	tca	agt	tcg	tcc	agc
			x3	0,00219	-0,00254	-0,00329	-0,00085	-0,00462	0,00016	0,0020	-0,00081	0,00057	-0,00075	-0,00091	-0,0003	-0,0005	-0,0002	-0,0013	-0,0010
			x2	-0,10807	0,27112	0,37605	0,10907	0,5886	0,0552	-0,05462	0,09348	0,01185	0,11012	0,13691	0,06661	0,07383	0,0518	0,15161	0,09531
			x	0,97089	-5,14699	-8,20089	-2,69606	-13,46935	-1,18671	0,91141	1,73297	-0,2492	-0,95591	-3,32039	-1,92933	-1,84844	-0,92575	-2,72647	-1,05602
5710	zin	86,5	13,5	692	-60	-24	33	-86	-6	989	39	435	5	148	163	88	-4	-12	1
5760	crp	83,4	16,6	601	-17	23	41	-83	-4	881	51	393	11	147	152	87	-2	-9	4
5864	hcr	77,5	22,5	445	47	92	51	-58	3	691	77	317	26	141	129	81	3	1	14
6157	mcac	76,3	23,7	419	57	102	52	-50	5	659	83	304	29	140	125	80	4	3	16
6041	ssdc	75,8	24,2	406	62	106	52	-46	6	643	85	297	31	139	123	79	5	4	17
6132	sbw	74,9	25,1	387	68	113	53	-41	7	620	89	288	33	137	120	78	6	6	18
5709	uur	74,5	25,5	378	71	116	53	-37	8	608	92	283	35	136	118	78	7	8	19
6361	ple	73,8	26,2	364	76	120	53	-32	10	590	95	276	37	135	116	77	8	9	21
6600	smf	73,7	26,3	361	77	121	53	-31	10	587	96	274	37	135	115	77	8	10	21
6345	fnc	72,9	27,1	344	82	126	54	-25	12	566	100	265	40	133	113	75	9	12	23
6697	bfl	72,6	27,4	339	83	128	54	-22	12	559	101	263	41	132	112	75	9	12	23
6334	cbl	71,7	28,3	321	89	133	54	-14	14	536	106	253	44	130	108	74	11	15	25
6762	rip	71,5	28,5	318	89	133	54	-13	15	532	106	251	45	130	108	74	11	15	25
6715	rpr	71,0	29,0	308	92	136	54	-8	16	520	109	246	47	129	106	73	12	17	26
6569	pub	70,3	29,7	295	96	139	54	-2	18	503	113	239	49	127	103	72	13	19	28
6265	cad	70,1	29,9	291	97	140	54	0	18	497	114	237	50	126	102	71	13	19	28
6706	cje	69,5	30,5	280	99	142	54	6	20	483	117	231	52	125	100	70	14	21	30
6431	pmh	68,9	31,1	269	102	144	54	12	21	470	120	225	54	123	98	69	15	23	31
__	__	__	__	__	__	__	__	__	__	__	__	__	__	__	__	__	__	__	__
6490	din	43,9	56,1	20	82	86	20	281	135	107	248	60	161	41	22	21	76	95	73
5844	say	43,2	56,8	17	79	82	19	287	140	102	251	57	163	39	20	20	78	96	73
6773	bmf	42,8	57,2	15	77	80	18	290	142	99	253	56	165	37	19	19	79	97	74
6638	kpn	42,5	57,5	14	76	78	17	293	145	97	255	55	166	36	18	19	80	97	74
6820	aba	41,6	58,4	11	72	73	15	300	151	90	259	51	170	33	16	17	83	99	74
6546	dba	41,4	58,6	10	71	71	15	303	153	89	260	50	171	32	16	17	84	99	74
6472	synd	40,9	59,1	9	69	69	14	306	156	86	262	49	173	31	15	16	85	100	74
6745	pgd	40,4	59,6	7	67	65	13	310	159	82	264	47	176	29	14	15	87	101	74
6549	pac	40,0	60,0	6	65	63	12	313	162	80	266	45	177	28	13	14	88	101	75
6780	bla	39,5	60,5	5	63	60	11	316	166	77	268	44	179	26	12	13	89	102	75
6795	ret	38,7	61,3	3	60	55	10	322	171	72	271	41	182	24	10	12	92	103	75
6566	sus	38,1	61,9	1	57	51	9	326	176	68	273	39	185	22	9	11	94	104	75
6672	saci	37,7	62,3	0	55	49	8	328	179	66	275	38	186	21	8	10	95	104	74
6805	smk	37,3	62,7	0	54	47	7	330	182	64	276	37	188	20	7	9	96	105	74
6720	dvl	37,0	63,0	-1	52	45	6	332	184	62	278	36	189	18	7	9	97	105	74
6859	ddr	36,6	63,4	-2	50	42	6	334	187	60	279	35	191	17	6	8	99	105	74
6582	tai	36,2	63,8	-3	49	40	5	337	190	58	281	34	192	16	5	8	100	106	74
7021	gau	35,7	64,3	-3	46	37	4	339	194	56	282	32	194	15	4	7	101	106	74
6764	xcb	35,0	65,0	-4	43	33	3	342	200	53	285	30	197	13	3	6	104	106	73
6688	rru	34,6	65,4	-5	41	30	2	344	204	50	287	29	199	11	2	5	105	107	73
6845	dpt	33,8	66,2	-6	38	26	1	347	209	47	289	27	202	9	1	4	108	107	72
6664	pae	33,4	66,6	-6	36	23	0	349	213	46	291	26	203	8	0	3	109	107	72
6576	roa	32,6	67,4	-7	32	18	-1	351	220	42	293	24	206	6	-1	2	112	107	71
7207	bmv	31,9	68,1	-8	29	14	-3	353	226	40	296	23	209	4	-2	1	114	107	70
6617	tos	31,4	68,6	-8	27	12	-3	354	230	38	297	22	210	3	-3	0	116	107	69
7209	vin	31,1	68,9	-8	26	9	-4	355	233	37	298	21	212	2	-3	0	117	107	69
6713	age	30,6	69,4	-9	23	7	-5	356	237	35	300	20	214	0	-4	-1	119	106	68
6646	opr	30,0	70,0	-9	21	3	-6	357	243	33	302	19	216	-1	-5	-2	121	106	67
6487	mts	29,7	70,3	-9	20	2	-6	357	245	32	302	18	216	-2	-5	-2	121	106	67
6581	sma	29,3	70,7	-9	18	0	-7	357	249	31	304	17	218	-3	-6	-3	123	106	66
6465	amd	28,7	71,3	-9	16	-3	-8	357	254	29	305	16	220	-4	-7	-3	125	105	65
6559	sho	28,0	72,0	-9	13	-7	-9	357	261	27	307	15	222	-6	-8	-4	127	104	63
6561	sgr	27,8	72,2	-9	12	-8	-9	357	263	27	308	14	223	-6	-8	-4	128	104	63
6452	cmi	27,3	72,7	-9	10	-10	-10	356	267	26	309	14	224	-7	-8	-5	130	104	62
6571	salb	26,7	73,3	-9	7	-14	-10	355	273	24	310	13	226	-8	-9	-6	132	103	60
6532	ksk	25,8	74,2	-9	4	-18	-12	354	281	22	312	11	229	-10	-10	-7	135	101	58
6733	ade	25,1	74,9	-9	1	-21	-12	352	288	21	314	10	231	-11	-11	-7	137	100	56

Les écarts. Moyenne des écarts, en %, par rapport à la courbe théorique. Les queues. Les moyennes des codons.[modifier | modifier le wikicode]

Lien Tableur: Les écarts. Moyenne des écarts, en %, par rapport à la courbe théorique. Les queues. Les moyennes des codons.
Tableau partiel pour illustration. Pour repérer les queues, dans le tableau des calculs des écarts, il suffit de copier le format seul du tableau des courbes théoriques après avoir coloré le fond des cellules de queue. Les moyennes des codons sont celles calculées dans le tableau des diagrammes.
Totalité du tableau à copier dans un tableur. Largeur de colonne 1,3 cm.

**111 bactéries: Caractérisation des codons** . Moyenne des écarts, moyenne des codons, queues,
aas	KEGG	%AT	%GC	tta	ttg	ctt	cta	ctg	ctc	aaa	aag	ttt	ttc	tct	tca	agt	tcg	tcc	agc
5710	zin	86,5	13,5	18	115	133	69	100	100	25	44	4	71	2	40	35	132	119	322
5760	crp	83,4	16,6	11	414	66	2	103	130	6	12	46	118	11	14	3	774	136	188
5864	hcr	77,5	22,5	6	32	70	56	100	44	6	31	7	0	4	28	49	112	1920	27
6157	mcac	76,3	23,7	20	29	62	1	100	100	12	48	14	45	28	21	42	76	100	26
6041	ssdc	75,8	24,2	24	35	39	69	102	45	16	23	6	58	31	8	32	152	166	29
6132	sbw	74,9	25,1	7	50	33	35	121	14	2	70	4	46	25	22	20	89	82	50
5709	uur	74,5	25,5	17	23	65	4	103	72	12	29	10	34	60	53	31	103	24	46
6361	ple	73,8	26,2	14	42	62	2	129	47	2	14	3	72	22	17	22	74	12	15
6600	smf	73,7	26,3	4	70	10	29	119	100	9	17	22	9	13	23	2	12	79	24
6345	fnc	72,9	27,1	6	9	4	6	113	73	9	19	29	8	3	22	23	43	65	31
6697	bfl	72,6	27,4	25	49	62	51	148	44	26	26	6	76	32	11	4	87	51	49
6334	cbl	71,7	28,3	5	57	14	20	122	86	14	12	22	22	2	4	18	71	12	34
6762	rip	71,5	28,5	22	26	39	20	355	118	5	19	6	101	69	2	30	224	223	39
6715	rpr	71,0	29,0	1	49	4	24	417	53	19	3	1	2	7	8	21	81	5	70
6569	pub	70,3	29,7	7	38	10	32	971	77	14	9	11	13	0	46	13	8	31	3
6265	cad	70,1	29,9	14	66	13	122	5112	77	16	25	24	28	17	14	36	33	73	4
6706	cje	69,5	30,5	2	9	60	53	36	41	18	27	16	57	27	46	82	12	63	128
6431	pmh	68,9	31,1	2	3	10	45	29	19	11	8	15	16	30	40	28	32	7	9
__	__	__	__	__	__	__	__	__	__	__	__	__	__	__	__	__	__	__	__
6490	din	43,9	56,1	85	72	20	80	38	9	7	4	80	11	46	12	108	60	49	19
5844	say	43,2	56,8	561	188	47	4	46	23	36	64	113	54	57	55	95	44	44	31
6773	bmf	42,8	57,2	87	36	50	62	10	14	48	22	7	10	46	24	60	73	9	36
6638	kpn	42,5	57,5	52	74	51	77	66	49	149	46	12	8	60	79	53	42	16	3
6820	aba	41,6	58,4	48	18	34	32	42	80	2	29	48	24	54	12	32	31	32	15
6546	dba	41,4	58,6	51	11	29	60	7	11	2	16	45	10	38	14	40	29	40	23
6472	synd	40,9	59,1	100	1	20	78	26	16	14	12	65	11	64	44	144	30	17	62
6745	pgd	40,4	59,6	86	48	30	25	22	48	57	18	79	13	37	0	47	17	15	40
6549	pac	40,0	60,0	17	42	30	63	27	5	41	6	10	3	43	41	6	23	10	48
6780	bla	39,5	60,5	80	4	49	74	22	34	56	2	82	21	82	40	12	33	12	17
6795	ret	38,7	61,3	100	52	13	51	10	14	41	18	28	8	52	33	76	70	6	41
6566	sus	38,1	61,9	143	38	34	19	3	18	14	23	14	10	68	55	11	22	42	19
6672	saci	37,7	62,3	364	54	8	50	42	84	7	8	59	5	76	39	7	33	52	58
6805	smk	37,3	62,7	327	59	58	46	33	25	49	13	45	18	56	21	59	76	13	44
6720	dvl	37,0	63,0	187	74	44	55	23	60	67	19	78	17	37	47	34	32	15	12
6859	ddr	36,6	63,4	256	72	53	50	41	53	27	10	1	2	50	176	167	51	33	114
6582	tai	36,2	63,8	371	6	105	257	3	14	85	7	32	5	32	22	19	46	98	29
7021	gau	35,7	64,3	128	85	57	13	16	23	80	3	10	3	11	275	203	40	45	34
6764	xcb	35,0	65,0	122	19	79	66	49	64	67	0	46	2	54	100	88	18	35	34
6688	rru	34,6	65,4	157	60	113	47	11	59	42	2	29	5	82	54	40	26	39	5
6845	dpt	33,8	66,2	100	44	74	959	49	67	48	25	90	21	16	426	229	22	29	103
6664	pae	33,4	66,6	100	37	83	18171	44	45	38	14	96	9	88	1451	7	22	8	40
6576	roa	32,6	67,4	100	17	57	100	6	8	88	2	100	1	14	193	307	35	3	16
7207	bmv	31,9	68,1	111	19	37	201	17	14	52	7	35	2	76	260	226	69	80	34
6617	tos	31,4	68,6	220	16	494	867	19	44	53	9	124	10	63	134	100	81	18	1
7209	vin	31,1	68,9	100	86	25	214	44	70	88	15	78	9	440	153	437	15	3	9
6713	age	30,6	69,4	100	54	71	100	5	25	92	49	95	6	1619	100	708	23	1	37
6646	opr	30,0	70,0	100	27	499	117	4	19	47	0	47	3	196	120	157	30	63	48
6487	mts	29,7	70,3	100	49	437	133	24	33	53	6	100	7	285	157	247	42	39	13
6581	sma	29,3	70,7	100	72	3805	100	5	16	97	2	94	6	211	134	138	1	35	35
6465	amd	28,7	71,3	100	28	311	113	12	25	90	17	94	2	176	146	161	26	17	38
6559	sho	28,0	72,0	100	60	252	100	8	28	100	4	73	0	100	113	100	23	45	29
6561	sgr	27,8	72,2	100	83	185	100	3	20	96	2	86	2	133	113	145	11	40	46
6452	cmi	27,3	72,7	100	49	110	111	33	45	100	20	100	4	100	100	100	10	9	73
6571	salb	26,7	73,3	100	73	129	100	0	12	100	7	92	0	112	100	118	12	40	36
6532	ksk	25,8	74,2	100	48	117	100	13	29	100	17	91	5	110	100	100	0	36	24
6733	ade	25,1	74,9	100	36	114	100	16	6	81	15	100	5	100	100	100	6	15	3

Total sans queue				3601	4547	4752	4168	3618	4358	3137	2959	2870	2430	3384	3477	4121	4601	3941	4159
bactéries sans queue				76	106	101	91	95	99	103	111	99	111	92	92	95	107	107	111
écart (moyenne)				47	43	47	46	38	44	30	27	29	22	37	38	43	43	37	37
queue				35	5	10	20	16	12	8	0	12	0	19	19	16	4	4	0
Moyenne du codon				120	81	97	30	180	104	247	202	123	125	69	50	38	58	66	55
codon				tta	ttg	ctt	cta	ctg	ctc	aaa	aag	ttt	ttc	tct	tca	agt	tcg	tcc	agc

Les coefficients de corrélation[modifier | modifier le wikicode]

Lien Tableur: Les coefficients de corrélation
Les valeurs présentées ici sont les coefficients de corrélation X 100. La corrélation entre 2 codons est celle de 2 colonnes du tableau des diagrammes normalisé. Pour obtenir les valeurs absolues il suffit de copier ce tableau (largeur de colonne 1,3 cm) et de remplacer le moins (-) par rien. Pour extraire le maximum d'une colonne il suffit de remplacer 100 par rien (format sans décimales et option de recherche 'cellule entière').
Légende:

moyenne : moyenne des corrélations en valeurs absolues d'un codon.
>74 : nombre de corrélations en valeurs absolues d'un codon supérieures à 0.74.
>79 : nombre de corrélations en valeurs absolues d'un codon supérieures à 0.79.
max : corrélation maximum parmi les valeurs absolues des corrélations d'un codon.

Les valeurs de la légende sont utilisées dans le tableau synthétique des aas et des codons

Tableau synthétique des diagrammes[modifier | modifier le wikicode]

Tableau des abscisses et maxima des courbes de tendance.[modifier | modifier le wikicode]

Lien Tableur: Tableau des abscisses et maxima des courbes de tendance.

- (*): ttg et agg, sont reportés en %AT et tga en %GC.

- (75) abscisse sans maximum, valeur de max à 75.

- (75) abscisse supérieure à 75 pour le maximum, valeur de max à 75.

Tableau des abscisses et maxima des courbes de tendance
	abscis	max		abscis	max		abscis	max		abscis	max

ttt	75	288	tct	75	137	tat	75	261	tgt	75	51
ttc	75	231	tcc	67	107	tac	75	172	tgc	64	48
tta	75	389	tca	75	120	taa	75	5	tga*	75	3
ttg*	60	119	tcg	75	138	tag	75	1	tgg	75	89

ctt	63	153	cct	68	104	cat	73	91	cgt	56	134
ctc	75	289	ccc	75	140	cac	75	131	cgc	75	359
cta	71	54	cca	74	106	caa	75	174	cga	61	28
ctg	71	357	ccg	75	213	cag	68	213	cgg	75	131

att	75	369	act	75	137	aat	75	399	agt	75	78
atc	73	296	acc	75	238	aac	66	171	agc	61	75
ata	75	259	aca	75	129	aaa	75	622	aga	75	150
atg	51	168	acg	69	110	aag	75	314	agg*	59	36

gtt	68	211	gct	66	170	gat	70	329	ggt	63	183
gtc	75	328	gcc	75	405	gac	75	447	ggc	75	419
gta	70	143	gca	67	141	gaa	67	420	gga	75	157
gtg	70	236	gcg	75	287	gag	75	513	ggg	64	70

Caractérisation par les diagrammes et les coefficients de corrélation[modifier | modifier le wikicode]

Lien Tableur: Caractérisation par les diagrammes et les coefficients de corrélation
Voir l'article pour une définition des paramètres plus élaborée.

Le paramètre R2 est le coefficient de détermination des courbes de tendance. Pour comparaison avec le paramètre écart.
Le paramètre queue a été déterminé à partir des courbes calculées à partir des coefficients du polynôme de degré 3 du diagramme de chaque codon. Voir le tableau de ces calculs. Il est exprimé ici en nombre de bactéries dont les effectifs des codons sont nulles ou très faibles au début des abscisses, voir le tableau de la 1ère détermination de ces queues avec des effectifs qui ne dépassent pas 3% du total. Sur 32 queues de longueur supérieure à 4, 5 seulement ont des effectifs qui dépassent 1% du total.
Le paramètre écart est l'équivalent du R2 mais calculé pour les effectifs sans la queue du codon. C'est la moyenne des différences, en valeur absolue et en % par rapport à la valeur théorique, entre cette valeur théorique et l'effectif compté du codon. Quand une différence est très élevée à cause d'un effectif théorique très faible, elle est ignorée et la queue rallongée. Voir le tableau de ces calculs.
Le paramètre abscis est l'abscisse du maximum de la courbe de tendance. Il est exprimé en %GC ou %AT. Voir le tableau de ces calculs. Pour les courbes sans maximum l'abscisse 75% (AT ou GC) est utilisée pour comparaison. Quand l'abscisse du maximum dépasse 75% elle est seulement indiquée sous la forme 75/xx où xx est l'abscisse en question.
Le paramètre moyen, pour moyenne, est la moyenne du codon sur les 111 bactéries. C'est la somme des effectifs d'un codon divisé par 111.
La colonne %: c'est le pourcentage d'un codon dans la constitution de son acide aminé.
Le paramètre max est l'ordonnée de l'abscisse abscis. C'est le maximum de la courbe ou la valeur pour l'abscisse 75% quand ce maximum n'existe pas ou si son abscisse est supérieure à 75%.
La colonne %moy c'est le rapport max/moyen dans le but de normaliser les courbes.
La colonne cor>79 correspond au nombre de corrélations supérieures à 0.79 pour un codon donné avec les autres codons (l'identité exclue).
La colonne cor tot correspond à la moyenne des corrélations d'un codon avec les autres codons. Cette moyenne est reportée en fin du tableau des corrélations.

**111 bactéries. Caractérisation des codons par leurs diagrammes et leurs coefficients de corrélation.**
codon	R2	écart	queue	Moyen.	%	abscis	max	%moy.	Cor>79	cor tot
act	891	38	14	68	21	75/82	137	200	10	64,1
acc	932	30	8	121	37	75	238	196	17	66,0
aca	884	38	18	65	20	75/78	129	198	6	63,0
acg	832	38	4	71	22	69	110	155	0	48,4
				325
gct	911	30	9	108	22	66	170	156	4	56,8
gcc	931	28	9	164	33	75	405	247	17	66,9
gca	929	30	6	91	19	67	141	155	6	59,2
gcg	882	35	5	126	26	75	287	228	3	59,5
				490
gtt	944	28	8	132	28	68	211	160	11	62,7
gtc	916	32	4	118	25	75	328	278	7	62,9
gta	888	45	13	84	18	70	143	171	0	58,4
gtg	907	39	5	137	29	70	236	172	0	60,1
				471
ggt	900	30	0	142	31	63	183	129	0	39,6
ggc	956	42	0	169	37	75	419	248	28	68,6
gga	847	42	9	88	19	75/78	157	178	2	56,0
ggg	710	42	0	54	12	64	70	131	0	26,8
				453

tta	925	47	35	120	20	75	389	324	13	61,2
ttg*	765	43	5	81	13	60	119	147	0	26,6

ctt	805	47	10	97	16	63	153	158	0	39,2
ctc	839	44	12	104	17	75	289	278	4	60,0
cta	756	46	20	30	5	71	54	183	0	51,5
ctg	878	38	16	180	30	71	357	198	6	61,9
				611

agt	876	43	16	38	11	75/86	78	205	7	62,3
agc	857	37	0	55	16	61	75	136	0	42,6

tct	876	37	19	69	20	75	137	200	7	62,5
tcc	868	37	4	66	20	67	107	162	0	54,8
tca	893	38	19	50	15	75	120	240	12	63,5
tcg	853	43	4	58	17	75	138	236	3	58,2
				336

aga	715	64	31	60	16	75	150	251	1	53,2
agg*	308	92	10	24	6	59	36	148	0	13,5

cgt	736	51	0	103	27	56	134	131	0	18,2
cgc	938	28	19	132	34	75	359	272	17	66,6
cga	571	66	0	20	5	61	28	136	0	22,4
cgg	699	56	20	44	12	75	131	297	0	48,5
				383

**111 bactéries. Caractérisation des codons par leurs diagrammes et leurs coefficients de corrélation.**
codon	R2	écart	queue	Moyen.	%	abscis	max	%moy.	Cor>79	cor tot
atg	985	10	0	154	−	51	168	109	0	19,5
tgg	970	10	7*	71	−	75	89	125	0	43,2

tat	967	22	11	116	52	75	261	226	20	66,2
tac	927	25	0	107	48	75/83	172	161	8	60,1
				222
cat	914	30	10	59	46	73	91	155	6	60,0
cac	962	20	0	70	54	75	131	189	19	66,2
				128
caa	880	36	14	89	40	75/80	174	196	12	63,3
cag	964	26	0	132	60	68	213	161	21	66,3
				220
aat	966	35	15	133	51	75	399	300	10	58,9
aac	951	21	0	128	49	66	171	133	8	57,6
				261
aaa	957	30	8	247	55	75	622	252	11	62,7
aag	918	27	0	202	45	75/85	314	155	1	56,8
				450
gat	965	23	0	217	52	70	329	152	21	65,8
gac	970	20	0	202	48	75	447	222	27	69,4
				419
gaa	951	27	0	296	57	67	420	142	4	58,2
gag	924	30	0	226	43	75	513	227	6	61,7
				521
ttt	947	29	12	123	50	75	288	235	15	63,7
ttc	963	22	0	125	50	75	231	185	25	67,8
				248
tgt	850	37	19	27	46	75	51	193	5	57,8
tgc	874	37	5	31	54	64	48	154	0	53,3
				58
att	913	30	9	168	39	75	369	219	13	63,2
atc	938	26	2	181	42	73	296	163	11	63,8
ata	691	80	31	84	19	75	259	310	0	44,3
				433

tga*	727	104	−	2	−	75	3	180	1	44,8
taa	835	42	−	3	−	75/77	5	151	1	42,0
tag	488	129	−	1	−	75	1	95	0	9,3


cct	941	32	8	65	23	68	104	160	11	63,0
ccc	735	62	9	61	21	75	140	228	1	53,9
cca	851	39	19	58	20	74	106	182	3	60,2
ccg	885	40	8	101	35	75/82	213	210	7	61,3
				286

Diagramme corcodon[modifier | modifier le wikicode]

Lien Tableur: Diagramme corcodon
moyenne du codon en fonction de sa corrélation moyenne ( cor tot). La corrélation moyenne est donnée au bas de la matrice des corrélations entre codons. La moyenne des codons se trouve au bas du tableau des diagrammes étendus des codons. Voir le diagramme.

Tableaux des parallèles. Diagramme / coefficient de corrélation[modifier | modifier le wikicode]

Voir l'article pour la définition des paramètres pour l'établissement des matrices du paramètre diag. Ces paramètres sont donnés avant la matrice pour être utilisés dans un tableur.

écart: C'est la moyenne des différences, en valeur absolue et en % par rapport à la valeur théorique, entre cette valeur théorique et l'effectif compté du codon. Voir le tableau de ces calculs.
q3: C'est la cotation du paramètre queue, nombre de bactéries, en continu, ayant des effectifs faibles ou nuls. Le tableau des cotations pour les paramètres q3 et a3 donne la correspondance entre le %AT ou le %GC et le rang de la dernière bactérie de la queue avant le décollage de la courbe. Voir le tableau de ces calculs.
a3: Cotation du paramètre abscis, abscisse du maximum de la courbe de tendance. Il est exprimé en %GC ou %AT. Voir le tableau de ces calculs. Le tableau des cotations pour les paramètres q3 et a3 donne la correspondance entre a3 et abscis.
moyen.: pour moyenne, est la moyenne des effectifs du codon sur les 111 bactéries. En tant que moyenne ce paramètre n'a pas de sens biologique, car que veut dire l'absence d'un codon pour une bactérie donnée? Par contre la somme des effectifs correspond en mathématique à l'intégrale d'une courbe continue.C'est une caractéristique mathématique du diagramme. Voir calculs.

cor>79: nombre de coefficients du codon supérieurs à 79; pour illustration. Voir le tableau des coefficients.

cor tot: corrélation moyenne, moyenne des valeurs absolues des coefficients (multipliés par 100) du codon; pour illustration. Voir calculs.

Matrice de calcul du paramètre diag %AT (diagramme)[modifier | modifier le wikicode]

Lien Tableur: Matrice de calcul du paramètre diag %AT (diagramme)
Le paramètre diag est la somme des différences entre 2 codons, en valeur absolue et en %, des paramètres e, q3, a3 et moyen. Ici écart=e, queue=q3 et abscis=a3 (Voir l'introduction). Son calcul est le suivant:

diag = 200*(abs((e1-e2)/(e1+e2))+abs((q31-q32)/(q31+q32))+abs((a31-a32)/(a31+a32))+abs((moyen1-moyen2)/(moyen1+moyen2))).

La matrice de calcul de diag est une matrice symétrique dont la diagonale est nulle.

Matrice de calcul du paramètre diag %GC (diagramme)[modifier | modifier le wikicode]

Lien Tableur: Matrice de calcul du paramètre diag %GC (diagramme)
Le paramètre diag est la somme des différences entre 2 codons, en valeur absolue et en %, des paramètres e, q3, a3 et moyen. Ici écart=e, queue=q3 et abscis=a3 (Voir l'introduction). Son calcul est le suivant:

diag = 200*(abs((e1-e2)/(e1+e2))+abs((q31-q32)/(q31+q32))+abs((a31-a32)/(a31+a32))+abs((moyen1-moyen2)/(moyen1+moyen2))).

La matrice de calcul de diag est une matrice symétrique dont la diagonale est nulle.

Paramètres q3 a3[modifier | modifier le wikicode]

Lien Tableur: Paramètres q3 a3
Légende: voir caractérisation des codons et tableaux des parallèles.
Notes pour les diagrammes %AT: */86 abscisse optimale, 86 abscisse maximale, ttg* et agg* reportés en %AT au lieu de en %GC.
Notes pour les diagrammes %GC: */85 abscisse optimale non considérée pour les calculs, 75 abscisse maximale, tga* reporté en %GC au lieu de en %AT.
Tableaux non formatés du 13.3.17

**111 bactéries: Caractérisation des codons** . Diagrammes %AT. Cotation de queue, écart et abscisse.
codon	queue	rang	q3	écart	abscis	a3	Moyen.	Cor>79	Cor tot
aaa	29,3	8	11	30	86	5	247	11	62,7
aat	32,6	15	17	35	86	5	133	10	58,9
aca	34,6	18	20	38	78	11	65	6	63,0
act	31,9	14	17	38	82	8	68	10	64,1
aga	40,9	31	35	64	86	5	60	1	53,2
agg*	30,0	10	14	92	59	32	24	0	13,5
agt	33,4	16	20	43	*/86	5	38	7	62,3
ata	40,9	31	35	80	86	5	84	0	44,3
att	29,7	9	11	30	86	5	168	13	63,2
caa	31,9	14	17	36	80	11	89	12	63,3
cat	30,0	10	14	30	73	17	59	6	60,0
cca	35,0	19	23	39	74	17	58	3	60,2
cct	29,3	8	11	32	68	23	65	11	63,0
cga	25,1	0	5	66	61	29	20	0	22,4
cgt	25,1	0	5	51	56	35	103	0	18,2
cta	35,7	20	23	46	71	20	30	0	51,5
ctt	30,0	10	14	47	63	26	97	0	39,2
gaa	25,1	0	5	27	67	23	296	4	58,2
gat	25,1	0	5	23	70	20	217	21	65,8
gca	28,0	6	8	30	67	23	91	6	59,2
gct	29,7	9	11	30	66	23	108	4	56,8
gga	29,7	9	11	42	78	11	88	2	56,0
ggt	25,1	0	5	30	63	26	142	0	39,6
gta	31,4	13	17	45	70	20	84	0	58,4
gtt	29,3	8	11	28	68	23	132	11	62,7
taa	25,1	0	5	42	77	14	3	1	42,0
tat	30,6	11	14	22	86	5	116	20	66,2
tca	35,0	19	23	38	86	5	50	12	63,5
tct	35,0	19	23	37	86	5	69	7	62,5
tgt	35,0	19	23	37	86	5	27	5	57,8
tta	42,8	35	38	47	86	5	120	13	61,2
ttg*	27,8	5	8	43	60	29	81	0	26,6
ttt	31,1	12	14	29	86	5	123	15	63,7

**111 bactéries: Caractérisation des codons** . Diagrammes %GC. Cotation de queue, écart et abscisse.
codon	queue	rang	q3	écart	abscis	a3	Moyen.	Cor>79	Cor tot
aac	13,5	0	5	21	66	14	128	8	57,6
aag	13,5	0	5	27	*/85	5	202	1	56,8
acc	26,2	8	11	30	75	5	121	17	66,0
acg	23,7	4	8	38	69	11	71	0	48,4
agc	13,5	0	5	37	61	17	55	0	42,6
atc	16,6	2	5	26	73	5	181	11	63,8
atg	13,5	0	5	10	51	29	154	0	19,5
cac	13,5	0	5	20	75	5	70	19	66,2
cag	13,5	0	5	26	68	11	132	21	66,3
ccc	26,3	9	11	62	75	5	61	1	53,9
ccg	26,2	8	11	40	*/82	5	101	7	61,3
cgc	31,4	19	23	28	75	5	132	17	66,6
cgg	32,1	20	23	56	75	5	44	0	48,5
ctc	28,3	12	14	44	75	5	104	4	60,0
ctg	29,9	16	20	38	71	8	180	6	61,9
gac	13,5	0	5	20	75	5	202	27	69,4
gag	13,5	0	5	30	75	5	226	6	61,7
gcc	26,3	9	11	28	75	5	164	17	66,9
gcg	24,2	5	8	35	75	5	126	3	59,5
ggc	13,5	0	5	42	75	5	169	28	68,6
ggg	13,5	0	5	42	64	14	54	0	26,8
gtc	23,7	4	8	32	75	5	118	7	62,9
gtg	24,2	5	8	39	70	8	137	0	60,1
tac	13,5	0	5	25	*/83	5	107	8	60,1
tag	13,5	0	5	129	75	5	1	0	9,3
tcc	23,7	4	8	37	67	11	66	0	54,8
tcg	23,7	4	8	43	75	5	58	3	58,2
tga*	13,5	0	5	104	75	5	2	1	44,8
tgc	24,2	5	8	37	64	14	31	0	53,3
tgg	13,5	0	5	10	75	5	71	0	43,2
ttc	13,5	0	5	22	75	5	125	25	67,8

Tableaux des parallèles %AT[modifier | modifier le wikicode]

Lien Tableur: Tableaux des parallèles %AT
Ces 30 parallèles sont faits pour les couples dont le paramètre diag est inférieur à 100. Le paramètre cor est tiré du tableau des corrélations et les autres paramètres sont ceux du tableau synthétique.
Légende: voir caractérisation des codons et tableaux des parallèles.
diag/cor la 1ère ligne indique la valeur de diag la 2ème, la corrélation entre les 2 codons du parallèle.
Nota: ici l’abscisse du maximum peut aller jusqu'à 86% AT car les bactéries peuvent atteindre ce taux. Quand la courbe de tendance n'a pas de maximum c'est ce taux qui est indiqué. Si le maximum a exactement 86% alors c'est indiqué sous la forme */86.
Les 2 tableaux non formatés du 15.3.17

**111 bactéries: Caractérisation des codons** . Parallèle diagramme %AT / coefficient de corrélation. 2/2.
codon	écart	queue	Moyen.	abscis	Cor>79	cor tot	diag/cor

tca	38	19	50	86	12	63,5	64
tgt	37	19	27	86	5	57,8	62

gta	45	13	84	70	0	58,4	64
ctt	47	10	97	63	0	39,2	49

tgt	37	19	27	86	5	57,8	66
agt	43	16	38	86	7	62,3	72

cct	32	8	65	68	11	63,0	70
cat	30	10	59	73	6	60,0	74

ttg*	43	5	81	60	0	26,6	71
gca	30	6	91	67	6	59,2	36

gca	30	6	91	67	6	59,2	71
cct	32	8	65	68	11	63,0	79

cca	39	19	58	74	3	60,2	71
aca	38	18	65	78	6	63,0	75

gtt	28	8	132	68	11	62,7	76
gca	30	6	91	67	6	59,2	83

cca	39	19	58	74	3	60,2	78
cat	30	10	59	73	6	60,0	62

tat	22	11	116	86	20	66,2	78
aat	35	15	133	86	10	58,9	92

tct	37	19	69	86	7	62,5	79
act	38	14	68	82	10	64,1	79

att	30	9	168	86	13	63,2	79
aat	35	15	133	86	10	58,9	85

gtt	28	8	132	68	11	62,7	82
cct	32	8	65	68	11	63,0	81

gta	45	13	84	70	0	58,4	87
caa	36	14	89	80	12	63,3	65

ata	80	31	84	86	0	44,3	95
tta	47	35	120	86	13	61,2	62

**111 bactéries: Caractérisation des codons** . Parallèle diagramme %AT / coefficient de corrélation. 1/2.
codon	écart	queue	Moyen.	abscis	Cor>79	cor tot	diag/cor

gtt	28	8	132	68	11	62,7	27
gct	30	9	108	66	4	56,8	84

tat	22	11	116	86	20	66,2	33
ttt	29	12	123	86	15	63,7	91

tct	37	19	69	86	7	62,5	34
tca	38	19	50	86	12	63,5	70

att	30	9	168	86	13	63,2	38
aaa	30	8	247	86	11	62,7	83

ttt	29	12	123	86	15	63,7	45
aat	35	15	133	86	10	58,9	91

gct	30	9	108	66	4	56,8	49
gca	30	6	91	67	6	59,2	75

aca	38	18	65	78	6	63,0	53
caa	36	14	89	80	12	63,3	73

aca	38	18	65	78	6	63,0	54
act	38	14	68	82	10	64,1	69

tca	38	19	50	86	12	63,5	55
agt	43	16	38	86	7	62,3	75

gct	30	9	108	66	4	56,8	56
cct	32	8	65	68	11	63,0	85

aga	64	31	60	86	1	53,2	56
ata	80	31	84	86	0	44,3	76

gaa	27	0	296	67	4	58,2	58
gat	23	0	217	70	21	65,8	79

caa	36	14	89	80	12	63,3	59
gga	42	9	88	78	2	56,0	56

att	30	9	168	86	13	63,2	60
ttt	29	12	123	86	15	63,7	87

act	38	14	68	82	10	64,1	62
caa	36	14	89	80	12	63,3	80

Tableaux des parallèles %GC[modifier | modifier le wikicode]

Lien Tableur: Tableaux des parallèles %GC
Ces 30 parallèles sont faits pour les couples dont le paramètre diag est inférieur à 100. Le paramètre cor est tiré du tableau des corrélations et les autres paramètres sont ceux du tableau synthétique.
Légende: voir caractérisation des codons et tableaux des parallèles.
diag/cor la 1ère ligne indique la valeur de diag la 2ème, la corrélation entre les 2 codons du parallèle.
Nota: ici l’abscisse du maximum peut aller jusqu'à 75% GC car les bactéries peuvent atteindre ce taux. Quand la courbe de tendance n'a pas de maximum c'est ce taux qui est indiqué. Si le maximum a une abscisse supérieure à 75% alors cette abscisse est indiquée sous la forme */xx où xx est l'abscisse en question. Cela reste une caractéristique de la courbe même si biologiquement cette abscisse n'est pas atteinte.
Tableaux non formatés du 15.3.17

**111 bactéries: Caractérisation des codons** . Parallèle diagramme %GC / coefficient de corrélation. 2/2.
codon	écart	queue	Moyen.	abscis	cor>79	cor tot	diag/cor

gag	30	0	226	75	6	61,7	51
gac	20	0	202	75	27	69,4	81

ttc	22	0	125	75	25	67,8	54
atc	26	2	181	73	11	63,8	89

tac	25	0	107	75/83	8	60,1	54
atc	26	2	181	73	11	63,8	66

ggc	42	0	169	75	28	68,6	55
atc	26	2	181	73	11	63,8	84

ttc	22	0	125	75	25	67,8	56
gac	20	0	202	75	27	69,4	91

ggc	42	0	169	75	28	68,6	62
gag	30	0	226	75	6	61,7	73

ggc	42	0	169	75	28	68,6	63
aag	27	0	202	75/85	1	56,8	68

tga*	104	−	2	75	1	44,8	66
tag	129	−	1	75	0	9,3	11

gtg	39	5	137	70	0	60,1	66
gcg	35	5	126	75	3	59,5	69

tac	25	0	107	75/83	8	60,1	67
aag	27	0	202	75/85	1	56,8	77

tac	25	0	107	75/83	8	60,1	67
cac	20	0	70	75	19	66,2	92

ttc	22	0	125	75	25	67,8	67
cac	20	0	70	75	19	66,2	87

gcg	35	5	126	75	3	59,5	67
ccg	40	8	101	75/82	7	61,3	89

ttc	22	0	125	75	25	67,8	67
aag	27	0	202	75/85	1	56,8	80

gtc	32	4	118	75	7	62,9	71
ccg	40	8	101	75/82	7	61,3	75

**111 bactéries: Caractérisation des codons** . Parallèle diagramme %GC / coefficient de corrélation. 1/2.
codon	écart	queue	Moyen.	abscis	cor>79	cor tot	diag/cor

tcc	37	4	66	67	0	54,8	9
acg	38	4	71	69	0	48,4	40

aag	27	0	202	75/85	1	56,8	14
atc	26	2	181	73	11	63,8	66

gtc	32	4	118	75	7	62,9	17
gcg	35	5	126	75	3	59,5	71

gag	30	0	226	75	6	61,7	23
aag	27	0	202	75/85	1	56,8	76

gac	20	0	202	75	27	69,4	29
aag	27	0	202	75/85	1	56,8	73

ttc	22	0	125	75	25	67,8	30
tac	25	0	107	75/83	8	60,1	82

agc	37	0	55	61	0	42,6	34
ggg	42	0	54	64	0	26,8	26

ctc	44	12	104	75	4	60,0	35
ccg	40	8	101	75/82	7	61,3	58

gac	20	0	202	75	27	69,4	36
atc	26	2	181	73	11	63,8	80

gcc	28	9	164	75	17	66,9	36
acc	30	8	121	75	17	66,0	89

gag	30	0	226	75	6	61,7	37
atc	26	2	181	73	11	63,8	66

gtc	32	4	118	75	7	62,9	39
acc	30	8	121	75	17	66,0	78

ccg	40	8	101	75/82	7	61,3	47
acc	30	8	121	75	17	66,0	74

aac	21	0	128	66	8	57,6	50
cag	26	0	132	68	21	66,3	79

gcg	35	5	126	75	3	59,5	51
acc	30	8	121	75	17	66,0	67

Diagramme diagcor-gc[modifier | modifier le wikicode]

Lien Tableur: Diagramme diagcor-gc
Tableau numérique. Voir le diagramme
Paramètre diag voir diag gc
Coefficients de corrélations gc: voit Tableur.

Diagramme diagcor-at[modifier | modifier le wikicode]

Lien Tableur: Diagramme diagcor-at
Tableau numérique. Voir le diagramme.
Paramètre diag, voir diag at
Coefficients de corrélations at: voir Tableur.

Caractérisation des aas par les courbes et les coefficients de corrélation[modifier | modifier le wikicode]

Tableau des diagrammes aas DRNA[modifier | modifier le wikicode]

Lien Tableur: Tableau des diagrammes aas DRNA
Chaque acide aminé est la somme de ses codons du tableau des diagrammes des codons.
Les diagrammes issus de ce tableau.

Courbes à partir des équations de tendance[modifier | modifier le wikicode]

Lien Tableur: Courbes à partir des équations de tendance
Calculs: (x₃/100000)*GC^3+x₂*GC^2+x*GC+cte.
Ces constantes sont relevées à partir des diagrammes des aas.

Moyenne des écarts par rapport à la courbe théorique[modifier | modifier le wikicode]

Lien Tableur: Moyenne des écarts par rapport à la courbe théorique
calculs: ABS(100*(effectif-théorique)/théorique). effectif, théorique
Légende: Moy, moyenne des écarts en %; >20, nombre des écarts supérieurs à 20%; ecartt, écart-type.

Taux de variation des acides aminés[modifier | modifier le wikicode]

Lien Tableur: Taux de variation des acides aminés
Légende:

écart*: moyenne des écarts de l'aa calculée ci-dessus
ax et cte: de l'équation de la courbe de tendance linéaire, "effectif de l'aa" = ax+cte. A calculer à partir du tableau des diagrammes des aas. Le signe de ax indique le sens de la variation de l'aa.
Max et Min (avec ou sans zin et crp) sont en fin du tableau des diagrammes des aas.
Les bactéries zin et crp sont extrêmes, ce qui fait que le Maximum et le minimum sans eux ne concernent que 109 bactéries et avec les écart* faibles, le rapport M/m (Maximum sur minimum) reflète mieux la courbe de tendance linéaire.

**Tableau des taux de variation des aas**
	ax	cte	écart*	Max	min	M/m	−Max	min	M/m
				Sans zin ni crp			−Avec zin et crp
A	7.49	131	8.4	693	221	3.1	693	91	7.6
C	-0.24	69	25.3	121	21	5.7	121	21	5.7
D	1.61	342	7.5	526	292	1.8	526	148	3.6
E	0.77	485	7.6	694	340	2.0	694	196	3.5
F	-1.88	338	7.8	326	171	1.9	599	171	3.5
G	3.54	284	4.0	538	309	1.7	538	217	2.5
H	0.42	109	8.0	162	92	1.8	162	61	2.7
I	-7.34	785	7.6	767	261	2.9	1074	261	4.1
K	-8.17	840	11.0	783	229	3.4	1263	229	5.5
L	0.35	595	4.4	753	543	1.4	753	543	1.4
M	0.40	135	10.2	207	97	2.1	207	70	2.9
N	-5.58	528	9.0	544	123	4.4	864	123	7.0
P	2.61	161	4.8	401	190	2.1	401	113	3.6
Q	0.47	198	12.0	302	148	2.0	302	97	3.1
R	4.79	154	7.3	546	221	2.5	546	128	4.3
S	-1.72	418	8.5	496	220	2.3	496	220	2.3
T	1.14	271	7.5	391	231	1.7	391	174	2.2
V	3.09	323	4.8	588	255	2.3	588	134	4.4
W	0.48	51	8.6	117	54	2.2	117	50	2.3
Y	-2.22	329	7.8	306	149	2.1	399	149	2.7

Tableau non formaté

Les coefficients de corrélation entre aas[modifier | modifier le wikicode]

Lien Tableur: Les coefficients de corrélation entre aas
Les valeurs présentées ici sont les coefficients de corrélation X 100. La corrélation entre 2 aas est celle de 2 colonnes du tableau des diagrammes des aas. Pour obtenir les valeurs absolues il suffit de copier ce tableau (largeur de colonne 1,3 cm) et de remplacer le moins (-) par rien. Pour extraire le maximum d'une colonne il suffit de remplacer 100 par rien (format sans décimales et option de recherche 'cellule entière').
Légende:

moyenne : moyenne des corrélations en valeurs absolues d'un aa.
>74 : nombre de corrélations en valeurs absolues d'un aa supérieures à 0.74.
>79 : nombre de corrélations en valeurs absolues d'un aa supérieures à 0.79.
max : corrélation maximum parmi les valeurs absolues des corrélations d'un aa.

Les valeurs de la légende sont utilisées dans le tableau synthétique des aas et des codons

Diagramme coraa[modifier | modifier le wikicode]

Lien Tableur: Diagramme coraa
moyenne de l'aa en fonction de sa corrélation moyenne ( cor moy). La corrélation moyenne est donnée au bas de la matrice des corrélations entre aas.
La moyenne des aas (moy. aa) se trouve au bas du tableau des diagrammes des aas.
Le diagramme coraa.

Synthèse des corrélations des codons et des aas[modifier | modifier le wikicode]

Tableau synthétique[modifier | modifier le wikicode]

Lien Tableur: Tableau synthétique
Tableau synthétique non formaté
Légende: corrélations en valeur absolue et multipliée par 100 entre 2 aas ou 2 codons.

Corrélations entre aas (acides aminés): d'après la matrice des corrélations.
1. moy : moyenne des corrélations d'un aa.
2. >74−79 : nombre de corrélations d'un aa supérieures à 0.74 − dont corrélations supérieures à 0.79.
3. max : corrélation maximum d'un aa.
Corrélations entre codons
1. t,c,a,g,t/c,a/g : terminaison des codons (t/c pour t ou c), pour lesquels on a la moyenne "moy" sous moyt (comme pour les aas) et le nombre ">74−79" sous >74−79t (comme pour les aas).
2. moyt : total des moyennes "moy" des codons d'un aa.
3. >74−79t : total des nombres ">74−79" des codons d'un aa.
4. 0-70 : pour un codon, zéro corrélations supérieures à 0.74 − avec une corrélation maximale (en valeur absolue) de 0.70.
5. stop : les codons stops. Les codons taa et tga ont une seule corrélation supérieure à 0.74 et c'est celle entre eux. Elle est négative (*). Sont indiqués aussi le maximum de tag et les maxima de taa et tga en dehors de leur corrélation de -0.802.
Résumés :
1. moyn : nombre des moyennes "moy" pour une gamme donnée en en-tête de la colonne.
2. 74n : nombre des nombres ">74−79" pour une gamme donnée en en-tête de la colonne.
3. 74t : total des corrélations supérieures à 0.74 seulement, des codons d'un aa.
4. moyt : déjà défini dans codons
5. %total: 20 aas et 61 codons (pour les aas).
Résumé III: La corrélation entre aas traduit peu la corrélation qui existe entre codons. Ainsi
1. Les aas à un codon, M W, sont peu corrélés avec les autres aas et peu corrélés avec les autres codons;
2. Les aas, A F I P V Y, sont très corrélés avec les autres aas et leurs codons sont très corrélés avec les autres codons;
3. Les aas, G K N R, sont très corrélés avec les autres aas et leurs codons sont peu corrélés avec les autres codons;
4. Les aas, C D E H L Q S T, sont peu corrélés avec les autres aas et leurs codons sont très corrélés avec les autres codons.

**111 bactéries: Caractérisation des aas** . Coefficients de corrélation codons / aas.
	A	C	D	E	F	G	H	I	K	L	M	N	P	Q	R	S	T	V	W	Y
aas
moy	61	20	51	26	59	62	40	65	64	13	35	62	60	32	56	31	46	58	38	55
>74−79	7−7	0	1−0	0	7−5	9−9	0	9−9	9−9	0	0	9−9	9−8	0	8−7	0	0	7−6	0	7−7
max		38	74	56			66			35	54			54		57	67		68

codons
moyt	242	111	135	120	131	191	126	171	119	300	19	116	238	130	222	344	242	244	43	126
t	57	58	66	-	64	40	60	63	-	39	-	59	63	-	18	63	64	63	-	66
c	67	53	69	-	68	69	66	64	-	60	-	58	54	-	67	55	66	63	-	60
a	59	-	-	58	-	56	-	44	63	51	-	-	60	63	22	64	63	58	-	-
g	59	-	-	62	-	27	-	-	57	62	19	-	61	66	49	58	48	60	43	-
t/a										61					53	62
c/g										27					13	43
>74−79t	62−30	8−5	65−48	25−10	56−40	40−30	44−25	50−24	28−12	47−23	0−0	27−18	51−22	50−33	33−18	75−29	76−33	65−18	0−0	48−28
t	7 −4	8−5	28−21	-	22−15	0-70	14 −6	23−13	-	0-69	-	13−10	21−11	-	0-70	16 −7	25 −10	19−11	-	31−20
c	33−17	0-72	37−27	-	34−25	33−28	30−19	26−11	-	9 −4	-	14 −8	1 −1	-	29−17	4 −76	30−17	24 −7	-	17 −8
a	13 −6	-	-	8 −4	-	6 −2	-	1 −76	20−11	0-69	-	-	12 −3	21−12	0-46	27−12	21 −6	10 −78	-	-
g	9 −3	-	-	17−6	-	1-75	-	-	8 −1	20 −6	0-55	-	17 −7	29−21	1 −75	8 −3	0-73	12 −77	0-72	-
t/a										18−13					2 −1	20 −7
c/g										0-52					0-43	0-65
Stop			max	suivant			max
		taa	80*	60		tag	48
		tga	80*	62		* taa/tga=	-80.2

I	Résumés
codons	>27	26-12	10-6	4-0		codons	>58	57-51	<49			aas	7-9	1	0		aas	>58	57-51	<49
74n	11	23	9	18		moyn	40	8	13			74n	10	1	9		moyn	8	3	9

II						+faibles	74n	%total	moyn	%total		+forts	74n	%total	moyn	%total
						gamme	<3		<33				>12/7		>54
						codons	17	28 %	6	10 %			34	56 %	45	74 %
						aas	10	50 %	5	25 %			10	50 %	10	50 %

III	A	C	D	E	F	G	H	I	K	L	M	N	P	Q	R	S	T	V	W	Y
aas
>74	7		1		7	9		9	9			9	9		8			7		7
moy	61	20	51	26	59	62	40	65	64	13	35	62	60	32	56	31	46	58	38	55
codons
74t	62	8	65	25	56	40	44	50	28	47	0	27	51	50	33	75	76	65	0	48
moyt	242	111	135	120	131	191	126	171	119	300	19	116	238	130	222	344	242	244	43	126

Repartition des fréquences de corrélation des aas et des codons[modifier | modifier le wikicode]

Lien Tableur: Repartition des fréquences de corrélation des aas et des codons
Les effectifs ou fréquence (fr) sont comptés à partir des matrices des coefficients de corrélation des aas et des codons. La matrice est formatée sans décimales et copiée dans 'writer'. L'effectif d'une corrélation donnée (exemple 3) est affiché (18) quand on exécute la recherche sur la matrice de cette corrélation avec l'option 'tout rechercher'.
Légende :

cor : corrélation
fr : fréquence

Les diagrammes: Repartition des corrélations codons et aas. Dans le même tableau de diagrammes: Fréquences des corrélations entre codons, Répartition des corrélations entre codons, Fréquences des corrélations entre aas, Répartition des corrélations entre aas
Fréquences des corrélations entre codons (multipliées par 100).
Fréquences des corrélations entre aas (multipliées par 100).

Tableaux triés des corrélations des aas et des codons entre eux[modifier | modifier le wikicode]

Tableau trié des corrélations des aas entre eux[modifier | modifier le wikicode]

Lien Tableur: Tableau trié des corrélations des aas entre eux
Image du tableau formaté:

Tableau trié des corrélations des codons entre eux[modifier | modifier le wikicode]

Lien Tableur: Tableau trié des corrélations des codons entre eux
Image du tableau formaté: Un tableau de cette taille formaté avec wikipédia serait très compliqué à faire. Aussi j'ai opté de prendre une image de ce tableau formaté sous le tableur calc de LibreOffice.

Construction: 3 lignes-colonnes sont ajoutées pour trier les codons. La L-C "ordre original" sert à retrouver l’ordre de la matrice des corrélations entre codons. Elle est numérotée de 1 à 64 de façon progressive sur cette matrice. Les 2 autres L-C "ordres optimisés" séparent les numéros des codons se terminant par "a,t" (en incluant agg, ttg et en excluant tga) des numéros des codons se terminant par "g,c" (en procédant de façon inverse pour agg, ttg et tga).
Tri sur les valeurs les plus élevées des corrélations: les numéros des 2 L-C sont obtenus par estimation de l'ordre des codons suivant le classement de leurs corrélations positives avec les autres codons. Le tableau final est optimisé pour avoir des groupes de codons fortement corrélés entre eux, les plus grands possibles. Voici ci-dessous les ordres estimés et optimisés obtenus, à recopier dans un tableur. Les codons ayant beaucoup de corrélations alternées, positives et négatives, ne sont pas inclus, c'est-à-dire atg, tag, ctg, agg. Les tris ne concernent alors que 2 carrés à corrélations positives de 29X29 codons.

Tableaux triés, connexions entre codons et aas[modifier | modifier le wikicode]

Lien Tableur: Tableaux triés, connexions entre codons et aas

Tableau trié des 10 aas fortement corrélés entre eux[modifier | modifier le wikicode]

Lien Tableur: Tableau trié des 10 aas fortement corrélés entre eux
Tableau non formaté
Tableau formaté (+ D)

	I	K	N	F	Y	G	A	P	V	R	D
I		92	93	83	82	-93	-89	-89	-90	-83	-72
K	92		86	80	84	-90	-88	-85	-83	-86	-72
N	93	86		81	81	-90	-81	-87	-90	-85	-60
F	83	80	81		71	-80	-70	-74	-80	-66	-74
Y	82	84	81	71		-84	-84	-80	-72	-80	-62
G	-93	-90	-90	-80	-84		90	88	82	86	65
A	-89	-88	-81	-70	-84	90		84	73	83	63
P	-89	-85	-87	-74	-80	88	84		80	89	51
V	-90	-83	-90	-80	-72	82	73	80		77	61
R	-83	-86	-85	-66	-80	86	83	89	77		43
D	-72	-72	-60	-74	-62	65	63	51	61	43

Distribution des fréquences entre ces 10 aas et le total

fréquences des corrélations en valeur absolue					
cor	aas10	aas	cor	aas10	aas
93	2	2	78	0	0
92	1	1	77	1	1
91	0	0	76	0	0
90	5	5	75	0	0
89	3	3	74	1	2
88	2	2	73	1	1
87	1	1	72	1	3
86	3	3	71	1	1
85	2	2	70	1	1
84	4	4	69	0	0
83	4	4	68	0	1
82	2	2	67	0	1
81	3	3	66	1	3
80	6	6	65	0	1
79	0	0	64	0	0

Tableaux triés de groupes de codons fortement corrélés entre eux[modifier | modifier le wikicode]

Lien Tableur: Tableaux triés de groupes de codons fortement corrélés entre eux
Uniquement les corrélations positives
Tableau formaté de 7 codons fortement corrélés se terminant par a,t.

		Y	F	N	L	K	I	S
	codon	tat	ttt	aat	tta	aaa	att	tca
Y	tat		91	92	90	91	86	81
F	ttt	91		91	85	93	87	79
N	aat	92	91		91	92	85	79
L	tta	90	85	91		84	85	81
K	aaa	91	93	92	84		83	78
I	att	86	87	85	85	83		82
S	tca	81	79	79	81	78	82

Tableau non formaté: voir tableur

Tableau formaté de 8 codons moyennement corrélés se terminant par a,t.

		D	V	Q	T	P	A	A	H
	codon	gat	gtt	caa	act	cct	gca	gct	cat
D	gat		85	83	81	83	81	81	87
V	gtt	85		71	82	81	83	84	69
Q	caa	83	71		80	71	66	72	81
T	act	81	82	80		77	74	82	69
P	cct	83	81	71	77		79	85	74
A	gca	81	83	66	74	79		75	69
A	gct	81	84	72	82	85	75		66
H	cat	87	69	81	69	74	69	66

Tableau non formaté: voir tableur

Tableau formaté de 12 codons fortement corrélés se terminant par g,c.

		V	Y	L	I	T	A	Q	R	H	G	F	D
	codon	gtc	tac	ctg	atc	acc	gcc	cag	cgc	cac	ggc	ttc	gac
V	gtc		64	62	77	78	84	71	80	78	83	82	87
Y	tac	64		66	66	73	68	76	67	92	70	82	84
L	ctg	62	66		75	88	76	90	77	76	83	74	78
I	atc	77	66	75		82	79	79	82	76	84	89	80
T	acc	78	73	88	82		89	86	81	84	86	81	87
A	gcc	84	68	76	79	89		78	87	79	88	83	87
Q	cag	71	76	90	79	86	78		82	83	85	83	84
R	cgc	80	67	77	82	81	87	82		80	96	85	87
H	cac	78	92	76	76	84	79	83	80		81	87	92
G	ggc	83	70	83	84	86	88	85	96	81		87	90
F	ttc	82	82	74	89	81	83	83	85	87	87		91
D	gac	87	84	78	80	87	87	84	87	92	90	91

Tableau non formaté: voir tableur

Les Corrélations faibles entre codons[modifier | modifier le wikicode]

Lien Tableur: Les Corrélations faibles entre codons
Légende: tga processus non GC pour ce codon; mcor corrélation moyenne du codon.

Les 2 groupes de corrélations faibles
	cta	ata	ctt	ggt	taa	ggg	tgg	agc	tga	cgg	acg	tgc	tcc
cta		41	41	43	37	-16	-29	-39	-45	-44	-46	-56	-57
ata	41		28	1	15	-20	-40	-35	-21	-38	-51	-38	-44
ctt	41	28		25	22	-11	-19	-9	-34	-40	-35	-22	-29
ggt	43	1	25		53	-39	-18	-28	-45	-55	-32	-49	-33
taa	37	15	22	53		-26	-38	-21	-80	-44	-40	-41	-45
ggg	-16	-20	-11	-39	-26		37	26	15	75	24	30	36
tgg	-29	-40	-19	-18	-38	37		33	43	50	44	34	52
agc	-39	-35	-9	-28	-21	26	33		23	29	31	62	39
tga	-45	-21	-34	-45	-80	15	43	23		44	42	37	44
cgg	-44	-38	-40	-55	-44	75	50	29	44		46	42	50
acg	-46	-51	-35	-32	-40	24	44	31	42	46		44	40
tgc	-56	-38	-22	-49	-41	30	34	62	37	42	44		65
tcc	-57	-44	-29	-33	-45	36	52	39	44	50	40	65

mcor	51.5	44.3	39.2	39.6	42.0	26.8	43.2	42.6	44.8	48.5	48.4	53.3	54.8

Tableau non formaté: voir tableur

Corrélations isolées, fortes et faibles entre codons[modifier | modifier le wikicode]

ccg	ccg	aga	aac	caa	tct
gcg	ggc	gga	cac	att	tgt
89	84	83	83	83	82
					
caa	tat	gag	ttt	gct	gct
tta	agt	cac	tgt	aat	aac
81	81	81	80	40	-50
					
tga	cgt	tga	cgt	cgg	ata
taa	atg	gtc	ggt	ggg	aga
-80	55	60	70	75	76

Corrélations entre bactéries et conformation des protéines[modifier | modifier le wikicode]

Conformation des protéines par le nombre d'aas et de codons[modifier | modifier le wikicode]

Légende:La conformation moyenne des 6 protéines étudiées peut être représentée par les moyennes des aas calculées dans le tableau des diagrammes des aas. Pour chaque bactérie j'ai fait le diagramme "moyenne de l'aa" /"effectif de son aa correspodant"; La conformation moyenne des 6 protéines pour cette bactérie peut être alors représentée par les 3 paramètres de la droite de tendance de ce diagramme. A savoir:

R2: coefficient de détermination de la droite (ici multiplié par 100)
a: la pente de la droite (ici notée ax).
b: la constante de la droite.

Les 3 paramètres sont reportés tels quels en fonction du contenu en GC (%GC) des bactéries dans les diagrammes des chapitres suivants.

La conformation des gènes des 6 protéines est étudiée de la même manière qu'avec les aas, mais ici je considère les 64 codons d'après le tableau des diagrammes des codons.
Dans le chapitre des exemples qui suit sont représentés 12 tableaux de ces diagrammes.

Conformation des protéines par le nombre d'aas[modifier | modifier le wikicode]

Lien Tableur: Conformation des protéines par le nombre d'aas
format1 : voir 1er diagramme
Voir la légende

Conformation des protéines par le nombre de codons[modifier | modifier le wikicode]

Lien Tableur: Conformation des protéines par le nombre de codons
format2 : voir 2ème diagramme.
Voir la légende
Ce diagramme est l'équivalent de celui des aas car il réunit tout les codons. Les 2 diagrammes sont cependant très différents par la grande variance de R2 avec les codons, somme de 2 variances opposées que sont celle des triplets bbc,g et celle des bbt,a, et une très faible variance de R2 avec les aas, nécessaire au maintient des fonctions de ces 6 protéines.

Conformation des protéines par le nombre de codons bbc,g[modifier | modifier le wikicode]

Lien Tableur: Conformation des protéines par le nombre de codons bbc,g
format3 : voir 3ème diagramme
Voir la légende

Conformation des protéines par le nombre de codons bbt,a[modifier | modifier le wikicode]

Lien Tableur: Conformation des protéines par le nombre de codons bbt,a
format4 : voir 4ème diagramme
Voir la légende

Conformation, récapitulatif[modifier | modifier le wikicode]

La colonne 3° R2 correspond au coefficient de détermination d'un polynôme de degré 3.

Paramètre	a	b	r2	a	b	r2	r'23	r23
Coefficient	pente			constante				R2
Diagramme
aas	0.003	0.86	391	-0.99	47.5	410	540	874
codons	0.005	0.76	279	-0.50	24.6	280	320	709
bbg,c	0.040	-0.91	907	-0.54	26.3	170	260	691
bba,t	-0.033	2.59	894	-0.62	30.8	250	420	665

Conformation des protéines, exemples[modifier | modifier le wikicode]

Conformation des protéines par le nombre d'aas[modifier | modifier le wikicode]

Lien Tableur: Conformation des protéines par le nombre d'aas
formate et formatf: Voir diagrammes 5 et 6
Voir la légende pour R2 a b.

moyen: moyenne de l'aa, voir la légende ci-dessus.
zero: colonne à valeurs nulles pour reporter les noms des aas.
hth: code KEGG de la bactérie

Conformation des protéines par le nombre de codons bbc,g[modifier | modifier le wikicode]

Lien Tableur: Conformation des protéines par le nombre de codons bbc,g
formata et formatb: Voir diagrammes 1 et 2
Voir la légende pour R2 a b.

moyen: moyenne du codon, voir la légende ci-dessus.
zero: colonne à valeurs nulles pour reporter les noms des codons.
eal: code KEGG de la bactérie

Conformation des protéines par le nombre de codons bbt,a[modifier | modifier le wikicode]

Lien Tableur: Conformation des protéines par le nombre de codons bbt,a
formatc et formatd: Voir diagrammes 3 et 4
Voir la légende pour R2 a b.

moyen: moyenne du codon, voir la légende ci-dessus.
zero: colonne à valeurs nulles pour reporter les noms des codons.
fnc: code KEGG de la bactérie

Fréquences des corrélations entre bactéries / codons[modifier | modifier le wikicode]

Lien Tableur: Fréquences des corrélations entre bactéries / codons
format5 et format6: voir diagrammes 1 et 2
Tableau construit à partir de la matrice des corrélations entre bactéries/codons ci-dessous.
Matrice des corrélations entre bactéries/codons: Les corrélations sont calculées entre 2 lignes du tableau des diagrammes des codons.

Fréquences des corrélations entre bactéries / aas[modifier | modifier le wikicode]

Lien Tableur: Fréquences des corrélations entre bactéries / aas
format7: voir diagramme 3.
Tableau construit à partir de la matrice des corrélations entre bactéries/aas ci-dessous.
Matrice des corrélations entre bactéries/aas: Les corrélations sont calculées entre 2 lignes du tableau des diagrammes des aas.

Les tRNAs[modifier | modifier le wikicode]

Nombres de tRNAs des 111 bactéries[modifier | modifier le wikicode]

Lien Tableur: Nombres de tRNAs des 111 bactéries
Base de données des tRNAs [1], gtRNAdb. Pour vin amo ssm opr age fbt cad sbw mcac j'ai utilisé la base de données KEGG [2]: fournir les 3 lettres du génome dans organism. Puis cliquer successivement sur Assembly, Genome et RefSeq. Ctrl+F: tRNA-Arg . . .
Légende:

colonne tRNA/8: les 8 aas à 4 et 6 codons ayant 1 seul codon avec tRNA pour le carré à 4 codons (ct pour L par exemple). Pour réduire la notation sont indiqués en 1er les aas à 4 codons suivis de ceux à 6 codons. S'il y a un seul aa avec plus d'un codon à tRNA, cet aa est noté avec le signe −.

−G *: R n'a aucun tRNa pour les 4 codons cg (ceci pour *) et G a plus d'un codon à tRNA. Donc APTV ont 1 seul codon à tRNA et SL en ont plus de 1 pour leur carré.
−G SR*: L n'a aucun tRNa pour les 4 codons ct (ceci pour *) et G a plus d'un codon à tRNA. Donc APTV et SR ont 1 seul codon à tRNA pour leur carré.
5 SRL, tRNA/8: Les 5 aas à 4 codons et SRL ont 1 seul codon à tRNA.

Colonne >2: les 8 aas à 4 et 6 codons ayant plus de 2 codons à tRNA pour le carré à 4 codons (ct pour L par exemple). Pour réduire la notation sont indiqués en 1er les aas à 4 codons suivis de ceux à 6 codons. S'il y a un seul aa avec 2 codons à tRNA, cet aa est noté avec le signe −.

8: APTVG et SRL ont plus de 2 codons à tRNA.
T S: T et S ont plus de 2 codons à tRNA.
−V −S: APTG et RL ont plus de 2 codons à tRNA.
GT* SL: GSL ont plus de 2 codons à tRNA et T en a 4 (pour *).

Colonne 2: Les aas KEQ à 2 codons peuvent avoir les 2 codons avec tRNA. Les codons tta et ttg de L ont dans la majorité des cas un tRNA chacun, de même pour aga et agg de R. Pour S le codon agt n’a pratiquement jamais de tRNA alors que agc en a toujours. Donc S sera absent dans cette colonne.

3RL: KEQ et RL ont 2 codons à tRNA.
KRL: ces 3 aas ont 2 codons à tRNA.
W C I : Les codons tgg et tga, tgt et tgc, ata ont chacun un tRNA.

Les tRNAs des 111 bactéries
KEGG	%GC	tRNA	tRNA/8	>2	2	KEGG	%GC	tRNA	tRNA/8	>2	2	KEGG	%GC	tRNA	tRNA/8	>2	2	KEGG	%GC	tRNA	tRNA/8	>2	2
zin	13.5	25	−G SR*	0	0	lat	36.3	44	P	T SL	KQR	ype	47.6	70	0	G L	KQRL	ret	61.3	50	0	GPTSL	3R
crp	16.6	28	−G *	0	0	bbd	36.8	39	V	0	RL	amo	48.0	48	0	8	3RLW	sus	61.9	51	0	8	3RL
hcr	22.5	28	5 SRL	0	L	liv	37.1	67	AP	T S	RL	pgi	48.3	53	V	GPT L	KQRL	saci	62.3	68	0	8	3RLC
mcac	23.7	30	−T SRL	0	KL	hmr	37.5	48	0	8	3RL	mah	48.7	45	0	T SL	RL	smk	62.7	57	0	-V −R	3RL
ssdc	24.2	34	AP	L	KRL	tde	37.9	44	0	APTSL	3RL	ssm	49.0	48	0	8	3RL	dvl	63.0	68	0	−R	KQRL
sbw	25.1	35	AP	L	KRL	spi	38.3	63	APV	0	KRL	eal	49.7	85	0	GPTSL	QRL	ddr	63.4	48	0	−R	KQRL
uur	25.5	30	−G SL	0	KL	vpr	38.6	48	APV	G S	KRL	lfc	50.0	52	0	8	3RL	tai	63.8	50	0	8	3RL
ple	26.2	33	AP	S	0	chp	39.1	38	0	T SL	RL	eco	50.8	87	0	GPTSL	QRL	gau	64.3	48	0	−R	3RL
smf	26.3	39	5 SRL	0	KL	spl	39.1	143	0	0	RL	sbz	51.3	86	0	GPTSL	QRL	xcb	65.0	55	0	−R	3RL
fnc	27.1	47	−G SL	0	KRL	tsu	39.2	48	0	−V−S	3RL	bvs	51.7	62	V	GPTSL	3RL	rru	65.5	55	0	−R	3RL
bfl	27.4	37	AP	T SL	KRL	nis	39.7	45	0	T	RL	sty	52.1	79	0	GPTSL	QRL	dpt	66.2	46	0	−G−R	KQRL
cbl	28.3	81	APV	G	3RL	cmn	40.3	37	0	TSL	L	tpas	52.8	45	0	−G	3RL	pae	66.6	63	0	GPTSL	RL
rip	28.5	33	AP	0	RL	nse	41.1	33	AP	0	RL I	apt	53.0	57	0	−R	KQL	roa	67.4	52	0	−R	3RL
rpr	29.0	33	P	T	0	cta	41.3	37	0	TSL	L	caa	53.6	46	0	GPTSL	KRL	bmv	68.2	56	0	−R	KR
pub	29.7	32	AP L	0	L	hhd	41.8	67	P	0	RL	cgq	54.2	58	0	−A−R	3RL	tos	68.6	52	0	−R	3RL I
cad	29.9	81	APV	0	LW	gva	42.0	45	0	−P−R	3RL	dal	54.5	56	0	−R	3RL	vin	68.9	49	0	8	3RL
cje	30.6	43	P	0	RL	cbd	42.4	42	0	GPTSL	KERL	eno	55.1	83	0	GT L	QRL	age	69.5	81	0	8	3RL
pmh	31.1	40	0	T S	RL	bae	43.2	75	P	0	RL	mcu	55.4	46	0	−R	3RL	opr	70.0	46	0	−R	3RL
tme	31.4	50	0	8	3RL	aae	43.5	44	0	GPTSL	KRL	din	56.1	37	0	P L	RL	mts	70.3	46	0	−R	3RL
sep	32.1	59	APV	0	L	bsu	43.5	54	P	L	RL	say	56.8	53	0	8	3RL	sma	70.7	71	0	−R	3RL
hhl	32.5	44	0	0	RL	hth	44.0	44	0	−R	KRL	bmf1	57.2	55	0	−R	3RL	amd	71.3	52	0	−R	3RL
cff	33.3	41	P	0	KERL	lpl	44.5	73	V	GT*SL	3RL	kpn	57.5	86	0	GPTSL	QRL	sho	72.0	73	0	−R	3RL
ial	33.9	45	0	−V	3RL	pdi	45.1	82	0	GPTSL	3RL	aba	58.4	46	0	8	3RL	sgr	72.2	67	0	−R	3RL
ljf	34.5	55	AV R	GT*SL	3RL	ppoy	45.5	109	0	T SL	KL	dba	58.7	64	0	8	3RL	cmi	72.7	45	0	−R	3RL
dte	34.9	43	0	TSL	RL	tma	46.3	46	0	8	3RL	synd	59.1	46	0	−R	RL	salb	73.3	66	0	−R	3RL
lla	35.3	63	APV	TSL	KRL	sbn	46.3	105	0	L	RL	pgd	59.6	60	0	−A−R	RL	ksk	74.2	78	0	−R	3RL
axl	35.7	55	P	0	L	fbt	46.5	47	V	L	RL	pac	60.0	45	0	−R	3RL	ade	74.9	49	0	8	3RL
thl	36.0	62	AV	GT SL	KRL	tli	47.1	48	0	8	3RL	bla	60.5	52	0	−R	3RL

Tableau non formaté: voir tableur
Récapitulatif

Nombre de bactéries (sur 111) ayant au moins un tRNA par codon
	0	1	2	3	4	0	1	2
aa
A	0	23	40	48
C						0	110	1
D						0	111	0
E						0	62	49
F						0	111	0
G	0	3	41	67
H						0	111	0
I						0	109	2
K						0	38	73
L	1	6	22	82		0	7	104
M						0	111	0
N						0	111	0
P	0	29	19	63
Q						0	51	60
R	1	5	87	18		0	16	95
S	0	6	29	76		0	111	0
T	0	6	25	78	2
V	0	20	46	46
W						0	109	2
Y						0	111	0

Tableau non formaté: voir tableur

Moyenne des codons t/c et a/g en %[modifier | modifier le wikicode]

Lien Tableur: Moyenne des codons t/c et a/g en %
Voir le tableau des moyennes.

Moyenne des codons 2*(t-c)/(t+c) et 2*(a-g)/(a+g) en %

ttt	123	tct	69	tat	116	tgt	27
c	125	c	66	c	107	c	31
a	120	a	50	a	3	a	2
g	81	g	58	g	1	g	71
ctt	97	cct	65	cat	59	cgt	103
c	104	c	61	c	70	c	132
a	30	a	58	a	89	a	20
g	180	g	101	g	132	g	44
att	168	act	68	aat	133	agt	38
c	181	c	121	c	128	c	55
a	84	a	65	a	247	a	60
g	154	g	71	g	202	g	24
gtt	132	gct	108	gat	217	ggt	142
c	118	c	164	c	202	c	169
a	84	a	91	a	296	a	88
g	137	g	126	g	226	g	54

ttt/c	-2	tct	4	tat	8	tgt	-15

tta/g	39		-15		103		-191

ctt/c	-7	cct	5	cat	-17	cgt	-25

cta/g	-144		-54		-39		-73

att/c	-7	act	-56	aat	4	agt	-35

ata/g	-59		-8		20		84

gtt/c	11	gct	-41	gat	7	ggt	-17

gta/g	-48		-32		27		49

Tableau non formaté: voir tableur

Moyenne des corrélations t/c et a/g en %[modifier | modifier le wikicode]

Lien Tableur: Moyenne des corrélations t/c et a/g en %
Voir le tableau des corrélations.

Moyenne des corrélations 2*(t-c)/(t+c) et 2*(a-g)/(a+g) en %

ttt	64	tct	63	tat	66	tgt	58
c	68	c	55	c	60	c	53
a	61	a	64	a	42	a	45
g	27	g	58	g	9	g	43
ctt	39	cct	63	cat	60	cgt	18
c	60	c	54	c	66	c	67
a	51	a	60	a	63	a	22
g	62	g	61	g	66	g	49
att	63	act	64	aat	59	agt	62
c	64	c	66	c	58	c	43
a	44	a	63	a	63	a	53
g	19	g	48	g	57	g	13
gtt	63	gct	57	gat	66	ggt	40
c	63	c	67	c	69	c	69
a	58	a	59	a	58	a	56
g	60	g	59	g	62	g	27

ttt/c	-6	tct	13	tat	10	tgt	8

tta/g	79		9		128		4

ctt/c	-42	cct	16	cat	-10	cgt	-114

cta/g	-18		-2		-5		-74

att/c	-1	act	-3	aat	2	agt	38

ata/g	78		26		10		119

gtt/c	0	gct	-16	gat	-5	ggt	-54

gta/g	-3		0		-6		70

Tableau non formaté: voir tableur

Les corrélations en ordre[modifier | modifier le wikicode]

Lien Tableur: Les corrélations en ordre
Voir pour l'affectation de l'ordre à un codon Tableau trié des corrélations des codons entre eux. C'est l'ordre optimisé.
Les nombres na pour ordre n du codon du groupe des codons se terminant par a ou t.
Les nombres ng pour ordre n du codon du groupe des codons se terminant par g ou c.

L'ordre des corrélations
ttt	2a	tct	17a	tat	1a	tgt	21a
c	2g	c	22g	c	11g	c	23g
a	4a	a	7a	a	29a	a*	26g
g*	30a	g	16g	g	31g	g	28g
ctt	27a	cct	12a	cat	15a	cgt	32a
c	17g	c	20g	c	4g	c	5g
a	25a	a	16a	a	10a	a	31a
g	10g	g	14g	g	6g	g	25g
att	6a	act	11a	aat	3a	agt	18a
c	9g	c	8g	c	13g	c	27g
a	26a	a	19a	a	5a	a	24a
g	30g	g	24g	g	19g	g*	33a
gtt	9a	gct	14a	gat	8a	ggt	28a
c	12g	c	7g	c	1g	c	3g
a	22a	a	13a	a	20a	a	23a
g	21g	g	15g	g	18g	g	29g

Comptes détaillés des tRNAs des 111 bactéries[modifier | modifier le wikicode]

Comptes détaillés[modifier | modifier le wikicode]

Lien Tableur: Comptes détaillés

Spectres des codons des tRNAs des 111 bactéries[modifier | modifier le wikicode]

Lien Tableur: Spectres des codons des tRNAs des 111 bactéries
Légende
Méthode: Voir en bas du tableau des décomptes détaillés.

Spectres des codons des tRNAs111
n tRNAs	ttc	tta	ttg	tcc	tca	tcg	tac	taa	tag	tgc	tga	tgg

0	0	3	4	6	0	34	0	−	−	2	78	1
1	80	94	104	95	91	73	82			93	33	101
2	22	9	2	9	16	3	18			13		8
3	8	3	1	1	2	1	8			1		1
4	1	1			2		2			2
5		1					0
autres							1

	ctc	cta	ctg	ccc	cca	ccg	cac	caa	cag	cgt	cga	cgg

0	12	1	28	33	0	44	2	0	50	11	76	21
1	89	97	66	72	93	65	91	83	47	67	34	88
2	10	11	9	4	12	1	18	18	14	19	1	2
3		1	2	2	5	1		6		4
4		0	6		1			3		8
5		1						1		0
autres										2

	atc	ata	atg	acc	aca	acg	aac	aaa	aag	agc	aga	agg

0	0		0	9	0	29	0	1	37	0	0	16
1	53		0	85	90	80	65	73	62	99	102	90
2	23		3	16	8	2	21	17	7	10	7	4
3	24		55	1	7		11	7	4	2	2	1
4	6		20		6		9	5	1
5	4		12				3	3
autres	1		21				2	5

	gtc	gta	gtg	gcc	gca	gcg	gac	gaa	gag	ggc	gga	ggg

0	20	0	65	24	0	62	0	0	61	3	0	44
1	72	73	39	66	53	49	50	63	40	51	86	65
2	12	13	6	20	18		35	21	4	27	14	1
3	7	13	1	1	24		16	12	5	19	8	1
4		6			8		8	8	1	8	2
5		4			5		1	2		1	1
autres		2			3		1	5		2

Spectre du codon atg des gènes tRNA des 111 bactéries[modifier | modifier le wikicode]

Lien Tableur: Spectre du codon atg des gènes tRNA des 111 bactéries
Légende: Décompte du 10.04.19 des 101 bactéries sur 111 de la liste des bactéries étudiées ici. Dix génomes n'ont pu être décomptés (génome, gènes atg): age 5 amo 3 cad 9 cbl 7 fbt 3 opr 3 salb 6 sbw 3 ssm 4 vin 3.
Méthode: Prendre le nom latin dans KEGG avec le code à 3 lettres de KEGG^[1].C'est seulement à l'affichage des tableaux VF5 de gtRNAdb^[2] que l'on peut avoir les effectifs de fMet et Met sous la forme de fMet/Met de la ligne Met, et ceux de Ile (anti codon cat) de la ligne Ile.
Bactéries sans Ile (anti codon cat) ni Ile (anti codon tat): sur les 9 bactéries sans Ile (anti codon cat) une a ile (anti codon tat), c'est nse. Les 8 autres se répartissent en 3 n'ayant qu'un gène Met (ssdc saci dpt) et 5 avec 2 gènes Met (ple rpr tme ial tma). Si on admet que les 5 derniers ont une erreur sur les 2 gènes Met et que ceux-ci sont en réalité Ile plus Met, alors il reste 3 génomes n’ayant pas du tout de gènes tRNA pouvant coder Ile. Est-ce que ce sont des symbiotes ou des erreus? Pourtant saci avec 62% GC et dpt avec 66% ne semblent pas être des symbiotes comme ssdc avec 24%. Voir le tableau détaillé des génomes.

Distribution des gènes de tRNAs du codon atg
occur.	fMet	Met	Ile
0	0	0	9
1	55	78	85
2	19	22	6
3	15	1	1
4	8
5	1
6	1
7	1
9	1
genèse	101	101	92
dup %	95	24	9

Comptes des solitaires des tRNAs des 111 bactéries[modifier | modifier le wikicode]

Lien Tableur: Comptes des solitaires des tRNAs des 111 bactéries
Légende:

			   Résultat	Formules
			nom	cellule		
4 codons Leu	ctx	0	ES12	SI(ET(DC12=0,DD12=0,DE12=0,DF12=0),1,0)	
			ctt	ET12	SI(ET(DC12>0,DD12=0,DE12=0,DF12=0),1,0)	
			ctc	EU12	SI(ET(DC12=0,DD12>0,DE12=0,DF12=0),1,0)	
			cta	EV12	SI(ET(DC12=0,DD12=0,DE12>0,DF12=0),1,0)	
			ctg	EW12	SI(ET(DC12=0,DD12=0,DE12=0,DF12>0),1,0)	
2 codons	ctt,ctc	ctt	EX12	SI(ET(DC12>0,DD12=0),1,0)	
			ctc	EY12	SI(ET(DC12=0,DD12>0),1,0)	
			11	EZ12	SI(ET(DC12=1,DD12=1),1,0)	
			01	FA12	SI(SOMME(EX12:EZ12)=0,1,0)	
3 codons Ser	tcx	0	GR12	SI(ET(DU12=0;DV12=0;DW12=0);1;0)
			tcc	GS12	SI(ET(DU12>0;DV12=0;DW12=0);1;0)
			tca	GT12	SI(ET(DU12=0;DV12>0;DW12=0);1;0)
			tcg	GU12	SI(ET(DU12=0;DV12=0;DW12>0);1;0)

La procédure utilisée ici pour 111 bactéries est la même que j'ai utilisée pour les 4032 bactéries de la base gtRNAdb: un tRNA est dit solitaire pour un carré donné (ctx), s'il ne contient qu'un seul type (ctt), les autres (ctc cta ctg) étant nuls. Pour les 4032 bactéries je cherchais les occurrences *ctt*, *ctt;ctt*, . . . .. Ici pour le nom ctt je teste la condition ctt>0 et (ctc=0 cta=0 ctg=0) pour une bactérie donnée. Ce qui donne dans calc pour la bactérie zin (ligne 12) les codonss "ctt ctc cta ctg" (colonnes DC12 DD12 DE12 DF12). La cellule DC12 correspond à la ligne zin et à la colonne ctt du tableau des décomptes détaillés ci-dessus.

4 codons: calculs pour les 4 codons non nuls d'un carré et 0 s'il n'y a aucun tRNA. Les 4 sont testés pour ctx cgx acx, et seulement 3 pour tcx ccx gtx gcx ggx.
2 codons: calculs sur 2 codons supposés lus par un seul tRNA. ctt,ctc,11,01: respectivement, seul le codon ctt ou ctc a plus d'un tRNA, ctt et ctc ont chacun 1 seul tRNA, autre combinaison. La colonne avec (*) correspond au cas où les 2 codons n'ont pas de tRNA parmi le décompte "autre combinaison". Ces tests sont faits pour ctt.c cta.g tta.g aga.g cgt.c cga.g act.c aca.g tca.g cca.g gca.g gta.g gga.g tga.g aaa.g caa.g gaa.g

Les xxt ne sont pas présentés sauf ctt cgt act, car ils n’ont pas de tRNA (voir tableau).

Donc il n’y a pas de résultat pour tct cct gtt gct ggt;

att,c ata atg Ile; tat,c taa,g Tyr stp;

ttt,c Phe; cat,c His; aat,c Asn; gat,c Asp; tgt,c Cys; agt,c Ser;

Il reste donc 39 colonnes à tester et les résultats peuvent se localiser en ES quand les colonnes à tester commencent en DC.

DC12 cellule ctt du tableau pour la bactérie zin

DD12 cellule ctc du tableau «

. . . .

EX12 cellule du résultat du test ctt pour 2 codons

EY12 cellule du résultat du test ctc pour 2 codons

EZ12 cellule du résultat du test 11 pour 2 codons

FA12 cellule du résultat du test 01 pour 2 codons

Les résultats présentés sont la somme des colonnes des noms

Leu 0

Leu ctt

. . . . . . . .

Comptes des solitaires des tRNAs des 111 bactéries
Leu	0	1		Arg	0	1		Glu	gaa	61	Thr	0	0	Gly	0	0
	ctt	0			cgt	4			gag	0		act	0		ggc	0
	ctc	0			cgc	1			11	28		acc	0		gga	3
	cta	6			cga	0			01	22		aca	6		ggg	0
	ctg	0			cgg	0		Trp	tga	0		acg	0		gga	44
	ctt	5			cgt	100			tgg	77		act	2		ggg	0
	ctc	99			cgc	10			11	29		acc	99		11	54
	11	0			11	0			01	5		11	1		01	13
	01	7	7*		01	1	1*	Val	0	0		01	9
	cta	27			cga	15			gtc	0		aca	29
	ctg	0			cgg	70			gta	20		acg	0
	11	63			11	18			gtg	0		11	72
	01	21	1*		01	8	6*		gta	65		01	10
	tta	4			aga	16			gtg	0	Ala	0	0
	ttg	3			agg	0			11	37		gcc	0
	11	87			11	85			01	9		gca	23
	01	17			01	10		Pro	0	0		gcg	0
Ser	0	0		Lys	aaa	37			ccc	0		gca	62
	tcc	0			aag	1			cca	29		gcg	0
	tca	6			11	47			ccg	0		11	30
	tcg	0			01	26			cca	44		01	19
	tca	34		Gln	caa	50			ccg	0
	tcg	0			cag	0			11	63
	11	68			11	41			01	4
	01	9			01	20

Tableau non formaté: voir tableur

Comptes détaillés des tRNAs des 111 bactéries: totaux[modifier | modifier le wikicode]

Lien Tableur: Comptes détaillés des tRNAs des 111 bactéries: totaux

I. 4032 bactéries: total
ttt	10	tct	5	tat	4	tgt	3
c	6105	c	4520	c	6420	c	4473
a	4749	a	5299	a	−	a	1315
g	3999	g	2622	g	−	g	4366
ctt	369	cct	10	cat	4	cgt	7478
c	3849	c	2742	c	4715	c	333
a	4940	a	5453	a	6388	a	887
g	5186	g	2183	g	2389	g	3355
att	5	act	103	aat	5	agt	1
c	9,203	c	4513	c	8,764	c	4422
a	55	a	5878	a	9,105	a	4804
g	18,026	g	2760	g	2427	g	3452
gtt	9	gct	2	gat	0	ggt	1
c	4430	c	4166	c	9,023	c	9,273
a	8,859	a	10,185	a	9,679	a	5515
g	1313	g	1224	g	1388	g	2266

II. 4032 bactéries : 100 * n / 3950
0.3	0.1	0.1	0.1
155	114	163	113
120	134	−	33
101	66	−	111
9.3	0.3	0.1	189
97	69	119	8.4
125	138	162	22
131	55	60	85
0.1	2.6	0.1	0.0
233	114	222	112
1.4	149	231	122
456	70	61	87
0.2	0.1	0.0	0.0
112	105	228	235
224	258	245	140
33	31	35	57

I'. 111 bactéries: total
ttt	0	tct	0	tat	0	tgt	1
ttc	152	tcc	116	tac	156	tgc	130
tta	130	tca	137	taa	0	tga	33
ttg	111	tcg	82	tag	0	tgg	120
ctt	6	cct	0	cat	0	cgt	162
ctc	109	ccc	86	cac	127	cgc	10
cta	127	cca	136	caa	154	cga	36
ctg	114	ccg	70	cag	75	cgg	92
att	0	act	6	aat	0	agt	0
atc	222	acc	120	aac	204	agc	125
ata	4	aca	151	aaa	201	aga	122
atg	462	acg	84	aag	92	agg	101
gtt	0	gct	0	gat	0	ggt	0
gtc	117	gcc	109	gac	211	ggc	213
gta	199	gca	237	gaa	221	gga	151
gtg	54	gcg	49	gag	67	ggg	70

II'. 111 bactéries : 100 * n / 111
0	0	0	0.9
137	105	141	117
117	123	0	30
100	74	0	108
5.4	0	0	146
98	77	114	9
114	123	139	32
103	63	68	83
0	5.4	0	0
200	108	184	113
3.6	136	181	110
416	76	83	91
0	0	0	0
105	98	190	192
179	214	199	136
49	44	60	63

Tableaux non formatés: voir tableur

Comptes détaillés des tRNAs des 111 bactéries: solitaires[modifier | modifier le wikicode]

Lien Tableur: Comptes détaillés des tRNAs des 111 bactéries: solitaires

II ₄₀₃₂. Nombre de bactéries à tRNAs solitaires de 4 codons. Total requête.
ttt	3948	tct	3945	tat	3934	tgt	3947
c	15	c	2	c	3930	c	12
a	0	a	85	a	−	a	0
g	2	g	0	g	−	g	17
ctt	3942	cct	3941	cat	3948	cgt	106*
c	7	c	3	c	5	c	1
a	98	a	1173	a	6	a	7
g	0	g	1	g	2	g	7
att	3949	act	3946	aat	3949	agt	3944
c	2	c	2	c	2	c	1
a	0	a	152	a	5	a	0
g	81	g	3	g	1	g	0
gtt	3943	gct	3934	gat	3949	ggt	3948
c	8	c	32	c	5	c	9
a	724	a	877	a	8	a	66
g	1	g	7	g	1	g	0

III ₄₀₃₂. Nombre de bactéries à tRNAs solitaires des codons a,g. Total requête.
tt	−	tc	−	ta	−	tg	−
sag	3933	sag	3943	sag	−	sag	3934
a	96	a	1493	a	−	a	15
g	190	g	22	g	−	g	2629
ct	−	cc	−	ca	−	cg	−
sag	3935	sag	3939	sag	3943	sag	3833
a	692	a	1813	a	2130	a	539
g	30	g	5	g	18	g	3026
at	−	ac	−	aa	−	ag	−
sag	3947	sag	3944	sag	3941	sag	3928
a	0	a	1288	a	1899	a	780
g	3947	g	13	g	9	g	10
gt	−	gc	−	ga	−	gg	−
sag	3935	sag	3902	sag	3928	sag	3939
a	2724	a	2721	a	2808	a	1699
g	2	g	11	g	5	g	11

II ₁₁₁. Nombre de bactéries à tRNAs solitaires des carrés à 4 codons.
ttt	111	tct	111	tat	111	tgt	110
c	0	c	0	c	0	c	0
a	0	a	6	a	−	a	−
g	0	g	0	g	−	g	1
ctt	111	cct	111	cat	111	cgt	4*
c	0	c	0	c	0	c	1
a	6	a	29	a	2	a	0
g	0	g	0	g	0	g	0
att	111	act	111	aat	111	agt	111
c	0	c	0	c	0	c	0
a	0	a	6	a	0	a	0
g	0	g	0	g	0	g	0
gtt	111	gct	111	gat	111	ggt	111
c	0	c	0	c	0	c	0
a	20	a	23	a	0	a	3
g	0	g	0	g	0	g	0

III ₁₁₁. Nombre de bactéries à tRNAs solitaires des codons a,g.
ttt	−	tct	111	cg	110	tgt	−
sag	111	sag	111	sct	110	sag	110
a	4	a	34	t	100	a	0
g	3	g	0	c	10	g	77
ctt	110	cct	111	cat	−	cgt	110
sag	110	sag	111	sag	111	sag	105
a	27	a	44	a	50	a	15
g	0	g	0	g	0	g	70
ctt	111	act	111	aat	−	agt	−
sct	104	sag	111	sag	111	sag	111
t	5	a	29	a	37	a	16
c	99	g	0	g	1	g	0
gtt	111	gct	111	gat	−	ggt	111
sag	111	sag	111	sag	111	sag	111
a	65	a	62	a	61	a	44
g	0	g	0	g	0	g	0

IV ₄₀₃₂. Pourcentage des bactéries à tRNAs solitaires.
	tt	tc	ta	tg
%4	−	2.2	−	−
1a1g	2804	2114	−	1238
%2	7	38	−	67
	ct	cc	ca	cg
%4	2.7	29.9	−	3.1
1a1g	962	1911	996	222
%2	18	46	54	93
	at	ac	aa	ag
%4	2.1	4.0	−	−
1a1g	0	2166	1155	2579
%2	100	33	48	20
	gt	gc	ga	gg
%4	18.6	23.3	−	1.9
1a1g	1051	562	602	1973
%2	69	70	72	43
	ct	cg	ac	−
%4	2.7	3.1	4.0	−
1t1c	8	10	41	−
%2	99	99	98	−

IV ₁₁₁. Pourcentage des bactéries à tRNAs solitaires.
	tt	tc	ta	tg
%4	−	5,4	−	−
1a1g	87	68	0	29
%2	6	31	100	70
	ct	cc	ca	cg
%4	5,5	26.1	−	4,5
1a1g	63	63	41	18
%2	25	40	45	81
	at	ac	aa	ag
%4	0	5,4	−	−
1a1g	0	72	47	85
%2	99	26	34	14
	gt	gc	ga	gg
%4	18.0	20.7	−	2,7
1a1g	37	30	28	54
%2	59	56	55	40
	ct	cg	ac	−
%4	−	−	−	−
1t1c	0	0	1	−
%2	100	100	91	−

Compléments

		Nombre de bactéries à tRNAs solitaires des codons c,t.							
4032	sct	t	c			111	sct	t	c
ac	3775	41	3682			ac	111	2	99
cg	3932	3614	307			cg	110	100	10
ct	3834	323	3502			ct	104	5	99

Tableaux non formatés:voir tableur

tRNAs des 111 bactéries: Diagramme des solitaires APV[modifier | modifier le wikicode]

Diagramme des solitaires APV .

	Effectifs des tRNAs solitaires APV							
%GC	A	P	V	T	G	L	R	S
15-20	2	2	2	2	0	0	1	1
20-25	3	3	2	1	2	2	2	2
25-30	10	11	5	3	1	4	1	3
30-35	2	3	2	0	0	0	1	0
35-40	5	6	5					
40-45	1	4	1					
45-50	0	0	2					
50-55	0	0	1					
55-60	0	0	0					
total	23	29	20	6	3	6	5	6

Diagrammes codons-GC-PDNA[modifier | modifier le wikicode]

Compilation PDNA[modifier | modifier le wikicode]

codons PDNA[modifier | modifier le wikicode]

aseca;a63551[modifier | modifier le wikicode]

aseca;a63551;a63552;a27140;a4213;a2211;a36314;a363141;a6412
− Lien Tableur: aseca;a63551

a64121[modifier | modifier le wikicode]

a64121
− Lien Tableur: a64121

a64122[modifier | modifier le wikicode]

a64122
− Lien Tableur: a64122

Total codons PDNA[modifier | modifier le wikicode]

Lien Tableur: Total codons PDNA
Total numérique: addition des 3 tableaux codons PDNA

acides aminés PDNA[modifier | modifier le wikicode]

Total acides aminés PDNA[modifier | modifier le wikicode]

Lien Tableur: Total acides aminés PDNA
Total numérique: addition des tableaux acides aminés PDNA

Tableau des diagrammes des codons PDNA[modifier | modifier le wikicode]

Lien Tableur: Tableau des diagrammes des codons PDNA
codons des PDNA rapportés à 6 555, moyenne du total des aas des DRNA par bactérie. La moyenne correspondante des PDNA 6 391 est donnée pour indication.

Maximum et 75% PDNA[modifier | modifier le wikicode]

Constantes des courbes PDNA[modifier | modifier le wikicode]

Lien Tableur: Constantes des courbes PDNA

abscisse du maximum PDNA[modifier | modifier le wikicode]

Lien Tableur: abscisse du maximum PDNA

maximum PDNA[modifier | modifier le wikicode]

Lien Tableur: maximum PDNA

Diagrammes codons-GC-DRNA-39[modifier | modifier le wikicode]

Compilation DRNA-39[modifier | modifier le wikicode]

codons DRNA-39[modifier | modifier le wikicode]

Lien Tableur: codons DRNA-39
39 bactéries 6 protéines

acides aminés DRNA-39[modifier | modifier le wikicode]

Lien Tableur: acides aminés DRNA-39
39 bactéries 6 protéines

Contenu en GC des génomes DRNA-39[modifier | modifier le wikicode]

Lien Tableur: Contenu en GC des génomes DRNA-39

Tableau des diagrammes des codons DRNA-39[modifier | modifier le wikicode]

Lien Tableur: Tableau des diagrammes des codons DRNA-39
Codons des DRNA rapportés à leur moyenne 6 555.4.

Maximum et 75% DRNA-39[modifier | modifier le wikicode]

Constantes des courbes DRNA-39[modifier | modifier le wikicode]

Lien Tableur: Constantes des courbes DRNA-39

abscisse du maximum DRNA-39[modifier | modifier le wikicode]

Lien Tableur: abscisse du maximum DRNA-39

maximum DRNA-39[modifier | modifier le wikicode]

Lien Tableur: maximum DRNA-39

Différences entre DRNA-39 et PDNA-39[modifier | modifier le wikicode]

Différence en % par rapport à DRNA-39[modifier | modifier le wikicode]

Lien Tableur: Différence en % par rapport à DRNA-39
sans les effectifs faibles:

Corrélation entre les différences “dna-prot” de 2 codons[modifier | modifier le wikicode]

Corrélation entre les différences[modifier | modifier le wikicode]

Lien Tableur: Corrélation entre les différences
Corrélation entre les différences “dna-prot” (%) de 2 codons ayant les 2 1ères bases en commun. Données pour manipulation. Voir le tableau formaté dans l'article

Tableau des diagrammes x.y[modifier | modifier le wikicode]

Lien Tableur: Tableau des diagrammes x.y
Tableau des diagrammes x.y en fonction des 2 1ères bases. A copier dans un tableur.

Différences entre codons dues à la séquence des gènes[modifier | modifier le wikicode]

Les protéines, notamment les tRNA synthases et les protéines de maintenance de l'ADN, différencient les codons. Ainsi il existe plusieurs tRNA pour Gly et la maintenance de l'ADN est à l'origine de la différence en contenu GC et différencie entre la paire GC et la paire AT. L'objet de ce chapitre est d'éliminer l'influence des protéines en comparant dans le même génome la différence entre 2 codons dans le lot des gènes prot et le lot dna. Si la différence est statistiquement significative entre les 2 lots, alors il n'y a que la séquence des gènes qui peut en être la cause.
Construction du tableau de comparaison. Légende:

DE at :comparaison entre gaa et gat
%GC :contenu en GC du génome
KEGG :code de la bactérie
Différences.prot: 200*((prot.gaa − prot.gat) / (prot.gaa + prot.gat)).
Différences.DNA : 200*((DNA.gaa − DNA.gat) / (DNA.gaa + DNA.gat))
dif :Différences.prot − Différences.DNA
Eprot :200*RACINE(1 / (prot.gaa + prot.gat) )
Edna :200*RACINE(1 / (DNA.gaa + DNA.gat) )
ecart :SI (dif < 0,(−dif − (Eprot + Edna)), (dif − (Eprot + Edna)))
ok :SI (ecart <0,0,1), différence statiquement significative.
gaa :effectif du codon gaa d’après le résultat direct (nombre entier). voir la compilation totale des codons pour prot dans total numérique et pour dna dans compilations des codons.
gat :effectif du codon gat d’après le résultat direct (nombre entier). idem
(*) :bactérie éliminée pour les diagrammes: Eprot ou Edna supérieur à 21.

Exemple:

DE at		Différences						prot		DNA		
%GC	KEGG	prot	DNA	dif	Eprot	Edna	ecart	ok	gaa	gat	gaa	gat	
74.9	ade	-169	-125	-44	55	50	-61	0	1	12	3	13   *
71.3	amd	149	135	14	21	19	-25	0	83	12	93	18	
53.0	apt	42	33	9	8	8	-7	0	374	244	412	295	
43.2	bae	66	52	14	8	8	-2	0	405	203	404	237	
60.5	bla	20	-10	30	11	12	7	1	180	148	136	151	
68.1	bmv	60	69	-9	12	11	-14	0	171	92	220	107	
43.5	bsu	58	48	10	8	8	-6	0	397	219	404	248	
42.4	cbd	50	30	20	8	8	4	1	404	242	396	292	
28.3	cbl	40	35	5	7	7	-9	0	435	289	507	356	
33.3	cff	-5	-22	18	8	8	2	1	298	312	310	388	
54.1	cgq	70	0	69	10	10	49	1	250	121	217	216	
30.5	cje	33	28	4	7	7	-10	0	427	307	491	369	
63.0	dvl	125	122	4	14	11	-21	0	174	40	275	67	
49.7	eal	63	58	5	9	8	-12	0	362	189	370	204	
50.8	eco	73	61	13	9	8	-4	0	374	173	373	199	
55.1	eno	68	53	16	9	9	-2	0	314	154	326	190	
57.5	kpn	50	47	3	9	9	-15	0	284	170	311	193	
36.3	lat	11	-10	20	8	7	5	1	323	290	343	378	
37.1	liv	53	64	-11	7	7	-4	0	486	282	483	249	
35.3	lla	66	54	11	7	7	-3	0	481	243	475	272	
60.0	pac	-21	-59	38	14	13	12	1	95	117	89	163	
66.6	pae	126	87	39	13	12	14	1	197	45	193	76	
59.6	pgd	29	18	11	10	9	-9	0	241	180	249	207	
31.1	pmh	29	-1	30	8	7	15	1	398	297	360	364	
45.5	ppoy	50	3	46	8	9	29	1	356	214	264	255	
61.3	ret	84	41	42	10	10	23	1	280	115	258	170	
67.4	roa	101	57	45	16	16	12	1	116	38	95	53	
65.4	rru	25	-4	29	10	11	8	1	207	161	174	181	
73.3	salb	172	120	52	30	52	-30	0	40	3	12	3     *
56.8	say	77	43	33	10	10	14	1	276	123	259	167	
51.3	sbz	51	39	12	9	8	-5	0	336	200	336	227	
32.1	sep	33	34	-1	7	7	-13	0	464	333	439	312	
72.2	sgr	120	103	17	32	33	-47	0	32	8	28	9     *
70.7	sma	102	118	-16	27	32	-43	0	40	13	31	8     *
62.7	smk	86	36	50	11	11	28	1	230	92	201	140	
52.1	sty	50	47	3	9	8	-15	0	332	200	349	216	
59.1	synd	41	-2	42	11	11	21	1	210	139	179	182	
65.0	xcb	66	70	-5	10	11	-16	0	255	129	229	110	
47.6	ype	24	14	10	8	8	-7	0	322	252	326	282	
								15					
								total ok