Recherche:Les clusters de gènes tRNA et rRNA chez les procaryotes/Fiche/Synthèse par clade

Une page de Wikiversité, la communauté pédagogique libre.
Fiche mémoire sur Synthèse par clade
En raison de limitations techniques, la typographie souhaitable du titre, « Fiche : Synthèse par clade
Les clusters de gènes tRNA et rRNA chez les procaryotes/Fiche/Synthèse par clade
 », n'a pu être restituée correctement ci-dessus.


Synthèse bactéries[modifier | modifier le wikicode]

Type 16s-y-23s5s[modifier | modifier le wikicode]

Type y cumuls[modifier | modifier le wikicode]

  • Lien tableur: Type y cumuls
  • Légende: M.aas, moyenne et variance des tRNAs par génome, avec ou sans rRNA.
Sb1. Synthèse type 16s-y-23s5s
M.aas avec M.aas sans génomes blocs clade lien 16s23s5s 16s23s,5s 16s,23s5s cds atcgca gcaatc gca atc atcgca-cds gcaatc-cds gca-cds cds-gca-atc-gta-cds atc-gaa atc-gcc gca-cca gaa gcc-gaa gaa-cds gaa-aaa-gta gaa-aaa-gca-gta gaa-aaa-gta-cds gcc atgf
14 ± 19 50 ± 16 11 66 a-firmicutes autres 43 15 3 5
21 ± 23 48 ± 19 43 264 clostridia C4.cumuls 160 5 24 23 26 12 3 1 8 2
59 ± 28 29 ± 19 32 288 bacilli Bx3 228 44 15 1
8 ± 5 46 ± 8 70 203 alpha alpha 2 8 138 17 4 2 31 1
8 ± 4 54 ± 11 44 164 beta beta 2 3 127 32
10 ± 6 58 ± 20 144 733 gamma gamma 79 349 15 4 1 7 3 1 4 254 1 3 6 2 3 1
5 ± 3 58 ± 12 19 64 delta delta 18 42 1 3
5 ± 3 40 ± 3 40 110 epsilon epsilon 11 1 41 30 18 9
0 ± 0 54 ± 10 99 354 actinobacteria actino 330 24
8 ± 5 54 ± 17 29 122 bacteroides bactero 18 102 2
5 ± 7 28 ± 6 20 32 tenericutes tener 18 5 1 8
2 ± 1 48 ± 3 7 15 deinococcus deino 2 13
2 ± 0 48 ± 2 8 15 chloroflexi chlor 8 3 4
2 ± 1 37 ± 6 13 16 spirochaetes spiro 2 2 7 5
4 ± 2 49 ± 14 31 78 cyanobacteria cyano 17 47 13 1
1 ± 1 37 ± 1 12 17 chlamydiae chlam 15 2
2 ± 1 46 ± 2 10 32 thermotogae toga 18 5 1 8
3 ± 1 49 ± 3 5 6 acidobacteria autre 6
4 ± 2 46 ± 17 8 15 aquificae autre 2 13
4 ± 1 38 ± 1 3 6 deferribacteres autre 6
6 ± 4 48 ± 19 3 16 fusobacteria autre 11 5
3 6 nitrospirae autre 1 5
4 15 planctomycetes autre 12 3
3 8 synergistetes autre 6 2
4 9 verrucomicrobia autre 8 1
13 20 total11 tot11 5 13 2
678 2674 total type 995 10 34 33 991 96 76 71 68 3 7 2 3 1 4 254 1 3 6 2 3 9 2
% type 373 3,7 13 12 371 36 28 27 25 0,7 2,6 0,7 1,1 0,4 1,5 95 0,4 1,1 2,2 0,7 1,1 3,4 0,7
% groupe 401 494 101
groupe 16s atc,gca gaa
type 16s23s5s 16s23s,5s 16s,23s5s cds atcgca gcaatc gca atc atcgca-cds gcaatc-cds gca-cds cds-gca-atc-gta-cds atc-gaa atc-gcc gca-cca gaa gcc-gaa gaa-cds gaa-aaa-gta gaa-aaa-gca-gta gaa-aaa-gta-cds gcc atgf

Type y par tRNA[modifier | modifier le wikicode]

  • Lien tableur: Type y par tRNA
  • Légende: tri sur %16s, 16s23s5s. Jaune comme les protéobacteria, moins de 28% 16s, cyan comme les firmicutes plus de 53% de 16s.
    - total11, 11 clades mineurs, voir la liste
  • Note: Le taux des jaunes ne contiennent pas les gamma
totaux	clades	génomes	blocs		
	36	678	2674		
					
tRNA	cumul	%	clades	génomes	notes
gca	1249	316	31		
atc	1235	312	31		
16s	1039	263	27		
gaa	272	69	1	68	sur 144 génomes gamma
cds	121	31	11		
gta	13	3	2	6	4 gamma + 2 total11
gcc	11	3	2	6	3 gamma 3 clostridia
aaa	11	3	1	4	gamma
cca	4	1	1	2	gamma
atgf	2	1	1	1	clostridia
total	3957	10*			* 1 % des tRNAs rares
Y Les types y
Y.1 Les types y , effectifs
blocs clade total 16s total gca,atc total gaa %16s %tgca %tgaa gca atc 16s cds gaa rares
6 acidobacteria 0 6 0 100 6 6 0
6 deferribacteres 0 6 0 100 6 6 0
9 verrucomicrobia 0 9 0 100 9 9 0 1
164 beta 5 159 3 97 155 155 2 35
203 alpha 10 193 5 95 191 189 10 32
733 gamma 79 376 273 11 51 37 378 373 79 14 272 29
110 epsilon 12 98 11 89 89 80 11 1
16 spirochaetes 2 14 13 88 9 7 2
15 aquificae 2 13 13 87 13 13 2
122 bacteroides 18 104 15 85 102 104 18
6 nitrospirae 1 5 17 83 5 5 1
78 cyanobacteria 17 61 22 78 48 61 17 1
20 total11 5 15 25 75 15 15 5 4 2
64 delta 18 46 28 72 43 45 18
15 chloroflexi 8 7 53 47 3 7 8
264 clostridia 165 99 63 38 75 63 160 9 10
66 a-firmicutes 43 23 65 35 23 18 43
16 fusobacteria 11 5 69 31 5 5 11
32 tenericutes 23 9 72 28 1 9 23
32 thermotogae 23 9 72 28 1 9 23
8 synergistetes 6 2 75 25 2 2 6
288 bacilli 228 60 79 21 59 45 228
15 planctomycetes 12 3 80 20 3 3 12
17 chlamydiae 15 2 88 12 2 2 15
15 deinococcus 15 0 100 0
354 actinobacteria 354 0 100 0
Y.2 Les types y , taux
Pour 1000 blocs Pour 1000 tRNAs
blocs clade gca atc 16s cds gaa rares total gca atc 16s cds gaa
164 beta 945 945 12 213 2116 447 447 6 101
203 alpha 941 931 49 158 2079 453 448 24 76
733 gamma 516 509 108 19 371 40 1562 330 326 69 12 238
110 epsilon 809 727 100 9 1645 492 442 61 6
16 spirochaetes 563 438 125 1125
15 aquificae 867 867 133 1867
122 bacteroides 836 852 148 1836 455 464 80
6 nitrospirae 833 833 167 1833
78 cyanobacteria 615 782 218 13 1628 378 480 134 8
64 delta 672 703 281 1656 406 425 170
total 7081 7079 1233 393 15786 449 448 78 25
15 chloroflexi 200 467 533 1200 167 389 444
264 clostridia 284 239 606 34 38 1201 237 199 505 28
66 a-firmicutes 348 273 652 1273 274 214 512
16 fusobacteria 313 313 688 1313
32 tenericutes 31 281 719 1031
32 thermotogae 31 281 719 1031
8 synergistetes 250 250 750 1250
288 bacilli 205 156 792 1153 178 136 687
15 planctomycetes 200 200 800 1200
17 chlamydiae 118 118 882 1118
total 1980 2577 7140 34 38 11769 168 219 607 3

Type y synthèse[modifier | modifier le wikicode]

  • gca atc gaa: 2 aas remarquables atc gca pour tout clade sauf deino et actinobactéria qui n'en contiennent pas du tout. Puis pour les gamma 1 aa en plus, remarquable, gaa.
  • Les cds: beta + alpha 68 pour 367 blocs et gamma 14 pour 733 blocs soit 10 fois moins. Les actino en ont autant que alpha beta, 24 pour 354 blocs. Les clostridia en ont autant que les gamma, 9 pour 264 blocs. Ils sont très rares chez les autres clades. La véracité des cds
  • Les blocs 16s23s5s cassés, 16s,y23s5s: chez les archées ils sont courants et y peut être gca. Il en existe quelques rares cas chez la plupart des clades bactériens accompagnés par une majorité de blocs entiers. Cependant certains génomes n'ont que des blocs cassés. Ainsi Deino en a 13 sur 15 où les blocs sont de la forme 16s, 23s5s-ggc. Il y en a 8 chez les alpha et 11 chez les epsilon tous les deux sous la forme 16s,23s5s.
  • Les blocs cassés 16s23s,5s: comme pour les précédents. Ils sont plus rares, 5 pour les tener et 5 pour les toga.
  • Les clades bactériens sont regroupés nettement en 3 groupes, le 1er avec moins de 28% de blocs 16s23s5s et 72% de 16s-y-23s5s contient les protéobactéria, le 2ème avec un taux de 16s compris entre 53 et 80 %16s et contient les firmicutes, le 3ème sans type y est représenté par les actino avec un effectif élevé de 354 blocs, il est accompagné par les deino avec un effectif de 15 seulement.
  • Les tRNAs y rares:
    - gcc tout seul, proche de gca, 8 chez les clostridia et 1 chez les gamma. Il accompagne gaa et atc chez les gamma, au total dans 11 blocs.
    - aaa gta accompagnent gaa chez les gamma dans 11 blocs, gaa-aaa-gta ou gaa-aaa-gca-gta.
  • Les blocs propres aux firmicutes 16s5s-y-23s: bacilli clostridia
    - 16s5s-y-23s avec y absent on a 16s5s23s. Il y en a 6 chez les bacilli sur 288 blocs, 23 chez les clostridia sur 264 blocs et rien dans les a.firmicutes (autres) sur 66 blocs.
    - bacilli: 4 atcgca et 2 16s dont 5 ont un z long et 1 court. En jaune dans le tableau.
    - clostridia: les 23 concentrent 7 des 10 tRNAs rares et le seul long 15aas-16s5s-atcgca-23s des clostridia.
    - Ces blocs se comportent exactement comme les blocs 16s-y-23s5s chez les firmicutes:
    + dans la répartition des types y. Voir le type y
    + dans la répartition des z z' x avec une majorité de z z' x (1-3 ) pour les clostridia et une majorité de z4-23 chez les bacilli. Voir tableau des longueurs
16s5s23s clostridia et bacilli
z / y 16s atc,gca gcc atgf z’
sans 4 1 2 2 3
1-3 1+1 5 1
4-8 2 1 2
9-23 1 2 1
7 10 4 2 6
x / y 16s atc,gca gcc atgf x
1-3 3 1 1 5
4-8
9-23 1 1
3 2 1 0 6

Type 16s23s5s-z[modifier | modifier le wikicode]

  • Note: Les types z' des types x-16s23s5s-z' sont ici incorporés dans les décomptes.

Les 3 longueurs du type z[modifier | modifier le wikicode]

Sb2. Longueurs du type 16s23s5s-z
clade sans 1-3 >3 total % z
gamma 507 218 0 725 30
alpha 47 145 0 192 76
proteo-autres 320 23 0 343 7
28 clades 727 43 5 775 6
bacilli 142 35 111 288 51
clostridia 119 94 39 252 53
negativ 48 12 6 66 27

Les type z 1-3[modifier | modifier le wikicode]

Les types 1-3 majoritaires[modifier | modifier le wikicode]
  • Lien tableur: Les types 1-3 majoritaires
  • Légende
    - Colonne 23 clades, regroupe les clades à très faible effectif des 1-3. Ce sont delta (5), 4 clades de Les autres bactéries (1 pour chlam) et les 18 autres clades de autres sans fuso (5). L'effectif de ces 23 clades est de 11, en bas de la 2ème colonne Type.
Z13.1 Les types 1-3 majoritaires
type blocs %1-3 geno     Type blocs geno     23 clades blocs geno
gamma 725 144 beta 164 44 5 clades
gac-tgg 66 30 62 tac-gga-acc 10 10 delta 61 19
gac 80 37 52 5s 1 chlamydae 17 12
acc- 5s 46 21 46 cyano 75 31
reste 26 12 deino 15 7 spiro 21 13
total 1-3 218 100 ggc 11 6 toga 20 10
18 clades
alpha 192 70 chloro 15 8 Acidobacteria 6 5
atgf 139 96 48 atgf 6 3 Aquificae 15 8
reste 6 4 Armatimonadetes 1 1
total 1-3 145 100 fuso 16 3 Caldiserica 1 1
aac 5 3 Chrysiogenetes 3 1
bacilli 288 32 reste 3 Deferribacteres 6 3
atgf-gac 19 54 19 Dictyoglomi 2 1
aac-acc 7 20 7 tener 32 20 Elusimicrobia 1 1
reste 9 26 aac 3 3 Fibrobacteres 3 1
total 1-3 35 100 reste 5 Gemmatimonadetes 1 1
Ignavibacteriae 1 1
clostridia 252 43 actino 353 99 Nitrospirae 5 3
aac 19 20 16 tcc 2 2 Planctomycetes 11 4
aaa 12 13 7 Synergistetes 8 3
atgi-gca 10 11 8 bacteroi 122 29 Thermobaculum 2 1
ttc 10 11 7 cca,tca 2 Thermodesulfobacteria 3 2
reste 43 46 Verrucomicrobia 9 4
total 1-3 94 100 epsilon 111 40 Candidatus Saccharibacteria 2 2
divers 7 274 128
a.firmicutes 66 11
aac 5 42 2 23 clades 274 128
reste 7 58 divers 11
total 1-3 12 100
Les types z taux des 1-3[modifier | modifier le wikicode]
  • Lien tableur: Les types z taux des 1-3
  • Légende: du tableau
    - deino*, les blocs sont cassés 16s,23s5s-ggc
    - chlam*, les 5 tRNA sont sur le brin opposé du bloc.
    - tener* 11aas voir la séquence
    - Ligne 16 clades, regroupe les clades à très faible effectif des x+z. Ce sont les 19 clades des autres sans fuso aquifecae planctomycetes.
  • Note: clostridia, LOI.BINOMIALE(L641;254;0,0025;0)
  • Les z de 4 de long: Voir ci-dessous le tableau des fréquences. Pour clostridia le cds étant considéré comme un intercalaire son bloc est compté comme un 1-3 et donc on a 3 fois 1-3 et 2 fois 4-8, c'est à dire 5 z de longueur 4.
clostridia 1-3	2 * 16s23s5s-ttc-5s-ttc-aaa		clostridia 4-8	2 * 16s23s5s-caa-gaa-tac-ggc
		    16-gca-atc-235-aac-5s-ttc-tgc	bacilli  4-8	    16-gca-235-gta-gga-atc-gaa
		    16s23s5s-aaa-cds-5s-aaa				
gamma 1-3	    16s23s5s-acc-5s-acc-5s				
  • Les cds des 1-3 en x et z: sont considérés comme des intercalaires pour faire ressortir les tRNAs. Au total 13 blocs:
    - 9 blocs ont le cds après 23s
    - 3 blocs firmicutes ont le cds après le 5s
    - 1 bloc clostridia a le cds avant le 16s
gamma			16gaa23-cds-5s-5s 		
alpha			16atcgca-*-23-cds-5s-atgf   5
clostridia		16s-cds-16s°-23s-cds-5s		
			16s23s5s-aaa-cds-5s-aaa		
			ttc-cds-16s5s-atc-23s-aac-atgf		
a.firmicutes		16s23s5s-cds-tgc-tta		
			16s23s5s-cds-tac-caa		
T.desulfobacteria	16atcgca23-cds-5s	   2
  • Les types majoritaires en fréquence, voir ci-dessous les 2 tableaux des fréquences: Le rouge, un seul type. L'orange 1 seul type à plus de 70% ou bien partagé par 2 ou 3 types.
		type		n	total	%
alpha		atgf		144	145	99
gamma avant	cgg-cac-cca	10	10	
gamma 1		gac		80	101	80
gamma 2		gac-tgg		66		
		acc-5s		46		
				112	115	97
bacilli après	atgf-gac	19	
		aac-acc		7	
				26	28	93
bacilli avant	cgt-gga		4	5	80
clostridia 2	atgi-gca	10	28	36
clostridia 1	aac		19		
		aaa		12		
		ttc		10		
				41	56	73
beta		tac-gga-acc	10	10	
tener* après	11aas		5	5	
tener avant	tac		5	5	
deino*		ggc		11	11	
chloro		atgf		6	6	
chlam* avant	cac		5	5	
Z13.2 Les types z taux et fréquences des 1-3
Z13.21 taux des 1-3, après
clade total 1-3 1-3% x+z x+z%
alpha 192 145 76 145 76
gamma 725 218 30 240 33
bacilli 288 35 12 164 57
clostridia 252 94 37 108 43
a.firm 66 12 18 18 27
beta 164 11 7 14 9
epsilon 111 7 6 11 10
delta 61 5 8 6 10
tenericutes 32 8 20
deino 15 11 11
chloro 15 6 6
fuso 16 8 8
chlam 17 1 6
aquificae 15 1 4
110 35 32 55 50
actino 353 2 0,6 2 0,6
bacteroides 122 2 1,6 4 3,3
cyano 75
spiro 21
toga 20
planctomycetes 11
602 4 0,7 6 1,0
16 clades 54 3 6 5 9
total 2625 569 22 772 29
Z13.22 fréquence des 1-3, après
clade  0  1  2  3  4 >4
alpha 47 145
gamma 507 101 115 1 1
bacilli 142 6 28 1 1 110
clostridia 120 56 28 6 5 37
a.firm 47 5 3 4 6
beta 153 1 10
epsilon 104 7
delta 57 3 1
tenericutes* 19 3 3 2 5
deino* 4 11
chloro 9 6
fuso 8 6 2
chlam 16 1
aquificae 14 1
actino 351 2
bacteroides 120 2
cyano 75
spiro 21
toga 20
planctomycetes 11
16 clades 51 3
total 1896 359 180 24 7 158
Z13.23 fréquence des 1-3, avant
clade  1  2  3  >4
alpha
gamma 9 3 10
bacilli 1 5 12
clostridia 5 6 1 2
a.firm
beta 3
epsilon 1 1 1 1
delta 1
tenericutes 5 1 1
deino
chloro
fuso
chlam* 5
aquificae 2 1
actino
bacteroides 2
cyano
spiro
toga
planctomycetes
16 clades 1 1
total 35 16 14 16
Les types z 1-3 synthèse[modifier | modifier le wikicode]
  • Les z de longueur 1-3 sont en nette rupture avec les z de longueur 4, tableau z13-22. Les z de longueur 4 sont très peu nombreux, 7 sur 2625. Et quand on les compte dans les 1-3 ils contiennent un 5s. Ceux comptés dans les 4-8 s'apparentent aux autres de longueur supérieure à 4 et on en dénombre alors que 3 sur 2625 blocs.
  • Les z' des blocs avant 16s x-16s23s5s-z' ont des types apparentés aux blocs sans x, voir analyse des clostridia et les z' des x des bacilli (atgf).
  • Les 1-3 se répartissent en clades ayant beaucoup et en clades sans ou avec très peu, tableau sb2 et z13-21.
    - Chez les proteobacteria les alpha se distinguent des gamma par leurs taux de 1-3, 76% contre 30% pour les gamma.
    - Les firmicutes ont un taux de z de 50% mais le rapport 1-3 sur >3 s'inverse entre bacilli et clostrida, respectivement 35/111 et 94/39.
    - Les actino ont la particularité d'avoir 2 z de type 1-3 sur 354 et un seul type y, le 16s23s5s.
    - On peut distinguer donc 3 groupes par leurs taux de z (x + 1-3 + >3)
    1. Un groupe de 10 clades, à fort taux de z: alpha gamma firmicutes, à grands effectifs, tener deino chloro fuso chlam aquifecae, à petits effectifs.
    2. Un groupe de 6 clades à très faible taux de z: actino bacteroides cyano, à grands effectifs, spiro toga planctomycetes, à petits effectifs.
    3. Un groupe de 3 clades à taux de z intermédiaire, avec aussi des effectifs faibles: delta beta epsilon. Leurs taux peuvent évoluer dans un sens ou l'autre si les effectifs venaient à augmenter.
    4. Le groupe de 16 clades à très faibles effectifs sont donnés pour mémoire.
  • Les 1-3 se répartissent en majoritaires et en rares. Seuls les clostridia possèdent beaucoup de rares alors que les alpha possèdent 144 d'un seul type majoritaire, atgf. Il y a 13 types majoritaires (voir la liste jointe au tableau z13.22 des fréquences).
  • Les majoritaires se répartissent sur plusieurs génomes et procèdent donc d'un processus général, voir tableau z13.1.
  • Les x de type 1-3 des blocs avant 16s, s'ils diffèrent des z 1-3, ont aussi des types majoritaires. Il y a 4 majoritaires chez les x. Voir tableau z13.23.
  • Les blocs 16s-5s-23s: sont propres aux firmicutes dans les 1-3 x et >3
  • Les blocs 16s23s-*-5s propres aux clostridia, existent en 5aas.
  • Les cds des 1-3 (z et x) voir liste
  • Note:
    - Sauf pour les clostridia les fréquences ne suivent pas une loi binomiale décroissante de 0 à 3. Les fréquences des alpha sont inversées (en % 24 76 0 0), celles des gamma (70 15 15 0), les bacilli, les clostridia.
    - En plus, à part les clostridia, un clade n'a qu'un à 2 types de z-1-3 se réduisant souvent à un seul aa (alpha atgf, gamma gac).
    - Les clades se constituent en 2 groupes, un avec beaucoup de z-1-3 (alpha …), l'autre avec très peu (actino) pour des effectifs élevés ou moyens.
Les tRNA 1-3 majoritaires[modifier | modifier le wikicode]
Z13.3 Les tRNA 1-3 majoritaires
gamma total %     clostridia total %     bacilli total %     31 clades total clade
gac 151 45 aac 38 26 atgf 20 31 aac 17 tener
tgg 73 22 ttc 19 13 gac 19 29 5s 14 delta
acc 57 17 aaa 17 12 aac 12 18 acc 13 beta
5s 50 15 atgi 14 10 acc 7 11 ggc 11 deino
tca 3 gca 14 10 cgt 2 gga 10 beta
ttc 2 acc 5 ctc 1 tac 10 beta
tta 1 tgc 5 ctg 1 atgf 6 chlor
tac 1 5s 4 gaa 1 cds 2
cds 1 gaa 4 tca 1 gta 2
339 98 atc 3 gta 1 tcc 2 actino
alpha tta 3 65 89 aga 1
atgf 144 96 gac 2 a.firmicutes atgi 1
cds 5 gga 2 aac 6 26 atgj 1
cgg 1 ggg 2 tgg 4 17 cca 1
150 96 gta 2 cac 2 cgc 1 epsilon
aca 1 cds 2 gaa 1
atgf 2 cgt 2 tca 1
cds 2 acg 1 tgc 1
cgg 1 agc 1 95
ctc 1 caa 1
ggc 1 gaa 1
gtg 1 tac 1
tgg 1 tgc 1
144 71 tta 1
23 43
Les tRNA 1-3 rares[modifier | modifier le wikicode]
  • Lien tableur: Les tRNA 1-3 rares
  • Légende
    - Les couleurs correspondent à la classe des tRNA, sans couleur sont des tRNA rares, rouge pour aucun effectif, jaune pour peu rares et cyan grands effectifs avec dégradé.
    - Tableau Z13.3 Les tRNA 1-3 rares, les effectifs de la couleur cyan (max) sont ceux des clades à faible effectif de ces tRNA. Ils correspondent à ceux de la colonne divers du tableau Z13.4 Liste des tRNA 1-3.
    - Tableau Z13.4 Liste des tRNA 1-3, les effectifs sont triés en ordre croissant. Deux colonnes sont affectées aux tRNA qui peuvent exister en grande quantité dans certains clades, max et très faibles dans d'autres, divers. Ainsi on a 713 max, 35 divers, 48 peu rares, 20 rares et 0 de la classe zéro. Le max de acc est égal à gamma + bacilli + beta (10). Le max de 5s est égal à gamma + delta (4).
  • Les groupes de tRNA 1-3: 48+1+4-3
tRNA 1-3
classe tRNA effectif
zéro 14 0
max 13 22
rare 14 19
cgc 1 1
peu rare 8 48
  • Les tRNA 1-3 rares:
Z13.4 Les tRNA 1-3 de type 16s23s5s-z
Z13.41 Les tRNA 1-3 rares
1-3    total    atgf atgi cds 5s 
tRNA 103 2 1 12 14
ttt tct tat tgt
att act aat agt
ctt cct cat cgc 1
gtt gct gat ggt
ttc 2 tcc 2 tac 2 tgc 7
atc 3 acc 8 aac 0 agc 1
ctc 2 ccc 0 cac 2 cgt 4
gtc 0 gcc 0 gac 2 ggc 1
tta 5 tca 5 taa tga
ata 0 aca 1 aaa 0 aga 1
cta 0 cca 1 caa 1 cga 0
gta 5 gca 0 gaa 7 gga 2
ttg 0 tcg 0 tag tgg 1
atgj 1 acg 1 aag 0 agg 0
ctg 1 ccg 0 cag 0 cgg 2
gtg 1 gcg 0 gag 0 ggg 2
Z13.42 Liste des tRNA 1-3
tRNA max tRNA rare
clade tRNA max divers tRNA divers tRNA divers
alpha atgf 170 2 cds 12 aca 1
gama gac 170 2 gaa 7 acg 1
" tgg 77 1 tgc 7 aga 1
" acc 74 8 gta 5 agc 1
firmicutes aac 73 0 tca 5 atgj 1
gama 5s 54 14 tta 5 caa 1
clostridia ttc 19 2 cgt 4 cca 1
" aaa 17 0 atc 3 cgc 1
" atgi 14 1 cac 2 ctg 1
" gca 14 0 cgg 2 gtg 1
deino ggc 11 1 ctc 2
beta gga 10 2 ggg 2
beta tac 10 2 tcc 2
713 35 58 10
Les tRNA z1-3 sur fond de référence[modifier | modifier le wikicode]
  • Lien tableur: Les tRNA z1-3 sur fond de référence
  • Légende: Légende: pour les couleurs voir le tableau référence.
  • - Note:
    + Les max se retrouvent dans les références jaunes aux taux supérieurs à 3.7% ( 8 / 13) sauf tgg (78) avec 2.5%. Parmi les 3 valeurs élevées en z-1-3 qui restent 2 ont des valeurs jaunes parmi les plus élevées (atgf 172 51, gac 172 55) et une, a sa valeur jaune moyenne (aac 73 39).
    + Les 4 autres max se répartissent en acc (82 12) complètement dissymétrique mais qui est accompagné de 5s (68 en z-1-3 et quasi nul en référence) dans le type acc-5s des gamma; en gca (14 21) à bascule directe, et en atgi (15 15) en bascule inverse. Les 2 gca et atgi se trouvent dans le type atgi-gca (10) des clostridia.
    + Les z-1-3 rares et peu rares se répartissent apparemment au hasard sur tous les références: ainsi les 14 rares ont 5 sur les blancs (15) et 9 sur les couleurs (30).
z13 Les tRNA 1-3, sur référence
tot max rare    atgf atgi 5s cds
816 748 68 172 15 68 12
ttt tct tat tgt
att act aat agt
ctt cct cat cgc 1
gtt gct gat ggt
ttc 21 tcc 2 tac 12 tgc 7
atc 3 acc 82 aac 73 agc 1
ctc 2 ccc cac 2 cgt 4
gtc gcc gac 172 ggc 12
tta 5 tca 5 taa tga
ata aca 1 aaa 17 aga 1
cta cca 1 caa 1 cga
gta 5 gca 14 gaa 7 gga 12
ttg tcg tag tgg 78
atgj 1 acg 1 aag agg
ctg 1 ccg cag cgg 2
gtg 1 gcg gag ggg 2
Les tRNA 1-3 synthèse[modifier | modifier le wikicode]
  • le classement des z-1-3: voir le calcul des majoritaires d'après le classement des types, et voir les rares.
  • Comparer avec
    - Le type y, gca se caractérise par la bascule firmicute, un z-1-3 monolytique avec atgi-gca et un taux de 31%, unique en y. Le tRNA gca intervient aussi dans les blocs doublons des 9-23 des bacilli en compagnie de tta gta aca aac ggc.
    - Les z longs des firmicutes, voir la note sur les références des firmicutes en z longs.
    - Le type x: Voir la synthèse des x.
  • Tableaux de multiplicité: alpha (atc 241 gca 239 atgf 236), gamma et actino bacteroidites.
    - gamma
    + > 250 max 377 aaa, ggc gaa gta aac 311, cgt atgf gac atc gca 283, ctg 252. tac 227 ttc 175.
    + < 10 gtg gcg gag
    - bacteroi, > 200 atc 295 gca 286. < 10 gtg gcg.
    - actino, max ggc 184 gtc 145 gag 143, mini gcg 86 et reste > 99.

Les type z supérieurs à 3 synthèse[modifier | modifier le wikicode]

Les type z supérieurs à 3 synthèse, caractéristiques[modifier | modifier le wikicode]
  • Ce type z est quasiment propre aux firmicutes. J'ai trouvé deux exceptions, chez les tenericutes (6 génomes dont 5 z et un z') et epsilon (1 génome sous forme de type x).
  • Le taux des z par rapport aux blocs sans z est proche de 50% contrairement aux alpha gamma actinomycètes chez qui ce rapport est respectivement de 76 30 et 99%.
  • Le taux z1-3/z>3 est inversé entre bacilli et firmicutes.
  • La frontière z3-z4 est très nette.
  • Les séquences de tRNAs supérieures à 3 se trouvent aussi chez les avant-16s, dans les types x et/ou z' ( les avant-16s s'écrivant sous la forme x-16s-z', où 16s représente le bloc interne comprenant 16s 23s 5s et éventuellement quelques tRNAs entre 16s et 23s).
  • La frontière paraît très nette entre z8-z9 chez les bacilli où les z9 ont un effectif de 25 contre seulement 3 pour z8. Chez les clostridia c'est moins nette 4 contre 3. J'ai analysé donc les z4-8 et les z9-23 séparément.
  • Les séquences des z > 3 se caractérisent par
    - une grande variabilite de la longueur allant de 4 à 33 avec une moyenne de 13.9 chez les bacilli (97 15 12 blocs pour z9-23 z4-8 x9-23); chez les clostridia de 4 à 43 avec une moyenne de 13.0 (24 14 6 blocs pour z9-23 z4-8 x-16s-z')
    - au niveau total des tRNAs la multiplicité est due à la multiplicité des z et non à des doublons dans le même z contrairement aux cluster sans rRNAs étudiés dans les annexes. Les bacilli ont jusqu'à 14 z9 doublons.
    - Absence des doubles de tRNAs par répétition dans le bloc, cependant 2 blocs ont présenté des duplications de séquences. C'est ainsi dans le bloc de 33 aas de bacilli où il y a 2 séquences de 10 aas identiques séparées par une séquence de 8 autres, et dans un bloc de 8 aas d'epsilon avec 2 séquences de 3 qui se suivent.
    - La majorité des tRNAs composant ces séquences longues, z z' x, ne concerne qu'une vingtaine d'aas dans leurs cumuls chez les bacilli et les clostridia, B-C total blocs longs (tRNAs en jaune). Ramenés pour 1000 tRNAs les jaunes paraissent semblables mais les rouges basculent entre bacilli et clostridia, ainsi gca (37-2) aga (1-37) ttg (19-0). D'autres tRNAs sont équivoques. C'est pour cela que j'ai voulu lever ces cas équivoques, dans le tableau B2-C2 de la même référence, en calculant la plus grande variation en % des variations en pour 1000 de B2 moins C2, le dénominateur étant le plus faible entre B2 et C2 pour un tRNA donné. Effectivement apparaissent 2 nouvelles bascules tcc avec une variation de 898 et cgt avec 233 comparée à la plus petite variation rouge précedente, ttg de 1860. Les jaunes ont une variation inférieure à 78 (gga) en valeur absolue.
Comparaison des z9-23 B-C[modifier | modifier le wikicode]
  • Comparaison des z9-23 B-C avec la loi binomiale.
    - J'ai signalé ci-dessus qu'une grande différence entre B et C est due au grand nombre de doublons z9-23 des bacilli par rapport à celui des clostridia. J'ai éliminé donc les doublons et je ne considère donc ici que la comparaison sans les processus de duplication. Ainsi certains aas seront moins avantagés par les duplications. Les tableaux z9-23 des bacilli et des clostridia donnent les effectifs sans doublons et montrent les tRNAs qui sont avantagés (en jaune foncé).
    - Je n'ai pas intégré les z4-8 car ils contiennent peu de tRNAs (93+83) et pouraient faire intervenir des processus différents de ceux des z9-23.
    - De même je n'ai pas intégré les x longs des 2 clades car ceux des bacilli se comportent clairement de façon différente des z9-23. Les x9-23 des bacilli au nombres de 12 blocs ont très peu de duplication mais les blocs ne diffèrent que par 1 à 3 aas, ce qui fait que certains aas sont très avantagés. En plus le tRNA ctc, rare dans les totaux des z longs, est très avantagé aussi. Chez les clostridia les x longs se comportent comme les z longs.
    - Les types z9-23 des 2 clades, sans doublons, sont donc homogènes et comparables (tableaux B-C.4 5 6), avec 45 blocs et 709 aas pour les bacilli, 21 blocs et 351 aas pour les clostridia. Dans cette référence (tableaux B-C.1 2 3) je compare aussi les totaux précédemment étudiés dans les grandes variations. Les aas ggc et gga apparaissent significativement différents entre les 2 clades alors qu'ils ne le sont pas en ne tenant pas en compte les doublons, et je n'ai pas pu les distinguer avec les grandes variations. Ce résultat justifie à lui seul, la nécessité d'éliminer les doublons pour la comparaison des 2 clades.
    - J'utilise ici la loi binomiale en prenant comme probabilité de base les taux des bacilli à partir desquels je calcule les taux espérés des clostridia pour un effectif de 351 aas, ainsi que leur intervalle de confiance.
    - comparaison des z9-23 bacilli et clostridia: Voir le classement des aas par groupes de pourcentages.
    + 23 tRNAs (jaune) entre les 2 clades, tous significativement semblables.
    + 7 bascules entre les 2 clades, 7 rouges, tous significativement différents.
    + 15 tRNAs très déficients, en clair. Les différences significatives sont rares pour ces tRNAs, dues aux faibles effectifs.
    + quasi absence des 5s et des cds.
    - Le référentiel: La somme des z9-23 des bacilli et des clostridia fait 1060 blocs, assez grande pour la comparer à d'autres processus aux faibles effectifs, surtout pour les 23 tRNAs semblables dont la somme a un sens. La couleur rouge des bascules indiquera si le type x y z z' à comparer va dans le même sens que les bacilli ou ou celui des clostridia. De même le référentiel fera ressortir un effectif élevé des aas en clair (déficients chez les z9-23 des firmicutes). Le référentiel se présente sous forme d'effectifs, tableau B-C.9 somme des tableaux B-C.4 et B-C.5 de la comparaison B-C ou sous forme de pourcentages, tableau B-C.8.
  • Comparaison des Cz'B-C9-23
    - Les z'9-23 sont ceux de 32 aas de 2 blocs des clostridia, les bacilli n'en ont pas (x-16s23s5s-z'). Je les ai ajoutés aux 351 des z9-23, soit 383 aas contre 1060 des bacilli.
    - Les résultats sont les mêmes qu'avec les z9-23 B-C du paragraphe précédent à la différence près qu'ils sont plus précis faisant apparaître ggc comme bascule (voir les bascules en bas des notes de ces tableaux).
Comparaison des z4-8 B-C[modifier | modifier le wikicode]
  • Liens aux tableaux:   B-CC-Bsomme,   B-C 105.
  • Jusqu'ici je considérait les z4-8 comme les z9-23 pour leur contenu en aas. C'est comme ça que j'avais additionné tous les z longs dans le tableau de comparaison du total des B et des C et que j'avais pu repérer les 1ers indices des bascules entre B et C (aas en rouge). Mais l'analyse plus fine que j'ai abordée au chapitre précédent en excluant les doublons des z9-23 m'a conduit à exlure aussi les avant-16s des bacilli pour leur comportement aberrant (paragraphe 3). Et pour plus d'homogénéité dans la comparaison des z9-23 B-C j'avais exclu les z4-8 aussi. C'est cela qui m'a conduit à comparer les effectifs des z4-8 B-C.
  • Comparaisons CzB-C4-8 et CzC-B4-8
    - Les bascules des z9-23 B-C sont conservées dans les z4-8 B-C: C'est un résultat très important à cause des faibles effectifs pour certaines bascules des Z9-23 B-C mais aussi sur l'incertitude de la taille de mon échantillonnage en général. Du fait que ces bascules se font toujours dans le même sens cela confirme leur existence et du coup les bascules propres aux z4-8, différentes des bascules z9-23 dans leurs comparaisons entre elles (C4-8/B4-8) ou avec les z9-23 (Bz9-23 /Cz9-23), prennent de la valeurs et pourraient avoir un sens.
    - Les bascules propres aux z4-8: J'ai adopté au début le même principe d'homogénéité que pour la comparaison des z9-23 B-C, je n'ai comparé que les z en excluant les avant-16s.
    - Avec uniquement les effectifs et au visu seulement j'ai repéré 8 bascules   aac 10-5   gta 11-5   gaa 6-11    acc 5-1   cca 6-1   caa 2-7   gga 1-7   atgj 5-0. atgj 5-0, est une bascule 9-23. C'est renforcé par le fait que atgi+atgj fait dans 9-23, 21 pour 709 bacilli contre 22 pour 351 clostridia. Mais dans 4-8 la bascule atgj n'est pas respectée 5/0 au lieu de 0/5.
    - Comparaison des z4-8 avec la loi binomiale: Pour utiliser la loi binomiale je dois utiliser le clade au total le plus élevé (B 93) pour définir la probabilité de référence, effectif de l'aa divisé par le total. Hors pour des effectifs faibles certains aas sont nulles et donc leur probabilité de référence sera nulle, non utilisable pour les estimations. Ces aas ne seront pas comparés. Pour se faire il faut repartir de l'autre clade (C 83). Ce que je ai fait dans le paragraphe suivant. Trois types de différences significatives:
    + cgt, cet aa appartient aux bascules des z9-23 et confirme cette bascule, sans changer de sens.
    + atgj, cet aa appartient aux bascules des z9-23 mais ne confirme pas le sens de la bascule, il change de sens. Cela serait une caractéristique des z4-8
    + caa gga gga confirment la bascule propre aux z4-8.
    - Comparaison inverse C-B: Ici les probabilités de référence sont calculées sur les C4-8 avec un total de 83 aas. Deux types de différences significatives:
    + gca, cet aa appartient aux bascules des z9-23 et confirme cette bascule, sans changer de sens.
    + acc cca caa gga gta confirmant 3 nouvelles bascules propres aux z4-8, acc cca gta.
    - La comparaison des B-C et C-B révèle donc 6 bascules propres aux séquences de 4-8 de long, acc cca gga caa gaa gta qui n'appartiennent pas aux bascules des z9-23 et atgj qui appartient aux z9-23 mais qui change de sens dans les z4-8.
  • Comparaisons Cz'B-C4-8 et Cz'C-B4-8
    - Les z'4-8 sont ceux de 17 aas de 3 blocs des clostridia, les bacilli n'en ont pas (x-16s23s5s-z'). Je les ai ajoutés aux 83, soit 100 aas contre 93 des bacilli.
    - Les résultats sont les mêmes sauf gta qui cède la place à gac: dans les z4-8 les bascules respectives sont 11-5 et 5-8 et dans les z'4-8 11-7 et 5-10. Une seule différence significative apparaît pour gta dans z4-8 sur 2 attendues et inversement dans z'4-8 c'est le cas de gac. Si j'adopte les bascules in visu, il serait intéressant de considérer 8 bascules propres aux blocs de longueurs 4-8: acc cca gga caa gaa gta gac atgj.
Comparaison des z9-23 / z4-8 B-C[modifier | modifier le wikicode]
  • Liens aux tableaux:   9-23/4-8,   Cz'B-C9-4,   9-23/105
  • Remarque sur la comparaison z9-23 B-C: Si j'adopte les mêmes différences entre z9-23 bacilli et clostridia (diviser les bacilli par 2, procédé in visu que j'ai adopté au chapitre précédent) je ne trouve que 2 tRNAs présentant une bascule outre les rouges, ggc 20.5-12 et gga 11.5-17, tgc 10.5-6 étant la limite (9-23/4-8, tableaux B-C.9 et B-C4-8 somme B+C ). Ceci montre l'absence d'autres bascules que les rouges remarqués dans cette comparaison.
  • Pour la comparaison z9-z4 je compare la somme Bz9-23 + Cz9-23 à la somme Bz4-8 + Cz4-8 et la somme Bz9-23 + Cz'9-23 à la somme Bz4-8 + Cz'4-8. Ce qui donne les tableaux 9-23/4-8 et Cz'B-C9-4. A la différence de la comparaison des z4-8 où les effectifs sont faibles et où j'ai du faire 4 tableaux Cz'B-C4-8 et des Cz'C-B4-8, ici je n'en fait que 2 grâce aux effectifs élevés des sommes des z4-8, 176, et des sommes des z'4-8 de 193. Les aas tca et gta ne sont pas significativement différents des z9-23 avec l'échantillon à 176 aas (9-23/4-8) et le deviennent avec 193 aas (Cz'B-C9-4).
  • Signification de la comparaison z9-23/z4-8: Alors que les bascules dans les comparaisons z9-23 et z4-8 concernent 2 processus dans chaque clade et donc sont propres aux clades, les bascules de la comparaison z9-23/z4-8 ne concernent plus les clades mais les 2 types z9-23 et z4-8 donc leurs longueurs. On assiste là à la manifestation de la propriété physique de l'ADN et non des fonctions protéiques éventuelles dans les processus affectés aux clades.
  • Les différences significatives de la comparaison z9-23/z4-8: Elles sont au nombre de 8.
    - Il y a 2 groupes un à bascules fortes et l'autre à bascule faible. Pour ce faire je fais le rapport cz'4-8 attendu (total 193) sur z'9-23 (total 1092). Pour un effectif nul je le remplace par l'unité. J'obtiens ainsi,
    + les bascules fortes   atgf 55-6   cac 35-6   tgg 28-6   tca 33-6.   Elles sont toutes directes de z9 vers z4. Le rapport de la bascule n'est pas inférieur à 4.9.
    + les bascules faibles   aac 42-96   gta 62-102   gaa 61-108   acc 13-34.   Elles sont toutes indirectes de z4 vers z9. Le rapport de la bascule n'est pas supérieur à 2.6.
    - Les intervalles de confiances sont solides: par là j'entends qu'avec un échantillon plus grand on aura toujours une différence significative ce qui rend la bascule réelle et effective.
    + L'existence effective de la bascule entre z9-23 et z4-8 pourrait être réduite à 2 intervalles de confiance solides avec une différence à la borne élevée: ce sont atgf avec une différence de 2,6 et aac avec 4,2, les 2 tRNA s'appuyant sur de grands effectifs.
    + Mais une solidité légèrement plus faible va toujours dans le même sens de la réalité des bascules de cette comparaison. Deux tRNA ont une différence à la borne de 1,3 et 1.8: cac gaa s'appuyant aussi sur de grands effectifs. Je considère que c'est une différence significative. gaa et cac ont respectivement dans le tableau 9-23/4-8, 1.0 et 1.1.
    + Quatre tRNAs pourraient porter sujet à caution, ce sont tgg tca gta acc avec soit des effectifs les plus faibles des 8 bascules, soit des différences à la borne aussi faibles avec respectivement 0.6 0.1 0.6 0.7 (Cz'B-C9-4) et 0.3 -0,2 -0.1 0.9 dans le tableau 9-23/4-8.
    - Manifestation de la propriété physique de l'ADN peut être à l'origine des bascules dans z9-23 et dans z4-8: Voir synthèse des bascules. Deux tRNA acc et gaa ont une bascule dans z4-8 et dans z9-z4, et atgj a une bascule dans z9-23 et dans z4-8.
    * La même bascule i9-4 est provoquée par C (gaa 6-13) ou B (acc 5-1) dans z4-8. La bascule d9-4 est provoquée par B et C dans z9-23 et leur absence simultanée dans z4-8 pour atgf cac tgg tca.
    * Pour atgj on a donc (i9, d4) et l'état de z9-4 dépend de C dans z9-23 (30-60) et de B dans z4-8 (5-0).
    * L'état de z9-4 dépend donc de B et/ou C dans Z4-8 et dans z9-23. Comme l'état de z9-4 est la manifestation physique de l'ADN (atgf cac tgg tca) les états des z9-23 et z4-8 le sont aussi.

Type z synthèse[modifier | modifier le wikicode]

Historique du typage x-16s-y-23s5s-z[modifier | modifier le wikicode]
  • La question des duplications des tRNAs reliées à leurs fonctions [1]: Dans ce but j'ai commencé à étudier les duplications des tRNAs dans les opérons à RNAs.
    - Les intercalaires: Très vite est apparue l'idée que la structure en boucle du tRNA devrait opposer une résistance à la réplication et aux réparations de l'ADN. Ceci aurait pour conséquence une destruction du tRNA et surtout des rRNAs qui contiennent l'équivalent de 1 20 40 structures de type tRNA pour respectivement 5s 16s 23s. Cette opposition aux maintenances de l'ADN engendre aussi la conservation de ces gènes de génération en génération. Elle devrait se traduire aussi par une très grande variabilité des intercalaires. C'est ce que j'ai mis en évidence dans cette première approche.
    - 1ère ébauche du typage. En partant toujours de l'article (article qui introduit les opérons longs de tRNA et les opérons mixtes de tRNA et de protéines, page 17 [2]) qui m'a mis sur la voie des opérons à RNAs j'ai étudié les duplications chez E.Coli, où la duplication ne se fait plus dans ces opérons, mais dans un cluster de tRNAs seuls. Ce qui m'a amené à comparer les intercalaires en relation avec le %GC de 16 génomes. Petit à petit sont apparus alors les types z et y (notation, 16s-y-23s5s-z ou x-16s-y-23s5s-z'), d'abord z puisqu'il est à l'origine des duplications et les différences de celles-ci entre bsu et eco, ensuite est apparu y qui s'imposait par la constance du cas atc-gca qui n'a aucune relation avec la fonction des tRNAs.
    - Les cds: En partant toujours de l'article qui parle de 2 opérons tRNAs+protéine, tpr et tufB, j'ai ajouté à mes intercalaires ceux des cds intra clusters et à leurs bordures dans eco cds. L'étude des cds est faite dans plusieurs génomes des annexes.
    - Le typage x y z, les longueurs de z: Si les annexes permettent de repérer les duplications avec ou sans rRNAs, les fiches ne concernent que les clusters à rRNAs sans l'encombrement des intercalaires. J'ai échantillonné chaque clade avec le 1er génome de la rupture du tri sur les 2 1ers qualificatifs du nom. Cette étude m' a permis alors de définir plus proprement les types et notamment de définir les 3 longueurs de z, sans z, 1-3 et >3 tRNAs. Ainsi sont apparus les 1-3 majoritaires de z dont l'exemple impressionnant des alphas. L'abondance d'un type donné de z1-3 pose alors le problème du génome: est-ce que cette abondance est due au fait que je suis tombé sur un génome particulier ou bien c'est une propriété générale. Dans la quasi totalité des cas il y a plusieurs génomes pour un type donné.
    - Le typage x-y-z', x n'est pas un accident: Ce n'est qu'à la synthèse finale sur les x que j'ai démontré leur existence propre et qu'ils ne sont pas dus à un réassemblent au hasard, par les réparations de l'ADN, d'un cluster 16s-y-23s5s-z. Les destructions et les réassemblements sont étudiés dans les comparaisons entre 2 génomes proches phylogénétiquement: ecoN-eco, bsu-lmo, cdc - cdc8.
Hypothèse de la contrainte physique du cluster[modifier | modifier le wikicode]
  • Voir dans la comparaison des z9-23/z4-8, la manifestation physique de l'ADN (dernier paragraphe).
  • Voir comparaison B+C z2/z1 et comparaison B+C z4-8/z1-3.
  • Notes:
    - La force des gènes tRNAs, émise dans l'historique précédent
    - Comparaison entre les longueurs des types de séquences et non entre clades: La somme B+C annule l'influence du clade et on passe au clade supérieur, ici les firmicutes. Le processus en cause pour une longueur donnée réagit par rapport à la caractéristique commune des clusters firmicute et cette réaction est différente entre les 2 longueurs comparées. Cette réaction est la contrainte physique du cluster dans son ensemble, c'est à dire les 3 rRNAs, 16s 23s 5s.
    - Comment se fait alors la création du gène de tRNA: exclure la création base par base et la façon de l'alphabet suivant un programme prédéfini. Elle se ferait plutôt par appui sur un modèle et ce modèle serait ici le 5s. Les processus comparables sont la réplication, l'édition de gène par CRISP (qui fait intervenir un brin RNA avec DNA et les protéines de réparations) et le transfert d'un domaine protéique entre gènes de protéines.
    - Ce type de création explique la fréquence élevée d'un type de séquence créée et donc les répétitions que j'ai relevées pour les z9-23 ne sont pas des copies d'éléments mobiles mais des créations identiques. La fréquence d'une séquence donnée est le résultat de la facilité avec laquelle la contrainte physique du cluster est résolue par le processus de réparation/réplication.
    - Cela explique aussi que les types x de x-16s-y-23s5s-z' fassent intervenir des tRNAs et des séquences différentes des z, avec des fréquences plus faibles, car ce processus x change le sens de la direction de réparation/réplication qui, apparemment se fait dans le sens 16s 23s 5s.
    - La destruction des clusters conserve les séquences de tRNAs et ne détruit que les rRNAs. Voir
    - Un autre processus est à l'origine de la création de séquence de tRNAs dans les clusters sans rRNAs où les gènes sont répétés alors que dans les clusters avec rRNAs les gènes ne sont jamais répétés. Cas des actinomycètes où le processus z est réduit à 2 z1-3 pour 354 blocs étudiés.
    - Si on revient au processus de création de type alphabet, nous voyons que le processus par modèle le reproduit mais par gène et non base par base. Le gène tRNA étant rigide (feuille de trèfle) le modèle est reproduit à l'identique sauf pour 3 bases (codon) ou 5 (codon plus les 2 bases l'entourant très sensibles lors de la maturation des ttRNAs) qui varient sous la contrainte physique du cluster dans le bloc de réparation.
    - La synthèse des z longs supérieurs à 3 m'a conduit à penser que même les comparaisons B-C révèlent la différence entre les 2 clusters qui contraignent différemment la réparation.
    - L'ajout des autres firmicutes ne modifie pas les résultats.
    - La comparaison entre proteobacteria, alpha + gamma, obéit toujours à la même hypothèse de la contrainte phsique du cluster.
Différents comportements des z[modifier | modifier le wikicode]
  • les longueurs, les taux, les génomes, les cds, les 16s5s23s, les cassés deino, les z' équivalents aux z. Sans z 1-3 4-8 9-23
conclusion[modifier | modifier le wikicode]
  • En conclusion: Malgré la ressemblance forte entre clostridia et bacilli pour les z longs, que ça soit les z9-23 (23 tRNAs jaunes) ou les z4-8 (17 sur 23 jaunes), les bascules fortes rouges ttg gca aga, la déficience en atgf chez les z4-8 et les caractéristiques uniques des x9-23 des bacilli ainsi que les nombreuses petites différences relevées (notamment les bascules des z4-8) laissent penser que chaque type de longueur z ou x correspond à un processus de création différent, Ce sont z1-3 z4-8 z9-23 et pour les avant 16s, x1-3 x4-8 x9-23 z'1-3 z'4-8 z'9-23.
  • Suite *******
  • Dans les totaux des blocs longs: les 2 types de bascules, tga cga ata (à compter sur toutes les bactéries), le 14 des ctc, ccc gcc gtc, 5s et cds.
  • Les cds internes ? pas de cds chez les bacilli beaucoup chez clostridia et autres firmicutes, 16s23s5s-cds-tgc-tta.
  • Les blocs bizarres 16s5s-*-23s propres aux firmicutes.
  • Tableau de multiplicité des bacilli
  • Tableau de multiplicité des clostridia

Type x-16s23s5s[modifier | modifier le wikicode]

Type x cumuls[modifier | modifier le wikicode]

Type x récapitulatif[modifier | modifier le wikicode]
  • Lien tableur: Type x récapitulatif
  • Légende:
    - 16*, autres dans les autres bactéries contient 19 clades dont 16 n'ont pas de avant 16s. Les 3 autres sont acidobacteria (acido) aquificae gemmatimonadetes (gemmati) listées en dernier.
    - total blocs, somme du tableau + différents + incomplets. Voir pour chaque clade ses blocs (tableau) et ses notes (différents + incomplets).
  • Notices: absence des x et y pour actino et x pour alpha
    - l'absence des x et y pour actino et x pour alpha peut être estimée par 2ơ, racine(effectif*p*(1-p))*2, l'intervalle de confiance[1] de la loi binomiale[2]. Pour p=0.01 la différence effectif*p moins 2ơ devient négative alors qu'elle reste positive pour p=0.02. Pour cette dernière valeur de p, zéro type avant 16s est statistiquement différent de effectf*0.02 puisque zéro est en dehors de l'intervalle effectf*0.02±2ơ. Pour actino (effectif de 354) il y a donc moins de 7 type x et y (354*0.02) et pour alpha (effectf de 208) moins de 4 de type x. Cela reste vrai pour le z de actino dont l'effectif est 2.
AV Bactéries. Récapitulatif des avant 16s, x.
AV1 Les taux des avant 16s par clade
références clade type longs courts sans total x total blocs x %
courts bacilli avant 12 6 18 288 6
longs après 15 3
courts clostridia avant 2 12 14 264 5
longs après 5 4 5
gamma gamma avant 22 22 742 3
après 5 17
epsilon epsilon avant 1 3 4 113 4
après 4
tenericutes tenericutes avant 1 6 7 32 22
après 1 4 2
beta beta agc 1 1 3 165 2
atgf 2 2
delta delta gca 1 1 1 64 2
bacteroi bacteroides cgt 1 1 2 126 2
aac 1 1
chlam chlam cac 5 5 5 17
acido acidobacteria aag 1 1 1 6
aquificae aquificae cca-aga-atgf 1 1 3 15
gcc 2 2
gemmati gemmati cca-aga-aag 1 1 1 1
autres cyano 82
spiro 25
chlor 15
deino 17
toga 20
apha alpha 208
actino actino 354
autres 16 clades* 86
autres a.firmicutes 67
totaux longs courts sans total x total blocs x %
avant 16 65 -
après 6 24 47
81 2730 3
clades étudiés total tRNAs
total 37 courts av 112
avec x 12 courts ap 51
sans x 25 longs av 197
longs ap 48
AV2 Les types courts des avant 16s
clade type avant n type après n
bacilli cgt-gga 4 atgf-gac 14
ctc-gga 1 gta 1
gga 1
clostridia atgf 1 aac 2
gca-atc-gga 1 aac-aac 1
atgi-gca 1 aac-atgf 1
cag-gag 1
5s-atgi-gca 1
tcg 1
tcc 1
gac-ttc-ggc 1
tca-tcc 1
agc 1
ttc-cds 1
cgg-tgg 1
gamma cgg-cac-cca 10
agc-gta 3 gac-tgg 4
atgf 3 x-tgg 1
aaa 2
ttc 1
atgj 1
cgg 1
ttg 1
epsilon aag-caa-atgf 1
aac 1
aac-aac 1
tenericutes tac 5 aac 1
aaa-cta 1 aac-5s-aac 1
gta-aac 2
beta agc 1
atgf 2
delta gca 1
bacteroides cgt 1
aac 1
chlam cac 5
acidobacteria aag 1
aquificae cca-aga-atgf 1
gcc 2
gemmati cca-aga-aag 1
Type x en x-z[modifier | modifier le wikicode]
  • Note: ici le z remplace le z' dans la notation x-16s23s5s-z'
type x en court et long, x – z.
clade xcou xcou-zcou xcou-zlon xlon xlon-zcou xlon-zlon total
gamma 17 5 22
bacilli 1 5 2 10 18
clostridia 4 4 4 1 1 14
epsilon 3 1 4
tenericutes 1 4 1 1 7
reste 16 16
42 18 5 5 10 1 81
Type x tRNAs[modifier | modifier le wikicode]
  • Lien tableur: Type x tRNAs
  • Légende:
    - Les couleurs adoptées ici sont celles des tRNA 1-3 rares des types 16s23s5s-z.
    - Le petit tableau précédent le grand affiche le total des effectifs de chaque couleur correspondant au degré de rareté des 1-3 de tpye z. Ainsi il y a 7 tRNA de classe zéro avec un effectif de 10, alors que chez les z cette classe a 14 tRNA avec un effectif de zéro.
  • Notice: 10 blocs x de gamma dans 10 génomes différents ne sont pas décomptés ici, avec x = cgg-cac-cca. Les 3 tRNAs sont rares. Ils se répartissent en 4 types de blocs différents:  4 16atcgca235   2 16atcgca235-gac-tgg    2 16gaa235   2 16gaa235-gac-tgg
tRNA 1-3
classe tRNA effectif
zéro 7 10
max 12 40
rare 9 21
cgc 0 0
peu rare 5 11
x16 Les tRNAs de type x-16s23s5s
x16.1 Sur couleurs de fond des types 16s23s5s-z
x-16    total    atgf atgi cds 5s 
tRNA 82 8 2 1 1
ttt tct tat tgt
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc 3 tcc 2 tac 5 tgc
atc 1 acc aac 4 agc 5
ctc 1 ccc cac 5 cgt 5
gtc gcc 2 gac 1 ggc 1
tta tca 1 taa tga
ata aca aaa 3 aga 2
cta 1 cca 2 caa 1 cga
gta 3 gca 4 gaa gga 7
ttg 1 tcg 1 tag tgg 1
atgj 1 acg aag 3 agg
ctg ccg cag 1 cgg 2
gtg gcg gag 1 ggg
x16.2 Liste des tRNA x-16s
tRNA max tRNA rare
clade tRNA max divers tRNA divers tRNA divers
alpha atgf - 8 cds 1 atgj 1
gama gac - 1 gaa 0 cca 2
" tgg - 1 tgc 0 caa 1
" acc - 0 gta 3 agc 5
firmicutes aac - 4 tca 1 aga 2
gama 5s - 1 tta 0 11
clostridia ttc - 3 cgt 5 cta 1
" aaa - 3 atc 1 ttg 1
" atgi - 2 cac 5 gcc 2
" gca - 4 cgg 2 tcg 1
deino ggc - 1 ctc 1 aag 3
beta gga - 7 ggg 0 cag 1
beta tac - 5 tcc 2 gag 1
- 40 21 zéros 10
x13 Les tRNA 1-3, sur référence
tot       atgf atgi 5s cds
82 8 2 1 1
ttt tct tat tgt
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc 3 tcc 2 tac 5 tgc
atc 1 acc aac 4 agc 5
ctc 1 ccc cac 5 cgt 5
gtc gcc 2 gac 1 ggc 1
tta tca 1 taa tga
ata aca aaa 3 aga 2
cta 1 cca 2 caa 1 cga
gta 3 gca 4 gaa gga 7
ttg 1 tcg 1 tag tgg 1
atgj 1 acg aag 3 agg
ctg ccg cag 1 cgg 2
gtg gcg gag 1 ggg

Les type x supérieurs à 3[modifier | modifier le wikicode]

Les type x bacilli[modifier | modifier le wikicode]
  • Légende: pour les couleurs vour le tableau référence.
    - Les tRNAs en foncé correspondent aux doubles des 97= blocs. Le rouge est l'exception des bacilli x-16s. Ici les 2 tableaux ayant été construits auparavant sont mis côte à côte pour la comparaison, tableau B9-23.2 et tableau B9-23. 12 Blocs avant 16s
  • Comparaison x z, bacilli. Il n'y a pas x-16s23s5s-z.
B9-23. Comparaison x z
B9-23.2 Effectifs 45 blocs #
tot 45#    atgf atgi 5s  cds
709 34 7
ttt tct tat tgt
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc 27 tcc 14 tac 27 tgc 15
atc 24 acc 9 aac 28 agc 13
ctc 4 ccc cac 24 cgt 30
gtc 3 gcc 1 gac 37 ggc 41
tta 19 tca 24 taa tga
ata aca 33 aaa 32 aga 1
cta 20 cca 28 caa 29 cga
gta 39 gca 22 gaa 38 gga 23
ttg 16 tcg 2 tag tgg 21
atgj 14 acg 2 aag agg
ctg 7 ccg cag cgg
gtg gcg gag ggg 1
B9-23. 12 Blocs avant 16s, x-16s.
tot 12x    atgf atgi 5s  cds
157 5
ttt tct tat tgt
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc 1 tcc tac tgc
atc 3 acc aac 12 agc 11
ctc 10 ccc cac cgt 13
gtc gcc gac 13 ggc 3
tta 3 tca 2 taa tga
ata aca 2 aaa 12 aga
cta 6 cca 13 caa 12 cga
gta 10 gca 2 gaa 12 gga 11
ttg tcg tag tgg 1
atgj acg aag agg
ctg ccg cag cgg
gtg gcg gag ggg
Les type x clostridia[modifier | modifier le wikicode]
  • Lien tableur
  • Légende: Pour les couleurs voir le tableau C9-23.1. Les 2 qui le suivent correspondent au tableau de leur somme déjà étudié les clostridia avant 16s: le tableau à 5 blocs contient les séquences longues z et le tableau à 2 blocs contient les séquences x.
  • Comparaison x z, clostridia. cd112 a un tRNA en plus non décompté, tcg-16s23s-gca-5s-12aas. cd001 contient du x et du z longs 5aas-16sgcaatc23s5s-6aas.
    - Autres x-16s, tenericutes et epsilon pour le 3ème tableau. Voir
    + aac-gaa-gta-aca-aaa-cta-16s23s5s tn012
    + 2*(aaa-gta-gac)-aaa-gag-16-gcaatc-235 ep057
    - Tenericutes 11aas, pour le 2ème tableau. Ce clade a 4 autres 16-atc-235-11aas, les 5 11aas ont une séquence identique.
    + tac-16-atcgca-235-gta-aca-aaa-tta-gca-atgj-atgi-tca-atgf-gac-ttc
C9-23. Comparaison x z
C9-23.1 Effectifs 21 blocs #
tot 21#    atgf atgi 5s  cds
351 20 9
ttt tct tat tgt
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc 17 tcc 1 tac 14 tgc 5
atc 8 acc 4 aac 13 agc 7
ctc 1 ccc 2 cac 10 cgt 6
gtc 3 gcc 4 gac 21 ggc 12
tta 10 tca 8 taa tga
ata aca 16 aaa 19 aga 13
cta 11 cca 12 caa 13 cga
gta 21 gca 0 gaa 21 gga 17
ttg 0 tcg 1 tag tgg 6
atgj 13 acg 1 aag 1 agg
ctg 4 ccg 2 cag 1 cgg 2
gtg gcg gag 2 ggg
C4-23 5 Blocs avant 16s, 16s23s5s-z.
tot 5z    atgf atgi 5s  cds
48 2 2
ttt tct tat tgt
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc 2 tcc tac 3 tgc 1
atc 1 acc aac 3 agc 1
ctc ccc cac 1 cgt
gtc gcc gac 4 ggc 1
tta 2 tca 1 taa tga
ata aca 4 aaa 3 aga 1
cta 1 cca 1 caa 1 cga
gta 4 gca gaa 4 gga 1
ttg tcg tag tgg 1
atgj 1 acg aag 1 agg 1
ctg ccg cag cgg
gtg gcg gag ggg
C4-23 2 Blocs avant 16s, x-16s.
tot 2x     atgf atgi 5s  cds
20 1
ttt tct tat tgt
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc 1 tcc tac 1 tgc 2
atc acc aac 1 agc 1
ctc ccc 1 cac cgt 1
gtc 1 gcc gac 1 ggc 3
tta tca taa tga
ata aca aaa 1 aga
cta cca 1 caa cga
gta 1 gca gaa 1 gga
ttg tcg tag tgg
atgj 1 acg aag agg
ctg 1 ccg cag cgg
gtg gcg gag ggg

Type x synthèse[modifier | modifier le wikicode]

  • Le 1/3 des clades a des blocs avec x (récapitulatif en bas du tableau AV1)
  • Mais la moyenne par clade est de 3% des blocs (Av1, colonne x%)
  • Quand un x-16s a un z', x-16sy23s5s-z', ce z' est souvent le même que le z dans les blocs, 16sy23s5s-z. Voir dernière colonne de Av2. Les types x sont différents donc des z courts en général, voir _x_.
  • Comparaison des fréquences des tRNA 1-3 _z_ et _x_: Ces 2 tableaux montrent clairement que les x-16s et les 16s23s5s-z sont très différents, même quand un clade n'a pas de tRNA exceptionnels. Ainsi chez les x les rares rouges et blancs sont abondants alors que chez les z les rouges n'existent pas du tout. On a respectivement, pour jaune blanc rouge, 11 21 10 pour un total de 82, soit 50% chez les x et 48 20 0 pour un total de 103, soit 76%, chez les z. Cependant les divers cyan sont sous-estimés chez les z. Si on admet que les divers sont répartis au hasard, les clades max devraient en contenir autant. En doublant les divers (44) chez les z le total des 4 couleurs serait alors de 112 et le taux des jaunes + blancs + rouges serait de 68/112 = 61%, chez les z. Ceci montre qu'il y a un glissement aussi des divers vers les rares, jaune blanc rouge.
  • Les types x-16s cgg-cac-cca au nombre de 10 chez les gamma renforcent encore cette différence entre x et z, les 3 tRNA sont de la classe blanc, rares et non rares.
  • Comparaison des tRNA des x et z longs: Voir le tableau des types x en court et long
    - La dissymétrie quasi totale entre les bacilli (12 x-longs) qui n'ont pas de z-longs et les clostridia (5 z longs) qui n'ont qu'un seul x-long non ambigu montre bien que le processus à l'origine des avant 16s n'est pas aléatoire, c'est à dire qu'ils ne sont pas des réarrangements au hasard de blocs déjà produits par le processus de base. Cependant ce processus avant 16s paraît dérivé du processus de base. Ainsi le processus de base des bacilli donne très peu de 1-3 (voir pourcentage des z) et son processus avant ne donne que des x 9-23 longs (12) et peu de x 1-3 (6). Voir le récapitulatif. Le processus de base des clostridia donne beaucoup de 1-3 et son processus avant donne un seul x-long de 15aas et 12 x 1-3. Les clostridia donnent un bloc intéressant 5aas-16s23s5s-6aas qui s'apparente aux x 1-3 et ne peut être produit par le processus de base et donc est propre au processus avant des clostridia.
    - Les tRNA rares des x-longs: Les 12 x-longs des bacilli se différencient des 97 z-longs (tableau 97=) par le fait que les 10 blocs différents entre eux ne diffèrent que par 1 à 2 tRNA ce qui donne un tableau de tRNA très hétérogène alors que celui des z-long est homogène. C'est une propriété du processus avant des bacilli. La caractéristique des tRNA rares que j'ai montré pour les x 1-3 est moins évidente pour les x longs mais elle existe. Ainsi pour les bacilli le ctc rare chez les z-longs se trouve dans 10 x-longs comme une caractéristique de multiplication du processus avant. De même l'unique x-long des clostridia arbore 3 tRNA rares dont le plus rare d'entre eux, le ccc, les 2 autres sont gtc et ctg.
    - J'ai signalé d'autres x-longs appartenant à epsilon et aux tenericutes. Epsilon contient un tRNA rare aag et les tenericutes contiennent 5 séquences identiques, 1 x-long et 4 z-long (sans x) avec gca qui fait partie de la bascule bacilli-clostridia (ref).
  • Les x sur fond de référence des z longs des firmicutes.
  • Les réarrangements des clusters RNA (ref.) conservent les tRNA et les blocs avant-16s et surtout ne détruisent que les 16s et 23s.

Les cds intra bloc[modifier | modifier le wikicode]

cds cumuls[modifier | modifier le wikicode]

type y[modifier | modifier le wikicode]
type x z[modifier | modifier le wikicode]
  • Voir les cds des z1-3

cds synthèse[modifier | modifier le wikicode]

  • Les bacilles n'ont pas de cds intra bloc sur 288 blocs.

Synthèse blocs à RNA[modifier | modifier le wikicode]

  • Notes
    - récapitulatifs des cassés pour comparer avec les archées, 16s, 23s5s.
    - récapitulatifs des autres cassés, 16s*23s, perte du 5s
    - récapitulatifs des abîmés pour la théorie des cds

Synthèse archées[modifier | modifier le wikicode]

  1. https://fr.wikipedia.org/wiki/Th%C3%A9or%C3%A8me_central_limite
  2. https://fr.wikipedia.org/wiki/%C3%89cart_type#Exemples