Aller au contenu

Recherche:Les clusters de gènes tRNA et rRNA chez les procaryotes/Annexe/génomes synthèse

Une page de Wikiversité, la communauté pédagogique libre.
génomes synthèse
Image logo représentative de la faculté
Annexe 11
Recherche : Les clusters de gènes tRNA et rRNA chez les procaryotes
Précédent :archeo
Suivant :Atableur
En raison de limitations techniques, la typographie souhaitable du titre, « Annexe : génomes synthèse
Les clusters de gènes tRNA et rRNA chez les procaryotes/Annexe/génomes synthèse
 », n'a pu être restituée correctement ci-dessus.



Les blocs à tRNA

Les cds dans les blocs à tRNA

  • Lien tableur: cds
  • Légende:
fréquences intercalaires	fréquences cds en aa	
autour du cds				
	9				2
10	20			50	20
50	21			100	9
90	21			150	10
130	21			200	4
170	5			250	5
210	6			300	3
250	2			350	8
290	8			400	9
	113				70
génomes. Les cds dans les blocs à tRNA
génome sens adresse nom cds aa intercal
gamma autres rien
eal comp 2042057..2043241 tuf1 395 117
comp 2043359..2043431 acc gga tac aca
eco comp 1287087..1287176 tpr 30 67
comp 1287244..1287328 tac tac
4175754..4175829 acc aca tac gga 114
4175944..4177128 tufb 395
ecoN comp 2192566..2192655 tcg 93
2192749..2193546 DgsA 266 100
2193647..2193722 aac
comp 2236186..2236261 aac 4
2236266..2237909 YeeO 548 100
2238010..2238085 aac
amed comp 3913378..3913454 tgg 52
comp 3913507..3914691 cds 395 171
comp 3914863..3914937 gga
alpha
rpm comp 659042..659116 gtc 155
comp 659272..660159 hydrolase 296 106
comp 660266..660340 gtc
comp 2114823..2114899 aga 55
comp 2114955..2115251 ETC 96 71
comp 2115323..2115399 cca
2632171..2632246 gcc 166
< 2632413..2632965 transposase 184 -41
2632925..2633473 hp 183 30
comp 2633504..2633579 aca 93
comp 2633673..2634200 transferase 176 271
comp 2634472..2634561 tcg
2863981..2864056 aca 15
2864072..2864317 DUF2829 82 8
2864326..2864401 aaa
rru 1934224..1934300 cca 63
1934364..1934663 ETC 100 12
1934676..1934752 aga
comp 3124836..3125033 translocase 66 151
comp 3125185..3125260 tgg 343
comp 3125604..3126794 ef tu 397 93
comp 3126888..3126961 gga
comp 3126989..3127074 tac 37
3127112..3128158 RlmB 349 57
3128216..3128291 aca 127
3128419..3128652 hp 78
3378495..3378569 acc 237
3378807..3379370 hp 188 234
oan comp 2040234..2040453 hp 73 91
2040545..2040629 tac
2040654..2040727 gga 6
comp 2040734..2040916 hp 61 -50
2040867..2042042 ef Tu 392 65
2042108..2042183 tgg 420
2042604..2042804 translocase 67
comp 2697238..2697314 aga 123
comp 2697438..2697743 ETC 102 156
comp 2697900..2697976 cca
abq comp 748703..749161 hp 153 38
comp 749200..749275 aca 91
comp 749367..750221 RlmB 285 144
750366..750451 tac
750512..750585 gga 81
750667..751857 ef Tu 397 153
752011..752086 tgg 69
752156..752353 Translocase 66
872533..872608 atgi 5
comp 872614..873093 GNAT 160 134
comp 873228..873304 cgt
1354014..1354091 cca 49
1354141..1354437 ETC 99 10
1354448..1354524 aga
abs comp 1500772..1501110 P-II 113 338
1501449..1501524 cac
1501634..1501709 cac 129
1501839..1503305 epimerase 489 106
1503412..1504977 Manolyl CoA 522 173
1505151..1505235 cta 91
1505327..1506661 trigger factor 445
1808815..1808892 cca 49
1808942..1809238 ETC 99 10
1809249..1809325 aga
2293805..2293881 cgt 137
2294019..2294495 GNAT 159 5
comp 2294501..2294576 atgi
comp 2418203..2418400 translocase 66 69
comp 2418470..2418545 tgg 152
comp 2418698..2419888 ef Tu 397 81
comp 2419970..2420043 gga
comp 2420104..2420189 tac 144
2420334..2421188 RlmB 285 91
2421280..2421355 aca 137
2421493..2423187 integrase 565
agr 1532381..1532455 gaa 121
1532577..1532818 P-hp 81 89
1532908..1532982 gaa
1770727..1772280 integrase 518 91
comp 1772372..1772448 cca 265
1772714..1773019 ETC 102 51
1773071..1773147 aga 7
comp 1773155..1773892 DUF429 246
aua 2368353..2368429 cca 43
2368473..2368778 cds 102 36
2368815..2368890 aga
comp 2641950..2642023 tgc 153
comp < 2642177..2642443 cds 89 296
2642740..2642814 aac
beta néant
delta néant
bacilli autres rien
pmq 20252..21532 cds 427 47
21580..21666 tca 140
21807..22157 hp 117 17
22175..22357 hp 61 23
22381..22524 hp 48 86
comp 22611..22796 hp 62 138
comp 22935..25265 replicase 777 156
25422..26165 hp 248 220
comp 26386..26460 cgg 183
26644..27168 replicase 175
clostridia autres rien
hmo comp 105958..106044 ctg 321
comp 106366..106929 cds 188 241
comp 107171..107246 aca
1172120..1172196 agg 181
1172378..1172812 cds 145 62
1172875..1172966 tcg
1764087..1764161 ggc 92
comp 1764254..1764493 cds 80 72
1764566..1764641 tgc
comp 2496451..2496527 gtc
comp 2496532..2496609 atgj 175
2496785..2497120 cds 112 217
comp 2497338..2497420 ctc
*** Suivent 5 tRNAs comp ***
comp 2497882..2497958 gtg -10
comp 2497949..2498185 cds 79 66
2498252..2498328 ccg
actino autres rien
ase 1520472..1520544 aac 315
1520860..1522122 cds 421 236
1522359..1522432 atg
comp 4901908..4901981 gcg 19
comp 4902001..4902321 cds 107 23
comp 4902345..4902417 gac
*** 7 tRNAs ggc cds cag 20 tRNAs ***
6400506..6400577 ggc 25
6400603..6401055 cds 151 35
6401091..6401163 cag
bacteroide fps rien
myr comp 719769..719842 tgg 60
comp 719903..721090 cds 396 58
comp 721149..721220 acc
omp 1929840..1929925 tta 147
comp 1930073..1930444 cds 124 108
comp 1930553..1930638 tta
comp 2208797..2208872 atgf 106
comp 2208979..2209605 cds 209 147
comp 2209753..2209829 atgj
cyano npu rien
pmg comp 435678..435751 gac 149
comp 435901..436095 cds 65 35
comp 436131..436203 tgg
tenericutes
abra comp 1540706..1540780 tgg 47
comp 1540828..1541754 cds 309 137
1541892..1541967 cac
apal comp 205299..205373 tgg 73
comp 205447..206382 cds 312 133
206516..206591 cac
comp 1457388..1457463 gac 40
comp 1457504..1458355 cds 284 154
comp 1458510..1458585 ttc
*** 10 tRNAs 5s23s ***
archeo mfi mfe rien
mja 862590..862661 cga 41
862703..863392 cds 230 86
863479..863555 aca
*** 3 tRNAs 5s gac ***
mba 4618540..4618617 gaa 351
4618969..4619190 hp 74 377
4619568..4619645 gaa

Les totaux des génomes par type

  • Les six types sont: les solitaires, les multiples, les duplicata, avant 5s, après 5s >3, après 5s <4, avant 16s et après 16s. En abrégé, respectivement, 1aa >1aa dup -5s +5s >3, 5s <4 (ou 1-3aas), -16s +16s.
  • Note: le tableau de contrôle est dans le tableur
  • Lien tableur: Les totaux des génomes par type

Les totaux des types

Les totaux des types
actino >1aa 1aa -5s +5s -16s +16s duplica 1-3aas total
total 1047 912 13 751 11 304 493 135 3666
  • Note: le -16s long de 33 est compté dans les +5s >3.

La référence +5s >3

  • Lien tableur: La référence +5s >3
  • Ce sont ceux des bacilli plus ceux des clostridia parce qu'ils sont nombreux et réduits à 2 clades, donc homogènes. Tenericutes en possèdent 2 fois 11. Les arcchées en possèdent aussi, mais seulement 1 de 6aas. Voir les études plus détaillées dans les fiches qui ne concernent que les blocs à rRNA.
  • Légende:
    - Cyan pour les valeurs faibles, total 19 pour 21 tRNAs.
    - Jaune pour les valeurs fortes et en gras les plus fortes, total 474 pour 14 tRNAs
    - blanc pour les valeurs intermédiaires, gca et atc le sont aussi, total 236 pour 16 tRNAs.
    - Le rouge pour l'emplacement des +16s occupés, gca et atc.
    - Les encadrés sont les emplacements des 1-3aas des +5s de alpha + gamma.
    - Le -16s de 33 aas est compté ici comme un +5s long (inversion).
Bacilli + clostridia. Les +5s >3 de référence.
g1    t1          
atgi 12 tct tat atgf 29
att act aat agt
ctt cct cat cgt
gtt gct gat ggt
ttc 26 tcc 10 tac 26 tgc 17
atc 15 acc 9 aac 38 agc 15
ctc 4 ccc 2 cac 20 cgc 30
gtc 5 gcc 1 gac 39 ggc 38
tta 22 tca 17 taa tga
ata aca 31 aaa 39 aga 15
cta 20 cca 33 caa 29 cga
gta 49 gca 15 gaa 42 gga 25
ttg 7 tcg 2 tag tgg 12
atgj 21 acg 2 aag agg
ctg 9 ccg 1 cag cgg
gtg gcg gag 1 ggg 1
5s-bc inter min max total
total 236 19 474 729

totaux par rapport au groupe de référence

bacts. Comparaison avec la référence
tRNAs blocs tRNAs blocs rRNAs
bacts 1aa >1aa dup +5s 1-3aas autres total
21 faible 317 124 114 19 2 7 583
16 moyen 345 327 80 246 43 253 1294
14 fort 250 596 299 486 90 68 1789
912 1047 493 751 135 328 3666
10 g+cga 151 68 57 7 283
2 agg+cgg 55 11 12 1 79
4 carre ccc 93 41 55 1 7 197
5 autres 18 4 2 24
317 124 114 19 2 7 583
total tRNAs ‰
bacts 1aa >1aa dup +5s 1-3aas autres bacts ‰ ref.‰
21 faible 86 34 31 5 1 2 159 26
16 moyen 94 89 22 67 12 69 353 324
14 fort 68 163 82 133 25 19 488 650
249 286 134 205 37 89 3666 729
10 g+cgg 41 19 16 2 77 10
2 agg+cga 15 3 3 0.3 22
4 carre ccc 25 11 15 0.3 2 54 16
5 autres 5 1.1 0.5 7
86 34 31 5 0.5 2 159
blocs tRNAs ‰ total colonne %
bacts 1aa >1aa dup total ref.‰ 1aa >1aa dup
21 faible 129 51 46 226 26 35 12 23
16 moyen 141 133 33 307 324 38 31 16
14 fort 102 243 122 467 650 27 57 61
372 427 201 2452 729 912 1047 493
10 g+cgg 62 28 23 113 10 48 55 50
2 agg+cga 22 4 27 17 9
4 carre ccc 38 17 22 77 16 29 33 48
5 autres 7 2 0.8 10 6 3 2
129 51 46 226 317 124 114

Caractérisation des tRNAs

Caractérisation d'un tRNA par les 4 processus +5s 1aa >1aa duplication

  • Lien tableur: Caractérisation d'un tRNA par les 4 processus +5s 1aa >1aa duplication
  • Le groupe de référence: voir la référence. Ici les intermédiaires sont remplacés par le vert au lieu du blanc. La colonne +5s représente la référence (729) plus ceux des tenericutes (22, 2*11) ce qui ne change pas l'ordre de son classement: atgijf ttc tta gta aaa tca aca gca gac.
  • Légende:
    - carré ccc, c'est ctc gtc ccc gcc
    - g+cga, c'est gtg xcg xag ggg cga (dans l'hypothèse de la bascule des cgx, cgt/cgc cga/cgg)
Synthèse des 44 génomes. Caractérisation de chaque tRNA par les 4 processus: +5s 1aa >1aa duplication
Caractérisation par les effectifs
g1 +5s 1aa >1aa dup t1 +5s 1aa >1aa dup +5s 1aa >1aa dup +5s 1aa >1aa dup
atgi 14 30 7 2 tct tat atgf 31 30 36 30
att act 3 aat agt 1
ctt 4 3 2 cct cat cgc
gtt gct gat ggt
ttc 28 21 35 9 tcc 10 37 6 2 tac 26 7 44 28 tgc 17 16 38 4
atc 15 4 7 2 acc 9 18 22 5 aac 38 28 35 22 agc 15 18 34
ctc 4 30 15 2 ccc 2 28 1 cac 20 14 34 11 cgt 30 15 19 49
gtc 5 19 11 28 gcc 1 16 14 25 gac 41 14 54 13 ggc 38 17 59 43
tta 24 18 31 2 tca 19 36 12 4 taa tga 9
ata 1 1 0 aca 33 19 43 7 aaa 41 17 44 25 aga 15 29 21 2
cta 20 21 32 8 cca 33 20 39 4 caa 29 19 37 12 cga 3 7
gta 51 13 54 26 gca 17 4 7 gaa 42 15 52 25 gga 25 15 45 6
ttg 7 34 8 2 tcg 2 26 5 tag tgg 12 31 13 2
atgj 23 15 39 6 acg 2 28 5 aag 18 12 16 agg 31 1
ctg 9 20 16 28 ccg 1 15 4 8 cag 9 14 10 cgg 24 10
gtg 10 5 8 gcg 13 5 3 gag 1 9 5 12 ggg 1 20 6
Caractérisation par la relativité des 4 processus: chaque processus est rapporté à 1000 tRNAs.
g1 +5s 1aa >1aa dup t1 +5s 1aa >1aa dup +5s 1aa >1aa dup +5s 1aa >1aa dup
atgi 19 33 7 4 tct tat atgf 41 33 34 61
att act 0 3 0 0 aat agt *1
ctt 0 4 3 4 cct cat cgc
gtt gct gat ggt
ttc 37 23 33 18 tcc 13 41 6 4 tac 35 8 42 57 tgc 23 18 36 8
atc 20 4 7 4 acc 12 20 21 10 aac 51 31 33 45 agc 20 20 32 0
ctc 5 33 14 4 ccc 3 31 1 0 cac 27 15 32 22 cgt 40 16 18 99
gtc 7 21 11 57 gcc 1 18 13 51 gac 55 15 52 26 ggc 51 19 56 87
tta 32 20 30 4 tca 25 39 11 8 taa tga 0 10 0 0
ata *1 *1 aca 44 21 41 14 aaa 55 19 42 51 aga 20 32 20 4
cta 27 23 31 16 cca 44 22 37 8 caa 39 21 35 24 cga 0 3 7 0
gta 68 14 52 53 gca 23 4 7 0 gaa 56 16 50 51 gga 33 16 43 12
ttg 9 37 8 4 tcg 3 29 5 0 tag tgg 16 34 12 4
atgj 31 16 37 12 acg 3 31 5 0 aag 0 20 11 32 agg 0 34 1 0
ctg 12 22 15 57 ccg 1 16 4 16 cag 0 10 13 20 cgg 0 26 10 0
gtg 0 11 5 16 gcg 0 14 5 6 gag 1 10 5 24 ggg 1 22 6 0

Construction du tableau avec les sous-totaux

Définition des classes pour les 4 types

  • Notes: Dans le tableau ci-dessus de la caractérisation des tRNAs rapportée à 1000 pour chaque type, 2ème tableau, les nombres en gras commencent à partir de 26 et sont au nombre de 64. Ce sont les plus élevés, ils incluent les nombres non gras des +5s colorés en jaune. On peut les diviser en
    - forts (les jaunes sans gras de la référence) de 26 à 37 au nombre de 32.
    - très forts (les gras jaunes de la références) de 39/1000 et plus, au nombre de 32
    - Les valeurs les plus faibles seraient inférieures à 10/1000 et sont au nombre de 68 dont 23 zéros. Les tRNAs ata et agt ne sont pas pris en compte (*). Le reste est divisé en
    - moyen faibles de 10 à 16 au nombre de 33, et en
    - moyen forts de 18 à 25 au nombre de 31.
    - Les nombres en gras du 1er tableau sont ceux de la référence (+5s) relativisés pour les duplications qui ont un total 50% inférieur à la référence. Les ruptures des types rapportés à 1000 tRNAs confirment et harmonisent le 1er tableau.
    - NB.SI, fonction calc utilisée.
0	23		16	9		32	5		48	0	
1	6		17	0		33	6		49	0	
2	0		18	4		34	3		50	1	
3	6		19	3		35	2		51	5	
4	13		20	9		36	1		52	2	
5	6		21	4		37	4		53	1	
6	3		22	4		38	0		54	0	
7	5		23	4		39	2		55	2	
8	5		24	2		40	1		56	2	
9	1		25	1		41	3		57	3	
10	5		26	2		42	2		61	1	
11	4		27	2		43	1		68	1	
12	5		28	0		44	2		87	1	
13	3		29	1		45	1		99	1	
14	4		30	1		46	0				
15	3		31	5		47	0				
	92			51			33			20	196

Les processus +16s -16s -5s 1-3aas

Récapitulatifs

  • D'après les distributions des totaux: liens

gama alpha baci clos bact actino cyano tener

  • Légendes: alpha* pour alpha+beta+delta, btc pour bacteroide tenericutes cyano
+16s	gca	atc	aaa	gta	gcc	gaa	total
gama	29	23	8	8	2	33	103
clos	26	11			5		42
afn	2	2					4
baci	16	15					31
alpha*	37	43					80
b t c	21	23					44
actino	0	0	0	0	0	0	0
total	131	117	8	8	7	33	304
total 1-3aas					
	alpha	gama	baci	clos	tener
atgf	23		2	2	
gac		23	2	1	
aac			4	7	6
acc		9	1	1	
tgg		8		1	
tca		4			
gaa		1		2	
tcc			1		
total	23	45	10	14	6
autres				37	
-16s	2gga 2tac aac agc atc cgt gca tca tcc		
-5s	3aca 5gga 5aac

Les processus +16s -16s 1-3aas -5s comparés à la référence

Distribution des totaux 1-3aas +16s -16s -5s.
Total 1-3aas
g1    t1       
atgi 8 tct tat atgf 27
att act aat agt
ctt cct cat cgt
gtt gct gat ggt
ttc 6 tcc 1 tac tgc 1
atc acc 11 aac 17 agc
ctc 1 ccc cac cgc
gtc gcc gac 26 ggc 4
tta 4 tca 4 taa tga
ata aca aaa 6 aga 1
cta cca caa cga
gta gca 4 gaa 3 gga 1
ttg tcg tag tgg 9
atgj acg aag agg
ctg ccg cag cgg 1
gtg gcg gag ggg
baci clos clos alpha tener gama total
10 47 4 23 6 45 135
Total 1-3aas avec la référence +5s
g1    t1       
atgi 8 tct tat atgf 27
att act aat agt
ctt cct cat cgt
gtt gct gat ggt
ttc 6 tcc 1 tac tgc 1
atc acc 11 aac 17 agc
ctc 1 ccc cac 0 cgc
gtc gcc gac 26 ggc 4
tta 4 tca 4 taa tga
ata aca aaa 6 aga 1
cta cca caa cga
gta gca 4 gaa 3 gga 1
ttg tcg tag tgg 9
atgj acg aag agg
ctg ccg cag cgg 1
gtg gcg gag ggg
inter max min total
43 90 2 135
Total +16s avec la référence +5s
g1    t1       
atgi tct tat atgf
att act aat agt
ctt cct cat cgt
gtt gct gat ggt
ttc tcc tac tgc
atc 117 acc aac agc
ctc ccc cac cgc
gtc gcc 7 gac ggc
tta tca taa tga
ata aca aaa 8 aga
cta cca caa cga
gta 8 gca 131 gaa 33 gga
ttg tcg tag tgg
atgj acg aag agg
ctg ccg cag cgg
gtg gcg gag ggg
inter max min total
248 49 7 304
Total -16s -5s avec la référence +5s
g1    t1       
atgi tct tat atgf
att act aat agt
ctt cct cat cgt
gtt gct gat ggt
ttc tcc 1 tac 2 tgc
atc 1 acc aac 6 agc 1
ctc ccc cac cgc 1
gtc gcc gac ggc
tta tca 1 taa tga
ata aca 3 aaa aga
cta cca caa cga
gta gca 1 gaa gga 7
ttg tcg tag tgg
atgj acg aag agg
ctg ccg cag cgg
gtg gcg gag ggg
inter max min total
5 19 0 24

Les processus +16s et 1-3aas des fiches mémoires

  • Lien tableur: Les processus +16s et 1-3aas des fiches mémoires
  • Le groupe de référence: voir la référence
  • Légende:
    - carré ccc, c'est ctc gtc ccc gcc
    - g+cga, c'est gtg xcg xag ggg cga (dans l'hypothèse de la bascule des cgx, cgt/cgc cga/cgg)
  • Note: Ces 2 processus ont été comptabilisés sur de plus grands effectifs dans les fiches mémoires par clade. La comparaison des effectifs avec ceux des annexes montrent qu'ils sont semblables statistiquement. Voir la synthèse des +16s et des 1-3aas.
Distribution des +16s et des 1-3aas des fiches mémoires, avec la référence +5s.
Effectifs des +16s
g1    t1       
atgi cds 121 16s 1039 atgf 2
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc tcc tac tgc
atc 1235 acc aac agc
ctc ccc cac cgt
gtc gcc 11 gac ggc
tta tca taa tga
ata aca aaa 11 aga
cta cca 4 caa cga
gta 13 gca 1249 gaa 272 gga
ttg tcg tag tgg
atgj acg aag agg
ctg ccg cag cgg
gtg gcg gag ggg
inter max min total
2484 302 11 2797
Les +16s rapportés à 1000 tRNAs.
g1    t1       
atgi tct tat atgf 1
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc tcc tac tgc
atc 442 acc aac agc
ctc ccc cac cgt
gtc gcc 4 gac ggc
tta tca taa tga
ata aca aaa 4 aga
cta cca 1 caa cga
gta 5 gca 447 gaa 97 gga
ttg tcg tag tgg
atgj acg aag agg
ctg ccg cag cgg
gtg gcg gag ggg
inter max min total
888 108 4 1000
Effectifs des 1-3aas
g1    t1       
atgi 15 tct tat atgf 172
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc 21 tcc 2 tac 12 tgc 7
atc 3 acc 82 aac 73 agc 1
ctc 2 ccc cac 2 cgt 4
gtc gcc gac 172 ggc 12
tta 5 tca 5 taa tga
ata aca 1 aaa 17 aga 1
cta cca 1 caa 1 cga
gta 5 gca 14 gaa 7 gga 12
ttg tcg tag tgg 78
atgj 1 acg 1 aag agg
ctg 1 ccg cag cgg 2
gtg 1 gcg gag ggg 2
inter max min total
218 510 8 736
Les 1-3aas rapportés à 1000 tRNAs.
g1    t1       
atgi 20 tct tat atgf 234
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc 29 tcc 3 tac 16 tgc 10
atc 4 acc 111 aac 99 agc 1
ctc 3 ccc cac 3 cgt 5
gtc gcc gac 234 ggc 16
tta 7 tca 7 taa tga
ata aca 1 aaa 23 aga 1
cta cca 1 caa 1 cga
gta 7 gca 19 gaa 10 gga 16
ttg tcg tag tgg 106
atgj 1 acg 1 aag agg
ctg 1 ccg cag cgg 3
gtg 1 gcg gag ggg 3
inter max min total
296 693 11 1000

Classement des tRNAs avec les 8 processus

Classement des tRNAs rapportés à 1000 par processus
Classement avec les processus +5s et >1aa.
tRNA +5s 1aa >1aa dup 1-3aas +16s
atgf 41 33 34 61 234 1
aac 51 31 33 45 99 -
I
gaa 56 16 50 51 10 97
gac 55 15 52 26 234 -
gta 68 14 52 53 7 5
aaa 55 19 42 51 23 4
ggc 51 19 56 87 16 -
tac 35 8 42 57 7 -
II
aca 44 21 41 14 1 -
cca 44 22 37 8 1 2
caa 39 21 35 24 1 -
ttc 37 23 33 18 29 -
gga 33 16 43 12 16 -
tta 32 20 30 4 7 -
atgj 31 16 37 12 1 -
cta 27 23 31 16 - -
cac 27 15 32 22 3 -
III
tgc 23 18 36 8 10 -
agc 20 20 32 0 1 -
IV
cgt 40 16 18 99 5 -
V
gca 23 4 7 0 19 447
atc 20 4 7 4 4 442
VI
acc 12 20 21 10 111 -
tgg 16 34 12 4 106 -
Classement avec les processus 1aa et dup
tRNA +5s 1aa >1aa dup 1-3aas +16s
tca 25 39 11 8 7 -
aga 20 32 20 4 1 -
atgi 19 33 7 4 20 -
tcc 13 41 6 4 3 -
ttg 9 37 8 4 - -
ctc 5 33 14 4 3 -
I
ccc 3 31 1 0 - -
tcg 3 29 5 0 - -
acg 3 31 5 0 1 -
agg 0 34 1 0 - -
cgg 0 26 10 0 3 -
ggg 1 22 6 0 3 -
II
ctg 12 22 15 57 1 -
gtc 7 21 11 57 - -
gcc 1 18 13 51 - 4
aag 0 20 11 32 - -
gag 1 10 5 24 - -
cag 0 10 13 20 - -
ccg 1 16 4 16 - -
gtg 0 11 5 16 1 -
gcg 0 14 5 6 - -
III
cga 0 3 7 0 - -
ata 0 1 1 0 - -
tga 0 10 0 0 - -
IV
ctt 0 4 3 4 - -
act 0 3 0 0 - -
agt 0 1 0 0 - -

Les intercalaires entre cds d'un génome

  • Note: Pour les génomes des annexes j'ai relevé les intercalaires entre tRNAs et entre ceux-ci et les cds qui leur sont adjacents. L'exemple est celui de rru du clade alpha. L'idée de départ de ces prélèvements est la recherche d'opérons formés de tRNA et de protéine comme dans le cas d'E.coli: l'intercalaire entre le tRNA et la protéine devrait être faible. Voir l'exemple d'eco (remarque @3) avec tac-tac-tpr et aca-tac-gga-acc-tufB.

Méthode de prélèvement

  1. Afficher le NCBI et relever taille et date
  2. Copier dans txt et rechercher join( et résoudre ses adresses en adresses uniques
  3. copier dans un calc temporaire pour faciliter les sélecitions début ou fin
  4. select ctrl+Maj+fin et trier croissant. Le curseur est à la fin. Rechercher (ctrl+H) tRNA précédent.
  5. select ctrl+Maj+fin et supprimer
  6. se posirionner au début ctrl+début et rechercher (ctrl+H) ‘ CDS ‘ suivant sans les cotes
  7. mettre le curseur loin à droite et effacer le début, ctrl+Maj+début.
  8. Le curseur est au début rechercher CDS suivant puis sélectionner ctrl+Maj+fin et coller au début de la feuille
  9. sans séléction remplacer CDS gene rRNA tRNA en ajoutant (;)
  10. rechercher tRNA; suivant et ajouter (;) aux gènes restants, ncRNA misc regulatory. Vérifier s’il n’y a pas d’autres entre CDS; et gene; .
  11. suprimer la ligne où le gène est ‘source’.
  12. sélect tout ctrl+Maj+fin, copier dans txt puis dans le calc temporaire à de la première colonne avec les (;)
  13. Sélect la colonne contenant les adresses, ctrl+H et enlever les blancs ( <)> et lexpression régulière [:alph:] .
  14. remplacer les 2 points des adresses .. en ; en copiant la colonne dans txt et ctrl H . Puis copier le tout en 2 colonnes dans calc en écrasant la colonne des adresses modifiée.
  15. sur la colonne à gauche des adresses en colonne numéroter en séquence gene puis CDS puis le reste 1 puis formule cellule de 1, + 1. Couper la formule et select la plage, coller et couper coller format.
  16. sauvegarder le tout dans le calc de travail. Copier les 4 dernières colonnes dans le calc temporaire nettoyé.
  17. dans le temporaire, trier d’abord sur la colonne 1 des numéros, puis trier sur 1ère et 2ème adresse
  18. A ce moment gene et CDS sont dans ce sens pour la même adresse.
  19. Dans le cas où la 1ère adresse est identique à celle du gène et que les 2 2èmes adresses sont différentes, dans le cas où le CDS n’existe pas, les 2 différences entre 2 lignes succesives pour les 2 1ères adresses et les 2 2èmes adresses, sur la ligne gene, seront différentes. Les différences sur la ligne suivante seront différentes en général.
  20. En triant sur les 2 différences tous les gene avec 0 et 0 sur leur ligne sont à suprimer.
  21. On supprime les 2 colonnes des différences et on trie le reste sur 1ère et 2ème adresse. On calcule les intercalaires toujours: écriture de la formule, la couper, ctrl+Maj+fin, réduire à la colonne et coller puis couper et coller format.
  22. on colorie les CDS de la colonne des gènes. Les gènes différents apparaissent en clair
  23. Sur la colonne de gauche du pavé deb à côté du CDS du début et fin à côté du CDS de fin encadrant le gène en clair
  24. deb-fin
    - Trier en 1er sur la colonne deb-fin et en 2ème la colonne CDS, copier les lignes avec deb et fin et les sauvegarder plus loin.
    - Suprimer du pavé principal les lignes deb.
    - Copier les lignes en clair qui se trouvent à la fin du pave et les coller sous les lignes du pavé deb-fin sauvegardé.
    - Trier le reste du pavé sur adresse1 et 2 et le positionner en haut de la feuille. C’est le pavé du travail qui suit.