Aller au contenu

Recherche:Les clusters de gènes tRNA et rRNA chez les procaryotes/Annexe/archeo

Une page de Wikiversité, la communauté pédagogique libre.
archeo
Image logo représentative de la faculté
Annexe 10
Recherche : Les clusters de gènes tRNA et rRNA chez les procaryotes
Précédent :spiro
Suivant :génomes synthèse
En raison de limitations techniques, la typographie souhaitable du titre, « Annexe : archeo
Les clusters de gènes tRNA et rRNA chez les procaryotes/Annexe/archeo
 », n'a pu être restituée correctement ci-dessus.



Methanobacterium formicicum DSM1535

[modifier | modifier le wikicode]
  • Lien tableur: mfi opérons
  • Liens: gtRNAdb [1], NCBI [2], génome [orgn]
  • Phylogénie: Archaea; Euryarchaeota; Methanomada group; Methanobacteria; Methanobacteriales; Methanobacteriaceae; Methanobacterium.
  • Légende: cdsa: cds aas, cdsd: cds dirigé
Ar1. mfi opérons, Methanobacterium formicicum DSM1535
41.2%GC 17.8.19 Paris  47   doubles intercal cds aa avec aa cdsa cdsd protéines
157153..157563 CDS 36 36 137
comp 157600..157683 ctc 246 246
157930..158232 CDS 101
comp 211693..213681 CDS 206 206 663
213888..213971 tcg 281 281
214253..215677 CDS 475
comp 314088..314264 CDS 50 50 59
comp 314315..314487 caa @1 -1 -1
comp 314487..314654 CDS 56
comp 317759..318211 CDS 198 198 151
comp 318410..318494 tcc 177 177
comp 318672..319634 CDS 321
comp 419250..419975 CDS 156 156 242
comp 420132..420204 aac 29 29
comp 420234..420545 CDS 104
comp 466570..467484 CDS 223 223 305
comp 467708..467792 agc 186 186
comp 467979..468294 ncRNA @2 122 122 316
468417..469397 CDS 327
681116..681676 CDS 37 37 187
comp 681714..681786 gcg 195 195
comp 681982..682488 CDS 169
695936..696538 CDS 939 939 201
comp 697478..697600 5s 305 123
comp 697906..700772 23s 233 2867
comp 701006..701079 gca 87
comp 701167..702646 16s 724 724 1480
703371..704336 CDS 322
comp 746487..747290 CDS 155 155 268
comp 747446..747518 acc 85 85
comp 747604..747686 tta 303 303
747990..748163 CDS 58
comp 800615..801820 CDS 43 43 402
comp 801864..801935 caa 72 72
comp 802008..802697 CDS 230
comp 963425..964432 CDS 273 273 336
964706..964778 aac 5 5
964784..964857 atgi 58 58
964916..964990 gaa 53 53
965044..965127 cta 29 29
965157..965232 cac 146 146
965379..965717 CDS 113
comp 974621..974842 CDS 564 564 74
975407..975480 aag 90 90
975571..975653 ttg 504 504
976158..976231 aaa 148 148
comp 976380..976679 CDS 100
comp 1006329..1008095 CDS 397 397 589
1008493..1008614 5s @3 748 122
1009363..1009485 5s 286 123
1009772..1012638 23s 233 2867
1012872..1012945 gca 72
1013018..1014497 16s 454 454 1480
1014952..1016097 CDS 382
comp 1088211..1088831 CDS 53 53 207
comp 1088885..1089038 tgg @1 40 40
comp 1089079..1089150 tgc 212 212
comp 1089363..1089746 CDS 128
1143658..1144137 CDS 166 166 160
comp 1144304..1144610 ncRNA @2 14 14 307
comp 1144625..1144699 atgf 139 139
comp 1144839..1145162 CDS 108
1153368..1154087 CDS 56 56 240
1154144..1154217 aga 62 62
1154280..1154354 agg 552 552
comp 1154907..1156157 CDS 417
1247204..1247659 CDS 4 4 152
comp 1247664..1247739 cga 133 133
comp 1247873..1248481 CDS 203
comp 1320721..1321641 CDS 183 183 307
1321825..1321896 gta 99 99
1321996..1322067 gtg 228 228
comp 1322296..1323084 CDS 263
comp 1403886..1409507 CDS 351 351 1874
comp 1409859..1409930 cgc 222 222
comp 1410153..1410620 CDS 156
1532795..1533088 CDS 127 127 98
comp 1533216..1533325 atgj @1 246 246
1533572..1534402 CDS 277
1541929..1542321 CDS 127 127 131
1542449..1542522 ggg 1 1
comp 1542524..1543528 CDS 335
1602054..1603277 CDS 257 257 408
1603535..1603608 aca 76 76
1603685..1603759 cca 44 44
1603804..1603877 tac 170 170
1604048..1604119 gac 7 7
1604127..1604200 aaa 24 24
1604225..1604461 CDS 79
1617553..1617861 CDS 187 187 103
1618049..1618133 tca 252 252
1618386..1619444 CDS 353
comp 1692202..1692552 CDS 271 271 117
comp 1692824..1692895 cag 156 156
comp 1693052..1693972 CDS 307
1887796..1888038 CDS 136 136 81
1888175..1888257 ctg 193 193
1888451..1891267 CDS 939
2057488..2057883 CDS 230 230 132
2058114..2058184 tgc 143 143
2058328..2059713 CDS 462
2128536..2129312 CDS 123 123 259
2129436..2129509 acg 362 362
comp 2129872..2130963 CDS
comp 2204492..2204932 CDS 178 178 147
2205111..2205182 gtc 4 4
2205187..2205259 ttc 283 283
comp 2205543..2205875 CDS 111
2317208..2317498 CDS 271 271 97
2317770..2317842 atc 460 460
2318303..2318863 CDS 187
comp 2414821..2415903 CDS 491 491 361
2416395..2416468 gcc 303 303
comp 2416772..2417797 CDS 342
comp 2432399..2432848 CDS 537 537 150
2433386..2433459 ggc 2 2
2433462..2433535 gga 326 326
comp 2433862..2434263 CDS 134
cumuls. mfi.
opérons Fréquences intercalaires tRNAs Fréquences intercalaires cds Fréquences aas cds chromosome
effectif gammes sans rRNAs avec rRNAs gammes cds gammes cdsd gammes cdsa gammes cdsa 300
avec rRNA opérons 2 1 0 - 1 2 1 100 9 30 0
16 23 5s 0 0 20 4 50 8 20 200 21 60 3
16 gca 235 2 40 2 100 3 40 300 10 90 3
16 23 5s a 0 60 3 150 10 60 400 12 120 10
max a 1 80 2 200 12 80 500 5 150 7
a doubles 0 100 3 250 8 100 600 1 180 5
autres 2 120 0 300 7 120 700 1 210 5
total aas 2 140 0 350 3 140 800 0 240 2
sans opérons 29 160 0 400 3 160 900 0 270 4
1 aa 20 180 1 450 0 180 1000 1 300 1
max a 5 200 0 500 3 200 1100 0 330 6
a doubles 0 1 5 1 15
total aas 45 16 0 64 0 61 61
total aas 47
remarques 3
avec jaune moyenne 83 224 266
variance 121 176 265
sans jaune moyenne 35 178 213 171
variance 27 96 115 81
  • Note: intercalaires prélevés de la colonne cds de mfi opérons dans un bloc de tRNAs uniquement. Le début du bloc est dans l'ordre des adresses, deb intercalaire entre le cds et le 1er tRNA dd bloc, fin entre le dernier tRNA et le cds terminal. J'ai procédé, dans les colonnes petit et grand, à la réorientation des blocs d'après la constatation que les blocs à rRNA ont leurs cds de début et de fin sont orientés du cds-16s au 5s-tRNAs-cds, l'intercalaire cds-16s étant plus grands que l'intercalaire avec le cds terminal. En tête de colonne est le % du nombre des intercalaires inférieurs à 201 pbs.
mfi	62			52			31			83
deb	fin		deb	fin		grand	petit		grand	petit
4	133		50	-1		50	-1		50	-1
14	139		127	1		72	43		127	1
36	246		257	24		127	1		133	4
37	195		156	29		133	4		139	14
43	72		43	72		139	14		257	24
50	-1		4	133		156	29		156	29
53	212		14	139		193	136		246	36
56	552		230	143		195	37		195	37
123	362		273	146		198	177		72	43
127	246		564	148		212	53		212	53
127	1		271	156		223	186		552	56
136	193		198	177		228	183		362	123
155	303		223	186		230	143		246	127
156	29		136	193		246	36		193	136
178	283		37	195		246	127		230	143
183	228		53	212		252	187		273	146
187	252		351	222		257	24		564	148
198	177		183	228		271	156		303	155
206	281		36	246		273	146		271	156
223	186		127	246		281	206		198	177
230	143		187	252		283	178		283	178
257	24		206	281		303	155		228	183
271	156		178	283		351	222		223	186
271	460		155	303		362	123		252	187
273	146		491	303		460	271		281	206
351	222		537	326		491	303		351	222
491	303		123	362		537	326		460	271
537	326		271	460		552	56		491	303
564	148		56	552		564	148		537	326
  • Comparaison cds-cds tRNA-cds: deb fin, c'est l'ordre des adresses et grand petit l'ordre après réorientation. Leur pourcentage est calculé par rapport à la colonne, c'est-à-dire la moitié du total des tRNA-cds.
archeo	cds total	total	<0	0-200	201-370	371-600	>600	deb	fin	grand	petit
mfi	3,381		58	1	32	20	5		18	14	9	23
‰				17	552	345	86		621	483	310	793
Ar1. mfi blocs, Methanobacterium formicicum DSM1535
CDS 939 201
5s 305 123
23s 233 2867
gca 87
16s 724 1480
CDS 322
CDS 397 589
5s 748 122
5s 286 123
23s 233 2867
gca 72
16s 454 1480
CDS 382
  • Lien tableur: mfi remarques
  • Remarques: pas de doubles mais des séquences. Il n’y a pas de cgt, on est avec les archées.
    1. @ Les introns des(gtRNAdb) archées existent pour tgg et atgj tujours. Ici en plus il y a un caa.
      - caa (Join(314315..314349,314448..314487)), l’intron empiète sur le cds d’où l’intercalaire négatif.
      - tgg ( join(1088885..1088919,1089000..1089038)), l’intron mais n’empiète pas sur les cds.
      - atgj Join(1533216..1533251,1533288..1533325), n’empiète pas sur les cds. C’est Met mais pas Il2 ni atgf.
    2. @ Ces ncRNAs sont dans le même cluster, sur le même brin qu’ un tRNA et très proche de lui, agc 186 et atgf 14. Ils sont petits respectivement 316 et 307 pbs.
    3. @ Le 5s collé au cluster du 16sgca23s5s, il se comporte comme un tRNA. Il a une pb de moins que les 2 autres 5s.
  • Séquence des doubles: aucun double dans une séquence. Les doubles exitants sont gca aac aaa caa tgc.
  • Tableau du code génétique de mfi
    Légende: prélèvement de la base gtRNAdb le 17.8.19
    • - totaux en en-tête, 47 total de gtRNAdb contenant des pseudo et inconnus; 47 total du cumul.
    • - atgi, c'est Ile2, mis à la place de ttt, très rare chez les procaryotes.
    • - atgf, c'est Metf, mis à la place de tgt, très rare chez les procaryotes.
    • - atgj, c'est Met, remplace le atg standard qui est la somme Ile2 Metf Met.
    • - Voir la légende des tris et couleurs, g1 t1.
Ar1. mfi, Methanobacterium formicicum DSM1535
g1    t1       47  47
atgi 1 tct tat atgf 1
att act aat agt
ctt cct cat cgt
gtt gct gat ggt
ttc 1 tcc 1 tac 1 tgc 2
atc 1 acc 1 aac 2 agc 1
ctc 1 ccc cac 1 cgc 1
gtc 1 gcc 1 gac 1 ggc 1
tta 1 tca 1 taa tga
ata aca 1 aaa 2 aga 1
cta 1 cca 1 caa 2 cga 1
gta 1 gca 2 gaa 1 gga 1
ttg 1 tcg 1 tag tgg 1
atgj 1 acg 1 aag 1 agg 1
ctg 1 ccg cag 1 cgg
gtg 1 gcg 1 gag ggg 1

mfi distribution

[modifier | modifier le wikicode]
Ar1. mfi distribution. Methanobacterium formicicum DSM1535. Archée
g1    t1       
atgi 1 tct tat atgf 1
att act aat agt
ctt cct cat cgt
gtt gct gat ggt
ttc 1 tcc 1 tac 1 tgc 2
atc 1 acc 1 aac 2 agc 1
ctc 1 ccc cac 1 cgc 1
gtc 1 gcc 1 gac 1 ggc 1
tta 1 tca 1 taa tga
ata aca 1 aaa 2 aga 1
cta 1 cca 1 caa 2 cga 1
gta 1 gca 2 gaa 1 gga 1
ttg 1 tcg 1 tag tgg 1
atgj 1 acg 1 aag 1 agg 1
ctg 1 ccg cag 1 cgg
gtg 1 gcg 1 gag ggg 1
arch >1aa =1aa -5s +5s -16s +16s total
mfi 25 20 * 2 47

mfi. Intergen51

[modifier | modifier le wikicode]

Intergen51. mfi. Le génome

[modifier | modifier le wikicode]
  • mfi Le prélèvement: Aapal
  • Le nom et le lien NCBI: mfi, Methanobacterium formicicum genome assembly DSM1535, chromosome:chrI, NCBI [3], date 25.9.19.
  • mfi La longueur totale des intercalaires, longueur du génome et taux intercalaires/génome:
Nom	intercals	génome		taux en %			
mfi	403,834		2,478,074	16.3	
mfi données intercalaires
[modifier | modifier le wikicode]
mfi données intercalaires 200
[modifier | modifier le wikicode]
mfi autres intercalaires aas
[modifier | modifier le wikicode]

Intergen51. mfi. Les différents types d'intercalaires

[modifier | modifier le wikicode]
  • Lien au tableur: Intergen51. mfi les différents types d'intercalaires.
  • Légende:
    - S pour intercalaire CDS-CDS et R pour tRNA-CDS,
    - c pour intercalaire continu (les 2 gènes sont sur le même brin) et x pour discontinu (les 2 gènes sont sur 2 brins différents, le brin et son complément)
    - %reste = 100*reste/total, le reste étant ce qui reste du total après la fin du diagramme, gamme.
    - %t30 = 100*t30/total, t30 étant le total des fréquences 10 20 30
    - %t5 = 100*t/total, t5 étant le total des fréquences de -1 à -5 dans le diagramme des S-.
Int51.2 mfi les différents types d'intercalaires entre gène
Int51.21 Les différents types
intercalaires CDS-CDS * autres intercalaires
continu S+ S- S0 total c/x RNA-RNA CDS-rRNA total
c 1,516 167 29 1,712 2.7 23 1 24
x 626 5 0 631 0 3 3
t 2,142 172 29 2,343 23 4 27
% 91.4 7.3 1.2
Int51.22 Détail des * autres intercalaires
intercalaires tRNA-CDS récapitulatif des * autres intercalaires
continu R+ R- R0 total c/x * autres total %
c 33 1 0 34 1.5 tRNA-CDS 56 64
x 22 0 0 22 RNA-RNA 23 26
t 55 1 0 56 CDS-rRNA 4 5
% 98.2 1.8 0.0 non RNA 4 5
- total 87 100
Int51.23 Les taux remarquables
taux %reste %t30 %t5 %0
type S+ R+ S- S+ R+ S- S+ R+
gamme 400 400 6-50 - - - - -
type S+ R+ S- S+ R+ S- S+ R+
c 6.0 2.9 4.2 20.2 5.9 55 1.7 0.0
x 15.8 18.2 40.0 5.8 9.1 20 0.0 0.0

Intergen51. mfi. Les diagrammes CDS-CDS positifs

[modifier | modifier le wikicode]
  • Lien tableur: mfi données intercalaires
  • Diagrammes:
    - fc40, CDS-CDS continu, fréquence unitaire en abscisses et effectif en ordonnées mfi fc40
    - fx%, CDS-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et pourcentage en ‰ par rapport au total, en ordonnées. mfi fx1
  • Équations des courbes de tendance en pour 1000: colonnes %fx %fc
Courbes de tendances pour les diagrammes en pour 1000			Calculs des f.41	mfi
R2	x3		x2		x		c		Inflexion poly3	x	c
0.600	2.45E-06	-1.82E-03	3.38E-01	11.20	fx1	abscisse	246.8	164.3
0.837	-1.93E-06	1.64E-03	-5.19E-01	71.0	fc1	ordonnée	20.9	25.1
								
0.646	3.39E-06	-2.51E-03	4.92E-01	1.36	fx41			
0.937	1.27E-06	-6.26E-04	-4.42E-02	43.6	fc41			
  • Le rfin après 400 est de 93 sur un total de 1545 . Jusqu'à 1% les freq10 sont en continu jusqu'à 720 , reste 15 . L'indice i.rfin1 = 78/320=0,244.
  • Moyennes glissantes fc+400, diagonale. Voir le détail des calculs dans abs.
données	mfi		calculs			poly3	mfi
effect	1545		R2.21	686		abscis	400
xm	25		pte	9,85		flexa	187
ym	5		cste	3,48		flexo	2,17
x1m	252		r400l	148		xm	25
y1m	1		restp	175,40		sup4	202,1
rfin	60,19		%sd	32,57		sup4t	514,6
bornf	160		lond	227		%	39,3
supd	202,6		%sf	32,62		long	162
supdt	622,0		lonf	135		R2	501
xmp	202,59		sf/lf	1,12			
r400	115,21		sr/lr	0,56			
supf	151,2		sd/ld	0,89			
supft	463,4		i.r400	0,78									

Intergen51. mfi. Les CDS-CDS négatifs

[modifier | modifier le wikicode]
Sous-totaux	mfi			totale	
fréquence	x-	c-		x-	c-
 - 1		0	22		4	4140
 - 2		0	0		85	11
 - 3		0	0		3	12
 - 4		1	70		717	10938
 - 5		0	0		5	19
sp6		4	75		1642	8424
total		5	167		2,456	23,544
reste		2	7		264	420
s6		1	0		361	41
s7		0	13		321	1438
s8		1	55		696	6525
rappot s1-5						
4/2/1		-	3.2		8.4	2.6
% / sp6						
s6/sp6		25.0	0.0		22.0	0.5
s7/sp6		0.0	17.3		19.5	17.1
s8/sp6		25.0	73.3		42.4	77.5
reste/sp6	50.0	9.3		16.1	5.0
						
total s1-5	1	92		814	15120
% / total						
%s1-5		20.0	55.1		33.1	64.2
%sp6		80.0	44.9		66.9	35.8

Intergen51. mfi. Les intercalaires des blocs

[modifier | modifier le wikicode]
  • Le détail
RNA-RNA		c	x		CDS-RNA		c	x
23s 5s		2			CDS 16s		1	1
16s 23s					5s CDS			2
16s tRNA	2			16 CDS			
tRNA 23s	2			CDS 5s			
5s tRNA					23s CDS			
tRNA in					CDS 23s			
tRNA contig				5s 16s			
tRNA hors	16			16s16s			
tRNA 16s								
23s tRNA								
tRNA 5s								
16s 5s								
5s 23s								
5s 5s		1						
total		23	0		total		1	3

  • Les rares voir gamma pour la longueur des intercalaires
  • Les tRNA-CDS compris, comparaison dans le clade et dans l'étude.

Intergen51. mfi. Les intercalaires tRNA-tRNA extra bloc

[modifier | modifier le wikicode]

Methanocaldococcus jannaschii DSM 2661

[modifier | modifier le wikicode]
  • Lien tableur: mja opérons
  • Liens: gtRNAdb [4], NCBI [5], génome [6]
  • Phylogénie: Archaea; Euryarchaeota; Methanomada group; Methanococci; Methanococcales; Methanocaldococcaceae; Methanocaldococcus.
  • Légende: cdsa: cds aas, cdsd: cds dirigé
Ar2. mja opérons, Methanocaldococcus jannaschii DSM 2661
31.3%GC 17.8.19 Paris  37   doubles intercal cds aa avec aa cdsa cdsd protéines
comp 96499..97053 CDS 372 372 185
comp 97426..97537 atgj @1 91 91
97629..97716 ctc 241 241
97958..99259 CDS 434
comp 110328..111545 CDS 222 222 406
111768..111852 tga 21 21
111874..112785 CDS 304
137244..138245 CDS 98 98 334
comp 138344..138419 gtg 59 59
comp 138479..138781 CDS 101
153070..154479 CDS 182 182 470
comp 154662..157639 23s 207 2978
comp 157847..157919 gca 64
comp 157984..159463 16s 340 340 1480
159804..160085 CDS 94
comp 185874..186671 CDS 306 306 266
186978..187066 tcc 71 71
187138..187590 CDS 151
190579..190800 CDS 31 31 74
190832..190908 ccc 32 32
190941..191114 CDS 58
comp 214560..215060 CDS 149 149 167
215210..215297 tta 154 154
215452..216240 CDS 263
226386..227639 CDS 64 64 418
comp 227704..227780 gcc 239 239
228020..229720 CDS 567
303613..303927 CDS 64 64 105
303992..304081 tca 230 230
comp 304312..304752 CDS 147
comp 357984..358547 CDS 220 220 188
358768..358845 aga 23 23
358869..358943 gaa 164 164
359108..359923 CDS 272
359108..359923 CDS 48 48 272
comp 359972..360047 atgf 103 103
comp 360151..361485 CDS 445
401945..402796 CDS 171 171 284
comp 402968..403044 gtc 229 229
403274..403834 CDS 187
comp 618311..618757 CDS 402 402 149
comp 619160..619234 tgc 63 63
comp 619298..619915 CDS 206
636394..637449 CDS 133 133 352
637583..637659 ttc 7 7
637667..637742 aac 29 29
637772..637849 atgi 18 18
637868..637942 gaa 39 39
637982..638069 cta 11 11
638081..638152 cac 295
638448..639930 16s 64 1483
639995..640067 gca 207
640275..643254 23s 78 2980
643333..643447 5s 56 115
643504..643761 ncRNA @2 232 232 258
643994..644962 CDS 323
762859..763608 CDS 157 157 250
comp 763766..763842 acc 178 178
764021..764096 caa 50 50
764147..764818 CDS 224
862207..862410 CDS 179 179 68
862590..862661 cga 41 41
862703..863392 CDS 86 86 230
863479..863555 aca 14 14
863570..863647 cca 8 8
863656..863732 tac 83 83
863816..863889 aaa 13
863903..864017 5s @3 46 115
864064..864141 gac 80 80
864222..864842 CDS 207
871492..873447 CDS 238 238 652
comp 873686..873763 atc 102 102
comp 873866..875110 CDS 415
comp 882566..883615 CDS 65 65 350
883681..883754 gta 123 123
comp 883878..884297 CDS 140
comp 1037197..1038504 CDS 39 39 436
comp 1038544..1038620 cgc @4 1 1
comp 1038622..1039386 CDS 255
comp 1148669..1149934 CDS 210 210 422
1150145..1150220 ggc 34 34
1150255..1150330 gga 243 243
1150574..1151254 CDS 227
comp 1188906..1189772 CDS 172 172 289
1189945..1190055 tgg @1 95 95
1190151..1190684 CDS 178
comp 1312335..1312781 CDS 383 383 149
1313165..1313249 agc 177 177
1313427..1314617 CDS 397
cumuls. mja.
opérons Fréquences intercalaires tRNAs Fréquences intercalaires cds Fréquences aas cds chromosome
effectif gammes sans rRNAs avec rRNAs gammes cds gammes cdsd gammes cdsa gammes cdsa 300
avec rRNA opérons 2 1 0 0 1 1 1 100 4 30 0
16 23 5s 0 0 20 0 5 50 7 20 200 12 60 1
16 atc gca 0 40 2 2 100 10 40 300 13 90 2
16 23 5s a 0 60 0 0 150 5 60 400 6 120 3
max a 7 80 0 0 200 8 80 500 8 150 4
a doubles 0 100 1 1 250 10 100 600 1 180 3
autres 2 120 0 0 300 0 120 700 1 210 5
total aas 13 140 0 0 350 2 140 800 0 240 3
sans opérons 20 160 0 0 400 2 160 900 0 270 4
1 aa 16 180 1 0 450 1 180 1000 0 300 4
max a 2 200 0 0 500 0 200 1100 0 330 2
a doubles 0 0 0 0 0 14
total aas 24 4 8 46 0 45 45
total aas 37
remarques 4
avec jaune moyenne 82 26 154 269
variance 71 25 102 137
sans jaune moyenne 29 18 152 253 194
variance 8 12 95 117 74
Ar2. mja blocs, Methanocaldococcus jannaschii DSM 2661
CDS 182
23s 207 2978
gca 64
16s 340 1480
CDS
cac 295
16s 64 1483
gca 207
23s 78 2980
5s 56 115
ncRNA 232 258
CDS
aaa 13
5s 46 115
gac 80
CDS
  • Lien tableur: mja remarques
  • Remarques: pas de doubles mais des séquences. Il n’y a pas de cgt, on est avec les archées.
    1. @ Les introns (gtRNAdb) des archées existent toujours pour tgg et atgj.
      - tgg, Join(1189945..1189984,1190018..1190055), l’ intron mais n’empiète pas sur les cds.
      - atgj, Join(97426..97464,97500..97537), n’empiète pas sur les cds. C’est Met mais pas Il2 ni atgf.
    2. @ Ce ncRNA est dans et sur le même brin que le cluster et très proche de lui, 56 au lieu de 232 avec cds. Il est petit, 258 pbs comme pour mfi.
    3. @ Le 5s est décollé du cluster du 16sgca23s, il se comporte comme un tRNA et est dans leur séquence. C’est pour ça que j’ai ces aas dans la colonne “avec rRNAs”.
    4. @ cgc très collé à ses 2 cds
  • Séquence des doubles: aucun double dans une séquence. Les doubles exitants sont gca gaa.
  • Tableau du code génétique de mja
    Légende: prélèvement de la base gtRNAdb le 17.8.19
    • - totaux en en-tête, 37 total de gtRNAdb contenant des pseudo et inconnus; 37 total du cumul.
    • - atgi, c'est Ile2, mis à la place de ttt, très rare chez les procaryotes.
    • - atgf, c'est Metf, mis à la place de tgt, très rare chez les procaryotes.
    • - atgj, c'est Met, remplace le atg standard qui est la somme Ile2 Metf Met.
    • - Voir la légende des tris et couleurs, g1 t1.
Ar2. mja, Methanocaldococcus jannaschii DSM 2661
g1    t1       37  37
atgi 1 tct tat atgf 1
att act aat agt
ctt cct cat cgt
gtt gct gat ggt
ttc 1 tcc 1 tac 1 tgc 1
atc 1 acc 1 aac 1 agc 1
ctc 1 ccc 1 cac 1 cgc 1
gtc 1 gcc 1 gac 1 ggc 1
tta 1 tca 1 taa tga 1
ata aca 1 aaa 1 aga 1
cta 1 cca 1 caa 1 cga 1
gta 1 gca 2 gaa 2 gga 1
ttg tcg tag tgg 1
atg 1 acg aag agg
ctg ccg cag cgg
gtg 1 gcg gag ggg

mja distribution

[modifier | modifier le wikicode]
Ar2. mja distribution, Methanocaldococcus jannaschii DSM 2661. Archée
g1    t1       
atgi 1 tct tat atgf 1
att act aat agt
ctt cct cat cgt
gtt gct gat ggt
ttc 1 tcc 1 tac 1 tgc 1
atc 1 acc 1 aac 1 agc 1
ctc 1 ccc 1 cac 1 cgc 1
gtc 1 gcc 1 gac 1 ggc 1
tta 1 tca 1 taa tga 1
ata aca 1 aaa 1 aga 1
cta 1 cca 1 caa 1 cga 1
gta 1 gca 2 gaa 2 gga 1
ttg tcg tag tgg 1
atgj 1 acg aag agg
ctg ccg cag cgg
gtg 1 gcg gag ggg
arch >1aa =1aa -5s +5s -16s +16s total
mja 8 16 1 4 6 * 2 37

mja. Intergen51

[modifier | modifier le wikicode]

Intergen51. mja. Le génome

[modifier | modifier le wikicode]
  • mja Le prélèvement: Artb
  • Le nom et le lien NCBI: mja, Methanocaldococcus jannaschii DSM 2661, NCBI [7], date 09.04.20.
  • mja La longueur totale des intercalaires, longueur du génome et taux intercalaires/génome:
Nom	intercals	génome		taux en %			
mja	168,865		1,664,970	10.1	
mja données intercalaires
[modifier | modifier le wikicode]
mja données intercalaires 200
[modifier | modifier le wikicode]
mja autres intercalaires aas
[modifier | modifier le wikicode]

Intergen51. mja. Les différents types d'intercalaires

[modifier | modifier le wikicode]
  • Lien au tableur: Intergen51. mja les différents types d'intercalaires.
  • Légende:
    - S pour intercalaire CDS-CDS et R pour tRNA-CDS,
    - c pour intercalaire continu (les 2 gènes sont sur le même brin) et x pour discontinu (les 2 gènes sont sur 2 brins différents, le brin et son complément)
    - %reste = 100*reste/total, le reste étant ce qui reste du total après la fin du diagramme, gamme.
    - %t30 = 100*t30/total, t30 étant le total des fréquences 10 20 30
    - %t5 = 100*t/total, t5 étant le total des fréquences de -1 à -5 dans le diagramme des S-.
Int51.2 mja les différents types d'intercalaires entre gène
Int51.21 Les différents types
intercalaires CDS-CDS * autres intercalaires
continu S+ S- S0 total c/x RNA-RNA CDS-rRNA total
c 1,058 163 11 1,232 2.5 20 0 20
x 431 56 10 497 0 2 2
t 1,489 219 21 1,729 20 2 22
% 86.1 12.7 1.2
Int51.22 Détail des * autres intercalaires
intercalaires tRNA-CDS récapitulatif des * autres intercalaires
continu R+ R- R0 total c/x * autres total %
c 25 0 0 25 1.4 tRNA-CDS 43 43
x 18 0 0 18 RNA-RNA 20 20
t 43 0 0 43 CDS-rRNA 2 2
% 100.0 0.0 0.0 non RNA 34 34
- total 99 100
Int51.23 Les taux remarquables
taux %reste %t30 %t5 %0
type S+ R+ S- S+ R+ S- S+ R+
gamme 400 400 6-50 - - - - -
type S+ R+ S- S+ R+ S- S+ R+
c 1.1 4.0 3.7 39.7 8.0 48 0.9 0.0
x 5.4 0.0 1.8 22.0 0.0 46 2.0 0.0

Intergen51. mja. Les diagrammes CDS-CDS positifs

[modifier | modifier le wikicode]
  • Lien tableur: mja données intercalaires
  • Diagrammes:
    - fc40, CDS-CDS continu, fréquence unitaire en abscisses et effectif en ordonnées mja fc40
    - fx%, CDS-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et pourcentage en ‰ par rapport au total, en ordonnées. mja fx1
    - fc%, CDS-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et pourcentage en ‰ par rapport au total, en ordonnées. mja fc1
  • Équations des courbes de tendance en pour 1000: colonnes %fx %fc
Courbes de tendances pour les diagrammes en pour 1000			Calculs des f.41	mja
R2	x3		x2		x		c		Inflexion poly3	x	c
0.659	-1.51E-06	1.41E-03	-4.93E-01	71.50	fx1	abscisse	216.0	413.1
0.856	-9.20E-06	7.03E-03	-1.72E+00	143.0	fc1	ordonnée	5.5	0.4
								
0.703	4.80E-06	-3.11E-03	4.71E-01	13.9	fx41			
0.960	-8.15E-07	1.01E-03	-4.38E-01	66.4	fc41			
  • Le rfin après 400 est de 12 sur un total de 1069 . Jusqu'à 1% les freq10 sont en continu jusqu'à 440 , reste 10 . L'indice i.rfin1 = 2/40=0,050.
  • Moyennes glissantes fc+400, diagonale. Voir le détail des calculs dans abs.
données	mja		calculs			poly3	mja
effect	1069		R2.21	738		abscis	250
xm	50		pte	20,35		flexa	134
ym	3,527		cste	4,32		flexo	2,45
x1m	163		r400l	237		xm	35
y1m	1		restp	152,48		sup4	137,9
rfin	11,23		%sd	38,68		sup4t	349,9
bornf	164		lond	113		%	39,4
supd	135,3		%sf	38,68		long	99
supdt	349,9		lonf	114		R2	366
xmp	497,66		sf/lf	1,19			
r400	141,25		sr/lr	0,00			
supf	135,3		sd/ld	1,20			
supft	349,9		i.r400	0,60								

Intergen51. mja. Les CDS-CDS négatifs

[modifier | modifier le wikicode]
Sous-totaux	mja			totale	
fréquence	x-	c-		x-	c-
 - 1		0	25		4	4140
 - 2		0	0		85	11
 - 3		0	0		3	12
 - 4		26	51		717	10938
 - 5		0	2		5	19
sp6		30	85		1642	8424
total		56	163		2,456	23,544
reste		1	6		264	420
s6		19	0		361	41
s7		3	17		321	1438
s8		7	62		696	6525
rappot s1-5						
4/2/1		-	2.0		8.4	2.6
% / sp6						
s6/sp6		63.3	0.0		22.0	0.5
s7/sp6		10.0	20.0		19.5	17.1
s8/sp6		23.3	72.9		42.4	77.5
reste/sp6	3.3	7.1		16.1	5.0
						
total s1-5	26	78		814	15120
% / total						
%s1-5		46.4	47.9		33.1	64.2
%sp6		53.6	52.1		66.9	35.8

Intergen51. mja. Les intercalaires des blocs

[modifier | modifier le wikicode]
  • Le détail
RNA-RNA		c	x		CDS-RNA		c	x
23s 5s		1			CDS 16s			1
16s 23s					5s CDS			
16s tRNA	2			16 CDS			
tRNA 23s	2			CDS 5s			
5s tRNA		1			23s CDS			
tRNA in					CDS 23s			
tRNA contig	8			5s 16s			1
tRNA hors	4			16s16s			
tRNA 16s	1						
23s tRNA								
tRNA 5s		1						
16s 5s								
5s 23s								
5s 5s								
total		20	0		total		0	2
  • Les rares voir gamma pour la longueur des intercalaires
  • Les tRNA-CDS compris, comparaison dans le clade et dans l'étude.

Intergen51. mja. Les intercalaires tRNA-tRNA extra bloc

[modifier | modifier le wikicode]

mja intercalaires entre cds

[modifier | modifier le wikicode]
  • Lien NCBI [8] 9.4.20
  • Note: Pour les génomes des annexes j'ai relevé les intercalaires entre tRNAs et entre ceux-ci et les cds qui leur sont adjacents. L'exemple est celui de rru du clade alpha. L'idée de départ de ces prélèvements est la recherche d'opérons formés de tRNA et de protéine comme dans le cas d'E.coli: l'intercalaire entre le tRNA et la protéine devrait être faible. Voir l'exemple d'eco (remarque @3) avec tac-tac-tpr et aca-tac-gga-acc-tufB.

mja intercalaires positifs S+

[modifier | modifier le wikicode]
mja. Sx+ Sc+ Les diagrammes 400
mja Sx+ Sc+
Poly3 -7 -5 -3 1 R2 flex x+ comment. -7 -5 -3 1 R2 flex c+ comment.
1 à 400 -16 150 -532 77 660 313 min50 -94 719 -1762 147 856 255 min40
31 à 400 47 -300 424 21 711 213 2 parties -6.2 87 -410 65 964 468 2 parties
droite -a cste - R2 note R2’ -a cste - R2 note R2’
1 à 400 154 57 - 582 poly 78 SF 227 71 537 poly 319 SF
31 à 400 115 46 - 623 poly 88 tF 128 44 - 859 poly 105 SF
  • Légende du tableau des corrélations
mja. Sx+ Sc+ Les diagrammes 400. Corrélations et les fréquences faibles 1-30
effectifs diagramme corrélation x+ c+, 41-n corrélation x+ c+, 1-n
gen minima x+ c+ total 400 200 250 diff 200 250 400
rru min40 874 2056 2930 829 193 611 418 722 792 861
mja min30 406 1047 1453 776 326 571 245 844 857 881
ant min40 601 1616 2217 730 271 538 267 892 886 876
1-30 ‰ effectifs 0 ‰ <0 ‰ effectifs 1-40 corel
1-30 x+ 1-30 c+ x+/c+ x c x c x- c- x+ c+ x+/c+
169 266 0.64 1037 2749 1 4 71 222 175 630 17
239 405 0.59 495 1234 20 9 113 132 113 474 502
281 485 0.58 714 2381 13 24 116 285 186 836 575
  • Diagrammes 400:  mja pmg,   diagramme 1-40: c+ mjac+ pmgx+ pmgtotal,   texte: pmg.
  • Résumé: Ici je ne compare que les 2 génomes mja et pmg en sachant que pub est semblable à pmg. Car mja et pmg se ressemblent beaucoup avec des effectif des diagrammes 400 égaux, 1 454 contre 1453, et un rapport des fréquences faibles c+/x+ presque égaux, 0.59 contre 0.76. Par contre les corrélations à 41-250 sont très différentes, 571 contre 802.
    - La forme des courbes 400: Les 4 courbes de mja sont identiques une à une aux 4 courbes de pmg, seule la force de mja x+ 31-400 est légèrement supérieure, 88, à celle de pmg de la même courbe, 48.
    • Les 2 courbes, c+ 1-400 mja pmg, sont SF avec R2’ 319 368.
    • Les 2 courbes, x+ 1-400 mja pmg, sont SF avec R2’ 78 257.
    • Les 2 courbes x+ 31-400 sont des tildes forts avec un R2’ de mja supérieur à celui de pmg noté quand même tm, 88 contre 48. Les 2 parties sont bien nettes.
    • Les 2 courbes c+ 31-400 sont SF avec R2’ 105 286. Les 2 parties sont bien nettes. Il faut noter que les 2 SF de mja, c+ 31-400 et x+ 1-400, sont plus faibles que ceux de pmg, 105-78 contre 286-257.
    • Les points d’inflexion des SF sont compris entre 255 et 313, 468 pour mja c+ 1-400. Les 2 tildes ont leurs points d’inflexion presque identiques 213 contre 180.
    - Les corrélations des courbes 400: C’est la différence la plus importante entre les 2 génômes.
    • Chez pmg la corrélation 41-250, de 802 chute à 728 pour 41-200 avec une différence de 74. Et mja en parallèle passe de 571 à 326 avec une différence de 245.
    • Par contre les 3 corrélations 1-n se comportent de la même façon chez les 2 génomes, elles augmentent fortement autour de 850 pour mja et 900 pour pmg.
    - Les fréquences faibles 1-30:
    • Elles sont du même ordre de grandeur et dans des rapports x+/c+ élevés: 239/405 pour mja et 326/430 pour pmg, donnant les rapports respectifs 0.58 0.76.
    • Elles sont réparties sur les 2 fréquences 10 20 dans les 4 courbes 1-400 des 2 génomes.
    • Les minima des fréquences faibles: elles sont bien prononcées chez les 2 génomes x+ 1-400 et faiblement chez les 2 aussi dans c+ 1-400.
    • Les fréquences des zéros sont moyens mais plus élevées chez pmg avec 46‰ que chez mja avec 29‰.
    • Les fréquences négatives sont réparties entre x- et c- de la même façon chez les 2 génômes: 128/144 pour ade et 113/132 pour mja.
    - La forme des courbes 1-40:
    • La courbe c+1-40: Les effectifs sont moyens, 449 pour pmg contre 474 pour mja. La courbe de mja est plus proche du total que pmg avec un excès à la fréquence 4. La courbe de pmg est moins nette à cause d’un excès à la fréquence 6. J’ai ajouté pour chaque génome un diagramme sans la fréquence en excès. La courbe de pmg ressemble alors à celle du total.
    • La courbe x+1-40: Les 2 courbes sont différentes du modèle. Il y a un excès à la fréquence 6 et un creux profond à 11, et la bosse du 10 et très petite par rapport au modèle.Il faut que je publie la courbe de mja avec un effectif de 113. Les 2 courbes ont à peu près la même allure décroissante et les mêmes défauts par rapport au modèle.
    - Les corrélations des courbes 1-40: Les corrélations x+/c+ sont fortes pour les 2 génomes ce qui explique l’augmentation chez tous les 2 de celles des 3 plages de fréquences 1-n.

mja autres intercalaires

[modifier | modifier le wikicode]
  • Lien tableur: mja autres intercalaires aas
  • Légende:  
    - comp, le gène est sur le brin complement
    - deb, fin sont respectivement dans le sens des adresses croissantes, le cds avant le 1er tRNA et le cds après le dernier tRNA du bloc.
  • Totaux: 15 repeat_region et 1 ncRNA
tRNA-cds 		tRNA-tRNA		autres-cds		total
c+	x+	x-	c+	x+	c-	c+	x+	c-	
26	20		19	2		15	17		99
  • Méthode de calculs des intercalaires autres que les CDS-CDS voir le cas de amed.

Methanosarcina barkeri str. Fusaro

[modifier | modifier le wikicode]
  • Lien tableur: mba opérons
  • Liens: gtRNAdb [9], NCBI [10], génome [11]
  • Phylogénie: Archaea; Euryarchaeota; Stenosarchaea group; Methanomicrobia; Methanosarcinales; Methanosarcinaceae; Methanosarcina.
  • Légende: cdsa: cds aas, cdsd: cds dirigé
Ar3. mba opérons, Methanosarcina barkeri str. Fusaro
39.2%GC 2.2.20 Paris  62   doubles intercal cds aa avec aa cdsa cdsd protéines
91192..91938 cds 137 137 249 DUF429 domain-containing protein
comp 92076..92160 ctc + 132 132
comp 92293..92377 ctc 2 ctc 298 298
comp 92676..93476 cds 267 DNA-directed RNA polymerase subunit D
comp 98630..99337 cds 535 535 236 ABC transporter ATP-binding protein
comp 99873..99955 tcc 222 222
comp 100178..101194 cds 339 RNA-guided pseudouridylation complex pseudouridine synthase subunit Cbf5
comp 146979..147518 cds 80 80 180 tyrosine-type recombinase/integrase
comp 147599..147670 acc 198 198
comp 147869..148381 cds 171 DUF98 domain-containing protein
comp 199345..200268 cds 492 492 308 aldolase
comp 200761..200833 aac + 71 71
comp 200905..200979 atgi 2 aac 119 119
comp 201099..201171 aac 964 964
202136..202366 cds 77 hp
260990..261532 cds 173 173 181 nitroreductase family protein"
261706..261777 cgg 673 673
262451..262960 cds 170 hp
comp 463836..464723 cds 2075 2075 296 polyprenyl synthetase family protein
466799..466870 gga 94 94
466965..467049 cta 221 221
comp 467271..468818 cds 516 MBL fold metallo-hydrolase
473154..473723 cds 298 298 190 hp
comp 474022..474096 gag 246 246
comp 474343..475584 cds 414 proteasome-activating nucleotidase
comp 692109..692987 cds 349 349 293 branched-chain-amino-acid transaminase
693337..693411 aga 400 400
comp 693812..694420 cds 203 sulfite exporter TauE/SafE family protein
comp 703446..703958 cds 488 488 171 biotin transporter BioY
704447..704521 agg 283 283
704805..705284 cds 160 N-acetyltransferase
comp 800463..800642 cds 799 799 60 hp
comp 801442..801526 agc 137 137
comp 801664..801978 ncRNA @1 327 327 315
802306..803931 cds 542 methylamine methyltransferase corrinoid protein reductive activase
1109819..1110013 cds 15 15 65 hp
1110029..1110103 atgf + 63 63
1110167..1110241 atgf 3 atg 63 63
1110305..1110379 atgf 273 273
1110653..1111984 cds 444 signal recognition particle protein
comp 1134460..1135074 cds 235 235 205 endonuclease III
comp 1135310..1135381 tgc + 65 65
comp 1135447..1135518 tgc 2 tgc 126 126
comp 1135645..1136277 cds 211 hp
1137210..1137680 cds 488 488 157 P-bacterioferritin
comp 1138169..1138290 5s 129 122
comp 1138420..1141252 23s 222 2833
comp 1141475..1142963 16s 830 830 1489
1143794..1145302 cds 503 2-isopropylmalate synthase
comp 1249870..1250040 cds 423 423 57 CopG family transcriptional regulator
comp 1250464..1250537 aag 546 546
1251084..1251290 cds 69 TRAM domain-containing protein
1315521..1315691 cds @2 -12 -12 57 hp
comp 1315680..1315751 cgc 174 174
1315926..1317110 cds 395 redox-regulated ATPase YchF
<comp 1514831..1515373 cds 1133 1133 181 ArsR family transcriptional regulator
1516507..1516579 caa 760 760
comp 1517340..1517663 cds 108 hp
comp 1538879..1539286 cds 36 36 136 sensor histidine kinase
comp 1539323..1539395 other @3 1249 1249 73
>comp 1540645..1540794 cds 50 PKD domain-containing protein
comp 1546247..1547791 cds 576 576 515 aminotransferase class V-fold PLP-dependent enzyme
comp 1548368..1548441 aca 448 448
< 1548890..1549093 cds 68 matrixin family metalloprotease
1550566..1550760 cds 745 745 65 DeoR family transcriptional regulator
comp 1551506..1551579 aca 506 506
1552086..1552640 cds 185 YkgJ family cysteine cluster protein
1621639..1622835 cds 433 433 399 methionine adenosyltransferase
1623269..1623384 tac @4 112 112
1623497..1623569 gac 300 300
comp 1623870..1624067 cds 66 hp
1714788..1715069 cds 154 154 94 hp
comp 1715224..1715295 acg 187 187
comp 1715483..1716493 cds 337 class I SAM-dependent methyltransferase family protein
comp 1755811..1755993 cds 113 113 61 DNA-directed RNA polymerase subunit K
comp 1756107..1756181 ccg @5 0 0
comp 1756182..1756370 cds 63 DNA-directed RNA polymerase subunit N
1842058..1842195 cds 16 16 46 hp
comp 1842212..1842285 gtg 717 717
1843003..1843767 cds 255 peptidase A24
comp 1852573..1852896 cds 1364 1364 108 PadR family transcriptional regulator
comp 1854261..1854338 ccc 198 198
comp 1854537..1855097 cds 187 CDP-alcohol phosphatidyltransferase family protein
comp 1908225..1908989 cds 349 349 255 hp
comp 1909339..1909530 tgg 445 445
> 1909976..1910152 cds 59 nitrogenase reductase
1926717..1927178 cds 183 183 154 DUF4145 domain-containing protein
comp 1927362..1927445 tcg 125 125
comp 1927571..1928944 cds 458 endonuclease Q family protein
comp 2005431..2007053 cds 2315 2315 541 PKD domain-containing protein
comp 2009369..2009443 cca 199 199
comp 2009643..2010194 cds 184 UbiX family flavin prenyltransferase
comp 2026807..2028456 cds 314 314 550 ATP-dependent DNA ligase
2028771..2028842 ggg 513 513
comp 2029356..2029766 cds 137 PaaI family thioesterase
2157926..2158684 cds 567 567 253 hp
2159252..2159362 atgj 349 349
2159712..2160225 cds 171 amidohydrolase family protein
comp 2194967..2195302 cds 713 713 112 translation initiation factor eIF-1A
2196016..2197504 16s 222 1489
2197727..2200559 23s 129 2833
2200689..2200810 5s 607 607 122
comp 2201418..2201615 cds 66 hp
>comp 2434335..2434609 cds 603 603 92 nucleoside deaminase
comp 2435213..2435284 gcc 223 223
2435508..2435584 atc + 74 74
2435659..2435735 atc 2 atc 241 241
comp 2435977..2436390 cds 138 transcriptional regulator
2622097..2624025 cds 1489 1489 643 replication factor C large subunit
2625515..2625588 gta 1102 1102
2626691..2626918 cds 76 hp
2650514..2651296 cds 164 164 261 thiazole biosynthesis protein
2651461..2651532 cac 218 218
2651751..2653460 cds 570 radical SAM protein
2663547..2664668 cds 318 318 374 PGF-pre-PGF domain-containing protein
comp 2664987..2665058 ggc 263 263
2665322..2666563 cds 414 hp
2856552..2857409 cds 134 134 286 hp
comp 2857544..2857628 tca 153 153
comp 2857782..2858546 cds 255 peptidylprolyl isomerase
3326036..3326557 cds 539 539 174 hp
3327097..3327168 tgc 995 995
3328164..3328898 cds 245 hp
3994472..3994921 cds 514 514 150 IS200/IS605 family transposase
comp 3995436..3995529 cga 477 477
3996007..3996714 cds 236 hp
4005709..4006026 cds 269 269 106 divalent-cation tolerance protein CutA
4006296..4006378 ttg 860 860
4007239..4009012 rpr @6 169 169 1774 Family CRISPR
comp 4009182..4009478 cds 99 CRISPR-associated endonuclease Cas2
comp 4031590..4031871 cds 1075 1075 94 hp
4032947..4033019 cag 182 182
comp 4033202..4033765 cds 188 hp
comp 4041205..4041960 cds 96 96 252 MBL fold metallo-hydrolase
4042057..4042141 tta 375 375
comp 4042517..4044976 cds 820 beta-propeller fold lactonase family protein
comp 4045359..4048274 cds 718 718 972 PKD domain-containing protein
4048993..4049077 tta 35 35
comp 4049113..4052403 cds 241 241 1097 PGF-pre-PGF domain-containing protein
4052645..4052729 tta 177 177
comp 4052907..4053395 cds 163 MarR family transcriptional regulator
4407561..4407830 cds 64 64 90 elongation factor 1-beta
4407895..4407966 gcg 675 675
comp 4408642..4409715 cds 358 radical SAM protein
comp 4504139..4504300 cds 536 536 54 hp
comp 4504837..4504921 ctg 220 220
comp 4505142..4506050 cds 303 ornithine carbamoyltransferase
comp 4551177..4551851 cds 566 566 225 MBL fold metallo-hydrolase
4552418..4552491 gtc + 94 94
4552586..4552660 ttc 2 gtc 7 7
4552668..4552739 ggc 2 ttc 61 61
4552801..4552874 gtc 2 ggc 94 94
4552969..4553043 ttc 7 7
4553051..4553122 ggc 717 717
4553840..4554052 cds 71 MoaD/ThiS family protein
4617920..4618339 cds 200 200 140 hp
4618540..4618617 gaa 351 351
4618969..4619190 cds 377 377 74 hp
4619568..4619645 gaa 214 214
comp 4619860..4620678 cds 273 hp
4673041..4673643 cds 289 289 201 adenosylcobinamide amidohydrolase
comp 4673933..4674054 5s 129 122
comp 4674184..4677016 23s 135 2833
comp 4677152..4677224 gca 79
comp 4677304..4678792 16s 1242 1242 1489
4680035..4680817 cds 261 methanol-5-hydroxybenzimidazolylcobamide methyltransferase
comp 4759174..4759410 cds 89 89 79 DNA-directed RNA polymerase subunit H
comp 4759500..4759576 aaa 655 655
comp 4760232..4760801 cds 190 DJ-1/PfpI family protein
cumuls. mba.
opérons Fréquences intercalaires tRNAs Fréquences intercalaires cds Fréquences aas cds chromosome
effectif gammes sans rRNAs avec rRNAs gammes cds gammes cdsd gammes cdsa gammes cdsa 300
avec rRNA opérons 3 1 0 - 1 2 1 100 25 30 0
16 23 5s 0 2 20 2 50 4 20 200 27 60 7
16 gca 235 1 40 0 100 4 40 300 21 90 14
16 23 5s a 0 60 0 150 6 60 400 8 120 8
max a 1 80 6 200 14 80 500 4 150 5
a doubles 0 100 3 250 9 100 600 7 180 10
autres 0 120 2 300 8 120 700 1 210 11
total aas 1 140 1 350 6 140 800 0 240 4
sans opérons 44 160 0 400 4 160 900 1 270 10
1 aa 37 180 0 450 4 180 1000 1 300 4
max a 6 200 0 500 4 200 1100 1 330 2
a doubles 6 1 35 0 21
total aas 61 15 0 100 0 96 96
total aas 62
remarques 6
avec jaune moyenne 85 457 240
variance 52 407 194
sans jaune moyenne 51 210 186 158
variance 28 98 106 78
Ar3. mba blocs, Methanosarcina barkeri str. Fusaro
cds 289 201 adenosylcobinamide amidohydrolase
5s 129 122
23s 135 2833
gca 79
16s 1242 1489
cds 261 methanol-5-hydroxybenzimidazolylcobamide methyltransferase
cds 713 112 translation initiation factor eIF-1A
16s 222 1489
23s 129 2833
5s 607 122
cds 66 hp
cds 488 157 P-bacterioferritin
5s 129 122
23s 222 2833
16s 830 1489
cds 503 2-isopropylmalate synthase
  • Lien tableur: mba remarques
  • Remarques un génome avec beaucoup de doubles dont une séquence de 3 aas.
    1. @ ncRNA, dans le même ques l que’aa, taille de 315 pbs.
    2. @ intercalaire négatif du au changement de sens
    3. @ un autre aa, other
    4. @ 4 introns
      - tac 1623269..1623304,1623349..1623384
      - tgg 1909339..1909374,1909493..1909530
      - atgj 2159252..2159289,2159327..2159362
      - cga 3995436..3995470,3995491..3995529
    5. @ un intercalaire nul sans changement de sens
    6. @ rpr, repeat région famille CRISPR, assez grand 1774 pbs. Dans le même sens que l’aa.
  • Séquence des doubles: 6 clusters avec des doubles dont une séquence de 3 aas et un triplet.
    - 2 doublets seuls ctc tgc
    - gcc 2atc
    - aac atgi aac
    - 3 atgf
    - 2 (gtc ttc ggc)
  • Tableau du code génétique de mba
    Légende: prélèvement de la base gtRNAdb le 2.2.20
    • - totaux en en-tête, 62 total de gtRNAdb contenant des pseudo et inconnus; 62 total du cumul.
    • - atgi, c'est Ile2, mis à la place de ttt, très rare chez les procaryotes.
    • - atgf, c'est Metf, mis à la place de tgt, très rare chez les procaryotes.
    • - atgj, c'est Met, remplace le atg standard qui est la somme Ile2 Metf Met.
    • - Voir la légende des tris et couleurs, g1 t1.
Ar3. mba, Methanosarcina barkeri str. Fusaro
g1    t1       62  62
atgi 1 tct tat atgf 3
att act aat agt
ctt cct cat cgt
gtt gct gat ggt
ttc 2 tcc 1 tac 1 tgc 4
atc 2 acc 1 aac 2 agc 1
ctc 2 ccc 1 cac 1 cgc 1
gtc 2 gcc 1 gac 1 ggc 3
tta 3 tca 1 taa tga
ata aca 2 aaa 1 aga 1
cta 1 cca 1 caa 1 cga 1
gta 1 gca 1 gaa 2 gga 1
ttg 1 tcg 1 tag tgg 1
atg 1 acg 1 aag 1 agg 1
ctg 1 ccg 1 cag 1 cgg 1
gtg 1 gcg 1 gag 1 ggg 1
  • intercalaires élevés avec le cds 43/100
1315680	cgc	-12	comp
1756107	ccg	0	
			
1250464	aag	423	
1623269	tac	433	
1909339	tgg	445	comp
1548368	aca	448	comp
3995436	cga	477	comp
704447	agg	488	comp
1138169	5s	488	comp
200761	aac	492	
1551506	aca	506	comp
2028771	ggg	513	comp
3995436	cga	514	comp
99873	tcc	535	
4504837	ctg	536	
3327097	tgc	539	
1250464	aag	546	comp
4552418	gtc	566	comp
2159252	atgj	567	
1548368	aca	576	
2435213	gcc	603	
2200689	5s	607	comp
4759500	aaa	655	
261706	cgg	673	
4407895	gcg	675	comp
2194967	16s	713	comp
1842212	gtg	717	comp
4553840	ggc	717	
4048993	tta	718	comp
1551506	aca	745	comp
1516507	caa	760	comp
801442	agc	799	
1141475	16s	830	comp
4006296	ttg	860	
201099	aac	964	comp
3327097	tgc	995	
4032947	cag	1075	comp
2625515	gta	1102	
1516507	caa	1133	comp
4677304	16s	1242	comp
1539323	other	1249	
1854261	ccc	1364	
2625515	gta	1489	
466799	gga	2075	
2009369	cca	2315	
moyenne		795	
écart		415	
  • intercalaires élevés entre aas
ttc-ggc		7	
ttc-ggc		7	
ggc-gtc		61	
atgf-atgf	63	
atgf-atgf	63	
tgc-tgc		65	
aac-atgi	71	
atc-atc		74	
--	--	
gga-cta		94	
gtc-ttc		94	
gtc-ttc		94	
tac-gac		112	intron
atgi-aac	119	intron
ctc-ctc		132	
gcc-atc		223	

mba distribution

[modifier | modifier le wikicode]
Ar3. mba distribution, Methanosarcina barkeri str. Fusaro. Archée
g1    t1       
atgi 1 tct tat atgf 3
att act aat agt
ctt cct cat cgt
gtt gct gat ggt
ttc 2 tcc 1 tac 1 tgc 3
atc 2 acc 1 aac 2 agc 1
ctc 2 ccc 1 cac 1 cgc 1
gtc 2 gcc 1 gac 1 ggc 3
tta 3 tca 1 taa tga
ata aca 2 aaa 1 aga 1
cta 1 cca 1 caa 1 cga 1
gta 1 gca 1 gaa 2 gga 1
ttg 1 tcg 1 tag tgg 1
atgj 1 acg 1 aag 1 agg 1
ctg 1 ccg 1 cag 1 cgg 1
gtg 1 gcg 1 gag 1 ggg 1
arch >1aa =1aa -5s +5s -16s +16s total
mba 23 * 37 * 1 61

mba. Intergen51

[modifier | modifier le wikicode]

Intergen51. mba. Le génome

[modifier | modifier le wikicode]
  • mba Le prélèvement: Acbn
  • Le nom et le lien NCBI: mba, Methanosarcina barkeri str. Fusaro, NCBI [12], date 17.12.20.
  • mba La longueur totale des intercalaires, longueur du génome et taux intercalaires/génome:
Nom	intercals	génome		taux en %			
mba	1,341,425	4,837,408	27.7
mba données intercalaires
[modifier | modifier le wikicode]
mba données intercalaires 200
[modifier | modifier le wikicode]
mba autres intercalaires aas
[modifier | modifier le wikicode]

Intergen51. mba. Les différents types d'intercalaires

[modifier | modifier le wikicode]
  • Lien au tableur: Intergen51. mba les différents types d'intercalaires.
  • Légende:
    - S pour intercalaire CDS-CDS et R pour tRNA-CDS,
    - c pour intercalaire continu (les 2 gènes sont sur le même brin) et x pour discontinu (les 2 gènes sont sur 2 brins différents, le brin et son complément)
    - %reste = 100*reste/total, le reste étant ce qui reste du total après la fin du diagramme, gamme.
    - %t30 = 100*t30/total, t30 étant le total des fréquences 10 20 30
    - %t5 = 100*t/total, t5 étant le total des fréquences de -1 à -5 dans le diagramme des S-.
Int51.2 mba les différents types d'intercalaires entre gène
Int51.21 Les différents types
intercalaires CDS-CDS * autres intercalaires
continu S+ S- S0 total c/x RNA-RNA CDS-rRNA total
c 2,358 307 21 2,686 2.1 22 0 22
x 1,234 22 1 1,257 0 6 6
t 3,592 329 22 3,943 22 6 28
% 91.1 8.3 0.6
Int51.22 Détail des * autres intercalaires
intercalaires tRNA-CDS récapitulatif des * autres intercalaires
continu R+ R- R0 total c/x * autres total %
c 48 0 1 49 1.2 tRNA-CDS 90 70
x 40 1 0 41 RNA-RNA 22 17
t 88 1 1 90 CDS-rRNA 6 5
% 97.8 1.1 1.1 non RNA 10 8
- total 128 100
Int51.23 Les taux remarquables
taux %reste %t30 %t5 %0
type S+ R+ S- S+ R+ S- S+ R+
gamme 400 400 6-50 - - - - -
type S+ R+ S- S+ R+ S- S+ R+
c 29.7 38.8 2.0 14.9 2.0 50 0.8 2.0
x 42.8 41.5 13.6 2.6 2.4 27 0.1 0.0

Intergen51. mba. Les diagrammes CDS-CDS positifs

[modifier | modifier le wikicode]
  • Lien tableur: mba données intercalaires
  • Diagrammes:
    - fc40, CDS-CDS continu, fréquence unitaire en abscisses et effectif en ordonnées mba fc40
    - fx%, CDS-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et pourcentage en ‰ par rapport au total, en ordonnées. mba fx1
    - fc%, CDS-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et pourcentage en ‰ par rapport au total, en ordonnées. mba fc1
  • Équations des courbes de tendance en pour 1000: colonnes %fx %fc
Courbes de tendances pour les diagrammes en pour 1000			Calculs des f.41	mba
R2	x3		x2		x		c		Inflexion poly3	x	c
0.351	2.63E-07	-3.94E-04	1.23E-01	6.43	fx1	abscisse	347.8	246.6
0.821	-3.44E-06	2.49E-03	5.76E-01	55.6	fc1	ordonnée	11.0	13.3
								
0.304	6.70E-07	-6.99E-04	1.93E-01	1.78	fx41			
0.739	-7.30E-07	5.40E-04	-1.58E-01	30.4	fc41			
  • Le rfin après 400 est de 707 sur un total de 2379 . Jusqu'à 1% les freq10 sont en continu jusqu'à 1550 , reste 23 . L'indice i.rfin1 = 684/1150=0,595.
  • Le reste après 1550 est de 23 sur un total de 2379 . Jusqu'à 3‰ les freq10 sont en continu jusqu'à 2080 , reste 7 . L'indice i.rf3 =16/530=0,030 .
  • Moyennes glissantes fc+400, diagonale. Voir le détail des calculs dans abs.
données	mba		calculs			poly3	mba
effect	2379		R2.21	604		abscis	400
xm	26		pte	5,92		flexa	243
ym	6		cste	2,68		flexo	1,32
x1m	283		r400l	117		xm	45
y1m	1		restp	407,31		sup4	116,9
rfin	297,18		%sd	19,73		sup4t	340,9
bornf	198		lond	257		%	34,3
supd	88,6		%sf	17,40		long	198
supdt	449,3		lonf	172		R2	221
xmp	143,34		sf/lf	0,34			
r400	110,13		sr/lr	0,36			
supf	58,4		sd/ld	0,34			
supft	335,4		i.r400	0,94												

Intergen51. mba. Les CDS-CDS négatifs

[modifier | modifier le wikicode]
Sous-totaux	mba			totale	
fréquence	x-	c-		x-	c-
 - 1		0	33		4	4140
 - 2		2	0		85	11
 - 3		0	2		3	12
 - 4		3	117		717	10938
 - 5		1	0		5	19
sp6		16	155		1642	8424
total		22	307		2,456	23,544
reste		3	6		264	420
s6		2	7		361	41
s7		2	34		321	1438
s8		9	108		696	6525
rappot s1-5						
4/2/1		1.5	3.5		8.4	2.6
% / sp6						
s6/sp6		12.5	4.5		22.0	0.5
s7/sp6		12.5	21.9		19.5	17.1
s8/sp6		56.3	69.7		42.4	77.5
reste/sp6	18.8	3.9		16.1	5.0
						
total s1-5	6	152		814	15120
% / total						
%s1-5		27.3	49.5		33.1	64.2
%sp6		72.7	50.5		66.9	35.8

Intergen51. mba. Les intercalaires des blocs

[modifier | modifier le wikicode]
  • Le détail
RNA-RNA		c	x		CDS-RNA		c	x
23s 5s		3			CDS 16s			3
16s 23s		2			5s CDS			3
16s tRNA	1			16 CDS			
tRNA 23s	1			CDS 5s			
5s tRNA					23s CDS			
tRNA in					CDS 23s			
tRNA contig				5s 16s			
tRNA hors	15			16s16s			
tRNA 16s								
23s tRNA								
tRNA 5s								
16s 5s								
5s 23s								
5s 5s								
total		22	0		total		0	6

  • Les rares voir gamma pour la longueur des intercalaires
  • Les tRNA-CDS compris, comparaison dans le clade et dans l'étude.

Intergen51. mba. Les intercalaires tRNA-tRNA extra bloc

[modifier | modifier le wikicode]

mba intercalaires entre cds

[modifier | modifier le wikicode]
  • Lien NCBI [13] 17.12.20
  • Note: Pour les génomes des annexes j'ai relevé les intercalaires entre tRNAs et entre ceux-ci et les cds qui leur sont adjacents. L'exemple est celui de rru du clade alpha. L'idée de départ de ces prélèvements est la recherche d'opérons formés de tRNA et de protéine comme dans le cas d'E.coli: l'intercalaire entre le tRNA et la protéine devrait être faible. Voir l'exemple d'eco (remarque @3) avec tac-tac-tpr et aca-tac-gga-acc-tufB.

mba intercalaires positifs S+

[modifier | modifier le wikicode]
mba. Sx+ Sc+ Les diagrammes 400
mba Sx+ Sc+
Poly3 -7 -5 -3 1 R2 flex x+ comment. -7 -5 -3 1 R2 flex c+ comment.
1 à 400 4.9 -71 219 11 350 483 min10 -50 359 -832 80 823 239 min50
1 à 600 5.8 -62 170 7.4 465 354 2 parties -6.7 100 -498 10 789 495 2 parties
droite -a cste - R2 note R2’ -a cste - R2 note R2’
1 à 400 2 25 - 1 poly 348 tF 104 46 536 poly 287 SF
1 à 600 14 20 - 146 poly 309 tF 80 59 - 580 poly 209 SF
  • Légende du tableau des corrélations et des fréquences faibles
mba. Sx+ Sc+ Les diagrammes 400. Corrélations et les fréquences faibles 1-30
effectifs diagramme corrélation x+ c+, 41-n corrélation x+ c+, 1-n
gen minima x+ c+ total 400 200 250 diff 200 250 400
afn min10 328 1322 1650 607 -17 108 125 -467 -407 -8
mba min10 705 1651 2356 154 -330 -221 109 -512 -477 -223
cbei min10 950 3395 4345 402 -509 -375 134 -649 -648 -290
1-30 ‰ effectifs 0 ‰ <0 ‰ effectifs 1-40 corel
1-30 x+ 1-30 c+ x+/c+ x c x c x- c- x+ c+ x+/c+
46 402 0.11 350 1688 6 5 11 180 36 580 -369
45 214 0.21 1255 2688 1 8 18 114 51 428 -74
26 244 0.11 1212 4400 0 4 8 89 35 954 272
  • Diagrammes 400:  mba cbei mba 600 ,   diagramme 1-40: c+ mbac+ cbeitotal,   texte: cbei.
  • Résumé: J’ai classé les 21 génomes suivant la forme des diagrammes x+ 1-400. J’ai obtenu 3 groupes,
    1. Les tildes au nombre de 5. Ils sont réguliers et forts, tF, avec un R2’ supérieur à 138 pour 4 d’entre eux et scc avec 71. Ce sont, cbei mba pmq et blo scc.
    2. Les formes S au nombre de 6. Leurs forces (R2’) sont variables, ade rru Sf 20-39, ant mja Sm 70-78, pmg pub SF 179-249.
    3. Les diagrammes à pyramide, c’est à dire présentant une bosse avec 4 ou 5 points contigus. Ils sont au nombre de 10 dont 9 sont des tildes et bsu est un Sf très faible (R2’18). abra rtb spl afn sont des tF avec plus de 96, ase cbn cvi sont des tf avec moins de 30, eco myr sont des tm 43 68.
    - mba / cbei: mba est un génome bien particulier avec une courbe x+ 1-400 sous forme d’un demi cercle. En fait c’est un tilde très fort, tF, avec un R2’ de 348, mais aussi un R2 très faible de 350 montrant sa grande variabilité. Cbei lui ressemble par ces 2 paramètres mais cbei a un tilde bien dessiné avec un R2’ de 708 et un R2 de 712. J’ai montré que pmq qui est un tilde très fort avec un R2’ de 813 et qui appartient au groupe des tildes réguliers varie beaucoup moins que cbei avec un R2 de 878. Ces 3 génomes ressemblent beaucoup entre eux pour les autres paramètres aussi mais se différencient pour de blo et scc qui ont des taux élevés en faibles fréquences 1-30. La ressemblance de mba avec cbei et non avec pmq est accentuée par le reste des intercalaires (reste) non pris en compte dans les diagrammes x+ 1-400. Le rapport de ce reste pour mba cbei pmq est respectivement 0.75 0.33 0.16. Aussi je vais comparer mba et cbei sur 1-400 et 1-600 pour apprécier mieux la forme des courbes et leurs variabilités.
    - Les diagrammes 400
    • x+ 1-400:
      + Les 2 courbes ont des taux peu élevés des fréquences faibles, 26‰ pour cbei et 45‰ pour mba à comparer à 89‰ de blo. Ensuite leur tilde est fort, 708 (R2 712 4) pour cbei contre 348 (R2 350 1). Les R2 montrent bien la régularité de cbei par rapport à mba, 712 contre 350.
      + Le point d’inflexion est normal pour cbei 269, par conre celui de mba est très élevé 483 du au reste de 527 (reste) non compris dans l’effectif de x- 1-400.
    • c+ 1-400: Ce sont 2 courbes de formes S fort, SF, avec un R2’ de 213 pour cbei contre 287 et 2 points d’inflexion normaux, 245 pour cbei et 239 pour mba. Les fréquences faibles s’accumulent à la fréquence 20 pour cbei qui est un maximum, alors que pour mba elles sont étalées sur 10 et 20 avec le maximum à 10.
    • x+ 31-400: Je n’ai pas représenté les courbes x+ 31-400 à cause des taux peu élevés des fréquences faibles 1-30, 26‰ pour cbei et 45‰ pour mba.
    • c+ 31-400: La courbe cbei présente le plus faible R2’ des 21 génomes avec 8, ce qui la rend quasiment une droite et je n’arrive pas à distinguer une première partie en bosse comme pour les autres génomes, c’est pour ça que j’ai indiqué 1 partie en commentaire. La courbe de afn est un tilde moyen, tm, R2’ de 45 (904 859). Les points d’inflexion sont aussi différents, il est faible pour afn à 147 et très faible pour cbei à 38.
    - Les corrélations:
    • Sur les plages 41-n: Les 2 corrélations sur 41-250 sont proches mais négatives, c’est à dire x+ et c+ s’opposent entre elles, -221 pour mba contre -377 pour cbei. Leurs comportements sont semblables quand on passe aux autres plages. Sur 41-200 leurs corrélations chutent avec à peu près la même différence (diff), 109 pour mba contre 133. La chute est aussi forte quand on passe à 1-250, de -221 à -512 pour mba et de -377 à -649 pour cbei.
    - Les faibles fréquences: Les faibles fréquences 1-30 ne sont intéressantes à comparer que pour les génomes à courbes 1-400 semblables où le taux de ces fréquences sont élevés et évoluent en parallèle comme entre pmg et pub où le rapport x+/c+ passe de 0.78 à 0.51. Pour cbei et mba ils sont très faibles, respectivement 0.11 et 0.21. Les zéros sont à 4‰ pour cbei et 9‰ pour mba, alors que le taux des négatifs est légèrement plus élevé chez mba que chez cbei, 132‰ contre 97‰.
    - Les courbes 1-40:
    • c+ 1-40: La courbe de cbei est très proche de celle du total des c+ 1-40, mais celle de mba en est proche avec le minimum du creux à la fréquence 7 et 8, mais avec un maximum local à 5 et un creux en 12.
    • x+ 1-40: Avec des effectifs de 35 et 51, les courbes ne peuvent pas être significatives.
    - Les diagrammes x+ 1-600: Ces diagrammes affinent la forme des courbes x+ 1-400 en la prolongeant à 600 à cause de nombreux restes (reste) non intégrés pour les 2 génomes, pour mba 705 sont représentés contre 527 en reste et pour cbei 946 contre 262.
    • cbei x+ 1-600: Le tilde se renforce avec R2p R2d R2’ qui passent respectivement de 712 4 708 à 783 344 439. Le R2 de la droite, R2d, devient conséquent à 344 contre 4. La corrélation 41-400 de 395 passe à 651, elle reste faible pour la longueur de la plage 41-600.
    • mba x+ 1-600: La forme devient clairement tilde et se renforce en passant de 350 1 349 à 465 156 309. Le R2 de la droite devient conséquent à 156 contre 1. La variabilité entre cbei et mba est maintenue et passe, en faisant la différence des R2 des tildes cbei-mba, de 712-349 = 363 à 783-465= 318 avec des effectifs qui passent de 946 à 1126 (reste 82 non pris en compte) pour cbei et de 705 à 937 (reste 295 non pris en compte) pour mba. La corrélation 41-400 de 154 passe à 435, elle reste faible pour la longueur de la plage 41-600.

mba autres intercalaires

[modifier | modifier le wikicode]
  • Lien tableur: mba autres intercalaires aas
  • Légende:  
    - comp, le gène est sur le brin complement
    - deb, fin sont respectivement dans le sens des adresses croissantes, le cds avant le 1er tRNA et le cds après le dernier tRNA du bloc.
  • Totaux: 2 repeat_region et 3 ncRNA
tRNA-cds 		tRNA-tRNA		autres-cds		total	
c+	x+	x-	c+	x+	c-	c+	x+	c-		
49	46	1	21	1		3	5		126	2 ac+
  • Méthode de calculs des intercalaires autres que les CDS-CDS voir le cas de amed.

Methanosarcina sp. WH1

[modifier | modifier le wikicode]
  • Lien tableur: mfe opérons
  • Liens: gtRNAdb [14], NCBI [15], génome [16], %GC 41.80 [17]
  • Phylogénie: Archaea; Euryarchaeota; Stenosarchaea group; Methanomicrobia; Methanosarcinales; Methanosarcinaceae; Methanosarcina; unclassified Methanosarcina
  • Légende: cdsa: cds aas, cdsd: cds dirigé
Ar4. mfe opérons, Methanosarcina sp. WH1
40.2%GC 2.2.20 Paris  56   doubles intercal cds aa avec aa cdsa cdsd protéines
comp 38726..40264 cds 698 698 513 2-isopropylmalate synthase
40963..42450 16s 208 1488
42659..45491 23s 130 2833
45622..45743 5s 857 857 122
46601..47164 cds 102 102 188 hp
47267..47338 tgc + 72 72
47411..47482 tgc 2 tgc 411 411
47894..48508 cds 205 endonuclease III
comp 71092..72423 cds 384 384 444 signal recognition particle protein
comp 72808..72882 atgf + 89 89
comp 72972..73046 atgf 2 atgf 234 234
73281..73472 cds 64 hp
comp 175573..176153 cds 163 163 194 hp
comp 176317..176389 gac 111 111
comp 176501..176614 tac @1 295 295
176910..177248 cds 113 hp
comp 214884..215966 cds 801 801 361 hp
comp 216768..216841 aca 150 150
216992..217582 cds 197 aldolase
comp 372219..373091 cds 558 558 291 hp
comp 373650..373723 gtg 340 340
374064..374828 cds 255 peptidase A24
comp 379248..381950 cds 1076 1076 901 DNA mismatch repair protein MutS
comp 383027..383104 ccc 193 193
comp 383298..383882 cds 195 CDP-alcohol phosphatidyltransferase family protein
comp 532751..533176 cds 356 356 142 hp
comp 533533..533607 cca 149 149
comp 533757..534308 cds 184 UbiX family flavin prenyltransferase
comp 598666..599850 cds 170 170 395 redox-regulated ATPase YchF
600021..600092 cgc 341 341
600434..600868 cds 145 cell surface lipoprotein
680493..681734 cds 185 185 414 proteasome-activating nucleotidase
681920..681994 gag 242 242
> 682237..682560 cds 108 p-IS200/IS605 family transposase
689062..689631 cds 36 36 190 phosphatase PAP2 family protein
comp 689668..689752 cta 73 73
comp 689826..689897 gga 1481 1481
691379..691483 cds 35 CcmD family protein
comp 793563..795017 cds 111 111 485 p-IS66 family transposase
comp 795129..795213 ctc + 117 117
comp 795331..795418 ctc 2 ctc 235 235
comp 795654..796454 cds 267 DNA-directed RNA polymerase subunit D
810088..810471 cds 861 861 128 hp
comp 811333..811415 tcc 123 123
comp 811539..812555 cds 339 RNA-guided pseudouridylation complex pseudouridine synthase subunit Cbf5
comp 893309..894232 cds 391 391 308 aldolase
comp 894624..894696 aac + 87 87
comp 894784..894858 atgi 2 aac 110 110
comp 894969..895041 aac 1415 1415
comp 896457..897506 cds 350 TIGR00303 family protein
949570..950112 cds 208 208 181 nitroreductase family protein
950321..950392 cgg 498 498
comp 950891..952300 cds 470 NADPH-dependent glutamate synthase
1088496..1090946 cds 360 360 817 PGF-pre-PGF domain-containing protein
comp 1091307..1091378 gcc 227 227
1091606..1091682 atc + 62 62
1091745..1091818 atc 2 atc 353 353
comp 1092172..1092585 cds 138 transcriptional regulator
1155736..1156137 cds 210 210 134 AsnC family transcriptional regulator
1156348..1156425 gaa + 718 718
1157144..1157221 gaa 2 gaa 233 233
comp 1157455..1158645 cds @4 397 ISH3 family transposase
comp 1199367..1200149 cds 967 967 261 methanol-5-hydroxybenzimidazolylcobamide methyltransferase
1201117..1202604 16s 80 1488
1202685..1202757 gca 135
1202893..1205725 23s 130 2833
1205856..1205977 5s 5 5 122
comp 1205983..1206231 cds 83 hp
1207508..1211485 cds 12 12 1326 PAS domain S-box protein
comp 1211498..1211582 ctg 190 190
comp 1211773..1212681 cds 303 ornithine carbamoyltransferase
comp 1220571..1220783 cds 596 596 71 MoaD/ThiS family protein
comp 1221380..1221451 ggc + 25 25
comp 1221477..1221551 ttc 2 ggc 57 57
comp 1221609..1221682 gtc 2 ttc 71 71
comp 1221754..1221825 ggc 2 gtc 25 25
comp 1221851..1221925 ttc 118 118
comp 1222044..1222117 gtc 358 358
1222476..1223792 cds 439 methanogenesis marker 16 metalloprotein
1400830..1401773 cds 914 914 315 helix-turn-helix domain-containing protein
1402688..1402761 gta 287 287
1403049..1403276 cds 76 hp
comp 1504221..1505630 cds 686 686 470 F0F1 ATP synthase subunit beta
comp 1506317..1506410 cga 750 750
1507161..1508039 cds 293 response regulator
1513245..1513562 cds 213 213 106 divalent-cation tolerance protein CutA
1513776..1513858 ttg 268 268
> 1514127..1514647 cds 174 p-IS1634 family transposase
1887880..1888338 cds 392 392 153 pyridoxamine 5'-phosphate oxidase family protein
comp 1888731..1888802 ggc 378 378
1889181..1890518 cds 446 DHH family phosphoesterase
1962666..1963553 cds 130 130 296 hp
comp 1963684..1963768 tta 235 235
1964004..1964759 cds 252 MBL fold metallo-hydrolase
1971331..1971852 cds 319 319 174 hp
comp 1972172..1972244 cag 204 204
comp 1972449..1972850 cds 134 hp
comp 2170713..2172446 cds 156 156 578 radical SAM protein
comp 2172603..2172674 cac 174 174
comp 2172849..2173631 cds 261 thiazole biosynthesis protein
<comp 2320809..2321131 cds 141 141 108 p-IS200/IS605 family transposase
comp 2321273..2321344 gcg 65 65
comp 2321410..2321679 cds 90 elongation factor 1-beta
2387890..2388675 cds 150 150 262 peptidylprolyl isomerase
2388826..2388911 tca 326 326
comp 2389238..2389453 cds 72 hp
comp 2678132..2678368 cds 85 85 79 DNA-directed RNA polymerase subunit H
comp 2678454..2678530 aaa 824 824
comp 2679355..2679537 cds 61 hp
3091524..3091754 cds 271 271 77 hp
comp 3092026..3092147 5s 130 122
comp 3092278..3095110 23s 208 2833
comp 3095319..3096806 16s 839 839 1488
3097646..3097975 cds 110 translation initiation factor eIF-1A
comp 3153517..3155214 cds 599 599 566 diguanylate phosphodiesterase
comp 3155814..3155923 atgj 799 799
3156723..3157106 cds 128 tRNA CCA-pyrophosphorylase
comp 3241682..3242944 cds 473 473 421 diaminopimelate decarboxylase
3243418..3243489 ggg 377 377
3243867..3244073 cds 69 hp
3341829..3342017 cds @2 0 0 63 DNA-directed RNA polymerase subunit N
3342018..3342092 ccg 112 112
3342205..3342387 cds 61 DNA-directed RNA polymerase subunit K
3358176..3359186 cds 533 533 337 class I SAM-dependent methyltransferase family protein
3359720..3359791 acg 52 52
comp 3359844..3360305 cds 154 peroxiredoxin
comp 3397316..3398947 cds 422 422 544 methylamine methyltransferase corrinoid protein reductive activase
3399370..3399684 ncRNA @3 149 149 315
3399834..3399918 agc 230 230
3400149..3400847 cds 233 ATPase
3435506..3436918 cds 181 181 471 phosphotransferase
3437100..3437183 tcg 273 273
3437457..3437948 cds 870 870 164 rubrerythrin family protein
3438819..3438989 cds 107 107 57 hp
3439097..3439289 tgg 42 42
comp 3439332..3439484 cds 51 hp MLELDILDLDILDLDILDLKILELEILELEVLELEILELEILELEVLVQS
3456114..3456473 cds 260 260 120 hp
comp 3456734..3456805 acc 200 200
comp 3457006..3457518 cds 171 DUF98 domain-containing protein
comp 3583589..3584044 cds 295 295 152 N-acetyltransferase
comp 3584340..3584414 agg 339 339
3584754..3585317 cds 188 biotin transporter BioY
3593430..3593861 cds 343 343 144 PspC domain-containing protein
comp 3594205..3594279 aga 348 348
3594628..3595506 cds 293 branched-chain-amino-acid transaminase
3603458..3603697 cds 389 389 80 type II toxin-antitoxin system HicB family antitoxin
3604087..3604159 caa 633 633
comp 3604793..3606301 cds 503 lipopolysaccharide biosynthesis protein
comp 3856073..3856279 cds 402 402 69 TRAM domain-containing protein
3856682..3856755 aag 498 498
3857254..3857424 cds 57 CopG family transcriptional regulator
cumuls. mfe.
opérons Fréquences intercalaires tRNAs Fréquences intercalaires cds Fréquences aas cds chromosome
effectif gammes sans rRNAs avec rRNAs gammes cds gammes cdsd gammes cdsa gammes cdsa 300
avec rRNA opérons 3 1 0 - 1 1 1 100 18 30 0
16 23 5s 0 2 20 0 50 4 20 200 29 60 4
16 gca 235 1 40 2 100 3 40 300 12 90 14
16 23 5s a 0 60 1 150 11 60 400 9 120 6
max a 1 80 4 200 9 80 500 9 150 8
a doubles 0 100 2 250 10 100 600 5 180 7
autres 0 120 4 300 7 120 700 0 210 9
total aas 1 140 0 350 7 140 800 0 240 1
sans opérons 40 160 0 400 10 160 900 1 270 6
1 aa 31 180 0 450 3 180 1000 1 300 4
max a 6 200 0 500 3 200 1100 0 330 3
a doubles 7 2 20 1 23
total aas 55 15 0 88 0 85 85
total aas 56
remarques
avec jaune moyenne 131 376 255
variance 169 299 210
sans jaune moyenne 55 223 207 157
variance 21 108 127 80
  • Note: intercalaires prélevés de la colonne cds de mfe opérons dans un bloc de tRNAs uniquement. Le début du bloc est dans l'ordre des adresses, deb intercalaire entre le cds et le 1er tRNA dd bloc, fin entre le dernier tRNA et le cds terminal. J'ai procédé, dans les colonnes petit et grand, à la réorientation des blocs d'après la constatation que les blocs à rRNA ont leurs cds de début et de fin sont orientés du cds-16s au 5s-tRNAs-cds, l'intercalaire cds-16s étant plus grands que l'intercalaire avec le cds terminal. En tête de colonne est le % du nombre des intercalaires inférieurs à 201 pbs.
mfe	38			28			13			54
deb	fin		deb	fin		grand	petit		grand	petit
0	112		107	42		107	42		112	0
12	190		533	52		112	0		190	12
36	1481		141	65		141	65		1481	36
85	824		0	112		174	156		107	42
107	42		861	123		190	12		533	52
111	235		356	149		230	149		141	65
130	235		801	150		233	210		824	85
141	65		156	174		235	111		235	111
149	230		12	190		235	130		861	123
150	326		1076	193		242	185		235	130
156	174		260	200		260	200		230	149
163	295		319	204		268	213		356	149
170	341		149	230		273	181		326	150
181	273		210	233		295	163		801	150
185	242		384	234		319	204		174	156
208	498		111	235		326	150		295	163
210	233		130	235		339	295		341	170
213	268		185	242		341	170		273	181
260	200		213	268		348	343		242	185
295	339		181	273		356	149		1076	193
319	204		914	287		360	353		260	200
343	348		163	295		384	234		319	204
356	149		150	326		392	378		498	208
360	353		295	339		473	377		233	210
384	234		558	340		498	208		268	213
389	633		170	341		498	402		384	234
391	1415		343	348		533	52		914	287
392	378		360	353		558	340		339	295
402	498		596	358		596	358		558	340
473	377		473	377		633	389		348	343
533	52		392	378		750	686		360	353
558	340		208	498		799	599		596	358
596	358		402	498		801	150		473	377
599	799		389	633		824	85		392	378
686	750		686	750		861	123		633	389
801	150		599	799		914	287		1415	391
861	123		85	824		1076	193		498	402
914	287		391	1415		1415	391		799	599
1076	193		36	1481		1481	36		750	686
  • Comparaison cds-cds tRNA-cds: deb fin, c'est l'ordre des adresses et grand petit l'ordre après réorientation. Leur pourcentage est calculé par rapport à la colonne, c'est-à-dire la moitié du total des tRNA-cds.
archeo	cds total	total	<0	0-200	201-370	371-600	>600	deb	fin	grand	petit
mfe	2,374		78		26	27	14	11	15	11	5	21
‰					333	346	179	141	385	282	128	538
Ar4. mfe blocs, Methanosarcina sp. WH1
cds 698 513 2-isopropylmalate synthase
16s 208 1488
23s 130 2833
5s 857 122
cds 102 188 hp
cds 967 261 methanol-5-hydroxybenzimidazolylcobamide methyltransferase
16s 80 1488
gca 135
23s 130 2833
5s 5 122
cds 83 hp
cds 271 77 hp
5s 130 122
23s 208 2833
16s 839 1488
cds 110 translation initiation factor eIF-1A
  • Lien tableur: mfe remarques
  • Remarques un génome avec beaucoup de doubles dont une séquence de 3 aas.
    1. @ ncRNA, dans le même ques l que’aa, taille de 315 pbs.
    2. @ 4 introns
      - tac 176501..176536,176579..176614
      - tgg 3439097..3439134,3439254..3439289
      - atgj 3155814..3155849,3155886..3155923
      - cga 1506317..1506351,1506372..1506410
    3. @ un intercalaire nul sans changement de sens
    4. @ intercalaire très élevé 718 pbs entre 2 aas, le nouveau doublet gaa.
  • Séquence des doubles: 7 clusters avec des doubles dont une séquence de 3 aas
    - 4 doublets seuls ctc tgc atgf gaa
    - gcc 2atc
    - aac atgi aac
    - 2 (gtc ttc ggc)
    - par rapport à mja un noveau doublet, gaa. Le triplet atgf est changé en doublet. Les autres restent identiques.
  • Tableau du code génétique de mfe
    Légende: prélèvement de la base gtRNAdb le 2.2.20
    • - totaux en en-tête, 56 total de gtRNAdb contenant des pseudo et inconnus; 56 total du cumul.
    • - atgi, c'est Ile2, mis à la place de ttt, très rare chez les procaryotes.
    • - atgf, c'est Metf, mis à la place de tgt, très rare chez les procaryotes.
    • - atgj, c'est Met, remplace le atg standard qui est la somme Ile2 Metf Met.
    • - Voir la légende des tris et couleurs, g1 t1.
Ar4. mfe, Methanosarcina sp. WH1
g1    t1       56  56
atgi 1 tct tat atgf 2
att act aat agt
ctt cct cat cgt
gtt gct gat ggt
ttc 2 tcc 1 tac 1 tgc 2
atc 2 acc 1 aac 2 agc 1
ctc 2 ccc 1 cac 1 cgc 1
gtc 2 gcc 1 gac 1 ggc 3
tta 1 tca 1 taa tga
ata aca 1 aaa 1 aga 1
cta 1 cca 1 caa 1 cga 1
gta 1 gca 1 gaa 2 gga 1
ttg 1 tcg 1 tag tgg 1
atg 1 acg 1 aag 1 agg 1
ctg 1 ccg 1 cag 1 cgg 1
gtg 1 gcg 1 gag 1 ggg 1
  • intercalaires élevés avec le cds 26/88
3856682	aag	402	comp
47411	tgc	411	
3399370	ncRNA	422	comp
3243418	ggg	473	comp
950321	cgg	498	comp
3856682	aag	498	
3359720	acg	533	
373650	gtg	558	
1221380	ggc	596	
3155814	atgj	599	
3604087	caa	633	comp
1506317	cga	686	
40963	16s	698	comp
1506317	cga	750	comp
3155814	atgj	799	comp
216768	aca	801	
2678454	aaa	824	
3095319	16s	839	comp
45622	5s	857	
811333	tcc	861	comp
3438819	cds	870	
1402688	gta	914	
1201117	16s	967	comp
383027	ccc	1076	
894969	aac	1415	
689826	gga	1481	comp
  • intercalaires élevés entre aas
ggc-ttc		25
ggc-ttc		25
ttc-gtc		57
atc-atc		62
gtc-ggc		71
tgc-tgc		72
cta-gga		73
aac-atgi	87
atgf-atgf	89
atgi-aac	110
gac-tac		111
ctc-ctc		117
ttc-gtc		118
gcc-atc		227
gaa-gaa		718

mfe distribution

[modifier | modifier le wikicode]
Ar4. mfe distribution, Methanosarcina sp. WH1. Archée
g1    t1       
atgi 1 tct tat atgf 2
att act aat agt
ctt cct cat cgt
gtt gct gat ggt
ttc 2 tcc 1 tac 1 tgc 2
atc 2 acc 1 aac 2 agc 1
ctc 2 ccc 1 cac 1 cgc 1
gtc 2 gcc 1 gac 1 ggc 3
tta 1 tca 1 taa tga
ata aca 1 aaa 1 aga 1
cta 1 cca 1 caa 1 cga 1
gta 1 gca 1 gaa 2 gga 1
ttg 1 tcg 1 tag tgg 1
atgj 1 acg 1 aag 1 agg 1
ctg 1 ccg 1 cag 1 cgg 1
gtg 1 gcg 1 gag 1 ggg 1
arch >1aa =1aa -5s +5s -16s +16s total
mfe 24 * 31 * 1 56

mfe. Intergen51

[modifier | modifier le wikicode]

Intergen51. mfe. Le génome

[modifier | modifier le wikicode]
  • mfe Le prélèvement: Aapal
  • Le nom et le lien NCBI: mfe, Methanosarcina sp. WH1 chromosome, NCBI [18], date 11.12.21.
  • mfe La longueur totale des intercalaires, longueur du génome et taux intercalaires/génome:
Nom	intercals	génome		taux en %			
mfe	987,074		3,914,091	25.2	
mfe données intercalaires
[modifier | modifier le wikicode]
mfe données intercalaires 200
[modifier | modifier le wikicode]
mfe autres intercalaires aas
[modifier | modifier le wikicode]

Intergen51. mfe. Les différents types d'intercalaires

[modifier | modifier le wikicode]
  • Lien au tableur: Intergen51. mfe les différents types d'intercalaires.
  • Légende:
    - S pour intercalaire CDS-CDS et R pour tRNA-CDS,
    - c pour intercalaire continu (les 2 gènes sont sur le même brin) et x pour discontinu (les 2 gènes sont sur 2 brins différents, le brin et son complément)
    - %reste = 100*reste/total, le reste étant ce qui reste du total après la fin du diagramme, gamme.
    - %t30 = 100*t30/total, t30 étant le total des fréquences 10 20 30
    - %t5 = 100*t/total, t5 étant le total des fréquences de -1 à -5 dans le diagramme des S-.
Int51.2 mfe les différents types d'intercalaires entre gène
Int51.21 Les différents types
intercalaires CDS-CDS * autres intercalaires
continu S+ S- S0 total c/x RNA-RNA CDS-rRNA total
c 1,994 250 17 2,261 2.1 21 1 22
x 1,066 17 1 1,084 1 5 6
t 3,060 267 18 3,345 22 6 28
% 91.5 8.0 0.5
Int51.22 Détail des * autres intercalaires
intercalaires tRNA-CDS récapitulatif des * autres intercalaires
continu R+ R- R0 total c/x * autres total %
c 47 0 1 48 1.5 tRNA-CDS 79 65
x 31 0 0 31 RNA-RNA 22 18
t 78 0 1 79 CDS-rRNA 6 5
% 98.7 0.0 1.3 non RNA 15 12
- total 122 100
Int51.23 Les taux remarquables
taux %reste %t30 %t5 %0
type S+ R+ S- S+ R+ S- S+ R+
gamme 400 400 6-50 - - - - -
type S+ R+ S- S+ R+ S- S+ R+
c 23.2 25.0 1.2 15.9 0.0 57 0.8 2.1
x 34.9 25.8 17.6 4.4 3.2 29 0.1 0.0

Intergen51. mfe. Les diagrammes CDS-CDS positifs

[modifier | modifier le wikicode]
  • Lien tableur: mfe données intercalaires
  • Diagrammes:
    - fc40, CDS-CDS continu, fréquence unitaire en abscisses et effectif en ordonnées mfe fc40
    - fx%, CDS-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et pourcentage en ‰ par rapport au total, en ordonnées. mfe fx1
  • Équations des courbes de tendance en pour 1000: colonnes %fx %fc
Courbes de tendances pour les diagrammes en pour 1000			Calculs des f.41	mfe
R2	x3		x2		x		c		Inflexion poly3	x	c
0.317	1.04E-06	-7.63E-04	1.38E-01	12.80	fx1	abscisse	248.3	329,5	
0.809	-3.02E-06	2.21E-03	-5.36E-01	57.3	fc1	ordonnée	2.4	10,4
								
0.309	8.74E-07	-6.51E-04	1.17E-01	13.6	fx41			
0.884	-1,92E-07	1,90E-04	-1,07E-01	31.9	fc31	
  • Le rfin après 400 est de 467 sur un total de 2011 . Jusqu'à 1% les freq10 sont en continu jusqu'à 1490 , reste 20 . L'indice i.rfin1 = 447/1090=0,410.
  • Le reste après 1490 est de 20 sur un total de 2011 . Jusqu'à 2‰ les freq10 sont en continu jusqu'à 1960 , reste 6 . L'indice i.rf3 = 14/470=0,030.
  • Moyennes glissantes fc+400, diagonale. Voir le détail des calculs dans abs.
données	mfe		calculs			poly3	mfe
effect	2011		R2.21	619		abscis	400
xm	32		pte	5,92		flexa	195
ym	5		cste	2,68		flexo	1,70
x1m	283		r400l	117		xm	55
y1m	1		restp	344,11		sup4	90,6
rfin	232,22		%sd	26,98		sup4t	293,4
bornf	217		lond	251		%	30,9
supd	131,0		%sf	24,94		long	140
supdt	485,3		lonf	185		R2	230
xmp	170,56		sf/lf	0,53			
r400	111,88		sr/lr	0,49			
supf	98,8		sd/ld	0,52			
supft	396,3		i.r400	0,96			

Intergen51. mfe. Les CDS-CDS négatifs

[modifier | modifier le wikicode]
Sous-totaux	mfe			totale	
fréquence	x-	c-		x-	c-
 - 1		0	26		4	4140
 - 2		1	0		85	11
 - 3		0	0		3	12
 - 4		4	116		717	10938
 - 5		0	0		5	19
sp6		12	108		1642	8424
total		17	250		2,456	23,544
reste		3	3		264	420
s6		5	3		361	41
s7		2	22		321	1438
s8		2	80		696	6525
rapport s1-5						
4/2/1		4.0	4.5		8.4	2.6
% / sp6						
s6/sp6		41.7	2.8		22.0	0.5
s7/sp6		16.7	20.4		19.5	17.1
s8/sp6		16.7	74.1		42.4	77.5
reste/sp6	25.0	2.8		16.1	5.0
						
total s1-5	5	142		814	15120
% / total						
%s1-5		29.4	56.8		33.1	64.2
%sp6		70.6	43.2		66.9	35.8

Intergen51. mfe. Les intercalaires des blocs

[modifier | modifier le wikicode]
  • Le détail
RNA-RNA		c	x		CDS-RNA		c	x
23s 5s		3			CDS 16s			3
16s 23s		2			5s CDS		1	2
16s tRNA	1			16 CDS			
tRNA 23s	1			CDS 5s			
5s tRNA					23s CDS			
tRNA in					CDS 23s			
tRNA contig				5s 16s			
tRNA hors	14	1		16s16s			
tRNA 16s								
23s tRNA								
tRNA 5s								
16s 5s								
5s 23s								
5s 5s								
total		21	1		total		1	5
  • Les rares voir gamma pour la longueur des intercalaires
  • Les tRNA-CDS compris, comparaison dans le clade et dans l'étude.

Intergen51. mfe. Les intercalaires tRNA-tRNA extra blocc

[modifier | modifier le wikicode]
Int51.31 archeo. Les intercalaires tRNA-tRNA extra blocs
mfe hors mfi hors mba hors mja hors
inter aa    inter aa    inter aa    inter aa
72 tgc 85 acc 132 ctc 91 atgj
** tgc ** tta ** ctc ** ctc
89 atgf 5 aac 71 aac 23 aga
** atgf 58 atgi 119 atgi ** gaa
111 gac 53 gaa ** aac 178 acc
** tac 29 cta 94 gga ** caa
73 cta ** cac ** cta 34 ggc
** gga 90 aag 63 atgf ** gga
117 ctc 504 ttg 63 atgf
** ctc ** aaa ** atgf
87 aac 40 tgg 65 tgc
110 atgi ** tgc ** tgc
** aac 62 aga 112 tac mja cont
227 gcc ** agg ** gac 7 ttc
62 atc 99 gta 223 gcc 29 aac
** atc ** gtg 74 atc 18 atgi
718 gaa 76 aca ** atc 39 gaa
** gaa 44 cca 94 gtc 11 cta
25 ggc 170 tac 7 ttc ** cac
57 ttc 7 gac 61 ggc 14 aca
71 gtc ** aaa 94 gtc 8 cca
25 ggc 4 gtc 7 ttc 83 tac
118 ttc ** ttc ** ggc ** aaa
** gtc 2 ggc
** gga
-

archées synthèse

[modifier | modifier le wikicode]

archées distribution par génome

[modifier | modifier le wikicode]
archées distribution par génome
arch >1aa 1aa -5s +5s -16s +16s duplica 1-3aas total
mba 14 37 1 9 61
mfe 14 31 1 10 56
mfi 25 20 2 47
mja 8 16 1 4 6 2 37
total 61 104 1 4 6 6 19 0 201

archées distribution du total

[modifier | modifier le wikicode]
  • Lien tableur: archées distribution du total
  • Liens indices: euryarchaeota
  • Notes: Les -5s +5s et -16s sont colorés et correspondent à un seul tRNA du génome mja. Les +16s sont tout les 6 des gca. Les -16s sont d'un seul bloc de 6 aas. Les -5s et +5s sont inversés dans le bloc 4aas-5s-gac.
  • Légende: Tableau des indices, en-tête: total des génomes, total des tRNAs, indice ttt, indice tgt.
Euryarcheota. distribution et indices.
Euryarcheota. distribution du total
g1    t1       
atgi 4 tct tat atgf 7
att act aat agt
ctt cct cat cgt
gtt gct gat ggt
ttc 6 tcc 4 tac 4 tgc 8
atc 6 acc 4 aac 7 agc 4
ctc 6 ccc 3 cac 4 cgc 4
gtc 6 gcc 4 gac 4 ggc 8
tta 6 tca 4 taa tga 1
ata aca 5 aaa 5 aga 4
cta 4 cca 4 caa 5 cga 4
gta 4 gca 6 gaa 7 gga 4
ttg 3 tcg 3 tag tgg 4
atgj 4 acg 3 aag 3 agg 3
ctg 3 ccg 2 cag 3 cgg 2
gtg 4 gcg 3 gag 2 ggg 3
arch >1aa =1aa -5s +5s -16s +16s total
total 80 104 1 4 6 6 201
Euryarchaeota. indices du 16.1.21 143 génomes
g1 t1 143 6935 0  0
atgi 99 tct tat atgf 127
att act aat agt
ctt 0.7 cct cat cgt 0.7
gtt gct gat ggt 0.7
ttc 122 tcc 106 tac 104 tgc 181
atc 121 acc 104 aac 122 agc 104
ctc 122 ccc 93 cac 101 cgc 102
gtc 121 gcc 101 gac 124 ggc 141
tta 107 tca 101 taa tga 13
ata aca 110 aaa 110 aga 103
cta 103 cca 102 caa 108 cga 103
gta 103 gca 151 gaa 132 gga 103
ttg 87 tcg 87 tag tgg 102
atgj 101 acg 90 aag 87 agg 88
ctg 85 ccg 78 cag 87 cgg 71
gtg 91 gcg 84 gag 84 ggg 79
inter max min total
eury

archées distribution par type

[modifier | modifier le wikicode]
  • Lien tableur: archées distribution par type
  • Notes: Le cyan pour les effectifs élevés des solitaires, le jaune celui des multiples sans duplicata et le blanc, le reste. En rapportant au total de chaque type je constate que les 3 processus sont distincts et se chevauchent très peu, respectivement pour 1aa >1aa duplicata, % 65 61 79.
	1aa		>1aa		duplica	%
	104	%	61	%	19	
jaune	4	4	37	61	0	0
cyan	68	65	7	11	4	21
blanc	32	31	17	28	15	79
Archées. Distribution par type.
Archées. distribution des solitaires
g1    t1          
atgi tct tat atgf 2
att act aat agt
ctt cct cat cgt
gtt gct gat ggt
ttc tcc 4 tac tgc 3
atc 2 acc 2 aac 1 agc 4
ctc 1 ccc 3 cac 2 cgc 4
gtc 1 gcc 2 gac ggc 2
tta 5 tca 4 taa tga 1
ata aca 3 aaa 2 aga 2
cta cca 2 caa 4 cga 4
gta 3 gca gaa 2 gga 2
ttg 2 tcg 3 tag tgg 3
atgj 3 acg 3 aag 2 agg 2
ctg 3 ccg 2 cag 3 cgg 2
gtg 3 gcg 3 gag 2 ggg 3
arch 1aa 104
Archées. distribution du type >1aa sans duplicata.
g1    t1          
atgi 3 tct tat atgf
att act aat agt
ctt cct cat cgt
gtt gct gat ggt
ttc 5 tcc tac 3 tgc 1
atc acc 2 aac 5 agc
ctc 1 ccc cac 1 cgc
gtc 5 gcc 2 gac 3 ggc
tta 1 tca taa tga
ata aca 1 aaa 2 aga 2
cta 3 cca 1 caa 1 cga
gta 1 gca gaa 2 gga 4
ttg 1 tcg tag tgg 1
atgj 1 acg aag 1 agg 1
ctg ccg cag cgg
gtg 1 gcg gag ggg
arch >1aa 61
Archées. distribution des duplicata
g1    t1          
atgi tct tat atgf 5
att act aat agt
ctt cct cat cgt
gtt gct gat ggt
ttc tcc tac tgc 4
atc 4 acc aac agc
ctc 4 ccc cac cgc
gtc gcc gac ggc
tta tca taa tga
ata aca aaa aga
cta cca caa cga
gta gca gaa 2 gga
ttg tcg tag tgg
atgj acg aag agg
ctg ccg cag cgg
gtg gcg gag ggg
arch dupl 19

archées par rapport au groupe de référence

[modifier | modifier le wikicode]
Comparaison avec la référence
tRNAs blocs tRNAs blocs rRNAs
archeo4 1aa >1aa dup +5s 1-3aas autres total
21 faible 40 11 4 55
16 moyen 39 16 8 9 72
14 fort 25 34 7 4 4 74
104 61 19 4 13 201
10 g+cgg 26 2 28
2 agg+cga 6 1 7
4 carre ccc 7 8 4 19
5 autres 1 1
40 11 4 55
total tRNAs ‰
archeo4 1aa >1aa dup +5s 1-3aas autres archeo ‰ ref.‰
21 faible 199 55 20 274 26
16 moyen 194 80 40 45 358 324
14 fort 124 169 35 20 20 368 650
517 303 95 20 65 201 729
10 g+cgg 129 10 139 10
2 agg+cga 30 5 35
4 carre ccc 35 40 20 95 16
5 autres 5 5
199 55 20 274
blocs tRNAs ‰ total colonne %
archeo4 1aa >1aa dup total ref.‰ 1aa >1aa dup
21 faible 217 60 22 299 26 38 18
16 moyen 212 87 43 342 324 38 26
14 fort 136 185 38 359 650 24 56
565 332 103 184 729 104 61
10 g+cgg 141 11 152 10 65
2 agg+cga 33 5 38 15
4 carre ccc 38 43 22 103 16 18
5 autres 5 5 3
217 60 22 299 40

euryarchaeota, estimation des -rRNAs

[modifier | modifier le wikicode]
  • Lien tableur: euryarchaeota, estimation des -rRNAs
  • Liens fiche:   typage
  • Légende: prélèvement de la base gtRNAdb le 16.1.21
    - ttt et tgt sont nuls partout
    - atgi, c'est Ile2, mis à la place de ttt, très rare chez les procaryotes.
    - atgf, c'est iMet, mis à la place de tgt, très rare chez les procaryotes.
    - atgj, c'est Met, remplace le atg standard qui est la somme Ile2 Met iMet.
    - Voir la légende des tris, g1 t1 et des couleurs

euryarchaeota, calcul des -rRNAs

[modifier | modifier le wikicode]
eur euryarchaeota 63 génomes
eur1 cumul des +rRNAs de la fiche euryarchaeota pour 63 génomes
g1    t1        0  0
atgi tct tat atgf
att act aat agt
ctt cct cat cgt
gtt gct gat ggt
ttc tcc 2 tac tgc 28
atc 1 acc aac agc
ctc ccc cac 0 cgc
gtc gcc gac ggc
tta tca taa tga
ata aca aaa 3 aga
cta cca caa cga
gta gca 87 gaa gga
ttg tcg tag tgg
atgj acg aag 1 agg
ctg ccg cag cgg 2
gtg gcg gag ggg
eury63 inter max min total
118 3 3 124
eur2 indices du clade euryarchaeota du 16.1.21 de gtRNAdb pour 100 génomes
g1    t1       
atgi 99 tct tat atgf 127
att act ° aat agt
ctt °0.7 cct cat cgt 0.7
gtt gct gat ggt 0.7
ttc 122 tcc 106 tac 104 tgc 181
atc 121 acc 104 aac 122 agc 104
ctc °122 ccc °93 cac 101 cgc 102
gtc °121 gcc °101 gac 124 ggc 141
tta 107 tca 101 taa tga °13
ata ° aca 110 aaa 110 aga 103
cta 103 cca 102 caa 108 cga °103
gta 103 gca 151 gaa 132 gga 103
ttg 87 tcg °87 tag tgg 102
atgj 101 acg °90 aag °87 agg °88
ctg 85 ccg °78 cag °87 cgg °71
gtg °91 gcg °84 gag °84 ggg °79
gtRNA inter max min total
1757 1612 1480 4848
eur3 cumul des -rRNAs de l'annexe archeo 4 génomes
g1    t1       
atgi 3 tct tat atgf 7
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc 5 tcc 4 tac 3 tgc 8
atc 6 acc 4 aac 6 agc 4
ctc 6 ccc 3 cac 3 cgc 4
gtc 6 gcc 4 gac 3 ggc 8
tta 6 tca 4 taa tga 1
ata aca 4 aaa 4 aga 4
cta 3 cca 3 caa 5 cga 4
gta 4 gca gaa 6 gga 4
ttg 3 tcg 3 tag tgg 4
atgj 4 acg 3 aag 3 agg 3
ctg 3 ccg 2 cag 3 cgg 2
gtg 4 gcg 3 gag 2 ggg 3
eury4 inter max min total
63 66 55 184
eur4 indices des +rRNAs de la fiche euryarchaeota pour 100 génomes
g1    t1       
atgi tct tat atgf
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc tcc 3 tac tgc 44
atc 2 acc aac agc
ctc ccc cac cgc
gtc gcc gac ggc
tta tca taa tga
ata aca aaa 5 aga
cta cca caa cga
gta gca 138 gaa gga
ttg tcg tag tgg
atgj acg aag 2 agg
ctg ccg cag cgg 3
gtg gcg gag ggg
eury63 inter max min total
187 5 5 197
eur5 estimation des -rRNA du clade euryarchaeota pour 100 génomes
g1    t1       
atgi 99 tct tat atgf 127
att act aat agt
ctt 0.7 cct cat cgc 0.7
gtt gct gat ggt 0.7
ttc 122 tcc 102 tac 104 tgc 137
atc 119 acc 104 aac 122 agc 104
ctc 122 ccc 93 cac 101 cgc 102
gtc 121 gcc 101 gac 124 ggc 141
tta 107 tca 101 taa tga 13
ata aca 110 aaa 106 aga 103
cta 103 cca 102 caa 108 cga 103
gta 103 gca 13 gaa 132 gga 103
ttg 87 tcg 87 tag tgg 102
atgj 101 acg 90 aag 85 agg 88
ctg 85 ccg 78 cag 87 cgg 68
gtg 91 gcg 84 gag 84 ggg 79
-rRNA inter max min total
1569 1607 1475 4651
eur6 indices des -rRNAs de l'annexe archeo pour 100 génomes
g1    t1       
atgi 75 tct tat atgf 175
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc 125 tcc 100 tac 75 tgc 200
atc 150 acc 100 aac 150 agc 100
ctc 150 ccc 75 cac 75 cgc 100
gtc 150 gcc 100 gac 75 ggc 200
tta 150 tca 100 taa tga 25
ata aca 100 aaa 100 aga 100
cta 75 cca 75 caa 125 cga 100
gta 100 gca gaa 150 gga 100
ttg 75 tcg 75 tag tgg 100
atgj 100 acg 75 aag 75 agg 75
ctg 75 ccg 50 cag 75 cgg 50
gtg 100 gcg 75 gag 50 ggg 75
eury4 inter max min total
1575 1650 1375 4600

euryarchaeota, comparaison clade-annexe des -rRNAs

[modifier | modifier le wikicode]
  • Lien tableur: euryarchaeota, comparaison clade-annexe des -rRNAs
  • Légende
    - eur7. diff, somme des couleurs de eur7. La différence entre tRNAs est faite entre eur5 et eur6 du tableau précédent. Elle est exprimée en % et rapporté à la plus grande valeur des 2 termes de la différence. Ce qui fait quand un tRNA est à zéro la différence en % est égale à 100.
    - eur8. rap, rapport des sommes couleurs eur5/eur2. Le rapport -rRNA/total est celui du tRNA de eur5 sur celui de eur2.
  • Fréquences des différences en % du tableau eur7
gamme		0/0	10	20	30	40	50	60	70	80	90	100			total
fréquence	1	17	14	10	3	2	0	0	0	0	0	1	48
tot ≤ 50							41							
  • Comparaison avec le nombre de tRNAs de la fiche du clade: L’estimation des -rRNA par l'annexe est 10% au dessus de celle de la fiche des archées.
tRNAs		fiche		annexe
sans		2642		184
avec		150		17
genomes		63		4
indice %	42		46
eur euryarchaeota 63 génomes
eur7 euryarchaeota, différence clade-annexe des -rRNAs
g1    t1       
atgi 24 tct tat atgf 28
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc 2 tcc 2 tac 28 tgc 32
atc 20 acc 4 aac 19 agc 4
ctc 19 ccc 19 cac 26 cgc 2
gtc 19 gcc 1 gac 39 ggc 29
tta 29 tca 1 taa tga 50
ata aca 9 aaa 5 aga 3
cta 27 cca 27 caa 13 cga 3
gta 3 gca 100 gaa 12 gga 3
ttg 14 tcg 14 tag tgg 2
atgj 1 acg 17 aag 12 agg 15
ctg 12 ccg 36 cag 14 cgg 27
gtg 9 gcg 11 gag 40 ggg 5
diff inter max min total
361 220 311 832
eur8 euryarchaeota, rapports -rRNA/total
g1    t1       
atgi tct tat atgf
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc tcc 97 tac tgc 75
atc 99 acc aac agc
ctc ccc cac cgc 2
gtc gcc gac ggc
tta tca taa tga
ata aca aaa 96 aga
cta cca caa cga
gta gca 9 gaa gga
ttg tcg tag tgg
atgj acg aag 98 agg
ctg ccg cag cgg 96
gtg gcg gag ggg
rap inter max min total
89 100 100 96

Archeo. Intergen51

[modifier | modifier le wikicode]

Intergen51. Archeo. Introduction

[modifier | modifier le wikicode]

Intergen51. Archeo. Historique des pré-études

[modifier | modifier le wikicode]

Intergen51. Archeo. Formatage des résultats pour 51 génomes

[modifier | modifier le wikicode]
  • Lien au tableur:

archées données intercalaires

[modifier | modifier le wikicode]
	total	max1	reste	max2	un
mba	2379	1733	12	2693	2705
mfe	2011	1740	10	2916	4246
mfi	1545	909	8	1722	11130
mja	1069	685	5	859	1019

archées données intercalaires 200

[modifier | modifier le wikicode]

Intergen51. Archeo. Vue de l'ensemble

[modifier | modifier le wikicode]

Intergen51. Archeo. La longueur totale des intercalaires d'un génome

[modifier | modifier le wikicode]
  • Note: voir la totale. Deux des archées présentent les taux les plus élevés de cette étude des 51 génomes, plus de 25% les 2 autres sont dans la moyenne des 12%.
Nom	intercalaires	génome			taux en %
archeo					
mba	1,341,425	4,837,408		27.7
mfe	987,074		3,914,091		25.2
mfi	403,834		2,478,074		16.3
mja	168,865		1,664,970		10.1

Intergen51. Archeo. Les différents types d'intercalaires

[modifier | modifier le wikicode]
  • Lien au tableur: Intergen51. Archeo. Les différents types d'intercalaires.
  • Légende:
    - S pour intercalaire CDS-CDS et R pour tRNA-CDS,
    - c pour intercalaire continu (les 2 gènes sont sur le même brin) et x pour discontinu (les 2 gènes sont sur 2 brins différents, le brin et son complément)
    - %reste = 100*reste/total, le reste étant ce qui reste du total après la fin du diagramme, gamme.
    - %t30 = 100*t30/total, t30 étant le total des fréquences 10 20 30
    - %t5 = 100*t5/total, t5 étant le total des fréquences de -1 à -5 dans le diagramme des S-.
  • Note:
Int51.2 Archeo les différents types d'intercalaires entre gènes de 4 génomes
Int51.21 Les différents types
intercalaires CDS-CDS * autres intercalaires
continu S+ S- S0 total c/x RNA-RNA CDS-rRNA total
c 6 926 887 78 7 891 2,3 86 2 88
x 3 357 100 12 3 469 2 15 17
t 10 283 987 90 11 360 88 17 105
% 90,5 8,7 0,8
Int51.22 Détail des * autres intercalaires
intercalaires tRNA-CDS récapitulatif des * autres intercalaires
continu R+ R- R0 total c/x * autres total %
c 153 1 2 156 1,4 tRNA-CDS 268 42
x 112 1 0 113 RNA-RNA 88 14
t 265 2 2 269 CDS-rRNA 17 3
% 98,5 0,7 0,7 non RNA 63 10
total 436 68
Int51.23 Les taux remarquables
taux %reste %t30 %t5 %0
type S+ R+ S- S+ R+ S- S+ R+
gamme 400 400 6-50 - - - - -
c 18,3 21,2 2,5 20,1 3,2 52 1,0 1,3
x 30,4 25,9 9,0 6,3 3,6 38 0,3 0,0

Intergen51. Archeo. Détail des intercalaires RNA-RNA et CDS-rRNA

[modifier | modifier le wikicode]
archeo								
RNA-RNA		c	x		CDS-RNA		c	x
23s5s		9			CDS 16s		1	7
16s23s		4			5s CDS		1	7
16stRNA		6			16 CDS			
tRNA23s		6			CDS 5s			
5stRNA		1			23s CDS			
tRNAin		0			CDS 23s			1
tRNAcontig	8			5s 16s			1
tRNAhors	49	1		16s16s			
tRNA16s		1						
23stRNA								
tRNA5s		1						
16s5s								
5s23s								
5s5s		1						
total		86	1		total		2	16

Intergen51. Archeo. Les intercalaires rares

[modifier | modifier le wikicode]
  • Note:
tRNA-CDS			
gen	x-	c-	c0
mfi		-1	
mba	-12		1
mfe			1
tRNA h	x+		
mfe	227		
5s5s	c+		
mfi	748		
5s16s	x+		
mja	340		

Intergen51. Archeo. Les diagrammes de la totale

[modifier | modifier le wikicode]

Intergen51. Archeo. Les diagrammes CDS-CDS et tRNA-CDS

[modifier | modifier le wikicode]
Intergen51. Archeo. Les diagrammes CDS-CDS et tRNA-CDS positifs
[modifier | modifier le wikicode]
  • Lien aux archées données intercalaires.
  • Diagrammes des archeo:  tar présente 4 diagrammes
    - fc40, CDS-CDS continu, fréquence unitaire en abscisses et effectif en ordonnées
    - fx% fc%, CDS-CDS discontinu continu, fréquences regroupées par 10 (freq10) en abscisses et pourcentage en ‰ par rapport au total, en ordonnées.
    - ftc, tRNA-CDS continu, fréquences regroupées par 10 (freq10) en abscisses et effectif en ordonnées
    - ftx, tRNA-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et effectif en ordonnées
  • Équations des courbes de tendance en pour 1000: colonnes %fx %fc
Courbes de tendances pour les diagrammes en pour 1000				Calculs des f.41 et autres R2 des f.1		
R2	x3		x2		x		c			Inflexion poly3	x	c
0,691	6,84E-07	-5,39E-04	8,70E-02	1,78E+01	fx1	abscisse	250,9	762,1
0,856	-3,86E-06	2,91E-03	-7,27E-01	7,29E+01	fc1	ordonnée	16,3	5,6
										poly3/droite	15,9	-22,9
0,753	1,78E-06	-1,34E-03	2,61E-01	7,03E+00	fx41				
0,976	-9,36E-08	2,14E-04	-1,52E-01	3,86E+01	fc41	R2 f.1		x	c
										Poly 3		691	856
0,578					-0,036		24,9		fx41	Poly 6		761	979
0,940					-0,072		32,0		fc41	Poly 9		774	991
0,575					-0,031		23,8		fx1				
0,623					-0,112		43,1		fc1				
Intergen51. Archeo. Les diagrammes CDS-CDS négatifs
[modifier | modifier le wikicode]
Intergen51. Archeo. comparaison avec la totale
[modifier | modifier le wikicode]
Sous-totaux	archeo			totale	
fréquence	x-	c-		x-	c-
-1		0	106		4	4140
-2		3	0		85	11
-3		0	2		3	12
-4		34	354		717	10938
-5		1	2		5	19
sp6		62	423		1642	8424
total		100	887		2 456	23 544
reste		9	22		264	420
s6		27	10		361	41
s7		7	86		321	1438
s8		19	305		696	6525
rappot s1-5						
4/2/1		11,3	3,3		8,4	2,6
% / sp6						
s6/sp6		43,5	2,4		22,0	0,5
s7/sp6		11,3	20,3		19,5	17,1
s8/sp6		30,6	72,1		42,4	77,5
reste/sp6	14,5	5,2		16,1	5,0
						
total s1-5	38	464		814	15120
% / total						
%s1-5		38,0	52,3		33,1	64,2
%sp6		62,0	47,7		66,9	35,8
Intergen51. Archeo. homogénéité des génomes
[modifier | modifier le wikicode]
  • Lien aux données intercalaires des génomes
  • Homogénéité des génomes:
    - Dans les discontinus mfe mfi mba sont homogènes pour s1-5/sp6 avec 1/4 et mja fait 1/1. Les 4 génomes sont hétérogènes pour le rapport 4/2, 4.0 ? 1.5 (mfe mfi mba) etsupérieur à 25 pour mja. Ils sont aussi hétérogènes pour s6 et s8, peut être homogènes pour s7.
    - Dans les continus les 4 génomes sont homogènes partout sauf mja qui a un rapport 4/1 de 2.0 contre plus de 3 pour les 3 autres. Les continus se distinguent des autres clades par un rapport s1-5/sp6 de 1/1 alors qu'en général il est de 1/4.
négatifs x	mfe	mfi	mba	mja	total
total		17	5	22	56	100
s1-5		5	1	6	26	38
sp6		12	4	16	30	62
rapport s1-5						
4/2		4.0	-	1.5	-	11.3
% / sp6						
s6		42	25	13	63	44
s7		17	0	13	10	11
s8		17	25	56	23	31
reste		25	50	19	3	15
% / total						
s1-5		29	20	27	46	38
sp6		71	80	73	54	62
						
						
négatifs c	mfe	mfi	mba	mja	total
total		250	167	307	163	887
s1-5		142	92	152	78	464
sp6		108	75	155	85	423
rapport s1-5						
4/1		4.5	3.2	3.5	2.0	3.3
% / sp6						
s6		3	0	5	0	2
s7		20	17	22	20	20
s8		74	73	70	73	72
reste		3	9	4	7	5
% / total						
s1-5		57	55	50	48	52
sp6		43	45	50	52	48
Intergen51. Archeo. Les grands négatifs inférieurs à -120
[modifier | modifier le wikicode]

Intergen51. Archeo. Les diagrammes CDS-rRNA

[modifier | modifier le wikicode]
Intergen51. Archeo. Les diagrammes CDS-16s
[modifier | modifier le wikicode]
archeo		CDS16sc		CDS16sx		5sCDSc		5sCDSx
R2		-		-		-		-
xs		454		799,8		857		410,4
plage		480		690-990		870		270-630
total-p		1		6		1		5
%		100		86		100		71
queue		0		1		0		1
%		0		14		0		14
tête		0		0		0		1
%		0		0		0		14
max		450;1		720;2		870;1		300;2
total4		1		7		1		7
freq		30		30		30		30
  • Les moyennes par génome
Intergen51.archeo. Moyennes CDS-16s
CDS16sx. discontinu
CDS16sx moyenne écart m/e intercalaires haut bas
mba 933,3 277,9 3,4 718 835 1247 16,8 156,0
mfe 840,7 134,6 6,2 704 845 973 109,4 63,3
mfi 724 724 226,1 -53,3
mja
total 863,7 194,2 4,4 950,1 777,3
CDS16sc. continu
CDS16sc moyenne écart m/e intercalaires haut bas
mba
mfe
mfi 454 454
mja
total 454
Intergen51. Archeo. Les diagrammes 5s-CDS
[modifier | modifier le wikicode]

voir données intercalaires

archeo		5sCDSc		5sCDSx		ftx		ftc
R2		-		-		0,127		0,393
xs		857		410,4		285,9		138,7
plage		870		270-630		40-250		40-300
total-p		1		5		48		102
%		100		71		43		65
queue		0		1		59		46
%		0		14		53		29
tête		0		1		4		5
%		0		14		4		3
max		870;1		300;2		250;5		200;9
total4		1		7		112		156
freq		30		30		10		10
Intergen51.archeo. Comparaison 5s-CDS tRNA-CDS CDS-CDS
[modifier | modifier le wikicode]
ftx-fx	92,7		ftc-fc	127,4
ftx-fx	-1,7		ftc-fc	-19,6
Intergen51.Archeo Comparaison 5s-CDS tRNA-CDS CDS-CDS
ftx. tRNA-CDS discontinu
ftx moyenne écart m/e Inf 40 Sup 700 haut bas
mba 330,2 153,1 2,2 2 7 -10,0 68,2
mfe 305,4 135,0 2,3 2 4 14,7 43,5
mfi 308,7 139,6 2,2 4 0 11,5 46,7
mja 186,2 87,9 2,1 0 0 134,0 -75,7
total 291,1 143,0 2,0 ++ 320,2 262,0
5sCDSx. 5s-CDS discontinu
5sCDSx moyenne écart m/e intercalaires  -
mba 461,3 160,7 2,9 289 488 607
mfe 138,0 188,1 0,7 5 271
mfi 397 397 *939
mja
total 342,8 207,8 1,6 ++ 377,1 308,6 -
ftc. tRNA-CDS continu
ftc moyenne écart m/e Inf 40 Sup 700 haut bas
mba 310,9 175,0 1,8 2 8 -43,6 92,2
mfe 273,3 156,2 1,7 0 5 -5,9 54,5
mfi 182,8 91,0 2,0 2 0 84,5 -35,9
mja 144,0 102,3 1,4 5 0 123,4 -74,8
total 243,1 154,5 1,6 ++ 267,4 218,7
5sCDSc. 5s-CDS continu
5sCDSc moyenne écart m/e intercalaires  -
mba
mfe 857 *857
mfi
mja
total 857 ++ 857 -
fx. CDS-CDS discontinu
fx moyenne écart m/e ftx-fx Sup 700 haut bas
mba 314,0 172,6 1,8 16,2 229 -11,9 66,8
mfe 288,4 170,2 1,7 17,0 140 13,6 41,3
mfi 237,1 143,2 1,7 71,5 15 64,9 -10,0
mja 185,1 127,3 1,5 1,1 0 116,9 -62,0
total 274,6 166,7 1,65 16,5 ++ 302,0 247,1
fc. CDS-CDS continu
fc moyenne écart m/e ftc-fc Sup 700 haut bas
mba 277,8 177,6 1,6 33,1 280 -24,7 70,7
mfe 251,2 165,9 1,5 22,1 183 2,0 44,1
mfi 181,7 123,9 1,5 1,1 17 71,4 -25,4
mja 136,8 87,6 1,6 7,2 5 116,4 -70,3
total 230,2 161,7 1,42 12,9 ++ 253,2 207,1
Intergen51. Archeo. Les CDS-rRNA rares
[modifier | modifier le wikicode]
  • CDS 23s x, 182.

Intergen51. Archeo. Les diagrammes RNA-RNA

[modifier | modifier le wikicode]
Intergen51. Archeo. Les diagrammes rRNA-rRNA
[modifier | modifier le wikicode]
archeo		16s23s		16stRNA		tRNA23s		23s5s
R2		-		-		-		-
xs		202,5		76,0		185,8		110,6
plage		180-220		60-100		100-240		60-180
total-p		4		6		6		25
%		100		100		100		100
queue		0		0		0		0
%		0		0		0		0
tête		0		0		0		0
%		0		0		0		0
max		220;2		100;3		220;2		80;8
total8		4		6		6		25
freq		20		20		20		20
Intergen51. Archeo. Les diagrammes tRNA-rRNA
[modifier | modifier le wikicode]
Intergen51.archeo. Moyennes rRNA-RNA
16s23s.
16s23s moyenne écart m/e intercalaires haut bas
mba 209 2x209       13,8 26,8
mfe 196 2x196 26,8 13,8
mfi
mja
total 202,5 7,5 27,0 222,8 182,3
23s5s.
23s5s moyenne écart m/e intercalaires haut bas
mba 74 3x74    62,0 -37,3
mfe 74 3x74 62,0 -37,3
mfi 295,5 13,4 22,0 286 305 -159,5 184,2
mja 78 78 58,0 -33,3
total 123,7 97,5 1,3 136,0 111,3
16stRNA.
16stRNA moyenne écart m/e intercalaires haut bas
mba 85 85    -1,4 16,6
mfe 84 84 -0,4 15,6
mfi 79,5 10,6 7,5 72 87 4,1 11,1
mja 64 2x64 19,6 -4,4
total 76,0 10,7 7,1 83,6 68,4
tRNA23s.
tRNA23s moyenne écart m/e intercalaires haut bas
mba 116 116       88,4 -51,2
mfe 119 119 85,4 -48,2
mfi 233 2x 233 -28,6 65,8
mja 207 2x 207 -2,6 39,8
total 185,8 54,2 3,4 204,4 167,3
Intergen51. Archeo. Les diagrammes tRNA-tRNA
[modifier | modifier le wikicode]
Les diagrammes
[modifier | modifier le wikicode]
type c		S40	%	R2	diag	total	reste	x+	restes	hors	tRNA 5s	5stRNA
hors		12	24	0,142	140	49	4	227		178	13	80
5s tRNA		0				1	1			223		
tRNA 5s		1				1	1			504		tRNA contig
tRNA contig	7	87		40	8	1			718		83
Les pourcentages des tRNA-tRNA hors blocs
[modifier | modifier le wikicode]
tRNA h		mba	mja	mfi	mfe	total	%
20		2		4	0	6	12.2
40			2	2	2	6	12.2
60				3	1	4	8.2
80		6		2	4	12	24.5
100		3	1	3	2	9	18.4
120		2			4	6	12.2
140		1				1	2.0
160							
180			1	1		2	4.1
200							
220							
240		1				1	2.0
260							
restes				1	1	2	4.1
total		15	4	16	14	49	100.0
							
repete		4	0	0	5	9	26
séquence	2	0	0	2	4	11
sans		2	9	9	2	22	63
clusters	8	9	9	9	35	100
							
5						0	0
10		2		3		5	10.2
15				1		1	2.0
20						0	0

Les moyennes par génome
[modifier | modifier le wikicode]
Intergen51.archeo. Moyennes tRNA-tRNA
mja
mja moyenne écart m/e total S60% sup120 haut bas
5stRNA 80 1 100
tRNA in - 0
tRNA cont 26,1 25,5 1,0 8 88 0
-
-
tRNA hors cluster
tRNA hors moyenne écart m/e total S60% sup120 haut bas
mba 71,1 34,2 2,1 15 13 2 -0,9 13,7
mfe 78,2 31,4 2,5 14 21 1 -8,1 20,8
mfi 46,7 33,8 1,4 16 56 2 23,5 -10,7
mja 49,3 36,5 1,4 4 50 20,8 -8,1
total 63,8 35,0 1,8 49 33 5 70,2 57,4
Intergen51. Archeo. Les RNA-RNA rares
[modifier | modifier le wikicode]
  • tRNA hors x+, mfe 227.
  • tRNA 16s c+, 295.
  • 5s5s c+, 748