Recherche:Les clusters de gènes tRNA et rRNA chez les procaryotes/Annexe/alpha

Une page de Wikiversité.
Sauter à la navigation Sauter à la recherche
alpha
Image logo représentative de la faculté
Annexe 2
Recherche : Les clusters de gènes tRNA et rRNA chez les procaryotes
Précédent :gamma
Suivant :bacilli
Icon falscher Titel.svg
En raison de limitations techniques, la typographie souhaitable du titre, « Annexe : alpha
Les clusters de gènes tRNA et rRNA chez les procaryotes/Annexe/alpha
 », n'a pu être restituée correctement ci-dessus.



Rickettsia typhi str. B9991CWPP[modifier | modifier le wikicode]

rtb opérons[modifier | modifier le wikicode]

  • Liens: gtRNAdb [1], NCBI [2], génome [3]
  • Lien tableur: rtb opérons
  • Phylogénie: Bacteria; Proteobacteria; Alphaproteobacteria; Rickettsiales; Rickettsiaceae; Rickettsieae; Rickettsia; typhus group.
  • Légende: cdsa: cds aas, cdsd: cds dirigé
A8. Rickettsia typhi str. B9991CWPP
29%GC 31.12.19 Paris  33   doubles intercal cds aa avec aa cdsa cdsd protéines
comp 7429..8469 cds 381 381 347 UDP-3-O-(3-hydroxymyristoyl)glucosamine N-acyltransferase
comp 8851..8926 ttc 368 368
9295..10278 cds 328 tRNA dihydrouridine synthase DusB
14663..18055 cds 108 108 1131 autotransporter outer membrane beta-barrel domain-containing protein
18164..18238 gaa 1394 1394
comp 19633..20106 cds 158 crossover junction endodeoxyribonuclease RuvC
comp 48065..48709 cds 278 278 215 YihA family ribosome biogenesis GTP-binding protein
comp 48988..49064 atgf 110 110
comp 49175..49411 cds 79 50S ribosomal protein L31
comp 73627..73929 cds 17 17 101 preprotein translocase subunit SecG
comp 73947..74021 acc 139 139
comp 74161..75417 cds 419 MFS transporter
155064..157163 cds 143 143 700 elongation factor G
157307..157382 tgg 167 167
157550..157750 cds 67 preprotein translocase subunit SecE
189197..189400 cds 889 889 68 DUF2674 domain-containing protein
comp 190290..190365 acg 142 142
comp 190508..192814 cds 769 outer membrane protein assembly factor BamA
255010..255921 cds 732 732 304 methionyl-tRNA formyltransferase
256654..259439 23s 206 2786
259646..259760 5s 173 173 115
comp 259934..261007 cds 358 cell division protein ZapE
291358..291843 cds 35 35 162 30S ribosomal protein S9
291879..291955 atgj 1364 1364
comp 293320..293805 cds 162 RNA pyrophosphohydrolase
335194..336996 cds 402 402 601 elongation factor 4
337399..337473 aac 633 633
comp 338107..338793 cds 229 hp
comp 440466..440933 cds 496 496 156 DUF2155 domain-containing protein
441430..441504 tgc 31 31
441536..442456 cds 307 site-specific tyrosine recombinase XerD
comp 469056..469781 cds 218 218 242 3-deoxy-manno-octulosonate cytidylyltransferase
470000..470075 aaa 15 15
470091..470167 atc 1922 1922
472090..472662 cds 191 GTP cyclohydrolase I FolE
comp 564534..565562 cds 1530 1530 343 type 2 isopentenyl-diphosphate Delta-isomerase
comp 567093..567180 tcc 218 218
comp 567399..568145 cds 249 NTP transferase domain-containing protein
583250..584149 cds 1278 1278 300 hydroxymethylbilane synthase
comp 585428..585518 tca 58 58
comp 585577..586569 cds 331 tryptophan--tRNA ligase
598723..599706 cds 26 26 328 polyprenyl synthetase family protein
599733..599809 cgg 60 60
comp 599870..599944 caa 62 62
comp 600007..601779 cds 591 aminopeptidase P family protein
comp 644357..644745 cds 499 499 130 p-ribosome-associated translation inhibitor RaiA
645245..645321 gac @1 1051 1051
comp 646373..646448 gcc 222 222
comp 646671..647276 cds 202 ATP-dependent Clp endopeptidase proteolytic subunit ClpP
comp 649389..650048 cds 452 452 220 (d)CMP kinase
650501..650577 gtc 1274 1274
comp 651852..652094 cds 81 HU family DNA-binding protein
comp 696163..697398 cds 1535 1535 412 tyrosine--tRNA ligase
698934..699010 cgt 1028 1028
700039..705720 cds 1894 alpha-2-macroglobulin family protein
comp 727560..728087 cds 1164 1164 176 copper chaperone Pcu(A)C
comp 729252..729326 gca 32 32
comp 729359..729574 cds 72 hp
739215..740075 cds 181 181 287 TIGR01459 family HAD-type hydrolase
740257..740343 ctc 246 246
740590..741960 cds 1199 1199 457 magnesium transporter
743160..743234 ggc 1090 1090
744325..744753 cds 143 preprotein translocase subunit YajC
comp 775944..777866 cds 2465 2465 641 hp
comp 780332..781831 16s 1854 1854 1500
comp 783686..785485 cds 600 PAS domain-containing sensor histidine kinase
comp 814590..814823 cds 349 349 78 hp
comp 815173..815248 gta 68 68
comp 815317..815589 cds 91 30S ribosomal protein S20
comp 829300..830484 cds 82 82 395 elongation factor Tu
comp 830567..830640 gga 95 95
comp 830736..830821 tac 183 183
831005..831733 cds 243 23s rRNA (guanosine(2251)-2'-O)-methyltransferase RlmB
839841..839969 cds 145 145 43 dimethyladenosine transferase
840115..840200 tta 2009 2009
842210..842446 cds 79 hp
comp 876906..877589 cds 401 401 228 7-cyano-7-deazaguanine synthase QueC
877991..878067 cac 145 145
878213..879943 cds 577 ATP-binding cassette domain-containing protein
918938..919882 cds 951 951 315 ACP S-malonyltransferase
920834..920925 agc 1945 1945
comp 922871..924049 cds 393 acetyl-CoA C-acetyltransferase
comp 961209..962297 cds 41 41 363 YjgP/YjgQ family permease
comp 962339..962415 atgi 390 390
comp 962806..963273 cds 156 peptidoglycan-associated lipoprotein Pal
1023375..1023626 cds 1585 1585 84 BolA family transcriptional regulator
1025212..1025288 cca 17 17
1025306..1025521 cds 72 translation initiation factor IF-1
1053321..1054139 cds 2191 2191 273 alpha/beta hydrolase
comp 1056331..1056407 aga 98 98
1056506..1056823 cds 106 DUF167 domain-containing protein
comp 1098776..1099240 cds 40 40 155 DNA polymerase III subunit chi
comp 1099281..1099365 cta 145 145
comp 1099511..1100662 cds 384 succinyl-diaminopimelate desuccinylase
comp 1102351..1102980 cds 475 475 210 lipoyl(octanoyl) transferase LipB
comp 1103456..1103530 aca 130 130
comp 1103661..1103996 cds 112 30S ribosomal protein S16

rtb cumuls[modifier | modifier le wikicode]

  • Lien tableur: rtb cumuls
  • Légende
  • Notes: moyenne et variance des intercalaires élevés des 21 cds : 1430 et 491
cumuls. rtb.
opérons Fréquences intercalaires tRNAs Fréquences intercalaires cds Fréquences aas cds chromosome
effectif gammes sans rRNAs avec rRNAs gammes cds gammes cdsd gammes cdsa gammes cdsa 300
avec rRNA opérons 2 1 - 1 0 1 100 11 30 0
23s5s 1 20 1 50 8 40 200 13 60 1
16s 1 40 100 5 80 300 12 90 9
16s23s 0 60 1 150 9 120 400 13 120 4
max a 0 80 200 4 160 500 3 150 2
a doubles 0 100 1 250 4 200 600 3 180 7
spéciaux 0 120 300 1 240 700 3 210 3
total aas 0 140 350 1 280 800 1 240 4
sans opérons 29 160 400 3 320 900 0 270 3
1 aa 25 180 450 2 360 1000 0 300 3
max a 2 200 500 4 400 1100 0 330 5
a doubles 0 1 21 2 20
total aas 33 4 0 62 0 61 61
total aas 33
remarques 1
avec jaune moyenne 612 310
variance 665 291
sans jaune moyenne 57 193 269 176
variance 40 148 176 86

rtb blocs[modifier | modifier le wikicode]

A8. rtb, blocs à rRNA.
cds 732 304 methionyl-tRNA formyltransferase
23s 206 2786
5s 173 115
cds 358 cell division protein ZapE
cds 2465 641 hp
16s 1854 1500
cds 600 PAS domain-containing sensor histidine kinase

rtb remarques[modifier | modifier le wikicode]

  • Remarques: Les rickettia, rtb et rpl, présentent de nombreux intercalaires très élevés. D’où cet intercalaire @1 entre 2 aas de 1051 pbs. Je détaille ici les intercalaires du tableau des cumuls.
    - Les intercalaires entre aas: Il y a quatre intercalaires de ce type, 1051 95 60 15. A part le 1er les 3 autres sont courants dans cette étude et seulement le dernier est le rprésentant de la moyenne dans cette étude.
    - Les intercalaires avec un cds. Les 31 blocs de ce génomes se répartissent en 3 groupes
    1. Les RNAs complètement isolés, les 2 intercalaires du bloc sont supérieurs à 400 pbs. Il y a 6 aas dont celui avec 1051, plus le 16s. Sur ces 14 intercalaires 10 sont supérieurs à 900 et 4 entre 400 et 600 pbs.
    2. Les tRNAs proches de leurs 2 cds. Il y a 6 aas dont les 2 intercalaires sont inférieurs à 300 pbs et 4 aas dont au moins un des 2 intercalaires est entre 300 et 400 pbs et l'autre inférieur à 300 pbs.
    3. Il reste 14 blocs dont le 23s5s, auxquels il faut ajouter l’aa gcc voisin du gac isolé par 1051. Ces blocs sont très polarisés, leurs 2 intercalaires sont très dissymétriques.
      - 11 aas ont leur intercalaire majeur supérieur à 900 et va jusqu’à 2465 pbs. Le 23s5s a un intercalaire majeur modéré et assez courant pour les blocs à rRNAs.
      - 3 aas ont leur intercalaire majeur de 450 pbs environ.
  • Les blocs isolés et les blocs entourés par 2 cds.
				
	Blocs à RNAs isolés par 2 intercalaires de plus de 400 pbs.					
	bloc	adresse			Blocs entourés par 2 intercalaires de 300 à 400 pbs	
	aac	337399			ttc	8851
	gac	645245			gta	815173
	gtc	650501			cac	877991
	cgt	698934			atgi	962339
	ggc	743160				
	16s	780332			Blocs entourés par 2 intercalaires inférieurs à 300 pbs	
	agc	920834			atgf	48988
	:	:			acc	73947
	:	:			tgg	157307
	:	:			cgg-caa	599733
	:	:			gga-tac	830567
	:	:			cta	1099281
  • Les séquences des doubles: Il n'y a aucun double dans ce génome

Rickettsia prowazekii str. Breinl[modifier | modifier le wikicode]

rpl opérons[modifier | modifier le wikicode]

  • Lien tableur: rpl opérons
  • Liens: gtRNAdb [4], NCBI [5], génome [6]
  • Phylogénie: Bacteria; Proteobacteria; Alphaproteobacteria; Rickettsiales; Rickettsiaceae; Rickettsieae; Rickettsia; typhus group.
  • Légende: cdsa: cds aas, cdsd: cds dirigé
A7. Rickettsia prowazekii str. Breinl
29%GC 30.12.19 Paris  33   doubles intercal cds aa avec aa cdsa cdsd protéines
comp 31462..31892 cds 263 263 144 p-preprotein translocase subunit YajC
comp 32156..32181 rpr 870 870 26 tandem
comp 33052..33126 ggc 1253 1253
comp 34380..35750 cds 256 256 magnesium transporter
comp 36007..36093 ctc 190 190
comp 36284..37144 cds 287 TIGR01459 family HAD-type hydrolase
46825..47040 cds 31 31 72 hp
47072..47146 gca 1964 1964
49111..49650 cds 180 copper chaperone Pcu(A)C
comp 71150..76816 cds 933 933 1889 alpha-2-macroglobulin family protein
comp 77750..77826 cgt 1179 1179
79006..80241 cds 412 tyrosine--tRNA ligase
121704..121946 cds 984 984 81 HU family DNA-binding protein
comp 122931..123007 gtc 446 446
123454..124113 cds 220 (d)CMP kinase
126222..126827 cds 236 236 202 ATP-dependent Clp endopeptidase proteolytic subunit ClpP
127064..127139 gcc @1 830 830
comp 127970..128046 gac 365 365
128412..128843 cds 144 ribosome-associated translation inhibitor RaiA
171237..173012 cds 50 50 592 aminopeptidase P family protein
173063..173137 caa 49 49
comp 173187..173263 cgg 18 18
comp 173282..174265 cds 328 polyprenyl synthetase family protein
186344..187336 cds 58 58 331 tryptophan--tRNA ligase
187395..187484 tca 354 354
comp 187839..188738 cds 300 hydroxymethylbilane synthase
203097..203846 cds 219 219 250 bifunctional N-acetylglucosamine-1-phosphate uridyltransferase/glucosamine-1-phosphate acetyltransferase
204066..204153 tcc 1457 1457
205611..206639 cds 343 type 2 isopentenyl-diphosphate Delta-isomerase
comp 299321..300853 cds 419 419 511 hp
comp 301273..301349 atc 15 15
comp 301365..301440 aaa 219 219
301660..302400 cds 247 3-deoxy-manno-octulosonate cytidylyltransferase
comp 328700..329635 cds 22 22 312 site-specific tyrosine recombinase XerD
comp 329658..329732 tgc 499 499
330232..330699 cds 156 DUF2155 domain-containing protein
429121..429807 cds 723 723 229 hp
comp 430531..430605 aac 359 359
comp 430965..432767 cds 601 elongation factor 4
473867..474352 cds 928 928 162 RNA pyrophosphohydrolase
comp 475281..475357 atgj 40 40
comp 475398..475883 cds 162 30S ribosomal protein S9
506934..508007 cds 183 183 358 cell division protein ZapE
comp 508191..508305 5s 240 115
comp 508546..511330 23s 716 716 2785
comp 512047..512958 cds 304 methionyl-tRNA formyltransferase
577419..579725 cds 138 138 769 outer membrane protein assembly factor BamA
579864..579939 acg 1026 1179
comp 580966..581169 cds 68 DUF2674 domain-containing protein
comp 612439..612639 cds 143 143 67 preprotein translocase subunit SecE
comp 612783..612858 tgg 143 143
comp 613002..615101 cds 700 elongation factor G
comp 656226..656870 cds 296 296 215 YihA family ribosome biogenesis GTP-binding protein
comp 657167..657243 atgf 119 119
comp 657363..657599 cds 79 50S ribosomal protein L31
comp 678911..679213 cds 19 19 101 preprotein translocase subunit SecG
comp 679233..679307 acc 159 159
comp 679467..680723 cds 419 MFS transporter
comp 746326..746529 cds 1664 1664 68 hp
comp 748194..748268 gaa 109 109
comp 748378..749421 cds 348 autotransporter outer membrane beta-barrel domain-containing protein
comp 756703..757686 cds 363 363 328 tRNA dihydrouridine synthase DusB
758050..758125 ttc 564 564
758690..759730 cds 347 UDP-3-O-(3-hydroxymyristoyl)glucosamine N-acyltransferase
776202..776537 cds 154 154 112 30S ribosomal protein S16
776692..776766 aca 467 467
777234..777863 cds 210 lipoyl(octanoyl) transferase LipB
779197..780348 cds 140 140 384 succinyl-diaminopimelate desuccinylase
780489..780573 cta 37 37
780611..781075 cds 155 DNA polymerase III subunit chi
comp 823242..823559 cds 98 98 106 DUF167 domain-containing protein
823658..823734 aga 1364 1364
comp 825099..825230 cds 44 hp
comp 854241..854456 cds 17 17 72 translation initiation factor IF-1
comp 854474..854550 cca 1573 1573
comp 856124..856357 cds 78 BolA family transcriptional regulator
915034..915501 cds 391 391 156 peptidoglycan-associated lipoprotein Pal
915893..915969 atgi 41 41
916011..917099 cds 363 YjgP/YjgQ family permease
953564..954742 cds 696 696 393 acetyl-CoA C-acetyltransferase
comp 955439..955530 agc 898 898
comp 956429..957373 cds 315 ACP S-malonyltransferase
comp 1009435..1011165 cds 142 142 577 ATP-binding cassette domain-containing protein
comp 1011308..1011384 cac 346 346
1011731..1012414 cds 228 7-cyano-7-deazaguanine synthase QueC
comp 1045414..1045656 cds 2381 2381 81 hp
comp 1048038..1048123 tta 135 135
comp 1048259..1048387 cds 43 hp
comp 1056245..1056973 cds 188 188 243 23s rRNA (guanosine(2251)-2'-O)-methyltransferase RlmB
1057162..1057247 tac 105 105
1057353..1057426 gga 82 82
1057509..1058693 cds 395 elongation factor Tu
1072391..1072663 cds 62 62 91 30S ribosomal protein S20
1072726..1072801 gta 1181 1181
comp 1073983..1074648 cds 222 hp
1102136..1103935 cds 1458 1462 600 PAS domain-containing sensor histidine kinase
1105394..1106893 16s 1462 1462 1500
1108356..1109301,1..184 cds 377 P-hp

rpl cumuls[modifier | modifier le wikicode]

  • Lien tableur: rpl cumuls
  • Légende
  • Notes: moyenne et variance des intercalaires élevés des 21 cds : 1204 et 453
cumuls. rpl.
opérons Fréquences intercalaires tRNAs Fréquences intercalaires cds Fréquences aas cds chromosome
effectif gammes sans rRNAs avec rRNAs gammes cds gammes cdsd gammes cdsa gammes cdsa 300
avec rRNA opérons 2 1 - 1 0 1 100 12 30 0
23s5s 1 20 1 50 9 40 200 11 60 2
16s 1 40 100 4 80 300 12 90 9
16s23s 0 60 1 150 8 120 400 15 120 4
max a 0 80 200 5 160 500 2 150 2
a doubles 0 100 250 3 200 600 4 180 6
spéciaux 0 120 1 300 3 240 700 2 210 2
total aas 0 140 350 1 280 800 1 240 5
sans opérons 29 160 400 5 320 900 0 270 3
1 aa 25 180 450 2 360 1000 0 300 2
max a 2 200 500 2 400 1100 0 330 5
a doubles 0 1 21 1 20
total aas 33 4 0 63 0 60 60
total aas 33
remarques 1
avec jaune moyenne 528 293
variance 558 271
sans jaune moyenne 56 191 243 172
variance 45 140 145 89

rpl blocs[modifier | modifier le wikicode]

A7. rpl, blocs à rRNA.
cds 183 358 cell division protein ZapE
5s 240 115
23s 716 2785
cds 304 methionyl-tRNA formyltransferase
cds 1458 600 PAS domain-containing sensor histidine kinase
16s 1462 1500
cds 377 P-hp

rpl remarques[modifier | modifier le wikicode]

  • Remarques: Les rickettsia, rtb et rpl, présentent de nombreux intercalaires très élevés. D’où cet intercalaire entre 2 aas de 830 pbs. La phylogénie très forte entre ces 2 génomes donne des blocs analogues mais avec des intercalaires différents. Ici les intercalaires élevés sont atténués. Je détaille ici les intercalaires du tableau des cumuls.
    - Les intercalaires entre aas: Il y a quatre intercalaires de ce type, 830 105 49 15. A part le 1er les 3 autres sont courants dans cette étude et seulement le dernier est le représentant de la moyenne dans cette étude.
    - Les intercalaires avec un cds. Les 31 blocs de ce génomes se répartissent en 3 groupes
    1. Les RNAs complètement isolés, les 2 intercalaires du bloc sont supérieurs à 400 pbs. Il y a 7 aas dont celui avec 830, et le 16s. Ici aac, gac et ttc ont l’intercalaire mineur à peine inférieur à 400. Sur ces 16 intercalaires 9 sont supérieurs à 800 et 7 entre 360 et 700 pbs.
    2. Les tRNAs proches de leurs 2 cds. Il y a 6 aas dont les 2 intercalaires sont inférieurs à 300 pbs et 3 aas dont au moins un des 2 intercalaires est entre 300 et 400 pbs.
    3. Il reste 14 blocs dont le 23s5s, auxquels il faut ajouter l’aa gcc voisin du gac isolé par 830. Ces blocs sont très polarisés, leurs 2 intercalaires sont très dissymétriques.
      10 aas ont leur intercalaire majeur supérieur à 800 et va jusqu’à 2381 pbs. Le 23s5s a un intercalaire majeur modéré, 723, assez courant pour les blocs à rRNAs.
      3 aas ont leur intercalaire majeur de 450 pbs environ.
  • Les blocs isolés et les blocs entourés par 2 cds
	Blocs à RNAs isolés par 2 intercalaires de plus de 400 pbs.					
	bloc	adresse	intercalaire	Blocs entourés par 2 intercalaires de 300 à 400 pbs	
	aac	430531	723-359		cac	1011308
	gac	127064	830-365		atgi	915893
	gtc	122931			tca	187395
	cgt	77750				
	ggc	33052			Blocs entourés par 2 intercalaires inférieurs à 300 pbs	
	16s	1105394			atgf	657167
	agc	955439			acc	679233
	ttc	758050	564-363		tgg	612783
	:	:			cgg-caa	173063
	:	:			gga-tac	1057162
	:	:			cta	780489
  • Les séquences des doubles: Il n'y a aucun double dans ce génome

Rhodospirillum photometricum DSM 122[modifier | modifier le wikicode]

rpm opérons[modifier | modifier le wikicode]

  • Lien tableur: rpm opérons
  • Liens: gtRNAdb [7], NCBI [8], génome [9]
  • Phylogénie: Bacteria; Proteobacteria; Alphaproteobacteria; Rhodospirillales; Rhodospirillaceae; Pararhodospirillum.
  • Légende: cdsa: cds aas, cdsd: cds dirigé
A5. Rhodospirillum photometricum DSM 122
64.7%GC 26.12.19 Paris  95   doubles intercal cds aa avec aa cdsa cdsd protéines
comp 3322..4194 cds 30 30 291 LysM peptidoglycan-binding domain-containing protein
comp 4225..4821 23s° @1 196 595
comp 5018..5093 gca 182
comp 5276..5684 16s° 38 38 407
5723..6664 cds 314 SEL1-like repeat protein
comp < 12458..13198 cds 242 242 247 p-transposase
comp 13441..13555 5s @2 72 113
comp 13628..13880 23s° -7 -7 251
comp 13874..15127 cds 418 hp
21325..22362 cds 586 586 346 hp
22949..23237 16s° 85 85 287
comp 23323..23490 cds 56 hp
comp 24015..24287 cds 250 250 91 TraYdomain-containingprotein
comp 24538..24652 5s 71 113
comp 24724..27490 23s 212 2765
comp 27703..27779 atc 112
comp 27892..28378 16s° 18 18 485
<> 28397..29119 cds 241 p-EscV/YscV/HrcVfamilytypeIIIsecretionsystemexportapparatusprotein
comp 32782..33759 cds 190 190 326 glycosyltransferase
33950..34357 16s° 112 406
34470..34546 atc 216
34763..35591 23s° 44 827
comp 35636..35750 5s 72 113
comp 35823..38589 23s 215 2765
comp 38805..38881 atc 112
comp 38994..40502 16s 260 1507
comp 40763..42629 23s° -15 1865
42615..42903 16s° 112 287
43016..43092 atc 213
43306..44132 23s° -1 825
comp 44132..44835 23s° -5 -5 702
44831..45121 cds 97 hp
< 45496..45768 cds 553 553 91 p-glycosyl transferase family 1
46322..47040 16s° 0 0 717
comp 47041..47433 cds 131 winged helix-turn-helix domain-containing protein
comp 49761..51017 cds 128 128 419 glycosyltransferase
comp 51146..51221 23s° 214 74
comp 51436..51512 atc 112
comp 51625..52017 16s° -7 391
52011..52881 23s° 106 106 869
52988..53464 cds -37 -37 159 hp
> 53428..53694 cds 86 86 89 p-glycosyltransferase
comp 53781..54709 23s° 26 927
54736..54898 16s° 112 161
55011..55087 atc 216
55304..55741 23s° 438 438 436
56180..56440 cds 87 hp
comp 82891..83088 cds 116 116 66 preprotein translocase subunit SecE
comp 83205..83280 tgg 199 199
>comp 83480..84178 cds 233 p-elongation factor Tu
417242..417412 cds 142 142 57 tRNA (5-methylaminomethyl-2-thiouridylate)-methyltransferase
417555..417631 atgj + 24 24
417656..417732 atgj 2 atgj 38 38
comp 417771..418796 cds 342 tRNA epoxyqueuosine(34) reductase QueG
434306..435142 cds 512 512 279 CDP-diacylglycerol--serine O-phosphatidyltransferase
435655..435842 16s° -6 186
435837..436075 23s° 72 237
436148..436262 5s 51 113
436314..436390 atgf 196 196
436587..436883 cds 99 hp
comp 467261..468370 cds 167 167 370 3-isopropylmalate dehydrogenase
468538..468667 23s° 72 128
468740..468854 5s 51 113
468906..468982 atgf 125 125
469108..469863 cds 252 SAM-dependent chlorinase/fluorinase
comp 534521..536161 cds 367 367 547 glucose-6-phosphate isomerase
536529..536603 acg 92 92
comp 536696..537778 cds 361 tyrosine-type recombinase/integrase
comp 658467..658931 cds 110 110 155 GNAT family N-acetyltransferase
comp 659042..659116 gtc 155 155
659272..660159 cds 106 106 296 N-formylglutamate amidohydrolase
660266..660340 gtc 648 648
comp 660989..661800 cds 271 p-N-formylglutamate amidohydrolase
comp 684188..685141 cds 323 323 318 cation transporter
comp 685465..685539 gtg + 25 25
comp 685565..685639 gtg 2 gtg 195 195
685835..686251 cds 139 NUDIX hydrolase
comp 691078..691773 cds 4 4 232 ComF family protein
691778..691897 23s° 72 118
691970..692084 5s 114 114 113
comp 692199..694505 cds 769 VWA domain-containing protein
750262..751398 cds 161 161 379 [FeFe] hydrogenase H-cluster radical SAM maturase HydE
comp 751560..751674 5s 72 113
comp 751747..752005 23s° 597 597 257
752603..752814 rpr @4 388 388 21 CRISPR
753203..753760 cds 186 hp
comp 839981..840214 cds 4 4 78 hp
comp 840219..840478 16s° 568 568 258
comp 841047..844388 cds 1114 response regulator
874585..875391 cds 88 88 269 phosphoadenylyl-sulfate reductase
875480..875556 cac 81 81
875638..876117 cds 160 CreA family protein
885688..886299 cds 176 176 204 LysE family translocator
886476..886552 ccc 144 144
comp 886697..887233 cds 179 helix-turn-helix transcriptional regulator
932708..934243 cds 93 93 512 Fic family protein
comp 934337..934413 cgt + 35 35
comp 934449..934525 cgt 3 cgt 44 44
comp 934570..934646 cgt 449 449
935096..936175 cds 360 hp
comp 978995..979396 cds 138 138 134 MFS transporter
comp 979535..979609 ggc + 23 23
comp 979633..979707 ggc 4 ggc 45 45
comp 979753..979827 ggc 29 29
comp 979857..979931 ggc 206 206
980138..981679 cds 514 murein biosynthesis integral membrane protein MurJ
997575..997898 cds 95 95 108 DUF1476 domain-containing protein
comp 997994..998067 cag + 54 54
comp 998122..998195 cag 2 cag 168 168
998364..999509 cds 382 Ppx/GppA family phosphatase
1050081..1051028 cds 60 60 316 NnrS family protein
comp 1051089..1051163 acc + 16 16
comp 1051180..1051254 acc 3 acc 18 18
comp 1051273..1051347 acc 170 170
comp 1051518..1053305 cds 596 EAL domain-containing protein
1197836..1199341 cds 197 197 502 aldehyde dehydrogenase
1199539..1199623 cta 126 126
1199750..1201090 cds 447 trigger factor
1206196..1206501 cds 93 93 102 HU family DNA-binding protein
1206595..1206670 gta 50 50
1206721..1207092 cds 124 hp
1213113..1214459 cds 210 210 449 acetyl-CoA carboxylase biotin carboxylase subunit
comp 1214670..1214874 16s° 600 600 203
comp 1215475..1216716 cds 414 polyphosphate kinase
comp 1349719..1350132 cds 109 109 138 NAD(P) transhydrogenase subunit alpha
comp 1350242..1350608 23s° 212 365
comp 1350821..1350897 atc 115
comp 1351013..1351438 16s° 23 23 424
< comp 1351462..1352160 cds 233 p-tetratricopeptide repeat protein
1359745..1360302 cds 176 176 186 hp
1360479..1360555 gac + 37 37
1360593..1360669 gac 2 gac 274 274
1360944..1361204 cds 87 hp
1416615..1417769 cds 214 214 385 glycosyltransferase family 61 protein
1417984..1418074 tcc 154 154
comp 1418229..1419095 cds 289 LysR family transcriptional regulator
comp 1472421..1473403 cds 250 250 328 biotin synthase BioB
comp 1473654..1473740 ttg 77 77
comp 1473818..1474678 cds 287 homocysteine S-methyltransferase family protein
comp 1735298..1736380 cds 209 209 361 DUF262 domain-containing protein
1736590..1736859 23s° 72 268
1736932..1737046 5s 52 113
1737099..1737175 atgf 93 93
comp 1737269..1737694 cds 142 type II toxin-antitoxin system VapC family toxin
comp 1812365..1813924 cds 894 894 520 peptidoglycan DD-metalloendopeptidase family protein
1814819..1815040 16s° -7 -7 222
<comp 1815034..1815837 cds 80 80 268 p-elongation factor Tu
comp 1815918..1815991 gga 34 34
comp 1816026..1816111 tac 144 144
1816256..1817143 cds 296 23S rRNA (guanosine(2251)-2'-O)-methyltransferase RlmB
comp 1833109..1833603 cds 83 83 165 MBL fold metallo-hydrolase
comp 1833687..1833762 aag + 24 24
comp 1833787..1833862 aag 2 aag 198 198
comp 1834061..1835224 cds 388 rod shape-determining protein RodA
> 1941413..1943059 cds -30 -30 549 p-recombinase family protein
comp 1943030..1943121 agc 160 160
comp 1943282..1944133 cds 284 FAD-dependent thymidylate synthase
comp 2087696..2090938 cds 705 705 1081 PAS domain-containing protein
2091644..2091826 16s° 7 7 181
2091834..2092247 cds 138 hp
comp 2095044..2095490 cds 48 48 149 hp
comp 2095539..2095733 16s° 614 614 193
comp 2096348..2097337 cds 330 trypsin-like serine protease
comp 2113248..2114603 cds 219 219 452 hp
comp 2114823..2114899 aga 55 55
comp 2114955..2115251 cds 71 71 99 ETC complex I subunit
comp 2115323..2115399 cca 261 261
comp 2115661..2115960 cds 100 hp
comp 2144042..2146288 cds 308 308 749 HAMP domain-containing protein
2146597..2147256 23s° 72 658
2147329..2147443 5s 52 113
2147496..2147572 atgf 645 645
comp 2148218..2148664 cds 149 hp
2268003..2268461 cds 87 87 153 23S rRNA (pseudouridine(1915)-N(3))-methyltransferase RlmH
comp 2268549..2268625 ccg + 165 165
comp 2268791..2268867 ccg 2 ccg 56 56
comp 2268924..2269910 cds 329 farnesyltranstransferase
comp 2321621..2322145 cds 332 332 175 hp
2322478..2322554 ccc 225 225
2322780..2322974 cds 65 hp
comp 2393295..2396009 cds @3 1003 1003 905 CRISPR-associated helicase/endonuclease Cas3
2397013..2397919 16s° 2 2 905
2397922..2400888 cds 989 hp
comp 2517845..2520559 cds 229 229 905 phosphoenolpyruvate carboxylase
comp 2520789..2520903 5s 72 113
comp 2520976..2521339 23s° 189 189 362
comp 2521529..2522152 cds 208 3-isopropylmalate dehydratase small subunit
comp 2596508..2596738 cds 989 989 77 motility twitching protein PilT
comp 2597728..2597815 tca 194 194
2598010..2599204 cds 398 hp
comp 2621435..2622058 cds 106 106 208 helix-turn-helix transcriptional regulator
comp 2622165..2622251 ctc 202 202
2622454..2623107 cds 218 lipoyl(octanoyl) transferase LipB
2631201..2631554 cds 192 192 118 hp
2631747..2631822 gcc + 70 70
2631893..2631968 gcc 4 gcc 69 69
2632038..2632113 gcc 57 57
2632171..2632246 gcc 166 166
< 2632413..2632965 cds -41 -41 184 p-IS256 family transposase
2632925..2633473 cds 30 30 183 hp
comp 2633504..2633579 aca 93 93
comp 2633673..2634200 cds 271 271 176 N-acetyltransferase
comp 2634472..2634561 tcg 155 155
2634717..2635742 cds 342 hp
comp 2655872..2656489 cds 182 182 206 YitT family protein
comp 2656672..2656747 gag 141 141
comp 2656889..2657674 cds 262 MetQ/NlpA family ABC transporter substrate-binding protein
2758160..2758312 cds 110 110 51 light-harvesting protein
comp 2758423..2758509 tta 94 94
comp 2758604..2759899 cds 432 bifunctional folylpolyglutamate synthase/dihydrofolate synthase
> 2768823..2769518 cds -12 -12 232 methyltransferase
2769507..2769776 23s° 71 268
2769848..2769962 5s 118 118 113
comp 2770081..2771016 cds 312 tetratricopeptide repeat protein
2792922..2794778 cds 129 129 619 glutathione-regulated potassium-efflux system protein KefB
2794908..2794982 caa 92 92
comp 2795075..2795686 cds 204 hp
2862755..2862982 cds 123 123 76 hp
2863106..2863182 cca 117 117
2863300..2863374 atgi 373 373
2863748..2863823 gca 157 157
2863981..2864056 aca 15
2864072..2864317 cds 8 82 DUF2829 domain-containing protein
2864326..2864401 aaa 250 250
> 2864652..2865041 cds 130 p-hp
2867066..2868112 cds 76 76 349 tyrosine-type recombinase/integrase
comp 2868189..2868264 aaa 99 99
comp 2868364..2868870 cds 169 peptidylprolyl isomerase
2893891..2894430 cds 25 25 180 phage portal protein
2894456..2894570 5s 51 113
2894622..2894698 atgf 285 285
2894984..2895400 cds 139 p-hp
comp 3034652..3035092 cds 250 250 147 hp
comp 3035343..3035418 aaa 8 8
comp 3035427..3035986 cds 187 DUF2829 domain-containing protein
comp 3305068..3306534 cds 379 379 489 S8 family serine peptidase
comp 3306914..3306989 ttc + 29 29
comp 3307019..3307094 ttc 4 ttc 34 34
comp 3307129..3307204 ttc 33 33
comp 3307238..3307313 ttc 60 60
comp 3307374..3308864 cds 497 RimK family protein
comp 3332977..3334356 cds 54 54 460 type II secretion system protein
3334411..3334487 cgg 176 176
< comp 3334664..3335983 cds 440 p-hp
3408217..3409026 cds 91 91 270 hp
comp 3409118..3409232 5s 71 113
comp 3409304..3409410 23s° 1 1 105
< 3409412..3409711 cds 100 p-IS5/IS1182 family transposase
comp 3456276..3461666 cds 387 387 1797 alpha-2-macroglobulin family protein
3462054..3462130 agg 29 29
3462160..3462951 cds 264 amino acid ABC transporter substrate-binding protein
comp 3500025..3500675 cds 210 210 217 protein-L-isoaspartate O-methyltransferase
3500886..3500959 tgc + 27 27
3500987..3501061 aac 2 aac 31 31
3501093..3501167 aac 84 84
comp 3501252..3501659 cds 136 hp
3639978..3641276 cds 172 172 433 outer membrane efflux protein
3641449..3641525 gcg + 70 70
3641596..3641671 gcg 3 gcg 33 33
3641705..3641780 gcg 389 389
3642170..3644392 cds 741 sigma-54-dependent Fis family transcriptional regulator
3651524..3652711 cds 55 55 396 aminotransferase
3652767..3652843 cac 202 202
<comp 3653046..3653543 cds 166 arsenical-resistance protein
3710072..3710840 cds 126 126 256 TonB family protein
comp 3710967..3711042 gaa + 214 214
comp 3711257..3711332 gaa 2 gaa 125 125
comp 3711458..3711664 cds 69 cold-shock protein
comp 3727874..3729085 cds 828 828 404 hp
3729914..3730068 16s° 87 87 153
3730156..3730545 cds 130 hp
comp 3804728..3805231 cds 118 118 168 response regulator
comp 3805350..3805425 gag 241 241
comp 3805667..3806140 cds 158 transcription elongation factor GreA
3813820..3815895 cds 138 138 692 RNA polymerase sigma factor RpoD
3816034..3816109 atgi 94 94
3816204..3818993 cds 930 diguanylate cyclase
comp 3827982..3828878 cds 90 90 299 phosphoserine phosphatase SerB
comp 3828969..3829042 ggg @5 292 292
3829335..3830670 cds 445 chemotaxis protein
comp 3832305..3833264 cds 311 311 320 complex I NDUFA9 subunit family protein
3833576..3833662 ctg + 47 47
3833710..3833796 ctg 5 ctg 153 153
3833950..3834036 ctg 48 48
3834085..3834171 ctg 47 47
3834219..3834305 ctg 113 113
3834419..3835039 cds 207 ribonuclease D

rpm cumuls[modifier | modifier le wikicode]

cumuls. rpm.
opérons Fréquences intercalaires tRNAs Fréquences intercalaires cds Fréquences aas cds chromosome
effectif gammes sans rRNAs avec rRNAs gammes cds gammes cdsd gammes cdsa gammes cdsa 300
avec rRNA opérons 27 1 0 1 9 1 100 20 1 0
16s°atc23s° 7 20 2 50 15 40 200 35 30 0
16s°gca23s° 1 40 14 100 30 80 300 30 60 3
16s°23s° 1 60 7 150 24 120 400 23 90 10
max a 1 80 3 200 23 160 500 14 120 10
a doubles 0 100 0 250 16 200 600 7 150 14
spéciaux 18 120 1 300 5 240 700 2 180 13
total aas 13 140 0 350 4 280 800 3 210 11
sans opérons 47 160 2 400 5 320 900 0 240 6
1 aa 30 180 1 450 2 360 1000 4 270 9
max a 5 200 0 500 0 400 1100 1 300 9
a doubles 15 2 14 2 56
total aas 79 32 0 147 0 141 141
total aas 92
remarques 5
avec jaune moyenne 69 194 310
variance 75 197 248
sans jaune moyenne 39 147 252 170
variance 16 112 134 71

rpm blocs[modifier | modifier le wikicode]

rpm blocs protéines[modifier | modifier le wikicode]

  • Lien tableur: rpm blocs protéines
  • Note:
    - hp pour hypothetical protein
    - p- pour pseudo, par exemple p-elon en abrégé donne p-elongation factor Tu.
A5p. rpm, protéines.
abrégé nom
23s 23s rRNA (guanosine(2251)-2'-O)-methyltransferase RlmB
3-isop 3-isopropylmalate dehydrogenase
3-isop-sub 3-isopropylmalate dehydratase small subunit
acetyl acetyl-CoA carboxylase biotin carboxylase subunit
cas3 CRISPR-associated helicase/endonuclease Cas3
CDP CDP-diacylglycerol--serine O-phosphatidyltransferase
ComF ComF family protein
CRISPR CRISPR
DUF262 DUF262 domain-containing protein
FeFe [FeFe] hydrogenase H-cluster radical SAM maturase HydE
glyco glycosyltransferase
HAMP HAMP domain-containing protein
LysM LysM peptidoglycan-binding domain-containing protein
methyl methyltransferase
NAD NAD(P) transhydrogenase subunit alpha
p-elon p-elongation factor Tu
p-EscV p-EscV/YscV/HrcVfamilytypeIIIsecretionsystemexportapparatusprotein
p-glyco p-glycosyltransferase
P-glyco1 p-glycosyl transferase family 1
p-IS5 p-IS5/IS1182 family transposase
p-tetra p-tetratricopeptide repeat protein
p-trans p-transposase
PAS PAS domain-containing protein
peptido peptidoglycan DD-metalloendopeptidase family protein
phage phage portal protein
phospho phosphoenolpyruvate carboxylase
polypho polyphosphate kinase
respons response regulator
SAM SAM-dependent chlorinase/fluorinase
SEL1 SEL1-like repeat protein
tetra tetratricopeptide repeat protein
TraY TraY domain-containing protein
trypsin trypsin-like serine protease
type II type II toxin-antitoxin system VapC family toxin
VWA VWA domain-containing protein
winged winged helix-turn-helix domain-containing protein

rpm blocs construits[modifier | modifier le wikicode]

  • Lien tableur: rpm blocs construits
  • Légende: lien au tableau des protéines, abrégés
    - vert: la taille des rRNAs en pbs alors que les protéines (cdsa) sont en aas.
    - bleu: protéines bien caractérisées alors qu'en clair sont les protéines candidates à la création, hp pour hypothetical protein, p-protéine pour pseudo-protéine et les protéines caractérisées seulement par un domaine comme DUF262 par exemple.
    - cyan: Les intercalaires constantes vestiges des blocs complets représentés par l'unique bloc contenant le 16s avec les intercalaires 71 pour 5s-23s, 212 pour 23s-atc, 112 pour atc-16s et 52 dans le cas de 5s-atgf.
    - gris: Je ne considère ici que les protéines créées à l'intérieur d'un bloc rRNA. Les protéines non canditates à la création sont en bleu, voir ci-dessus le bleu, mais la reconstruction des blocs détruits m'a obligé à considérer des protéines internes au bloc, bien caractérisées non candiates à la création. Aussi je n'ai conservé que les plus petites, metyl adresse 2768823, 3-isop-sub adresse 2521529 et glyco adresse 49761. La reconstruction ne m'a pas permis de faire de grands blocs pour 4 clusters listés à la fin des 2 derniers tableaux en gris. Ces clusters sont restés parce qu'ils mettraient des protéines non candidates en intra bloc avec de grande taille.
  • Notes: Il faut noter que théoriquement, pour cet organisme où la destruction des blocs est spéctaculaire, les protéines créées pourraient être aussi grande que le 23s en paires de base, 2765 soit 900 aas à peu près. C'est ce que j'ai suggéré en plaçant le 16s° contenant 1 grosse protéine candidate pour la création parce qu'elle est hypothétique dans le reconstruction du bloc b10, cas3-16s°-hp, 905-16s°-989. La même situation est reproduite dans le bloc b9 avec PAS-16s°-hp, 1081-16s°-138.
A5b. rpm blocs et leur réorganisation.
A5b1. 9 blocs 16s° solitaires, 6 blocs atc gca
sens adresse bloc interca cdsa protéine rRNA° ordre
21325..22362 cds 586 346 hp 1493
22949..23237 16s° 85 287
comp 23323..23490 cds 56 hp b3
abrégés
< 45496..45768 cds 553 91 p-glyco1 1383
46322..47040 16s° 0 717
comp 47041..47433 cds 131 winged b4
abrégés
comp 839981..840214 cds 4 78 hp 492
comp 840219..840478 16s° 568 258
comp 841047..844388 cds 1114 respons b7
abrégés
1213113..1214459 cds 210 449 acetyl 1445
comp 1214670..1214874 16s° 600 203
comp 1215475..1216716 cds 414 polypho
abrégés
comp 1812365..1813924 cds 894 520 peptido 1026
1814819..1815040 16s° -7 222
<comp 1815034..1815837 cds 268 p-elon b5
abrégés
comp 2087696..2090938 cds 705 1081 PAS 595
2091644..2091826 16s° 7 181
2091834..2092247 cds 138 hp b9
abrégés
comp 2095044..2095490 cds 48 149 hp 640
comp 2095539..2095733 16s° 614 193
comp 2096348..2097337 cds 330 trypsin b8
abrégés
comp 2393295..2396009 cds 1003 905 cas3
2397013..2397919 16s° 2 905 905
2397922..2400888 cds 989 hp b10
abrégés
comp 3727874..3729085 cds 828 404 hp 1755
3729914..3730068 16s° 87 153
3730156..3730545 cds 130 hp b2
abrégés
434306..435142 cds 512 279 CDP
435655..435842 16s° -6 186 1023
abrégés
comp 3322..4194 cds 30 291 LysM
comp 4225..4821 23s° 196 595 1468
comp 5018..5093 gca 182
comp 5276..5684 16s° 38 407
5723..6664 cds 314 SEL1 b6
abrégés
comp 32782..33759 cds 190 326 glyco
33950..34357 16s° 112 406
34470..34546 atc 216
34763..35591 23s° 44 827 827 b7
comp 35636..35750 5s 72 113
comp 35823..38589 23s 215 2765
comp 38805..38881 atc 112
comp 38994..40502 16s 260 1507 b0
comp 40763..42629 23s° -15 1865 1865 b4
42615..42903 16s° 112 287
43016..43092 atc 213
43306..44132 23s° -1 825 825 b8
comp 44132..44835 23s° -5 702 993
44831..45121 cds 97 hp b5
abrégés
comp 49761..51017 cds 128 419 glyco 1331
comp 51146..51221 23s° 214 74
comp 51436..51512 atc 112
comp 51625..52017 16s° -7 391 b9
52011..52881 23s° 106 869 1346
52988..53464 cds -37 159 hp
> 53428..53694 cds 86 89 p-glyco
comp 53781..54709 23s° 26 927 1194 b3
54736..54898 16s° 112 161
55011..55087 atc 216 697
55304..55741 23s° 438 436
56180..56440 cds 87 hp b10
A5b2. 9 blocs 23s°5s, 3 blocs complets
sens adresse bloc interca cdsa protéine rRNA° ordre
comp 13874..15127 cds -7 418 hp 1505
comp 13628..13880 23s° 72 251
comp 13441..13555 5s 242 113
comp < 12458..13198 cds 247 p-trans b5
abrégés
comp 691078..691773 cds 4 232 ComF 814
691778..691897 23s° 72 118
691970..692084 5s 114 113
comp 692199..694505 cds 769 VWA b9
abrégés
753203..753760 cds 388 186 hp 1028
752603..752814 rpr 597 71 CRISPR
comp 751747..752005 23s° 72 257
comp 751560..751674 5s 161 113
750262..751398 cds 379 FeFe b8
abrégés
comp 2521529..2522152 cds 189 208 3-isop-sub 986
comp 2520976..2521339 23s° 72 362
comp 2520789..2520903 5s 229 113
comp 2517845..2520559 cds 905 phospho b7
abrégés
> 2768823..2769518 cds -12 232 methyl 964
2769507..2769776 23s° 71 268
2769848..2769962 5s 118 113
comp 2770081..2771016 cds 312 tetra b6
abrégés
< 3409412..3409711 cds 1 100 p-IS5 405
comp 3409304..3409410 23s° 71 105
comp 3409118..3409232 5s 91 113
3408217..3409026 cds 270 hp b4
abrégés
comp 467261..468370 cds 167 370 3-isop 1238
468538..468667 23s° 72 128
468740..468854 5s 51 113
468906..468982 atgf 125
469108..469863 cds 252 SAM
abrégés
comp 1735298..1736380 cds 209 361 DUF262 1351
1736590..1736859 23s° 72 268
1736932..1737046 5s 52 113
1737099..1737175 atgf 93
comp 1737269..1737694 cds 142 type II b10
abrégés
comp 2144042..2146288 cds 308 749 HAMP 2905
2146597..2147256 23s° 72 658
2147329..2147443 5s 52 113
2147496..2147572 atgf 645
comp 2148218..2148664 cds 149 hp b2
abrégés
comp 24015..24287 cds 250 91 TraY
comp 24538..24652 5s 71 113
comp 24724..27490 23s 212 2765
comp 27703..27779 atc 112
comp 27892..28378 16s° 18 485
<> 28397..29119 cds 241 p-EscV b1
abrégés
comp 35636..35750 5s 72 113
comp 35823..38589 23s 215 2765
comp 38805..38881 atc 112
comp 38994..40502 16s 260 1507 b0
abrégés
434306..435142 cds 512 279 CDP
435655..435842 16s° -6 186 1023
435837..436075 23s° 72 237
436148..436262 5s 51 113 237
436314..436390 atgf 196
436587..436883 cds 99 hp b3
abrégés
2893891..2894430 cds 25 180 phage
2894456..2894570 5s 51 113 540
2894622..2894698 atgf 285
2894984..2895400 cds 139 p-hp
A5b3. Fait: 4 blocs sans aas
sens adresse bloc interca cdsa protéine rRNA° ordre
comp 35636..35750 5s 72 113 b0
comp 35823..38589 23s 215 2765 2765
comp 38805..38881 atc 112
comp 38994..40502 16s 260 1507 1507
abrégés
comp 24015..24287 cds 250 91 TraY b1
comp 24538..24652 5s 71 113
comp 24724..27490 23s 212 2765 2765
comp 27703..27779 atc 112
comp 27892..28378 16s° 18 485 1208
<> 28397..29119 cds 241 p-EscV
abrégés
comp 3727874..3729085 cds 828 404 hp 1755 b2
3729914..3730068 16s° 87 153 1365
3730156..3730545 cds 130 hp
comp 2144042..2146288 cds 308 749 HAMP
2146597..2147256 23s° 72 658
2147329..2147443 5s 52 113
2147496..2147572 atgf 645
comp 2148218..2148664 cds 149 hp 2905
abrégés
21325..22362 cds 586 346 hp 1493 b3
22949..23237 16s° 85 287 1325
comp 23323..23490 cds 56 hp
52011..52881 23s° 106 869 1346
52988..53464 cds -37 159 hp
> 53428..53694 cds 86 89 p-glyco
comp 53781..54709 23s° 26 927 1194
435837..436075 23s° 72 237 237
436148..436262 5s 51 113
436314..436390 atgf 196
436587..436883 cds 99 hp 2777
abrégés
< 45496..45768 cds 553 91 p-glyco1 1383 b4
46322..47040 16s° 0 717
comp 47041..47433 cds 131 winged
comp 40763..42629 23s° -15 1865 1865
< 3409412..3409711 cds 1 100 p-IS5
comp 3409304..3409410 23s° 71 105 405
comp 3409118..3409232 5s 91 113
3408217..3409026 cds 270 hp 2270
abrégés
comp 1812365..1813924 cds 894 520 peptido b5
1814819..1815040 16s° -7 222 1026
<comp 1815034..1815837 cds 268 p-elon
comp 44132..44835 23s° -5 702 993
44831..45121 cds 97 hp
comp 13874..15127 cds -7 418 hp 1505
comp 13628..13880 23s° 72 251
comp 13441..13555 5s 242 113
comp < 12458..13198 cds 247 p-trans 2498
abrégés
2893891..2894430 cds 25 180 phage
2894456..2894570 5s 51 113 540
2894622..2894698 atgf 285
2894984..2895400 cds 139 p-hp
abrégés
1213113..1214459 cds 210 449 acetyl 1445
comp 1214670..1214874 16s° 600 203
comp 1215475..1216716 cds 414 polypho
abrégés
comp 467261..468370 cds 167 370 3-isop 1238
468538..468667 23s° 72 128
468740..468854 5s 51 113
468906..468982 atgf 125
469108..469863 cds 252 SAM
A5b4. Fait: 5 blocs atc, gca
sens adresse bloc interca cdsa protéine rRNA° ordre
5723..6664 cds 314 SEL1 1349 b6
comp 5276..5684 16s° 38 407
comp 5018..5093 gca 182
comp 4225..4821 23s° 196 595
comp 3322..4194 cds 30 291 LysM 1468
> 2768823..2769518 cds -12 232 methyl 964
2769507..2769776 23s° 71 268
2769848..2769962 5s 118 113
comp 2770081..2771016 cds 312 tetra 2432
abrégés
comp 841047..844388 cds 1114 respons 898 b7
comp 840219..840478 16s° 568 258 492
comp 839981..840214 cds 4 78 hp
comp 32782..33759 cds 190 326 glyco
33950..34357 16s° 112 406 406
34470..34546 atc 216
34763..35591 23s° 44 827 827
comp 2521529..2522152 cds 189 208 3-isop-sub 986
comp 2520976..2521339 23s° 72 362
comp 2520789..2520903 5s 229 113 1238
comp 2517845..2520559 cds 905 phospho 1813
abrégés
comp 2096348..2097337 cds 330 trypsin 927 b8
comp 2095539..2095733 16s° 614 193 640
comp 2095044..2095490 cds 48 149 hp
42615..42903 16s° 112 287 287
43016..43092 atc 213
43306..44132 23s° -1 825 825
753203..753760 cds 388 186 hp
752603..752814 rpr 597 71 CRISPR 1028
comp 751747..752005 23s° 72 257
comp 751560..751674 5s 161 113
750262..751398 cds 379 FeFe 1853
abrégés
comp 2087696..2090938 cds 705 1081 PAS 986 b9
2091644..2091826 16s° 7 181 595
2091834..2092247 cds 138 hp
comp 51625..52017 16s° -7 391 391
comp 51436..51512 atc 112
comp 51146..51221 23s° 214 74
comp 49761..51017 cds 128 419 glyco 1331
comp 691078..691773 cds 4 232 ComF
691778..691897 23s° 72 118 814
691970..692084 5s 114 113
comp 692199..694505 cds 769 VWA 2145
abrégés
comp 2393295..2396009 cds 1003 905 cas3 1066 b10
2397013..2397919 16s° 2 905 905
2397922..2400888 cds 989 hp
54736..54898 16s° 112 161 161
55011..55087 atc 216
55304..55741 23s° 438 436
56180..56440 cds 87 hp 697
comp 1735298..1736380 cds 209 361 DUF262 1351
1736590..1736859 23s° 72 268
1736932..1737046 5s 52 113
1737099..1737175 atgf 93
comp 1737269..1737694 cds 142 type II 2048
abrégés
434306..435142 cds 512 279 CDP
435655..435842 16s° -6 186 1023
435837..436075 23s° 72 237
436148..436262 5s 51 113 237
436314..436390 atgf 196
436587..436883 cds 99 hp

rpm remarques[modifier | modifier le wikicode]

Rhodospirillum rubrum ATCC 11170[modifier | modifier le wikicode]

rru opérons[modifier | modifier le wikicode]

  • Lien tableur: rru opérons
  • Liens: gtRNAdb [10], NCBI [11], génome [orgn]
  • Phylogénie: Bacteria; Proteobacteria; Alphaproteobacteria; Rhodospirillales; Rhodospirillaceae; Rhodospirillum.
  • Légende: cdsa: cds aas, cdsd: cds dirigé
A4. Rhodospirillum rubrum ATCC 11170
64.97%GC 26.12.19 Paris  55   doubles intercal cds aa avec aa cdsa cdsd protéines
chromosome
comp 16232..16852 cds 163 163 207 3'-5' exonuclease
comp 17016..17102 ctg 253 253
17356..18378 cds 341 3-beta-hydroxy-delta(5)-steroid dehydrogenase
117072..117287 cds 37 37 72 slyX
comp 117325..117401 agg 341 341
117743..123022 cds 1760 alpha-2-macroglobulin-like protein
comp 149921..151015 cds 225 225 365 hp
151241..151317 cgg 136 136
comp 151454..152929 cds 492 chemotaxis sensory transducer protein
189941..191668 cds 859 859 576 sulfate transporter/antisigma-factor antagonist
192528..194004 16s 184 1477
194189..194265 atc 66 66
194332..194407 gca 362
194770..197527 23s 119 2758
197647..197761 5s 96 115
197858..197934 atgf 287 287
comp 198222..198455 cds 78 hp
comp 305449..306648 cds 257 257 400 Ppx/GppA phosphatase
306906..306979 cag 319 319
comp 307299..308303 cds 335 LacI family transcriptional regulator
comp 322896..323807 cds 292 292 304 hp
comp 324100..324174 caa 98 98
comp 324273..325601 cds 443 chemotaxis sensory transducer protein
362552..362881 cds 224 224 110 hp
363106..363181 gcc + 202 202
363384..363459 gcc 2 gcc 43 43
comp 363503..364531 cds 343 esterase
407067..407606 cds 92 92 180 YbaK/prolyl-tRNA synthetase associated domain-containing protein
407699..407790 agc 141 141
407932..408774 cds 281 hp
466945..467925 cds 115 115 327 hp
comp 468041..468126 tta 83 83
comp 468210..468458 cds 83 hp
comp 559038..559610 cds 86 86 191 OsmC-like protein
559697..559772 aag 140 140
559913..560608 cds 232 hp
comp 794877..795188 cds -81 -81 104 hp
comp 795108..795188 Sig-pep 217 217 27 hp
795406..795496 tcc 44 44
795541..795846 cds 102 hp
comp 908584..910185 cds -102 -102 534 peptidase M23B
comp 910084..910185 Sig-pep @1 1212 1212 34 hp
911398..912874 16s 182 1477
913057..913133 atc 66 66
913200..913275 gca 361
913637..916394 23s 118 2758
916513..916627 5s 95 115
916723..916799 atgf 573 573
917373..921860 cds 1496 hp
1159249..1160091 cds 71 71 281 Linocin_M18 bacteriocin protein
1160163..1160238 gag 117 117
1160356..1160613 cds 86 prevent-host-death protein
comp 1464820..1465122 cds 283 283 101 50S ribosomal protein L21
1465406..1465495 tcg 139 139
comp 1465635..1466303 cds 223 cytochrome B561
1791953..1792159 cds 116 116 69 hp
comp 1792276..1792351 gaa 131 131
comp 1792483..1792689 cds 69 cold-shock DNA-binding protein family protein
1824302..1825738 cds 98 98 479 malonyl-CoA decarboxylase
1825837..1825921 cta 102 102
1826024..1827415 cds 464 trigger factor
1833133..1833408 cds 284 284 92 histone-like DNA-binding protein
1833693..1833768 gta 70 70
comp 1833839..1835326 cds 496 methyl-accepting chemotaxis sensory transducer
1933506..1934138 cds -633 -633 211 hp
1933506..1933652 Sig-pep 571 571 49 hp
1934224..1934300 cca 63 63
1934364..1934663 cds 12 12 100 ETC complex I subunit region
1934676..1934752 aga 396 396
1935149..1939624 cds 1492 hp
1959133..1959858 cds 175 175 242 MerR family transcriptional regulator
1960034..1960110 ccc @2 1062 1062
1961173..1961367 cds 65 hp
comp 1996760..1998124 cds -120 -120 455 lytic murein transglycosylase
comp 1998005..1998124 Sig-pep 119 119 40 hp
1998244..1998333 tca 927 927
comp 1999261..1999929 cds 223 hp
2032027..2032863 cds 123 123 279 phage integrase
comp 2032987..2033062 aaa 186 186
comp 2033249..2033755 cds 169 peptidyl-prolyl isomerase
comp 2093327..2093977 cds 295 295 217 protein-L-isoaspartate(D-aspartate) O-methyltransferase
2094273..2094346 tgc 81 81
2094428..2094502 aac 150 150
2094653..2094916 cds 88 prevent-host-death protein
comp 2304404..2305834 cds 89 89 477 divalent cation transporter
comp 2305924..2306010 ctc 178 178
2306189..2306839 cds 217 lipoate-protein ligase B
2331183..2331521 cds 73 73 113 hp
2331595..2331671 atgj 126 126
comp 2331798..2332040 cds 81 hp
comp 2411337..2411804 cds -72 -72 156 CreA
comp 2411733..2411804 Sig-pep 202 202 24 hp
comp 2412007..2412083 cac 75 75
comp 2412159..2413343 cds 395 hp
2729598..2731271 cds 449 449 558 macrocin-O-methyltransferase
comp 2731721..2731797 atgf 95
comp 2731893..2732007 5s 119 115
comp 2732127..2734884 23s 362 2758
comp 2735247..2735322 gca 66 66
comp 2735389..2735465 atc 184
comp 2735650..2737126 16s 606 606 1477
comp 2737733..2738110 cds 126 hp
comp 2959802..2961874 cds 354 354 691 chemotaxis sensory transducer protein
comp 2962229..2962303 gtc 123 123
2962427..2963359 cds 311 N-formylglutamate amidohydrolase
comp 3124836..3125033 cds 151 151 66 preprotein translocase subunit SecE
comp 3125185..3125260 tgg 343 343
comp 3125604..3126794 cds 93 93 397 elongation factor Tu
comp 3126888..3126961 gga 27 27
comp 3126989..3127074 tac 37 37
3127112..3128158 cds 57 57 349 23s rRNA (guanosine(2251)-2'-O)-methyltransferase RlmB
3128216..3128291 aca 127 127
3128419..3128652 cds 78 hp
comp 3193350..3194507 cds 430 430 386 acyltransferase
comp 3194938..3195013 ttc 103 103
comp 3195117..3195635 cds 173 hp
3320745..3322115 cds -1371 -1371 457 virulence protein
3320745..3320816 Sig-pep 1389 1389 24 hp
comp 3322206..3322281 atgi 60 60
comp 3322342..3324432 cds 697 RNA polymerase sigma factor RpoD
comp 3377932..3378114 cds 140 140 61 hp
3378255..3378329 acc + 165 165
3378495..3378569 acc 2 acc 237 237
3378807..3379370 cds 234 234 188 hp
3379605..3379681 gac 77 77
comp 3379759..3380517 cds 253 diguanylate phosphodiesterase
comp 3399207..3399494 cds 262 262 96 hp
comp 3399757..3399833 ccg 56 56
comp 3399890..3400972 cds 361 farnesyltranstransferase
3490378..3491148 cds 84 84 257 2-phosphoglycolate phosphatase
3491233..3491307 gtg 407 407
3491715..3492080 cds 122 hp
comp 3719367..3719753 cds 163 163 129 hp
comp 3719917..3719990 ggg 95 95
comp 3720086..3720859 cds 258 enoyl-ACP reductase
3805869..3806813 cds 130 130 315 inner-membrane translocator
comp 3806944..3807058 5s 116 115
comp 3807175..3809932 23s 362 2758
comp 3810295..3810370 gca 66 66
comp 3810437..3810513 atc 184
comp 3810698..3812174 16s 1227 1227 1477
3813402..3814118 cds 239 transposase
comp 3824154..3825854 cds 76 76 567 phage integrase
comp 3825931..3826007 cgt 387 387
3826395..3827531 cds 379 hp
4021982..4023163 cds 27 27 394 diguanylate phosphodiesterase
comp 4023191..4023277 ttg 224 224
4023502..4023855 cds 118 hp
comp 4058818..4059117 cds 187 187 100 hp
4059305..4059380 gcg 179 179
comp 4059560..4060126 cds 189 hp
comp 4105626..4107317 cds -114 -114 564 chemotaxis sensory transducer
comp 4107204..4107317 Sig-pep 721 721 38 hp
comp 4108039..4108113 acg 148 148
4108262..4108843 cds 194 D-alpha,beta-D-heptose 1,7-bisphosphate phosphatase
comp 4261100..4262038 cds 269 269 313 thioredoxin-like protein
4262308..4262382 ggc 118 118
4262501..4263136 cds 212 lysine exporter protein LysE/YggA

rru cumuls[modifier | modifier le wikicode]

cumuls. rru.
opérons Fréquences intercalaires tRNAs Fréquences intercalaires cds Fréquences aas cds chromosome
effectif gammes sans rRNAs avec rRNAs gammes cds gammes cdsd gammes cdsa gammes cdsa 300
avec rRNA opérons 4 1 1 7 1 100 23 1 0
16atcgca235 1 20 50 6 40 200 17 30 3
Id-atgf 3 40 1 100 19 80 300 16 60 4
- 60 150 20 120 400 17 90 12
max a 3 80 4 200 8 160 500 8 120 10
a doubles 0 100 1 250 7 200 600 5 150 3
spéciaux 0 120 300 9 240 700 2 180 4
total aas 11 140 350 3 280 800 0 210 5
sans opérons 40 160 400 3 320 900 0 240 8
1 aa 36 180 1 450 3 360 1000 0 270 4
max a 2 200 500 0 400 1100 0 300 3
a doubles 2 1 10 3 35
total aas 44 4 4 95 0 91 91
total aas 55
remarques
avec jaune moyenne 119 66 208 292
variance 79 0 333 187
sans jaune moyenne 148 237 140
variance 83 132 69

rru blocs[modifier | modifier le wikicode]

  • Lien tableur: rru blocs
  • Légende:
    sulfate sulfate transporter/antisigma-factor antagonist
    inner   inner-membrane translocator
    macrocin macrocin-O-methyltransferase
    peptidase peptidase M23B
    hp    Hypothetical protein
A4. rru, blocs à rRNA.
cds 859 576 sulfate cds 606 126 hp
16s 184 1477 16s 184 1477
atc 66 atc 66
gca 362 gca 362
23s 119 2758 23s 119 2758
5s 96 115 5s 95 115
atgf 287 atgf 449
cds 78 hp cds 558 macrocin
cds -102 534 peptidase
Sig-pep 1212 34 hp cds 1227 239 transposase
16s 182 1477 16s 184 1477
atc 66 atc 66
gca 361 gca 362
23s 118 2758 23s 116 2758
5s 95 115 5s 130 115
atgf 573 cds 315 inner
cds 1496 hp

rru remarques[modifier | modifier le wikicode]

  • Remarques: Par rapport aux rickettsia rtb et rpl, les intercalaires élevés sont rares.
    1. @ Les intercalaires élevés
      - il n’y a pas d’aas isolés et les mineurs des blocs à rRNAs sont normaux pour ces blocs, inférieurs à 573.
      - Pour les aas il n’y a que 5 intercalaires élevés entre 571-1389, et 2 dépassant à peine 400 pbs.
      - Pour les blocs à rRNAs il n’y a que 3 intercalaires franchement élevés, 1227 1212 859.
    2. @ Sig-pep, signal peptide.
      - Il y a 580 sig-peptide dans ce génome. Dans le tableau des opérons ce sont de petites séquences peptidiques de moins de 30 aas placsés au début du cds. D’où l’intercalaire négatif.
      - Dans le tableau sur les 7 seg-pep, 4 sont associés à des intercalaires élevés (voir tableau ci-dessous) et 3 à des intercalaires inférieurs à 219 pbs.
  • Note: Les 4 blocs à rRNAs sont tous complets ayant atcgca en interne dont 3 ont atgf qui suit 5s. Aucun bloc ne contient un cds en interne.
  • Séquences des doubles: Sur 40 blocs sans rRNAs seulement 4 ont 2 aas dont 2 ont un doublet, gcc et acc.
  • Tableau des intercalaires
16s			aas			Sig-pep
adresse	intercalaire	adresse	intercalaire	intercalaire
911398	1212-573	atgi	3322206	1389	1389
2735650	606-449		ccc	1960034	1062	1212
3810698	1227-130	tca	1998244	927	721
192528	859-257		acg	4108039	721	571
			cca	1934224	571	3 <219
			ttc	3194938	430	
			gtg	3491233	407	

Ochrobactrum anthropi ATCC 49188[modifier | modifier le wikicode]

oan opérons[modifier | modifier le wikicode]

  • Lien tableur: oan opérons
  • Liens: gtRNAdb [12], NCBI [13], génome [orgn]
  • Phylogénie: Bacteria; Proteobacteria; Alphaproteobacteria; Rhizobiales; Brucellaceae; Ochrobactrum.
  • Légende: cdsa: cds aas, cdsd: cds dirigé
A3. Ochrobactrum anthropi ATCC 49188
56.1%GC 27.12.19 Paris  61   doubles intercal cds aa avec aa cdsa cdsd protéines
chromosom1
34057..34446 cds 224 224 130 TIGR02300 family protein
34671..34746 gcc @1 -40 -40
34707..35480 cds 258 glutathione S-transferase family protein
223549..224394 cds 164 164 282 3'(2'),5'-bisphosphate nucleotidase CysQ
224559..224635 ccg 109 109
comp 224745..225806 cds 354 site-specific integrase
comp 337757..338197 cds 158 158 147 DMT family transporter
comp 338356..338431 ttc 171 171
comp 338603..338818 cds 72 DNA gyrase inhibitor YacG
comp 344419..344598 cds 147 147 60 hp
344746..344820 acc 397 397
345218..346030 cds 271 DUF2189 domain-containing protein
comp 351922..353328 cds 167 167 469 deoxyribodipyrimidine photo-lyase
comp 353496..353572 cgt 159 159
comp 353732..355285 cds 518 HAMP domain-containing histidine kinase
comp 725472..726479 cds 219 219 336 glycosyltransferase family 4 protein
726699..726773 caa 61 61
comp 726835..727413 cds 193 hp
comp 934613..934987 cds 333 333 125 transposase
comp 935321..935397 agg 114 114
comp 935512..936675 cds 388 amidohydrolase
1049919..1051202 cds 24 24 428 cystathionine gamma-synthase family protein
comp 1051227..1051311 ttg @2 593 593
comp 1051905..1053539 cds 545 phosphoethanolamine transferase
comp 1081066..1083021 cds 998 998 652 M23 family metallopeptidase
1084020..1085508 16s 268 1489
1085777..1085853 atc 11 11
1085865..1085940 gca 39 39
>comp 1085980..1086168 cds @3 38 38 63 P-hp
1086207..1089125 23s 186 2919
1089312..1089426 5s 54 115
1089481..1089557 atgf 363 363
1089921..1090091 cds 57 LysR family transcriptional regulator
1096454..1096912 cds 7 7 153 hp
comp 1096920..1097009 tcg 352 352
1097362..1097751 cds 130 50S ribosomal protein L21
1311344..1311823 cds 211 211 160 hp
1312035..1312109 gag 88 88
1312198..1312467 cds 90 hp
1344750..1345565 cds 677 677 272 IclR family transcriptional regulator
1346243..1347731 16s 268 1489
1348000..1348076 atc 11 11
1348088..1348163 gca 39 39
>comp 1348203..1348391 cds 38 38 63 P-hp
1348430..1351348 23s 186 2919
1351535..1351649 5s 54 115
1351704..1351780 atgf 360 360
1352141..1353082 cds 314 LysR family transcriptional regulator
1354558..1355604 cds 85 85 349 polysaccharide deacetylase family protein
comp 1355690..1355764 ggc 136 136
comp 1355901..1357280 cds 460 MFS transporter
comp 1386666..1387982 cds 819 819 439 hp
comp 1388802..1388891 tcc 374 374
1389266..1389589 cds 108 hp
comp 1405236..1405859 cds 139 139 208 5,6-dimethylbenzimidazole synthase
comp 1405999..1406085 ctg 146 146
comp 1406232..1406852 cds 207 2,3-bisphosphoglycerate-dependent phosphoglycerate mutase
comp 1604615..1604854 cds 26 26 80 hp
comp 1604881..1604958 atgj 10 10
comp 1604969..1605214 cds 82 hp
1639492..1640289 cds -44 -44 266 hp
comp 1640246..1640322 atgj 55 55
1640378..1640572 cds 65 hp
comp 1778816..1779571 cds 385 385 252 SIMPL domain-containing protein
1779957..1780033 atgi 265 265
1780299..1780844 cds 182 sigma-70 family RNA polymerase sigma factor
> 1945985..1946374 cds 721 721 130 P-hp
comp 1947096..1947171 aag -38 -38
comp 1947134..1947319 cds 62 hp
comp 2014813..2015097 cds 103 103 95 DUF2218 domain-containing protein
comp 2015201..2015275 gaa + 146 146
comp 2015422..2015496 gaa 2 gaa 200 200
comp 2015697..2016962 cds 422 DUF882 domain-containing protein
comp 2040234..2040453 cds 91 91 73 hp
2040545..2040629 tac 24 24
2040654..2040727 gga 6 6
comp 2040734..2040916 cds -50 -50 61 hp
2040867..2042042 cds 65 65 392 elongation factor Tu
2042108..2042183 tgg 420 420
2042604..2042804 cds 67 preprotein translocase subunit SecE
2168416..2168658 cds 28 28 81 PepSY domain-containing protein
comp 2168687..2168760 ggg 289 289
2169050..2169946 cds 299 lipid kinase
comp 2244184..2245050 cds 112 112 289 mechanosensitive ion channel
comp 2245163..2245248 tta 200 200
2245449..2246705 cds 419 threonine ammonia-lyase IlvA
2267888..2268835 cds 305 305 316 patatin family protein
2269141..2269225 ctc 66 66
comp 2269292..2270185 cds 298 tyrosine-type recombinase/integrase
2332394..2333530 cds 393 393 379 glycosyltransferase family 2 protein
comp 2333924..2334000 cgg 169 169
comp 2334170..2335792 cds 541 ABC-F family ATP-binding cassette domain-containing protein
comp 2339396..2340514 cds 1650 1650 373 porin
comp 2342165..2342239 gtg 178 178
comp 2342418..2344424 cds 669 murein L,D-transpeptidase
comp 2369668..2370441 cds 152 152 258 NAD kinase
2370594..2370669 aca 987 987
comp 2371657..2372076 cds 140 SUF system Fe-S cluster assembly protein
comp 2442729..2443145 cds 299 299 139 hp
comp 2443445..2443519 atgf 70 70
<comp 2443590..2443799 cds 70 helix-turn-helix domain-containing protein
comp 2449947..2451311 cds 156 156 455 tyrosine-type recombinase/integrase
comp 2451468..2451550 cta 236 236
comp 2451787..2452356 cds 190 hp
comp 2548914..2550098 cds 513 513 395 alpha/beta hydrolase
comp 2550612..2550688 gac + 245 245
comp 2550934..2551010 gac 2 gac 328 328
2551339..2551956 cds 206 TetR/AcrR family transcriptional regulator
2604616..2605908 cds 824 824 431 FAD-binding oxidoreductase
comp 2606733..2606808 gta 264 264
comp 2607073..2607996 cds 308 sugar kinase
2641040..2641360 cds 97 97 107 YnfA family protein
2641458..2641534 ccc 94 94
2641629..2642357 cds 243 SDR family oxidoreductase
2696299..2697183 cds 54 54 295 transcriptional regulator GcvA
comp 2697238..2697314 aga 123 123
comp 2697438..2697743 cds 156 156 102 ETC complex I subunit
comp 2697900..2697976 cca 186 186
2698163..2698309 cds 49 hp
comp 2771579..2772697 cds 584 584 373 porin
2773282..2773372 agc 203 203
2773576..2774643 cds 356 porin
chromosom2
149537..151504 cds 355 355 656 selenocysteine-specific translation elongation factor
151860..151955 tga 14 14
comp 151970..152605 cds 212 lipase
comp 298403..299422 cds 300 300 340 TerC family protein
comp 299723..299796 cag 361 361
comp 300158..300460 cds 101 DUF1127 domain-containing protein
455428..456111 cds 713 713 228 FkbM family methyltransferase
456825..458313 16s 268 1489
458582..458658 atc 11 11
458670..458745 gca 39 39
>comp 458785..458973 cds 38 38 63 P-hp
459012..461930 23s 186 2919
462117..462231 5s 54 115
462286..462362 atgf -44 -44
comp 462319..463974 cds 552 recombinase family protein
comp 572059..572721 cds 545 545 221 response regulator transcription factor
comp 573267..573357 other @4 620 620
comp 573978..575285 cds 436 SidA/IucD/PvdA family monooxygenase
comp 611464..611742 cds 88 88 93 hp
comp 611831..611905 ggc 387 387
612293..612814 cds 174 prolyl-tRNA synthetase associated domain-containing protein
991265..991999 cds 217 217 245 alpha/beta hydrolase
comp 992217..992306 tca 323 323
992630..992884 cds 85 DUF2171 domain-containing protein
comp 1031528..1032946 cds 607 607 473 PepSY domain-containing protein
comp 1033554..1033629 aaa 327 327
1033957..1035651 cds 565 membrane protein
1067405..1068742 cds 131 131 446 DNA polymerase IV
1068874..1068947 tgc 739 739
1069687..1069905 cds 73 hp
1081639..1082031 cds 103 103 131 hp
comp 1082135..1082209 aac 168 168
1082378..1082653 cds 92 hp
comp 1333375..1333587 cds 209 209 71 hp
comp 1333797..1333873 cac 352 352
1334226..1337393 cds 1056 PAS domain S-box protein
1473437..1474405 cds 269 269 323 nitronate monooxygenase
1474675..1474750 acg 156 156
>comp 1474907..1475239 cds 111 DNA adenine methylase
comp 1597496..1597666 cds 363 363 57 LysR family transcriptional regulator
comp 1598030..1598106 atgf 54
comp 1598161..1598275 5s 186 115
comp 1598462..1601380 23s 38 38 2919
< 1601419..1601607 cds 39 39 63 P-hp
comp 1601647..1601722 gca 11 11
comp 1601734..1601810 atc 268
comp 1602079..1603567 16s 743 743 1489
1604311..1605192 cds 294 ATPase
1720169..1720531 cds 113 113 121 response regulator
1720645..1720719 gtc 465 465
1721185..1721838 cds 218 protein-L-isoaspartate(D-aspartate) O-methyltransferase

oan cumuls[modifier | modifier le wikicode]

cumuls. oan.
opérons Fréquences intercalaires tRNAs Fréquences intercalaires cds Fréquences aas cds chromosome
effectif gammes sans rRNAs avec rRNAs gammes cds gammes cdsd gammes cdsa gammes cdsa 300
avec rRNA opérons 4 1 4 1 5 1 100 25 1 0
16atcgca-cds 4 20 50 15 40 200 20 30 0
- 40 1 100 12 80 300 21 60 4
- 60 150 12 120 400 15 90 18
max a 3 80 200 15 160 500 11 120 8
a doubles 0 100 250 7 200 600 5 150 9
spéciaux 0 120 300 6 240 700 3 180 3
total aas 12 140 350 5 280 800 0 210 6
sans opérons 45 160 1 400 12 320 900 0 240 4
1 aa 42 180 450 1 360 1000 0 270 6
max a 2 200 500 1 400 1100 1 300 8
a doubles 2 1 16 0 35
total aas 48 3 4 107 0 101 101
total aas 60
remarques 4
avec jaune moyenne 138 11 258 256
variance 111 0 268 180
sans jaune moyenne 174 218 150
variance 117 132 81

oan blocs[modifier | modifier le wikicode]

  • Lien tableur: oan blocs
  • Légende:
    p-hp   pseudo hypothetical protein
A3. oan, blocs à rRNA.
Constantes
cds intercal cdsa
16s 268 1489
atc 11
gca 39
cds 38 63 p-hp
23s 186 2919
5s 54 115
atgf
cds
Variations
bloc 16s intercal cdsa
1084020..1085508 998 652 M23 family metallopeptidase
363 57 LysR family transcriptional regulator
1346243..1347731 677 272 IclR family transcriptional regulator
360 314 LysR family transcriptional regulator
456825..458313 713 228 FkbM family methyltransferase
-44 552 recombinase family protein
1602079..1603567 743 294 ATPase
363 57 LysR family transcriptional regulator

oan remarques[modifier | modifier le wikicode]

  • Remarques: Par rapport aux rickettsia rtb et rpl, les intercalaires très élevés existent, 3 contre 10, 987 988 1650. Ce génome est analogue à agr pour les cds internes aux blocs à RNAs.
    1. @ Des intercalaires négatifs avec les cds, 5, de -40 à -50 même dans un bloc à rRNAs, -44.
    2. @ Les intercalaires avec les cds élevés supérieurs à 500, 16 dont 4 pour les blocs. Voir le tableau des intercalaires ci-dessous .
      - Par rapport à agr analogue de ce génome, il y a nettement plus d’intercalaires élevés. Sur 45 blocs à aas il y a 12 intercalaires supérieurs à 500, contre 6 pour 38 aas chez agr.
      - Un seul cas où les 2 intercailaires d’un cluster sont supérieurs à 500, other, voir @4 ici.
      - Tous les 11 autres paires sont très assymétriques.
      - 2 intercalaires sur 3 entre aas sont du même ordre que la moyenne de ceux des cds sans jaune, 245 et 146 contre 174 pour la moyenne de ceux des cds.
    3. @ Les blocs à rRNAs sont identiques et ne diffèrent que par l’intercalaire du cds.
      - Le cds intra blocs est une pseudo protéine hypothétique, de faible taille, 63aas.
      - Ses intercalaires avec gca et 23s sont quasi identiques, très faibles et se situent dans la 1ère gamme des intercalaires cds.
    4. @ other, cela doit être un tRNA incomplet comme ceux des mitochondries
  • Note: les cds intra bloc à rRNAs. Les 4 blocs sont identiques. Cela veut dire que le cds interne est bien du au processus de la création des blocs. Le fait que le cds soit un pseudo renforce encore l’hypothèse de la création de ce cds par le processus de création ou de conversion. Voir remarque @2 de agr remarques.
  • Séquences des doubles, quasiment pas de doubles, 42 solitaires sur 45 opérons et 2 doubles seulement, gac et gaa.
  • Tableau des intercalaires
						
Intercalaires élevés		Intercalaires moyens	
pbs	adresse	RNA		pbs	adresse	tRNA
1650	2342165	gtg		465	1720645	gtc
987	2370594	aca		420	2042108	tgg
824	2606733	gta		397	344746	acc
819	1096920	tcg		387	611831	ggc
739	1068874	tgc		385	1779957	atgi
721	1947096	aag		363	1089481	atgf
620	573267	other isolé	363	1598030	atgf
607	1033554	aaa		352	1333797	cac
593	1051227	ttg		333	935321	agg
584	2773282	agc		323	992217	tca
513	2550612	gac		305	2269141	ctc
						
998	1084020	16s				
743	1602079	16s				
713	456825	16s				
677	1346243	16s				

Azospirillum brasilense Az39[modifier | modifier le wikicode]

abq opérons[modifier | modifier le wikicode]

  • Lien tableur: abq opérons
  • Liens: gtRNAdb [14], NCBI [15], génome [16]
  • Phylogénie: Bacteria; Proteobacteria; Alphaproteobacteria; Rhodospirillales; Rhodospirillaceae; Azospirillum.
  • Légende: cdsa: cds aas, cdsd: cds dirigé
A2. Azospirillum brasilense strain Az39
68.45%GC 29.12.19 Paris  88   doubles intercal cds aa avec aa cdsa cdsd protéines
chromosome
125527..126444 cds 127 127 306 restriction endonuclease
comp 126572..126647 gcg 206 206
126854..127138 cds 95 YggT family protein
comp 163237..164982 cds 175 175 582 hydrogenase maturation nickel metallochaperone HypA
165158..165234 agg 59 59
165294..166022 cds 243 SDR family NAD(P)-dependent oxidoreductase
comp 188235..189860 cds 42 42 542 glycosyltransferase
comp 189903..189977 acg 81 81
comp 190059..191987 cds 643 DNA helicase RecQ
comp 250833..251111 cds 169 169 93 hp
comp 251281..251356 gcc 141 141
comp 251498..251893 cds 132 TIGR02300 family protein
comp 458142..458459 cds 209 209 106 50S ribosomal protein L21
458669..458758 tcg 63 63
comp 458822..459664 cds 281 alpha/beta hydrolase fold domain-containing protein
comp 496776..497171 cds 162 162 132 cupin domain-containing protein
comp 497334..497420 ttg 137 137
497558..498085 cds 176 disulfide bond formation protein B
comp 615937..616350 cds 121 121 138 hp
comp 616472..616548 ccg + 206 206
comp 616755..616831 ccg 2 ccg 109 109
comp 616941..617957 cds 339 farnesyltranstransferase
comp 748703..749161 cds 38 38 153 hp
comp 749200..749275 aca 91 91
comp 749367..750221 cds 144 144 285 23s rRNA (guanosine(2251)-2'-O)-methyltransferase RlmB
750366..750451 tac 60 60
750512..750585 gga 81 81
750667..751857 cds 153 153 397 elongation factor Tu
752011..752086 tgg 69 69
752156..752353 cds 66 preprotein translocase subunit SecE
comp 794457..795983 cds 296 296 509 methyltransferase domain-containing protein
796280..796355 aag + 76 76
796432..796507 aag 2 aag 109 109
comp 796617..797057 cds 147 MaoC family dehydratase
870412..872373 cds 159 159 654 RNA polymerase sigma factor RpoD
872533..872608 atgi 5 5
comp 872614..873093 cds 134 134 160 GNAT family N-acetyltransferase
comp 873228..873304 cgt 212 212
873517..874023 cds 169 hp
931962..933011 cds 68 68 350 low specificity L-threonine aldolase
933080..933155 gag + 38 38
933194..933269 gag 2 gag 72 72
comp 933342..934340 cds 333 transglycosylase SLT domain-containing protein
997881..998357 cds 246 246 159 peptidoglycan-associated lipoprotein Pal
comp 998604..998678 acc 175 175
comp 998854..1000815 cds 654 polysaccharide biosynthesis protein
comp 1164137..1165048 cds 159 159 304 DUF3108 domain-containing protein
1165208..1165282 gtg + 132 132
1165415..1165489 gtg 2 gtg 231 231
1165721..1165885 cds 55 hp
1242416..1242919 cds 85 85 168 MerR family transcriptional regulator
1243005..1243081 ccc 139 139
comp 1243221..1244999 cds 593 cyclic nucleotide-binding domain-containing protein
comp 1353398..1353895 cds 118 118 166 hp
1354014..1354091 cca 49 49
1354141..1354437 cds 10 10 99 ETC complex I subunit
1354448..1354524 aga 443 443
1354968..1355213 cds 82 hp
comp 1370270..1370500 cds 196 196 77 hp
comp 1370697..1370772 aac @2 220 220
comp 1370993..1371066 tgc 218 218
1371285..1371941 cds 219 protein-L-isoaspartate O-methyltransferase
comp 1427443..1427733 cds 236 236 97 YkgJ family cysteine cluster protein
comp 1427970..1428085 5s 129 116
comp 1428215..1430967 23s 266 2753
comp 1431234..1431309 gca 30 30
comp 1431340..1431416 atc 108
comp 1431525..1433015 16s 779 779 1491
1433795..1437778 cds 1328 non-ribosomal peptide synthetase
comp 1576457..1577296 cds 243 243 280 aldo/keto reductase
comp 1577540..1577615 gaa 123 123
comp 1577739..1579538 cds 600 single-stranded-DNA-specific exonuclease RecJ
comp 1723089..1723457 cds 344 344 123 NADH-quinone oxidoreductase subunit A
comp 1723802..1723878 gac 164 164
comp 1724043..1724117 gta 106 106
comp 1724224..1724496 cds 91 HU family DNA-binding protein
comp 1730385..1731719 cds 91 91 445 trigger factor
comp 1731811..1731895 cta 173 173
comp 1732069..1733634 cds 522 malonyl-CoA decarboxylase
comp 1733741..1735207 cds 129 129 489 bifunctional ADP-dependent NAD(P)H-hydrate dehydratase/NAD(P)H-hydrate epimerase
comp 1735337..1735412 cac + 109 109
comp 1735522..1735597 cac 2 cac 337 337
1735935..1736273 cds 113 P-II family nitrogen regulator
1951126..1951752 cds 149 149 209 nitrogen fixation protein NifQ
1951902..1951987 tac 74 74
comp 1952062..1952424 cds 121 hp
1996903..1997244 cds 595 595 114 hp
comp 1997840..1997914 atgj 131 131
comp 1998046..1999179 cds 378 tRNA 2-thiouridine(34) synthase MnmA
2086487..2088658 cds 156 156 724 malate synthase G
comp 2088815..2088889 gtc 234 234
2089124..2090002 cds 293 N-formylglutamate amidohydrolase
comp 2303404..2303880 cds 414 414 159 bacterioferritin
comp 2304295..2304377 tta 406 406
comp 2304784..2305029 cds 82 hp
2482875..2484518 cds 365 365 548 recombinase family protein
comp 2484884..2484974 tcc 120 120
comp 2485095..2485898 cds 268 alpha/beta hydrolase
comp 2640759..2641325 cds 149 149 189 prolyl-tRNA synthetase associated domain-containing protein
2641475..2641549 ggc 688 688
2642238..2642915 cds 226 dimethylmenaquinone methyltransferase
comp 2764482..2765567 cds 659 659 362 hp
comp 2766227..2766300 ggg 35 35
comp 2766336..2766995 cds 220 N-acetyltransferase
2781933..2783774 cds 187 187 614 EAL and GGDEF domain-containing protein
comp 2783962..2784077 5s 129 116
comp 2784207..2786959 23s 255 2753
comp 2787215..2787290 gca 30 30
comp 2787321..2787397 atc 108
comp 2787506..2789006 16s 496 496 1501
comp 2789503..2790207 cds 235 phosphatase PAP2 family protein
2843264..2843443 cds 77 77 60 hp
comp 2843521..2843597 cgt 170 170
2843768..2844268 cds 167 xanthine phosphoribosyltransferase
plasmide2
comp 51090..51836 cds 481 481 249 sigma-70 family RNA polymerase sigma factor
comp 52318..52393 tgg 363 363
52757..53587 cds 277 hp
comp 809229..810019 cds 870 870 264 IS5 family transposase
comp 810890..810966 atgf 96
comp 811063..811178 5s 127 116
comp 811306..814058 23s 266 2753
comp 814325..814400 gca 30 30
comp 814431..814507 atc 108
comp 814616..816106 16s 452 452 1491
comp 816559..817443 cds 295 helix-turn-helix domain-containing protein
plasmide4
196992..199346 cds 148 148 785 mechanosensitive ion channel
199495..199581 ctg 30 30
199612..199687 gcc 188 188
199876..201333 cds 486 hp
237538..238578 cds 92 92 347 response regulator
comp 238671..238747 cgg 96 96
comp 238844..239821 cds 326 alpha/beta hydrolase
comp 257739..258470 cds 125 125 244 lipoyl(octanoyl) transferase LipB
258596..258682 ctc 123 123
comp 258806..259108 cds 101 STAS domain-containing protein
comp 399367..400527 cds 278 278 387 PQQ-dependent sugar dehydrogenase
comp 400806..400921 5s 129 116
comp 401051..403803 23s 255 2753
comp 404059..404134 gca 30 30
comp 404165..404241 atc 108
comp 404350..405850 16s 502 502 1501
comp 406353..406547 cds 65 hp
504531..504893 cds 82 82 121 response regulator
504976..505051 aac 3 3
505055..505131 gac 4 4
505136..505210 ggc 102 102
comp 505313..506080 cds 83 83 256 helix-turn-helix transcriptional regulator
506164..506790 cds 202 202 209 pyridoxamine 5'-phosphate oxidase
comp 506993..507108 5s 127 116
comp 507236..509988 23s 266 2753
comp 510255..510330 gca 30 30
comp 510361..510437 atc 110
comp 510548..512038 16s 615 615 1491
512654..513568 cds 305 lytic transglycosylase domain-containing protein
comp 588108..590768 cds 340 340 887 bifunctional acetaldehyde-CoA/alcohol dehydrogenase
591109..591184 ttc 286 286
591471..592979 cds 503 FAD-binding oxidoreductase
plasmide5
86421..87089 cds 455 455 223 RraA family protein
87545..87619 ggc 193 193
87813..88865 cds 351 UDP-N-acetylglucosamine 4,6-dehydratase (inverting)
plasmide1 @3
>comp 115594..115896 cds 394 394 101 P-IS5/IS1182 family transposase
comp 116291..116367 atgf 96
comp 116464..116579 5s 129 116
comp 116709..119461 23s 255 2753
comp 119717..119792 gca 30 30
comp 119823..119899 atc 108
comp 120008..121498 16s 740 740 1491
122239..123597 cds 453 peptidoglycan DD-metalloendopeptidase family protein
comp 217550..218176 cds 123 123 209 ribonuclease D
comp 218300..218386 ctg 228 228
218615..219604 cds 330 complex I NDUFA9 subunit family protein
comp 300477..301733 cds 472 472 419 exonuclease subunit SbcD
302206..303696 16s 108 1491
303805..303881 atc 30 30
303912..303987 gca 255
304243..306995 23s 129 2753
307125..307240 5s 96 116
307337..307413 atgf 161 161
<comp 307575..307805 cds 77 p-ATP-binding protein
comp 466493..467710 cds 231 231 406 site-specific integrase
comp 467942..468031 tca 205 205
comp 468237..468809 cds 191 hp
512242..512790 cds 136 136 183 pantetheine-phosphate adenylyltransferase
512927..513002 aaa 209 209
513212..514036 cds 275 DUF3618 domain-containing protein
931813..933912 cds 79 79 700 membrane protein
933992..934066 caa 382 382
comp 934449..935270 cds 274 hp
comp 948715..949743 cds 199 199 343 Ppx/GppA family phosphatase
949943..950016 cag 246 246
comp 950263..950829 cds 189 IS3 family transposase
> 971260..971532 cds 493 493 91 P-hp
comp 972026..972119 agc 197 197
972317..972550 cds 78 hp
comp 1302373..1303350 cds 166 166 326 alpha-1,3-fucosyltransferase
comp 1303517..1303592 ttc 98 98
comp 1303691..1303876 cds 62 DNA gyrase inhibitor YacG
1349823..1350929 cds 145 145 369 GNAT family N-acetyltransferase
comp 1351075..1353828 23s 262 2754
comp 1354091..1355591 16s @1 676 676 1501
1356268..1356726 cds 153 MarR family transcriptional regulator
comp 1441708..1443066 cds 153 153 453 hp
1443220..1443294 acc 1 1
1443296..1443371 gcg 99 99
1443471..1443547 gac 44 44
1443592..1443666 gtc 1 1
1443668..1443741 cag 137 137
comp 1443879..1446428 cds 850 dipeptide ABC transporter ATP-binding protein
1566394..1566612 cds 193 193 73 hp
comp 1566806..1566921 5s 128 116
comp 1567050..1569802 23s 254 2753
comp 1570057..1570132 gca 30 30
comp 1570163..1570239 atc 94
comp 1570334..1571834 16s 444 444 1501
comp 1572279..1572707 cds 143 DUF1489 domain-containing protein
1723583..1724962 cds 94 94 460 hp
comp 1725057..1725143 ctc 475 475
1725619..1726311 cds 231 FadR family transcriptional regulator
1757680..1760568 cds 308 308 963 PAS domain-containing protein
1760877..1760963 ctg 29 29
1760993..1761068 gcc 247 247
comp 1761316..1761840 cds 175 helix-turn-helix transcriptional regulator
1854042..1855049 cds 135 135 336 inorganic phosphate transporter
comp 1855185..1855259 ggc 243 243
1855503..1858685 cds 1061 AAA family ATPase
>comp 1883235..1883816 cds 210 210 194 P-hp
1884027..1884102 aac 4 4
1884107..1884183 gac 32 32
comp 1884216..1884821 cds 202 hp

abq cumuls[modifier | modifier le wikicode]

cumuls. abq.
opérons Fréquences intercalaires tRNAs Fréquences intercalaires cds Fréquences aas cds chromosome
effectif gammes sans rRNAs avec rRNAs gammes cds gammes cdsd gammes cdsa gammes cdsa 300
avec rRNA opérons 9 1 2 1 0 1 100 17 1 0
16atcgca235 5 20 3 50 7 40 200 29 30 0
Id-atgf 3 40 3 8 100 19 80 300 24 60 2
16s23s 1 60 2 150 26 120 400 18 90 9
max a 3 80 1 200 20 160 500 8 120 11
a doubles 0 100 1 250 18 200 600 8 150 8
spéciaux 0 120 1 300 3 240 700 5 180 11
total aas 19 140 1 350 4 280 800 2 210 9
sans opérons 51 160 0 400 4 320 900 2 240 6
1 aa 38 180 1 450 4 360 1000 1 270 6
max a 5 200 0 500 7 400 1100 1 300 8
a doubles 5 2 9 1 46
total aas 68 17 8 121 0 116 116
total aas 87
remarques 3
avec jaune moyenne 72 30 227 308
variance 72 0 175 230
sans jaune moyenne 153 249 166
variance 74 142 71

abq blocs[modifier | modifier le wikicode]

  • Lien tableur: abq blocs
  • Légende: lien au tableau des protéines, abrégé
    - vert: la taille des rRNAs en pbs alors que les protéines (cds) sont en aas.
A2. abq, blocs à rRNA.
bloc intercal cdsa intercal cdsa intercal cdsa intercal cdsa intercal cdsa
cds 779 1328 non ribosom 496 235 PAP2 fam 502 65 hp 615 305 lytic dom 444 143 DUF1489
16s 108 1491 108 1501 108 1501 110 1491 94 1501
atc 30 30 30 30 30
gca 266 255 255 266 254
23s 129 2753 129 2753 129 2753 127 2753 128 2753
5s 236 116 187 116 278 116 202 116 193 116
cds 97 YkgJ fam 614 EAL & GGDEF 387 PQQ 209 pyridoxamine 73 hp
cds 452 295 Hx-t-Hx 740 453 peptido fam 472 419 exo SbcD
16s 108 1491 108 1491 108 1491
atc 30 30 30
gca 266 255 255 cds 676 153 MarR fam
23s 127 2753 129 2753 129 2753 16s 262 1501
5s 96 116 96 116 96 116 23s 145 2754
atgf 870 394 161 cds 369 GNAT fam
cds 264 IS5 fam 101 p-IS5/IS1182 77 p-ATP-bind

abq remarques[modifier | modifier le wikicode]

  • Remarques
    - Les intercalaires élevés des cds: Ce génome ressemble à agr plus qu’à oan, voir le tableau des intercalaires ci-dessous. Le génome oan se rapproche plus des rickettsia avec 12 intercalaires cds-aa supérieurs à 500 et un maximum de 1650. Le génome abq a des intercalaires cds-aa inférieurs à 700 comme agr mais en plus grand nombre, 6 contre 3.
    1. @ Les blocs à RNAs: Les blocs sont nombreux, 9 16s, quasiment identiques et complets.
      - Sur 18 cds 2 hp 1 pseudo et 5 petits avec moins de 210 aas.
      - Tous les blocs sauf un (incomplet, 16s23s) sont de type 16satcgca23s5s dont 5 se terminent avec 5s et 3 avec 5s-atgf.
      - Les intercalaires internes, hors cds, sont quasiment identiques.
      - Les tailles des rRNAs du 23s et du 5s ne varient pas. Il y a 5 16s à 1491 pbs et 4 avec 1501 pbs.
    2. @ Les intercalaires entre aas: Il y a 13 blocs à plusieurs aas, pour 51 au total, contre 3 pour 45 chez oan et 3 pour 38 chez agr. Aussi je distingue 2 groupes comme avec agr et oan qui ont des effectifs très faibles.
      - un groupe de 10, normal dans cette étude, autour de 15 de moyenne, de 3 à 60 pbs
      - un groupe de 7, extrême, de 76 à 220 pbs. Le maximum est équivalent à celui de oan mais nettement inférieur aux 2 extrêmes de agr, 793 et 446.
    3. @ Les plasmides: génome exceptionnel avec 5 plasmides et 9 blocs à rRNAs. Exceptionnel aussi du fait qu’un plasmide, le plasmide 1, contient 4 blocs à rRNAs, soit 2 fois plus que le chromosome avec 2 blocs. Cette situation rappelle le cas unique du génome aua où le seul bloc à rRNA se trouve sur l’unique et tout petit plasmide de 10k pbs.
  • Séquences des doubles: sur les 51 blocs à aas seulement 13 ont plus d’un aa. Les doubles sont tous des doublets de blocs à 2 aas, 5 sur 11, ccg aag gag gtg cac.
  • Tableau des intercalaires
abq intercalaires entre aas	abq intercalaires cds		abq intercalaires cds			
1370697	aac-tgc	220		810890	atgf	870		2641475	ggc	688	
616472	ccg-ccg	206		1431525	16s	779		2766227	ggg	659	
1723802	gac-gta	164		120008	16s	740		1997840	atgj	595	
1165208	gtg-gtg	132		1354091	16s	676		972026	agc	493	
1735337	cac-cac	109		510548	16s	615		1725057	ctc	475	
1443296	gcg-gac	99		404350	16s	502		86421	ggc	455	
796280	aag-aag	76		2787506	16s	496		1354448	aga	443	
				302206	16s	472		52318	tgg	481-363	
				814616	16s	452		2304295	tta	414-406	isolé
				1570334	16s	444					
											
intercalaires supérieurs à 500 pbs.											
	agr	oan	abq								
16s	2	4	6								
aas	6	12	3								
max 16s	633	998	870								
max aas	793	1650	688								

Azospirillum brasilense Sp245[modifier | modifier le wikicode]

abs opérons[modifier | modifier le wikicode]

  • Lien tableur: abs opérons
  • Liens: gtRNAdb [17], NCBI [18], génome [19]
  • Phylogénie: Bacteria; Proteobacteria; Alphaproteobacteria; Rhodospirillales; Rhodospirillaceae; Azospirillum.
  • Légende: cdsa: cds aas, cdsd: cds dirigé
A9. Azospirillum brasilense strain Sp245
68.45%GC 10.1.20 Paris  80   doubles intercal cds aa avec aa cdsa cdsd protéines
chromosome [20]
comp 16414..16980 cds 163 163 189 prolyl-tRNA synthetase associated domain-containing protein
17144..17218 ggc 670 670
17889..18566 cds 226 demethylmenaquinone methyltransferase
84790..85017 cds 114 114 76 osmotically-inducible lipoprotein B
comp 85132..85205 ggg 35 35
comp 85241..85900 cds 220 N-acetyltransferase
comp 93530..94258 cds 60 60 243 SDR family NAD(P)-dependent oxidoreductase
comp 94319..94395 agg 175 175
94571..96262 cds 564 hp
comp 131833..132117 cds 206 206 95 YggT family protein
132324..132399 gcg 140 140
comp 132540..133586 cds 349 DMT family transporter
comp 483582..484082 cds 170 170 167 xanthine phosphoribosyltransferase
484253..484329 cgt 77 77
comp 484407..484586 cds 60 hp
536869..537573 cds 495 495 235 phosphatase PAP2 family protein
538069..539152 16s’ @1 189 1084
539342..540019 23s° 127 678
540147..540262 5s 153 153 116
comp 540416..542290 cds 625 GGDEF domain-containing protein
600048..601079 cds 79 79 344 tyrosine-type recombinase/integrase
comp 601159..601233 acg 81 81
comp 601315..603243 cds 643 DNA helicase RecQ
comp 656242..656520 cds 169 169 93 hp
comp 656690..656765 gcc 141 141
comp 656907..657305 cds 133 TIGR02300 family protein
comp 864141..864458 cds 209 209 106 50S ribosomal protein L21
864668..864757 tcg 79 79
comp 864837..865679 cds 281 alpha/beta hydrolase
927651..927896 cds 392 392 82 hp
928289..928371 tta 175 175
928547..929164 cds 206 hp
comp 1148345..1149223 cds 234 234 293 N-formylglutamate amidohydrolase
1149458..1149532 gtc 106 106
comp 1149639..1151516 cds 626 methyl-accepting chemotaxis protein
1243974..1245108 cds 131 131 378 tRNA 2-thiouridine(34) synthase MnmA
1245240..1245314 atgj 354 354
comp 1245669..1246637 cds 323 NAD(+) diphosphatase
1279875..1280237 cds 74 74 121 hp
comp 1280312..1280397 tac 148 148
comp 1280546..1281172 cds 209 nitrogen fixation protein NifQ
comp 1500772..1501110 cds 338 338 113 P-II family nitrogen regulator
1501449..1501524 cac + 109 109
1501634..1501709 cac 2 cac 129 129
1501839..1503305 cds 106 106 489 bifunctional ADP-dependent NAD(P)H-hydrate dehydratase/NAD(P)H-hydrate epimerase
1503412..1504977 cds 173 173 522 malonyl-CoA decarboxylase
1505151..1505235 cta 91 91
1505327..1506661 cds 445 trigger factor
1511745..1512017 cds 105 105 91 HU family DNA-binding protein
1512123..1512197 gta 163 163
1512361..1512437 gac 344 344
1512782..1513150 cds 123 NADH-quinone oxidoreductase subunit A
1657596..1659397 cds 123 123 601 p-single-stranded-DNA-specific exonuclease RecJ
1659521..1659596 gaa 234 234
1659831..1660671 cds 280 aldo/keto reductase
comp 1808199..1808735 cds 79 79 179 hp
1808815..1808892 cca 49 49
1808942..1809238 cds 10 10 99 ETC complex I subunit
1809249..1809325 aga 442 442
1809768..1810013 cds 82 hp
comp 1825075..1825305 cds 210 210 77 hp
comp 1825516..1825591 aac @2 219 219
comp 1825811..1825884 tgc 217 217
1826102..1826758 cds 219 protein-L-isoaspartate O-methyltransferase
comp 1878424..1878714 cds 244 244 97 YkgJ family cysteine cluster protein
comp 1878959..1879074 5s 123 116
comp 1879198..1881950 23s 272 2753
comp 1882223..1882298 gca 32 32
comp 1882331..1882407 atc 110
comp 1882518..1883224 16s° 100 100 707
<comp 1883325..1883763 cds 146 p-erythrose-4-phosphate dehydrogenase
1896604..1897080 cds 192 192 159 peptidoglycan-associated lipoprotein Pal
comp 1897273..1897347 acc 162 162
comp 1897510..1899495 cds 662 polysaccharide biosynthesis protein
comp 2032701..2033588 cds 165 165 296 DUF3108 domain-containing protein
2033754..2033828 gtg + 132 132
2033961..2034035 gtg 2 gtg 231 231
2034267..2034431 cds 55 hp
2113098..2113601 cds 85 85 168 MerR family transcriptional regulator
2113687..2113763 ccc 140 140
comp 2113904..2115682 cds 593 cyclic nucleotide-binding domain-containing protein
comp 2163405..2167388 cds 775 775 1328 non-ribosomal peptide synthetase
2168164..2168552 16s° 100 389
comp 2168653..2169323 16s° 522 522 671
comp 2169846..2170325 cds 160 DUF2141 domain-containing protein
2176963..2177427 cds 107 107 155 membrane protein
comp 2177535..2177610 gcc 30 30
comp 2177641..2177727 ctg 135 135
comp 2177863..2180208 cds 782 mechanosensitive ion channel
2233677..2234435 cds 92 92 253 hp
comp 2234528..2234603 gag + 38 38
comp 2234642..2234717 gag 2 gag 68 68
comp 2234786..2235836 cds 350 p-low specificity L-threonine aldolase
comp 2293087..2293593 cds 211 211 169 hp
2293805..2293881 cgt 137 137
2294019..2294495 cds 5 5 159 GNAT family N-acetyltransferase
comp 2294501..2294576 atgi 145 145
comp 2294722..2296683 cds 654 RNA polymerase sigma factor RpoD
2372946..2373401 cds 86 86 152 MaoC family dehydratase
comp 2373488..2373563 aag + 74 74
comp 2373638..2373713 aag 2 aag 309 309
2374023..2375549 cds 509 methyltransferase domain-containing protein
comp 2418203..2418400 cds 69 69 66 preprotein translocase subunit SecE
comp 2418470..2418545 tgg 152 152
comp 2418698..2419888 cds 81 81 397 elongation factor Tu
comp 2419970..2420043 gga 60 60
comp 2420104..2420189 tac 144 144
2420334..2421188 cds 91 91 285 23S rRNA (guanosine(2251)-2'-O)-methyltransferase RlmB
2421280..2421355 aca 137 137
2421493..2423187 cds 565 site-specific integrase
2561207..2562223 cds 109 109 339 farnesyltranstransferase
2562333..2562409 ccg + 205 205
2562615..2562691 ccg 2 ccg 136 136
2562828..2563241 cds 138 hp
comp 2680406..2680930 cds 140 140 175 disulfide bond formation protein B
2681071..2681157 ttg 162 162
2681320..2681715 cds 132 cupin domain-containing protein
2856509..2858152 cds 365 365 548 recombinase family protein
comp 2858518..2858608 tcc 118 118
comp 2858727..2859530 cds 268 alpha/beta hydrolase
plasmide1 [21] @3
198109..199200 cds 84 84 364 tyrosine-type recombinase/integrase
comp 199285..199360 aaa 135 135
comp 199496..200044 cds 183 pantetheine-phosphate adenylyltransferase
243776..244348 cds 205 205 191 hp
244554..244643 tca 143 143
244787..245683 cds 299 diguanylate cyclase
338004..339383 cds 116 116 460 hp
comp 339500..339586 ctc 257 257
comp 339844..340836 cds 331 alpha/beta hydrolase
comp 364473..365501 cds 200 200 343 Ppx/GppA family phosphatase
365702..365775 cag 746 746
366522..367214 cds 231 FadR family transcriptional regulator
474173..477079 cds 298 298 969 PAS domain-containing protein
477378..477464 ctg 30 30
477495..477570 gcc 238 238
477809..478123 cds 105 hp
599223..600230 cds 245 245 336 inorganic phosphate transporter
comp 600476..600550 ggc 351 351
600902..602071 cds 390 adenylate/guanylate cyclase domain-containing protein
comp 629856..631229 cds 154 154 458 tetratricopeptide repeat protein
631384..631458 acc 1 1
631460..631535 gcg 99 99
631635..631711 gac 35 35
631747..631821 gtc 1 1
631823..631896 cag 153 153
632050..632259 cds 70 hp
>comp 699265..699846 cds 210 210 194 P-hp
700057..700132 aac 4 4
700137..700213 gac 32 32
comp 700246..700851 cds 202 hp
909530..909766 cds 153 153 79 hp
comp 909920..910035 5s 127 116
comp 910163..912915 23s 271 2753
comp 913187..913262 gca 30 30
comp 913293..913369 atc 110
comp 913480..914970 16s 486 486 1491
915457..916713 cds 419 exonuclease subunit SbcD
comp 998160..999149 cds 229 229 330 complex I NDUFA9 subunit family protein
999379..999465 ctg 123 123
999589..1000215 cds 209 ribonuclease D
comp 1098197..1098655 cds 675 675 153 MarR family transcriptional regulator
1099331..1100821 16s 107 1491
1100929..1101005 atc 31 31
1101037..1101112 gca 271
1101384..1104136 23s 147 147 2753
comp 1104284..1105390 cds 369 GNAT family N-acetyltransferase
1157171..1157356 cds 98 98 62 DNA gyrase inhibitor YacG
1157455..1157530 ttc 178 178
1157709..1158686 cds 326 alpha-(1,3)-fucosyltransferase
1394614..1396740 cds 453 453 709 PAS domain S-box protein
1397194..1397287 agc 52 52
comp 1397340..1397858 cds 173 tyrosine-type recombinase/integrase
1399009..1399830 cds 301 301 274 hp
comp 1400132..1400206 caa 79 79
comp 1400286..1402379 cds 698 hp
1577667..1578095 cds 457 457 143 DUF1489 domain-containing protein
1578553..1580043 16s 110 1491
1580154..1580230 atc 31 31
1580262..1580337 gca 269
1580607..1581986 23s° 100 1380
1582087..1582616 23s° 123 530
1582740..1582855 5s 100 116
1582956..1583032 atgf 706 706
1583739..1585157 cds 473 pyruvate kinase
plasmide2 [22]
271302..272090 cds 529 529 263 ATP-binding cassette domain-containing protein
272620..272695 tgg 480 480
273176..273922 cds 249 sigma-70 family RNA polymerase sigma factor
449562..450338 cds 465 465 259 IclR family transcriptional regulator
450804..452289 16s 584 1486
452874..453640 23s° 128 767
453769..453884 5s 101 116
453986..454062 atgf 359 359
comp 454422..457751 cds 1110 NERD domain-containing protein
plasmide4 [23]
>comp 131140..131621 cds 193 193 161 p-erythrose-4-phosphate dehydrogenase
131815..131891 atgf 202 202
comp 132094..132276 cds 61 hp
comp 197300..198643 cds 738 738 448 peptidoglycan DD-metalloendopeptidase family protein
199382..199953 16s° 193 572
200147..200223 atgf 437 437
comp 200661..202571 cds 637 PAS domain-containing sensor histidine kinase
246777..248687 cds 208 208 637 RNA-directed DNA polymerase
comp 248896..248972 cgg 96 96
comp 249069..249983 cds 305 alpha/beta hydrolase
319641..319943 cds 134 134 101 STAS domain-containing protein
comp 320078..320164 ctc 125 125
320290..321018 cds 243 lipoyl(octanoyl) transferase LipB
comp 401067..402227 cds 281 281 387 PQQ-dependent sugar dehydrogenase
comp 402509..402624 5s 129 116
comp 402754..403402 23s° 106 649
comp 403509..403880 16s° 502 502 372
comp 404383..404577 cds 65 hp
501394..501756 cds 95 95 121 response regulator
501852..501927 aac 4 4
501932..502008 gac 4 4
502013..502087 ggc 102 102
comp 502190..502957 cds 256 helix-turn-helix transcriptional regulator
503041..503667 cds 249 249 209 pyridoxamine 5'-phosphate oxidase
comp 503917..504474 16s° 547 547 558
505022..506005 cds 328 lytic transglycosylase domain-containing protein
comp 601019..603679 cds 358 358 887 bifunctional acetaldehyde-CoA/alcohol dehydrogenase
604038..604113 ttc 318 318
> 604432..605613 cds 394 site-specific integrase
plasmide6 [24]
88804..89472 cds 397 397 223 RraA family protein
89870..89944 ggc 249 249
90194..91186 cds 331 UDP-N-acetylglucosamine 4,6-dehydratase (inverting)

abs cumuls[modifier | modifier le wikicode]

cumuls. abs.
opérons Fréquences intercalaires tRNAs Fréquences intercalaires cds Fréquences aas cds chromosome
effectif gammes sans rRNAs avec rRNAs gammes cds gammes cdsd gammes cdsa gammes cdsa 300
opérons Fréquences intercalaires tRNAs Fréquences intercalaires cds Fréquences aas cds
effectif gammes sans rRNAs avec rRNAs gammes cds gammes cdsd gammes cdsa cdsa 30-300
avec rRNA opérons 10 1 2 1 0 1 100 18 1 0
16atcgca235 1 20 3 50 5 40 200 29 30 0
Id-23s°-atgf 1 40 4 4 100 22 80 300 26 60 3
1623s°5atgf 1 60 1 150 29 120 400 20 90 10
max a 3 80 1 200 18 160 500 7 120 9
a doubles 0 100 1 250 18 200 600 6 150 8
autres 7 120 1 300 3 240 700 9 180 13
total aas 10 140 1 350 5 280 800 2 210 9
sans opérons 51 160 0 400 7 320 900 1 240 6
1 aa 39 180 1 450 2 360 1000 1 270 8
max a 5 200 0 500 6 400 1100 0 300 7
a doubles 5 2 10 2 48
total aas 67 17 4 125 0 121 121
total aas
remarques 3
avec jaune moyenne 71 31 221 308
variance 72 1 168 230
sans jaune moyenne 151 242 166
variance 72 137 72

abs blocs[modifier | modifier le wikicode]

abs blocs abrégé[modifier | modifier le wikicode]

  • Lien tableur: abs blocs abrégé
  • Note:
    - hp pour hypothetical protein
    - p- pour pseudo, par exemple p-elon en abrégé donne p-elongation factor Tu.
A9p. abs abq, protéines.
abrégé nom
23s RlmB 23S rRNA (guanosine(2251)-2'-O)-methyltransferase RlmB
50s L21 50S ribosomal protein L21
AAA fam AAA family ATPase
ab hydrolase alpha/beta hydrolase
ab hydrolase f alpha/beta hydrolase fold domain-containing protein
AG cyclase adenylate/guanylate cyclase domain-containing protein
ak reductase aldo/keto reductase
ATP bind ATP-binding cassette domain-containing protein
bacteriofer bacterioferritin
bif CoA bifunctional acetaldehyde-CoA/alcohol dehydrogenase
bif NAD bifunctional ADP-dependent NAD(P)H-hydrate dehydratase/NAD(P)H-hydrate epimerase
chemotaxis p methyl-accepting chemotaxis protein
cupin dom cupin domain-containing protein
cyclicN bind cyclic nucleotide-binding domain-containing protein
diG cyclase diguanylate cyclase
dip ABC dipeptide ABC transporter ATP-binding protein
disulfide disulfide bond formation protein B
DMT fam DMT family transporter
DUF1489 DUF1489 domain-containing protein
DUF2141 DUF2141 domain-containing protein
DUF3108 DUF3108 domain-containing protein
DUF3618 DUF3618 domain-containing protein
EAL & GGDEF EAL and GGDEF domain-containing protein
elonga Tu elongation factor Tu
ETC complex ETC complex I subunit
exo SbcD exonuclease subunit SbcD
FAD bind FAD-binding oxidoreductase
FadR fam FadR family transcriptional regulator
farnesyl farnesyltranstransferase
fucosyl alpha-1,3-fucosyltransferase
GGDEF dom GGDEF domain-containing protein
glycosyl glycosyltransferase
GNAT fam GNAT family N-acetyltransferase
gyrase YacG DNA gyrase inhibitor YacG
Hase HypA hydrogenase maturation nickel metallochaperone HypA
helicas RecQ DNA helicase RecQ
HU bind HU family DNA-binding protein
Hx-t-Hx helix-turn-helix transcriptional regulator
Hx-t-Hx dom helix-turn-helix domain-containing protein
IclR fam IclR family transcriptional regulator
inorganic P inorganic phosphate transporter
IS3 fam IS3 family transposase
IS5 fam IS5 family transposase
L-iso-Asp protein-L-isoaspartate O-methyltransferase
lipoyl LipB lipoyl(octanoyl) transferase LipB
low Thr low specificity L-threonine aldolase
lytic dom lytic transglycosylase domain-containing protein
malate G malate synthase G
malonyl CoA malonyl-CoA decarboxylase
MaoC fam MaoC family dehydratase
MarR fam MarR family transcriptional regulator
mecano ion mechanosensitive ion channel
membrane p membrane protein
menaquinone dimethylmenaquinone methyltransferase
MerR fam MerR family transcriptional regulator
methyl trans methyltransferase domain-containing protein
N-acetyl trans N-acetyltransferase
N-formyl Glu N-formylglutamate amidohydrolase
NAD diP NAD(+) diphosphatase
NADH-quinone NADH-quinone oxidoreductase subunit A
NDUFA9 complex I NDUFA9 subunit family protein
NERD dom NERD domain-containing protein
nitrogen NifQ nitrogen fixation protein NifQ
non ribosom non-ribosomal peptide synthetase
osmose LipB osmotically-inducible lipoprotein B
p-ATP-bind p-ATP-binding protein
p-erythrose p-erythrose-4-phosphate dehydrogenase
P-II nitrogen P-II family nitrogen regulator
p-IS5/IS1182 P-IS5/IS1182 family transposase
p-low Thr p-low specificity L-threonine aldolase
p-ssDNA exo p-single-stranded-DNA-specific exonuclease RecJ
pantetheine pantetheine-phosphate adenylyltransferase
PAP2 fam phosphatase PAP2 family protein
PAS dom PAS domain-containing protein
PAS kinase PAS domain-containing sensor histidine kinase
PAS S-box PAS domain S-box protein
peptido fam peptidoglycan DD-metalloendopeptidase family protein
peptido Pal peptidoglycan-associated lipoprotein Pal
polymerase RNA-directed DNA polymerase
polysacchard polysaccharide biosynthesis protein
Ppx/GppA Ppx/GppA family phosphatase
PQQ PQQ-dependent sugar dehydrogenase
Prolyl-tRNA prolyl-tRNA synthetase associated domain-containing protein
pyridoxamine pyridoxamine 5'-phosphate oxidase
pyruvate kin pyruvate kinase
recombinase recombinase family protein
response reg response regulator
restriction end restriction endonuclease
ribonucleaseD ribonuclease D
RraA fam RraA family protein
SDR fam SDR family NAD(P)-dependent oxidoreductase
sigma RpoD RNA polymerase sigma factor RpoD
sigma-70 fam sigma-70 family RNA polymerase sigma factor
SLT dom transglycosylase SLT domain-containing protein
ss integrase site-specific integrase
Ss-DNA single-stranded-DNA-specific exonuclease RecJ
STAS dom STAS domain-containing protein
subunit SecE preprotein translocase subunit SecE
tetratricopep tetratricopeptide repeat protein
TIGR02300 TIGR02300 family protein
trigger factor trigger factor
tRNA MnmA tRNA 2-thiouridine(34) synthase MnmA
Tyr rec/int tyrosine-type recombinase/integrase
UDP-N-acetyl UDP-N-acetylglucosamine 4,6-dehydratase (inverting)
xanthine xanthine phosphoribosyltransferase
YggT fam YggT family protein
YkgJ fam YkgJ family cysteine cluster protein

abs blocs tableau[modifier | modifier le wikicode]

  • Lien tableur: abs blocs tableau
  • Légende: lien au tableau des protéines, abrégé
    - vert: la taille des rRNAs en pbs alors que les protéines (cds) sont en aas.
  • Note: 10 cds < 259 sur 20 dont 2 hp + 1 p
A9b. abs blocs.
gène inter long abrégé gène inter long abrégé gène inter long abrégé
cds 486 419 SbcD cds 100 146 P-eryt cds 675 153 MarR
16s 110 1491 16s° 110 707 16s 107 1491
atc 30 atc 32 atc 31
gca 271 gca 272 gca 271
23s 127 2753 23s 123 2753 23s 147 2753
5s 153 116 5s 244 116 cds 369 GNAT
cds 79 hp cds 97 YkgJ
cds 457 143 DUF1489
16s 110 1491
atc 31
gca 269
23s° 100 1380
23s° 123 530
5s 100 116
atgf 706
cds 473 pyruvat
cds 465 259 IclR cds 502 65 hp cds 495 235 PAP2
16s 584 1486 16s° 106 372 16s' 189 1084
23s° 128 767 23s° 129 649 23s° 127 678
5s 101 116 5s 281 116 5s 153 v116
atgf 359 cds 387 PQQ cds 625 GGDEF
cds 1110 NERD
cds 775 1328 non-rib cds 738 448 peptido cds 249 209 pyridox
16s° 100 389 16s° 193 16s° 547 558
16s° 522 671 atgf 437 cds 328 lytic
cds 160 DUF2141 cds 637 PAS

abs abq blocs[modifier | modifier le wikicode]

  • Lien tableur: abs abq blocs
  • Légende: lien au tableau des protéines, abs abq blocs abrégé
    - vert: la taille des rRNAs en pbs alors qu'en clair les protéines (cdsa) sont en aas.
    - 16s° 16s' 23s°
    - comp: complement, le cds a changé de brin. Cela ressemble à une recombinaison. Exemple CHA1
    - hp caracter: hypothetical protein caractérisée. Le cds est, dans un génome hypothétique, alors que dans l'autre il est caractérisé,tout en ayant à peu près même taille et même intercalaire. Exemple CHA
    - modif: le cds a le même nom mais la taille est légèrement modifiée, ou bien le nom est modifié et nom et intercalaire sont les mêmes. Exemple CHA CHC
    - déplacé: Le cds est déplacé avec son rRNA, tout en conservant taille et intercalaire. Exemple le pavé après CHE
    - d’où?: je ne peux pas savoir de quel bloc à rRNAs, il vient. Exemple le pavé après CHE
    - recomb: En bordure un changement net du cds est du à la recombinaison d'un pavé de clusters. Exemple CHC
    - recombi: à l'intérieur, un changement net de cds est du à un déplacement ou à une recombinaison interne. Exemple CHC
    - insertion: C'est le cas typique du bloc à rRNAs incomplet qui lui manque 5s et atcgca dans abq. Exemple PL1G
    - bloc?: cela vient de quel bloc à rRNA? Exemple PL1I
    - réunion: 2 déplacés réunis. Exemple PL1I, réunion de bloc? et où?.
  • Notes:
    - PL1G
    - disparition des atc et gca internes non retrouvés dans les blocs aas
    - Les 5s ne sont pas abimés mais 2 disparaissent
    - Les atgf disparaissent aussi
    - Les 23s, 2 de perdus et 4 de modifiés et perdent leur 5s et 5satgf au contraire de rpm
    - Les 16s, aucun perdu, 4 modifiés s° et 1 modifié s'.
    - Les blocs rRNAs modifiés restent sur place.
A9-2b. Comparaison abs abq
A9. Azospirillum brasilense strain Sp245
sens adresse bloc inter cdsa protéine Note
chrom
2856509..2858152 cds 365 548 recombinase CHA1
comp 2858518..2858608 tcc 118
comp 2858727..2859530 cds 268 ab hydrolase
comp 16414..16980 cds 163 189 Prolyl-tRNA CHA
17144..17218 ggc 670
17889..18566 cds 226 menaquinone
84790..85017 cds 114 76 osmose LipB comp
comp 85132..85205 ggg 35
comp 85241..85900 cds 220 N-acetyl trans
comp 93530..94258 cds 60 243 SDR fam
comp 94319..94395 agg 175
94571..96262 cds 564 hp hp caracter
comp 131833..132117 cds 206 95 YggT fam
132324..132399 gcg 140
comp 132540..133586 cds 349 DMT fam modif
comp 483582..484082 cds 170 167 xanthine
484253..484329 cgt 77
comp 484407..484586 cds 60 hp
536869..537573 cds 495 235 PAP2 fam
538069..539152 16s’ 189 1084
539342..540019 23s° 127 678
540147..540262 5s 153 116
comp 540416..542290 cds 625 GGDEF dom
600048..601079 cds 79 344 Tyr rec/int comp
comp 601159..601233 acg 81
comp 601315..603243 cds 643 helicas RecQ
CHB
comp 656242..656520 cds 169 93 hp
comp 656690..656765 gcc 141
comp 656907..657305 cds 133 TIGR02300
comp 864141..864458 cds 209 106 50s L21
864668..864757 tcg 79
comp 864837..865679 cds 281 ab hydrolase
2233677..2234435 cds 92 253 hp recomb
comp 2234528..2234603 gag 38
comp 2234642..2234717 gag 68
comp 2234786..2235836 cds 350 p-low Thr modif
comp 2293087..2293593 cds 211 169 hp CHC
2293805..2293881 cgt 137
2294019..2294495 cds 5 159 GNAT fam
comp 2294501..2294576 atgi 145
comp 2294722..2296683 cds 654 sigma RpoD
2372946..2373401 cds 86 152 MaoC fam
comp 2373488..2373563 aag 74
comp 2373638..2373713 aag 309
2374023..2375549 cds 509 methyl trans
comp 2418203..2418400 cds 69 66 subunit SecE
comp 2418470..2418545 tgg 152
comp 2418698..2419888 cds 81 397 elonga Tu
comp 2419970..2420043 gga 60
comp 2420104..2420189 tac 144
2420334..2421188 cds 91 285 23s RlmB
2421280..2421355 aca 137
2421493..2423187 cds 565 ss integrase recombi
2561207..2562223 cds 109 339 farnesyl
2562333..2562409 ccg 205
2562615..2562691 ccg 136
2562828..2563241 cds 138 hp
comp 2680406..2680930 cds 140 175 disulfide
2681071..2681157 ttg 162
2681320..2681715 cds 132 cupin dom
1896604..1897080 cds 192 159 peptido Pal CHD
comp 1897273..1897347 acc 162
comp 1897510..1899495 cds 662 polysacchard
comp 2032701..2033588 cds 165 296 DUF3108
2033754..2033828 gtg 132
2033961..2034035 gtg 231
2034267..2034431 cds 55 hp
2113098..2113601 cds 85 168 MerR fam
2113687..2113763 ccc 140
comp 2113904..2115682 cds 593 cyclicN bind
comp 1808199..1808735 cds 79 179 hp CHE
1808815..1808892 cca 49
1808942..1809238 cds 10 99 ETC complex
1809249..1809325 aga 442
1809768..1810013 cds 82 hp
comp 1825075..1825305 cds 210 77 hp
comp 1825516..1825591 aac 219
comp 1825811..1825884 tgc 217
1826102..1826758 cds 219 L-iso-Asp
comp 1878424..1878714 cds 244 97 YkgJ fam
comp 1878959..1879074 5s 123 116
comp 1879198..1881950 23s 272 2753
comp 1882223..1882298 gca 32
comp 1882331..1882407 atc 110
comp 1882518..1883224 16s° 100 707
<comp 1883325..1883763 cds 146 p-erythrose comp
comp 2163405..2167388 cds 775 1328 non ribosom déplacé
2168164..2168552 16s° 100 389
comp 2168653..2169323 16s° 522 671 d’où?
comp 2169846..2170325 cds 160 DUF2141
927651..927896 cds 392 82 hp CHF
928289..928371 tta 175
928547..929164 cds 206 hp recombi
comp 1148345..1149223 cds 234 293 N-formyl Glu
1149458..1149532 gtc 106
comp 1149639..1151516 cds 626 chemotaxis p modif
1243974..1245108 cds 131 378 tRNA MnmA
1245240..1245314 atgj 354
comp 1245669..1246637 cds 323 NAD diP recombi
1279875..1280237 cds 74 121 hp
comp 1280312..1280397 tac 148
comp 1280546..1281172 cds 209 nitrogen NifQ
comp 1500772..1501110 cds 338 113 P-II nitrogen
1501449..1501524 cac 109
1501634..1501709 cac 129
1501839..1503305 cds 106 489 bif NAD
1503412..1504977 cds 173 522 malonyl CoA
1505151..1505235 cta 91
1505327..1506661 cds 445 trigger factor
1511745..1512017 cds 105 91 HU bind
1512123..1512197 gta 163
1512361..1512437 gac 344
1512782..1513150 cds 123 NADH-quinone
1657596..1659397 cds 123 601 p-ssDNA exo
1659521..1659596 gaa 234
1659831..1660671 cds 280 ak reductase
plasmide1
comp 197300..198643 cds 738 448 peptido fam PL4
199382..199953 16s° 193 572 déplacé
200147..200223 atgf 437
comp 200661..202571 cds 637 PAS kinase déplacé
909530..909766 cds 153 79 hp hp caracter
comp 909920..910035 5s 127 116
comp 910163..912915 23s 271 2753
comp 913187..913262 gca 30 PL1B
comp 913293..913369 atc 110
comp 913480..914970 16s 486 1491
915457..916713 cds 419 exo SbcD
comp 998160..999149 cds 229 330 NDUFA9
999379..999465 ctg 123
999589..1000215 cds 209 ribonucleaseD
198109..199200 cds 84 364 Tyr rec/int comp
comp 199285..199360 aaa 135
comp 199496..200044 cds 183 pantetheine PL1C
243776..244348 cds 205 191 hp
244554..244643 tca 143
244787..245683 cds 299 diG cyclase recomb
1399009..1399830 cds 301 274 hp PL1D
comp 1400132..1400206 caa 79
comp 1400286..1402379 cds 698 hp hp caracter
comp 364473..365501 cds 200 343 Ppx/GppA PL1E
365702..365775 cag 746
366522..367214 cds 231 FadR fam comp
1394614..1396740 cds 453 709 PAS S-box recomb
1397194..1397287 agc 52 PL1F
comp 1397340..1397858 cds 173 Tyr rec/int recomb
comp 1098197..1098655 cds 675 153 MarR fam PL1G
1099331..1100821 16s 107 1491
1100929..1101005 atc 31 insertion
1101037..1101112 gca 271
1101384..1104136 23s 147 2753
comp 1104284..1105390 cds 369 GNAT fam
1157171..1157356 cds 98 62 gyrase YacG
1157455..1157530 ttc 178
1157709..1158686 cds 326 fucosyl
comp 629856..631229 cds 154 458 tetratricopep PL1H
631384..631458 acc 1
631460..631535 gcg 99
631635..631711 gac 35
631747..631821 gtc 1
631823..631896 cag 153
632050..632259 cds 70 hp comp
1577667..1578095 cds 457 143 DUF1489 PL1I
1578553..1580043 16s 110 1491 bloc?
1580154..1580230 atc 31
1580262..1580337 gca 269
1580607..1581986 23s° 100 1380 réunion
1582087..1582616 23s° 123 530
1582740..1582855 5s 100 116
1582956..1583032 atgf 706 d’où?
1583739..1585157 cds 473 pyruvate kin comp
338004..339383 cds 116 460 hp PL1J
comp 339500..339586 ctc 257
comp 339844..340836 cds 331 ab hydrolase comp
474173..477079 cds 298 969 PAS dom PL1K
477378..477464 ctg 30
477495..477570 gcc 238
477809..478123 cds 105 hp comp
599223..600230 cds 245 336 inorganic P
comp 600476..600550 ggc 351
600902..602071 cds 390 AG cyclase recomb
>comp 699265..699846 cds 210 194 p-hp PL1L
700057..700132 aac 4
700137..700213 gac 32
comp 700246..700851 cds 202 hp
plasmide2
271302..272090 cds 529 263 ATP bind comp
272620..272695 tgg 480
273176..273922 cds 249 sigma-70 fam
449562..450338 cds 465 259 IclR fam modif
450804..452289 16s 584 1486
452874..453640 23s° 128 767
453769..453884 5s 101 116
453986..454062 atgf 359
comp 454422..457751 cds 1110 NERD dom comp
plasmide4
2176963..2177427 cds 107 155 membrane p comp
comp 2177535..2177610 gcc 30
comp 2177641..2177727 ctg 135 CH
comp 2177863..2180208 cds 782 mecano ion
246777..248687 cds 208 637 polymerase recomb
comp 248896..248972 cgg 96
comp 249069..249983 cds 305 ab hydrolase PL4B
319641..319943 cds 134 101 STAS dom
comp 320078..320164 ctc 125
320290..321018 cds 243 lipoyl LipB
comp 401067..402227 cds 281 387 PQQ
comp 402509..402624 5s 129 116
comp 402754..403402 23s° 106 649
comp 403509..403880 16s° 502 372
comp 404383..404577 cds 65 hp
501394..501756 cds 95 121 response reg
501852..501927 aac 4
501932..502008 gac 4
502013..502087 ggc 102
comp 502190..502957 cds 83 256 Hx-t-Hx
503041..503667 cds 249 209 pyridoxamine
comp 503917..504474 16s° 547 558
505022..506005 cds 328 lytic dom modif
comp 601019..603679 cds 358 887 bif CoA
604038..604113 ttc 318
> 604432..605613 cds 394 ss integrase recomb
>comp 131140..131621 cds 193 161 p-erythrose
131815..131891 atgf 202 d’où?
comp 132094..132276 cds 61 hp
plasmide6
88804..89472 cds 397 223 RraA fam
89870..89944 ggc 249
90194..91186 cds 331 UDP-N-acetyl
A2. Azospirillum brasilense strain Az39
sens adresse bloc inter cdsa protéine ordre
chrom
2482875..2484518 cds 365 548 recombinase CHA1
comp 2484884..2484974 tcc 120
comp 2485095..2485898 cds 268 ab hydrolase
comp 2640759..2641325 cds 149 189 Prolyl-tRNA CHA
2641475..2641549 ggc 688
2642238..2642915 cds 226 menaquinone
comp 2764482..2765567 cds 659 362 hp
comp 2766227..2766300 ggg 35
comp 2766336..2766995 cds 220 N-acetyl trans
2781933..2783774 cds 187 614 EAL & GGDEF
comp 2783962..2784077 5s 129 116
comp 2784207..2786959 23s 255 2753
comp 2787215..2787290 gca 30
comp 2787321..2787397 atc 108
comp 2787506..2789006 16s 496 1501
comp 2789503..2790207 cds 235 PAP2 fam
2843264..2843443 cds 77 60 hp
comp 2843521..2843597 cgt 170
2843768..2844268 cds 167 xanthine
125527..126444 cds 127 306 restriction end
comp 126572..126647 gcg 206
126854..127138 cds 95 YggT fam
comp 163237..164982 cds 175 582 Hase HypA
165158..165234 agg 59
165294..166022 cds 243 SDR fam
comp 188235..189860 cds 42 542 glycosyl CHB
comp 189903..189977 acg 81
comp 190059..191987 cds 643 helicas RecQ
comp 250833..251111 cds 169 93 hp
comp 251281..251356 gcc 141
comp 251498..251893 cds 132 TIGR02300
comp 458142..458459 cds 209 106 50s L21
458669..458758 tcg 63
comp 458822..459664 cds 281 ab hydrolase f
comp 496776..497171 cds 162 132 cupin dom CHC
comp 497334..497420 ttg 137
497558..498085 cds 176 disulfide
comp 615937..616350 cds 121 138 hp
comp 616472..616548 ccg 206
comp 616755..616831 ccg 109
comp 616941..617957 cds 339 farnesyl
comp 748703..749161 cds 38 153 hp
comp 749200..749275 aca 91
comp 749367..750221 cds 144 285 23s RlmB
750366..750451 tac 60
750512..750585 gga 81
750667..751857 cds 153 397 elonga Tu
752011..752086 tgg 69
752156..752353 cds 66 subunit SecE
comp 794457..795983 cds 296 509 methyl trans
796280..796355 aag 76
796432..796507 aag 109
comp 796617..797057 cds 147 MaoC fam
870412..872373 cds 159 654 sigma RpoD
872533..872608 atgi 5
comp 872614..873093 cds 134 160 GNAT fam
comp 873228..873304 cgt 212
873517..874023 cds 169 hp
931962..933011 cds 68 350 low Thr
933080..933155 gag 38
933194..933269 gag 72
comp 933342..934340 cds 333 SLT dom
997881..998357 cds 246 159 peptido Pal CHD
comp 998604..998678 acc 175
comp 998854..1000815 cds 654 polysacchard
comp 1164137..1165048 cds 159 304 DUF3108
1165208..1165282 gtg 132
1165415..1165489 gtg 231
1165721..1165885 cds 55 hp
1242416..1242919 cds 85 168 MerR fam
1243005..1243081 ccc 139
comp 1243221..1244999 cds 593 cyclicN bind
comp 1353398..1353895 cds 118 166 hp CHE
1354014..1354091 cca 49
1354141..1354437 cds 10 99 ETC complex
1354448..1354524 aga 443
1354968..1355213 cds 82 hp
comp 1370270..1370500 cds 196 77 hp
comp 1370697..1370772 aac 220
comp 1370993..1371066 tgc 218
1371285..1371941 cds 219 L-iso-Asp
comp 1427443..1427733 cds 236 97 YkgJ fam
comp 1427970..1428085 5s 129 116
comp 1428215..1430967 23s 266 2753
comp 1431234..1431309 gca 30
comp 1431340..1431416 atc 108
comp 1431525..1433015 16s 779 1491
1433795..1437778 cds 1328 non ribosom
comp 1576457..1577296 cds 243 280 ak reductase CHF
comp 1577540..1577615 gaa 123
comp 1577739..1579538 cds 600 ss-DNA
comp 1723089..1723457 cds 344 123 NADH-quinone
comp 1723802..1723878 gac 164
comp 1724043..1724117 gta 106
comp 1724224..1724496 cds 91 HU bind
comp 1730385..1731719 cds 91 445 trigger factor
comp 1731811..1731895 cta 173
comp 1732069..1733634 cds 106 522 malonyl CoA
comp 1733741..1735207 cds 129 489 bif NAD
comp 1735337..1735412 cac 109
comp 1735522..1735597 cac 337
1735935..1736273 cds 113 P-II nitrogen
1951126..1951752 cds 149 209 nitrogen NifQ
1951902..1951987 tac 74
comp 1952062..1952424 cds 121 hp
1996903..1997244 cds 595 114 hp
comp 1997840..1997914 atgj 131
comp 1998046..1999179 cds 378 tRNA MnmA
2086487..2088658 cds 156 724 malate G
comp 2088815..2088889 gtc 234
2089124..2090002 cds 293 N-formyl Glu
comp 2303404..2303880 cds 414 159 bacteriofer
comp 2304295..2304377 tta 406
comp 2304784..2305029 cds 82 hp
plasmide1
>comp 115594..115896 cds 394 101 p-IS5/IS1182 PL1A
comp 116291..116367 atgf 96
comp 116464..116579 5s 129 116
comp 116709..119461 23s 255 2753
comp 119717..119792 gca 30
comp 119823..119899 atc 108
comp 120008..121498 16s 740 1491
122239..123597 cds 453 peptido fam
comp 217550..218176 cds 123 209 ribonucleaseD PL1B
comp 218300..218386 ctg 228
218615..219604 cds 330 NDUFA9
comp 300477..301733 cds 472 419 exo SbcD
302206..303696 16s 108 1491
303805..303881 atc 30
303912..303987 gca 255
304243..306995 23s 129 2753
307125..307240 5s 96 116
307337..307413 atgf 161
<comp 307575..307805 cds 77 p-ATP-bind
comp 466493..467710 cds 231 406 ss integrase PL1C
comp 467942..468031 tca 205
comp 468237..468809 cds 191 hp
512242..512790 cds 136 183 pantetheine
512927..513002 aaa 209
513212..514036 cds 275 DUF3618
931813..933912 cds 79 700 membrane p PL1D
933992..934066 caa 382
comp 934449..935270 cds 274 hp
comp 948715..949743 cds 199 343 Ppx/GppA PL1E
949943..950016 cag 246
comp 950263..950829 cds 189 IS3 fam
> 971260..971532 cds 493 91 P-hp PL1F
comp 972026..972119 agc 197
972317..972550 cds 78 hp
comp 1302373..1303350 cds 166 326 fucosyl PL1G
comp 1303517..1303592 ttc 98
comp 1303691..1303876 cds 62 gyrase YacG
1349823..1350929 cds 145 369 GNAT fam
comp 1351075..1353828 23s 262 2754
comp 1354091..1355591 16s 676 1501
1356268..1356726 cds 153 MarR fam
comp 1441708..1443066 cds 153 453 hp PL1H
1443220..1443294 acc 1
1443296..1443371 gcg 99
1443471..1443547 gac 44
1443592..1443666 gtc 1
1443668..1443741 cag 137
comp 1443879..1446428 cds 850 dip ABC
1566394..1566612 cds 193 73 hp PL1I
comp 1566806..1566921 5s 128 116
comp 1567050..1569802 23s 254 2753
comp 1570057..1570132 gca 30
comp 1570163..1570239 atc 94
comp 1570334..1571834 16s 444 1501
comp 1572279..1572707 cds 143 DUF1489
1723583..1724962 cds 94 460 hp PL1J
comp 1725057..1725143 ctc 475
1725619..1726311 cds 231 FadR fam
1757680..1760568 cds 308 963 PAS dom PL1K
1760877..1760963 ctg 29
1760993..1761068 gcc 247
comp 1761316..1761840 cds 175 Hx-t-Hx
1854042..1855049 cds 135 336 inorganic P
comp 1855185..1855259 ggc 243
1855503..1858685 cds 1061 AAA fam
>comp 1883235..1883816 cds 210 194 P-hp PL1L
1884027..1884102 aac 4
1884107..1884183 gac 32
comp 1884216..1884821 cds 202 hp
plasmide2
comp 51090..51836 cds 481 249 sigma-70 fam
comp 52318..52393 tgg 363
52757..53587 cds 277 hp
comp 809229..810019 cds 870 264 IS5 fam
comp 810890..810966 atgf 96
comp 811063..811178 5s 127 116
comp 811306..814058 23s 266 2753
comp 814325..814400 gca 30
comp 814431..814507 atc 108
comp 814616..816106 16s 452 1491
comp 816559..817443 cds 295 Hx-t-Hx dom
plasmide4
196992..199346 cds 148 785 mecano ion PL4A
199495..199581 ctg 30
199612..199687 gcc 188
199876..201333 cds 486 hp
237538..238578 cds 92 347 response reg PL4B
comp 238671..238747 cgg 96
comp 238844..239821 cds 326 ab hydrolase
comp 257739..258470 cds 125 244 lipoyl LipB
258596..258682 ctc 123
comp 258806..259108 cds 101 STAS dom
comp 399367..400527 cds 278 387 PQQ
comp 400806..400921 5s 129 116
comp 401051..403803 23s 255 2753
comp 404059..404134 gca 30
comp 404165..404241 atc 108
comp 404350..405850 16s 502 1501
comp 406353..406547 cds 65 hp
504531..504893 cds 82 121 response reg
504976..505051 aac 3
505055..505131 gac 4
505136..505210 ggc 102
comp 505313..506080 cds 83 256 Hx-t-Hx
506164..506790 cds 202 209 pyridoxamine
comp 506993..507108 5s 127 116
comp 507236..509988 23s 266 2753
comp 510255..510330 gca 30
comp 510361..510437 atc 110
comp 510548..512038 16s 615 1491
512654..513568 cds 305 lytic dom
comp 588108..590768 cds 340 887 bif CoA
591109..591184 ttc 286
591471..592979 cds 503 FAD bind
plasmide5
86421..87089 cds 455 223 RraA fam
87545..87619 ggc 193
87813..88865 cds 351 UDP-N-acety

abs remarques[modifier | modifier le wikicode]

  • Remarques:
    - Les remarques de abq qui ne changent pas: les intercalaires élevés avec les cds, les intercalaires entre aas (@2) et les séquences des doubles. La phylogénie étroite entre les 2 souches explique cette étroite ressemblance en tout cas pour les intercalaires et les doubles, mais pas pour les blocs à rRNAs.
    - Le tableau des intercalaires et des doubles ci-dessous met en parallèle ces 3 remarques.
    - Les remarques qui changent fondamentalement: ce sont les blocs à rRNAs (@1) et les plasmides (@3). J’ai fait une comparaison détaillée entre les 2 génomes dans abs abq blocs. Elle montre 2 processus distincts:
    1. Le processus de recombinaison qui explique l’ordre des blocs et le changement de certains cds.
    2. Le processus de conversion génique qui, en grande partie, a détruit partiellement les rRNAs 16s et 23s et non les 5s. Cependant un 5s a disparu en laissant son atgf. D’après la majorité des cds identiques entre abs et abq et qui sont attachés à ces blocs, les rRNas modifiés restent sur place.
  • Tableau des intercalaires et des doubles
abs intercalaires aas		abs	intercalaires cds	abs intercalaires cds			
adresse	aas			adresse	rRNA			adresse	aas		
1825516	aac-tgc	219		2168164	16s°	775		365702	cag	746	
2562333	ccg-ccg	205		199382	16s°	738		17144	ggc	670	
1512123	gta-gac	163		1582956	atgf	706		272620	tgg	529-480	isolé
2033754	gtg-gtg	132		913480	16s	675		1397194	agc	453	
1501449	cac-cac	109		503917	16s°	547		1809249	aga	442	
631460	gcg-gac	99		2168653	16s°	522					
2373488	aag-aag	74		403509	16s°	502			atgj	354	
				538069	16s’	495			ctc	257	
				913480	16s	486			ggg	114	
				450804	16s	465					
				1578553	16s	457			cag abq	246	
				200147	atgf	437					
											
abq intercalaires entre aas	abq intercalaires cds		abq intercalaires cds			
1370697	aac-tgc	220		810890	atgf	870		2641475	ggc	688	
616472	ccg-ccg	206		1431525	16s	779		2766227	ggg	659	
1723802	gac-gta	164		120008	16s	740		1997840	atgj	595	
1165208	gtg-gtg	132		1354091	16s	676		972026	agc	493	
1735337	cac-cac	109		510548	16s	615		1725057	ctc	475	
1443296	gcg-gac	99		404350	16s	502		86421	ggc	455	
796280	aag-aag	76		2787506	16s	496		1354448	aga	443	
				302206	16s	472		52318	tgg	481-363	
				814616	16s	452		2304295	tta	414-406	isolé
				1570334	16s	444					
											
intercalaires supérieurs à 500 pbs.											
	agr	oan	abq	abs							
16s	2	4	6	7							
aas	6	12	3	3							
max 16s	633	998	870	775							
max aas	793	1650	688	746							
											
											
Doubles abs			Doubles abq							
aas	n	doublets	aas	n	doublets					
1	39	ccg		1	38	ccg					
2	10	aag		2	11	aag					
3	1	gag		3	1	gag					
4		gtg		4		gtg					
5	1	cac		5	1	cac					

Agrobacterium sp. H13-3[modifier | modifier le wikicode]

agr opérons[modifier | modifier le wikicode]

  • Lien tableur: agr opérons
  • Liens: gtRNAdb [25], NCBI [26], génome [orgn]
  • Phylogénie: Bacteria; Proteobacteria; Alphaproteobacteria; Rhizobiales; Rhizobiaceae; Rhizobium/Agrobacterium group; Agrobacterium.
  • Légende: cdsa: cds aas, cdsd: cds dirigé
A6. Agrobacterium sp. H13-3
59.3%GC 29.12.19 Paris  58   doubles intercal cds aa avec aa cdsa cdsd protéines
chromosoml
comp 1064633..1065274 cds 296 296 214 hp
1065571..1065655 ttg 266 266
1065922..1066437 cds 172 disulfide bond formation protein B
comp 1178605..1179114 cds 256 256 170 prolyl-tRNA synthetase associated domain-containing protein
1179371..1179445 ggc @1 793 793
comp 1180239..1180315 atgj 135 135
comp 1180451..1181647 cds 399 tRNA 2-thiouridine(34) synthase MnmA
comp 1320644..1321006 cds 318 318 121 hp
comp 1321325..1321414 tcg 197 197
comp 1321612..1322493 cds 294 dihydrodipicolinate synthase family protein
comp 1361929..1362942 cds 554 554 338 sugar ABC transporter substrate-binding protein
comp 1363497..1363571 gtc 81 81
comp 1363653..1364015 cds 121 response regulator
<comp 1426814..1427137 cds 105 105 108 hp
1427243..1428733 16s 337 1491
1429071..1429147 atc 59 59
1429207..1429282 gca 146 146
<comp 1429429..1429626 cds @2 241 241 66 P-hp
1429868..1432681 23s 242 2814
1432924..1433038 5s 257 115
1433296..1433372 atgf 311 311
1433684..1434118 cds 145 acetyl-CoA carboxylase biotin carboxyl carrier protein subunit
1503534..1504520 cds 122 122 329 beta-ketoacyl-ACP synthase III
comp 1504643..1504716 cag 123 123
comp 1504840..1505277 cds 146 Lrp/AsnC family transcriptional regulator
1605356..1605856 cds 71 71 167 hp
comp 1605928..1606003 gcc 152 152
comp 1606156..1606545 cds 130 TIGR02300 family protein
<comp 1687683..1688015 cds 105 105 111 hp
1688121..1689611 16s 337 1491
1689949..1690025 atc 59 59
1690085..1690160 gca 146 146
<comp 1690307..1690504 cds 241 241 66 P-hp
1690746..1693559 23s 242 2814
1693802..1693916 5s 257 115
1694174..1694250 atgf 203 203
comp 1694454..1694645 cds 64 hp
<comp 2103153..2103404 cds 105 105 84 P-hp
2103510..2105000 16s 337 1491
2105338..2105414 atc 59 59
2105474..2105549 gca 146 146
<comp 2105696..2105893 cds 241 241 66 P-hp
2106135..2108948 23s 242 2814
2109191..2109305 5s 257 115
2109563..2109639 atgf 633 633
2110273..2110680 cds 136 membrane protein
chromosomc
<comp 56862..57137 cds 105 105 92 P-hp
57243..58733 16s 337 1491
59071..59147 atc 59 59
59207..59282 gca 146 146
<comp 59429..59626 cds 241 241 66 P-hp
59868..62681 23s 242 2814
62924..63038 5s 257 115
63296..63372 atgf 196 196
63569..65377 cds 603 DNA helicase RecQ
comp 125821..127722 cds 287 287 634 molecular chaperone DnaK
comp 128010..128099 tcc 220 220
128320..128637 cds 106 hp
227621..228004 cds 240 240 128 membrane protein
comp 228245..228331 ctg 120 120
comp 228452..228757 cds 102 SelT/SelW/SelH family protein
> 378307..378396 cds 40 40 30 P-hp
378437..378513 cgt 174 174
378688..379500 cds 271 class I SAM-dependent methyltransferase
comp 407277..407435 cds 167 167 53 YqaE/Pmp3 family membrane protein
comp 407603..407678 acg 137 137
comp 407816..408778 cds 321 nitronate monooxygenase
425990..427087 cds 56 56 366 2'-deoxycytidine 5'-triphosphate deaminase
427144..427217 ggg 154 154
427372..428058 cds 229 aquaporin Z
458659..459081 cds 285 285 141 hp
459367..459442 ttc 246 246
comp 459689..460033 cds 115 cation:proton antiporter
comp 493759..494025 cds 155 155 89 hp
494181..494255 acc 195 195
comp 494451..495686 cds 412 flagellin
comp 564938..568684 cds 361 361 1249 PAS domain S-box protein
569046..569122 cac 79 79
569202..570920 cds 573 Ppx/GppA family phosphatase
comp 763448..764356 cds 202 202 303 MBL fold metallo-hydrolase
764559..764633 caa 263 263
comp 764897..766549 cds 551 malate dehydrogenase (quinone)
comp 767020..767439 cds 264 264 140 hp
767704..767780 ccg 159 159
comp 767940..768260 cds 107 hp
comp 960360..960701 cds 163 163 114 hp
960865..960955 agc 500 500
comp 961456..961671 cds 72 hp
1123408..1124136 cds 141 141 243 hp
1124278..1124363 tta 241 241
1124605..1127115 cds 837 copper-translocating P-type ATPase
1154411..1154803 cds 91 91 131 DUF2934 domain-containing protein
comp 1154895..1154969 aac 176 176
1155146..1155424 cds 93 hp
comp 1162767..1163027 cds 138 138 87 hp
comp 1163166..1163242 ccc 218 218
1163461..1163997 cds 179 DUF1269 domain-containing protein
1192452..1194650 cds 660 660 733 esterase-like activity of phytase family protein
comp 1195311..1195386 gta + 446 446
1195833..1195909 gac 2 gac 41 41
1195951..1196027 gac 435 435
1196463..1196828 cds 122 NADH-quinone oxidoreductase subunit A
1421863..1422201 cds 134 134 113 hp
comp 1422336..1422425 tca 88 88
comp 1422514..1422678 cds 55 hp
comp 1468229..1469110 cds 180 180 294 HNH endonuclease
comp 1469291..1469367 atgf 132 132
comp 1469500..1470450 cds 317 hp
comp 1508458..1508883 cds 558 558 142 PAS domain-containing protein
comp 1509442..1509526 ctc 189 189
1509716..1510447 cds 244 lipoyl(octanoyl) transferase LipB
1531160..1531933 cds 447 447 258 amino acid ABC transporter ATP-binding protein
1532381..1532455 gaa 121 121
1532577..1532818 cds 89 89 81 P-hp
1532908..1532982 gaa 129 129
comp 1533112..1534920 cds 603 single-stranded-DNA-specific exonuclease RecJ
1584509..1584763 cds 155 155 85 GlsB/YeaQ/YmgE family stress response membrane protein
1584919..1584994 aag 134 134
comp 1585129..1585575 cds 149 hp
comp 1612420..1613898 cds 240 240 493 trigger factor
comp 1614139..1614221 cta 447 447
< 1614669..1614876 cds 69 P-hp
comp 1672216..1672887 cds 245 245 224 protein-L-isoaspartate O-methyltransferase
comp 1673133..1673206 tgc 240 240
comp 1673447..1673599 cds 51 DUF3309 family protein
comp 1744688..1745434 cds 341 341 249 cytochrome c biogenesis protein CcdA
1745776..1745851 aaa 310 310
1746162..1746743 cds 194 DUF1003 domain-containing protein
comp 1770727..1772280 cds 91 91 518 tyrosine-type recombinase/integrase
comp 1772372..1772448 cca 265 265
1772714..1773019 cds 51 51 102 ETC complex I subunit
1773071..1773147 aga 7 7
comp 1773155..1773892 cds 246 DUF429 domain-containing protein
comp 1902337..1902537 cds 184 184 67 preprotein translocase subunit SecE
comp 1902722..1902797 tgg 241 241
comp 1903039..1903845 cds 269 glycosyltransferase
1908698..1908892 cds 70 70 65 hp
comp 1908963..1909036 gga 26 26 26
comp 1909063..1909147 tac 209 209
1909357..1910244 cds 296 23s rRNA (guanosine(2251)-2'-O)-methyltransferase RlmB
1922447..1922800 cds 55 55 118 hp
comp 1922856..1922931 aca 207 207
1923139..1924878 cds 580 GGDEF domain-containing protein
2079925..2080287 cds 156 156 121 hp
comp 2080444..2080519 atgi 178 178
2080698..2081441 cds 248 SIMPL domain-containing protein
comp 2275632..2276138 cds 522 522 169 winged helix-turn-helix transcriptional regulator
2276661..2276737 cgg 287 287
2277025..2277264 cds 80 hp
comp 2388300..2388497 cds 87 87 66 hp
2388585..2388659 ggc 361 361
2389021..2391024 cds 668 methyl-accepting chemotaxis protein
comp 2490745..2491854 cds 535 535 370 2Fe-2S iron-sulfur cluster binding domain-containing protein
comp 2492390..2492466 atgf 287 115
comp 2492754..2492868 5s 242 2814
comp 2493111..2495924 23s 241 241
> 2496166..2496363 cds 146 146 66 P-hp
comp 2496510..2496585 gca 59 59
comp 2496645..2496721 atc 337
comp 2497059..2498549 16s 105 105 1491
> 2498655..2498930 cds 92 P-hp

agr cumuls[modifier | modifier le wikicode]

cumuls. agr.
opérons Fréquences intercalaires tRNAs Fréquences intercalaires cds Fréquences aas cds chromosome
effectif gammes sans rRNAs avec rRNAs gammes cds gammes cdsd gammes cdsa gammes cdsa 300
avec rRNA opérons 5 1 1 0 1 100 24 1 0
16atcgca235 0 20 50 3 40 200 30 30 1
Id-atgf 5 40 1 100 12 80 300 14 60 3
16s23s 0 60 1 5 150 22 120 400 8 90 17
max a 3 80 200 17 160 500 2 120 13
a doubles 0 100 250 18 200 600 4 150 14
spéciaux 0 120 300 9 240 700 4 180 5
total aas 15 140 350 4 280 800 1 210 1
sans opérons 38 160 400 2 320 900 1 240 3
1 aa 35 180 450 3 360 1000 0 270 7
max a 3 200 500 1 400 1100 0 300 4
a doubles 1 2 6 1 21
total aas 42 4 5 97 0 89 89
total aas 57
remarques 2
avec jaune moyenne 59 213 230
variance 0 134 209
sans jaune moyenne 33 172 185 137
variance 76 131 71

agr blocs[modifier | modifier le wikicode]

  • Lien tableur: agr blocs
  • Légende:
    CoA   acetyl-CoA carboxylase biotin carboxyl carrier protein subunit
    helicase  DNA helicase RecQ
    2Fe-2S  2Fe-2S iron-sulfur cluster binding domain-containing protein
    membrane  membrane protein
    hp    hypothetical protein
    p-hp   pseudo hp
A6. agr, blocs à rRNA.
chromomel intercal cdsa intercal cdsa intercal cdsa
cds 105 108 hp 105 111 hp 105 84 P-hp
16s 337 1491 337 1491 337 1491
atc 59 59 59
gca 146 146 146
cds 241 66 P-hp 241 66 P-hp 241 66 P-hp
23s 242 2814 242 2814 242 2814
5s 257 115 257 115 257 115
atgf 311 203 633
cds 145 CoA 64 hp 136 membrane
chromosomec
cds 105 92 P-hp 105 92 P-hp
16s 337 1491 337 1491
atc 59 59
gca 146 146
cds 241 66 P-hp 241 66 P-hp
23s 242 2814 242 2814
5s 257 115 287 115
atgf 196 535
cds 603 helicase 370 2Fe-2S

agr remarques[modifier | modifier le wikicode]

  • Remarques
    1. @: Par rapport aux rickettsia rtb et rpl, les intercalaires élevés sont rares et faibles, 6 sur 38 aas sont entre 500 et 793. Voir tableau ci-dessous.
      - un seul aa isolé, gta , 660-446.
      - 2 intercalaires élevés entre 2 aas, ggc-atgi 793 et gta-gac 446. Le 1er est du même ordre que celui de rtb et rpl, 1051 830.
      - Les intercalaires entre aas: Il y en a quatre comme les rickettsia, 793 446 41 26. Les 2 petits sont proches de la moyenne de cette étude de 15 pbs.
      - Les intercalaires avec un cds. Ils sont très faibles sur les 38 aas un seul atteint 660 pbs les autres élevés se répartissent en 4 entre 500-558 et 3 entre 435-447. Ces valeurs sont analogues à ceux des blocs à rRNA, 535 et 633 tout à fait courants dans le haut de gamme de cette étude. Les 30 aas restants ont des intercalaires cds inférieurs à 400 dont 3 seulement dépassent les 300, cac aaa ggc.
    2. @ Les cds dans les blocs à rRNAs. Voir agr blocs.
    - Les 5 blocs sont identiques qu’ils soient sur le chromosome linéaire ou circulaire. C’est comme une duplication répétée 5 fois.
    - Le cds interne a toutes les caractéristiques d’un candidat à la création: interne, hypothétique et petit. La caractéristique pseudo est encore un indice très fort de la genèse, la séquence acquiera plus tard le codon initial et le codon stop ou tout autre complément imposé par le système de réparation contraint par l’évolution de l’environnement du génome.
    - On retrouve la situation du génome oan, avec un p-hp de 63 aas contre 66 ici. Ces 2 génomes se ressemblent beaucoup,
    + DNAa total identique oan et agr 4,8 mega, 2 chromosomes dont 1 linéaire pour agr. Tous les blocs se terminent par atgf et sont complets.
    + Beaucoup de cds hp externes.
    - Chez agr, 5 hp dont 3 p-hp au-dessus de 16s de la même taille que le p-hp interne. Ils se comportent comme lui, quasimment même petite taille et des intercalaires identiques de 105 pbs. Ces 10 cds font partie intégrante du processus de réparation ou de conversion qui a créé les 5 blocs. Après 5s 3 cds de petites tailles dont un hpcomme ceux au-dessus du 16s. Donc 2 cds bien caractérisés se comportant comme le p-hp interne candidat à la création. Cependant ces 3 cds apparemment ne font pas partie intégrante du processus de conversion puisque leurs intercalaires avec atgf varient beaucoup de 203 à 633, comme les 2 restant.
    - Chez oan seulement 2 cds de 57 aas sur un total de 8 cds. Ils sont bien caractérisés.
    - La question qui se pose alors est : est-ce que ces 10 cds analogues aux internes peuvent ils être des candidats à la création?
  • Séquence des doubles: très peu de doubles, 1 doublets pour 38 opérons à aas.
  • Tableau des intercalaires élevés
aas	adresse	pbs	note
ggc	1179371	793	aa-aa
gta	1195311	660-446	isolé
ctc	1509442	558	
gtc	1363497	554	
cgg	2276661	522	
agc	960865	500	
gaa	1532381	447	
cta	1614139	447	
gac	1195833	446	aa-aa
gac	1195951	435	
			
cac	569046	361	
aaa	1745776	341-310	
ggc	2388585	361	
			
atgf	2492390	535	5s-aa
atgf	2109563	633	5s-aa

Aureimonas sp. AU20[modifier | modifier le wikicode]

aua opérons[modifier | modifier le wikicode]

  • Lien tableur: aua opérons
  • Liens: gtRNAdb [], NCBI [27], génome [orgn], pau20rrn [28]
  • Phylogénie: Bacteria; Proteobacteria; Alphaproteobacteria; Rhizobiales; Aurantimonadaceae; Aureimonas.
  • Légende: cdsa: cds aas, cdsd: cds dirigé
A1. Aureimonas sp. AU20
67%GC 8.8.19 Paris  55   doubles intercal cds aa avec aa cdsa cdsd protéines
pAU20rrn
324..1028 CDS rep 461 235 replication initiation protein
comp 1490..1604 5s @1 82 115
comp 1687..4515 23s -15 2829
comp 4501..4851 CDS hp 142 117 hp
comp 4994..5069 gca 33 33
comp 5103..5179 atc 233
comp 5413..6898 16s 1752 1486
comp 8651..9109 CDS hp 153 hp
Chromosome
comp 170900..171925 CDS 368 368 342
172294..172378 ctg 130 130 130
172509..172772 CDS 88
comp 330094..330690 CDS 338 338 199
331029..331103 ggc @2 404 404
comp 331508..331584 atg + 44 44
comp 331629..331705 atg 2 atg 255 255 255
comp 331961..333217 CDS 419
344949..346025 CDS 589 589 359 589
346615..346704 tcg 609 609
347314..348471 CDS 386
comp 393335..395356 CDS 800 800 674
comp 396157..396232 gcc 439 439 439
comp 396672..397094 CDS 141
635177..637537 CDS 640 640 787
comp 638178..638253 gcg 182 182 182
638436..638738 CDS 101
comp 924507..925466 CDS 529 529 320
comp 925996..926085 tcc 349 349 349
926435..926767 CDS 111
1216789..1217439 CDS 60 60 217 60
1217500..1217576 agg 68 68
comp 1217645..1218760 CDS 372
1350534..1352180 CDS @4 -30 -30 549
comp 1352151..1352227 cgt + 51 51
comp 1352279..1352355 cgt 2 cgt 169 169
comp 1352525..1353967 CDS 481
1401921..1402442 CDS 142 142 174 142
1402585..1402661 cac 585 585
1403247..1404875 CDS 543
1544580..1546277 CDS 455 455 566
comp 1546733..1546808 ttc @2 161 161
1546970..1547044 acc 414 414 414
1547459..1549516 CDS 686
1609269..1610216 CDS 278 278 316
comp 1610495..1610571 cgg 121 121 121
comp 1610693..1611427 CDS 245
> 1683255..1683581 CDS 209 209 109 209
comp 1683791..1683864 cag 580 580
1684445..1685734 CDS 430
1700827..1701852 CDS 300 300 342
comp 1702153..1702227 gtc + 128 128
comp 1702356..1702430 gtc 3 gtc 186 186
comp 1702617..1702691 gtc 68 68 68
comp 1702760..1703125 CDS 122
1946715..1946936 CDS 6 6 74 6
comp 1946943..1947018 atgi 105 105
1947124..1947345 CDS 74
1981934..1983139 CDS 139 139 402 139
1983279..1983368 agc 825 825
1984194..1985339 CDS 382
1996083..1997171 CDS 243 243 363
comp 1997415..1997490 acg 112 112 112
comp 1997603..1998583 CDS 327
comp 2263930..2264781 CDS 30 30 284 30
comp 2264812..2264886 gtg 111 111
comp 2264998..2265768 CDS 257
2363764..2364786 CDS 18 18 341 18
comp 2364805..2364879 gaa + 140 140
comp 2365020..2365094 gaa 2 gaa 69 69 69
comp 2365164..2366144 CDS 327
2367774..2368247 CDS 105 105 158
2368353..2368429 cca @3 43 43 43
2368473..2368778 CDS 36 36 102 36
2368815..2368890 aga 448 448
2369339..2369929 CDS 197
comp 2401620..2402732 CDS 155 155 371 155
comp 2402888..2402963 aaa 169 169
2403133..2403870 CDS 246
2419689..2420852 CDS 13 13 388 13
2420866..2420955 tca 238 238
2421194..2421934 CDS 247
comp 2601493..2601858 CDS 287 287 122 287
comp 2602146..2602222 gac + 58 58
comp 2602281..2602357 gac 2 gac 270 270
2602628..2602703 gta @2 330 330
comp 2603034..2603312 CDS 93
comp 2608494..2609852 CDS 73 73 453 73
comp 2609926..2610009 cta 307 307
2610317..2610460 CDS 48
comp 2641174..2641824 CDS @3 125 125 217 125
comp 2641950..2642023 tgc 153 153
comp < 2642177..2642443 CDS 296 296 89
2642740..2642814 aac 269 269 269
2643084..2644127 CDS 348
comp 2651145..2652935 CDS 239 239 597 239
2653175..2653259 tta 265 265
2653525..2653725 CDS 67
comp 2749758..2750318 CDS 3102 3102 187
comp 2753421..2753497 atg 83 83 83
comp 2753581..2754180 CDS 200
2768127..2769224 CDS 63 63 366 63
comp 2769288..2769364 ccg @2 173 173
2769538..2769612 caa 528 528
comp 2770141..2770566 CDS 142
comp 2787112..2788920 CDS 217 217 603 217
comp 2789138..2789214 ccc 265 265
comp 2789480..2790022 CDS 181
2927857..2928789 CDS 136 136 311 136
comp 2928926..2929010 ctc + 132 132
comp 2929143..2929227 ctc 2 ctc 175 175
2929403..2930164 CDS 254
comp 2971057..2971257 CDS 130 130 67
comp 2971388..2971463 tgg 53 53 53
comp 2971517..2972374 CDS 286
comp 2973322..2974497 CDS 291 291 392
comp 2974789..2974862 gga 24 24
comp 2974887..2974971 tac 259 259 259
2975231..2976097 CDS 289
comp 2979955..2981049 CDS 221 221 365
2981271..2981346 aca 55 55 55
comp 2981402..2981752 CDS 117
comp 3063743..3064045 CDS 106 106 101 106
comp 3064152..3064227 aag 147 147
comp 3064375..3064803 CDS 143
comp 3194307..3194906 CDS 249 249 200
3195156..3195232 atg 173 173 173
3195406..3196356 CDS 317
comp 3206006..3206455 CDS 743 743 150
comp 3207199..3207273 gag 50 50 50
comp 3207324..3207689 CDS 122
3398165..3399901 CDS 554 554 579
3400456..3400530 aac 115 115 115
3400646..3400924 CDS 93
3401737..3403497 CDS 227 227 587
comp 3403725..3403799 ggc 208 208
comp 3404008..3404082 ggg 74 74 74
comp 3404157..3404819 CDS 221
comp 3597872..3598414 CDS 370 370 181
3598785..3598869 ttg 151 151 151
comp 3599021..3599251 CDS 77

aua cumuls[modifier | modifier le wikicode]

cumuls. aua. Aureimonas sp. AU20
opérons Fréquences intercalaires tRNAs Fréquences intercalaires cds Fréquences aas cds chromosome
effectif gammes sans rRNAs avec rRNAs gammes cds gammes cdsd gammes cdsa gammes cdsa 300
avec rRNA opérons 1 1 0 - 1 1 1 0 100 10 1 0
16 aas 23 5s 0 20 0 50 7 40 7 200 22 30 0
16 atc gca hp 1 40 1 100 10 80 9 300 11 60 1
16 cds 23 5s 0 60 3 150 14 120 9 400 20 90 7
max a 2 80 0 200 8 160 4 500 5 120 8
a doubles 0 100 0 250 8 200 3 600 6 150 7
spéciaux 0 120 0 300 10 240 4 700 3 180 2
total aas 2 140 3 350 4 280 1 800 1 210 7
sans opérons 38 160 0 400 2 320 900 0 240 3
1 aa 26 180 2 450 3 360 2 1000 0 270 5
max a 3 200 1 500 1 400 1100 0 300 3
a doubles 6 3 12 1 0 35
total aas 53 13 0 80 40 78 78
total aas 55
remarques 4
avec jaune moyenne
variance
sans jaune moyenne 131 226 153 235 158
variance 75 165 128 125 69

aua blocs[modifier | modifier le wikicode]

A1. aua, blocs à rRNA du 8.8.19.
CDS 1752 153 hp
16s 233 1486
atc 33
gca 142
CDS -15 117 hp
23s 82 2829
5s 461 115
CDS 235 replication initiation protein

aua remarques[modifier | modifier le wikicode]

A1. aua, blocs à rRNA du 6.1.20.
324..1028 cds 461 235 replication initiation protein
comp 1490..1604 5s 82 115
comp 1687..4515 23s -6 2829
4510..4740 cds 253 77 hp
comp 4994..5069 gca 33
comp 5103..5179 atc 236
comp 5416..6898 16s 718 1483
comp 7617..8363 cds 287 249 hp
comp 8651..9178 cds 176 excisionase family DNA-binding protein
  • Remarques: Le seul génome de cette étude dont l’unique bloc rRNA est dans un tout petit plasmide de 9 kpbs pour un chromosome circulaire de 3 742 793 pbs.
    1. @ Une protéine candidate à la création est dans le bloc rRNA, hp, petite taille de 77 aas avec un intercalaire négatif avec 23s (voir prélèvement du 6.1.20 ci-dessus)
    2. @ Des intercalaires entre aas très élevés par rapport aux clusters à plusieurs aas étudiés. Trois très élevés au-delà de 200 pbs, 44 270 208, trois supérieurs à 160, 161 173 186. Alors que la moyenne des autres génomes est autour de 15 pbs.
    3. @ A l’adresse 2367774, deux aas séparés par un cds à très faibles intercalaires, 43 et 36 pbs. Le cds a une taille de 102 aas. Est-ce un candidat à la création? La même situation se retrouve à l’adresse 2641174, avec des intervals moyens, 153 2936 mais le cds a encore une taille plus petite 89 aas.
    4. @ Un intercalaire négatif qui souligne surtout la proximité d’un aa et d’un cds se trouvant sur 2 brins différents. Ceci est du certainement aux processus de conversion génique qui agissent sur les blocs à rRNA, ici ceux-là ont disparus laissant cette configuration. Les 2 cds entourant les 2 aas sont énormes, 500 aas environs, et ne sont donc pas candidats à la création.
  • Note: En séparant les tRNAs des 2 clusters du @3 le spectre des blocs sans rRNA est le suivant
	aas   effectif	total
	1	30	30
	2	7	14
	3	3	9
total aas		53
  • Séquences des doubles: La caractéristique principale des doublons pour ce génome est la grandeur de leurs inteercalaires. Les blocs à doublons se répartissent en
    - 3 blocs à 2 aas doubles, cgt gaa ctc, séparés entre eux par respectivement, 51 140 132 pbs.
    - 2 blocs à 3 aas dont un doublet chacun, ggc atg atg et gta gac gac, avec respectivement entre les doubles 44 et 58 pbs
    - 1 bloc avec un triplet gtc avec les intercalaires de 128 186 pbs.