Aller au contenu

Recherche:Les clusters de gènes tRNA et rRNA chez les procaryotes/Annexe/alpha

Une page de Wikiversité, la communauté pédagogique libre.
alpha
Image logo représentative de la faculté
Annexe 2
Recherche : Les clusters de gènes tRNA et rRNA chez les procaryotes
Précédent :gamma
Suivant :bacilli
En raison de limitations techniques, la typographie souhaitable du titre, « Annexe : alpha
Les clusters de gènes tRNA et rRNA chez les procaryotes/Annexe/alpha
 », n'a pu être restituée correctement ci-dessus.



Rickettsia typhi str. B9991CWPP

rtb opérons

  • Liens: gtRNAdb [1], NCBI [2], génome [3]
  • Lien tableur: rtb opérons
  • Phylogénie: Bacteria; Proteobacteria; Alphaproteobacteria; Rickettsiales; Rickettsiaceae; Rickettsieae; Rickettsia; typhus group.
  • Légende: cdsa: cds aas, cdsd: cds dirigé
A8. Rickettsia typhi str. B9991CWPP
29%GC 31.12.19 Paris  33   doubles intercal cds aa avec aa cdsa cdsd protéines
comp 7429..8469 cds 381 381 347 UDP-3-O-(3-hydroxymyristoyl)glucosamine N-acyltransferase
comp 8851..8926 ttc 368 368
9295..10278 cds 328 tRNA dihydrouridine synthase DusB
14663..18055 cds 108 108 1131 autotransporter outer membrane beta-barrel domain-containing protein
18164..18238 gaa 1394 1394
comp 19633..20106 cds 158 crossover junction endodeoxyribonuclease RuvC
comp 48065..48709 cds 278 278 215 YihA family ribosome biogenesis GTP-binding protein
comp 48988..49064 atgf 110 110
comp 49175..49411 cds 79 50S ribosomal protein L31
comp 73627..73929 cds 17 17 101 preprotein translocase subunit SecG
comp 73947..74021 acc 139 139
comp 74161..75417 cds 419 MFS transporter
155064..157163 cds 143 143 700 elongation factor G
157307..157382 tgg 167 167
157550..157750 cds 67 preprotein translocase subunit SecE
189197..189400 cds 889 889 68 DUF2674 domain-containing protein
comp 190290..190365 acg 142 142
comp 190508..192814 cds 769 outer membrane protein assembly factor BamA
255010..255921 cds 732 732 304 methionyl-tRNA formyltransferase
256654..259439 23s 206 2786
259646..259760 5s 173 173 115
comp 259934..261007 cds 358 cell division protein ZapE
291358..291843 cds 35 35 162 30S ribosomal protein S9
291879..291955 atgj 1364 1364
comp 293320..293805 cds 162 RNA pyrophosphohydrolase
335194..336996 cds 402 402 601 elongation factor 4
337399..337473 aac 633 633
comp 338107..338793 cds 229 hp
comp 440466..440933 cds 496 496 156 DUF2155 domain-containing protein
441430..441504 tgc 31 31
441536..442456 cds 307 site-specific tyrosine recombinase XerD
comp 469056..469781 cds 218 218 242 3-deoxy-manno-octulosonate cytidylyltransferase
470000..470075 aaa 15 15
470091..470167 atc 1922 1922
472090..472662 cds 191 GTP cyclohydrolase I FolE
comp 564534..565562 cds 1530 1530 343 type 2 isopentenyl-diphosphate Delta-isomerase
comp 567093..567180 tcc 218 218
comp 567399..568145 cds 249 NTP transferase domain-containing protein
583250..584149 cds 1278 1278 300 hydroxymethylbilane synthase
comp 585428..585518 tca 58 58
comp 585577..586569 cds 331 tryptophan--tRNA ligase
598723..599706 cds 26 26 328 polyprenyl synthetase family protein
599733..599809 cgg 60 60
comp 599870..599944 caa 62 62
comp 600007..601779 cds 591 aminopeptidase P family protein
comp 644357..644745 cds 499 499 130 p-ribosome-associated translation inhibitor RaiA
645245..645321 gac @1 1051 1051
comp 646373..646448 gcc 222 222
comp 646671..647276 cds 202 ATP-dependent Clp endopeptidase proteolytic subunit ClpP
comp 649389..650048 cds 452 452 220 (d)CMP kinase
650501..650577 gtc 1274 1274
comp 651852..652094 cds 81 HU family DNA-binding protein
comp 696163..697398 cds 1535 1535 412 tyrosine--tRNA ligase
698934..699010 cgt 1028 1028
700039..705720 cds 1894 alpha-2-macroglobulin family protein
comp 727560..728087 cds 1164 1164 176 copper chaperone Pcu(A)C
comp 729252..729326 gca 32 32
comp 729359..729574 cds 72 hp
739215..740075 cds 181 181 287 TIGR01459 family HAD-type hydrolase
740257..740343 ctc 246 246
740590..741960 cds 1199 1199 457 magnesium transporter
743160..743234 ggc 1090 1090
744325..744753 cds 143 preprotein translocase subunit YajC
comp 775944..777866 cds 2465 2465 641 hp
comp 780332..781831 16s 1854 1854 1500
comp 783686..785485 cds 600 PAS domain-containing sensor histidine kinase
comp 814590..814823 cds 349 349 78 hp
comp 815173..815248 gta 68 68
comp 815317..815589 cds 91 30S ribosomal protein S20
comp 829300..830484 cds 82 82 395 elongation factor Tu
comp 830567..830640 gga 95 95
comp 830736..830821 tac 183 183
831005..831733 cds 243 23s rRNA (guanosine(2251)-2'-O)-methyltransferase RlmB
839841..839969 cds 145 145 43 dimethyladenosine transferase
840115..840200 tta 2009 2009
842210..842446 cds 79 hp
comp 876906..877589 cds 401 401 228 7-cyano-7-deazaguanine synthase QueC
877991..878067 cac 145 145
878213..879943 cds 577 ATP-binding cassette domain-containing protein
918938..919882 cds 951 951 315 ACP S-malonyltransferase
920834..920925 agc 1945 1945
comp 922871..924049 cds 393 acetyl-CoA C-acetyltransferase
comp 961209..962297 cds 41 41 363 YjgP/YjgQ family permease
comp 962339..962415 atgi 390 390
comp 962806..963273 cds 156 peptidoglycan-associated lipoprotein Pal
1023375..1023626 cds 1585 1585 84 BolA family transcriptional regulator
1025212..1025288 cca 17 17
1025306..1025521 cds 72 translation initiation factor IF-1
1053321..1054139 cds 2191 2191 273 alpha/beta hydrolase
comp 1056331..1056407 aga 98 98
1056506..1056823 cds 106 DUF167 domain-containing protein
comp 1098776..1099240 cds 40 40 155 DNA polymerase III subunit chi
comp 1099281..1099365 cta 145 145
comp 1099511..1100662 cds 384 succinyl-diaminopimelate desuccinylase
comp 1102351..1102980 cds 475 475 210 lipoyl(octanoyl) transferase LipB
comp 1103456..1103530 aca 130 130
comp 1103661..1103996 cds 112 30S ribosomal protein S16

rtb cumuls

  • Lien tableur: rtb cumuls
  • Légende
  • Notes: moyenne et variance des intercalaires élevés des 21 cds : 1430 et 491
cumuls. rtb.
opérons Fréquences intercalaires tRNAs Fréquences intercalaires cds Fréquences aas cds chromosome
effectif gammes sans rRNAs avec rRNAs gammes cds gammes cdsd gammes cdsa gammes cdsa 300
avec rRNA opérons 2 1 - 1 0 1 100 11 30 0
23s5s 1 20 1 50 8 40 200 13 60 1
16s 1 40 100 5 80 300 12 90 9
16s23s 0 60 1 150 9 120 400 13 120 4
max a 0 80 200 4 160 500 3 150 2
a doubles 0 100 1 250 4 200 600 3 180 7
spéciaux 0 120 300 1 240 700 3 210 3
total aas 0 140 350 1 280 800 1 240 4
sans opérons 29 160 400 3 320 900 0 270 3
1 aa 25 180 450 2 360 1000 0 300 3
max a 2 200 500 4 400 1100 0 330 5
a doubles 0 1 21 2 20
total aas 33 4 0 62 0 61 61
total aas 33
remarques 1
avec jaune moyenne 612 310
variance 665 291
sans jaune moyenne 57 193 269 176
variance 40 148 176 86

rtb blocs

A8. rtb, blocs à rRNA.
cds 732 304 methionyl-tRNA formyltransferase
23s 206 2786
5s 173 115
cds 358 cell division protein ZapE
cds 2465 641 hp
16s 1854 1500
cds 600 PAS domain-containing sensor histidine kinase

rtb remarques

  • Remarques: Les rickettia, rtb et rpl, présentent de nombreux intercalaires très élevés. D’où cet intercalaire @1 entre 2 aas de 1051 pbs. Je détaille ici les intercalaires du tableau des cumuls.
    - Les intercalaires entre aas: Il y a quatre intercalaires de ce type, 1051 95 60 15. A part le 1er les 3 autres sont courants dans cette étude et seulement le dernier est le rprésentant de la moyenne dans cette étude.
    - Les intercalaires avec un cds. Les 31 blocs de ce génomes se répartissent en 3 groupes
    1. Les RNAs complètement isolés, les 2 intercalaires du bloc sont supérieurs à 400 pbs. Il y a 6 aas dont celui avec 1051, plus le 16s. Sur ces 14 intercalaires 10 sont supérieurs à 900 et 4 entre 400 et 600 pbs.
    2. Les tRNAs proches de leurs 2 cds. Il y a 6 aas dont les 2 intercalaires sont inférieurs à 300 pbs et 4 aas dont au moins un des 2 intercalaires est entre 300 et 400 pbs et l'autre inférieur à 300 pbs.
    3. Il reste 14 blocs dont le 23s5s, auxquels il faut ajouter l’aa gcc voisin du gac isolé par 1051. Ces blocs sont très polarisés, leurs 2 intercalaires sont très dissymétriques.
      - 11 aas ont leur intercalaire majeur supérieur à 900 et va jusqu’à 2465 pbs. Le 23s5s a un intercalaire majeur modéré et assez courant pour les blocs à rRNAs.
      - 3 aas ont leur intercalaire majeur de 450 pbs environ.
  • Les blocs isolés et les blocs entourés par 2 cds.
				
	Blocs à RNAs isolés par 2 intercalaires de plus de 400 pbs.					
	bloc	adresse			Blocs entourés par 2 intercalaires de 300 à 400 pbs	
	aac	337399			ttc	8851
	gac	645245			gta	815173
	gtc	650501			cac	877991
	cgt	698934			atgi	962339
	ggc	743160				
	16s	780332			Blocs entourés par 2 intercalaires inférieurs à 300 pbs	
	agc	920834			atgf	48988
	:	:			acc	73947
	:	:			tgg	157307
	:	:			cgg-caa	599733
	:	:			gga-tac	830567
	:	:			cta	1099281
  • Les séquences des doubles: Il n'y a aucun double dans ce génome

rtb distribution

Al1 rtb, Rickettsia typhi str. B9991CWPP. alpha.
g1    t1       
atgi 1 tct tat atgf 1
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc 1 tcc 1 tac 1 tgc 1
atc 1 acc 1 aac 1 agc 1
ctc 1 ccc cac 1 cgt 1
gtc 1 gcc 1 gac 1 ggc 1
tta 1 tca 1 taa tga
ata aca 1 aaa 1 aga 1
cta 1 cca 1 caa 1 cga
gta 1 gca 1 gaa 1 gga 1
ttg tcg tag tgg 1
atgj 1 acg 1 aag agg
ctg ccg cag cgg 1
gtg gcg gag ggg
alpha >1aa =1aa -5s +5s -16s +16s total
rtb 6 27 33

rtb intercalaires entre cds

  • Rickettsia typhi str. B9991CWPP, 7.12.2020, NCBI [4]
  • Note: Pour les génomes des annexes j'ai relevé les intercalaires entre tRNAs et entre ceux-ci et les cds qui leur sont adjacents. L'exemple est celui de rru du clade alpha. L'idée de départ de ces prélèvements est la recherche d'opérons formés de tRNA et de protéine comme dans le cas d'E.coli: l'intercalaire entre le tRNA et la protéine devrait être faible. Voir l'exemple d'eco (remarque @3) avec tac-tac-tpr et aca-tac-gga-acc-tufB.

rtb les fréquences

  • Lien tableur: rtb intercalaires entre cds
  • Légende:   long, longueur en pbs,   intercal pour intercalaire
    - fréquence-1 1 5 6 f, respectivement fréquence des intercalaires négatives à l'unité, positives à l'unité, par blocs de 5, par blocs de 10 jusqu'à 600 pbs et f pour finales. Ces fréquences servent à faire les diagrammes. La fréquence fréquencez est l'étendue à 1200 de la fréquence6 pour certains grands génomes.
    - cumul,% colonne à la droite de frequence6, reprend les fréquences par plages et leurs pourcentages indiqués déjà dans la 1ère partie du tableau.
    - La couleur cyan des fréquences fréquence-1 et 1 sert à montrer leur périodicité ternaire.
    - intercaln intercalx, pour les intercalaires négatifs minimaux et intercalaires positifs maximaux.
    - colonne ADN pour la longueur totale du génome en pbs et intercals pour le total en pbs des intercalaires entre cds uniquement, d'après la méthode des prélèvements de NCBI du 7.12.20.
rtb Les fréquences des intercalaires entre cds
rtb intercalaires total % intercalaires moyenne ecartype plage ADN intercal frequence5 intercal fréquencez
négatif 102 12.9 négatif -11 10 -50 à -1 1 112 957 -1 102 610 1
zéro 5 0.6 intercals 0 5 620 2
1 à 200 430 54.2 0 à 200 85 61 224 467 5 42 630 1
201 à 370 84 10.6 201 à 370 261 43 20.2% 10 24 640 3
371 à 600 52 6.6 371 à 600 481 63 15 24 650 2
601 à max 120 15.1 601 à 1028 1173 515 20 16 660 3
total 793 <201 67.7 total 793 282 445 -50 à 3216 25 12 670 0
adresse intercalx intercal fréquence1 intercal fréquence6 cumul,% intercal fréquence-1 30 6 680 7
665700 3216 -1 102 -70 0 0 5 35 7 690 0
1032528 3065 0 5 -60 0 -1 10 40 8 700 1
506416 2624 1 10 -50 1 -2 1 45 2 710 1
64385 2360 2 7 -40 1 -3 0 50 8 720 2
801292 2313 3 8 -30 5 min à -1 -4 33 55 5 730 2
272796 2262 4 13 -20 12 102 -5 0 60 8 740 0
131965 2171 5 4 -10 21 12.9% -6 0 65 10 750 1
763244 2078 6 5 0 67 -7 2 70 12 760 1
101695 2071 7 3 10 66 -8 16 75 9 770 2
446016 1893 8 7 20 40 -9 0 80 12 780 2
905133 1870 9 7 30 18 -10 1 85 9 790 0
141270 1858 10 2 40 15 1 à 100 -11 2 90 4 800 1
570117 1846 11 6 50 10 243 -12 0 95 10 810 3
129767 1794 12 5 60 13 30.6% -13 3 100 15 820 0
378376 1765 13 3 70 22 -14 7 105 11 830 4
232652 1743 14 5 80 21 -15 0 110 12 840 0
871293 1715 15 5 90 13 -16 1 115 10 850 1
998041 1656 16 6 100 25 -17 7 120 10 860 1
359936 1637 17 1 110 23 -18 0 125 13 870 0
1014216 1621 18 3 120 20 -19 0 130 8 880 1
847537 1581 19 3 130 21 -20 2 135 16 890 1
338816 1539 20 3 140 26 -21 0 140 10 900 1
808693 1532 21 2 150 17 -22 1 145 10 910 2
950532 1524 22 2 160 17 1 à 200 -23 3 150 7 920 1
969491 1524 23 1 170 21 430 -24 0 155 8 930 1
706435 1485 24 4 180 16 54% -25 1 160 9 940 1
536071 1468 25 3 190 15 -26 5 165 12 950 3
638208 1464 26 2 200 11 -27 0 170 9 960 0
597131 1463 27 0 210 7 100 175 9 970 0
544938 1446 28 2 220 7 reste 7 180 7 980 1
235220 1444 29 2 230 11 total 107 185 8 990 0
90984 1401 30 0 240 8 190 7 1000 1
693395 1374 31 0 250 9 intercal fréquencef 195 6 1010 1
422301 1373 32 3 260 9 0 à 200 600 673 200 5 1020 1
678698 1370 33 3 270 6 435 650 9 205 3 1030 1
476675 1354 34 0 280 3 700 11 210 4 1040 1
1079428 1335 35 1 290 6 750 6 215 3 1050 2
270767 1318 36 1 300 1 800 6 220 4 1060 2
687447 1302 37 2 310 3 850 8 225 5 1070 1
49408 1282 38 0 320 3 900 4 230 6 1080 1
247450 1266 39 2 330 2 950 8 235 5 1090 0
398128 1260 40 3 340 2 1000 2 240 3 1100 0
577310 1255 reste 547 350 3 1050 6 245 6 1110 2
676898 1227 total 793 360 2 201 à 370 1100 4 250 3 1120 2
425653 1184 370 2 84 1150 7 255 5 1130 1
915284 1182 380 0 10.6% 1200 5 260 4 1140 0
390 1 1250 1 265 4 1150 2
400 5 1300 4 270 2 1160 0
410 4 1350 3 275 1 1170 2
420 3 1400 4 280 2 1180 1
adresse intercaln décalage long 430 2 1450 3 285 3 1190 2
384083 -50 comp 440 2 1500 4 290 3 1200 0
523034 -41 shift2 646 450 3 1550 4 295 1 reste 44
362986 -38 shift2 850 460 2 1600 1 300 0 total 793
864784 -38 shift2 2407 470 1 1650 2 305 3
628502 -35 shift2 571 480 2 1700 1 310 0
1068153 -35 comp 490 3 1750 2 315 1
1110540 -32 shift2 997 500 3 1800 2 320 2
511489 -26 510 4 371 à 600 1850 1 325 2
661241 -26 520 3 52 1900 3 330 0
710083 -26 530 3 6.6% 1950 0 335 1
899806 -26 540 0 2000 0 340 1
1089393 -26 550 0 2050 0 345 2
417665 -25 560 3 2100 2 350 1
276966 -23 570 3 2150 0 355 1
480829 -23 580 1 601 à max 2200 1 360 1
981350 -23 590 1 120 114 365 1
110015 -22 600 3 15.1% 370 1
415433 -20 reste 120 reste 6 reste 172
748256 -20 total 793 total 793 total 793

rtb autres intercalaires

  • Lien tableur: rtb autres intercalaires
  • Légende:  
    - comp, le gène est sur le brin complement
    - deb, fin sont respectivement dans le sens des adresses croissantes, le cds avant le 1er tRNA et le cds après le dernier tRNA du bloc.
rtb Les autres intercalaires.
rtb1 adresses1
deb-fin gènes adresses intercal sens
deb CDS 7429 381 comp
tRNA 8851 368 comp
fin CDS 9295
deb CDS 14663 108
tRNA 18164 1394
fin CDS 19633 comp
deb CDS 48065 278 comp
tRNA 48988 110 comp
fin CDS 49175 comp
deb CDS 73627 17 comp
tRNA 73947 139 comp
fin CDS 74161 comp
deb CDS 155064 143
tRNA 157307 167
fin CDS 157550
deb CDS 189738 411
tRNA 190290 142 comp
fin CDS 190508 comp
deb CDS 255010 736
23s rRNA 256658 228
5s rRNA 259646 173
fin CDS 259934 comp
deb CDS 291358 35
tRNA 291879 1364
fin CDS 293320
deb CDS 335194 402
tRNA 337399 633
fin CDS 338107 comp
deb CDS 440466 496 comp
tRNA 441430 31
fin CDS 441536
deb CDS 469056 218 comp
tRNA 470000 15
tRNA 470091 1922
fin CDS 472090
rtb2 adresses2
deb-fin gènes adresses intercal sens
deb CDS 564534 1530 comp
tRNA 567093 218 comp
fin CDS 567399 comp
deb CDS 583250 1278
tRNA 585428 58 comp
fin CDS 585577 comp
deb CDS 598723 26
tRNA 599733 60
tRNA 599870 62 comp
fin CDS 600007 comp
deb CDS 608541 176 comp
ncRNA 609386 248 comp
fin CDS 610018
deb CDS 644395 499 comp
tRNA 645245 1051
tRNA 646373 222 comp
fin CDS 646671 comp
deb CDS 649389 452 comp
tRNA 650501 1274
fin CDS 651852 comp
deb CDS 696163 1535 comp
tRNA 698934 1028
fin CDS 700039
deb CDS 727560 1164 comp
tRNA 729252 32 comp
fin CDS 729359 comp
deb CDS 739215 181
tRNA 740257 246
deb CDS 740590 1199
tRNA 743160 1090
fin CDS 744325
deb CDS 775944 2466 comp
16s rRNA 780333 1854 comp
fin CDS 783686 comp
deb CDS 814590 349 comp
tRNA 815173 68 comp
fin CDS 815317 comp
rtb3 adresses3
deb-fin gènes adresses intercal sens
deb CDS 829300 82 comp
tRNA 830567 95 comp
tRNA 830736 183 comp
fin CDS 831005
deb CDS 839520 382
tRNA 840115 2009
fin CDS 842210
deb CDS 876906 401 comp
tRNA 877991 145
fin CDS 878213
deb CDS 911079 179 comp
tmRNA 911738 74 comp
fin CDS 912362
deb CDS 918938 951
tRNA 920834 1945
fin CDS 922871 comp
deb CDS 941489 156 comp
ncRNA 942887 9 comp
fin CDS 943055 comp
deb CDS 961209 41 comp
tRNA 962339 390 comp
fin CDS 962806 comp
deb CDS 1023375 1585
tRNA 1025212 17
fin CDS 1025306
deb CDS 1053321 2191
tRNA 1056331 98 comp
fin CDS 1056506
deb CDS 1090984 14
ncRNA 1091640 152
fin CDS 1091886
deb CDS 1098776 40 comp
tRNA 1099281 145 comp
fin CDS 1099511 comp
deb CDS 1102351 475 comp
tRNA 1103456 130 comp
fin CDS 1103661 comp

rtb intercalaires tRNA

  • Lien tableur: rtb intercalaires tRNA
  • Légende:
    - comp', l'intercalaire est entre un gène comp (sur le complément) et un gène sur le brin direct. Continu les 2 gènes sont sur le même brin.
    - deb, fin sont les intercalaires des cds du tableau précédent, autres intercalaires: respectivement dans le sens des adresses croissantes, le cds avant le 1er tRNA et le cds après le dernier tRNA du bloc.
  • Cumuls comp'+continu du tableau
	deb	fin	total
<201	9	14	23
total	28	28	56
taux	32%	50%	41%
rtb intercalaires tRNA
rtb les relevés deb-fin
comp’ entre tRNAs comp’ deb comp’ fin
15 381 comp’ 368
comp’ 60 108 comp’ 1394
comp’ 1051 278 110
95 17 139
143 167
comp’ 411 142
35 1364
402 comp’ 633
comp’ 496 31
comp’ 218 1922
1530 218
comp’ 1278 58
26 62
176 248
comp’ 499 222
comp’ 452 comp’ 1274
comp’ 1535 1028
1164 32
181 246
1199 1090
349 68
82 comp’ 183
382 2009
comp’ 401 145
951 comp’ 1945
comp’ 2191 comp’ 98
40 145
475 130
rtb intercalaires inférieures à 201 pbs
deb fin continu cumuls
17 31 deb
26 32 <201 9
35 58 total 19
40 62 taux 47%
82 68
108 110 fin
143 130 <201 12
176 139 total 21
181 142 taux 57%
278 145
349 145 total
381 167 <201 21
382 218 total 40
402 222 taux 53%
475 246
951 248
1164 1028
1199 1090
1530 1364
- 1922
- 2009 comp’ cumuls
218 98 deb 9
401 183 <201 0
411 368 fin 7
452 633 <201 2
496 1274
499 1394 total
1278 1945 <201 2
1535 - total 16
2191 - taux 13%

rtb intercalaires rRNA

  • Voir la présentation des blocs à rRNA dans le chapitre rtb blocs de l'étude préliminaire. A comparer avec le tableau rtb autres intercalaires.
  • Remarque: Quand le 16s n'est pas précédé de tRNAs l'intercalaire cds-16s est élevé, pour le 2ème bloc il est pour cvi de 447 pbs. L'intercalaire cds-bloc de l'autre côté du bloc est beaucoup plus faible, cvi 280 pbs. Cette orientation est quasiment générale chez tous les génomes que j'ai étudié ici. Je l'ai notée dans les chapitres génome-bloc de chaque génome. Pour rtb il y a un seul bloc 16s23s5s mais cassé, le 23s5s est très loin du 16s.
  • Note: J'ai supposé souvent que les blocs à tRNA sans rRNA sont aussi orientés de l'intercalaire le plus grand au plus petit. Dans pub cumuls et de même pour les autres génomes, j'ai noté cette orientation dans la colonne cdsd, pour cds dirigé. Je n'ai conservé pour les calculs que le plus petit intercalaire des 2 cds bordant le bloc. L'idée était que cette orientation provoquait la création du cds en fin de bloc. Ces cds sont souvent de petites protéines et souvent hypothétiques. Aussi je présente ci-dessous la transformation deb-fin qui est imposée par l'adressage en intercalaire plus grand et plus petit.
deb	fin		tri	grand	petit
381	368		4	139	17
108	1394		13	62	26
278	110		9	496	31
17	139		18	1164	32
143	167		7	1364	35
411	142		27	145	40
35	1364		12	1278	58
402	633		21	349	68
496	31		22	183	82
218	1922		26	2191	98
1530	218		2	1394	108
1278	58		3	278	110
26	62		28	475	130
176	248		6	411	142
499	222		5	167	143
452	1274		24	401	145
1535	1028		14	248	176
1164	32		19	246	181
181	246		10	1922	218
1199	1090		11	1530	218
349	68		15	499	222
82	183		1	381	368
382	2009		23	2009	382
401	145		8	633	402
951	1945		16	1274	452
2191	98		25	1945	951
40	145		17	1535	1028
475	130		20	1199	1090

Rickettsia prowazekii str. Breinl

rpl opérons

  • Lien tableur: rpl opérons
  • Liens: gtRNAdb [5], NCBI [6], génome [7]
  • Phylogénie: Bacteria; Proteobacteria; Alphaproteobacteria; Rickettsiales; Rickettsiaceae; Rickettsieae; Rickettsia; typhus group.
  • Légende: cdsa: cds aas, cdsd: cds dirigé
A7. Rickettsia prowazekii str. Breinl
29%GC 30.12.19 Paris  33   doubles intercal cds aa avec aa cdsa cdsd protéines
comp 31462..31892 cds 263 263 144 p-preprotein translocase subunit YajC
comp 32156..32181 rpr 870 870 26 tandem
comp 33052..33126 ggc 1253 1253
comp 34380..35750 cds 256 256 magnesium transporter
comp 36007..36093 ctc 190 190
comp 36284..37144 cds 287 TIGR01459 family HAD-type hydrolase
46825..47040 cds 31 31 72 hp
47072..47146 gca 1964 1964
49111..49650 cds 180 copper chaperone Pcu(A)C
comp 71150..76816 cds 933 933 1889 alpha-2-macroglobulin family protein
comp 77750..77826 cgt 1179 1179
79006..80241 cds 412 tyrosine--tRNA ligase
121704..121946 cds 984 984 81 HU family DNA-binding protein
comp 122931..123007 gtc 446 446
123454..124113 cds 220 (d)CMP kinase
126222..126827 cds 236 236 202 ATP-dependent Clp endopeptidase proteolytic subunit ClpP
127064..127139 gcc @1 830 830
comp 127970..128046 gac 365 365
128412..128843 cds 144 ribosome-associated translation inhibitor RaiA
171237..173012 cds 50 50 592 aminopeptidase P family protein
173063..173137 caa 49 49
comp 173187..173263 cgg 18 18
comp 173282..174265 cds 328 polyprenyl synthetase family protein
186344..187336 cds 58 58 331 tryptophan--tRNA ligase
187395..187484 tca 354 354
comp 187839..188738 cds 300 hydroxymethylbilane synthase
203097..203846 cds 219 219 250 bifunctional N-acetylglucosamine-1-phosphate uridyltransferase/glucosamine-1-phosphate acetyltransferase
204066..204153 tcc 1457 1457
205611..206639 cds 343 type 2 isopentenyl-diphosphate Delta-isomerase
comp 299321..300853 cds 419 419 511 hp
comp 301273..301349 atc 15 15
comp 301365..301440 aaa 219 219
301660..302400 cds 247 3-deoxy-manno-octulosonate cytidylyltransferase
comp 328700..329635 cds 22 22 312 site-specific tyrosine recombinase XerD
comp 329658..329732 tgc 499 499
330232..330699 cds 156 DUF2155 domain-containing protein
429121..429807 cds 723 723 229 hp
comp 430531..430605 aac 359 359
comp 430965..432767 cds 601 elongation factor 4
473867..474352 cds 928 928 162 RNA pyrophosphohydrolase
comp 475281..475357 atgj 40 40
comp 475398..475883 cds 162 30S ribosomal protein S9
506934..508007 cds 183 183 358 cell division protein ZapE
comp 508191..508305 5s 240 115
comp 508546..511330 23s 716 716 2785
comp 512047..512958 cds 304 methionyl-tRNA formyltransferase
577419..579725 cds 138 138 769 outer membrane protein assembly factor BamA
579864..579939 acg 1026 1179
comp 580966..581169 cds 68 DUF2674 domain-containing protein
comp 612439..612639 cds 143 143 67 preprotein translocase subunit SecE
comp 612783..612858 tgg 143 143
comp 613002..615101 cds 700 elongation factor G
comp 656226..656870 cds 296 296 215 YihA family ribosome biogenesis GTP-binding protein
comp 657167..657243 atgf 119 119
comp 657363..657599 cds 79 50S ribosomal protein L31
comp 678911..679213 cds 19 19 101 preprotein translocase subunit SecG
comp 679233..679307 acc 159 159
comp 679467..680723 cds 419 MFS transporter
comp 746326..746529 cds 1664 1664 68 hp
comp 748194..748268 gaa 109 109
comp 748378..749421 cds 348 autotransporter outer membrane beta-barrel domain-containing protein
comp 756703..757686 cds 363 363 328 tRNA dihydrouridine synthase DusB
758050..758125 ttc 564 564
758690..759730 cds 347 UDP-3-O-(3-hydroxymyristoyl)glucosamine N-acyltransferase
776202..776537 cds 154 154 112 30S ribosomal protein S16
776692..776766 aca 467 467
777234..777863 cds 210 lipoyl(octanoyl) transferase LipB
779197..780348 cds 140 140 384 succinyl-diaminopimelate desuccinylase
780489..780573 cta 37 37
780611..781075 cds 155 DNA polymerase III subunit chi
comp 823242..823559 cds 98 98 106 DUF167 domain-containing protein
823658..823734 aga 1364 1364
comp 825099..825230 cds 44 hp
comp 854241..854456 cds 17 17 72 translation initiation factor IF-1
comp 854474..854550 cca 1573 1573
comp 856124..856357 cds 78 BolA family transcriptional regulator
915034..915501 cds 391 391 156 peptidoglycan-associated lipoprotein Pal
915893..915969 atgi 41 41
916011..917099 cds 363 YjgP/YjgQ family permease
953564..954742 cds 696 696 393 acetyl-CoA C-acetyltransferase
comp 955439..955530 agc 898 898
comp 956429..957373 cds 315 ACP S-malonyltransferase
comp 1009435..1011165 cds 142 142 577 ATP-binding cassette domain-containing protein
comp 1011308..1011384 cac 346 346
1011731..1012414 cds 228 7-cyano-7-deazaguanine synthase QueC
comp 1045414..1045656 cds 2381 2381 81 hp
comp 1048038..1048123 tta 135 135
comp 1048259..1048387 cds 43 hp
comp 1056245..1056973 cds 188 188 243 23s rRNA (guanosine(2251)-2'-O)-methyltransferase RlmB
1057162..1057247 tac 105 105
1057353..1057426 gga 82 82
1057509..1058693 cds 395 elongation factor Tu
1072391..1072663 cds 62 62 91 30S ribosomal protein S20
1072726..1072801 gta 1181 1181
comp 1073983..1074648 cds 222 hp
1102136..1103935 cds 1458 1462 600 PAS domain-containing sensor histidine kinase
1105394..1106893 16s 1462 1462 1500
1108356..1109301,1..184 cds 377 P-hp

rpl cumuls

  • Lien tableur: rpl cumuls
  • Légende
  • Notes: moyenne et variance des intercalaires élevés des 21 cds : 1204 et 453
cumuls. rpl.
opérons Fréquences intercalaires tRNAs Fréquences intercalaires cds Fréquences aas cds chromosome
effectif gammes sans rRNAs avec rRNAs gammes cds gammes cdsd gammes cdsa gammes cdsa 300
avec rRNA opérons 2 1 - 1 0 1 100 12 30 0
23s5s 1 20 1 50 9 40 200 11 60 2
16s 1 40 100 4 80 300 12 90 9
16s23s 0 60 1 150 8 120 400 15 120 4
max a 0 80 200 5 160 500 2 150 2
a doubles 0 100 250 3 200 600 4 180 6
spéciaux 0 120 1 300 3 240 700 2 210 2
total aas 0 140 350 1 280 800 1 240 5
sans opérons 29 160 400 5 320 900 0 270 3
1 aa 25 180 450 2 360 1000 0 300 2
max a 2 200 500 2 400 1100 0 330 5
a doubles 0 1 21 1 20
total aas 33 4 0 63 0 60 60
total aas 33
remarques 1
avec jaune moyenne 528 293
variance 558 271
sans jaune moyenne 56 191 243 172
variance 45 140 145 89

rpl blocs

A7. rpl, blocs à rRNA.
cds 183 358 cell division protein ZapE
5s 240 115
23s 716 2785
cds 304 methionyl-tRNA formyltransferase
cds 1458 600 PAS domain-containing sensor histidine kinase
16s 1462 1500
cds 377 P-hp

rpl remarques

  • Remarques: Les rickettsia, rtb et rpl, présentent de nombreux intercalaires très élevés. D’où cet intercalaire entre 2 aas de 830 pbs. La phylogénie très forte entre ces 2 génomes donne des blocs analogues mais avec des intercalaires différents. Ici les intercalaires élevés sont atténués. Je détaille ici les intercalaires du tableau des cumuls.
    - Les intercalaires entre aas: Il y a quatre intercalaires de ce type, 830 105 49 15. A part le 1er les 3 autres sont courants dans cette étude et seulement le dernier est le représentant de la moyenne dans cette étude.
    - Les intercalaires avec un cds. Les 31 blocs de ce génomes se répartissent en 3 groupes
    1. Les RNAs complètement isolés, les 2 intercalaires du bloc sont supérieurs à 400 pbs. Il y a 7 aas dont celui avec 830, et le 16s. Ici aac, gac et ttc ont l’intercalaire mineur à peine inférieur à 400. Sur ces 16 intercalaires 9 sont supérieurs à 800 et 7 entre 360 et 700 pbs.
    2. Les tRNAs proches de leurs 2 cds. Il y a 6 aas dont les 2 intercalaires sont inférieurs à 300 pbs et 3 aas dont au moins un des 2 intercalaires est entre 300 et 400 pbs.
    3. Il reste 14 blocs dont le 23s5s, auxquels il faut ajouter l’aa gcc voisin du gac isolé par 830. Ces blocs sont très polarisés, leurs 2 intercalaires sont très dissymétriques.
      10 aas ont leur intercalaire majeur supérieur à 800 et va jusqu’à 2381 pbs. Le 23s5s a un intercalaire majeur modéré, 723, assez courant pour les blocs à rRNAs.
      3 aas ont leur intercalaire majeur de 450 pbs environ.
  • Les blocs isolés et les blocs entourés par 2 cds
	Blocs à RNAs isolés par 2 intercalaires de plus de 400 pbs.					
	bloc	adresse	intercalaire	Blocs entourés par 2 intercalaires de 300 à 400 pbs	
	aac	430531	723-359		cac	1011308
	gac	127064	830-365		atgi	915893
	gtc	122931			tca	187395
	cgt	77750				
	ggc	33052			Blocs entourés par 2 intercalaires inférieurs à 300 pbs	
	16s	1105394			atgf	657167
	agc	955439			acc	679233
	ttc	758050	564-363		tgg	612783
	:	:			cgg-caa	173063
	:	:			gga-tac	1057162
	:	:			cta	780489
  • Les séquences des doubles: Il n'y a aucun double dans ce génome

rpl distribution

Al2 rpl, Rickettsia prowazekii str. Breinl. alpha.
g1    t1       
atgi 1 tct tat atgf 1
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc 1 tcc 1 tac 1 tgc 1
atc 1 acc 1 aac 1 agc 1
ctc 1 ccc cac 1 cgt 1
gtc 1 gcc 1 gac 1 ggc 1
tta 1 tca 1 taa tga
ata aca 1 aaa 1 aga 1
cta 1 cca 1 caa 1 cga
gta 1 gca 1 gaa 1 gga 1
ttg tcg tag tgg 1
atgj 1 acg 1 aag agg
ctg ccg cag cgg 1
gtg gcg gag ggg
alpha >1aa =1aa -5s +5s -16s +16s total
rpl 8 25 33

Rhodospirillum photometricum DSM 122

rpm opérons

  • Lien tableur: rpm opérons
  • Liens: gtRNAdb [8], NCBI [9], génome [10]
  • Phylogénie: Bacteria; Proteobacteria; Alphaproteobacteria; Rhodospirillales; Rhodospirillaceae; Pararhodospirillum.
  • Légende: cdsa: cds aas, cdsd: cds dirigé
A5. Rhodospirillum photometricum DSM 122
64.7%GC 26.12.19 Paris  95   doubles intercal cds aa avec aa cdsa cdsd protéines
comp 3322..4194 cds 30 30 291 LysM peptidoglycan-binding domain-containing protein
comp 4225..4821 23s° @1 196 595
comp 5018..5093 gca 182
comp 5276..5684 16s° 38 38 407
5723..6664 cds 314 SEL1-like repeat protein
comp < 12458..13198 cds 242 242 247 p-transposase
comp 13441..13555 5s @2 72 113
comp 13628..13880 23s° -7 -7 251
comp 13874..15127 cds 418 hp
21325..22362 cds 586 586 346 hp
22949..23237 16s° 85 85 287
comp 23323..23490 cds 56 hp
comp 24015..24287 cds 250 250 91 TraYdomain-containingprotein
comp 24538..24652 5s 71 113
comp 24724..27490 23s 212 2765
comp 27703..27779 atc 112
comp 27892..28378 16s° 18 18 485
<> 28397..29119 cds 241 p-EscV/YscV/HrcVfamilytypeIIIsecretionsystemexportapparatusprotein
comp 32782..33759 cds 190 190 326 glycosyltransferase
33950..34357 16s° 112 406
34470..34546 atc 216
34763..35591 23s° 44 827
comp 35636..35750 5s 72 113
comp 35823..38589 23s 215 2765
comp 38805..38881 atc 112
comp 38994..40502 16s 260 1507
comp 40763..42629 23s° -15 1865
42615..42903 16s° 112 287
43016..43092 atc 213
43306..44132 23s° -1 825
comp 44132..44835 23s° -5 -5 702
44831..45121 cds 97 hp
< 45496..45768 cds 553 553 91 p-glycosyl transferase family 1
46322..47040 16s° 0 0 717
comp 47041..47433 cds 131 winged helix-turn-helix domain-containing protein
comp 49761..51017 cds 128 128 419 glycosyltransferase
comp 51146..51221 23s° 214 74
comp 51436..51512 atc 112
comp 51625..52017 16s° -7 391
52011..52881 23s° 106 106 869
52988..53464 cds -37 -37 159 hp
> 53428..53694 cds 86 86 89 p-glycosyltransferase
comp 53781..54709 23s° 26 927
54736..54898 16s° 112 161
55011..55087 atc 216
55304..55741 23s° 438 438 436
56180..56440 cds 87 hp
comp 82891..83088 cds 116 116 66 preprotein translocase subunit SecE
comp 83205..83280 tgg 199 199
>comp 83480..84178 cds 233 p-elongation factor Tu
417242..417412 cds 142 142 57 tRNA (5-methylaminomethyl-2-thiouridylate)-methyltransferase
417555..417631 atgj + 24 24
417656..417732 atgj 2 atgj 38 38
comp 417771..418796 cds 342 tRNA epoxyqueuosine(34) reductase QueG
434306..435142 cds 512 512 279 CDP-diacylglycerol--serine O-phosphatidyltransferase
435655..435842 16s° -6 186
435837..436075 23s° 72 237
436148..436262 5s 51 113
436314..436390 atgf 196 196
436587..436883 cds 99 hp
comp 467261..468370 cds 167 167 370 3-isopropylmalate dehydrogenase
468538..468667 23s° 72 128
468740..468854 5s 51 113
468906..468982 atgf 125 125
469108..469863 cds 252 SAM-dependent chlorinase/fluorinase
comp 534521..536161 cds 367 367 547 glucose-6-phosphate isomerase
536529..536603 acg 92 92
comp 536696..537778 cds 361 tyrosine-type recombinase/integrase
comp 658467..658931 cds 110 110 155 GNAT family N-acetyltransferase
comp 659042..659116 gtc 155 155
659272..660159 cds 106 106 296 N-formylglutamate amidohydrolase
660266..660340 gtc 648 648
comp 660989..661800 cds 271 p-N-formylglutamate amidohydrolase
comp 684188..685141 cds 323 323 318 cation transporter
comp 685465..685539 gtg + 25 25
comp 685565..685639 gtg 2 gtg 195 195
685835..686251 cds 139 NUDIX hydrolase
comp 691078..691773 cds 4 4 232 ComF family protein
691778..691897 23s° 72 118
691970..692084 5s 114 114 113
comp 692199..694505 cds 769 VWA domain-containing protein
750262..751398 cds 161 161 379 [FeFe] hydrogenase H-cluster radical SAM maturase HydE
comp 751560..751674 5s 72 113
comp 751747..752005 23s° 597 597 257
752603..752814 rpr @4 388 388 21 CRISPR
753203..753760 cds 186 hp
comp 839981..840214 cds 4 4 78 hp
comp 840219..840478 16s° 568 568 258
comp 841047..844388 cds 1114 response regulator
874585..875391 cds 88 88 269 phosphoadenylyl-sulfate reductase
875480..875556 cac 81 81
875638..876117 cds 160 CreA family protein
885688..886299 cds 176 176 204 LysE family translocator
886476..886552 ccc 144 144
comp 886697..887233 cds 179 helix-turn-helix transcriptional regulator
932708..934243 cds 93 93 512 Fic family protein
comp 934337..934413 cgt + 35 35
comp 934449..934525 cgt 3 cgt 44 44
comp 934570..934646 cgt 449 449
935096..936175 cds 360 hp
comp 978995..979396 cds 138 138 134 MFS transporter
comp 979535..979609 ggc + 23 23
comp 979633..979707 ggc 4 ggc 45 45
comp 979753..979827 ggc 29 29
comp 979857..979931 ggc 206 206
980138..981679 cds 514 murein biosynthesis integral membrane protein MurJ
997575..997898 cds 95 95 108 DUF1476 domain-containing protein
comp 997994..998067 cag + 54 54
comp 998122..998195 cag 2 cag 168 168
998364..999509 cds 382 Ppx/GppA family phosphatase
1050081..1051028 cds 60 60 316 NnrS family protein
comp 1051089..1051163 acc + 16 16
comp 1051180..1051254 acc 3 acc 18 18
comp 1051273..1051347 acc 170 170
comp 1051518..1053305 cds 596 EAL domain-containing protein
1197836..1199341 cds 197 197 502 aldehyde dehydrogenase
1199539..1199623 cta 126 126
1199750..1201090 cds 447 trigger factor
1206196..1206501 cds 93 93 102 HU family DNA-binding protein
1206595..1206670 gta 50 50
1206721..1207092 cds 124 hp
1213113..1214459 cds 210 210 449 acetyl-CoA carboxylase biotin carboxylase subunit
comp 1214670..1214874 16s° 600 600 203
comp 1215475..1216716 cds 414 polyphosphate kinase
comp 1349719..1350132 cds 109 109 138 NAD(P) transhydrogenase subunit alpha
comp 1350242..1350608 23s° 212 365
comp 1350821..1350897 atc 115
comp 1351013..1351438 16s° 23 23 424
< comp 1351462..1352160 cds 233 p-tetratricopeptide repeat protein
1359745..1360302 cds 176 176 186 hp
1360479..1360555 gac + 37 37
1360593..1360669 gac 2 gac 274 274
1360944..1361204 cds 87 hp
1416615..1417769 cds 214 214 385 glycosyltransferase family 61 protein
1417984..1418074 tcc 154 154
comp 1418229..1419095 cds 289 LysR family transcriptional regulator
comp 1472421..1473403 cds 250 250 328 biotin synthase BioB
comp 1473654..1473740 ttg 77 77
comp 1473818..1474678 cds 287 homocysteine S-methyltransferase family protein
comp 1735298..1736380 cds 209 209 361 DUF262 domain-containing protein
1736590..1736859 23s° 72 268
1736932..1737046 5s 52 113
1737099..1737175 atgf 93 93
comp 1737269..1737694 cds 142 type II toxin-antitoxin system VapC family toxin
comp 1812365..1813924 cds 894 894 520 peptidoglycan DD-metalloendopeptidase family protein
1814819..1815040 16s° -7 -7 222
<comp 1815034..1815837 cds 80 80 268 p-elongation factor Tu
comp 1815918..1815991 gga 34 34
comp 1816026..1816111 tac 144 144
1816256..1817143 cds 296 23S rRNA (guanosine(2251)-2'-O)-methyltransferase RlmB
comp 1833109..1833603 cds 83 83 165 MBL fold metallo-hydrolase
comp 1833687..1833762 aag + 24 24
comp 1833787..1833862 aag 2 aag 198 198
comp 1834061..1835224 cds 388 rod shape-determining protein RodA
> 1941413..1943059 cds -30 -30 549 p-recombinase family protein
comp 1943030..1943121 agc 160 160
comp 1943282..1944133 cds 284 FAD-dependent thymidylate synthase
comp 2087696..2090938 cds 705 705 1081 PAS domain-containing protein
2091644..2091826 16s° 7 7 181
2091834..2092247 cds 138 hp
comp 2095044..2095490 cds 48 48 149 hp
comp 2095539..2095733 16s° 614 614 193
comp 2096348..2097337 cds 330 trypsin-like serine protease
comp 2113248..2114603 cds 219 219 452 hp
comp 2114823..2114899 aga 55 55
comp 2114955..2115251 cds 71 71 99 ETC complex I subunit
comp 2115323..2115399 cca 261 261
comp 2115661..2115960 cds 100 hp
comp 2144042..2146288 cds 308 308 749 HAMP domain-containing protein
2146597..2147256 23s° 72 658
2147329..2147443 5s 52 113
2147496..2147572 atgf 645 645
comp 2148218..2148664 cds 149 hp
2268003..2268461 cds 87 87 153 23S rRNA (pseudouridine(1915)-N(3))-methyltransferase RlmH
comp 2268549..2268625 ccg + 165 165
comp 2268791..2268867 ccg 2 ccg 56 56
comp 2268924..2269910 cds 329 farnesyltranstransferase
comp 2321621..2322145 cds 332 332 175 hp
2322478..2322554 ccc 225 225
2322780..2322974 cds 65 hp
comp 2393295..2396009 cds @3 1003 1003 905 CRISPR-associated helicase/endonuclease Cas3
2397013..2397919 16s° 2 2 905
2397922..2400888 cds 989 hp
comp 2517845..2520559 cds 229 229 905 phosphoenolpyruvate carboxylase
comp 2520789..2520903 5s 72 113
comp 2520976..2521339 23s° 189 189 362
comp 2521529..2522152 cds 208 3-isopropylmalate dehydratase small subunit
comp 2596508..2596738 cds 989 989 77 motility twitching protein PilT
comp 2597728..2597815 tca 194 194
2598010..2599204 cds 398 hp
comp 2621435..2622058 cds 106 106 208 helix-turn-helix transcriptional regulator
comp 2622165..2622251 ctc 202 202
2622454..2623107 cds 218 lipoyl(octanoyl) transferase LipB
2631201..2631554 cds 192 192 118 hp
2631747..2631822 gcc + 70 70
2631893..2631968 gcc 4 gcc 69 69
2632038..2632113 gcc 57 57
2632171..2632246 gcc 166 166
< 2632413..2632965 cds -41 -41 184 p-IS256 family transposase
2632925..2633473 cds 30 30 183 hp
comp 2633504..2633579 aca 93 93
comp 2633673..2634200 cds 271 271 176 N-acetyltransferase
comp 2634472..2634561 tcg 155 155
2634717..2635742 cds 342 hp
comp 2655872..2656489 cds 182 182 206 YitT family protein
comp 2656672..2656747 gag 141 141
comp 2656889..2657674 cds 262 MetQ/NlpA family ABC transporter substrate-binding protein
2758160..2758312 cds 110 110 51 light-harvesting protein
comp 2758423..2758509 tta 94 94
comp 2758604..2759899 cds 432 bifunctional folylpolyglutamate synthase/dihydrofolate synthase
> 2768823..2769518 cds -12 -12 232 methyltransferase
2769507..2769776 23s° 71 268
2769848..2769962 5s 118 118 113
comp 2770081..2771016 cds 312 tetratricopeptide repeat protein
2792922..2794778 cds 129 129 619 glutathione-regulated potassium-efflux system protein KefB
2794908..2794982 caa 92 92
comp 2795075..2795686 cds 204 hp
2862755..2862982 cds 123 123 76 hp
2863106..2863182 cca 117 117
2863300..2863374 atgi 373 373
2863748..2863823 gca 157 157
2863981..2864056 aca 15
2864072..2864317 cds 8 82 DUF2829 domain-containing protein
2864326..2864401 aaa 250 250
> 2864652..2865041 cds 130 p-hp
2867066..2868112 cds 76 76 349 tyrosine-type recombinase/integrase
comp 2868189..2868264 aaa 99 99
comp 2868364..2868870 cds 169 peptidylprolyl isomerase
2893891..2894430 cds 25 25 180 phage portal protein
2894456..2894570 5s 51 113
2894622..2894698 atgf 285 285
2894984..2895400 cds 139 p-hp
comp 3034652..3035092 cds 250 250 147 hp
comp 3035343..3035418 aaa 8 8
comp 3035427..3035986 cds 187 DUF2829 domain-containing protein
comp 3305068..3306534 cds 379 379 489 S8 family serine peptidase
comp 3306914..3306989 ttc + 29 29
comp 3307019..3307094 ttc 4 ttc 34 34
comp 3307129..3307204 ttc 33 33
comp 3307238..3307313 ttc 60 60
comp 3307374..3308864 cds 497 RimK family protein
comp 3332977..3334356 cds 54 54 460 type II secretion system protein
3334411..3334487 cgg 176 176
< comp 3334664..3335983 cds 440 p-hp
3408217..3409026 cds 91 91 270 hp
comp 3409118..3409232 5s 71 113
comp 3409304..3409410 23s° 1 1 105
< 3409412..3409711 cds 100 p-IS5/IS1182 family transposase
comp 3456276..3461666 cds 387 387 1797 alpha-2-macroglobulin family protein
3462054..3462130 agg 29 29
3462160..3462951 cds 264 amino acid ABC transporter substrate-binding protein
comp 3500025..3500675 cds 210 210 217 protein-L-isoaspartate O-methyltransferase
3500886..3500959 tgc + 27 27
3500987..3501061 aac 2 aac 31 31
3501093..3501167 aac 84 84
comp 3501252..3501659 cds 136 hp
3639978..3641276 cds 172 172 433 outer membrane efflux protein
3641449..3641525 gcg + 70 70
3641596..3641671 gcg 3 gcg 33 33
3641705..3641780 gcg 389 389
3642170..3644392 cds 741 sigma-54-dependent Fis family transcriptional regulator
3651524..3652711 cds 55 55 396 aminotransferase
3652767..3652843 cac 202 202
<comp 3653046..3653543 cds 166 arsenical-resistance protein
3710072..3710840 cds 126 126 256 TonB family protein
comp 3710967..3711042 gaa + 214 214
comp 3711257..3711332 gaa 2 gaa 125 125
comp 3711458..3711664 cds 69 cold-shock protein
comp 3727874..3729085 cds 828 828 404 hp
3729914..3730068 16s° 87 87 153
3730156..3730545 cds 130 hp
comp 3804728..3805231 cds 118 118 168 response regulator
comp 3805350..3805425 gag 241 241
comp 3805667..3806140 cds 158 transcription elongation factor GreA
3813820..3815895 cds 138 138 692 RNA polymerase sigma factor RpoD
3816034..3816109 atgi 94 94
3816204..3818993 cds 930 diguanylate cyclase
comp 3827982..3828878 cds 90 90 299 phosphoserine phosphatase SerB
comp 3828969..3829042 ggg @5 292 292
3829335..3830670 cds 445 chemotaxis protein
comp 3832305..3833264 cds 311 311 320 complex I NDUFA9 subunit family protein
3833576..3833662 ctg + 47 47
3833710..3833796 ctg 5 ctg 153 153
3833950..3834036 ctg 48 48
3834085..3834171 ctg 47 47
3834219..3834305 ctg 113 113
3834419..3835039 cds 207 ribonuclease D

rpm cumuls

cumuls. rpm.
opérons Fréquences intercalaires tRNAs Fréquences intercalaires cds Fréquences aas cds chromosome
effectif gammes sans rRNAs avec rRNAs gammes cds gammes cdsd gammes cdsa gammes cdsa 300
avec rRNA opérons 27 1 0 1 9 1 100 20 1 0
16s°atc23s° 7 20 2 50 15 40 200 35 30 0
16s°gca23s° 1 40 14 100 30 80 300 30 60 3
16s°23s° 1 60 7 150 24 120 400 23 90 10
max a 1 80 3 200 23 160 500 14 120 10
a doubles 0 100 0 250 16 200 600 7 150 14
spéciaux 18 120 1 300 5 240 700 2 180 13
total aas 13 140 0 350 4 280 800 3 210 11
sans opérons 47 160 2 400 5 320 900 0 240 6
1 aa 30 180 1 450 2 360 1000 4 270 9
max a 5 200 0 500 0 400 1100 1 300 9
a doubles 15 2 14 2 56
total aas 79 32 0 147 0 141 141
total aas 92
remarques 5
avec jaune moyenne 69 194 310
variance 75 197 248
sans jaune moyenne 39 147 252 170
variance 16 112 134 71

rpm blocs

rpm blocs protéines

  • Lien tableur: rpm blocs protéines
  • Note:
    - hp pour hypothetical protein
    - p- pour pseudo, par exemple p-elon en abrégé donne p-elongation factor Tu.
A5p. rpm, protéines.
abrégé nom
23s 23s rRNA (guanosine(2251)-2'-O)-methyltransferase RlmB
3-isop 3-isopropylmalate dehydrogenase
3-isop-sub 3-isopropylmalate dehydratase small subunit
acetyl acetyl-CoA carboxylase biotin carboxylase subunit
cas3 CRISPR-associated helicase/endonuclease Cas3
CDP CDP-diacylglycerol--serine O-phosphatidyltransferase
ComF ComF family protein
CRISPR CRISPR
DUF262 DUF262 domain-containing protein
FeFe [FeFe] hydrogenase H-cluster radical SAM maturase HydE
glyco glycosyltransferase
HAMP HAMP domain-containing protein
LysM LysM peptidoglycan-binding domain-containing protein
methyl methyltransferase
NAD NAD(P) transhydrogenase subunit alpha
p-elon p-elongation factor Tu
p-EscV p-EscV/YscV/HrcVfamilytypeIIIsecretionsystemexportapparatusprotein
p-glyco p-glycosyltransferase
P-glyco1 p-glycosyl transferase family 1
p-IS5 p-IS5/IS1182 family transposase
p-tetra p-tetratricopeptide repeat protein
p-trans p-transposase
PAS PAS domain-containing protein
peptido peptidoglycan DD-metalloendopeptidase family protein
phage phage portal protein
phospho phosphoenolpyruvate carboxylase
polypho polyphosphate kinase
respons response regulator
SAM SAM-dependent chlorinase/fluorinase
SEL1 SEL1-like repeat protein
tetra tetratricopeptide repeat protein
TraY TraY domain-containing protein
trypsin trypsin-like serine protease
type II type II toxin-antitoxin system VapC family toxin
VWA VWA domain-containing protein
winged winged helix-turn-helix domain-containing protein

rpm blocs construits

  • Lien tableur: rpm blocs construits
  • Légende: lien au tableau des protéines, abrégés
    - vert: la taille des rRNAs en pbs alors que les protéines (cdsa) sont en aas.
    - bleu: protéines bien caractérisées alors qu'en clair sont les protéines candidates à la création, hp pour hypothetical protein, p-protéine pour pseudo-protéine et les protéines caractérisées seulement par un domaine comme DUF262 par exemple.
    - cyan: Les intercalaires constantes vestiges des blocs complets représentés par l'unique bloc contenant le 16s avec les intercalaires 71 pour 5s-23s, 212 pour 23s-atc, 112 pour atc-16s et 52 dans le cas de 5s-atgf.
    - gris: Je ne considère ici que les protéines créées à l'intérieur d'un bloc rRNA. Les protéines non canditates à la création sont en bleu, voir ci-dessus le bleu, mais la reconstruction des blocs détruits m'a obligé à considérer des protéines internes au bloc, bien caractérisées non candiates à la création. Aussi je n'ai conservé que les plus petites, metyl adresse 2768823, 3-isop-sub adresse 2521529 et glyco adresse 49761. La reconstruction ne m'a pas permis de faire de grands blocs pour 4 clusters listés à la fin des 2 derniers tableaux en gris. Ces clusters sont restés parce qu'ils mettraient des protéines non candidates en intra bloc avec de grande taille.
  • Notes: Il faut noter que théoriquement, pour cet organisme où la destruction des blocs est spéctaculaire, les protéines créées pourraient être aussi grande que le 23s en paires de base, 2765 soit 900 aas à peu près. C'est ce que j'ai suggéré en plaçant le 16s° contenant 1 grosse protéine candidate pour la création parce qu'elle est hypothétique dans le reconstruction du bloc b10, cas3-16s°-hp, 905-16s°-989. La même situation est reproduite dans le bloc b9 avec PAS-16s°-hp, 1081-16s°-138.
    • @ Les blocs à rRNAs: texte de rpm remarques, remarque @3.
      - Les clusters de rpm tels qu’ils apparaissent dans la séquence des adresses sont présentés au chapitre rpm blocs construits, tableaux A5b1 et A5b2.
      + A5b1 rassemble 9 16s° solitaires suivis de longs clusters où on peut repérer les blocs d’origine altérés caractérisés par les intercalaires 16s-atc-23s, respectivement de 112 pbs et 216 pbs. Ainsi je suppose qu’il y a 5 blocs d’origine de type 16s-atc-23s-5s et un,isolé, de type 16s-gca-23s-5s. Dans ces grands clusters seul subsiste un seul 5s appartenant au bloc complet et intègre que j’ai nommé b0.
      + A5b2 rassemble 9 23s°5s solitaires et 3 blocs complets et un 5s solitaire. Les 23s°5s sont mis en face des 16s° du tableau A5b1. Les blocs complets contiennent un représentant de 16s, un de 23s et un 5s. Dans cette partie du tableau A5b2 j’ai ajouté le bloc b0 séparé de son cluster pour comparaison. Le bloc analogue au b0 est le bloc b1 qui est isolé et où seul le 16s est altéré. Le bloc b3 de cette partie du tableau apparaît comme un racollage d’un 16s° solitaire et d’un 23s°5s solitaire puisque l’intercalaire 16s°-23s° est négatif, c’est-à-dire qu’il y a recouvrement des 2 morceaux, ce qui ne serait pas le cas s’il y avait une délétion entre le 16s et le 23s d’origine.
      - Le parallélisme et l'égalité en nombres entre les 16s° et les 23s°5s solitaires, ainsi que l'analyse des intercalaires petits et négatifs de la remarque @2 m’ont poussé à reconstruire les blocs d’origines en rapprochant des 16s° solitaires à d’autres 16s° solitaires ou non tous 2 avec leurs cds, selon l’hypothèse que les 2 cds internes résultant font partie de l’altération ou de la délétion du 16s original et du coup ces cds seraient des candidats à la création de gènes nouveaux. Le même procédé et la même hypothèse sont appliqués pour un 23° et un 23s°5s.
      - Cette reconstruction se trouve dans les tableaux A5b3 et A5b4. Ainsi en optimisant les tailles des 16s et 23s reconstruits pour se rapprocher le plus aux tailles de ces rRNAs du bloc intègre b0, j’ai pu construire 11 blocs. J’ai séparé le 16s° du 23s°5s du bloc b3 du tableau A5b2. Il reste cependant un 16s°, un 23s° et un 5s-atgf que je n’ai pas pu réunir car leurs cds sont tous bien caractérisés et ne répondent aux critères des candidats à la création. L’hypothèse de 11 blocs ou 12 blocs à l’origine est tout à fait probable en comparaison des 9 blocs de abq.
      - Je n'ai pas pu faire une reconstruction analogue avec abs malgré la proximité phylogénique de abq car la complémentarité 16s° et 23s°5s n’existe pas comme si l’altération faisait disparaître une partie du rRNA, ceux qui restent indiquant la position des originaux. Cela indiquerait que ce sont 2 processus d’altération différents certainement reliés à la présence des tRNAs intra bloc, atc pour rpm et atc-gca pour abs.
      - Le génome analogue avec que des atc Tistrella mobilis KA081020-065, voir proteobacteria et Tistrella mobilis KA081020-065 [[11]]
A5b. rpm blocs et leur réorganisation.
A5b1. 9 blocs 16s° solitaires, 6 blocs atc gca
sens adresse bloc interca cdsa protéine rRNA° ordre
21325..22362 cds 586 346 hp 1493
22949..23237 16s° 85 287
comp 23323..23490 cds 56 hp b3
abrégés
< 45496..45768 cds 553 91 p-glyco1 1383
46322..47040 16s° 0 717
comp 47041..47433 cds 131 winged b4
abrégés
comp 839981..840214 cds 4 78 hp 492
comp 840219..840478 16s° 568 258
comp 841047..844388 cds 1114 respons b7
abrégés
1213113..1214459 cds 210 449 acetyl 1445
comp 1214670..1214874 16s° 600 203
comp 1215475..1216716 cds 414 polypho
abrégés
comp 1812365..1813924 cds 894 520 peptido 1026
1814819..1815040 16s° -7 222
<comp 1815034..1815837 cds 268 p-elon b5
abrégés
comp 2087696..2090938 cds 705 1081 PAS 595
2091644..2091826 16s° 7 181
2091834..2092247 cds 138 hp b9
abrégés
comp 2095044..2095490 cds 48 149 hp 640
comp 2095539..2095733 16s° 614 193
comp 2096348..2097337 cds 330 trypsin b8
abrégés
comp 2393295..2396009 cds 1003 905 cas3
2397013..2397919 16s° 2 905 905
2397922..2400888 cds 989 hp b10
abrégés
comp 3727874..3729085 cds 828 404 hp 1755
3729914..3730068 16s° 87 153
3730156..3730545 cds 130 hp b2
abrégés
434306..435142 cds 512 279 CDP
435655..435842 16s° -6 186 1023
abrégés
comp 3322..4194 cds 30 291 LysM
comp 4225..4821 23s° 196 595 1468
comp 5018..5093 gca 182
comp 5276..5684 16s° 38 407
5723..6664 cds 314 SEL1 b6
abrégés
comp 32782..33759 cds 190 326 glyco
33950..34357 16s° 112 406
34470..34546 atc 216
34763..35591 23s° 44 827 827 b7
comp 35636..35750 5s 72 113
comp 35823..38589 23s 215 2765
comp 38805..38881 atc 112
comp 38994..40502 16s 260 1507 b0
comp 40763..42629 23s° -15 1865 1865 b4
42615..42903 16s° 112 287
43016..43092 atc 213
43306..44132 23s° -1 825 825 b8
comp 44132..44835 23s° -5 702 993
44831..45121 cds 97 hp b5
abrégés
comp 49761..51017 cds 128 419 glyco 1331
comp 51146..51221 23s° 214 74
comp 51436..51512 atc 112
comp 51625..52017 16s° -7 391 b9
52011..52881 23s° 106 869 1346
52988..53464 cds -37 159 hp
> 53428..53694 cds 86 89 p-glyco
comp 53781..54709 23s° 26 927 1194 b3
54736..54898 16s° 112 161
55011..55087 atc 216 697
55304..55741 23s° 438 436
56180..56440 cds 87 hp b10
A5b2. 9 blocs 23s°5s, 3 blocs complets
sens adresse bloc interca cdsa protéine rRNA° ordre
comp 13874..15127 cds -7 418 hp 1505
comp 13628..13880 23s° 72 251
comp 13441..13555 5s 242 113
comp < 12458..13198 cds 247 p-trans b5
abrégés
comp 691078..691773 cds 4 232 ComF 814
691778..691897 23s° 72 118
691970..692084 5s 114 113
comp 692199..694505 cds 769 VWA b9
abrégés
753203..753760 cds 388 186 hp 1028
752603..752814 rpr 597 71 CRISPR
comp 751747..752005 23s° 72 257
comp 751560..751674 5s 161 113
750262..751398 cds 379 FeFe b8
abrégés
comp 2521529..2522152 cds 189 208 3-isop-sub 986
comp 2520976..2521339 23s° 72 362
comp 2520789..2520903 5s 229 113
comp 2517845..2520559 cds 905 phospho b7
abrégés
> 2768823..2769518 cds -12 232 methyl 964
2769507..2769776 23s° 71 268
2769848..2769962 5s 118 113
comp 2770081..2771016 cds 312 tetra b6
abrégés
< 3409412..3409711 cds 1 100 p-IS5 405
comp 3409304..3409410 23s° 71 105
comp 3409118..3409232 5s 91 113
3408217..3409026 cds 270 hp b4
abrégés
comp 467261..468370 cds 167 370 3-isop 1238
468538..468667 23s° 72 128
468740..468854 5s 51 113
468906..468982 atgf 125
469108..469863 cds 252 SAM
abrégés
comp 1735298..1736380 cds 209 361 DUF262 1351
1736590..1736859 23s° 72 268
1736932..1737046 5s 52 113
1737099..1737175 atgf 93
comp 1737269..1737694 cds 142 type II b10
abrégés
comp 2144042..2146288 cds 308 749 HAMP 2905
2146597..2147256 23s° 72 658
2147329..2147443 5s 52 113
2147496..2147572 atgf 645
comp 2148218..2148664 cds 149 hp b2
abrégés
comp 24015..24287 cds 250 91 TraY
comp 24538..24652 5s 71 113
comp 24724..27490 23s 212 2765
comp 27703..27779 atc 112
comp 27892..28378 16s° 18 485
<> 28397..29119 cds 241 p-EscV b1
abrégés
comp 35636..35750 5s 72 113
comp 35823..38589 23s 215 2765
comp 38805..38881 atc 112
comp 38994..40502 16s 260 1507 b0
abrégés
434306..435142 cds 512 279 CDP
435655..435842 16s° -6 186 1023
435837..436075 23s° 72 237
436148..436262 5s 51 113 237
436314..436390 atgf 196
436587..436883 cds 99 hp b3
abrégés
2893891..2894430 cds 25 180 phage
2894456..2894570 5s 51 113 540
2894622..2894698 atgf 285
2894984..2895400 cds 139 p-hp
A5b3. Fait: 4 blocs sans aas
sens adresse bloc interca cdsa protéine rRNA° ordre
comp 35636..35750 5s 72 113 b0
comp 35823..38589 23s 215 2765 2765
comp 38805..38881 atc 112
comp 38994..40502 16s 260 1507 1507
abrégés
comp 24015..24287 cds 250 91 TraY b1
comp 24538..24652 5s 71 113
comp 24724..27490 23s 212 2765 2765
comp 27703..27779 atc 112
comp 27892..28378 16s° 18 485 1208
<> 28397..29119 cds 241 p-EscV
abrégés
comp 3727874..3729085 cds 828 404 hp 1755 b2
3729914..3730068 16s° 87 153 1365
3730156..3730545 cds 130 hp
comp 2144042..2146288 cds 308 749 HAMP
2146597..2147256 23s° 72 658
2147329..2147443 5s 52 113
2147496..2147572 atgf 645
comp 2148218..2148664 cds 149 hp 2905
abrégés
21325..22362 cds 586 346 hp 1493 b3
22949..23237 16s° 85 287 1325
comp 23323..23490 cds 56 hp
52011..52881 23s° 106 869 1346
52988..53464 cds -37 159 hp
> 53428..53694 cds 86 89 p-glyco
comp 53781..54709 23s° 26 927 1194
435837..436075 23s° 72 237 237
436148..436262 5s 51 113
436314..436390 atgf 196
436587..436883 cds 99 hp 2777
abrégés
< 45496..45768 cds 553 91 p-glyco1 1383 b4
46322..47040 16s° 0 717
comp 47041..47433 cds 131 winged
comp 40763..42629 23s° -15 1865 1865
< 3409412..3409711 cds 1 100 p-IS5
comp 3409304..3409410 23s° 71 105 405
comp 3409118..3409232 5s 91 113
3408217..3409026 cds 270 hp 2270
abrégés
comp 1812365..1813924 cds 894 520 peptido b5
1814819..1815040 16s° -7 222 1026
<comp 1815034..1815837 cds 268 p-elon
comp 44132..44835 23s° -5 702 993
44831..45121 cds 97 hp
comp 13874..15127 cds -7 418 hp 1505
comp 13628..13880 23s° 72 251
comp 13441..13555 5s 242 113
comp < 12458..13198 cds 247 p-trans 2498
abrégés
2893891..2894430 cds 25 180 phage
2894456..2894570 5s 51 113 540
2894622..2894698 atgf 285
2894984..2895400 cds 139 p-hp
abrégés
1213113..1214459 cds 210 449 acetyl 1445
comp 1214670..1214874 16s° 600 203
comp 1215475..1216716 cds 414 polypho
abrégés
comp 467261..468370 cds 167 370 3-isop 1238
468538..468667 23s° 72 128
468740..468854 5s 51 113
468906..468982 atgf 125
469108..469863 cds 252 SAM
A5b4. Fait: 5 blocs atc, gca
sens adresse bloc interca cdsa protéine rRNA° ordre
5723..6664 cds 314 SEL1 1349 b6
comp 5276..5684 16s° 38 407
comp 5018..5093 gca 182
comp 4225..4821 23s° 196 595
comp 3322..4194 cds 30 291 LysM 1468
> 2768823..2769518 cds -12 232 methyl 964
2769507..2769776 23s° 71 268
2769848..2769962 5s 118 113
comp 2770081..2771016 cds 312 tetra 2432
abrégés
comp 841047..844388 cds 1114 respons 898 b7
comp 840219..840478 16s° 568 258 492
comp 839981..840214 cds 4 78 hp
comp 32782..33759 cds 190 326 glyco
33950..34357 16s° 112 406 406
34470..34546 atc 216
34763..35591 23s° 44 827 827
comp 2521529..2522152 cds 189 208 3-isop-sub 986
comp 2520976..2521339 23s° 72 362
comp 2520789..2520903 5s 229 113 1238
comp 2517845..2520559 cds 905 phospho 1813
abrégés
comp 2096348..2097337 cds 330 trypsin 927 b8
comp 2095539..2095733 16s° 614 193 640
comp 2095044..2095490 cds 48 149 hp
42615..42903 16s° 112 287 287
43016..43092 atc 213
43306..44132 23s° -1 825 825
753203..753760 cds 388 186 hp
752603..752814 rpr 597 71 CRISPR 1028
comp 751747..752005 23s° 72 257
comp 751560..751674 5s 161 113
750262..751398 cds 379 FeFe 1853
abrégés
comp 2087696..2090938 cds 705 1081 PAS 986 b9
2091644..2091826 16s° 7 181 595
2091834..2092247 cds 138 hp
comp 51625..52017 16s° -7 391 391
comp 51436..51512 atc 112
comp 51146..51221 23s° 214 74
comp 49761..51017 cds 128 419 glyco 1331
comp 691078..691773 cds 4 232 ComF
691778..691897 23s° 72 118 814
691970..692084 5s 114 113
comp 692199..694505 cds 769 VWA 2145
abrégés
comp 2393295..2396009 cds 1003 905 cas3 1066 b10
2397013..2397919 16s° 2 905 905
2397922..2400888 cds 989 hp
54736..54898 16s° 112 161 161
55011..55087 atc 216
55304..55741 23s° 438 436
56180..56440 cds 87 hp 697
comp 1735298..1736380 cds 209 361 DUF262 1351
1736590..1736859 23s° 72 268
1736932..1737046 5s 52 113
1737099..1737175 atgf 93
comp 1737269..1737694 cds 142 type II 2048
abrégés
434306..435142 cds 512 279 CDP
435655..435842 16s° -6 186 1023
435837..436075 23s° 72 237
436148..436262 5s 51 113 237
436314..436390 atgf 196
436587..436883 cds 99 hp

rpm remarques

rpm remarques texte

  • Remarques:
    1. @ Il y a 7 atc dans 7 blocs à rRNAs courts ou longs et il n’y a qu’un seul gca de ce type. Il y a un 2ème gca mais dans un bloc sans rRNAs. C’est un génome à 16satc23s5s comme Tistrella mobilis KA081020-065 [[12]]. Voir fiche alpha.
    2. @ Il y a 12 blocs à rRNAs courts ou complets et tous ont un intercalaire 23s-5s ou 23s°-5s de 72 ou 71. Les intercalaires avec cds et entre aas
      - Les intercalaires élevés: Ils sont peu nombreux et modérés.
      + Les cds avec les blocs à rRNAs sont en général élevés jusqu’à 600 pbs. Sur les 13 de rpm seulement 4 dépassent 700, 705 828 894 1003.
      + Il y a 3 intercalaires avec les tRNAs supérieurs à 400, 489 648 989. Le génome rpm n’échappe donc pas au comportement des alpha.Voir le tableau des spectres des intercalaires avec les cds. Bien que rpm présente un maximum élevé il affiche un minimum de 3 intercalaires avec les tRNAs, élevés, supérieurs à 400 contre un maximum de 24 pour rpl.
      - Les intercalaires négatifs et petits, voir le tableau des spectres et la liste de ces intercalaires.
      + Dans le tableau des spectres des intercalaires, rpm et aon sont les seuls à présenter une proportion significative de ces intercalaires négatifs avec 6% alors que les 7 autres alpha n’en présentent aucun.
      + Dans la liste de rpm sur 24 intercalaires inférieurs à 51, 7 sont négatifs un nul et un égale à l’unité. Six autres ont des intercalaires positifs inférieurs à 9. Cette liste laisse penser que ce comportement est très lié à l’altération des blocs à rRNAs. Puisque, 16 de ces intercalaires concernent les rRNAs altérés de même que les intercalaires élevés, supérieurs à 400, concernent 12 de ces RNAs.
      + C'est comme si l'altération des blocs à rRNAs se faisait à l'intérieur du bloc et épargnait son extérieur. D'où cette hypothèse que les cds à intercalaires petits ou négatifs collés aux rRNAs altérés seraient des candidats à la création de gènes, petits, hypothétiques et/ou pseudo.
      + Ces intercalaires ne seraient pas dus seulement au changement de brin lors de la recombinaison ou de la conversion, puisque les changements de brin (présentés ici par comp) ne représentent que le tiers, 6 sur 16.
      + Dans ce génome les intercalaires négatifs et petits existent entre 2 cds contigus et un cds et un tRNA (agc).Mais les intercalaires des 5 autres tRNAs sont assez élevés et correspondent à la dissymétrie, constatée chez beaucoup de génomes, entre les 2 cds encadrant un bloc sans rRNAs.
      - Spectre des intercalaires avec les cds: rapportés au total j’ai distingué 4 intervalles de ces intercalaires en pbs, inférieur à 51, de 51-200, de 201-400 et supérieur à 400. A part les génomes à phylogénie étroite, abq abs et rtb rpl, il y a 6 génomes différents.
      + rru et abq sont identiques
      + rpm et oan sont différents avec tous les autres à cause des négatifs et ils sont différents entre eux par l'intervalle 51-200, 0.52 contre 0.36.
      + agr a l'intervalle 201-400 le plus élevé de tous, 0.34 contre 0.15 à 0.28. Et le génome dont il se rapproche le plus, aua, diffère avec lui pour tous les autres intervalles.
      + rtb diffère de tous les autres par un intervalle > 400 élevé qui est de 0.44 contre moins de 0.20 pour tous les autres. En même temps ce génome est très dissymétrique puisqu’il a un intervalle < 51 aussi élevé que rpm et oan, 13 contre 16 et 19 respectivement, alors que les autres tournent autour de 0.05 jusqu’à 0.10 pour aua.
      - Les intercalaires entre tRNAs notés aussi aas, voir la liste entre aas.
      + Pour ces intercalaires, rpm se comporte comme les autres alpha et gamma (spl eco) avec 2 groupes, ceux supérieurs à 80 et pouvant atteindre des maxima élevés jusqu’à 1172 pour spl et 373 pour rpm, et le 2ème groupe ,le plus nombreux, aux intercalaires inférieurs à 81 avec une moyenne proche de 30 (variance inférieure à 20).
      + Le comportement des gamma et alpha est nettement différent de celui des firmicutes (ban lbu cbc) où le 2ème groupe fait à peine 5% du total (5 pour 113) mais avec des maxima aussi élevés que rpm. Le 2ème groupe des alpha dépasse les 50% ( 24 pour 45) et celui des gamma fait 25% ( 31 pour 129).
    3. @ Les blocs à rRNAs:
      - Les clusters de rpm tels qu’ils apparaissent dans la séquence des adresses sont présentés au chapitre rpm blocs construits, tableaux A5b1 et A5b2.
      + A5b1 rassemble 9 16s° solitaires suivis de longs clusters où on peut repérer les blocs d’origine altérés caractérisés par les intercalaires 16s-atc-23s, respectivement de 112 pbs et 216 pbs. Ainsi je suppose qu’il y a 5 blocs d’origine de type 16s-atc-23s-5s et un,isolé, de type 16s-gca-23s-5s. Dans ces grands clusters seul subsiste un seul 5s appartenant au bloc complet et intègre que j’ai nommé b0.
      + A5b2 rassemble 9 23s°5s solitaires et 3 blocs complets et un 5s solitaire. Les 23s°5s sont mis en face des 16s° du tableau A5b1. Les blocs complets contiennent un représentant de 16s, un de 23s et un 5s. Dans cette partie du tableau A5b2 j’ai ajouté le bloc b0 séparé de son cluster pour comparaison. Le bloc analogue au b0 est le bloc b1 qui est isolé et où seul le 16s est altéré. Le bloc b3 de cette partie du tableau apparaît comme un racollage d’un 16s° solitaire et d’un 23s°5s solitaire puisque l’intercalaire 16s°-23s° est négatif, c’est-à-dire qu’il y a recouvrement des 2 morceaux, ce qui ne serait pas le cas s’il y avait une délétion entre le 16s et le 23s d’origine.
      - Le parallélisme et l'égalité en nombres entre les 16s° et les 23s°5s solitaires, ainsi que l'analyse des intercalaires petits et négatifs de la remarque @2 m’ont poussé à reconstruire les blocs d’origines en rapprochant des 16s° solitaires à d’autres 16s° solitaires ou non tous 2 avec leurs cds, selon l’hypothèse que les 2 cds internes résultant font partie de l’altération ou de la délétion du 16s original et du coup ces cds seraient des candidats à la création de gènes nouveaux. Le même procédé et la même hypothèse sont appliqués pour un 23° et un 23s°5s.
      - Cette reconstruction se trouve dans les tableaux A5b3 et A5b4. Ainsi en optimisant les tailles des 16s et 23s reconstruits pour se rapprocher le plus aux tailles de ces rRNAs du bloc intègre b0, j’ai pu construire 11 blocs. J’ai séparé le 16s° du 23s°5s du bloc b3 du tableau A5b2. Il reste cependant un 16s°, un 23s° et un 5s-atgf que je n’ai pas pu réunir car leurs cds sont tous bien caractérisés et ne répondent aux critères des candidats à la création. L’hypothèse de 11 blocs ou 12 blocs à l’origine est tout à fait probable en comparaison des 9 blocs de abq.
      - Je n'ai pas pu faire une reconstruction analogue avec abs malgré la proximité phylogénique de abq car la complémentarité 16s° et 23s°5s n’existe pas comme si l’altération faisait disparaître une partie du rRNA, ceux qui restent indiquant la position des originaux. Cela indiquerait que ce sont 2 processus d’altération différents certainement reliés à la présence des tRNAs intra bloc, atc pour rpm et atc-gca pour abs.
      - Le génome analogue avec que des atc Tistrella mobilis KA081020-065, voir proteobacteria et Tistrella mobilis KA081020-065 [[13]]
    4. @ CRISPR, en relation avec la création des gènes et la conversion?
      Adresse 752603
      /rpt_family="CRISPR"
      /rpt_type=direct
      /rpt_unit_range=752664..752692
      /rpt_unit_seq="gggttcatccctgcgcatgcaggggatac"
    5. @ Les tRNAs rares : liens aux indices de l'ensemble des alpha, de l'ensemble des bacilli et de l'ensemble des gamma
      - Les 11 tRNAs se terminant par g, à part ttg agg tgg atg et tag, sont souvent les premiers absents chez certains génomes bactériens. A ceux-là il faut ajouter ccc et cga: ccc s’expliquerait par complémentarité avec ggg; cga est du au fait que chez les bactéries il y a bascule cgt/cgc et cgg/cga (cgc devenant rare comme pour tous les autres doublets xyt et de même cga par rapport à cgg). Chez les bacilli par exemple ces 13 tRNAs sont très rares alors que chez les alphaproteobacteria sont aussi abondants que les xyc et xya, à part cga est absent dans les 9 génomes étudiés ici.
      - Indices pour 100 génomes des aas les plus faibles, < 80: cgg et ttg soupçonnés ne présentent aucune faiblesse. Par contre je découvre 4 tRNAs présentant une seule faiblesse sur les 4 clades et seul le clade bacilli présente cette faiblesse, ce sont ctc gtc gcc ctg. Est-ce que ce foisonnement de doubles est en relation avec l'étendue des altérations des blocs à rRNAs?
génomes	354	1161	672	4032
clade	alpha	gamma	bacilli	bacteria
				
cga	8.5	13.4	5.4	22
ccc	78	87	5.7	68
				
gtc	101	176	47	110
gcc	94	170	26	103
ctc	110	104	67	95
				
gtg	55	8.4	0.7	33
gcg	55	7.1	7.9	30
gag	50	7.8	15	34
ggg	66	74	17	56
				
ctg	87	256	57	129
ccg	68	63	17	54
cag	62	104	16	59
cgg	101	102	99	83
				
acg	86	73	43	68
aag	74	24	67	60
agg	71	112	66	86
				
ttg	84	105	112	99
tcg	76	85	46	65

  • séquences des doubles: C'est le génome des 9 alpha étudiés qui présente le plus de doubles avec 15 contre 1 ou 2 cluster pour les autres présentant des doubles. En plus, même les tRNAs les plus faibles présentent des doublets, ccg aag cag gtg, et même un triplet gcg.
										
n aas	effectif	total		doubles						
1	30		30								
2	7		14		ccg	aag	gac	cag	gtg	atgi	gaa
3	4		12		gcgx3	cgtx3	accx3	tgc.aacx2			
4	4		16		ttcx4	gccx4	ggcx4	simplesx4			
5	1		5		ctgx5						
total	46		77								

rpm listes

rpm intercalaires entre aas
  • Tableau des intercalaires entre aas dans les blocs sans rRNAs
2863300	373	atgi-gca
3710967	214	gaa-gaa
2268549	165	ccg-ccg
2863748	157	gca-aca
3833710	153	ctg-ctg
2863106	117	cca-atgi
  • Comparaison avec les gamma et les firmicutes
clade		génome	< 80	> 80	moyenne	ecartype	maximum
alpha		rpm	26	6	39	16		373
		rru	1	3	-			202
		abq	11	6	-			220
		abs	11	6	-			219
		oan	1	2	-			245
		agr	2	2	-			793
		aua	4	9	-			404
		rtb	2	2	-			1051
		rpl	2	2	-			830
alpha total-rpm		34	32	-			-
alpha sans double	21	24	-			-
bacilli		ban	35	2	14	14		87
bacilli		lbu	46	2	14	12		258
clostridia	cbc	27	1	15	14		306
gama		spl	70	23	39	14		1172
gama		eco	28	8	28	18		209

rpm intercalaires avec les cds
	cds > 400	
adresse	intercalaire	RNA
435655		512	16s°
46322		553	16s°
840219		568	16s°
22949		586	16s°
1214670		600	16s°
2095539		614	16s°
2091644		705	16s° comp
3729914		828	16s° comp
1814819		894	16s° comp
2393295		1003	16s° comp
		
55304		438	23s°
751747		597	23s°  comp
		
2147496		645	atgf  comp
		
934570		449	cgt  comp
660266		648	gtc  comp
2597728		989	tca
  • Tableau des intercalaires négatifs ou petits avec les cds
	cds < 50	
adresse	intercalaire	RNA ou cds
1814819		-7	16s° comp
46322		0	16s°
2397013		2	16s°
840219		4	16s°
2091644		7	16s°
27892		18	16s° comp
1351013		23	16s°
5276		38	16s° comp
2095539		48	16s°
		
2769507		-12	23s°
13628		-7	23s°
44132		-5	23s°  comp
3409304		1	23s°  comp
691778		4	23s°  comp
4225		30	23s°
		
2894456		25	5s
		
52988		-37	cds
2632925		-41	cds
		
1814819		-30	agc  comp
3035343		8	aaa
3462054		29	agg
2633504		30	aca comp
417656		38	atgj comp
1206595		50	gta

intercalaires	rru	rpm	oan	abs	abq	agr	rtb	rpl	aua
< 2		0	0.06	0.05	0	0	0	0	0	0.01
< 51		0.07	0.16	0.19	0.04	0.06	0.03	0.13	0.14	0.10
51-200		0.53	0.52	0.36	0.55	0.54	0.53	0.29	0.27	0.40
201-400		0.25	0.20	0.28	0.26	0.24	0.34	0.15	0.19	0.30
> 400		0.15	0.11	0.17	0.14	0.17	0.10	0.44	0.40	0.20
total		88	147	107	125	121	97	62	63	80
Aas > 400	7	3	13	6	9	8	24	22	16
max  aas	1389	989	1650	746	688	660	2465	2381	3102

alpha codes

  • Lien tableur: alpha codes
  • Légende: prélèvement de la base gtRNAdb le 19/1/20 Paris
    - totaux en en-tête, exemple pour A5c, 25 98 95, 12 somme des tRNAs faibles ccc cga les jaunes et les 3 oranges de la colonne 6; 98 total de gtRNAdb contenant des pseudo et inconnus; 95 total du tableau.
    - ata très rare est remplacé par atgi (Ile2)
    - Met comprend atgf (Metf) et atgj (Met) sous la forme atgf/atgj, sauf pour A1c dont il faut les différencier.
    - Voir la légende des tris et couleurs, g1 t1.
Ac. Code génétique des 9 alpha
A1c. aua Aureimonas sp. AU20
g1    t1    12    55   55
ttt tct tat tgt
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc 1 tcc 1 tac 1 tgc 1
atc 1 acc 1 aac 2 agc 1
ctc 2 ccc 1 cac 1 cgt 2
gtc 3 gcc 1 gac 2 ggc 2
tta 1 tca 1 taa tga
ata 1 aca 1 aaa 1 aga 1
cta 1 cca 1 caa 1 cga 0
gta 1 gca 1 gaa 2 gga 1
ttg 1 tcg 1 tag tgg 1
atg 4 acg 1 aag 1 agg 1
ctg 1 ccg 1 cag 1 cgg 1
gtg 1 gcg 1 gag 1 ggg 1
A2c. abq Azospirillum brasilense strain Az39
g1    t1    20    88   87
ttt tct tat tgt
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc 2 tcc 1 tac 2 tgc 1
atc 8 acc 2 aac 3 agc 1
ctc 2 ccc 1 cac 2 cgt 2
gtc 2 gcc 3 gac 4 ggc 4
tta 1 tca 1 taa tga
ata 1 aca 1 aaa 1 aga 1
cta 1 cca 1 caa 1 cga 0
gta 1 gca 8 gaa 1 gga 1
ttg 1 tcg 1 tag tgg 2
atg 3/1 acg 1 aag 2 agg 1
ctg 3 ccg 2 cag 2 cgg 1
gtg 2 gcg 2 gag 2 ggg 1
A9c. abs Azospirillum brasilense strain Sp245
g1    t1    20    85   82
ttt tct tat tgt
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc 2 tcc 1 tac 2 tgc 1
atc 4 acc 2 aac 3 agc 1
ctc 2 ccc 1 cac 2 cgt 2
gtc 2 gcc 3 gac 4 ggc 4
tta 1 tca 1 taa tga
ata 1 aca 1 aaa 1 aga 1
cta 1 cca 1 caa 1 cga 0
gta 1 gca 4 gaa 1 gga 2
ttg 1 tcg 1 tag tgg 2
atg 5/1 acg 1 aag 2 agg 1
ctg 3 ccg 2 cag 2 cgg 1
gtg 2 gcg 2 gag 2 ggg 1
A3c. oan Ochrobactrum anthropi ATCC 49188
g1    t1    11    61   59
ttt tct tat tgt
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc 1 tcc 1 tac 1 tgc 1
atc 4 acc 1 aac 1 agc 1
ctc 1 ccc 1 cac 1 cgt 1
gtc 1 gcc 1 gac 2 ggc 2
tta 1 tca 1 taa tga 1
ata 1 aca 1 aaa 1 aga 1
cta 1 cca 1 caa 1 cga 0
gta 1 gca 4 gaa 2 gga 1
ttg 1 tcg 1 tag tgg 1
atg 5/2 acg 1 aag 1 agg 1
ctg 1 ccg 1 cag 1 cgg 1
gtg 1 gcg 0 gag 1 ggg 1
A4c. rru Rhodospirillum rubrum ATCC 11170
g1    t1    12    55   55
ttt tct tat tgt
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc 1 tcc 1 tac 1 tgc 1
atc 4 acc 2 aac 1 agc 1
ctc 1 ccc 1 cac 1 cgt 1
gtc 1 gcc 2 gac 1 ggc 1
tta 1 tca 1 taa tga
ata 1 aca 1 aaa 1 aga 1
cta 1 cca 1 caa 1 cga 0
gta 1 gca 4 gaa 1 gga 1
ttg 1 tcg 1 tag tgg 1
atg 3/1 acg 1 aag 1 agg 1
ctg 1 ccg 1 cag 1 cgg 1
gtg 1 gcg 1 gag 1 ggg 1
A5c. rpm Rhodospirillum photometricum
g1    t1    25    95   95
ttt tct tat tgt
att act aat agt
ctt cct cat cgc
gtt gct gat 1 ggt
ttc 4 tcc 1 tac 1 tgc 1
atc 7 acc 3 aac 2 agc 1
ctc 1 ccc 2 cac 2 cgt 3
gtc 2 gcc 4 gac 2 ggc 4
tta 1 tca 1 taa tga
ata 2 aca 2 aaa 4 aga 1
cta 1 cca 2 caa 1 cga 0
gta 1 gca 2 gaa 2 gga 1
ttg 1 tcg 1 tag tgg 1
atg 5/2 acg 1 aag 3 agg 1
ctg 5 ccg 2 cag 2 cgg 1
gtg 2 gcg 3 gag 2 ggg 1
A6c. agr Agrobacterium sp. H13-3
g1    t1    9    58   58
ttt tct tat tgt
att act aat agt
ctt 1 cct cat cgc
gtt gct gat ggt
ttc 1 tcc 1 tac 1 tgc 1
atc 5 acc 1 aac 1 agc 1
ctc 1 ccc 1 cac 1 cgt 1
gtc 1 gcc 1 gac 2 ggc 2
tta 1 tca 1 taa tga
ata 1 aca 1 aaa 1 aga 1
cta 1 cca 1 caa 1 cga 0
gta 1 gca 5 gaa 2 gga 1
ttg 1 tcg 1 tag tgg 1
atg 6/1 acg 1 aag 1 agg 0
ctg 1 ccg 1 cag 1 cgg 1
gtg 0 gcg 0 gag 0 ggg 1
A78c. rpl Rickettsia prowazekii et rtb typhi
g1    t1    2    33   33
ttt tct tat tgt
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc 1 tcc 1 tac 1 tgc 1
atc 1 acc 1 aac 1 agc 1
ctc 1 ccc 0 cac 1 cgt 1
gtc 1 gcc 1 gac 1 ggc 1
tta 1 tca 1 taa tga
ata 1 aca 1 aaa 1 aga 1
cta 1 cca 1 caa 1 cga 0
gta 1 gca 1 gaa 1 gga 1
ttg 0 tcg 0 tag tgg 1
atg 1/1 acg 1 aag 0 agg 0
ctg 0 ccg 0 cag 0 cgg 1
gtg 0 gcg 0 gag 0 ggg 0

gamma codes

  • Lien tableur: gamma codes
  • Légende: prélèvement de la base gtRNAdb le 19/1/20 Paris
    - totaux en en-tête, exemple pour G1c, 88642 86720, 88642 total de la requête pour tout gamma dans gtRNAdb, 86720 total du tableau.
    - Voir la légende des tris et couleurs, g1 t1.
  • Liens aux indices de l'ensemble des alpha et de l'ensemble des bacilli
Gc. Code génétique des gammaproteobacteria
G1c. Effectifs
g1    t1    1161    88462 86720
ttt 18 tct 20 tat 15 tgt 2
att 1 act 6 aat 2 agt 0
ctt 11 cct 1 cat 3 cgc 0
gtt 6 gct 0 gat 0 ggt 6
ttc 2075 tcc 1 795 tac 2 687 tgc 1345
atc 3369 acc 1 829 aac 3 679 agc 1256
ctc 1204 ccc 1 012 cac 1 369 cgt 3520
gtc 2046 gcc 1 973 gac 3 421 ggc 4151
tta 1422 tca 1 662 taa 12 tga 762
ata 10 aca 1 666 aaa 4 457 aga 1784
cta 1516 cca 1 671 caa 2 239 cga 156
gta 3798 gca 3 342 gaa 3 829 gga 1347
ttg 1214 tcg 984 tag 32 tgg 1340
atg 7009 acg 845 aag 282 agg 1298
ctg 2977 ccg 729 cag 1208 cgg 1182
gtg 98 gcg 82 gag 90 ggg 855
G2c. gamma indice pour 100 génomes
g1    t1    1161    88462 7469
ttt 1.55 tct 1.72 tat 1.29 tgt 0.17
att 0.09 act 0.52 aat 0.17 agt 0
ctt 0.95 cct 0.09 cat 0.26 cgc 0
gtt 0.52 gct 0 gat 0 ggt 0.52
ttc 179 tcc 155 tac 231 tgc 116
atc 290 acc 158 aac 317 agc 108
ctc 104 ccc 87 cac 118 cgt 303
gtc 176 gcc 170 gac 295 ggc 358
tta 122 tca 143 taa 1.03 tga 66
ata 0.86 aca 143 aaa 384 aga 154
cta 131 cca 144 caa 193 cga 13.4
gta 327 gca 288 gaa 330 gga 116
ttg 105 tcg 85 tag 2.76 tgg 115
atg 604 acg 73 aag 24.3 agg 112
ctg 256 ccg 63 cag 104 cgg 102
gtg 8.4 gcg 7.1 gag 7.8 ggg 74

rpm distribution

aac2 aag2 acc3 atgj2 cag2 ccg2 cgt3 ctg5 gaa2 gac2 gcc4 gcg3 ggc4 gtg2 ttc4
gca >1 16s
Al3 rpm, Rhodospirillum photometricum DSM 122. alpha.
g1    t1       
atgi 2 tct tat atgf 5
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc 4 tcc 1 tac 1 tgc 1
atc 7 acc 3 aac 2 agc 1
ctc 1 ccc 2 cac 2 cgt 3
gtc 2 gcc 4 gac 2 ggc 4
tta 1 tca 1 taa tga
ata aca 2 aaa 3 aga 1
cta 1 cca 2 caa 1 cga
gta 1 gca 2 gaa 2 gga 1
ttg 1 tcg 1 tag tgg 1
atgj 2 acg 1 aag 2 agg 1
ctg 5 ccg 2 cag 2 cgg 1
gtg 2 gcg 3 gag 2 ggg 1
alpha >1aa =1aa -5s +5s -16s +16s total
rpm 49 30 5 8 92

Rhodospirillum rubrum ATCC 11170

rru opérons

  • Lien tableur: rru opérons
  • Liens: gtRNAdb [14], NCBI [15], génome [orgn]
  • Phylogénie: Bacteria; Proteobacteria; Alphaproteobacteria; Rhodospirillales; Rhodospirillaceae; Rhodospirillum.
  • Légende: cdsa: cds aas, cdsd: cds dirigé
A4. Rhodospirillum rubrum ATCC 11170
64.97%GC 26.12.19 Paris  55   doubles intercal cds aa avec aa cdsa cdsd protéines
chromosome
comp 16232..16852 cds 163 163 207 3'-5' exonuclease
comp 17016..17102 ctg 253 253
17356..18378 cds 341 3-beta-hydroxy-delta(5)-steroid dehydrogenase
117072..117287 cds 37 37 72 slyX
comp 117325..117401 agg 341 341
117743..123022 cds 1760 alpha-2-macroglobulin-like protein
comp 149921..151015 cds 225 225 365 hp
151241..151317 cgg 136 136
comp 151454..152929 cds 492 chemotaxis sensory transducer protein
189941..191668 cds 859 859 576 sulfate transporter/antisigma-factor antagonist
192528..194004 16s 184 1477
194189..194265 atc 66 66
194332..194407 gca 362
194770..197527 23s 119 2758
197647..197761 5s 96 115
197858..197934 atgf 287 287
comp 198222..198455 cds 78 hp
comp 305449..306648 cds 257 257 400 Ppx/GppA phosphatase
306906..306979 cag 319 319
comp 307299..308303 cds 335 LacI family transcriptional regulator
comp 322896..323807 cds 292 292 304 hp
comp 324100..324174 caa 98 98
comp 324273..325601 cds 443 chemotaxis sensory transducer protein
362552..362881 cds 224 224 110 hp
363106..363181 gcc + 202 202
363384..363459 gcc 2 gcc 43 43
comp 363503..364531 cds 343 esterase
407067..407606 cds 92 92 180 YbaK/prolyl-tRNA synthetase associated domain-containing protein
407699..407790 agc 141 141
407932..408774 cds 281 hp
466945..467925 cds 115 115 327 hp
comp 468041..468126 tta 83 83
comp 468210..468458 cds 83 hp
comp 559038..559610 cds 86 86 191 OsmC-like protein
559697..559772 aag 140 140
559913..560608 cds 232 hp
comp 794877..795188 cds -81 -81 104 hp
comp 795108..795188 Sig-pep 217 217 27 hp
795406..795496 tcc 44 44
795541..795846 cds 102 hp
comp 908584..910185 cds -102 -102 534 peptidase M23B
comp 910084..910185 Sig-pep @1 1212 1212 34 hp
911398..912874 16s 182 1477
913057..913133 atc 66 66
913200..913275 gca 361
913637..916394 23s 118 2758
916513..916627 5s 95 115
916723..916799 atgf 573 573
917373..921860 cds 1496 hp
1159249..1160091 cds 71 71 281 Linocin_M18 bacteriocin protein
1160163..1160238 gag 117 117
1160356..1160613 cds 86 prevent-host-death protein
comp 1464820..1465122 cds 283 283 101 50S ribosomal protein L21
1465406..1465495 tcg 139 139
comp 1465635..1466303 cds 223 cytochrome B561
1791953..1792159 cds 116 116 69 hp
comp 1792276..1792351 gaa 131 131
comp 1792483..1792689 cds 69 cold-shock DNA-binding protein family protein
1824302..1825738 cds 98 98 479 malonyl-CoA decarboxylase
1825837..1825921 cta 102 102
1826024..1827415 cds 464 trigger factor
1833133..1833408 cds 284 284 92 histone-like DNA-binding protein
1833693..1833768 gta 70 70
comp 1833839..1835326 cds 496 methyl-accepting chemotaxis sensory transducer
1933506..1934138 cds -633 -633 211 hp
1933506..1933652 Sig-pep 571 571 49 hp
1934224..1934300 cca 63 63
1934364..1934663 cds 12 12 100 ETC complex I subunit region
1934676..1934752 aga 396 396
1935149..1939624 cds 1492 hp
1959133..1959858 cds 175 175 242 MerR family transcriptional regulator
1960034..1960110 ccc @2 1062 1062
1961173..1961367 cds 65 hp
comp 1996760..1998124 cds -120 -120 455 lytic murein transglycosylase
comp 1998005..1998124 Sig-pep 119 119 40 hp
1998244..1998333 tca 927 927
comp 1999261..1999929 cds 223 hp
2032027..2032863 cds 123 123 279 phage integrase
comp 2032987..2033062 aaa 186 186
comp 2033249..2033755 cds 169 peptidyl-prolyl isomerase
comp 2093327..2093977 cds 295 295 217 protein-L-isoaspartate(D-aspartate) O-methyltransferase
2094273..2094346 tgc 81 81
2094428..2094502 aac 150 150
2094653..2094916 cds 88 prevent-host-death protein
comp 2304404..2305834 cds 89 89 477 divalent cation transporter
comp 2305924..2306010 ctc 178 178
2306189..2306839 cds 217 lipoate-protein ligase B
2331183..2331521 cds 73 73 113 hp
2331595..2331671 atgj 126 126
comp 2331798..2332040 cds 81 hp
comp 2411337..2411804 cds -72 -72 156 CreA
comp 2411733..2411804 Sig-pep 202 202 24 hp
comp 2412007..2412083 cac 75 75
comp 2412159..2413343 cds 395 hp
2729598..2731271 cds 449 449 558 macrocin-O-methyltransferase
comp 2731721..2731797 atgf 95
comp 2731893..2732007 5s 119 115
comp 2732127..2734884 23s 362 2758
comp 2735247..2735322 gca 66 66
comp 2735389..2735465 atc 184
comp 2735650..2737126 16s 606 606 1477
comp 2737733..2738110 cds 126 hp
comp 2959802..2961874 cds 354 354 691 chemotaxis sensory transducer protein
comp 2962229..2962303 gtc 123 123
2962427..2963359 cds 311 N-formylglutamate amidohydrolase
comp 3124836..3125033 cds 151 151 66 preprotein translocase subunit SecE
comp 3125185..3125260 tgg 343 343
comp 3125604..3126794 cds 93 93 397 elongation factor Tu
comp 3126888..3126961 gga 27 27
comp 3126989..3127074 tac 37 37
3127112..3128158 cds 57 57 349 23s rRNA (guanosine(2251)-2'-O)-methyltransferase RlmB
3128216..3128291 aca 127 127
3128419..3128652 cds 78 hp
comp 3193350..3194507 cds 430 430 386 acyltransferase
comp 3194938..3195013 ttc 103 103
comp 3195117..3195635 cds 173 hp
3320745..3322115 cds -1371 -1371 457 virulence protein
3320745..3320816 Sig-pep 1389 1389 24 hp
comp 3322206..3322281 atgi 60 60
comp 3322342..3324432 cds 697 RNA polymerase sigma factor RpoD
comp 3377932..3378114 cds 140 140 61 hp
3378255..3378329 acc + 165 165
3378495..3378569 acc 2 acc 237 237
3378807..3379370 cds 234 234 188 hp
3379605..3379681 gac 77 77
comp 3379759..3380517 cds 253 diguanylate phosphodiesterase
comp 3399207..3399494 cds 262 262 96 hp
comp 3399757..3399833 ccg 56 56
comp 3399890..3400972 cds 361 farnesyltranstransferase
3490378..3491148 cds 84 84 257 2-phosphoglycolate phosphatase
3491233..3491307 gtg 407 407
3491715..3492080 cds 122 hp
comp 3719367..3719753 cds 163 163 129 hp
comp 3719917..3719990 ggg 95 95
comp 3720086..3720859 cds 258 enoyl-ACP reductase
3805869..3806813 cds 130 130 315 inner-membrane translocator
comp 3806944..3807058 5s 116 115
comp 3807175..3809932 23s 362 2758
comp 3810295..3810370 gca 66 66
comp 3810437..3810513 atc 184
comp 3810698..3812174 16s 1227 1227 1477
3813402..3814118 cds 239 transposase
comp 3824154..3825854 cds 76 76 567 phage integrase
comp 3825931..3826007 cgt 387 387
3826395..3827531 cds 379 hp
4021982..4023163 cds 27 27 394 diguanylate phosphodiesterase
comp 4023191..4023277 ttg 224 224
4023502..4023855 cds 118 hp
comp 4058818..4059117 cds 187 187 100 hp
4059305..4059380 gcg 179 179
comp 4059560..4060126 cds 189 hp
comp 4105626..4107317 cds -114 -114 564 chemotaxis sensory transducer
comp 4107204..4107317 Sig-pep 721 721 38 hp
comp 4108039..4108113 acg 148 148
4108262..4108843 cds 194 D-alpha,beta-D-heptose 1,7-bisphosphate phosphatase
comp 4261100..4262038 cds 269 269 313 thioredoxin-like protein
4262308..4262382 ggc 118 118
4262501..4263136 cds 212 lysine exporter protein LysE/YggA

rru cumuls

cumuls. rru.
opérons Fréquences intercalaires tRNAs Fréquences intercalaires cds Fréquences aas cds chromosome
effectif gammes sans rRNAs avec rRNAs gammes cds gammes cdsd gammes cdsa gammes cdsa 300
avec rRNA opérons 4 1 1 7 1 100 23 1 0
16atcgca235 1 20 50 6 40 200 17 30 3
Id-atgf 3 40 1 100 19 80 300 16 60 4
- 60 150 20 120 400 17 90 12
max a 3 80 4 200 8 160 500 8 120 10
a doubles 0 100 1 250 7 200 600 5 150 3
spéciaux 0 120 300 9 240 700 2 180 4
total aas 11 140 350 3 280 800 0 210 5
sans opérons 40 160 400 3 320 900 0 240 8
1 aa 36 180 1 450 3 360 1000 0 270 4
max a 2 200 500 0 400 1100 0 300 3
a doubles 2 1 10 3 35
total aas 44 4 4 95 0 91 91
total aas 55
remarques
avec jaune moyenne 119 66 208 292
variance 79 0 333 187
sans jaune moyenne 148 237 140
variance 83 132 69

rru blocs

  • Lien tableur: rru blocs
  • Légende:
    sulfate sulfate transporter/antisigma-factor antagonist
    inner   inner-membrane translocator
    macrocin macrocin-O-methyltransferase
    peptidase peptidase M23B
    hp    Hypothetical protein
A4. rru, blocs à rRNA.
cds 859 576 sulfate cds 606 126 hp
16s 184 1477 16s 184 1477
atc 66 atc 66
gca 362 gca 362
23s 119 2758 23s 119 2758
5s 96 115 5s 95 115
atgf 287 atgf 449
cds 78 hp cds 558 macrocin
cds -102 534 peptidase
Sig-pep 1212 34 hp cds 1227 239 transposase
16s 182 1477 16s 184 1477
atc 66 atc 66
gca 361 gca 362
23s 118 2758 23s 116 2758
5s 95 115 5s 130 115
atgf 573 cds 315 inner
cds 1496 hp

rru remarques

  • Remarques: Par rapport aux rickettsia rtb et rpl, les intercalaires élevés sont rares.
    1. @ Les intercalaires élevés
      - il n’y a pas d’aas isolés et les mineurs des blocs à rRNAs sont normaux pour ces blocs, inférieurs à 573.
      - Pour les aas il n’y a que 5 intercalaires élevés entre 571-1389, et 2 dépassant à peine 400 pbs.
      - Pour les blocs à rRNAs il n’y a que 3 intercalaires franchement élevés, 1227 1212 859.
    2. @ Sig-pep, signal peptide.
      - Il y a 580 sig-peptide dans ce génome. Dans le tableau des opérons ce sont de petites séquences peptidiques de moins de 30 aas placsés au début du cds. D’où l’intercalaire négatif.
      - Dans le tableau sur les 7 seg-pep, 4 sont associés à des intercalaires élevés (voir tableau ci-dessous) et 3 à des intercalaires inférieurs à 219 pbs.
  • Note: Les 4 blocs à rRNAs sont tous complets ayant atcgca en interne dont 3 ont atgf qui suit 5s. Aucun bloc ne contient un cds en interne.
  • Séquences des doubles: Sur 40 blocs sans rRNAs seulement 4 ont 2 aas dont 2 ont un doublet, gcc et acc.
  • Tableau des intercalaires
16s			aas			Sig-pep
adresse	intercalaire	adresse	intercalaire	intercalaire
911398	1212-573	atgi	3322206	1389	1389
2735650	606-449		ccc	1960034	1062	1212
3810698	1227-130	tca	1998244	927	721
192528	859-257		acg	4108039	721	571
			cca	1934224	571	3 <219
			ttc	3194938	430	
			gtg	3491233	407	

rru distribution

Al4 rru, Rhodospirillum rubrum ATCC 11170. alpha.
g1    t1       
atgi 1 tct tat atgf 3
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc 1 tcc 1 tac 1 tgc 1
atc 4 acc 2 aac 1 agc 1
ctc 1 ccc 1 cac 1 cgt 1
gtc 1 gcc 2 gac 1 ggc 1
tta 1 tca 1 taa tga
ata aca 1 aaa 1 aga 1
cta 1 cca 1 caa 1 cga
gta 1 gca 4 gaa 1 gga 1
ttg 1 tcg 1 tag tgg 1
atgj 1 acg 1 aag 1 agg 1
ctg 1 ccg 1 cag 1 cgg 1
gtg 1 gcg 1 gag 1 ggg 1
alpha >1aa =1aa -5s +5s -16s +16s total
rru 8 36 3 8 55

rru intercalaires entre cds

  • Rhodospirillum rubrum ATCC 11170, 10.3.2020, NCBI [16]
  • Note: Pour les génomes des annexes j'ai relevé les intercalaires entre tRNAs et entre ceux-ci et les cds qui leur sont adjacents. L'exemple est celui de rru du clade alpha. L'idée de départ de ces prélèvements est la recherche d'opérons formés de tRNA et de protéine comme dans le cas d'E.coli: l'intercalaire entre le tRNA et la protéine devrait être faible. Voir l'exemple d'eco (remarque @3) avec tac-tac-tpr et aca-tac-gga-acc-tufB.

rru les fréquences

  • Lien tableur: rru intercalaires entre cds
  • Légende:   long, longueur en pbs,   intercal pour intercalaire
    - fréquence-1 1 5 6 f, respectivement fréquence des intercalaires négatives à l'unité, positives à l'unité, par blocs de 5, par blocs de 10 jusqu'à 600 pbs et f pour finales. Ces fréquences servent à faire les diagrammes. La fréquence fréquencez est l'étendue à 1200 de la fréquence6 pour certains grands génomes.
    - cumul,% colonne à la droite de frequence6, reprend les fréquences par plages et leurs pourcentages indiqués déjà dans la 1ère partie du tableau.
    - La couleur cyan des fréquences fréquence-1 et 1 sert à montrer leur périodicité ternaire.
    - intercaln intercalx, pour les intercalaires négatifs minimaux et intercalaires positifs maximaux.
    - colonne ADN pour la longueur totale du génome en pbs et intercals pour le total en pbs des intercalaires entre cds uniquement, d'après la méthode des prélèvements de NCBI du 10.3.20.
rru Les fréquences des intercalaires entre cds
rru intercalaires total % intercalaires moyenne ecartype plage ADN intercal frequence5 intercal fréquencez
négatif 683 18.0 négatif -8 15 -73 à -1 4 352 825 -1 683 610 1
zéro 13 0.3 intercals 0 13 620 0
1 à 200 2368 62.5 0 à 200 78 58 429 144 5 180 630 5
201 à 370 535 14.1 201 à 370 268 46 9.9% 10 109 640 6
371 à 600 139 3.7 371 à 600 453 60 15 155 650 1
601 à max 48 1.3 601 à 1028 733 105 20 84 660 4
total 3786 <201 80.9 total 3779 112 136 -73 à 995 25 86 670 3
adresse intercalx intercal fréquence1 intercal fréquence6 cumul,% intercal fréquence-1 30 81 680 1
3818575 1469 -1 683 -70 8 0 13 35 54 690 2
844364 995 0 13 -60 5 -1 81 40 56 700 1
3816901 954 1 25 -50 8 -2 1 45 59 710 1
3134490 938 2 34 -40 8 -3 0 50 63 720 0
3477618 929 3 41 -30 6 min à -1 -4 421 55 67 730 0
1097019 885 4 47 -20 21 683 -5 0 60 67 740 3
3856065 884 5 33 -10 75 18.0% -6 2 65 61 750 0
566184 881 6 20 0 565 -7 5 70 52 760 1
1833839 873 7 16 10 289 -8 42 75 59 770 2
3136049 866 8 27 20 239 -9 0 80 52 780 3
2475546 802 9 20 30 167 -10 9 85 58 790 3
93164 788 10 26 40 110 -11 26 90 64 800 0
409696 787 11 41 50 122 -12 0 95 51 810 1
400635 785 12 37 60 134 -13 4 100 75 820 0
1366462 777 13 28 70 113 -14 13 105 49 830 0
3456663 777 14 28 80 111 -15 1 110 53 840 0
3312945 771 15 21 90 122 1 à 100 -16 3 115 49 850 0
550038 769 16 16 100 126 1533 -17 14 120 45 860 0
2493887 767 17 25 110 102 41% -18 0 125 44 870 1
1410707 755 18 16 120 94 -19 5 130 45 880 1
1423514 739 19 13 130 89 -20 7 135 48 890 3
2688282 734 20 14 140 92 -21 1 140 44 900 0
3627241 732 21 13 150 83 -22 1 145 41 910 0
2706640 702 22 20 160 87 -23 2 150 42 920 0
3937050 697 23 15 170 92 -24 0 155 44 930 1
1011650 686 24 17 180 62 -25 2 160 43 940 1
742860 682 25 21 190 68 1 à 200 -26 4 165 42 950 0
3424033 675 26 10 200 66 2368 -27 1 170 50 960 1
139185 669 27 18 210 45 62.5% -28 0 175 31 970 0
880072 663 28 20 220 56 -29 3 180 31 980 0
1976647 662 29 17 230 47 -30 0 185 28 990 0
2640270 659 30 16 240 39 -31 2 190 40 1000 1
90214 657 31 10 250 39 -32 1 195 39 1010 0
961964 656 32 14 260 43 664 200 27 1020 0
1209394 652 33 10 270 33 0 à 200 reste 32 205 19 1030 0
2536913 650 34 13 280 33 2381 total 696 210 26 1040 0
2591508 639 35 7 290 31 215 25 1050 0
55947 637 36 10 300 29 intercal frequencef 220 31 1060 0
1786743 636 37 13 310 33 600 3738 225 25 1070 0
2231609 636 38 11 320 22 620 1 230 22 1080 0
3609912 633 39 10 330 15 640 11 235 18 1090 0
3187318 631 40 12 340 19 660 5 240 21 1100 0
reste 2285 350 17 680 4 245 24 1110 0
total 3786 360 14 201 à 370 700 3 250 15 1120 0
370 20 535 720 1 255 21 1130 0
380 9 14.1% 740 3 260 22 1140 0
390 9 760 1 265 23 1150 0
adresses intercaln décalage long 400 9 780 5 270 10 1160 0
2068001 -137 shift2 1009 410 14 800 3 275 15 1170 0
651352 -122 comp 420 14 820 1 280 18 1180 0
2462962 -120 comp 430 9 840 0 285 13 1190 0
1155908 -106 comp 440 4 860 0 290 18 1200 0
2381188 -104 comp 450 15 880 2 295 14 reste 1
3871151 -104 comp 460 5 900 3 300 15 total 3786
4292550 -73 shift2 662 470 5 371 à 600 920 0 305 18
664620 -70 comp 480 4 139 940 2 310 15
3822351 -68 shift2 682 490 4 3.7% 960 1 315 10
3867765 -65 shift2 451 500 5 980 0 320 12
1091959 -64 shift2 1268 510 7 1000 1 325 8
3289914 -62 520 1 47 330 7
1568904 -61 530 3 335 11
465562 -59 540 4 340 8
2309068 -59 550 7 345 12
780196 -58 560 2 350 5
2759874 -55 570 1 355 7
3267314 -53 580 5 601 à max 360 7
210683 -52 590 1 48 365 7
1365051 -52 600 2 1.3% 370 13
622208 -50 reste 48 reste 1 reste 187
2342888 -49 total 3786 total 3786 total 3786

rru autres intercalaires

  • Lien tableur: rru autres intercalaires
  • Légende:  
    - comp, le gène est sur le brin complement
    - deb, fin sont respectivement dans le sens des adresses croissantes, le cds avant le 1er tRNA et le cds après le dernier tRNA du bloc.
rru Les autres intercalaires.
rru1 adresses1
deb-fin gènes adresses intercal sens
deb CDS 16232 163 comp
tRNA 17016 253 comp
fin CDS 17356
deb CDS 117072 37
tRNA 117325 299 comp
fin CDS 117701
deb CDS 149921 147 comp
tRNA 151241 136
fin CDS 151454 comp
deb CDS 189941 841
16s rRNA 192510 180
tRNA 194189 66
tRNA 194332 347
23s rRNA 194755 119
5s rRNA 197647 96
tRNA 197858 287
deb CDS 198222 222 comp
repeat_region 198678 145
fin CDS 200012 comp
deb CDS 211593 261 comp
repeat_region 213597 128
fin CDS 214303 comp
deb CDS 305449 257 comp
tRNA 306906 319
fin CDS 307299 comp
deb CDS 322896 406 comp
tRNA 324100 98 comp
fin CDS 324273 comp
deb CDS 362552 224
tRNA 363106 202
tRNA 363384 43
fin CDS 363503 comp
deb CDS 407067 92
tRNA 407699 141
fin CDS 407932
deb CDS 419952 57
repeat_region 420333 228
fin CDS 423032 comp
deb CDS 466945 115
tRNA 468041 83 comp
fin CDS 468210 comp
deb CDS 529650 67
repeat_region 530056 180
fin CDS 530734 comp
deb CDS 536858 111 comp
regulatory 537266 38
fin CDS 537511
deb CDS 559038 239 comp
tRNA 559697 170
fin CDS 559943
deb CDS 571949 20
regulatory 572902 194
fin CDS 573329
deb CDS 794877 217 comp
tRNA 795406 86
fin CDS 795583
deb CDS 908584 1193 comp
16s rRNA 911379 178
tRNA 913057 66
tRNA 913200 346
23s rRNA 913622 118
5s rRNA 916513 95
tRNA 916723 738
fin CDS 917538
deb CDS 988887 204
repeat_region 989382 533
fin CDS 992381 comp
deb CDS 1144656 314 comp
ncRNA 1145438 15 comp
fin CDS 1145882 comp
deb CDS 1159249 71
tRNA 1160163 117
fin CDS 1160356
deb CDS 1339162 168
regulatory 1340533 238
fin CDS 1340988
rru2 adresses2
deb-fin gènes adresses intercal sens
deb CDS 1362782 177 comp
repeat_region 1363865 208
fin CDS 1364648 comp
deb CDS 1464820 283 comp
tRNA 1465406 139
fin CDS 1465635 comp
deb CDS 1499517 136 comp
regulatory 1501675 100 comp
fin CDS 1502001
deb CDS 1578910 1039
repeat_region 1580591 284
fin CDS 1582246 comp
deb CDS 1692844 162 comp
repeat_region 1694053 193
fin CDS 1696161 comp
deb CDS 1706399 230 comp
regulatory 1707586 93
fin CDS 1707876
deb CDS 1791953 116
tRNA 1792276 131 comp
fin CDS 1792483 comp
deb CDS 1824299 98
tRNA 1825837 150
fin CDS 1826072
deb CDS 1833133 284
tRNA 1833693 70
fin CDS 1833839 comp
deb CDS 1933548 85
tRNA 1934224 63
deb CDS 1934364 12
tRNA 1934676 396
fin CDS 1935149
deb CDS 1959133 175
tRNA 1960034 215
fin CDS 1960326
deb CDS 1996760 164 comp
tRNA 1998244 261
fin CDS 1998595 comp
deb CDS 2008544 206 comp
regulatory 2009119 129
fin CDS 2009470
deb CDS 2031997 123
tRNA 2032987 186 comp
fin CDS 2033249 comp
deb CDS 2093327 295 comp
tRNA 2094273 81
tRNA 2094428 150
fin CDS 2094653
deb CDS 2304404 89 comp
tRNA 2305924 178 comp
fin CDS 2306189
deb CDS 2318681 138 comp
regulatory 2319857 73
fin CDS 2320063
deb CDS 2331183 73
tRNA 2331595 126
fin CDS 2331798 comp
deb CDS 2411337 202 comp
tRNA 2412007 75 comp
fin CDS 2412159 comp
deb CDS 2550773 186 comp
regulatory 2551172 147
fin CDS 2551477
deb CDS 2559473 36
tmRNA 2560658 131
fin CDS 2561126
deb CDS 2667051 354
repeat_region 2668113 204
fin CDS 2669862 comp
deb CDS 2714978 129
repeat_region 2715965 262
fin CDS 2716563
rru3 adresses3
deb-fin gènes adresses intercal sens
deb CDS 2729598 449
tRNA 2731721 95 comp
5s rRNA 2731893 119 comp
23s rRNA 2732127 347 comp
tRNA 2735247 66 comp
tRNA 2735389 180 comp
16s rRNA 2735646 972 comp
fin CDS 2738117 comp
deb CDS 2959802 354 comp
tRNA 2962229 171 comp
fin CDS 2962475
deb CDS 3124836 151 comp
tRNA 3125185 343 comp
deb CDS 3125604 93 comp
tRNA 3126888 27 comp
tRNA 3126989 166 comp
deb CDS 3127241 57
tRNA 3128216 127
fin CDS 3128419
deb CDS 3193350 430 comp
tRNA 3194938 103 comp
fin CDS 3195117 comp
deb CDS 3320745 90
tRNA 3322206 60 comp
fin CDS 3322342 comp
deb CDS 3377932 140 comp
tRNA 3378255 165
tRNA 3378495 237
deb CDS 3378807 234
tRNA 3379605 77
fin CDS 3379759 comp
deb CDS 3399207 262 comp
tRNA 3399757 56 comp
fin CDS 3399890 comp
deb CDS 3490378 84
tRNA 3491233 407
fin CDS 3491715
deb CDS 3514107 56 comp
regulatory 3515291 4 comp
regulatory 3515401 88 comp
fin CDS 3515601 comp
deb CDS 3523910 371
repeat_region 3524497 79
fin CDS 3525452 comp
deb CDS 3705744 56 comp
regulatory 3707042 399 comp
fin CDS 3707518
deb CDS 3719367 163 comp
tRNA 3719917 95 comp
fin CDS 3720086 comp
deb CDS 3805869 130
5s rRNA 3806944 116 comp
23s rRNA 3807175 347 comp
tRNA 3810295 66 comp
tRNA 3810437 180 comp
16s rRNA 3810694 999 comp
fin CDS 3813192
deb CDS 3824154 103 comp
tRNA 3825931 387 comp
fin CDS 3826395
deb CDS 3996560 58 comp
ncRNA 3998598 106 comp
fin CDS 3998802 comp
deb CDS 4021982 27
tRNA 4023191 224 comp
fin CDS 4023502
deb CDS 4058818 187 comp
tRNA 4059305 179
fin CDS 4059560 comp
deb CDS 4105626 721 comp
tRNA 4108039 148 comp
fin CDS 4108262
deb CDS 4261100 269 comp
tRNA 4262308 118
fin CDS 4262501

rru intercalaires tRNA

  • Lien tableur: rru intercalaires tRNA
  • Légende:
    - comp', l'intercalaire est entre un gène comp (sur le complément) et un gène sur le brin direct. Continu les 2 gènes sont sur le même brin.
    - deb, fin sont les intercalaires des cds du tableau précédent, autres intercalaires: respectivement dans le sens des adresses croissantes, le cds avant le 1er tRNA et le cds après le dernier tRNA du bloc.
  • Cumuls comp'+continu du tableau
	deb	fin	total
<201	25	29	54
total	41	42	83
taux	61%	69%	65%
rru intercalaires tRNA
rru les relevés deb-fin
comp’ entre tRNAs comp’ deb comp’ fin
66 163 comp’ 253
202 comp’ 37 comp’ 299
66 comp’ 147 comp’ 136
81 287
66 comp’ 257 comp’ 319
27 406 98
165 224 comp’ 43
66 92 141
comp’ 115 83
comp’ 239 170
comp’ 217 86
738
71 117
comp’ 283 comp’ 139
comp’ 116 131
98 150
284 comp’ 70
85 63
12 396
175 215
comp’ 164 comp’ 261
comp’ 123 186
comp’ 295 150
89 comp’ 178
73 comp’ 126
202 75
comp’ 449
354 comp’ 171
151 343
93 comp’ 166
57 127
430 103
comp’ 90 60
comp’ 140 237
234 comp’ 77
262 56
84 407
163 95
103 comp’ 387
comp’ 27 comp’ 224
comp’ 187 comp’ 179
721 comp’ 148
comp’ 269 118
rru intercalaires inférieures à 201 pbs
deb fin continu cumuls
12 56 deb
57 60 <201 15
71 63 total 24
73 75 taux 63%
84 83
85 86 fin
89 95 <201 18
92 98 total 25
93 103 taux 72%
98 117
103 118 total
151 127 <201 33
163 131 total 49
163 141 taux 67%
175 150
202 150
224 170
234 186
262 215
284 237
354 287
406 343
430 396
721 407
- 738 comp’ cumuls
27 43
37 70 deb
90 77 <201 10
115 126 total 17
116 136 taux 59%
123 139
140 148 fin
147 166 <201 11
164 171 total 17
187 178 taux 65%
217 179
239 224 total
257 253 <201 21
269 261 total 34
283 299 taux 62%
295 319
449 387

rru intercalaires rRNA

  • Voir la présentation des blocs à rRNA dans le chapitre rru blocs de l'étude préliminaire. A comparer avec le tableau rru autres intercalaires.
  • Remarque: Quand le 16s n'est pas précédé de tRNAs l'intercalaire cds-16s est élevé, pour le 4ème bloc il est ici de 1227 pbs. L'intercalaire cds-bloc de l'autre côté du bloc est beaucoup plus faible, ici 130 pbs. Les 3 autres blocs ont un aa après le 5s et conserve la même orientation. Cette orientation est quasiment générale chez tous les génomes que j'ai étudié ici. Je l'ai notée dans les chapitres génome-bloc de chaque génome.
  • Note: J'ai supposé souvent que les blocs à tRNA sans rRNA sont aussi orientés de l'intercalaire le plus grand au plus petit. Dans rru cumuls et de même pour les autres génomes, j'ai noté cette orientation dans la colonne cdsd, pour cds dirigé. Je n'ai conservé pour les calculs que le plus petit intercalaire des 2 cds bordant le bloc. L'idée était que cette orientation provoquait la création du cds en fin de bloc. Ces cds sont souvent de petites protéines et souvent hypothétiques. Aussi je présente ci-dessous la transformation deb-fin qui est imposée par l'adressage en intercalaire plus grand et plus petit.
deb	fin		tri	grand	petit		deb	fin		tri	grand	petit
163	253		17	396	12		295	150		5	406	98
37	299		37	224	27		89	178		14	150	98
147	136		2	299	37		73	126		29	430	103
257	319		6	224	43		202	75		36	387	103
406	98		33	262	56		354	171		13	131	116
224	43		28	127	57		151	343		40	269	118
92	141		30	90	60		93	166		20	186	123
115	83		16	85	63		57	127		3	147	136
239	170		15	284	70		430	103		12	283	139
217	86		11	117	71		90	60		31	237	140
71	117		23	126	73		140	237		39	721	148
283	139		24	202	75		234	77		21	295	150
116	131		32	234	77		262	56		26	343	151
98	150		8	115	83		84	407		1	253	163
284	70		34	407	84		163	95		19	261	164
85	63		10	217	86		103	387		9	239	170
12	396		22	178	89		27	224		25	354	171
175	215		7	141	92		187	179		18	215	175
164	261		27	166	93		721	148		38	187	179
123	186		35	163	95		269	118		4	319	257

Ochrobactrum anthropi ATCC 49188

oan opérons

  • Lien tableur: oan opérons
  • Liens: gtRNAdb [17], NCBI [18], génome [orgn]
  • Phylogénie: Bacteria; Proteobacteria; Alphaproteobacteria; Rhizobiales; Brucellaceae; Ochrobactrum.
  • Légende: cdsa: cds aas, cdsd: cds dirigé
A3. Ochrobactrum anthropi ATCC 49188
56.1%GC 27.12.19 Paris  61   doubles intercal cds aa avec aa cdsa cdsd protéines
chromosom1
34057..34446 cds 224 224 130 TIGR02300 family protein
34671..34746 gcc @1 -40 -40
34707..35480 cds 258 glutathione S-transferase family protein
223549..224394 cds 164 164 282 3'(2'),5'-bisphosphate nucleotidase CysQ
224559..224635 ccg 109 109
comp 224745..225806 cds 354 site-specific integrase
comp 337757..338197 cds 158 158 147 DMT family transporter
comp 338356..338431 ttc 171 171
comp 338603..338818 cds 72 DNA gyrase inhibitor YacG
comp 344419..344598 cds 147 147 60 hp
344746..344820 acc 397 397
345218..346030 cds 271 DUF2189 domain-containing protein
comp 351922..353328 cds 167 167 469 deoxyribodipyrimidine photo-lyase
comp 353496..353572 cgt 159 159
comp 353732..355285 cds 518 HAMP domain-containing histidine kinase
comp 725472..726479 cds 219 219 336 glycosyltransferase family 4 protein
726699..726773 caa 61 61
comp 726835..727413 cds 193 hp
comp 934613..934987 cds 333 333 125 transposase
comp 935321..935397 agg 114 114
comp 935512..936675 cds 388 amidohydrolase
1049919..1051202 cds 24 24 428 cystathionine gamma-synthase family protein
comp 1051227..1051311 ttg @2 593 593
comp 1051905..1053539 cds 545 phosphoethanolamine transferase
comp 1081066..1083021 cds 998 998 652 M23 family metallopeptidase
1084020..1085508 16s 268 1489
1085777..1085853 atc 11 11
1085865..1085940 gca 39 39
>comp 1085980..1086168 cds @3 38 38 63 P-hp
1086207..1089125 23s 186 2919
1089312..1089426 5s 54 115
1089481..1089557 atgf 363 363
1089921..1090091 cds 57 LysR family transcriptional regulator
1096454..1096912 cds 7 7 153 hp
comp 1096920..1097009 tcg 352 352
1097362..1097751 cds 130 50S ribosomal protein L21
1311344..1311823 cds 211 211 160 hp
1312035..1312109 gag 88 88
1312198..1312467 cds 90 hp
1344750..1345565 cds 677 677 272 IclR family transcriptional regulator
1346243..1347731 16s 268 1489
1348000..1348076 atc 11 11
1348088..1348163 gca 39 39
>comp 1348203..1348391 cds 38 38 63 P-hp
1348430..1351348 23s 186 2919
1351535..1351649 5s 54 115
1351704..1351780 atgf 360 360
1352141..1353082 cds 314 LysR family transcriptional regulator
1354558..1355604 cds 85 85 349 polysaccharide deacetylase family protein
comp 1355690..1355764 ggc 136 136
comp 1355901..1357280 cds 460 MFS transporter
comp 1386666..1387982 cds 819 819 439 hp
comp 1388802..1388891 tcc 374 374
1389266..1389589 cds 108 hp
comp 1405236..1405859 cds 139 139 208 5,6-dimethylbenzimidazole synthase
comp 1405999..1406085 ctg 146 146
comp 1406232..1406852 cds 207 2,3-bisphosphoglycerate-dependent phosphoglycerate mutase
comp 1604615..1604854 cds 26 26 80 hp
comp 1604881..1604958 atgj 10 10
comp 1604969..1605214 cds 82 hp
1639492..1640289 cds -44 -44 266 hp
comp 1640246..1640322 atgj 55 55
1640378..1640572 cds 65 hp
comp 1778816..1779571 cds 385 385 252 SIMPL domain-containing protein
1779957..1780033 atgi 265 265
1780299..1780844 cds 182 sigma-70 family RNA polymerase sigma factor
> 1945985..1946374 cds 721 721 130 P-hp
comp 1947096..1947171 aag -38 -38
comp 1947134..1947319 cds 62 hp
comp 2014813..2015097 cds 103 103 95 DUF2218 domain-containing protein
comp 2015201..2015275 gaa + 146 146
comp 2015422..2015496 gaa 2 gaa 200 200
comp 2015697..2016962 cds 422 DUF882 domain-containing protein
comp 2040234..2040453 cds 91 91 73 hp
2040545..2040629 tac 24 24
2040654..2040727 gga 6 6
comp 2040734..2040916 cds -50 -50 61 hp
2040867..2042042 cds 65 65 392 elongation factor Tu
2042108..2042183 tgg 420 420
2042604..2042804 cds 67 preprotein translocase subunit SecE
2168416..2168658 cds 28 28 81 PepSY domain-containing protein
comp 2168687..2168760 ggg 289 289
2169050..2169946 cds 299 lipid kinase
comp 2244184..2245050 cds 112 112 289 mechanosensitive ion channel
comp 2245163..2245248 tta 200 200
2245449..2246705 cds 419 threonine ammonia-lyase IlvA
2267888..2268835 cds 305 305 316 patatin family protein
2269141..2269225 ctc 66 66
comp 2269292..2270185 cds 298 tyrosine-type recombinase/integrase
2332394..2333530 cds 393 393 379 glycosyltransferase family 2 protein
comp 2333924..2334000 cgg 169 169
comp 2334170..2335792 cds 541 ABC-F family ATP-binding cassette domain-containing protein
comp 2339396..2340514 cds 1650 1650 373 porin
comp 2342165..2342239 gtg 178 178
comp 2342418..2344424 cds 669 murein L,D-transpeptidase
comp 2369668..2370441 cds 152 152 258 NAD kinase
2370594..2370669 aca 987 987
comp 2371657..2372076 cds 140 SUF system Fe-S cluster assembly protein
comp 2442729..2443145 cds 299 299 139 hp
comp 2443445..2443519 atgf 70 70
<comp 2443590..2443799 cds 70 helix-turn-helix domain-containing protein
comp 2449947..2451311 cds 156 156 455 tyrosine-type recombinase/integrase
comp 2451468..2451550 cta 236 236
comp 2451787..2452356 cds 190 hp
comp 2548914..2550098 cds 513 513 395 alpha/beta hydrolase
comp 2550612..2550688 gac + 245 245
comp 2550934..2551010 gac 2 gac 328 328
2551339..2551956 cds 206 TetR/AcrR family transcriptional regulator
2604616..2605908 cds 824 824 431 FAD-binding oxidoreductase
comp 2606733..2606808 gta 264 264
comp 2607073..2607996 cds 308 sugar kinase
2641040..2641360 cds 97 97 107 YnfA family protein
2641458..2641534 ccc 94 94
2641629..2642357 cds 243 SDR family oxidoreductase
2696299..2697183 cds 54 54 295 transcriptional regulator GcvA
comp 2697238..2697314 aga 123 123
comp 2697438..2697743 cds 156 156 102 ETC complex I subunit
comp 2697900..2697976 cca 186 186
2698163..2698309 cds 49 hp
comp 2771579..2772697 cds 584 584 373 porin
2773282..2773372 agc 203 203
2773576..2774643 cds 356 porin
chromosom2
149537..151504 cds 355 355 656 selenocysteine-specific translation elongation factor
151860..151955 tga 14 14
comp 151970..152605 cds 212 lipase
comp 298403..299422 cds 300 300 340 TerC family protein
comp 299723..299796 cag 361 361
comp 300158..300460 cds 101 DUF1127 domain-containing protein
455428..456111 cds 713 713 228 FkbM family methyltransferase
456825..458313 16s 268 1489
458582..458658 atc 11 11
458670..458745 gca 39 39
>comp 458785..458973 cds 38 38 63 P-hp
459012..461930 23s 186 2919
462117..462231 5s 54 115
462286..462362 atgf -44 -44
comp 462319..463974 cds 552 recombinase family protein
comp 572059..572721 cds 545 545 221 response regulator transcription factor
comp 573267..573357 other @4 620 620
comp 573978..575285 cds 436 SidA/IucD/PvdA family monooxygenase
comp 611464..611742 cds 88 88 93 hp
comp 611831..611905 ggc 387 387
612293..612814 cds 174 prolyl-tRNA synthetase associated domain-containing protein
991265..991999 cds 217 217 245 alpha/beta hydrolase
comp 992217..992306 tca 323 323
992630..992884 cds 85 DUF2171 domain-containing protein
comp 1031528..1032946 cds 607 607 473 PepSY domain-containing protein
comp 1033554..1033629 aaa 327 327
1033957..1035651 cds 565 membrane protein
1067405..1068742 cds 131 131 446 DNA polymerase IV
1068874..1068947 tgc 739 739
1069687..1069905 cds 73 hp
1081639..1082031 cds 103 103 131 hp
comp 1082135..1082209 aac 168 168
1082378..1082653 cds 92 hp
comp 1333375..1333587 cds 209 209 71 hp
comp 1333797..1333873 cac 352 352
1334226..1337393 cds 1056 PAS domain S-box protein
1473437..1474405 cds 269 269 323 nitronate monooxygenase
1474675..1474750 acg 156 156
>comp 1474907..1475239 cds 111 DNA adenine methylase
comp 1597496..1597666 cds 363 363 57 LysR family transcriptional regulator
comp 1598030..1598106 atgf 54
comp 1598161..1598275 5s 186 115
comp 1598462..1601380 23s 38 38 2919
< 1601419..1601607 cds 39 39 63 P-hp
comp 1601647..1601722 gca 11 11
comp 1601734..1601810 atc 268
comp 1602079..1603567 16s 743 743 1489
1604311..1605192 cds 294 ATPase
1720169..1720531 cds 113 113 121 response regulator
1720645..1720719 gtc 465 465
1721185..1721838 cds 218 protein-L-isoaspartate(D-aspartate) O-methyltransferase

oan cumuls

cumuls. oan.
opérons Fréquences intercalaires tRNAs Fréquences intercalaires cds Fréquences aas cds chromosome
effectif gammes sans rRNAs avec rRNAs gammes cds gammes cdsd gammes cdsa gammes cdsa 300
avec rRNA opérons 4 1 4 1 5 1 100 25 1 0
16atcgca-cds 4 20 50 15 40 200 20 30 0
- 40 1 100 12 80 300 21 60 4
- 60 150 12 120 400 15 90 18
max a 3 80 200 15 160 500 11 120 8
a doubles 0 100 250 7 200 600 5 150 9
spéciaux 0 120 300 6 240 700 3 180 3
total aas 12 140 350 5 280 800 0 210 6
sans opérons 45 160 1 400 12 320 900 0 240 4
1 aa 42 180 450 1 360 1000 0 270 6
max a 2 200 500 1 400 1100 1 300 8
a doubles 2 1 16 0 35
total aas 48 3 4 107 0 101 101
total aas 60
remarques 4
avec jaune moyenne 138 11 258 256
variance 111 0 268 180
sans jaune moyenne 174 218 150
variance 117 132 81

oan blocs

  • Lien tableur: oan blocs
  • Légende:
    p-hp   pseudo hypothetical protein
A3. oan, blocs à rRNA.
Constantes
cds intercal cdsa
16s 268 1489
atc 11
gca 39
cds 38 63 p-hp
23s 186 2919
5s 54 115
atgf
cds
Variations
bloc 16s intercal cdsa
1084020..1085508 998 652 M23 family metallopeptidase
363 57 LysR family transcriptional regulator
1346243..1347731 677 272 IclR family transcriptional regulator
360 314 LysR family transcriptional regulator
456825..458313 713 228 FkbM family methyltransferase
-44 552 recombinase family protein
1602079..1603567 743 294 ATPase
363 57 LysR family transcriptional regulator

oan remarques

  • Remarques: Par rapport aux rickettsia rtb et rpl, les intercalaires très élevés existent, 3 contre 10, 987 988 1650. Ce génome est analogue à agr pour les cds internes aux blocs à RNAs.
    1. @ Des intercalaires négatifs avec les cds, 5, de -40 à -50 même dans un bloc à rRNAs, -44.
    2. @ Les intercalaires avec les cds élevés supérieurs à 500, 16 dont 4 pour les blocs. Voir le tableau des intercalaires ci-dessous .
      - Par rapport à agr analogue de ce génome, il y a nettement plus d’intercalaires élevés. Sur 45 blocs à aas il y a 12 intercalaires supérieurs à 500, contre 6 pour 38 aas chez agr.
      - Un seul cas où les 2 intercailaires d’un cluster sont supérieurs à 500, other, voir @4 ici.
      - Tous les 11 autres paires sont très assymétriques.
      - 2 intercalaires sur 3 entre aas sont du même ordre que la moyenne de ceux des cds sans jaune, 245 et 146 contre 174 pour la moyenne de ceux des cds.
    3. @ Les blocs à rRNAs sont identiques et ne diffèrent que par l’intercalaire du cds.
      - Le cds intra blocs est une pseudo protéine hypothétique, de faible taille, 63aas.
      - Ses intercalaires avec gca et 23s sont quasi identiques, très faibles et se situent dans la 1ère gamme des intercalaires cds.
    4. @ other, cela doit être un tRNA incomplet comme ceux des mitochondries
  • Note: les cds intra bloc à rRNAs. Les 4 blocs sont identiques. Cela veut dire que le cds interne est bien du au processus de la création des blocs. Le fait que le cds soit un pseudo renforce encore l’hypothèse de la création de ce cds par le processus de création ou de conversion. Voir remarque @2 de agr remarques.
  • Note du 3.10.20: le contrôle des 4 cds montre qu'ils sont absents au 31.7.20, date du NCBI.
  • Séquences des doubles, quasiment pas de doubles, 42 solitaires sur 45 opérons et 2 doubles seulement, gac et gaa.
  • Tableau des intercalaires
						
Intercalaires élevés		Intercalaires moyens	
pbs	adresse	RNA		pbs	adresse	tRNA
1650	2342165	gtg		465	1720645	gtc
987	2370594	aca		420	2042108	tgg
824	2606733	gta		397	344746	acc
819	1096920	tcg		387	611831	ggc
739	1068874	tgc		385	1779957	atgi
721	1947096	aag		363	1089481	atgf
620	573267	other isolé	363	1598030	atgf
607	1033554	aaa		352	1333797	cac
593	1051227	ttg		333	935321	agg
584	2773282	agc		323	992217	tca
513	2550612	gac		305	2269141	ctc
						
998	1084020	16s				
743	1602079	16s				
713	456825	16s				
677	1346243	16s				

oan distribution

Al5 oan, Ochrobactrum anthropi ATCC 49188 . alpha.
g1    t1       
atgi 1 tct tat atgf 5
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc 1 tcc 1 tac 1 tgc 1
atc 4 acc 1 aac 1 agc 1
ctc 1 ccc 1 cac 1 cgt 1
gtc 1 gcc 1 gac 2 ggc 2
tta 1 tca 1 taa tga 1
ata aca 1 aaa 1 aga 1
cta 1 cca 1 caa 1 cga
gta 1 gca 4 gaa 2 gga 1
ttg 1 tcg 1 tag tgg 1
atgj 2 acg 1 aag 1 agg 1
ctg 1 ccg 1 cag 1 cgg 1
gtg 1 gcg gag 1 ggg 1
alpha >1aa =1aa -5s +5s -16s +16s total
oan 6 41 4 8 59

Azospirillum brasilense Az39

abq opérons

  • Lien tableur: abq opérons
  • Liens: gtRNAdb [19], NCBI [20], génome [21]
  • Phylogénie: Bacteria; Proteobacteria; Alphaproteobacteria; Rhodospirillales; Rhodospirillaceae; Azospirillum.
  • Légende: cdsa: cds aas, cdsd: cds dirigé
A2. Azospirillum brasilense strain Az39
68.45%GC 29.12.19 Paris  88   doubles intercal cds aa avec aa cdsa cdsd protéines
chromosome
125527..126444 cds 127 127 306 restriction endonuclease
comp 126572..126647 gcg 206 206
126854..127138 cds 95 YggT family protein
comp 163237..164982 cds 175 175 582 hydrogenase maturation nickel metallochaperone HypA
165158..165234 agg 59 59
165294..166022 cds 243 SDR family NAD(P)-dependent oxidoreductase
comp 188235..189860 cds 42 42 542 glycosyltransferase
comp 189903..189977 acg 81 81
comp 190059..191987 cds 643 DNA helicase RecQ
comp 250833..251111 cds 169 169 93 hp
comp 251281..251356 gcc 141 141
comp 251498..251893 cds 132 TIGR02300 family protein
comp 458142..458459 cds 209 209 106 50S ribosomal protein L21
458669..458758 tcg 63 63
comp 458822..459664 cds 281 alpha/beta hydrolase fold domain-containing protein
comp 496776..497171 cds 162 162 132 cupin domain-containing protein
comp 497334..497420 ttg 137 137
497558..498085 cds 176 disulfide bond formation protein B
comp 615937..616350 cds 121 121 138 hp
comp 616472..616548 ccg + 206 206
comp 616755..616831 ccg 2 ccg 109 109
comp 616941..617957 cds 339 farnesyltranstransferase
comp 748703..749161 cds 38 38 153 hp
comp 749200..749275 aca 91 91
comp 749367..750221 cds 144 144 285 23s rRNA (guanosine(2251)-2'-O)-methyltransferase RlmB
750366..750451 tac 60 60
750512..750585 gga 81 81
750667..751857 cds 153 153 397 elongation factor Tu
752011..752086 tgg 69 69
752156..752353 cds 66 preprotein translocase subunit SecE
comp 794457..795983 cds 296 296 509 methyltransferase domain-containing protein
796280..796355 aag + 76 76
796432..796507 aag 2 aag 109 109
comp 796617..797057 cds 147 MaoC family dehydratase
870412..872373 cds 159 159 654 RNA polymerase sigma factor RpoD
872533..872608 atgi 5 5
comp 872614..873093 cds 134 134 160 GNAT family N-acetyltransferase
comp 873228..873304 cgt 212 212
873517..874023 cds 169 hp
931962..933011 cds 68 68 350 low specificity L-threonine aldolase
933080..933155 gag + 38 38
933194..933269 gag 2 gag 72 72
comp 933342..934340 cds 333 transglycosylase SLT domain-containing protein
997881..998357 cds 246 246 159 peptidoglycan-associated lipoprotein Pal
comp 998604..998678 acc 175 175
comp 998854..1000815 cds 654 polysaccharide biosynthesis protein
comp 1164137..1165048 cds 159 159 304 DUF3108 domain-containing protein
1165208..1165282 gtg + 132 132
1165415..1165489 gtg 2 gtg 231 231
1165721..1165885 cds 55 hp
1242416..1242919 cds 85 85 168 MerR family transcriptional regulator
1243005..1243081 ccc 139 139
comp 1243221..1244999 cds 593 cyclic nucleotide-binding domain-containing protein
comp 1353398..1353895 cds 118 118 166 hp
1354014..1354091 cca 49 49
1354141..1354437 cds 10 10 99 ETC complex I subunit
1354448..1354524 aga 443 443
1354968..1355213 cds 82 hp
comp 1370270..1370500 cds 196 196 77 hp
comp 1370697..1370772 aac @2 220 220
comp 1370993..1371066 tgc 218 218
1371285..1371941 cds 219 protein-L-isoaspartate O-methyltransferase
comp 1427443..1427733 cds 236 236 97 YkgJ family cysteine cluster protein
comp 1427970..1428085 5s 129 116
comp 1428215..1430967 23s 266 2753
comp 1431234..1431309 gca 30 30
comp 1431340..1431416 atc 108
comp 1431525..1433015 16s 779 779 1491
1433795..1437778 cds 1328 non-ribosomal peptide synthetase
comp 1576457..1577296 cds 243 243 280 aldo/keto reductase
comp 1577540..1577615 gaa 123 123
comp 1577739..1579538 cds 600 single-stranded-DNA-specific exonuclease RecJ
comp 1723089..1723457 cds 344 344 123 NADH-quinone oxidoreductase subunit A
comp 1723802..1723878 gac 164 164
comp 1724043..1724117 gta 106 106
comp 1724224..1724496 cds 91 HU family DNA-binding protein
comp 1730385..1731719 cds 91 91 445 trigger factor
comp 1731811..1731895 cta 173 173
comp 1732069..1733634 cds 522 malonyl-CoA decarboxylase
comp 1733741..1735207 cds 129 129 489 bifunctional ADP-dependent NAD(P)H-hydrate dehydratase/NAD(P)H-hydrate epimerase
comp 1735337..1735412 cac + 109 109
comp 1735522..1735597 cac 2 cac 337 337
1735935..1736273 cds 113 P-II family nitrogen regulator
1951126..1951752 cds 149 149 209 nitrogen fixation protein NifQ
1951902..1951987 tac 74 74
comp 1952062..1952424 cds 121 hp
1996903..1997244 cds 595 595 114 hp
comp 1997840..1997914 atgj 131 131
comp 1998046..1999179 cds 378 tRNA 2-thiouridine(34) synthase MnmA
2086487..2088658 cds 156 156 724 malate synthase G
comp 2088815..2088889 gtc 234 234
2089124..2090002 cds 293 N-formylglutamate amidohydrolase
comp 2303404..2303880 cds 414 414 159 bacterioferritin
comp 2304295..2304377 tta 406 406
comp 2304784..2305029 cds 82 hp
2482875..2484518 cds 365 365 548 recombinase family protein
comp 2484884..2484974 tcc 120 120
comp 2485095..2485898 cds 268 alpha/beta hydrolase
comp 2640759..2641325 cds 149 149 189 prolyl-tRNA synthetase associated domain-containing protein
2641475..2641549 ggc 688 688
2642238..2642915 cds 226 dimethylmenaquinone methyltransferase
comp 2764482..2765567 cds 659 659 362 hp
comp 2766227..2766300 ggg 35 35
comp 2766336..2766995 cds 220 N-acetyltransferase
2781933..2783774 cds 187 187 614 EAL and GGDEF domain-containing protein
comp 2783962..2784077 5s 129 116
comp 2784207..2786959 23s 255 2753
comp 2787215..2787290 gca 30 30
comp 2787321..2787397 atc 108
comp 2787506..2789006 16s 496 496 1501
comp 2789503..2790207 cds 235 phosphatase PAP2 family protein
2843264..2843443 cds 77 77 60 hp
comp 2843521..2843597 cgt 170 170
2843768..2844268 cds 167 xanthine phosphoribosyltransferase
plasmide2
comp 51090..51836 cds 481 481 249 sigma-70 family RNA polymerase sigma factor
comp 52318..52393 tgg 363 363
52757..53587 cds 277 hp
comp 809229..810019 cds 870 870 264 IS5 family transposase
comp 810890..810966 atgf 96
comp 811063..811178 5s 127 116
comp 811306..814058 23s 266 2753
comp 814325..814400 gca 30 30
comp 814431..814507 atc 108
comp 814616..816106 16s 452 452 1491
comp 816559..817443 cds 295 helix-turn-helix domain-containing protein
plasmide4
196992..199346 cds 148 148 785 mechanosensitive ion channel
199495..199581 ctg 30 30
199612..199687 gcc 188 188
199876..201333 cds 486 hp
237538..238578 cds 92 92 347 response regulator
comp 238671..238747 cgg 96 96
comp 238844..239821 cds 326 alpha/beta hydrolase
comp 257739..258470 cds 125 125 244 lipoyl(octanoyl) transferase LipB
258596..258682 ctc 123 123
comp 258806..259108 cds 101 STAS domain-containing protein
comp 399367..400527 cds 278 278 387 PQQ-dependent sugar dehydrogenase
comp 400806..400921 5s 129 116
comp 401051..403803 23s 255 2753
comp 404059..404134 gca 30 30
comp 404165..404241 atc 108
comp 404350..405850 16s 502 502 1501
comp 406353..406547 cds 65 hp
504531..504893 cds 82 82 121 response regulator
504976..505051 aac 3 3
505055..505131 gac 4 4
505136..505210 ggc 102 102
comp 505313..506080 cds 83 83 256 helix-turn-helix transcriptional regulator
506164..506790 cds 202 202 209 pyridoxamine 5'-phosphate oxidase
comp 506993..507108 5s 127 116
comp 507236..509988 23s 266 2753
comp 510255..510330 gca 30 30
comp 510361..510437 atc 110
comp 510548..512038 16s 615 615 1491
512654..513568 cds 305 lytic transglycosylase domain-containing protein
comp 588108..590768 cds 340 340 887 bifunctional acetaldehyde-CoA/alcohol dehydrogenase
591109..591184 ttc 286 286
591471..592979 cds 503 FAD-binding oxidoreductase
plasmide5
86421..87089 cds 455 455 223 RraA family protein
87545..87619 ggc 193 193
87813..88865 cds 351 UDP-N-acetylglucosamine 4,6-dehydratase (inverting)
plasmide1 @3
>comp 115594..115896 cds 394 394 101 P-IS5/IS1182 family transposase
comp 116291..116367 atgf 96
comp 116464..116579 5s 129 116
comp 116709..119461 23s 255 2753
comp 119717..119792 gca 30 30
comp 119823..119899 atc 108
comp 120008..121498 16s 740 740 1491
122239..123597 cds 453 peptidoglycan DD-metalloendopeptidase family protein
comp 217550..218176 cds 123 123 209 ribonuclease D
comp 218300..218386 ctg 228 228
218615..219604 cds 330 complex I NDUFA9 subunit family protein
comp 300477..301733 cds 472 472 419 exonuclease subunit SbcD
302206..303696 16s 108 1491
303805..303881 atc 30 30
303912..303987 gca 255
304243..306995 23s 129 2753
307125..307240 5s 96 116
307337..307413 atgf 161 161
<comp 307575..307805 cds 77 p-ATP-binding protein
comp 466493..467710 cds 231 231 406 site-specific integrase
comp 467942..468031 tca 205 205
comp 468237..468809 cds 191 hp
512242..512790 cds 136 136 183 pantetheine-phosphate adenylyltransferase
512927..513002 aaa 209 209
513212..514036 cds 275 DUF3618 domain-containing protein
931813..933912 cds 79 79 700 membrane protein
933992..934066 caa 382 382
comp 934449..935270 cds 274 hp
comp 948715..949743 cds 199 199 343 Ppx/GppA family phosphatase
949943..950016 cag 246 246
comp 950263..950829 cds 189 IS3 family transposase
> 971260..971532 cds 493 493 91 P-hp
comp 972026..972119 agc 197 197
972317..972550 cds 78 hp
comp 1302373..1303350 cds 166 166 326 alpha-1,3-fucosyltransferase
comp 1303517..1303592 ttc 98 98
comp 1303691..1303876 cds 62 DNA gyrase inhibitor YacG
1349823..1350929 cds 145 145 369 GNAT family N-acetyltransferase
comp 1351075..1353828 23s 262 2754
comp 1354091..1355591 16s @1 676 676 1501
1356268..1356726 cds 153 MarR family transcriptional regulator
comp 1441708..1443066 cds 153 153 453 hp
1443220..1443294 acc 1 1
1443296..1443371 gcg 99 99
1443471..1443547 gac 44 44
1443592..1443666 gtc 1 1
1443668..1443741 cag 137 137
comp 1443879..1446428 cds 850 dipeptide ABC transporter ATP-binding protein
1566394..1566612 cds 193 193 73 hp
comp 1566806..1566921 5s 128 116
comp 1567050..1569802 23s 254 2753
comp 1570057..1570132 gca 30 30
comp 1570163..1570239 atc 94
comp 1570334..1571834 16s 444 444 1501
comp 1572279..1572707 cds 143 DUF1489 domain-containing protein
1723583..1724962 cds 94 94 460 hp
comp 1725057..1725143 ctc 475 475
1725619..1726311 cds 231 FadR family transcriptional regulator
1757680..1760568 cds 308 308 963 PAS domain-containing protein
1760877..1760963 ctg 29 29
1760993..1761068 gcc 247 247
comp 1761316..1761840 cds 175 helix-turn-helix transcriptional regulator
1854042..1855049 cds 135 135 336 inorganic phosphate transporter
comp 1855185..1855259 ggc 243 243
1855503..1858685 cds 1061 AAA family ATPase
>comp 1883235..1883816 cds 210 210 194 P-hp
1884027..1884102 aac 4 4
1884107..1884183 gac 32 32
comp 1884216..1884821 cds 202 hp

abq cumuls

cumuls. abq.
opérons Fréquences intercalaires tRNAs Fréquences intercalaires cds Fréquences aas cds chromosome
effectif gammes sans rRNAs avec rRNAs gammes cds gammes cdsd gammes cdsa gammes cdsa 300
avec rRNA opérons 9 1 2 1 0 1 100 17 1 0
16atcgca235 5 20 3 50 7 40 200 29 30 0
Id-atgf 3 40 3 8 100 19 80 300 24 60 2
16s23s 1 60 2 150 26 120 400 18 90 9
max a 3 80 1 200 20 160 500 8 120 11
a doubles 0 100 1 250 18 200 600 8 150 8
spéciaux 0 120 1 300 3 240 700 5 180 11
total aas 19 140 1 350 4 280 800 2 210 9
sans opérons 51 160 0 400 4 320 900 2 240 6
1 aa 38 180 1 450 4 360 1000 1 270 6
max a 5 200 0 500 7 400 1100 1 300 8
a doubles 5 2 9 1 46
total aas 68 17 8 121 0 116 116
total aas 87
remarques 3
avec jaune moyenne 72 30 227 308
variance 72 0 175 230
sans jaune moyenne 153 249 166
variance 74 142 71

abq blocs

  • Lien tableur: abq blocs
  • Légende: lien au tableau des protéines, abrégé
    - vert: la taille des rRNAs en pbs alors que les protéines (cds) sont en aas.
A2. abq, blocs à rRNA.
bloc intercal cdsa intercal cdsa intercal cdsa intercal cdsa intercal cdsa
cds 779 1328 non ribosom 496 235 PAP2 fam 502 65 hp 615 305 lytic dom 444 143 DUF1489
16s 108 1491 108 1501 108 1501 110 1491 94 1501
atc 30 30 30 30 30
gca 266 255 255 266 254
23s 129 2753 129 2753 129 2753 127 2753 128 2753
5s 236 116 187 116 278 116 202 116 193 116
cds 97 YkgJ fam 614 EAL & GGDEF 387 PQQ 209 pyridoxamine 73 hp
cds 452 295 Hx-t-Hx 740 453 peptido fam 472 419 exo SbcD
16s 108 1491 108 1491 108 1491
atc 30 30 30
gca 266 255 255 cds 676 153 MarR fam
23s 127 2753 129 2753 129 2753 16s 262 1501
5s 96 116 96 116 96 116 23s 145 2754
atgf 870 394 161 cds 369 GNAT fam
cds 264 IS5 fam 101 p-IS5/IS1182 77 p-ATP-bind

abq remarques

  • Remarques
    - Les intercalaires élevés des cds: Ce génome ressemble à agr plus qu’à oan, voir le tableau des intercalaires ci-dessous. Le génome oan se rapproche plus des rickettsia avec 12 intercalaires cds-aa supérieurs à 500 et un maximum de 1650. Le génome abq a des intercalaires cds-aa inférieurs à 700 comme agr mais en plus grand nombre, 6 contre 3.
    1. @ Les blocs à RNAs: Les blocs sont nombreux, 9 16s, quasiment identiques et complets.
      - Sur 18 cds 2 hp 1 pseudo et 5 petits avec moins de 210 aas.
      - Tous les blocs sauf un (incomplet, 16s23s) sont de type 16satcgca23s5s dont 5 se terminent avec 5s et 3 avec 5s-atgf.
      - Les intercalaires internes, hors cds, sont quasiment identiques.
      - Les tailles des rRNAs du 23s et du 5s ne varient pas. Il y a 5 16s à 1491 pbs et 4 avec 1501 pbs.
    2. @ Les intercalaires entre aas: Il y a 13 blocs à plusieurs aas, pour 51 au total, contre 3 pour 45 chez oan et 3 pour 38 chez agr. Aussi je distingue 2 groupes comme avec agr et oan qui ont des effectifs très faibles.
      - un groupe de 10, normal dans cette étude, autour de 15 de moyenne, de 3 à 60 pbs
      - un groupe de 7, extrême, de 76 à 220 pbs. Le maximum est équivalent à celui de oan mais nettement inférieur aux 2 extrêmes de agr, 793 et 446.
    3. @ Les plasmides: génome exceptionnel avec 5 plasmides et 9 blocs à rRNAs. Exceptionnel aussi du fait qu’un plasmide, le plasmide 1, contient 4 blocs à rRNAs, soit 2 fois plus que le chromosome avec 2 blocs. Cette situation rappelle le cas unique du génome aua où le seul bloc à rRNA se trouve sur l’unique et tout petit plasmide de 10k pbs.
  • Séquences des doubles: sur les 51 blocs à aas seulement 13 ont plus d’un aa. Les doubles sont tous des doublets de blocs à 2 aas, 5 sur 11, ccg aag gag gtg cac.
  • Tableau des intercalaires
abq intercalaires entre aas	abq intercalaires cds		abq intercalaires cds			
1370697	aac-tgc	220		810890	atgf	870		2641475	ggc	688	
616472	ccg-ccg	206		1431525	16s	779		2766227	ggg	659	
1723802	gac-gta	164		120008	16s	740		1997840	atgj	595	
1165208	gtg-gtg	132		1354091	16s	676		972026	agc	493	
1735337	cac-cac	109		510548	16s	615		1725057	ctc	475	
1443296	gcg-gac	99		404350	16s	502		86421	ggc	455	
796280	aag-aag	76		2787506	16s	496		1354448	aga	443	
				302206	16s	472		52318	tgg	481-363	
				814616	16s	452		2304295	tta	414-406	isolé
				1570334	16s	444					
											
intercalaires supérieurs à 500 pbs.											
	agr	oan	abq								
16s	2	4	6								
aas	6	12	3								
max 16s	633	998	870								
max aas	793	1650	688								

abq distribution

aag2 cac2 ccg2 gag3 gtg3  
ggc: 3 1aa et 1 >1aa
Al6 abq, Azospirillum brasilense strain Az39. alpha.
g1    t1       
atgi 1 tct tat atgf 3
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc 2 tcc 1 tac 2 tgc 1
atc 8 acc 2 aac 3 agc 1
ctc 2 ccc 1 cac 2 cgt 2
gtc 2 gcc 3 gac 3 ggc 4
tta 1 tca 1 taa tga
ata aca 1 aaa 1 aga 1
cta 1 cca 1 caa 1 cga
gta gca 8 gaa 1 gga 1
ttg 1 tcg 1 tag tgg 2
atgj 1 acg 1 aag 2 agg 1
ctg 3 ccg 2 cag 2 cgg 1
gtg 3 gcg 2 gag 3 ggg 1
alpha >1aa =1aa -5s +5s -16s +16s total
abq 30 38 3 16 87

Azospirillum brasilense Sp245

abs opérons

  • Lien tableur: abs opérons
  • Liens: gtRNAdb [22], NCBI [23], génome [24]
  • Phylogénie: Bacteria; Proteobacteria; Alphaproteobacteria; Rhodospirillales; Rhodospirillaceae; Azospirillum.
  • Légende: cdsa: cds aas, cdsd: cds dirigé
A9. Azospirillum brasilense strain Sp245
68.45%GC 10.1.20 Paris  80   doubles intercal cds aa avec aa cdsa cdsd protéines
chromosome [25]
comp 16414..16980 cds 163 163 189 prolyl-tRNA synthetase associated domain-containing protein
17144..17218 ggc 670 670
17889..18566 cds 226 demethylmenaquinone methyltransferase
84790..85017 cds 114 114 76 osmotically-inducible lipoprotein B
comp 85132..85205 ggg 35 35
comp 85241..85900 cds 220 N-acetyltransferase
comp 93530..94258 cds 60 60 243 SDR family NAD(P)-dependent oxidoreductase
comp 94319..94395 agg 175 175
94571..96262 cds 564 hp
comp 131833..132117 cds 206 206 95 YggT family protein
132324..132399 gcg 140 140
comp 132540..133586 cds 349 DMT family transporter
comp 483582..484082 cds 170 170 167 xanthine phosphoribosyltransferase
484253..484329 cgt 77 77
comp 484407..484586 cds 60 hp
536869..537573 cds 495 495 235 phosphatase PAP2 family protein
538069..539152 16s’ @1 189 1084
539342..540019 23s° 127 678
540147..540262 5s 153 153 116
comp 540416..542290 cds 625 GGDEF domain-containing protein
600048..601079 cds 79 79 344 tyrosine-type recombinase/integrase
comp 601159..601233 acg 81 81
comp 601315..603243 cds 643 DNA helicase RecQ
comp 656242..656520 cds 169 169 93 hp
comp 656690..656765 gcc 141 141
comp 656907..657305 cds 133 TIGR02300 family protein
comp 864141..864458 cds 209 209 106 50S ribosomal protein L21
864668..864757 tcg 79 79
comp 864837..865679 cds 281 alpha/beta hydrolase
927651..927896 cds 392 392 82 hp
928289..928371 tta 175 175
928547..929164 cds 206 hp
comp 1148345..1149223 cds 234 234 293 N-formylglutamate amidohydrolase
1149458..1149532 gtc 106 106
comp 1149639..1151516 cds 626 methyl-accepting chemotaxis protein
1243974..1245108 cds 131 131 378 tRNA 2-thiouridine(34) synthase MnmA
1245240..1245314 atgj 354 354
comp 1245669..1246637 cds 323 NAD(+) diphosphatase
1279875..1280237 cds 74 74 121 hp
comp 1280312..1280397 tac 148 148
comp 1280546..1281172 cds 209 nitrogen fixation protein NifQ
comp 1500772..1501110 cds 338 338 113 P-II family nitrogen regulator
1501449..1501524 cac + 109 109
1501634..1501709 cac 2 cac 129 129
1501839..1503305 cds 106 106 489 bifunctional ADP-dependent NAD(P)H-hydrate dehydratase/NAD(P)H-hydrate epimerase
1503412..1504977 cds 173 173 522 malonyl-CoA decarboxylase
1505151..1505235 cta 91 91
1505327..1506661 cds 445 trigger factor
1511745..1512017 cds 105 105 91 HU family DNA-binding protein
1512123..1512197 gta 163 163
1512361..1512437 gac 344 344
1512782..1513150 cds 123 NADH-quinone oxidoreductase subunit A
1657596..1659397 cds 123 123 601 p-single-stranded-DNA-specific exonuclease RecJ
1659521..1659596 gaa 234 234
1659831..1660671 cds 280 aldo/keto reductase
comp 1808199..1808735 cds 79 79 179 hp
1808815..1808892 cca 49 49
1808942..1809238 cds 10 10 99 ETC complex I subunit
1809249..1809325 aga 442 442
1809768..1810013 cds 82 hp
comp 1825075..1825305 cds 210 210 77 hp
comp 1825516..1825591 aac @2 219 219
comp 1825811..1825884 tgc 217 217
1826102..1826758 cds 219 protein-L-isoaspartate O-methyltransferase
comp 1878424..1878714 cds 244 244 97 YkgJ family cysteine cluster protein
comp 1878959..1879074 5s 123 116
comp 1879198..1881950 23s 272 2753
comp 1882223..1882298 gca 32 32
comp 1882331..1882407 atc 110
comp 1882518..1883224 16s° 100 100 707
<comp 1883325..1883763 cds 146 p-erythrose-4-phosphate dehydrogenase
1896604..1897080 cds 192 192 159 peptidoglycan-associated lipoprotein Pal
comp 1897273..1897347 acc 162 162
comp 1897510..1899495 cds 662 polysaccharide biosynthesis protein
comp 2032701..2033588 cds 165 165 296 DUF3108 domain-containing protein
2033754..2033828 gtg + 132 132
2033961..2034035 gtg 2 gtg 231 231
2034267..2034431 cds 55 hp
2113098..2113601 cds 85 85 168 MerR family transcriptional regulator
2113687..2113763 ccc 140 140
comp 2113904..2115682 cds 593 cyclic nucleotide-binding domain-containing protein
comp 2163405..2167388 cds 775 775 1328 non-ribosomal peptide synthetase
2168164..2168552 16s° 100 389
comp 2168653..2169323 16s° 522 522 671
comp 2169846..2170325 cds 160 DUF2141 domain-containing protein
2176963..2177427 cds 107 107 155 membrane protein
comp 2177535..2177610 gcc 30 30
comp 2177641..2177727 ctg 135 135
comp 2177863..2180208 cds 782 mechanosensitive ion channel
2233677..2234435 cds 92 92 253 hp
comp 2234528..2234603 gag + 38 38
comp 2234642..2234717 gag 2 gag 68 68
comp 2234786..2235836 cds 350 p-low specificity L-threonine aldolase
comp 2293087..2293593 cds 211 211 169 hp
2293805..2293881 cgt 137 137
2294019..2294495 cds 5 5 159 GNAT family N-acetyltransferase
comp 2294501..2294576 atgi 145 145
comp 2294722..2296683 cds 654 RNA polymerase sigma factor RpoD
2372946..2373401 cds 86 86 152 MaoC family dehydratase
comp 2373488..2373563 aag + 74 74
comp 2373638..2373713 aag 2 aag 309 309
2374023..2375549 cds 509 methyltransferase domain-containing protein
comp 2418203..2418400 cds 69 69 66 preprotein translocase subunit SecE
comp 2418470..2418545 tgg 152 152
comp 2418698..2419888 cds 81 81 397 elongation factor Tu
comp 2419970..2420043 gga 60 60
comp 2420104..2420189 tac 144 144
2420334..2421188 cds 91 91 285 23S rRNA (guanosine(2251)-2'-O)-methyltransferase RlmB
2421280..2421355 aca 137 137
2421493..2423187 cds 565 site-specific integrase
2561207..2562223 cds 109 109 339 farnesyltranstransferase
2562333..2562409 ccg + 205 205
2562615..2562691 ccg 2 ccg 136 136
2562828..2563241 cds 138 hp
comp 2680406..2680930 cds 140 140 175 disulfide bond formation protein B
2681071..2681157 ttg 162 162
2681320..2681715 cds 132 cupin domain-containing protein
2856509..2858152 cds 365 365 548 recombinase family protein
comp 2858518..2858608 tcc 118 118
comp 2858727..2859530 cds 268 alpha/beta hydrolase
plasmide1 [26] @3
198109..199200 cds 84 84 364 tyrosine-type recombinase/integrase
comp 199285..199360 aaa 135 135
comp 199496..200044 cds 183 pantetheine-phosphate adenylyltransferase
243776..244348 cds 205 205 191 hp
244554..244643 tca 143 143
244787..245683 cds 299 diguanylate cyclase
338004..339383 cds 116 116 460 hp
comp 339500..339586 ctc 257 257
comp 339844..340836 cds 331 alpha/beta hydrolase
comp 364473..365501 cds 200 200 343 Ppx/GppA family phosphatase
365702..365775 cag 746 746
366522..367214 cds 231 FadR family transcriptional regulator
474173..477079 cds 298 298 969 PAS domain-containing protein
477378..477464 ctg 30 30
477495..477570 gcc 238 238
477809..478123 cds 105 hp
599223..600230 cds 245 245 336 inorganic phosphate transporter
comp 600476..600550 ggc 351 351
600902..602071 cds 390 adenylate/guanylate cyclase domain-containing protein
comp 629856..631229 cds 154 154 458 tetratricopeptide repeat protein
631384..631458 acc 1 1
631460..631535 gcg 99 99
631635..631711 gac 35 35
631747..631821 gtc 1 1
631823..631896 cag 153 153
632050..632259 cds 70 hp
>comp 699265..699846 cds 210 210 194 P-hp
700057..700132 aac 4 4
700137..700213 gac 32 32
comp 700246..700851 cds 202 hp
909530..909766 cds 153 153 79 hp
comp 909920..910035 5s 127 116
comp 910163..912915 23s 271 2753
comp 913187..913262 gca 30 30
comp 913293..913369 atc 110
comp 913480..914970 16s 486 486 1491
915457..916713 cds 419 exonuclease subunit SbcD
comp 998160..999149 cds 229 229 330 complex I NDUFA9 subunit family protein
999379..999465 ctg 123 123
999589..1000215 cds 209 ribonuclease D
comp 1098197..1098655 cds 675 675 153 MarR family transcriptional regulator
1099331..1100821 16s 107 1491
1100929..1101005 atc 31 31
1101037..1101112 gca 271
1101384..1104136 23s 147 147 2753
comp 1104284..1105390 cds 369 GNAT family N-acetyltransferase
1157171..1157356 cds 98 98 62 DNA gyrase inhibitor YacG
1157455..1157530 ttc 178 178
1157709..1158686 cds 326 alpha-(1,3)-fucosyltransferase
1394614..1396740 cds 453 453 709 PAS domain S-box protein
1397194..1397287 agc 52 52
comp 1397340..1397858 cds 173 tyrosine-type recombinase/integrase
1399009..1399830 cds 301 301 274 hp
comp 1400132..1400206 caa 79 79
comp 1400286..1402379 cds 698 hp
1577667..1578095 cds 457 457 143 DUF1489 domain-containing protein
1578553..1580043 16s 110 1491
1580154..1580230 atc 31 31
1580262..1580337 gca 269
1580607..1581986 23s° 100 1380
1582087..1582616 23s° 123 530
1582740..1582855 5s 100 116
1582956..1583032 atgf 706 706
1583739..1585157 cds 473 pyruvate kinase
plasmide2 [27]
271302..272090 cds 529 529 263 ATP-binding cassette domain-containing protein
272620..272695 tgg 480 480
273176..273922 cds 249 sigma-70 family RNA polymerase sigma factor
449562..450338 cds 465 465 259 IclR family transcriptional regulator
450804..452289 16s 584 1486
452874..453640 23s° 128 767
453769..453884 5s 101 116
453986..454062 atgf 359 359
comp 454422..457751 cds 1110 NERD domain-containing protein
plasmide4 [28]
>comp 131140..131621 cds 193 193 161 p-erythrose-4-phosphate dehydrogenase
131815..131891 atgf 202 202
comp 132094..132276 cds 61 hp
comp 197300..198643 cds 738 738 448 peptidoglycan DD-metalloendopeptidase family protein
199382..199953 16s° 193 572
200147..200223 atgf 437 437
comp 200661..202571 cds 637 PAS domain-containing sensor histidine kinase
246777..248687 cds 208 208 637 RNA-directed DNA polymerase
comp 248896..248972 cgg 96 96
comp 249069..249983 cds 305 alpha/beta hydrolase
319641..319943 cds 134 134 101 STAS domain-containing protein
comp 320078..320164 ctc 125 125
320290..321018 cds 243 lipoyl(octanoyl) transferase LipB
comp 401067..402227 cds 281 281 387 PQQ-dependent sugar dehydrogenase
comp 402509..402624 5s 129 116
comp 402754..403402 23s° 106 649
comp 403509..403880 16s° 502 502 372
comp 404383..404577 cds 65 hp
501394..501756 cds 95 95 121 response regulator
501852..501927 aac 4 4
501932..502008 gac 4 4
502013..502087 ggc 102 102
comp 502190..502957 cds 256 helix-turn-helix transcriptional regulator
503041..503667 cds 249 249 209 pyridoxamine 5'-phosphate oxidase
comp 503917..504474 16s° 547 547 558
505022..506005 cds 328 lytic transglycosylase domain-containing protein
comp 601019..603679 cds 358 358 887 bifunctional acetaldehyde-CoA/alcohol dehydrogenase
604038..604113 ttc 318 318
> 604432..605613 cds 394 site-specific integrase
plasmide6 [29]
88804..89472 cds 397 397 223 RraA family protein
89870..89944 ggc 249 249
90194..91186 cds 331 UDP-N-acetylglucosamine 4,6-dehydratase (inverting)

abs cumuls

cumuls. abs.
opérons Fréquences intercalaires tRNAs Fréquences intercalaires cds Fréquences aas cds chromosome
effectif gammes sans rRNAs avec rRNAs gammes cds gammes cdsd gammes cdsa gammes cdsa 30-300
avec rRNA opérons 10 1 2 1 0 1 100 18 1 0
16atcgca235 1 20 3 50 5 40 200 29 30 0
Id-23s°-atgf 1 40 4 4 100 22 80 300 26 60 3
1623s°5atgf 1 60 1 150 29 120 400 20 90 10
max a 3 80 1 200 18 160 500 7 120 9
a doubles 0 100 1 250 18 200 600 6 150 8
autres 7 120 1 300 3 240 700 9 180 13
total aas 10 140 1 350 5 280 800 2 210 9
sans opérons 51 160 0 400 7 320 900 1 240 6
1 aa 39 180 1 450 2 360 1000 1 270 8
max a 5 200 0 500 6 400 1100 0 300 7
a doubles 5 2 10 2 48
total aas 67 17 4 125 0 121 121
total aas
remarques 3
avec jaune moyenne 71 31 221 308
variance 72 1 168 230
sans jaune moyenne 151 242 166
variance 72 137 72

abs blocs

abs blocs abrégé

  • Lien tableur: abs blocs abrégé
  • Note:
    - hp pour hypothetical protein
    - p- pour pseudo, par exemple p-elon en abrégé donne p-elongation factor Tu.
A9p. abs abq, protéines.
abrégé nom
23s RlmB 23S rRNA (guanosine(2251)-2'-O)-methyltransferase RlmB
50s L21 50S ribosomal protein L21
AAA fam AAA family ATPase
ab hydrolase alpha/beta hydrolase
ab hydrolase f alpha/beta hydrolase fold domain-containing protein
AG cyclase adenylate/guanylate cyclase domain-containing protein
ak reductase aldo/keto reductase
ATP bind ATP-binding cassette domain-containing protein
bacteriofer bacterioferritin
bif CoA bifunctional acetaldehyde-CoA/alcohol dehydrogenase
bif NAD bifunctional ADP-dependent NAD(P)H-hydrate dehydratase/NAD(P)H-hydrate epimerase
chemotaxis p methyl-accepting chemotaxis protein
cupin dom cupin domain-containing protein
cyclicN bind cyclic nucleotide-binding domain-containing protein
diG cyclase diguanylate cyclase
dip ABC dipeptide ABC transporter ATP-binding protein
disulfide disulfide bond formation protein B
DMT fam DMT family transporter
DUF1489 DUF1489 domain-containing protein
DUF2141 DUF2141 domain-containing protein
DUF3108 DUF3108 domain-containing protein
DUF3618 DUF3618 domain-containing protein
EAL & GGDEF EAL and GGDEF domain-containing protein
elonga Tu elongation factor Tu
ETC complex ETC complex I subunit
exo SbcD exonuclease subunit SbcD
FAD bind FAD-binding oxidoreductase
FadR fam FadR family transcriptional regulator
farnesyl farnesyltranstransferase
fucosyl alpha-1,3-fucosyltransferase
GGDEF dom GGDEF domain-containing protein
glycosyl glycosyltransferase
GNAT fam GNAT family N-acetyltransferase
gyrase YacG DNA gyrase inhibitor YacG
Hase HypA hydrogenase maturation nickel metallochaperone HypA
helicas RecQ DNA helicase RecQ
HU bind HU family DNA-binding protein
Hx-t-Hx helix-turn-helix transcriptional regulator
Hx-t-Hx dom helix-turn-helix domain-containing protein
IclR fam IclR family transcriptional regulator
inorganic P inorganic phosphate transporter
IS3 fam IS3 family transposase
IS5 fam IS5 family transposase
L-iso-Asp protein-L-isoaspartate O-methyltransferase
lipoyl LipB lipoyl(octanoyl) transferase LipB
low Thr low specificity L-threonine aldolase
lytic dom lytic transglycosylase domain-containing protein
malate G malate synthase G
malonyl CoA malonyl-CoA decarboxylase
MaoC fam MaoC family dehydratase
MarR fam MarR family transcriptional regulator
mecano ion mechanosensitive ion channel
membrane p membrane protein
menaquinone dimethylmenaquinone methyltransferase
MerR fam MerR family transcriptional regulator
methyl trans methyltransferase domain-containing protein
N-acetyl trans N-acetyltransferase
N-formyl Glu N-formylglutamate amidohydrolase
NAD diP NAD(+) diphosphatase
NADH-quinone NADH-quinone oxidoreductase subunit A
NDUFA9 complex I NDUFA9 subunit family protein
NERD dom NERD domain-containing protein
nitrogen NifQ nitrogen fixation protein NifQ
non ribosom non-ribosomal peptide synthetase
osmose LipB osmotically-inducible lipoprotein B
p-ATP-bind p-ATP-binding protein
p-erythrose p-erythrose-4-phosphate dehydrogenase
P-II nitrogen P-II family nitrogen regulator
p-IS5/IS1182 P-IS5/IS1182 family transposase
p-low Thr p-low specificity L-threonine aldolase
p-ssDNA exo p-single-stranded-DNA-specific exonuclease RecJ
pantetheine pantetheine-phosphate adenylyltransferase
PAP2 fam phosphatase PAP2 family protein
PAS dom PAS domain-containing protein
PAS kinase PAS domain-containing sensor histidine kinase
PAS S-box PAS domain S-box protein
peptido fam peptidoglycan DD-metalloendopeptidase family protein
peptido Pal peptidoglycan-associated lipoprotein Pal
polymerase RNA-directed DNA polymerase
polysacchard polysaccharide biosynthesis protein
Ppx/GppA Ppx/GppA family phosphatase
PQQ PQQ-dependent sugar dehydrogenase
Prolyl-tRNA prolyl-tRNA synthetase associated domain-containing protein
pyridoxamine pyridoxamine 5'-phosphate oxidase
pyruvate kin pyruvate kinase
recombinase recombinase family protein
response reg response regulator
restriction end restriction endonuclease
ribonucleaseD ribonuclease D
RraA fam RraA family protein
SDR fam SDR family NAD(P)-dependent oxidoreductase
sigma RpoD RNA polymerase sigma factor RpoD
sigma-70 fam sigma-70 family RNA polymerase sigma factor
SLT dom transglycosylase SLT domain-containing protein
ss integrase site-specific integrase
Ss-DNA single-stranded-DNA-specific exonuclease RecJ
STAS dom STAS domain-containing protein
subunit SecE preprotein translocase subunit SecE
tetratricopep tetratricopeptide repeat protein
TIGR02300 TIGR02300 family protein
trigger factor trigger factor
tRNA MnmA tRNA 2-thiouridine(34) synthase MnmA
Tyr rec/int tyrosine-type recombinase/integrase
UDP-N-acetyl UDP-N-acetylglucosamine 4,6-dehydratase (inverting)
xanthine xanthine phosphoribosyltransferase
YggT fam YggT family protein
YkgJ fam YkgJ family cysteine cluster protein

abs blocs tableau

  • Lien tableur: abs blocs tableau
  • Légende: lien au tableau des protéines, abrégé
    - vert: la taille des rRNAs en pbs alors que les protéines (cds) sont en aas.
  • Note: 10 cds < 259 sur 20 dont 2 hp + 1 p
A9b. abs blocs.
gène inter long abrégé gène inter long abrégé gène inter long abrégé
cds 486 419 SbcD cds 100 146 P-eryt cds 675 153 MarR
16s 110 1491 16s° 110 707 16s 107 1491
atc 30 atc 32 atc 31
gca 271 gca 272 gca 271
23s 127 2753 23s 123 2753 23s 147 2753
5s 153 116 5s 244 116 cds 369 GNAT
cds 79 hp cds 97 YkgJ
cds 457 143 DUF1489
16s 110 1491
atc 31
gca 269
23s° 100 1380
23s° 123 530
5s 100 116
atgf 706
cds 473 pyruvat
cds 465 259 IclR cds 502 65 hp cds 495 235 PAP2
16s 584 1486 16s° 106 372 16s' 189 1084
23s° 128 767 23s° 129 649 23s° 127 678
5s 101 116 5s 281 116 5s 153 v116
atgf 359 cds 387 PQQ cds 625 GGDEF
cds 1110 NERD
cds 775 1328 non-rib cds 738 448 peptido cds 249 209 pyridox
16s° 100 389 16s° 193 16s° 547 558
16s° 522 671 atgf 437 cds 328 lytic
cds 160 DUF2141 cds 637 PAS

abs abq blocs

  • Lien tableur: abs abq blocs
  • Légende: lien au tableau des protéines, abs abq blocs abrégé
    - vert: la taille des rRNAs en pbs alors qu'en clair les protéines (cdsa) sont en aas.
    - 16s° 16s' 23s°
    - comp: complement, le cds a changé de brin. Cela ressemble à une recombinaison. Exemple CHA1
    - hp caracter: hypothetical protein caractérisée. Le cds est, dans un génome hypothétique, alors que dans l'autre il est caractérisé,tout en ayant à peu près même taille et même intercalaire. Exemple CHA
    - modif: le cds a le même nom mais la taille est légèrement modifiée, ou bien le nom est modifié et nom et intercalaire sont les mêmes. Exemple CHA CHC
    - déplacé: Le cds est déplacé avec son rRNA, tout en conservant taille et intercalaire. Exemple le pavé après CHE
    - d’où?: je ne peux pas savoir de quel bloc à rRNAs, il vient. Exemple le pavé après CHE
    - recomb: En bordure un changement net du cds est du à la recombinaison d'un pavé de clusters. Exemple CHC
    - recombi: à l'intérieur, un changement net de cds est du à un déplacement ou à une recombinaison interne. Exemple CHC
    - insertion: C'est le cas typique du bloc à rRNAs incomplet qui lui manque 5s et atcgca dans abq. Exemple PL1G
    - bloc?: cela vient de quel bloc à rRNA? Exemple PL1I
    - réunion: 2 déplacés réunis. Exemple PL1I, réunion de bloc? et où?.
  • Notes:
    - PL1G
    - disparition des atc et gca internes non retrouvés dans les blocs aas
    - Les 5s ne sont pas abimés mais 2 disparaissent
    - Les atgf disparaissent aussi
    - Les 23s, 2 de perdus et 4 de modifiés et perdent leur 5s et 5satgf au contraire de rpm
    - Les 16s, aucun perdu, 4 modifiés s° et 1 modifié s'.
    - Les blocs rRNAs modifiés restent sur place.
A9-2b. Comparaison abs abq
A9. Azospirillum brasilense strain Sp245
sens adresse bloc inter cdsa protéine Note
chrom
2856509..2858152 cds 365 548 recombinase CHA1
comp 2858518..2858608 tcc 118
comp 2858727..2859530 cds 268 ab hydrolase
comp 16414..16980 cds 163 189 Prolyl-tRNA CHA
17144..17218 ggc 670
17889..18566 cds 226 menaquinone
84790..85017 cds 114 76 osmose LipB comp
comp 85132..85205 ggg 35
comp 85241..85900 cds 220 N-acetyl trans
comp 93530..94258 cds 60 243 SDR fam
comp 94319..94395 agg 175
94571..96262 cds 564 hp hp caracter
comp 131833..132117 cds 206 95 YggT fam
132324..132399 gcg 140
comp 132540..133586 cds 349 DMT fam modif
comp 483582..484082 cds 170 167 xanthine
484253..484329 cgt 77
comp 484407..484586 cds 60 hp
536869..537573 cds 495 235 PAP2 fam
538069..539152 16s’ 189 1084
539342..540019 23s° 127 678
540147..540262 5s 153 116
comp 540416..542290 cds 625 GGDEF dom
600048..601079 cds 79 344 Tyr rec/int comp
comp 601159..601233 acg 81
comp 601315..603243 cds 643 helicas RecQ
CHB
comp 656242..656520 cds 169 93 hp
comp 656690..656765 gcc 141
comp 656907..657305 cds 133 TIGR02300
comp 864141..864458 cds 209 106 50s L21
864668..864757 tcg 79
comp 864837..865679 cds 281 ab hydrolase
2233677..2234435 cds 92 253 hp recomb
comp 2234528..2234603 gag 38
comp 2234642..2234717 gag 68
comp 2234786..2235836 cds 350 p-low Thr modif
comp 2293087..2293593 cds 211 169 hp CHC
2293805..2293881 cgt 137
2294019..2294495 cds 5 159 GNAT fam
comp 2294501..2294576 atgi 145
comp 2294722..2296683 cds 654 sigma RpoD
2372946..2373401 cds 86 152 MaoC fam
comp 2373488..2373563 aag 74
comp 2373638..2373713 aag 309
2374023..2375549 cds 509 methyl trans
comp 2418203..2418400 cds 69 66 subunit SecE
comp 2418470..2418545 tgg 152
comp 2418698..2419888 cds 81 397 elonga Tu
comp 2419970..2420043 gga 60
comp 2420104..2420189 tac 144
2420334..2421188 cds 91 285 23s RlmB
2421280..2421355 aca 137
2421493..2423187 cds 565 ss integrase recombi
2561207..2562223 cds 109 339 farnesyl
2562333..2562409 ccg 205
2562615..2562691 ccg 136
2562828..2563241 cds 138 hp
comp 2680406..2680930 cds 140 175 disulfide
2681071..2681157 ttg 162
2681320..2681715 cds 132 cupin dom
1896604..1897080 cds 192 159 peptido Pal CHD
comp 1897273..1897347 acc 162
comp 1897510..1899495 cds 662 polysacchard
comp 2032701..2033588 cds 165 296 DUF3108
2033754..2033828 gtg 132
2033961..2034035 gtg 231
2034267..2034431 cds 55 hp
2113098..2113601 cds 85 168 MerR fam
2113687..2113763 ccc 140
comp 2113904..2115682 cds 593 cyclicN bind
comp 1808199..1808735 cds 79 179 hp CHE
1808815..1808892 cca 49
1808942..1809238 cds 10 99 ETC complex
1809249..1809325 aga 442
1809768..1810013 cds 82 hp
comp 1825075..1825305 cds 210 77 hp
comp 1825516..1825591 aac 219
comp 1825811..1825884 tgc 217
1826102..1826758 cds 219 L-iso-Asp
comp 1878424..1878714 cds 244 97 YkgJ fam
comp 1878959..1879074 5s 123 116
comp 1879198..1881950 23s 272 2753
comp 1882223..1882298 gca 32
comp 1882331..1882407 atc 110
comp 1882518..1883224 16s° 100 707
<comp 1883325..1883763 cds 146 p-erythrose comp
comp 2163405..2167388 cds 775 1328 non ribosom déplacé
2168164..2168552 16s° 100 389
comp 2168653..2169323 16s° 522 671 d’où?
comp 2169846..2170325 cds 160 DUF2141
927651..927896 cds 392 82 hp CHF
928289..928371 tta 175
928547..929164 cds 206 hp recombi
comp 1148345..1149223 cds 234 293 N-formyl Glu
1149458..1149532 gtc 106
comp 1149639..1151516 cds 626 chemotaxis p modif
1243974..1245108 cds 131 378 tRNA MnmA
1245240..1245314 atgj 354
comp 1245669..1246637 cds 323 NAD diP recombi
1279875..1280237 cds 74 121 hp
comp 1280312..1280397 tac 148
comp 1280546..1281172 cds 209 nitrogen NifQ
comp 1500772..1501110 cds 338 113 P-II nitrogen
1501449..1501524 cac 109
1501634..1501709 cac 129
1501839..1503305 cds 106 489 bif NAD
1503412..1504977 cds 173 522 malonyl CoA
1505151..1505235 cta 91
1505327..1506661 cds 445 trigger factor
1511745..1512017 cds 105 91 HU bind
1512123..1512197 gta 163
1512361..1512437 gac 344
1512782..1513150 cds 123 NADH-quinone
1657596..1659397 cds 123 601 p-ssDNA exo
1659521..1659596 gaa 234
1659831..1660671 cds 280 ak reductase
plasmide1
comp 197300..198643 cds 738 448 peptido fam PL4
199382..199953 16s° 193 572 déplacé
200147..200223 atgf 437
comp 200661..202571 cds 637 PAS kinase déplacé
909530..909766 cds 153 79 hp hp caracter
comp 909920..910035 5s 127 116
comp 910163..912915 23s 271 2753
comp 913187..913262 gca 30 PL1B
comp 913293..913369 atc 110
comp 913480..914970 16s 486 1491
915457..916713 cds 419 exo SbcD
comp 998160..999149 cds 229 330 NDUFA9
999379..999465 ctg 123
999589..1000215 cds 209 ribonucleaseD
198109..199200 cds 84 364 Tyr rec/int comp
comp 199285..199360 aaa 135
comp 199496..200044 cds 183 pantetheine PL1C
243776..244348 cds 205 191 hp
244554..244643 tca 143
244787..245683 cds 299 diG cyclase recomb
1399009..1399830 cds 301 274 hp PL1D
comp 1400132..1400206 caa 79
comp 1400286..1402379 cds 698 hp hp caracter
comp 364473..365501 cds 200 343 Ppx/GppA PL1E
365702..365775 cag 746
366522..367214 cds 231 FadR fam comp
1394614..1396740 cds 453 709 PAS S-box recomb
1397194..1397287 agc 52 PL1F
comp 1397340..1397858 cds 173 Tyr rec/int recomb
comp 1098197..1098655 cds 675 153 MarR fam PL1G
1099331..1100821 16s 107 1491
1100929..1101005 atc 31 insertion
1101037..1101112 gca 271
1101384..1104136 23s 147 2753
comp 1104284..1105390 cds 369 GNAT fam
1157171..1157356 cds 98 62 gyrase YacG
1157455..1157530 ttc 178
1157709..1158686 cds 326 fucosyl
comp 629856..631229 cds 154 458 tetratricopep PL1H
631384..631458 acc 1
631460..631535 gcg 99
631635..631711 gac 35
631747..631821 gtc 1
631823..631896 cag 153
632050..632259 cds 70 hp comp
1577667..1578095 cds 457 143 DUF1489 PL1I
1578553..1580043 16s 110 1491 bloc?
1580154..1580230 atc 31
1580262..1580337 gca 269
1580607..1581986 23s° 100 1380 réunion
1582087..1582616 23s° 123 530
1582740..1582855 5s 100 116
1582956..1583032 atgf 706 d’où?
1583739..1585157 cds 473 pyruvate kin comp
338004..339383 cds 116 460 hp PL1J
comp 339500..339586 ctc 257
comp 339844..340836 cds 331 ab hydrolase comp
474173..477079 cds 298 969 PAS dom PL1K
477378..477464 ctg 30
477495..477570 gcc 238
477809..478123 cds 105 hp comp
599223..600230 cds 245 336 inorganic P
comp 600476..600550 ggc 351
600902..602071 cds 390 AG cyclase recomb
>comp 699265..699846 cds 210 194 p-hp PL1L
700057..700132 aac 4
700137..700213 gac 32
comp 700246..700851 cds 202 hp
plasmide2
271302..272090 cds 529 263 ATP bind comp
272620..272695 tgg 480
273176..273922 cds 249 sigma-70 fam
449562..450338 cds 465 259 IclR fam modif
450804..452289 16s 584 1486
452874..453640 23s° 128 767
453769..453884 5s 101 116
453986..454062 atgf 359
comp 454422..457751 cds 1110 NERD dom comp
plasmide4
2176963..2177427 cds 107 155 membrane p comp
comp 2177535..2177610 gcc 30
comp 2177641..2177727 ctg 135 CH
comp 2177863..2180208 cds 782 mecano ion
246777..248687 cds 208 637 polymerase recomb
comp 248896..248972 cgg 96
comp 249069..249983 cds 305 ab hydrolase PL4B
319641..319943 cds 134 101 STAS dom
comp 320078..320164 ctc 125
320290..321018 cds 243 lipoyl LipB
comp 401067..402227 cds 281 387 PQQ
comp 402509..402624 5s 129 116
comp 402754..403402 23s° 106 649
comp 403509..403880 16s° 502 372
comp 404383..404577 cds 65 hp
501394..501756 cds 95 121 response reg
501852..501927 aac 4
501932..502008 gac 4
502013..502087 ggc 102
comp 502190..502957 cds 83 256 Hx-t-Hx
503041..503667 cds 249 209 pyridoxamine
comp 503917..504474 16s° 547 558
505022..506005 cds 328 lytic dom modif
comp 601019..603679 cds 358 887 bif CoA
604038..604113 ttc 318
> 604432..605613 cds 394 ss integrase recomb
>comp 131140..131621 cds 193 161 p-erythrose
131815..131891 atgf 202 d’où?
comp 132094..132276 cds 61 hp
plasmide6
88804..89472 cds 397 223 RraA fam
89870..89944 ggc 249
90194..91186 cds 331 UDP-N-acetyl
A2. Azospirillum brasilense strain Az39
sens adresse bloc inter cdsa protéine ordre
chrom
2482875..2484518 cds 365 548 recombinase CHA1
comp 2484884..2484974 tcc 120
comp 2485095..2485898 cds 268 ab hydrolase
comp 2640759..2641325 cds 149 189 Prolyl-tRNA CHA
2641475..2641549 ggc 688
2642238..2642915 cds 226 menaquinone
comp 2764482..2765567 cds 659 362 hp
comp 2766227..2766300 ggg 35
comp 2766336..2766995 cds 220 N-acetyl trans
2781933..2783774 cds 187 614 EAL & GGDEF
comp 2783962..2784077 5s 129 116
comp 2784207..2786959 23s 255 2753
comp 2787215..2787290 gca 30
comp 2787321..2787397 atc 108
comp 2787506..2789006 16s 496 1501
comp 2789503..2790207 cds 235 PAP2 fam
2843264..2843443 cds 77 60 hp
comp 2843521..2843597 cgt 170
2843768..2844268 cds 167 xanthine
125527..126444 cds 127 306 restriction end
comp 126572..126647 gcg 206
126854..127138 cds 95 YggT fam
comp 163237..164982 cds 175 582 Hase HypA
165158..165234 agg 59
165294..166022 cds 243 SDR fam
comp 188235..189860 cds 42 542 glycosyl CHB
comp 189903..189977 acg 81
comp 190059..191987 cds 643 helicas RecQ
comp 250833..251111 cds 169 93 hp
comp 251281..251356 gcc 141
comp 251498..251893 cds 132 TIGR02300
comp 458142..458459 cds 209 106 50s L21
458669..458758 tcg 63
comp 458822..459664 cds 281 ab hydrolase f
comp 496776..497171 cds 162 132 cupin dom CHC
comp 497334..497420 ttg 137
497558..498085 cds 176 disulfide
comp 615937..616350 cds 121 138 hp
comp 616472..616548 ccg 206
comp 616755..616831 ccg 109
comp 616941..617957 cds 339 farnesyl
comp 748703..749161 cds 38 153 hp
comp 749200..749275 aca 91
comp 749367..750221 cds 144 285 23s RlmB
750366..750451 tac 60
750512..750585 gga 81
750667..751857 cds 153 397 elonga Tu
752011..752086 tgg 69
752156..752353 cds 66 subunit SecE
comp 794457..795983 cds 296 509 methyl trans
796280..796355 aag 76
796432..796507 aag 109
comp 796617..797057 cds 147 MaoC fam
870412..872373 cds 159 654 sigma RpoD
872533..872608 atgi 5
comp 872614..873093 cds 134 160 GNAT fam
comp 873228..873304 cgt 212
873517..874023 cds 169 hp
931962..933011 cds 68 350 low Thr
933080..933155 gag 38
933194..933269 gag 72
comp 933342..934340 cds 333 SLT dom
997881..998357 cds 246 159 peptido Pal CHD
comp 998604..998678 acc 175
comp 998854..1000815 cds 654 polysacchard
comp 1164137..1165048 cds 159 304 DUF3108
1165208..1165282 gtg 132
1165415..1165489 gtg 231
1165721..1165885 cds 55 hp
1242416..1242919 cds 85 168 MerR fam
1243005..1243081 ccc 139
comp 1243221..1244999 cds 593 cyclicN bind
comp 1353398..1353895 cds 118 166 hp CHE
1354014..1354091 cca 49
1354141..1354437 cds 10 99 ETC complex
1354448..1354524 aga 443
1354968..1355213 cds 82 hp
comp 1370270..1370500 cds 196 77 hp
comp 1370697..1370772 aac 220
comp 1370993..1371066 tgc 218
1371285..1371941 cds 219 L-iso-Asp
comp 1427443..1427733 cds 236 97 YkgJ fam
comp 1427970..1428085 5s 129 116
comp 1428215..1430967 23s 266 2753
comp 1431234..1431309 gca 30
comp 1431340..1431416 atc 108
comp 1431525..1433015 16s 779 1491
1433795..1437778 cds 1328 non ribosom
comp 1576457..1577296 cds 243 280 ak reductase CHF
comp 1577540..1577615 gaa 123
comp 1577739..1579538 cds 600 ss-DNA
comp 1723089..1723457 cds 344 123 NADH-quinone
comp 1723802..1723878 gac 164
comp 1724043..1724117 gta 106
comp 1724224..1724496 cds 91 HU bind
comp 1730385..1731719 cds 91 445 trigger factor
comp 1731811..1731895 cta 173
comp 1732069..1733634 cds 106 522 malonyl CoA
comp 1733741..1735207 cds 129 489 bif NAD
comp 1735337..1735412 cac 109
comp 1735522..1735597 cac 337
1735935..1736273 cds 113 P-II nitrogen
1951126..1951752 cds 149 209 nitrogen NifQ
1951902..1951987 tac 74
comp 1952062..1952424 cds 121 hp
1996903..1997244 cds 595 114 hp
comp 1997840..1997914 atgj 131
comp 1998046..1999179 cds 378 tRNA MnmA
2086487..2088658 cds 156 724 malate G
comp 2088815..2088889 gtc 234
2089124..2090002 cds 293 N-formyl Glu
comp 2303404..2303880 cds 414 159 bacteriofer
comp 2304295..2304377 tta 406
comp 2304784..2305029 cds 82 hp
plasmide1
>comp 115594..115896 cds 394 101 p-IS5/IS1182 PL1A
comp 116291..116367 atgf 96
comp 116464..116579 5s 129 116
comp 116709..119461 23s 255 2753
comp 119717..119792 gca 30
comp 119823..119899 atc 108
comp 120008..121498 16s 740 1491
122239..123597 cds 453 peptido fam
comp 217550..218176 cds 123 209 ribonucleaseD PL1B
comp 218300..218386 ctg 228
218615..219604 cds 330 NDUFA9
comp 300477..301733 cds 472 419 exo SbcD
302206..303696 16s 108 1491
303805..303881 atc 30
303912..303987 gca 255
304243..306995 23s 129 2753
307125..307240 5s 96 116
307337..307413 atgf 161
<comp 307575..307805 cds 77 p-ATP-bind
comp 466493..467710 cds 231 406 ss integrase PL1C
comp 467942..468031 tca 205
comp 468237..468809 cds 191 hp
512242..512790 cds 136 183 pantetheine
512927..513002 aaa 209
513212..514036 cds 275 DUF3618
931813..933912 cds 79 700 membrane p PL1D
933992..934066 caa 382
comp 934449..935270 cds 274 hp
comp 948715..949743 cds 199 343 Ppx/GppA PL1E
949943..950016 cag 246
comp 950263..950829 cds 189 IS3 fam
> 971260..971532 cds 493 91 P-hp PL1F
comp 972026..972119 agc 197
972317..972550 cds 78 hp
comp 1302373..1303350 cds 166 326 fucosyl PL1G
comp 1303517..1303592 ttc 98
comp 1303691..1303876 cds 62 gyrase YacG
1349823..1350929 cds 145 369 GNAT fam
comp 1351075..1353828 23s 262 2754
comp 1354091..1355591 16s 676 1501
1356268..1356726 cds 153 MarR fam
comp 1441708..1443066 cds 153 453 hp PL1H
1443220..1443294 acc 1
1443296..1443371 gcg 99
1443471..1443547 gac 44
1443592..1443666 gtc 1
1443668..1443741 cag 137
comp 1443879..1446428 cds 850 dip ABC
1566394..1566612 cds 193 73 hp PL1I
comp 1566806..1566921 5s 128 116
comp 1567050..1569802 23s 254 2753
comp 1570057..1570132 gca 30
comp 1570163..1570239 atc 94
comp 1570334..1571834 16s 444 1501
comp 1572279..1572707 cds 143 DUF1489
1723583..1724962 cds 94 460 hp PL1J
comp 1725057..1725143 ctc 475
1725619..1726311 cds 231 FadR fam
1757680..1760568 cds 308 963 PAS dom PL1K
1760877..1760963 ctg 29
1760993..1761068 gcc 247
comp 1761316..1761840 cds 175 Hx-t-Hx
1854042..1855049 cds 135 336 inorganic P
comp 1855185..1855259 ggc 243
1855503..1858685 cds 1061 AAA fam
>comp 1883235..1883816 cds 210 194 P-hp PL1L
1884027..1884102 aac 4
1884107..1884183 gac 32
comp 1884216..1884821 cds 202 hp
plasmide2
comp 51090..51836 cds 481 249 sigma-70 fam
comp 52318..52393 tgg 363
52757..53587 cds 277 hp
comp 809229..810019 cds 870 264 IS5 fam
comp 810890..810966 atgf 96
comp 811063..811178 5s 127 116
comp 811306..814058 23s 266 2753
comp 814325..814400 gca 30
comp 814431..814507 atc 108
comp 814616..816106 16s 452 1491
comp 816559..817443 cds 295 Hx-t-Hx dom
plasmide4
196992..199346 cds 148 785 mecano ion PL4A
199495..199581 ctg 30
199612..199687 gcc 188
199876..201333 cds 486 hp
237538..238578 cds 92 347 response reg PL4B
comp 238671..238747 cgg 96
comp 238844..239821 cds 326 ab hydrolase
comp 257739..258470 cds 125 244 lipoyl LipB
258596..258682 ctc 123
comp 258806..259108 cds 101 STAS dom
comp 399367..400527 cds 278 387 PQQ
comp 400806..400921 5s 129 116
comp 401051..403803 23s 255 2753
comp 404059..404134 gca 30
comp 404165..404241 atc 108
comp 404350..405850 16s 502 1501
comp 406353..406547 cds 65 hp
504531..504893 cds 82 121 response reg
504976..505051 aac 3
505055..505131 gac 4
505136..505210 ggc 102
comp 505313..506080 cds 83 256 Hx-t-Hx
506164..506790 cds 202 209 pyridoxamine
comp 506993..507108 5s 127 116
comp 507236..509988 23s 266 2753
comp 510255..510330 gca 30
comp 510361..510437 atc 110
comp 510548..512038 16s 615 1491
512654..513568 cds 305 lytic dom
comp 588108..590768 cds 340 887 bif CoA
591109..591184 ttc 286
591471..592979 cds 503 FAD bind
plasmide5
86421..87089 cds 455 223 RraA fam
87545..87619 ggc 193
87813..88865 cds 351 UDP-N-acety

abs remarques

  • Remarques:
    - Les remarques de abq qui ne changent pas: les intercalaires élevés avec les cds, les intercalaires entre aas (@2) et les séquences des doubles. La phylogénie étroite entre les 2 souches explique cette étroite ressemblance en tout cas pour les intercalaires et les doubles, mais pas pour les blocs à rRNAs.
    - Le tableau des intercalaires et des doubles ci-dessous met en parallèle ces 3 remarques.
    - Les remarques qui changent fondamentalement: ce sont les blocs à rRNAs (@1) et les plasmides (@3). J’ai fait une comparaison détaillée entre les 2 génomes dans abs abq blocs. Elle montre 2 processus distincts:
    1. Le processus de recombinaison qui explique l’ordre des blocs et le changement de certains cds.
    2. Le processus de conversion génique qui, en grande partie, a détruit partiellement les rRNAs 16s et 23s et non les 5s. Cependant un 5s a disparu en laissant son atgf. D’après la majorité des cds identiques entre abs et abq et qui sont attachés à ces blocs, les rRNas modifiés restent sur place.
  • Tableau des intercalaires et des doubles
abs intercalaires aas		abs	intercalaires cds	abs intercalaires cds			
adresse	aas			adresse	rRNA			adresse	aas		
1825516	aac-tgc	219		2168164	16s°	775		365702	cag	746	
2562333	ccg-ccg	205		199382	16s°	738		17144	ggc	670	
1512123	gta-gac	163		1582956	atgf	706		272620	tgg	529-480	isolé
2033754	gtg-gtg	132		913480	16s	675		1397194	agc	453	
1501449	cac-cac	109		503917	16s°	547		1809249	aga	442	
631460	gcg-gac	99		2168653	16s°	522					
2373488	aag-aag	74		403509	16s°	502			atgj	354	
				538069	16s’	495			ctc	257	
				913480	16s	486			ggg	114	
				450804	16s	465					
				1578553	16s	457			cag abq	246	
				200147	atgf	437					
											
abq intercalaires entre aas	abq intercalaires cds		abq intercalaires cds			
1370697	aac-tgc	220		810890	atgf	870		2641475	ggc	688	
616472	ccg-ccg	206		1431525	16s	779		2766227	ggg	659	
1723802	gac-gta	164		120008	16s	740		1997840	atgj	595	
1165208	gtg-gtg	132		1354091	16s	676		972026	agc	493	
1735337	cac-cac	109		510548	16s	615		1725057	ctc	475	
1443296	gcg-gac	99		404350	16s	502		86421	ggc	455	
796280	aag-aag	76		2787506	16s	496		1354448	aga	443	
				302206	16s	472		52318	tgg	481-363	
				814616	16s	452		2304295	tta	414-406	isolé
				1570334	16s	444					
											
intercalaires supérieurs à 500 pbs.											
	agr	oan	abq	abs							
16s	2	4	6	7							
aas	6	12	3	3							
max 16s	633	998	870	775							
max aas	793	1650	688	746							
											
											
Doubles abs			Doubles abq							
aas	n	doublets	aas	n	doublets					
1	39	ccg		1	38	ccg					
2	10	aag		2	11	aag					
3	1	gag		3	1	gag					
4		gtg		4		gtg					
5	1	cac		5	1	cac					

abs distribution

aag2 cac2 ccg2 gag2 gtg2  
ggc: 3 1aa et 1 >1aa
Al7 abs, Azospirillum brasilense strain Sp245. alpha.
g1    t1       
atgi 1 tct tat atgf 4
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc 2 tcc 1 tac 2 tgc 1
atc 4 acc 2 aac 3 agc 1
ctc 2 ccc 1 cac 2 cgt 2
gtc 2 gcc 3 gac 4 ggc 4
tta 1 tca 1 taa tga
ata aca 1 aaa 1 aga 1
cta 1 cca 1 caa 1 cga
gta 1 gca 4 gaa 1 gga 1
ttg 1 tcg 1 tag tgg 2
atgj 1 acg 1 aag 2 agg 1
ctg 3 ccg 2 cag 2 cgg 1
gtg 2 gcg 2 gag 2 ggg 1
alpha >1aa =1aa -5s +5s -16s +16s total
abs 30 39 3 8 80

Agrobacterium sp. H13-3

agr opérons

  • Lien tableur: agr opérons
  • Liens: gtRNAdb [30], NCBI [31], génome [orgn]
  • Phylogénie: Bacteria; Proteobacteria; Alphaproteobacteria; Rhizobiales; Rhizobiaceae; Rhizobium/Agrobacterium group; Agrobacterium.
  • Légende: cdsa: cds aas, cdsd: cds dirigé
A6. Agrobacterium sp. H13-3
59.3%GC 29.12.19 Paris  58   doubles intercal cds aa avec aa cdsa cdsd protéines
chromosoml
comp 1064633..1065274 cds 296 296 214 hp
1065571..1065655 ttg 266 266
1065922..1066437 cds 172 disulfide bond formation protein B
comp 1178605..1179114 cds 256 256 170 prolyl-tRNA synthetase associated domain-containing protein
1179371..1179445 ggc @1 793 793
comp 1180239..1180315 atgj 135 135
comp 1180451..1181647 cds 399 tRNA 2-thiouridine(34) synthase MnmA
comp 1320644..1321006 cds 318 318 121 hp
comp 1321325..1321414 tcg 197 197
comp 1321612..1322493 cds 294 dihydrodipicolinate synthase family protein
comp 1361929..1362942 cds 554 554 338 sugar ABC transporter substrate-binding protein
comp 1363497..1363571 gtc 81 81
comp 1363653..1364015 cds 121 response regulator
<comp 1426814..1427137 cds 105 105 108 hp
1427243..1428733 16s 337 1491
1429071..1429147 atc 59 59
1429207..1429282 gca 146 146
<comp 1429429..1429626 cds @2 241 241 66 P-hp
1429868..1432681 23s 242 2814
1432924..1433038 5s 257 115
1433296..1433372 atgf 311 311
1433684..1434118 cds 145 acetyl-CoA carboxylase biotin carboxyl carrier protein subunit
1503534..1504520 cds 122 122 329 beta-ketoacyl-ACP synthase III
comp 1504643..1504716 cag 123 123
comp 1504840..1505277 cds 146 Lrp/AsnC family transcriptional regulator
1605356..1605856 cds 71 71 167 hp
comp 1605928..1606003 gcc 152 152
comp 1606156..1606545 cds 130 TIGR02300 family protein
<comp 1687683..1688015 cds 105 105 111 hp
1688121..1689611 16s 337 1491
1689949..1690025 atc 59 59
1690085..1690160 gca 146 146
<comp 1690307..1690504 cds 241 241 66 P-hp
1690746..1693559 23s 242 2814
1693802..1693916 5s 257 115
1694174..1694250 atgf 203 203
comp 1694454..1694645 cds 64 hp
<comp 2103153..2103404 cds 105 105 84 P-hp
2103510..2105000 16s 337 1491
2105338..2105414 atc 59 59
2105474..2105549 gca 146 146
<comp 2105696..2105893 cds 241 241 66 P-hp
2106135..2108948 23s 242 2814
2109191..2109305 5s 257 115
2109563..2109639 atgf 633 633
2110273..2110680 cds 136 membrane protein
chromosomc
<comp 56862..57137 cds 105 105 92 P-hp
57243..58733 16s 337 1491
59071..59147 atc 59 59
59207..59282 gca 146 146
<comp 59429..59626 cds 241 241 66 P-hp
59868..62681 23s 242 2814
62924..63038 5s 257 115
63296..63372 atgf 196 196
63569..65377 cds 603 DNA helicase RecQ
comp 125821..127722 cds 287 287 634 molecular chaperone DnaK
comp 128010..128099 tcc 220 220
128320..128637 cds 106 hp
227621..228004 cds 240 240 128 membrane protein
comp 228245..228331 ctg 120 120
comp 228452..228757 cds 102 SelT/SelW/SelH family protein
> 378307..378396 cds 40 40 30 P-hp
378437..378513 cgt 174 174
378688..379500 cds 271 class I SAM-dependent methyltransferase
comp 407277..407435 cds 167 167 53 YqaE/Pmp3 family membrane protein
comp 407603..407678 acg 137 137
comp 407816..408778 cds 321 nitronate monooxygenase
425990..427087 cds 56 56 366 2'-deoxycytidine 5'-triphosphate deaminase
427144..427217 ggg 154 154
427372..428058 cds 229 aquaporin Z
458659..459081 cds 285 285 141 hp
459367..459442 ttc 246 246
comp 459689..460033 cds 115 cation:proton antiporter
comp 493759..494025 cds 155 155 89 hp
494181..494255 acc 195 195
comp 494451..495686 cds 412 flagellin
comp 564938..568684 cds 361 361 1249 PAS domain S-box protein
569046..569122 cac 79 79
569202..570920 cds 573 Ppx/GppA family phosphatase
comp 763448..764356 cds 202 202 303 MBL fold metallo-hydrolase
764559..764633 caa 263 263
comp 764897..766549 cds 551 malate dehydrogenase (quinone)
comp 767020..767439 cds 264 264 140 hp
767704..767780 ccg 159 159
comp 767940..768260 cds 107 hp
comp 960360..960701 cds 163 163 114 hp
960865..960955 agc 500 500
comp 961456..961671 cds 72 hp
1123408..1124136 cds 141 141 243 hp
1124278..1124363 tta 241 241
1124605..1127115 cds 837 copper-translocating P-type ATPase
1154411..1154803 cds 91 91 131 DUF2934 domain-containing protein
comp 1154895..1154969 aac 176 176
1155146..1155424 cds 93 hp
comp 1162767..1163027 cds 138 138 87 hp
comp 1163166..1163242 ccc 218 218
1163461..1163997 cds 179 DUF1269 domain-containing protein
1192452..1194650 cds 660 660 733 esterase-like activity of phytase family protein
comp 1195311..1195386 gta + 446 446
1195833..1195909 gac 2 gac 41 41
1195951..1196027 gac 435 435
1196463..1196828 cds 122 NADH-quinone oxidoreductase subunit A
1421863..1422201 cds 134 134 113 hp
comp 1422336..1422425 tca 88 88
comp 1422514..1422678 cds 55 hp
comp 1468229..1469110 cds 180 180 294 HNH endonuclease
comp 1469291..1469367 atgf 132 132
comp 1469500..1470450 cds 317 hp
comp 1508458..1508883 cds 558 558 142 PAS domain-containing protein
comp 1509442..1509526 ctc 189 189
1509716..1510447 cds 244 lipoyl(octanoyl) transferase LipB
1531160..1531933 cds 447 447 258 amino acid ABC transporter ATP-binding protein
1532381..1532455 gaa 121 121
1532577..1532818 cds 89 89 81 P-hp
1532908..1532982 gaa 129 129
comp 1533112..1534920 cds 603 single-stranded-DNA-specific exonuclease RecJ
1584509..1584763 cds 155 155 85 GlsB/YeaQ/YmgE family stress response membrane protein
1584919..1584994 aag 134 134
comp 1585129..1585575 cds 149 hp
comp 1612420..1613898 cds 240 240 493 trigger factor
comp 1614139..1614221 cta 447 447
< 1614669..1614876 cds 69 P-hp
comp 1672216..1672887 cds 245 245 224 protein-L-isoaspartate O-methyltransferase
comp 1673133..1673206 tgc 240 240
comp 1673447..1673599 cds 51 DUF3309 family protein
comp 1744688..1745434 cds 341 341 249 cytochrome c biogenesis protein CcdA
1745776..1745851 aaa 310 310
1746162..1746743 cds 194 DUF1003 domain-containing protein
comp 1770727..1772280 cds 91 91 518 tyrosine-type recombinase/integrase
comp 1772372..1772448 cca 265 265
1772714..1773019 cds 51 51 102 ETC complex I subunit
1773071..1773147 aga 7 7
comp 1773155..1773892 cds 246 DUF429 domain-containing protein
comp 1902337..1902537 cds 184 184 67 preprotein translocase subunit SecE
comp 1902722..1902797 tgg 241 241
comp 1903039..1903845 cds 269 glycosyltransferase
1908698..1908892 cds 70 70 65 hp
comp 1908963..1909036 gga 26 26 26
comp 1909063..1909147 tac 209 209
1909357..1910244 cds 296 23s rRNA (guanosine(2251)-2'-O)-methyltransferase RlmB
1922447..1922800 cds 55 55 118 hp
comp 1922856..1922931 aca 207 207
1923139..1924878 cds 580 GGDEF domain-containing protein
2079925..2080287 cds 156 156 121 hp
comp 2080444..2080519 atgi 178 178
2080698..2081441 cds 248 SIMPL domain-containing protein
comp 2275632..2276138 cds 522 522 169 winged helix-turn-helix transcriptional regulator
2276661..2276737 cgg 287 287
2277025..2277264 cds 80 hp
comp 2388300..2388497 cds 87 87 66 hp
2388585..2388659 ggc 361 361
2389021..2391024 cds 668 methyl-accepting chemotaxis protein
comp 2490745..2491854 cds 535 535 370 2Fe-2S iron-sulfur cluster binding domain-containing protein
comp 2492390..2492466 atgf 287 115
comp 2492754..2492868 5s 242 2814
comp 2493111..2495924 23s 241 241
> 2496166..2496363 cds 146 146 66 P-hp
comp 2496510..2496585 gca 59 59
comp 2496645..2496721 atc 337
comp 2497059..2498549 16s 105 105 1491
> 2498655..2498930 cds 92 P-hp

agr cumuls

cumuls. agr.
opérons Fréquences intercalaires tRNAs Fréquences intercalaires cds Fréquences aas cds chromosome
effectif gammes sans rRNAs avec rRNAs gammes cds gammes cdsd gammes cdsa gammes cdsa 300
avec rRNA opérons 5 1 1 0 1 100 24 1 0
16atcgca235 0 20 50 3 40 200 30 30 1
Id-atgf 5 40 1 100 12 80 300 14 60 3
16s23s 0 60 1 5 150 22 120 400 8 90 17
max a 3 80 200 17 160 500 2 120 13
a doubles 0 100 250 18 200 600 4 150 14
spéciaux 0 120 300 9 240 700 4 180 5
total aas 15 140 350 4 280 800 1 210 1
sans opérons 38 160 400 2 320 900 1 240 3
1 aa 35 180 450 3 360 1000 0 270 7
max a 3 200 500 1 400 1100 0 300 4
a doubles 1 2 6 1 21
total aas 42 4 5 97 0 89 89
total aas 57
remarques 2
avec jaune moyenne 59 213 230
variance 0 134 209
sans jaune moyenne 33 172 185 137
variance 76 131 71

agr blocs

  • Lien tableur: agr blocs
  • Légende:
    CoA   acetyl-CoA carboxylase biotin carboxyl carrier protein subunit
    helicase  DNA helicase RecQ
    2Fe-2S  2Fe-2S iron-sulfur cluster binding domain-containing protein
    membrane  membrane protein
    hp    hypothetical protein
    p-hp   pseudo hp
A6. agr, blocs à rRNA.
chromomel intercal cdsa intercal cdsa intercal cdsa
cds 105 108 hp 105 111 hp 105 84 P-hp
16s 337 1491 337 1491 337 1491
atc 59 59 59
gca 146 146 146
cds 241 66 P-hp 241 66 P-hp 241 66 P-hp
23s 242 2814 242 2814 242 2814
5s 257 115 257 115 257 115
atgf 311 203 633
cds 145 CoA 64 hp 136 membrane
chromosomec
cds 105 92 P-hp 105 92 P-hp
16s 337 1491 337 1491
atc 59 59
gca 146 146
cds 241 66 P-hp 241 66 P-hp
23s 242 2814 242 2814
5s 257 115 287 115
atgf 196 535
cds 603 helicase 370 2Fe-2S

agr remarques

  • Remarques
    1. @: Par rapport aux rickettsia rtb et rpl, les intercalaires élevés sont rares et faibles, 6 sur 38 aas sont entre 500 et 793. Voir tableau ci-dessous.
      - un seul aa isolé, gta , 660-446.
      - 2 intercalaires élevés entre 2 aas, ggc-atgi 793 et gta-gac 446. Le 1er est du même ordre que celui de rtb et rpl, 1051 830.
      - Les intercalaires entre aas: Il y en a quatre comme les rickettsia, 793 446 41 26. Les 2 petits sont proches de la moyenne de cette étude de 15 pbs.
      - Les intercalaires avec un cds. Ils sont très faibles sur les 38 aas un seul atteint 660 pbs les autres élevés se répartissent en 4 entre 500-558 et 3 entre 435-447. Ces valeurs sont analogues à ceux des blocs à rRNA, 535 et 633 tout à fait courants dans le haut de gamme de cette étude. Les 30 aas restants ont des intercalaires cds inférieurs à 400 dont 3 seulement dépassent les 300, cac aaa ggc.
    2. @ Les cds dans les blocs à rRNAs. Voir agr blocs.
    - Les 5 blocs sont identiques qu’ils soient sur le chromosome linéaire ou circulaire. C’est comme une duplication répétée 5 fois.
    - Le cds interne a toutes les caractéristiques d’un candidat à la création: interne, hypothétique et petit. La caractéristique pseudo est encore un indice très fort de la genèse, la séquence acquiera plus tard le codon initial et le codon stop ou tout autre complément imposé par le système de réparation contraint par l’évolution de l’environnement du génome.
    - On retrouve la situation du génome oan, avec un p-hp de 63 aas contre 66 ici. Ces 2 génomes se ressemblent beaucoup,
    + DNAa total identique oan et agr 4,8 mega, 2 chromosomes dont 1 linéaire pour agr. Tous les blocs se terminent par atgf et sont complets.
    + Beaucoup de cds hp externes.
    - Chez agr, 5 hp dont 3 p-hp au-dessus de 16s de la même taille que le p-hp interne. Ils se comportent comme lui, quasimment même petite taille et des intercalaires identiques de 105 pbs. Ces 10 cds font partie intégrante du processus de réparation ou de conversion qui a créé les 5 blocs. Après 5s 3 cds de petites tailles dont un hpcomme ceux au-dessus du 16s. Donc 2 cds bien caractérisés se comportant comme le p-hp interne candidat à la création. Cependant ces 3 cds apparemment ne font pas partie intégrante du processus de conversion puisque leurs intercalaires avec atgf varient beaucoup de 203 à 633, comme les 2 restant.
    - Chez oan seulement 2 cds de 57 aas sur un total de 8 cds. Ils sont bien caractérisés.
    - La question qui se pose alors est : est-ce que ces 10 cds analogues aux internes peuvent ils être des candidats à la création?
    - Note du 4.10.20: les 5 cds disparaissent dans NCBI du 12.4.20, après contrôle.
  • Séquence des doubles: très peu de doubles, 1 doublets pour 38 opérons à aas.
  • Tableau des intercalaires élevés
aas	adresse	pbs	note
ggc	1179371	793	aa-aa
gta	1195311	660-446	isolé
ctc	1509442	558	
gtc	1363497	554	
cgg	2276661	522	
agc	960865	500	
gaa	1532381	447	
cta	1614139	447	
gac	1195833	446	aa-aa
gac	1195951	435	
			
cac	569046	361	
aaa	1745776	341-310	
ggc	2388585	361	
			
atgf	2492390	535	5s-aa
atgf	2109563	633	5s-aa

agr distribution

Al8 agr, Agrobacterium sp. H13-3. alpha.
g1    t1       
atgi 1 tct tat atgf 6
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc 1 tcc 1 tac 1 tgc 1
atc 5 acc 1 aac 1 agc 1
ctc 1 ccc 1 cac 1 cgt 1
gtc 1 gcc 1 gac 2 ggc 2
tta 1 tca 1 taa tga
ata aca 1 aaa 1 aga 1
cta 1 cca 1 caa 1 cga
gta 1 gca 5 gaa 2 gga 1
ttg 1 tcg 1 tag tgg 1
atgj 1 acg 1 aag 1 agg
ctg 1 ccg 1 cag 1 cgg 1
gtg gcg gag ggg 1
alpha >1aa =1aa -5s +5s -16s +16s total
agr 7 35 5 10 57

Aureimonas sp. AU20

aua opérons

  • Lien tableur: aua opérons
  • Liens: gtRNAdb [], NCBI [32], génome [orgn], pau20rrn [33]
  • Phylogénie: Bacteria; Proteobacteria; Alphaproteobacteria; Rhizobiales; Aurantimonadaceae; Aureimonas.
  • Légende: cdsa: cds aas, cdsd: cds dirigé
  • Note: il n'y a pas de gtRNAdb. Aussi j'ai comparé (EXACT NB.CAR STXT) les 1ers atgf atgi atgj du génome cdc, avec les atg de aua sauf atgi qui est défini dans NCB. Les 2 atgf de atgf2 (331629..331705) sont identiques.
A1. Aureimonas sp. AU20
67%GC 8.8.19 Paris  55   doubles intercal cds aa avec aa cdsa cdsd protéines
pAU20rrn
324..1028 CDS rep 461 235 replication initiation protein
comp 1490..1604 5s @1 82 115
comp 1687..4515 23s -15 2829
comp 4501..4851 CDS hp 142 117 hp
comp 4994..5069 gca 33 33
comp 5103..5179 atc 233
comp 5413..6898 16s 1752 1486
comp 8651..9109 CDS hp 153 hp
Chromosome
comp 170900..171925 CDS 368 368 342
172294..172378 ctg 130 130 130
172509..172772 CDS 88
comp 330094..330690 CDS 338 338 199
331029..331103 ggc @2 404 404
comp 331508..331584 atgf + 44 44
comp 331629..331705 atgf 2 atg 255 255 255
comp 331961..333217 CDS 419
344949..346025 CDS 589 589 359 589
346615..346704 tcg 609 609
347314..348471 CDS 386
comp 393335..395356 CDS 800 800 674
comp 396157..396232 gcc 439 439 439
comp 396672..397094 CDS 141
635177..637537 CDS 640 640 787
comp 638178..638253 gcg 182 182 182
638436..638738 CDS 101
comp 924507..925466 CDS 529 529 320
comp 925996..926085 tcc 349 349 349
926435..926767 CDS 111
1216789..1217439 CDS 60 60 217 60
1217500..1217576 agg 68 68
comp 1217645..1218760 CDS 372
1350534..1352180 CDS @4 -30 -30 549
comp 1352151..1352227 cgt + 51 51
comp 1352279..1352355 cgt 2 cgt 169 169
comp 1352525..1353967 CDS 481
1401921..1402442 CDS 142 142 174 142
1402585..1402661 cac 585 585
1403247..1404875 CDS 543
1544580..1546277 CDS 455 455 566
comp 1546733..1546808 ttc @2 161 161
1546970..1547044 acc 414 414 414
1547459..1549516 CDS 686
1609269..1610216 CDS 278 278 316
comp 1610495..1610571 cgg 121 121 121
comp 1610693..1611427 CDS 245
> 1683255..1683581 CDS 209 209 109 209
comp 1683791..1683864 cag 580 580
1684445..1685734 CDS 430
1700827..1701852 CDS 300 300 342
comp 1702153..1702227 gtc + 128 128
comp 1702356..1702430 gtc 3 gtc 186 186
comp 1702617..1702691 gtc 68 68 68
comp 1702760..1703125 CDS 122
1946715..1946936 CDS 6 6 74 6
comp 1946943..1947018 atgi 105 105
1947124..1947345 CDS 74
1981934..1983139 CDS 139 139 402 139
1983279..1983368 agc 825 825
1984194..1985339 CDS 382
1996083..1997171 CDS 243 243 363
comp 1997415..1997490 acg 112 112 112
comp 1997603..1998583 CDS 327
comp 2263930..2264781 CDS 30 30 284 30
comp 2264812..2264886 gtg 111 111
comp 2264998..2265768 CDS 257
2363764..2364786 CDS 18 18 341 18
comp 2364805..2364879 gaa + 140 140
comp 2365020..2365094 gaa 2 gaa 69 69 69
comp 2365164..2366144 CDS 327
2367774..2368247 CDS 105 105 158
2368353..2368429 cca @3 43 43 43
2368473..2368778 CDS 36 36 102 36
2368815..2368890 aga 448 448
2369339..2369929 CDS 197
comp 2401620..2402732 CDS 155 155 371 155
comp 2402888..2402963 aaa 169 169
2403133..2403870 CDS 246
2419689..2420852 CDS 13 13 388 13
2420866..2420955 tca 238 238
2421194..2421934 CDS 247
comp 2601493..2601858 CDS 287 287 122 287
comp 2602146..2602222 gac + 58 58
comp 2602281..2602357 gac 2 gac 270 270
2602628..2602703 gta @2 330 330
comp 2603034..2603312 CDS 93
comp 2608494..2609852 CDS 73 73 453 73
comp 2609926..2610009 cta 307 307
2610317..2610460 CDS 48
comp 2641174..2641824 CDS @3 125 125 217 125
comp 2641950..2642023 tgc 153 153
comp < 2642177..2642443 CDS 296 296 89
2642740..2642814 aac 269 269 269
2643084..2644127 CDS 348
comp 2651145..2652935 CDS 239 239 597 239
2653175..2653259 tta 265 265
2653525..2653725 CDS 67
comp 2749758..2750318 CDS 3102 3102 187
comp 2753421..2753497 atgf 83 83 83
comp 2753581..2754180 CDS 200
2768127..2769224 CDS 63 63 366 63
comp 2769288..2769364 ccg @2 173 173
2769538..2769612 caa 528 528
comp 2770141..2770566 CDS 142
comp 2787112..2788920 CDS 217 217 603 217
comp 2789138..2789214 ccc 265 265
comp 2789480..2790022 CDS 181
2927857..2928789 CDS 136 136 311 136
comp 2928926..2929010 ctc + 132 132
comp 2929143..2929227 ctc 2 ctc 175 175
2929403..2930164 CDS 254
comp 2971057..2971257 CDS 130 130 67
comp 2971388..2971463 tgg 53 53 53
comp 2971517..2972374 CDS 286
comp 2973322..2974497 CDS 291 291 392
comp 2974789..2974862 gga 24 24
comp 2974887..2974971 tac 259 259 259
2975231..2976097 CDS 289
comp 2979955..2981049 CDS 221 221 365
2981271..2981346 aca 55 55 55
comp 2981402..2981752 CDS 117
comp 3063743..3064045 CDS 106 106 101 106
comp 3064152..3064227 aag 147 147
comp 3064375..3064803 CDS 143
comp 3194307..3194906 CDS 249 249 200
3195156..3195232 atgj 173 173 173
3195406..3196356 CDS 317
comp 3206006..3206455 CDS 743 743 150
comp 3207199..3207273 gag 50 50 50
comp 3207324..3207689 CDS 122
3398165..3399901 CDS 554 554 579
3400456..3400530 aac 115 115 115
3400646..3400924 CDS 93
3401737..3403497 CDS 227 227 587
comp 3403725..3403799 ggc 208 208
comp 3404008..3404082 ggg 74 74 74
comp 3404157..3404819 CDS 221
comp 3597872..3598414 CDS 370 370 181
3598785..3598869 ttg 151 151 151
comp 3599021..3599251 CDS 77

aua cumuls

cumuls. aua. Aureimonas sp. AU20
opérons Fréquences intercalaires tRNAs Fréquences intercalaires cds Fréquences aas cds chromosome
effectif gammes sans rRNAs avec rRNAs gammes cds gammes cdsd gammes cdsa gammes cdsa 300
avec rRNA opérons 1 1 0 - 1 1 1 0 100 10 1 0
16 aas 23 5s 0 20 0 50 7 40 7 200 22 30 0
16 atc gca hp 1 40 1 100 10 80 9 300 11 60 1
16 cds 23 5s 0 60 3 150 14 120 9 400 20 90 7
max a 2 80 0 200 8 160 4 500 5 120 8
a doubles 0 100 0 250 8 200 3 600 6 150 7
spéciaux 0 120 0 300 10 240 4 700 3 180 2
total aas 2 140 3 350 4 280 1 800 1 210 7
sans opérons 38 160 0 400 2 320 900 0 240 3
1 aa 26 180 2 450 3 360 2 1000 0 270 5
max a 3 200 1 500 1 400 1100 0 300 3
a doubles 6 3 12 1 0 35
total aas 53 13 0 80 40 78 78
total aas 55
remarques 4
avec jaune moyenne
variance
sans jaune moyenne 131 226 153 235 158
variance 75 165 128 125 69

aua blocs

A1. aua, blocs à rRNA du 8.8.19.
CDS 1752 153 hp
16s 233 1486
atc 33
gca 142
CDS -15 117 hp
23s 82 2829
5s 461 115
CDS 235 replication initiation protein

aua remarques

  • cds de 77 aas: MIVLIAHVHQTSSEDEGERDEQDGFFSSLSALNTGPRATGVGVLRRRSASSRALDGRELAKDQLPETDPDNGGQAR
A1. aua, blocs à rRNA du 6.1.20.
324..1028 cds 461 235 replication initiation protein
comp 1490..1604 5s 82 115
comp 1687..4515 23s -6 2829
4510..4740 cds 253 77 hp
comp 4994..5069 gca 33
comp 5103..5179 atc 236
comp 5416..6898 16s 718 1483
comp 7617..8363 cds 287 249 hp
comp 8651..9178 cds 176 excisionase family DNA-binding protein
  • Remarques: Le seul génome de cette étude dont l’unique bloc rRNA est dans un tout petit plasmide de 9 kpbs pour un chromosome circulaire de 3 742 793 pbs.
    1. @ Une protéine candidate à la création est dans le bloc rRNA, hp, petite taille de 77 aas avec un intercalaire négatif avec 23s (voir prélèvement du 6.1.20 ci-dessus)
    2. @ Des intercalaires entre aas très élevés par rapport aux clusters à plusieurs aas étudiés. Trois très élevés au-delà de 200 pbs, 44 270 208, trois supérieurs à 160, 161 173 186. Alors que la moyenne des autres génomes est autour de 15 pbs.
    3. @ A l’adresse 2367774, deux aas séparés par un cds à très faibles intercalaires, 43 et 36 pbs. Le cds a une taille de 102 aas. Est-ce un candidat à la création? La même situation se retrouve à l’adresse 2641174, avec des intervals moyens, 153 2936 mais le cds a encore une taille plus petite 89 aas.
    4. @ Un intercalaire négatif qui souligne surtout la proximité d’un aa et d’un cds se trouvant sur 2 brins différents. Ceci est du certainement aux processus de conversion génique qui agissent sur les blocs à rRNA, ici ceux-là ont disparus laissant cette configuration. Les 2 cds entourant les 2 aas sont énormes, 500 aas environs, et ne sont donc pas candidats à la création.
  • Note: En séparant les tRNAs des 2 clusters du @3 le spectre des blocs sans rRNA est le suivant
	aas   effectif	total
	1	30	30
	2	7	14
	3	3	9
total aas		53
  • Séquences des doubles: La caractéristique principale des doublons pour ce génome est la grandeur de leurs inteercalaires. Les blocs à doublons se répartissent en
    - 3 blocs à 2 aas doubles, cgt gaa ctc, séparés entre eux par respectivement, 51 140 132 pbs.
    - 2 blocs à 3 aas dont un doublet chacun, ggc atg atg et gta gac gac, avec respectivement entre les doubles 44 et 58 pbs
    - 1 bloc avec un triplet gtc avec les intercalaires de 128 186 pbs.

aua distribution

Al9 aua, Aureimonas sp. AU20. alpha.
g1    t1       
atgi 1 tct tat atgf 3
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc 1 tcc 1 tac 1 tgc 1
atc 1 acc 1 aac 2 agc 1
ctc 2 ccc 1 cac 1 cgt 2
gtc 3 gcc 1 gac 2 ggc 2
tta 1 tca 1 taa tga
ata aca 1 aaa 1 aga 1
cta 1 cca 1 caa 1 cga
gta 1 gca 1 gaa 2 gga 1
ttg 1 tcg 1 tag tgg 1
atgj 1 acg 1 aag 1 agg 1
ctg 1 ccg 1 cag 1 cgg 1
gtg 1 gcg 1 gag 1 ggg 1
alpha >1aa =1aa -5s +5s -16s +16s total
aua 23 30 2 55

alpha synthèse

alpha distribution par génome

Alpha distribution par génome
baci >1aa 1aa -5s +5s -16s +16s duplica 1-3aas total
rtb 8 25 0 33
rpm 7 30 8 42 5 92
rru 4 36 8 4 3 55
oan 6 41 8 4 59
abq 20 38 16 10 3 87
abs 20 39 8 10 3 80
agr 5 35 10 2 5 57
aua 10 30 2 13 55
total 80 274 0 0 0 60 81 23 518

alpha distribution du total

  • Lien tableur: alpha distribution du total
    - Couleurs du 1er tableau: voir bacilli
    - Couleurs du 2ème tableau: d'après les couleurs du pieds du tableau
    - Tableau des indices, en-tête: total génomes, total tRNAs, indice ttt, indice tgt.
Alpha. Distribution du total.
alpha. Distribution du total sans +16s +5s
g1    t1       
atgi 9 tct tat atgf 7
att act aat agt
ctt cct cat cgt
gtt gct gat ggt
ttc 13 tcc 8 tac 10 tgc 8
atc 1 acc 13 aac 14 agc 8
ctc 11 ccc 8 cac 11 cgc 13
gtc 13 gcc 16 gac 17 ggc 22
tta 8 tca 8 taa tga 1
ata aca 9 aaa 10 aga 8
cta 8 cca 9 caa 8 cga
gta 7 gca 2 gaa 12 gga 8
ttg 7 tcg 7 tag tgg 10
atgj 10 acg 8 aag 10 agg 6
ctg 15 ccg 10 cag 10 cgg 8
gtg 9 gcg 9 gag 9 ggg 7
alpha8 >1aa 1aa -5s +5s -16s +16s total
type 161 274 0 0 0 0 435
alpha. Distribution du total. +16s +5s (1-3aas)
g1    t1       
atgi tct tat atgf 23
att act aat agt
ctt cct cat cgt
gtt gct gat ggt
ttc tcc tac tgc
atc 33 acc 0 aac agc
ctc ccc cac cgc
gtc gcc gac 0 ggc
tta tca 0 taa tga
ata aca aaa aga
cta cca caa cga
gta gca 27 gaa gga
ttg tcg tag tgg 0
atgj acg aag agg
ctg ccg cag cgg
gtg gcg gag ggg
alpha8 >1aa 1aa -5s +5s -16s +16s total
type 23 60 83
alpha. indices du 27.5.20 347 génomes
g1 t1 347 16935 0,6  0,3
atgi 106 tct tat 0,9 atgf 236
att act 0,3 aat agt
ctt 1,2 cct 0,3 cat cgc 0,3
gtt gct gat 0,6 ggt
ttc 109 tcc 101 tac 104 tgc 105
atc 241 acc 108 aac 111 agc 101
ctc 116 ccc 82 cac 102 cgt 112
gtc 105 gcc 97 gac 150 ggc 133
tta 94 tca 102 taa 1,2 tga 10
ata 1,7 aca 107 aaa 106 aga 103
cta 103 cca 104 caa 113 cga 9,2
gta 105 gca 239 gaa 141 gga 104
ttg 91 tcg 89 tag 0,3 tgg 102
atgj 116 acg 91 aag 80 agg 75
ctg 90 ccg 71 cag 65 cgg 107
gtg 59 gcg 59 gag 54 ggg 70
inter max min total

alpha distribution par type

Alpha. Distribution par type.
alpha. distribution des solitaires
g1    t1          
atgi 8 tct tat atgf 5
att act aat agt 0
ctt cct cat cgt
gtt gct gat ggt
ttc 8 tcc 8 tac 2 tgc 4
atc acc 5 aac 5 agc 8
ctc 9 ccc 8 cac 7 cgc 8
gtc 8 gcc 5 gac 1 ggc 11
tta 8 tca 8 taa tga 1
ata aca 8 aaa 9 aga 8
cta 8 cca 8 caa 6 cga
gta 4 gca 1 gaa 6 gga
ttg 7 tcg 7 tag tgg 10
atgj 7 acg 8 aag 4 agg 6
ctg 6 ccg 3 cag 6 cgg 7
gtg 3 gcg 4 gag 5 ggg 6
alpha8 1aa 274
alpha. distribution du type >1aa sans duplicata.
g1    t1          
atgi 1 tct tat atgf
att act aat agt
ctt cct cat cgt
gtt gct gat ggt
ttc 1 tcc tac 8 tgc 4
atc 1 acc 3 aac 7 agc
ctc ccc cac cgc
gtc 2 gcc 5 gac 10 ggc 7
tta tca taa tga
ata aca 1 aaa 1 aga
cta cca 1 caa 2 cga
gta 3 gca 1 gaa 2 gga 8
ttg tcg tag tgg
atgj 1 acg aag agg
ctg 4 ccg 1 cag 2 cgg 1
gtg gcg 2 gag ggg 1
alpha8 >1aa 80
alpha. distribution du type >1aa duplicata
g1    t1          
atgi tct tat atgf 2
att act aat agt
ctt cct cat cgt
gtt gct gat ggt
ttc 4 tcc tac tgc
atc acc 5 aac 2 agc
ctc 2 ccc cac 4 cgc 5
gtc 3 gcc 6 gac 6 ggc 4
tta tca taa tga
ata aca aaa aga
cta cca caa cga
gta gca gaa 4 gga
ttg tcg tag tgg
atgj 2 acg aag 6 agg
ctg 5 ccg 6 cag 2 cgg
gtg 6 gcg 3 gag 4 ggg
alpha8 dupli 81

alpha par rapport au groupe de référence

Comparaison avec la référence
tRNAs blocs tRNAs blocs rRNAs
alpha8 1aa >1aa dup +5s 1-3aas autres total
21 faible 90 14 38 142
16 moyen 103 15 16 60 134
14 fort 81 51 27 23 182
274 80 81 23 60 518
10 g+cga 46 6 27 79
2 agg+cgg 13 1 14
4 carre ccc 30 7 11 48
5 autres 1 1
90 14 38 142
total tRNAs ‰
alpha8 1aa >1aa dup +5s 1-3aas autres alpha ‰ ref.‰
21 faible 174 27 73 274 26
16 moyen 199 29 31 116 259 324
14 fort 156 98 52 44 351 650
529 154 156 44 116 518 729
10 g+cga 89 12 52 153 10
2 agg+cgg 25 2 0 27
4 carre ccc 58 14 21 93 16
5 autres 2 0 0 2
174 27 73 274
blocs tRNAs ‰ total colonne %
alpha8 1aa >1aa dup total ref.‰ 1aa >1aa dup
21 faible 207 32 87 326 26 33 18 47
16 moyen 237 34 37 308 324 38 19 20
14 fort 186 117 62 366 650 30 64 33
630 184 186 435 729 274 80 81
10 g+cga 106 14 62 182 10 51 71
2 agg+cgg 30 2 0 32 14
4 carre ccc 69 16 25 110 16 33 29
5 autres 2 0 0 2 1
207 32 87 326 90 38

alpha, estimation des -rRNAs

  • Lien tableur: alpha, estimation des -rRNAs
  • Liens fiche:   typage
  • Légende: prélèvement de la base gtRNAdb le 27.5.20
    - ttt et tgt sont nuls partout
    - atgi, c'est Ile2, mis à la place de ttt, très rare chez les procaryotes.
    - atgf, c'est Metf, mis à la place de tgt, très rare chez les procaryotes.
    - atgj, c'est Met, remplace le atg standard qui est la somme Ile2 Met fMet.
    - Voir la légende des tris, g1 t1 et des couleurs

alpha, calcul des -rRNAs

alp alpha 70 génomes
alp1 cumul des +rRNAs de la fiche alpha pour 70 génomes
g1    t1       
atgi tct tat atgf 144
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc tcc tac tgc
atc 189 acc aac agc
ctc ccc cac cgc
gtc gcc gac ggc
tta tca taa tga
ata aca aaa aga
cta cca caa cga
gta gca 191 gaa gga
ttg tcg tag tgg
atgj acg aag agg
ctg ccg cag cgg 1
gtg gcg gag ggg
alph70 inter max min total
380 144 1 525
alp2 indices du clade alpha du 27.5.20 de gtRNAdb pour 100 génomes
g1    t1      347 0.6  0.3
atgi 106 tct tat 0.9 atgf 236
att act 0.3 aat agt
ctt 1.2 cct 0.3 cat cgc 0.3
gtt gct gat 0.6 ggt
ttc 109 tcc 101 tac 104 tgc 105
atc 269 acc 108 aac 111 agc 101
ctc 116 ccc 82 cac 102 cgt 112
gtc 105 gcc 97 gac 150 ggc 133
tta 94 tca 102 taa 1.2 tga 10
ata 1.7 aca 107 aaa 106 aga 103
cta 103 cca 104 caa 113 cga 9.2
gta 105 gca 271 gaa 141 gga 104
ttg 91 tcg 89 tag 0.3 tgg 102
atgj 116 acg 91 aag 80 agg 75
ctg 90 ccg 71 cag 65 cgg 107
gtg 59 gcg 59 gag 54 ggg 70
gtRNA inter max min total
1964 1735 1242 4941
alp3 cumul des -rRNAs de l'annexe alpha 8 génomes
g1    t1       
atgi 9 tct tat atgf 7
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc 13 tcc 8 tac 10 tgc 8
atc 1 acc 13 aac 14 agc 8
ctc 11 ccc 8 cac 11 cgt 13
gtc 13 gcc 16 gac 17 ggc 22
tta 8 tca 8 taa tga 1
ata aca 9 aaa 10 aga 8
cta 8 cca 9 caa 8 cga
gta 7 gca 2 gaa 12 gga 8
ttg 7 tcg 7 tag tgg 10
atgj 10 acg 8 aag 10 agg 6
ctg 15 ccg 10 cag 10 cgg 8
gtg 9 gcg 9 gag 9 ggg 7
alph8 inter max min total
134 159 142 435
alp4 indices des +rRNAs de la fiche alpha pour 100 génomes
g1    t1       
atgi tct tat atgf 206
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc tcc tac tgc
atc 270 acc aac agc
ctc ccc cac cgc
gtc gcc gac ggc
tta tca taa tga
ata aca aaa aga
cta cca caa cga
gta gca 273 gaa gga
ttg tcg tag tgg
atgj acg aag agg
ctg ccg cag cgg 1.4
gtg gcg gag ggg
alph70 inter max min total
543 206 1 750
alp5 estimation des -rRNA du clade alpha pour 100 génomes
g1    t1       
atgi 106 tct tat 0.9 atgf 30
att act 0.3 aat agt
ctt 1.2 cct 0.3 cat cgc 0.3
gtt gct gat 0.6 ggt
ttc 109 tcc 101 tac 104 tgc 105
atc -1 acc 108 aac 111 agc 101
ctc 116 ccc 82 cac 102 cgt 112
gtc 105 gcc 97 gac 150 ggc 133
tta 94 tca 102 taa 1.2 tga 10
ata 1.7 aca 107 aaa 106 aga 103
cta 103 cca 104 caa 113 cga 9.2
gta 105 gca -2 gaa 141 gga 104
ttg 91 tcg 89 tag 0.3 tgg 102
atgj 116 acg 91 aag 80 agg 75
ctg 90 ccg 71 cag 65 cgg 106
gtg 59 gcg 59 gag 54 ggg 70
-rRNA inter max min total
1421 1529 1241 4191
alp6 indices des -rRNAs de l'annexe alpha pour 100 génomes
g1    t1       
atgi 113 tct tat atgf 88
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc 163 tcc 100 tac 125 tgc 100
atc 13 acc 163 aac 175 agc 100
ctc 138 ccc 100 cac 138 cgt 163
gtc 163 gcc 200 gac 213 ggc 275
tta 100 tca 100 taa tga 13
ata aca 113 aaa 125 aga 100
cta 100 cca 113 caa 100 cga
gta 88 gca 25 gaa 150 gga 100
ttg 88 tcg 88 tag tgg 125
atgj 125 acg 100 aag 125 agg 75
ctg 188 ccg 125 cag 125 cgg 100
gtg 113 gcg 113 gag 113 ggg 88
alph8 inter max min total
1675 1988 1775 5438

alpha, comparaison clade-annexe des -rRNAs

  • Lien tableur: alpha, comparaison clade-annexe des -rRNAs
  • Légende
    - alp7. diff, somme des couleurs de alp7. La différence entre tRNAs est faite entre alp5 et alp6 du tableau précédent. Elle est exprimée en % et rapporté à la plus grande valeur des 2 termes de la différence. Ce qui fait quand un tRNA est à zéro la différence en % est égale à 100.
    - alp8. rap, rapport des sommes couleurs alp5/alp2. Le rapport -rRNA/total est celui du tRNA de alp5 sur celui de alp2.
  • Fréquences des différences en % du tableau alp7
gamme		0/0	10	20	30	40	50	60	70	80	90	100		total
fréquence	0	18	9	2	6	4	4	1	0	0	2	2	48
tot ≤ 50						39							
  • Comparaison avec le nombre de tRNAs de la fiche du clade: L’estimation des -rRNA par l'annexe est 19% au dessus de celle de la fiche des alpha.
tRNAs		fiche		annexe
sans		3190		435
avec		525		205
genomes		70		8
indice %	46		54
alp alpha 63 génomes
alp7 alpha, différence clade-annexe des -rRNAs
g1    t1       
atgi 6 tct tat 100 atgf 66
att act 100 aat agt
ctt 100 cct 100 cat cgc 100
gtt gct gat 100 ggt
ttc 33 tcc 1 tac 17 tgc 5
atc 108 acc 34 aac 37 agc 1
ctc 16 ccc 18 cac 26 cgt 31
gtc 35 gcc 52 gac 29 ggc 52
tta 6 tca 2 taa 100 tga 20
ata 100 aca 5 aaa 15 aga 3
cta 3 cca 8 caa 12 cga 100
gta 17 gca 107 gaa 6 gga 4
ttg 4 tcg 2 tag 100 tgg 18
atgj 7 acg 9 aag 36 agg 0
ctg 52 ccg 43 cag 48 cgg 5
gtg 48 gcg 48 gag 52 ggg 20
diff inter max min total
178 330 451 959
alp8 alpha, rapports -rRNA/total
g1    t1       
atgi tct tat atgf 13
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc tcc tac tgc
atc 0 acc aac agc
ctc ccc cac cgc
gtc gcc gac ggc
tta tca taa tga
ata aca aaa aga
cta cca caa cga
gta gca -1 gaa gga
ttg tcg tag tgg
atgj acg aag agg
ctg ccg cag cgg 99
gtg gcg gag ggg
rap inter max min total
72 88 100 85

Beta

Chromobacterium violaceum ATCC 12472

cvi opérons

  • Lien tableur: cvi opérons
  • Liens: gtRNAdb [34], NCBI [35], génome [36]
  • Phylogénie: Bacteria; Proteobacteria; Betaproteobacteria; Neisseriales; Chromobacteriaceae; Chromobacterium.
  • Légende:
Bd1. cvi opérons, Chromobacterium violaceum ATCC 12472
65%GC 30.6.19 Paris  98  doubles intercalaire
421217..422762 16s @1 179
422942..423018 atc 86
423105..423180 gca 249
423430..426324 23s 125
426450..426564 5s
502182..503727 16s 79
503807..503883 atc 12
503896..503971 gca 250
504222..507116 23s 122
507239..507353 5s
comp 682034..682118 ttg
759824..759908 tac
comp 878775..878849 agg
955155..955230 gcg
975612..975696 ctc
1006822..1006897 ttc + 6
1006904..1006979 ttc 2 ttc
1058518..1058611 agc 6
1058618..1058694 cgt 3
1058698..1058772 gaa
comp 1061741..1061815 gaa + 3
comp 1061819..1061895 cgt 2 gaa 7
comp 1061903..1061977 gaa 2cgt 5
comp 1061983..1062059 cgt
1154020..1155565 16s 179
1155745..1155821 atc 86
1155908..1155983 gca 250
1156234..1159128 23s 122
1159251..1159365 5s
comp 1263556..1263645 tcg
1273710..1273786 atgf
1377435..1377510 ggc + 23
1377534..1377609 ggc 5 ggc 22
1377632..1377707 ggc 24
1377732..1377807 ggc 29
1377837..1377912 ggc 45
1377958..1378031 tgc
1387010..1387094 tta
1420085..1420161 gtc
1427771..1427847 ccc
comp 1433244..1433319 aac + 32
comp 1433352..1433427 aac 3 aac 31
comp 1433459..1433534 aac
1646821..1648366 16s 179
1648546..1648622 atc 86
1648709..1648784 gca 249
1649034..1651928 23s 122
1652051..1652165 5s 89
1652255..1652369 5s
1746117..1746207 tcc + 53
1746261..1746351 tcc 2 tcc
1978844..1978919 aac
comp 2094372..2094447 cac + 26
comp 2094474..2094549 cac 3 cac 45
comp 2094595..2094670 cac 27
comp 2094698..2094774 aga 18
comp 2094793..2094869 cca
comp 2511625..2511712 tca
comp 2747299..2747375 gac 7
comp 2747383..2747458 gta
2853221..2853305 cta
3187082..3187157 aca
3257362..3257437 gcc
3262246..3262321 gcc + 8
3262330..3262405 gaa 2 gcc 11
3262417..3262492 gcc
comp 3371478..3371592 5s 122
comp 3371715..3374609 23s 250
comp 3374860..3374935 gca 12
comp 3374948..3375024 atc 79
comp 3375104..3376649 16s
3472822..3472897 gta + 12
3472910..3472986 gac 5 gta 26
3473013..3473088 gta 6 gac 12
3473101..3473177 gac 1 gtg 26
3473204..3473279 gta 12
3473292..3473368 gac 26
3473395..3473470 gta 12
3473483..3473559 gac 27
3473587..3473663 gta 6
3473670..3473746 gac 27
3473774..3473850 gtg 6
3473857..3473933 gac
3622292..3622365 ggg
comp 3820120..3820234 5s 122
comp 3820357..3823251 23s 249
comp 3823501..3823576 gca 86
comp 3823663..3823739 atc 179
comp 3823919..3825464 16s
3828836..3828922 ctg + 51
3828974..3829060 ctg 4 ctg 33
3829094..3829180 ctg 57
3829238..3829324 ctg
3854547..3854622 caa @2 557
3855180..3855255 acg 61
3855317..3855393 ccg + 78
3855472..3855548 ccg 2 ccg
comp 4059834..4059912 atgi
comp 4244591..4244705 5s 122
comp 4244828..4247722 23s 249
comp 4247972..4248047 gca 86
comp 4248134..4248210 atc 179
comp 4248390..4249935 16s
comp 4325718..4325794 atgf
comp 4389268..4389342 caa
4402077..4402153 cgg
comp 4434130..4434244 5s 122
comp 4434367..4437261 23s 249
comp 4437511..4437586 gca 86
comp 4437673..4437749 atc 179
comp 4437929..4439474 16s
4474196..4474272 atgj + 35
4474308..4474384 atgj 2 atgj
comp 4529616..4529690 acc
comp 4532053..4532128 tgg
comp 4533370..4533444 acc 24
comp 4533469..4533542 gga 52
comp 4533595..4533679 tac
comp 4586712..4586787 aaa + 38
comp 4586826..4586901 aag 3 aaa 35
comp 4586937..4587012 aaa 2 aag 28
comp 4587041..4587116 aag 37
comp 4587154..4587229 aaa

cvi cumuls

cumuls. cvi
opérons Fréquences intercalaires tRNAs
effectif gammes sans rRNAs avec rRNAs
avec rRNA opérons 8 1 0
16 23 5s 0 0 20 16 2
16 atc gca 8 40 20
16 23 5s a 0 60 6
max a 2 80 2
a doubles 0 100 0 6
spéciaux 0 120 0
total aas 16 140 0
sans opérons 37 160 0
1 aa 22 180 0
max a 12 200 0
a doubles 12 1
total aas 82 45 8
total aas 98
remarques 2
avec jaune moyenne
variance
sans jaune moyenne 26 86
variance 18 0

cvi blocs

Bt1. cvi, blocs à rRNA.
16s 179 1546 79 1546 179 1546
atc 86 12 86
gca 249 250 250
23s 125 2895 122 2895 122 2895
5s 115 115 115
5s 122 115 122 115 122 115 122 115
23s 250 2895 249 2895 249 2895 249 2895
gca 12 86 86 86
atc 79 179 179 179
16s 1546 1546 1546 1546
16s 179 1546
atc 86
gca 249
23s 122 2895
5s 89 115
5s 115

cvi remarques

  • Lien tableur: cvi remarques
  • Remarques : Pas de blocs 16-23-5s et 8 blocs 16-atc gca 23-5s. Beaucoup de doubles.
    1. @ 8 blocs 16-atc gca 23-5s tous sans aas supplémentaires.
      - Les intercalaires gca-23s-5s sont tous identiques, 250 122.
      - Un groupe de 2 opérons aux intercalaires 16s-atc-gca 79 12 très différent du suivant
      - Un groupe de 6 opérons aux intercalaires 16s-atc-gca 179 86, respectivement 2 et 7 fois plus grands.
      - Un opéron présente 1 5s supplémentaire collé au 1er.
    2. @ Un intercallaire très élevé, 557 bases, entre 2 aas d’un opéron à 4aas.
  • Séquences des doubles : 12 opérons sur 23 à 2aas et plus ont des doubles. 3 opérons à séquences répétées.
    - 12 opérons sans rRNAs sur 15 à 2 aas et plus ont des doubles.
    - 4 opérons avec 1 doublet chacun
    - 1 opéron au doublet séparé (gcc gaa gcc
    - 4 opérons à répétitions multiples non séparées, voir ci-dessous.
    - 3 opérons avec répétition de séquences
    • 2gaa 2cgt avec 2*2
    • 3aaa 2aag avec 2*2
    • 4gta 6gac 2gtg avec 4*2 + 2*2.
2ttc			3aac			2gaa 2cgt		2*2
2tcc			cca aga 3cac		3aaa 2aag		2*2
2atg			4ctg			4gta 6gac 2gtg		4*2 + 2*2
caa acg 2ccg		tgc 5ggc		-			-
gcc gaa gcc		-			-			-
  • Code génétique de cvi:
    Légende: prélèvement de la base gtRNAdb le
    • - totaux en en-tête, 99 total de gtRNAdb contenant des pseudo et inconnus; 98 total du cumul. Le tRNA impacté est atgf avec 3 gtRNAdb et 2 en NCBI.
    • - atgi, c'est Ile2, mis à la place de ttt, très rare chez les procaryotes.
    • - atgf, c'est Metf, mis à la place de tgt, très rare chez les procaryotes.
    • - atgj, c'est Met, remplace le atg standard qui est la somme Ile2 Metf Met.
    • - Voir la légende des tris et couleurs, g1 t1.
Bt1 cvi, Chromobacterium violaceum ATCC 12472
g1    t1       99  98
atgi 1 tct tat atgf 3
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc 2 tcc 2 tac 2 tgc 1
atc 8 acc 2 aac 4 agc 1
ctc 1 ccc 1 cac 3 cgt 3
gtc 1 gcc 3 gac 7 ggc 5
tta 1 tca 1 taa tga
ata aca 1 aaa 3 aga 1
cta 1 cca 1 caa 2 cga
gta 5 gca 8 gaa 4 gga 1
ttg 1 tcg 1 tag tgg 1
atgj 2 acg 1 aag 2 agg 1
ctg 4 ccg 2 cag cgg 1
gtg 2 gcg 1 gag ggg 1

cvi distribution

  • Lien tableur: cvi distribution
  • Liens aux fiches:   beta
  • Liens aux indices:   beta epsilon delta
  • Notes:
  • Légende: Tableau des indices, en-tête: total des génomes, total des tRNAs, indice ttt, indice tgt.
aac3 atgj2 cac3 ccg2 ctg4 ggc5 tcc2 ttc2
séquences:  (gaa cgt)2 ((gta gac)5 gtg gac) ((aaa aag)2 aaa)
Bt1 cvi, Chromobacterium violaceum ATCC 12472. Beta
Bt11 cvi, distribution du total
g1    t1       
atgi 1 tct tat atgf 2
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc 2 tcc 2 tac 2 tgc 1
atc 8 acc 1 aac 4 agc 1
ctc 1 ccc 1 cac 3 cgt 3
gtc 1 gcc 3 gac 7 ggc 5
tta 1 tca 1 taa tga
ata aca 1 aaa 3 aga 1
cta 1 cca 1 caa 2 cga
gta 6 gca 8 gaa 4 gga 1
ttg 1 tcg 1 tag tgg 1
atgj 2 acg 1 aag 2 agg 1
ctg 4 ccg 2 cag cgg 1
gtg 1 gcg 2 gag ggg 1
beta >1aa 1aa -5s +5s -16s +16s total
cvi 60 22 16 98
Bt12 cvi, distribution des solitaires
g1    t1       
atgi 1 tct tat atgf 2
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc tcc tac 1 tgc
atc acc 1 aac 1 agc
ctc 1 ccc 1 cac cgt
gtc 1 gcc 1 gac ggc
tta 1 tca 1 taa tga
ata aca 1 aaa aga
cta 1 cca caa 1 cga
gta gca gaa gga
ttg 1 tcg 1 tag tgg 1
atgj acg aag agg 1
ctg ccg cag cgg 1
gtg gcg 1 gag ggg 1
cvi >1aa 1aa -5s +5s -16s +16s total
type 22 22
Bt13 cvi, distribution des >1aa et des duplicata
g1    t1       
atgi tct tat atgf
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc 2 tcc 2 tac 1 tgc 1
atc acc aac 3 agc 1
ctc ccc cac 3 cgt 3
gtc gcc 2 gac 7 ggc 5
tta tca taa tga
ata aca aaa 3 aga 1
cta cca 1 caa 1 cga
gta 6 gca gaa 4 gga 1
ttg tcg tag tgg
atgj 2 acg 1 aag 2 agg
ctg 4 ccg 2 cag cgg
gtg 1 gcg 1 gag ggg
cvi >1aa dupli -5s +5s -16s +16s total
type 37 23 60
beta2. Indices du 11.1.21. 268 génomes
g1 t1 268 15721 5.2  0
atgi 99 tct 0.4 tat atgf 177
att 1.1 act 0.7 aat 0.4 agt 0.4
ctt 2.2 cct cat cgc 0.7
gtt 0.7 gct gat ggt
ttc 108 tcc 101 tac 107 tgc 142
atc 367 acc 102 aac 184 agc 101
ctc 143 ccc 100 cac 109 cgt 187
gtc 150 gcc 124 gac 246 ggc 224
tta 55 tca 99 taa tga 60
ata 0.4 aca 114 aaa 121 aga 114
cta 101 cca 137 caa 123 cga
gta 118 gca 373 gaa 202 gga 101
ttg 102 tcg 111 tag 2.6 tgg 102
atgj 107 acg 96 aag 103 agg 99
ctg 191 ccg 92 cag 0.7 cgg 107
gtg 90 gcg 79 gag 0.4 ggg 82
inter max min total

cvi intercalaires entre cds

  • Lien NCBI [37] 25.12.20
  • Note: Pour les génomes des annexes j'ai relevé les intercalaires entre tRNAs et entre ceux-ci et les cds qui leur sont adjacents. L'exemple est celui de rru du clade alpha. L'idée de départ de ces prélèvements est la recherche d'opérons formés de tRNA et de protéine comme dans le cas d'E.coli: l'intercalaire entre le tRNA et la protéine devrait être faible. Voir l'exemple d'eco (remarque @3) avec tac-tac-tpr et aca-tac-gga-acc-tufB.

cvi les fréquences

  • Lien tableur: cvi intercalaires entre cds
  • Légende:   long, longueur en pbs,   intercal pour intercalaire
    - fréquence-1 1 5 6 f, respectivement fréquence des intercalaires négatives à l'unité, positives à l'unité, par blocs de 5, par blocs de 10 jusqu'à 600 pbs et f pour finales. Ces fréquences servent à faire les diagrammes. La fréquence fréquencez est l'étendue à 1200 de la fréquence6 pour certains grands génomes.
    - cumul,% colonne à la droite de frequence6, reprend les fréquences par plages et leurs pourcentages indiqués déjà dans la 1ère partie du tableau.
    - La couleur cyan des fréquences fréquence-1 et 1 sert à montrer leur périodicité ternaire.
    - intercaln intercalx, pour les intercalaires négatifs minimaux et intercalaires positifs maximaux.
    - colonne ADN pour la longueur totale du génome en pbs et intercals pour le total en pbs des intercalaires entre cds uniquement, d'après la méthode des prélèvements de NCBI du 25.12.20.
cvi Les fréquences des intercalaires entre cds
cvi intercalaires total % intercalaires moyenne ecartype plage ADN intercal frequence5 intercal fréquencez
négatif 756 17.7 négatif -8 11 -1 à -102 4 751 080 -1 756 610 2
zéro 15 0.4 intercals 0 15 620 1
1 à 200 2842 66.4 0 à 200 74 55 452 650 5 227 630 2
201 à 370 455 10.6 201 à 370 266 47 9.5% 10 169 640 1
371 à 600 147 3.4 371 à 600 453 59 15 168 650 1
601 à max 67 1.6 601 à 1309 795 172 20 110 660 4
total 4282 <201 84.4 total 4281 104 142 -102 à 1309 25 72 670 4
adresse intercalx intercal fréquence1 intercal fréquence6 cumul,% intercal fréquence-1 30 66 680 2
1407250 1977 -1 756 -70 6 0 15 35 68 690 3
2476400 1309 0 15 -60 1 -1 118 40 65 700 5
667844 1253 1 65 -50 4 -2 3 45 75 710 2
448587 1220 2 47 -40 9 -3 0 50 67 720 1
357760 1187 3 52 -30 12 min à -1 -4 397 55 84 730 5
707510 1165 4 36 -20 32 756 -5 0 60 94 740 2
139762 1148 5 27 -10 103 17.7% -6 2 65 120 750 1
1309853 1098 6 21 0 604 -7 12 70 126 760 2
2457295 1068 7 24 10 396 -8 56 75 114 770 1
669869 1004 8 18 20 278 -9 1 80 82 780 1
2288697 984 9 49 30 138 -10 6 85 62 790 1
1828489 968 10 57 40 133 1 à 100 -11 35 90 53 800 4
3613803 905 11 44 50 142 1984 -12 1 95 81 810 1
2465473 902 12 32 60 178 46.3% -13 12 100 66 820 2
2025387 900 13 39 70 246 -14 21 105 60 830 0
869124 888 14 28 80 196 -15 0 110 57 840 1
2030614 865 15 25 90 115 -16 4 115 69 850 0
664864 858 16 33 100 147 -17 19 120 48 860 1
2442265 838 17 19 110 117 -18 0 125 58 870 1
561508 819 18 20 120 117 -19 5 130 69 880 0
1345805 811 19 23 130 127 -20 13 135 48 890 1
27453 809 20 15 140 92 -21 1 140 44 900 1
3009727 799 21 17 150 71 -22 2 145 41 910 2
914899 796 22 15 160 81 -23 5 150 30 920 0
344593 793 23 8 170 72 1 à 200 -24 1 155 46 930 0
1783705 791 24 21 180 63 2842 -25 3 160 35 940 0
1569417 787 25 11 190 67 66.4% -26 3 165 41 950 0
3000804 771 26 15 200 66 -27 0 170 31 960 0
34255 767 27 10 210 58 -28 1 175 37 970 1
136535 759 28 14 220 38 -29 3 180 26 980 0
2126902 751 29 15 230 42 -30 0 185 39 990 1
1360178 742 30 12 240 37 -31 4 190 28 1000 0
3310655 736 31 18 250 22 0 à 200 -32 2 195 34 1010 1
2140607 733 32 12 260 29 2857 total 75 200 32 1020 0
33 17 270 37 reste 26 205 32 1030 0
34 11 280 31 total 771 210 26 1040 0
35 10 290 28 215 19 1050 0
36 12 300 22 intercal fréquencef 220 19 1060 0
37 14 310 21 600 4215 225 21 1070 1
38 10 320 20 620 3 230 21 1080 0
39 13 330 11 640 3 235 17 1090 0
40 16 340 19 201 à 370 660 5 240 20 1100 1
reste 2566 350 11 455 680 6 245 11 1110 0
total 3857 360 11 10.6% 700 8 250 11 1120 0
370 18 720 3 255 9 1130 0
380 10 740 7 260 20 1140 0
390 10 760 3 265 17 1150 1
adresses intercaln décalage long 400 11 780 2 270 20 1160 0
4014450 -102 comp 410 11 800 5 275 15 1170 1
1765439 -97 shift2 1671 420 9 820 3 280 16 1180 0
1246857 -94 shift2 798 430 12 840 1 285 17 1190 1
4426186 -80 comp 440 14 860 1 290 11 1200 0
3511064 -73 shift2 1 450 9 880 1 295 14 reste 4
3199809 -71 shift2 494 460 5 900 2 300 8 total 4282
3580355 -61 comp 470 6 920 2 305 14
4088183 -59 480 6 940 310 7
2599768 -57 490 5 960 315 14
1062106 -56 500 1 980 1 320 6
3542032 -50 510 10 1000 1 325 5
834886 -49 520 5 1020 1 330 6
2603937 -44 530 4 1040 335 13
2822032 -44 540 2 371 à 600 1060 340 6
4104968 -44 550 4 147 1080 1 345 6
283435 -43 560 3 3.4% 1100 1 350 5
226851 -41 570 5 1120 355 6
387678 -41 580 3 601 à max 1140 360 5
1796583 -41 590 0 67 1160 1 365 10
4120154 -40 600 2 1.6% 61 370 8
3951302 -38 reste 67 reste 6 reste 214
4595659 -38 total 4282 total 4282 total 4282

cvi autres intercalaires

  • Lien tableur: cvi autres intercalaires
  • Légende:  
    - comp, le gène est sur le brin complement
    - deb, fin sont respectivement dans le sens des adresses croissantes, le cds avant le 1er tRNA et le cds après le dernier tRNA du bloc.
cvi Les autres intercalaires.
cvi1 adresses1
deb-fin gènes adresses intercal sens
deb CDS 242272 116 comp
regulatory 243048 76
fin CDS 243272
deb CDS 419401 506 comp
rRNA 421224 182
tRNA 422942 86
tRNA 423105 253
rRNA 423434 127
rRNA 426450 137
fin CDS 426702 comp
deb CDS 500524 447
rRNA 502189 82
tRNA 503807 12
tRNA 503896 254
rRNA 504226 124
rRNA 507239 280
fin CDS 507634
deb CDS 521304 119 comp
regulatory 522458 124
fin CDS 522848
deb CDS 526333 31
ncRNA 526676 12
fin CDS 526872
deb CDS 578634 106 comp
ncRNA 581905 130
fin CDS 582495
deb CDS 680663 177 comp
tRNA 682034 58 comp
fin CDS 682177 comp
deb CDS 758940 152 comp
tRNA 759824 57
fin CDS 759966 comp
deb CDS 877002 858 comp
tRNA 878775 19 comp
fin CDS 878869 comp
deb CDS 952811 49
tRNA 955155 329
fin CDS 955560
deb CDS 975236 19
tRNA 975612 91
fin CDS 975788
deb CDS 996781 89 comp
regulatory 998457 72
fin CDS 998621
deb CDS 1006022 155
tRNA 1006822 6
tRNA 1006904 51
fin CDS 1007031
deb CDS 1057229 62
tRNA 1058518 6
tRNA 1058618 3
tRNA 1058698 110
deb CDS 1058883 173 comp
tRNA 1061741 3 comp
tRNA 1061819 7 comp
tRNA 1061903 5 comp
tRNA 1061983 46 comp
fin CDS 1062106
deb CDS 1153105 370
rRNA 1154027 182
tRNA 1155745 86
tRNA 1155908 254
rRNA 1156238 124
rRNA 1159251 189
fin CDS 1159555
deb CDS 1262223 190
tRNA 1263556 120 comp
fin CDS 1263766 comp
deb CDS 1272648 435
tRNA 1273710 180
fin CDS 1273967 comp
deb CDS 1292860 191
repeat_region 1293342 324
fin CDS 1295441
deb CDS 1376752 101
tRNA 1377435 23
tRNA 1377534 22
tRNA 1377632 24
tRNA 1377732 29
tRNA 1377837 45
tRNA 1377958 425
fin CDS 1378457 comp
deb CDS 1385508 707 comp
tRNA 1387010 183
fin CDS 1387278
deb CDS 1418833 136 comp
tRNA 1420085 182
fin CDS 1420344
cvi2 adresses2
deb-fin gènes adresses intercal sens
deb CDS 1427387 30
tRNA 1427771 204
fin CDS 1428052
deb CDS 1432303 98 comp
tRNA 1433244 32 comp
tRNA 1433352 31 comp
tRNA 1433459 211 comp
fin CDS 1433746
deb CDS 1451057 323 comp
repeat_region 1452712 105
fin CDS 1454130 comp
deb CDS 1458879 179
repeat_region 1461308 144
fin CDS 1462645
deb CDS 1644076 439
rRNA 1646828 182
tRNA 1648546 86
tRNA 1648709 253
rRNA 1649038 124
rRNA 1652051 89
rRNA 1652255 154
fin CDS 1652524 comp
deb CDS 1689363 107 comp
regulatory 1690517 42 comp
fin CDS 1690745 comp
deb CDS 1744930 59
tRNA 1746117 53
tRNA 1746261 360
fin CDS 1746712
deb CDS 1786722 25
tRNA 1786963 15
fin CDS 1787071
deb CDS 1899096 223
repeat_region 1900978 157
fin CDS 1902728 comp
deb CDS 1975805 93
tRNA 1978844 66
fin CDS 1978986 comp
deb CDS 2093021 230
tRNA 2094372 26
tRNA 2094474 45
tRNA 2094595 27
tRNA 2094698 18
tRNA 2094793 225
fin CDS 2095095 comp
deb CDS 2186305 69
tmRNA 2186992 205
fin CDS 2187562
deb CDS 2192639 145 comp
regulatory 2193399 4 comp
regulatory 2193502 65 comp
fin CDS 2193653 comp
deb CDS 2337863 -1
ncRNA 2338135 0
fin CDS 2338210
deb CDS 2511015 130 comp
tRNA 2511625 46 comp
fin CDS 2511759 comp
deb CDS 2560167 264 comp
ncRNA 2560755 168 comp
fin CDS 2561022
deb CDS 2745389 71 comp
tRNA 2747299 7 comp
tRNA 2747383 48 comp
fin CDS 2747507 comp
deb CDS 2852349 182 comp
tRNA 2853221 70
fin CDS 2853376 comp
deb CDS 3186574 49 comp
tRNA 3187082 411
fin CDS 3187569
deb CDS 3256344 205 comp
tRNA 3257362 151
fin CDS 3257589 comp
deb CDS 3261178 303 comp
tRNA 3262246 8
tRNA 3262330 11
tRNA 3262417 106
fin CDS 3262599 comp
deb CDS 3368966 415 comp
rRNA 3371478 124 comp
rRNA 3371717 254 comp
tRNA 3374860 12 comp
tRNA 3374948 82 comp
rRNA 3375107 439 comp
fin CDS 3377082 comp
deb CDS 3447322 50 comp
regulatory 3448389 124 comp
fin CDS 3448608
cvi3 adresses3
deb-fin gènes adresses intercal sens
deb CDS 3471644 212 comp
tRNA 3472822 12
tRNA 3472910 26
tRNA 3473013 12
tRNA 3473101 26
tRNA 3473204 12
tRNA 3473292 26
tRNA 3473395 12
tRNA 3473483 27
tRNA 3473587 6
tRNA 3473670 27
tRNA 3473774 6
tRNA 3473857 163
fin CDS 3474097
deb CDS 3621600 170
tRNA 3622292 55
fin CDS 3622421
deb CDS 3727029 40 comp
regulatory 3728158 14 comp
regulatory 3728271 172 comp
fin CDS 3728534 comp
deb CDS 3818863 213 comp
rRNA 3820120 124 comp
rRNA 3820359 253 comp
tRNA 3823501 86 comp
tRNA 3823663 182 comp
rRNA 3823922 437 comp
deb CDS 3825895 73 comp
tRNA 3828836 51
tRNA 3828974 33
tRNA 3829094 57
tRNA 3829238 651
fin CDS 3829976 comp
deb CDS 3854191 770 comp
tRNA 3855180 61 comp
tRNA 3855317 78 comp
tRNA 3855472 97 comp
fin CDS 3855646
deb CDS 4058859 201 comp
tRNA 4059834 92 comp
fin CDS 4060005 comp
deb CDS 4244169 101
rRNA 4244591 124 comp
rRNA 4244830 253 comp
tRNA 4247972 86 comp
tRNA 4248134 182 comp
rRNA 4248393 450 comp
fin CDS 4250379
deb CDS 4324029 747 comp
tRNA 4325718 151 comp
fin CDS 4325946 comp
deb CDS 4388195 89 comp
tRNA 4389268 6 comp
fin CDS 4389349 comp
deb CDS 4401196 137 comp
tRNA 4402077 265
fin CDS 4402419 comp
deb CDS 4433423 206
rRNA 4434130 124 comp
rRNA 4434369 253 comp
tRNA 4437511 86 comp
tRNA 4437673 182 comp
rRNA 4437932 391 comp
fin CDS 4439859
deb CDS 4472951 87
tRNA 4474196 35
tRNA 4474308 125
fin CDS 4474510
deb CDS 4529035 86 comp
tRNA 4529616 179 comp
fin CDS 4529870 comp
deb CDS 4531632 64 comp
tRNA 4532053 10 comp
deb CDS 4532139 40 comp
tRNA 4533370 24 comp
tRNA 4533469 52 comp
tRNA 4533595 139 comp
fin CDS 4533819 comp
deb CDS 4549877 87 comp
regulatory 4551002 131
fin CDS 4551282
deb CDS 4586188 194 comp
tRNA 4586712 38 comp
tRNA 4586826 35 comp
tRNA 4586937 28 comp
tRNA 4587041 37 comp
tRNA 4587154 130 comp
fin CDS 4587360 comp

cvi intercalaires tRNA

  • Lien tableur: cvi intercalaires tRNA
  • Légende:
    - comp', l'intercalaire est entre un gène comp (sur le complément) et un gène sur le brin direct. Continu les 2 gènes sont sur le même brin.
    - deb, fin sont les intercalaires des cds du tableau précédent, autres intercalaires: respectivement dans le sens des adresses croissantes, le cds avant le 1er tRNA et le cds après le dernier tRNA du bloc.
  • Cumuls comp'+continu du tableau
	deb	fin	total
<201	29	29	58
total	39	39	78
%	74	74	74
cvi intercalaires tRNA
cvi les relevés deb-fin
comp’ entre tRNAs comp’ deb comp’ fin
177 58
comp’ 152 comp’ 57
858 19
49 329
19 91
6 155 51
6 3 62 comp’ 110
3 7 5 173 comp’ 46
comp’ 190 120
435 comp’ 180
191 324
23 22 24 29 45 101 comp’ 425
comp’ 707 183
comp’ 136 182
30 204
32 31 98 comp’ 211
53 59 360
25 15
93 comp’ 66
26 45 27 18 230 comp’ 225
130 46
7 71 48
comp’ 182 comp’ 70
comp’ 49 411
comp’ 205 comp’ 151
8 11 comp’ 303 comp’ 106
12 26 12 26 12 26 comp’ 212 163
12 27 6 27 6
170 55
51 33 57 comp’ 73 comp’ 651
61 78 770 comp’ 97
201 92
747 151
89 6
comp’ 137 comp’ 265
35 87 125
86 179
64 10
24 52 40 139
38 35 28 37 194 130
cvi intercalaires inférieures à 201 pbs
deb fin continu cumuls
19 6 deb
25 10 <201 22
30 15 total 27
40 19 taux 81%
49 46
59 48 fin
62 51 <201 20
64 55 total 25
71 58 taux 80%
86 91
87 92 total
89 120 <201 42
93 125 total 52
98 130 taux 81%
101 139
130 151
155 163
170 179
173 182
177 183
191 204
194 324
201 329
230 360
435 411
747
858 comp’ cumuls
49 46 deb
73 57 <201 7
136 66 total 12
137 70 taux 58%
152 97
182 106 fin
190 110 <201 9
205 151 total 14
212 180 taux 64%
303 211
707 225 total
770 265 <201 16
- 425 total 26
- 651 taux 62%

cvi intercalaires rRNA

  • Voir la présentation des blocs à rRNA dans le chapitre cvi blocs de l'étude préliminaire. A comparer avec le tableau cvi autres intercalaires.
  • Remarque: Quand le 16s n'est pas précédé de tRNAs l'intercalaire cds-16s est élevé, pour le 2ème bloc il est ici de 447 pbs. L'intercalaire cds-bloc de l'autre côté du bloc est beaucoup plus faible, ici 280 pbs. Cette orientation est quasiment générale chez tous les génomes que j'ai étudié ici. Je l'ai notée dans les chapitres génome-bloc de chaque génome. Mais en plus ici j'ai un bloc en direct avec les 2 cds en comp, c'est le 1er bloc avec 506 et 137. De même le dernier bloc en comp, c'est à dire orienté 5s23s16s, est orienté comme les rRNAs avec les cds correspondants 206 391.
  • Note: J'ai supposé souvent que les blocs à tRNA sans rRNA sont aussi orientés de l'intercalaire le plus grand au plus petit. Dans cvi cumuls et de même pour les autres génomes, j'ai noté cette orientation dans la colonne cdsd, pour cds dirigé. Je n'ai conservé pour les calculs que le plus petit intercalaire des 2 cds bordant le bloc. L'idée était que cette orientation provoquait la création du cds en fin de bloc. Ces cds sont souvent de petites protéines et souvent hypothétiques. Aussi je présente ci-dessous la transformation deb-fin qui est imposée par l'adressage en intercalaire plus grand et plus petit.
deb	fin		tri	grand	petit		deb	fin		tri	grand	petit
177	58		33	89	6		130	46		29	651	73
152	57		37	64	10		71	48		36	179	86
858	19		18	25	15		182	70		35	125	87
49	329		3	858	19		49	411		31	201	92
19	91		5	91	19		205	151		30	770	97
155	51		15	204	30		303	106		16	211	98
62	110		38	139	40		212	163		12	425	101
173	46		8	173	46		170	55		26	303	106
190	120		21	130	46		73	651		9	190	120
435	180		22	71	48		770	97		39	194	130
191	324		4	329	49		201	92		14	182	136
101	425		24	411	49		747	151		34	265	137
707	183		6	155	51		89	6		25	205	151
136	182		28	170	55		137	265		32	747	151
30	204		2	152	57		87	125		27	212	163
98	211		1	177	58		86	179		10	435	180
59	360		17	360	59		64	10		13	707	183
25	15		7	110	62		40	139		11	324	191
93	66		19	93	66		194	130		20	230	225
230	225		23	182	70		-	-		-	-	-

cvi par rapport au groupe de référence

Comparaison avec la référence
tRNAs blocs tRNAs blocs rRNAs
cvi 1aa >1aa dup +5s 1-3aas autres total
21 faible 9 7 2 18
16 moyen 7 3 11 16 37
14 fort 6 27 10 43
22 37 23 16 98
10 g+cga 3 5 2 10
2 agg+cgg 2 2
4 carre ccc 4 2 6
5 autres 0
9 7 2 18
total tRNAs ‰
cvi 1aa >1aa dup +5s 1-3aas autres cvi ‰ ref.‰
21 faible 92 71 20 184 26
16 moyen 71 31 112 163 378 324
14 fort 61 276 102 439 650
224 378 235 163 98 729
10 g+cgg 31 51 20 102 10
2 agg+cga 20 20
4 carre ccc 41 20 61 16
5 autres 0
92 71 20 184
blocs tRNAs ‰ total colonne %
cvi 1aa >1aa dup total ref.‰ 1aa >1aa dup
21 faible 110 85 24 220 26 41 19 9
16 moyen 85 37 134 256 324 32 8 48
14 fort 73 329 122 524 650 27 73 43
268 451 280 82 729 22 37 23
10 g+cgg 37 61 24 122 10
2 agg+cga 24 24
4 carre ccc 49 24 73 16
5 autres
110 85 24 220

beta, estimation des -rRNAs

  • Lien tableur: beta, estimation des -rRNAs
  • Liens fiche:   typage
  • Légende: prélèvement de la base gtRNAdb le 22.1.21
    - ttt et tgt sont nuls partout
    - atgi, c'est Ile2, mis à la place de ttt, très rare chez les procaryotes.
    - atgf, c'est Metf, mis à la place de tgt, très rare chez les procaryotes.
    - atgj, c'est Met, remplace le atg standard qui est la somme Ile2 Met fMet.
    - Voir la légende des tris, g1 t1 et des couleurs

beta, calcul des -rRNAs

bet beta 44 génomes
bet1 cumul des +rRNAs de la fiche beta pour 44 génomes
g1    t1       
atgi tct tat atgf 2
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc tcc tac 10 tgc
atc 159 acc 10 aac agc 1
ctc ccc cac cgc
gtc gcc gac ggc
tta tca taa tga
ata aca aaa aga
cta cca caa cga
gta gca 159 gaa gga 10
ttg tcg tag tgg
atgj acg aag agg
ctg ccg cag cgg
gtg gcg gag ggg
+beta44 inter max min total
329 22 0 351
bet2 indices du clade beta du 11.1.21 de gtRNAdb pour 100 génomes
g1    t1        5.2   0
atgi 99 tct tat atgf 177
att 1.1 act 0.7 aat 0.4 agt 0.4
ctt 2.2 cct cat cgc 0.7
gtt 0.7 gct gat ggt
ttc 108 tcc 101 tac 107 tgc 142
atc 367 acc 102 aac 184 agc 101
ctc 143 ccc 100 cac 109 cgt 187
gtc 150 gcc 124 gac 246 ggc 224
tta 55 tca 99 taa tga 60
ata 0.4 aca 114 aaa 121 aga 114
cta 101 cca 137 caa 123 cga
gta 118 gca 373 gaa 202 gga 101
ttg 102 tcg 111 tag tgg 102
atgj 107 acg 96 aag 103 agg 99
ctg 191 ccg 92 cag 0.7 cgg 107
gtg 90 gcg 79 gag 0.4 ggg 82
gtRNA inter max min total
2265 2149 1440 5854
bet3 cumul des -rRNAs de l'annexe beta de 1 génome
g1    t1       
atgi 1 tct tat atgf 2
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc 2 tcc 2 tac 2 tgc 1
atc acc 1 aac 4 agc 1
ctc 1 ccc 1 cac 3 cgt 3
gtc 1 gcc 3 gac 7 ggc 5
tta 1 tca 1 taa tga
ata aca 1 aaa 3 aga 1
cta 1 cca 1 caa 2 cga
gta 6 gca gaa 4 gga 1
ttg 1 tcg 1 tag tgg 1
atgj 2 acg 1 aag 2 agg 1
ctg 4 ccg 2 cag cgg 1
gtg 1 gcg 2 gag ggg 1
+beta1 inter max min total
21 43 18 82
bet4 indices des +rRNAs de la fiche beta pour 100 génomes
g1    t1       
atgi tct tat atgf 5
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc tcc tac 23 tgc
atc 361 acc 23 aac agc 2
ctc ccc cac cgc
gtc gcc gac ggc
tta tca taa tga
ata aca aaa aga
cta cca caa cga
gta gca 361 gaa gga 23
ttg tcg tag tgg
atgj acg aag agg
ctg ccg cag cgg
gtg gcg gag ggg
+beta44 inter max min total
748 50 0 798
bet5 estimation des -rRNA du clade beta pour 100 génomes
g1    t1       
atgi 99 tct 0.4 tat atgf 172
att 1.1 act 0.7 aat 0.4 agt 0.4
ctt 2.2 cct cat cgc 0.7
gtt 0.7 gct gat ggt
ttc 108 tcc 101 tac 84 tgc 142
atc 6 acc 79 aac 184 agc 99
ctc 143 ccc 100 cac 109 cgt 187
gtc 150 gcc 124 gac 246 ggc 224
tta 55 tca 99 taa tga 60
ata 0.4 aca 114 aaa 121 aga 114
cta 101 cca 137 caa 123 cga 0
gta 118 gca 12 gaa 202 gga 78
ttg 102 tcg 111 tag tgg 102
atgj 107 acg 96 aag 103 agg 99
ctg 191 ccg 92 cag 0.7 cgg 107
gtg 90 gcg 79 gag 0.4 ggg 82
-rRNA inter max min total
1517 2099 1440 5057
bet6 indices des -rRNAs de l'annexe archeo pour 100 génomes
g1    t1       
atgi 100 tct tat atgf 200
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc 200 tcc 200 tac 200 tgc 100
atc acc 100 aac 400 agc 100
ctc 100 ccc 100 cac 300 cgt 300
gtc 100 gcc 300 gac 700 ggc 500
tta 100 tca 100 taa tga
ata aca 100 aaa 300 aga 100
cta 100 cca 100 caa 200 cga
gta 600 gca gaa 400 gga 100
ttg 100 tcg 100 tag tgg 100
atgj 200 acg 100 aag 200 agg 100
ctg 400 ccg 200 cag cgg 100
gtg 100 gcg 200 gag ggg 100
+beta1 inter max min total
2100 4300 1800 8200

beta, comparaison clade-annexe des -rRNAs

  • Lien tableur: beta, comparaison clade-annexe des -rRNAs
  • Légende
    - bet7. diff, somme des couleurs de bet7. La différence entre tRNAs est faite entre bet5 et bet6 du tableau précédent. Elle est exprimée en % et rapporté à la plus grande valeur des 2 termes de la différence. Ce qui fait quand un tRNA est à zéro la différence en % est égale à 100.
    - bet8. rap, rapport des sommes couleurs bet5/bet2. Le rapport -rRNA/total est celui du tRNA de bet5 sur celui de bet2.
  • Fréquences des différences en % du tableau bet7
gamme		0/0	10	20	30	40	50	60	70	80	90	100		total
fréquence	1	12	4	4	4	6	7	3	0	1	6	0	48
tot ≤ 50						30							
  • Comparaison avec le nombre de tRNAs de la fiche du clade: L’estimation des -rRNA par l'annexe est 52% en dessous de celle de la fiche des beta.
tRNAs		fiche		annexe
sans		2379		82
avec		353		16
genomes		44		1
indice %	54		82
bet beta 63 génomes
bet7 beta, différence clade-annexe des -rRNAs
g1    t1       
atgi 1 tct 100 tat atgf 14
att 100 act 100 aat 100 agt 100
ctt 100 cct cat cgc 100
gtt 100 gct gat ggt
ttc 46 tcc 50 tac 58 tgc 30
atc 100 acc 21 aac 54 agc 1
ctc 30 ccc 0 cac 64 cgt 38
gtc 33 gcc 59 gac 65 ggc 55
tta 45 tca 1 taa tga 100
ata 100 aca 12 aaa 60 aga 12
cta 1 cca 27 caa 39 cga
gta 80 gca 100 gaa 50 gga 22
ttg 2 tcg 10 tag tgg 2
atgj 47 acg 4 aag 49 agg 1
ctg 52 ccg 54 cag 100 cgg 7
gtg 10 gcg 61 gag 100 ggg 18
diff inter max min total
328 618 335 1281
bet8 beta, rapports -rRNA/total
g1    t1       
atgi tct tat atgf 97
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc tcc tac 79 tgc
atc 2 acc 78 aac agc 98
ctc ccc cac cgc
gtc gcc gac ggc
tta tca taa tga
ata aca aaa aga
cta cca caa cga
gta gca 3 gaa gga 77
ttg tcg tag tgg
atgj acg aag agg
ctg ccg cag cgg
gtg gcg gag ggg
rap inter max min total
67 98 100 86

Delta

Anaeromyxobacter dehalogenans 2CP-C

ade opérons

  • Lien tableur: ade opérons
  • Liens: gtRNAdb [38], NCBI [39], génome [40]
  • Phylogénie: Bacteria; Proteobacteria; Deltaproteobacteria; Myxococcales; Cystobacterineae; Anaeromyxobacteraceae; Anaeromyxobacter.
  • Légende:
Bd1. ade opérons, Anaeromyxobacter dehalogenans 2CP-C
75%GC 30.6.19 Paris  49  doubles intercalaire
8147..8220 caa
21040..21112 ttc
comp 433303..433378 ggg
comp 666509..666585 gac 6
comp 666592..666666 gta
comp 693146..693229 ctg
851483..851555 atgi
comp 1057311..1057386 gcg
comp 1306222..1306295 ccc
1442379..1442450 tgc
1495545..1497102 16s @1 187
1497290..1497367 atc 22
1497390..1497465 gca 194
1497660..1500648 23s 152
1500801..1500917 5s
1509186..1509259 cag 60
1509320..1509394 gag
1691085..1691160 gcc
1819377..1819453 atgf
2235670..2235741 gtc
comp 2314981..2315079 tga
comp 2337031..2337104 atgj
2376009..2376080 gtg
comp 2429718..2429790 acg
comp 2623942..2624017 tgg
comp 2625463..2625535 acc 22
comp 2625558..2625633 gga 63
comp 2625697..2625779 tac 46
comp 2625826..2625898 aca
2653452..2653535 ttg
2680790..2680871 ctc
comp 2747806..2747879 agg
3029047..3029122 aac
comp 3076236..3076352 5s 152
comp 3076505..3079493 23s 194
comp 3079688..3079763 gca 22
comp 3079786..3079863 atc 187
comp 3080051..3081608 16s
comp 3144286..3144357 aaa
3156732..3156804 gaa
3253990..3254063 cgg
comp 3793996..3794069 ccg
3806164..3806249 tta
comp 3915708..3915789 cta
comp 3920245..3920317 aag @2 248
comp 3920566..3920639 aga 140
comp 3920780..3920854 cac 18
comp 3920873..3920946 cga 134
comp 3921081..3921154 cca
comp 4121675..4121749 ggc
comp 4195371..4195460 tcc 278
comp 4195739..4195829 tcg
4456675..4456764 tca 27
4456792..4456883 agc 73
4456957..4457033 cgt

ade cumuls

cumuls. ade.
opérons Fréquences intercalaires tRNAs
effectif gammes sans rRNAs avec rRNAs
avec rRNA opérons 2 1 0
16 23 5s 0 0 20 2
16 atc gca 2 40 2 2
16 23 5s a 0 60 2
max a 2 80 2
a doubles 0 100 0
spéciaux 0 120 0
total aas 4 140 2
sans opérons 33 160 0
1 aa 27 180 0
max a 5 200 0
a doubles 0 2
total aas 45 8 2
total aas 49
remarques 2
avec jaune moyenne 93
variance 90
sans jaune moyenne 39 22
variance 24 0

ade blocs

Dt1. ade, blocs à rRNA.
16s 187 1558 5s 152 117
atc 22 23s 194 2989
gca 194 gca 22
23s 152 2989 atc 187
5s 117 16s 1558

ade remarques

  • Lien tableur: ade remarques
  • Remarques : Pas de blocs 16-23-5s, 2 blocs 16-atc-gca-23-5s, pas de doubles.
    1. @ 2 blocs 16-atc-gca-23-5s sans aas supplémentaires.
      - Intercalaires identiques, 187 22 194 152.
    2. @ Les intercalaires élevés ne touchent que 2 opérons sans rRNAs et sont à la limite de la règle de 210 bases, et sont équivalents à l’intercalaire 16s-23s, 278 et 248. Comme ksk.
    3. tous les tRNAs existent sauf ata et les absents classiques. Cga et tga existent. Seuls atc et gca sont au nombre de 2 à cause des blocs rRNAs doubles.
  • Séquences des doubles : 27 des 33 opérons à tRNAs sont des tRNAs solitaires.
    - Analogue à ksk
    - Pas de doubles du tout.
    - Ce sont les opérons qui se répètent qui font les doubles. Les opérons à rRNAs font de même, avec 2 blocs quasi identiques même dans la longueur de leurs intercalaires.
  • Code génétique de ade:
    Légende: prélèvement de la base gtRNAdb le
    • - totaux en en-tête, 49 total de gtRNAdb contenant des pseudo et inconnus; 49 total du cumul.
    • - atgi, c'est Ile2, mis à la place de ttt, très rare chez les procaryotes.
    • - atgf, c'est Metf, mis à la place de tgt, très rare chez les procaryotes.
    • - atgj, c'est Met, remplace le atg standard qui est la somme Ile2 Metf Met.
    • - Voir la légende des tris et couleurs, g1 t1.
Dt1 ade, Anaeromyxobacter dehalogenans 2CP-C
g1    t1       49  49
atgi 1 tct tat atgf 1
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc 1 tcc 1 tac 1 tgc 1
atc 2 acc 1 aac 1 agc 1
ctc 1 ccc 1 cac 1 cgt 1
gtc 1 gcc 1 gac 1 ggc 1
tta 1 tca 1 taa tga 1
ata aca 1 aaa 1 aga 1
cta 1 cca 1 caa 1 cga 1
gta 1 gca 2 gaa 1 gga 1
ttg 1 tcg 1 tag tgg 1
atgj 1 acg 1 aag 1 agg 1
ctg 1 ccg 1 cag 1 cgg 1
gtg 1 gcg 1 gag 1 ggg 1

ade distribution

Dt1 ade, Anaeromyxobacter dehalogenans 2CP-C. Delta
Dt11 Distribution du total
g1    t1       
atgi 1 tct tat atgf 1
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc 1 tcc 1 tac 1 tgc 1
atc 2 acc 1 aac 1 agc 1
ctc 1 ccc 1 cac 1 cgt 1
gtc 1 gcc 1 gac 1 ggc 1
tta 1 tca 1 taa tga 1
ata aca 1 aaa 1 aga 1
cta 1 cca 1 caa 1 cga 1
gta 1 gca 2 gaa 1 gga 1
ttg 1 tcg 1 tag tgg 1
atgj 1 acg 1 aag 1 agg 1
ctg 1 ccg 1 cag 1 cgg 1
gtg 1 gcg 1 gag 1 ggg 1
delta >1aa 1aa -5s +5s -16s +16s total
ade 18 27 4 49
Dt12 ade, distribution des solitaires
g1    t1       
atgi 1 tct tat atgf 1
att act aat agt
ctt cct cat cgt
gtt gct gat ggt
ttc 1 tcc tac tgc 1
atc acc aac 1 agc
ctc 1 ccc 1 cac cgc
gtc 1 gcc 1 gac ggc 1
tta 1 tca taa tga 1
ata aca aaa 1 aga
cta 1 cca caa 1 cga
gta gca gaa 1 gga
ttg 1 tcg tag tgg 1
atgj 1 acg 1 aag agg 1
ctg 1 ccg 1 cag cgg 1
gtg 1 gcg 1 gag ggg 1
ade >1aa 1aa -5s +5s -16s +16s total
type 27 27
Dt13 ade, distribution des >1aa
g1    t1       
atgi tct tat atgf
att act aat agt
ctt cct cat cgt
gtt gct gat ggt
ttc tcc 1 tac 1 tgc
atc acc 1 aac agc 1
ctc ccc cac 1 cgc 1
gtc gcc gac 1 ggc
tta tca 1 taa tga
ata aca 1 aaa aga 1
cta cca 1 caa cga 1
gta 1 gca gaa gga 1
ttg tcg 1 tag tgg
atgj acg aag 1 agg
ctg ccg cag 1 cgg
gtg gcg gag 1 ggg
ade >1aa 1aa -5s +5s -16s +16s total
type 18 18
delta2. indices du 11.1.21 65 génomes
g1 t1 65 3551 1.4  0
atgi 99 tct tat 0.6 atgf 106
att act aat agt
ctt cct cat cgc 97
gtt 1.2 gct gat ggt
ttc 107 tcc 97 tac 103 tgc 101
atc 191 acc 99 aac 112 agc 101
ctc 101 ccc 55 cac 100 cgt 0
gtc 98 gcc 95 gac 139 ggc 140
tta 104 tca 101 taa tga 60
ata aca 108 aaa 150 aga 124
cta 101 cca 101 caa 109 cga 100
gta 139 gca 199 gaa 173 gga 111
ttg 101 tcg 0.6 tag tgg 100
atgj 98 acg 1.9 aag 9 agg 96
ctg 1.2 ccg 0.6 cag 0.6 cgg 1.2
gtg gcg gag 25 ggg 1.9
inter max min total

ade intercalaires entre cds

  • Lien NCBI [41] 16.7.20
  • Note: Pour les génomes des annexes j'ai relevé les intercalaires entre tRNAs et entre ceux-ci et les cds qui leur sont adjacents. L'exemple est celui de rru du clade alpha. L'idée de départ de ces prélèvements est la recherche d'opérons formés de tRNA et de protéine comme dans le cas d'E.coli: l'intercalaire entre le tRNA et la protéine devrait être faible. Voir l'exemple d'eco (remarque @3) avec tac-tac-tpr et aca-tac-gga-acc-tufB.

ade les fréquences

  • Lien tableur: ade intercalaires entre cds
  • Légende:   long, longueur en pbs,   intercal pour intercalaire
    - fréquence-1 1 5 6 f, respectivement fréquence des intercalaires négatives à l'unité, positives à l'unité, par blocs de 5, par blocs de 10 jusqu'à 600 pbs et f pour finales. Ces fréquences servent à faire les diagrammes. La fréquence fréquencez est l'étendue à 1200 de la fréquence6 pour certains grands génomes.
    - cumul,% colonne à la droite de frequence6, reprend les fréquences par plages et leurs pourcentages indiqués déjà dans la 1ère partie du tableau.
    - La couleur cyan des fréquences fréquence-1 et 1 sert à montrer leur périodicité ternaire.
    - intercaln intercalx, pour les intercalaires négatifs minimaux et intercalaires positifs maximaux.
    - colonne ADN pour la longueur totale du génome en pbs et intercals pour le total en pbs des intercalaires entre cds uniquement, d'après la méthode des prélèvements de NCBI du 16.7.20.
ade Les fréquences des intercalaires entre cds
ade intercalaires total % intercalaires moyenne ecartype plage ADN intercal frequence5 intercal fréquencez
négatif 815 18.3 négatif -8 15 -1 à -116 5 029 329 -1 815 610 5
zéro 29 0.6 intercals 0 29 620 3
1 à 200 2987 66.9 0 à 200 70 57 42 8947 5 251 630 2
201 à 370 464 10.4 201 à 370 260 44 8.5% 10 224 640 0
371 à 600 124 2.8 371 à 600 469 63 15 214 650 3
601 à max 45 1.0 601 à 1160 771 157 20 141 660 1
total 4464 <201 85.8 total 4461 93 127 -116 à 1160 25 104 670 0
adresse intercalx intercal fréquence1 intercal fréquence6 cumul,% intercal fréquence-1 30 89 680 1
4491815 1915 -1 815 -70 14 0 29 35 91 690 1
3576176 1774 0 29 -60 8 -1 70 40 66 700 1
4068576 1388 1 45 -50 2 -2 3 45 58 710 1
3337295 1160 2 68 -40 7 -3 0 50 57 720 2
3373664 1119 3 73 -30 12 min à -1 -4 570 55 74 730 1
2044486 1080 4 39 -20 26 815 -5 0 60 82 740 2
4163005 1080 5 26 -10 69 18.3% -6 2 65 92 750 2
1981544 1014 6 34 0 706 -7 7 70 86 760 0
427780 984 7 35 10 475 -8 25 75 87 770 0
540538 963 8 45 20 355 -9 0 80 78 780 0
1223737 917 9 65 30 193 -10 3 85 70 790 1
1005799 900 10 45 40 157 1 à 100 -11 21 90 77 800 1
4943119 860 11 36 50 115 2097 -12 1 95 66 810 1
4581242 849 12 54 60 156 47.0% -13 10 100 61 820 1
104609 834 13 49 70 178 -14 16 105 69 830 1
4846209 821 14 35 80 165 -15 1 110 55 840 1
1084460 817 15 40 90 147 -16 4 115 65 850 1
2814006 807 16 36 100 127 -17 11 120 63 860 1
2386981 793 17 23 110 124 -18 0 125 60 870 0
3422997 788 18 35 120 128 -19 2 130 56 880 0
494107 749 19 29 130 116 -20 4 135 64 890 0
3820597 741 20 18 140 109 -21 0 140 45 900 1
4073584 732 21 19 150 90 -22 2 145 50 910 0
1445527 731 22 25 160 67 -23 8 150 40 920 1
3757399 730 23 24 170 75 1 à 200 -24 0 155 36 930 0
4117240 719 24 18 180 74 2987 -25 1 160 31 940 0
3533685 715 25 18 190 81 67% -26 6 165 34 950 0
3631148 704 26 22 200 55 -27 0 170 41 960 0
2060112 697 27 16 210 57 -28 1 175 36 970 1
1026522 689 28 27 220 48 -29 4 180 38 980 0
4180297 676 29 9 230 45 -30 0 185 40 990 1
3200409 660 30 15 240 34 -31 0 190 41 1000 0
1266186 649 31 15 250 39 -32 3 195 29 1010 0
4553826 643 32 15 260 47 66 200 26 1020 1
4101937 641 33 22 270 30 0 à 200 reste 40 205 27 1030 0
34 26 280 27 3016 total 844 210 30 1040 0
35 13 290 20 215 26 1050 0
36 13 300 20 intercal frequencef 220 22 1060 0
37 17 310 21 600 4419 225 28 1070 0
38 9 320 18 620 8 230 17 1080 2
39 8 330 15 640 2 235 13 1090 0
40 19 340 11 201 à 370 660 4 240 21 1100 0
reste 2440 350 9 464 680 1 245 18 1110 0
total 4044 360 17 10.4% 700 2 250 21 1120 1
370 6 720 3 255 23 1130 0
adresse intercaln décalage long 380 9 740 3 260 24 1140 0
3295433 -116 comp 390 5 760 2 265 17 1150 0
4579158 -110 comp 400 6 780 270 13 1160 1
1556750 -109 shift2 738 410 10 800 2 275 16 1170 0
4555636 -109 comp 420 4 820 2 280 11 1180 0
4916430 -107 comp 430 2 840 2 285 13 1190 0
3210093 -106 shift2 1146 440 11 860 2 290 7 1200 0
3997874 -104 comp 450 5 880 295 10 reste 3
2946107 -101 comp 460 8 900 1 300 10 total 4464
3213081 -100 shift2 279 470 8 920 1 305 10
1033174 -98 comp 480 6 940 310 11
4178347 -86 comp 490 4 960 315 13
1150010 -82 comp 500 4 980 1 320 5
526736 -79 comp 510 8 1000 1 325 9
1558055 -74 comp 520 4 1020 1 330 6
178866 -68 shift2 797 530 4 1040 335 6
4625265 -68 shift2 869 540 7 371 à 600 1060 340 5
1268795 -67 550 3 124 1080 2 345 6
1590849 -67 560 6 2.8% 1100 350 3
1222168 -65 570 3 1120 1 355 11
3832496 -65 580 1 601 à max 1140 360 6
23880 -61 590 3 45 1160 1 365 5
157893 -61 600 3 1.0% 42 370 1
4881610 -59 reste 45 reste 3 169
3182922 -55 total 4464 total 4464 4464

ade autres intercalaires

  • Lien tableur: ade autres intercalaires
  • Légende:  
    - comp, le gène est sur le brin complement
    - deb, fin sont respectivement dans le sens des adresses croissantes, le cds avant le 1er tRNA et le cds après le dernier tRNA du bloc.
ade Les autres intercalaires.
ade1 adresses1
deb-fin gènes adresses intercal sens
deb CDS 7060 91
tRNA 8147 44
fin CDS 8265
deb CDS 20441 158
tRNA 21040 220
fin CDS 21333 comp
deb CDS 432722 119 comp
tRNA 433303 79 comp
fin CDS 433458 comp
deb CDS 664814 456 comp
tRNA 666509 6 comp
tRNA 666592 157 comp
fin CDS 666824
deb CDS 691951 157 comp
tRNA 693146 333 comp
fin CDS 693563
deb CDS 849021 53
tRNA 851483 36
fin CDS 851592
deb CDS 883315 64
repeat_region 883709 98
fin CDS 886703 comp
deb CDS 887392 77 comp
repeat_region 888746 95
fin CDS 892587
deb CDS 1055941 68
tRNA 1057311 105 comp
fin CDS 1057492
deb CDS 1305647 350 comp
tRNA 1306222 105 comp
fin CDS 1306401 comp
deb CDS 1311419 33 comp
ncRNA 1312049 302 comp
fin CDS 1312542
deb CDS 1441648 14
tRNA 1442379 111
fin CDS 1442562
deb CDS 1492304 691
rRNA 1495545 187
tRNA 1497290 22
tRNA 1497390 194
rRNA 1497660 152
rRNA 1500801 75
fin CDS 1500993 comp
deb CDS 1508769 3
tRNA 1509186 60
tRNA 1509320 130
fin CDS 1509525 comp
deb CDS 1690794 9
tRNA 1691085 96
fin CDS 1691254 comp
ade2 adresses2
deb-fin gènes adresses intercal sens
deb CDS 1818424 110
tRNA 1819377 53
fin CDS 1819507
deb CDS 1968293 141
regulatory 1969289 108
fin CDS 1969480
deb CDS 2235017 38
tRNA 2235670 77
fin CDS 2235819
deb CDS 2313926 38
tRNA 2314981 92 comp
fin CDS 2315172 comp
deb CDS 2335260 406 comp
tRNA 2337031 222 comp
fin CDS 2337327
deb CDS 2375620 53
tRNA 2376009 437
fin CDS 2376518
deb CDS 2429105 190
tRNA 2429718 111 comp
fin CDS 2429902
deb CDS 2623487 62 comp
tRNA 2623942 15 comp
fin CDS 2624033 comp
deb CDS 2624207 65 comp
tRNA 2625463 22 comp
tRNA 2625558 63 comp
tRNA 2625697 46 comp
tRNA 2625826 105 comp
fin CDS 2626004 comp
deb CDS 2652965 124 comp
tRNA 2653452 100
fin CDS 2653636
deb CDS 2680375 91
tRNA 2680790 110
fin CDS 2680982 comp
deb CDS 2747439 94
tRNA 2747806 106 comp
fin CDS 2747986 comp
deb CDS 3027884 161 comp
tRNA 3029047 184
fin CDS 3029307
deb CDS 3075187 167 comp
rRNA 3076236 152 comp
rRNA 3076505 194 comp
tRNA 3079688 22 comp
tRNA 3079786 187 comp
rRNA 3080051 590 comp
fin CDS 3082199 comp
ade3 adresses3
deb-fin gènes adresses intercal sens
deb CDS 3143759 230 comp
tRNA 3144286 306 comp
fin CDS 3144664 comp
deb CDS 3155946 78
tRNA 3156732 694
fin CDS 3157499
deb CDS 3253083 193 comp
tRNA 3253990 130
fin CDS 3254194
deb CDS 3372825 107
tmRNA 3373094 219
fin CDS 3373664
deb CDS 3793550 226
tRNA 3793996 386 comp
fin CDS 3794456 comp
deb CDS 3805030 111
tRNA 3806164 127
fin CDS 3806377 comp
deb CDS 3914337 81 comp
tRNA 3915708 63 comp
fin CDS 3915853
deb CDS 3919322 179 comp
tRNA 3920245 248 comp
tRNA 3920566 142 comp
tRNA 3920782 18 comp
tRNA 3920873 134 comp
tRNA 3921081 76 comp
fin CDS 3921231 comp
deb CDS 4031625 149
regulatory 4032113 67
fin CDS 4032337
deb CDS 4120462 34
tRNA 4121675 246 comp
fin CDS 4121996
deb CDS 4164508 430
ncRNA 4166687 43 comp
fin CDS 4167140 comp
deb CDS 4193348 55 comp
ncRNA 4195209 68 comp
tRNA 4195371 278 comp
tRNA 4195739 50 comp
fin CDS 4195880 comp
deb CDS 4454313 715 comp
tRNA 4456675 27
tRNA 4456792 73
tRNA 4456957 492
fin CDS 4457526

ade intercalaires tRNA

  • Lien tableur: ade intercalaires tRNA
  • Légende:
    - comp', l'intercalaire est entre un gène comp (sur le complément) et un gène sur le brin direct. Continu les 2 gènes sont sur le même brin.
    - deb, fin sont les intercalaires des cds du tableau précédent, autres intercalaires: respectivement dans le sens des adresses croissantes, le cds avant le 1er tRNA et le cds après le dernier tRNA du bloc.
  • Cumuls comp'+continu du tableau
	deb	fin	total
<201	29	25	54
total	34	35	69
%	85	71	78
ade intercalaires tRNA
ade les relevés deb-fin
comp’ entre tRNAs comp’ deb comp’ fin
91 44
158 comp’ 220
119 79
6 456 comp’ 156
157 comp’ 353
53 36
comp’ 68 comp’ 105
350 105
14 111
60 3 comp’ 130
9 comp’ 96
110 53
38 77
38 comp’ 92
406 comp’ 222
53 437
comp’ 190 comp’ 111
62 15
22 63 46 65 105
comp’ 124 100
91 comp’ 110
comp’ 94 106
comp’ 161 184
230 306
78 694
comp’ 193 130
107 219
comp’ 226 386
111 comp’ 127
81 comp’ 63
248 142 18 134 179 76
comp’ 34 comp’ 246
430 43
278 50
27 73 comp’ 715 492
ade intercalaires inférieures à 201 pbs
deb fin continu cumuls
3 15 deb
9 36 <201 20
14 43 total 25
38 44 taux 80%
38 50
53 53 fin
53 76 <201 16
62 77 total 22
65 79 taux 73%
78 100
81 105 total
91 105 <201 36
91 106 total 47
107 111 taux 77%
110 130
111 184
119 219
157 306
158 386
179 437
230 492
350 694
406 -
430 -
456 - comp’ cumuls
34 63 deb
68 92 <201 7
94 96 total 9
124 105 taux 78%
161 110 fin
190 111 <201 9
193 127 total 13
226 130 taux 69%
715 156
- 220 total
- 222 <201 16
- 246 total 22
- 353 taux 73%

ade intercalaires rRNA

  • Voir la présentation des blocs à rRNA dans le chapitre ade blocs de l'étude préliminaire. A comparer avec le tableau ade autres intercalaires.
  • Remarque: Quand le 16s n'est pas précédé de tRNAs l'intercalaire cds-16s est élevé, pour le 1er bloc il est ici de 691 pbs. L'intercalaire cds-bloc de l'autre côté du bloc est beaucoup plus faible, ici 75 pbs en comp. Le 2ème bloc est inversé et l'orientation des 2 cds aussi, 590 167. Cette orientation est quasiment générale chez tous les génomes que j'ai étudié ici. Je l'ai notée dans les chapitres génome-bloc de chaque génome.
  • Note: J'ai supposé souvent que les blocs à tRNA sans rRNA sont aussi orientés de l'intercalaire le plus grand au plus petit. Dans ade cumuls et de même pour les autres génomes, j'ai noté cette orientation dans la colonne cdsd, pour cds dirigé. Je n'ai conservé pour les calculs que le plus petit intercalaire des 2 cds bordant le bloc. L'idée était que cette orientation provoquait la création du cds en fin de bloc. Ces cds sont souvent de petites protéines et souvent hypothétiques. Aussi je présente ci-dessous la transformation deb-fin qui est imposée par l'adressage en intercalaire plus grand et plus petit.
deb	fin		tri	grand	petit		deb	fin		tri	grand	petit
91	44		10	130	3		62	15		3	119	79
158	220		11	96	9		65	105		21	110	91
119	79		9	111	14		124	100		22	106	94
456	156		18	62	15		91	110		20	124	100
157	353		32	246	34		94	106		8	350	105
53	36		6	53	36		161	184		27	219	107
68	105		13	77	38		230	306		17	190	111
350	105		14	92	38		78	694		29	127	111
14	111		33	430	43		193	130		26	193	130
3	130		1	91	44		107	219		4	456	156
9	96		12	110	53		226	386		5	353	157
110	53		16	437	53		111	127		2	220	158
38	77		30	81	63		81	63		23	184	161
38	92		19	105	65		179	76		15	406	222
406	222		7	105	68		34	246		28	386	226
53	437		31	179	76		430	43		24	306	230
190	111		25	694	78		715	492		34	715	492

ade par rapport au groupe de référence

Comparaison avec la référence
tRNAs blocs tRNAs blocs rRNAs
ade 1aa >1aa dup +5s 1-3aas autres total
21 faible 12 5 17
16 moyen 9 6 4 19
14 fort 6 7 13
27 18 4 49
10 g+cga 5 5 10
2 agg+cgg 2 2
4 carre ccc 4 4
5 autres 1 1
12 5 17
total tRNAs ‰
ade 1aa >1aa dup +5s 1-3aas autres ade ‰ ref.‰
21 faible 245 102 347 26
16 moyen 184 122 82 388 324
14 fort 122 143 265 650
551 367 82 49 729
10 g+cgg 102 102 204 10
2 agg+cga 41 41
4 carre ccc 82 82 16
5 autres 20 20
245 102 347
blocs tRNAs ‰ total colonne %
ade 1aa >1aa dup total ref.‰ 1aa >1aa dup
21 faible 267 111 378 26 44 28
16 moyen 200 133 333 324 33 33
14 fort 133 156 289 650 22 39
600 400 45 729 27 18
10 g+cgg 111 111 222 10 42
2 agg+cga 44 44 17
4 carre ccc 89 89 16 33
5 autres 22 22 8
267 111 378 12

delta, estimation des -rRNAs

  • Lien tableur: delta, estimation des -rRNAs
  • Liens fiche:   typage
  • Légende: prélèvement de la base gtRNAdb le 11.1.21
    - ttt et tgt sont nuls partout
    - atgi, c'est Ile2, mis à la place de ttt, très rare chez les procaryotes.
    - atgf, c'est Metf, mis à la place de tgt, très rare chez les procaryotes.
    - atgj, c'est Met, remplace le atg standard qui est la somme Ile2 Met fMet.
    - Voir la légende des tris, g1 t1 et des couleurs

delta, calcul des -rRNAs

del delta 19 génomes
del1 cumul des +rRNAs de la fiche delta pour 19 génomes
g1    t1       
atgi tct tat atgf 1
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc tcc tac tgc
atc 45 acc aac agc
ctc ccc cac cgc
gtc gcc gac ggc
tta tca taa tga
ata aca aaa aga
cta cca caa cga
gta gca 44 gaa gga
ttg tcg tag tgg
atgj acg aag agg
ctg ccg cag cgg
gtg gcg gag ggg
delt19 inter max min total
89 1 0 90
del2 indices du clade delta du 11.1.21 de gtRNAdb pour 100 génomes
g1    t1       
atgi 97 tct tat atgf 149
att act aat agt
ctt 1.5 cct cat cgc 9
gtt gct gat ggt
ttc 122 tcc 109 tac 118 tgc 108
atc 243 acc 118 aac 122 agc 105
ctc 129 ccc 106 cac 111 cgt 134
gtc 100 gcc 131 gac 165 ggc 175
tta 108 tca 108 taa tga 86
ata aca 102 aaa 118 aga 106
cta 108 cca 105 caa 111 cga 65
gta 115 gca 234 gaa 180 gga 105
ttg 126 tcg 106 tag tgg 111
atgj 112 acg 98 aag 85 agg 100
ctg 122 ccg 98 cag 88 cgg 92
gtg 83 gcg 78 gag 40 ggg 94
gtRNA inter max min total
2026 1821 1581 5428
del3 cumul des -rRNAs de l'annexe delta de 1 génome
g1    t1       
atgi 1 tct tat atgf 1
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc 1 tcc 1 tac 1 tgc 1
atc acc 1 aac 1 agc 1
ctc 1 ccc 1 cac 1 cgt 1
gtc 1 gcc 1 gac 1 ggc 1
tta 1 tca 1 taa tga 1
ata aca 1 aaa 1 aga 1
cta 1 cca 1 caa 1 cga 1
gta 1 gca gaa 1 gga 1
ttg 1 tcg 1 tag tgg 1
atgj 1 acg 1 aag 1 agg 1
ctg 1 ccg 1 cag 1 cgg 1
gtg 1 gcg 1 gag 1 ggg 1
delt1 inter max min total
14 14 17 45
del4 indices des +rRNAs de la fiche delta pour 100 génomes
g1    t1       
atgi tct tat atgf 5
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc tcc tac tgc
atc 237 acc aac agc
ctc ccc cac cgc
gtc gcc gac ggc
tta tca taa tga
ata aca aaa aga
cta cca caa cga
gta gca 232 gaa gga
ttg tcg tag tgg
atgj acg aag agg
ctg ccg cag cgg
gtg gcg gag ggg
delt19 inter max min total
469 5 0 474
del5 estimation des -rRNA du clade delta pour 100 génomes
g1    t1       
atgi 97 tct tat atgf 144
att act aat agt
ctt 1.5 cct cat cgc 9
gtt gct gat ggt
ttc 122 tcc 109 tac 118 tgc 108
atc 6 acc 118 aac 122 agc 105
ctc 129 ccc 106 cac 111 cgt 134
gtc 100 gcc 131 gac 165 ggc 175
tta 108 tca 108 taa tga 86
ata 0 aca 102 aaa 118 aga 106
cta 108 cca 105 caa 111 cga 65
gta 115 gca 2 gaa 180 gga 105
ttg 126 tcg 106 tag tgg 111
atgj 112 acg 98 aag 85 agg 100
ctg 122 ccg 98 cag 88 cgg 92
gtg 83 gcg 78 gag 40 ggg 94
-rRNA inter max min total
1558 1816 1581 4954
del6 indices des -rRNAs de l'annexe archeo pour 100 génomes
g1    t1       
atgi 100 tct tat atgf 100
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc 100 tcc 100 tac 100 tgc 100
atc acc 100 aac 100 agc 100
ctc 100 ccc 100 cac 100 cgt 100
gtc 100 gcc 100 gac 100 ggc 100
tta 100 tca 100 taa tga 100
ata aca 100 aaa 100 aga 100
cta 100 cca 100 caa 100 cga 100
gta 100 gca gaa 100 gga 100
ttg 100 tcg 100 tag tgg 100
atgj 100 acg 100 aag 100 agg 100
ctg 100 ccg 100 cag 100 cgg 100
gtg 100 gcg 100 gag 100 ggg 100
delt1 inter max min total
1400 1400 1700 4500

delta, comparaison clade-annexe des -rRNAs

  • Lien tableur: delta, comparaison clade-annexe des -rRNAs
  • Légende
    - del7. diff, somme des couleurs de del7. La différence entre tRNAs est faite entre del5 et del6 du tableau précédent. Elle est exprimée en % et rapporté à la plus grande valeur des 2 termes de la différence. Ce qui fait quand un tRNA est à zéro la différence en % est égale à 100.
    - del8. rap, rapport des sommes couleurs del5/eur2. Le rapport -rRNA/total est celui du tRNA de del5 sur celui de del2.
  • Fréquences des différences en % du tableau del7
gamme		0/0	10	20	30	40	50	60	70	80	90	100		total
fréquence	1	22	12	5	3	2	1	0	0	0	3	0	49
tot ≤ 50						41							
  • Comparaison avec le nombre de tRNAs de la fiche du clade: L’estimation des -rRNA par l'annexe est 22% en dessous de celle de la fiche des delta.
tRNAs		fiche		annexe
sans		1097		45
avec		89		4
genomes		19		1
indice %	58		45
del delta 19 génomes
del7 delta, différence clade-annexe des -rRNAs
g1    t1       
atgi 3 tct tat atgf 30
att act aat agt
ctt 100 cct cat cgc 100
gtt gct gat ggt
ttc 18 tcc 8 tac 15 tgc 7
atc 100 acc 15 aac 18 agc 5
ctc 22 ccc 6 cac 10 cgt 25
gtc 0 gcc 24 gac 39 ggc 43
tta 7 tca 7 taa tga 14
ata aca 2 aaa 15 aga 6
cta 7 cca 5 caa 10 cga 35
gta 13 gca 100 gaa 44 gga 5
ttg 21 tcg 6 tag tgg 10
atgj 11 acg 2 aag 15 agg 0
ctg 18 ccg 2 cag 12 cgg 8
gtg 17 gcg 22 gag 60 ggg 6
diff inter max min total
136 284 250 670
del8 delta, rapports -rRNA/total
g1    t1       
atgi tct tat atgf 96
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc tcc tac tgc
atc 3 acc aac agc
ctc ccc cac cgc
gtc gcc gac ggc
tta tca taa tga
ata aca aaa aga
cta cca caa cga
gta gca 1 gaa gga
ttg tcg tag tgg
atgj acg aag agg
ctg ccg cag cgg
gtg gcg gag ggg
rap inter max min total
77 100 100 91

Epsilon

Arcobacter nitrofigilis DSM 7299

ant opérons

  • Lien tableur: ant opérons
  • Liens: gtRNAdb [42], NCBI [43], génome [orgn]
  • Phylogénie: Bacteria; Proteobacteria; Epsilonproteobacteria; Campylobacterales; Campylobacteraceae; Arcobacter group; Arcobacter.
  • Légende:
Ep1. ant opérons, Arcobacter nitrofigilis DSM 7299.
28.4%GC 12.1.21 Paris 4.16s doubles intercal cds aa  avec.aa cdsa cdsd protéines
167574..168434 cds 66 66 287 66 4-hydroxybenzoate polyprenyltransferase
168501..168577 cga @1 447 447
169025..169261 cds 79 DNA-binding protein
237275..237622 cds 305 305 116 305 nucleotide pyrophosphohydrolase
237928..239444 16s 111 111
239556..239632 atc 19 19
239652..239727 gca 301 301
240029..242945 23s 202
243148..243263 5s 354 354
comp 243618..244301 cds 228 bifunctional phosphoribosyl-AMP cyclohydrolase/phosphoribosyl-ATP diphosphatase HisIE
comp 302333..303160 cds 155 155 276 AraC family transcriptional regulator
303316..303393 cca 10 10
303404..303480 cac 16 16
303497..303573 aga 61 61
303635..303719 cta 96 96
303816..303892 atgf 70 70 70
303963..304103 cds 47 hp
316375..317343 cds 110 110 323 glycine betaine/L-proline ABC transporter substrate-binding protein ProX"
317454..317530 atgf 109 109 109
317640..318416 cds 259 helix-turn-helix domain-containing protein
373519..375741 cds 120 120 741 PAS domain-containing protein
375862..375937 ttc 5 5
375943..376027 tac 65 65 65
376093..376725 cds 211 hp
597419..598486 cds 47 47 356 47 class II fructose-bisphosphate aldolase
598534..598618 ttg 208 208
598827..600107 cds 427 tyrosine-type recombinase/integrase
comp 751446..752990 cds @2 73 73 515 cache domain-containing protein
comp 753064..753140 gac + 16 16
comp 753157..753232 gta 2 gac 3 3
comp 753236..753310 gaa 2 aaa 31 31
comp 753342..753417 aaa 2 gta 8 8
comp 753426..753502 gac 2 gaa 22 22
comp 753525..753600 gta 3 3
comp 753604..753678 gaa 42 42
comp 753721..753796 aaa 40 40 40
comp 753837..754343 cds 169 CinA family protein
comp 833388..833978 cds 142 142 197 LemA family protein
comp 834121..834204 ctc 93 93 93
comp 834298..836409 cds 704 methyl-accepting chemotaxis protein
1445917..1449822 cds 93 93 1302 93 hemolysin-type calcium-binding region
1449916..1449991 gaa 270 270
1450262..1450510 cds 83 hp
1615201..1615542 cds 29 29 114 29 hp
1615572..1615647 gtc 99 99
1615747..1616595 cds 283 universal stress protein
1703617..1703835 cds 1 1 73 1 hp
comp 1703837..1703913 atgf 12 12
comp 1703926..1704000 caa 117 117
1704118..1705149 cds 344 bifunctional 3,4-dihydroxy-2-butanone 4-phosphate synthase/GTP cyclohydrolase II
comp 2221719..2222525 cds + 242 242 269 hp
comp 2222768..2222842 aac 2 aac 33 33
comp 2222876..2222950 aac 72 72 72
comp 2223023..2223931 cds @3 303 radical SAM protein
comp 2282678..2283442 cds 349 349 255 oxidoreductase
comp 2283792..2283880 tcc 81 81
comp 2283962..2284038 gga 39 39
comp 2284078..2284154 atgi 15 15
comp 2284170..2284259 agc 102 102 102
comp 2284362..2285048 cds 229 orotidine-5'-phosphate decarboxylase
2323802..2324866 cds @4 12 12 355 12 methyltransferase domain-containing protein
comp 2324879..2324954 acc 167 167
comp 2325122..2325237 5s 202
comp 2325440..2328356 23s 300 300
comp 2328657..2328732 gca 19 19
comp 2328752..2328828 atc 111 111
comp 2328940..2330456 16s 378 378
comp 2330835..2331530 cds 232 5'-methylthioadenosine/adenosylhomocysteine nucleosidase
comp 2581821..2582840 cds 192 192 340 UDP-glucose 4-epimerase GalE
comp 2583033..2583108 tgc 45 45
comp 2583154..2583242 tca 16 16
comp 2583259..2583345 tta 143 143 143
2583489..2585177 cds 563 dihydroxy-acid dehydratase
comp 2637277..2637459 cds 81 81 61 preprotein translocase subunit SecE
comp 2637541..2637616 tgg 31 31 31
comp 2637648..2637815 cds 56 50S ribosomal protein L33
comp 2637824..2639032 cds 240 240 403 elongation factor Tu
comp 2639273..2639349 gga 8 8
comp 2639358..2639442 tac 69 69
comp 2639512..2639588 aca 21 21
comp 2639610..2639685 ttc 41 41 41
comp 2639727..2640881 cds 385 UDP-N-acetylmuramoyl-L-alanine—D-glutamate ligase
2656033..2656263 cds 231 231 77 231 transcriptional antiterminator Rof
comp 2656495..2656610 5s 223
comp 2656834..2659750 23s 301 301
comp 2660052..2660127 gca 19 19
comp 2660147..2660223 atc 111 111
comp 2660335..2661851 16s 292 292
comp 2662144..2662782 cds 213 hp
2693436..2695451 cds 95 95 672 dynamin family protein
2695547..2695621 caa 16 16
2695638..2695724 tta 7 7
2695732..2695808 gga 14 14
2695823..2695898 aaa 16 16
2695915..2695991 atgf 14 14
2696006..2696082 atgj 12 12
2696095..2696171 aca 30 30
2696202..2696290 tca 90 90 90
2696381..2696893 cds 171 hp
3082950..3083174 cds 143 143 75 143 CcoQ/FixQ family Cbb3-type cytochrome c oxidase assembly chaperone
comp 3083318..3083393 acc 173 173
comp 3083567..3083682 5s 202
comp 3083885..3086801 23s 273 273
comp 3087075..3087150 gca 19 19
comp 3087170..3087246 atc 111 111
comp 3087358..3088874 16s 462 462
3089337..3090032 cds 232 Bax inhibitor-1/YccA family protein

ant cumuls

cumuls. ant.
opérons Fréquences intercalaires tRNAs Fréquences intercalaires cds Fréquences aas cds
effectif gammes sans rRNAs avec rRNAs gammes cds gammes cdsd gammes cdsa gammes cdsa 300
avec rRNA opérons 4 1 0 1 1 1 1 100 8 - -
16 23 5s 0 20 21 50 6 20 1 200 5
16 atc gca 4 40 6 100 11 40 3 300 12
16 23 5s a 60 2 150 8 60 2 400 7
max a 3 80 2 200 2 80 4 500 2
a doubles 100 2 250 4 100 3 600 2
autres 120 4 300 2 120 2 700 1
total aas 10 140 0 350 2 140 0 800 2
sans opérons 16 160 0 400 2 160 2 900 0
1 aa 7 180 2 450 1 180 0 1000 0
max a 8 200 0 500 1 200 0 1100 0
a doubles 2 4 0 2 1
total aas 45 33 10 38 16 36
total aas 55
remarques 4
avec jaune moyenne 25 196 155 89 301
variance 22 88 121 73 240
sans jaune moyenne 139 60 239
variance 102 33 132

ant blocs

Ep1. Arcobacter nitrofigilis DSM 7299
cds 143 12    cds 231    cds 305
acc 173 167 5s 223 16s 111
5s 202 202 23s 301 atc 19
23s 273 300 gca 19 gca 301
gca 19 19 atc 111 23s 202
atc 111 111 16s 292 5s 354
16s 462 378 cds cds
cds

ant remarques

  • Lien tableur: ant remarques
  • Remarques: Ce génome se distingue par sa simplicité. Pas de tRNAs rares et 4 blocs 16s presque identiques.
    1. @ Même les solitaires ne sont pas des tRNAs rares, ccc xxg cga … Et ne représentent que 13 % du total des tRNAs.
    2. @ Les clusters multiples et sans rRNAs sont nombreux, 9/20, et accumulent 38 tRNAs contre 17 pour les autres. Les 2 plus grands font 8 chacun dont un avec une séquence de 4 double.
    3. @ Un seul duplicata de 2 tRNAs non rare, aac.
    4. @ Les 4 blocs sont presque identiques, 2 avec acc après 5s et 2 sans autres tRNAs. Les intercalaires sont quasiment identiques. Mais chaque bloque se distingue des 3 autres par un seul intercalaire, à part ceux avec les cds. Ainsi les 2 blocs avec acc diffèrent par gca-23s de 300 (pour 3 blocs) et 273 ; Les blocs sans acc diffèrent par 5s-23s de 202 (pour 3 blocs) et 223.
  • Séquences des doubles: un seul duplicata et une séquence double de 4 aas simple. Les 7 clusters à multiples tRNAs n’ont pas de répétitions.

ant distribution

Ep1 ant, Arcobacter nitrofigilis DSM 7299. Epsilon
Ep11 ant, distribution par type
g1    t1       
atgi 1 tct tat atgf 4
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc 2 tcc 1 tac 2 tgc 1
atc 4 acc 2 aac 2 agc 1
ctc 1 ccc cac 1 cgt
gtc 1 gcc gac 2 ggc
tta 2 tca 2 taa tga
ata aca 2 aaa 3 aga 1
cta 1 cca 2 caa 1 cga 1
gta 2 gca 4 gaa 3 gga 3
ttg 1 tcg tag tgg 1
atgj 1 acg aag agg
ctg ccg cag cgg
gtg gcg gag ggg
spiro >1aa 1aa -5s +5s -16s +16s total
ant 38 7 2 8 55
Ep12 ant, distribution sur référence
g1    t1       
atgi 1 tct tat atgf 4
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc 2 tcc 1 tac 2 tgc 1
atc 4 acc 2 aac 2 agc 1
ctc 1 ccc cac 1 cgt
gtc 1 gcc gac 2 ggc
tta 2 tca 2 taa tga
ata aca 2 aaa 3 aga 1
cta 1 cca 2 caa 1 cga 1
gta 2 gca 4 gaa 3 gga 3
ttg 1 tcg tag tgg 1
atgj 1 acg aag agg
ctg ccg cag cgg
gtg gcg gag ggg
inter max min total
ant 24 28 3 55
epsilon2. indices du 11.1.21 161 génomes.
g1 t1 161 6531 0  0
atgi 97 tct tat atgf 149
att act aat agt
ctt 1.5 cct cat cgc 9
gtt gct gat ggt
ttc 122 tcc 109 tac 118 tgc 108
atc 243 acc 118 aac 122 agc 105
ctc 129 ccc 106 cac 111 cgt 134
gtc 100 gcc 131 gac 165 ggc 175
tta 108 tca 108 taa 3.1 tga 86
ata aca 102 aaa 118 aga 106
cta 108 cca 105 caa 111 cga 65
gta 115 gca 234 gaa 180 gga 105
ttg 126 tcg 106 tag 1.5 tgg 111
atgj 112 acg 98 aag 85 agg 100
ctg 122 ccg 98 cag 88 cgg 92
gtg 83 gcg 78 gag 40 ggg 94
inter max min total
epsilon

ant intercalaires entre cds

  • Lien NCBI [44] 24.9.20
  • Note: Pour les génomes des annexes j'ai relevé les intercalaires entre tRNAs et entre ceux-ci et les cds qui leur sont adjacents. L'exemple est celui de rru du clant alpha. L'idée de départ de ces prélèvements est la recherche d'opérons formés de tRNA et de protéine comme dans le cas d'E.coli: l'intercalaire entre le tRNA et la protéine devrait être faible. Voir l'exemple d'eco (remarque @3) avec tac-tac-tpr et aca-tac-gga-acc-tufB.

ant les fréquences

  • Lien tableur: ant intercalaires entre cds
  • Légende:   long, longueur en pbs,   intercal pour intercalaire
    - fréquence-1 1 5 6 f, respectivement fréquence des intercalaires négatives à l'unité, positives à l'unité, par blocs de 5, par blocs de 10 jusqu'à 600 pbs et f pour finales. Ces fréquences servent à faire les diagrammes. La fréquence fréquencez est l'étendue à 1200 de la fréquence6 pour certains grands génomes.
    - cumul,% colonne à la droite de frequence6, reprend les fréquences par plages et leurs pourcentages indiqués déjà dans la 1ère partie du tableau.
    - La couleur cyan des fréquences fréquence-1 et 1 sert à montrer leur périodicité ternaire.
    - intercaln intercalx, pour les intercalaires négatifs minimaux et intercalaires positifs maximaux.
    - colonne ADN pour la longueur totale du génome en pbs et intercals pour le total en pbs des intercalaires entre cds uniquement, d'après la méthode des prélèvements de NCBI du 24.9.20.
ant Les fréquences des intercalaires entre cds
ant intercalaires total % intercalaires moyenne ecartype plage ADN intercal frequence5
négatif 762 24.6 négatif -8 9 -1 à -79 3 192 235 -1 762
zéro 65 2.1 intercals 0 65
1 à 200 2060 66.6 0 à 200 56 54 192 251 5 313
201 à 370 150 4.8 201 à 370 258 43 6.0% 10 248
371 à 600 33 1.1 371 à 600 470 68 15 182
601 à max 25 0.8 601 à 1028 769 128 20 100
total 3095 <201 93.3 total 3094 60 105 -79 à 1028 25 58
adresse intercalx intercal fréquence1 intercal fréquence6 cumul,% intercal fréquence-1 30 51
184238 1181 -1 762 -70 2 0 65 35 36
2384649 1028 0 65 -60 1 -1 164 40 34
710835 984 1 120 -50 4 -2 0 45 33
982825 947 2 70 -40 3 -3 0 50 45
3045330 924 3 59 -30 14 min à -1 -4 261 55 47
1534263 916 4 31 -20 49 762 -5 2 60 44
2391806 863 5 33 -10 137 24.6% -6 7 65 60
269108 850 6 26 0 617 -7 12 70 42
1454453 848 7 21 10 561 -8 103 75 54
1174364 789 8 50 20 282 -9 3 80 49
1115863 783 9 94 30 109 -10 8 85 56
2054584 776 10 57 40 70 1 à 100 -11 49 90 56
2920637 773 11 48 50 78 1651 -12 4 95 31
1754154 772 12 52 60 91 53.3% -13 9 100 47
997474 739 13 39 70 102 -14 35 105 38
1906747 712 14 22 80 103 -15 3 110 34
1172194 702 15 21 90 112 -16 1 115 45
606029 672 16 21 100 78 -17 26 120 31
1071807 649 17 15 110 72 -18 0 125 35
1204569 642 18 26 120 76 -19 2 130 27
792914 628 19 26 130 62 -20 20 135 33
2100174 625 20 12 140 57 -21 1 140 24
949485 617 21 22 150 48 -22 0 145 24
2733159 613 22 11 160 53 -23 9 150 24
2042643 612 23 11 170 20 1 à 200 -24 1 155 21
2270147 596 24 6 180 30 2060 -25 2 160 32
3006396 587 25 8 190 30 66.6% -26 6 165 16
2176130 583 26 12 200 26 -27 2 170 4
27717 575 27 8 210 20 -28 0 175 15
1024897 562 28 6 220 18 -29 8 180 15
715253 551 29 16 230 13 -30 0 185 15
2128182 532 30 9 240 16 -31 1 190 15
1829788 526 31 11 250 9 -32 6 195 14
1763296 520 32 2 260 13 0 à 200 810 200 12
33 10 270 9 2125 reste 17 205 11
34 6 280 9 total 827 210 9
35 7 290 5 215 10
36 6 300 12 intercal frequencef 220 8
37 7 310 5 600 3070 225 5
38 6 320 3 620 3 230 8
39 9 330 7 640 2 235 6
40 6 340 4 201 à 370 660 2 240 10
1246 350 2 150 680 1 245 6
2669 360 3 4.8% 700 250 3
370 2 720 2 255 7
380 1 740 1 260 6
adresse intercaln décalage long 390 4 760 265 5
3067823 -79 comp 400 2 780 3 270 4
2531271 -71 shift2 1430 410 3 800 2 275 5
1382616 -65 shift2 248 420 1 820 280 4
1058996 -59 shift2 389 430 0 840 285 3
2237436 -56 shift2 872 440 0 860 2 290 2
641645 -55 shift2 861 450 3 880 1 295 5
1374304 -53 shift2 1223 460 4 900 300 7
3090072 -49 470 0 920 1 305 1
542837 -43 480 1 940 1 310 4
2236436 -41 490 1 960 1 315 3
907463 -38 500 1 980 320 0
984116 -38 510 2 1000 1 325 3
1476725 -38 520 2 1020 330 4
1904926 -38 530 1 1040 1 335 3
1716281 -35 540 1 371 à 600 24 340 1
2233985 -35 550 0 33 345 0
3184884 -35 560 1 1.1% 350 2
531215 -32 570 1 355 2
642505 -32 580 1 601 à max 360 1
1843228 -32 590 2 25 365 1
2546649 -32 600 1 0.8% 370 1
2808157 -32 reste 25 reste 1 reste 58
3127986 -32 total 3095 total 3095 total 3095

ant autres intercalaires

  • Lien tableur: ant autres intercalaires
  • Légende:  
    - comp, le gène est sur le brin complement
    - deb, fin sont respectivement dans le sens des adresses croissantes, le cds avant le 1er tRNA et le cds après le dernier tRNA du bloc.
ant Les autres intercalaires.
ant1 adresses1
deb-fin gènes adresses intercal sens
deb CDS 167574 66
tRNA 168501 447
fin CDS 169025
deb CDS 237275 305
rRNA 237928 111
tRNA 239556 19
tRNA 239652 301
rRNA 240029 202
rRNA 243148 354
fin CDS 243618 comp
deb CDS 302333 155 comp
tRNA 303316 10
tRNA 303404 16
tRNA 303497 61
tRNA 303635 96
tRNA 303816 70
fin CDS 303963
deb CDS 316375 110
tRNA 317454 109
fin CDS 317640
deb CDS 373519 120
tRNA 375862 5
tRNA 375943 65
fin CDS 376093
deb CDS 597419 47
tRNA 598534 208
fin CDS 598827
deb CDS 751446 73 comp
tRNA 753064 16 comp
tRNA 753157 3 comp
tRNA 753236 31 comp
tRNA 753342 8 comp
tRNA 753426 22 comp
tRNA 753525 3 comp
tRNA 753604 42 comp
tRNA 753721 40 comp
fin CDS 753837 comp
deb CDS 833388 142 comp
tRNA 834121 93 comp
fin CDS 834298 comp
ant2 adresses2
deb-fin gènes adresses intercal sens
deb CDS 1445917 93
tRNA 1449916 270
fin CDS 1450262
deb CDS 1615201 29
tRNA 1615572 99
fin CDS 1615747
deb CDS 1703617 1
tRNA 1703837 12 comp
tRNA 1703926 117 comp
fin CDS 1704118
deb CDS 1907982 -5
ncRNA 1908268 28 comp
fin CDS 1908619 comp
deb CDS 2221719 242 comp
tRNA 2222768 33 comp
tRNA 2222876 72 comp
fin CDS 2223023 comp
deb CDS 2282678 349 comp
tRNA 2283792 81 comp
tRNA 2283962 39 comp
tRNA 2284078 15 comp
tRNA 2284170 102 comp
fin CDS 2284362 comp
deb CDS 2323802 12
tRNA 2324879 167 comp
rRNA 2325122 202 comp
rRNA 2325440 300 comp
tRNA 2328657 19 comp
tRNA 2328752 111 comp
rRNA 2328940 378 comp
fin CDS 2330835 comp
deb CDS 2425110 353
tmRNA 2427398 181 comp
fin CDS 2427974 comp
deb CDS 2581821 192 comp
tRNA 2583033 45 comp
tRNA 2583154 16 comp
tRNA 2583259 143 comp
fin CDS 2583489
ant3 adresses3
deb-fin gènes adresses intercal sens
deb CDS 2637277 81 comp
tRNA 2637541 31 comp
fin CDS 2637648 comp
deb CDS 2637824 240 comp
tRNA 2639273 8 comp
tRNA 2639358 69 comp
tRNA 2639512 21 comp
tRNA 2639610 41 comp
fin CDS 2639727 comp
deb CDS 2656033 231
rRNA 2656495 223 comp
rRNA 2656834 301 comp
tRNA 2660052 19 comp
tRNA 2660147 111 comp
rRNA 2660335 292 comp
fin CDS 2662144 comp
deb CDS 2693436 95
tRNA 2695547 16
tRNA 2695638 7
tRNA 2695732 14
tRNA 2695823 16
tRNA 2695915 14
tRNA 2696006 12
tRNA 2696095 30
tRNA 2696202 90
fin CDS 2696381
deb CDS 2739487 88 comp
Regulatory 2740208 48 comp
fin CDS 2740399 comp
deb CDS 2825449 163
repeat_region 2825927 233
fin CDS 2827303
deb CDS 3082950 143
tRNA 3083318 173 comp
rRNA 3083567 202 comp
rRNA 3083885 273 comp
tRNA 3087075 19 comp
tRNA 3087170 111 comp
rRNA 3087358 462 comp
fin CDS 3089337

ant intercalaires tRNA

  • Lien tableur: ant intercalaires tRNA
  • Légende:
    - comp', l'intercalaire est entre un gène comp (sur le complément) et un gène sur le brin direct. Continu les 2 gènes sont sur le même brin.
    - deb, fin sont les intercalaires des cds du tableau précédent, autres intercalaires: respectivement dans le sens des adresses croissantes, le cds avant le 1er tRNA et le cds après le dernier tRNA du bloc.
  • Cumuls comp'+continu du tableau
	deb	fin	total
<201	15	13	28
total	18	16	34
%	83%	81%	82%
ant intercalaires tRNA
ant les relevés deb-fin
comp’ entre tRNAs comp’ deb comp’ fin
66 447
10 16 61 96 comp’ 155 70
110 109
5 120 65
47 208
16 3 31 8 22 3 42 73 40
142 93
93 270
29 99
12 comp’ 1 117
33 242 73
81 39 15 349 102
comp’ 12
45 16 192 comp’ 143
81 31
8 69 21 240 41
16 7 14 16 14 12 30 95 90
comp’ 143
ant intercalaires inférieures à 201 pbs
deb fin continu cumuls
29 31 deb
47 40 <201 11
66 41 total 14
73 65 taux 79%
81 70 fin
93 73 <201 12
95 90 total 15
110 93 taux 80%
120 99 total
142 102 <201 23
192 109 total 29
240 117 taux 79%
242 208
349 270
- 447 comp’ cumuls
1 143 deb 100%
12 - fin 100%
143 - total 100%
155 -

ant intercalaires rRNA

  • Voir la présentation des blocs à rRNA dans le chapitre ant blocs de l'étude préliminaire. A comparer avec le tableau ant autres intercalaires.
  • Remarque: Quand le 16s n'est pas précédé de tRNAs l'intercalaire cds-16s est élevé, pour les 3 1ers blocs ils ont 462 378 292 pbs. Les intercalaires cds-bloc de l'autre côté du bloc sont beaucoup plus faibles, respectivement 143 12 231 pbs. Cette orientation est quasiment générale chez tous les génomes que j'ai étudié ici. Je l'ai notée dans les chapitres génome-bloc de chaque génome. Seul le 4ème bloc ne répond pas à cette orientation, 305 354.
  • Note: J'ai supposé souvent que les blocs à tRNA sans rRNA sont aussi orientés de l'intercalaire le plus grand au plus petit. Dans ant cumuls et de même pour les autres génomes, j'ai noté cette orientation dans la colonne cdsd, pour cds dirigé. Je n'ai conservé pour les calculs que le plus petit intercalaire des 2 cds bordant le bloc. L'idée était que cette orientation provoquait la création du cds en fin de bloc. Ces cds sont souvent de petites protéines et souvent hypothétiques. Aussi je présente ci-dessous la transformation deb-fin qui est imposée par l'adressage en intercalaire plus grand et plus petit.
deb	fin		tri	grand	petit
66	447		10	117	1
155	70		9	99	29
110	109		14	81	31
120	65		6	73	40
47	208		15	240	41
73	40		5	208	47
142	93		4	120	65
93	270		1	447	66
29	99		2	155	70
1	117		11	242	73
242	73		16	95	90
349	102		7	142	93
192	143		8	270	93
81	31		12	349	102
240	41		3	110	109
95	90		13	192	143

ant par rapport au groupe de référence

ant: Comparaison avec la référence
tRNAs blocs tRNAs blocs rRNAs
ant 1aa >1aa dup +5s 1-3aas autres total
21 faible 3 3
16 moyen 2 12 2 8 24
14 fort 2 24 2 28
7 36 2 0 2 8 55
10 g+cga 1 1
2 agg+cgg 0
4 carre ccc 2 2
5 autres 0
3 0 0 0 0 0 3
total tRNAs ‰
ant 1aa >1aa dup +5s 1-3aas autres ant ‰ ref.‰
21 faible 55 55 26
16 moyen 36 218 0 36 145 436 324
14 fort 36 436 36 509 650
127 655 36 0 36 145 55 729
10 g+cga 18 18 10
2 agg+cgg
4 carre ccc 36 36 16
5 autres
55 0 0 0 0 0 55
blocs tRNAs ‰ total colonne %
ant 1aa >1aa dup total ref.‰ 1aa >1aa dup
21 faible 67 67 26 0
16 moyen 44 267 311 324 33
14 fort 44 533 44 622 650 67
156 800 44 45 729 36
10 g+cga 22 22 10
2 agg+cgg
4 carre ccc 44 44 16
5 autres
67 67

epsilon, estimation des -rRNAs

  • Lien tableur: epsilon, estimation des -rRNAs
  • Liens fiche:   typage
  • Légende: prélèvement de la base gtRNAdb le 11.1.21
    - ttt et tgt sont nuls partout
    - atgi, c'est Ile2, mis à la place de ttt, très rare chez les procaryotes.
    - atgf, c'est Metf, mis à la place de tgt, très rare chez les procaryotes.
    - atgj, c'est Met, remplace le atg standard qui est la somme Ile2 Met fMet.
    - Voir la légende des tris, g1 t1 et des couleurs

epsilon, calcul des -rRNAs

eps epsilon 63 génomes
eps1 cumul des +rRNAs de la fiche epsilon pour 40 génomes
g1    t1       
atgi tct tat atgf 1
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc tcc tac tgc
atc 80 acc 3 aac 3 agc
ctc ccc cac cgt
gtc gcc gac 2 ggc
tta tca taa tga
ata aca aaa 3 aga
cta cca 1 caa cga
gta 2 gca 89 gaa gga
ttg tcg tag tgg
atgj acg aag 1 agg
ctg ccg cag cgg
gtg gcg gag 1 ggg
epsi40 inter max min total
172 13 2 187
eps2 indices du clade epsilon du 11.1.21 de gtRNAdb pour 100 génomes
g1    t1       
atgi 99 tct tat 0.6 atgf 106
att act aat agt
ctt cct cat cgc 97
gtt 1.2 gct gat ggt
ttc 107 tcc 97 tac 103 tgc 101
atc 191 acc 99 aac 112 agc 101
ctc 101 ccc 55 cac 100 cgt 0
gtc 98 gcc 95 gac 139 ggc 140
tta 104 tca 101 taa tga 60
ata aca 108 aaa 150 aga 124
cta 101 cca 101 caa 109 cga 100
gta 139 gca 199 gaa 173 gga 111
ttg 101 tcg 0.6 tag tgg 100
atgj 98 acg 1.9 aag 9 agg 96
ctg 1.2 ccg 0.6 cag 0.6 cgg 1.2
gtg gcg gag 25 ggg 1.9
gtRNA inter max min total
1717 1695 646 4058
eps3 cumul des -rRNAs de l'annexe epsilon de 1 génome
g1    t1       
atgi 1 tct tat atgf 4
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc 2 tcc 1 tac 2 tgc 1
atc acc aac 2 agc 1
ctc 1 ccc cac 1 cgt
gtc 1 gcc gac 2 ggc
tta 2 tca 2 taa tga
ata aca 2 aaa 3 aga 1
cta 1 cca 2 caa 1 cga 1
gta 2 gca gaa 3 gga 3
ttg 1 tcg tag tgg 1
atgj 1 acg aag agg
ctg ccg cag cgg
gtg gcg gag ggg
epsi1 inter max min total
14 28 3 45
eps4 indices des +rRNAs de la fiche epsilon pour 100 génomes
g1    t1       
atgi tct tat atgf 3
att act aat agt
ctt cct cat cgc 3
gtt gct gat ggt
ttc tcc tac tgc
atc 200 acc 8 aac 8 agc
ctc ccc cac cgt
gtc gcc gac 5 ggc
tta tca taa tga
ata aca aaa 8 aga
cta cca 3 caa cga
gta 5 gca 223 gaa gga
ttg tcg tag tgg
atgj acg aag 3 agg
ctg ccg cag cgg
gtg gcg gag 3 ggg
epsi40 inter max min total
430 33 5 468
eps5 estimation des -rRNA du clade epsilon pour 100 génomes
g1    t1       
atgi 99 tct tat 0.6 atgf 104
att act aat agt
ctt cct cat cgc 95
gtt 1.2 gct gat ggt
ttc 107 tcc 97 tac 103 tgc 101
atc -9 acc 92 aac 105 agc 101
ctc 101 ccc 55 cac 100 cgt 0
gtc 98 gcc 95 gac 134 ggc 140
tta 104 tca 101 taa tga 60
ata 0 aca 108 aaa 143 aga 124
cta 101 cca 99 caa 109 cga 100
gta 134 gca -24 gaa 173 gga 111
ttg 101 tcg 0.6 tag tgg 100
atgj 98 acg 1.9 aag 6.5 agg 96
ctg 1.2 ccg 0.6 cag 0.6 cgg 1.2
gtg 0 gcg 0 gag 23 ggg 1.9
-rRNA inter max min total
1287 1663 641 3591
eps6 indices des -rRNAs de l'annexe archeo pour 100 génomes
g1    t1       
atgi 100 tct tat atgf 400
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc 200 tcc 100 tac 200 tgc 100
atc acc aac 200 agc 100
ctc 100 ccc cac 100 cgt
gtc 100 gcc gac 200 ggc
tta 200 tca 200 taa tga
ata aca 200 aaa 300 aga 100
cta 100 cca 200 caa 100 cga 100
gta 200 gca gaa 300 gga 300
ttg 100 tcg tag tgg 100
atgj 100 acg aag agg
ctg ccg cag cgg
gtg gcg gag ggg
epsi1 inter max min total
1400 2800 300 4500

epsilon, comparaison clade-annexe des -rRNAs

  • Lien tableur: epsilon, comparaison clade-annexe des -rRNAs
  • Légende
    - eps7. diff, somme des couleurs de eps7. La différence entre tRNAs est faite entre eps5 et eps6 du tableau précédent. Elle est exprimée en % et rapporté à la plus grande valeur des 2 termes de la différence. Ce qui fait quand un tRNA est à zéro la différence en % est égale à 100.
    - eps8. rap, rapport des sommes couleurs eps5/eps2. Le rapport -rRNA/total est celui du tRNA de eps5 sur celui de eps2.
  • Fréquences des différences en % du tableau eps7
gamme		0/0	10	20	30	40	50	60	70	80	90	100		total
fréquence	4	13	1	0	2	7	2	1	1	0	18	0	49
tot ≤ 50						23							
  • Comparaison avec le nombre de tRNAs de la fiche du clade: L’estimation des -rRNA par l'annexe est 13% au dessus de celle de la fiche des archées.
tRNAs		fiche		annexe
sans		1588		45
avec		188		10
genomes		40		1
indice %	40		45
eps epsilon 40 génomes
eps7 epsilon, différence clade-annexe des -rRNAs
g1    t1       
atgi 1 tct tat atgf 74
att act aat agt
ctt cct cat cgc 100
gtt gct gat ggt
ttc 47 tcc 3 tac 49 tgc 1
atc 100 acc 100 aac 48 agc 1
ctc 1 ccc 100 cac 0 cgt
gtc 2 gcc 100 gac 33 ggc 100
tta 48 tca 50 taa tga 100
ata aca 46 aaa 53 aga 19
cta 1 cca 51 caa 8 cga 0
gta 33 gca 100 gaa 42 gga 63
ttg 1 tcg 100 tag tgg 0
atgj 2 acg 100 aag 100 agg 100
ctg 100 ccg 100 cag 100 cgg 100
gtg gcg gag 100 ggg 100
diff inter max min total
127 546 3 676
eps8 epsilon, rapports -rRNA/total
g1    t1       
atgi tct tat atgf 98
att act aat agt
ctt cct cat cgc 97
gtt gct gat ggt
ttc tcc tac tgc
atc -5 acc 92 aac 93 agc
ctc ccc cac cgt
gtc gcc gac 96 ggc
tta tca taa tga
ata aca aaa 95 aga
cta cca 98 caa cga
gta 96 gca -12 gaa gga
ttg tcg tag tgg
atgj acg aag 72 agg
ctg ccg cag cgg
gtg gcg gag 90 ggg
rap inter max min total
75 98 99 88

pelagibacter ubique

Candidatus Pelagibacter ubique HTCC1062. NCBI 24-JAN-2021.

pub opérons

  • Lien tableur: pub opérons
  • Liens: gtRNAdb [45], NCBI [46], génome [orgn]
  • Phylogénie: Bacteria; Proteobacteria; Alphaproteobacteria; Pelagibacterales; Pelagibacteraceae; Candidatus Pelagibacter.
  • Légende: cdsa: cds aas, cdsd: cds dirigé
A10. Pelagibacter ubique
29.2%GC 24.01.21  31   doubles intercal cds aa avec aa cdsa cdsd protéines
41060..41653 cds 20 20 198 ABC transporter substrate-binding protein
comp 41674..41750 atgi 66 66
comp 41817..41891 gtc 8 8 8
comp 41900..43723 cds 608 RNA polymerase sigma factor RpoD
comp 114873..116147 cds 3 3 425 3 CCA tRNA nucleotidyltransferase
comp 116151..116224 caa 32 32
comp 116257..117102 cds 282 4-diphosphocytidyl-2C-methyl-D-erythritol kinase
comp 319204..319548 cds 22 22 115 22 4a-hydroxytetrahydrobiopterin dehydratase
comp 319571..319645 ggc 97 97
319743..320384 cds 214 LON peptidase substrate-binding domain-containing protein
comp 407852..408448 cds 68 68 199 DedA family protein
408517..408601 ttg 7 7 7
408609..410315 cds 569 AMP-binding protein
comp 414886..415407 cds 26 26 174 26 PaaI family thioesterase
comp 415434..415510 cgt 75 75
415586..416773 cds 396 acetyl-CoA C-acetyltransferase
438405..440213 cds 2 2 603 2 elongation factor 4
440216..440305 tcc 5 5 5
comp 440311..441081 cds 257 FkbM family methyltransferase
461643..462362 cds 2 2 240 2 VTT domain-containing protein
comp 462365..462438 acc 101 101
462540..462737 cds 66 hp
466335..466550 cds 5 5 72 5 translation initiation factor IF-1
466556..466631 ttc 88 88
466720..466932 cds 235 235 71 cold-shock protein
467168..467242 cac 5 5 5
467248..468645 cds 466 histidine--tRNA ligase
comp 509729..511027 cds 330 330 433 330 peptidoglycan DD-metalloendopeptidase family protein
511358..512832 16s @1 98
512931..513007 atc 9 9
513017..513092 gca 149
513242..515995 23s 446 446
516442..516975 cds 46625 178 WbuC family cupin fold metalloprotein
563601..564479 cds 52 52 293 NAD-dependent epimerase/dehydratase family protein
564532..564646 5s 13 13 13
564660..564785 cds 42 type B 50S ribosomal protein L36
567715..568413 cds 18 18 233 transaldolase
comp 568432..568508 atgf 6 6 6
comp 568515..568709 cds 65 30S ribosomal protein S21
comp 593396..594376 cds 23 23 327 RluA family pseudouridine synthase
594400..594476 cga @2 16 16 16
comp 594493..595425 cds 311 threonylcarbamoyl-AMP synthase
comp 842772..843023 cds 101 101 84 DUF1289 domain-containing protein
843125..843209 cta 16 16 16
843226..844659 cds 478 trigger factor
846722..849106 cds 49 49 795 49 endopeptidase La
849156..849231 gta 13 13
849245..849321 gac 88 88
849410..849778 cds 123 NADH-quinone oxidoreductase subunit A
934654..936063 cds 31 31 470 31 potassium transporter Trk
936095..936171 aga 170 170
936342..937382 cds 347 amino acid ABC transporter substrate-binding protein
941232..942389 cds 19 19 386 19 hp
comp 942409..942484 aac 52 52
comp 942537..942610 tgc 128 128
942739..945366 cds 876 valine--tRNA ligase
970015..971127 cds 200 200 371 tRNA guanosine(34) transglycosylase Tgt
971328..971403 aaa 20 20 20
comp 971424..972251 cds 276 M48 family metallopeptidase
975062..975328 cds 0 0 89 0 succinate dehydrogenase assembly factor 2
comp 975329..975418 tca 92 92
975511..976392 cds 294 EamA family transporter RarD
comp 985615..986127 cds 93 93 171 zinc-ribbon domain-containing protein
986221..986297 cca 4 4 4
986302..986583 cds 94 ETC complex I subunit
988522..990216 cds 50 50 565 single-stranded-DNA-specific exonuclease RecJ
990267..990341 gaa 23 23 23
990365..990598 cds 78 GIY-YIG nuclease family protein
1029539..1031752 cds 0 0 738 0 lytic transglycosylase domain-containing protein
comp 1031753..1031844 agc 68 68
1031913..1033166 cds 418 sarcosine oxidase subunit beta family protein
comp 1085222..1085413 cds 19 19 64 preprotein translocase subunit SecE
comp 1085433..1085508 tgg 7 7 7
comp 1085516..1086706 cds 47 47 397 47 elongation factor Tu
comp 1086754..1086827 gga 46 46
comp 1086874..1086959 tac 131 131
1087091..1087834 cds 33 33 248 33 23S rRNA (guanosine(2251)-2'-O)-methyltransferase RlmB
1087868..1087943 aca 4 4 4
comp 1087948..1088727 cds 4 4 260 4 NAD kinase
comp 1088732..1088816 tta 79 79
comp 1088896..1089312 cds 139 Gamma-glutamylcyclotransferase
1165696..1166454 cds 141 141 253 pilin
comp 1166596..1166672 atgj 64 64 64
comp 1166737..1166964 cds 76 hp

pub cumuls

cumuls. pub.
opérons Fréquences intercalaires tRNAs Fréquences intercalaires cds Fréquences aas cds chromosome
effectif gammes sans rRNAs avec rRNAs gammes cds gammes cdsd gammes cdsa gammes cdsa 300
avec rRNA opérons 1 1 1 2 1 2 100 11
16 atcgca 23 1 20 1 1 50 31 20 18 200 8
16 atc23s5s 40 100 11 40 5 300 11
16gca23s5s 60 2 150 5 60 2 400 7
max a 2 80 1 200 2 80 1 500 6
a doubles 100 250 1 100 600 2
autres 120 300 120 700 2
total aas 2 140 350 1 140 800 2
sans opérons 25 160 400 160 900 1
1 aa 21 180 450 1 180 1000
max a 2 200 500 200 1100
a doubles 0 1
total aas 29 4 1 52 28 43
total aas 31
remarques 2
avec jaune moyenne 44 9 63 27 299
variance 22 0 85 61 203
sans jaune moyenne 50 16 237
variance 55 16 134

pub blocs

A10. pub, blocs à rRNA.
cds 330 433 peptidoglycan DD-metalloendopeptidase family protein
16s 98 1475
atc 9 77
gca 149 76
23s 446 2754
cds 46625 178 WbuC family cupin fold metalloprotein
cds 52 293 NAD-dependent epimerase/dehydratase family protein
5s 13 115
cds 42 type B 50S ribosomal protein L36

pub distribution

  • Lien tableur: pub distribution
  • Légende:
    - Couleurs du 1er tableau: voir bacilli
    - Couleurs du 2ème tableau: d'après les couleurs du pieds du tableau
A10 pub distribution
A10 pub distribution selon la référence
g1    t1       
atgi 1 tct tat atgf 1
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc 1 tcc 1 tac 1 tgc 1
atc acc 1 aac 1 agc 1
ctc ccc cac 1 cgt 1
gtc 1 gcc gac 1 ggc 1
tta 1 tca 1 taa tga
ata aca 1 aaa 1 aga 1
cta 1 cca 1 caa 1 cga 1
gta 1 gca gaa 1 gga 1
ttg 1 tcg tag tgg 1
atgj 1 acg aag agg
ctg ccg cag cgg
gtg gcg gag ggg
pub inter max min total
13 14 2 29
A10 pub, distribution du total avec +16s. alpha.
g1    t1       
atgi 1 tct tat atgf 1
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc 1 tcc 1 tac 1 tgc 1
atc 1 acc 1 aac 1 agc 1
ctc ccc cac 1 cgt 1
gtc 1 gcc gac 1 ggc 1
tta 1 tca 1 taa tga
ata aca 1 aaa 1 aga 1
cta 1 cca 1 caa 1 cga 1
gta 1 gca 1 gaa 1 gga 1
ttg 1 tcg tag tgg 1
atgj 1 acg aag agg
ctg ccg cag cgg
gtg gcg gag ggg
alpha >1aa 1aa -5s +5s -16s +16s total
pub 8 21 2 31

pub remarques

  • Remarques : Ce génome se distingue par 1 seul bloc à rRNA dont le 5s est séparé, et le grand nombre de solitaires.
    1. @ 1 seul bloc rRNA dont le 5s se trouve à 46625 pbs.
    2. @ un tRNA très rare
  • Séquences des doubles :pas de doubles

pub intercalaires entre cds

  • Candidatus Pelagibacter ubique HTCC1062, pub [47], 24-JAN-2021.
  • Note: Pour les génomes des annexes j'ai relevé les intercalaires entre tRNAs et entre ceux-ci et les cds qui leur sont adjacents. L'exemple est celui de rru du clade alpha. L'idée de départ de ces prélèvements est la recherche d'opérons formés de tRNA et de protéine comme dans le cas d'E.coli: l'intercalaire entre le tRNA et la protéine devrait être faible. Voir l'exemple d'eco (remarque @3) avec tac-tac-tpr et aca-tac-gga-acc-tufB.

pub les fréquences

  • Lien tableur: pub intercalaires entre cds
  • Légende:   long, longueur en pbs,   intercal pour intercalaire
    - fréquence-1 1 5 6 f, respectivement fréquence des intercalaires négatives à l'unité, positives à l'unité, par blocs de 5, par blocs de 10 jusqu'à 600 pbs et f pour finales. Ces fréquences servent à faire les diagrammes. La fréquence fréquencez est l'étendue à 1200 de la fréquence6 pour certains grands génomes.
    - cumul,% colonne à la droite de frequence6, reprend les fréquences par plages et leurs pourcentages indiqués déjà dans la 1ère partie du tableau.
    - La couleur cyan des fréquences fréquence-1 et 1 sert à montrer leur périodicité ternaire.
    - intercaln intercalx, pour les intercalaires négatifs minimaux et intercalaires positifs maximaux.
    - colonne ADN pour la longueur totale du génome en pbs et intercals pour le total en pbs des intercalaires entre cds uniquement, d'après la méthode des prélèvements de NCBI du 24.1.21.
pub Les fréquences des intercalaires entre cds
pub intercalaires total % intercalaires moyenne ecartype plage ADN intercal frequence5
négatif 473 36.2 négatif -8 9 -65 à -1 1 308 759 -1 473
zéro 71 5.4 intercals 0 71
1 à 200 736 56.3 0 à 200 37 45 39 179 5 228
201 à 370 19 1.5 201 à 370 260 47 3.0% 10 67
371 à 600 7 0.5 371 à 600 475 70 15 35
601 à max 1 0.1 601 à 1028 - 20 31
total 1307 <201 97.9 total 1306 26 61 -65 à 596 25 29
adresse intercalx intercal fréquence1 intercal fréquence6 cumul,% intercal fréquence-1 30 16
73227 1380 -1 473 -70 0 0 71 35 26
999551 596 0 71 -60 1 -1 152 40 23
1162229 549 1 56 -50 2 -2 3 45 33
537246 464 2 69 -40 6 -65 à -1 -3 0 50 16
1119848 445 3 43 -30 8 473 -4 123 55 23
1180952 435 4 30 -20 29 36% -5 2 60 25
193367 434 5 30 -10 79 -6 2 65 15
398173 403 6 15 0 419 -7 3 70 13
408609 356 7 15 10 295 -8 56 75 17
762333 335 8 15 20 66 -9 7 80 12
1122717 318 9 14 30 45 1 à 100 -10 2 85 10
338267 317 10 8 40 49 651 -11 35 90 14
997872 304 11 8 50 49 49.8% -12 4 95 7
334628 284 12 7 60 48 -13 3 100 9
675167 279 13 6 70 28 -14 20 105 8
1135181 268 14 12 80 29 -15 0 110 4
627169 255 15 2 90 24 -16 2 115 9
1118568 248 16 5 100 16 -17 10 120 8
79392 239 17 6 110 12 1 à 200 -18 2 125 7
807867 230 18 8 120 17 736 -19 1 130 6
58997 223 19 4 130 13 56.3% -20 13 135 5
1152723 221 20 8 140 10 -21 0 140 5
761553 219 21 9 150 6 -22 1 145 1
782276 217 22 5 160 7 -23 6 150 5
612190 216 23 3 170 5 -24 3 155 2
351261 209 24 8 180 5 -25 1 160 5
838936 201 25 4 190 7 0 à 200 -26 3 165 3
744621 200 26 3 200 5 807 -27 0 170 2
166432 195 27 4 210 2 -28 1 175 4
625822 195 28 4 220 3 -29 1 180 1
164576 191 29 3 230 3 -30 1 185 6
217060 191 30 2 240 1 -31 1 190 1
1163621 188 31 3 250 1 -32 1 195 4
798049 185 32 8 260 1 530 200 1
422106 184 33 5 270 1 reste 14 205 1
288782 182 34 2 280 1 201 à 370 total 544 210 1
560488 182 35 8 290 1 19 215 0
262705 181 36 7 300 0 1.5% 220 3
469675 181 37 5 310 1 225 2
832239 177 38 2 320 2 230 1
939877 174 39 6 330 0 235 0
40 3 340 1 240 1
reste 308 350 0 245 0
total 1122 360 1 250 1
370 0 255 1
380 0 260 0
390 0 265 0
400 0 270 1
410 1 275 0
420 0 280 1
adresse intercaln décalage long 430 0 285 1
817687 -65 shift2 2521 440 2 290 0
410672 -59 shift2 856 450 1 295 0
1196013 -56 shift2 445 460 0 300 0
474189 -47 shift2 1222 470 1 305 1
682918 -47 shift2 1435 480 0 310 0
1025350 -44 shift2 544 490 0 315 0
1197066 -43 comp 500 0 371 à 600 320 2
584040 -41 shift2 934 510 0 7 325 0
707855 -41 shift2 319 520 0 0.5% 330 0
802906 -38 530 0 335 1
1038898 -38 540 0 340 0
279711 -35 550 1 345 0
1027659 -35 560 0 350 0
928018 -34 570 0 355 0
803426 -32 580 0 360 1
1176246 -31 590 0 max 365 0
429007 -30 600 1 1380 370 0
992704 -29 reste 1 reste 8
1233832 -28 total 1307 total 1307

pub autres intercalaires

  • Lien tableur: pub autres intercalaires
  • Légende:  
    - comp, le gène est sur le brin complement
    - deb, fin sont respectivement dans le sens des adresses croissantes, le cds avant le 1er tRNA et le cds après le dernier tRNA du bloc.
pub Les autres intercalaires.
pub1 adresses1
deb-fin gènes adresses intercal sens
deb CDS 9267 4 comp
tmRNA 10219 -2
fin CDS 10519 comp
deb CDS 38328 255 comp
ncRNA 39051 42 comp
fin CDS 39448 comp
deb CDS 41060 20
tRNA 41674 66 comp
tRNA 41817 8 comp
fin CDS 41900 comp
deb CDS 114873 3 comp
tRNA 116151 32 comp
fin CDS 116257 comp
deb CDS 319204 22 comp
tRNA 319571 97 comp
fin CDS 319743
deb CDS 407852 68 comp
tRNA 408517 7
fin CDS 408609
deb CDS 414886 26 comp
tRNA 415434 75 comp
fin CDS 415586
deb CDS 438405 2
tRNA 440216 5
fin CDS 440311 comp
deb CDS 461643 2
tRNA 462365 101 comp
fin CDS 462540
deb CDS 466335 5
tRNA 466556 88
deb CDS 466720 235
tRNA 467168 5
fin CDS 467248
deb CDS 496262 70 comp
regulatory 498528 91 comp
fin CDS 498707
pub2 adresses2
deb-fin gènes adresses intercal sens
deb CDS 509729 330 comp
rRNA 511358 98
tRNA 512931 9
tRNA 513017 149
rRNA 513242 446
fin CDS 516442
deb CDS 563601 52
rRNA 564532 13
fin CDS 564660
deb CDS 567715 18
tRNA 568432 6 comp
fin CDS 568515 comp
deb CDS 593396 23 comp
tRNA 594400 16
fin CDS 594493 comp
deb CDS 648881 24
regulatory 649787 77
fin CDS 649954
deb CDS 731869 9 comp
regulatory 732787 88 comp
fin CDS 732939 comp
deb CDS 785951 32
regulatory 786499 -13
fin CDS 786575
deb CDS 842772 101 comp
tRNA 843125 16
fin CDS 843226
deb CDS 846722 49
tRNA 849156 13
tRNA 849245 88
fin CDS 849410
deb CDS 934654 31
tRNA 936095 170
fin CDS 936342
deb CDS 941232 19
tRNA 942409 52 comp
tRNA 942537 128 comp
fin CDS 942739
pub3 adresses3
deb-fin gènes adresses intercal sens
deb CDS 970015 200
tRNA 971328 20
fin CDS 971424 comp
deb CDS 975062 0
tRNA 975329 92 comp
fin CDS 975511
deb CDS 985615 93 comp
tRNA 986221 4
fin CDS 986302
deb CDS 988522 50
tRNA 990267 23
fin CDS 990365
deb CDS 1005217 139 comp
regulatory 1005818 4
fin CDS 1005891
deb CDS 1029539 0
tRNA 1031753 68 comp
fin CDS 1031913
deb CDS 1085222 19 comp
tRNA 1085433 7 comp
deb CDS 1085516 47 comp
tRNA 1086754 46 comp
tRNA 1086874 131 comp
deb CDS 1087091 33
tRNA 1087868 4
deb CDS 1087948 4 comp
tRNA 1088732 79 comp
fin CDS 1088896 comp
deb CDS 1125607 4 comp
regulatory 1126163 3 comp
deb CDS 1126231 66 comp
regulatory 1127359 295 comp
fin CDS 1127719 comp
deb CDS 1165696 141
tRNA 1166596 64 comp
fin CDS 1166737 comp

pub intercalaires tRNA

  • Lien tableur: pub intercalaires tRNA
  • Légende:
    - comp', l'intercalaire est entre un gène comp (sur le complément) et un gène sur le brin direct. Continu les 2 gènes sont sur le même brin.
    - deb, fin sont les intercalaires des cds du tableau précédent, autres intercalaires: respectivement dans le sens des adresses croissantes, le cds avant le 1er tRNA et le cds après le dernier tRNA du bloc.
  • Cumuls comp'+continu du tableau
	deb	fin	total
<201	24	25	49
total	25	25	50
taux	96%	100%	98%
pub intercalaires tRNA
pub les relevés deb-fin
comp’ entre tRNAs comp’ deb comp’ fin
66 comp’ 20 8
9 3 32
13 22 comp’ 97
comp’ 52 comp’ 68 7
46 26 comp’ 75
2 comp’ 5
comp’ 2 comp’ 101
5 88
235 5
comp’ 18 6
comp’ 23 comp’ 16
comp’ 101 16
49 88
31 170
comp’ 19 comp’ 128
200 comp’ 20
comp’ 0 comp’ 92
comp’ 93 4
50 23
comp’ 0 comp’ 68
19 7
47 comp’ 131
33 comp’ 4
4 79
comp’ 141 64
pub intercalaires inférieures à 201 pbs
deb fin continu cumuls
2 4 deb
3 5 <201 13
4 6 total 14
5 7 taux 93%
19 7 fin
22 8 <201 14
26 16 total 14
31 23 taux 100%
33 32 total
47 64 <201 27
49 79 total 28
50 88 taux 96%
200 88
235 170 comp’ cumuls
0 4
0 5 deb 11
2 16 <201 100%
18 20
19 68 fin 11
20 75 <201 100%
23 92
68 97 total
93 101 <201 22
101 128 total 22
141 131 taux 100%

pub intercalaires rRNA

  • Voir la présentation des blocs à rRNA dans le chapitre pub blocs de l'étude préliminaire. A comparer avec le tableau pub autres intercalaires.
  • Remarque: Quand le 16s n'est pas précédé de tRNAs l'intercalaire cds-16s est élevé, pour le 2ème bloc il est pour cvi de 447 pbs. L'intercalaire cds-bloc de l'autre côté du bloc est beaucoup plus faible, cvi 280 pbs. Cette orientation est quasiment générale chez tous les génomes que j'ai étudié ici. Je l'ai notée dans les chapitres génome-bloc de chaque génome. Pour pub il y a un seul bloc 16s23s5s mais cassé, le 5s est très loin du 16s23s, le cds-16s fait 330 pbs et 23s-cds 446.
  • Note: J'ai supposé souvent que les blocs à tRNA sans rRNA sont aussi orientés de l'intercalaire le plus grand au plus petit. Dans pub cumuls et de même pour les autres génomes, j'ai noté cette orientation dans la colonne cdsd, pour cds dirigé. Je n'ai conservé pour les calculs que le plus petit intercalaire des 2 cds bordant le bloc. L'idée était que cette orientation provoquait la création du cds en fin de bloc. Ces cds sont souvent de petites protéines et souvent hypothétiques. Aussi je présente ci-dessous la transformation deb-fin qui est imposée par l'adressage en intercalaire plus grand et plus petit.
deb	fin		tri	grand	petit
20	8		17	92	0
3	32		20	68	0
22	97		6	5	2
68	7		7	101	2
26	75		2	32	3
2	5		18	93	4
2	101		23	33	4
5	88		24	79	4
235	5		8	88	5
18	6		9	235	5
23	16		10	18	6
101	16		4	68	7
49	88		21	19	7
31	170		1	20	8
19	128		11	23	16
200	20		12	101	16
0	92		15	128	19
93	4		16	200	20
50	23		3	97	22
0	68		19	50	23
19	7		5	75	26
47	131		14	170	31
33	4		22	131	47
4	79		13	88	49
141	64		25	141	64