Recherche:Les clusters de gènes tRNA et rRNA chez les procaryotes/Annexe/alpha
Aller à la navigation
Aller à la recherche
Rickettsia typhi str. B9991CWPP[modifier | modifier le wikicode]
rtb opérons[modifier | modifier le wikicode]
- Liens: gtRNAdb [1], NCBI [2], génome [3]
- Lien tableur: rtb opérons
- Phylogénie: Bacteria; Proteobacteria; Alphaproteobacteria; Rickettsiales; Rickettsiaceae; Rickettsieae; Rickettsia; typhus group.
- Légende: cdsa: cds aas, cdsd: cds dirigé
29%GC | 31.12.19 Paris | 33 | doubles | intercal | cds | aa | avec aa | cdsa | cdsd | protéines |
---|---|---|---|---|---|---|---|---|---|---|
comp | 7429..8469 | cds | 381 | 381 | 347 | UDP-3-O-(3-hydroxymyristoyl)glucosamine N-acyltransferase | ||||
comp | 8851..8926 | ttc | 368 | 368 | ||||||
9295..10278 | cds | 328 | tRNA dihydrouridine synthase DusB | |||||||
14663..18055 | cds | 108 | 108 | 1131 | autotransporter outer membrane beta-barrel domain-containing protein | |||||
18164..18238 | gaa | 1394 | 1394 | |||||||
comp | 19633..20106 | cds | 158 | crossover junction endodeoxyribonuclease RuvC | ||||||
comp | 48065..48709 | cds | 278 | 278 | 215 | YihA family ribosome biogenesis GTP-binding protein | ||||
comp | 48988..49064 | atgf | 110 | 110 | ||||||
comp | 49175..49411 | cds | 79 | 50S ribosomal protein L31 | ||||||
comp | 73627..73929 | cds | 17 | 17 | 101 | preprotein translocase subunit SecG | ||||
comp | 73947..74021 | acc | 139 | 139 | ||||||
comp | 74161..75417 | cds | 419 | MFS transporter | ||||||
155064..157163 | cds | 143 | 143 | 700 | elongation factor G | |||||
157307..157382 | tgg | 167 | 167 | |||||||
157550..157750 | cds | 67 | preprotein translocase subunit SecE | |||||||
189197..189400 | cds | 889 | 889 | 68 | DUF2674 domain-containing protein | |||||
comp | 190290..190365 | acg | 142 | 142 | ||||||
comp | 190508..192814 | cds | 769 | outer membrane protein assembly factor BamA | ||||||
255010..255921 | cds | 732 | 732 | 304 | methionyl-tRNA formyltransferase | |||||
256654..259439 | 23s | 206 | 2786 | |||||||
259646..259760 | 5s | 173 | 173 | 115 | ||||||
comp | 259934..261007 | cds | 358 | cell division protein ZapE | ||||||
291358..291843 | cds | 35 | 35 | 162 | 30S ribosomal protein S9 | |||||
291879..291955 | atgj | 1364 | 1364 | |||||||
comp | 293320..293805 | cds | 162 | RNA pyrophosphohydrolase | ||||||
335194..336996 | cds | 402 | 402 | 601 | elongation factor 4 | |||||
337399..337473 | aac | 633 | 633 | |||||||
comp | 338107..338793 | cds | 229 | hp | ||||||
comp | 440466..440933 | cds | 496 | 496 | 156 | DUF2155 domain-containing protein | ||||
441430..441504 | tgc | 31 | 31 | |||||||
441536..442456 | cds | 307 | site-specific tyrosine recombinase XerD | |||||||
comp | 469056..469781 | cds | 218 | 218 | 242 | 3-deoxy-manno-octulosonate cytidylyltransferase | ||||
470000..470075 | aaa | 15 | 15 | |||||||
470091..470167 | atc | 1922 | 1922 | |||||||
472090..472662 | cds | 191 | GTP cyclohydrolase I FolE | |||||||
comp | 564534..565562 | cds | 1530 | 1530 | 343 | type 2 isopentenyl-diphosphate Delta-isomerase | ||||
comp | 567093..567180 | tcc | 218 | 218 | ||||||
comp | 567399..568145 | cds | 249 | NTP transferase domain-containing protein | ||||||
583250..584149 | cds | 1278 | 1278 | 300 | hydroxymethylbilane synthase | |||||
comp | 585428..585518 | tca | 58 | 58 | ||||||
comp | 585577..586569 | cds | 331 | tryptophan--tRNA ligase | ||||||
598723..599706 | cds | 26 | 26 | 328 | polyprenyl synthetase family protein | |||||
599733..599809 | cgg | 60 | 60 | |||||||
comp | 599870..599944 | caa | 62 | 62 | ||||||
comp | 600007..601779 | cds | 591 | aminopeptidase P family protein | ||||||
comp | 644357..644745 | cds | 499 | 499 | 130 | p-ribosome-associated translation inhibitor RaiA | ||||
645245..645321 | gac | @1 | 1051 | 1051 | ||||||
comp | 646373..646448 | gcc | 222 | 222 | ||||||
comp | 646671..647276 | cds | 202 | ATP-dependent Clp endopeptidase proteolytic subunit ClpP | ||||||
comp | 649389..650048 | cds | 452 | 452 | 220 | (d)CMP kinase | ||||
650501..650577 | gtc | 1274 | 1274 | |||||||
comp | 651852..652094 | cds | 81 | HU family DNA-binding protein | ||||||
comp | 696163..697398 | cds | 1535 | 1535 | 412 | tyrosine--tRNA ligase | ||||
698934..699010 | cgt | 1028 | 1028 | |||||||
700039..705720 | cds | 1894 | alpha-2-macroglobulin family protein | |||||||
comp | 727560..728087 | cds | 1164 | 1164 | 176 | copper chaperone Pcu(A)C | ||||
comp | 729252..729326 | gca | 32 | 32 | ||||||
comp | 729359..729574 | cds | 72 | hp | ||||||
739215..740075 | cds | 181 | 181 | 287 | TIGR01459 family HAD-type hydrolase | |||||
740257..740343 | ctc | 246 | 246 | |||||||
740590..741960 | cds | 1199 | 1199 | 457 | magnesium transporter | |||||
743160..743234 | ggc | 1090 | 1090 | |||||||
744325..744753 | cds | 143 | preprotein translocase subunit YajC | |||||||
comp | 775944..777866 | cds | 2465 | 2465 | 641 | hp | ||||
comp | 780332..781831 | 16s | 1854 | 1854 | 1500 | |||||
comp | 783686..785485 | cds | 600 | PAS domain-containing sensor histidine kinase | ||||||
comp | 814590..814823 | cds | 349 | 349 | 78 | hp | ||||
comp | 815173..815248 | gta | 68 | 68 | ||||||
comp | 815317..815589 | cds | 91 | 30S ribosomal protein S20 | ||||||
comp | 829300..830484 | cds | 82 | 82 | 395 | elongation factor Tu | ||||
comp | 830567..830640 | gga | 95 | 95 | ||||||
comp | 830736..830821 | tac | 183 | 183 | ||||||
831005..831733 | cds | 243 | 23s rRNA (guanosine(2251)-2'-O)-methyltransferase RlmB | |||||||
839841..839969 | cds | 145 | 145 | 43 | dimethyladenosine transferase | |||||
840115..840200 | tta | 2009 | 2009 | |||||||
842210..842446 | cds | 79 | hp | |||||||
comp | 876906..877589 | cds | 401 | 401 | 228 | 7-cyano-7-deazaguanine synthase QueC | ||||
877991..878067 | cac | 145 | 145 | |||||||
878213..879943 | cds | 577 | ATP-binding cassette domain-containing protein | |||||||
918938..919882 | cds | 951 | 951 | 315 | ACP S-malonyltransferase | |||||
920834..920925 | agc | 1945 | 1945 | |||||||
comp | 922871..924049 | cds | 393 | acetyl-CoA C-acetyltransferase | ||||||
comp | 961209..962297 | cds | 41 | 41 | 363 | YjgP/YjgQ family permease | ||||
comp | 962339..962415 | atgi | 390 | 390 | ||||||
comp | 962806..963273 | cds | 156 | peptidoglycan-associated lipoprotein Pal | ||||||
1023375..1023626 | cds | 1585 | 1585 | 84 | BolA family transcriptional regulator | |||||
1025212..1025288 | cca | 17 | 17 | |||||||
1025306..1025521 | cds | 72 | translation initiation factor IF-1 | |||||||
1053321..1054139 | cds | 2191 | 2191 | 273 | alpha/beta hydrolase | |||||
comp | 1056331..1056407 | aga | 98 | 98 | ||||||
1056506..1056823 | cds | 106 | DUF167 domain-containing protein | |||||||
comp | 1098776..1099240 | cds | 40 | 40 | 155 | DNA polymerase III subunit chi | ||||
comp | 1099281..1099365 | cta | 145 | 145 | ||||||
comp | 1099511..1100662 | cds | 384 | succinyl-diaminopimelate desuccinylase | ||||||
comp | 1102351..1102980 | cds | 475 | 475 | 210 | lipoyl(octanoyl) transferase LipB | ||||
comp | 1103456..1103530 | aca | 130 | 130 | ||||||
comp | 1103661..1103996 | cds | 112 | 30S ribosomal protein S16 |
rtb cumuls[modifier | modifier le wikicode]
- Lien tableur: rtb cumuls
- Légende
- Notes: moyenne et variance des intercalaires élevés des 21 cds : 1430 et 491
opérons | Fréquences intercalaires tRNAs | Fréquences intercalaires cds | Fréquences aas cds chromosome | ||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
effectif | gammes | sans rRNAs | avec rRNAs | gammes | cds | gammes | cdsd | gammes | cdsa | gammes | cdsa 300 | ||
avec rRNA | opérons | 2 | 1 | - | 1 | 0 | 1 | 100 | 11 | 30 | 0 | ||
23s5s | 1 | 20 | 1 | 50 | 8 | 40 | 200 | 13 | 60 | 1 | |||
16s | 1 | 40 | 100 | 5 | 80 | 300 | 12 | 90 | 9 | ||||
16s23s | 0 | 60 | 1 | 150 | 9 | 120 | 400 | 13 | 120 | 4 | |||
max a | 0 | 80 | 200 | 4 | 160 | 500 | 3 | 150 | 2 | ||||
a doubles | 0 | 100 | 1 | 250 | 4 | 200 | 600 | 3 | 180 | 7 | |||
spéciaux | 0 | 120 | 300 | 1 | 240 | 700 | 3 | 210 | 3 | ||||
total aas | 0 | 140 | 350 | 1 | 280 | 800 | 1 | 240 | 4 | ||||
sans | opérons | 29 | 160 | 400 | 3 | 320 | 900 | 0 | 270 | 3 | |||
1 aa | 25 | 180 | 450 | 2 | 360 | 1000 | 0 | 300 | 3 | ||||
max a | 2 | 200 | 500 | 4 | 400 | 1100 | 0 | 330 | 5 | ||||
a doubles | 0 | 1 | 21 | 2 | 20 | ||||||||
total aas | 33 | 4 | 0 | 62 | 0 | 61 | 61 | ||||||
total aas | 33 | ||||||||||||
remarques | 1 | ||||||||||||
avec jaune | moyenne | 612 | 310 | ||||||||||
variance | 665 | 291 | |||||||||||
sans jaune | moyenne | 57 | 193 | 269 | 176 | ||||||||
variance | 40 | 148 | 176 | 86 |
rtb blocs[modifier | modifier le wikicode]
- Lien tableur: rtb blocs
cds | 732 | 304 | methionyl-tRNA formyltransferase |
23s | 206 | 2786 | |
5s | 173 | 115 | |
cds | 358 | cell division protein ZapE | |
cds | 2465 | 641 | hp |
16s | 1854 | 1500 | |
cds | 600 | PAS domain-containing sensor histidine kinase |
rtb remarques[modifier | modifier le wikicode]
- Remarques: Les rickettia, rtb et rpl, présentent de nombreux intercalaires très élevés. D’où cet intercalaire @1 entre 2 aas de 1051 pbs. Je détaille ici les intercalaires du tableau des cumuls.
- - Les intercalaires entre aas: Il y a quatre intercalaires de ce type, 1051 95 60 15. A part le 1er les 3 autres sont courants dans cette étude et seulement le dernier est le rprésentant de la moyenne dans cette étude.
- - Les intercalaires avec un cds. Les 31 blocs de ce génomes se répartissent en 3 groupes
- Les RNAs complètement isolés, les 2 intercalaires du bloc sont supérieurs à 400 pbs. Il y a 6 aas dont celui avec 1051, plus le 16s. Sur ces 14 intercalaires 10 sont supérieurs à 900 et 4 entre 400 et 600 pbs.
- Les tRNAs proches de leurs 2 cds. Il y a 6 aas dont les 2 intercalaires sont inférieurs à 300 pbs et 4 aas dont au moins un des 2 intercalaires est entre 300 et 400 pbs et l'autre inférieur à 300 pbs.
- Il reste 14 blocs dont le 23s5s, auxquels il faut ajouter l’aa gcc voisin du gac isolé par 1051. Ces blocs sont très polarisés, leurs 2 intercalaires sont très dissymétriques.
- - 11 aas ont leur intercalaire majeur supérieur à 900 et va jusqu’à 2465 pbs. Le 23s5s a un intercalaire majeur modéré et assez courant pour les blocs à rRNAs.
- - 3 aas ont leur intercalaire majeur de 450 pbs environ.
- Les blocs isolés et les blocs entourés par 2 cds.
Blocs à RNAs isolés par 2 intercalaires de plus de 400 pbs. bloc adresse Blocs entourés par 2 intercalaires de 300 à 400 pbs aac 337399 ttc 8851 gac 645245 gta 815173 gtc 650501 cac 877991 cgt 698934 atgi 962339 ggc 743160 16s 780332 Blocs entourés par 2 intercalaires inférieurs à 300 pbs agc 920834 atgf 48988 : : acc 73947 : : tgg 157307 : : cgg-caa 599733 : : gga-tac 830567 : : cta 1099281
- Les séquences des doubles: Il n'y a aucun double dans ce génome
rtb distribution[modifier | modifier le wikicode]
- Lien tableur: rtb distribution
g1 | t1 | ||||||
---|---|---|---|---|---|---|---|
atgi | 1 | tct | tat | atgf | 1 | ||
att | act | aat | agt | ||||
ctt | cct | cat | cgc | ||||
gtt | gct | gat | ggt | ||||
ttc | 1 | tcc | 1 | tac | 1 | tgc | 1 |
atc | 1 | acc | 1 | aac | 1 | agc | 1 |
ctc | 1 | ccc | cac | 1 | cgt | 1 | |
gtc | 1 | gcc | 1 | gac | 1 | ggc | 1 |
tta | 1 | tca | 1 | taa | tga | ||
ata | aca | 1 | aaa | 1 | aga | 1 | |
cta | 1 | cca | 1 | caa | 1 | cga | |
gta | 1 | gca | 1 | gaa | 1 | gga | 1 |
ttg | tcg | tag | tgg | 1 | |||
atgj | 1 | acg | 1 | aag | agg | ||
ctg | ccg | cag | cgg | 1 | |||
gtg | gcg | gag | ggg | ||||
alpha | >1aa | =1aa | -5s | +5s | -16s | +16s | total |
rtb | 6 | 27 | 33 |
rtb intercalaires entre cds[modifier | modifier le wikicode]
- Rickettsia typhi str. B9991CWPP, 7.12.2020, NCBI [4]
- Note: Pour les génomes des annexes j'ai relevé les intercalaires entre tRNAs et entre ceux-ci et les cds qui leur sont adjacents. L'exemple est celui de rru du clade alpha. L'idée de départ de ces prélèvements est la recherche d'opérons formés de tRNA et de protéine comme dans le cas d'E.coli: l'intercalaire entre le tRNA et la protéine devrait être faible. Voir l'exemple d'eco (remarque @3) avec tac-tac-tpr et aca-tac-gga-acc-tufB.
rtb les fréquences[modifier | modifier le wikicode]
- Lien tableur: rtb intercalaires entre cds
- Légende: long, longueur en pbs, intercal pour intercalaire
- - fréquence-1 1 5 6 f, respectivement fréquence des intercalaires négatives à l'unité, positives à l'unité, par blocs de 5, par blocs de 10 jusqu'à 600 pbs et f pour finales. Ces fréquences servent à faire les diagrammes. La fréquence fréquencez est l'étendue à 1200 de la fréquence6 pour certains grands génomes.
- - cumul,% colonne à la droite de frequence6, reprend les fréquences par plages et leurs pourcentages indiqués déjà dans la 1ère partie du tableau.
- - La couleur cyan des fréquences fréquence-1 et 1 sert à montrer leur périodicité ternaire.
- - intercaln intercalx, pour les intercalaires négatifs minimaux et intercalaires positifs maximaux.
- - colonne ADN pour la longueur totale du génome en pbs et intercals pour le total en pbs des intercalaires entre cds uniquement, d'après la méthode des prélèvements de NCBI du 7.12.20.
rtb | intercalaires | total | % | intercalaires | moyenne | ecartype | plage | ADN | intercal | frequence5 | intercal | fréquencez |
---|---|---|---|---|---|---|---|---|---|---|---|---|
négatif | 102 | 12.9 | négatif | -11 | 10 | -50 à -1 | 1 112 957 | -1 | 102 | 610 | 1 | |
zéro | 5 | 0.6 | intercals | 0 | 5 | 620 | 2 | |||||
1 à 200 | 430 | 54.2 | 0 à 200 | 85 | 61 | 224 467 | 5 | 42 | 630 | 1 | ||
201 à 370 | 84 | 10.6 | 201 à 370 | 261 | 43 | 20.2% | 10 | 24 | 640 | 3 | ||
371 à 600 | 52 | 6.6 | 371 à 600 | 481 | 63 | 15 | 24 | 650 | 2 | |||
601 à max | 120 | 15.1 | 601 à 1028 | 1173 | 515 | 20 | 16 | 660 | 3 | |||
total 793 | <201 | 67.7 | total 793 | 282 | 445 | -50 à 3216 | 25 | 12 | 670 | 0 | ||
adresse | intercalx | intercal | fréquence1 | intercal | fréquence6 | cumul,% | intercal | fréquence-1 | 30 | 6 | 680 | 7 |
665700 | 3216 | -1 | 102 | -70 | 0 | 0 | 5 | 35 | 7 | 690 | 0 | |
1032528 | 3065 | 0 | 5 | -60 | 0 | -1 | 10 | 40 | 8 | 700 | 1 | |
506416 | 2624 | 1 | 10 | -50 | 1 | -2 | 1 | 45 | 2 | 710 | 1 | |
64385 | 2360 | 2 | 7 | -40 | 1 | -3 | 0 | 50 | 8 | 720 | 2 | |
801292 | 2313 | 3 | 8 | -30 | 5 | min à -1 | -4 | 33 | 55 | 5 | 730 | 2 |
272796 | 2262 | 4 | 13 | -20 | 12 | 102 | -5 | 0 | 60 | 8 | 740 | 0 |
131965 | 2171 | 5 | 4 | -10 | 21 | 12.9% | -6 | 0 | 65 | 10 | 750 | 1 |
763244 | 2078 | 6 | 5 | 0 | 67 | -7 | 2 | 70 | 12 | 760 | 1 | |
101695 | 2071 | 7 | 3 | 10 | 66 | -8 | 16 | 75 | 9 | 770 | 2 | |
446016 | 1893 | 8 | 7 | 20 | 40 | -9 | 0 | 80 | 12 | 780 | 2 | |
905133 | 1870 | 9 | 7 | 30 | 18 | -10 | 1 | 85 | 9 | 790 | 0 | |
141270 | 1858 | 10 | 2 | 40 | 15 | 1 à 100 | -11 | 2 | 90 | 4 | 800 | 1 |
570117 | 1846 | 11 | 6 | 50 | 10 | 243 | -12 | 0 | 95 | 10 | 810 | 3 |
129767 | 1794 | 12 | 5 | 60 | 13 | 30.6% | -13 | 3 | 100 | 15 | 820 | 0 |
378376 | 1765 | 13 | 3 | 70 | 22 | -14 | 7 | 105 | 11 | 830 | 4 | |
232652 | 1743 | 14 | 5 | 80 | 21 | -15 | 0 | 110 | 12 | 840 | 0 | |
871293 | 1715 | 15 | 5 | 90 | 13 | -16 | 1 | 115 | 10 | 850 | 1 | |
998041 | 1656 | 16 | 6 | 100 | 25 | -17 | 7 | 120 | 10 | 860 | 1 | |
359936 | 1637 | 17 | 1 | 110 | 23 | -18 | 0 | 125 | 13 | 870 | 0 | |
1014216 | 1621 | 18 | 3 | 120 | 20 | -19 | 0 | 130 | 8 | 880 | 1 | |
847537 | 1581 | 19 | 3 | 130 | 21 | -20 | 2 | 135 | 16 | 890 | 1 | |
338816 | 1539 | 20 | 3 | 140 | 26 | -21 | 0 | 140 | 10 | 900 | 1 | |
808693 | 1532 | 21 | 2 | 150 | 17 | -22 | 1 | 145 | 10 | 910 | 2 | |
950532 | 1524 | 22 | 2 | 160 | 17 | 1 à 200 | -23 | 3 | 150 | 7 | 920 | 1 |
969491 | 1524 | 23 | 1 | 170 | 21 | 430 | -24 | 0 | 155 | 8 | 930 | 1 |
706435 | 1485 | 24 | 4 | 180 | 16 | 54% | -25 | 1 | 160 | 9 | 940 | 1 |
536071 | 1468 | 25 | 3 | 190 | 15 | -26 | 5 | 165 | 12 | 950 | 3 | |
638208 | 1464 | 26 | 2 | 200 | 11 | -27 | 0 | 170 | 9 | 960 | 0 | |
597131 | 1463 | 27 | 0 | 210 | 7 | 100 | 175 | 9 | 970 | 0 | ||
544938 | 1446 | 28 | 2 | 220 | 7 | reste | 7 | 180 | 7 | 980 | 1 | |
235220 | 1444 | 29 | 2 | 230 | 11 | total | 107 | 185 | 8 | 990 | 0 | |
90984 | 1401 | 30 | 0 | 240 | 8 | 190 | 7 | 1000 | 1 | |||
693395 | 1374 | 31 | 0 | 250 | 9 | intercal | fréquencef | 195 | 6 | 1010 | 1 | |
422301 | 1373 | 32 | 3 | 260 | 9 | 0 à 200 | 600 | 673 | 200 | 5 | 1020 | 1 |
678698 | 1370 | 33 | 3 | 270 | 6 | 435 | 650 | 9 | 205 | 3 | 1030 | 1 |
476675 | 1354 | 34 | 0 | 280 | 3 | 700 | 11 | 210 | 4 | 1040 | 1 | |
1079428 | 1335 | 35 | 1 | 290 | 6 | 750 | 6 | 215 | 3 | 1050 | 2 | |
270767 | 1318 | 36 | 1 | 300 | 1 | 800 | 6 | 220 | 4 | 1060 | 2 | |
687447 | 1302 | 37 | 2 | 310 | 3 | 850 | 8 | 225 | 5 | 1070 | 1 | |
49408 | 1282 | 38 | 0 | 320 | 3 | 900 | 4 | 230 | 6 | 1080 | 1 | |
247450 | 1266 | 39 | 2 | 330 | 2 | 950 | 8 | 235 | 5 | 1090 | 0 | |
398128 | 1260 | 40 | 3 | 340 | 2 | 1000 | 2 | 240 | 3 | 1100 | 0 | |
577310 | 1255 | reste | 547 | 350 | 3 | 1050 | 6 | 245 | 6 | 1110 | 2 | |
676898 | 1227 | total | 793 | 360 | 2 | 201 à 370 | 1100 | 4 | 250 | 3 | 1120 | 2 |
425653 | 1184 | 370 | 2 | 84 | 1150 | 7 | 255 | 5 | 1130 | 1 | ||
915284 | 1182 | 380 | 0 | 10.6% | 1200 | 5 | 260 | 4 | 1140 | 0 | ||
390 | 1 | 1250 | 1 | 265 | 4 | 1150 | 2 | |||||
400 | 5 | 1300 | 4 | 270 | 2 | 1160 | 0 | |||||
410 | 4 | 1350 | 3 | 275 | 1 | 1170 | 2 | |||||
420 | 3 | 1400 | 4 | 280 | 2 | 1180 | 1 | |||||
adresse | intercaln | décalage | long | 430 | 2 | 1450 | 3 | 285 | 3 | 1190 | 2 | |
384083 | -50 | comp | 440 | 2 | 1500 | 4 | 290 | 3 | 1200 | 0 | ||
523034 | -41 | shift2 | 646 | 450 | 3 | 1550 | 4 | 295 | 1 | reste | 44 | |
362986 | -38 | shift2 | 850 | 460 | 2 | 1600 | 1 | 300 | 0 | total | 793 | |
864784 | -38 | shift2 | 2407 | 470 | 1 | 1650 | 2 | 305 | 3 | |||
628502 | -35 | shift2 | 571 | 480 | 2 | 1700 | 1 | 310 | 0 | |||
1068153 | -35 | comp | 490 | 3 | 1750 | 2 | 315 | 1 | ||||
1110540 | -32 | shift2 | 997 | 500 | 3 | 1800 | 2 | 320 | 2 | |||
511489 | -26 | 510 | 4 | 371 à 600 | 1850 | 1 | 325 | 2 | ||||
661241 | -26 | 520 | 3 | 52 | 1900 | 3 | 330 | 0 | ||||
710083 | -26 | 530 | 3 | 6.6% | 1950 | 0 | 335 | 1 | ||||
899806 | -26 | 540 | 0 | 2000 | 0 | 340 | 1 | |||||
1089393 | -26 | 550 | 0 | 2050 | 0 | 345 | 2 | |||||
417665 | -25 | 560 | 3 | 2100 | 2 | 350 | 1 | |||||
276966 | -23 | 570 | 3 | 2150 | 0 | 355 | 1 | |||||
480829 | -23 | 580 | 1 | 601 à max | 2200 | 1 | 360 | 1 | ||||
981350 | -23 | 590 | 1 | 120 | 114 | 365 | 1 | |||||
110015 | -22 | 600 | 3 | 15.1% | 370 | 1 | ||||||
415433 | -20 | reste | 120 | reste | 6 | reste | 172 | |||||
748256 | -20 | total | 793 | total | 793 | total | 793 |
rtb autres intercalaires[modifier | modifier le wikicode]
- Lien tableur: rtb autres intercalaires
- Légende:
- - comp, le gène est sur le brin complement
- - deb, fin sont respectivement dans le sens des adresses croissantes, le cds avant le 1er tRNA et le cds après le dernier tRNA du bloc.
|
|
|
rtb intercalaires tRNA[modifier | modifier le wikicode]
- Lien tableur: rtb intercalaires tRNA
- Légende:
- - comp', l'intercalaire est entre un gène comp (sur le complément) et un gène sur le brin direct. Continu les 2 gènes sont sur le même brin.
- - deb, fin sont les intercalaires des cds du tableau précédent, autres intercalaires: respectivement dans le sens des adresses croissantes, le cds avant le 1er tRNA et le cds après le dernier tRNA du bloc.
- Cumuls comp'+continu du tableau
deb fin total <201 9 14 23 total 28 28 56 taux 32% 50% 41%
|
|
rtb intercalaires rRNA[modifier | modifier le wikicode]
- Voir la présentation des blocs à rRNA dans le chapitre rtb blocs de l'étude préliminaire. A comparer avec le tableau rtb autres intercalaires.
- Remarque: Quand le 16s n'est pas précédé de tRNAs l'intercalaire cds-16s est élevé, pour le 2ème bloc il est pour cvi de 447 pbs. L'intercalaire cds-bloc de l'autre côté du bloc est beaucoup plus faible, cvi 280 pbs. Cette orientation est quasiment générale chez tous les génomes que j'ai étudié ici. Je l'ai notée dans les chapitres génome-bloc de chaque génome. Pour rtb il y a un seul bloc 16s23s5s mais cassé, le 23s5s est très loin du 16s.
- Note: J'ai supposé souvent que les blocs à tRNA sans rRNA sont aussi orientés de l'intercalaire le plus grand au plus petit. Dans pub cumuls et de même pour les autres génomes, j'ai noté cette orientation dans la colonne cdsd, pour cds dirigé. Je n'ai conservé pour les calculs que le plus petit intercalaire des 2 cds bordant le bloc. L'idée était que cette orientation provoquait la création du cds en fin de bloc. Ces cds sont souvent de petites protéines et souvent hypothétiques. Aussi je présente ci-dessous la transformation deb-fin qui est imposée par l'adressage en intercalaire plus grand et plus petit.
deb fin tri grand petit 381 368 4 139 17 108 1394 13 62 26 278 110 9 496 31 17 139 18 1164 32 143 167 7 1364 35 411 142 27 145 40 35 1364 12 1278 58 402 633 21 349 68 496 31 22 183 82 218 1922 26 2191 98 1530 218 2 1394 108 1278 58 3 278 110 26 62 28 475 130 176 248 6 411 142 499 222 5 167 143 452 1274 24 401 145 1535 1028 14 248 176 1164 32 19 246 181 181 246 10 1922 218 1199 1090 11 1530 218 349 68 15 499 222 82 183 1 381 368 382 2009 23 2009 382 401 145 8 633 402 951 1945 16 1274 452 2191 98 25 1945 951 40 145 17 1535 1028 475 130 20 1199 1090
Rickettsia prowazekii str. Breinl[modifier | modifier le wikicode]
rpl opérons[modifier | modifier le wikicode]
- Lien tableur: rpl opérons
- Liens: gtRNAdb [5], NCBI [6], génome [7]
- Phylogénie: Bacteria; Proteobacteria; Alphaproteobacteria; Rickettsiales; Rickettsiaceae; Rickettsieae; Rickettsia; typhus group.
- Légende: cdsa: cds aas, cdsd: cds dirigé
29%GC | 30.12.19 Paris | 33 | doubles | intercal | cds | aa | avec aa | cdsa | cdsd | protéines |
---|---|---|---|---|---|---|---|---|---|---|
comp | 31462..31892 | cds | 263 | 263 | 144 | p-preprotein translocase subunit YajC | ||||
comp | 32156..32181 | rpr | 870 | 870 | 26 | tandem | ||||
comp | 33052..33126 | ggc | 1253 | 1253 | ||||||
comp | 34380..35750 | cds | 256 | 256 | magnesium transporter | |||||
comp | 36007..36093 | ctc | 190 | 190 | ||||||
comp | 36284..37144 | cds | 287 | TIGR01459 family HAD-type hydrolase | ||||||
46825..47040 | cds | 31 | 31 | 72 | hp | |||||
47072..47146 | gca | 1964 | 1964 | |||||||
49111..49650 | cds | 180 | copper chaperone Pcu(A)C | |||||||
comp | 71150..76816 | cds | 933 | 933 | 1889 | alpha-2-macroglobulin family protein | ||||
comp | 77750..77826 | cgt | 1179 | 1179 | ||||||
79006..80241 | cds | 412 | tyrosine--tRNA ligase | |||||||
121704..121946 | cds | 984 | 984 | 81 | HU family DNA-binding protein | |||||
comp | 122931..123007 | gtc | 446 | 446 | ||||||
123454..124113 | cds | 220 | (d)CMP kinase | |||||||
126222..126827 | cds | 236 | 236 | 202 | ATP-dependent Clp endopeptidase proteolytic subunit ClpP | |||||
127064..127139 | gcc | @1 | 830 | 830 | ||||||
comp | 127970..128046 | gac | 365 | 365 | ||||||
128412..128843 | cds | 144 | ribosome-associated translation inhibitor RaiA | |||||||
171237..173012 | cds | 50 | 50 | 592 | aminopeptidase P family protein | |||||
173063..173137 | caa | 49 | 49 | |||||||
comp | 173187..173263 | cgg | 18 | 18 | ||||||
comp | 173282..174265 | cds | 328 | polyprenyl synthetase family protein | ||||||
186344..187336 | cds | 58 | 58 | 331 | tryptophan--tRNA ligase | |||||
187395..187484 | tca | 354 | 354 | |||||||
comp | 187839..188738 | cds | 300 | hydroxymethylbilane synthase | ||||||
203097..203846 | cds | 219 | 219 | 250 | bifunctional N-acetylglucosamine-1-phosphate uridyltransferase/glucosamine-1-phosphate acetyltransferase | |||||
204066..204153 | tcc | 1457 | 1457 | |||||||
205611..206639 | cds | 343 | type 2 isopentenyl-diphosphate Delta-isomerase | |||||||
comp | 299321..300853 | cds | 419 | 419 | 511 | hp | ||||
comp | 301273..301349 | atc | 15 | 15 | ||||||
comp | 301365..301440 | aaa | 219 | 219 | ||||||
301660..302400 | cds | 247 | 3-deoxy-manno-octulosonate cytidylyltransferase | |||||||
comp | 328700..329635 | cds | 22 | 22 | 312 | site-specific tyrosine recombinase XerD | ||||
comp | 329658..329732 | tgc | 499 | 499 | ||||||
330232..330699 | cds | 156 | DUF2155 domain-containing protein | |||||||
429121..429807 | cds | 723 | 723 | 229 | hp | |||||
comp | 430531..430605 | aac | 359 | 359 | ||||||
comp | 430965..432767 | cds | 601 | elongation factor 4 | ||||||
473867..474352 | cds | 928 | 928 | 162 | RNA pyrophosphohydrolase | |||||
comp | 475281..475357 | atgj | 40 | 40 | ||||||
comp | 475398..475883 | cds | 162 | 30S ribosomal protein S9 | ||||||
506934..508007 | cds | 183 | 183 | 358 | cell division protein ZapE | |||||
comp | 508191..508305 | 5s | 240 | 115 | ||||||
comp | 508546..511330 | 23s | 716 | 716 | 2785 | |||||
comp | 512047..512958 | cds | 304 | methionyl-tRNA formyltransferase | ||||||
577419..579725 | cds | 138 | 138 | 769 | outer membrane protein assembly factor BamA | |||||
579864..579939 | acg | 1026 | 1179 | |||||||
comp | 580966..581169 | cds | 68 | DUF2674 domain-containing protein | ||||||
comp | 612439..612639 | cds | 143 | 143 | 67 | preprotein translocase subunit SecE | ||||
comp | 612783..612858 | tgg | 143 | 143 | ||||||
comp | 613002..615101 | cds | 700 | elongation factor G | ||||||
comp | 656226..656870 | cds | 296 | 296 | 215 | YihA family ribosome biogenesis GTP-binding protein | ||||
comp | 657167..657243 | atgf | 119 | 119 | ||||||
comp | 657363..657599 | cds | 79 | 50S ribosomal protein L31 | ||||||
comp | 678911..679213 | cds | 19 | 19 | 101 | preprotein translocase subunit SecG | ||||
comp | 679233..679307 | acc | 159 | 159 | ||||||
comp | 679467..680723 | cds | 419 | MFS transporter | ||||||
comp | 746326..746529 | cds | 1664 | 1664 | 68 | hp | ||||
comp | 748194..748268 | gaa | 109 | 109 | ||||||
comp | 748378..749421 | cds | 348 | autotransporter outer membrane beta-barrel domain-containing protein | ||||||
comp | 756703..757686 | cds | 363 | 363 | 328 | tRNA dihydrouridine synthase DusB | ||||
758050..758125 | ttc | 564 | 564 | |||||||
758690..759730 | cds | 347 | UDP-3-O-(3-hydroxymyristoyl)glucosamine N-acyltransferase | |||||||
776202..776537 | cds | 154 | 154 | 112 | 30S ribosomal protein S16 | |||||
776692..776766 | aca | 467 | 467 | |||||||
777234..777863 | cds | 210 | lipoyl(octanoyl) transferase LipB | |||||||
779197..780348 | cds | 140 | 140 | 384 | succinyl-diaminopimelate desuccinylase | |||||
780489..780573 | cta | 37 | 37 | |||||||
780611..781075 | cds | 155 | DNA polymerase III subunit chi | |||||||
comp | 823242..823559 | cds | 98 | 98 | 106 | DUF167 domain-containing protein | ||||
823658..823734 | aga | 1364 | 1364 | |||||||
comp | 825099..825230 | cds | 44 | hp | ||||||
comp | 854241..854456 | cds | 17 | 17 | 72 | translation initiation factor IF-1 | ||||
comp | 854474..854550 | cca | 1573 | 1573 | ||||||
comp | 856124..856357 | cds | 78 | BolA family transcriptional regulator | ||||||
915034..915501 | cds | 391 | 391 | 156 | peptidoglycan-associated lipoprotein Pal | |||||
915893..915969 | atgi | 41 | 41 | |||||||
916011..917099 | cds | 363 | YjgP/YjgQ family permease | |||||||
953564..954742 | cds | 696 | 696 | 393 | acetyl-CoA C-acetyltransferase | |||||
comp | 955439..955530 | agc | 898 | 898 | ||||||
comp | 956429..957373 | cds | 315 | ACP S-malonyltransferase | ||||||
comp | 1009435..1011165 | cds | 142 | 142 | 577 | ATP-binding cassette domain-containing protein | ||||
comp | 1011308..1011384 | cac | 346 | 346 | ||||||
1011731..1012414 | cds | 228 | 7-cyano-7-deazaguanine synthase QueC | |||||||
comp | 1045414..1045656 | cds | 2381 | 2381 | 81 | hp | ||||
comp | 1048038..1048123 | tta | 135 | 135 | ||||||
comp | 1048259..1048387 | cds | 43 | hp | ||||||
comp | 1056245..1056973 | cds | 188 | 188 | 243 | 23s rRNA (guanosine(2251)-2'-O)-methyltransferase RlmB | ||||
1057162..1057247 | tac | 105 | 105 | |||||||
1057353..1057426 | gga | 82 | 82 | |||||||
1057509..1058693 | cds | 395 | elongation factor Tu | |||||||
1072391..1072663 | cds | 62 | 62 | 91 | 30S ribosomal protein S20 | |||||
1072726..1072801 | gta | 1181 | 1181 | |||||||
comp | 1073983..1074648 | cds | 222 | hp | ||||||
1102136..1103935 | cds | 1458 | 1462 | 600 | PAS domain-containing sensor histidine kinase | |||||
1105394..1106893 | 16s | 1462 | 1462 | 1500 | ||||||
1108356..1109301,1..184 | cds | 377 | P-hp |
rpl cumuls[modifier | modifier le wikicode]
- Lien tableur: rpl cumuls
- Légende
- Notes: moyenne et variance des intercalaires élevés des 21 cds : 1204 et 453
opérons | Fréquences intercalaires tRNAs | Fréquences intercalaires cds | Fréquences aas cds chromosome | ||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
effectif | gammes | sans rRNAs | avec rRNAs | gammes | cds | gammes | cdsd | gammes | cdsa | gammes | cdsa 300 | ||
avec rRNA | opérons | 2 | 1 | - | 1 | 0 | 1 | 100 | 12 | 30 | 0 | ||
23s5s | 1 | 20 | 1 | 50 | 9 | 40 | 200 | 11 | 60 | 2 | |||
16s | 1 | 40 | 100 | 4 | 80 | 300 | 12 | 90 | 9 | ||||
16s23s | 0 | 60 | 1 | 150 | 8 | 120 | 400 | 15 | 120 | 4 | |||
max a | 0 | 80 | 200 | 5 | 160 | 500 | 2 | 150 | 2 | ||||
a doubles | 0 | 100 | 250 | 3 | 200 | 600 | 4 | 180 | 6 | ||||
spéciaux | 0 | 120 | 1 | 300 | 3 | 240 | 700 | 2 | 210 | 2 | |||
total aas | 0 | 140 | 350 | 1 | 280 | 800 | 1 | 240 | 5 | ||||
sans | opérons | 29 | 160 | 400 | 5 | 320 | 900 | 0 | 270 | 3 | |||
1 aa | 25 | 180 | 450 | 2 | 360 | 1000 | 0 | 300 | 2 | ||||
max a | 2 | 200 | 500 | 2 | 400 | 1100 | 0 | 330 | 5 | ||||
a doubles | 0 | 1 | 21 | 1 | 20 | ||||||||
total aas | 33 | 4 | 0 | 63 | 0 | 60 | 60 | ||||||
total aas | 33 | ||||||||||||
remarques | 1 | ||||||||||||
avec jaune | moyenne | 528 | 293 | ||||||||||
variance | 558 | 271 | |||||||||||
sans jaune | moyenne | 56 | 191 | 243 | 172 | ||||||||
variance | 45 | 140 | 145 | 89 |
rpl blocs[modifier | modifier le wikicode]
- Lien tableur: rpl blocs
cds | 183 | 358 | cell division protein ZapE |
5s | 240 | 115 | |
23s | 716 | 2785 | |
cds | 304 | methionyl-tRNA formyltransferase | |
cds | 1458 | 600 | PAS domain-containing sensor histidine kinase |
16s | 1462 | 1500 | |
cds | 377 | P-hp |
rpl remarques[modifier | modifier le wikicode]
- Remarques: Les rickettsia, rtb et rpl, présentent de nombreux intercalaires très élevés. D’où cet intercalaire entre 2 aas de 830 pbs. La phylogénie très forte entre ces 2 génomes donne des blocs analogues mais avec des intercalaires différents. Ici les intercalaires élevés sont atténués. Je détaille ici les intercalaires du tableau des cumuls.
- - Les intercalaires entre aas: Il y a quatre intercalaires de ce type, 830 105 49 15. A part le 1er les 3 autres sont courants dans cette étude et seulement le dernier est le représentant de la moyenne dans cette étude.
- - Les intercalaires avec un cds. Les 31 blocs de ce génomes se répartissent en 3 groupes
- Les RNAs complètement isolés, les 2 intercalaires du bloc sont supérieurs à 400 pbs. Il y a 7 aas dont celui avec 830, et le 16s. Ici aac, gac et ttc ont l’intercalaire mineur à peine inférieur à 400. Sur ces 16 intercalaires 9 sont supérieurs à 800 et 7 entre 360 et 700 pbs.
- Les tRNAs proches de leurs 2 cds. Il y a 6 aas dont les 2 intercalaires sont inférieurs à 300 pbs et 3 aas dont au moins un des 2 intercalaires est entre 300 et 400 pbs.
- Il reste 14 blocs dont le 23s5s, auxquels il faut ajouter l’aa gcc voisin du gac isolé par 830. Ces blocs sont très polarisés, leurs 2 intercalaires sont très dissymétriques.
- 10 aas ont leur intercalaire majeur supérieur à 800 et va jusqu’à 2381 pbs. Le 23s5s a un intercalaire majeur modéré, 723, assez courant pour les blocs à rRNAs.
- 3 aas ont leur intercalaire majeur de 450 pbs environ.
- Les blocs isolés et les blocs entourés par 2 cds
Blocs à RNAs isolés par 2 intercalaires de plus de 400 pbs. bloc adresse intercalaire Blocs entourés par 2 intercalaires de 300 à 400 pbs aac 430531 723-359 cac 1011308 gac 127064 830-365 atgi 915893 gtc 122931 tca 187395 cgt 77750 ggc 33052 Blocs entourés par 2 intercalaires inférieurs à 300 pbs 16s 1105394 atgf 657167 agc 955439 acc 679233 ttc 758050 564-363 tgg 612783 : : cgg-caa 173063 : : gga-tac 1057162 : : cta 780489
- Les séquences des doubles: Il n'y a aucun double dans ce génome
rpl distribution[modifier | modifier le wikicode]
- Lien tableur: rpl distribution
g1 | t1 | ||||||
---|---|---|---|---|---|---|---|
atgi | 1 | tct | tat | atgf | 1 | ||
att | act | aat | agt | ||||
ctt | cct | cat | cgc | ||||
gtt | gct | gat | ggt | ||||
ttc | 1 | tcc | 1 | tac | 1 | tgc | 1 |
atc | 1 | acc | 1 | aac | 1 | agc | 1 |
ctc | 1 | ccc | cac | 1 | cgt | 1 | |
gtc | 1 | gcc | 1 | gac | 1 | ggc | 1 |
tta | 1 | tca | 1 | taa | tga | ||
ata | aca | 1 | aaa | 1 | aga | 1 | |
cta | 1 | cca | 1 | caa | 1 | cga | |
gta | 1 | gca | 1 | gaa | 1 | gga | 1 |
ttg | tcg | tag | tgg | 1 | |||
atgj | 1 | acg | 1 | aag | agg | ||
ctg | ccg | cag | cgg | 1 | |||
gtg | gcg | gag | ggg | ||||
alpha | >1aa | =1aa | -5s | +5s | -16s | +16s | total |
rpl | 8 | 25 | 33 |
Rhodospirillum photometricum DSM 122[modifier | modifier le wikicode]
rpm opérons[modifier | modifier le wikicode]
- Lien tableur: rpm opérons
- Liens: gtRNAdb [8], NCBI [9], génome [10]
- Phylogénie: Bacteria; Proteobacteria; Alphaproteobacteria; Rhodospirillales; Rhodospirillaceae; Pararhodospirillum.
- Légende: cdsa: cds aas, cdsd: cds dirigé
64.7%GC | 26.12.19 Paris | 95 | doubles | intercal | cds | aa | avec aa | cdsa | cdsd | protéines |
---|---|---|---|---|---|---|---|---|---|---|
comp | 3322..4194 | cds | 30 | 30 | 291 | LysM peptidoglycan-binding domain-containing protein | ||||
comp | 4225..4821 | 23s° | @1 | 196 | 595 | |||||
comp | 5018..5093 | gca | 182 | |||||||
comp | 5276..5684 | 16s° | 38 | 38 | 407 | |||||
5723..6664 | cds | 314 | SEL1-like repeat protein | |||||||
comp < | 12458..13198 | cds | 242 | 242 | 247 | p-transposase | ||||
comp | 13441..13555 | 5s | @2 | 72 | 113 | |||||
comp | 13628..13880 | 23s° | -7 | -7 | 251 | |||||
comp | 13874..15127 | cds | 418 | hp | ||||||
21325..22362 | cds | 586 | 586 | 346 | hp | |||||
22949..23237 | 16s° | 85 | 85 | 287 | ||||||
comp | 23323..23490 | cds | 56 | hp | ||||||
comp | 24015..24287 | cds | 250 | 250 | 91 | TraYdomain-containingprotein | ||||
comp | 24538..24652 | 5s | 71 | 113 | ||||||
comp | 24724..27490 | 23s | 212 | 2765 | ||||||
comp | 27703..27779 | atc | 112 | |||||||
comp | 27892..28378 | 16s° | 18 | 18 | 485 | |||||
<> | 28397..29119 | cds | 241 | p-EscV/YscV/HrcVfamilytypeIIIsecretionsystemexportapparatusprotein | ||||||
comp | 32782..33759 | cds | 190 | 190 | 326 | glycosyltransferase | ||||
33950..34357 | 16s° | 112 | 406 | |||||||
34470..34546 | atc | 216 | ||||||||
34763..35591 | 23s° | 44 | 827 | |||||||
comp | 35636..35750 | 5s | 72 | 113 | ||||||
comp | 35823..38589 | 23s | 215 | 2765 | ||||||
comp | 38805..38881 | atc | 112 | |||||||
comp | 38994..40502 | 16s | 260 | 1507 | ||||||
comp | 40763..42629 | 23s° | -15 | 1865 | ||||||
42615..42903 | 16s° | 112 | 287 | |||||||
43016..43092 | atc | 213 | ||||||||
43306..44132 | 23s° | -1 | 825 | |||||||
comp | 44132..44835 | 23s° | -5 | -5 | 702 | |||||
44831..45121 | cds | 97 | hp | |||||||
< | 45496..45768 | cds | 553 | 553 | 91 | p-glycosyl transferase family 1 | ||||
46322..47040 | 16s° | 0 | 0 | 717 | ||||||
comp | 47041..47433 | cds | 131 | winged helix-turn-helix domain-containing protein | ||||||
comp | 49761..51017 | cds | 128 | 128 | 419 | glycosyltransferase | ||||
comp | 51146..51221 | 23s° | 214 | 74 | ||||||
comp | 51436..51512 | atc | 112 | |||||||
comp | 51625..52017 | 16s° | -7 | 391 | ||||||
52011..52881 | 23s° | 106 | 106 | 869 | ||||||
52988..53464 | cds | -37 | -37 | 159 | hp | |||||
> | 53428..53694 | cds | 86 | 86 | 89 | p-glycosyltransferase | ||||
comp | 53781..54709 | 23s° | 26 | 927 | ||||||
54736..54898 | 16s° | 112 | 161 | |||||||
55011..55087 | atc | 216 | ||||||||
55304..55741 | 23s° | 438 | 438 | 436 | ||||||
56180..56440 | cds | 87 | hp | |||||||
comp | 82891..83088 | cds | 116 | 116 | 66 | preprotein translocase subunit SecE | ||||
comp | 83205..83280 | tgg | 199 | 199 | ||||||
>comp | 83480..84178 | cds | 233 | p-elongation factor Tu | ||||||
417242..417412 | cds | 142 | 142 | 57 | tRNA (5-methylaminomethyl-2-thiouridylate)-methyltransferase | |||||
417555..417631 | atgj | + | 24 | 24 | ||||||
417656..417732 | atgj | 2 atgj | 38 | 38 | ||||||
comp | 417771..418796 | cds | 342 | tRNA epoxyqueuosine(34) reductase QueG | ||||||
434306..435142 | cds | 512 | 512 | 279 | CDP-diacylglycerol--serine O-phosphatidyltransferase | |||||
435655..435842 | 16s° | -6 | 186 | |||||||
435837..436075 | 23s° | 72 | 237 | |||||||
436148..436262 | 5s | 51 | 113 | |||||||
436314..436390 | atgf | 196 | 196 | |||||||
436587..436883 | cds | 99 | hp | |||||||
comp | 467261..468370 | cds | 167 | 167 | 370 | 3-isopropylmalate dehydrogenase | ||||
468538..468667 | 23s° | 72 | 128 | |||||||
468740..468854 | 5s | 51 | 113 | |||||||
468906..468982 | atgf | 125 | 125 | |||||||
469108..469863 | cds | 252 | SAM-dependent chlorinase/fluorinase | |||||||
comp | 534521..536161 | cds | 367 | 367 | 547 | glucose-6-phosphate isomerase | ||||
536529..536603 | acg | 92 | 92 | |||||||
comp | 536696..537778 | cds | 361 | tyrosine-type recombinase/integrase | ||||||
comp | 658467..658931 | cds | 110 | 110 | 155 | GNAT family N-acetyltransferase | ||||
comp | 659042..659116 | gtc | 155 | 155 | ||||||
659272..660159 | cds | 106 | 106 | 296 | N-formylglutamate amidohydrolase | |||||
660266..660340 | gtc | 648 | 648 | |||||||
comp | 660989..661800 | cds | 271 | p-N-formylglutamate amidohydrolase | ||||||
comp | 684188..685141 | cds | 323 | 323 | 318 | cation transporter | ||||
comp | 685465..685539 | gtg | + | 25 | 25 | |||||
comp | 685565..685639 | gtg | 2 gtg | 195 | 195 | |||||
685835..686251 | cds | 139 | NUDIX hydrolase | |||||||
comp | 691078..691773 | cds | 4 | 4 | 232 | ComF family protein | ||||
691778..691897 | 23s° | 72 | 118 | |||||||
691970..692084 | 5s | 114 | 114 | 113 | ||||||
comp | 692199..694505 | cds | 769 | VWA domain-containing protein | ||||||
750262..751398 | cds | 161 | 161 | 379 | [FeFe] hydrogenase H-cluster radical SAM maturase HydE | |||||
comp | 751560..751674 | 5s | 72 | 113 | ||||||
comp | 751747..752005 | 23s° | 597 | 597 | 257 | |||||
752603..752814 | rpr | @4 | 388 | 388 | 21 | CRISPR | ||||
753203..753760 | cds | 186 | hp | |||||||
comp | 839981..840214 | cds | 4 | 4 | 78 | hp | ||||
comp | 840219..840478 | 16s° | 568 | 568 | 258 | |||||
comp | 841047..844388 | cds | 1114 | response regulator | ||||||
874585..875391 | cds | 88 | 88 | 269 | phosphoadenylyl-sulfate reductase | |||||
875480..875556 | cac | 81 | 81 | |||||||
875638..876117 | cds | 160 | CreA family protein | |||||||
885688..886299 | cds | 176 | 176 | 204 | LysE family translocator | |||||
886476..886552 | ccc | 144 | 144 | |||||||
comp | 886697..887233 | cds | 179 | helix-turn-helix transcriptional regulator | ||||||
932708..934243 | cds | 93 | 93 | 512 | Fic family protein | |||||
comp | 934337..934413 | cgt | + | 35 | 35 | |||||
comp | 934449..934525 | cgt | 3 cgt | 44 | 44 | |||||
comp | 934570..934646 | cgt | 449 | 449 | ||||||
935096..936175 | cds | 360 | hp | |||||||
comp | 978995..979396 | cds | 138 | 138 | 134 | MFS transporter | ||||
comp | 979535..979609 | ggc | + | 23 | 23 | |||||
comp | 979633..979707 | ggc | 4 ggc | 45 | 45 | |||||
comp | 979753..979827 | ggc | 29 | 29 | ||||||
comp | 979857..979931 | ggc | 206 | 206 | ||||||
980138..981679 | cds | 514 | murein biosynthesis integral membrane protein MurJ | |||||||
997575..997898 | cds | 95 | 95 | 108 | DUF1476 domain-containing protein | |||||
comp | 997994..998067 | cag | + | 54 | 54 | |||||
comp | 998122..998195 | cag | 2 cag | 168 | 168 | |||||
998364..999509 | cds | 382 | Ppx/GppA family phosphatase | |||||||
1050081..1051028 | cds | 60 | 60 | 316 | NnrS family protein | |||||
comp | 1051089..1051163 | acc | + | 16 | 16 | |||||
comp | 1051180..1051254 | acc | 3 acc | 18 | 18 | |||||
comp | 1051273..1051347 | acc | 170 | 170 | ||||||
comp | 1051518..1053305 | cds | 596 | EAL domain-containing protein | ||||||
1197836..1199341 | cds | 197 | 197 | 502 | aldehyde dehydrogenase | |||||
1199539..1199623 | cta | 126 | 126 | |||||||
1199750..1201090 | cds | 447 | trigger factor | |||||||
1206196..1206501 | cds | 93 | 93 | 102 | HU family DNA-binding protein | |||||
1206595..1206670 | gta | 50 | 50 | |||||||
1206721..1207092 | cds | 124 | hp | |||||||
1213113..1214459 | cds | 210 | 210 | 449 | acetyl-CoA carboxylase biotin carboxylase subunit | |||||
comp | 1214670..1214874 | 16s° | 600 | 600 | 203 | |||||
comp | 1215475..1216716 | cds | 414 | polyphosphate kinase | ||||||
comp | 1349719..1350132 | cds | 109 | 109 | 138 | NAD(P) transhydrogenase subunit alpha | ||||
comp | 1350242..1350608 | 23s° | 212 | 365 | ||||||
comp | 1350821..1350897 | atc | 115 | |||||||
comp | 1351013..1351438 | 16s° | 23 | 23 | 424 | |||||
< comp | 1351462..1352160 | cds | 233 | p-tetratricopeptide repeat protein | ||||||
1359745..1360302 | cds | 176 | 176 | 186 | hp | |||||
1360479..1360555 | gac | + | 37 | 37 | ||||||
1360593..1360669 | gac | 2 gac | 274 | 274 | ||||||
1360944..1361204 | cds | 87 | hp | |||||||
1416615..1417769 | cds | 214 | 214 | 385 | glycosyltransferase family 61 protein | |||||
1417984..1418074 | tcc | 154 | 154 | |||||||
comp | 1418229..1419095 | cds | 289 | LysR family transcriptional regulator | ||||||
comp | 1472421..1473403 | cds | 250 | 250 | 328 | biotin synthase BioB | ||||
comp | 1473654..1473740 | ttg | 77 | 77 | ||||||
comp | 1473818..1474678 | cds | 287 | homocysteine S-methyltransferase family protein | ||||||
comp | 1735298..1736380 | cds | 209 | 209 | 361 | DUF262 domain-containing protein | ||||
1736590..1736859 | 23s° | 72 | 268 | |||||||
1736932..1737046 | 5s | 52 | 113 | |||||||
1737099..1737175 | atgf | 93 | 93 | |||||||
comp | 1737269..1737694 | cds | 142 | type II toxin-antitoxin system VapC family toxin | ||||||
comp | 1812365..1813924 | cds | 894 | 894 | 520 | peptidoglycan DD-metalloendopeptidase family protein | ||||
1814819..1815040 | 16s° | -7 | -7 | 222 | ||||||
<comp | 1815034..1815837 | cds | 80 | 80 | 268 | p-elongation factor Tu | ||||
comp | 1815918..1815991 | gga | 34 | 34 | ||||||
comp | 1816026..1816111 | tac | 144 | 144 | ||||||
1816256..1817143 | cds | 296 | 23S rRNA (guanosine(2251)-2'-O)-methyltransferase RlmB | |||||||
comp | 1833109..1833603 | cds | 83 | 83 | 165 | MBL fold metallo-hydrolase | ||||
comp | 1833687..1833762 | aag | + | 24 | 24 | |||||
comp | 1833787..1833862 | aag | 2 aag | 198 | 198 | |||||
comp | 1834061..1835224 | cds | 388 | rod shape-determining protein RodA | ||||||
> | 1941413..1943059 | cds | -30 | -30 | 549 | p-recombinase family protein | ||||
comp | 1943030..1943121 | agc | 160 | 160 | ||||||
comp | 1943282..1944133 | cds | 284 | FAD-dependent thymidylate synthase | ||||||
comp | 2087696..2090938 | cds | 705 | 705 | 1081 | PAS domain-containing protein | ||||
2091644..2091826 | 16s° | 7 | 7 | 181 | ||||||
2091834..2092247 | cds | 138 | hp | |||||||
comp | 2095044..2095490 | cds | 48 | 48 | 149 | hp | ||||
comp | 2095539..2095733 | 16s° | 614 | 614 | 193 | |||||
comp | 2096348..2097337 | cds | 330 | trypsin-like serine protease | ||||||
comp | 2113248..2114603 | cds | 219 | 219 | 452 | hp | ||||
comp | 2114823..2114899 | aga | 55 | 55 | ||||||
comp | 2114955..2115251 | cds | 71 | 71 | 99 | ETC complex I subunit | ||||
comp | 2115323..2115399 | cca | 261 | 261 | ||||||
comp | 2115661..2115960 | cds | 100 | hp | ||||||
comp | 2144042..2146288 | cds | 308 | 308 | 749 | HAMP domain-containing protein | ||||
2146597..2147256 | 23s° | 72 | 658 | |||||||
2147329..2147443 | 5s | 52 | 113 | |||||||
2147496..2147572 | atgf | 645 | 645 | |||||||
comp | 2148218..2148664 | cds | 149 | hp | ||||||
2268003..2268461 | cds | 87 | 87 | 153 | 23S rRNA (pseudouridine(1915)-N(3))-methyltransferase RlmH | |||||
comp | 2268549..2268625 | ccg | + | 165 | 165 | |||||
comp | 2268791..2268867 | ccg | 2 ccg | 56 | 56 | |||||
comp | 2268924..2269910 | cds | 329 | farnesyltranstransferase | ||||||
comp | 2321621..2322145 | cds | 332 | 332 | 175 | hp | ||||
2322478..2322554 | ccc | 225 | 225 | |||||||
2322780..2322974 | cds | 65 | hp | |||||||
comp | 2393295..2396009 | cds | @3 | 1003 | 1003 | 905 | CRISPR-associated helicase/endonuclease Cas3 | |||
2397013..2397919 | 16s° | 2 | 2 | 905 | ||||||
2397922..2400888 | cds | 989 | hp | |||||||
comp | 2517845..2520559 | cds | 229 | 229 | 905 | phosphoenolpyruvate carboxylase | ||||
comp | 2520789..2520903 | 5s | 72 | 113 | ||||||
comp | 2520976..2521339 | 23s° | 189 | 189 | 362 | |||||
comp | 2521529..2522152 | cds | 208 | 3-isopropylmalate dehydratase small subunit | ||||||
comp | 2596508..2596738 | cds | 989 | 989 | 77 | motility twitching protein PilT | ||||
comp | 2597728..2597815 | tca | 194 | 194 | ||||||
2598010..2599204 | cds | 398 | hp | |||||||
comp | 2621435..2622058 | cds | 106 | 106 | 208 | helix-turn-helix transcriptional regulator | ||||
comp | 2622165..2622251 | ctc | 202 | 202 | ||||||
2622454..2623107 | cds | 218 | lipoyl(octanoyl) transferase LipB | |||||||
2631201..2631554 | cds | 192 | 192 | 118 | hp | |||||
2631747..2631822 | gcc | + | 70 | 70 | ||||||
2631893..2631968 | gcc | 4 gcc | 69 | 69 | ||||||
2632038..2632113 | gcc | 57 | 57 | |||||||
2632171..2632246 | gcc | 166 | 166 | |||||||
< | 2632413..2632965 | cds | -41 | -41 | 184 | p-IS256 family transposase | ||||
2632925..2633473 | cds | 30 | 30 | 183 | hp | |||||
comp | 2633504..2633579 | aca | 93 | 93 | ||||||
comp | 2633673..2634200 | cds | 271 | 271 | 176 | N-acetyltransferase | ||||
comp | 2634472..2634561 | tcg | 155 | 155 | ||||||
2634717..2635742 | cds | 342 | hp | |||||||
comp | 2655872..2656489 | cds | 182 | 182 | 206 | YitT family protein | ||||
comp | 2656672..2656747 | gag | 141 | 141 | ||||||
comp | 2656889..2657674 | cds | 262 | MetQ/NlpA family ABC transporter substrate-binding protein | ||||||
2758160..2758312 | cds | 110 | 110 | 51 | light-harvesting protein | |||||
comp | 2758423..2758509 | tta | 94 | 94 | ||||||
comp | 2758604..2759899 | cds | 432 | bifunctional folylpolyglutamate synthase/dihydrofolate synthase | ||||||
> | 2768823..2769518 | cds | -12 | -12 | 232 | methyltransferase | ||||
2769507..2769776 | 23s° | 71 | 268 | |||||||
2769848..2769962 | 5s | 118 | 118 | 113 | ||||||
comp | 2770081..2771016 | cds | 312 | tetratricopeptide repeat protein | ||||||
2792922..2794778 | cds | 129 | 129 | 619 | glutathione-regulated potassium-efflux system protein KefB | |||||
2794908..2794982 | caa | 92 | 92 | |||||||
comp | 2795075..2795686 | cds | 204 | hp | ||||||
2862755..2862982 | cds | 123 | 123 | 76 | hp | |||||
2863106..2863182 | cca | 117 | 117 | |||||||
2863300..2863374 | atgi | 373 | 373 | |||||||
2863748..2863823 | gca | 157 | 157 | |||||||
2863981..2864056 | aca | 15 | ||||||||
2864072..2864317 | cds | 8 | 82 | DUF2829 domain-containing protein | ||||||
2864326..2864401 | aaa | 250 | 250 | |||||||
> | 2864652..2865041 | cds | 130 | p-hp | ||||||
2867066..2868112 | cds | 76 | 76 | 349 | tyrosine-type recombinase/integrase | |||||
comp | 2868189..2868264 | aaa | 99 | 99 | ||||||
comp | 2868364..2868870 | cds | 169 | peptidylprolyl isomerase | ||||||
2893891..2894430 | cds | 25 | 25 | 180 | phage portal protein | |||||
2894456..2894570 | 5s | 51 | 113 | |||||||
2894622..2894698 | atgf | 285 | 285 | |||||||
2894984..2895400 | cds | 139 | p-hp | |||||||
comp | 3034652..3035092 | cds | 250 | 250 | 147 | hp | ||||
comp | 3035343..3035418 | aaa | 8 | 8 | ||||||
comp | 3035427..3035986 | cds | 187 | DUF2829 domain-containing protein | ||||||
comp | 3305068..3306534 | cds | 379 | 379 | 489 | S8 family serine peptidase | ||||
comp | 3306914..3306989 | ttc | + | 29 | 29 | |||||
comp | 3307019..3307094 | ttc | 4 ttc | 34 | 34 | |||||
comp | 3307129..3307204 | ttc | 33 | 33 | ||||||
comp | 3307238..3307313 | ttc | 60 | 60 | ||||||
comp | 3307374..3308864 | cds | 497 | RimK family protein | ||||||
comp | 3332977..3334356 | cds | 54 | 54 | 460 | type II secretion system protein | ||||
3334411..3334487 | cgg | 176 | 176 | |||||||
< comp | 3334664..3335983 | cds | 440 | p-hp | ||||||
3408217..3409026 | cds | 91 | 91 | 270 | hp | |||||
comp | 3409118..3409232 | 5s | 71 | 113 | ||||||
comp | 3409304..3409410 | 23s° | 1 | 1 | 105 | |||||
< | 3409412..3409711 | cds | 100 | p-IS5/IS1182 family transposase | ||||||
comp | 3456276..3461666 | cds | 387 | 387 | 1797 | alpha-2-macroglobulin family protein | ||||
3462054..3462130 | agg | 29 | 29 | |||||||
3462160..3462951 | cds | 264 | amino acid ABC transporter substrate-binding protein | |||||||
comp | 3500025..3500675 | cds | 210 | 210 | 217 | protein-L-isoaspartate O-methyltransferase | ||||
3500886..3500959 | tgc | + | 27 | 27 | ||||||
3500987..3501061 | aac | 2 aac | 31 | 31 | ||||||
3501093..3501167 | aac | 84 | 84 | |||||||
comp | 3501252..3501659 | cds | 136 | hp | ||||||
3639978..3641276 | cds | 172 | 172 | 433 | outer membrane efflux protein | |||||
3641449..3641525 | gcg | + | 70 | 70 | ||||||
3641596..3641671 | gcg | 3 gcg | 33 | 33 | ||||||
3641705..3641780 | gcg | 389 | 389 | |||||||
3642170..3644392 | cds | 741 | sigma-54-dependent Fis family transcriptional regulator | |||||||
3651524..3652711 | cds | 55 | 55 | 396 | aminotransferase | |||||
3652767..3652843 | cac | 202 | 202 | |||||||
<comp | 3653046..3653543 | cds | 166 | arsenical-resistance protein | ||||||
3710072..3710840 | cds | 126 | 126 | 256 | TonB family protein | |||||
comp | 3710967..3711042 | gaa | + | 214 | 214 | |||||
comp | 3711257..3711332 | gaa | 2 gaa | 125 | 125 | |||||
comp | 3711458..3711664 | cds | 69 | cold-shock protein | ||||||
comp | 3727874..3729085 | cds | 828 | 828 | 404 | hp | ||||
3729914..3730068 | 16s° | 87 | 87 | 153 | ||||||
3730156..3730545 | cds | 130 | hp | |||||||
comp | 3804728..3805231 | cds | 118 | 118 | 168 | response regulator | ||||
comp | 3805350..3805425 | gag | 241 | 241 | ||||||
comp | 3805667..3806140 | cds | 158 | transcription elongation factor GreA | ||||||
3813820..3815895 | cds | 138 | 138 | 692 | RNA polymerase sigma factor RpoD | |||||
3816034..3816109 | atgi | 94 | 94 | |||||||
3816204..3818993 | cds | 930 | diguanylate cyclase | |||||||
comp | 3827982..3828878 | cds | 90 | 90 | 299 | phosphoserine phosphatase SerB | ||||
comp | 3828969..3829042 | ggg | @5 | 292 | 292 | |||||
3829335..3830670 | cds | 445 | chemotaxis protein | |||||||
comp | 3832305..3833264 | cds | 311 | 311 | 320 | complex I NDUFA9 subunit family protein | ||||
3833576..3833662 | ctg | + | 47 | 47 | ||||||
3833710..3833796 | ctg | 5 ctg | 153 | 153 | ||||||
3833950..3834036 | ctg | 48 | 48 | |||||||
3834085..3834171 | ctg | 47 | 47 | |||||||
3834219..3834305 | ctg | 113 | 113 | |||||||
3834419..3835039 | cds | 207 | ribonuclease D |
rpm cumuls[modifier | modifier le wikicode]
- Lien tableur: rpm cumuls
opérons | Fréquences intercalaires tRNAs | Fréquences intercalaires cds | Fréquences aas cds chromosome | ||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
effectif | gammes | sans rRNAs | avec rRNAs | gammes | cds | gammes | cdsd | gammes | cdsa | gammes | cdsa 300 | ||
avec rRNA | opérons | 27 | 1 | 0 | 1 | 9 | 1 | 100 | 20 | 1 | 0 | ||
16s°atc23s° | 7 | 20 | 2 | 50 | 15 | 40 | 200 | 35 | 30 | 0 | |||
16s°gca23s° | 1 | 40 | 14 | 100 | 30 | 80 | 300 | 30 | 60 | 3 | |||
16s°23s° | 1 | 60 | 7 | 150 | 24 | 120 | 400 | 23 | 90 | 10 | |||
max a | 1 | 80 | 3 | 200 | 23 | 160 | 500 | 14 | 120 | 10 | |||
a doubles | 0 | 100 | 0 | 250 | 16 | 200 | 600 | 7 | 150 | 14 | |||
spéciaux | 18 | 120 | 1 | 300 | 5 | 240 | 700 | 2 | 180 | 13 | |||
total aas | 13 | 140 | 0 | 350 | 4 | 280 | 800 | 3 | 210 | 11 | |||
sans | opérons | 47 | 160 | 2 | 400 | 5 | 320 | 900 | 0 | 240 | 6 | ||
1 aa | 30 | 180 | 1 | 450 | 2 | 360 | 1000 | 4 | 270 | 9 | |||
max a | 5 | 200 | 0 | 500 | 0 | 400 | 1100 | 1 | 300 | 9 | |||
a doubles | 15 | 2 | 14 | 2 | 56 | ||||||||
total aas | 79 | 32 | 0 | 147 | 0 | 141 | 141 | ||||||
total aas | 92 | ||||||||||||
remarques | 5 | ||||||||||||
avec jaune | moyenne | 69 | 194 | 310 | |||||||||
variance | 75 | 197 | 248 | ||||||||||
sans jaune | moyenne | 39 | 147 | 252 | 170 | ||||||||
variance | 16 | 112 | 134 | 71 |
rpm blocs[modifier | modifier le wikicode]
rpm blocs protéines[modifier | modifier le wikicode]
- Lien tableur: rpm blocs protéines
- Note:
- - hp pour hypothetical protein
- - p- pour pseudo, par exemple p-elon en abrégé donne p-elongation factor Tu.
abrégé | nom |
---|---|
23s | 23s rRNA (guanosine(2251)-2'-O)-methyltransferase RlmB |
3-isop | 3-isopropylmalate dehydrogenase |
3-isop-sub | 3-isopropylmalate dehydratase small subunit |
acetyl | acetyl-CoA carboxylase biotin carboxylase subunit |
cas3 | CRISPR-associated helicase/endonuclease Cas3 |
CDP | CDP-diacylglycerol--serine O-phosphatidyltransferase |
ComF | ComF family protein |
CRISPR | CRISPR |
DUF262 | DUF262 domain-containing protein |
FeFe | [FeFe] hydrogenase H-cluster radical SAM maturase HydE |
glyco | glycosyltransferase |
HAMP | HAMP domain-containing protein |
LysM | LysM peptidoglycan-binding domain-containing protein |
methyl | methyltransferase |
NAD | NAD(P) transhydrogenase subunit alpha |
p-elon | p-elongation factor Tu |
p-EscV | p-EscV/YscV/HrcVfamilytypeIIIsecretionsystemexportapparatusprotein |
p-glyco | p-glycosyltransferase |
P-glyco1 | p-glycosyl transferase family 1 |
p-IS5 | p-IS5/IS1182 family transposase |
p-tetra | p-tetratricopeptide repeat protein |
p-trans | p-transposase |
PAS | PAS domain-containing protein |
peptido | peptidoglycan DD-metalloendopeptidase family protein |
phage | phage portal protein |
phospho | phosphoenolpyruvate carboxylase |
polypho | polyphosphate kinase |
respons | response regulator |
SAM | SAM-dependent chlorinase/fluorinase |
SEL1 | SEL1-like repeat protein |
tetra | tetratricopeptide repeat protein |
TraY | TraY domain-containing protein |
trypsin | trypsin-like serine protease |
type II | type II toxin-antitoxin system VapC family toxin |
VWA | VWA domain-containing protein |
winged | winged helix-turn-helix domain-containing protein |
rpm blocs construits[modifier | modifier le wikicode]
- Lien tableur: rpm blocs construits
- Légende: lien au tableau des protéines, abrégés
- - vert: la taille des rRNAs en pbs alors que les protéines (cdsa) sont en aas.
- - bleu: protéines bien caractérisées alors qu'en clair sont les protéines candidates à la création, hp pour hypothetical protein, p-protéine pour pseudo-protéine et les protéines caractérisées seulement par un domaine comme DUF262 par exemple.
- - cyan: Les intercalaires constantes vestiges des blocs complets représentés par l'unique bloc contenant le 16s avec les intercalaires 71 pour 5s-23s, 212 pour 23s-atc, 112 pour atc-16s et 52 dans le cas de 5s-atgf.
- - gris: Je ne considère ici que les protéines créées à l'intérieur d'un bloc rRNA. Les protéines non canditates à la création sont en bleu, voir ci-dessus le bleu, mais la reconstruction des blocs détruits m'a obligé à considérer des protéines internes au bloc, bien caractérisées non candiates à la création. Aussi je n'ai conservé que les plus petites, metyl adresse 2768823, 3-isop-sub adresse 2521529 et glyco adresse 49761. La reconstruction ne m'a pas permis de faire de grands blocs pour 4 clusters listés à la fin des 2 derniers tableaux en gris. Ces clusters sont restés parce qu'ils mettraient des protéines non candidates en intra bloc avec de grande taille.
- Notes: Il faut noter que théoriquement, pour cet organisme où la destruction des blocs est spéctaculaire, les protéines créées pourraient être aussi grande que le 23s en paires de base, 2765 soit 900 aas à peu près. C'est ce que j'ai suggéré en plaçant le 16s° contenant 1 grosse protéine candidate pour la création parce qu'elle est hypothétique dans le reconstruction du bloc b10, cas3-16s°-hp, 905-16s°-989. La même situation est reproduite dans le bloc b9 avec PAS-16s°-hp, 1081-16s°-138.
- @ Les blocs à rRNAs: texte de rpm remarques, remarque @3.
- - Les clusters de rpm tels qu’ils apparaissent dans la séquence des adresses sont présentés au chapitre rpm blocs construits, tableaux A5b1 et A5b2.
- + A5b1 rassemble 9 16s° solitaires suivis de longs clusters où on peut repérer les blocs d’origine altérés caractérisés par les intercalaires 16s-atc-23s, respectivement de 112 pbs et 216 pbs. Ainsi je suppose qu’il y a 5 blocs d’origine de type 16s-atc-23s-5s et un,isolé, de type 16s-gca-23s-5s. Dans ces grands clusters seul subsiste un seul 5s appartenant au bloc complet et intègre que j’ai nommé b0.
- + A5b2 rassemble 9 23s°5s solitaires et 3 blocs complets et un 5s solitaire. Les 23s°5s sont mis en face des 16s° du tableau A5b1. Les blocs complets contiennent un représentant de 16s, un de 23s et un 5s. Dans cette partie du tableau A5b2 j’ai ajouté le bloc b0 séparé de son cluster pour comparaison. Le bloc analogue au b0 est le bloc b1 qui est isolé et où seul le 16s est altéré. Le bloc b3 de cette partie du tableau apparaît comme un racollage d’un 16s° solitaire et d’un 23s°5s solitaire puisque l’intercalaire 16s°-23s° est négatif, c’est-à-dire qu’il y a recouvrement des 2 morceaux, ce qui ne serait pas le cas s’il y avait une délétion entre le 16s et le 23s d’origine.
- - Le parallélisme et l'égalité en nombres entre les 16s° et les 23s°5s solitaires, ainsi que l'analyse des intercalaires petits et négatifs de la remarque @2 m’ont poussé à reconstruire les blocs d’origines en rapprochant des 16s° solitaires à d’autres 16s° solitaires ou non tous 2 avec leurs cds, selon l’hypothèse que les 2 cds internes résultant font partie de l’altération ou de la délétion du 16s original et du coup ces cds seraient des candidats à la création de gènes nouveaux. Le même procédé et la même hypothèse sont appliqués pour un 23° et un 23s°5s.
- - Cette reconstruction se trouve dans les tableaux A5b3 et A5b4. Ainsi en optimisant les tailles des 16s et 23s reconstruits pour se rapprocher le plus aux tailles de ces rRNAs du bloc intègre b0, j’ai pu construire 11 blocs. J’ai séparé le 16s° du 23s°5s du bloc b3 du tableau A5b2. Il reste cependant un 16s°, un 23s° et un 5s-atgf que je n’ai pas pu réunir car leurs cds sont tous bien caractérisés et ne répondent aux critères des candidats à la création. L’hypothèse de 11 blocs ou 12 blocs à l’origine est tout à fait probable en comparaison des 9 blocs de abq.
- - Je n'ai pas pu faire une reconstruction analogue avec abs malgré la proximité phylogénique de abq car la complémentarité 16s° et 23s°5s n’existe pas comme si l’altération faisait disparaître une partie du rRNA, ceux qui restent indiquant la position des originaux. Cela indiquerait que ce sont 2 processus d’altération différents certainement reliés à la présence des tRNAs intra bloc, atc pour rpm et atc-gca pour abs.
- - Le génome analogue avec que des atc Tistrella mobilis KA081020-065, voir proteobacteria et Tistrella mobilis KA081020-065 [[11]]
- - Les clusters de rpm tels qu’ils apparaissent dans la séquence des adresses sont présentés au chapitre rpm blocs construits, tableaux A5b1 et A5b2.
- @ Les blocs à rRNAs: texte de rpm remarques, remarque @3.
|
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|
rpm remarques[modifier | modifier le wikicode]
rpm remarques texte[modifier | modifier le wikicode]
- Remarques:
- @ Il y a 7 atc dans 7 blocs à rRNAs courts ou longs et il n’y a qu’un seul gca de ce type. Il y a un 2ème gca mais dans un bloc sans rRNAs. C’est un génome à 16satc23s5s comme Tistrella mobilis KA081020-065 [[12]]. Voir fiche alpha.
- @ Il y a 12 blocs à rRNAs courts ou complets et tous ont un intercalaire 23s-5s ou 23s°-5s de 72 ou 71. Les intercalaires avec cds et entre aas
- - Les intercalaires élevés: Ils sont peu nombreux et modérés.
- + Les cds avec les blocs à rRNAs sont en général élevés jusqu’à 600 pbs. Sur les 13 de rpm seulement 4 dépassent 700, 705 828 894 1003.
- + Il y a 3 intercalaires avec les tRNAs supérieurs à 400, 489 648 989. Le génome rpm n’échappe donc pas au comportement des alpha.Voir le tableau des spectres des intercalaires avec les cds. Bien que rpm présente un maximum élevé il affiche un minimum de 3 intercalaires avec les tRNAs, élevés, supérieurs à 400 contre un maximum de 24 pour rpl.
- - Les intercalaires négatifs et petits, voir le tableau des spectres et la liste de ces intercalaires.
- + Dans le tableau des spectres des intercalaires, rpm et aon sont les seuls à présenter une proportion significative de ces intercalaires négatifs avec 6% alors que les 7 autres alpha n’en présentent aucun.
- + Dans la liste de rpm sur 24 intercalaires inférieurs à 51, 7 sont négatifs un nul et un égale à l’unité. Six autres ont des intercalaires positifs inférieurs à 9. Cette liste laisse penser que ce comportement est très lié à l’altération des blocs à rRNAs. Puisque, 16 de ces intercalaires concernent les rRNAs altérés de même que les intercalaires élevés, supérieurs à 400, concernent 12 de ces RNAs.
- + C'est comme si l'altération des blocs à rRNAs se faisait à l'intérieur du bloc et épargnait son extérieur. D'où cette hypothèse que les cds à intercalaires petits ou négatifs collés aux rRNAs altérés seraient des candidats à la création de gènes, petits, hypothétiques et/ou pseudo.
- + Ces intercalaires ne seraient pas dus seulement au changement de brin lors de la recombinaison ou de la conversion, puisque les changements de brin (présentés ici par comp) ne représentent que le tiers, 6 sur 16.
- + Dans ce génome les intercalaires négatifs et petits existent entre 2 cds contigus et un cds et un tRNA (agc).Mais les intercalaires des 5 autres tRNAs sont assez élevés et correspondent à la dissymétrie, constatée chez beaucoup de génomes, entre les 2 cds encadrant un bloc sans rRNAs.
- - Spectre des intercalaires avec les cds: rapportés au total j’ai distingué 4 intervalles de ces intercalaires en pbs, inférieur à 51, de 51-200, de 201-400 et supérieur à 400. A part les génomes à phylogénie étroite, abq abs et rtb rpl, il y a 6 génomes différents.
- + rru et abq sont identiques
- + rpm et oan sont différents avec tous les autres à cause des négatifs et ils sont différents entre eux par l'intervalle 51-200, 0.52 contre 0.36.
- + agr a l'intervalle 201-400 le plus élevé de tous, 0.34 contre 0.15 à 0.28. Et le génome dont il se rapproche le plus, aua, diffère avec lui pour tous les autres intervalles.
- + rtb diffère de tous les autres par un intervalle > 400 élevé qui est de 0.44 contre moins de 0.20 pour tous les autres. En même temps ce génome est très dissymétrique puisqu’il a un intervalle < 51 aussi élevé que rpm et oan, 13 contre 16 et 19 respectivement, alors que les autres tournent autour de 0.05 jusqu’à 0.10 pour aua.
- - Les intercalaires entre tRNAs notés aussi aas, voir la liste entre aas.
- + Pour ces intercalaires, rpm se comporte comme les autres alpha et gamma (spl eco) avec 2 groupes, ceux supérieurs à 80 et pouvant atteindre des maxima élevés jusqu’à 1172 pour spl et 373 pour rpm, et le 2ème groupe ,le plus nombreux, aux intercalaires inférieurs à 81 avec une moyenne proche de 30 (variance inférieure à 20).
- + Le comportement des gamma et alpha est nettement différent de celui des firmicutes (ban lbu cbc) où le 2ème groupe fait à peine 5% du total (5 pour 113) mais avec des maxima aussi élevés que rpm. Le 2ème groupe des alpha dépasse les 50% ( 24 pour 45) et celui des gamma fait 25% ( 31 pour 129).
- - Les intercalaires élevés: Ils sont peu nombreux et modérés.
- @ Les blocs à rRNAs:
- - Les clusters de rpm tels qu’ils apparaissent dans la séquence des adresses sont présentés au chapitre rpm blocs construits, tableaux A5b1 et A5b2.
- + A5b1 rassemble 9 16s° solitaires suivis de longs clusters où on peut repérer les blocs d’origine altérés caractérisés par les intercalaires 16s-atc-23s, respectivement de 112 pbs et 216 pbs. Ainsi je suppose qu’il y a 5 blocs d’origine de type 16s-atc-23s-5s et un,isolé, de type 16s-gca-23s-5s. Dans ces grands clusters seul subsiste un seul 5s appartenant au bloc complet et intègre que j’ai nommé b0.
- + A5b2 rassemble 9 23s°5s solitaires et 3 blocs complets et un 5s solitaire. Les 23s°5s sont mis en face des 16s° du tableau A5b1. Les blocs complets contiennent un représentant de 16s, un de 23s et un 5s. Dans cette partie du tableau A5b2 j’ai ajouté le bloc b0 séparé de son cluster pour comparaison. Le bloc analogue au b0 est le bloc b1 qui est isolé et où seul le 16s est altéré. Le bloc b3 de cette partie du tableau apparaît comme un racollage d’un 16s° solitaire et d’un 23s°5s solitaire puisque l’intercalaire 16s°-23s° est négatif, c’est-à-dire qu’il y a recouvrement des 2 morceaux, ce qui ne serait pas le cas s’il y avait une délétion entre le 16s et le 23s d’origine.
- - Le parallélisme et l'égalité en nombres entre les 16s° et les 23s°5s solitaires, ainsi que l'analyse des intercalaires petits et négatifs de la remarque @2 m’ont poussé à reconstruire les blocs d’origines en rapprochant des 16s° solitaires à d’autres 16s° solitaires ou non tous 2 avec leurs cds, selon l’hypothèse que les 2 cds internes résultant font partie de l’altération ou de la délétion du 16s original et du coup ces cds seraient des candidats à la création de gènes nouveaux. Le même procédé et la même hypothèse sont appliqués pour un 23° et un 23s°5s.
- - Cette reconstruction se trouve dans les tableaux A5b3 et A5b4. Ainsi en optimisant les tailles des 16s et 23s reconstruits pour se rapprocher le plus aux tailles de ces rRNAs du bloc intègre b0, j’ai pu construire 11 blocs. J’ai séparé le 16s° du 23s°5s du bloc b3 du tableau A5b2. Il reste cependant un 16s°, un 23s° et un 5s-atgf que je n’ai pas pu réunir car leurs cds sont tous bien caractérisés et ne répondent aux critères des candidats à la création. L’hypothèse de 11 blocs ou 12 blocs à l’origine est tout à fait probable en comparaison des 9 blocs de abq.
- - Je n'ai pas pu faire une reconstruction analogue avec abs malgré la proximité phylogénique de abq car la complémentarité 16s° et 23s°5s n’existe pas comme si l’altération faisait disparaître une partie du rRNA, ceux qui restent indiquant la position des originaux. Cela indiquerait que ce sont 2 processus d’altération différents certainement reliés à la présence des tRNAs intra bloc, atc pour rpm et atc-gca pour abs.
- - Le génome analogue avec que des atc Tistrella mobilis KA081020-065, voir proteobacteria et Tistrella mobilis KA081020-065 [[13]]
- - Les clusters de rpm tels qu’ils apparaissent dans la séquence des adresses sont présentés au chapitre rpm blocs construits, tableaux A5b1 et A5b2.
- @ CRISPR, en relation avec la création des gènes et la conversion?
- Adresse 752603
- /rpt_family="CRISPR"
- /rpt_type=direct
- /rpt_unit_range=752664..752692
- /rpt_unit_seq="gggttcatccctgcgcatgcaggggatac"
- @ Les tRNAs rares : liens aux indices de l'ensemble des alpha, de l'ensemble des bacilli et de l'ensemble des gamma
- - Les 11 tRNAs se terminant par g, à part ttg agg tgg atg et tag, sont souvent les premiers absents chez certains génomes bactériens. A ceux-là il faut ajouter ccc et cga: ccc s’expliquerait par complémentarité avec ggg; cga est du au fait que chez les bactéries il y a bascule cgt/cgc et cgg/cga (cgc devenant rare comme pour tous les autres doublets xyt et de même cga par rapport à cgg). Chez les bacilli par exemple ces 13 tRNAs sont très rares alors que chez les alphaproteobacteria sont aussi abondants que les xyc et xya, à part cga est absent dans les 9 génomes étudiés ici.
- - Indices pour 100 génomes des aas les plus faibles, < 80: cgg et ttg soupçonnés ne présentent aucune faiblesse. Par contre je découvre 4 tRNAs présentant une seule faiblesse sur les 4 clades et seul le clade bacilli présente cette faiblesse, ce sont ctc gtc gcc ctg. Est-ce que ce foisonnement de doubles est en relation avec l'étendue des altérations des blocs à rRNAs?
génomes 354 1161 672 4032 clade alpha gamma bacilli bacteria cga 8.5 13.4 5.4 22 ccc 78 87 5.7 68 gtc 101 176 47 110 gcc 94 170 26 103 ctc 110 104 67 95 gtg 55 8.4 0.7 33 gcg 55 7.1 7.9 30 gag 50 7.8 15 34 ggg 66 74 17 56 ctg 87 256 57 129 ccg 68 63 17 54 cag 62 104 16 59 cgg 101 102 99 83 acg 86 73 43 68 aag 74 24 67 60 agg 71 112 66 86 ttg 84 105 112 99 tcg 76 85 46 65
- séquences des doubles: C'est le génome des 9 alpha étudiés qui présente le plus de doubles avec 15 contre 1 ou 2 cluster pour les autres présentant des doubles. En plus, même les tRNAs les plus faibles présentent des doublets, ccg aag cag gtg, et même un triplet gcg.
n aas effectif total doubles 1 30 30 2 7 14 ccg aag gac cag gtg atgi gaa 3 4 12 gcgx3 cgtx3 accx3 tgc.aacx2 4 4 16 ttcx4 gccx4 ggcx4 simplesx4 5 1 5 ctgx5 total 46 77
rpm listes[modifier | modifier le wikicode]
rpm intercalaires entre aas[modifier | modifier le wikicode]
- Tableau des intercalaires entre aas dans les blocs sans rRNAs
2863300 373 atgi-gca 3710967 214 gaa-gaa 2268549 165 ccg-ccg 2863748 157 gca-aca 3833710 153 ctg-ctg 2863106 117 cca-atgi
- Comparaison avec les gamma et les firmicutes
clade génome < 80 > 80 moyenne ecartype maximum alpha rpm 26 6 39 16 373 rru 1 3 - 202 abq 11 6 - 220 abs 11 6 - 219 oan 1 2 - 245 agr 2 2 - 793 aua 4 9 - 404 rtb 2 2 - 1051 rpl 2 2 - 830 alpha total-rpm 34 32 - - alpha sans double 21 24 - - bacilli ban 35 2 14 14 87 bacilli lbu 46 2 14 12 258 clostridia cbc 27 1 15 14 306 gama spl 70 23 39 14 1172 gama eco 28 8 28 18 209
rpm intercalaires avec les cds[modifier | modifier le wikicode]
cds > 400 adresse intercalaire RNA 435655 512 16s° 46322 553 16s° 840219 568 16s° 22949 586 16s° 1214670 600 16s° 2095539 614 16s° 2091644 705 16s° comp 3729914 828 16s° comp 1814819 894 16s° comp 2393295 1003 16s° comp 55304 438 23s° 751747 597 23s° comp 2147496 645 atgf comp 934570 449 cgt comp 660266 648 gtc comp 2597728 989 tca
- Tableau des intercalaires négatifs ou petits avec les cds
cds < 50 adresse intercalaire RNA ou cds 1814819 -7 16s° comp 46322 0 16s° 2397013 2 16s° 840219 4 16s° 2091644 7 16s° 27892 18 16s° comp 1351013 23 16s° 5276 38 16s° comp 2095539 48 16s° 2769507 -12 23s° 13628 -7 23s° 44132 -5 23s° comp 3409304 1 23s° comp 691778 4 23s° comp 4225 30 23s° 2894456 25 5s 52988 -37 cds 2632925 -41 cds 1814819 -30 agc comp 3035343 8 aaa 3462054 29 agg 2633504 30 aca comp 417656 38 atgj comp 1206595 50 gta
- Spectre des intercalaires avec les cds
- Liens aux cumuls
- - spl cumuls, gamma
- - lbu cumuls, bacilli
- - fiche alpha
- - ban cumuls, bacilli
- - cbc cumuls, clostridia
- - eco cumuls, gamma
- Tableau des intercalaires élevés avec les cds
intercalaires rru rpm oan abs abq agr rtb rpl aua < 2 0 0.06 0.05 0 0 0 0 0 0.01 < 51 0.07 0.16 0.19 0.04 0.06 0.03 0.13 0.14 0.10 51-200 0.53 0.52 0.36 0.55 0.54 0.53 0.29 0.27 0.40 201-400 0.25 0.20 0.28 0.26 0.24 0.34 0.15 0.19 0.30 > 400 0.15 0.11 0.17 0.14 0.17 0.10 0.44 0.40 0.20 total 88 147 107 125 121 97 62 63 80 Aas > 400 7 3 13 6 9 8 24 22 16 max aas 1389 989 1650 746 688 660 2465 2381 3102
alpha codes[modifier | modifier le wikicode]
- Lien tableur: alpha codes
- Légende: prélèvement de la base gtRNAdb le 19/1/20 Paris
- - totaux en en-tête, exemple pour A5c, 25 98 95, 12 somme des tRNAs faibles ccc cga les jaunes et les 3 oranges de la colonne 6; 98 total de gtRNAdb contenant des pseudo et inconnus; 95 total du tableau.
- - ata très rare est remplacé par atgi (Ile2)
- - Met comprend atgf (Metf) et atgj (Met) sous la forme atgf/atgj, sauf pour A1c dont il faut les différencier.
- - Voir la légende des tris et couleurs, g1 t1.
|
|
|
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|
|
|
gamma codes[modifier | modifier le wikicode]
- Lien tableur: gamma codes
- Légende: prélèvement de la base gtRNAdb le 19/1/20 Paris
- - totaux en en-tête, exemple pour G1c, 88642 86720, 88642 total de la requête pour tout gamma dans gtRNAdb, 86720 total du tableau.
- - Voir la légende des tris et couleurs, g1 t1.
- Liens aux indices de l'ensemble des alpha et de l'ensemble des bacilli
|
|
rpm distribution[modifier | modifier le wikicode]
- Lien tableur: rpm distribution
- Notes:
aac2 aag2 acc3 atgj2 cag2 ccg2 cgt3 ctg5 gaa2 gac2 gcc4 gcg3 ggc4 gtg2 ttc4 gca >1 16s
g1 | t1 | ||||||
---|---|---|---|---|---|---|---|
atgi | 2 | tct | tat | atgf | 5 | ||
att | act | aat | agt | ||||
ctt | cct | cat | cgc | ||||
gtt | gct | gat | ggt | ||||
ttc | 4 | tcc | 1 | tac | 1 | tgc | 1 |
atc | 7 | acc | 3 | aac | 2 | agc | 1 |
ctc | 1 | ccc | 2 | cac | 2 | cgt | 3 |
gtc | 2 | gcc | 4 | gac | 2 | ggc | 4 |
tta | 1 | tca | 1 | taa | tga | ||
ata | aca | 2 | aaa | 3 | aga | 1 | |
cta | 1 | cca | 2 | caa | 1 | cga | |
gta | 1 | gca | 2 | gaa | 2 | gga | 1 |
ttg | 1 | tcg | 1 | tag | tgg | 1 | |
atgj | 2 | acg | 1 | aag | 2 | agg | 1 |
ctg | 5 | ccg | 2 | cag | 2 | cgg | 1 |
gtg | 2 | gcg | 3 | gag | 2 | ggg | 1 |
alpha | >1aa | =1aa | -5s | +5s | -16s | +16s | total |
rpm | 49 | 30 | 5 | 8 | 92 |
Rhodospirillum rubrum ATCC 11170[modifier | modifier le wikicode]
rru opérons[modifier | modifier le wikicode]
- Lien tableur: rru opérons
- Liens: gtRNAdb [14], NCBI [15], génome [orgn]
- Phylogénie: Bacteria; Proteobacteria; Alphaproteobacteria; Rhodospirillales; Rhodospirillaceae; Rhodospirillum.
- Légende: cdsa: cds aas, cdsd: cds dirigé
64.97%GC | 26.12.19 Paris | 55 | doubles | intercal | cds | aa | avec aa | cdsa | cdsd | protéines |
---|---|---|---|---|---|---|---|---|---|---|
chromosome | ||||||||||
comp | 16232..16852 | cds | 163 | 163 | 207 | 3'-5' exonuclease | ||||
comp | 17016..17102 | ctg | 253 | 253 | ||||||
17356..18378 | cds | 341 | 3-beta-hydroxy-delta(5)-steroid dehydrogenase | |||||||
117072..117287 | cds | 37 | 37 | 72 | slyX | |||||
comp | 117325..117401 | agg | 341 | 341 | ||||||
117743..123022 | cds | 1760 | alpha-2-macroglobulin-like protein | |||||||
comp | 149921..151015 | cds | 225 | 225 | 365 | hp | ||||
151241..151317 | cgg | 136 | 136 | |||||||
comp | 151454..152929 | cds | 492 | chemotaxis sensory transducer protein | ||||||
189941..191668 | cds | 859 | 859 | 576 | sulfate transporter/antisigma-factor antagonist | |||||
192528..194004 | 16s | 184 | 1477 | |||||||
194189..194265 | atc | 66 | 66 | |||||||
194332..194407 | gca | 362 | ||||||||
194770..197527 | 23s | 119 | 2758 | |||||||
197647..197761 | 5s | 96 | 115 | |||||||
197858..197934 | atgf | 287 | 287 | |||||||
comp | 198222..198455 | cds | 78 | hp | ||||||
comp | 305449..306648 | cds | 257 | 257 | 400 | Ppx/GppA phosphatase | ||||
306906..306979 | cag | 319 | 319 | |||||||
comp | 307299..308303 | cds | 335 | LacI family transcriptional regulator | ||||||
comp | 322896..323807 | cds | 292 | 292 | 304 | hp | ||||
comp | 324100..324174 | caa | 98 | 98 | ||||||
comp | 324273..325601 | cds | 443 | chemotaxis sensory transducer protein | ||||||
362552..362881 | cds | 224 | 224 | 110 | hp | |||||
363106..363181 | gcc | + | 202 | 202 | ||||||
363384..363459 | gcc | 2 gcc | 43 | 43 | ||||||
comp | 363503..364531 | cds | 343 | esterase | ||||||
407067..407606 | cds | 92 | 92 | 180 | YbaK/prolyl-tRNA synthetase associated domain-containing protein | |||||
407699..407790 | agc | 141 | 141 | |||||||
407932..408774 | cds | 281 | hp | |||||||
466945..467925 | cds | 115 | 115 | 327 | hp | |||||
comp | 468041..468126 | tta | 83 | 83 | ||||||
comp | 468210..468458 | cds | 83 | hp | ||||||
comp | 559038..559610 | cds | 86 | 86 | 191 | OsmC-like protein | ||||
559697..559772 | aag | 140 | 140 | |||||||
559913..560608 | cds | 232 | hp | |||||||
comp | 794877..795188 | cds | -81 | -81 | 104 | hp | ||||
comp | 795108..795188 | Sig-pep | 217 | 217 | 27 | hp | ||||
795406..795496 | tcc | 44 | 44 | |||||||
795541..795846 | cds | 102 | hp | |||||||
comp | 908584..910185 | cds | -102 | -102 | 534 | peptidase M23B | ||||
comp | 910084..910185 | Sig-pep | @1 | 1212 | 1212 | 34 | hp | |||
911398..912874 | 16s | 182 | 1477 | |||||||
913057..913133 | atc | 66 | 66 | |||||||
913200..913275 | gca | 361 | ||||||||
913637..916394 | 23s | 118 | 2758 | |||||||
916513..916627 | 5s | 95 | 115 | |||||||
916723..916799 | atgf | 573 | 573 | |||||||
917373..921860 | cds | 1496 | hp | |||||||
1159249..1160091 | cds | 71 | 71 | 281 | Linocin_M18 bacteriocin protein | |||||
1160163..1160238 | gag | 117 | 117 | |||||||
1160356..1160613 | cds | 86 | prevent-host-death protein | |||||||
comp | 1464820..1465122 | cds | 283 | 283 | 101 | 50S ribosomal protein L21 | ||||
1465406..1465495 | tcg | 139 | 139 | |||||||
comp | 1465635..1466303 | cds | 223 | cytochrome B561 | ||||||
1791953..1792159 | cds | 116 | 116 | 69 | hp | |||||
comp | 1792276..1792351 | gaa | 131 | 131 | ||||||
comp | 1792483..1792689 | cds | 69 | cold-shock DNA-binding protein family protein | ||||||
1824302..1825738 | cds | 98 | 98 | 479 | malonyl-CoA decarboxylase | |||||
1825837..1825921 | cta | 102 | 102 | |||||||
1826024..1827415 | cds | 464 | trigger factor | |||||||
1833133..1833408 | cds | 284 | 284 | 92 | histone-like DNA-binding protein | |||||
1833693..1833768 | gta | 70 | 70 | |||||||
comp | 1833839..1835326 | cds | 496 | methyl-accepting chemotaxis sensory transducer | ||||||
1933506..1934138 | cds | -633 | -633 | 211 | hp | |||||
1933506..1933652 | Sig-pep | 571 | 571 | 49 | hp | |||||
1934224..1934300 | cca | 63 | 63 | |||||||
1934364..1934663 | cds | 12 | 12 | 100 | ETC complex I subunit region | |||||
1934676..1934752 | aga | 396 | 396 | |||||||
1935149..1939624 | cds | 1492 | hp | |||||||
1959133..1959858 | cds | 175 | 175 | 242 | MerR family transcriptional regulator | |||||
1960034..1960110 | ccc | @2 | 1062 | 1062 | ||||||
1961173..1961367 | cds | 65 | hp | |||||||
comp | 1996760..1998124 | cds | -120 | -120 | 455 | lytic murein transglycosylase | ||||
comp | 1998005..1998124 | Sig-pep | 119 | 119 | 40 | hp | ||||
1998244..1998333 | tca | 927 | 927 | |||||||
comp | 1999261..1999929 | cds | 223 | hp | ||||||
2032027..2032863 | cds | 123 | 123 | 279 | phage integrase | |||||
comp | 2032987..2033062 | aaa | 186 | 186 | ||||||
comp | 2033249..2033755 | cds | 169 | peptidyl-prolyl isomerase | ||||||
comp | 2093327..2093977 | cds | 295 | 295 | 217 | protein-L-isoaspartate(D-aspartate) O-methyltransferase | ||||
2094273..2094346 | tgc | 81 | 81 | |||||||
2094428..2094502 | aac | 150 | 150 | |||||||
2094653..2094916 | cds | 88 | prevent-host-death protein | |||||||
comp | 2304404..2305834 | cds | 89 | 89 | 477 | divalent cation transporter | ||||
comp | 2305924..2306010 | ctc | 178 | 178 | ||||||
2306189..2306839 | cds | 217 | lipoate-protein ligase B | |||||||
2331183..2331521 | cds | 73 | 73 | 113 | hp | |||||
2331595..2331671 | atgj | 126 | 126 | |||||||
comp | 2331798..2332040 | cds | 81 | hp | ||||||
comp | 2411337..2411804 | cds | -72 | -72 | 156 | CreA | ||||
comp | 2411733..2411804 | Sig-pep | 202 | 202 | 24 | hp | ||||
comp | 2412007..2412083 | cac | 75 | 75 | ||||||
comp | 2412159..2413343 | cds | 395 | hp | ||||||
2729598..2731271 | cds | 449 | 449 | 558 | macrocin-O-methyltransferase | |||||
comp | 2731721..2731797 | atgf | 95 | |||||||
comp | 2731893..2732007 | 5s | 119 | 115 | ||||||
comp | 2732127..2734884 | 23s | 362 | 2758 | ||||||
comp | 2735247..2735322 | gca | 66 | 66 | ||||||
comp | 2735389..2735465 | atc | 184 | |||||||
comp | 2735650..2737126 | 16s | 606 | 606 | 1477 | |||||
comp | 2737733..2738110 | cds | 126 | hp | ||||||
comp | 2959802..2961874 | cds | 354 | 354 | 691 | chemotaxis sensory transducer protein | ||||
comp | 2962229..2962303 | gtc | 123 | 123 | ||||||
2962427..2963359 | cds | 311 | N-formylglutamate amidohydrolase | |||||||
comp | 3124836..3125033 | cds | 151 | 151 | 66 | preprotein translocase subunit SecE | ||||
comp | 3125185..3125260 | tgg | 343 | 343 | ||||||
comp | 3125604..3126794 | cds | 93 | 93 | 397 | elongation factor Tu | ||||
comp | 3126888..3126961 | gga | 27 | 27 | ||||||
comp | 3126989..3127074 | tac | 37 | 37 | ||||||
3127112..3128158 | cds | 57 | 57 | 349 | 23s rRNA (guanosine(2251)-2'-O)-methyltransferase RlmB | |||||
3128216..3128291 | aca | 127 | 127 | |||||||
3128419..3128652 | cds | 78 | hp | |||||||
comp | 3193350..3194507 | cds | 430 | 430 | 386 | acyltransferase | ||||
comp | 3194938..3195013 | ttc | 103 | 103 | ||||||
comp | 3195117..3195635 | cds | 173 | hp | ||||||
3320745..3322115 | cds | -1371 | -1371 | 457 | virulence protein | |||||
3320745..3320816 | Sig-pep | 1389 | 1389 | 24 | hp | |||||
comp | 3322206..3322281 | atgi | 60 | 60 | ||||||
comp | 3322342..3324432 | cds | 697 | RNA polymerase sigma factor RpoD | ||||||
comp | 3377932..3378114 | cds | 140 | 140 | 61 | hp | ||||
3378255..3378329 | acc | + | 165 | 165 | ||||||
3378495..3378569 | acc | 2 acc | 237 | 237 | ||||||
3378807..3379370 | cds | 234 | 234 | 188 | hp | |||||
3379605..3379681 | gac | 77 | 77 | |||||||
comp | 3379759..3380517 | cds | 253 | diguanylate phosphodiesterase | ||||||
comp | 3399207..3399494 | cds | 262 | 262 | 96 | hp | ||||
comp | 3399757..3399833 | ccg | 56 | 56 | ||||||
comp | 3399890..3400972 | cds | 361 | farnesyltranstransferase | ||||||
3490378..3491148 | cds | 84 | 84 | 257 | 2-phosphoglycolate phosphatase | |||||
3491233..3491307 | gtg | 407 | 407 | |||||||
3491715..3492080 | cds | 122 | hp | |||||||
comp | 3719367..3719753 | cds | 163 | 163 | 129 | hp | ||||
comp | 3719917..3719990 | ggg | 95 | 95 | ||||||
comp | 3720086..3720859 | cds | 258 | enoyl-ACP reductase | ||||||
3805869..3806813 | cds | 130 | 130 | 315 | inner-membrane translocator | |||||
comp | 3806944..3807058 | 5s | 116 | 115 | ||||||
comp | 3807175..3809932 | 23s | 362 | 2758 | ||||||
comp | 3810295..3810370 | gca | 66 | 66 | ||||||
comp | 3810437..3810513 | atc | 184 | |||||||
comp | 3810698..3812174 | 16s | 1227 | 1227 | 1477 | |||||
3813402..3814118 | cds | 239 | transposase | |||||||
comp | 3824154..3825854 | cds | 76 | 76 | 567 | phage integrase | ||||
comp | 3825931..3826007 | cgt | 387 | 387 | ||||||
3826395..3827531 | cds | 379 | hp | |||||||
4021982..4023163 | cds | 27 | 27 | 394 | diguanylate phosphodiesterase | |||||
comp | 4023191..4023277 | ttg | 224 | 224 | ||||||
4023502..4023855 | cds | 118 | hp | |||||||
comp | 4058818..4059117 | cds | 187 | 187 | 100 | hp | ||||
4059305..4059380 | gcg | 179 | 179 | |||||||
comp | 4059560..4060126 | cds | 189 | hp | ||||||
comp | 4105626..4107317 | cds | -114 | -114 | 564 | chemotaxis sensory transducer | ||||
comp | 4107204..4107317 | Sig-pep | 721 | 721 | 38 | hp | ||||
comp | 4108039..4108113 | acg | 148 | 148 | ||||||
4108262..4108843 | cds | 194 | D-alpha,beta-D-heptose 1,7-bisphosphate phosphatase | |||||||
comp | 4261100..4262038 | cds | 269 | 269 | 313 | thioredoxin-like protein | ||||
4262308..4262382 | ggc | 118 | 118 | |||||||
4262501..4263136 | cds | 212 | lysine exporter protein LysE/YggA |
rru cumuls[modifier | modifier le wikicode]
- Lien tableur: rru cumuls
opérons | Fréquences intercalaires tRNAs | Fréquences intercalaires cds | Fréquences aas cds chromosome | ||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
effectif | gammes | sans rRNAs | avec rRNAs | gammes | cds | gammes | cdsd | gammes | cdsa | gammes | cdsa 300 | ||
avec rRNA | opérons | 4 | 1 | 1 | 7 | 1 | 100 | 23 | 1 | 0 | |||
16atcgca235 | 1 | 20 | 50 | 6 | 40 | 200 | 17 | 30 | 3 | ||||
Id-atgf | 3 | 40 | 1 | 100 | 19 | 80 | 300 | 16 | 60 | 4 | |||
- | 60 | 150 | 20 | 120 | 400 | 17 | 90 | 12 | |||||
max a | 3 | 80 | 4 | 200 | 8 | 160 | 500 | 8 | 120 | 10 | |||
a doubles | 0 | 100 | 1 | 250 | 7 | 200 | 600 | 5 | 150 | 3 | |||
spéciaux | 0 | 120 | 300 | 9 | 240 | 700 | 2 | 180 | 4 | ||||
total aas | 11 | 140 | 350 | 3 | 280 | 800 | 0 | 210 | 5 | ||||
sans | opérons | 40 | 160 | 400 | 3 | 320 | 900 | 0 | 240 | 8 | |||
1 aa | 36 | 180 | 1 | 450 | 3 | 360 | 1000 | 0 | 270 | 4 | |||
max a | 2 | 200 | 500 | 0 | 400 | 1100 | 0 | 300 | 3 | ||||
a doubles | 2 | 1 | 10 | 3 | 35 | ||||||||
total aas | 44 | 4 | 4 | 95 | 0 | 91 | 91 | ||||||
total aas | 55 | ||||||||||||
remarques | |||||||||||||
avec jaune | moyenne | 119 | 66 | 208 | 292 | ||||||||
variance | 79 | 0 | 333 | 187 | |||||||||
sans jaune | moyenne | 148 | 237 | 140 | |||||||||
variance | 83 | 132 | 69 |
rru blocs[modifier | modifier le wikicode]
- Lien tableur: rru blocs
- Légende:
- sulfate sulfate transporter/antisigma-factor antagonist
- inner inner-membrane translocator
- macrocin macrocin-O-methyltransferase
- peptidase peptidase M23B
- hp Hypothetical protein
cds | 859 | 576 | sulfate | cds | 606 | 126 | hp |
16s | 184 | 1477 | 16s | 184 | 1477 | ||
atc | 66 | atc | 66 | ||||
gca | 362 | gca | 362 | ||||
23s | 119 | 2758 | 23s | 119 | 2758 | ||
5s | 96 | 115 | 5s | 95 | 115 | ||
atgf | 287 | atgf | 449 | ||||
cds | 78 | hp | cds | 558 | macrocin | ||
cds | -102 | 534 | peptidase | ||||
Sig-pep | 1212 | 34 | hp | cds | 1227 | 239 | transposase |
16s | 182 | 1477 | 16s | 184 | 1477 | ||
atc | 66 | atc | 66 | ||||
gca | 361 | gca | 362 | ||||
23s | 118 | 2758 | 23s | 116 | 2758 | ||
5s | 95 | 115 | 5s | 130 | 115 | ||
atgf | 573 | cds | 315 | inner | |||
cds | 1496 | hp |
rru remarques[modifier | modifier le wikicode]
- Remarques: Par rapport aux rickettsia rtb et rpl, les intercalaires élevés sont rares.
- @ Les intercalaires élevés
- - il n’y a pas d’aas isolés et les mineurs des blocs à rRNAs sont normaux pour ces blocs, inférieurs à 573.
- - Pour les aas il n’y a que 5 intercalaires élevés entre 571-1389, et 2 dépassant à peine 400 pbs.
- - Pour les blocs à rRNAs il n’y a que 3 intercalaires franchement élevés, 1227 1212 859.
- @ Sig-pep, signal peptide.
- - Il y a 580 sig-peptide dans ce génome. Dans le tableau des opérons ce sont de petites séquences peptidiques de moins de 30 aas placsés au début du cds. D’où l’intercalaire négatif.
- - Dans le tableau sur les 7 seg-pep, 4 sont associés à des intercalaires élevés (voir tableau ci-dessous) et 3 à des intercalaires inférieurs à 219 pbs.
- @ Les intercalaires élevés
- Note: Les 4 blocs à rRNAs sont tous complets ayant atcgca en interne dont 3 ont atgf qui suit 5s. Aucun bloc ne contient un cds en interne.
- Séquences des doubles: Sur 40 blocs sans rRNAs seulement 4 ont 2 aas dont 2 ont un doublet, gcc et acc.
- Tableau des intercalaires
16s aas Sig-pep adresse intercalaire adresse intercalaire intercalaire 911398 1212-573 atgi 3322206 1389 1389 2735650 606-449 ccc 1960034 1062 1212 3810698 1227-130 tca 1998244 927 721 192528 859-257 acg 4108039 721 571 cca 1934224 571 3 <219 ttc 3194938 430 gtg 3491233 407
rru distribution[modifier | modifier le wikicode]
- Lien tableur: rru distribution
- Notes: gcc2 acc2
g1 | t1 | ||||||
---|---|---|---|---|---|---|---|
atgi | 1 | tct | tat | atgf | 3 | ||
att | act | aat | agt | ||||
ctt | cct | cat | cgc | ||||
gtt | gct | gat | ggt | ||||
ttc | 1 | tcc | 1 | tac | 1 | tgc | 1 |
atc | 4 | acc | 2 | aac | 1 | agc | 1 |
ctc | 1 | ccc | 1 | cac | 1 | cgt | 1 |
gtc | 1 | gcc | 2 | gac | 1 | ggc | 1 |
tta | 1 | tca | 1 | taa | tga | ||
ata | aca | 1 | aaa | 1 | aga | 1 | |
cta | 1 | cca | 1 | caa | 1 | cga | |
gta | 1 | gca | 4 | gaa | 1 | gga | 1 |
ttg | 1 | tcg | 1 | tag | tgg | 1 | |
atgj | 1 | acg | 1 | aag | 1 | agg | 1 |
ctg | 1 | ccg | 1 | cag | 1 | cgg | 1 |
gtg | 1 | gcg | 1 | gag | 1 | ggg | 1 |
alpha | >1aa | =1aa | -5s | +5s | -16s | +16s | total |
rru | 8 | 36 | 3 | 8 | 55 |
rru intercalaires entre cds[modifier | modifier le wikicode]
- Rhodospirillum rubrum ATCC 11170, 10.3.2020, NCBI [16]
- Note: Pour les génomes des annexes j'ai relevé les intercalaires entre tRNAs et entre ceux-ci et les cds qui leur sont adjacents. L'exemple est celui de rru du clade alpha. L'idée de départ de ces prélèvements est la recherche d'opérons formés de tRNA et de protéine comme dans le cas d'E.coli: l'intercalaire entre le tRNA et la protéine devrait être faible. Voir l'exemple d'eco (remarque @3) avec tac-tac-tpr et aca-tac-gga-acc-tufB.
rru les fréquences[modifier | modifier le wikicode]
- Lien tableur: rru intercalaires entre cds
- Légende: long, longueur en pbs, intercal pour intercalaire
- - fréquence-1 1 5 6 f, respectivement fréquence des intercalaires négatives à l'unité, positives à l'unité, par blocs de 5, par blocs de 10 jusqu'à 600 pbs et f pour finales. Ces fréquences servent à faire les diagrammes. La fréquence fréquencez est l'étendue à 1200 de la fréquence6 pour certains grands génomes.
- - cumul,% colonne à la droite de frequence6, reprend les fréquences par plages et leurs pourcentages indiqués déjà dans la 1ère partie du tableau.
- - La couleur cyan des fréquences fréquence-1 et 1 sert à montrer leur périodicité ternaire.
- - intercaln intercalx, pour les intercalaires négatifs minimaux et intercalaires positifs maximaux.
- - colonne ADN pour la longueur totale du génome en pbs et intercals pour le total en pbs des intercalaires entre cds uniquement, d'après la méthode des prélèvements de NCBI du 10.3.20.
rru | intercalaires | total | % | intercalaires | moyenne | ecartype | plage | ADN | intercal | frequence5 | intercal | fréquencez |
---|---|---|---|---|---|---|---|---|---|---|---|---|
négatif | 683 | 18.0 | négatif | -8 | 15 | -73 à -1 | 4 352 825 | -1 | 683 | 610 | 1 | |
zéro | 13 | 0.3 | intercals | 0 | 13 | 620 | 0 | |||||
1 à 200 | 2368 | 62.5 | 0 à 200 | 78 | 58 | 429 144 | 5 | 180 | 630 | 5 | ||
201 à 370 | 535 | 14.1 | 201 à 370 | 268 | 46 | 9.9% | 10 | 109 | 640 | 6 | ||
371 à 600 | 139 | 3.7 | 371 à 600 | 453 | 60 | 15 | 155 | 650 | 1 | |||
601 à max | 48 | 1.3 | 601 à 1028 | 733 | 105 | 20 | 84 | 660 | 4 | |||
total 3786 | <201 | 80.9 | total 3779 | 112 | 136 | -73 à 995 | 25 | 86 | 670 | 3 | ||
adresse | intercalx | intercal | fréquence1 | intercal | fréquence6 | cumul,% | intercal | fréquence-1 | 30 | 81 | 680 | 1 |
3818575 | 1469 | -1 | 683 | -70 | 8 | 0 | 13 | 35 | 54 | 690 | 2 | |
844364 | 995 | 0 | 13 | -60 | 5 | -1 | 81 | 40 | 56 | 700 | 1 | |
3816901 | 954 | 1 | 25 | -50 | 8 | -2 | 1 | 45 | 59 | 710 | 1 | |
3134490 | 938 | 2 | 34 | -40 | 8 | -3 | 0 | 50 | 63 | 720 | 0 | |
3477618 | 929 | 3 | 41 | -30 | 6 | min à -1 | -4 | 421 | 55 | 67 | 730 | 0 |
1097019 | 885 | 4 | 47 | -20 | 21 | 683 | -5 | 0 | 60 | 67 | 740 | 3 |
3856065 | 884 | 5 | 33 | -10 | 75 | 18.0% | -6 | 2 | 65 | 61 | 750 | 0 |
566184 | 881 | 6 | 20 | 0 | 565 | -7 | 5 | 70 | 52 | 760 | 1 | |
1833839 | 873 | 7 | 16 | 10 | 289 | -8 | 42 | 75 | 59 | 770 | 2 | |
3136049 | 866 | 8 | 27 | 20 | 239 | -9 | 0 | 80 | 52 | 780 | 3 | |
2475546 | 802 | 9 | 20 | 30 | 167 | -10 | 9 | 85 | 58 | 790 | 3 | |
93164 | 788 | 10 | 26 | 40 | 110 | -11 | 26 | 90 | 64 | 800 | 0 | |
409696 | 787 | 11 | 41 | 50 | 122 | -12 | 0 | 95 | 51 | 810 | 1 | |
400635 | 785 | 12 | 37 | 60 | 134 | -13 | 4 | 100 | 75 | 820 | 0 | |
1366462 | 777 | 13 | 28 | 70 | 113 | -14 | 13 | 105 | 49 | 830 | 0 | |
3456663 | 777 | 14 | 28 | 80 | 111 | -15 | 1 | 110 | 53 | 840 | 0 | |
3312945 | 771 | 15 | 21 | 90 | 122 | 1 à 100 | -16 | 3 | 115 | 49 | 850 | 0 |
550038 | 769 | 16 | 16 | 100 | 126 | 1533 | -17 | 14 | 120 | 45 | 860 | 0 |
2493887 | 767 | 17 | 25 | 110 | 102 | 41% | -18 | 0 | 125 | 44 | 870 | 1 |
1410707 | 755 | 18 | 16 | 120 | 94 | -19 | 5 | 130 | 45 | 880 | 1 | |
1423514 | 739 | 19 | 13 | 130 | 89 | -20 | 7 | 135 | 48 | 890 | 3 | |
2688282 | 734 | 20 | 14 | 140 | 92 | -21 | 1 | 140 | 44 | 900 | 0 | |
3627241 | 732 | 21 | 13 | 150 | 83 | -22 | 1 | 145 | 41 | 910 | 0 | |
2706640 | 702 | 22 | 20 | 160 | 87 | -23 | 2 | 150 | 42 | 920 | 0 | |
3937050 | 697 | 23 | 15 | 170 | 92 | -24 | 0 | 155 | 44 | 930 | 1 | |
1011650 | 686 | 24 | 17 | 180 | 62 | -25 | 2 | 160 | 43 | 940 | 1 | |
742860 | 682 | 25 | 21 | 190 | 68 | 1 à 200 | -26 | 4 | 165 | 42 | 950 | 0 |
3424033 | 675 | 26 | 10 | 200 | 66 | 2368 | -27 | 1 | 170 | 50 | 960 | 1 |
139185 | 669 | 27 | 18 | 210 | 45 | 62.5% | -28 | 0 | 175 | 31 | 970 | 0 |
880072 | 663 | 28 | 20 | 220 | 56 | -29 | 3 | 180 | 31 | 980 | 0 | |
1976647 | 662 | 29 | 17 | 230 | 47 | -30 | 0 | 185 | 28 | 990 | 0 | |
2640270 | 659 | 30 | 16 | 240 | 39 | -31 | 2 | 190 | 40 | 1000 | 1 | |
90214 | 657 | 31 | 10 | 250 | 39 | -32 | 1 | 195 | 39 | 1010 | 0 | |
961964 | 656 | 32 | 14 | 260 | 43 | 664 | 200 | 27 | 1020 | 0 | ||
1209394 | 652 | 33 | 10 | 270 | 33 | 0 à 200 | reste | 32 | 205 | 19 | 1030 | 0 |
2536913 | 650 | 34 | 13 | 280 | 33 | 2381 | total | 696 | 210 | 26 | 1040 | 0 |
2591508 | 639 | 35 | 7 | 290 | 31 | 215 | 25 | 1050 | 0 | |||
55947 | 637 | 36 | 10 | 300 | 29 | intercal | frequencef | 220 | 31 | 1060 | 0 | |
1786743 | 636 | 37 | 13 | 310 | 33 | 600 | 3738 | 225 | 25 | 1070 | 0 | |
2231609 | 636 | 38 | 11 | 320 | 22 | 620 | 1 | 230 | 22 | 1080 | 0 | |
3609912 | 633 | 39 | 10 | 330 | 15 | 640 | 11 | 235 | 18 | 1090 | 0 | |
3187318 | 631 | 40 | 12 | 340 | 19 | 660 | 5 | 240 | 21 | 1100 | 0 | |
reste | 2285 | 350 | 17 | 680 | 4 | 245 | 24 | 1110 | 0 | |||
total | 3786 | 360 | 14 | 201 à 370 | 700 | 3 | 250 | 15 | 1120 | 0 | ||
370 | 20 | 535 | 720 | 1 | 255 | 21 | 1130 | 0 | ||||
380 | 9 | 14.1% | 740 | 3 | 260 | 22 | 1140 | 0 | ||||
390 | 9 | 760 | 1 | 265 | 23 | 1150 | 0 | |||||
adresses | intercaln | décalage | long | 400 | 9 | 780 | 5 | 270 | 10 | 1160 | 0 | |
2068001 | -137 | shift2 | 1009 | 410 | 14 | 800 | 3 | 275 | 15 | 1170 | 0 | |
651352 | -122 | comp | 420 | 14 | 820 | 1 | 280 | 18 | 1180 | 0 | ||
2462962 | -120 | comp | 430 | 9 | 840 | 0 | 285 | 13 | 1190 | 0 | ||
1155908 | -106 | comp | 440 | 4 | 860 | 0 | 290 | 18 | 1200 | 0 | ||
2381188 | -104 | comp | 450 | 15 | 880 | 2 | 295 | 14 | reste | 1 | ||
3871151 | -104 | comp | 460 | 5 | 900 | 3 | 300 | 15 | total | 3786 | ||
4292550 | -73 | shift2 | 662 | 470 | 5 | 371 à 600 | 920 | 0 | 305 | 18 | ||
664620 | -70 | comp | 480 | 4 | 139 | 940 | 2 | 310 | 15 | |||
3822351 | -68 | shift2 | 682 | 490 | 4 | 3.7% | 960 | 1 | 315 | 10 | ||
3867765 | -65 | shift2 | 451 | 500 | 5 | 980 | 0 | 320 | 12 | |||
1091959 | -64 | shift2 | 1268 | 510 | 7 | 1000 | 1 | 325 | 8 | |||
3289914 | -62 | 520 | 1 | 47 | 330 | 7 | ||||||
1568904 | -61 | 530 | 3 | 335 | 11 | |||||||
465562 | -59 | 540 | 4 | 340 | 8 | |||||||
2309068 | -59 | 550 | 7 | 345 | 12 | |||||||
780196 | -58 | 560 | 2 | 350 | 5 | |||||||
2759874 | -55 | 570 | 1 | 355 | 7 | |||||||
3267314 | -53 | 580 | 5 | 601 à max | 360 | 7 | ||||||
210683 | -52 | 590 | 1 | 48 | 365 | 7 | ||||||
1365051 | -52 | 600 | 2 | 1.3% | 370 | 13 | ||||||
622208 | -50 | reste | 48 | reste | 1 | reste | 187 | |||||
2342888 | -49 | total | 3786 | total | 3786 | total | 3786 |
rru autres intercalaires[modifier | modifier le wikicode]
- Lien tableur: rru autres intercalaires
- Légende:
- - comp, le gène est sur le brin complement
- - deb, fin sont respectivement dans le sens des adresses croissantes, le cds avant le 1er tRNA et le cds après le dernier tRNA du bloc.
|
|
|
rru intercalaires tRNA[modifier | modifier le wikicode]
- Lien tableur: rru intercalaires tRNA
- Légende:
- - comp', l'intercalaire est entre un gène comp (sur le complément) et un gène sur le brin direct. Continu les 2 gènes sont sur le même brin.
- - deb, fin sont les intercalaires des cds du tableau précédent, autres intercalaires: respectivement dans le sens des adresses croissantes, le cds avant le 1er tRNA et le cds après le dernier tRNA du bloc.
- Cumuls comp'+continu du tableau
deb fin total <201 25 29 54 total 41 42 83 taux 61% 69% 65%
|
|
rru intercalaires rRNA[modifier | modifier le wikicode]
- Voir la présentation des blocs à rRNA dans le chapitre rru blocs de l'étude préliminaire. A comparer avec le tableau rru autres intercalaires.
- Remarque: Quand le 16s n'est pas précédé de tRNAs l'intercalaire cds-16s est élevé, pour le 4ème bloc il est ici de 1227 pbs. L'intercalaire cds-bloc de l'autre côté du bloc est beaucoup plus faible, ici 130 pbs. Les 3 autres blocs ont un aa après le 5s et conserve la même orientation. Cette orientation est quasiment générale chez tous les génomes que j'ai étudié ici. Je l'ai notée dans les chapitres génome-bloc de chaque génome.
- Note: J'ai supposé souvent que les blocs à tRNA sans rRNA sont aussi orientés de l'intercalaire le plus grand au plus petit. Dans rru cumuls et de même pour les autres génomes, j'ai noté cette orientation dans la colonne cdsd, pour cds dirigé. Je n'ai conservé pour les calculs que le plus petit intercalaire des 2 cds bordant le bloc. L'idée était que cette orientation provoquait la création du cds en fin de bloc. Ces cds sont souvent de petites protéines et souvent hypothétiques. Aussi je présente ci-dessous la transformation deb-fin qui est imposée par l'adressage en intercalaire plus grand et plus petit.
deb fin tri grand petit deb fin tri grand petit 163 253 17 396 12 295 150 5 406 98 37 299 37 224 27 89 178 14 150 98 147 136 2 299 37 73 126 29 430 103 257 319 6 224 43 202 75 36 387 103 406 98 33 262 56 354 171 13 131 116 224 43 28 127 57 151 343 40 269 118 92 141 30 90 60 93 166 20 186 123 115 83 16 85 63 57 127 3 147 136 239 170 15 284 70 430 103 12 283 139 217 86 11 117 71 90 60 31 237 140 71 117 23 126 73 140 237 39 721 148 283 139 24 202 75 234 77 21 295 150 116 131 32 234 77 262 56 26 343 151 98 150 8 115 83 84 407 1 253 163 284 70 34 407 84 163 95 19 261 164 85 63 10 217 86 103 387 9 239 170 12 396 22 178 89 27 224 25 354 171 175 215 7 141 92 187 179 18 215 175 164 261 27 166 93 721 148 38 187 179 123 186 35 163 95 269 118 4 319 257
Ochrobactrum anthropi ATCC 49188[modifier | modifier le wikicode]
oan opérons[modifier | modifier le wikicode]
- Lien tableur: oan opérons
- Liens: gtRNAdb [17], NCBI [18], génome [orgn]
- Phylogénie: Bacteria; Proteobacteria; Alphaproteobacteria; Rhizobiales; Brucellaceae; Ochrobactrum.
- Légende: cdsa: cds aas, cdsd: cds dirigé
56.1%GC | 27.12.19 Paris | 61 | doubles | intercal | cds | aa | avec aa | cdsa | cdsd | protéines |
---|---|---|---|---|---|---|---|---|---|---|
chromosom1 | ||||||||||
34057..34446 | cds | 224 | 224 | 130 | TIGR02300 family protein | |||||
34671..34746 | gcc | @1 | -40 | -40 | ||||||
34707..35480 | cds | 258 | glutathione S-transferase family protein | |||||||
223549..224394 | cds | 164 | 164 | 282 | 3'(2'),5'-bisphosphate nucleotidase CysQ | |||||
224559..224635 | ccg | 109 | 109 | |||||||
comp | 224745..225806 | cds | 354 | site-specific integrase | ||||||
comp | 337757..338197 | cds | 158 | 158 | 147 | DMT family transporter | ||||
comp | 338356..338431 | ttc | 171 | 171 | ||||||
comp | 338603..338818 | cds | 72 | DNA gyrase inhibitor YacG | ||||||
comp | 344419..344598 | cds | 147 | 147 | 60 | hp | ||||
344746..344820 | acc | 397 | 397 | |||||||
345218..346030 | cds | 271 | DUF2189 domain-containing protein | |||||||
comp | 351922..353328 | cds | 167 | 167 | 469 | deoxyribodipyrimidine photo-lyase | ||||
comp | 353496..353572 | cgt | 159 | 159 | ||||||
comp | 353732..355285 | cds | 518 | HAMP domain-containing histidine kinase | ||||||
comp | 725472..726479 | cds | 219 | 219 | 336 | glycosyltransferase family 4 protein | ||||
726699..726773 | caa | 61 | 61 | |||||||
comp | 726835..727413 | cds | 193 | hp | ||||||
comp | 934613..934987 | cds | 333 | 333 | 125 | transposase | ||||
comp | 935321..935397 | agg | 114 | 114 | ||||||
comp | 935512..936675 | cds | 388 | amidohydrolase | ||||||
1049919..1051202 | cds | 24 | 24 | 428 | cystathionine gamma-synthase family protein | |||||
comp | 1051227..1051311 | ttg | @2 | 593 | 593 | |||||
comp | 1051905..1053539 | cds | 545 | phosphoethanolamine transferase | ||||||
comp | 1081066..1083021 | cds | 998 | 998 | 652 | M23 family metallopeptidase | ||||
1084020..1085508 | 16s | 268 | 1489 | |||||||
1085777..1085853 | atc | 11 | 11 | |||||||
1085865..1085940 | gca | 39 | 39 | |||||||
>comp | 1085980..1086168 | cds | @3 | 38 | 38 | 63 | P-hp | |||
1086207..1089125 | 23s | 186 | 2919 | |||||||
1089312..1089426 | 5s | 54 | 115 | |||||||
1089481..1089557 | atgf | 363 | 363 | |||||||
1089921..1090091 | cds | 57 | LysR family transcriptional regulator | |||||||
1096454..1096912 | cds | 7 | 7 | 153 | hp | |||||
comp | 1096920..1097009 | tcg | 352 | 352 | ||||||
1097362..1097751 | cds | 130 | 50S ribosomal protein L21 | |||||||
1311344..1311823 | cds | 211 | 211 | 160 | hp | |||||
1312035..1312109 | gag | 88 | 88 | |||||||
1312198..1312467 | cds | 90 | hp | |||||||
1344750..1345565 | cds | 677 | 677 | 272 | IclR family transcriptional regulator | |||||
1346243..1347731 | 16s | 268 | 1489 | |||||||
1348000..1348076 | atc | 11 | 11 | |||||||
1348088..1348163 | gca | 39 | 39 | |||||||
>comp | 1348203..1348391 | cds | 38 | 38 | 63 | P-hp | ||||
1348430..1351348 | 23s | 186 | 2919 | |||||||
1351535..1351649 | 5s | 54 | 115 | |||||||
1351704..1351780 | atgf | 360 | 360 | |||||||
1352141..1353082 | cds | 314 | LysR family transcriptional regulator | |||||||
1354558..1355604 | cds | 85 | 85 | 349 | polysaccharide deacetylase family protein | |||||
comp | 1355690..1355764 | ggc | 136 | 136 | ||||||
comp | 1355901..1357280 | cds | 460 | MFS transporter | ||||||
comp | 1386666..1387982 | cds | 819 | 819 | 439 | hp | ||||
comp | 1388802..1388891 | tcc | 374 | 374 | ||||||
1389266..1389589 | cds | 108 | hp | |||||||
comp | 1405236..1405859 | cds | 139 | 139 | 208 | 5,6-dimethylbenzimidazole synthase | ||||
comp | 1405999..1406085 | ctg | 146 | 146 | ||||||
comp | 1406232..1406852 | cds | 207 | 2,3-bisphosphoglycerate-dependent phosphoglycerate mutase | ||||||
comp | 1604615..1604854 | cds | 26 | 26 | 80 | hp | ||||
comp | 1604881..1604958 | atgj | 10 | 10 | ||||||
comp | 1604969..1605214 | cds | 82 | hp | ||||||
1639492..1640289 | cds | -44 | -44 | 266 | hp | |||||
comp | 1640246..1640322 | atgj | 55 | 55 | ||||||
1640378..1640572 | cds | 65 | hp | |||||||
comp | 1778816..1779571 | cds | 385 | 385 | 252 | SIMPL domain-containing protein | ||||
1779957..1780033 | atgi | 265 | 265 | |||||||
1780299..1780844 | cds | 182 | sigma-70 family RNA polymerase sigma factor | |||||||
> | 1945985..1946374 | cds | 721 | 721 | 130 | P-hp | ||||
comp | 1947096..1947171 | aag | -38 | -38 | ||||||
comp | 1947134..1947319 | cds | 62 | hp | ||||||
comp | 2014813..2015097 | cds | 103 | 103 | 95 | DUF2218 domain-containing protein | ||||
comp | 2015201..2015275 | gaa | + | 146 | 146 | |||||
comp | 2015422..2015496 | gaa | 2 gaa | 200 | 200 | |||||
comp | 2015697..2016962 | cds | 422 | DUF882 domain-containing protein | ||||||
comp | 2040234..2040453 | cds | 91 | 91 | 73 | hp | ||||
2040545..2040629 | tac | 24 | 24 | |||||||
2040654..2040727 | gga | 6 | 6 | |||||||
comp | 2040734..2040916 | cds | -50 | -50 | 61 | hp | ||||
2040867..2042042 | cds | 65 | 65 | 392 | elongation factor Tu | |||||
2042108..2042183 | tgg | 420 | 420 | |||||||
2042604..2042804 | cds | 67 | preprotein translocase subunit SecE | |||||||
2168416..2168658 | cds | 28 | 28 | 81 | PepSY domain-containing protein | |||||
comp | 2168687..2168760 | ggg | 289 | 289 | ||||||
2169050..2169946 | cds | 299 | lipid kinase | |||||||
comp | 2244184..2245050 | cds | 112 | 112 | 289 | mechanosensitive ion channel | ||||
comp | 2245163..2245248 | tta | 200 | 200 | ||||||
2245449..2246705 | cds | 419 | threonine ammonia-lyase IlvA | |||||||
2267888..2268835 | cds | 305 | 305 | 316 | patatin family protein | |||||
2269141..2269225 | ctc | 66 | 66 | |||||||
comp | 2269292..2270185 | cds | 298 | tyrosine-type recombinase/integrase | ||||||
2332394..2333530 | cds | 393 | 393 | 379 | glycosyltransferase family 2 protein | |||||
comp | 2333924..2334000 | cgg | 169 | 169 | ||||||
comp | 2334170..2335792 | cds | 541 | ABC-F family ATP-binding cassette domain-containing protein | ||||||
comp | 2339396..2340514 | cds | 1650 | 1650 | 373 | porin | ||||
comp | 2342165..2342239 | gtg | 178 | 178 | ||||||
comp | 2342418..2344424 | cds | 669 | murein L,D-transpeptidase | ||||||
comp | 2369668..2370441 | cds | 152 | 152 | 258 | NAD kinase | ||||
2370594..2370669 | aca | 987 | 987 | |||||||
comp | 2371657..2372076 | cds | 140 | SUF system Fe-S cluster assembly protein | ||||||
comp | 2442729..2443145 | cds | 299 | 299 | 139 | hp | ||||
comp | 2443445..2443519 | atgf | 70 | 70 | ||||||
<comp | 2443590..2443799 | cds | 70 | helix-turn-helix domain-containing protein | ||||||
comp | 2449947..2451311 | cds | 156 | 156 | 455 | tyrosine-type recombinase/integrase | ||||
comp | 2451468..2451550 | cta | 236 | 236 | ||||||
comp | 2451787..2452356 | cds | 190 | hp | ||||||
comp | 2548914..2550098 | cds | 513 | 513 | 395 | alpha/beta hydrolase | ||||
comp | 2550612..2550688 | gac | + | 245 | 245 | |||||
comp | 2550934..2551010 | gac | 2 gac | 328 | 328 | |||||
2551339..2551956 | cds | 206 | TetR/AcrR family transcriptional regulator | |||||||
2604616..2605908 | cds | 824 | 824 | 431 | FAD-binding oxidoreductase | |||||
comp | 2606733..2606808 | gta | 264 | 264 | ||||||
comp | 2607073..2607996 | cds | 308 | sugar kinase | ||||||
2641040..2641360 | cds | 97 | 97 | 107 | YnfA family protein | |||||
2641458..2641534 | ccc | 94 | 94 | |||||||
2641629..2642357 | cds | 243 | SDR family oxidoreductase | |||||||
2696299..2697183 | cds | 54 | 54 | 295 | transcriptional regulator GcvA | |||||
comp | 2697238..2697314 | aga | 123 | 123 | ||||||
comp | 2697438..2697743 | cds | 156 | 156 | 102 | ETC complex I subunit | ||||
comp | 2697900..2697976 | cca | 186 | 186 | ||||||
2698163..2698309 | cds | 49 | hp | |||||||
comp | 2771579..2772697 | cds | 584 | 584 | 373 | porin | ||||
2773282..2773372 | agc | 203 | 203 | |||||||
2773576..2774643 | cds | 356 | porin | |||||||
chromosom2 | ||||||||||
149537..151504 | cds | 355 | 355 | 656 | selenocysteine-specific translation elongation factor | |||||
151860..151955 | tga | 14 | 14 | |||||||
comp | 151970..152605 | cds | 212 | lipase | ||||||
comp | 298403..299422 | cds | 300 | 300 | 340 | TerC family protein | ||||
comp | 299723..299796 | cag | 361 | 361 | ||||||
comp | 300158..300460 | cds | 101 | DUF1127 domain-containing protein | ||||||
455428..456111 | cds | 713 | 713 | 228 | FkbM family methyltransferase | |||||
456825..458313 | 16s | 268 | 1489 | |||||||
458582..458658 | atc | 11 | 11 | |||||||
458670..458745 | gca | 39 | 39 | |||||||
>comp | 458785..458973 | cds | 38 | 38 | 63 | P-hp | ||||
459012..461930 | 23s | 186 | 2919 | |||||||
462117..462231 | 5s | 54 | 115 | |||||||
462286..462362 | atgf | -44 | -44 | |||||||
comp | 462319..463974 | cds | 552 | recombinase family protein | ||||||
comp | 572059..572721 | cds | 545 | 545 | 221 | response regulator transcription factor | ||||
comp | 573267..573357 | other | @4 | 620 | 620 | |||||
comp | 573978..575285 | cds | 436 | SidA/IucD/PvdA family monooxygenase | ||||||
comp | 611464..611742 | cds | 88 | 88 | 93 | hp | ||||
comp | 611831..611905 | ggc | 387 | 387 | ||||||
612293..612814 | cds | 174 | prolyl-tRNA synthetase associated domain-containing protein | |||||||
991265..991999 | cds | 217 | 217 | 245 | alpha/beta hydrolase | |||||
comp | 992217..992306 | tca | 323 | 323 | ||||||
992630..992884 | cds | 85 | DUF2171 domain-containing protein | |||||||
comp | 1031528..1032946 | cds | 607 | 607 | 473 | PepSY domain-containing protein | ||||
comp | 1033554..1033629 | aaa | 327 | 327 | ||||||
1033957..1035651 | cds | 565 | membrane protein | |||||||
1067405..1068742 | cds | 131 | 131 | 446 | DNA polymerase IV | |||||
1068874..1068947 | tgc | 739 | 739 | |||||||
1069687..1069905 | cds | 73 | hp | |||||||
1081639..1082031 | cds | 103 | 103 | 131 | hp | |||||
comp | 1082135..1082209 | aac | 168 | 168 | ||||||
1082378..1082653 | cds | 92 | hp | |||||||
comp | 1333375..1333587 | cds | 209 | 209 | 71 | hp | ||||
comp | 1333797..1333873 | cac | 352 | 352 | ||||||
1334226..1337393 | cds | 1056 | PAS domain S-box protein | |||||||
1473437..1474405 | cds | 269 | 269 | 323 | nitronate monooxygenase | |||||
1474675..1474750 | acg | 156 | 156 | |||||||
>comp | 1474907..1475239 | cds | 111 | DNA adenine methylase | ||||||
comp | 1597496..1597666 | cds | 363 | 363 | 57 | LysR family transcriptional regulator | ||||
comp | 1598030..1598106 | atgf | 54 | |||||||
comp | 1598161..1598275 | 5s | 186 | 115 | ||||||
comp | 1598462..1601380 | 23s | 38 | 38 | 2919 | |||||
< | 1601419..1601607 | cds | 39 | 39 | 63 | P-hp | ||||
comp | 1601647..1601722 | gca | 11 | 11 | ||||||
comp | 1601734..1601810 | atc | 268 | |||||||
comp | 1602079..1603567 | 16s | 743 | 743 | 1489 | |||||
1604311..1605192 | cds | 294 | ATPase | |||||||
1720169..1720531 | cds | 113 | 113 | 121 | response regulator | |||||
1720645..1720719 | gtc | 465 | 465 | |||||||
1721185..1721838 | cds | 218 | protein-L-isoaspartate(D-aspartate) O-methyltransferase |
oan cumuls[modifier | modifier le wikicode]
- Lien tableur: oan cumuls
opérons | Fréquences intercalaires tRNAs | Fréquences intercalaires cds | Fréquences aas cds chromosome | ||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
effectif | gammes | sans rRNAs | avec rRNAs | gammes | cds | gammes | cdsd | gammes | cdsa | gammes | cdsa 300 | ||
avec rRNA | opérons | 4 | 1 | 4 | 1 | 5 | 1 | 100 | 25 | 1 | 0 | ||
16atcgca-cds | 4 | 20 | 50 | 15 | 40 | 200 | 20 | 30 | 0 | ||||
- | 40 | 1 | 100 | 12 | 80 | 300 | 21 | 60 | 4 | ||||
- | 60 | 150 | 12 | 120 | 400 | 15 | 90 | 18 | |||||
max a | 3 | 80 | 200 | 15 | 160 | 500 | 11 | 120 | 8 | ||||
a doubles | 0 | 100 | 250 | 7 | 200 | 600 | 5 | 150 | 9 | ||||
spéciaux | 0 | 120 | 300 | 6 | 240 | 700 | 3 | 180 | 3 | ||||
total aas | 12 | 140 | 350 | 5 | 280 | 800 | 0 | 210 | 6 | ||||
sans | opérons | 45 | 160 | 1 | 400 | 12 | 320 | 900 | 0 | 240 | 4 | ||
1 aa | 42 | 180 | 450 | 1 | 360 | 1000 | 0 | 270 | 6 | ||||
max a | 2 | 200 | 500 | 1 | 400 | 1100 | 1 | 300 | 8 | ||||
a doubles | 2 | 1 | 16 | 0 | 35 | ||||||||
total aas | 48 | 3 | 4 | 107 | 0 | 101 | 101 | ||||||
total aas | 60 | ||||||||||||
remarques | 4 | ||||||||||||
avec jaune | moyenne | 138 | 11 | 258 | 256 | ||||||||
variance | 111 | 0 | 268 | 180 | |||||||||
sans jaune | moyenne | 174 | 218 | 150 | |||||||||
variance | 117 | 132 | 81 |
oan blocs[modifier | modifier le wikicode]
- Lien tableur: oan blocs
- Légende:
- p-hp pseudo hypothetical protein
Constantes | |||
cds | intercal | cdsa | |
16s | 268 | 1489 | |
atc | 11 | ||
gca | 39 | ||
cds | 38 | 63 | p-hp |
23s | 186 | 2919 | |
5s | 54 | 115 | |
atgf | |||
cds | |||
Variations | |||
bloc 16s | intercal | cdsa | |
---|---|---|---|
1084020..1085508 | 998 | 652 | M23 family metallopeptidase |
363 | 57 | LysR family transcriptional regulator | |
1346243..1347731 | 677 | 272 | IclR family transcriptional regulator |
360 | 314 | LysR family transcriptional regulator | |
456825..458313 | 713 | 228 | FkbM family methyltransferase |
-44 | 552 | recombinase family protein | |
1602079..1603567 | 743 | 294 | ATPase |
363 | 57 | LysR family transcriptional regulator |
oan remarques[modifier | modifier le wikicode]
- Remarques: Par rapport aux rickettsia rtb et rpl, les intercalaires très élevés existent, 3 contre 10, 987 988 1650. Ce génome est analogue à agr pour les cds internes aux blocs à RNAs.
- @ Des intercalaires négatifs avec les cds, 5, de -40 à -50 même dans un bloc à rRNAs, -44.
- @ Les intercalaires avec les cds élevés supérieurs à 500, 16 dont 4 pour les blocs. Voir le tableau des intercalaires ci-dessous .
- - Par rapport à agr analogue de ce génome, il y a nettement plus d’intercalaires élevés. Sur 45 blocs à aas il y a 12 intercalaires supérieurs à 500, contre 6 pour 38 aas chez agr.
- - Un seul cas où les 2 intercailaires d’un cluster sont supérieurs à 500, other, voir @4 ici.
- - Tous les 11 autres paires sont très assymétriques.
- - 2 intercalaires sur 3 entre aas sont du même ordre que la moyenne de ceux des cds sans jaune, 245 et 146 contre 174 pour la moyenne de ceux des cds.
- @ Les blocs à rRNAs sont identiques et ne diffèrent que par l’intercalaire du cds.
- - Le cds intra blocs est une pseudo protéine hypothétique, de faible taille, 63aas.
- - Ses intercalaires avec gca et 23s sont quasi identiques, très faibles et se situent dans la 1ère gamme des intercalaires cds.
- @ other, cela doit être un tRNA incomplet comme ceux des mitochondries
- Note: les cds intra bloc à rRNAs. Les 4 blocs sont identiques. Cela veut dire que le cds interne est bien du au processus de la création des blocs. Le fait que le cds soit un pseudo renforce encore l’hypothèse de la création de ce cds par le processus de création ou de conversion. Voir remarque @2 de agr remarques.
- Note du 3.10.20: le contrôle des 4 cds montre qu'ils sont absents au 31.7.20, date du NCBI.
- Séquences des doubles, quasiment pas de doubles, 42 solitaires sur 45 opérons et 2 doubles seulement, gac et gaa.
- Tableau des intercalaires
Intercalaires élevés Intercalaires moyens pbs adresse RNA pbs adresse tRNA 1650 2342165 gtg 465 1720645 gtc 987 2370594 aca 420 2042108 tgg 824 2606733 gta 397 344746 acc 819 1096920 tcg 387 611831 ggc 739 1068874 tgc 385 1779957 atgi 721 1947096 aag 363 1089481 atgf 620 573267 other isolé 363 1598030 atgf 607 1033554 aaa 352 1333797 cac 593 1051227 ttg 333 935321 agg 584 2773282 agc 323 992217 tca 513 2550612 gac 305 2269141 ctc 998 1084020 16s 743 1602079 16s 713 456825 16s 677 1346243 16s
oan distribution[modifier | modifier le wikicode]
- Lien tableur: oan distribution
g1 | t1 | ||||||
---|---|---|---|---|---|---|---|
atgi | 1 | tct | tat | atgf | 5 | ||
att | act | aat | agt | ||||
ctt | cct | cat | cgc | ||||
gtt | gct | gat | ggt | ||||
ttc | 1 | tcc | 1 | tac | 1 | tgc | 1 |
atc | 4 | acc | 1 | aac | 1 | agc | 1 |
ctc | 1 | ccc | 1 | cac | 1 | cgt | 1 |
gtc | 1 | gcc | 1 | gac | 2 | ggc | 2 |
tta | 1 | tca | 1 | taa | tga | 1 | |
ata | aca | 1 | aaa | 1 | aga | 1 | |
cta | 1 | cca | 1 | caa | 1 | cga | |
gta | 1 | gca | 4 | gaa | 2 | gga | 1 |
ttg | 1 | tcg | 1 | tag | tgg | 1 | |
atgj | 2 | acg | 1 | aag | 1 | agg | 1 |
ctg | 1 | ccg | 1 | cag | 1 | cgg | 1 |
gtg | 1 | gcg | gag | 1 | ggg | 1 | |
alpha | >1aa | =1aa | -5s | +5s | -16s | +16s | total |
oan | 6 | 41 | 4 | 8 | 59 |
Azospirillum brasilense Az39[modifier | modifier le wikicode]
abq opérons[modifier | modifier le wikicode]
- Lien tableur: abq opérons
- Liens: gtRNAdb [19], NCBI [20], génome [21]
- Phylogénie: Bacteria; Proteobacteria; Alphaproteobacteria; Rhodospirillales; Rhodospirillaceae; Azospirillum.
- Légende: cdsa: cds aas, cdsd: cds dirigé
68.45%GC | 29.12.19 Paris | 88 | doubles | intercal | cds | aa | avec aa | cdsa | cdsd | protéines |
---|---|---|---|---|---|---|---|---|---|---|
chromosome | ||||||||||
125527..126444 | cds | 127 | 127 | 306 | restriction endonuclease | |||||
comp | 126572..126647 | gcg | 206 | 206 | ||||||
126854..127138 | cds | 95 | YggT family protein | |||||||
comp | 163237..164982 | cds | 175 | 175 | 582 | hydrogenase maturation nickel metallochaperone HypA | ||||
165158..165234 | agg | 59 | 59 | |||||||
165294..166022 | cds | 243 | SDR family NAD(P)-dependent oxidoreductase | |||||||
comp | 188235..189860 | cds | 42 | 42 | 542 | glycosyltransferase | ||||
comp | 189903..189977 | acg | 81 | 81 | ||||||
comp | 190059..191987 | cds | 643 | DNA helicase RecQ | ||||||
comp | 250833..251111 | cds | 169 | 169 | 93 | hp | ||||
comp | 251281..251356 | gcc | 141 | 141 | ||||||
comp | 251498..251893 | cds | 132 | TIGR02300 family protein | ||||||
comp | 458142..458459 | cds | 209 | 209 | 106 | 50S ribosomal protein L21 | ||||
458669..458758 | tcg | 63 | 63 | |||||||
comp | 458822..459664 | cds | 281 | alpha/beta hydrolase fold domain-containing protein | ||||||
comp | 496776..497171 | cds | 162 | 162 | 132 | cupin domain-containing protein | ||||
comp | 497334..497420 | ttg | 137 | 137 | ||||||
497558..498085 | cds | 176 | disulfide bond formation protein B | |||||||
comp | 615937..616350 | cds | 121 | 121 | 138 | hp | ||||
comp | 616472..616548 | ccg | + | 206 | 206 | |||||
comp | 616755..616831 | ccg | 2 ccg | 109 | 109 | |||||
comp | 616941..617957 | cds | 339 | farnesyltranstransferase | ||||||
comp | 748703..749161 | cds | 38 | 38 | 153 | hp | ||||
comp | 749200..749275 | aca | 91 | 91 | ||||||
comp | 749367..750221 | cds | 144 | 144 | 285 | 23s rRNA (guanosine(2251)-2'-O)-methyltransferase RlmB | ||||
750366..750451 | tac | 60 | 60 | |||||||
750512..750585 | gga | 81 | 81 | |||||||
750667..751857 | cds | 153 | 153 | 397 | elongation factor Tu | |||||
752011..752086 | tgg | 69 | 69 | |||||||
752156..752353 | cds | 66 | preprotein translocase subunit SecE | |||||||
comp | 794457..795983 | cds | 296 | 296 | 509 | methyltransferase domain-containing protein | ||||
796280..796355 | aag | + | 76 | 76 | ||||||
796432..796507 | aag | 2 aag | 109 | 109 | ||||||
comp | 796617..797057 | cds | 147 | MaoC family dehydratase | ||||||
870412..872373 | cds | 159 | 159 | 654 | RNA polymerase sigma factor RpoD | |||||
872533..872608 | atgi | 5 | 5 | |||||||
comp | 872614..873093 | cds | 134 | 134 | 160 | GNAT family N-acetyltransferase | ||||
comp | 873228..873304 | cgt | 212 | 212 | ||||||
873517..874023 | cds | 169 | hp | |||||||
931962..933011 | cds | 68 | 68 | 350 | low specificity L-threonine aldolase | |||||
933080..933155 | gag | + | 38 | 38 | ||||||
933194..933269 | gag | 2 gag | 72 | 72 | ||||||
comp | 933342..934340 | cds | 333 | transglycosylase SLT domain-containing protein | ||||||
997881..998357 | cds | 246 | 246 | 159 | peptidoglycan-associated lipoprotein Pal | |||||
comp | 998604..998678 | acc | 175 | 175 | ||||||
comp | 998854..1000815 | cds | 654 | polysaccharide biosynthesis protein | ||||||
comp | 1164137..1165048 | cds | 159 | 159 | 304 | DUF3108 domain-containing protein | ||||
1165208..1165282 | gtg | + | 132 | 132 | ||||||
1165415..1165489 | gtg | 2 gtg | 231 | 231 | ||||||
1165721..1165885 | cds | 55 | hp | |||||||
1242416..1242919 | cds | 85 | 85 | 168 | MerR family transcriptional regulator | |||||
1243005..1243081 | ccc | 139 | 139 | |||||||
comp | 1243221..1244999 | cds | 593 | cyclic nucleotide-binding domain-containing protein | ||||||
comp | 1353398..1353895 | cds | 118 | 118 | 166 | hp | ||||
1354014..1354091 | cca | 49 | 49 | |||||||
1354141..1354437 | cds | 10 | 10 | 99 | ETC complex I subunit | |||||
1354448..1354524 | aga | 443 | 443 | |||||||
1354968..1355213 | cds | 82 | hp | |||||||
comp | 1370270..1370500 | cds | 196 | 196 | 77 | hp | ||||
comp | 1370697..1370772 | aac | @2 | 220 | 220 | |||||
comp | 1370993..1371066 | tgc | 218 | 218 | ||||||
1371285..1371941 | cds | 219 | protein-L-isoaspartate O-methyltransferase | |||||||
comp | 1427443..1427733 | cds | 236 | 236 | 97 | YkgJ family cysteine cluster protein | ||||
comp | 1427970..1428085 | 5s | 129 | 116 | ||||||
comp | 1428215..1430967 | 23s | 266 | 2753 | ||||||
comp | 1431234..1431309 | gca | 30 | 30 | ||||||
comp | 1431340..1431416 | atc | 108 | |||||||
comp | 1431525..1433015 | 16s | 779 | 779 | 1491 | |||||
1433795..1437778 | cds | 1328 | non-ribosomal peptide synthetase | |||||||
comp | 1576457..1577296 | cds | 243 | 243 | 280 | aldo/keto reductase | ||||
comp | 1577540..1577615 | gaa | 123 | 123 | ||||||
comp | 1577739..1579538 | cds | 600 | single-stranded-DNA-specific exonuclease RecJ | ||||||
comp | 1723089..1723457 | cds | 344 | 344 | 123 | NADH-quinone oxidoreductase subunit A | ||||
comp | 1723802..1723878 | gac | 164 | 164 | ||||||
comp | 1724043..1724117 | gta | 106 | 106 | ||||||
comp | 1724224..1724496 | cds | 91 | HU family DNA-binding protein | ||||||
comp | 1730385..1731719 | cds | 91 | 91 | 445 | trigger factor | ||||
comp | 1731811..1731895 | cta | 173 | 173 | ||||||
comp | 1732069..1733634 | cds | 522 | malonyl-CoA decarboxylase | ||||||
comp | 1733741..1735207 | cds | 129 | 129 | 489 | bifunctional ADP-dependent NAD(P)H-hydrate dehydratase/NAD(P)H-hydrate epimerase | ||||
comp | 1735337..1735412 | cac | + | 109 | 109 | |||||
comp | 1735522..1735597 | cac | 2 cac | 337 | 337 | |||||
1735935..1736273 | cds | 113 | P-II family nitrogen regulator | |||||||
1951126..1951752 | cds | 149 | 149 | 209 | nitrogen fixation protein NifQ | |||||
1951902..1951987 | tac | 74 | 74 | |||||||
comp | 1952062..1952424 | cds | 121 | hp | ||||||
1996903..1997244 | cds | 595 | 595 | 114 | hp | |||||
comp | 1997840..1997914 | atgj | 131 | 131 | ||||||
comp | 1998046..1999179 | cds | 378 | tRNA 2-thiouridine(34) synthase MnmA | ||||||
2086487..2088658 | cds | 156 | 156 | 724 | malate synthase G | |||||
comp | 2088815..2088889 | gtc | 234 | 234 | ||||||
2089124..2090002 | cds | 293 | N-formylglutamate amidohydrolase | |||||||
comp | 2303404..2303880 | cds | 414 | 414 | 159 | bacterioferritin | ||||
comp | 2304295..2304377 | tta | 406 | 406 | ||||||
comp | 2304784..2305029 | cds | 82 | hp | ||||||
2482875..2484518 | cds | 365 | 365 | 548 | recombinase family protein | |||||
comp | 2484884..2484974 | tcc | 120 | 120 | ||||||
comp | 2485095..2485898 | cds | 268 | alpha/beta hydrolase | ||||||
comp | 2640759..2641325 | cds | 149 | 149 | 189 | prolyl-tRNA synthetase associated domain-containing protein | ||||
2641475..2641549 | ggc | 688 | 688 | |||||||
2642238..2642915 | cds | 226 | dimethylmenaquinone methyltransferase | |||||||
comp | 2764482..2765567 | cds | 659 | 659 | 362 | hp | ||||
comp | 2766227..2766300 | ggg | 35 | 35 | ||||||
comp | 2766336..2766995 | cds | 220 | N-acetyltransferase | ||||||
2781933..2783774 | cds | 187 | 187 | 614 | EAL and GGDEF domain-containing protein | |||||
comp | 2783962..2784077 | 5s | 129 | 116 | ||||||
comp | 2784207..2786959 | 23s | 255 | 2753 | ||||||
comp | 2787215..2787290 | gca | 30 | 30 | ||||||
comp | 2787321..2787397 | atc | 108 | |||||||
comp | 2787506..2789006 | 16s | 496 | 496 | 1501 | |||||
comp | 2789503..2790207 | cds | 235 | phosphatase PAP2 family protein | ||||||
2843264..2843443 | cds | 77 | 77 | 60 | hp | |||||
comp | 2843521..2843597 | cgt | 170 | 170 | ||||||
2843768..2844268 | cds | 167 | xanthine phosphoribosyltransferase | |||||||
plasmide2 | ||||||||||
comp | 51090..51836 | cds | 481 | 481 | 249 | sigma-70 family RNA polymerase sigma factor | ||||
comp | 52318..52393 | tgg | 363 | 363 | ||||||
52757..53587 | cds | 277 | hp | |||||||
comp | 809229..810019 | cds | 870 | 870 | 264 | IS5 family transposase | ||||
comp | 810890..810966 | atgf | 96 | |||||||
comp | 811063..811178 | 5s | 127 | 116 | ||||||
comp | 811306..814058 | 23s | 266 | 2753 | ||||||
comp | 814325..814400 | gca | 30 | 30 | ||||||
comp | 814431..814507 | atc | 108 | |||||||
comp | 814616..816106 | 16s | 452 | 452 | 1491 | |||||
comp | 816559..817443 | cds | 295 | helix-turn-helix domain-containing protein | ||||||
plasmide4 | ||||||||||
196992..199346 | cds | 148 | 148 | 785 | mechanosensitive ion channel | |||||
199495..199581 | ctg | 30 | 30 | |||||||
199612..199687 | gcc | 188 | 188 | |||||||
199876..201333 | cds | 486 | hp | |||||||
237538..238578 | cds | 92 | 92 | 347 | response regulator | |||||
comp | 238671..238747 | cgg | 96 | 96 | ||||||
comp | 238844..239821 | cds | 326 | alpha/beta hydrolase | ||||||
comp | 257739..258470 | cds | 125 | 125 | 244 | lipoyl(octanoyl) transferase LipB | ||||
258596..258682 | ctc | 123 | 123 | |||||||
comp | 258806..259108 | cds | 101 | STAS domain-containing protein | ||||||
comp | 399367..400527 | cds | 278 | 278 | 387 | PQQ-dependent sugar dehydrogenase | ||||
comp | 400806..400921 | 5s | 129 | 116 | ||||||
comp | 401051..403803 | 23s | 255 | 2753 | ||||||
comp | 404059..404134 | gca | 30 | 30 | ||||||
comp | 404165..404241 | atc | 108 | |||||||
comp | 404350..405850 | 16s | 502 | 502 | 1501 | |||||
comp | 406353..406547 | cds | 65 | hp | ||||||
504531..504893 | cds | 82 | 82 | 121 | response regulator | |||||
504976..505051 | aac | 3 | 3 | |||||||
505055..505131 | gac | 4 | 4 | |||||||
505136..505210 | ggc | 102 | 102 | |||||||
comp | 505313..506080 | cds | 83 | 83 | 256 | helix-turn-helix transcriptional regulator | ||||
506164..506790 | cds | 202 | 202 | 209 | pyridoxamine 5'-phosphate oxidase | |||||
comp | 506993..507108 | 5s | 127 | 116 | ||||||
comp | 507236..509988 | 23s | 266 | 2753 | ||||||
comp | 510255..510330 | gca | 30 | 30 | ||||||
comp | 510361..510437 | atc | 110 | |||||||
comp | 510548..512038 | 16s | 615 | 615 | 1491 | |||||
512654..513568 | cds | 305 | lytic transglycosylase domain-containing protein | |||||||
comp | 588108..590768 | cds | 340 | 340 | 887 | bifunctional acetaldehyde-CoA/alcohol dehydrogenase | ||||
591109..591184 | ttc | 286 | 286 | |||||||
591471..592979 | cds | 503 | FAD-binding oxidoreductase | |||||||
plasmide5 | ||||||||||
86421..87089 | cds | 455 | 455 | 223 | RraA family protein | |||||
87545..87619 | ggc | 193 | 193 | |||||||
87813..88865 | cds | 351 | UDP-N-acetylglucosamine 4,6-dehydratase (inverting) | |||||||
plasmide1 | @3 | |||||||||
>comp | 115594..115896 | cds | 394 | 394 | 101 | P-IS5/IS1182 family transposase | ||||
comp | 116291..116367 | atgf | 96 | |||||||
comp | 116464..116579 | 5s | 129 | 116 | ||||||
comp | 116709..119461 | 23s | 255 | 2753 | ||||||
comp | 119717..119792 | gca | 30 | 30 | ||||||
comp | 119823..119899 | atc | 108 | |||||||
comp | 120008..121498 | 16s | 740 | 740 | 1491 | |||||
122239..123597 | cds | 453 | peptidoglycan DD-metalloendopeptidase family protein | |||||||
comp | 217550..218176 | cds | 123 | 123 | 209 | ribonuclease D | ||||
comp | 218300..218386 | ctg | 228 | 228 | ||||||
218615..219604 | cds | 330 | complex I NDUFA9 subunit family protein | |||||||
comp | 300477..301733 | cds | 472 | 472 | 419 | exonuclease subunit SbcD | ||||
302206..303696 | 16s | 108 | 1491 | |||||||
303805..303881 | atc | 30 | 30 | |||||||
303912..303987 | gca | 255 | ||||||||
304243..306995 | 23s | 129 | 2753 | |||||||
307125..307240 | 5s | 96 | 116 | |||||||
307337..307413 | atgf | 161 | 161 | |||||||
<comp | 307575..307805 | cds | 77 | p-ATP-binding protein | ||||||
comp | 466493..467710 | cds | 231 | 231 | 406 | site-specific integrase | ||||
comp | 467942..468031 | tca | 205 | 205 | ||||||
comp | 468237..468809 | cds | 191 | hp | ||||||
512242..512790 | cds | 136 | 136 | 183 | pantetheine-phosphate adenylyltransferase | |||||
512927..513002 | aaa | 209 | 209 | |||||||
513212..514036 | cds | 275 | DUF3618 domain-containing protein | |||||||
931813..933912 | cds | 79 | 79 | 700 | membrane protein | |||||
933992..934066 | caa | 382 | 382 | |||||||
comp | 934449..935270 | cds | 274 | hp | ||||||
comp | 948715..949743 | cds | 199 | 199 | 343 | Ppx/GppA family phosphatase | ||||
949943..950016 | cag | 246 | 246 | |||||||
comp | 950263..950829 | cds | 189 | IS3 family transposase | ||||||
> | 971260..971532 | cds | 493 | 493 | 91 | P-hp | ||||
comp | 972026..972119 | agc | 197 | 197 | ||||||
972317..972550 | cds | 78 | hp | |||||||
comp | 1302373..1303350 | cds | 166 | 166 | 326 | alpha-1,3-fucosyltransferase | ||||
comp | 1303517..1303592 | ttc | 98 | 98 | ||||||
comp | 1303691..1303876 | cds | 62 | DNA gyrase inhibitor YacG | ||||||
1349823..1350929 | cds | 145 | 145 | 369 | GNAT family N-acetyltransferase | |||||
comp | 1351075..1353828 | 23s | 262 | 2754 | ||||||
comp | 1354091..1355591 | 16s | @1 | 676 | 676 | 1501 | ||||
1356268..1356726 | cds | 153 | MarR family transcriptional regulator | |||||||
comp | 1441708..1443066 | cds | 153 | 153 | 453 | hp | ||||
1443220..1443294 | acc | 1 | 1 | |||||||
1443296..1443371 | gcg | 99 | 99 | |||||||
1443471..1443547 | gac | 44 | 44 | |||||||
1443592..1443666 | gtc | 1 | 1 | |||||||
1443668..1443741 | cag | 137 | 137 | |||||||
comp | 1443879..1446428 | cds | 850 | dipeptide ABC transporter ATP-binding protein | ||||||
1566394..1566612 | cds | 193 | 193 | 73 | hp | |||||
comp | 1566806..1566921 | 5s | 128 | 116 | ||||||
comp | 1567050..1569802 | 23s | 254 | 2753 | ||||||
comp | 1570057..1570132 | gca | 30 | 30 | ||||||
comp | 1570163..1570239 | atc | 94 | |||||||
comp | 1570334..1571834 | 16s | 444 | 444 | 1501 | |||||
comp | 1572279..1572707 | cds | 143 | DUF1489 domain-containing protein | ||||||
1723583..1724962 | cds | 94 | 94 | 460 | hp | |||||
comp | 1725057..1725143 | ctc | 475 | 475 | ||||||
1725619..1726311 | cds | 231 | FadR family transcriptional regulator | |||||||
1757680..1760568 | cds | 308 | 308 | 963 | PAS domain-containing protein | |||||
1760877..1760963 | ctg | 29 | 29 | |||||||
1760993..1761068 | gcc | 247 | 247 | |||||||
comp | 1761316..1761840 | cds | 175 | helix-turn-helix transcriptional regulator | ||||||
1854042..1855049 | cds | 135 | 135 | 336 | inorganic phosphate transporter | |||||
comp | 1855185..1855259 | ggc | 243 | 243 | ||||||
1855503..1858685 | cds | 1061 | AAA family ATPase | |||||||
>comp | 1883235..1883816 | cds | 210 | 210 | 194 | P-hp | ||||
1884027..1884102 | aac | 4 | 4 | |||||||
1884107..1884183 | gac | 32 | 32 | |||||||
comp | 1884216..1884821 | cds | 202 | hp |
abq cumuls[modifier | modifier le wikicode]
- Lien tableur: abq cumuls
opérons | Fréquences intercalaires tRNAs | Fréquences intercalaires cds | Fréquences aas cds chromosome | ||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
effectif | gammes | sans rRNAs | avec rRNAs | gammes | cds | gammes | cdsd | gammes | cdsa | gammes | cdsa 300 | ||
avec rRNA | opérons | 9 | 1 | 2 | 1 | 0 | 1 | 100 | 17 | 1 | 0 | ||
16atcgca235 | 5 | 20 | 3 | 50 | 7 | 40 | 200 | 29 | 30 | 0 | |||
Id-atgf | 3 | 40 | 3 | 8 | 100 | 19 | 80 | 300 | 24 | 60 | 2 | ||
16s23s | 1 | 60 | 2 | 150 | 26 | 120 | 400 | 18 | 90 | 9 | |||
max a | 3 | 80 | 1 | 200 | 20 | 160 | 500 | 8 | 120 | 11 | |||
a doubles | 0 | 100 | 1 | 250 | 18 | 200 | 600 | 8 | 150 | 8 | |||
spéciaux | 0 | 120 | 1 | 300 | 3 | 240 | 700 | 5 | 180 | 11 | |||
total aas | 19 | 140 | 1 | 350 | 4 | 280 | 800 | 2 | 210 | 9 | |||
sans | opérons | 51 | 160 | 0 | 400 | 4 | 320 | 900 | 2 | 240 | 6 | ||
1 aa | 38 | 180 | 1 | 450 | 4 | 360 | 1000 | 1 | 270 | 6 | |||
max a | 5 | 200 | 0 | 500 | 7 | 400 | 1100 | 1 | 300 | 8 | |||
a doubles | 5 | 2 | 9 | 1 | 46 | ||||||||
total aas | 68 | 17 | 8 | 121 | 0 | 116 | 116 | ||||||
total aas | 87 | ||||||||||||
remarques | 3 | ||||||||||||
avec jaune | moyenne | 72 | 30 | 227 | 308 | ||||||||
variance | 72 | 0 | 175 | 230 | |||||||||
sans jaune | moyenne | 153 | 249 | 166 | |||||||||
variance | 74 | 142 | 71 |
abq blocs[modifier | modifier le wikicode]
- Lien tableur: abq blocs
- Légende: lien au tableau des protéines, abrégé
- - vert: la taille des rRNAs en pbs alors que les protéines (cds) sont en aas.
bloc | intercal | cdsa | intercal | cdsa | intercal | cdsa | intercal | cdsa | intercal | cdsa | |||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
cds | 779 | 1328 | non ribosom | 496 | 235 | PAP2 fam | 502 | 65 | hp | 615 | 305 | lytic dom | 444 | 143 | DUF1489 |
16s | 108 | 1491 | 108 | 1501 | 108 | 1501 | 110 | 1491 | 94 | 1501 | |||||
atc | 30 | 30 | 30 | 30 | 30 | ||||||||||
gca | 266 | 255 | 255 | 266 | 254 | ||||||||||
23s | 129 | 2753 | 129 | 2753 | 129 | 2753 | 127 | 2753 | 128 | 2753 | |||||
5s | 236 | 116 | 187 | 116 | 278 | 116 | 202 | 116 | 193 | 116 | |||||
cds | 97 | YkgJ fam | 614 | EAL & GGDEF | 387 | PQQ | 209 | pyridoxamine | 73 | hp | |||||
cds | 452 | 295 | Hx-t-Hx | 740 | 453 | peptido fam | 472 | 419 | exo SbcD | ||||||
16s | 108 | 1491 | 108 | 1491 | 108 | 1491 | |||||||||
atc | 30 | 30 | 30 | ||||||||||||
gca | 266 | 255 | 255 | cds | 676 | 153 | MarR fam | ||||||||
23s | 127 | 2753 | 129 | 2753 | 129 | 2753 | 16s | 262 | 1501 | ||||||
5s | 96 | 116 | 96 | 116 | 96 | 116 | 23s | 145 | 2754 | ||||||
atgf | 870 | 394 | 161 | cds | 369 | GNAT fam | |||||||||
cds | 264 | IS5 fam | 101 | p-IS5/IS1182 | 77 | p-ATP-bind |
abq remarques[modifier | modifier le wikicode]
- Remarques
- - Les intercalaires élevés des cds: Ce génome ressemble à agr plus qu’à oan, voir le tableau des intercalaires ci-dessous. Le génome oan se rapproche plus des rickettsia avec 12 intercalaires cds-aa supérieurs à 500 et un maximum de 1650. Le génome abq a des intercalaires cds-aa inférieurs à 700 comme agr mais en plus grand nombre, 6 contre 3.
- @ Les blocs à RNAs: Les blocs sont nombreux, 9 16s, quasiment identiques et complets.
- - Sur 18 cds 2 hp 1 pseudo et 5 petits avec moins de 210 aas.
- - Tous les blocs sauf un (incomplet, 16s23s) sont de type 16satcgca23s5s dont 5 se terminent avec 5s et 3 avec 5s-atgf.
- - Les intercalaires internes, hors cds, sont quasiment identiques.
- - Les tailles des rRNAs du 23s et du 5s ne varient pas. Il y a 5 16s à 1491 pbs et 4 avec 1501 pbs.
- @ Les intercalaires entre aas: Il y a 13 blocs à plusieurs aas, pour 51 au total, contre 3 pour 45 chez oan et 3 pour 38 chez agr. Aussi je distingue 2 groupes comme avec agr et oan qui ont des effectifs très faibles.
- - un groupe de 10, normal dans cette étude, autour de 15 de moyenne, de 3 à 60 pbs
- - un groupe de 7, extrême, de 76 à 220 pbs. Le maximum est équivalent à celui de oan mais nettement inférieur aux 2 extrêmes de agr, 793 et 446.
- @ Les plasmides: génome exceptionnel avec 5 plasmides et 9 blocs à rRNAs. Exceptionnel aussi du fait qu’un plasmide, le plasmide 1, contient 4 blocs à rRNAs, soit 2 fois plus que le chromosome avec 2 blocs. Cette situation rappelle le cas unique du génome aua où le seul bloc à rRNA se trouve sur l’unique et tout petit plasmide de 10k pbs.
- Séquences des doubles: sur les 51 blocs à aas seulement 13 ont plus d’un aa. Les doubles sont tous des doublets de blocs à 2 aas, 5 sur 11, ccg aag gag gtg cac.
- Tableau des intercalaires
abq intercalaires entre aas abq intercalaires cds abq intercalaires cds 1370697 aac-tgc 220 810890 atgf 870 2641475 ggc 688 616472 ccg-ccg 206 1431525 16s 779 2766227 ggg 659 1723802 gac-gta 164 120008 16s 740 1997840 atgj 595 1165208 gtg-gtg 132 1354091 16s 676 972026 agc 493 1735337 cac-cac 109 510548 16s 615 1725057 ctc 475 1443296 gcg-gac 99 404350 16s 502 86421 ggc 455 796280 aag-aag 76 2787506 16s 496 1354448 aga 443 302206 16s 472 52318 tgg 481-363 814616 16s 452 2304295 tta 414-406 isolé 1570334 16s 444 intercalaires supérieurs à 500 pbs. agr oan abq 16s 2 4 6 aas 6 12 3 max 16s 633 998 870 max aas 793 1650 688
abq distribution[modifier | modifier le wikicode]
- Lien tableur: abq distribution
- Notes
aag2 cac2 ccg2 gag3 gtg3 ggc: 3 1aa et 1 >1aa
g1 | t1 | ||||||
---|---|---|---|---|---|---|---|
atgi | 1 | tct | tat | atgf | 3 | ||
att | act | aat | agt | ||||
ctt | cct | cat | cgc | ||||
gtt | gct | gat | ggt | ||||
ttc | 2 | tcc | 1 | tac | 2 | tgc | 1 |
atc | 8 | acc | 2 | aac | 3 | agc | 1 |
ctc | 2 | ccc | 1 | cac | 2 | cgt | 2 |
gtc | 2 | gcc | 3 | gac | 3 | ggc | 4 |
tta | 1 | tca | 1 | taa | tga | ||
ata | aca | 1 | aaa | 1 | aga | 1 | |
cta | 1 | cca | 1 | caa | 1 | cga | |
gta | gca | 8 | gaa | 1 | gga | 1 | |
ttg | 1 | tcg | 1 | tag | tgg | 2 | |
atgj | 1 | acg | 1 | aag | 2 | agg | 1 |
ctg | 3 | ccg | 2 | cag | 2 | cgg | 1 |
gtg | 3 | gcg | 2 | gag | 3 | ggg | 1 |
alpha | >1aa | =1aa | -5s | +5s | -16s | +16s | total |
abq | 30 | 38 | 3 | 16 | 87 |
Azospirillum brasilense Sp245[modifier | modifier le wikicode]
abs opérons[modifier | modifier le wikicode]
- Lien tableur: abs opérons
- Liens: gtRNAdb [22], NCBI [23], génome [24]
- Phylogénie: Bacteria; Proteobacteria; Alphaproteobacteria; Rhodospirillales; Rhodospirillaceae; Azospirillum.
- Légende: cdsa: cds aas, cdsd: cds dirigé
68.45%GC | 10.1.20 Paris | 80 | doubles | intercal | cds | aa | avec aa | cdsa | cdsd | protéines |
---|---|---|---|---|---|---|---|---|---|---|
chromosome [25] | ||||||||||
comp | 16414..16980 | cds | 163 | 163 | 189 | prolyl-tRNA synthetase associated domain-containing protein | ||||
17144..17218 | ggc | 670 | 670 | |||||||
17889..18566 | cds | 226 | demethylmenaquinone methyltransferase | |||||||
84790..85017 | cds | 114 | 114 | 76 | osmotically-inducible lipoprotein B | |||||
comp | 85132..85205 | ggg | 35 | 35 | ||||||
comp | 85241..85900 | cds | 220 | N-acetyltransferase | ||||||
comp | 93530..94258 | cds | 60 | 60 | 243 | SDR family NAD(P)-dependent oxidoreductase | ||||
comp | 94319..94395 | agg | 175 | 175 | ||||||
94571..96262 | cds | 564 | hp | |||||||
comp | 131833..132117 | cds | 206 | 206 | 95 | YggT family protein | ||||
132324..132399 | gcg | 140 | 140 | |||||||
comp | 132540..133586 | cds | 349 | DMT family transporter | ||||||
comp | 483582..484082 | cds | 170 | 170 | 167 | xanthine phosphoribosyltransferase | ||||
484253..484329 | cgt | 77 | 77 | |||||||
comp | 484407..484586 | cds | 60 | hp | ||||||
536869..537573 | cds | 495 | 495 | 235 | phosphatase PAP2 family protein | |||||
538069..539152 | 16s’ | @1 | 189 | 1084 | ||||||
539342..540019 | 23s° | 127 | 678 | |||||||
540147..540262 | 5s | 153 | 153 | 116 | ||||||
comp | 540416..542290 | cds | 625 | GGDEF domain-containing protein | ||||||
600048..601079 | cds | 79 | 79 | 344 | tyrosine-type recombinase/integrase | |||||
comp | 601159..601233 | acg | 81 | 81 | ||||||
comp | 601315..603243 | cds | 643 | DNA helicase RecQ | ||||||
comp | 656242..656520 | cds | 169 | 169 | 93 | hp | ||||
comp | 656690..656765 | gcc | 141 | 141 | ||||||
comp | 656907..657305 | cds | 133 | TIGR02300 family protein | ||||||
comp | 864141..864458 | cds | 209 | 209 | 106 | 50S ribosomal protein L21 | ||||
864668..864757 | tcg | 79 | 79 | |||||||
comp | 864837..865679 | cds | 281 | alpha/beta hydrolase | ||||||
927651..927896 | cds | 392 | 392 | 82 | hp | |||||
928289..928371 | tta | 175 | 175 | |||||||
928547..929164 | cds | 206 | hp | |||||||
comp | 1148345..1149223 | cds | 234 | 234 | 293 | N-formylglutamate amidohydrolase | ||||
1149458..1149532 | gtc | 106 | 106 | |||||||
comp | 1149639..1151516 | cds | 626 | methyl-accepting chemotaxis protein | ||||||
1243974..1245108 | cds | 131 | 131 | 378 | tRNA 2-thiouridine(34) synthase MnmA | |||||
1245240..1245314 | atgj | 354 | 354 | |||||||
comp | 1245669..1246637 | cds | 323 | NAD(+) diphosphatase | ||||||
1279875..1280237 | cds | 74 | 74 | 121 | hp | |||||
comp | 1280312..1280397 | tac | 148 | 148 | ||||||
comp | 1280546..1281172 | cds | 209 | nitrogen fixation protein NifQ | ||||||
comp | 1500772..1501110 | cds | 338 | 338 | 113 | P-II family nitrogen regulator | ||||
1501449..1501524 | cac | + | 109 | 109 | ||||||
1501634..1501709 | cac | 2 cac | 129 | 129 | ||||||
1501839..1503305 | cds | 106 | 106 | 489 | bifunctional ADP-dependent NAD(P)H-hydrate dehydratase/NAD(P)H-hydrate epimerase | |||||
1503412..1504977 | cds | 173 | 173 | 522 | malonyl-CoA decarboxylase | |||||
1505151..1505235 | cta | 91 | 91 | |||||||
1505327..1506661 | cds | 445 | trigger factor | |||||||
1511745..1512017 | cds | 105 | 105 | 91 | HU family DNA-binding protein | |||||
1512123..1512197 | gta | 163 | 163 | |||||||
1512361..1512437 | gac | 344 | 344 | |||||||
1512782..1513150 | cds | 123 | NADH-quinone oxidoreductase subunit A | |||||||
1657596..1659397 | cds | 123 | 123 | 601 | p-single-stranded-DNA-specific exonuclease RecJ | |||||
1659521..1659596 | gaa | 234 | 234 | |||||||
1659831..1660671 | cds | 280 | aldo/keto reductase | |||||||
comp | 1808199..1808735 | cds | 79 | 79 | 179 | hp | ||||
1808815..1808892 | cca | 49 | 49 | |||||||
1808942..1809238 | cds | 10 | 10 | 99 | ETC complex I subunit | |||||
1809249..1809325 | aga | 442 | 442 | |||||||
1809768..1810013 | cds | 82 | hp | |||||||
comp | 1825075..1825305 | cds | 210 | 210 | 77 | hp | ||||
comp | 1825516..1825591 | aac | @2 | 219 | 219 | |||||
comp | 1825811..1825884 | tgc | 217 | 217 | ||||||
1826102..1826758 | cds | 219 | protein-L-isoaspartate O-methyltransferase | |||||||
comp | 1878424..1878714 | cds | 244 | 244 | 97 | YkgJ family cysteine cluster protein | ||||
comp | 1878959..1879074 | 5s | 123 | 116 | ||||||
comp | 1879198..1881950 | 23s | 272 | 2753 | ||||||
comp | 1882223..1882298 | gca | 32 | 32 | ||||||
comp | 1882331..1882407 | atc | 110 | |||||||
comp | 1882518..1883224 | 16s° | 100 | 100 | 707 | |||||
<comp | 1883325..1883763 | cds | 146 | p-erythrose-4-phosphate dehydrogenase | ||||||
1896604..1897080 | cds | 192 | 192 | 159 | peptidoglycan-associated lipoprotein Pal | |||||
comp | 1897273..1897347 | acc | 162 | 162 | ||||||
comp | 1897510..1899495 | cds | 662 | polysaccharide biosynthesis protein | ||||||
comp | 2032701..2033588 | cds | 165 | 165 | 296 | DUF3108 domain-containing protein | ||||
2033754..2033828 | gtg | + | 132 | 132 | ||||||
2033961..2034035 | gtg | 2 gtg | 231 | 231 | ||||||
2034267..2034431 | cds | 55 | hp | |||||||
2113098..2113601 | cds | 85 | 85 | 168 | MerR family transcriptional regulator | |||||
2113687..2113763 | ccc | 140 | 140 | |||||||
comp | 2113904..2115682 | cds | 593 | cyclic nucleotide-binding domain-containing protein | ||||||
comp | 2163405..2167388 | cds | 775 | 775 | 1328 | non-ribosomal peptide synthetase | ||||
2168164..2168552 | 16s° | 100 | 389 | |||||||
comp | 2168653..2169323 | 16s° | 522 | 522 | 671 | |||||
comp | 2169846..2170325 | cds | 160 | DUF2141 domain-containing protein | ||||||
2176963..2177427 | cds | 107 | 107 | 155 | membrane protein | |||||
comp | 2177535..2177610 | gcc | 30 | 30 | ||||||
comp | 2177641..2177727 | ctg | 135 | 135 | ||||||
comp | 2177863..2180208 | cds | 782 | mechanosensitive ion channel | ||||||
2233677..2234435 | cds | 92 | 92 | 253 | hp | |||||
comp | 2234528..2234603 | gag | + | 38 | 38 | |||||
comp | 2234642..2234717 | gag | 2 gag | 68 | 68 | |||||
comp | 2234786..2235836 | cds | 350 | p-low specificity L-threonine aldolase | ||||||
comp | 2293087..2293593 | cds | 211 | 211 | 169 | hp | ||||
2293805..2293881 | cgt | 137 | 137 | |||||||
2294019..2294495 | cds | 5 | 5 | 159 | GNAT family N-acetyltransferase | |||||
comp | 2294501..2294576 | atgi | 145 | 145 | ||||||
comp | 2294722..2296683 | cds | 654 | RNA polymerase sigma factor RpoD | ||||||
2372946..2373401 | cds | 86 | 86 | 152 | MaoC family dehydratase | |||||
comp | 2373488..2373563 | aag | + | 74 | 74 | |||||
comp | 2373638..2373713 | aag | 2 aag | 309 | 309 | |||||
2374023..2375549 | cds | 509 | methyltransferase domain-containing protein | |||||||
comp | 2418203..2418400 | cds | 69 | 69 | 66 | preprotein translocase subunit SecE | ||||
comp | 2418470..2418545 | tgg | 152 | 152 | ||||||
comp | 2418698..2419888 | cds | 81 | 81 | 397 | elongation factor Tu | ||||
comp | 2419970..2420043 | gga | 60 | 60 | ||||||
comp | 2420104..2420189 | tac | 144 | 144 | ||||||
2420334..2421188 | cds | 91 | 91 | 285 | 23S rRNA (guanosine(2251)-2'-O)-methyltransferase RlmB | |||||
2421280..2421355 | aca | 137 | 137 | |||||||
2421493..2423187 | cds | 565 | site-specific integrase | |||||||
2561207..2562223 | cds | 109 | 109 | 339 | farnesyltranstransferase | |||||
2562333..2562409 | ccg | + | 205 | 205 | ||||||
2562615..2562691 | ccg | 2 ccg | 136 | 136 | ||||||
2562828..2563241 | cds | 138 | hp | |||||||
comp | 2680406..2680930 | cds | 140 | 140 | 175 | disulfide bond formation protein B | ||||
2681071..2681157 | ttg | 162 | 162 | |||||||
2681320..2681715 | cds | 132 | cupin domain-containing protein | |||||||
2856509..2858152 | cds | 365 | 365 | 548 | recombinase family protein | |||||
comp | 2858518..2858608 | tcc | 118 | 118 | ||||||
comp | 2858727..2859530 | cds | 268 | alpha/beta hydrolase | ||||||
plasmide1 [26] | @3 | |||||||||
198109..199200 | cds | 84 | 84 | 364 | tyrosine-type recombinase/integrase | |||||
comp | 199285..199360 | aaa | 135 | 135 | ||||||
comp | 199496..200044 | cds | 183 | pantetheine-phosphate adenylyltransferase | ||||||
243776..244348 | cds | 205 | 205 | 191 | hp | |||||
244554..244643 | tca | 143 | 143 | |||||||
244787..245683 | cds | 299 | diguanylate cyclase | |||||||
338004..339383 | cds | 116 | 116 | 460 | hp | |||||
comp | 339500..339586 | ctc | 257 | 257 | ||||||
comp | 339844..340836 | cds | 331 | alpha/beta hydrolase | ||||||
comp | 364473..365501 | cds | 200 | 200 | 343 | Ppx/GppA family phosphatase | ||||
365702..365775 | cag | 746 | 746 | |||||||
366522..367214 | cds | 231 | FadR family transcriptional regulator | |||||||
474173..477079 | cds | 298 | 298 | 969 | PAS domain-containing protein | |||||
477378..477464 | ctg | 30 | 30 | |||||||
477495..477570 | gcc | 238 | 238 | |||||||
477809..478123 | cds | 105 | hp | |||||||
599223..600230 | cds | 245 | 245 | 336 | inorganic phosphate transporter | |||||
comp | 600476..600550 | ggc | 351 | 351 | ||||||
600902..602071 | cds | 390 | adenylate/guanylate cyclase domain-containing protein | |||||||
comp | 629856..631229 | cds | 154 | 154 | 458 | tetratricopeptide repeat protein | ||||
631384..631458 | acc | 1 | 1 | |||||||
631460..631535 | gcg | 99 | 99 | |||||||
631635..631711 | gac | 35 | 35 | |||||||
631747..631821 | gtc | 1 | 1 | |||||||
631823..631896 | cag | 153 | 153 | |||||||
632050..632259 | cds | 70 | hp | |||||||
>comp | 699265..699846 | cds | 210 | 210 | 194 | P-hp | ||||
700057..700132 | aac | 4 | 4 | |||||||
700137..700213 | gac | 32 | 32 | |||||||
comp | 700246..700851 | cds | 202 | hp | ||||||
909530..909766 | cds | 153 | 153 | 79 | hp | |||||
comp | 909920..910035 | 5s | 127 | 116 | ||||||
comp | 910163..912915 | 23s | 271 | 2753 | ||||||
comp | 913187..913262 | gca | 30 | 30 | ||||||
comp | 913293..913369 | atc | 110 | |||||||
comp | 913480..914970 | 16s | 486 | 486 | 1491 | |||||
915457..916713 | cds | 419 | exonuclease subunit SbcD | |||||||
comp | 998160..999149 | cds | 229 | 229 | 330 | complex I NDUFA9 subunit family protein | ||||
999379..999465 | ctg | 123 | 123 | |||||||
999589..1000215 | cds | 209 | ribonuclease D | |||||||
comp | 1098197..1098655 | cds | 675 | 675 | 153 | MarR family transcriptional regulator | ||||
1099331..1100821 | 16s | 107 | 1491 | |||||||
1100929..1101005 | atc | 31 | 31 | |||||||
1101037..1101112 | gca | 271 | ||||||||
1101384..1104136 | 23s | 147 | 147 | 2753 | ||||||
comp | 1104284..1105390 | cds | 369 | GNAT family N-acetyltransferase | ||||||
1157171..1157356 | cds | 98 | 98 | 62 | DNA gyrase inhibitor YacG | |||||
1157455..1157530 | ttc | 178 | 178 | |||||||
1157709..1158686 | cds | 326 | alpha-(1,3)-fucosyltransferase | |||||||
1394614..1396740 | cds | 453 | 453 | 709 | PAS domain S-box protein | |||||
1397194..1397287 | agc | 52 | 52 | |||||||
comp | 1397340..1397858 | cds | 173 | tyrosine-type recombinase/integrase | ||||||
1399009..1399830 | cds | 301 | 301 | 274 | hp | |||||
comp | 1400132..1400206 | caa | 79 | 79 | ||||||
comp | 1400286..1402379 | cds | 698 | hp | ||||||
1577667..1578095 | cds | 457 | 457 | 143 | DUF1489 domain-containing protein | |||||
1578553..1580043 | 16s | 110 | 1491 | |||||||
1580154..1580230 | atc | 31 | 31 | |||||||
1580262..1580337 | gca | 269 | ||||||||
1580607..1581986 | 23s° | 100 | 1380 | |||||||
1582087..1582616 | 23s° | 123 | 530 | |||||||
1582740..1582855 | 5s | 100 | 116 | |||||||
1582956..1583032 | atgf | 706 | 706 | |||||||
1583739..1585157 | cds | 473 | pyruvate kinase | |||||||
plasmide2 [27] | ||||||||||
271302..272090 | cds | 529 | 529 | 263 | ATP-binding cassette domain-containing protein | |||||
272620..272695 | tgg | 480 | 480 | |||||||
273176..273922 | cds | 249 | sigma-70 family RNA polymerase sigma factor | |||||||
449562..450338 | cds | 465 | 465 | 259 | IclR family transcriptional regulator | |||||
450804..452289 | 16s | 584 | 1486 | |||||||
452874..453640 | 23s° | 128 | 767 | |||||||
453769..453884 | 5s | 101 | 116 | |||||||
453986..454062 | atgf | 359 | 359 | |||||||
comp | 454422..457751 | cds | 1110 | NERD domain-containing protein | ||||||
plasmide4 [28] | ||||||||||
>comp | 131140..131621 | cds | 193 | 193 | 161 | p-erythrose-4-phosphate dehydrogenase | ||||
131815..131891 | atgf | 202 | 202 | |||||||
comp | 132094..132276 | cds | 61 | hp | ||||||
comp | 197300..198643 | cds | 738 | 738 | 448 | peptidoglycan DD-metalloendopeptidase family protein | ||||
199382..199953 | 16s° | 193 | 572 | |||||||
200147..200223 | atgf | 437 | 437 | |||||||
comp | 200661..202571 | cds | 637 | PAS domain-containing sensor histidine kinase | ||||||
246777..248687 | cds | 208 | 208 | 637 | RNA-directed DNA polymerase | |||||
comp | 248896..248972 | cgg | 96 | 96 | ||||||
comp | 249069..249983 | cds | 305 | alpha/beta hydrolase | ||||||
319641..319943 | cds | 134 | 134 | 101 | STAS domain-containing protein | |||||
comp | 320078..320164 | ctc | 125 | 125 | ||||||
320290..321018 | cds | 243 | lipoyl(octanoyl) transferase LipB | |||||||
comp | 401067..402227 | cds | 281 | 281 | 387 | PQQ-dependent sugar dehydrogenase | ||||
comp | 402509..402624 | 5s | 129 | 116 | ||||||
comp | 402754..403402 | 23s° | 106 | 649 | ||||||
comp | 403509..403880 | 16s° | 502 | 502 | 372 | |||||
comp | 404383..404577 | cds | 65 | hp | ||||||
501394..501756 | cds | 95 | 95 | 121 | response regulator | |||||
501852..501927 | aac | 4 | 4 | |||||||
501932..502008 | gac | 4 | 4 | |||||||
502013..502087 | ggc | 102 | 102 | |||||||
comp | 502190..502957 | cds | 256 | helix-turn-helix transcriptional regulator | ||||||
503041..503667 | cds | 249 | 249 | 209 | pyridoxamine 5'-phosphate oxidase | |||||
comp | 503917..504474 | 16s° | 547 | 547 | 558 | |||||
505022..506005 | cds | 328 | lytic transglycosylase domain-containing protein | |||||||
comp | 601019..603679 | cds | 358 | 358 | 887 | bifunctional acetaldehyde-CoA/alcohol dehydrogenase | ||||
604038..604113 | ttc | 318 | 318 | |||||||
> | 604432..605613 | cds | 394 | site-specific integrase | ||||||
plasmide6 [29] | ||||||||||
88804..89472 | cds | 397 | 397 | 223 | RraA family protein | |||||
89870..89944 | ggc | 249 | 249 | |||||||
90194..91186 | cds | 331 | UDP-N-acetylglucosamine 4,6-dehydratase (inverting) |
abs cumuls[modifier | modifier le wikicode]
- Lien tableur: abs cumuls
opérons | Fréquences intercalaires tRNAs | Fréquences intercalaires cds | Fréquences aas cds chromosome | ||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
effectif | gammes | sans rRNAs | avec rRNAs | gammes | cds | gammes | cdsd | gammes | cdsa | gammes | cdsa 30-300 | ||
avec rRNA | opérons | 10 | 1 | 2 | 1 | 0 | 1 | 100 | 18 | 1 | 0 | ||
16atcgca235 | 1 | 20 | 3 | 50 | 5 | 40 | 200 | 29 | 30 | 0 | |||
Id-23s°-atgf | 1 | 40 | 4 | 4 | 100 | 22 | 80 | 300 | 26 | 60 | 3 | ||
1623s°5atgf | 1 | 60 | 1 | 150 | 29 | 120 | 400 | 20 | 90 | 10 | |||
max a | 3 | 80 | 1 | 200 | 18 | 160 | 500 | 7 | 120 | 9 | |||
a doubles | 0 | 100 | 1 | 250 | 18 | 200 | 600 | 6 | 150 | 8 | |||
autres | 7 | 120 | 1 | 300 | 3 | 240 | 700 | 9 | 180 | 13 | |||
total aas | 10 | 140 | 1 | 350 | 5 | 280 | 800 | 2 | 210 | 9 | |||
sans | opérons | 51 | 160 | 0 | 400 | 7 | 320 | 900 | 1 | 240 | 6 | ||
1 aa | 39 | 180 | 1 | 450 | 2 | 360 | 1000 | 1 | 270 | 8 | |||
max a | 5 | 200 | 0 | 500 | 6 | 400 | 1100 | 0 | 300 | 7 | |||
a doubles | 5 | 2 | 10 | 2 | 48 | ||||||||
total aas | 67 | 17 | 4 | 125 | 0 | 121 | 121 | ||||||
total aas | |||||||||||||
remarques | 3 | ||||||||||||
avec jaune | moyenne | 71 | 31 | 221 | 308 | ||||||||
variance | 72 | 1 | 168 | 230 | |||||||||
sans jaune | moyenne | 151 | 242 | 166 | |||||||||
variance | 72 | 137 | 72 |
abs blocs[modifier | modifier le wikicode]
abs blocs abrégé[modifier | modifier le wikicode]
- Lien tableur: abs blocs abrégé
- Note:
- - hp pour hypothetical protein
- - p- pour pseudo, par exemple p-elon en abrégé donne p-elongation factor Tu.
abrégé | nom |
---|---|
23s RlmB | 23S rRNA (guanosine(2251)-2'-O)-methyltransferase RlmB |
50s L21 | 50S ribosomal protein L21 |
AAA fam | AAA family ATPase |
ab hydrolase | alpha/beta hydrolase |
ab hydrolase f | alpha/beta hydrolase fold domain-containing protein |
AG cyclase | adenylate/guanylate cyclase domain-containing protein |
ak reductase | aldo/keto reductase |
ATP bind | ATP-binding cassette domain-containing protein |
bacteriofer | bacterioferritin |
bif CoA | bifunctional acetaldehyde-CoA/alcohol dehydrogenase |
bif NAD | bifunctional ADP-dependent NAD(P)H-hydrate dehydratase/NAD(P)H-hydrate epimerase |
chemotaxis p | methyl-accepting chemotaxis protein |
cupin dom | cupin domain-containing protein |
cyclicN bind | cyclic nucleotide-binding domain-containing protein |
diG cyclase | diguanylate cyclase |
dip ABC | dipeptide ABC transporter ATP-binding protein |
disulfide | disulfide bond formation protein B |
DMT fam | DMT family transporter |
DUF1489 | DUF1489 domain-containing protein |
DUF2141 | DUF2141 domain-containing protein |
DUF3108 | DUF3108 domain-containing protein |
DUF3618 | DUF3618 domain-containing protein |
EAL & GGDEF | EAL and GGDEF domain-containing protein |
elonga Tu | elongation factor Tu |
ETC complex | ETC complex I subunit |
exo SbcD | exonuclease subunit SbcD |
FAD bind | FAD-binding oxidoreductase |
FadR fam | FadR family transcriptional regulator |
farnesyl | farnesyltranstransferase |
fucosyl | alpha-1,3-fucosyltransferase |
GGDEF dom | GGDEF domain-containing protein |
glycosyl | glycosyltransferase |
GNAT fam | GNAT family N-acetyltransferase |
gyrase YacG | DNA gyrase inhibitor YacG |
Hase HypA | hydrogenase maturation nickel metallochaperone HypA |
helicas RecQ | DNA helicase RecQ |
HU bind | HU family DNA-binding protein |
Hx-t-Hx | helix-turn-helix transcriptional regulator |
Hx-t-Hx dom | helix-turn-helix domain-containing protein |
IclR fam | IclR family transcriptional regulator |
inorganic P | inorganic phosphate transporter |
IS3 fam | IS3 family transposase |
IS5 fam | IS5 family transposase |
L-iso-Asp | protein-L-isoaspartate O-methyltransferase |
lipoyl LipB | lipoyl(octanoyl) transferase LipB |
low Thr | low specificity L-threonine aldolase |
lytic dom | lytic transglycosylase domain-containing protein |
malate G | malate synthase G |
malonyl CoA | malonyl-CoA decarboxylase |
MaoC fam | MaoC family dehydratase |
MarR fam | MarR family transcriptional regulator |
mecano ion | mechanosensitive ion channel |
membrane p | membrane protein |
menaquinone | dimethylmenaquinone methyltransferase |
MerR fam | MerR family transcriptional regulator |
methyl trans | methyltransferase domain-containing protein |
N-acetyl trans | N-acetyltransferase |
N-formyl Glu | N-formylglutamate amidohydrolase |
NAD diP | NAD(+) diphosphatase |
NADH-quinone | NADH-quinone oxidoreductase subunit A |
NDUFA9 | complex I NDUFA9 subunit family protein |
NERD dom | NERD domain-containing protein |
nitrogen NifQ | nitrogen fixation protein NifQ |
non ribosom | non-ribosomal peptide synthetase |
osmose LipB | osmotically-inducible lipoprotein B |
p-ATP-bind | p-ATP-binding protein |
p-erythrose | p-erythrose-4-phosphate dehydrogenase |
P-II nitrogen | P-II family nitrogen regulator |
p-IS5/IS1182 | P-IS5/IS1182 family transposase |
p-low Thr | p-low specificity L-threonine aldolase |
p-ssDNA exo | p-single-stranded-DNA-specific exonuclease RecJ |
pantetheine | pantetheine-phosphate adenylyltransferase |
PAP2 fam | phosphatase PAP2 family protein |
PAS dom | PAS domain-containing protein |
PAS kinase | PAS domain-containing sensor histidine kinase |
PAS S-box | PAS domain S-box protein |
peptido fam | peptidoglycan DD-metalloendopeptidase family protein |
peptido Pal | peptidoglycan-associated lipoprotein Pal |
polymerase | RNA-directed DNA polymerase |
polysacchard | polysaccharide biosynthesis protein |
Ppx/GppA | Ppx/GppA family phosphatase |
PQQ | PQQ-dependent sugar dehydrogenase |
Prolyl-tRNA | prolyl-tRNA synthetase associated domain-containing protein |
pyridoxamine | pyridoxamine 5'-phosphate oxidase |
pyruvate kin | pyruvate kinase |
recombinase | recombinase family protein |
response reg | response regulator |
restriction end | restriction endonuclease |
ribonucleaseD | ribonuclease D |
RraA fam | RraA family protein |
SDR fam | SDR family NAD(P)-dependent oxidoreductase |
sigma RpoD | RNA polymerase sigma factor RpoD |
sigma-70 fam | sigma-70 family RNA polymerase sigma factor |
SLT dom | transglycosylase SLT domain-containing protein |
ss integrase | site-specific integrase |
Ss-DNA | single-stranded-DNA-specific exonuclease RecJ |
STAS dom | STAS domain-containing protein |
subunit SecE | preprotein translocase subunit SecE |
tetratricopep | tetratricopeptide repeat protein |
TIGR02300 | TIGR02300 family protein |
trigger factor | trigger factor |
tRNA MnmA | tRNA 2-thiouridine(34) synthase MnmA |
Tyr rec/int | tyrosine-type recombinase/integrase |
UDP-N-acetyl | UDP-N-acetylglucosamine 4,6-dehydratase (inverting) |
xanthine | xanthine phosphoribosyltransferase |
YggT fam | YggT family protein |
YkgJ fam | YkgJ family cysteine cluster protein |
abs blocs tableau[modifier | modifier le wikicode]
- Lien tableur: abs blocs tableau
- Légende: lien au tableau des protéines, abrégé
- - vert: la taille des rRNAs en pbs alors que les protéines (cds) sont en aas.
- Note: 10 cds < 259 sur 20 dont 2 hp + 1 p
gène | inter | long | abrégé | gène | inter | long | abrégé | gène | inter | long | abrégé |
---|---|---|---|---|---|---|---|---|---|---|---|
cds | 486 | 419 | SbcD | cds | 100 | 146 | P-eryt | cds | 675 | 153 | MarR |
16s | 110 | 1491 | 16s° | 110 | 707 | 16s | 107 | 1491 | |||
atc | 30 | atc | 32 | atc | 31 | ||||||
gca | 271 | gca | 272 | gca | 271 | ||||||
23s | 127 | 2753 | 23s | 123 | 2753 | 23s | 147 | 2753 | |||
5s | 153 | 116 | 5s | 244 | 116 | cds | 369 | GNAT | |||
cds | 79 | hp | cds | 97 | YkgJ | ||||||
cds | 457 | 143 | DUF1489 | ||||||||
16s | 110 | 1491 | |||||||||
atc | 31 | ||||||||||
gca | 269 | ||||||||||
23s° | 100 | 1380 | |||||||||
23s° | 123 | 530 | |||||||||
5s | 100 | 116 | |||||||||
atgf | 706 | ||||||||||
cds | 473 | pyruvat | |||||||||
cds | 465 | 259 | IclR | cds | 502 | 65 | hp | cds | 495 | 235 | PAP2 |
16s | 584 | 1486 | 16s° | 106 | 372 | 16s' | 189 | 1084 | |||
23s° | 128 | 767 | 23s° | 129 | 649 | 23s° | 127 | 678 | |||
5s | 101 | 116 | 5s | 281 | 116 | 5s | 153 | v116 | |||
atgf | 359 | cds | 387 | PQQ | cds | 625 | GGDEF | ||||
cds | 1110 | NERD | |||||||||
cds | 775 | 1328 | non-rib | cds | 738 | 448 | peptido | cds | 249 | 209 | pyridox |
16s° | 100 | 389 | 16s° | 193 | 16s° | 547 | 558 | ||||
16s° | 522 | 671 | atgf | 437 | cds | 328 | lytic | ||||
cds | 160 | DUF2141 | cds | 637 | PAS |
abs abq blocs[modifier | modifier le wikicode]
- Lien tableur: abs abq blocs
- Légende: lien au tableau des protéines, abs abq blocs abrégé
- - vert: la taille des rRNAs en pbs alors qu'en clair les protéines (cdsa) sont en aas.
- - 16s° 16s' 23s°
- - comp: complement, le cds a changé de brin. Cela ressemble à une recombinaison. Exemple CHA1
- - hp caracter: hypothetical protein caractérisée. Le cds est, dans un génome hypothétique, alors que dans l'autre il est caractérisé,tout en ayant à peu près même taille et même intercalaire. Exemple CHA
- - modif: le cds a le même nom mais la taille est légèrement modifiée, ou bien le nom est modifié et nom et intercalaire sont les mêmes. Exemple CHA CHC
- - déplacé: Le cds est déplacé avec son rRNA, tout en conservant taille et intercalaire. Exemple le pavé après CHE
- - d’où?: je ne peux pas savoir de quel bloc à rRNAs, il vient. Exemple le pavé après CHE
- - recomb: En bordure un changement net du cds est du à la recombinaison d'un pavé de clusters. Exemple CHC
- - recombi: à l'intérieur, un changement net de cds est du à un déplacement ou à une recombinaison interne. Exemple CHC
- - insertion: C'est le cas typique du bloc à rRNAs incomplet qui lui manque 5s et atcgca dans abq. Exemple PL1G
- - bloc?: cela vient de quel bloc à rRNA? Exemple PL1I
- - réunion: 2 déplacés réunis. Exemple PL1I, réunion de bloc? et où?.
- Notes:
- - PL1G
- - disparition des atc et gca internes non retrouvés dans les blocs aas
- - Les 5s ne sont pas abimés mais 2 disparaissent
- - Les atgf disparaissent aussi
- - Les 23s, 2 de perdus et 4 de modifiés et perdent leur 5s et 5satgf au contraire de rpm
- - Les 16s, aucun perdu, 4 modifiés s° et 1 modifié s'.
- - Les blocs rRNAs modifiés restent sur place.
|
|
abs remarques[modifier | modifier le wikicode]
- Remarques:
- - Les remarques de abq qui ne changent pas: les intercalaires élevés avec les cds, les intercalaires entre aas (@2) et les séquences des doubles. La phylogénie étroite entre les 2 souches explique cette étroite ressemblance en tout cas pour les intercalaires et les doubles, mais pas pour les blocs à rRNAs.
- - Le tableau des intercalaires et des doubles ci-dessous met en parallèle ces 3 remarques.
- - Les remarques qui changent fondamentalement: ce sont les blocs à rRNAs (@1) et les plasmides (@3). J’ai fait une comparaison détaillée entre les 2 génomes dans abs abq blocs. Elle montre 2 processus distincts:
- Le processus de recombinaison qui explique l’ordre des blocs et le changement de certains cds.
- Le processus de conversion génique qui, en grande partie, a détruit partiellement les rRNAs 16s et 23s et non les 5s. Cependant un 5s a disparu en laissant son atgf. D’après la majorité des cds identiques entre abs et abq et qui sont attachés à ces blocs, les rRNas modifiés restent sur place.
- Tableau des intercalaires et des doubles
abs intercalaires aas abs intercalaires cds abs intercalaires cds adresse aas adresse rRNA adresse aas 1825516 aac-tgc 219 2168164 16s° 775 365702 cag 746 2562333 ccg-ccg 205 199382 16s° 738 17144 ggc 670 1512123 gta-gac 163 1582956 atgf 706 272620 tgg 529-480 isolé 2033754 gtg-gtg 132 913480 16s 675 1397194 agc 453 1501449 cac-cac 109 503917 16s° 547 1809249 aga 442 631460 gcg-gac 99 2168653 16s° 522 2373488 aag-aag 74 403509 16s° 502 atgj 354 538069 16s’ 495 ctc 257 913480 16s 486 ggg 114 450804 16s 465 1578553 16s 457 cag abq 246 200147 atgf 437 abq intercalaires entre aas abq intercalaires cds abq intercalaires cds 1370697 aac-tgc 220 810890 atgf 870 2641475 ggc 688 616472 ccg-ccg 206 1431525 16s 779 2766227 ggg 659 1723802 gac-gta 164 120008 16s 740 1997840 atgj 595 1165208 gtg-gtg 132 1354091 16s 676 972026 agc 493 1735337 cac-cac 109 510548 16s 615 1725057 ctc 475 1443296 gcg-gac 99 404350 16s 502 86421 ggc 455 796280 aag-aag 76 2787506 16s 496 1354448 aga 443 302206 16s 472 52318 tgg 481-363 814616 16s 452 2304295 tta 414-406 isolé 1570334 16s 444 intercalaires supérieurs à 500 pbs. agr oan abq abs 16s 2 4 6 7 aas 6 12 3 3 max 16s 633 998 870 775 max aas 793 1650 688 746 Doubles abs Doubles abq aas n doublets aas n doublets 1 39 ccg 1 38 ccg 2 10 aag 2 11 aag 3 1 gag 3 1 gag 4 gtg 4 gtg 5 1 cac 5 1 cac
abs distribution[modifier | modifier le wikicode]
- Lien tableur: abs distribution
- Notes
aag2 cac2 ccg2 gag2 gtg2 ggc: 3 1aa et 1 >1aa
g1 | t1 | ||||||
---|---|---|---|---|---|---|---|
atgi | 1 | tct | tat | atgf | 4 | ||
att | act | aat | agt | ||||
ctt | cct | cat | cgc | ||||
gtt | gct | gat | ggt | ||||
ttc | 2 | tcc | 1 | tac | 2 | tgc | 1 |
atc | 4 | acc | 2 | aac | 3 | agc | 1 |
ctc | 2 | ccc | 1 | cac | 2 | cgt | 2 |
gtc | 2 | gcc | 3 | gac | 4 | ggc | 4 |
tta | 1 | tca | 1 | taa | tga | ||
ata | aca | 1 | aaa | 1 | aga | 1 | |
cta | 1 | cca | 1 | caa | 1 | cga | |
gta | 1 | gca | 4 | gaa | 1 | gga | 1 |
ttg | 1 | tcg | 1 | tag | tgg | 2 | |
atgj | 1 | acg | 1 | aag | 2 | agg | 1 |
ctg | 3 | ccg | 2 | cag | 2 | cgg | 1 |
gtg | 2 | gcg | 2 | gag | 2 | ggg | 1 |
alpha | >1aa | =1aa | -5s | +5s | -16s | +16s | total |
abs | 30 | 39 | 3 | 8 | 80 |
Agrobacterium sp. H13-3[modifier | modifier le wikicode]
agr opérons[modifier | modifier le wikicode]
- Lien tableur: agr opérons
- Liens: gtRNAdb [30], NCBI [31], génome [orgn]
- Phylogénie: Bacteria; Proteobacteria; Alphaproteobacteria; Rhizobiales; Rhizobiaceae; Rhizobium/Agrobacterium group; Agrobacterium.
- Légende: cdsa: cds aas, cdsd: cds dirigé
59.3%GC | 29.12.19 Paris | 58 | doubles | intercal | cds | aa | avec aa | cdsa | cdsd | protéines |
---|---|---|---|---|---|---|---|---|---|---|
chromosoml | ||||||||||
comp | 1064633..1065274 | cds | 296 | 296 | 214 | hp | ||||
1065571..1065655 | ttg | 266 | 266 | |||||||
1065922..1066437 | cds | 172 | disulfide bond formation protein B | |||||||
comp | 1178605..1179114 | cds | 256 | 256 | 170 | prolyl-tRNA synthetase associated domain-containing protein | ||||
1179371..1179445 | ggc | @1 | 793 | 793 | ||||||
comp | 1180239..1180315 | atgj | 135 | 135 | ||||||
comp | 1180451..1181647 | cds | 399 | tRNA 2-thiouridine(34) synthase MnmA | ||||||
comp | 1320644..1321006 | cds | 318 | 318 | 121 | hp | ||||
comp | 1321325..1321414 | tcg | 197 | 197 | ||||||
comp | 1321612..1322493 | cds | 294 | dihydrodipicolinate synthase family protein | ||||||
comp | 1361929..1362942 | cds | 554 | 554 | 338 | sugar ABC transporter substrate-binding protein | ||||
comp | 1363497..1363571 | gtc | 81 | 81 | ||||||
comp | 1363653..1364015 | cds | 121 | response regulator | ||||||
<comp | 1426814..1427137 | cds | 105 | 105 | 108 | hp | ||||
1427243..1428733 | 16s | 337 | 1491 | |||||||
1429071..1429147 | atc | 59 | 59 | |||||||
1429207..1429282 | gca | 146 | 146 | |||||||
<comp | 1429429..1429626 | cds | @2 | 241 | 241 | 66 | P-hp | |||
1429868..1432681 | 23s | 242 | 2814 | |||||||
1432924..1433038 | 5s | 257 | 115 | |||||||
1433296..1433372 | atgf | 311 | 311 | |||||||
1433684..1434118 | cds | 145 | acetyl-CoA carboxylase biotin carboxyl carrier protein subunit | |||||||
1503534..1504520 | cds | 122 | 122 | 329 | beta-ketoacyl-ACP synthase III | |||||
comp | 1504643..1504716 | cag | 123 | 123 | ||||||
comp | 1504840..1505277 | cds | 146 | Lrp/AsnC family transcriptional regulator | ||||||
1605356..1605856 | cds | 71 | 71 | 167 | hp | |||||
comp | 1605928..1606003 | gcc | 152 | 152 | ||||||
comp | 1606156..1606545 | cds | 130 | TIGR02300 family protein | ||||||
<comp | 1687683..1688015 | cds | 105 | 105 | 111 | hp | ||||
1688121..1689611 | 16s | 337 | 1491 | |||||||
1689949..1690025 | atc | 59 | 59 | |||||||
1690085..1690160 | gca | 146 | 146 | |||||||
<comp | 1690307..1690504 | cds | 241 | 241 | 66 | P-hp | ||||
1690746..1693559 | 23s | 242 | 2814 | |||||||
1693802..1693916 | 5s | 257 | 115 | |||||||
1694174..1694250 | atgf | 203 | 203 | |||||||
comp | 1694454..1694645 | cds | 64 | hp | ||||||
<comp | 2103153..2103404 | cds | 105 | 105 | 84 | P-hp | ||||
2103510..2105000 | 16s | 337 | 1491 | |||||||
2105338..2105414 | atc | 59 | 59 | |||||||
2105474..2105549 | gca | 146 | 146 | |||||||
<comp | 2105696..2105893 | cds | 241 | 241 | 66 | P-hp | ||||
2106135..2108948 | 23s | 242 | 2814 | |||||||
2109191..2109305 | 5s | 257 | 115 | |||||||
2109563..2109639 | atgf | 633 | 633 | |||||||
2110273..2110680 | cds | 136 | membrane protein | |||||||
chromosomc | ||||||||||
<comp | 56862..57137 | cds | 105 | 105 | 92 | P-hp | ||||
57243..58733 | 16s | 337 | 1491 | |||||||
59071..59147 | atc | 59 | 59 | |||||||
59207..59282 | gca | 146 | 146 | |||||||
<comp | 59429..59626 | cds | 241 | 241 | 66 | P-hp | ||||
59868..62681 | 23s | 242 | 2814 | |||||||
62924..63038 | 5s | 257 | 115 | |||||||
63296..63372 | atgf | 196 | 196 | |||||||
63569..65377 | cds | 603 | DNA helicase RecQ | |||||||
comp | 125821..127722 | cds | 287 | 287 | 634 | molecular chaperone DnaK | ||||
comp | 128010..128099 | tcc | 220 | 220 | ||||||
128320..128637 | cds | 106 | hp | |||||||
227621..228004 | cds | 240 | 240 | 128 | membrane protein | |||||
comp | 228245..228331 | ctg | 120 | 120 | ||||||
comp | 228452..228757 | cds | 102 | SelT/SelW/SelH family protein | ||||||
> | 378307..378396 | cds | 40 | 40 | 30 | P-hp | ||||
378437..378513 | cgt | 174 | 174 | |||||||
378688..379500 | cds | 271 | class I SAM-dependent methyltransferase | |||||||
comp | 407277..407435 | cds | 167 | 167 | 53 | YqaE/Pmp3 family membrane protein | ||||
comp | 407603..407678 | acg | 137 | 137 | ||||||
comp | 407816..408778 | cds | 321 | nitronate monooxygenase | ||||||
425990..427087 | cds | 56 | 56 | 366 | 2'-deoxycytidine 5'-triphosphate deaminase | |||||
427144..427217 | ggg | 154 | 154 | |||||||
427372..428058 | cds | 229 | aquaporin Z | |||||||
458659..459081 | cds | 285 | 285 | 141 | hp | |||||
459367..459442 | ttc | 246 | 246 | |||||||
comp | 459689..460033 | cds | 115 | cation:proton antiporter | ||||||
comp | 493759..494025 | cds | 155 | 155 | 89 | hp | ||||
494181..494255 | acc | 195 | 195 | |||||||
comp | 494451..495686 | cds | 412 | flagellin | ||||||
comp | 564938..568684 | cds | 361 | 361 | 1249 | PAS domain S-box protein | ||||
569046..569122 | cac | 79 | 79 | |||||||
569202..570920 | cds | 573 | Ppx/GppA family phosphatase | |||||||
comp | 763448..764356 | cds | 202 | 202 | 303 | MBL fold metallo-hydrolase | ||||
764559..764633 | caa | 263 | 263 | |||||||
comp | 764897..766549 | cds | 551 | malate dehydrogenase (quinone) | ||||||
comp | 767020..767439 | cds | 264 | 264 | 140 | hp | ||||
767704..767780 | ccg | 159 | 159 | |||||||
comp | 767940..768260 | cds | 107 | hp | ||||||
comp | 960360..960701 | cds | 163 | 163 | 114 | hp | ||||
960865..960955 | agc | 500 | 500 | |||||||
comp | 961456..961671 | cds | 72 | hp | ||||||
1123408..1124136 | cds | 141 | 141 | 243 | hp | |||||
1124278..1124363 | tta | 241 | 241 | |||||||
1124605..1127115 | cds | 837 | copper-translocating P-type ATPase | |||||||
1154411..1154803 | cds | 91 | 91 | 131 | DUF2934 domain-containing protein | |||||
comp | 1154895..1154969 | aac | 176 | 176 | ||||||
1155146..1155424 | cds | 93 | hp | |||||||
comp | 1162767..1163027 | cds | 138 | 138 | 87 | hp | ||||
comp | 1163166..1163242 | ccc | 218 | 218 | ||||||
1163461..1163997 | cds | 179 | DUF1269 domain-containing protein | |||||||
1192452..1194650 | cds | 660 | 660 | 733 | esterase-like activity of phytase family protein | |||||
comp | 1195311..1195386 | gta | + | 446 | 446 | |||||
1195833..1195909 | gac | 2 gac | 41 | 41 | ||||||
1195951..1196027 | gac | 435 | 435 | |||||||
1196463..1196828 | cds | 122 | NADH-quinone oxidoreductase subunit A | |||||||
1421863..1422201 | cds | 134 | 134 | 113 | hp | |||||
comp | 1422336..1422425 | tca | 88 | 88 | ||||||
comp | 1422514..1422678 | cds | 55 | hp | ||||||
comp | 1468229..1469110 | cds | 180 | 180 | 294 | HNH endonuclease | ||||
comp | 1469291..1469367 | atgf | 132 | 132 | ||||||
comp | 1469500..1470450 | cds | 317 | hp | ||||||
comp | 1508458..1508883 | cds | 558 | 558 | 142 | PAS domain-containing protein | ||||
comp | 1509442..1509526 | ctc | 189 | 189 | ||||||
1509716..1510447 | cds | 244 | lipoyl(octanoyl) transferase LipB | |||||||
1531160..1531933 | cds | 447 | 447 | 258 | amino acid ABC transporter ATP-binding protein | |||||
1532381..1532455 | gaa | 121 | 121 | |||||||
1532577..1532818 | cds | 89 | 89 | 81 | P-hp | |||||
1532908..1532982 | gaa | 129 | 129 | |||||||
comp | 1533112..1534920 | cds | 603 | single-stranded-DNA-specific exonuclease RecJ | ||||||
1584509..1584763 | cds | 155 | 155 | 85 | GlsB/YeaQ/YmgE family stress response membrane protein | |||||
1584919..1584994 | aag | 134 | 134 | |||||||
comp | 1585129..1585575 | cds | 149 | hp | ||||||
comp | 1612420..1613898 | cds | 240 | 240 | 493 | trigger factor | ||||
comp | 1614139..1614221 | cta | 447 | 447 | ||||||
< | 1614669..1614876 | cds | 69 | P-hp | ||||||
comp | 1672216..1672887 | cds | 245 | 245 | 224 | protein-L-isoaspartate O-methyltransferase | ||||
comp | 1673133..1673206 | tgc | 240 | 240 | ||||||
comp | 1673447..1673599 | cds | 51 | DUF3309 family protein | ||||||
comp | 1744688..1745434 | cds | 341 | 341 | 249 | cytochrome c biogenesis protein CcdA | ||||
1745776..1745851 | aaa | 310 | 310 | |||||||
1746162..1746743 | cds | 194 | DUF1003 domain-containing protein | |||||||
comp | 1770727..1772280 | cds | 91 | 91 | 518 | tyrosine-type recombinase/integrase | ||||
comp | 1772372..1772448 | cca | 265 | 265 | ||||||
1772714..1773019 | cds | 51 | 51 | 102 | ETC complex I subunit | |||||
1773071..1773147 | aga | 7 | 7 | |||||||
comp | 1773155..1773892 | cds | 246 | DUF429 domain-containing protein | ||||||
comp | 1902337..1902537 | cds | 184 | 184 | 67 | preprotein translocase subunit SecE | ||||
comp | 1902722..1902797 | tgg | 241 | 241 | ||||||
comp | 1903039..1903845 | cds | 269 | glycosyltransferase | ||||||
1908698..1908892 | cds | 70 | 70 | 65 | hp | |||||
comp | 1908963..1909036 | gga | 26 | 26 | 26 | |||||
comp | 1909063..1909147 | tac | 209 | 209 | ||||||
1909357..1910244 | cds | 296 | 23s rRNA (guanosine(2251)-2'-O)-methyltransferase RlmB | |||||||
1922447..1922800 | cds | 55 | 55 | 118 | hp | |||||
comp | 1922856..1922931 | aca | 207 | 207 | ||||||
1923139..1924878 | cds | 580 | GGDEF domain-containing protein | |||||||
2079925..2080287 | cds | 156 | 156 | 121 | hp | |||||
comp | 2080444..2080519 | atgi | 178 | 178 | ||||||
2080698..2081441 | cds | 248 | SIMPL domain-containing protein | |||||||
comp | 2275632..2276138 | cds | 522 | 522 | 169 | winged helix-turn-helix transcriptional regulator | ||||
2276661..2276737 | cgg | 287 | 287 | |||||||
2277025..2277264 | cds | 80 | hp | |||||||
comp | 2388300..2388497 | cds | 87 | 87 | 66 | hp | ||||
2388585..2388659 | ggc | 361 | 361 | |||||||
2389021..2391024 | cds | 668 | methyl-accepting chemotaxis protein | |||||||
comp | 2490745..2491854 | cds | 535 | 535 | 370 | 2Fe-2S iron-sulfur cluster binding domain-containing protein | ||||
comp | 2492390..2492466 | atgf | 287 | 115 | ||||||
comp | 2492754..2492868 | 5s | 242 | 2814 | ||||||
comp | 2493111..2495924 | 23s | 241 | 241 | ||||||
> | 2496166..2496363 | cds | 146 | 146 | 66 | P-hp | ||||
comp | 2496510..2496585 | gca | 59 | 59 | ||||||
comp | 2496645..2496721 | atc | 337 | |||||||
comp | 2497059..2498549 | 16s | 105 | 105 | 1491 | |||||
> | 2498655..2498930 | cds | 92 | P-hp |
agr cumuls[modifier | modifier le wikicode]
- Lien tableur: agr cumuls
opérons | Fréquences intercalaires tRNAs | Fréquences intercalaires cds | Fréquences aas cds chromosome | ||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
effectif | gammes | sans rRNAs | avec rRNAs | gammes | cds | gammes | cdsd | gammes | cdsa | gammes | cdsa 300 | ||
avec rRNA | opérons | 5 | 1 | 1 | 0 | 1 | 100 | 24 | 1 | 0 | |||
16atcgca235 | 0 | 20 | 50 | 3 | 40 | 200 | 30 | 30 | 1 | ||||
Id-atgf | 5 | 40 | 1 | 100 | 12 | 80 | 300 | 14 | 60 | 3 | |||
16s23s | 0 | 60 | 1 | 5 | 150 | 22 | 120 | 400 | 8 | 90 | 17 | ||
max a | 3 | 80 | 200 | 17 | 160 | 500 | 2 | 120 | 13 | ||||
a doubles | 0 | 100 | 250 | 18 | 200 | 600 | 4 | 150 | 14 | ||||
spéciaux | 0 | 120 | 300 | 9 | 240 | 700 | 4 | 180 | 5 | ||||
total aas | 15 | 140 | 350 | 4 | 280 | 800 | 1 | 210 | 1 | ||||
sans | opérons | 38 | 160 | 400 | 2 | 320 | 900 | 1 | 240 | 3 | |||
1 aa | 35 | 180 | 450 | 3 | 360 | 1000 | 0 | 270 | 7 | ||||
max a | 3 | 200 | 500 | 1 | 400 | 1100 | 0 | 300 | 4 | ||||
a doubles | 1 | 2 | 6 | 1 | 21 | ||||||||
total aas | 42 | 4 | 5 | 97 | 0 | 89 | 89 | ||||||
total aas | 57 | ||||||||||||
remarques | 2 | ||||||||||||
avec jaune | moyenne | 59 | 213 | 230 | |||||||||
variance | 0 | 134 | 209 | ||||||||||
sans jaune | moyenne | 33 | 172 | 185 | 137 | ||||||||
variance | 76 | 131 | 71 |
agr blocs[modifier | modifier le wikicode]
- Lien tableur: agr blocs
- Légende:
- CoA acetyl-CoA carboxylase biotin carboxyl carrier protein subunit
- helicase DNA helicase RecQ
- 2Fe-2S 2Fe-2S iron-sulfur cluster binding domain-containing protein
- membrane membrane protein
- hp hypothetical protein
- p-hp pseudo hp
chromomel | intercal | cdsa | intercal | cdsa | intercal | cdsa | |||
---|---|---|---|---|---|---|---|---|---|
cds | 105 | 108 | hp | 105 | 111 | hp | 105 | 84 | P-hp |
16s | 337 | 1491 | 337 | 1491 | 337 | 1491 | |||
atc | 59 | 59 | 59 | ||||||
gca | 146 | 146 | 146 | ||||||
cds | 241 | 66 | P-hp | 241 | 66 | P-hp | 241 | 66 | P-hp |
23s | 242 | 2814 | 242 | 2814 | 242 | 2814 | |||
5s | 257 | 115 | 257 | 115 | 257 | 115 | |||
atgf | 311 | 203 | 633 | ||||||
cds | 145 | CoA | 64 | hp | 136 | membrane | |||
chromosomec | |||||||||
cds | 105 | 92 | P-hp | 105 | 92 | P-hp | |||
16s | 337 | 1491 | 337 | 1491 | |||||
atc | 59 | 59 | |||||||
gca | 146 | 146 | |||||||
cds | 241 | 66 | P-hp | 241 | 66 | P-hp | |||
23s | 242 | 2814 | 242 | 2814 | |||||
5s | 257 | 115 | 287 | 115 | |||||
atgf | 196 | 535 | |||||||
cds | 603 | helicase | 370 | 2Fe-2S |
agr remarques[modifier | modifier le wikicode]
- Remarques
- @: Par rapport aux rickettsia rtb et rpl, les intercalaires élevés sont rares et faibles, 6 sur 38 aas sont entre 500 et 793. Voir tableau ci-dessous.
- - un seul aa isolé, gta , 660-446.
- - 2 intercalaires élevés entre 2 aas, ggc-atgi 793 et gta-gac 446. Le 1er est du même ordre que celui de rtb et rpl, 1051 830.
- - Les intercalaires entre aas: Il y en a quatre comme les rickettsia, 793 446 41 26. Les 2 petits sont proches de la moyenne de cette étude de 15 pbs.
- - Les intercalaires avec un cds. Ils sont très faibles sur les 38 aas un seul atteint 660 pbs les autres élevés se répartissent en 4 entre 500-558 et 3 entre 435-447. Ces valeurs sont analogues à ceux des blocs à rRNA, 535 et 633 tout à fait courants dans le haut de gamme de cette étude. Les 30 aas restants ont des intercalaires cds inférieurs à 400 dont 3 seulement dépassent les 300, cac aaa ggc.
- @ Les cds dans les blocs à rRNAs. Voir agr blocs.
- - Les 5 blocs sont identiques qu’ils soient sur le chromosome linéaire ou circulaire. C’est comme une duplication répétée 5 fois.
- - Le cds interne a toutes les caractéristiques d’un candidat à la création: interne, hypothétique et petit. La caractéristique pseudo est encore un indice très fort de la genèse, la séquence acquiera plus tard le codon initial et le codon stop ou tout autre complément imposé par le système de réparation contraint par l’évolution de l’environnement du génome.
- - On retrouve la situation du génome oan, avec un p-hp de 63 aas contre 66 ici. Ces 2 génomes se ressemblent beaucoup,
- + DNAa total identique oan et agr 4,8 mega, 2 chromosomes dont 1 linéaire pour agr. Tous les blocs se terminent par atgf et sont complets.
- + Beaucoup de cds hp externes.
- - Chez agr, 5 hp dont 3 p-hp au-dessus de 16s de la même taille que le p-hp interne. Ils se comportent comme lui, quasimment même petite taille et des intercalaires identiques de 105 pbs. Ces 10 cds font partie intégrante du processus de réparation ou de conversion qui a créé les 5 blocs. Après 5s 3 cds de petites tailles dont un hpcomme ceux au-dessus du 16s. Donc 2 cds bien caractérisés se comportant comme le p-hp interne candidat à la création. Cependant ces 3 cds apparemment ne font pas partie intégrante du processus de conversion puisque leurs intercalaires avec atgf varient beaucoup de 203 à 633, comme les 2 restant.
- - Chez oan seulement 2 cds de 57 aas sur un total de 8 cds. Ils sont bien caractérisés.
- - La question qui se pose alors est : est-ce que ces 10 cds analogues aux internes peuvent ils être des candidats à la création?
- - Note du 4.10.20: les 5 cds disparaissent dans NCBI du 12.4.20, après contrôle.
- @: Par rapport aux rickettsia rtb et rpl, les intercalaires élevés sont rares et faibles, 6 sur 38 aas sont entre 500 et 793. Voir tableau ci-dessous.
- Séquence des doubles: très peu de doubles, 1 doublets pour 38 opérons à aas.
- Tableau des intercalaires élevés
aas adresse pbs note ggc 1179371 793 aa-aa gta 1195311 660-446 isolé ctc 1509442 558 gtc 1363497 554 cgg 2276661 522 agc 960865 500 gaa 1532381 447 cta 1614139 447 gac 1195833 446 aa-aa gac 1195951 435 cac 569046 361 aaa 1745776 341-310 ggc 2388585 361 atgf 2492390 535 5s-aa atgf 2109563 633 5s-aa
agr distribution[modifier | modifier le wikicode]
- Lien tableur: agr distribution
- Notes: gac2
g1 | t1 | ||||||
---|---|---|---|---|---|---|---|
atgi | 1 | tct | tat | atgf | 6 | ||
att | act | aat | agt | ||||
ctt | cct | cat | cgc | ||||
gtt | gct | gat | ggt | ||||
ttc | 1 | tcc | 1 | tac | 1 | tgc | 1 |
atc | 5 | acc | 1 | aac | 1 | agc | 1 |
ctc | 1 | ccc | 1 | cac | 1 | cgt | 1 |
gtc | 1 | gcc | 1 | gac | 2 | ggc | 2 |
tta | 1 | tca | 1 | taa | tga | ||
ata | aca | 1 | aaa | 1 | aga | 1 | |
cta | 1 | cca | 1 | caa | 1 | cga | |
gta | 1 | gca | 5 | gaa | 2 | gga | 1 |
ttg | 1 | tcg | 1 | tag | tgg | 1 | |
atgj | 1 | acg | 1 | aag | 1 | agg | |
ctg | 1 | ccg | 1 | cag | 1 | cgg | 1 |
gtg | gcg | gag | ggg | 1 | |||
alpha | >1aa | =1aa | -5s | +5s | -16s | +16s | total |
agr | 7 | 35 | 5 | 10 | 57 |
Aureimonas sp. AU20[modifier | modifier le wikicode]
aua opérons[modifier | modifier le wikicode]
- Lien tableur: aua opérons
- Liens: gtRNAdb [], NCBI [32], génome [orgn], pau20rrn [33]
- Phylogénie: Bacteria; Proteobacteria; Alphaproteobacteria; Rhizobiales; Aurantimonadaceae; Aureimonas.
- Légende: cdsa: cds aas, cdsd: cds dirigé
- Note: il n'y a pas de gtRNAdb. Aussi j'ai comparé (EXACT NB.CAR STXT) les 1ers atgf atgi atgj du génome cdc, avec les atg de aua sauf atgi qui est défini dans NCB. Les 2 atgf de atgf2 (331629..331705) sont identiques.
67%GC | 8.8.19 Paris | 55 | doubles | intercal | cds | aa | avec aa | cdsa | cdsd | protéines |
---|---|---|---|---|---|---|---|---|---|---|
pAU20rrn | ||||||||||
324..1028 | CDS rep | 461 | 235 | replication initiation protein | ||||||
comp | 1490..1604 | 5s | @1 | 82 | 115 | |||||
comp | 1687..4515 | 23s | -15 | 2829 | ||||||
comp | 4501..4851 | CDS hp | 142 | 117 | hp | |||||
comp | 4994..5069 | gca | 33 | 33 | ||||||
comp | 5103..5179 | atc | 233 | |||||||
comp | 5413..6898 | 16s | 1752 | 1486 | ||||||
comp | 8651..9109 | CDS hp | 153 | hp | ||||||
Chromosome | ||||||||||
comp | 170900..171925 | CDS | 368 | 368 | 342 | |||||
172294..172378 | ctg | 130 | 130 | 130 | ||||||
172509..172772 | CDS | 88 | ||||||||
comp | 330094..330690 | CDS | 338 | 338 | 199 | |||||
331029..331103 | ggc | @2 | 404 | 404 | ||||||
comp | 331508..331584 | atgf | + | 44 | 44 | |||||
comp | 331629..331705 | atgf | 2 atg | 255 | 255 | 255 | ||||
comp | 331961..333217 | CDS | 419 | |||||||
344949..346025 | CDS | 589 | 589 | 359 | 589 | |||||
346615..346704 | tcg | 609 | 609 | |||||||
347314..348471 | CDS | 386 | ||||||||
comp | 393335..395356 | CDS | 800 | 800 | 674 | |||||
comp | 396157..396232 | gcc | 439 | 439 | 439 | |||||
comp | 396672..397094 | CDS | 141 | |||||||
635177..637537 | CDS | 640 | 640 | 787 | ||||||
comp | 638178..638253 | gcg | 182 | 182 | 182 | |||||
638436..638738 | CDS | 101 | ||||||||
comp | 924507..925466 | CDS | 529 | 529 | 320 | |||||
comp | 925996..926085 | tcc | 349 | 349 | 349 | |||||
926435..926767 | CDS | 111 | ||||||||
1216789..1217439 | CDS | 60 | 60 | 217 | 60 | |||||
1217500..1217576 | agg | 68 | 68 | |||||||
comp | 1217645..1218760 | CDS | 372 | |||||||
1350534..1352180 | CDS | @4 | -30 | -30 | 549 | |||||
comp | 1352151..1352227 | cgt | + | 51 | 51 | |||||
comp | 1352279..1352355 | cgt | 2 cgt | 169 | 169 | |||||
comp | 1352525..1353967 | CDS | 481 | |||||||
1401921..1402442 | CDS | 142 | 142 | 174 | 142 | |||||
1402585..1402661 | cac | 585 | 585 | |||||||
1403247..1404875 | CDS | 543 | ||||||||
1544580..1546277 | CDS | 455 | 455 | 566 | ||||||
comp | 1546733..1546808 | ttc | @2 | 161 | 161 | |||||
1546970..1547044 | acc | 414 | 414 | 414 | ||||||
1547459..1549516 | CDS | 686 | ||||||||
1609269..1610216 | CDS | 278 | 278 | 316 | ||||||
comp | 1610495..1610571 | cgg | 121 | 121 | 121 | |||||
comp | 1610693..1611427 | CDS | 245 | |||||||
> | 1683255..1683581 | CDS | 209 | 209 | 109 | 209 | ||||
comp | 1683791..1683864 | cag | 580 | 580 | ||||||
1684445..1685734 | CDS | 430 | ||||||||
1700827..1701852 | CDS | 300 | 300 | 342 | ||||||
comp | 1702153..1702227 | gtc | + | 128 | 128 | |||||
comp | 1702356..1702430 | gtc | 3 gtc | 186 | 186 | |||||
comp | 1702617..1702691 | gtc | 68 | 68 | 68 | |||||
comp | 1702760..1703125 | CDS | 122 | |||||||
1946715..1946936 | CDS | 6 | 6 | 74 | 6 | |||||
comp | 1946943..1947018 | atgi | 105 | 105 | ||||||
1947124..1947345 | CDS | 74 | ||||||||
1981934..1983139 | CDS | 139 | 139 | 402 | 139 | |||||
1983279..1983368 | agc | 825 | 825 | |||||||
1984194..1985339 | CDS | 382 | ||||||||
1996083..1997171 | CDS | 243 | 243 | 363 | ||||||
comp | 1997415..1997490 | acg | 112 | 112 | 112 | |||||
comp | 1997603..1998583 | CDS | 327 | |||||||
comp | 2263930..2264781 | CDS | 30 | 30 | 284 | 30 | ||||
comp | 2264812..2264886 | gtg | 111 | 111 | ||||||
comp | 2264998..2265768 | CDS | 257 | |||||||
2363764..2364786 | CDS | 18 | 18 | 341 | 18 | |||||
comp | 2364805..2364879 | gaa | + | 140 | 140 | |||||
comp | 2365020..2365094 | gaa | 2 gaa | 69 | 69 | 69 | ||||
comp | 2365164..2366144 | CDS | 327 | |||||||
2367774..2368247 | CDS | 105 | 105 | 158 | ||||||
2368353..2368429 | cca | @3 | 43 | 43 | 43 | |||||
2368473..2368778 | CDS | 36 | 36 | 102 | 36 | |||||
2368815..2368890 | aga | 448 | 448 | |||||||
2369339..2369929 | CDS | 197 | ||||||||
comp | 2401620..2402732 | CDS | 155 | 155 | 371 | 155 | ||||
comp | 2402888..2402963 | aaa | 169 | 169 | ||||||
2403133..2403870 | CDS | 246 | ||||||||
2419689..2420852 | CDS | 13 | 13 | 388 | 13 | |||||
2420866..2420955 | tca | 238 | 238 | |||||||
2421194..2421934 | CDS | 247 | ||||||||
comp | 2601493..2601858 | CDS | 287 | 287 | 122 | 287 | ||||
comp | 2602146..2602222 | gac | + | 58 | 58 | |||||
comp | 2602281..2602357 | gac | 2 gac | 270 | 270 | |||||
2602628..2602703 | gta | @2 | 330 | 330 | ||||||
comp | 2603034..2603312 | CDS | 93 | |||||||
comp | 2608494..2609852 | CDS | 73 | 73 | 453 | 73 | ||||
comp | 2609926..2610009 | cta | 307 | 307 | ||||||
2610317..2610460 | CDS | 48 | ||||||||
comp | 2641174..2641824 | CDS | @3 | 125 | 125 | 217 | 125 | |||
comp | 2641950..2642023 | tgc | 153 | 153 | ||||||
comp < | 2642177..2642443 | CDS | 296 | 296 | 89 | |||||
2642740..2642814 | aac | 269 | 269 | 269 | ||||||
2643084..2644127 | CDS | 348 | ||||||||
comp | 2651145..2652935 | CDS | 239 | 239 | 597 | 239 | ||||
2653175..2653259 | tta | 265 | 265 | |||||||
2653525..2653725 | CDS | 67 | ||||||||
comp | 2749758..2750318 | CDS | 3102 | 3102 | 187 | |||||
comp | 2753421..2753497 | atgf | 83 | 83 | 83 | |||||
comp | 2753581..2754180 | CDS | 200 | |||||||
2768127..2769224 | CDS | 63 | 63 | 366 | 63 | |||||
comp | 2769288..2769364 | ccg | @2 | 173 | 173 | |||||
2769538..2769612 | caa | 528 | 528 | |||||||
comp | 2770141..2770566 | CDS | 142 | |||||||
comp | 2787112..2788920 | CDS | 217 | 217 | 603 | 217 | ||||
comp | 2789138..2789214 | ccc | 265 | 265 | ||||||
comp | 2789480..2790022 | CDS | 181 | |||||||
2927857..2928789 | CDS | 136 | 136 | 311 | 136 | |||||
comp | 2928926..2929010 | ctc | + | 132 | 132 | |||||
comp | 2929143..2929227 | ctc | 2 ctc | 175 | 175 | |||||
2929403..2930164 | CDS | 254 | ||||||||
comp | 2971057..2971257 | CDS | 130 | 130 | 67 | |||||
comp | 2971388..2971463 | tgg | 53 | 53 | 53 | |||||
comp | 2971517..2972374 | CDS | 286 | |||||||
comp | 2973322..2974497 | CDS | 291 | 291 | 392 | |||||
comp | 2974789..2974862 | gga | 24 | 24 | ||||||
comp | 2974887..2974971 | tac | 259 | 259 | 259 | |||||
2975231..2976097 | CDS | 289 | ||||||||
comp | 2979955..2981049 | CDS | 221 | 221 | 365 | |||||
2981271..2981346 | aca | 55 | 55 | 55 | ||||||
comp | 2981402..2981752 | CDS | 117 | |||||||
comp | 3063743..3064045 | CDS | 106 | 106 | 101 | 106 | ||||
comp | 3064152..3064227 | aag | 147 | 147 | ||||||
comp | 3064375..3064803 | CDS | 143 | |||||||
comp | 3194307..3194906 | CDS | 249 | 249 | 200 | |||||
3195156..3195232 | atgj | 173 | 173 | 173 | ||||||
3195406..3196356 | CDS | 317 | ||||||||
comp | 3206006..3206455 | CDS | 743 | 743 | 150 | |||||
comp | 3207199..3207273 | gag | 50 | 50 | 50 | |||||
comp | 3207324..3207689 | CDS | 122 | |||||||
3398165..3399901 | CDS | 554 | 554 | 579 | ||||||
3400456..3400530 | aac | 115 | 115 | 115 | ||||||
3400646..3400924 | CDS | 93 | ||||||||
3401737..3403497 | CDS | 227 | 227 | 587 | ||||||
comp | 3403725..3403799 | ggc | 208 | 208 | ||||||
comp | 3404008..3404082 | ggg | 74 | 74 | 74 | |||||
comp | 3404157..3404819 | CDS | 221 | |||||||
comp | 3597872..3598414 | CDS | 370 | 370 | 181 | |||||
3598785..3598869 | ttg | 151 | 151 | 151 | ||||||
comp | 3599021..3599251 | CDS | 77 |
aua cumuls[modifier | modifier le wikicode]
- Lien tableur: aua cumuls
opérons | Fréquences intercalaires tRNAs | Fréquences intercalaires cds | Fréquences aas cds chromosome | ||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
effectif | gammes | sans rRNAs | avec rRNAs | gammes | cds | gammes | cdsd | gammes | cdsa | gammes | cdsa 300 | ||
avec rRNA | opérons | 1 | 1 | 0 | - | 1 | 1 | 1 | 0 | 100 | 10 | 1 | 0 |
16 aas 23 5s | 0 | 20 | 0 | 50 | 7 | 40 | 7 | 200 | 22 | 30 | 0 | ||
16 atc gca hp | 1 | 40 | 1 | 100 | 10 | 80 | 9 | 300 | 11 | 60 | 1 | ||
16 cds 23 5s | 0 | 60 | 3 | 150 | 14 | 120 | 9 | 400 | 20 | 90 | 7 | ||
max a | 2 | 80 | 0 | 200 | 8 | 160 | 4 | 500 | 5 | 120 | 8 | ||
a doubles | 0 | 100 | 0 | 250 | 8 | 200 | 3 | 600 | 6 | 150 | 7 | ||
spéciaux | 0 | 120 | 0 | 300 | 10 | 240 | 4 | 700 | 3 | 180 | 2 | ||
total aas | 2 | 140 | 3 | 350 | 4 | 280 | 1 | 800 | 1 | 210 | 7 | ||
sans | opérons | 38 | 160 | 0 | 400 | 2 | 320 | 900 | 0 | 240 | 3 | ||
1 aa | 26 | 180 | 2 | 450 | 3 | 360 | 2 | 1000 | 0 | 270 | 5 | ||
max a | 3 | 200 | 1 | 500 | 1 | 400 | 1100 | 0 | 300 | 3 | |||
a doubles | 6 | 3 | 12 | 1 | 0 | 35 | |||||||
total aas | 53 | 13 | 0 | 80 | 40 | 78 | 78 | ||||||
total aas | 55 | ||||||||||||
remarques | 4 | ||||||||||||
avec jaune | moyenne | ||||||||||||
variance | |||||||||||||
sans jaune | moyenne | 131 | 226 | 153 | 235 | 158 | |||||||
variance | 75 | 165 | 128 | 125 | 69 |
aua blocs[modifier | modifier le wikicode]
- Lien tableur: aua blocs
CDS | 1752 | 153 | hp |
16s | 233 | 1486 | |
atc | 33 | ||
gca | 142 | ||
CDS | -15 | 117 | hp |
23s | 82 | 2829 | |
5s | 461 | 115 | |
CDS | 235 | replication initiation protein |
aua remarques[modifier | modifier le wikicode]
- cds de 77 aas: MIVLIAHVHQTSSEDEGERDEQDGFFSSLSALNTGPRATGVGVLRRRSASSRALDGRELAKDQLPETDPDNGGQAR
324..1028 | cds | 461 | 235 | replication initiation protein | |
comp | 1490..1604 | 5s | 82 | 115 | |
comp | 1687..4515 | 23s | -6 | 2829 | |
4510..4740 | cds | 253 | 77 | hp | |
comp | 4994..5069 | gca | 33 | ||
comp | 5103..5179 | atc | 236 | ||
comp | 5416..6898 | 16s | 718 | 1483 | |
comp | 7617..8363 | cds | 287 | 249 | hp |
comp | 8651..9178 | cds | 176 | excisionase family DNA-binding protein |
- Remarques: Le seul génome de cette étude dont l’unique bloc rRNA est dans un tout petit plasmide de 9 kpbs pour un chromosome circulaire de 3 742 793 pbs.
- @ Une protéine candidate à la création est dans le bloc rRNA, hp, petite taille de 77 aas avec un intercalaire négatif avec 23s (voir prélèvement du 6.1.20 ci-dessus)
- @ Des intercalaires entre aas très élevés par rapport aux clusters à plusieurs aas étudiés. Trois très élevés au-delà de 200 pbs, 44 270 208, trois supérieurs à 160, 161 173 186. Alors que la moyenne des autres génomes est autour de 15 pbs.
- @ A l’adresse 2367774, deux aas séparés par un cds à très faibles intercalaires, 43 et 36 pbs. Le cds a une taille de 102 aas. Est-ce un candidat à la création? La même situation se retrouve à l’adresse 2641174, avec des intervals moyens, 153 2936 mais le cds a encore une taille plus petite 89 aas.
- @ Un intercalaire négatif qui souligne surtout la proximité d’un aa et d’un cds se trouvant sur 2 brins différents. Ceci est du certainement aux processus de conversion génique qui agissent sur les blocs à rRNA, ici ceux-là ont disparus laissant cette configuration. Les 2 cds entourant les 2 aas sont énormes, 500 aas environs, et ne sont donc pas candidats à la création.
- Note: En séparant les tRNAs des 2 clusters du @3 le spectre des blocs sans rRNA est le suivant
aas effectif total 1 30 30 2 7 14 3 3 9 total aas 53
- Séquences des doubles: La caractéristique principale des doublons pour ce génome est la grandeur de leurs inteercalaires. Les blocs à doublons se répartissent en
- - 3 blocs à 2 aas doubles, cgt gaa ctc, séparés entre eux par respectivement, 51 140 132 pbs.
- - 2 blocs à 3 aas dont un doublet chacun, ggc atg atg et gta gac gac, avec respectivement entre les doubles 44 et 58 pbs
- - 1 bloc avec un triplet gtc avec les intercalaires de 128 186 pbs.
aua distribution[modifier | modifier le wikicode]
- Lien tableur: aua distribution
- Notes: ctc2 gtc3 gac2 gaa2 cgt2 atgf2
g1 | t1 | ||||||
---|---|---|---|---|---|---|---|
atgi | 1 | tct | tat | atgf | 3 | ||
att | act | aat | agt | ||||
ctt | cct | cat | cgc | ||||
gtt | gct | gat | ggt | ||||
ttc | 1 | tcc | 1 | tac | 1 | tgc | 1 |
atc | 1 | acc | 1 | aac | 2 | agc | 1 |
ctc | 2 | ccc | 1 | cac | 1 | cgt | 2 |
gtc | 3 | gcc | 1 | gac | 2 | ggc | 2 |
tta | 1 | tca | 1 | taa | tga | ||
ata | aca | 1 | aaa | 1 | aga | 1 | |
cta | 1 | cca | 1 | caa | 1 | cga | |
gta | 1 | gca | 1 | gaa | 2 | gga | 1 |
ttg | 1 | tcg | 1 | tag | tgg | 1 | |
atgj | 1 | acg | 1 | aag | 1 | agg | 1 |
ctg | 1 | ccg | 1 | cag | 1 | cgg | 1 |
gtg | 1 | gcg | 1 | gag | 1 | ggg | 1 |
alpha | >1aa | =1aa | -5s | +5s | -16s | +16s | total |
aua | 23 | 30 | 2 | 55 |
alpha synthèse[modifier | modifier le wikicode]
- Liens aux indices des clades: alpha bacilli gamma actino clostridia bacteroide cyano tener spiro beta epsilon delta bactéries
- Liens aux fiches: spiro tener gama alpha beta delta epsilon bacilli clostridia autres firmicutes actino bactero cyano archeo
alpha distribution par génome[modifier | modifier le wikicode]
- Lien tableur: alpha distribution par génome
baci | >1aa | 1aa | -5s | +5s | -16s | +16s | duplica | 1-3aas | total |
rtb | 8 | 25 | 0 | 33 | |||||
rpm | 7 | 30 | 8 | 42 | 5 | 92 | |||
rru | 4 | 36 | 8 | 4 | 3 | 55 | |||
oan | 6 | 41 | 8 | 4 | 59 | ||||
abq | 20 | 38 | 16 | 10 | 3 | 87 | |||
abs | 20 | 39 | 8 | 10 | 3 | 80 | |||
agr | 5 | 35 | 10 | 2 | 5 | 57 | |||
aua | 10 | 30 | 2 | 13 | 55 | ||||
total | 80 | 274 | 0 | 0 | 0 | 60 | 81 | 23 | 518 |
alpha distribution du total[modifier | modifier le wikicode]
- Lien tableur: alpha distribution du total
- - Couleurs du 1er tableau: voir bacilli
- - Couleurs du 2ème tableau: d'après les couleurs du pieds du tableau
- - Tableau des indices, en-tête: total génomes, total tRNAs, indice ttt, indice tgt.
|
|
|
alpha distribution par type[modifier | modifier le wikicode]
- Lien tableur: alpha distribution par type
- Légende: voir bacilli
|
|
|
alpha par rapport au groupe de référence[modifier | modifier le wikicode]
- Lien tableur: alpha par rapport au groupe de référence
- Le groupe de référence: voir la référence
- Légende:
- - carré ccc, c'est ctc gtc ccc gcc
- - g+cga, c'est gtg xcg xag ggg cga (dans l'hypothèse de la bascule des cgx, cgt/cgc cga/cgg)
tRNAs | blocs tRNAs | blocs rRNAs | |||||||
alpha8 | 1aa | >1aa | dup | +5s | 1-3aas | autres | total | ||
---|---|---|---|---|---|---|---|---|---|
21 | faible | 90 | 14 | 38 | 142 | ||||
16 | moyen | 103 | 15 | 16 | 60 | 134 | |||
14 | fort | 81 | 51 | 27 | 23 | 182 | |||
274 | 80 | 81 | 23 | 60 | 518 | ||||
10 | g+cga | 46 | 6 | 27 | 79 | ||||
2 | agg+cgg | 13 | 1 | 14 | |||||
4 | carre ccc | 30 | 7 | 11 | 48 | ||||
5 | autres | 1 | 1 | ||||||
90 | 14 | 38 | 142 | ||||||
total tRNAs ‰ | |||||||||
alpha8 | 1aa | >1aa | dup | +5s | 1-3aas | autres | alpha ‰ | ref.‰ | |
21 | faible | 174 | 27 | 73 | 274 | 26 | |||
16 | moyen | 199 | 29 | 31 | 116 | 259 | 324 | ||
14 | fort | 156 | 98 | 52 | 44 | 351 | 650 | ||
529 | 154 | 156 | 44 | 116 | 518 | 729 | |||
10 | g+cga | 89 | 12 | 52 | 153 | 10 | |||
2 | agg+cgg | 25 | 2 | 0 | 27 | ||||
4 | carre ccc | 58 | 14 | 21 | 93 | 16 | |||
5 | autres | 2 | 0 | 0 | 2 | ||||
174 | 27 | 73 | 274 | ||||||
blocs tRNAs ‰ | total colonne % | ||||||||
alpha8 | 1aa | >1aa | dup | total | ref.‰ | 1aa | >1aa | dup | |
21 | faible | 207 | 32 | 87 | 326 | 26 | 33 | 18 | 47 |
16 | moyen | 237 | 34 | 37 | 308 | 324 | 38 | 19 | 20 |
14 | fort | 186 | 117 | 62 | 366 | 650 | 30 | 64 | 33 |
630 | 184 | 186 | 435 | 729 | 274 | 80 | 81 | ||
10 | g+cga | 106 | 14 | 62 | 182 | 10 | 51 | 71 | |
2 | agg+cgg | 30 | 2 | 0 | 32 | 14 | |||
4 | carre ccc | 69 | 16 | 25 | 110 | 16 | 33 | 29 | |
5 | autres | 2 | 0 | 0 | 2 | 1 | |||
207 | 32 | 87 | 326 | 90 | 38 |
alpha, estimation des -rRNAs[modifier | modifier le wikicode]
- Lien tableur: alpha, estimation des -rRNAs
- Liens fiche: typage
- Légende: prélèvement de la base gtRNAdb le 27.5.20
- - ttt et tgt sont nuls partout
- - atgi, c'est Ile2, mis à la place de ttt, très rare chez les procaryotes.
- - atgf, c'est Metf, mis à la place de tgt, très rare chez les procaryotes.
- - atgj, c'est Met, remplace le atg standard qui est la somme Ile2 Met fMet.
- - Voir la légende des tris, g1 t1 et des couleurs
alpha, calcul des -rRNAs[modifier | modifier le wikicode]
- Lien tableur: alpha, calcul des -rRNAs
|
|
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|
|
alpha, comparaison clade-annexe des -rRNAs[modifier | modifier le wikicode]
- Lien tableur: alpha, comparaison clade-annexe des -rRNAs
- Légende
- - alp7. diff, somme des couleurs de alp7. La différence entre tRNAs est faite entre alp5 et alp6 du tableau précédent. Elle est exprimée en % et rapporté à la plus grande valeur des 2 termes de la différence. Ce qui fait quand un tRNA est à zéro la différence en % est égale à 100.
- - alp8. rap, rapport des sommes couleurs alp5/alp2. Le rapport -rRNA/total est celui du tRNA de alp5 sur celui de alp2.
- Fréquences des différences en % du tableau alp7
gamme 0/0 10 20 30 40 50 60 70 80 90 100 total fréquence 0 18 9 2 6 4 4 1 0 0 2 2 48 tot ≤ 50 39
- Comparaison avec le nombre de tRNAs de la fiche du clade: L’estimation des -rRNA par l'annexe est 19% au dessus de celle de la fiche des alpha.
tRNAs fiche annexe sans 3190 435 avec 525 205 genomes 70 8 indice % 46 54
|
|
Beta[modifier | modifier le wikicode]
Chromobacterium violaceum ATCC 12472[modifier | modifier le wikicode]
cvi opérons[modifier | modifier le wikicode]
- Lien tableur: cvi opérons
- Liens: gtRNAdb [34], NCBI [35], génome [36]
- Phylogénie: Bacteria; Proteobacteria; Betaproteobacteria; Neisseriales; Chromobacteriaceae; Chromobacterium.
- Légende:
65%GC | 30.6.19 Paris | 98 | doubles | intercalaire |
---|---|---|---|---|
421217..422762 | 16s | @1 | 179 | |
422942..423018 | atc | 86 | ||
423105..423180 | gca | 249 | ||
423430..426324 | 23s | 125 | ||
426450..426564 | 5s | |||
502182..503727 | 16s | 79 | ||
503807..503883 | atc | 12 | ||
503896..503971 | gca | 250 | ||
504222..507116 | 23s | 122 | ||
507239..507353 | 5s | |||
comp | 682034..682118 | ttg | ||
759824..759908 | tac | |||
comp | 878775..878849 | agg | ||
955155..955230 | gcg | |||
975612..975696 | ctc | |||
1006822..1006897 | ttc | + | 6 | |
1006904..1006979 | ttc | 2 ttc | ||
1058518..1058611 | agc | 6 | ||
1058618..1058694 | cgt | 3 | ||
1058698..1058772 | gaa | |||
comp | 1061741..1061815 | gaa | + | 3 |
comp | 1061819..1061895 | cgt | 2 gaa | 7 |
comp | 1061903..1061977 | gaa | 2cgt | 5 |
comp | 1061983..1062059 | cgt | ||
1154020..1155565 | 16s | 179 | ||
1155745..1155821 | atc | 86 | ||
1155908..1155983 | gca | 250 | ||
1156234..1159128 | 23s | 122 | ||
1159251..1159365 | 5s | |||
comp | 1263556..1263645 | tcg | ||
1273710..1273786 | atgf | |||
1377435..1377510 | ggc | + | 23 | |
1377534..1377609 | ggc | 5 ggc | 22 | |
1377632..1377707 | ggc | 24 | ||
1377732..1377807 | ggc | 29 | ||
1377837..1377912 | ggc | 45 | ||
1377958..1378031 | tgc | |||
1387010..1387094 | tta | |||
1420085..1420161 | gtc | |||
1427771..1427847 | ccc | |||
comp | 1433244..1433319 | aac | + | 32 |
comp | 1433352..1433427 | aac | 3 aac | 31 |
comp | 1433459..1433534 | aac | ||
1646821..1648366 | 16s | 179 | ||
1648546..1648622 | atc | 86 | ||
1648709..1648784 | gca | 249 | ||
1649034..1651928 | 23s | 122 | ||
1652051..1652165 | 5s | 89 | ||
1652255..1652369 | 5s | |||
1746117..1746207 | tcc | + | 53 | |
1746261..1746351 | tcc | 2 tcc | ||
1978844..1978919 | aac | |||
comp | 2094372..2094447 | cac | + | 26 |
comp | 2094474..2094549 | cac | 3 cac | 45 |
comp | 2094595..2094670 | cac | 27 | |
comp | 2094698..2094774 | aga | 18 | |
comp | 2094793..2094869 | cca | ||
comp | 2511625..2511712 | tca | ||
comp | 2747299..2747375 | gac | 7 | |
comp | 2747383..2747458 | gta | ||
2853221..2853305 | cta | |||
3187082..3187157 | aca | |||
3257362..3257437 | gcc | |||
3262246..3262321 | gcc | + | 8 | |
3262330..3262405 | gaa | 2 gcc | 11 | |
3262417..3262492 | gcc | |||
comp | 3371478..3371592 | 5s | 122 | |
comp | 3371715..3374609 | 23s | 250 | |
comp | 3374860..3374935 | gca | 12 | |
comp | 3374948..3375024 | atc | 79 | |
comp | 3375104..3376649 | 16s | ||
3472822..3472897 | gta | + | 12 | |
3472910..3472986 | gac | 5 gta | 26 | |
3473013..3473088 | gta | 6 gac | 12 | |
3473101..3473177 | gac | 1 gtg | 26 | |
3473204..3473279 | gta | 12 | ||
3473292..3473368 | gac | 26 | ||
3473395..3473470 | gta | 12 | ||
3473483..3473559 | gac | 27 | ||
3473587..3473663 | gta | 6 | ||
3473670..3473746 | gac | 27 | ||
3473774..3473850 | gtg | 6 | ||
3473857..3473933 | gac | |||
3622292..3622365 | ggg | |||
comp | 3820120..3820234 | 5s | 122 | |
comp | 3820357..3823251 | 23s | 249 | |
comp | 3823501..3823576 | gca | 86 | |
comp | 3823663..3823739 | atc | 179 | |
comp | 3823919..3825464 | 16s | ||
3828836..3828922 | ctg | + | 51 | |
3828974..3829060 | ctg | 4 ctg | 33 | |
3829094..3829180 | ctg | 57 | ||
3829238..3829324 | ctg | |||
3854547..3854622 | caa | @2 | 557 | |
3855180..3855255 | acg | 61 | ||
3855317..3855393 | ccg | + | 78 | |
3855472..3855548 | ccg | 2 ccg | ||
comp | 4059834..4059912 | atgi | ||
comp | 4244591..4244705 | 5s | 122 | |
comp | 4244828..4247722 | 23s | 249 | |
comp | 4247972..4248047 | gca | 86 | |
comp | 4248134..4248210 | atc | 179 | |
comp | 4248390..4249935 | 16s | ||
comp | 4325718..4325794 | atgf | ||
comp | 4389268..4389342 | caa | ||
4402077..4402153 | cgg | |||
comp | 4434130..4434244 | 5s | 122 | |
comp | 4434367..4437261 | 23s | 249 | |
comp | 4437511..4437586 | gca | 86 | |
comp | 4437673..4437749 | atc | 179 | |
comp | 4437929..4439474 | 16s | ||
4474196..4474272 | atgj | + | 35 | |
4474308..4474384 | atgj | 2 atgj | ||
comp | 4529616..4529690 | acc | ||
comp | 4532053..4532128 | tgg | ||
comp | 4533370..4533444 | acc | 24 | |
comp | 4533469..4533542 | gga | 52 | |
comp | 4533595..4533679 | tac | ||
comp | 4586712..4586787 | aaa | + | 38 |
comp | 4586826..4586901 | aag | 3 aaa | 35 |
comp | 4586937..4587012 | aaa | 2 aag | 28 |
comp | 4587041..4587116 | aag | 37 | |
comp | 4587154..4587229 | aaa |
cvi cumuls[modifier | modifier le wikicode]
- Lien tableur: cvi cumuls
opérons | Fréquences intercalaires tRNAs | ||||
---|---|---|---|---|---|
effectif | gammes | sans rRNAs | avec rRNAs | ||
avec rRNA | opérons | 8 | 1 | 0 | |
16 23 5s 0 | 0 | 20 | 16 | 2 | |
16 atc gca | 8 | 40 | 20 | ||
16 23 5s a | 0 | 60 | 6 | ||
max a | 2 | 80 | 2 | ||
a doubles | 0 | 100 | 0 | 6 | |
spéciaux | 0 | 120 | 0 | ||
total aas | 16 | 140 | 0 | ||
sans | opérons | 37 | 160 | 0 | |
1 aa | 22 | 180 | 0 | ||
max a | 12 | 200 | 0 | ||
a doubles | 12 | 1 | |||
total aas | 82 | 45 | 8 | ||
total aas | 98 | ||||
remarques | 2 | ||||
avec jaune | moyenne | ||||
variance | |||||
sans jaune | moyenne | 26 | 86 | ||
variance | 18 | 0 |
cvi blocs[modifier | modifier le wikicode]
- Lien tableur: cvi blocs
16s | 179 | 1546 | 79 | 1546 | 179 | 1546 | ||
atc | 86 | 12 | 86 | |||||
gca | 249 | 250 | 250 | |||||
23s | 125 | 2895 | 122 | 2895 | 122 | 2895 | ||
5s | 115 | 115 | 115 | |||||
5s | 122 | 115 | 122 | 115 | 122 | 115 | 122 | 115 |
23s | 250 | 2895 | 249 | 2895 | 249 | 2895 | 249 | 2895 |
gca | 12 | 86 | 86 | 86 | ||||
atc | 79 | 179 | 179 | 179 | ||||
16s | 1546 | 1546 | 1546 | 1546 | ||||
16s | 179 | 1546 | ||||||
atc | 86 | |||||||
gca | 249 | |||||||
23s | 122 | 2895 | ||||||
5s | 89 | 115 | ||||||
5s | 115 |
cvi remarques[modifier | modifier le wikicode]
- Lien tableur: cvi remarques
- Remarques : Pas de blocs 16-23-5s et 8 blocs 16-atc gca 23-5s. Beaucoup de doubles.
- @ 8 blocs 16-atc gca 23-5s tous sans aas supplémentaires.
- - Les intercalaires gca-23s-5s sont tous identiques, 250 122.
- - Un groupe de 2 opérons aux intercalaires 16s-atc-gca 79 12 très différent du suivant
- - Un groupe de 6 opérons aux intercalaires 16s-atc-gca 179 86, respectivement 2 et 7 fois plus grands.
- - Un opéron présente 1 5s supplémentaire collé au 1er.
- @ Un intercallaire très élevé, 557 bases, entre 2 aas d’un opéron à 4aas.
- @ 8 blocs 16-atc gca 23-5s tous sans aas supplémentaires.
- Séquences des doubles : 12 opérons sur 23 à 2aas et plus ont des doubles. 3 opérons à séquences répétées.
- - 12 opérons sans rRNAs sur 15 à 2 aas et plus ont des doubles.
- - 4 opérons avec 1 doublet chacun
- - 1 opéron au doublet séparé (gcc gaa gcc
- - 4 opérons à répétitions multiples non séparées, voir ci-dessous.
- - 3 opérons avec répétition de séquences
- 2gaa 2cgt avec 2*2
- 3aaa 2aag avec 2*2
- 4gta 6gac 2gtg avec 4*2 + 2*2.
2ttc 3aac 2gaa 2cgt 2*2 2tcc cca aga 3cac 3aaa 2aag 2*2 2atg 4ctg 4gta 6gac 2gtg 4*2 + 2*2 caa acg 2ccg tgc 5ggc - - gcc gaa gcc - - -
- Code génétique de cvi:
- Légende: prélèvement de la base gtRNAdb le
- - totaux en en-tête, 99 total de gtRNAdb contenant des pseudo et inconnus; 98 total du cumul. Le tRNA impacté est atgf avec 3 gtRNAdb et 2 en NCBI.
- - atgi, c'est Ile2, mis à la place de ttt, très rare chez les procaryotes.
- - atgf, c'est Metf, mis à la place de tgt, très rare chez les procaryotes.
- - atgj, c'est Met, remplace le atg standard qui est la somme Ile2 Metf Met.
- - Voir la légende des tris et couleurs, g1 t1.
- Légende: prélèvement de la base gtRNAdb le
g1 | t1 | 99 | 98 | ||||
---|---|---|---|---|---|---|---|
atgi | 1 | tct | tat | atgf | 3 | ||
att | act | aat | agt | ||||
ctt | cct | cat | cgc | ||||
gtt | gct | gat | ggt | ||||
ttc | 2 | tcc | 2 | tac | 2 | tgc | 1 |
atc | 8 | acc | 2 | aac | 4 | agc | 1 |
ctc | 1 | ccc | 1 | cac | 3 | cgt | 3 |
gtc | 1 | gcc | 3 | gac | 7 | ggc | 5 |
tta | 1 | tca | 1 | taa | tga | ||
ata | aca | 1 | aaa | 3 | aga | 1 | |
cta | 1 | cca | 1 | caa | 2 | cga | |
gta | 5 | gca | 8 | gaa | 4 | gga | 1 |
ttg | 1 | tcg | 1 | tag | tgg | 1 | |
atgj | 2 | acg | 1 | aag | 2 | agg | 1 |
ctg | 4 | ccg | 2 | cag | cgg | 1 | |
gtg | 2 | gcg | 1 | gag | ggg | 1 |
cvi distribution[modifier | modifier le wikicode]
- Lien tableur: cvi distribution
- Liens aux fiches: beta
- Liens aux indices: beta epsilon delta
- Notes:
- Légende: Tableau des indices, en-tête: total des génomes, total des tRNAs, indice ttt, indice tgt.
aac3 atgj2 cac3 ccg2 ctg4 ggc5 tcc2 ttc2 séquences: (gaa cgt)2 ((gta gac)5 gtg gac) ((aaa aag)2 aaa)
|
|
|
|
cvi intercalaires entre cds[modifier | modifier le wikicode]
- Lien NCBI [37] 25.12.20
- Note: Pour les génomes des annexes j'ai relevé les intercalaires entre tRNAs et entre ceux-ci et les cds qui leur sont adjacents. L'exemple est celui de rru du clade alpha. L'idée de départ de ces prélèvements est la recherche d'opérons formés de tRNA et de protéine comme dans le cas d'E.coli: l'intercalaire entre le tRNA et la protéine devrait être faible. Voir l'exemple d'eco (remarque @3) avec tac-tac-tpr et aca-tac-gga-acc-tufB.
cvi les fréquences[modifier | modifier le wikicode]
- Lien tableur: cvi intercalaires entre cds
- Légende: long, longueur en pbs, intercal pour intercalaire
- - fréquence-1 1 5 6 f, respectivement fréquence des intercalaires négatives à l'unité, positives à l'unité, par blocs de 5, par blocs de 10 jusqu'à 600 pbs et f pour finales. Ces fréquences servent à faire les diagrammes. La fréquence fréquencez est l'étendue à 1200 de la fréquence6 pour certains grands génomes.
- - cumul,% colonne à la droite de frequence6, reprend les fréquences par plages et leurs pourcentages indiqués déjà dans la 1ère partie du tableau.
- - La couleur cyan des fréquences fréquence-1 et 1 sert à montrer leur périodicité ternaire.
- - intercaln intercalx, pour les intercalaires négatifs minimaux et intercalaires positifs maximaux.
- - colonne ADN pour la longueur totale du génome en pbs et intercals pour le total en pbs des intercalaires entre cds uniquement, d'après la méthode des prélèvements de NCBI du 25.12.20.
cvi | intercalaires | total | % | intercalaires | moyenne | ecartype | plage | ADN | intercal | frequence5 | intercal | fréquencez |
---|---|---|---|---|---|---|---|---|---|---|---|---|
négatif | 756 | 17.7 | négatif | -8 | 11 | -1 à -102 | 4 751 080 | -1 | 756 | 610 | 2 | |
zéro | 15 | 0.4 | intercals | 0 | 15 | 620 | 1 | |||||
1 à 200 | 2842 | 66.4 | 0 à 200 | 74 | 55 | 452 650 | 5 | 227 | 630 | 2 | ||
201 à 370 | 455 | 10.6 | 201 à 370 | 266 | 47 | 9.5% | 10 | 169 | 640 | 1 | ||
371 à 600 | 147 | 3.4 | 371 à 600 | 453 | 59 | 15 | 168 | 650 | 1 | |||
601 à max | 67 | 1.6 | 601 à 1309 | 795 | 172 | 20 | 110 | 660 | 4 | |||
total 4282 | <201 | 84.4 | total 4281 | 104 | 142 | -102 à 1309 | 25 | 72 | 670 | 4 | ||
adresse | intercalx | intercal | fréquence1 | intercal | fréquence6 | cumul,% | intercal | fréquence-1 | 30 | 66 | 680 | 2 |
1407250 | 1977 | -1 | 756 | -70 | 6 | 0 | 15 | 35 | 68 | 690 | 3 | |
2476400 | 1309 | 0 | 15 | -60 | 1 | -1 | 118 | 40 | 65 | 700 | 5 | |
667844 | 1253 | 1 | 65 | -50 | 4 | -2 | 3 | 45 | 75 | 710 | 2 | |
448587 | 1220 | 2 | 47 | -40 | 9 | -3 | 0 | 50 | 67 | 720 | 1 | |
357760 | 1187 | 3 | 52 | -30 | 12 | min à -1 | -4 | 397 | 55 | 84 | 730 | 5 |
707510 | 1165 | 4 | 36 | -20 | 32 | 756 | -5 | 0 | 60 | 94 | 740 | 2 |
139762 | 1148 | 5 | 27 | -10 | 103 | 17.7% | -6 | 2 | 65 | 120 | 750 | 1 |
1309853 | 1098 | 6 | 21 | 0 | 604 | -7 | 12 | 70 | 126 | 760 | 2 | |
2457295 | 1068 | 7 | 24 | 10 | 396 | -8 | 56 | 75 | 114 | 770 | 1 | |
669869 | 1004 | 8 | 18 | 20 | 278 | -9 | 1 | 80 | 82 | 780 | 1 | |
2288697 | 984 | 9 | 49 | 30 | 138 | -10 | 6 | 85 | 62 | 790 | 1 | |
1828489 | 968 | 10 | 57 | 40 | 133 | 1 à 100 | -11 | 35 | 90 | 53 | 800 | 4 |
3613803 | 905 | 11 | 44 | 50 | 142 | 1969 | -12 | 1 | 95 | 81 | 810 | 1 |
2465473 | 902 | 12 | 32 | 60 | 178 | 46.0% | -13 | 12 | 100 | 66 | 820 | 2 |
2025387 | 900 | 13 | 39 | 70 | 246 | -14 | 21 | 105 | 60 | 830 | 0 | |
869124 | 888 | 14 | 28 | 80 | 196 | -15 | 0 | 110 | 57 | 840 | 1 | |
2030614 | 865 | 15 | 25 | 90 | 115 | -16 | 4 | 115 | 69 | 850 | 0 | |
664864 | 858 | 16 | 33 | 100 | 147 | -17 | 19 | 120 | 48 | 860 | 1 | |
2442265 | 838 | 17 | 19 | 110 | 117 | -18 | 0 | 125 | 58 | 870 | 1 | |
561508 | 819 | 18 | 20 | 120 | 117 | -19 | 5 | 130 | 69 | 880 | 0 | |
1345805 | 811 | 19 | 23 | 130 | 127 | -20 | 13 | 135 | 48 | 890 | 1 | |
27453 | 809 | 20 | 15 | 140 | 92 | -21 | 1 | 140 | 44 | 900 | 1 | |
3009727 | 799 | 21 | 17 | 150 | 71 | -22 | 2 | 145 | 41 | 910 | 2 | |
914899 | 796 | 22 | 15 | 160 | 81 | -23 | 5 | 150 | 30 | 920 | 0 | |
344593 | 793 | 23 | 8 | 170 | 72 | 1 à 200 | -24 | 1 | 155 | 46 | 930 | 0 |
1783705 | 791 | 24 | 21 | 180 | 63 | 2842 | -25 | 3 | 160 | 35 | 940 | 0 |
1569417 | 787 | 25 | 11 | 190 | 67 | 66.4% | -26 | 3 | 165 | 41 | 950 | 0 |
3000804 | 771 | 26 | 15 | 200 | 66 | -27 | 0 | 170 | 31 | 960 | 0 | |
34255 | 767 | 27 | 10 | 210 | 58 | -28 | 1 | 175 | 37 | 970 | 1 | |
136535 | 759 | 28 | 14 | 220 | 38 | -29 | 3 | 180 | 26 | 980 | 0 | |
2126902 | 751 | 29 | 15 | 230 | 42 | -30 | 0 | 185 | 39 | 990 | 1 | |
1360178 | 742 | 30 | 12 | 240 | 37 | -31 | 4 | 190 | 28 | 1000 | 0 | |
3310655 | 736 | 31 | 18 | 250 | 22 | 0 à 200 | -32 | 2 | 195 | 34 | 1010 | 1 |
2140607 | 733 | 32 | 12 | 260 | 29 | 2857 | total | 75 | 200 | 32 | 1020 | 0 |
33 | 17 | 270 | 37 | reste | 26 | 205 | 32 | 1030 | 0 | |||
34 | 11 | 280 | 31 | total | 771 | 210 | 26 | 1040 | 0 | |||
35 | 10 | 290 | 28 | 215 | 19 | 1050 | 0 | |||||
36 | 12 | 300 | 22 | intercal | fréquencef | 220 | 19 | 1060 | 0 | |||
37 | 14 | 310 | 21 | 600 | 4215 | 225 | 21 | 1070 | 1 | |||
38 | 10 | 320 | 20 | 620 | 3 | 230 | 21 | 1080 | 0 | |||
39 | 13 | 330 | 11 | 640 | 3 | 235 | 17 | 1090 | 0 | |||
40 | 16 | 340 | 19 | 201 à 370 | 660 | 5 | 240 | 20 | 1100 | 1 | ||
reste | 2566 | 350 | 11 | 455 | 680 | 6 | 245 | 11 | 1110 | 0 | ||
total | 3857 | 360 | 11 | 10.6% | 700 | 8 | 250 | 11 | 1120 | 0 | ||
370 | 18 | 720 | 3 | 255 | 9 | 1130 | 0 | |||||
380 | 10 | 740 | 7 | 260 | 20 | 1140 | 0 | |||||
390 | 10 | 760 | 3 | 265 | 17 | 1150 | 1 | |||||
adresses | intercaln | décalage | long | 400 | 11 | 780 | 2 | 270 | 20 | 1160 | 0 | |
4014450 | -102 | comp | 410 | 11 | 800 | 5 | 275 | 15 | 1170 | 1 | ||
1765439 | -97 | shift2 | 1671 | 420 | 9 | 820 | 3 | 280 | 16 | 1180 | 0 | |
1246857 | -94 | shift2 | 798 | 430 | 12 | 840 | 1 | 285 | 17 | 1190 | 1 | |
4426186 | -80 | comp | 440 | 14 | 860 | 1 | 290 | 11 | 1200 | 0 | ||
3511064 | -73 | shift2 | 1 | 450 | 9 | 880 | 1 | 295 | 14 | reste | 4 | |
3199809 | -71 | shift2 | 494 | 460 | 5 | 900 | 2 | 300 | 8 | total | 4282 | |
3580355 | -61 | comp | 470 | 6 | 920 | 2 | 305 | 14 | ||||
4088183 | -59 | 480 | 6 | 940 | 310 | 7 | ||||||
2599768 | -57 | 490 | 5 | 960 | 315 | 14 | ||||||
1062106 | -56 | 500 | 1 | 980 | 1 | 320 | 6 | |||||
3542032 | -50 | 510 | 10 | 1000 | 1 | 325 | 5 | |||||
834886 | -49 | 520 | 5 | 1020 | 1 | 330 | 6 | |||||
2603937 | -44 | 530 | 4 | 1040 | 335 | 13 | ||||||
2822032 | -44 | 540 | 2 | 371 à 600 | 1060 | 340 | 6 | |||||
4104968 | -44 | 550 | 4 | 147 | 1080 | 1 | 345 | 6 | ||||
283435 | -43 | 560 | 3 | 3.4% | 1100 | 1 | 350 | 5 | ||||
226851 | -41 | 570 | 5 | 1120 | 355 | 6 | ||||||
387678 | -41 | 580 | 3 | 601 à max | 1140 | 360 | 5 | |||||
1796583 | -41 | 590 | 0 | 67 | 1160 | 1 | 365 | 10 | ||||
4120154 | -40 | 600 | 2 | 1.6% | 61 | 370 | 8 | |||||
3951302 | -38 | reste | 67 | reste | 6 | reste | 214 | |||||
4595659 | -38 | total | 4282 | total | 4282 | total | 4282 |
cvi autres intercalaires[modifier | modifier le wikicode]
- Lien tableur: cvi autres intercalaires
- Légende:
- - comp, le gène est sur le brin complement
- - deb, fin sont respectivement dans le sens des adresses croissantes, le cds avant le 1er tRNA et le cds après le dernier tRNA du bloc.
|
|