Recherche:Les clusters de gènes tRNA et rRNA chez les procaryotes/Annexe/alpha
Aller à la navigation
Aller à la recherche
Rickettsia typhi str. B9991CWPP[modifier | modifier le wikicode]
rtb opérons[modifier | modifier le wikicode]
- Liens: gtRNAdb [1], NCBI [2], génome [3]
- Lien tableur: rtb opérons
- Phylogénie: Bacteria; Proteobacteria; Alphaproteobacteria; Rickettsiales; Rickettsiaceae; Rickettsieae; Rickettsia; typhus group.
- Légende: cdsa: cds aas, cdsd: cds dirigé
29%GC | 31.12.19 Paris | 33 | doubles | intercal | cds | aa | avec aa | cdsa | cdsd | protéines |
---|---|---|---|---|---|---|---|---|---|---|
comp | 7429..8469 | cds | 381 | 381 | 347 | UDP-3-O-(3-hydroxymyristoyl)glucosamine N-acyltransferase | ||||
comp | 8851..8926 | ttc | 368 | 368 | ||||||
9295..10278 | cds | 328 | tRNA dihydrouridine synthase DusB | |||||||
14663..18055 | cds | 108 | 108 | 1131 | autotransporter outer membrane beta-barrel domain-containing protein | |||||
18164..18238 | gaa | 1394 | 1394 | |||||||
comp | 19633..20106 | cds | 158 | crossover junction endodeoxyribonuclease RuvC | ||||||
comp | 48065..48709 | cds | 278 | 278 | 215 | YihA family ribosome biogenesis GTP-binding protein | ||||
comp | 48988..49064 | atgf | 110 | 110 | ||||||
comp | 49175..49411 | cds | 79 | 50S ribosomal protein L31 | ||||||
comp | 73627..73929 | cds | 17 | 17 | 101 | preprotein translocase subunit SecG | ||||
comp | 73947..74021 | acc | 139 | 139 | ||||||
comp | 74161..75417 | cds | 419 | MFS transporter | ||||||
155064..157163 | cds | 143 | 143 | 700 | elongation factor G | |||||
157307..157382 | tgg | 167 | 167 | |||||||
157550..157750 | cds | 67 | preprotein translocase subunit SecE | |||||||
189197..189400 | cds | 889 | 889 | 68 | DUF2674 domain-containing protein | |||||
comp | 190290..190365 | acg | 142 | 142 | ||||||
comp | 190508..192814 | cds | 769 | outer membrane protein assembly factor BamA | ||||||
255010..255921 | cds | 732 | 732 | 304 | methionyl-tRNA formyltransferase | |||||
256654..259439 | 23s | 206 | 2786 | |||||||
259646..259760 | 5s | 173 | 173 | 115 | ||||||
comp | 259934..261007 | cds | 358 | cell division protein ZapE | ||||||
291358..291843 | cds | 35 | 35 | 162 | 30S ribosomal protein S9 | |||||
291879..291955 | atgj | 1364 | 1364 | |||||||
comp | 293320..293805 | cds | 162 | RNA pyrophosphohydrolase | ||||||
335194..336996 | cds | 402 | 402 | 601 | elongation factor 4 | |||||
337399..337473 | aac | 633 | 633 | |||||||
comp | 338107..338793 | cds | 229 | hp | ||||||
comp | 440466..440933 | cds | 496 | 496 | 156 | DUF2155 domain-containing protein | ||||
441430..441504 | tgc | 31 | 31 | |||||||
441536..442456 | cds | 307 | site-specific tyrosine recombinase XerD | |||||||
comp | 469056..469781 | cds | 218 | 218 | 242 | 3-deoxy-manno-octulosonate cytidylyltransferase | ||||
470000..470075 | aaa | 15 | 15 | |||||||
470091..470167 | atc | 1922 | 1922 | |||||||
472090..472662 | cds | 191 | GTP cyclohydrolase I FolE | |||||||
comp | 564534..565562 | cds | 1530 | 1530 | 343 | type 2 isopentenyl-diphosphate Delta-isomerase | ||||
comp | 567093..567180 | tcc | 218 | 218 | ||||||
comp | 567399..568145 | cds | 249 | NTP transferase domain-containing protein | ||||||
583250..584149 | cds | 1278 | 1278 | 300 | hydroxymethylbilane synthase | |||||
comp | 585428..585518 | tca | 58 | 58 | ||||||
comp | 585577..586569 | cds | 331 | tryptophan--tRNA ligase | ||||||
598723..599706 | cds | 26 | 26 | 328 | polyprenyl synthetase family protein | |||||
599733..599809 | cgg | 60 | 60 | |||||||
comp | 599870..599944 | caa | 62 | 62 | ||||||
comp | 600007..601779 | cds | 591 | aminopeptidase P family protein | ||||||
comp | 644357..644745 | cds | 499 | 499 | 130 | p-ribosome-associated translation inhibitor RaiA | ||||
645245..645321 | gac | @1 | 1051 | 1051 | ||||||
comp | 646373..646448 | gcc | 222 | 222 | ||||||
comp | 646671..647276 | cds | 202 | ATP-dependent Clp endopeptidase proteolytic subunit ClpP | ||||||
comp | 649389..650048 | cds | 452 | 452 | 220 | (d)CMP kinase | ||||
650501..650577 | gtc | 1274 | 1274 | |||||||
comp | 651852..652094 | cds | 81 | HU family DNA-binding protein | ||||||
comp | 696163..697398 | cds | 1535 | 1535 | 412 | tyrosine--tRNA ligase | ||||
698934..699010 | cgt | 1028 | 1028 | |||||||
700039..705720 | cds | 1894 | alpha-2-macroglobulin family protein | |||||||
comp | 727560..728087 | cds | 1164 | 1164 | 176 | copper chaperone Pcu(A)C | ||||
comp | 729252..729326 | gca | 32 | 32 | ||||||
comp | 729359..729574 | cds | 72 | hp | ||||||
739215..740075 | cds | 181 | 181 | 287 | TIGR01459 family HAD-type hydrolase | |||||
740257..740343 | ctc | 246 | 246 | |||||||
740590..741960 | cds | 1199 | 1199 | 457 | magnesium transporter | |||||
743160..743234 | ggc | 1090 | 1090 | |||||||
744325..744753 | cds | 143 | preprotein translocase subunit YajC | |||||||
comp | 775944..777866 | cds | 2465 | 2465 | 641 | hp | ||||
comp | 780332..781831 | 16s | 1854 | 1854 | 1500 | |||||
comp | 783686..785485 | cds | 600 | PAS domain-containing sensor histidine kinase | ||||||
comp | 814590..814823 | cds | 349 | 349 | 78 | hp | ||||
comp | 815173..815248 | gta | 68 | 68 | ||||||
comp | 815317..815589 | cds | 91 | 30S ribosomal protein S20 | ||||||
comp | 829300..830484 | cds | 82 | 82 | 395 | elongation factor Tu | ||||
comp | 830567..830640 | gga | 95 | 95 | ||||||
comp | 830736..830821 | tac | 183 | 183 | ||||||
831005..831733 | cds | 243 | 23s rRNA (guanosine(2251)-2'-O)-methyltransferase RlmB | |||||||
839841..839969 | cds | 145 | 145 | 43 | dimethyladenosine transferase | |||||
840115..840200 | tta | 2009 | 2009 | |||||||
842210..842446 | cds | 79 | hp | |||||||
comp | 876906..877589 | cds | 401 | 401 | 228 | 7-cyano-7-deazaguanine synthase QueC | ||||
877991..878067 | cac | 145 | 145 | |||||||
878213..879943 | cds | 577 | ATP-binding cassette domain-containing protein | |||||||
918938..919882 | cds | 951 | 951 | 315 | ACP S-malonyltransferase | |||||
920834..920925 | agc | 1945 | 1945 | |||||||
comp | 922871..924049 | cds | 393 | acetyl-CoA C-acetyltransferase | ||||||
comp | 961209..962297 | cds | 41 | 41 | 363 | YjgP/YjgQ family permease | ||||
comp | 962339..962415 | atgi | 390 | 390 | ||||||
comp | 962806..963273 | cds | 156 | peptidoglycan-associated lipoprotein Pal | ||||||
1023375..1023626 | cds | 1585 | 1585 | 84 | BolA family transcriptional regulator | |||||
1025212..1025288 | cca | 17 | 17 | |||||||
1025306..1025521 | cds | 72 | translation initiation factor IF-1 | |||||||
1053321..1054139 | cds | 2191 | 2191 | 273 | alpha/beta hydrolase | |||||
comp | 1056331..1056407 | aga | 98 | 98 | ||||||
1056506..1056823 | cds | 106 | DUF167 domain-containing protein | |||||||
comp | 1098776..1099240 | cds | 40 | 40 | 155 | DNA polymerase III subunit chi | ||||
comp | 1099281..1099365 | cta | 145 | 145 | ||||||
comp | 1099511..1100662 | cds | 384 | succinyl-diaminopimelate desuccinylase | ||||||
comp | 1102351..1102980 | cds | 475 | 475 | 210 | lipoyl(octanoyl) transferase LipB | ||||
comp | 1103456..1103530 | aca | 130 | 130 | ||||||
comp | 1103661..1103996 | cds | 112 | 30S ribosomal protein S16 |
rtb cumuls[modifier | modifier le wikicode]
- Lien tableur: rtb cumuls
- Légende
- Notes: moyenne et variance des intercalaires élevés des 21 cds : 1430 et 491
opérons | Fréquences intercalaires tRNAs | Fréquences intercalaires cds | Fréquences aas cds chromosome | ||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
effectif | gammes | sans rRNAs | avec rRNAs | gammes | cds | gammes | cdsd | gammes | cdsa | gammes | cdsa 300 | ||
avec rRNA | opérons | 2 | 1 | - | 1 | 0 | 1 | 100 | 11 | 30 | 0 | ||
23s5s | 1 | 20 | 1 | 50 | 8 | 40 | 200 | 13 | 60 | 1 | |||
16s | 1 | 40 | 100 | 5 | 80 | 300 | 12 | 90 | 9 | ||||
16s23s | 0 | 60 | 1 | 150 | 9 | 120 | 400 | 13 | 120 | 4 | |||
max a | 0 | 80 | 200 | 4 | 160 | 500 | 3 | 150 | 2 | ||||
a doubles | 0 | 100 | 1 | 250 | 4 | 200 | 600 | 3 | 180 | 7 | |||
spéciaux | 0 | 120 | 300 | 1 | 240 | 700 | 3 | 210 | 3 | ||||
total aas | 0 | 140 | 350 | 1 | 280 | 800 | 1 | 240 | 4 | ||||
sans | opérons | 29 | 160 | 400 | 3 | 320 | 900 | 0 | 270 | 3 | |||
1 aa | 25 | 180 | 450 | 2 | 360 | 1000 | 0 | 300 | 3 | ||||
max a | 2 | 200 | 500 | 4 | 400 | 1100 | 0 | 330 | 5 | ||||
a doubles | 0 | 1 | 21 | 2 | 20 | ||||||||
total aas | 33 | 4 | 0 | 62 | 0 | 61 | 61 | ||||||
total aas | 33 | ||||||||||||
remarques | 1 | ||||||||||||
avec jaune | moyenne | 612 | 310 | ||||||||||
variance | 665 | 291 | |||||||||||
sans jaune | moyenne | 57 | 193 | 269 | 176 | ||||||||
variance | 40 | 148 | 176 | 86 |
rtb blocs[modifier | modifier le wikicode]
- Lien tableur: rtb blocs
cds | 732 | 304 | methionyl-tRNA formyltransferase |
23s | 206 | 2786 | |
5s | 173 | 115 | |
cds | 358 | cell division protein ZapE | |
cds | 2465 | 641 | hp |
16s | 1854 | 1500 | |
cds | 600 | PAS domain-containing sensor histidine kinase |
rtb remarques[modifier | modifier le wikicode]
- Remarques: Les rickettia, rtb et rpl, présentent de nombreux intercalaires très élevés. D’où cet intercalaire @1 entre 2 aas de 1051 pbs. Je détaille ici les intercalaires du tableau des cumuls.
- - Les intercalaires entre aas: Il y a quatre intercalaires de ce type, 1051 95 60 15. A part le 1er les 3 autres sont courants dans cette étude et seulement le dernier est le rprésentant de la moyenne dans cette étude.
- - Les intercalaires avec un cds. Les 31 blocs de ce génomes se répartissent en 3 groupes
- Les RNAs complètement isolés, les 2 intercalaires du bloc sont supérieurs à 400 pbs. Il y a 6 aas dont celui avec 1051, plus le 16s. Sur ces 14 intercalaires 10 sont supérieurs à 900 et 4 entre 400 et 600 pbs.
- Les tRNAs proches de leurs 2 cds. Il y a 6 aas dont les 2 intercalaires sont inférieurs à 300 pbs et 4 aas dont au moins un des 2 intercalaires est entre 300 et 400 pbs et l'autre inférieur à 300 pbs.
- Il reste 14 blocs dont le 23s5s, auxquels il faut ajouter l’aa gcc voisin du gac isolé par 1051. Ces blocs sont très polarisés, leurs 2 intercalaires sont très dissymétriques.
- - 11 aas ont leur intercalaire majeur supérieur à 900 et va jusqu’à 2465 pbs. Le 23s5s a un intercalaire majeur modéré et assez courant pour les blocs à rRNAs.
- - 3 aas ont leur intercalaire majeur de 450 pbs environ.
- Les blocs isolés et les blocs entourés par 2 cds.
Blocs à RNAs isolés par 2 intercalaires de plus de 400 pbs. bloc adresse Blocs entourés par 2 intercalaires de 300 à 400 pbs aac 337399 ttc 8851 gac 645245 gta 815173 gtc 650501 cac 877991 cgt 698934 atgi 962339 ggc 743160 16s 780332 Blocs entourés par 2 intercalaires inférieurs à 300 pbs agc 920834 atgf 48988 : : acc 73947 : : tgg 157307 : : cgg-caa 599733 : : gga-tac 830567 : : cta 1099281
- Les séquences des doubles: Il n'y a aucun double dans ce génome
rtb distribution[modifier | modifier le wikicode]
- Lien tableur: rtb distribution
g1 | t1 | ||||||
---|---|---|---|---|---|---|---|
atgi | 1 | tct | tat | atgf | 1 | ||
att | act | aat | agt | ||||
ctt | cct | cat | cgc | ||||
gtt | gct | gat | ggt | ||||
ttc | 1 | tcc | 1 | tac | 1 | tgc | 1 |
atc | 1 | acc | 1 | aac | 1 | agc | 1 |
ctc | 1 | ccc | cac | 1 | cgt | 1 | |
gtc | 1 | gcc | 1 | gac | 1 | ggc | 1 |
tta | 1 | tca | 1 | taa | tga | ||
ata | aca | 1 | aaa | 1 | aga | 1 | |
cta | 1 | cca | 1 | caa | 1 | cga | |
gta | 1 | gca | 1 | gaa | 1 | gga | 1 |
ttg | tcg | tag | tgg | 1 | |||
atgj | 1 | acg | 1 | aag | agg | ||
ctg | ccg | cag | cgg | 1 | |||
gtg | gcg | gag | ggg | ||||
alpha | >1aa | =1aa | -5s | +5s | -16s | +16s | total |
rtb | 6 | 27 | 33 |
rtb intercalaires entre cds[modifier | modifier le wikicode]
- Rickettsia typhi str. B9991CWPP, 7.12.2020, NCBI [4]
- Note: Pour les génomes des annexes j'ai relevé les intercalaires entre tRNAs et entre ceux-ci et les cds qui leur sont adjacents. L'exemple est celui de rru du clade alpha. L'idée de départ de ces prélèvements est la recherche d'opérons formés de tRNA et de protéine comme dans le cas d'E.coli: l'intercalaire entre le tRNA et la protéine devrait être faible. Voir l'exemple d'eco (remarque @3) avec tac-tac-tpr et aca-tac-gga-acc-tufB.
rtb les fréquences[modifier | modifier le wikicode]
- Lien tableur: rtb intercalaires entre cds
- Légende: long, longueur en pbs, intercal pour intercalaire
- - fréquence-1 1 5 6 f, respectivement fréquence des intercalaires négatives à l'unité, positives à l'unité, par blocs de 5, par blocs de 10 jusqu'à 600 pbs et f pour finales. Ces fréquences servent à faire les diagrammes. La fréquence fréquencez est l'étendue à 1200 de la fréquence6 pour certains grands génomes.
- - cumul,% colonne à la droite de frequence6, reprend les fréquences par plages et leurs pourcentages indiqués déjà dans la 1ère partie du tableau.
- - La couleur cyan des fréquences fréquence-1 et 1 sert à montrer leur périodicité ternaire.
- - intercaln intercalx, pour les intercalaires négatifs minimaux et intercalaires positifs maximaux.
- - colonne ADN pour la longueur totale du génome en pbs et intercals pour le total en pbs des intercalaires entre cds uniquement, d'après la méthode des prélèvements de NCBI du 7.12.20.
rtb | intercalaires | total | % | intercalaires | moyenne | ecartype | plage | ADN | intercal | frequence5 | intercal | fréquencez |
---|---|---|---|---|---|---|---|---|---|---|---|---|
négatif | 102 | 12.9 | négatif | -11 | 10 | -50 à -1 | 1 112 957 | -1 | 102 | 610 | 1 | |
zéro | 5 | 0.6 | intercals | 0 | 5 | 620 | 2 | |||||
1 à 200 | 430 | 54.2 | 0 à 200 | 85 | 61 | 224 467 | 5 | 42 | 630 | 1 | ||
201 à 370 | 84 | 10.6 | 201 à 370 | 261 | 43 | 20.2% | 10 | 24 | 640 | 3 | ||
371 à 600 | 52 | 6.6 | 371 à 600 | 481 | 63 | 15 | 24 | 650 | 2 | |||
601 à max | 120 | 15.1 | 601 à 3216 | 1173 | 515 | 20 | 16 | 660 | 3 | |||
total 793 | <201 | 67.7 | total 793 | 282 | 445 | -50 à 3216 | 25 | 12 | 670 | 0 | ||
adresse | intercalx | intercal | fréquence1 | intercal | fréquence6 | cumul,% | intercal | fréquence-1 | 30 | 6 | 680 | 7 |
665700 | 3216 | -1 | 102 | -70 | 0 | 0 | 5 | 35 | 7 | 690 | 0 | |
1032528 | 3065 | 0 | 5 | -60 | 0 | -1 | 10 | 40 | 8 | 700 | 1 | |
506416 | 2624 | 1 | 10 | -50 | 1 | -2 | 1 | 45 | 2 | 710 | 1 | |
64385 | 2360 | 2 | 7 | -40 | 1 | -3 | 0 | 50 | 8 | 720 | 2 | |
801292 | 2313 | 3 | 8 | -30 | 5 | min à -1 | -4 | 33 | 55 | 5 | 730 | 2 |
272796 | 2262 | 4 | 13 | -20 | 12 | 102 | -5 | 0 | 60 | 8 | 740 | 0 |
131965 | 2171 | 5 | 4 | -10 | 21 | 12.9% | -6 | 0 | 65 | 10 | 750 | 1 |
763244 | 2078 | 6 | 5 | 0 | 67 | -7 | 2 | 70 | 12 | 760 | 1 | |
101695 | 2071 | 7 | 3 | 10 | 66 | -8 | 16 | 75 | 9 | 770 | 2 | |
446016 | 1893 | 8 | 7 | 20 | 40 | -9 | 0 | 80 | 12 | 780 | 2 | |
905133 | 1870 | 9 | 7 | 30 | 18 | -10 | 1 | 85 | 9 | 790 | 0 | |
141270 | 1858 | 10 | 2 | 40 | 15 | 1 à 100 | -11 | 2 | 90 | 4 | 800 | 1 |
570117 | 1846 | 11 | 6 | 50 | 10 | 243 | -12 | 0 | 95 | 10 | 810 | 3 |
129767 | 1794 | 12 | 5 | 60 | 13 | 30.6% | -13 | 3 | 100 | 15 | 820 | 0 |
378376 | 1765 | 13 | 3 | 70 | 22 | -14 | 7 | 105 | 11 | 830 | 4 | |
232652 | 1743 | 14 | 5 | 80 | 21 | -15 | 0 | 110 | 12 | 840 | 0 | |
871293 | 1715 | 15 | 5 | 90 | 13 | -16 | 1 | 115 | 10 | 850 | 1 | |
998041 | 1656 | 16 | 6 | 100 | 25 | -17 | 7 | 120 | 10 | 860 | 1 | |
359936 | 1637 | 17 | 1 | 110 | 23 | -18 | 0 | 125 | 13 | 870 | 0 | |
1014216 | 1621 | 18 | 3 | 120 | 20 | -19 | 0 | 130 | 8 | 880 | 1 | |
847537 | 1581 | 19 | 3 | 130 | 21 | -20 | 2 | 135 | 16 | 890 | 1 | |
338816 | 1539 | 20 | 3 | 140 | 26 | -21 | 0 | 140 | 10 | 900 | 1 | |
808693 | 1532 | 21 | 2 | 150 | 17 | -22 | 1 | 145 | 10 | 910 | 2 | |
950532 | 1524 | 22 | 2 | 160 | 17 | 1 à 200 | -23 | 3 | 150 | 7 | 920 | 1 |
969491 | 1524 | 23 | 1 | 170 | 21 | 430 | -24 | 0 | 155 | 8 | 930 | 1 |
706435 | 1485 | 24 | 4 | 180 | 16 | 54% | -25 | 1 | 160 | 9 | 940 | 1 |
536071 | 1468 | 25 | 3 | 190 | 15 | -26 | 5 | 165 | 12 | 950 | 3 | |
638208 | 1464 | 26 | 2 | 200 | 11 | -27 | 0 | 170 | 9 | 960 | 0 | |
597131 | 1463 | 27 | 0 | 210 | 7 | 100 | 175 | 9 | 970 | 0 | ||
544938 | 1446 | 28 | 2 | 220 | 7 | reste | 7 | 180 | 7 | 980 | 1 | |
235220 | 1444 | 29 | 2 | 230 | 11 | total | 107 | 185 | 8 | 990 | 0 | |
90984 | 1401 | 30 | 0 | 240 | 8 | 190 | 7 | 1000 | 1 | |||
693395 | 1374 | 31 | 0 | 250 | 9 | intercal | fréquencef | 195 | 6 | 1010 | 1 | |
422301 | 1373 | 32 | 3 | 260 | 9 | 0 à 200 | 600 | 673 | 200 | 5 | 1020 | 1 |
678698 | 1370 | 33 | 3 | 270 | 6 | 435 | 650 | 9 | 205 | 3 | 1030 | 1 |
476675 | 1354 | 34 | 0 | 280 | 3 | 700 | 11 | 210 | 4 | 1040 | 1 | |
1079428 | 1335 | 35 | 1 | 290 | 6 | 750 | 6 | 215 | 3 | 1050 | 2 | |
270767 | 1318 | 36 | 1 | 300 | 1 | 800 | 6 | 220 | 4 | 1060 | 2 | |
687447 | 1302 | 37 | 2 | 310 | 3 | 850 | 8 | 225 | 5 | 1070 | 1 | |
49408 | 1282 | 38 | 0 | 320 | 3 | 900 | 4 | 230 | 6 | 1080 | 1 | |
247450 | 1266 | 39 | 2 | 330 | 2 | 950 | 8 | 235 | 5 | 1090 | 0 | |
398128 | 1260 | 40 | 3 | 340 | 2 | 1000 | 2 | 240 | 3 | 1100 | 0 | |
577310 | 1255 | reste | 547 | 350 | 3 | 1050 | 6 | 245 | 6 | 1110 | 2 | |
676898 | 1227 | total | 793 | 360 | 2 | 201 à 370 | 1100 | 4 | 250 | 3 | 1120 | 2 |
425653 | 1184 | 370 | 2 | 84 | 1150 | 7 | 255 | 5 | 1130 | 1 | ||
915284 | 1182 | 380 | 0 | 10.6% | 1200 | 5 | 260 | 4 | 1140 | 0 | ||
390 | 1 | 1250 | 1 | 265 | 4 | 1150 | 2 | |||||
400 | 5 | 1300 | 4 | 270 | 2 | 1160 | 0 | |||||
410 | 4 | 1350 | 3 | 275 | 1 | 1170 | 2 | |||||
420 | 3 | 1400 | 4 | 280 | 2 | 1180 | 1 | |||||
adresse | intercaln | décalage | long | 430 | 2 | 1450 | 3 | 285 | 3 | 1190 | 2 | |
384083 | -50 | comp | 440 | 2 | 1500 | 4 | 290 | 3 | 1200 | 0 | ||
523034 | -41 | shift2 | 646 | 450 | 3 | 1550 | 4 | 295 | 1 | reste | 44 | |
362986 | -38 | shift2 | 850 | 460 | 2 | 1600 | 1 | 300 | 0 | total | 793 | |
864784 | -38 | shift2 | 2407 | 470 | 1 | 1650 | 2 | 305 | 3 | |||
628502 | -35 | shift2 | 571 | 480 | 2 | 1700 | 1 | 310 | 0 | |||
1068153 | -35 | comp | 490 | 3 | 1750 | 2 | 315 | 1 | ||||
1110540 | -32 | shift2 | 997 | 500 | 3 | 1800 | 2 | 320 | 2 | |||
511489 | -26 | shift2 | 510 | 4 | 371 à 600 | 1850 | 1 | 325 | 2 | |||
661241 | -26 | shift2 | 520 | 3 | 52 | 1900 | 3 | 330 | 0 | |||
710083 | -26 | shift2 | 530 | 3 | 6.6% | 1950 | 0 | 335 | 1 | |||
899806 | -26 | shift2 | 540 | 0 | 2000 | 0 | 340 | 1 | ||||
1089393 | -26 | shift2 | 550 | 0 | 2050 | 0 | 345 | 2 | ||||
417665 | -25 | shift2 | 560 | 3 | 2100 | 2 | 350 | 1 | ||||
276966 | -23 | shift2 | 570 | 3 | 2150 | 0 | 355 | 1 | ||||
480829 | -23 | shift2 | 580 | 1 | 601 à max | 2200 | 1 | 360 | 1 | |||
981350 | -23 | shift2 | 590 | 1 | 120 | 114 | 365 | 1 | ||||
110015 | -22 | shift2 | 600 | 3 | 15.1% | 370 | 1 | |||||
415433 | -20 | shift2 | reste | 120 | reste | 6 | reste | 172 | ||||
748256 | -20 | shift2 | total | 793 | total | 793 | total | 793 |
rtb intercalaires positifs S+[modifier | modifier le wikicode]
- Lien tableur: rtb intercalaires positifs S+
- Diagrammes 400: rtb cvi, diagramme 1-40: c+ rtb c+ cvi x+ cvi total, texte: cvi.
- Légende: voir la légende de cvi.
rtb | Sx+ | Sc+ | ||||||||||||
Poly3 | -7 | -5 | -3 | 1 | R2 | flex x+ | comment. | -7 | -5 | -3 | 1 | R2 | flex c+ | comment. |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
1 à 400 | 45 | -332 | 590 | 12 | 496 | 246 | max80 | -36 | 279 | -782 | 91 | 569 | 258 | min50 |
31 à 400 | 70 | -478 | 827 | -4.5 | 788 | 228 | 2 parties | |||||||
droite | -a | cste | - | R2 | note | R2’ | -a | cste | - | R2 | note | R2’ | ||
1 à 400 | 91 | 44 | - | 304 | poly | 191 | tF | 174 | 61 | - | 487 | poly | 82 | Sm |
31 à 400 | -36 | 44 | - | 598 | poly | 190 | tF |
- Légende du tableau corrélations et fréquences faibles
effectifs diagramme | corrélation x+ c+, 41-n | corrélation x+ c+, 1-n | |||||||||
gen | minima | x+ | c+ | total | 400 | 200 | 250 | diff | 200 | 250 | 400 |
---|---|---|---|---|---|---|---|---|---|---|---|
bsu | min10 | 1028 | 2444 | 3472 | 659 | 8 | 282 | 274 | 152 | 257 | 470 |
rtb | min30 | 118 | 402 | 520 | 536 | -105 | 148 | 253 | -277 | -165 | 202 |
afn | min10 | 328 | 1323 | 1651 | 603 | -26 | 101 | 127 | -468 | -407 | -9 |
1-30 ‰ | effectifs | 0 ‰ | <0 ‰ | effectifs 1-40 | corel | ||||||
1-30 x+ | 1-30 c+ | x+/c+ | x | c | x | c | x- | c- | x+ | c+ | x+/c+ |
140 | 333 | 0.42 | 1125 | 3091 | 2 | 8 | 31 | 186 | 302 | 936 | -432 |
51 | 294 | 0.17 | 189 | 604 | 5 | 7 | 21 | 162 | 8 | 131 | -81 |
46 | 402 | 0.11 | 350 | 1689 | 6 | 5 | 11 | 179 | 36 | 580 | -369 |
- Diagrammes 400: rtb cvi, diagramme 1-40: c+ rtb c+ cvi x+ cvi total, texte: cvi.
- Résumé: J’ai classé les 21 génomes suivant la forme des diagrammes x+ 1-400. J’ai obtenu 3 groupes,
- Les tildes au nombre de 5. Ils sont réguliers et forts, tF, avec un R2’ supérieur à 138 pour 4 d’entre eux et scc avec 71. Ce sont, cbei mba pmq et blo scc.
- Les formes S au nombre de 6. Leurs forces (R2’) sont variables, ade rru Sf 20-39, ant mja Sm 70-78, pmg pub SF 179-249.
- Les diagrammes à pyramide, c’est à dire présentant une bosse avec 4 ou 5 points contigus. Ils sont au nombre de 10 dont 9 sont des tildes et bsu est un Sf très faible (R2’18). abra rtb spl afn sont des tF avec plus de 96, ase cbn cvi sont des tf avec moins de 30, eco myr sont des tm 43 68.
- - rtb ressemble à cvi par la pyramide de x+ 1-400 avec un maximum à 80 pour rtb et 70 pour cvi et la forme de toutes les courbes ne diffèrent que par leur force. La différence entre les 2 génomes est due à la grande différence des effectifs, 520 pour rtb contre 3328 pour cvi, et des corrélations sur 41-250, de 148 pour rtb contre 891 pour cvi.
- - Les diagrammes 400
- x+ 1-400:
- + Les 2 génomes ont une pyramide à 3 fréquences avec un maximum à 80 pour rtb et 70 pour cvi. Quand j’enlève les fréquences faibles pour ne laisser que la pyramide (6 pour rtb et 5 pour cvi), la courbe rtb devient une S faible, Sf, R2’ à 36 (662 625) et la courbe cvi devient une S moyenne, Sm, R2’ à 68 (794 726). Je n’ai pas représenté les courbes x+ 31-400 à cause des taux peu élevés des fréquences faibles 1-30, 51 pour rtb et 112 pour cvi.
- + Les fréquences faibles 1-30 sont en opposition avec celles des rtb c+1-400 et en parallèle avec cvi. Cette différence va impacter différemment les corrélations 1-n qu’on verra plus loin.
- + Les points d’inflexion sont normaux, 246 pour rtb contre 200 pour cvi.
- c+ 1-400: Ce sont 2 courbes semblables de forme S, moyenne pour rtb avec un R2’ de 82 et forte pour cvi avec un R2’ de 203. Les 2 points d’inflexion normaux, 258 pour rtb et 282 pour cvi. Les fréquences faibles sont positionnées aux fréquences 10 et 20 pour les 2 génomes et les minima locaux sont identiques à la fréquence 50. La différence des effectifs, 402 pour rtb et 2320 pour cvi explique la différence de forme avec des R2 très différents, 569 pour rtb et 852 pour cvi
- x+ 31-400: Je n’ai pas représenté les courbes x+ 31-400 à cause des taux peu élevés des fréquences faibles 1-30. Il faudrait les remplacer par les courbes avec pyramide seule sans les fréquences faibles 1-30, voir le paragraphe x+ 1-400 ci-dessus.
- c+ 31-400: Les 2 formes sont 2 tildes très différents , tF pour rtb, avec un R2’ de 190 (788 598) et très faible pour cvi, tf, R2’ de 30 (525 808) plus proche d’une droite. La forme de rtb est bien différente de celle de cvi car les R2, polynome et droite, sont inversés dans le mauvais sens par rapport aux effectifs, 284 pour rtb et 1621 pour cvi. De même les points d’inflexion sont différents, il est normal pour rtb à la fréquence 228 et négatif pour cvi à -138.
- x+ 1-400:
- - Les corrélations:
- Sur les plages 41-n: Les 2 corrélations sur 41-250 sont très dfiiérentes, 148 pour rtb contre 891 pour cvi.. Par contre rtb chute fortement sur 41-200, avec une différence de 253, alors que cvi se maintient avec une différence de 33.
- Sur les plages 1-n: les 2 génomes chutent fortement, -165 pour rtb et 549 pour cvi, malgré le comportement des fréquences faibles que j’ai signalé au paragraphe x+ 1 -400, en opposition pour rtb et en parallèle avec cvi.
- - Les faibles fréquences: Les faibles fréquences 1-30 ne sont intéressantes à comparer que pour les génomes à courbes 1-400 semblables où le taux de ces fréquences sont élevés et évoluent en parallèle comme entre pmg et pub où le rapport x+/c+ passe de 0.78 à 0.51. rtb fait 0.17 et cvi 0.37 Les zéros sont à 7‰ pour cvi et 12‰ pour rtb et les négatifs sont 50% plus élevés chez cvi que chez rtb, 280 ‰ contre 183 ‰ pour rtb.
- - Les courbes 1-40:
- c+ 1-40: La courbe cvi est semblale et très proche de celle du total des c+ 1-40; celle de rtb le devient aussi en omettant les fréquences 6 et 10.
- x+ 1-40: Avec un effectif de 8 pour rtb la courbe ne peut être significative. Cvi avec 130 est différente du modèle c+ 1-40 avec un effectif aussi grand à la fréquence 6 et 9, un creux profond à la fréquence 11 et aussi à cause de la faible corrélation x+/c+ de 582.
rtb intercalaires négatifs S-[modifier | modifier le wikicode]
- Lien tableur: rtb intercalaires négatifs S-
- Légende:
- Les intercalaires négatifs: j'ai dénombré ces intercaalires avec les brins complement/direct. Ensuite j'ai cumulé les intercalaires négatifs entre 2 brins différents à part, un continu ou complement suivi du brin inverse (comp'), et entre 2 brins continus d'autre part, 2 direct ou 2 complement. Je ne fournis ici que le résultat pour le tableur.
rtb autres intercalaires[modifier | modifier le wikicode]
- Lien tableur: rtb autres intercalaires
- Légende:
- - comp, le gène est sur le brin complement
- - deb, fin sont respectivement dans le sens des adresses croissantes, le cds avant le 1er tRNA et le cds après le dernier tRNA du bloc.
- Totaux: 3 ncRNA 1 tmRNA
tRNA-cds tRNA-tRNA autres-cds total c+ x+ x- c+ x+ c- c+ x+ c- 45 17 3 2 6 2 75
|
|
|
rtb intercalaires tRNA[modifier | modifier le wikicode]
- Lien tableur: rtb intercalaires tRNA
- Légende:
- - comp', l'intercalaire est entre un gène comp (sur le complément) et un gène sur le brin direct. Continu les 2 gènes sont sur le même brin.
- - deb, fin sont les intercalaires des cds du tableau précédent, autres intercalaires: respectivement dans le sens des adresses croissantes, le cds avant le 1er tRNA et le cds après le dernier tRNA du bloc.
- Cumuls comp'+continu du tableau
deb fin total <201 9 14 23 total 28 28 56 taux 32% 50% 41%
|
|
rtb intercalaires rRNA[modifier | modifier le wikicode]
- Voir la présentation des blocs à rRNA dans le chapitre rtb blocs de l'étude préliminaire. A comparer avec le tableau rtb autres intercalaires.
- Remarque: Quand le 16s n'est pas précédé de tRNAs l'intercalaire cds-16s est élevé, pour le 2ème bloc il est pour cvi de 447 pbs. L'intercalaire cds-bloc de l'autre côté du bloc est beaucoup plus faible, cvi 280 pbs. Cette orientation est quasiment générale chez tous les génomes que j'ai étudié ici. Je l'ai notée dans les chapitres génome-bloc de chaque génome. Pour rtb il y a un seul bloc 16s23s5s mais cassé, le 23s5s est très loin du 16s.
- Note: J'ai supposé souvent que les blocs à tRNA sans rRNA sont aussi orientés de l'intercalaire le plus grand au plus petit. Dans pub cumuls et de même pour les autres génomes, j'ai noté cette orientation dans la colonne cdsd, pour cds dirigé. Je n'ai conservé pour les calculs que le plus petit intercalaire des 2 cds bordant le bloc. L'idée était que cette orientation provoquait la création du cds en fin de bloc. Ces cds sont souvent de petites protéines et souvent hypothétiques. Aussi je présente ci-dessous la transformation deb-fin, du chapitre précédent, qui est imposée par l'adressage en intercalaire plus grand et plus petit.
deb fin tri grand petit* tri grand* petit 381 368 4 139 17 13 62 26 108 1394 13 62 26 4 139 17 278 110 9 496 31 27 145 40 17 139 18 1164 32 5 167 143 143 167 7 1364 35 22 183 82 411 142 27 145 40 19 246 181 35 1364 12 1278 58 14 248 176 402 633 21 349 68 3 278 110 496 31 22 183 82 21 349 68 218 1922 26 2191 98 1 381 368 1530 218 2 1394 108 24 401 145 1278 58 3 278 110 6 411 142 26 62 28 475 130 28 475 130 176 248 6 411 142 9 496 31 499 222 5 167 143 15 499 222 452 1274 24 401 145 8 633 402 1535 1028 14 248 176 18 1164 32 1164 32 19 246 181 20 1199 1090 181 246 10 1922 218 16 1274 452 1199 1090 11 1530 218 12 1278 58 349 68 15 499 222 7 1364 35 82 183 1 381 368 2 1394 108 382 2009 23 2009 382 11 1530 218 401 145 8 633 402 17 1535 1028 951 1945 16 1274 452 10 1922 218 2191 98 25 1945 951 25 1945 951 40 145 17 1535 1028 23 2009 382 475 130 20 1199 1090 26 2191 98
- Comparaison cds-cds tRNA-cds: deb fin, c'est l'ordre des adresses et grand petit l'ordre après réorientation. Leur pourcentage est calculé par rapport à la colonne, c'est à dire la moitié du total des tRNA-cds. Voir le tableau des cds-cds de la bactérie rtb, et les doublets tRNA-cds ci-dessus.
alpha cds total total <0 0-200 201-370 371-600 >600 deb fin grand petit rtb cds-cds 828 793 102 435 84 52 120 rtb cds ‰ 129 548 106 66 151 rtb tRNA ‰ 411 143 161 286 321 500 179 643 rtb tRNA 56 23 8 9 16 9 14 5 18
- Calculs: voir les détails
alpha cds total total <0 0-200 reste cds≥0 bornes p q tRNAs rtb cds-cds 828 793 102 435 256 691 petit 0,630 0,370 28 rtb cds % 129 630 370 20,515 p2 2pq 1-q2 q2 rtb tRNA 56 23 33 27,799 0,396 0,466 0,863 0,137 calculs proba effect attendu plage 2σ grand varq varp attendus petit 0,630 18 24,2 21 – 28 3,6 5,920 nq2(1-q2) np2(1-p2) petit grand grand 0,370 5 11,1 6 – 16 5,2 16,273 3,316 6,699 24,157 11,096
Rickettsia prowazekii str. Breinl[modifier | modifier le wikicode]
rpl opérons[modifier | modifier le wikicode]
- Lien tableur: rpl opérons
- Liens: gtRNAdb [5], NCBI [6], génome [7]
- Phylogénie: Bacteria; Proteobacteria; Alphaproteobacteria; Rickettsiales; Rickettsiaceae; Rickettsieae; Rickettsia; typhus group.
- Légende: cdsa: cds aas, cdsd: cds dirigé
29%GC | 30.12.19 Paris | 33 | doubles | intercal | cds | aa | avec aa | cdsa | cdsd | protéines |
---|---|---|---|---|---|---|---|---|---|---|
comp | 31462..31892 | cds | 263 | 263 | 144 | p-preprotein translocase subunit YajC | ||||
comp | 32156..32181 | rpr | 870 | 870 | 26 | tandem | ||||
comp | 33052..33126 | ggc | 1253 | 1253 | ||||||
comp | 34380..35750 | cds | 256 | 256 | magnesium transporter | |||||
comp | 36007..36093 | ctc | 190 | 190 | ||||||
comp | 36284..37144 | cds | 287 | TIGR01459 family HAD-type hydrolase | ||||||
46825..47040 | cds | 31 | 31 | 72 | hp | |||||
47072..47146 | gca | 1964 | 1964 | |||||||
49111..49650 | cds | 180 | copper chaperone Pcu(A)C | |||||||
comp | 71150..76816 | cds | 933 | 933 | 1889 | alpha-2-macroglobulin family protein | ||||
comp | 77750..77826 | cgt | 1179 | 1179 | ||||||
79006..80241 | cds | 412 | tyrosine--tRNA ligase | |||||||
121704..121946 | cds | 984 | 984 | 81 | HU family DNA-binding protein | |||||
comp | 122931..123007 | gtc | 446 | 446 | ||||||
123454..124113 | cds | 220 | (d)CMP kinase | |||||||
126222..126827 | cds | 236 | 236 | 202 | ATP-dependent Clp endopeptidase proteolytic subunit ClpP | |||||
127064..127139 | gcc | @1 | 830 | 830 | ||||||
comp | 127970..128046 | gac | 365 | 365 | ||||||
128412..128843 | cds | 144 | ribosome-associated translation inhibitor RaiA | |||||||
171237..173012 | cds | 50 | 50 | 592 | aminopeptidase P family protein | |||||
173063..173137 | caa | 49 | 49 | |||||||
comp | 173187..173263 | cgg | 18 | 18 | ||||||
comp | 173282..174265 | cds | 328 | polyprenyl synthetase family protein | ||||||
186344..187336 | cds | 58 | 58 | 331 | tryptophan--tRNA ligase | |||||
187395..187484 | tca | 354 | 354 | |||||||
comp | 187839..188738 | cds | 300 | hydroxymethylbilane synthase | ||||||
203097..203846 | cds | 219 | 219 | 250 | bifunctional N-acetylglucosamine-1-phosphate uridyltransferase/glucosamine-1-phosphate acetyltransferase | |||||
204066..204153 | tcc | 1457 | 1457 | |||||||
205611..206639 | cds | 343 | type 2 isopentenyl-diphosphate Delta-isomerase | |||||||
comp | 299321..300853 | cds | 419 | 419 | 511 | hp | ||||
comp | 301273..301349 | atc | 15 | 15 | ||||||
comp | 301365..301440 | aaa | 219 | 219 | ||||||
301660..302400 | cds | 247 | 3-deoxy-manno-octulosonate cytidylyltransferase | |||||||
comp | 328700..329635 | cds | 22 | 22 | 312 | site-specific tyrosine recombinase XerD | ||||
comp | 329658..329732 | tgc | 499 | 499 | ||||||
330232..330699 | cds | 156 | DUF2155 domain-containing protein | |||||||
429121..429807 | cds | 723 | 723 | 229 | hp | |||||
comp | 430531..430605 | aac | 359 | 359 | ||||||
comp | 430965..432767 | cds | 601 | elongation factor 4 | ||||||
473867..474352 | cds | 928 | 928 | 162 | RNA pyrophosphohydrolase | |||||
comp | 475281..475357 | atgj | 40 | 40 | ||||||
comp | 475398..475883 | cds | 162 | 30S ribosomal protein S9 | ||||||
506934..508007 | cds | 183 | 183 | 358 | cell division protein ZapE | |||||
comp | 508191..508305 | 5s | 240 | 115 | ||||||
comp | 508546..511330 | 23s | 716 | 716 | 2785 | |||||
comp | 512047..512958 | cds | 304 | methionyl-tRNA formyltransferase | ||||||
577419..579725 | cds | 138 | 138 | 769 | outer membrane protein assembly factor BamA | |||||
579864..579939 | acg | 1026 | 1179 | |||||||
comp | 580966..581169 | cds | 68 | DUF2674 domain-containing protein | ||||||
comp | 612439..612639 | cds | 143 | 143 | 67 | preprotein translocase subunit SecE | ||||
comp | 612783..612858 | tgg | 143 | 143 | ||||||
comp | 613002..615101 | cds | 700 | elongation factor G | ||||||
comp | 656226..656870 | cds | 296 | 296 | 215 | YihA family ribosome biogenesis GTP-binding protein | ||||
comp | 657167..657243 | atgf | 119 | 119 | ||||||
comp | 657363..657599 | cds | 79 | 50S ribosomal protein L31 | ||||||
comp | 678911..679213 | cds | 19 | 19 | 101 | preprotein translocase subunit SecG | ||||
comp | 679233..679307 | acc | 159 | 159 | ||||||
comp | 679467..680723 | cds | 419 | MFS transporter | ||||||
comp | 746326..746529 | cds | 1664 | 1664 | 68 | hp | ||||
comp | 748194..748268 | gaa | 109 | 109 | ||||||
comp | 748378..749421 | cds | 348 | autotransporter outer membrane beta-barrel domain-containing protein | ||||||
comp | 756703..757686 | cds | 363 | 363 | 328 | tRNA dihydrouridine synthase DusB | ||||
758050..758125 | ttc | 564 | 564 | |||||||
758690..759730 | cds | 347 | UDP-3-O-(3-hydroxymyristoyl)glucosamine N-acyltransferase | |||||||
776202..776537 | cds | 154 | 154 | 112 | 30S ribosomal protein S16 | |||||
776692..776766 | aca | 467 | 467 | |||||||
777234..777863 | cds | 210 | lipoyl(octanoyl) transferase LipB | |||||||
779197..780348 | cds | 140 | 140 | 384 | succinyl-diaminopimelate desuccinylase | |||||
780489..780573 | cta | 37 | 37 | |||||||
780611..781075 | cds | 155 | DNA polymerase III subunit chi | |||||||
comp | 823242..823559 | cds | 98 | 98 | 106 | DUF167 domain-containing protein | ||||
823658..823734 | aga | 1364 | 1364 | |||||||
comp | 825099..825230 | cds | 44 | hp | ||||||
comp | 854241..854456 | cds | 17 | 17 | 72 | translation initiation factor IF-1 | ||||
comp | 854474..854550 | cca | 1573 | 1573 | ||||||
comp | 856124..856357 | cds | 78 | BolA family transcriptional regulator | ||||||
915034..915501 | cds | 391 | 391 | 156 | peptidoglycan-associated lipoprotein Pal | |||||
915893..915969 | atgi | 41 | 41 | |||||||
916011..917099 | cds | 363 | YjgP/YjgQ family permease | |||||||
953564..954742 | cds | 696 | 696 | 393 | acetyl-CoA C-acetyltransferase | |||||
comp | 955439..955530 | agc | 898 | 898 | ||||||
comp | 956429..957373 | cds | 315 | ACP S-malonyltransferase | ||||||
comp | 1009435..1011165 | cds | 142 | 142 | 577 | ATP-binding cassette domain-containing protein | ||||
comp | 1011308..1011384 | cac | 346 | 346 | ||||||
1011731..1012414 | cds | 228 | 7-cyano-7-deazaguanine synthase QueC | |||||||
comp | 1045414..1045656 | cds | 2381 | 2381 | 81 | hp | ||||
comp | 1048038..1048123 | tta | 135 | 135 | ||||||
comp | 1048259..1048387 | cds | 43 | hp | ||||||
comp | 1056245..1056973 | cds | 188 | 188 | 243 | 23s rRNA (guanosine(2251)-2'-O)-methyltransferase RlmB | ||||
1057162..1057247 | tac | 105 | 105 | |||||||
1057353..1057426 | gga | 82 | 82 | |||||||
1057509..1058693 | cds | 395 | elongation factor Tu | |||||||
1072391..1072663 | cds | 62 | 62 | 91 | 30S ribosomal protein S20 | |||||
1072726..1072801 | gta | 1181 | 1181 | |||||||
comp | 1073983..1074648 | cds | 222 | hp | ||||||
1102136..1103935 | cds | 1458 | 1462 | 600 | PAS domain-containing sensor histidine kinase | |||||
1105394..1106893 | 16s | 1462 | 1462 | 1500 | ||||||
1108356..1109301,1..184 | cds | 377 | P-hp |
rpl cumuls[modifier | modifier le wikicode]
- Lien tableur: rpl cumuls
- Légende
- Notes: moyenne et variance des intercalaires élevés des 21 cds : 1204 et 453
opérons | Fréquences intercalaires tRNAs | Fréquences intercalaires cds | Fréquences aas cds chromosome | ||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
effectif | gammes | sans rRNAs | avec rRNAs | gammes | cds | gammes | cdsd | gammes | cdsa | gammes | cdsa 300 | ||
avec rRNA | opérons | 2 | 1 | - | 1 | 0 | 1 | 100 | 12 | 30 | 0 | ||
23s5s | 1 | 20 | 1 | 50 | 9 | 40 | 200 | 11 | 60 | 2 | |||
16s | 1 | 40 | 100 | 4 | 80 | 300 | 12 | 90 | 9 | ||||
16s23s | 0 | 60 | 1 | 150 | 8 | 120 | 400 | 15 | 120 | 4 | |||
max a | 0 | 80 | 200 | 5 | 160 | 500 | 2 | 150 | 2 | ||||
a doubles | 0 | 100 | 250 | 3 | 200 | 600 | 4 | 180 | 6 | ||||
spéciaux | 0 | 120 | 1 | 300 | 3 | 240 | 700 | 2 | 210 | 2 | |||
total aas | 0 | 140 | 350 | 1 | 280 | 800 | 1 | 240 | 5 | ||||
sans | opérons | 29 | 160 | 400 | 5 | 320 | 900 | 0 | 270 | 3 | |||
1 aa | 25 | 180 | 450 | 2 | 360 | 1000 | 0 | 300 | 2 | ||||
max a | 2 | 200 | 500 | 2 | 400 | 1100 | 0 | 330 | 5 | ||||
a doubles | 0 | 1 | 21 | 1 | 20 | ||||||||
total aas | 33 | 4 | 0 | 63 | 0 | 60 | 60 | ||||||
total aas | 33 | ||||||||||||
remarques | 1 | ||||||||||||
avec jaune | moyenne | 528 | 293 | ||||||||||
variance | 558 | 271 | |||||||||||
sans jaune | moyenne | 56 | 191 | 243 | 172 | ||||||||
variance | 45 | 140 | 145 | 89 |
rpl tRNA-cds[modifier | modifier le wikicode]
- Note: intercalaires prélevés de la colonne cds de rpl opérons dans un bloc de tRNAs uniquement. Le début du bloc est dans l'ordre des adresses, deb intercalaire entre le cds et le 1er tRNA dd bloc, fin entre le dernier tRNA et le cds terminal. J'ai procédé, dans les colonnes petit et grand, à la réorientation des blocs d'après la constatation que les blocs à rRNA ont leurs cds de début et de fin sont orientés du cds-16s au 5s-tRNAs-cds, l'intercalaire cds-16s étant plus grands que l'intercalaire avec le cds terminal. En tête de colonne est le % du nombre des intercalaires inférieurs à 201 pbs.
rpl 50 36 18 68 deb fin deb fin grand petit grand petit 17 1573 50 18 50 18 1573 17 19 159 140 37 140 37 50 18 22 499 928 40 143 143 159 19 31 1964 391 41 159 19 499 22 50 18 188 82 188 82 1964 31 58 354 1664 109 296 119 140 37 62 1181 296 119 346 142 928 40 98 1364 2381 135 354 58 391 41 138 1026 143 143 365 236 354 58 140 37 19 159 391 41 1181 62 142 346 419 219 419 219 188 82 143 143 142 346 467 154 1364 98 154 467 58 354 499 22 1664 109 188 82 723 359 564 363 296 119 219 1457 236 365 723 359 2381 135 236 365 984 446 898 696 1026 138 296 119 154 467 928 40 346 142 363 564 22 499 984 446 143 143 391 41 363 564 1026 138 467 154 419 219 696 898 1179 933 419 219 696 898 138 1026 1181 62 1457 219 723 359 933 1179 1253 870 365 236 870 1253 62 1181 1364 98 723 359 928 40 870 1253 1457 219 564 363 933 1179 98 1364 1573 17 984 446 984 446 219 1457 1664 109 898 696 1664 109 17 1573 1964 31 1253 870 2381 135 31 1964 2381 135 1179 933
- Comparaison cds-cds tRNA-cds: deb fin, c'est l'ordre des adresses et grand petit l'ordre après réorientation. Leur pourcentage est calculé par rapport à la colonne, c'est à dire la moitié du total des tRNA-cds.
alpha cds total total <0 0-200 201-370 371-600 >600 deb fin grand petit rpl 850 56 24 9 6 17 14 10 5 19 ‰ 429 161 107 304 500 357 179 679
rpl blocs[modifier | modifier le wikicode]
- Lien tableur: rpl blocs
cds | 183 | 358 | cell division protein ZapE |
5s | 240 | 115 | |
23s | 716 | 2785 | |
cds | 304 | methionyl-tRNA formyltransferase | |
cds | 1458 | 600 | PAS domain-containing sensor histidine kinase |
16s | 1462 | 1500 | |
cds | 377 | P-hp |
rpl remarques[modifier | modifier le wikicode]
- Remarques: Les rickettsia, rtb et rpl, présentent de nombreux intercalaires très élevés. D’où cet intercalaire entre 2 aas de 830 pbs. La phylogénie très forte entre ces 2 génomes donne des blocs analogues mais avec des intercalaires différents. Ici les intercalaires élevés sont atténués. Je détaille ici les intercalaires du tableau des cumuls.
- - Les intercalaires entre aas: Il y a quatre intercalaires de ce type, 830 105 49 15. A part le 1er les 3 autres sont courants dans cette étude et seulement le dernier est le représentant de la moyenne dans cette étude.
- - Les intercalaires avec un cds. Les 31 blocs de ce génomes se répartissent en 3 groupes
- Les RNAs complètement isolés, les 2 intercalaires du bloc sont supérieurs à 400 pbs. Il y a 7 aas dont celui avec 830, et le 16s. Ici aac, gac et ttc ont l’intercalaire mineur à peine inférieur à 400. Sur ces 16 intercalaires 9 sont supérieurs à 800 et 7 entre 360 et 700 pbs.
- Les tRNAs proches de leurs 2 cds. Il y a 6 aas dont les 2 intercalaires sont inférieurs à 300 pbs et 3 aas dont au moins un des 2 intercalaires est entre 300 et 400 pbs.
- Il reste 14 blocs dont le 23s5s, auxquels il faut ajouter l’aa gcc voisin du gac isolé par 830. Ces blocs sont très polarisés, leurs 2 intercalaires sont très dissymétriques.
- 10 aas ont leur intercalaire majeur supérieur à 800 et va jusqu’à 2381 pbs. Le 23s5s a un intercalaire majeur modéré, 723, assez courant pour les blocs à rRNAs.
- 3 aas ont leur intercalaire majeur de 450 pbs environ.
- Les blocs isolés et les blocs entourés par 2 cds
Blocs à RNAs isolés par 2 intercalaires de plus de 400 pbs. bloc adresse intercalaire Blocs entourés par 2 intercalaires de 300 à 400 pbs aac 430531 723-359 cac 1011308 gac 127064 830-365 atgi 915893 gtc 122931 tca 187395 cgt 77750 ggc 33052 Blocs entourés par 2 intercalaires inférieurs à 300 pbs 16s 1105394 atgf 657167 agc 955439 acc 679233 ttc 758050 564-363 tgg 612783 : : cgg-caa 173063 : : gga-tac 1057162 : : cta 780489
- Les séquences des doubles: Il n'y a aucun double dans ce génome
rpl distribution[modifier | modifier le wikicode]
- Lien tableur: rpl distribution
g1 | t1 | ||||||
---|---|---|---|---|---|---|---|
atgi | 1 | tct | tat | atgf | 1 | ||
att | act | aat | agt | ||||
ctt | cct | cat | cgc | ||||
gtt | gct | gat | ggt | ||||
ttc | 1 | tcc | 1 | tac | 1 | tgc | 1 |
atc | 1 | acc | 1 | aac | 1 | agc | 1 |
ctc | 1 | ccc | cac | 1 | cgt | 1 | |
gtc | 1 | gcc | 1 | gac | 1 | ggc | 1 |
tta | 1 | tca | 1 | taa | tga | ||
ata | aca | 1 | aaa | 1 | aga | 1 | |
cta | 1 | cca | 1 | caa | 1 | cga | |
gta | 1 | gca | 1 | gaa | 1 | gga | 1 |
ttg | tcg | tag | tgg | 1 | |||
atgj | 1 | acg | 1 | aag | agg | ||
ctg | ccg | cag | cgg | 1 | |||
gtg | gcg | gag | ggg | ||||
alpha | >1aa | =1aa | -5s | +5s | -16s | +16s | total |
rpl | 8 | 25 | 33 |
Rhodospirillum photometricum DSM 122[modifier | modifier le wikicode]
rpm opérons[modifier | modifier le wikicode]
- Lien tableur: rpm opérons
- Liens: gtRNAdb [8], NCBI [9], génome [10]
- Phylogénie: Bacteria; Proteobacteria; Alphaproteobacteria; Rhodospirillales; Rhodospirillaceae; Pararhodospirillum.
- Légende: cdsa: cds aas, cdsd: cds dirigé
64.7%GC | 26.12.19 Paris | 95 | doubles | intercal | cds | aa | avec aa | cdsa | cdsd | protéines |
---|---|---|---|---|---|---|---|---|---|---|
comp | 3322..4194 | cds | 30 | 30 | 291 | LysM peptidoglycan-binding domain-containing protein | ||||
comp | 4225..4821 | 23s° | @1 | 196 | 595 | |||||
comp | 5018..5093 | gca | 182 | |||||||
comp | 5276..5684 | 16s° | 38 | 38 | 407 | |||||
5723..6664 | cds | 314 | SEL1-like repeat protein | |||||||
comp < | 12458..13198 | cds | 242 | 242 | 247 | p-transposase | ||||
comp | 13441..13555 | 5s | @2 | 72 | 113 | |||||
comp | 13628..13880 | 23s° | -7 | -7 | 251 | |||||
comp | 13874..15127 | cds | 418 | hp | ||||||
21325..22362 | cds | 586 | 586 | 346 | hp | |||||
22949..23237 | 16s° | 85 | 85 | 287 | ||||||
comp | 23323..23490 | cds | 56 | hp | ||||||
comp | 24015..24287 | cds | 250 | 250 | 91 | TraYdomain-containingprotein | ||||
comp | 24538..24652 | 5s | 71 | 113 | ||||||
comp | 24724..27490 | 23s | 212 | 2765 | ||||||
comp | 27703..27779 | atc | 112 | |||||||
comp | 27892..28378 | 16s° | 18 | 18 | 485 | |||||
<> | 28397..29119 | cds | 241 | p-EscV/YscV/HrcVfamilytypeIIIsecretionsystemexportapparatusprotein | ||||||
comp | 32782..33759 | cds | 190 | 190 | 326 | glycosyltransferase | ||||
33950..34357 | 16s° | 112 | 406 | |||||||
34470..34546 | atc | 216 | ||||||||
34763..35591 | 23s° | 44 | 827 | |||||||
comp | 35636..35750 | 5s | 72 | 113 | ||||||
comp | 35823..38589 | 23s | 215 | 2765 | ||||||
comp | 38805..38881 | atc | 112 | |||||||
comp | 38994..40502 | 16s | 260 | 1507 | ||||||
comp | 40763..42629 | 23s° | -15 | 1865 | ||||||
42615..42903 | 16s° | 112 | 287 | |||||||
43016..43092 | atc | 213 | ||||||||
43306..44132 | 23s° | -1 | 825 | |||||||
comp | 44132..44835 | 23s° | -5 | -5 | 702 | |||||
44831..45121 | cds | 97 | hp | |||||||
< | 45496..45768 | cds | 553 | 553 | 91 | p-glycosyl transferase family 1 | ||||
46322..47040 | 16s° | 0 | 0 | 717 | ||||||
comp | 47041..47433 | cds | 131 | winged helix-turn-helix domain-containing protein | ||||||
comp | 49761..51017 | cds | 128 | 128 | 419 | glycosyltransferase | ||||
comp | 51146..51221 | 23s° | 214 | 74 | ||||||
comp | 51436..51512 | atc | 112 | |||||||
comp | 51625..52017 | 16s° | -7 | 391 | ||||||
52011..52881 | 23s° | 106 | 106 | 869 | ||||||
52988..53464 | cds | -37 | -37 | 159 | hp | |||||
> | 53428..53694 | cds | 86 | 86 | 89 | p-glycosyltransferase | ||||
comp | 53781..54709 | 23s° | 26 | 927 | ||||||
54736..54898 | 16s° | 112 | 161 | |||||||
55011..55087 | atc | 216 | ||||||||
55304..55741 | 23s° | 438 | 438 | 436 | ||||||
56180..56440 | cds | 87 | hp | |||||||
comp | 82891..83088 | cds | 116 | 116 | 66 | preprotein translocase subunit SecE | ||||
comp | 83205..83280 | tgg | 199 | 199 | ||||||
>comp | 83480..84178 | cds | 233 | p-elongation factor Tu | ||||||
417242..417412 | cds | 142 | 142 | 57 | tRNA (5-methylaminomethyl-2-thiouridylate)-methyltransferase | |||||
417555..417631 | atgj | + | 24 | 24 | ||||||
417656..417732 | atgj | 2 atgj | 38 | 38 | ||||||
comp | 417771..418796 | cds | 342 | tRNA epoxyqueuosine(34) reductase QueG | ||||||
434306..435142 | cds | 512 | 512 | 279 | CDP-diacylglycerol--serine O-phosphatidyltransferase | |||||
435655..435842 | 16s° | -6 | 186 | |||||||
435837..436075 | 23s° | 72 | 237 | |||||||
436148..436262 | 5s | 51 | 113 | |||||||
436314..436390 | atgf | 196 | 196 | |||||||
436587..436883 | cds | 99 | hp | |||||||
comp | 467261..468370 | cds | 167 | 167 | 370 | 3-isopropylmalate dehydrogenase | ||||
468538..468667 | 23s° | 72 | 128 | |||||||
468740..468854 | 5s | 51 | 113 | |||||||
468906..468982 | atgf | 125 | 125 | |||||||
469108..469863 | cds | 252 | SAM-dependent chlorinase/fluorinase | |||||||
comp | 534521..536161 | cds | 367 | 367 | 547 | glucose-6-phosphate isomerase | ||||
536529..536603 | acg | 92 | 92 | |||||||
comp | 536696..537778 | cds | 361 | tyrosine-type recombinase/integrase | ||||||
comp | 658467..658931 | cds | 110 | 110 | 155 | GNAT family N-acetyltransferase | ||||
comp | 659042..659116 | gtc | 155 | 155 | ||||||
659272..660159 | cds | 106 | 106 | 296 | N-formylglutamate amidohydrolase | |||||
660266..660340 | gtc | 648 | 648 | |||||||
comp | 660989..661800 | cds | 271 | p-N-formylglutamate amidohydrolase | ||||||
comp | 684188..685141 | cds | 323 | 323 | 318 | cation transporter | ||||
comp | 685465..685539 | gtg | + | 25 | 25 | |||||
comp | 685565..685639 | gtg | 2 gtg | 195 | 195 | |||||
685835..686251 | cds | 139 | NUDIX hydrolase | |||||||
comp | 691078..691773 | cds | 4 | 4 | 232 | ComF family protein | ||||
691778..691897 | 23s° | 72 | 118 | |||||||
691970..692084 | 5s | 114 | 114 | 113 | ||||||
comp | 692199..694505 | cds | 769 | VWA domain-containing protein | ||||||
750262..751398 | cds | 161 | 161 | 379 | [FeFe] hydrogenase H-cluster radical SAM maturase HydE | |||||
comp | 751560..751674 | 5s | 72 | 113 | ||||||
comp | 751747..752005 | 23s° | 597 | 597 | 257 | |||||
752603..752814 | rpr | @4 | 388 | 388 | 21 | CRISPR | ||||
753203..753760 | cds | 186 | hp | |||||||
comp | 839981..840214 | cds | 4 | 4 | 78 | hp | ||||
comp | 840219..840478 | 16s° | 568 | 568 | 258 | |||||
comp | 841047..844388 | cds | 1114 | response regulator | ||||||
874585..875391 | cds | 88 | 88 | 269 | phosphoadenylyl-sulfate reductase | |||||
875480..875556 | cac | 81 | 81 | |||||||
875638..876117 | cds | 160 | CreA family protein | |||||||
885688..886299 | cds | 176 | 176 | 204 | LysE family translocator | |||||
886476..886552 | ccc | 144 | 144 | |||||||
comp | 886697..887233 | cds | 179 | helix-turn-helix transcriptional regulator | ||||||
932708..934243 | cds | 93 | 93 | 512 | Fic family protein | |||||
comp | 934337..934413 | cgt | + | 35 | 35 | |||||
comp | 934449..934525 | cgt | 3 cgt | 44 | 44 | |||||
comp | 934570..934646 | cgt | 449 | 449 | ||||||
935096..936175 | cds | 360 | hp | |||||||
comp | 978995..979396 | cds | 138 | 138 | 134 | MFS transporter | ||||
comp | 979535..979609 | ggc | + | 23 | 23 | |||||
comp | 979633..979707 | ggc | 4 ggc | 45 | 45 | |||||
comp | 979753..979827 | ggc | 29 | 29 | ||||||
comp | 979857..979931 | ggc | 206 | 206 | ||||||
980138..981679 | cds | 514 | murein biosynthesis integral membrane protein MurJ | |||||||
997575..997898 | cds | 95 | 95 | 108 | DUF1476 domain-containing protein | |||||
comp | 997994..998067 | cag | + | 54 | 54 | |||||
comp | 998122..998195 | cag | 2 cag | 168 | 168 | |||||
998364..999509 | cds | 382 | Ppx/GppA family phosphatase | |||||||
1050081..1051028 | cds | 60 | 60 | 316 | NnrS family protein | |||||
comp | 1051089..1051163 | acc | + | 16 | 16 | |||||
comp | 1051180..1051254 | acc | 3 acc | 18 | 18 | |||||
comp | 1051273..1051347 | acc | 170 | 170 | ||||||
comp | 1051518..1053305 | cds | 596 | EAL domain-containing protein | ||||||
1197836..1199341 | cds | 197 | 197 | 502 | aldehyde dehydrogenase | |||||
1199539..1199623 | cta | 126 | 126 | |||||||
1199750..1201090 | cds | 447 | trigger factor | |||||||
1206196..1206501 | cds | 93 | 93 | 102 | HU family DNA-binding protein | |||||
1206595..1206670 | gta | 50 | 50 | |||||||
1206721..1207092 | cds | 124 | hp | |||||||
1213113..1214459 | cds | 210 | 210 | 449 | acetyl-CoA carboxylase biotin carboxylase subunit | |||||
comp | 1214670..1214874 | 16s° | 600 | 600 | 203 | |||||
comp | 1215475..1216716 | cds | 414 | polyphosphate kinase | ||||||
comp | 1349719..1350132 | cds | 109 | 109 | 138 | NAD(P) transhydrogenase subunit alpha | ||||
comp | 1350242..1350608 | 23s° | 212 | 365 | ||||||
comp | 1350821..1350897 | atc | 115 | |||||||
comp | 1351013..1351438 | 16s° | 23 | 23 | 424 | |||||
< comp | 1351462..1352160 | cds | 233 | p-tetratricopeptide repeat protein | ||||||
1359745..1360302 | cds | 176 | 176 | 186 | hp | |||||
1360479..1360555 | gac | + | 37 | 37 | ||||||
1360593..1360669 | gac | 2 gac | 274 | 274 | ||||||
1360944..1361204 | cds | 87 | hp | |||||||
1416615..1417769 | cds | 214 | 214 | 385 | glycosyltransferase family 61 protein | |||||
1417984..1418074 | tcc | 154 | 154 | |||||||
comp | 1418229..1419095 | cds | 289 | LysR family transcriptional regulator | ||||||
comp | 1472421..1473403 | cds | 250 | 250 | 328 | biotin synthase BioB | ||||
comp | 1473654..1473740 | ttg | 77 | 77 | ||||||
comp | 1473818..1474678 | cds | 287 | homocysteine S-methyltransferase family protein | ||||||
comp | 1735298..1736380 | cds | 209 | 209 | 361 | DUF262 domain-containing protein | ||||
1736590..1736859 | 23s° | 72 | 268 | |||||||
1736932..1737046 | 5s | 52 | 113 | |||||||
1737099..1737175 | atgf | 93 | 93 | |||||||
comp | 1737269..1737694 | cds | 142 | type II toxin-antitoxin system VapC family toxin | ||||||
comp | 1812365..1813924 | cds | 894 | 894 | 520 | peptidoglycan DD-metalloendopeptidase family protein | ||||
1814819..1815040 | 16s° | -7 | -7 | 222 | ||||||
<comp | 1815034..1815837 | cds | 80 | 80 | 268 | p-elongation factor Tu | ||||
comp | 1815918..1815991 | gga | 34 | 34 | ||||||
comp | 1816026..1816111 | tac | 144 | 144 | ||||||
1816256..1817143 | cds | 296 | 23S rRNA (guanosine(2251)-2'-O)-methyltransferase RlmB | |||||||
comp | 1833109..1833603 | cds | 83 | 83 | 165 | MBL fold metallo-hydrolase | ||||
comp | 1833687..1833762 | aag | + | 24 | 24 | |||||
comp | 1833787..1833862 | aag | 2 aag | 198 | 198 | |||||
comp | 1834061..1835224 | cds | 388 | rod shape-determining protein RodA | ||||||
> | 1941413..1943059 | cds | -30 | -30 | 549 | p-recombinase family protein | ||||
comp | 1943030..1943121 | agc | 160 | 160 | ||||||
comp | 1943282..1944133 | cds | 284 | FAD-dependent thymidylate synthase | ||||||
comp | 2087696..2090938 | cds | 705 | 705 | 1081 | PAS domain-containing protein | ||||
2091644..2091826 | 16s° | 7 | 7 | 181 | ||||||
2091834..2092247 | cds | 138 | hp | |||||||
comp | 2095044..2095490 | cds | 48 | 48 | 149 | hp | ||||
comp | 2095539..2095733 | 16s° | 614 | 614 | 193 | |||||
comp | 2096348..2097337 | cds | 330 | trypsin-like serine protease | ||||||
comp | 2113248..2114603 | cds | 219 | 219 | 452 | hp | ||||
comp | 2114823..2114899 | aga | 55 | 55 | ||||||
comp | 2114955..2115251 | cds | 71 | 71 | 99 | ETC complex I subunit | ||||
comp | 2115323..2115399 | cca | 261 | 261 | ||||||
comp | 2115661..2115960 | cds | 100 | hp | ||||||
comp | 2144042..2146288 | cds | 308 | 308 | 749 | HAMP domain-containing protein | ||||
2146597..2147256 | 23s° | 72 | 658 | |||||||
2147329..2147443 | 5s | 52 | 113 | |||||||
2147496..2147572 | atgf | 645 | 645 | |||||||
comp | 2148218..2148664 | cds | 149 | hp | ||||||
2268003..2268461 | cds | 87 | 87 | 153 | 23S rRNA (pseudouridine(1915)-N(3))-methyltransferase RlmH | |||||
comp | 2268549..2268625 | ccg | + | 165 | 165 | |||||
comp | 2268791..2268867 | ccg | 2 ccg | 56 | 56 | |||||
comp | 2268924..2269910 | cds | 329 | farnesyltranstransferase | ||||||
comp | 2321621..2322145 | cds | 332 | 332 | 175 | hp | ||||
2322478..2322554 | ccc | 225 | 225 | |||||||
2322780..2322974 | cds | 65 | hp | |||||||
comp | 2393295..2396009 | cds | @3 | 1003 | 1003 | 905 | CRISPR-associated helicase/endonuclease Cas3 | |||
2397013..2397919 | 16s° | 2 | 2 | 905 | ||||||
2397922..2400888 | cds | 989 | hp | |||||||
comp | 2517845..2520559 | cds | 229 | 229 | 905 | phosphoenolpyruvate carboxylase | ||||
comp | 2520789..2520903 | 5s | 72 | 113 | ||||||
comp | 2520976..2521339 | 23s° | 189 | 189 | 362 | |||||
comp | 2521529..2522152 | cds | 208 | 3-isopropylmalate dehydratase small subunit | ||||||
comp | 2596508..2596738 | cds | 989 | 989 | 77 | motility twitching protein PilT | ||||
comp | 2597728..2597815 | tca | 194 | 194 | ||||||
2598010..2599204 | cds | 398 | hp | |||||||
comp | 2621435..2622058 | cds | 106 | 106 | 208 | helix-turn-helix transcriptional regulator | ||||
comp | 2622165..2622251 | ctc | 202 | 202 | ||||||
2622454..2623107 | cds | 218 | lipoyl(octanoyl) transferase LipB | |||||||
2631201..2631554 | cds | 192 | 192 | 118 | hp | |||||
2631747..2631822 | gcc | + | 70 | 70 | ||||||
2631893..2631968 | gcc | 4 gcc | 69 | 69 | ||||||
2632038..2632113 | gcc | 57 | 57 | |||||||
2632171..2632246 | gcc | 166 | 166 | |||||||
< | 2632413..2632965 | cds | -41 | -41 | 184 | p-IS256 family transposase | ||||
2632925..2633473 | cds | 30 | 30 | 183 | hp | |||||
comp | 2633504..2633579 | aca | 93 | 93 | ||||||
comp | 2633673..2634200 | cds | 271 | 271 | 176 | N-acetyltransferase | ||||
comp | 2634472..2634561 | tcg | 155 | 155 | ||||||
2634717..2635742 | cds | 342 | hp | |||||||
comp | 2655872..2656489 | cds | 182 | 182 | 206 | YitT family protein | ||||
comp | 2656672..2656747 | gag | 141 | 141 | ||||||
comp | 2656889..2657674 | cds | 262 | MetQ/NlpA family ABC transporter substrate-binding protein | ||||||
2758160..2758312 | cds | 110 | 110 | 51 | light-harvesting protein | |||||
comp | 2758423..2758509 | tta | 94 | 94 | ||||||
comp | 2758604..2759899 | cds | 432 | bifunctional folylpolyglutamate synthase/dihydrofolate synthase | ||||||
> | 2768823..2769518 | cds | -12 | -12 | 232 | methyltransferase | ||||
2769507..2769776 | 23s° | 71 | 268 | |||||||
2769848..2769962 | 5s | 118 | 118 | 113 | ||||||
comp | 2770081..2771016 | cds | 312 | tetratricopeptide repeat protein | ||||||
2792922..2794778 | cds | 129 | 129 | 619 | glutathione-regulated potassium-efflux system protein KefB | |||||
2794908..2794982 | caa | 92 | 92 | |||||||
comp | 2795075..2795686 | cds | 204 | hp | ||||||
2862755..2862982 | cds | 123 | 123 | 76 | hp | |||||
2863106..2863182 | cca | 117 | 117 | |||||||
2863300..2863374 | atgi | 373 | 373 | |||||||
2863748..2863823 | gca | 157 | 157 | |||||||
2863981..2864056 | aca | 15 | ||||||||
2864072..2864317 | cds | 8 | 82 | DUF2829 domain-containing protein | ||||||
2864326..2864401 | aaa | 250 | 250 | |||||||
> | 2864652..2865041 | cds | 130 | p-hp | ||||||
2867066..2868112 | cds | 76 | 76 | 349 | tyrosine-type recombinase/integrase | |||||
comp | 2868189..2868264 | aaa | 99 | 99 | ||||||
comp | 2868364..2868870 | cds | 169 | peptidylprolyl isomerase | ||||||
2893891..2894430 | cds | 25 | 25 | 180 | phage portal protein | |||||
2894456..2894570 | 5s | 51 | 113 | |||||||
2894622..2894698 | atgf | 285 | 285 | |||||||
2894984..2895400 | cds | 139 | p-hp | |||||||
comp | 3034652..3035092 | cds | 250 | 250 | 147 | hp | ||||
comp | 3035343..3035418 | aaa | 8 | 8 | ||||||
comp | 3035427..3035986 | cds | 187 | DUF2829 domain-containing protein | ||||||
comp | 3305068..3306534 | cds | 379 | 379 | 489 | S8 family serine peptidase | ||||
comp | 3306914..3306989 | ttc | + | 29 | 29 | |||||
comp | 3307019..3307094 | ttc | 4 ttc | 34 | 34 | |||||
comp | 3307129..3307204 | ttc | 33 | 33 | ||||||
comp | 3307238..3307313 | ttc | 60 | 60 | ||||||
comp | 3307374..3308864 | cds | 497 | RimK family protein | ||||||
comp | 3332977..3334356 | cds | 54 | 54 | 460 | type II secretion system protein | ||||
3334411..3334487 | cgg | 176 | 176 | |||||||
< comp | 3334664..3335983 | cds | 440 | p-hp | ||||||
3408217..3409026 | cds | 91 | 91 | 270 | hp | |||||
comp | 3409118..3409232 | 5s | 71 | 113 | ||||||
comp | 3409304..3409410 | 23s° | 1 | 1 | 105 | |||||
< | 3409412..3409711 | cds | 100 | p-IS5/IS1182 family transposase | ||||||
comp | 3456276..3461666 | cds | 387 | 387 | 1797 | alpha-2-macroglobulin family protein | ||||
3462054..3462130 | agg | 29 | 29 | |||||||
3462160..3462951 | cds | 264 | amino acid ABC transporter substrate-binding protein | |||||||
comp | 3500025..3500675 | cds | 210 | 210 | 217 | protein-L-isoaspartate O-methyltransferase | ||||
3500886..3500959 | tgc | + | 27 | 27 | ||||||
3500987..3501061 | aac | 2 aac | 31 | 31 | ||||||
3501093..3501167 | aac | 84 | 84 | |||||||
comp | 3501252..3501659 | cds | 136 | hp | ||||||
3639978..3641276 | cds | 172 | 172 | 433 | outer membrane efflux protein | |||||
3641449..3641525 | gcg | + | 70 | 70 | ||||||
3641596..3641671 | gcg | 3 gcg | 33 | 33 | ||||||
3641705..3641780 | gcg | 389 | 389 | |||||||
3642170..3644392 | cds | 741 | sigma-54-dependent Fis family transcriptional regulator | |||||||
3651524..3652711 | cds | 55 | 55 | 396 | aminotransferase | |||||
3652767..3652843 | cac | 202 | 202 | |||||||
<comp | 3653046..3653543 | cds | 166 | arsenical-resistance protein | ||||||
3710072..3710840 | cds | 126 | 126 | 256 | TonB family protein | |||||
comp | 3710967..3711042 | gaa | + | 214 | 214 | |||||
comp | 3711257..3711332 | gaa | 2 gaa | 125 | 125 | |||||
comp | 3711458..3711664 | cds | 69 | cold-shock protein | ||||||
comp | 3727874..3729085 | cds | 828 | 828 | 404 | hp | ||||
3729914..3730068 | 16s° | 87 | 87 | 153 | ||||||
3730156..3730545 | cds | 130 | hp | |||||||
comp | 3804728..3805231 | cds | 118 | 118 | 168 | response regulator | ||||
comp | 3805350..3805425 | gag | 241 | 241 | ||||||
comp | 3805667..3806140 | cds | 158 | transcription elongation factor GreA | ||||||
3813820..3815895 | cds | 138 | 138 | 692 | RNA polymerase sigma factor RpoD | |||||
3816034..3816109 | atgi | 94 | 94 | |||||||
3816204..3818993 | cds | 930 | diguanylate cyclase | |||||||
comp | 3827982..3828878 | cds | 90 | 90 | 299 | phosphoserine phosphatase SerB | ||||
comp | 3828969..3829042 | ggg | @5 | 292 | 292 | |||||
3829335..3830670 | cds | 445 | chemotaxis protein | |||||||
comp | 3832305..3833264 | cds | 311 | 311 | 320 | complex I NDUFA9 subunit family protein | ||||
3833576..3833662 | ctg | + | 47 | 47 | ||||||
3833710..3833796 | ctg | 5 ctg | 153 | 153 | ||||||
3833950..3834036 | ctg | 48 | 48 | |||||||
3834085..3834171 | ctg | 47 | 47 | |||||||
3834219..3834305 | ctg | 113 | 113 | |||||||
3834419..3835039 | cds | 207 | ribonuclease D |
rpm cumuls[modifier | modifier le wikicode]
- Lien tableur: rpm cumuls
opérons | Fréquences intercalaires tRNAs | Fréquences intercalaires cds | Fréquences aas cds chromosome | ||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
effectif | gammes | sans rRNAs | avec rRNAs | gammes | cds | gammes | cdsd | gammes | cdsa | gammes | cdsa 300 | ||
avec rRNA | opérons | 27 | 1 | 0 | 1 | 9 | 1 | 100 | 20 | 1 | 0 | ||
16s°atc23s° | 7 | 20 | 2 | 50 | 15 | 40 | 200 | 35 | 30 | 0 | |||
16s°gca23s° | 1 | 40 | 14 | 100 | 30 | 80 | 300 | 30 | 60 | 3 | |||
16s°23s° | 1 | 60 | 7 | 150 | 24 | 120 | 400 | 23 | 90 | 10 | |||
max a | 1 | 80 | 3 | 200 | 23 | 160 | 500 | 14 | 120 | 10 | |||
a doubles | 0 | 100 | 0 | 250 | 16 | 200 | 600 | 7 | 150 | 14 | |||
spéciaux | 18 | 120 | 1 | 300 | 5 | 240 | 700 | 2 | 180 | 13 | |||
total aas | 13 | 140 | 0 | 350 | 4 | 280 | 800 | 3 | 210 | 11 | |||
sans | opérons | 47 | 160 | 2 | 400 | 5 | 320 | 900 | 0 | 240 | 6 | ||
1 aa | 30 | 180 | 1 | 450 | 2 | 360 | 1000 | 4 | 270 | 9 | |||
max a | 5 | 200 | 0 | 500 | 0 | 400 | 1100 | 1 | 300 | 9 | |||
a doubles | 15 | 2 | 14 | 2 | 56 | ||||||||
total aas | 79 | 32 | 0 | 147 | 0 | 141 | 141 | ||||||
total aas | 92 | ||||||||||||
remarques | 5 | ||||||||||||
avec jaune | moyenne | 69 | 194 | 310 | |||||||||
variance | 75 | 197 | 248 | ||||||||||
sans jaune | moyenne | 39 | 147 | 252 | 170 | ||||||||
variance | 16 | 112 | 134 | 71 |
rpm tRNA-cds[modifier | modifier le wikicode]
- Note: intercalaires prélevés de la colonne cds de rpm opérons dans un bloc de tRNAs uniquement. Le début du bloc est dans l'ordre des adresses, deb intercalaire entre le cds et le 1er tRNA dd bloc, fin entre le dernier tRNA et le cds terminal. J'ai procédé, dans les colonnes petit et grand, à la réorientation des blocs d'après la constatation que les blocs à rRNA ont leurs cds de début et de fin sont orientés du cds-16s au 5s-tRNAs-cds, l'intercalaire cds-16s étant plus grands que l'intercalaire avec le cds terminal. En tête de colonne est le % du nombre des intercalaires inférieurs à 201 pbs.
rpm 71 73 47 98 deb fin deb fin grand petit grand petit -30 160 250 8 87 56 160 -30 30 93 387 29 88 81 250 8 54 176 142 38 93 50 387 29 55 202 93 50 93 30 93 30 60 170 219 55 99 76 142 38 71 261 87 56 110 94 93 50 76 99 379 60 126 125 176 54 83 198 250 77 129 92 202 55 87 56 88 81 138 94 219 55 88 81 210 84 142 38 87 56 90 292 129 92 155 110 170 60 93 449 367 92 160 -30 379 60 93 50 30 93 168 95 261 71 95 168 110 94 170 60 99 76 106 648 138 94 176 144 250 77 106 202 76 99 176 54 88 81 110 155 311 113 182 141 198 83 110 94 126 125 192 166 210 84 116 199 197 126 197 126 292 90 118 241 182 141 198 83 129 92 123 250 176 144 199 116 367 92 126 125 214 154 202 55 449 93 129 92 110 155 202 106 110 94 138 206 271 155 206 138 138 94 138 94 -30 160 210 84 168 95 142 38 192 166 214 154 202 106 172 389 95 168 219 55 648 106 176 144 60 170 241 118 155 110 176 274 54 176 250 8 311 113 182 141 989 194 250 77 199 116 192 166 323 195 250 123 241 118 197 126 83 198 261 71 250 123 210 84 116 199 271 155 126 125 214 154 55 202 274 176 197 126 219 55 106 202 292 90 206 138 250 77 138 206 311 113 182 141 250 8 332 225 323 195 176 144 271 155 118 241 332 225 214 154 311 113 123 250 367 92 271 155 323 195 71 261 379 60 192 166 332 225 176 274 387 29 389 172 367 92 90 292 389 172 274 176 379 60 172 389 449 93 989 194 387 29 93 449 648 106 323 195 989 194 106 648 989 194 332 225
- Comparaison cds-cds tRNA-cds: deb fin, c'est l'ordre des adresses et grand petit l'ordre après réorientation. Leur pourcentage est calculé par rapport à la colonne, c'est à dire la moitié du total des tRNA-cds.
alpha cds total total <0 0-200 201-370 371-600 >600 deb fin grand petit rpm 3,484 90 1 64 19 4 2 31 33 21 43 rpm ‰ 11 711 211 44 22 689 733 467 956
rpm blocs[modifier | modifier le wikicode]
rpm blocs protéines[modifier | modifier le wikicode]
- Lien tableur: rpm blocs protéines
- Note:
- - hp pour hypothetical protein
- - p- pour pseudo, par exemple p-elon en abrégé donne p-elongation factor Tu.
abrégé | nom |
---|---|
23s | 23s rRNA (guanosine(2251)-2'-O)-methyltransferase RlmB |
3-isop | 3-isopropylmalate dehydrogenase |
3-isop-sub | 3-isopropylmalate dehydratase small subunit |
acetyl | acetyl-CoA carboxylase biotin carboxylase subunit |
cas3 | CRISPR-associated helicase/endonuclease Cas3 |
CDP | CDP-diacylglycerol--serine O-phosphatidyltransferase |
ComF | ComF family protein |
CRISPR | CRISPR |
DUF262 | DUF262 domain-containing protein |
FeFe | [FeFe] hydrogenase H-cluster radical SAM maturase HydE |
glyco | glycosyltransferase |
HAMP | HAMP domain-containing protein |
LysM | LysM peptidoglycan-binding domain-containing protein |
methyl | methyltransferase |
NAD | NAD(P) transhydrogenase subunit alpha |
p-elon | p-elongation factor Tu |
p-EscV | p-EscV/YscV/HrcVfamilytypeIIIsecretionsystemexportapparatusprotein |
p-glyco | p-glycosyltransferase |
P-glyco1 | p-glycosyl transferase family 1 |
p-IS5 | p-IS5/IS1182 family transposase |
p-tetra | p-tetratricopeptide repeat protein |
p-trans | p-transposase |
PAS | PAS domain-containing protein |
peptido | peptidoglycan DD-metalloendopeptidase family protein |
phage | phage portal protein |
phospho | phosphoenolpyruvate carboxylase |
polypho | polyphosphate kinase |
respons | response regulator |
SAM | SAM-dependent chlorinase/fluorinase |
SEL1 | SEL1-like repeat protein |
tetra | tetratricopeptide repeat protein |
TraY | TraY domain-containing protein |
trypsin | trypsin-like serine protease |
type II | type II toxin-antitoxin system VapC family toxin |
VWA | VWA domain-containing protein |
winged | winged helix-turn-helix domain-containing protein |
rpm blocs construits[modifier | modifier le wikicode]
- Lien tableur: rpm blocs construits
- Légende: lien au tableau des protéines, abrégés
- - vert: la taille des rRNAs en pbs alors que les protéines (cdsa) sont en aas.
- - bleu: protéines bien caractérisées alors qu'en clair sont les protéines candidates à la création, hp pour hypothetical protein, p-protéine pour pseudo-protéine et les protéines caractérisées seulement par un domaine comme DUF262 par exemple.
- - cyan: Les intercalaires constantes vestiges des blocs complets représentés par l'unique bloc contenant le 16s avec les intercalaires 71 pour 5s-23s, 212 pour 23s-atc, 112 pour atc-16s et 52 dans le cas de 5s-atgf.
- - gris: Je ne considère ici que les protéines créées à l'intérieur d'un bloc rRNA. Les protéines non canditates à la création sont en bleu, voir ci-dessus le bleu, mais la reconstruction des blocs détruits m'a obligé à considérer des protéines internes au bloc, bien caractérisées non candiates à la création. Aussi je n'ai conservé que les plus petites, metyl adresse 2768823, 3-isop-sub adresse 2521529 et glyco adresse 49761. La reconstruction ne m'a pas permis de faire de grands blocs pour 4 clusters listés à la fin des 2 derniers tableaux en gris. Ces clusters sont restés parce qu'ils mettraient des protéines non candidates en intra bloc avec de grande taille.
- Notes: Il faut noter que théoriquement, pour cet organisme où la destruction des blocs est spéctaculaire, les protéines créées pourraient être aussi grande que le 23s en paires de base, 2765 soit 900 aas à peu près. C'est ce que j'ai suggéré en plaçant le 16s° contenant 1 grosse protéine candidate pour la création parce qu'elle est hypothétique dans le reconstruction du bloc b10, cas3-16s°-hp, 905-16s°-989. La même situation est reproduite dans le bloc b9 avec PAS-16s°-hp, 1081-16s°-138.
- @ Les blocs à rRNAs: texte de rpm remarques, remarque @3.
- - Les clusters de rpm tels qu’ils apparaissent dans la séquence des adresses sont présentés au chapitre rpm blocs construits, tableaux A5b1 et A5b2.
- + A5b1 rassemble 9 16s° solitaires suivis de longs clusters où on peut repérer les blocs d’origine altérés caractérisés par les intercalaires 16s-atc-23s, respectivement de 112 pbs et 216 pbs. Ainsi je suppose qu’il y a 5 blocs d’origine de type 16s-atc-23s-5s et un,isolé, de type 16s-gca-23s-5s. Dans ces grands clusters seul subsiste un seul 5s appartenant au bloc complet et intègre que j’ai nommé b0.
- + A5b2 rassemble 9 23s°5s solitaires et 3 blocs complets et un 5s solitaire. Les 23s°5s sont mis en face des 16s° du tableau A5b1. Les blocs complets contiennent un représentant de 16s, un de 23s et un 5s. Dans cette partie du tableau A5b2 j’ai ajouté le bloc b0 séparé de son cluster pour comparaison. Le bloc analogue au b0 est le bloc b1 qui est isolé et où seul le 16s est altéré. Le bloc b3 de cette partie du tableau apparaît comme un racollage d’un 16s° solitaire et d’un 23s°5s solitaire puisque l’intercalaire 16s°-23s° est négatif, c’est-à-dire qu’il y a recouvrement des 2 morceaux, ce qui ne serait pas le cas s’il y avait une délétion entre le 16s et le 23s d’origine.
- - Le parallélisme et l'égalité en nombres entre les 16s° et les 23s°5s solitaires, ainsi que l'analyse des intercalaires petits et négatifs de la remarque @2 m’ont poussé à reconstruire les blocs d’origines en rapprochant des 16s° solitaires à d’autres 16s° solitaires ou non tous 2 avec leurs cds, selon l’hypothèse que les 2 cds internes résultant font partie de l’altération ou de la délétion du 16s original et du coup ces cds seraient des candidats à la création de gènes nouveaux. Le même procédé et la même hypothèse sont appliqués pour un 23° et un 23s°5s.
- - Cette reconstruction se trouve dans les tableaux A5b3 et A5b4. Ainsi en optimisant les tailles des 16s et 23s reconstruits pour se rapprocher le plus aux tailles de ces rRNAs du bloc intègre b0, j’ai pu construire 11 blocs. J’ai séparé le 16s° du 23s°5s du bloc b3 du tableau A5b2. Il reste cependant un 16s°, un 23s° et un 5s-atgf que je n’ai pas pu réunir car leurs cds sont tous bien caractérisés et ne répondent aux critères des candidats à la création. L’hypothèse de 11 blocs ou 12 blocs à l’origine est tout à fait probable en comparaison des 9 blocs de abq.
- - Je n'ai pas pu faire une reconstruction analogue avec abs malgré la proximité phylogénique de abq car la complémentarité 16s° et 23s°5s n’existe pas comme si l’altération faisait disparaître une partie du rRNA, ceux qui restent indiquant la position des originaux. Cela indiquerait que ce sont 2 processus d’altération différents certainement reliés à la présence des tRNAs intra bloc, atc pour rpm et atc-gca pour abs.
- - Le génome analogue avec que des atc Tistrella mobilis KA081020-065, voir proteobacteria et Tistrella mobilis KA081020-065 [[11]]
- - Les clusters de rpm tels qu’ils apparaissent dans la séquence des adresses sont présentés au chapitre rpm blocs construits, tableaux A5b1 et A5b2.
- @ Les blocs à rRNAs: texte de rpm remarques, remarque @3.
|
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|
rpm remarques[modifier | modifier le wikicode]
rpm remarques texte[modifier | modifier le wikicode]
- Remarques:
- @ Il y a 7 atc dans 7 blocs à rRNAs courts ou longs et il n’y a qu’un seul gca de ce type. Il y a un 2ème gca mais dans un bloc sans rRNAs. C’est un génome à 16satc23s5s comme Tistrella mobilis KA081020-065 [[12]]. Voir fiche alpha.
- @ Il y a 12 blocs à rRNAs courts ou complets et tous ont un intercalaire 23s-5s ou 23s°-5s de 72 ou 71. Les intercalaires avec cds et entre aas
- - Les intercalaires élevés: Ils sont peu nombreux et modérés.
- + Les cds avec les blocs à rRNAs sont en général élevés jusqu’à 600 pbs. Sur les 13 de rpm seulement 4 dépassent 700, 705 828 894 1003.
- + Il y a 3 intercalaires avec les tRNAs supérieurs à 400, 489 648 989. Le génome rpm n’échappe donc pas au comportement des alpha.Voir le tableau des spectres des intercalaires avec les cds. Bien que rpm présente un maximum élevé il affiche un minimum de 3 intercalaires avec les tRNAs, élevés, supérieurs à 400 contre un maximum de 24 pour rpl.
- - Les intercalaires négatifs et petits, voir le tableau des spectres et la liste de ces intercalaires.
- + Dans le tableau des spectres des intercalaires, rpm et aon sont les seuls à présenter une proportion significative de ces intercalaires négatifs avec 6% alors que les 7 autres alpha n’en présentent aucun.
- + Dans la liste de rpm sur 24 intercalaires inférieurs à 51, 7 sont négatifs un nul et un égale à l’unité. Six autres ont des intercalaires positifs inférieurs à 9. Cette liste laisse penser que ce comportement est très lié à l’altération des blocs à rRNAs. Puisque, 16 de ces intercalaires concernent les rRNAs altérés de même que les intercalaires élevés, supérieurs à 400, concernent 12 de ces RNAs.
- + C'est comme si l'altération des blocs à rRNAs se faisait à l'intérieur du bloc et épargnait son extérieur. D'où cette hypothèse que les cds à intercalaires petits ou négatifs collés aux rRNAs altérés seraient des candidats à la création de gènes, petits, hypothétiques et/ou pseudo.
- + Ces intercalaires ne seraient pas dus seulement au changement de brin lors de la recombinaison ou de la conversion, puisque les changements de brin (présentés ici par comp) ne représentent que le tiers, 6 sur 16.
- + Dans ce génome les intercalaires négatifs et petits existent entre 2 cds contigus et un cds et un tRNA (agc).Mais les intercalaires des 5 autres tRNAs sont assez élevés et correspondent à la dissymétrie, constatée chez beaucoup de génomes, entre les 2 cds encadrant un bloc sans rRNAs.
- - Spectre des intercalaires avec les cds: rapportés au total j’ai distingué 4 intervalles de ces intercalaires en pbs, inférieur à 51, de 51-200, de 201-400 et supérieur à 400. A part les génomes à phylogénie étroite, abq abs et rtb rpl, il y a 6 génomes différents.
- + rru et abq sont identiques
- + rpm et oan sont différents avec tous les autres à cause des négatifs et ils sont différents entre eux par l'intervalle 51-200, 0.52 contre 0.36.
- + agr a l'intervalle 201-400 le plus élevé de tous, 0.34 contre 0.15 à 0.28. Et le génome dont il se rapproche le plus, aua, diffère avec lui pour tous les autres intervalles.
- + rtb diffère de tous les autres par un intervalle > 400 élevé qui est de 0.44 contre moins de 0.20 pour tous les autres. En même temps ce génome est très dissymétrique puisqu’il a un intervalle < 51 aussi élevé que rpm et oan, 13 contre 16 et 19 respectivement, alors que les autres tournent autour de 0.05 jusqu’à 0.10 pour aua.
- - Les intercalaires entre tRNAs notés aussi aas, voir la liste entre aas.
- + Pour ces intercalaires, rpm se comporte comme les autres alpha et gamma (spl eco) avec 2 groupes, ceux supérieurs à 80 et pouvant atteindre des maxima élevés jusqu’à 1172 pour spl et 373 pour rpm, et le 2ème groupe ,le plus nombreux, aux intercalaires inférieurs à 81 avec une moyenne proche de 30 (variance inférieure à 20).
- + Le comportement des gamma et alpha est nettement différent de celui des firmicutes (ban lbu cbc) où le 2ème groupe fait à peine 5% du total (5 pour 113) mais avec des maxima aussi élevés que rpm. Le 2ème groupe des alpha dépasse les 50% ( 24 pour 45) et celui des gamma fait 25% ( 31 pour 129).
- - Les intercalaires élevés: Ils sont peu nombreux et modérés.
- @ Les blocs à rRNAs:
- - Les clusters de rpm tels qu’ils apparaissent dans la séquence des adresses sont présentés au chapitre rpm blocs construits, tableaux A5b1 et A5b2.
- + A5b1 rassemble 9 16s° solitaires suivis de longs clusters où on peut repérer les blocs d’origine altérés caractérisés par les intercalaires 16s-atc-23s, respectivement de 112 pbs et 216 pbs. Ainsi je suppose qu’il y a 5 blocs d’origine de type 16s-atc-23s-5s et un,isolé, de type 16s-gca-23s-5s. Dans ces grands clusters seul subsiste un seul 5s appartenant au bloc complet et intègre que j’ai nommé b0.
- + A5b2 rassemble 9 23s°5s solitaires et 3 blocs complets et un 5s solitaire. Les 23s°5s sont mis en face des 16s° du tableau A5b1. Les blocs complets contiennent un représentant de 16s, un de 23s et un 5s. Dans cette partie du tableau A5b2 j’ai ajouté le bloc b0 séparé de son cluster pour comparaison. Le bloc analogue au b0 est le bloc b1 qui est isolé et où seul le 16s est altéré. Le bloc b3 de cette partie du tableau apparaît comme un racollage d’un 16s° solitaire et d’un 23s°5s solitaire puisque l’intercalaire 16s°-23s° est négatif, c’est-à-dire qu’il y a recouvrement des 2 morceaux, ce qui ne serait pas le cas s’il y avait une délétion entre le 16s et le 23s d’origine.
- - Le parallélisme et l'égalité en nombres entre les 16s° et les 23s°5s solitaires, ainsi que l'analyse des intercalaires petits et négatifs de la remarque @2 m’ont poussé à reconstruire les blocs d’origines en rapprochant des 16s° solitaires à d’autres 16s° solitaires ou non tous 2 avec leurs cds, selon l’hypothèse que les 2 cds internes résultant font partie de l’altération ou de la délétion du 16s original et du coup ces cds seraient des candidats à la création de gènes nouveaux. Le même procédé et la même hypothèse sont appliqués pour un 23° et un 23s°5s.
- - Cette reconstruction se trouve dans les tableaux A5b3 et A5b4. Ainsi en optimisant les tailles des 16s et 23s reconstruits pour se rapprocher le plus aux tailles de ces rRNAs du bloc intègre b0, j’ai pu construire 11 blocs. J’ai séparé le 16s° du 23s°5s du bloc b3 du tableau A5b2. Il reste cependant un 16s°, un 23s° et un 5s-atgf que je n’ai pas pu réunir car leurs cds sont tous bien caractérisés et ne répondent aux critères des candidats à la création. L’hypothèse de 11 blocs ou 12 blocs à l’origine est tout à fait probable en comparaison des 9 blocs de abq.
- - Je n'ai pas pu faire une reconstruction analogue avec abs malgré la proximité phylogénique de abq car la complémentarité 16s° et 23s°5s n’existe pas comme si l’altération faisait disparaître une partie du rRNA, ceux qui restent indiquant la position des originaux. Cela indiquerait que ce sont 2 processus d’altération différents certainement reliés à la présence des tRNAs intra bloc, atc pour rpm et atc-gca pour abs.
- - Le génome analogue avec que des atc Tistrella mobilis KA081020-065, voir proteobacteria et Tistrella mobilis KA081020-065 [[13]]
- - Les clusters de rpm tels qu’ils apparaissent dans la séquence des adresses sont présentés au chapitre rpm blocs construits, tableaux A5b1 et A5b2.
- @ CRISPR, en relation avec la création des gènes et la conversion?
- Adresse 752603
- /rpt_family="CRISPR"
- /rpt_type=direct
- /rpt_unit_range=752664..752692
- /rpt_unit_seq="gggttcatccctgcgcatgcaggggatac"
- @ Les tRNAs rares : liens aux indices de l'ensemble des alpha, de l'ensemble des bacilli et de l'ensemble des gamma
- - Les 11 tRNAs se terminant par g, à part ttg agg tgg atg et tag, sont souvent les premiers absents chez certains génomes bactériens. A ceux-là il faut ajouter ccc et cga: ccc s’expliquerait par complémentarité avec ggg; cga est du au fait que chez les bactéries il y a bascule cgt/cgc et cgg/cga (cgc devenant rare comme pour tous les autres doublets xyt et de même cga par rapport à cgg). Chez les bacilli par exemple ces 13 tRNAs sont très rares alors que chez les alphaproteobacteria sont aussi abondants que les xyc et xya, à part cga est absent dans les 9 génomes étudiés ici.
- - Indices pour 100 génomes des aas les plus faibles, < 80: cgg et ttg soupçonnés ne présentent aucune faiblesse. Par contre je découvre 4 tRNAs présentant une seule faiblesse sur les 4 clades et seul le clade bacilli présente cette faiblesse, ce sont ctc gtc gcc ctg. Est-ce que ce foisonnement de doubles est en relation avec l'étendue des altérations des blocs à rRNAs?
génomes 354 1161 672 4032 clade alpha gamma bacilli bacteria cga 8.5 13.4 5.4 22 ccc 78 87 5.7 68 gtc 101 176 47 110 gcc 94 170 26 103 ctc 110 104 67 95 gtg 55 8.4 0.7 33 gcg 55 7.1 7.9 30 gag 50 7.8 15 34 ggg 66 74 17 56 ctg 87 256 57 129 ccg 68 63 17 54 cag 62 104 16 59 cgg 101 102 99 83 acg 86 73 43 68 aag 74 24 67 60 agg 71 112 66 86 ttg 84 105 112 99 tcg 76 85 46 65
- séquences des doubles: C'est le génome des 9 alpha étudiés qui présente le plus de doubles avec 15 contre 1 ou 2 cluster pour les autres présentant des doubles. En plus, même les tRNAs les plus faibles présentent des doublets, ccg aag cag gtg, et même un triplet gcg.
n aas effectif total doubles 1 30 30 2 7 14 ccg aag gac cag gtg atgi gaa 3 4 12 gcgx3 cgtx3 accx3 tgc.aacx2 4 4 16 ttcx4 gccx4 ggcx4 simplesx4 5 1 5 ctgx5 total 46 77
rpm listes[modifier | modifier le wikicode]
rpm intercalaires entre aas[modifier | modifier le wikicode]
- Tableau des intercalaires entre aas dans les blocs sans rRNAs
2863300 373 atgi-gca 3710967 214 gaa-gaa 2268549 165 ccg-ccg 2863748 157 gca-aca 3833710 153 ctg-ctg 2863106 117 cca-atgi
- Comparaison avec les gamma et les firmicutes
clade génome < 80 > 80 moyenne ecartype maximum alpha rpm 26 6 39 16 373 rru 1 3 - 202 abq 11 6 - 220 abs 11 6 - 219 oan 1 2 - 245 agr 2 2 - 793 aua 4 9 - 404 rtb 2 2 - 1051 rpl 2 2 - 830 alpha total-rpm 34 32 - - alpha sans double 21 24 - - bacilli ban 35 2 14 14 87 bacilli lbu 46 2 14 12 258 clostridia cbc 27 1 15 14 306 gama spl 70 23 39 14 1172 gama eco 28 8 28 18 209
rpm intercalaires avec les cds[modifier | modifier le wikicode]
cds > 400 adresse intercalaire RNA 435655 512 16s° 46322 553 16s° 840219 568 16s° 22949 586 16s° 1214670 600 16s° 2095539 614 16s° 2091644 705 16s° comp 3729914 828 16s° comp 1814819 894 16s° comp 2393295 1003 16s° comp 55304 438 23s° 751747 597 23s° comp 2147496 645 atgf comp 934570 449 cgt comp 660266 648 gtc comp 2597728 989 tca
- Tableau des intercalaires négatifs ou petits avec les cds
cds < 50 adresse intercalaire RNA ou cds 1814819 -7 16s° comp 46322 0 16s° 2397013 2 16s° 840219 4 16s° 2091644 7 16s° 27892 18 16s° comp 1351013 23 16s° 5276 38 16s° comp 2095539 48 16s° 2769507 -12 23s° 13628 -7 23s° 44132 -5 23s° comp 3409304 1 23s° comp 691778 4 23s° comp 4225 30 23s° 2894456 25 5s 52988 -37 cds 2632925 -41 cds 1814819 -30 agc comp 3035343 8 aaa 3462054 29 agg 2633504 30 aca comp 417656 38 atgj comp 1206595 50 gta
- Spectre des intercalaires avec les cds
- Liens aux cumuls
- - spl cumuls, gamma
- - lbu cumuls, bacilli
- - fiche alpha
- - ban cumuls, bacilli
- - cbc cumuls, clostridia
- - eco cumuls, gamma
- Tableau des intercalaires élevés avec les cds
intercalaires rru rpm oan abs abq agr rtb rpl aua < 2 0 0.06 0.05 0 0 0 0 0 0.01 < 51 0.07 0.16 0.19 0.04 0.06 0.03 0.13 0.14 0.10 51-200 0.53 0.52 0.36 0.55 0.54 0.53 0.29 0.27 0.40 201-400 0.25 0.20 0.28 0.26 0.24 0.34 0.15 0.19 0.30 > 400 0.15 0.11 0.17 0.14 0.17 0.10 0.44 0.40 0.20 total 88 147 107 125 121 97 62 63 80 Aas > 400 7 3 13 6 9 8 24 22 16 max aas 1389 989 1650 746 688 660 2465 2381 3102
alpha codes[modifier | modifier le wikicode]
- Lien tableur: alpha codes
- Légende: prélèvement de la base gtRNAdb le 19/1/20 Paris
- - totaux en en-tête, exemple pour A5c, 25 98 95, 12 somme des tRNAs faibles ccc cga les jaunes et les 3 oranges de la colonne 6; 98 total de gtRNAdb contenant des pseudo et inconnus; 95 total du tableau.
- - ata très rare est remplacé par atgi (Ile2)
- - Met comprend atgf (Metf) et atgj (Met) sous la forme atgf/atgj, sauf pour A1c dont il faut les différencier.
- - Voir la légende des tris et couleurs, g1 t1.
|
|
|
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|
|
|
gamma codes[modifier | modifier le wikicode]
- Lien tableur: gamma codes
- Légende: prélèvement de la base gtRNAdb le 19/1/20 Paris
- - totaux en en-tête, exemple pour G1c, 88642 86720, 88642 total de la requête pour tout gamma dans gtRNAdb, 86720 total du tableau.
- - Voir la légende des tris et couleurs, g1 t1.
- Liens aux indices de l'ensemble des alpha et de l'ensemble des bacilli
|
|
rpm distribution[modifier | modifier le wikicode]
- Lien tableur: rpm distribution
- Notes:
aac2 aag2 acc3 atgj2 cag2 ccg2 cgt3 ctg5 gaa2 gac2 gcc4 gcg3 ggc4 gtg2 ttc4 gca >1 16s
g1 | t1 | ||||||
---|---|---|---|---|---|---|---|
atgi | 2 | tct | tat | atgf | 5 | ||
att | act | aat | agt | ||||
ctt | cct | cat | cgc | ||||
gtt | gct | gat | ggt | ||||
ttc | 4 | tcc | 1 | tac | 1 | tgc | 1 |
atc | 7 | acc | 3 | aac | 2 | agc | 1 |
ctc | 1 | ccc | 2 | cac | 2 | cgt | 3 |
gtc | 2 | gcc | 4 | gac | 2 | ggc | 4 |
tta | 1 | tca | 1 | taa | tga | ||
ata | aca | 2 | aaa | 3 | aga | 1 | |
cta | 1 | cca | 2 | caa | 1 | cga | |
gta | 1 | gca | 2 | gaa | 2 | gga | 1 |
ttg | 1 | tcg | 1 | tag | tgg | 1 | |
atgj | 2 | acg | 1 | aag | 2 | agg | 1 |
ctg | 5 | ccg | 2 | cag | 2 | cgg | 1 |
gtg | 2 | gcg | 3 | gag | 2 | ggg | 1 |
alpha | >1aa | =1aa | -5s | +5s | -16s | +16s | total |
rpm | 49 | 30 | 5 | 8 | 92 |
Rhodospirillum rubrum ATCC 11170[modifier | modifier le wikicode]
rru opérons[modifier | modifier le wikicode]
- Lien tableur: rru opérons
- Liens: gtRNAdb [14], NCBI [15], génome [orgn]
- Phylogénie: Bacteria; Proteobacteria; Alphaproteobacteria; Rhodospirillales; Rhodospirillaceae; Rhodospirillum.
- Légende: cdsa: cds aas, cdsd: cds dirigé
64.97%GC | 26.12.19 Paris | 55 | doubles | intercal | cds | aa | avec aa | cdsa | cdsd | protéines |
---|---|---|---|---|---|---|---|---|---|---|
chromosome | ||||||||||
comp | 16232..16852 | cds | 163 | 163 | 207 | 3'-5' exonuclease | ||||
comp | 17016..17102 | ctg | 253 | 253 | ||||||
17356..18378 | cds | 341 | 3-beta-hydroxy-delta(5)-steroid dehydrogenase | |||||||
117072..117287 | cds | 37 | 37 | 72 | slyX | |||||
comp | 117325..117401 | agg | 341 | 341 | ||||||
117743..123022 | cds | 1760 | alpha-2-macroglobulin-like protein | |||||||
comp | 149921..151015 | cds | 225 | 225 | 365 | hp | ||||
151241..151317 | cgg | 136 | 136 | |||||||
comp | 151454..152929 | cds | 492 | chemotaxis sensory transducer protein | ||||||
189941..191668 | cds | 859 | 859 | 576 | sulfate transporter/antisigma-factor antagonist | |||||
192528..194004 | 16s | 184 | 1477 | |||||||
194189..194265 | atc | 66 | 66 | |||||||
194332..194407 | gca | 362 | ||||||||
194770..197527 | 23s | 119 | 2758 | |||||||
197647..197761 | 5s | 96 | 115 | |||||||
197858..197934 | atgf | 287 | 287 | |||||||
comp | 198222..198455 | cds | 78 | hp | ||||||
comp | 305449..306648 | cds | 257 | 257 | 400 | Ppx/GppA phosphatase | ||||
306906..306979 | cag | 319 | 319 | |||||||
comp | 307299..308303 | cds | 335 | LacI family transcriptional regulator | ||||||
comp | 322896..323807 | cds | 292 | 292 | 304 | hp | ||||
comp | 324100..324174 | caa | 98 | 98 | ||||||
comp | 324273..325601 | cds | 443 | chemotaxis sensory transducer protein | ||||||
362552..362881 | cds | 224 | 224 | 110 | hp | |||||
363106..363181 | gcc | + | 202 | 202 | ||||||
363384..363459 | gcc | 2 gcc | 43 | 43 | ||||||
comp | 363503..364531 | cds | 343 | esterase | ||||||
407067..407606 | cds | 92 | 92 | 180 | YbaK/prolyl-tRNA synthetase associated domain-containing protein | |||||
407699..407790 | agc | 141 | 141 | |||||||
407932..408774 | cds | 281 | hp | |||||||
466945..467925 | cds | 115 | 115 | 327 | hp | |||||
comp | 468041..468126 | tta | 83 | 83 | ||||||
comp | 468210..468458 | cds | 83 | hp | ||||||
comp | 559038..559610 | cds | 86 | 86 | 191 | OsmC-like protein | ||||
559697..559772 | aag | 140 | 140 | |||||||
559913..560608 | cds | 232 | hp | |||||||
comp | 794877..795188 | cds | -81 | -81 | 104 | hp | ||||
comp | 795108..795188 | Sig-pep | 217 | 217 | 27 | hp | ||||
795406..795496 | tcc | 44 | 44 | |||||||
795541..795846 | cds | 102 | hp | |||||||
comp | 908584..910185 | cds | -102 | -102 | 534 | peptidase M23B | ||||
comp | 910084..910185 | Sig-pep | @1 | 1212 | 1212 | 34 | hp | |||
911398..912874 | 16s | 182 | 1477 | |||||||
913057..913133 | atc | 66 | 66 | |||||||
913200..913275 | gca | 361 | ||||||||
913637..916394 | 23s | 118 | 2758 | |||||||
916513..916627 | 5s | 95 | 115 | |||||||
916723..916799 | atgf | 573 | 573 | |||||||
917373..921860 | cds | 1496 | hp | |||||||
1159249..1160091 | cds | 71 | 71 | 281 | Linocin_M18 bacteriocin protein | |||||
1160163..1160238 | gag | 117 | 117 | |||||||
1160356..1160613 | cds | 86 | prevent-host-death protein | |||||||
comp | 1464820..1465122 | cds | 283 | 283 | 101 | 50S ribosomal protein L21 | ||||
1465406..1465495 | tcg | 139 | 139 | |||||||
comp | 1465635..1466303 | cds | 223 | cytochrome B561 | ||||||
1791953..1792159 | cds | 116 | 116 | 69 | hp | |||||
comp | 1792276..1792351 | gaa | 131 | 131 | ||||||
comp | 1792483..1792689 | cds | 69 | cold-shock DNA-binding protein family protein | ||||||
1824302..1825738 | cds | 98 | 98 | 479 | malonyl-CoA decarboxylase | |||||
1825837..1825921 | cta | 102 | 102 | |||||||
1826024..1827415 | cds | 464 | trigger factor | |||||||
1833133..1833408 | cds | 284 | 284 | 92 | histone-like DNA-binding protein | |||||
1833693..1833768 | gta | 70 | 70 | |||||||
comp | 1833839..1835326 | cds | 496 | methyl-accepting chemotaxis sensory transducer | ||||||
1933506..1934138 | cds | -633 | -633 | 211 | hp | |||||
1933506..1933652 | Sig-pep | 571 | 571 | 49 | hp | |||||
1934224..1934300 | cca | 63 | 63 | |||||||
1934364..1934663 | cds | 12 | 12 | 100 | ETC complex I subunit region | |||||
1934676..1934752 | aga | 396 | 396 | |||||||
1935149..1939624 | cds | 1492 | hp | |||||||
1959133..1959858 | cds | 175 | 175 | 242 | MerR family transcriptional regulator | |||||
1960034..1960110 | ccc | @2 | 1062 | 1062 | ||||||
1961173..1961367 | cds | 65 | hp | |||||||
comp | 1996760..1998124 | cds | -120 | -120 | 455 | lytic murein transglycosylase | ||||
comp | 1998005..1998124 | Sig-pep | 119 | 119 | 40 | hp | ||||
1998244..1998333 | tca | 927 | 927 | |||||||
comp | 1999261..1999929 | cds | 223 | hp | ||||||
2032027..2032863 | cds | 123 | 123 | 279 | phage integrase | |||||
comp | 2032987..2033062 | aaa | 186 | 186 | ||||||
comp | 2033249..2033755 | cds | 169 | peptidyl-prolyl isomerase | ||||||
comp | 2093327..2093977 | cds | 295 | 295 | 217 | protein-L-isoaspartate(D-aspartate) O-methyltransferase | ||||
2094273..2094346 | tgc | 81 | 81 | |||||||
2094428..2094502 | aac | 150 | 150 | |||||||
2094653..2094916 | cds | 88 | prevent-host-death protein | |||||||
comp | 2304404..2305834 | cds | 89 | 89 | 477 | divalent cation transporter | ||||
comp | 2305924..2306010 | ctc | 178 | 178 | ||||||
2306189..2306839 | cds | 217 | lipoate-protein ligase B | |||||||
2331183..2331521 | cds | 73 | 73 | 113 | hp | |||||
2331595..2331671 | atgj | 126 | 126 | |||||||
comp | 2331798..2332040 | cds | 81 | hp | ||||||
comp | 2411337..2411804 | cds | -72 | -72 | 156 | CreA | ||||
comp | 2411733..2411804 | Sig-pep | 202 | 202 | 24 | hp | ||||
comp | 2412007..2412083 | cac | 75 | 75 | ||||||
comp | 2412159..2413343 | cds | 395 | hp | ||||||
2729598..2731271 | cds | 449 | 449 | 558 | macrocin-O-methyltransferase | |||||
comp | 2731721..2731797 | atgf | 95 | |||||||
comp | 2731893..2732007 | 5s | 119 | 115 | ||||||
comp | 2732127..2734884 | 23s | 362 | 2758 | ||||||
comp | 2735247..2735322 | gca | 66 | 66 | ||||||
comp | 2735389..2735465 | atc | 184 | |||||||
comp | 2735650..2737126 | 16s | 606 | 606 | 1477 | |||||
comp | 2737733..2738110 | cds | 126 | hp | ||||||
comp | 2959802..2961874 | cds | 354 | 354 | 691 | chemotaxis sensory transducer protein | ||||
comp | 2962229..2962303 | gtc | 123 | 123 | ||||||
2962427..2963359 | cds | 311 | N-formylglutamate amidohydrolase | |||||||
comp | 3124836..3125033 | cds | 151 | 151 | 66 | preprotein translocase subunit SecE | ||||
comp | 3125185..3125260 | tgg | 343 | 343 | ||||||
comp | 3125604..3126794 | cds | 93 | 93 | 397 | elongation factor Tu | ||||
comp | 3126888..3126961 | gga | 27 | 27 | ||||||
comp | 3126989..3127074 | tac | 37 | 37 | ||||||
3127112..3128158 | cds | 57 | 57 | 349 | 23s rRNA (guanosine(2251)-2'-O)-methyltransferase RlmB | |||||
3128216..3128291 | aca | 127 | 127 | |||||||
3128419..3128652 | cds | 78 | hp | |||||||
comp | 3193350..3194507 | cds | 430 | 430 | 386 | acyltransferase | ||||
comp | 3194938..3195013 | ttc | 103 | 103 | ||||||
comp | 3195117..3195635 | cds | 173 | hp | ||||||
3320745..3322115 | cds | -1371 | -1371 | 457 | virulence protein | |||||
3320745..3320816 | Sig-pep | 1389 | 1389 | 24 | hp | |||||
comp | 3322206..3322281 | atgi | 60 | 60 | ||||||
comp | 3322342..3324432 | cds | 697 | RNA polymerase sigma factor RpoD | ||||||
comp | 3377932..3378114 | cds | 140 | 140 | 61 | hp | ||||
3378255..3378329 | acc | + | 165 | 165 | ||||||
3378495..3378569 | acc | 2 acc | 237 | 237 | ||||||
3378807..3379370 | cds | 234 | 234 | 188 | hp | |||||
3379605..3379681 | gac | 77 | 77 | |||||||
comp | 3379759..3380517 | cds | 253 | diguanylate phosphodiesterase | ||||||
comp | 3399207..3399494 | cds | 262 | 262 | 96 | hp | ||||
comp | 3399757..3399833 | ccg | 56 | 56 | ||||||
comp | 3399890..3400972 | cds | 361 | farnesyltranstransferase | ||||||
3490378..3491148 | cds | 84 | 84 | 257 | 2-phosphoglycolate phosphatase | |||||
3491233..3491307 | gtg | 407 | 407 | |||||||
3491715..3492080 | cds | 122 | hp | |||||||
comp | 3719367..3719753 | cds | 163 | 163 | 129 | hp | ||||
comp | 3719917..3719990 | ggg | 95 | 95 | ||||||
comp | 3720086..3720859 | cds | 258 | enoyl-ACP reductase | ||||||
3805869..3806813 | cds | 130 | 130 | 315 | inner-membrane translocator | |||||
comp | 3806944..3807058 | 5s | 116 | 115 | ||||||
comp | 3807175..3809932 | 23s | 362 | 2758 | ||||||
comp | 3810295..3810370 | gca | 66 | 66 | ||||||
comp | 3810437..3810513 | atc | 184 | |||||||
comp | 3810698..3812174 | 16s | 1227 | 1227 | 1477 | |||||
3813402..3814118 | cds | 239 | transposase | |||||||
comp | 3824154..3825854 | cds | 76 | 76 | 567 | phage integrase | ||||
comp | 3825931..3826007 | cgt | 387 | 387 | ||||||
3826395..3827531 | cds | 379 | hp | |||||||
4021982..4023163 | cds | 27 | 27 | 394 | diguanylate phosphodiesterase | |||||
comp | 4023191..4023277 | ttg | 224 | 224 | ||||||
4023502..4023855 | cds | 118 | hp | |||||||
comp | 4058818..4059117 | cds | 187 | 187 | 100 | hp | ||||
4059305..4059380 | gcg | 179 | 179 | |||||||
comp | 4059560..4060126 | cds | 189 | hp | ||||||
comp | 4105626..4107317 | cds | -114 | -114 | 564 | chemotaxis sensory transducer | ||||
comp | 4107204..4107317 | Sig-pep | 721 | 721 | 38 | hp | ||||
comp | 4108039..4108113 | acg | 148 | 148 | ||||||
4108262..4108843 | cds | 194 | D-alpha,beta-D-heptose 1,7-bisphosphate phosphatase | |||||||
comp | 4261100..4262038 | cds | 269 | 269 | 313 | thioredoxin-like protein | ||||
4262308..4262382 | ggc | 118 | 118 | |||||||
4262501..4263136 | cds | 212 | lysine exporter protein LysE/YggA |
rru cumuls[modifier | modifier le wikicode]
- Lien tableur: rru cumuls
opérons | Fréquences intercalaires tRNAs | Fréquences intercalaires cds | Fréquences aas cds chromosome | ||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
effectif | gammes | sans rRNAs | avec rRNAs | gammes | cds | gammes | cdsd | gammes | cdsa | gammes | cdsa 300 | ||
avec rRNA | opérons | 4 | 1 | 1 | 7 | 1 | 100 | 23 | 1 | 0 | |||
16atcgca235 | 1 | 20 | 50 | 6 | 40 | 200 | 17 | 30 | 3 | ||||
Id-atgf | 3 | 40 | 1 | 100 | 19 | 80 | 300 | 16 | 60 | 4 | |||
- | 60 | 150 | 20 | 120 | 400 | 17 | 90 | 12 | |||||
max a | 3 | 80 | 4 | 200 | 8 | 160 | 500 | 8 | 120 | 10 | |||
a doubles | 0 | 100 | 1 | 250 | 7 | 200 | 600 | 5 | 150 | 3 | |||
spéciaux | 0 | 120 | 300 | 9 | 240 | 700 | 2 | 180 | 4 | ||||
total aas | 11 | 140 | 350 | 3 | 280 | 800 | 0 | 210 | 5 | ||||
sans | opérons | 40 | 160 | 400 | 3 | 320 | 900 | 0 | 240 | 8 | |||
1 aa | 36 | 180 | 1 | 450 | 3 | 360 | 1000 | 0 | 270 | 4 | |||
max a | 2 | 200 | 500 | 0 | 400 | 1100 | 0 | 300 | 3 | ||||
a doubles | 2 | 1 | 10 | 3 | 35 | ||||||||
total aas | 44 | 4 | 4 | 95 | 0 | 91 | 91 | ||||||
total aas | 55 | ||||||||||||
remarques | |||||||||||||
avec jaune | moyenne | 119 | 66 | 208 | 292 | ||||||||
variance | 79 | 0 | 333 | 187 | |||||||||
sans jaune | moyenne | 148 | 237 | 140 | |||||||||
variance | 83 | 132 | 69 |
rru blocs[modifier | modifier le wikicode]
- Lien tableur: rru blocs
- Légende:
- sulfate sulfate transporter/antisigma-factor antagonist
- inner inner-membrane translocator
- macrocin macrocin-O-methyltransferase
- peptidase peptidase M23B
- hp Hypothetical protein
cds | 859 | 576 | sulfate | cds | 606 | 126 | hp |
16s | 184 | 1477 | 16s | 184 | 1477 | ||
atc | 66 | atc | 66 | ||||
gca | 362 | gca | 362 | ||||
23s | 119 | 2758 | 23s | 119 | 2758 | ||
5s | 96 | 115 | 5s | 95 | 115 | ||
atgf | 287 | atgf | 449 | ||||
cds | 78 | hp | cds | 558 | macrocin | ||
cds | -102 | 534 | peptidase | ||||
Sig-pep | 1212 | 34 | hp | cds | 1227 | 239 | transposase |
16s | 182 | 1477 | 16s | 184 | 1477 | ||
atc | 66 | atc | 66 | ||||
gca | 361 | gca | 362 | ||||
23s | 118 | 2758 | 23s | 116 | 2758 | ||
5s | 95 | 115 | 5s | 130 | 115 | ||
atgf | 573 | cds | 315 | inner | |||
cds | 1496 | hp |
rru remarques[modifier | modifier le wikicode]
- Remarques: Par rapport aux rickettsia rtb et rpl, les intercalaires élevés sont rares.
- @ Les intercalaires élevés
- - il n’y a pas d’aas isolés et les mineurs des blocs à rRNAs sont normaux pour ces blocs, inférieurs à 573.
- - Pour les aas il n’y a que 5 intercalaires élevés entre 571-1389, et 2 dépassant à peine 400 pbs.
- - Pour les blocs à rRNAs il n’y a que 3 intercalaires franchement élevés, 1227 1212 859.
- @ Sig-pep, signal peptide.
- - Il y a 580 sig-peptide dans ce génome. Dans le tableau des opérons ce sont de petites séquences peptidiques de moins de 30 aas placsés au début du cds. D’où l’intercalaire négatif.
- - Dans le tableau sur les 7 seg-pep, 4 sont associés à des intercalaires élevés (voir tableau ci-dessous) et 3 à des intercalaires inférieurs à 219 pbs.
- @ Les intercalaires élevés
- Note: Les 4 blocs à rRNAs sont tous complets ayant atcgca en interne dont 3 ont atgf qui suit 5s. Aucun bloc ne contient un cds en interne.
- Séquences des doubles: Sur 40 blocs sans rRNAs seulement 4 ont 2 aas dont 2 ont un doublet, gcc et acc.
- Tableau des intercalaires
16s aas Sig-pep adresse intercalaire adresse intercalaire intercalaire 911398 1212-573 atgi 3322206 1389 1389 2735650 606-449 ccc 1960034 1062 1212 3810698 1227-130 tca 1998244 927 721 192528 859-257 acg 4108039 721 571 cca 1934224 571 3 <219 ttc 3194938 430 gtg 3491233 407
rru distribution[modifier | modifier le wikicode]
- Lien tableur: rru distribution
- Notes: gcc2 acc2
g1 | t1 | ||||||
---|---|---|---|---|---|---|---|
atgi | 1 | tct | tat | atgf | 3 | ||
att | act | aat | agt | ||||
ctt | cct | cat | cgc | ||||
gtt | gct | gat | ggt | ||||
ttc | 1 | tcc | 1 | tac | 1 | tgc | 1 |
atc | 4 | acc | 2 | aac | 1 | agc | 1 |
ctc | 1 | ccc | 1 | cac | 1 | cgt | 1 |
gtc | 1 | gcc | 2 | gac | 1 | ggc | 1 |
tta | 1 | tca | 1 | taa | tga | ||
ata | aca | 1 | aaa | 1 | aga | 1 | |
cta | 1 | cca | 1 | caa | 1 | cga | |
gta | 1 | gca | 4 | gaa | 1 | gga | 1 |
ttg | 1 | tcg | 1 | tag | tgg | 1 | |
atgj | 1 | acg | 1 | aag | 1 | agg | 1 |
ctg | 1 | ccg | 1 | cag | 1 | cgg | 1 |
gtg | 1 | gcg | 1 | gag | 1 | ggg | 1 |
alpha | >1aa | =1aa | -5s | +5s | -16s | +16s | total |
rru | 8 | 36 | 3 | 8 | 55 |
rru intercalaires entre cds[modifier | modifier le wikicode]
- Rhodospirillum rubrum ATCC 11170, 10.3.2020, NCBI [16]
- Note: Pour les génomes des annexes j'ai relevé les intercalaires entre tRNAs et entre ceux-ci et les cds qui leur sont adjacents. L'exemple est celui de rru du clade alpha. L'idée de départ de ces prélèvements est la recherche d'opérons formés de tRNA et de protéine comme dans le cas d'E.coli: l'intercalaire entre le tRNA et la protéine devrait être faible. Voir l'exemple d'eco (remarque @3) avec tac-tac-tpr et aca-tac-gga-acc-tufB.
rru les fréquences[modifier | modifier le wikicode]
- Lien tableur: rru intercalaires entre cds
- Légende: long, longueur en pbs, intercal pour intercalaire
- - fréquence-1 1 5 6 f, respectivement fréquence des intercalaires négatives à l'unité, positives à l'unité, par blocs de 5, par blocs de 10 jusqu'à 600 pbs et f pour finales. Ces fréquences servent à faire les diagrammes. La fréquence fréquencez est l'étendue à 1200 de la fréquence6 pour certains grands génomes.
- - cumul,% colonne à la droite de frequence6, reprend les fréquences par plages et leurs pourcentages indiqués déjà dans la 1ère partie du tableau.
- - La couleur cyan des fréquences fréquence-1 et 1 sert à montrer leur périodicité ternaire.
- - intercaln intercalx, pour les intercalaires négatifs minimaux et intercalaires positifs maximaux.
- - colonne ADN pour la longueur totale du génome en pbs et intercals pour le total en pbs des intercalaires entre cds uniquement, d'après la méthode des prélèvements de NCBI du 10.3.20.
rru | intercalaires | total | % | intercalaires | moyenne | ecartype | plage | ADN | intercal | frequence5 | intercal | fréquencez |
---|---|---|---|---|---|---|---|---|---|---|---|---|
négatif | 683 | 18.0 | négatif | -8 | 15 | -73 à -1 | 4 352 825 | -1 | 683 | 610 | 1 | |
zéro | 13 | 0.3 | intercals | 0 | 13 | 620 | 0 | |||||
1 à 200 | 2368 | 62.5 | 0 à 200 | 78 | 58 | 429 144 | 5 | 180 | 630 | 5 | ||
201 à 370 | 535 | 14.1 | 201 à 370 | 268 | 46 | 9.9% | 10 | 109 | 640 | 6 | ||
371 à 600 | 139 | 3.7 | 371 à 600 | 453 | 60 | 15 | 155 | 650 | 1 | |||
601 à max | 48 | 1.3 | 601 à 995 | 733 | 105 | 20 | 84 | 660 | 4 | |||
total 3786 | <201 | 80.9 | total 3779 | 112 | 136 | -73 à 995 | 25 | 86 | 670 | 3 | ||
adresse | intercalx | intercal | fréquence1 | intercal | fréquence6 | cumul,% | intercal | fréquence-1 | 30 | 81 | 680 | 1 |
3818575 | 1469 | -1 | 683 | -70 | 8 | 0 | 13 | 35 | 54 | 690 | 2 | |
844364 | 995 | 0 | 13 | -60 | 5 | -1 | 81 | 40 | 56 | 700 | 1 | |
3816901 | 954 | 1 | 25 | -50 | 8 | -2 | 1 | 45 | 59 | 710 | 1 | |
3134490 | 938 | 2 | 34 | -40 | 8 | -3 | 0 | 50 | 63 | 720 | 0 | |
3477618 | 929 | 3 | 41 | -30 | 6 | min à -1 | -4 | 421 | 55 | 67 | 730 | 0 |
1097019 | 885 | 4 | 47 | -20 | 21 | 683 | -5 | 0 | 60 | 67 | 740 | 3 |
3856065 | 884 | 5 | 33 | -10 | 75 | 18.0% | -6 | 2 | 65 | 61 | 750 | 0 |
566184 | 881 | 6 | 20 | 0 | 565 | -7 | 5 | 70 | 52 | 760 | 1 | |
1833839 | 873 | 7 | 16 | 10 | 289 | -8 | 42 | 75 | 59 | 770 | 2 | |
3136049 | 866 | 8 | 27 | 20 | 239 | -9 | 0 | 80 | 52 | 780 | 3 | |
2475546 | 802 | 9 | 20 | 30 | 167 | -10 | 9 | 85 | 58 | 790 | 3 | |
93164 | 788 | 10 | 26 | 40 | 110 | -11 | 26 | 90 | 64 | 800 | 0 | |
409696 | 787 | 11 | 41 | 50 | 122 | -12 | 0 | 95 | 51 | 810 | 1 | |
400635 | 785 | 12 | 37 | 60 | 134 | -13 | 4 | 100 | 75 | 820 | 0 | |
1366462 | 777 | 13 | 28 | 70 | 113 | -14 | 13 | 105 | 49 | 830 | 0 | |
3456663 | 777 | 14 | 28 | 80 | 111 | -15 | 1 | 110 | 53 | 840 | 0 | |
3312945 | 771 | 15 | 21 | 90 | 122 | 1 à 100 | -16 | 3 | 115 | 49 | 850 | 0 |
550038 | 769 | 16 | 16 | 100 | 126 | 1533 | -17 | 14 | 120 | 45 | 860 | 0 |
2493887 | 767 | 17 | 25 | 110 | 102 | 41% | -18 | 0 | 125 | 44 | 870 | 1 |
1410707 | 755 | 18 | 16 | 120 | 94 | -19 | 5 | 130 | 45 | 880 | 1 | |
1423514 | 739 | 19 | 13 | 130 | 89 | -20 | 7 | 135 | 48 | 890 | 3 | |
2688282 | 734 | 20 | 14 | 140 | 92 | -21 | 1 | 140 | 44 | 900 | 0 | |
3627241 | 732 | 21 | 13 | 150 | 83 | -22 | 1 | 145 | 41 | 910 | 0 | |
2706640 | 702 | 22 | 20 | 160 | 87 | -23 | 2 | 150 | 42 | 920 | 0 | |
3937050 | 697 | 23 | 15 | 170 | 92 | -24 | 0 | 155 | 44 | 930 | 1 | |
1011650 | 686 | 24 | 17 | 180 | 62 | -25 | 2 | 160 | 43 | 940 | 1 | |
742860 | 682 | 25 | 21 | 190 | 68 | 1 à 200 | -26 | 4 | 165 | 42 | 950 | 0 |
3424033 | 675 | 26 | 10 | 200 | 66 | 2368 | -27 | 1 | 170 | 50 | 960 | 1 |
139185 | 669 | 27 | 18 | 210 | 45 | 62.5% | -28 | 0 | 175 | 31 | 970 | 0 |
880072 | 663 | 28 | 20 | 220 | 56 | -29 | 3 | 180 | 31 | 980 | 0 | |
1976647 | 662 | 29 | 17 | 230 | 47 | -30 | 0 | 185 | 28 | 990 | 0 | |
2640270 | 659 | 30 | 16 | 240 | 39 | -31 | 2 | 190 | 40 | 1000 | 1 | |
90214 | 657 | 31 | 10 | 250 | 39 | -32 | 1 | 195 | 39 | 1010 | 0 | |
961964 | 656 | 32 | 14 | 260 | 43 | 664 | 200 | 27 | 1020 | 0 | ||
1209394 | 652 | 33 | 10 | 270 | 33 | 0 à 200 | reste | 32 | 205 | 19 | 1030 | 0 |
2536913 | 650 | 34 | 13 | 280 | 33 | 2381 | total | 696 | 210 | 26 | 1040 | 0 |
2591508 | 639 | 35 | 7 | 290 | 31 | 215 | 25 | 1050 | 0 | |||
55947 | 637 | 36 | 10 | 300 | 29 | intercal | frequencef | 220 | 31 | 1060 | 0 | |
1786743 | 636 | 37 | 13 | 310 | 33 | 600 | 3738 | 225 | 25 | 1070 | 0 | |
2231609 | 636 | 38 | 11 | 320 | 22 | 620 | 1 | 230 | 22 | 1080 | 0 | |
3609912 | 633 | 39 | 10 | 330 | 15 | 640 | 11 | 235 | 18 | 1090 | 0 | |
3187318 | 631 | 40 | 12 | 340 | 19 | 660 | 5 | 240 | 21 | 1100 | 0 | |
reste | 2285 | 350 | 17 | 680 | 4 | 245 | 24 | 1110 | 0 | |||
total | 3786 | 360 | 14 | 201 à 370 | 700 | 3 | 250 | 15 | 1120 | 0 | ||
370 | 20 | 535 | 720 | 1 | 255 | 21 | 1130 | 0 | ||||
380 | 9 | 14.1% | 740 | 3 | 260 | 22 | 1140 | 0 | ||||
390 | 9 | 760 | 1 | 265 | 23 | 1150 | 0 | |||||
adresses | intercaln | décalage | long | 400 | 9 | 780 | 5 | 270 | 10 | 1160 | 0 | |
2068001 | -137 | shift2 | 1009 | 410 | 14 | 800 | 3 | 275 | 15 | 1170 | 0 | |
651352 | -122 | comp | 420 | 14 | 820 | 1 | 280 | 18 | 1180 | 0 | ||
2462962 | -120 | comp | 430 | 9 | 840 | 0 | 285 | 13 | 1190 | 0 | ||
1155908 | -106 | comp | 440 | 4 | 860 | 0 | 290 | 18 | 1200 | 0 | ||
2381188 | -104 | comp | 450 | 15 | 880 | 2 | 295 | 14 | reste | 1 | ||
3871151 | -104 | comp | 460 | 5 | 900 | 3 | 300 | 15 | total | 3786 | ||
4292550 | -73 | shift2 | 662 | 470 | 5 | 371 à 600 | 920 | 0 | 305 | 18 | ||
664620 | -70 | comp | 480 | 4 | 139 | 940 | 2 | 310 | 15 | |||
3822351 | -68 | shift2 | 682 | 490 | 4 | 3.7% | 960 | 1 | 315 | 10 | ||
3867765 | -65 | shift2 | 451 | 500 | 5 | 980 | 0 | 320 | 12 | |||
1091959 | -64 | shift2 | 1268 | 510 | 7 | 1000 | 1 | 325 | 8 | |||
3289914 | -62 | shift2 | 520 | 1 | 47 | 330 | 7 | |||||
1568904 | -61 | shift2 | 530 | 3 | 335 | 11 | ||||||
465562 | -59 | comp | 540 | 4 | 340 | 8 | ||||||
2309068 | -59 | shift2 | 550 | 7 | 345 | 12 | ||||||
780196 | -58 | shift2 | 560 | 2 | 350 | 5 | ||||||
2759874 | -55 | comp | 570 | 1 | 355 | 7 | ||||||
3267314 | -53 | shift2 | 580 | 5 | 601 à max | 360 | 7 | |||||
210683 | -52 | shift2 | 590 | 1 | 48 | 365 | 7 | |||||
1365051 | -52 | shift2 | 600 | 2 | 1.3% | 370 | 13 | |||||
622208 | -50 | comp | reste | 48 | reste | 1 | reste | 187 | ||||
2342888 | -49 | comp | total | 3786 | total | 3786 | total | 3786 |
rru intercalaires positifs S+[modifier | modifier le wikicode]
- Lien tableur: rru intercalaires positifs S+
- Diagrammes 400: rru ade, diagramme 1-40: c+ rru c+ ade x+ rru x+ ade total, texte: ade.
- Légende: voir la légende de cvi.
rru | Sx+ | Sc+ | ||||||||||||
Poly3 | -7 | -5 | -3 | 1 | R2 | flex x+ | comment. | -7 | -5 | -3 | 1 | R2 | flex c+ | comment. |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
1 à 400 | -13 | 90 | -272 | 53 | 818 | 231 | min50 | -34 | 275 | -804 | 94 | 878 | 270 | min40 |
31 à 400 | 12 | -97 | 135 | 28 | 833 | 269 | 2 parties | 13 | -61 | -91 | 52 | 957 | 156 | 2 parties |
droite | -a | cste | - | R2 | note | R2’ | -a | cste | - | R2 | note | R2’ | ||
1 à 400 | 103 | 46 | - | 798 | dte | 20 | Sf | 181 | 62 | - | 739 | poly | 139 | SF |
31 à 400 | 86 | 41 | - | 797 | dte | 36 | tf | 137 | 50 | - | 916 | dte | 41 | tf |
- Légende du tableau corrélations et fréquences faibles
effectifs diagramme | corrélation x+ c+, 41-n | corrélation x+ c+, 1-n | |||||||||
gen | minima | x+ | c+ | total | 400 | 200 | 250 | diff | 200 | 250 | 400 |
---|---|---|---|---|---|---|---|---|---|---|---|
spl | min10 | 1071 | 2215 | 3286 | 884 | 735 | 784 | 49 | -353 | -202 | 172 |
rru | min40 | 874 | 2056 | 2930 | 829 | 193 | 611 | 418 | 722 | 792 | 861 |
mja | min30 | 406 | 1047 | 1453 | 776 | 326 | 571 | 245 | 844 | 857 | 881 |
1-30 ‰ | effectifs | 0 ‰ | <0 ‰ | effectifs 1-40 | corel | ||||||
1-30 x+ | 1-30 c+ | x+/c+ | x | c | x | c | x- | c- | x+ | c+ | x+/c+ |
37 | 270 | 0.14 | 1313 | 2900 | 1 | 6 | 9 | 143 | 69 | 683 | -342 |
169 | 266 | 0.64 | 1037 | 2749 | 1 | 4 | 71 | 222 | 175 | 630 | 17 |
239 | 405 | 0.59 | 495 | 1234 | 20 | 9 | 113 | 132 | 113 | 474 | 502 |
- Diagrammes 400: rru ade, diagramme 1-40: c+ rru c+ ade x+ rru x+ ade total, texte: ade.
- Résumé: Ici je ne compare que les 2 génomes rru et ade en sachant que pmg est semblable à ade. Car rru et ade se ressemblent beaucoup avec des effectif des diagrammes 400 presque égaux, 2930 contre 3471, et un rapport des fréquences faibles c+/x+ aussi presque égaux, 0.64 contre 0.66. Par contre les corrélations à 41-250 sont très différentes, 611 contre 758.
- - La forme des courbes 400: Les 4 courbes de rru sont identiques une à une aux 4 courbes de ade, seules les forces des courbes tildes 31-400 diffèrent, elles sont fortes pour ade, tF, et faibles pour rru, tf.
- Les 2 courbes, c+ 1-400 rru ade, sont SF avec R2’ 139 232.
- Les 2 courbes, x+ 1-400 rru ade, sont Sf avec R2’ 20 39.
- Les 2 courbes rru 31-400 sont tf avec R2’ x+ à 31 et c+ à 41. Les courbes sont presque des droites mais toujours avec des renflements en 1ère partie.
- Les 2 courbes ade 31-400 sont tF avec R2’ x+ à 67 et c+ à 103 avec 2 parties nettes.
- Les points d’inflexion sont compris entre 230 et 271 sauf pour rru c+ 31-400 avec 156 et ade c+ 31-400 avec -507.
- - Les corrélations des courbes 400: C’est la différence la plus importante entre les 2 génômes.
- Chez ade la corrélation 41-250, de 758 chute à 624 pour 41-200 avec une différence de 134. Et rru en parallèle passe de 611 à 193 avec une différence de 418.
- Les 3 corrélations 1-n de ade tournent autour de 900 alors que celles de rru sont plutôt négatives -353 -202 172.
- - Les fréquences faibles 1-30:
- Elles sont du même ordre de grandeur et dans le même rapport x+/c+: 169/266 pour rru et 221/335 pour ade, donnant les rapports respectifs 0.66 0.64.
- Elles sont réparties sur les 3 fréquences 10 20 30 dans les 2 génomes.
- Les minima des fréquences faibles: elles sont bien prononcées mais plus chez ade que chez rru.
- Les fréquences des zéros sont faibles mais plus élevées chez ade avec 14‰ que chez rr avec 5‰.
- Les fréquences négatives sont réparties entre x- et c- de la même façon chez les 2 génômes: 72/234 pour ade et 71/222 pour rru
- - La forme des courbes 1-40:
- La courbe c+1-40: avec un effectif élevé de 876 pour ade contre 630 pour rru, les 2 courbes sont très proches de la courbe du total. Cependant les sommets à 2 et 10 de rru sont déplacés à 4 et 12 chez ade.
- La courbe x+1-40: Les 2 courbes diffèrent du modèle c+ 1-40 et entre elles:
- + La courbe de rru, avec un effectif de 175, n’a pas le maximum à la fréquence 2 du modèle par contre elle a le minimum à 6 et la bosse à 10 comme lui. La bosse du 10 est suivie par un plateau et non par une pente comme le modèle.
- + La courbe de ade, avec un effectif de 304, a le maximum à la fréquence 3 du modèle par contre le minimum à 6 devient une bosse et la bosse du 11 est un creux profond. La bosse du 11 du modèle est remplacée par une forte bosse à 17.
- - Les corrélations des courbes 1-40:
- La corrélation x+/c+ de rru à 17 est quasiment nulle et va de pair avec les coorélations négatives des courbes 400 des 3 plages de fréquences 1-n.
- La corrélation x+/c+ de ade à 459 est moyenne et va de pair avec les coorélations élevées des courbes 400 des 3 plages de fréquences 1-n.
- - La forme des courbes 400: Les 4 courbes de rru sont identiques une à une aux 4 courbes de ade, seules les forces des courbes tildes 31-400 diffèrent, elles sont fortes pour ade, tF, et faibles pour rru, tf.
rru intercalaires négatifs S-[modifier | modifier le wikicode]
- Lien tableur: rru intercalaires négatifs S-
- Légende:
- Les intercalaires négatifs: j'ai dénombré ces intercaalires avec les brins complement/direct. Ensuite j'ai cumulé les intercalaires négatifs entre 2 brins différents à part, un continu ou complement suivi du brin inverse (comp'), et entre 2 brins continus d'autre part, 2 direct ou 2 complement. Je ne fournis ici que le résultat pour le tableur.
rru autres intercalaires[modifier | modifier le wikicode]
- Lien tableur: rru autres intercalaires
- Légende:
- - comp, le gène est sur le brin complement
- - deb, fin sont respectivement dans le sens des adresses croissantes, le cds avant le 1er tRNA et le cds après le dernier tRNA du bloc.
- Totaux: 11 regulatory 2 ncRNA 1 tmRNA 11 repeat_region
tRNA-cds tRNA-tRNA autres-cds total 160 c+ x+ x- c+ x+ c- c+ x+ c- 50 38 23 28 20 159 1 ac+
|
|
|
rru intercalaires tRNA[modifier | modifier le wikicode]
- Lien tableur: rru intercalaires tRNA
- Légende:
- - comp', l'intercalaire est entre un gène comp (sur le complément) et un gène sur le brin direct. Continu les 2 gènes sont sur le même brin.
- - deb, fin sont les intercalaires des cds du tableau précédent, autres intercalaires: respectivement dans le sens des adresses croissantes, le cds avant le 1er tRNA et le cds après le dernier tRNA du bloc.
- Cumuls comp'+continu du tableau
deb fin total <201 25 29 54 total 41 42 83 taux 61% 69% 65%
|
|
rru intercalaires rRNA[modifier | modifier le wikicode]
- Voir la présentation des blocs à rRNA dans le chapitre rru blocs de l'étude préliminaire. A comparer avec le tableau rru autres intercalaires.
- Remarque: Quand le 16s n'est pas précédé de tRNAs l'intercalaire cds-16s est élevé, pour le 4ème bloc il est ici de 1227 pbs. L'intercalaire cds-bloc de l'autre côté du bloc est beaucoup plus faible, ici 130 pbs. Les 3 autres blocs ont un aa après le 5s et conserve la même orientation. Cette orientation est quasiment générale chez tous les génomes que j'ai étudié ici. Je l'ai notée dans les chapitres génome-bloc de chaque génome.
- Note: J'ai supposé souvent que les blocs à tRNA sans rRNA sont aussi orientés de l'intercalaire le plus grand au plus petit. Dans rru cumuls et de même pour les autres génomes, j'ai noté cette orientation dans la colonne cdsd, pour cds dirigé. Je n'ai conservé pour les calculs que le plus petit intercalaire des 2 cds bordant le bloc. L'idée était que cette orientation provoquait la création du cds en fin de bloc. Ces cds sont souvent de petites protéines et souvent hypothétiques. Aussi je présente ci-dessous la transformation deb-fin, du chapitre précédent, qui est imposée par l'adressage en intercalaire plus grand et plus petit.
deb fin tri grand petit* tri grand* petit 163 253 17 396 12 16 85 63 37 299 37 224 27 30 90 60 147 136 2 299 37 8 115 83 257 319 6 224 43 11 117 71 406 98 33 262 56 23 126 73 224 43 28 127 57 28 127 57 92 141 30 90 60 13 131 116 115 83 16 85 63 7 141 92 239 170 15 284 70 3 147 136 217 86 11 117 71 14 150 98 71 117 23 126 73 35 163 95 283 139 24 202 75 27 166 93 116 131 32 234 77 22 178 89 98 150 8 115 83 20 186 123 284 70 34 407 84 38 187 179 85 63 10 217 86 24 202 75 12 396 22 178 89 18 215 175 175 215 7 141 92 10 217 86 164 261 27 166 93 37 224 27 123 186 35 163 95 6 224 43 295 150 5 406 98 32 234 77 89 178 14 150 98 31 237 140 73 126 29 430 103 9 239 170 202 75 36 387 103 1 253 163 354 171 13 131 116 19 261 164 151 343 40 269 118 33 262 56 93 166 20 186 123 40 269 118 57 127 3 147 136 12 283 139 430 103 12 283 139 15 284 70 90 60 31 237 140 21 295 150 140 237 39 721 148 2 299 37 234 77 21 295 150 4 319 257 262 56 26 343 151 26 343 151 84 407 1 253 163 25 354 171 163 95 19 261 164 36 387 103 103 387 9 239 170 17 396 12 27 224 25 354 171 5 406 98 187 179 18 215 175 34 407 84 721 148 38 187 179 29 430 103 269 118 4 319 257 39 721 148
- Comparaison cds-cds tRNA-cds: deb fin, c'est l'ordre des adresses et grand petit l'ordre après réorientation. Leur pourcentage est calculé par rapport à la colonne, c'est à dire la moitié du total des tRNA-cds. Voir le tableau des cds-cds de la bactérie rru, et les doublets tRNA-cds ci-dessus.
alpha cds total total <0 0-200 201-370 371-600 >600 deb fin grand petit rru cds-cds 3,854 3786 683 2381 535 139 48 rru cds ‰ 180 628 141 37 13 rru tRNA ‰ 0 675 250 62.5 12.5 625 725 375 975 rru tRNA 80 54 20 5 1 25 29 15 39
- Calculs: voir les détails
alpha cds total total <0 0-200 reste cds≥0 bornes p q tRNAs rru cds-cds 3 854 3786 683 2381 722 3103 petit 0,767 0,233 40 rru cds ‰ 180 767 233 34,972 p2 2pq 1-q2 q2 rru tRNA 80 54 26 40,697 0,589 0,357 0,946 0,054 calculs proba effect attendu plage 2σ grand varq varp attendus petit 0,767 39 37,8 35 – 41 2,9 17,327 nq2(1-q2) np2(1-p2) petit grand grand 0,233 15 23,6 17 – 30 6,2 29,775 2,048 9,685 37,834 23,551
Ochrobactrum anthropi ATCC 49188[modifier | modifier le wikicode]
oan opérons[modifier | modifier le wikicode]
- Lien tableur: oan opérons
- Liens: gtRNAdb [17], NCBI [18], génome [orgn]
- Phylogénie: Bacteria; Proteobacteria; Alphaproteobacteria; Rhizobiales; Brucellaceae; Ochrobactrum.
- Légende: cdsa: cds aas, cdsd: cds dirigé
56.1%GC | 27.12.19 Paris | 61 | doubles | intercal | cds | aa | avec aa | cdsa | cdsd | protéines |
---|---|---|---|---|---|---|---|---|---|---|
chromosom1 | ||||||||||
34057..34446 | cds | 224 | 224 | 130 | TIGR02300 family protein | |||||
34671..34746 | gcc | @1 | -40 | -40 | ||||||
34707..35480 | cds | 258 | glutathione S-transferase family protein | |||||||
223549..224394 | cds | 164 | 164 | 282 | 3'(2'),5'-bisphosphate nucleotidase CysQ | |||||
224559..224635 | ccg | 109 | 109 | |||||||
comp | 224745..225806 | cds | 354 | site-specific integrase | ||||||
comp | 337757..338197 | cds | 158 | 158 | 147 | DMT family transporter | ||||
comp | 338356..338431 | ttc | 171 | 171 | ||||||
comp | 338603..338818 | cds | 72 | DNA gyrase inhibitor YacG | ||||||
comp | 344419..344598 | cds | 147 | 147 | 60 | hp | ||||
344746..344820 | acc | 397 | 397 | |||||||
345218..346030 | cds | 271 | DUF2189 domain-containing protein | |||||||
comp | 351922..353328 | cds | 167 | 167 | 469 | deoxyribodipyrimidine photo-lyase | ||||
comp | 353496..353572 | cgt | 159 | 159 | ||||||
comp | 353732..355285 | cds | 518 | HAMP domain-containing histidine kinase | ||||||
comp | 725472..726479 | cds | 219 | 219 | 336 | glycosyltransferase family 4 protein | ||||
726699..726773 | caa | 61 | 61 | |||||||
comp | 726835..727413 | cds | 193 | hp | ||||||
comp | 934613..934987 | cds | 333 | 333 | 125 | transposase | ||||
comp | 935321..935397 | agg | 114 | 114 | ||||||
comp | 935512..936675 | cds | 388 | amidohydrolase | ||||||
1049919..1051202 | cds | 24 | 24 | 428 | cystathionine gamma-synthase family protein | |||||
comp | 1051227..1051311 | ttg | @2 | 593 | 593 | |||||
comp | 1051905..1053539 | cds | 545 | phosphoethanolamine transferase | ||||||
comp | 1081066..1083021 | cds | 998 | 998 | 652 | M23 family metallopeptidase | ||||
1084020..1085508 | 16s | 268 | 1489 | |||||||
1085777..1085853 | atc | 11 | 11 | |||||||
1085865..1085940 | gca | 39 | 39 | |||||||
>comp | 1085980..1086168 | cds | @3 | 38 | 38 | 63 | P-hp | |||
1086207..1089125 | 23s | 186 | 2919 | |||||||
1089312..1089426 | 5s | 54 | 115 | |||||||
1089481..1089557 | atgf | 363 | 363 | |||||||
1089921..1090091 | cds | 57 | LysR family transcriptional regulator | |||||||
1096454..1096912 | cds | 7 | 7 | 153 | hp | |||||
comp | 1096920..1097009 | tcg | 352 | 352 | ||||||
1097362..1097751 | cds | 130 | 50S ribosomal protein L21 | |||||||
1311344..1311823 | cds | 211 | 211 | 160 | hp | |||||
1312035..1312109 | gag | 88 | 88 | |||||||
1312198..1312467 | cds | 90 | hp | |||||||
1344750..1345565 | cds | 677 | 677 | 272 | IclR family transcriptional regulator | |||||
1346243..1347731 | 16s | 268 | 1489 | |||||||
1348000..1348076 | atc | 11 | 11 | |||||||
1348088..1348163 | gca | 39 | 39 | |||||||
>comp | 1348203..1348391 | cds | 38 | 38 | 63 | P-hp | ||||
1348430..1351348 | 23s | 186 | 2919 | |||||||
1351535..1351649 | 5s | 54 | 115 | |||||||
1351704..1351780 | atgf | 360 | 360 | |||||||
1352141..1353082 | cds | 314 | LysR family transcriptional regulator | |||||||
1354558..1355604 | cds | 85 | 85 | 349 | polysaccharide deacetylase family protein | |||||
comp | 1355690..1355764 | ggc | 136 | 136 | ||||||
comp | 1355901..1357280 | cds | 460 | MFS transporter | ||||||
comp | 1386666..1387982 | cds | 819 | 819 | 439 | hp | ||||
comp | 1388802..1388891 | tcc | 374 | 374 | ||||||
1389266..1389589 | cds | 108 | hp | |||||||
comp | 1405236..1405859 | cds | 139 | 139 | 208 | 5,6-dimethylbenzimidazole synthase | ||||
comp | 1405999..1406085 | ctg | 146 | 146 | ||||||
comp | 1406232..1406852 | cds | 207 | 2,3-bisphosphoglycerate-dependent phosphoglycerate mutase | ||||||
comp | 1604615..1604854 | cds | 26 | 26 | 80 | hp | ||||
comp | 1604881..1604958 | atgj | 10 | 10 | ||||||
comp | 1604969..1605214 | cds | 82 | hp | ||||||
1639492..1640289 | cds | -44 | -44 | 266 | hp | |||||
comp | 1640246..1640322 | atgj | 55 | 55 | ||||||
1640378..1640572 | cds | 65 | hp | |||||||
comp | 1778816..1779571 | cds | 385 | 385 | 252 | SIMPL domain-containing protein | ||||
1779957..1780033 | atgi | 265 | 265 | |||||||
1780299..1780844 | cds | 182 | sigma-70 family RNA polymerase sigma factor | |||||||
> | 1945985..1946374 | cds | 721 | 721 | 130 | P-hp | ||||
comp | 1947096..1947171 | aag | -38 | -38 | ||||||
comp | 1947134..1947319 | cds | 62 | hp | ||||||
comp | 2014813..2015097 | cds | 103 | 103 | 95 | DUF2218 domain-containing protein | ||||
comp | 2015201..2015275 | gaa | + | 146 | 146 | |||||
comp | 2015422..2015496 | gaa | 2 gaa | 200 | 200 | |||||
comp | 2015697..2016962 | cds | 422 | DUF882 domain-containing protein | ||||||
comp | 2040234..2040453 | cds | 91 | 91 | 73 | hp | ||||
2040545..2040629 | tac | 24 | 24 | |||||||
2040654..2040727 | gga | 6 | 6 | |||||||
comp | 2040734..2040916 | cds | -50 | -50 | 61 | hp | ||||
2040867..2042042 | cds | 65 | 65 | 392 | elongation factor Tu | |||||
2042108..2042183 | tgg | 420 | 420 | |||||||
2042604..2042804 | cds | 67 | preprotein translocase subunit SecE | |||||||
2168416..2168658 | cds | 28 | 28 | 81 | PepSY domain-containing protein | |||||
comp | 2168687..2168760 | ggg | 289 | 289 | ||||||
2169050..2169946 | cds | 299 | lipid kinase | |||||||
comp | 2244184..2245050 | cds | 112 | 112 | 289 | mechanosensitive ion channel | ||||
comp | 2245163..2245248 | tta | 200 | 200 | ||||||
2245449..2246705 | cds | 419 | threonine ammonia-lyase IlvA | |||||||
2267888..2268835 | cds | 305 | 305 | 316 | patatin family protein | |||||
2269141..2269225 | ctc | 66 | 66 | |||||||
comp | 2269292..2270185 | cds | 298 | tyrosine-type recombinase/integrase | ||||||
2332394..2333530 | cds | 393 | 393 | 379 | glycosyltransferase family 2 protein | |||||
comp | 2333924..2334000 | cgg | 169 | 169 | ||||||
comp | 2334170..2335792 | cds | 541 | ABC-F family ATP-binding cassette domain-containing protein | ||||||
comp | 2339396..2340514 | cds | 1650 | 1650 | 373 | porin | ||||
comp | 2342165..2342239 | gtg | 178 | 178 | ||||||
comp | 2342418..2344424 | cds | 669 | murein L,D-transpeptidase | ||||||
comp | 2369668..2370441 | cds | 152 | 152 | 258 | NAD kinase | ||||
2370594..2370669 | aca | 987 | 987 | |||||||
comp | 2371657..2372076 | cds | 140 | SUF system Fe-S cluster assembly protein | ||||||
comp | 2442729..2443145 | cds | 299 | 299 | 139 | hp | ||||
comp | 2443445..2443519 | atgf | 70 | 70 | ||||||
<comp | 2443590..2443799 | cds | 70 | helix-turn-helix domain-containing protein | ||||||
comp | 2449947..2451311 | cds | 156 | 156 | 455 | tyrosine-type recombinase/integrase | ||||
comp | 2451468..2451550 | cta | 236 | 236 | ||||||
comp | 2451787..2452356 | cds | 190 | hp | ||||||
comp | 2548914..2550098 | cds | 513 | 513 | 395 | alpha/beta hydrolase | ||||
comp | 2550612..2550688 | gac | + | 245 | 245 | |||||
comp | 2550934..2551010 | gac | 2 gac | 328 | 328 | |||||
2551339..2551956 | cds | 206 | TetR/AcrR family transcriptional regulator | |||||||
2604616..2605908 | cds | 824 | 824 | 431 | FAD-binding oxidoreductase | |||||
comp | 2606733..2606808 | gta | 264 | 264 | ||||||
comp | 2607073..2607996 | cds | 308 | sugar kinase | ||||||
2641040..2641360 | cds | 97 | 97 | 107 | YnfA family protein | |||||
2641458..2641534 | ccc | 94 | 94 | |||||||
2641629..2642357 | cds | 243 | SDR family oxidoreductase | |||||||
2696299..2697183 | cds | 54 | 54 | 295 | transcriptional regulator GcvA | |||||
comp | 2697238..2697314 | aga | 123 | 123 | ||||||
comp | 2697438..2697743 | cds | 156 | 156 | 102 | ETC complex I subunit | ||||
comp | 2697900..2697976 | cca | 186 | 186 | ||||||
2698163..2698309 | cds | 49 | hp | |||||||
comp | 2771579..2772697 | cds | 584 | 584 | 373 | porin | ||||
2773282..2773372 | agc | 203 | 203 | |||||||
2773576..2774643 | cds | 356 | porin | |||||||
chromosom2 | ||||||||||
149537..151504 | cds | 355 | 355 | 656 | selenocysteine-specific translation elongation factor | |||||
151860..151955 | tga | 14 | 14 | |||||||
comp | 151970..152605 | cds | 212 | lipase | ||||||
comp | 298403..299422 | cds | 300 | 300 | 340 | TerC family protein | ||||
comp | 299723..299796 | cag | 361 | 361 | ||||||
comp | 300158..300460 | cds | 101 | DUF1127 domain-containing protein | ||||||
455428..456111 | cds | 713 | 713 | 228 | FkbM family methyltransferase | |||||
456825..458313 | 16s | 268 | 1489 | |||||||
458582..458658 | atc | 11 | 11 | |||||||
458670..458745 | gca | 39 | 39 | |||||||
>comp | 458785..458973 | cds | 38 | 38 | 63 | P-hp | ||||
459012..461930 | 23s | 186 | 2919 | |||||||
462117..462231 | 5s | 54 | 115 | |||||||
462286..462362 | atgf | -44 | -44 | |||||||
comp | 462319..463974 | cds | 552 | recombinase family protein | ||||||
comp | 572059..572721 | cds | 545 | 545 | 221 | response regulator transcription factor | ||||
comp | 573267..573357 | other | @4 | 620 | 620 | |||||
comp | 573978..575285 | cds | 436 | SidA/IucD/PvdA family monooxygenase | ||||||
comp | 611464..611742 | cds | 88 | 88 | 93 | hp | ||||
comp | 611831..611905 | ggc | 387 | 387 | ||||||
612293..612814 | cds | 174 | prolyl-tRNA synthetase associated domain-containing protein | |||||||
991265..991999 | cds | 217 | 217 | 245 | alpha/beta hydrolase | |||||
comp | 992217..992306 | tca | 323 | 323 | ||||||
992630..992884 | cds | 85 | DUF2171 domain-containing protein | |||||||
comp | 1031528..1032946 | cds | 607 | 607 | 473 | PepSY domain-containing protein | ||||
comp | 1033554..1033629 | aaa | 327 | 327 | ||||||
1033957..1035651 | cds | 565 | membrane protein | |||||||
1067405..1068742 | cds | 131 | 131 | 446 | DNA polymerase IV | |||||
1068874..1068947 | tgc | 739 | 739 | |||||||
1069687..1069905 | cds | 73 | hp | |||||||
1081639..1082031 | cds | 103 | 103 | 131 | hp | |||||
comp | 1082135..1082209 | aac | 168 | 168 | ||||||
1082378..1082653 | cds | 92 | hp | |||||||
comp | 1333375..1333587 | cds | 209 | 209 | 71 | hp | ||||
comp | 1333797..1333873 | cac | 352 | 352 | ||||||
1334226..1337393 | cds | 1056 | PAS domain S-box protein | |||||||
1473437..1474405 | cds | 269 | 269 | 323 | nitronate monooxygenase | |||||
1474675..1474750 | acg | 156 | 156 | |||||||
>comp | 1474907..1475239 | cds | 111 | DNA adenine methylase | ||||||
comp | 1597496..1597666 | cds | 363 | 363 | 57 | LysR family transcriptional regulator | ||||
comp | 1598030..1598106 | atgf | 54 | |||||||
comp | 1598161..1598275 | 5s | 186 | 115 | ||||||
comp | 1598462..1601380 | 23s | 38 | 38 | 2919 | |||||
< | 1601419..1601607 | cds | 39 | 39 | 63 | P-hp | ||||
comp | 1601647..1601722 | gca | 11 | 11 | ||||||
comp | 1601734..1601810 | atc | 268 | |||||||
comp | 1602079..1603567 | 16s | 743 | 743 | 1489 | |||||
1604311..1605192 | cds | 294 | ATPase | |||||||
1720169..1720531 | cds | 113 | 113 | 121 | response regulator | |||||
1720645..1720719 | gtc | 465 | 465 | |||||||
1721185..1721838 | cds | 218 | protein-L-isoaspartate(D-aspartate) O-methyltransferase |
oan cumuls[modifier | modifier le wikicode]
- Lien tableur: oan cumuls
opérons | Fréquences intercalaires tRNAs | Fréquences intercalaires cds | Fréquences aas cds chromosome | ||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
effectif | gammes | sans rRNAs | avec rRNAs | gammes | cds | gammes | cdsd | gammes | cdsa | gammes | cdsa 300 | ||
avec rRNA | opérons | 4 | 1 | 4 | 1 | 5 | 1 | 100 | 25 | 1 | 0 | ||
16atcgca-cds | 4 | 20 | 50 | 15 | 40 | 200 | 20 | 30 | 0 | ||||
- | 40 | 1 | 100 | 12 | 80 | 300 | 21 | 60 | 4 | ||||
- | 60 | 150 | 12 | 120 | 400 | 15 | 90 | 18 | |||||
max a | 3 | 80 | 200 | 15 | 160 | 500 | 11 | 120 | 8 | ||||
a doubles | 0 | 100 | 250 | 7 | 200 | 600 | 5 | 150 | 9 | ||||
spéciaux | 0 | 120 | 300 | 6 | 240 | 700 | 3 | 180 | 3 | ||||
total aas | 12 | 140 | 350 | 5 | 280 | 800 | 0 | 210 | 6 | ||||
sans | opérons | 45 | 160 | 1 | 400 | 12 | 320 | 900 | 0 | 240 | 4 | ||
1 aa | 42 | 180 | 450 | 1 | 360 | 1000 | 0 | 270 | 6 | ||||
max a | 2 | 200 | 500 | 1 | 400 | 1100 | 1 | 300 | 8 | ||||
a doubles | 2 | 1 | 16 | 0 | 35 | ||||||||
total aas | 48 | 3 | 4 | 107 | 0 | 101 | 101 | ||||||
total aas | 60 | ||||||||||||
remarques | 4 | ||||||||||||
avec jaune | moyenne | 138 | 11 | 258 | 256 | ||||||||
variance | 111 | 0 | 268 | 180 | |||||||||
sans jaune | moyenne | 174 | 218 | 150 | |||||||||
variance | 117 | 132 | 81 |
oan tRNA-cds[modifier | modifier le wikicode]
- Note: intercalaires prélevés de la colonne cds de oan opérons dans un bloc de tRNAs uniquement. Le début du bloc est dans l'ordre des adresses, deb intercalaire entre le cds et le 1er tRNA dd bloc, fin entre le dernier tRNA et le cds terminal. J'ai procédé, dans les colonnes petit et grand, à la réorientation des blocs d'après la constatation que les blocs à rRNA ont leurs cds de début et de fin sont orientés du cds-16s au 5s-tRNAs-cds, l'intercalaire cds-16s étant plus grands que l'intercalaire avec le cds terminal. En tête de colonne est le % du nombre des intercalaires inférieurs à 201 pbs.
oan 53 56 31 78 deb fin deb fin grand petit grand petit -44 55 224 -40 26 10 55 -44 7 352 721 -38 55 -44 224 -40 24 593 91 6 91 6 721 -38 26 10 26 10 97 94 91 6 28 289 355 14 123 54 352 7 54 123 -44 55 136 85 26 10 65 420 219 61 146 139 355 14 85 136 305 66 164 109 593 24 88 387 299 70 167 159 289 28 91 6 211 88 168 103 123 54 97 94 97 94 171 158 219 61 103 200 164 109 186 156 420 65 103 168 333 114 200 103 305 66 112 200 54 123 200 112 299 70 113 465 85 136 211 88 136 85 131 739 139 146 219 61 211 88 139 146 269 156 224 -40 387 88 147 397 167 159 236 156 97 94 152 987 103 168 269 156 168 103 156 236 393 169 289 28 200 103 156 186 158 171 299 70 164 109 158 171 1650 178 305 66 200 112 164 109 156 186 323 217 465 113 167 159 103 200 333 114 333 114 209 352 112 200 352 7 739 131 211 88 584 203 352 209 146 139 217 323 156 236 355 14 397 147 219 61 824 264 361 300 987 152 224 -40 385 265 385 265 269 156 269 156 28 289 387 88 186 156 299 70 217 323 393 169 236 156 300 361 607 327 397 147 171 158 305 66 513 328 420 65 167 159 333 114 7 352 465 113 393 169 355 14 209 352 513 328 1650 178 385 265 300 361 584 203 584 203 393 169 819 374 593 24 352 209 513 328 88 387 607 327 323 217 545 620 147 397 620 545 824 264 584 203 65 420 721 -38 385 265 607 327 113 465 739 131 361 300 721 -38 24 593 819 374 607 327 819 374 545 620 824 264 513 328 824 264 131 739 987 152 819 374 1650 178 152 987 1650 178 620 545
- Comparaison cds-cds tRNA-cds: deb fin, c'est l'ordre des adresses et grand petit l'ordre après réorientation. Leur pourcentage est calculé par rapport à la colonne, c'est à dire la moitié du total des tRNA-cds.
alpha cds total total <0 0-200 201-370 371-600 >600 deb fin grand petit oan 4,900 90 3 46 22 11 8 23 23 14 32 ‰ 33 511 244 122 89 511 511 311 711
oan blocs[modifier | modifier le wikicode]
- Lien tableur: oan blocs
- Légende:
- p-hp pseudo hypothetical protein
Constantes | |||
cds | intercal | cdsa | |
16s | 268 | 1489 | |
atc | 11 | ||
gca | 39 | ||
cds | 38 | 63 | p-hp |
23s | 186 | 2919 | |
5s | 54 | 115 | |
atgf | |||
cds | |||
Variations | |||
bloc 16s | intercal | cdsa | |
---|---|---|---|
1084020..1085508 | 998 | 652 | M23 family metallopeptidase |
363 | 57 | LysR family transcriptional regulator | |
1346243..1347731 | 677 | 272 | IclR family transcriptional regulator |
360 | 314 | LysR family transcriptional regulator | |
456825..458313 | 713 | 228 | FkbM family methyltransferase |
-44 | 552 | recombinase family protein | |
1602079..1603567 | 743 | 294 | ATPase |
363 | 57 | LysR family transcriptional regulator |
- Détails: tous les blocs sont identiques avec comp' pour le cds du mileieu (jaune). Comp' pour sens direct quand les autres sont complement et complement quand les autres sont directs. Trois cds externes sont comp' aussi. Les intercalaires entourant ces cds sont en gras et primés.
cds | 743’ | 713 | 677 | 998’ |
16s | 268 | 268 | 268 | 268 |
atc | 11 | 11 | 11 | 11 |
gca | 39’ | 39’ | 39’ | 39’ |
cds | 38’ | 38’ | 38’ | 38’ |
23s | 186 | 186 | 186 | 186 |
5s | 54 | 54 | 54 | 54 |
atgf | 363 | -44' | 360 | 363 |
cds |
oan remarques[modifier | modifier le wikicode]
- Remarques: Par rapport aux rickettsia rtb et rpl, les intercalaires très élevés existent, 3 contre 10, 987 988 1650. Ce génome est analogue à agr pour les cds internes aux blocs à RNAs.
- @ Des intercalaires négatifs avec les cds, 5, de -40 à -50 même dans un bloc à rRNAs, -44.
- @ Les intercalaires avec les cds élevés supérieurs à 500, 16 dont 4 pour les blocs. Voir le tableau des intercalaires ci-dessous .
- - Par rapport à agr analogue de ce génome, il y a nettement plus d’intercalaires élevés. Sur 45 blocs à aas il y a 12 intercalaires supérieurs à 500, contre 6 pour 38 aas chez agr.
- - Un seul cas où les 2 intercailaires d’un cluster sont supérieurs à 500, other, voir @4 ici.
- - Tous les 11 autres paires sont très assymétriques.
- - 2 intercalaires sur 3 entre aas sont du même ordre que la moyenne de ceux des cds sans jaune, 245 et 146 contre 174 pour la moyenne de ceux des cds.
- @ Les blocs à rRNAs sont identiques et ne diffèrent que par l’intercalaire du cds.
- - Le cds intra blocs est une pseudo protéine hypothétique, de faible taille, 63aas.
- - Ses intercalaires avec gca et 23s sont quasi identiques, très faibles et se situent dans la 1ère gamme des intercalaires cds.
- @ other, cela doit être un tRNA incomplet comme ceux des mitochondries
- Note: les cds intra bloc à rRNAs. Les 4 blocs sont identiques. Cela veut dire que le cds interne est bien du au processus de la création des blocs. Le fait que le cds soit un pseudo renforce encore l’hypothèse de la création de ce cds par le processus de création ou de conversion. Voir remarque @2 de agr remarques.
- Note du 3.10.20: le contrôle des 4 cds montre qu'ils sont absents au 31.7.20, date du NCBI.
- Séquences des doubles, quasiment pas de doubles, 42 solitaires sur 45 opérons et 2 doubles seulement, gac et gaa.
- Tableau des intercalaires
Intercalaires élevés Intercalaires moyens pbs adresse RNA pbs adresse tRNA 1650 2342165 gtg 465 1720645 gtc 987 2370594 aca 420 2042108 tgg 824 2606733 gta 397 344746 acc 819 1096920 tcg 387 611831 ggc 739 1068874 tgc 385 1779957 atgi 721 1947096 aag 363 1089481 atgf 620 573267 other isolé 363 1598030 atgf 607 1033554 aaa 352 1333797 cac 593 1051227 ttg 333 935321 agg 584 2773282 agc 323 992217 tca 513 2550612 gac 305 2269141 ctc 998 1084020 16s 743 1602079 16s 713 456825 16s 677 1346243 16s
oan distribution[modifier | modifier le wikicode]
- Lien tableur: oan distribution
g1 | t1 | ||||||
---|---|---|---|---|---|---|---|
atgi | 1 | tct | tat | atgf | 5 | ||
att | act | aat | agt | ||||
ctt | cct | cat | cgc | ||||
gtt | gct | gat | ggt | ||||
ttc | 1 | tcc | 1 | tac | 1 | tgc | 1 |
atc | 4 | acc | 1 | aac | 1 | agc | 1 |
ctc | 1 | ccc | 1 | cac | 1 | cgt | 1 |
gtc | 1 | gcc | 1 | gac | 2 | ggc | 2 |
tta | 1 | tca | 1 | taa | tga | 1 | |
ata | aca | 1 | aaa | 1 | aga | 1 | |
cta | 1 | cca | 1 | caa | 1 | cga | |
gta | 1 | gca | 4 | gaa | 2 | gga | 1 |
ttg | 1 | tcg | 1 | tag | tgg | 1 | |
atgj | 2 | acg | 1 | aag | 1 | agg | 1 |
ctg | 1 | ccg | 1 | cag | 1 | cgg | 1 |
gtg | 1 | gcg | gag | 1 | ggg | 1 | |
alpha | >1aa | =1aa | -5s | +5s | -16s | +16s | total |
oan | 6 | 41 | 4 | 8 | 59 |
Azospirillum brasilense Az39[modifier | modifier le wikicode]
abq opérons[modifier | modifier le wikicode]
- Lien tableur: abq opérons
- Liens: gtRNAdb [19], NCBI [20], génome [21]
- Phylogénie: Bacteria; Proteobacteria; Alphaproteobacteria; Rhodospirillales; Rhodospirillaceae; Azospirillum.
- Légende: cdsa: cds aas, cdsd: cds dirigé
68.45%GC | 29.12.19 Paris | 88 | doubles | intercal | cds | aa | avec aa | cdsa | cdsd | protéines |
---|---|---|---|---|---|---|---|---|---|---|
chromosome | ||||||||||
125527..126444 | cds | 127 | 127 | 306 | restriction endonuclease | |||||
comp | 126572..126647 | gcg | 206 | 206 | ||||||
126854..127138 | cds | 95 | YggT family protein | |||||||
comp | 163237..164982 | cds | 175 | 175 | 582 | hydrogenase maturation nickel metallochaperone HypA | ||||
165158..165234 | agg | 59 | 59 | |||||||
165294..166022 | cds | 243 | SDR family NAD(P)-dependent oxidoreductase | |||||||
comp | 188235..189860 | cds | 42 | 42 | 542 | glycosyltransferase | ||||
comp | 189903..189977 | acg | 81 | 81 | ||||||
comp | 190059..191987 | cds | 643 | DNA helicase RecQ | ||||||
comp | 250833..251111 | cds | 169 | 169 | 93 | hp | ||||
comp | 251281..251356 | gcc | 141 | 141 | ||||||
comp | 251498..251893 | cds | 132 | TIGR02300 family protein | ||||||
comp | 458142..458459 | cds | 209 | 209 | 106 | 50S ribosomal protein L21 | ||||
458669..458758 | tcg | 63 | 63 | |||||||
comp | 458822..459664 | cds | 281 | alpha/beta hydrolase fold domain-containing protein | ||||||
comp | 496776..497171 | cds | 162 | 162 | 132 | cupin domain-containing protein | ||||
comp | 497334..497420 | ttg | 137 | 137 | ||||||
497558..498085 | cds | 176 | disulfide bond formation protein B | |||||||
comp | 615937..616350 | cds | 121 | 121 | 138 | hp | ||||
comp | 616472..616548 | ccg | + | 206 | 206 | |||||
comp | 616755..616831 | ccg | 2 ccg | 109 | 109 | |||||
comp | 616941..617957 | cds | 339 | farnesyltranstransferase | ||||||
comp | 748703..749161 | cds | 38 | 38 | 153 | hp | ||||
comp | 749200..749275 | aca | 91 | 91 | ||||||
comp | 749367..750221 | cds | 144 | 144 | 285 | 23s rRNA (guanosine(2251)-2'-O)-methyltransferase RlmB | ||||
750366..750451 | tac | 60 | 60 | |||||||
750512..750585 | gga | 81 | 81 | |||||||
750667..751857 | cds | 153 | 153 | 397 | elongation factor Tu | |||||
752011..752086 | tgg | 69 | 69 | |||||||
752156..752353 | cds | 66 | preprotein translocase subunit SecE | |||||||
comp | 794457..795983 | cds | 296 | 296 | 509 | methyltransferase domain-containing protein | ||||
796280..796355 | aag | + | 76 | 76 | ||||||
796432..796507 | aag | 2 aag | 109 | 109 | ||||||
comp | 796617..797057 | cds | 147 | MaoC family dehydratase | ||||||
870412..872373 | cds | 159 | 159 | 654 | RNA polymerase sigma factor RpoD | |||||
872533..872608 | atgi | 5 | 5 | |||||||
comp | 872614..873093 | cds | 134 | 134 | 160 | GNAT family N-acetyltransferase | ||||
comp | 873228..873304 | cgt | 212 | 212 | ||||||
873517..874023 | cds | 169 | hp | |||||||
931962..933011 | cds | 68 | 68 | 350 | low specificity L-threonine aldolase | |||||
933080..933155 | gag | + | 38 | 38 | ||||||
933194..933269 | gag | 2 gag | 72 | 72 | ||||||
comp | 933342..934340 | cds | 333 | transglycosylase SLT domain-containing protein | ||||||
997881..998357 | cds | 246 | 246 | 159 | peptidoglycan-associated lipoprotein Pal | |||||
comp | 998604..998678 | acc | 175 | 175 | ||||||
comp | 998854..1000815 | cds | 654 | polysaccharide biosynthesis protein | ||||||
comp | 1164137..1165048 | cds | 159 | 159 | 304 | DUF3108 domain-containing protein | ||||
1165208..1165282 | gtg | + | 132 | 132 | ||||||
1165415..1165489 | gtg | 2 gtg | 231 | 231 | ||||||
1165721..1165885 | cds | 55 | hp | |||||||
1242416..1242919 | cds | 85 | 85 | 168 | MerR family transcriptional regulator | |||||
1243005..1243081 | ccc | 139 | 139 | |||||||
comp | 1243221..1244999 | cds | 593 | cyclic nucleotide-binding domain-containing protein | ||||||
comp | 1353398..1353895 | cds | 118 | 118 | 166 | hp | ||||
1354014..1354091 | cca | 49 | 49 | |||||||
1354141..1354437 | cds | 10 | 10 | 99 | ETC complex I subunit | |||||
1354448..1354524 | aga | 443 | 443 | |||||||
1354968..1355213 | cds | 82 | hp | |||||||
comp | 1370270..1370500 | cds | 196 | 196 | 77 | hp | ||||
comp | 1370697..1370772 | aac | @2 | 220 | 220 | |||||
comp | 1370993..1371066 | tgc | 218 | 218 | ||||||
1371285..1371941 | cds | 219 | protein-L-isoaspartate O-methyltransferase | |||||||
comp | 1427443..1427733 | cds | 236 | 236 | 97 | YkgJ family cysteine cluster protein | ||||
comp | 1427970..1428085 | 5s | 129 | 116 | ||||||
comp | 1428215..1430967 | 23s | 266 | 2753 | ||||||
comp | 1431234..1431309 | gca | 30 | 30 | ||||||
comp | 1431340..1431416 | atc | 108 | |||||||
comp | 1431525..1433015 | 16s | 779 | 779 | 1491 | |||||
1433795..1437778 | cds | 1328 | non-ribosomal peptide synthetase | |||||||
comp | 1576457..1577296 | cds | 243 | 243 | 280 | aldo/keto reductase | ||||
comp | 1577540..1577615 | gaa | 123 | 123 | ||||||
comp | 1577739..1579538 | cds | 600 | single-stranded-DNA-specific exonuclease RecJ | ||||||
comp | 1723089..1723457 | cds | 344 | 344 | 123 | NADH-quinone oxidoreductase subunit A | ||||
comp | 1723802..1723878 | gac | 164 | 164 | ||||||
comp | 1724043..1724117 | gta | 106 | 106 | ||||||
comp | 1724224..1724496 | cds | 91 | HU family DNA-binding protein | ||||||
comp | 1730385..1731719 | cds | 91 | 91 | 445 | trigger factor | ||||
comp | 1731811..1731895 | cta | 173 | 173 | ||||||
comp | 1732069..1733634 | cds | 522 | malonyl-CoA decarboxylase | ||||||
comp | 1733741..1735207 | cds | 129 | 129 | 489 | bifunctional ADP-dependent NAD(P)H-hydrate dehydratase/NAD(P)H-hydrate epimerase | ||||
comp | 1735337..1735412 | cac | + | 109 | 109 | |||||
comp | 1735522..1735597 | cac | 2 cac | 337 | 337 | |||||
1735935..1736273 | cds | 113 | P-II family nitrogen regulator | |||||||
1951126..1951752 | cds | 149 | 149 | 209 | nitrogen fixation protein NifQ | |||||
1951902..1951987 | tac | 74 | 74 | |||||||
comp | 1952062..1952424 | cds | 121 | hp | ||||||
1996903..1997244 | cds | 595 | 595 | 114 | hp | |||||
comp | 1997840..1997914 | atgj | 131 | 131 | ||||||
comp | 1998046..1999179 | cds | 378 | tRNA 2-thiouridine(34) synthase MnmA | ||||||
2086487..2088658 | cds | 156 | 156 | 724 | malate synthase G | |||||
comp | 2088815..2088889 | gtc | 234 | 234 | ||||||
2089124..2090002 | cds | 293 | N-formylglutamate amidohydrolase | |||||||
comp | 2303404..2303880 | cds | 414 | 414 | 159 | bacterioferritin | ||||
comp | 2304295..2304377 | tta | 406 | 406 | ||||||
comp | 2304784..2305029 | cds | 82 | hp | ||||||
2482875..2484518 | cds | 365 | 365 | 548 | recombinase family protein | |||||
comp | 2484884..2484974 | tcc | 120 | 120 | ||||||
comp | 2485095..2485898 | cds | 268 | alpha/beta hydrolase | ||||||
comp | 2640759..2641325 | cds | 149 | 149 | 189 | prolyl-tRNA synthetase associated domain-containing protein | ||||
2641475..2641549 | ggc | 688 | 688 | |||||||
2642238..2642915 | cds | 226 | dimethylmenaquinone methyltransferase | |||||||
comp | 2764482..2765567 | cds | 659 | 659 | 362 | hp | ||||
comp | 2766227..2766300 | ggg | 35 | 35 | ||||||
comp | 2766336..2766995 | cds | 220 | N-acetyltransferase | ||||||
2781933..2783774 | cds | 187 | 187 | 614 | EAL and GGDEF domain-containing protein | |||||
comp | 2783962..2784077 | 5s | 129 | 116 | ||||||
comp | 2784207..2786959 | 23s | 255 | 2753 | ||||||
comp | 2787215..2787290 | gca | 30 | 30 | ||||||
comp | 2787321..2787397 | atc | 108 | |||||||
comp | 2787506..2789006 | 16s | 496 | 496 | 1501 | |||||
comp | 2789503..2790207 | cds | 235 | phosphatase PAP2 family protein | ||||||
2843264..2843443 | cds | 77 | 77 | 60 | hp | |||||
comp | 2843521..2843597 | cgt | 170 | 170 | ||||||
2843768..2844268 | cds | 167 | xanthine phosphoribosyltransferase | |||||||
plasmide2 | ||||||||||
comp | 51090..51836 | cds | 481 | 481 | 249 | sigma-70 family RNA polymerase sigma factor | ||||
comp | 52318..52393 | tgg | 363 | 363 | ||||||
52757..53587 | cds | 277 | hp | |||||||
comp | 809229..810019 | cds | 870 | 870 | 264 | IS5 family transposase | ||||
comp | 810890..810966 | atgf | 96 | |||||||
comp | 811063..811178 | 5s | 127 | 116 | ||||||
comp | 811306..814058 | 23s | 266 | 2753 | ||||||
comp | 814325..814400 | gca | 30 | 30 | ||||||
comp | 814431..814507 | atc | 108 | |||||||
comp | 814616..816106 | 16s | 452 | 452 | 1491 | |||||
comp | 816559..817443 | cds | 295 | helix-turn-helix domain-containing protein | ||||||
plasmide4 | ||||||||||
196992..199346 | cds | 148 | 148 | 785 | mechanosensitive ion channel | |||||
199495..199581 | ctg | 30 | 30 | |||||||
199612..199687 | gcc | 188 | 188 | |||||||
199876..201333 | cds | 486 | hp | |||||||
237538..238578 | cds | 92 | 92 | 347 | response regulator | |||||
comp | 238671..238747 | cgg | 96 | 96 | ||||||
comp | 238844..239821 | cds | 326 | alpha/beta hydrolase | ||||||
comp | 257739..258470 | cds | 125 | 125 | 244 | lipoyl(octanoyl) transferase LipB | ||||
258596..258682 | ctc | 123 | 123 | |||||||
comp | 258806..259108 | cds | 101 | STAS domain-containing protein | ||||||
comp | 399367..400527 | cds | 278 | 278 | 387 | PQQ-dependent sugar dehydrogenase | ||||
comp | 400806..400921 | 5s | 129 | 116 | ||||||
comp | 401051..403803 | 23s | 255 | 2753 | ||||||
comp | 404059..404134 | gca | 30 | 30 | ||||||
comp | 404165..404241 | atc | 108 | |||||||
comp | 404350..405850 | 16s | 502 | 502 | 1501 | |||||
comp | 406353..406547 | cds | 65 | hp | ||||||
504531..504893 | cds | 82 | 82 | 121 | response regulator | |||||
504976..505051 | aac | 3 | 3 | |||||||
505055..505131 | gac | 4 | 4 | |||||||
505136..505210 | ggc | 102 | 102 | |||||||
comp | 505313..506080 | cds | 83 | 83 | 256 | helix-turn-helix transcriptional regulator | ||||
506164..506790 | cds | 202 | 202 | 209 | pyridoxamine 5'-phosphate oxidase | |||||
comp | 506993..507108 | 5s | 127 | 116 | ||||||
comp | 507236..509988 | 23s | 266 | 2753 | ||||||
comp | 510255..510330 | gca | 30 | 30 | ||||||
comp | 510361..510437 | atc | 110 | |||||||
comp | 510548..512038 | 16s | 615 | 615 | 1491 | |||||
512654..513568 | cds | 305 | lytic transglycosylase domain-containing protein | |||||||
comp | 588108..590768 | cds | 340 | 340 | 887 | bifunctional acetaldehyde-CoA/alcohol dehydrogenase | ||||
591109..591184 | ttc | 286 | 286 | |||||||
591471..592979 | cds | 503 | FAD-binding oxidoreductase | |||||||
plasmide5 | ||||||||||
86421..87089 | cds | 455 | 455 | 223 | RraA family protein | |||||
87545..87619 | ggc | 193 | 193 | |||||||
87813..88865 | cds | 351 | UDP-N-acetylglucosamine 4,6-dehydratase (inverting) | |||||||
plasmide1 | @3 | |||||||||
>comp | 115594..115896 | cds | 394 | 394 | 101 | P-IS5/IS1182 family transposase | ||||
comp | 116291..116367 | atgf | 96 | |||||||
comp | 116464..116579 | 5s | 129 | 116 | ||||||
comp | 116709..119461 | 23s | 255 | 2753 | ||||||
comp | 119717..119792 | gca | 30 | 30 | ||||||
comp | 119823..119899 | atc | 108 | |||||||
comp | 120008..121498 | 16s | 740 | 740 | 1491 | |||||
122239..123597 | cds | 453 | peptidoglycan DD-metalloendopeptidase family protein | |||||||
comp | 217550..218176 | cds | 123 | 123 | 209 | ribonuclease D | ||||
comp | 218300..218386 | ctg | 228 | 228 | ||||||
218615..219604 | cds | 330 | complex I NDUFA9 subunit family protein | |||||||
comp | 300477..301733 | cds | 472 | 472 | 419 | exonuclease subunit SbcD | ||||
302206..303696 | 16s | 108 | 1491 | |||||||
303805..303881 | atc | 30 | 30 | |||||||
303912..303987 | gca | 255 | ||||||||
304243..306995 | 23s | 129 | 2753 | |||||||
307125..307240 | 5s | 96 | 116 | |||||||
307337..307413 | atgf | 161 | 161 | |||||||
<comp | 307575..307805 | cds | 77 | p-ATP-binding protein | ||||||
comp | 466493..467710 | cds | 231 | 231 | 406 | site-specific integrase | ||||
comp | 467942..468031 | tca | 205 | 205 | ||||||
comp | 468237..468809 | cds | 191 | hp | ||||||
512242..512790 | cds | 136 | 136 | 183 | pantetheine-phosphate adenylyltransferase | |||||
512927..513002 | aaa | 209 | 209 | |||||||
513212..514036 | cds | 275 | DUF3618 domain-containing protein | |||||||
931813..933912 | cds | 79 | 79 | 700 | membrane protein | |||||
933992..934066 | caa | 382 | 382 | |||||||
comp | 934449..935270 | cds | 274 | hp | ||||||
comp | 948715..949743 | cds | 199 | 199 | 343 | Ppx/GppA family phosphatase | ||||
949943..950016 | cag | 246 | 246 | |||||||
comp | 950263..950829 | cds | 189 | IS3 family transposase | ||||||
> | 971260..971532 | cds | 493 | 493 | 91 | P-hp | ||||
comp | 972026..972119 | agc | 197 | 197 | ||||||
972317..972550 | cds | 78 | hp | |||||||
comp | 1302373..1303350 | cds | 166 | 166 | 326 | alpha-1,3-fucosyltransferase | ||||
comp | 1303517..1303592 | ttc | 98 | 98 | ||||||
comp | 1303691..1303876 | cds | 62 | DNA gyrase inhibitor YacG | ||||||
1349823..1350929 | cds | 145 | 145 | 369 | GNAT family N-acetyltransferase | |||||
comp | 1351075..1353828 | 23s | 262 | 2754 | ||||||
comp | 1354091..1355591 | 16s | @1 | 676 | 676 | 1501 | ||||
1356268..1356726 | cds | 153 | MarR family transcriptional regulator | |||||||
comp | 1441708..1443066 | cds | 153 | 153 | 453 | hp | ||||
1443220..1443294 | acc | 1 | 1 | |||||||
1443296..1443371 | gcg | 99 | 99 | |||||||
1443471..1443547 | gac | 44 | 44 | |||||||
1443592..1443666 | gtc | 1 | 1 | |||||||
1443668..1443741 | cag | 137 | 137 | |||||||
comp | 1443879..1446428 | cds | 850 | dipeptide ABC transporter ATP-binding protein | ||||||
1566394..1566612 | cds | 193 | 193 | 73 | hp | |||||
comp | 1566806..1566921 | 5s | 128 | 116 | ||||||
comp | 1567050..1569802 | 23s | 254 | 2753 | ||||||
comp | 1570057..1570132 | gca | 30 | 30 | ||||||
comp | 1570163..1570239 | atc | 94 | |||||||
comp | 1570334..1571834 | 16s | 444 | 444 | 1501 | |||||
comp | 1572279..1572707 | cds | 143 | DUF1489 domain-containing protein | ||||||
1723583..1724962 | cds | 94 | 94 | 460 | hp | |||||
comp | 1725057..1725143 | ctc | 475 | 475 | ||||||
1725619..1726311 | cds | 231 | FadR family transcriptional regulator | |||||||
1757680..1760568 | cds | 308 | 308 | 963 | PAS domain-containing protein | |||||
1760877..1760963 | ctg | 29 | 29 | |||||||
1760993..1761068 | gcc | 247 | 247 | |||||||
comp | 1761316..1761840 | cds | 175 | helix-turn-helix transcriptional regulator | ||||||
1854042..1855049 | cds | 135 | 135 | 336 | inorganic phosphate transporter | |||||
comp | 1855185..1855259 | ggc | 243 | 243 | ||||||
1855503..1858685 | cds | 1061 | AAA family ATPase | |||||||
>comp | 1883235..1883816 | cds | 210 | 210 | 194 | P-hp | ||||
1884027..1884102 | aac | 4 | 4 | |||||||
1884107..1884183 | gac | 32 | 32 | |||||||
comp | 1884216..1884821 | cds | 202 | hp |
abq cumuls[modifier | modifier le wikicode]
- Lien tableur: abq cumuls
opérons | Fréquences intercalaires tRNAs | Fréquences intercalaires cds | Fréquences aas cds chromosome | ||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
effectif | gammes | sans rRNAs | avec rRNAs | gammes | cds | gammes | cdsd | gammes | cdsa | gammes | cdsa 300 | ||
avec rRNA | opérons | 9 | 1 | 2 | 1 | 0 | 1 | 100 | 17 | 1 | 0 | ||
16atcgca235 | 5 | 20 | 3 | 50 | 7 | 40 | 200 | 29 | 30 | 0 | |||
Id-atgf | 3 | 40 | 3 | 8 | 100 | 19 | 80 | 300 | 24 | 60 | 2 | ||
16s23s | 1 | 60 | 2 | 150 | 26 | 120 | 400 | 18 | 90 | 9 | |||
max a | 3 | 80 | 1 | 200 | 20 | 160 | 500 | 8 | 120 | 11 | |||
a doubles | 0 | 100 | 1 | 250 | 18 | 200 | 600 | 8 | 150 | 8 | |||
spéciaux | 0 | 120 | 1 | 300 | 3 | 240 | 700 | 5 | 180 | 11 | |||
total aas | 19 | 140 | 1 | 350 | 4 | 280 | 800 | 2 | 210 | 9 | |||
sans | opérons | 51 | 160 | 0 | 400 | 4 | 320 | 900 | 2 | 240 | 6 | ||
1 aa | 38 | 180 | 1 | 450 | 4 | 360 | 1000 | 1 | 270 | 6 | |||
max a | 5 | 200 | 0 | 500 | 7 | 400 | 1100 | 1 | 300 | 8 | |||
a doubles | 5 | 2 | 9 | 1 | 46 | ||||||||
total aas | 68 | 17 | 8 | 121 | 0 | 116 | 116 | ||||||
total aas | 87 | ||||||||||||
remarques | 3 | ||||||||||||
avec jaune | moyenne | 72 | 30 | 227 | 308 | ||||||||
variance | 72 | 0 | 175 | 230 | |||||||||
sans jaune | moyenne | 153 | 249 | 166 | |||||||||
variance | 74 | 142 | 71 |
abq tRNA-cds[modifier | modifier le wikicode]
- Note: intercalaires prélevés de la colonne cds de abq opérons dans un bloc de tRNAs uniquement. Le début du bloc est dans l'ordre des adresses, deb intercalaire entre le cds et le 1er tRNA dd bloc, fin entre le dernier tRNA et le cds terminal. J'ai procédé, dans les colonnes petit et grand, à la réorientation des blocs d'après la constatation que les blocs à rRNA ont leurs cds de début et de fin sont orientés du cds-16s au 5s-tRNAs-cds, l'intercalaire cds-16s étant plus grands que l'intercalaire avec le cds terminal. En tête de colonne est le % du nombre des intercalaires inférieurs à 201 pbs.
abq 67 60 38 90 deb fin deb fin grand petit grand petit 38 91 159 5 72 68 159 5 42 81 210 32 81 42 210 32 68 72 659 35 91 38 659 35 77 170 175 59 96 92 91 38 79 382 209 63 125 123 81 42 85 139 153 69 139 85 175 59 91 173 68 72 144 81 209 63 92 96 149 74 149 74 72 68 94 475 42 81 153 69 153 69 118 443 144 81 153 137 149 74 123 228 38 91 159 5 170 77 125 123 92 96 162 137 382 79 127 206 166 98 166 98 144 81 129 337 344 106 169 141 139 85 134 212 296 109 170 77 173 91 135 243 365 120 173 91 96 92 136 209 125 123 175 59 475 94 144 81 243 123 188 148 166 98 148 188 595 131 206 127 344 106 149 74 153 137 209 63 296 109 149 688 162 137 209 136 443 118 153 69 85 139 210 32 365 120 153 137 169 141 212 134 125 123 156 234 77 170 218 196 243 123 159 5 91 173 228 123 228 123 159 231 246 175 231 205 206 127 162 137 148 188 231 159 337 129 166 98 455 193 234 156 595 131 169 141 493 197 243 123 212 134 175 59 231 205 243 135 243 135 196 218 127 206 246 175 209 136 199 246 136 209 246 199 153 137 209 63 134 212 296 109 162 137 210 32 196 218 308 247 169 141 231 205 123 228 337 129 188 148 243 123 159 231 340 286 688 149 246 175 156 234 344 106 234 156 296 109 135 243 365 120 231 159 308 247 199 246 382 79 246 175 340 286 308 247 414 406 455 193 344 106 340 286 443 118 218 196 365 120 129 337 455 193 493 197 414 406 481 363 475 94 246 199 455 193 79 382 481 363 231 205 481 363 414 406 493 197 308 247 493 197 118 443 595 131 340 286 595 131 94 475 659 35 481 363 659 35 149 688 688 149 414 406
- Comparaison cds-cds tRNA-cds: deb fin, c'est l'ordre des adresses et grand petit l'ordre après réorientation. Leur pourcentage est calculé par rapport à la colonne, c'est à dire la moitié du total des tRNA-cds.
alpha cds total total <0 0-200 201-370 371-600 >600 deb fin grand petit abq 6,576 96 61 24 9 2 32 29 18 43 ‰ 635 250 94 21 667 604 375 896
abq blocs[modifier | modifier le wikicode]
- Lien tableur: abq blocs
- Légende: lien au tableau des protéines, abrégé
- - vert: la taille des rRNAs en pbs alors que les protéines (cds) sont en aas.
bloc | intercal | cdsa | intercal | cdsa | intercal | cdsa | intercal | cdsa | intercal | cdsa | |||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
cds | 779 | 1328 | non ribosom | 496 | 235 | PAP2 fam | 502 | 65 | hp | 615 | 305 | lytic dom | 444 | 143 | DUF1489 |
16s | 108 | 1491 | 108 | 1501 | 108 | 1501 | 110 | 1491 | 94 | 1501 | |||||
atc | 30 | 30 | 30 | 30 | 30 | ||||||||||
gca | 266 | 255 | 255 | 266 | 254 | ||||||||||
23s | 129 | 2753 | 129 | 2753 | 129 | 2753 | 127 | 2753 | 128 | 2753 | |||||
5s | 236 | 116 | 187 | 116 | 278 | 116 | 202 | 116 | 193 | 116 | |||||
cds | 97 | YkgJ fam | 614 | EAL & GGDEF | 387 | PQQ | 209 | pyridoxamine | 73 | hp | |||||
cds | 452 | 295 | Hx-t-Hx | 740 | 453 | peptido fam | 472 | 419 | exo SbcD | ||||||
16s | 108 | 1491 | 108 | 1491 | 108 | 1491 | |||||||||
atc | 30 | 30 | 30 | ||||||||||||
gca | 266 | 255 | 255 | cds | 676 | 153 | MarR fam | ||||||||
23s | 127 | 2753 | 129 | 2753 | 129 | 2753 | 16s | 262 | 1501 | ||||||
5s | 96 | 116 | 96 | 116 | 96 | 116 | 23s | 145 | 2754 | ||||||
atgf | 870 | 394 | 161 | cds | 369 | GNAT fam | |||||||||
cds | 264 | IS5 fam | 101 | p-IS5/IS1182 | 77 | p-ATP-bind |
abq remarques[modifier | modifier le wikicode]
- Remarques
- - Les intercalaires élevés des cds: Ce génome ressemble à agr plus qu’à oan, voir le tableau des intercalaires ci-dessous. Le génome oan se rapproche plus des rickettsia avec 12 intercalaires cds-aa supérieurs à 500 et un maximum de 1650. Le génome abq a des intercalaires cds-aa inférieurs à 700 comme agr mais en plus grand nombre, 6 contre 3.
- @ Les blocs à RNAs: Les blocs sont nombreux, 9 16s, quasiment identiques et complets.
- - Sur 18 cds 2 hp 1 pseudo et 5 petits avec moins de 210 aas.
- - Tous les blocs sauf un (incomplet, 16s23s) sont de type 16satcgca23s5s dont 5 se terminent avec 5s et 3 avec 5s-atgf.
- - Les intercalaires internes, hors cds, sont quasiment identiques.
- - Les tailles des rRNAs du 23s et du 5s ne varient pas. Il y a 5 16s à 1491 pbs et 4 avec 1501 pbs.
- @ Les intercalaires entre aas: Il y a 13 blocs à plusieurs aas, pour 51 au total, contre 3 pour 45 chez oan et 3 pour 38 chez agr. Aussi je distingue 2 groupes comme avec agr et oan qui ont des effectifs très faibles.
- - un groupe de 10, normal dans cette étude, autour de 15 de moyenne, de 3 à 60 pbs
- - un groupe de 7, extrême, de 76 à 220 pbs. Le maximum est équivalent à celui de oan mais nettement inférieur aux 2 extrêmes de agr, 793 et 446.
- @ Les plasmides: génome exceptionnel avec 5 plasmides et 9 blocs à rRNAs. Exceptionnel aussi du fait qu’un plasmide, le plasmide 1, contient 4 blocs à rRNAs, soit 2 fois plus que le chromosome avec 2 blocs. Cette situation rappelle le cas unique du génome aua où le seul bloc à rRNA se trouve sur l’unique et tout petit plasmide de 10k pbs.
- Séquences des doubles: sur les 51 blocs à aas seulement 13 ont plus d’un aa. Les doubles sont tous des doublets de blocs à 2 aas, 5 sur 11, ccg aag gag gtg cac.
- Tableau des intercalaires
abq intercalaires entre aas abq intercalaires cds abq intercalaires cds 1370697 aac-tgc 220 810890 atgf 870 2641475 ggc 688 616472 ccg-ccg 206 1431525 16s 779 2766227 ggg 659 1723802 gac-gta 164 120008 16s 740 1997840 atgj 595 1165208 gtg-gtg 132 1354091 16s 676 972026 agc 493 1735337 cac-cac 109 510548 16s 615 1725057 ctc 475 1443296 gcg-gac 99 404350 16s 502 86421 ggc 455 796280 aag-aag 76 2787506 16s 496 1354448 aga 443 302206 16s 472 52318 tgg 481-363 814616 16s 452 2304295 tta 414-406 isolé 1570334 16s 444 intercalaires supérieurs à 500 pbs. agr oan abq 16s 2 4 6 aas 6 12 3 max 16s 633 998 870 max aas 793 1650 688
abq distribution[modifier | modifier le wikicode]
- Lien tableur: abq distribution
- Notes
aag2 cac2 ccg2 gag3 gtg3 ggc: 3 1aa et 1 >1aa
g1 | t1 | ||||||
---|---|---|---|---|---|---|---|
atgi | 1 | tct | tat | atgf | 3 | ||
att | act | aat | agt | ||||
ctt | cct | cat | cgc | ||||
gtt | gct | gat | ggt | ||||
ttc | 2 | tcc | 1 | tac | 2 | tgc | 1 |
atc | 8 | acc | 2 | aac | 3 | agc | 1 |
ctc | 2 | ccc | 1 | cac | 2 | cgt | 2 |
gtc | 2 | gcc | 3 | gac | 3 | ggc | 4 |
tta | 1 | tca | 1 | taa | tga | ||
ata | aca | 1 | aaa | 1 | aga | 1 | |
cta | 1 | cca | 1 | caa | 1 | cga | |
gta | gca | 8 | gaa | 1 | gga | 1 | |
ttg | 1 | tcg | 1 | tag | tgg | 2 | |
atgj | 1 | acg | 1 | aag | 2 | agg | 1 |
ctg | 3 | ccg | 2 | cag | 2 | cgg | 1 |
gtg | 3 | gcg | 2 | gag | 3 | ggg | 1 |
alpha | >1aa | =1aa | -5s | +5s | -16s | +16s | total |
abq | 30 | 38 | 3 | 16 | 87 |
Azospirillum brasilense Sp245[modifier | modifier le wikicode]
abs opérons[modifier | modifier le wikicode]
- Lien tableur: abs opérons
- Liens: gtRNAdb [22], NCBI [23], génome [24]
- Phylogénie: Bacteria; Proteobacteria; Alphaproteobacteria; Rhodospirillales; Rhodospirillaceae; Azospirillum.
- Légende: cdsa: cds aas, cdsd: cds dirigé
68.45%GC | 10.1.20 Paris | 80 | doubles | intercal | cds | aa | avec aa | cdsa | cdsd | protéines |
---|---|---|---|---|---|---|---|---|---|---|
chromosome [25] | ||||||||||
comp | 16414..16980 | cds | 163 | 163 | 189 | prolyl-tRNA synthetase associated domain-containing protein | ||||
17144..17218 | ggc | 670 | 670 | |||||||
17889..18566 | cds | 226 | demethylmenaquinone methyltransferase | |||||||
84790..85017 | cds | 114 | 114 | 76 | osmotically-inducible lipoprotein B | |||||
comp | 85132..85205 | ggg | 35 | 35 | ||||||
comp | 85241..85900 | cds | 220 | N-acetyltransferase | ||||||
comp | 93530..94258 | cds | 60 | 60 | 243 | SDR family NAD(P)-dependent oxidoreductase | ||||
comp | 94319..94395 | agg | 175 | 175 | ||||||
94571..96262 | cds | 564 | hp | |||||||
comp | 131833..132117 | cds | 206 | 206 | 95 | YggT family protein | ||||
132324..132399 | gcg | 140 | 140 | |||||||
comp | 132540..133586 | cds | 349 | DMT family transporter | ||||||
comp | 483582..484082 | cds | 170 | 170 | 167 | xanthine phosphoribosyltransferase | ||||
484253..484329 | cgt | 77 | 77 | |||||||
comp | 484407..484586 | cds | 60 | hp | ||||||
536869..537573 | cds | 495 | 495 | 235 | phosphatase PAP2 family protein | |||||
538069..539152 | 16s’ | @1 | 189 | 1084 | ||||||
539342..540019 | 23s° | 127 | 678 | |||||||
540147..540262 | 5s | 153 | 153 | 116 | ||||||
comp | 540416..542290 | cds | 625 | GGDEF domain-containing protein | ||||||
600048..601079 | cds | 79 | 79 | 344 | tyrosine-type recombinase/integrase | |||||
comp | 601159..601233 | acg | 81 | 81 | ||||||
comp | 601315..603243 | cds | 643 | DNA helicase RecQ | ||||||
comp | 656242..656520 | cds | 169 | 169 | 93 | hp | ||||
comp | 656690..656765 | gcc | 141 | 141 | ||||||
comp | 656907..657305 | cds | 133 | TIGR02300 family protein | ||||||
comp | 864141..864458 | cds | 209 | 209 | 106 | 50S ribosomal protein L21 | ||||
864668..864757 | tcg | 79 | 79 | |||||||
comp | 864837..865679 | cds | 281 | alpha/beta hydrolase | ||||||
927651..927896 | cds | 392 | 392 | 82 | hp | |||||
928289..928371 | tta | 175 | 175 | |||||||
928547..929164 | cds | 206 | hp | |||||||
comp | 1148345..1149223 | cds | 234 | 234 | 293 | N-formylglutamate amidohydrolase | ||||
1149458..1149532 | gtc | 106 | 106 | |||||||
comp | 1149639..1151516 | cds | 626 | methyl-accepting chemotaxis protein | ||||||
1243974..1245108 | cds | 131 | 131 | 378 | tRNA 2-thiouridine(34) synthase MnmA | |||||
1245240..1245314 | atgj | 354 | 354 | |||||||
comp | 1245669..1246637 | cds | 323 | NAD(+) diphosphatase | ||||||
1279875..1280237 | cds | 74 | 74 | 121 | hp | |||||
comp | 1280312..1280397 | tac | 148 | 148 | ||||||
comp | 1280546..1281172 | cds | 209 | nitrogen fixation protein NifQ | ||||||
comp | 1500772..1501110 | cds | 338 | 338 | 113 | P-II family nitrogen regulator | ||||
1501449..1501524 | cac | + | 109 | 109 | ||||||
1501634..1501709 | cac | 2 cac | 129 | 129 | ||||||
1501839..1503305 | cds | 106 | 106 | 489 | bifunctional ADP-dependent NAD(P)H-hydrate dehydratase/NAD(P)H-hydrate epimerase | |||||
1503412..1504977 | cds | 173 | 173 | 522 | malonyl-CoA decarboxylase | |||||
1505151..1505235 | cta | 91 | 91 | |||||||
1505327..1506661 | cds | 445 | trigger factor | |||||||
1511745..1512017 | cds | 105 | 105 | 91 | HU family DNA-binding protein | |||||
1512123..1512197 | gta | 163 | 163 | |||||||
1512361..1512437 | gac | 344 | 344 | |||||||
1512782..1513150 | cds | 123 | NADH-quinone oxidoreductase subunit A | |||||||
1657596..1659397 | cds | 123 | 123 | 601 | p-single-stranded-DNA-specific exonuclease RecJ | |||||
1659521..1659596 | gaa | 234 | 234 | |||||||
1659831..1660671 | cds | 280 | aldo/keto reductase | |||||||
comp | 1808199..1808735 | cds | 79 | 79 | 179 | hp | ||||
1808815..1808892 | cca | 49 | 49 | |||||||
1808942..1809238 | cds | 10 | 10 | 99 | ETC complex I subunit | |||||
1809249..1809325 | aga | 442 | 442 | |||||||
1809768..1810013 | cds | 82 | hp | |||||||
comp | 1825075..1825305 | cds | 210 | 210 | 77 | hp | ||||
comp | 1825516..1825591 | aac | @2 | 219 | 219 | |||||
comp | 1825811..1825884 | tgc | 217 | 217 | ||||||
1826102..1826758 | cds | 219 | protein-L-isoaspartate O-methyltransferase | |||||||
comp | 1878424..1878714 | cds | 244 | 244 | 97 | YkgJ family cysteine cluster protein | ||||
comp | 1878959..1879074 | 5s | 123 | 116 | ||||||
comp | 1879198..1881950 | 23s | 272 | 2753 | ||||||
comp | 1882223..1882298 | gca | 32 | 32 | ||||||
comp | 1882331..1882407 | atc | 110 | |||||||
comp | 1882518..1883224 | 16s° | 100 | 100 | 707 | |||||
<comp | 1883325..1883763 | cds | 146 | p-erythrose-4-phosphate dehydrogenase | ||||||
1896604..1897080 | cds | 192 | 192 | 159 | peptidoglycan-associated lipoprotein Pal | |||||
comp | 1897273..1897347 | acc | 162 | 162 | ||||||
comp | 1897510..1899495 | cds | 662 | polysaccharide biosynthesis protein | ||||||
comp | 2032701..2033588 | cds | 165 | 165 | 296 | DUF3108 domain-containing protein | ||||
2033754..2033828 | gtg | + | 132 | 132 | ||||||
2033961..2034035 | gtg | 2 gtg | 231 | 231 | ||||||
2034267..2034431 | cds | 55 | hp | |||||||
2113098..2113601 | cds | 85 | 85 | 168 | MerR family transcriptional regulator | |||||
2113687..2113763 | ccc | 140 | 140 | |||||||
comp | 2113904..2115682 | cds | 593 | cyclic nucleotide-binding domain-containing protein | ||||||
comp | 2163405..2167388 | cds | 775 | 775 | 1328 | non-ribosomal peptide synthetase | ||||
2168164..2168552 | 16s° | 100 | 389 | |||||||
comp | 2168653..2169323 | 16s° | 522 | 522 | 671 | |||||
comp | 2169846..2170325 | cds | 160 | DUF2141 domain-containing protein | ||||||
2176963..2177427 | cds | 107 | 107 | 155 | membrane protein | |||||
comp | 2177535..2177610 | gcc | 30 | 30 | ||||||
comp | 2177641..2177727 | ctg | 135 | 135 | ||||||
comp | 2177863..2180208 | cds | 782 | mechanosensitive ion channel | ||||||
2233677..2234435 | cds | 92 | 92 | 253 | hp | |||||
comp | 2234528..2234603 | gag | + | 38 | 38 | |||||
comp | 2234642..2234717 | gag | 2 gag | 68 | 68 | |||||
comp | 2234786..2235836 | cds | 350 | p-low specificity L-threonine aldolase | ||||||
comp | 2293087..2293593 | cds | 211 | 211 | 169 | hp | ||||
2293805..2293881 | cgt | 137 | 137 | |||||||
2294019..2294495 | cds | 5 | 5 | 159 | GNAT family N-acetyltransferase | |||||
comp | 2294501..2294576 | atgi | 145 | 145 | ||||||
comp | 2294722..2296683 | cds | 654 | RNA polymerase sigma factor RpoD | ||||||
2372946..2373401 | cds | 86 | 86 | 152 | MaoC family dehydratase | |||||
comp | 2373488..2373563 | aag | + | 74 | 74 | |||||
comp | 2373638..2373713 | aag | 2 aag | 309 | 309 | |||||
2374023..2375549 | cds | 509 | methyltransferase domain-containing protein | |||||||
comp | 2418203..2418400 | cds | 69 | 69 | 66 | preprotein translocase subunit SecE | ||||
comp | 2418470..2418545 | tgg | 152 | 152 | ||||||
comp | 2418698..2419888 | cds | 81 | 81 | 397 | elongation factor Tu | ||||
comp | 2419970..2420043 | gga | 60 | 60 | ||||||
comp | 2420104..2420189 | tac | 144 | 144 | ||||||
2420334..2421188 | cds | 91 | 91 | 285 | 23S rRNA (guanosine(2251)-2'-O)-methyltransferase RlmB | |||||
2421280..2421355 | aca | 137 | 137 | |||||||
2421493..2423187 | cds | 565 | site-specific integrase | |||||||
2561207..2562223 | cds | 109 | 109 | 339 | farnesyltranstransferase | |||||
2562333..2562409 | ccg | + | 205 | 205 | ||||||
2562615..2562691 | ccg | 2 ccg | 136 | 136 | ||||||
2562828..2563241 | cds | 138 | hp | |||||||
comp | 2680406..2680930 | cds | 140 | 140 | 175 | disulfide bond formation protein B | ||||
2681071..2681157 | ttg | 162 | 162 | |||||||
2681320..2681715 | cds | 132 | cupin domain-containing protein | |||||||
2856509..2858152 | cds | 365 | 365 | 548 | recombinase family protein | |||||
comp | 2858518..2858608 | tcc | 118 | 118 | ||||||
comp | 2858727..2859530 | cds | 268 | alpha/beta hydrolase | ||||||
plasmide1 [26] | @3 | |||||||||
198109..199200 | cds | 84 | 84 | 364 | tyrosine-type recombinase/integrase | |||||
comp | 199285..199360 | aaa | 135 | 135 | ||||||
comp | 199496..200044 | cds | 183 | pantetheine-phosphate adenylyltransferase | ||||||
243776..244348 | cds | 205 | 205 | 191 | hp | |||||
244554..244643 | tca | 143 | 143 | |||||||
244787..245683 | cds | 299 | diguanylate cyclase | |||||||
338004..339383 | cds | 116 | 116 | 460 | hp | |||||
comp | 339500..339586 | ctc | 257 | 257 | ||||||
comp | 339844..340836 | cds | 331 | alpha/beta hydrolase | ||||||
comp | 364473..365501 | cds | 200 | 200 | 343 | Ppx/GppA family phosphatase | ||||
365702..365775 | cag | 746 | 746 | |||||||
366522..367214 | cds | 231 | FadR family transcriptional regulator | |||||||
474173..477079 | cds | 298 | 298 | 969 | PAS domain-containing protein | |||||
477378..477464 | ctg | 30 | 30 | |||||||
477495..477570 | gcc | 238 | 238 | |||||||
477809..478123 | cds | 105 | hp | |||||||
599223..600230 | cds | 245 | 245 | 336 | inorganic phosphate transporter | |||||
comp | 600476..600550 | ggc | 351 | 351 | ||||||
600902..602071 | cds | 390 | adenylate/guanylate cyclase domain-containing protein | |||||||
comp | 629856..631229 | cds | 154 | 154 | 458 | tetratricopeptide repeat protein | ||||
631384..631458 | acc | 1 | 1 | |||||||
631460..631535 | gcg | 99 | 99 | |||||||
631635..631711 | gac | 35 | 35 | |||||||
631747..631821 | gtc | 1 | 1 | |||||||
631823..631896 | cag | 153 | 153 | |||||||
632050..632259 | cds | 70 | hp | |||||||
>comp | 699265..699846 | cds | 210 | 210 | 194 | P-hp | ||||
700057..700132 | aac | 4 | 4 | |||||||
700137..700213 | gac | 32 | 32 | |||||||
comp | 700246..700851 | cds | 202 | hp | ||||||
909530..909766 | cds | 153 | 153 | 79 | hp | |||||
comp | 909920..910035 | 5s | 127 | 116 | ||||||
comp | 910163..912915 | 23s | 271 | 2753 | ||||||
comp | 913187..913262 | gca | 30 | 30 | ||||||
comp | 913293..913369 | atc | 110 | |||||||
comp | 913480..914970 | 16s | 486 | 486 | 1491 | |||||
915457..916713 | cds | 419 | exonuclease subunit SbcD | |||||||
comp | 998160..999149 | cds | 229 | 229 | 330 | complex I NDUFA9 subunit family protein | ||||
999379..999465 | ctg | 123 | 123 | |||||||
999589..1000215 | cds | 209 | ribonuclease D | |||||||
comp | 1098197..1098655 | cds | 675 | 675 | 153 | MarR family transcriptional regulator | ||||
1099331..1100821 | 16s | 107 | 1491 | |||||||
1100929..1101005 | atc | 31 | 31 | |||||||
1101037..1101112 | gca | 271 | ||||||||
1101384..1104136 | 23s | 147 | 147 | 2753 | ||||||
comp | 1104284..1105390 | cds | 369 | GNAT family N-acetyltransferase | ||||||
1157171..1157356 | cds | 98 | 98 | 62 | DNA gyrase inhibitor YacG | |||||
1157455..1157530 | ttc | 178 | 178 | |||||||
1157709..1158686 | cds | 326 | alpha-(1,3)-fucosyltransferase | |||||||
1394614..1396740 | cds | 453 | 453 | 709 | PAS domain S-box protein | |||||
1397194..1397287 | agc | 52 | 52 | |||||||
comp | 1397340..1397858 | cds | 173 | tyrosine-type recombinase/integrase | ||||||
1399009..1399830 | cds | 301 | 301 | 274 | hp | |||||
comp | 1400132..1400206 | caa | 79 | 79 | ||||||
comp | 1400286..1402379 | cds | 698 | hp | ||||||
1577667..1578095 | cds | 457 | 457 | 143 | DUF1489 domain-containing protein | |||||
1578553..1580043 | 16s | 110 | 1491 | |||||||
1580154..1580230 | atc | 31 | 31 | |||||||
1580262..1580337 | gca | 269 | ||||||||
1580607..1581986 | 23s° | 100 | 1380 | |||||||
1582087..1582616 | 23s° | 123 | 530 | |||||||
1582740..1582855 | 5s | 100 | 116 | |||||||
1582956..1583032 | atgf | 706 | 706 | |||||||
1583739..1585157 | cds | 473 | pyruvate kinase | |||||||
plasmide2 [27] | ||||||||||
271302..272090 | cds | 529 | 529 | 263 | ATP-binding cassette domain-containing protein | |||||
272620..272695 | tgg | 480 | 480 | |||||||
273176..273922 | cds | 249 | sigma-70 family RNA polymerase sigma factor | |||||||
449562..450338 | cds | 465 | 465 | 259 | IclR family transcriptional regulator | |||||
450804..452289 | 16s | 584 | 1486 | |||||||
452874..453640 | 23s° | 128 | 767 | |||||||
453769..453884 | 5s | 101 | 116 | |||||||
453986..454062 | atgf | 359 | 359 | |||||||
comp | 454422..457751 | cds | 1110 | NERD domain-containing protein | ||||||
plasmide4 [28] | ||||||||||
>comp | 131140..131621 | cds | 193 | 193 | 161 | p-erythrose-4-phosphate dehydrogenase | ||||
131815..131891 | atgf | 202 | 202 | |||||||
comp | 132094..132276 | cds | 61 | hp | ||||||
comp | 197300..198643 | cds | 738 | 738 | 448 | peptidoglycan DD-metalloendopeptidase family protein | ||||
199382..199953 | 16s° | 193 | 572 | |||||||
200147..200223 | atgf | 437 | 437 | |||||||
comp | 200661..202571 | cds | 637 | PAS domain-containing sensor histidine kinase | ||||||
246777..248687 | cds | 208 | 208 | 637 | RNA-directed DNA polymerase | |||||
comp | 248896..248972 | cgg | 96 | 96 | ||||||
comp | 249069..249983 | cds | 305 | alpha/beta hydrolase | ||||||
319641..319943 | cds | 134 | 134 | 101 | STAS domain-containing protein | |||||
comp | 320078..320164 | ctc | 125 | 125 | ||||||
320290..321018 | cds | 243 | lipoyl(octanoyl) transferase LipB | |||||||
comp | 401067..402227 | cds | 281 | 281 | 387 | PQQ-dependent sugar dehydrogenase | ||||
comp | 402509..402624 | 5s | 129 | 116 | ||||||
comp | 402754..403402 | 23s° | 106 | 649 | ||||||
comp | 403509..403880 | 16s° | 502 | 502 | 372 | |||||
comp | 404383..404577 | cds | 65 | hp | ||||||
501394..501756 | cds | 95 | 95 | 121 | response regulator | |||||
501852..501927 | aac | 4 | 4 | |||||||
501932..502008 | gac | 4 | 4 | |||||||
502013..502087 | ggc | 102 | 102 | |||||||
comp | 502190..502957 | cds | 256 | helix-turn-helix transcriptional regulator | ||||||
503041..503667 | cds | 249 | 249 | 209 | pyridoxamine 5'-phosphate oxidase | |||||
comp | 503917..504474 | 16s° | 547 | 547 | 558 | |||||
505022..506005 | cds | 328 | lytic transglycosylase domain-containing protein | |||||||
comp | 601019..603679 | cds | 358 | 358 | 887 | bifunctional acetaldehyde-CoA/alcohol dehydrogenase | ||||
604038..604113 | ttc | 318 | 318 | |||||||
> | 604432..605613 | cds | 394 | site-specific integrase | ||||||
plasmide6 [29] | ||||||||||
88804..89472 | cds | 397 | 397 | 223 | RraA family protein | |||||
89870..89944 | ggc | 249 | 249 | |||||||
90194..91186 | cds | 331 | UDP-N-acetylglucosamine 4,6-dehydratase (inverting) |
abs cumuls[modifier | modifier le wikicode]
- Lien tableur: abs cumuls
opérons | Fréquences intercalaires tRNAs | Fréquences intercalaires cds | Fréquences aas cds chromosome | ||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
effectif | gammes | sans rRNAs | avec rRNAs | gammes | cds | gammes | cdsd | gammes | cdsa | gammes | cdsa 30-300 | ||
avec rRNA | opérons | 10 | 1 | 2 | 1 | 0 | 1 | 100 | 18 | 1 | 0 | ||
16atcgca235 | 1 | 20 | 3 | 50 | 5 | 40 | 200 | 29 | 30 | 0 | |||
Id-23s°-atgf | 1 | 40 | 4 | 4 | 100 | 22 | 80 | 300 | 26 | 60 | 3 | ||
1623s°5atgf | 1 | 60 | 1 | 150 | 29 | 120 | 400 | 20 | 90 | 10 | |||
max a | 3 | 80 | 1 | 200 | 18 | 160 | 500 | 7 | 120 | 9 | |||
a doubles | 0 | 100 | 1 | 250 | 18 | 200 | 600 | 6 | 150 | 8 | |||
autres | 7 | 120 | 1 | 300 | 3 | 240 | 700 | 9 | 180 | 13 | |||
total aas | 10 | 140 | 1 | 350 | 5 | 280 | 800 | 2 | 210 | 9 | |||
sans | opérons | 51 | 160 | 0 | 400 | 7 | 320 | 900 | 1 | 240 | 6 | ||
1 aa | 39 | 180 | 1 | 450 | 2 | 360 | 1000 | 1 | 270 | 8 | |||
max a | 5 | 200 | 0 | 500 | 6 | 400 | 1100 | 0 | 300 | 7 | |||
a doubles | 5 | 2 | 10 | 2 | 48 | ||||||||
total aas | 67 | 17 | 4 | 125 | 0 | 121 | 121 | ||||||
total aas | |||||||||||||
remarques | 3 | ||||||||||||
avec jaune | moyenne | 71 | 31 | 221 | 308 | ||||||||
variance | 72 | 1 | 168 | 230 | |||||||||
sans jaune | moyenne | 151 | 242 | 166 | |||||||||
variance | 72 | 137 | 72 |
abs tRNA-cds[modifier | modifier le wikicode]
- Note: intercalaires prélevés de la colonne cds de abs opérons dans un bloc de tRNAs uniquement. Le début du bloc est dans l'ordre des adresses, deb intercalaire entre le cds et le 1er tRNA dd bloc, fin entre le dernier tRNA et le cds terminal. J'ai procédé, dans les colonnes petit et grand, à la réorientation des blocs d'après la constatation que les blocs à rRNA ont leurs cds de début et de fin sont orientés du cds-16s au 5s-tRNAs-cds, l'intercalaire cds-16s étant plus grands que l'intercalaire avec le cds terminal. En tête de colonne est le % du nombre des intercalaires inférieurs à 201 pbs.
abs 63 69 44 88 deb fin deb fin grand petit grand petit 5 145 210 32 79 49 145 5 10 442 114 35 81 79 442 10 60 175 79 49 92 68 210 32 69 152 453 52 102 95 114 35 74 148 92 68 114 35 79 49 79 81 170 77 134 125 453 52 79 49 209 79 135 84 175 60 81 144 301 79 135 107 92 68 84 135 79 81 136 109 152 69 85 140 173 91 137 91 148 74 86 309 208 96 140 85 170 77 91 137 95 102 144 81 81 79 92 68 234 106 145 5 209 79 95 102 365 118 148 74 301 79 98 178 229 123 152 69 144 81 105 344 134 125 154 153 135 84 107 135 338 129 162 140 140 85 109 136 84 135 169 141 309 86 114 35 107 135 170 77 137 91 116 257 109 136 173 91 173 91 123 234 91 137 175 60 102 95 131 354 211 137 178 98 208 96 134 125 85 140 192 162 178 98 140 162 206 140 202 193 344 105 154 153 169 141 205 143 234 106 163 670 205 143 206 140 135 107 165 231 81 144 208 96 136 109 169 141 5 145 209 79 257 116 170 77 74 148 210 32 365 118 173 91 69 152 211 137 229 123 192 162 154 153 217 210 234 123 193 202 140 162 229 123 134 125 200 746 192 162 231 165 338 129 205 143 60 175 234 106 354 131 206 140 392 175 234 123 211 137 208 96 98 178 257 116 162 140 209 79 193 202 298 238 206 140 210 217 210 217 301 79 169 141 210 32 165 231 309 86 205 143 211 137 123 234 338 129 154 153 229 123 298 238 344 105 192 162 234 106 397 249 351 245 670 163 245 351 116 257 354 131 231 165 298 238 86 309 358 318 392 175 301 79 358 318 365 118 202 193 338 129 105 344 392 175 746 200 358 318 245 351 397 249 217 210 365 118 131 354 442 10 298 238 392 175 10 442 453 52 351 245 397 249 529 480 529 480 397 249 453 52 163 670 670 163 358 318 529 480 200 746 746 200 529 480
- Comparaison cds-cds tRNA-cds: deb fin, c'est l'ordre des adresses et grand petit l'ordre après réorientation. Leur pourcentage est calculé par rapport à la colonne, c'est à dire la moitié du total des tRNA-cds.
alpha cds total total <0 0-200 201-370 371-600 >600 deb fin grand petit abs 6,817 104 69 27 6 2 33 36 23 46 ‰ 663 260 58 19 635 692 442 885
abs blocs[modifier | modifier le wikicode]
abs blocs abrégé[modifier | modifier le wikicode]
- Lien tableur: abs blocs abrégé
- Note:
- - hp pour hypothetical protein
- - p- pour pseudo, par exemple p-elon en abrégé donne p-elongation factor Tu.
abrégé | nom |
---|---|
23s RlmB | 23S rRNA (guanosine(2251)-2'-O)-methyltransferase RlmB |
50s L21 | 50S ribosomal protein L21 |
AAA fam | AAA family ATPase |
ab hydrolase | alpha/beta hydrolase |
ab hydrolase f | alpha/beta hydrolase fold domain-containing protein |
AG cyclase | adenylate/guanylate cyclase domain-containing protein |
ak reductase | aldo/keto reductase |
ATP bind | ATP-binding cassette domain-containing protein |
bacteriofer | bacterioferritin |
bif CoA | bifunctional acetaldehyde-CoA/alcohol dehydrogenase |
bif NAD | bifunctional ADP-dependent NAD(P)H-hydrate dehydratase/NAD(P)H-hydrate epimerase |
chemotaxis p | methyl-accepting chemotaxis protein |
cupin dom | cupin domain-containing protein |
cyclicN bind | cyclic nucleotide-binding domain-containing protein |
diG cyclase | diguanylate cyclase |
dip ABC | dipeptide ABC transporter ATP-binding protein |
disulfide | disulfide bond formation protein B |
DMT fam | DMT family transporter |
DUF1489 | DUF1489 domain-containing protein |
DUF2141 | DUF2141 domain-containing protein |
DUF3108 | DUF3108 domain-containing protein |
DUF3618 | DUF3618 domain-containing protein |
EAL & GGDEF | EAL and GGDEF domain-containing protein |
elonga Tu | elongation factor Tu |
ETC complex | ETC complex I subunit |
exo SbcD | exonuclease subunit SbcD |
FAD bind | FAD-binding oxidoreductase |
FadR fam | FadR family transcriptional regulator |
farnesyl | farnesyltranstransferase |
fucosyl | alpha-1,3-fucosyltransferase |
GGDEF dom | GGDEF domain-containing protein |
glycosyl | glycosyltransferase |
GNAT fam | GNAT family N-acetyltransferase |
gyrase YacG | DNA gyrase inhibitor YacG |
Hase HypA | hydrogenase maturation nickel metallochaperone HypA |
helicas RecQ | DNA helicase RecQ |
HU bind | HU family DNA-binding protein |
Hx-t-Hx | helix-turn-helix transcriptional regulator |
Hx-t-Hx dom | helix-turn-helix domain-containing protein |
IclR fam | IclR family transcriptional regulator |
inorganic P | inorganic phosphate transporter |
IS3 fam | IS3 family transposase |
IS5 fam | IS5 family transposase |
L-iso-Asp | protein-L-isoaspartate O-methyltransferase |
lipoyl LipB | lipoyl(octanoyl) transferase LipB |
low Thr | low specificity L-threonine aldolase |
lytic dom | lytic transglycosylase domain-containing protein |
malate G | malate synthase G |
malonyl CoA | malonyl-CoA decarboxylase |
MaoC fam | MaoC family dehydratase |
MarR fam | MarR family transcriptional regulator |
mecano ion | mechanosensitive ion channel |
membrane p | membrane protein |
menaquinone | dimethylmenaquinone methyltransferase |
MerR fam | MerR family transcriptional regulator |
methyl trans | methyltransferase domain-containing protein |
N-acetyl trans | N-acetyltransferase |
N-formyl Glu | N-formylglutamate amidohydrolase |
NAD diP | NAD(+) diphosphatase |
NADH-quinone | NADH-quinone oxidoreductase subunit A |
NDUFA9 | complex I NDUFA9 subunit family protein |
NERD dom | NERD domain-containing protein |
nitrogen NifQ | nitrogen fixation protein NifQ |
non ribosom | non-ribosomal peptide synthetase |
osmose LipB | osmotically-inducible lipoprotein B |
p-ATP-bind | p-ATP-binding protein |
p-erythrose | p-erythrose-4-phosphate dehydrogenase |
P-II nitrogen | P-II family nitrogen regulator |
p-IS5/IS1182 | P-IS5/IS1182 family transposase |
p-low Thr | p-low specificity L-threonine aldolase |
p-ssDNA exo | p-single-stranded-DNA-specific exonuclease RecJ |
pantetheine | pantetheine-phosphate adenylyltransferase |
PAP2 fam | phosphatase PAP2 family protein |
PAS dom | PAS domain-containing protein |
PAS kinase | PAS domain-containing sensor histidine kinase |
PAS S-box | PAS domain S-box protein |
peptido fam | peptidoglycan DD-metalloendopeptidase family protein |
peptido Pal | peptidoglycan-associated lipoprotein Pal |
polymerase | RNA-directed DNA polymerase |
polysacchard | polysaccharide biosynthesis protein |
Ppx/GppA | Ppx/GppA family phosphatase |
PQQ | PQQ-dependent sugar dehydrogenase |
Prolyl-tRNA | prolyl-tRNA synthetase associated domain-containing protein |
pyridoxamine | pyridoxamine 5'-phosphate oxidase |
pyruvate kin | pyruvate kinase |
recombinase | recombinase family protein |
response reg | response regulator |
restriction end | restriction endonuclease |
ribonucleaseD | ribonuclease D |
RraA fam | RraA family protein |
SDR fam | SDR family NAD(P)-dependent oxidoreductase |
sigma RpoD | RNA polymerase sigma factor RpoD |
sigma-70 fam | sigma-70 family RNA polymerase sigma factor |
SLT dom | transglycosylase SLT domain-containing protein |
ss integrase | site-specific integrase |
Ss-DNA | single-stranded-DNA-specific exonuclease RecJ |
STAS dom | STAS domain-containing protein |
subunit SecE | preprotein translocase subunit SecE |
tetratricopep | tetratricopeptide repeat protein |
TIGR02300 | TIGR02300 family protein |
trigger factor | trigger factor |
tRNA MnmA | tRNA 2-thiouridine(34) synthase MnmA |
Tyr rec/int | tyrosine-type recombinase/integrase |
UDP-N-acetyl | UDP-N-acetylglucosamine 4,6-dehydratase (inverting) |
xanthine | xanthine phosphoribosyltransferase |
YggT fam | YggT family protein |
YkgJ fam | YkgJ family cysteine cluster protein |
abs blocs tableau[modifier | modifier le wikicode]
- Lien tableur: abs blocs tableau
- Légende: lien au tableau des protéines, abrégé
- - vert: la taille des rRNAs en pbs alors que les protéines (cds) sont en aas.
- Note: 10 cds < 259 sur 20 dont 2 hp + 1 p
gène | inter | long | abrégé | gène | inter | long | abrégé | gène | inter | long | abrégé |
---|---|---|---|---|---|---|---|---|---|---|---|
cds | 486 | 419 | SbcD | cds | 100 | 146 | P-eryt | cds | 675 | 153 | MarR |
16s | 110 | 1491 | 16s° | 110 | 707 | 16s | 107 | 1491 | |||
atc | 30 | atc | 32 | atc | 31 | ||||||
gca | 271 | gca | 272 | gca | 271 | ||||||
23s | 127 | 2753 | 23s | 123 | 2753 | 23s | 147 | 2753 | |||
5s | 153 | 116 | 5s | 244 | 116 | cds | 369 | GNAT | |||
cds | 79 | hp | cds | 97 | YkgJ | ||||||
cds | 457 | 143 | DUF1489 | ||||||||
16s | 110 | 1491 | |||||||||
atc | 31 | ||||||||||
gca | 269 | ||||||||||
23s° | 100 | 1380 | |||||||||
23s° | 123 | 530 | |||||||||
5s | 100 | 116 | |||||||||
atgf | 706 | ||||||||||
cds | 473 | pyruvat | |||||||||
cds | 465 | 259 | IclR | cds | 502 | 65 | hp | cds | 495 | 235 | PAP2 |
16s | 584 | 1486 | 16s° | 106 | 372 | 16s' | 189 | 1084 | |||
23s° | 128 | 767 | 23s° | 129 | 649 | 23s° | 127 | 678 | |||
5s | 101 | 116 | 5s | 281 | 116 | 5s | 153 | v116 | |||
atgf | 359 | cds | 387 | PQQ | cds | 625 | GGDEF | ||||
cds | 1110 | NERD | |||||||||
cds | 775 | 1328 | non-rib | cds | 738 | 448 | peptido | cds | 249 | 209 | pyridox |
16s° | 100 | 389 | 16s° | 193 | 16s° | 547 | 558 | ||||
16s° | 522 | 671 | atgf | 437 | cds | 328 | lytic | ||||
cds | 160 | DUF2141 | cds | 637 | PAS |
abs abq blocs[modifier | modifier le wikicode]
- Lien tableur: abs abq blocs
- Légende: lien au tableau des protéines, abs abq blocs abrégé
- - vert: la taille des rRNAs en pbs alors qu'en clair les protéines (cdsa) sont en aas.
- - 16s° 16s' 23s°
- - comp: complement, le cds a changé de brin. Cela ressemble à une recombinaison. Exemple CHA1
- - hp caracter: hypothetical protein caractérisée. Le cds est, dans un génome hypothétique, alors que dans l'autre il est caractérisé,tout en ayant à peu près même taille et même intercalaire. Exemple CHA
- - modif: le cds a le même nom mais la taille est légèrement modifiée, ou bien le nom est modifié et nom et intercalaire sont les mêmes. Exemple CHA CHC
- - déplacé: Le cds est déplacé avec son rRNA, tout en conservant taille et intercalaire. Exemple le pavé après CHE
- - d’où?: je ne peux pas savoir de quel bloc à rRNAs, il vient. Exemple le pavé après CHE
- - recomb: En bordure un changement net du cds est du à la recombinaison d'un pavé de clusters. Exemple CHC
- - recombi: à l'intérieur, un changement net de cds est du à un déplacement ou à une recombinaison interne. Exemple CHC
- - insertion: C'est le cas typique du bloc à rRNAs incomplet qui lui manque 5s et atcgca dans abq. Exemple PL1G
- - bloc?: cela vient de quel bloc à rRNA? Exemple PL1I
- - réunion: 2 déplacés réunis. Exemple PL1I, réunion de bloc? et où?.
- Notes:
- - PL1G
- - disparition des atc et gca internes non retrouvés dans les blocs aas
- - Les 5s ne sont pas abimés mais 2 disparaissent
- - Les atgf disparaissent aussi
- - Les 23s, 2 de perdus et 4 de modifiés et perdent leur 5s et 5satgf au contraire de rpm
- - Les 16s, aucun perdu, 4 modifiés s° et 1 modifié s'.
- - Les blocs rRNAs modifiés restent sur place.
|
|
abs remarques[modifier | modifier le wikicode]
- Remarques:
- - Les remarques de abq qui ne changent pas: les intercalaires élevés avec les cds, les intercalaires entre aas (@2) et les séquences des doubles. La phylogénie étroite entre les 2 souches explique cette étroite ressemblance en tout cas pour les intercalaires et les doubles, mais pas pour les blocs à rRNAs.
- - Le tableau des intercalaires et des doubles ci-dessous met en parallèle ces 3 remarques.
- - Les remarques qui changent fondamentalement: ce sont les blocs à rRNAs (@1) et les plasmides (@3). J’ai fait une comparaison détaillée entre les 2 génomes dans abs abq blocs. Elle montre 2 processus distincts:
- Le processus de recombinaison qui explique l’ordre des blocs et le changement de certains cds.
- Le processus de conversion génique qui, en grande partie, a détruit partiellement les rRNAs 16s et 23s et non les 5s. Cependant un 5s a disparu en laissant son atgf. D’après la majorité des cds identiques entre abs et abq et qui sont attachés à ces blocs, les rRNas modifiés restent sur place.
- Tableau des intercalaires et des doubles
abs intercalaires aas abs intercalaires cds abs intercalaires cds adresse aas adresse rRNA adresse aas 1825516 aac-tgc 219 2168164 16s° 775 365702 cag 746 2562333 ccg-ccg 205 199382 16s° 738 17144 ggc 670 1512123 gta-gac 163 1582956 atgf 706 272620 tgg 529-480 isolé 2033754 gtg-gtg 132 913480 16s 675 1397194 agc 453 1501449 cac-cac 109 503917 16s° 547 1809249 aga 442 631460 gcg-gac 99 2168653 16s° 522 2373488 aag-aag 74 403509 16s° 502 atgj 354 538069 16s’ 495 ctc 257 913480 16s 486 ggg 114 450804 16s 465 1578553 16s 457 cag abq 246 200147 atgf 437 abq intercalaires entre aas abq intercalaires cds abq intercalaires cds 1370697 aac-tgc 220 810890 atgf 870 2641475 ggc 688 616472 ccg-ccg 206 1431525 16s 779 2766227 ggg 659 1723802 gac-gta 164 120008 16s 740 1997840 atgj 595 1165208 gtg-gtg 132 1354091 16s 676 972026 agc 493 1735337 cac-cac 109 510548 16s 615 1725057 ctc 475 1443296 gcg-gac 99 404350 16s 502 86421 ggc 455 796280 aag-aag 76 2787506 16s 496 1354448 aga 443 302206 16s 472 52318 tgg 481-363 814616 16s 452 2304295 tta 414-406 isolé 1570334 16s 444 intercalaires supérieurs à 500 pbs. agr oan abq abs 16s 2 4 6 7 aas 6 12 3 3 max 16s 633 998 870 775 max aas 793 1650 688 746 Doubles abs Doubles abq aas n doublets aas n doublets 1 39 ccg 1 38 ccg 2 10 aag 2 11 aag 3 1 gag 3 1 gag 4 gtg 4 gtg 5 1 cac 5 1 cac
abs distribution[modifier | modifier le wikicode]
- Lien tableur: abs distribution
- Notes
aag2 cac2 ccg2 gag2 gtg2 ggc: 3 1aa et 1 >1aa
g1 | t1 | ||||||
---|---|---|---|---|---|---|---|
atgi | 1 | tct | tat | atgf | 4 | ||
att | act | aat | agt | ||||
ctt | cct | cat | cgc | ||||
gtt | gct | gat | ggt | ||||
ttc | 2 | tcc | 1 | tac | 2 | tgc | 1 |
atc | 4 | acc | 2 | aac | 3 | agc | 1 |
ctc | 2 | ccc | 1 | cac | 2 | cgt | 2 |
gtc | 2 | gcc | 3 | gac | 4 | ggc | 4 |
tta | 1 | tca | 1 | taa | tga | ||
ata | aca | 1 | aaa | 1 | aga | 1 | |
cta | 1 | cca | 1 | caa | 1 | cga | |
gta | 1 | gca | 4 | gaa | 1 | gga | 1 |
ttg | 1 | tcg | 1 | tag | tgg | 2 | |
atgj | 1 | acg | 1 | aag | 2 | agg | 1 |
ctg | 3 | ccg | 2 | cag | 2 | cgg | 1 |
gtg | 2 | gcg | 2 | gag | 2 | ggg | 1 |
alpha | >1aa | =1aa | -5s | +5s | -16s | +16s | total |
abs | 30 | 39 | 3 | 8 | 80 |
Agrobacterium sp. H13-3[modifier | modifier le wikicode]
agr opérons[modifier | modifier le wikicode]
- Lien tableur: agr opérons
- Liens: gtRNAdb [30], NCBI [31], génome [orgn]
- Phylogénie: Bacteria; Proteobacteria; Alphaproteobacteria; Rhizobiales; Rhizobiaceae; Rhizobium/Agrobacterium group; Agrobacterium.
- Légende: cdsa: cds aas, cdsd: cds dirigé
59.3%GC | 29.12.19 Paris | 58 | doubles | intercal | cds | aa | avec aa | cdsa | cdsd | protéines |
---|---|---|---|---|---|---|---|---|---|---|
chromosoml | ||||||||||
comp | 1064633..1065274 | cds | 296 | 296 | 214 | hp | ||||
1065571..1065655 | ttg | 266 | 266 | |||||||
1065922..1066437 | cds | 172 | disulfide bond formation protein B | |||||||
comp | 1178605..1179114 | cds | 256 | 256 | 170 | prolyl-tRNA synthetase associated domain-containing protein | ||||
1179371..1179445 | ggc | @1 | 793 | 793 | ||||||
comp | 1180239..1180315 | atgj | 135 | 135 | ||||||
comp | 1180451..1181647 | cds | 399 | tRNA 2-thiouridine(34) synthase MnmA | ||||||
comp | 1320644..1321006 | cds | 318 | 318 | 121 | hp | ||||
comp | 1321325..1321414 | tcg | 197 | 197 | ||||||
comp | 1321612..1322493 | cds | 294 | dihydrodipicolinate synthase family protein | ||||||
comp | 1361929..1362942 | cds | 554 | 554 | 338 | sugar ABC transporter substrate-binding protein | ||||
comp | 1363497..1363571 | gtc | 81 | 81 | ||||||
comp | 1363653..1364015 | cds | 121 | response regulator | ||||||
<comp | 1426814..1427137 | cds | 105 | 105 | 108 | hp | ||||
1427243..1428733 | 16s | 337 | 1491 | |||||||
1429071..1429147 | atc | 59 | 59 | |||||||
1429207..1429282 | gca | 146 | 146 | |||||||
<comp | 1429429..1429626 | cds | @2 | 241 | 241 | 66 | P-hp | |||
1429868..1432681 | 23s | 242 | 2814 | |||||||
1432924..1433038 | 5s | 257 | 115 | |||||||
1433296..1433372 | atgf | 311 | 311 | |||||||
1433684..1434118 | cds | 145 | acetyl-CoA carboxylase biotin carboxyl carrier protein subunit | |||||||
1503534..1504520 | cds | 122 | 122 | 329 | beta-ketoacyl-ACP synthase III | |||||
comp | 1504643..1504716 | cag | 123 | 123 | ||||||
comp | 1504840..1505277 | cds | 146 | Lrp/AsnC family transcriptional regulator | ||||||
1605356..1605856 | cds | 71 | 71 | 167 | hp | |||||
comp | 1605928..1606003 | gcc | 152 | 152 | ||||||
comp | 1606156..1606545 | cds | 130 | TIGR02300 family protein | ||||||
<comp | 1687683..1688015 | cds | 105 | 105 | 111 | hp | ||||
1688121..1689611 | 16s | 337 | 1491 | |||||||
1689949..1690025 | atc | 59 | 59 | |||||||
1690085..1690160 | gca | 146 | 146 | |||||||
<comp | 1690307..1690504 | cds | 241 | 241 | 66 | P-hp | ||||
1690746..1693559 | 23s | 242 | 2814 | |||||||
1693802..1693916 | 5s | 257 | 115 | |||||||
1694174..1694250 | atgf | 203 | 203 | |||||||
comp | 1694454..1694645 | cds | 64 | hp | ||||||
<comp | 2103153..2103404 | cds | 105 | 105 | 84 | P-hp | ||||
2103510..2105000 | 16s | 337 | 1491 | |||||||
2105338..2105414 | atc | 59 | 59 | |||||||
2105474..2105549 | gca | 146 | 146 | |||||||
<comp | 2105696..2105893 | cds | 241 | 241 | 66 | P-hp | ||||
2106135..2108948 | 23s | 242 | 2814 | |||||||
2109191..2109305 | 5s | 257 | 115 | |||||||
2109563..2109639 | atgf | 633 | 633 | |||||||
2110273..2110680 | cds | 136 | membrane protein | |||||||
chromosomc | ||||||||||
<comp | 56862..57137 | cds | 105 | 105 | 92 | P-hp | ||||
57243..58733 | 16s | 337 | 1491 | |||||||
59071..59147 | atc | 59 | 59 | |||||||
59207..59282 | gca | 146 | 146 | |||||||
<comp | 59429..59626 | cds | 241 | 241 | 66 | P-hp | ||||
59868..62681 | 23s | 242 | 2814 | |||||||
62924..63038 | 5s | 257 | 115 | |||||||
63296..63372 | atgf | 196 | 196 | |||||||
63569..65377 | cds | 603 | DNA helicase RecQ | |||||||
comp | 125821..127722 | cds | 287 | 287 | 634 | molecular chaperone DnaK | ||||
comp | 128010..128099 | tcc | 220 | 220 | ||||||
128320..128637 | cds | 106 | hp | |||||||
227621..228004 | cds | 240 | 240 | 128 | membrane protein | |||||
comp | 228245..228331 | ctg | 120 | 120 | ||||||
comp | 228452..228757 | cds | 102 | SelT/SelW/SelH family protein | ||||||
> | 378307..378396 | cds | 40 | 40 | 30 | P-hp | ||||
378437..378513 | cgt | 174 | 174 | |||||||
378688..379500 | cds | 271 | class I SAM-dependent methyltransferase | |||||||
comp | 407277..407435 | cds | 167 | 167 | 53 | YqaE/Pmp3 family membrane protein | ||||
comp | 407603..407678 | acg | 137 | 137 | ||||||
comp | 407816..408778 | cds | 321 | nitronate monooxygenase | ||||||
425990..427087 | cds | 56 | 56 | 366 | 2'-deoxycytidine 5'-triphosphate deaminase | |||||
427144..427217 | ggg | 154 | 154 | |||||||
427372..428058 | cds | 229 | aquaporin Z | |||||||
458659..459081 | cds | 285 | 285 | 141 | hp | |||||
459367..459442 | ttc | 246 | 246 | |||||||
comp | 459689..460033 | cds | 115 | cation:proton antiporter | ||||||
comp | 493759..494025 | cds | 155 | 155 | 89 | hp | ||||
494181..494255 | acc | 195 | 195 | |||||||
comp | 494451..495686 | cds | 412 | flagellin | ||||||
comp | 564938..568684 | cds | 361 | 361 | 1249 | PAS domain S-box protein | ||||
569046..569122 | cac | 79 | 79 | |||||||
569202..570920 | cds | 573 | Ppx/GppA family phosphatase | |||||||
comp | 763448..764356 | cds | 202 | 202 | 303 | MBL fold metallo-hydrolase | ||||
764559..764633 | caa | 263 | 263 | |||||||
comp | 764897..766549 | cds | 551 | malate dehydrogenase (quinone) | ||||||
comp | 767020..767439 | cds | 264 | 264 | 140 | hp | ||||
767704..767780 | ccg | 159 | 159 | |||||||
comp | 767940..768260 | cds | 107 | hp | ||||||
comp | 960360..960701 | cds | 163 | 163 | 114 | hp | ||||
960865..960955 | agc | 500 | 500 | |||||||
comp | 961456..961671 | cds | 72 | hp | ||||||
1123408..1124136 | cds | 141 | 141 | 243 | hp | |||||
1124278..1124363 | tta | 241 | 241 | |||||||
1124605..1127115 | cds | 837 | copper-translocating P-type ATPase | |||||||
1154411..1154803 | cds | 91 | 91 | 131 | DUF2934 domain-containing protein | |||||
comp | 1154895..1154969 | aac | 176 | 176 | ||||||
1155146..1155424 | cds | 93 | hp | |||||||
comp | 1162767..1163027 | cds | 138 | 138 | 87 | hp | ||||
comp | 1163166..1163242 | ccc | 218 | 218 | ||||||
1163461..1163997 | cds | 179 | DUF1269 domain-containing protein | |||||||
1192452..1194650 | cds | 660 | 660 | 733 | esterase-like activity of phytase family protein | |||||
comp | 1195311..1195386 | gta | + | 446 | 446 | |||||
1195833..1195909 | gac | 2 gac | 41 | 41 | ||||||
1195951..1196027 | gac | 435 | 435 | |||||||
1196463..1196828 | cds | 122 | NADH-quinone oxidoreductase subunit A | |||||||
1421863..1422201 | cds | 134 | 134 | 113 | hp | |||||
comp | 1422336..1422425 | tca | 88 | 88 | ||||||
comp | 1422514..1422678 | cds | 55 | hp | ||||||
comp | 1468229..1469110 | cds | 180 | 180 | 294 | HNH endonuclease | ||||
comp | 1469291..1469367 | atgf | 132 | 132 | ||||||
comp | 1469500..1470450 | cds | 317 | hp | ||||||
comp | 1508458..1508883 | cds | 558 | 558 | 142 | PAS domain-containing protein | ||||
comp | 1509442..1509526 | ctc | 189 | 189 | ||||||
1509716..1510447 | cds | 244 | lipoyl(octanoyl) transferase LipB | |||||||
1531160..1531933 | cds | 447 | 447 | 258 | amino acid ABC transporter ATP-binding protein | |||||
1532381..1532455 | gaa | 121 | 121 | |||||||
1532577..1532818 | cds | 89 | 89 | 81 | P-hp | |||||
1532908..1532982 | gaa | 129 | 129 | |||||||
comp | 1533112..1534920 | cds | 603 | single-stranded-DNA-specific exonuclease RecJ | ||||||
1584509..1584763 | cds | 155 | 155 | 85 | GlsB/YeaQ/YmgE family stress response membrane protein | |||||
1584919..1584994 | aag | 134 | 134 | |||||||
comp | 1585129..1585575 | cds | 149 | hp | ||||||
comp | 1612420..1613898 | cds | 240 | 240 | 493 | trigger factor | ||||
comp | 1614139..1614221 | cta | 447 | 447 | ||||||
< | 1614669..1614876 | cds | 69 | P-hp | ||||||
comp | 1672216..1672887 | cds | 245 | 245 | 224 | protein-L-isoaspartate O-methyltransferase | ||||
comp | 1673133..1673206 | tgc | 240 | 240 | ||||||
comp | 1673447..1673599 | cds | 51 | DUF3309 family protein | ||||||
comp | 1744688..1745434 | cds | 341 | 341 | 249 | cytochrome c biogenesis protein CcdA | ||||
1745776..1745851 | aaa | 310 | 310 | |||||||
1746162..1746743 | cds | 194 | DUF1003 domain-containing protein | |||||||
comp | 1770727..1772280 | cds | 91 | 91 | 518 | tyrosine-type recombinase/integrase | ||||
comp | 1772372..1772448 | cca | 265 | 265 | ||||||
1772714..1773019 | cds | 51 | 51 | 102 | ETC complex I subunit | |||||
1773071..1773147 | aga | 7 | 7 | |||||||
comp | 1773155..1773892 | cds | 246 | DUF429 domain-containing protein | ||||||
comp | 1902337..1902537 | cds | 184 | 184 | 67 | preprotein translocase subunit SecE | ||||
comp | 1902722..1902797 | tgg | 241 | 241 | ||||||
comp | 1903039..1903845 | cds | 269 | glycosyltransferase | ||||||
1908698..1908892 | cds | 70 | 70 | 65 | hp | |||||
comp | 1908963..1909036 | gga | 26 | 26 | 26 | |||||
comp | 1909063..1909147 | tac | 209 | 209 | ||||||
1909357..1910244 | cds | 296 | 23s rRNA (guanosine(2251)-2'-O)-methyltransferase RlmB | |||||||
1922447..1922800 | cds | 55 | 55 | 118 | hp | |||||
comp | 1922856..1922931 | aca | 207 | 207 | ||||||
1923139..1924878 | cds | 580 | GGDEF domain-containing protein | |||||||
2079925..2080287 | cds | 156 | 156 | 121 | hp | |||||
comp | 2080444..2080519 | atgi | 178 | 178 | ||||||
2080698..2081441 | cds | 248 | SIMPL domain-containing protein | |||||||
comp | 2275632..2276138 | cds | 522 | 522 | 169 | winged helix-turn-helix transcriptional regulator | ||||
2276661..2276737 | cgg | 287 | 287 | |||||||
2277025..2277264 | cds | 80 | hp | |||||||
comp | 2388300..2388497 | cds | 87 | 87 | 66 | hp | ||||
2388585..2388659 | ggc | 361 | 361 | |||||||
2389021..2391024 | cds | 668 | methyl-accepting chemotaxis protein | |||||||
comp | 2490745..2491854 | cds | 535 | 535 | 370 | 2Fe-2S iron-sulfur cluster binding domain-containing protein | ||||
comp | 2492390..2492466 | atgf | 287 | 115 | ||||||
comp | 2492754..2492868 | 5s | 242 | 2814 | ||||||
comp | 2493111..2495924 | 23s | 241 | 241 | ||||||
> | 2496166..2496363 | cds | 146 | 146 | 66 | P-hp | ||||
comp | 2496510..2496585 | gca | 59 | 59 | ||||||
comp | 2496645..2496721 | atc | 337 | |||||||
comp | 2497059..2498549 | 16s | 105 | 105 | 1491 | |||||
> | 2498655..2498930 | cds | 92 | P-hp |
agr cumuls[modifier | modifier le wikicode]
- Lien tableur: agr cumuls
opérons | Fréquences intercalaires tRNAs | Fréquences intercalaires cds | Fréquences aas cds chromosome | ||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
effectif | gammes | sans rRNAs | avec rRNAs | gammes | cds | gammes | cdsd | gammes | cdsa | gammes | cdsa 300 | ||
avec rRNA | opérons | 5 | 1 | 1 | 0 | 1 | 100 | 24 | 1 | 0 | |||
16atcgca235 | 0 | 20 | 50 | 3 | 40 | 200 | 30 | 30 | 1 | ||||
Id-atgf | 5 | 40 | 1 | 100 | 12 | 80 | 300 | 14 | 60 | 3 | |||
16s23s | 0 | 60 | 1 | 5 | 150 | 22 | 120 | 400 | 8 | 90 | 17 | ||
max a | 3 | 80 | 200 | 17 | 160 | 500 | 2 | 120 | 13 | ||||
a doubles | 0 | 100 | 250 | 18 | 200 | 600 | 4 | 150 | 14 | ||||
spéciaux | 0 | 120 | 300 | 9 | 240 | 700 | 4 | 180 | 5 | ||||
total aas | 15 | 140 | 350 | 4 | 280 | 800 | 1 | 210 | 1 | ||||
sans | opérons | 38 | 160 | 400 | 2 | 320 | 900 | 1 | 240 | 3 | |||
1 aa | 35 | 180 | 450 | 3 | 360 | 1000 | 0 | 270 | 7 | ||||
max a | 3 | 200 | 500 | 1 | 400 | 1100 | 0 | 300 | 4 | ||||
a doubles | 1 | 2 | 6 | 1 | 21 | ||||||||
total aas | 42 | 4 | 5 | 97 | 0 | 89 | 89 | ||||||
total aas | 57 | ||||||||||||
remarques | 2 | ||||||||||||
avec jaune | moyenne | 59 | 213 | 230 | |||||||||
variance | 0 | 134 | 209 | ||||||||||
sans jaune | moyenne | 33 | 172 | 185 | 137 | ||||||||
variance | 76 | 131 | 71 |
agr tRNA-cds[modifier | modifier le wikicode]
- Note: intercalaires prélevés de la colonne cds de agr opérons dans un bloc de tRNAs uniquement. Le début du bloc est dans l'ordre des adresses, deb intercalaire entre le cds et le 1er tRNA dd bloc, fin entre le dernier tRNA et le cds terminal. J'ai procédé, dans les colonnes petit et grand, à la réorientation des blocs d'après la constatation que les blocs à rRNA ont leurs cds de début et de fin sont orientés du cds-16s au 5s-tRNAs-cds, l'intercalaire cds-16s étant plus grands que l'intercalaire avec le cds terminal. En tête de colonne est le % du nombre des intercalaires inférieurs à 201 pbs.
agr 55 55 34 76 deb fin deb fin grand petit grand petit 40 174 51 7 51 7 51 7 51 7 361 79 123 122 174 40 55 207 554 81 129 89 207 55 56 154 134 88 134 88 154 56 70 209 240 120 152 71 209 70 71 152 447 121 154 56 152 71 87 361 122 123 155 134 361 79 89 129 89 129 167 137 554 81 91 176 180 132 174 40 361 87 91 265 155 134 176 91 134 88 122 123 256 135 178 156 129 89 134 88 167 137 180 132 176 91 138 218 71 152 195 155 265 91 141 241 56 154 207 55 240 120 155 195 264 159 209 70 447 121 155 134 40 174 218 138 123 122 156 178 91 176 240 120 180 132 163 500 156 178 241 141 155 134 167 137 558 189 241 184 256 135 180 132 155 195 245 240 167 137 184 241 318 197 256 135 218 138 202 263 55 207 263 202 241 141 240 120 70 209 264 159 195 155 240 447 138 218 265 91 178 156 245 240 287 220 285 246 264 159 256 135 245 240 287 220 500 163 264 159 141 241 296 266 241 184 285 246 184 241 318 197 558 189 287 220 285 246 341 310 318 197 296 266 202 263 361 79 263 202 318 197 91 265 361 87 287 220 341 310 296 266 447 121 245 240 361 79 522 287 447 240 447 240 447 121 341 310 500 163 285 246 522 287 87 361 522 287 296 266 554 81 660 435 554 81 522 287 558 189 240 447 558 189 341 310 660 435 163 500 660 435 660 435
- Comparaison cds-cds tRNA-cds: deb fin, c'est l'ordre des adresses et grand petit l'ordre après réorientation. Leur pourcentage est calculé par rapport à la colonne, c'est à dire la moitié du total des tRNA-cds.
alpha cds total total <0 0-200 201-370 371-600 >600 deb fin grand petit agr 5,159 76 42 26 7 1 21 21 13 29 ‰ 553 342 92 13 553 553 342 763
agr blocs[modifier | modifier le wikicode]
- Lien tableur: agr blocs
- Légende:
- CoA acetyl-CoA carboxylase biotin carboxyl carrier protein subunit
- helicase DNA helicase RecQ
- 2Fe-2S 2Fe-2S iron-sulfur cluster binding domain-containing protein
- membrane membrane protein
- hp hypothetical protein
- p-hp pseudo hp
chromomel | intercal | cdsa | intercal | cdsa | intercal | cdsa | |||
---|---|---|---|---|---|---|---|---|---|
cds | 105 | 108 | hp | 105 | 111 | hp | 105 | 84 | P-hp |
16s | 337 | 1491 | 337 | 1491 | 337 | 1491 | |||
atc | 59 | 59 | 59 | ||||||
gca | 146 | 146 | 146 | ||||||
cds | 241 | 66 | P-hp | 241 | 66 | P-hp | 241 | 66 | P-hp |
23s | 242 | 2814 | 242 | 2814 | 242 | 2814 | |||
5s | 257 | 115 | 257 | 115 | 257 | 115 | |||
atgf | 311 | 203 | 633 | ||||||
cds | 145 | CoA | 64 | hp | 136 | membrane | |||
chromosomec | |||||||||
cds | 105 | 92 | P-hp | 105 | 92 | P-hp | |||
16s | 337 | 1491 | 337 | 1491 | |||||
atc | 59 | 59 | |||||||
gca | 146 | 146 | |||||||
cds | 241 | 66 | P-hp | 241 | 66 | P-hp | |||
23s | 242 | 2814 | 242 | 2814 | |||||
5s | 257 | 115 | 287 | 115 | |||||
atgf | 196 | 535 | |||||||
cds | 603 | helicase | 370 | 2Fe-2S |
agr remarques[modifier | modifier le wikicode]
- Remarques
- @: Par rapport aux rickettsia rtb et rpl, les intercalaires élevés sont rares et faibles, 6 sur 38 aas sont entre 500 et 793. Voir tableau ci-dessous.
- - un seul aa isolé, gta , 660-446.
- - 2 intercalaires élevés entre 2 aas, ggc-atgi 793 et gta-gac 446. Le 1er est du même ordre que celui de rtb et rpl, 1051 830.
- - Les intercalaires entre aas: Il y en a quatre comme les rickettsia, 793 446 41 26. Les 2 petits sont proches de la moyenne de cette étude de 15 pbs.
- - Les intercalaires avec un cds. Ils sont très faibles sur les 38 aas un seul atteint 660 pbs les autres élevés se répartissent en 4 entre 500-558 et 3 entre 435-447. Ces valeurs sont analogues à ceux des blocs à rRNA, 535 et 633 tout à fait courants dans le haut de gamme de cette étude. Les 30 aas restants ont des intercalaires cds inférieurs à 400 dont 3 seulement dépassent les 300, cac aaa ggc.
- @ Les cds dans les blocs à rRNAs. Voir agr blocs.
- - Les 5 blocs sont identiques qu’ils soient sur le chromosome linéaire ou circulaire. C’est comme une duplication répétée 5 fois.
- - Le cds interne a toutes les caractéristiques d’un candidat à la création: interne, hypothétique et petit. La caractéristique pseudo est encore un indice très fort de la genèse, la séquence acquiera plus tard le codon initial et le codon stop ou tout autre complément imposé par le système de réparation contraint par l’évolution de l’environnement du génome.
- - On retrouve la situation du génome oan, avec un p-hp de 63 aas contre 66 ici. Ces 2 génomes se ressemblent beaucoup,
- + DNAa total identique oan et agr 4,8 mega, 2 chromosomes dont 1 linéaire pour agr. Tous les blocs se terminent par atgf et sont complets.
- + Beaucoup de cds hp externes.
- - Chez agr, 5 hp dont 3 p-hp au-dessus de 16s de la même taille que le p-hp interne. Ils se comportent comme lui, quasimment même petite taille et des intercalaires identiques de 105 pbs. Ces 10 cds font partie intégrante du processus de réparation ou de conversion qui a créé les 5 blocs. Après 5s 3 cds de petites tailles dont un hpcomme ceux au-dessus du 16s. Donc 2 cds bien caractérisés se comportant comme le p-hp interne candidat à la création. Cependant ces 3 cds apparemment ne font pas partie intégrante du processus de conversion puisque leurs intercalaires avec atgf varient beaucoup de 203 à 633, comme les 2 restant.
- - Chez oan seulement 2 cds de 57 aas sur un total de 8 cds. Ils sont bien caractérisés.
- - La question qui se pose alors est : est-ce que ces 10 cds analogues aux internes peuvent ils être des candidats à la création?
- - Note du 4.10.20: les 5 cds disparaissent dans NCBI du 12.4.20, après contrôle.
- @: Par rapport aux rickettsia rtb et rpl, les intercalaires élevés sont rares et faibles, 6 sur 38 aas sont entre 500 et 793. Voir tableau ci-dessous.
- Séquence des doubles: très peu de doubles, 1 doublets pour 38 opérons à aas.
- Tableau des intercalaires élevés
aas adresse pbs note ggc 1179371 793 aa-aa gta 1195311 660-446 isolé ctc 1509442 558 gtc 1363497 554 cgg 2276661 522 agc 960865 500 gaa 1532381 447 cta 1614139 447 gac 1195833 446 aa-aa gac 1195951 435 cac 569046 361 aaa 1745776 341-310 ggc 2388585 361 atgf 2492390 535 5s-aa atgf 2109563 633 5s-aa
agr distribution[modifier | modifier le wikicode]
- Lien tableur: agr distribution
- Notes: gac2
g1 | t1 | ||||||
---|---|---|---|---|---|---|---|
atgi | 1 | tct | tat | atgf | 6 | ||
att | act | aat | agt | ||||
ctt | cct | cat | cgc | ||||
gtt | gct | gat | ggt | ||||
ttc | 1 | tcc | 1 | tac | 1 | tgc | 1 |
atc | 5 | acc | 1 | aac | 1 | agc | 1 |
ctc | 1 | ccc | 1 | cac | 1 | cgt | 1 |
gtc | 1 | gcc | 1 | gac | 2 | ggc | 2 |
tta | 1 | tca | 1 | taa | tga | ||
ata | aca | 1 | aaa | 1 | aga | 1 | |
cta | 1 | cca | 1 | caa | 1 | cga | |
gta | 1 | gca | 5 | gaa | 2 | gga | 1 |
ttg | 1 | tcg | 1 | tag | tgg | 1 | |
atgj | 1 | acg | 1 | aag | 1 | agg | |
ctg | 1 | ccg | 1 | cag | 1 | cgg | 1 |
gtg | gcg | gag | ggg | 1 | |||
alpha | >1aa | =1aa | -5s | +5s | -16s | +16s | total |
agr | 7 | 35 | 5 | 10 | 57 |
Aureimonas sp. AU20[modifier | modifier le wikicode]
aua opérons[modifier | modifier le wikicode]
- Lien tableur: aua opérons
- Liens: gtRNAdb [], NCBI [32], génome [orgn], pau20rrn [33]
- Phylogénie: Bacteria; Proteobacteria; Alphaproteobacteria; Rhizobiales; Aurantimonadaceae; Aureimonas.
- Légende: cdsa: cds aas, cdsd: cds dirigé
- Note: il n'y a pas de gtRNAdb. Aussi j'ai comparé (EXACT NB.CAR STXT) les 1ers atgf atgi atgj du génome cdc, avec les atg de aua sauf atgi qui est défini dans NCB. Les 2 atgf de atgf2 (331629..331705) sont identiques.
67%GC | 8.8.19 Paris | 55 | doubles | intercal | cds | aa | avec aa | cdsa | cdsd | protéines |
---|---|---|---|---|---|---|---|---|---|---|
pAU20rrn | ||||||||||
324..1028 | CDS rep | 461 | 235 | replication initiation protein | ||||||
comp | 1490..1604 | 5s | @1 | 82 | 115 | |||||
comp | 1687..4515 | 23s | -15 | 2829 | ||||||
comp | 4501..4851 | CDS hp | 142 | 117 | hp | |||||
comp | 4994..5069 | gca | 33 | 33 | ||||||
comp | 5103..5179 | atc | 233 | |||||||
comp | 5413..6898 | 16s | 1752 | 1486 | ||||||
comp | 8651..9109 | CDS hp | 153 | hp | ||||||
Chromosome | ||||||||||
comp | 170900..171925 | CDS | 368 | 368 | 342 | |||||
172294..172378 | ctg | 130 | 130 | 130 | ||||||
172509..172772 | CDS | 88 | ||||||||
comp | 330094..330690 | CDS | 338 | 338 | 199 | |||||
331029..331103 | ggc | @2 | 404 | 404 | ||||||
comp | 331508..331584 | atgf | + | 44 | 44 | |||||
comp | 331629..331705 | atgf | 2 atg | 255 | 255 | 255 | ||||
comp | 331961..333217 | CDS | 419 | |||||||
344949..346025 | CDS | 589 | 589 | 359 | 589 | |||||
346615..346704 | tcg | 609 | 609 | |||||||
347314..348471 | CDS | 386 | ||||||||
comp | 393335..395356 | CDS | 800 | 800 | 674 | |||||
comp | 396157..396232 | gcc | 439 | 439 | 439 | |||||
comp | 396672..397094 | CDS | 141 | |||||||
635177..637537 | CDS | 640 | 640 | 787 | ||||||
comp | 638178..638253 | gcg | 182 | 182 | 182 | |||||
638436..638738 | CDS | 101 | ||||||||
comp | 924507..925466 | CDS | 529 | 529 | 320 | |||||
comp | 925996..926085 | tcc | 349 | 349 | 349 | |||||
926435..926767 | CDS | 111 | ||||||||
1216789..1217439 | CDS | 60 | 60 | 217 | 60 | |||||
1217500..1217576 | agg | 68 | 68 | |||||||
comp | 1217645..1218760 | CDS | 372 | |||||||
1350534..1352180 | CDS | @4 | -30 | -30 | 549 | |||||
comp | 1352151..1352227 | cgt | + | 51 | 51 | |||||
comp | 1352279..1352355 | cgt | 2 cgt | 169 | 169 | |||||
comp | 1352525..1353967 | CDS | 481 | |||||||
1401921..1402442 | CDS | 142 | 142 | 174 | 142 | |||||
1402585..1402661 | cac | 585 | 585 | |||||||
1403247..1404875 | CDS | 543 | ||||||||
1544580..1546277 | CDS | 455 | 455 | 566 | ||||||
comp | 1546733..1546808 | ttc | @2 | 161 | 161 | |||||
1546970..1547044 | acc | 414 | 414 | 414 | ||||||
1547459..1549516 | CDS | 686 | ||||||||
1609269..1610216 | CDS | 278 | 278 | 316 | ||||||
comp | 1610495..1610571 | cgg | 121 | 121 | 121 | |||||
comp | 1610693..1611427 | CDS | 245 | |||||||
> | 1683255..1683581 | CDS | 209 | 209 | 109 | 209 | ||||
comp | 1683791..1683864 | cag | 580 | 580 | ||||||
1684445..1685734 | CDS | 430 | ||||||||
1700827..1701852 | CDS | 300 | 300 | 342 | ||||||
comp | 1702153..1702227 | gtc | + | 128 | 128 | |||||
comp | 1702356..1702430 | gtc | 3 gtc | 186 | 186 | |||||
comp | 1702617..1702691 | gtc | 68 | 68 | 68 | |||||
comp | 1702760..1703125 | CDS | 122 | |||||||
1946715..1946936 | CDS | 6 | 6 | 74 | 6 | |||||
comp | 1946943..1947018 | atgi | 105 | 105 | ||||||
1947124..1947345 | CDS | 74 | ||||||||
1981934..1983139 | CDS | 139 | 139 | 402 | 139 | |||||
1983279..1983368 | agc | 825 | 825 | |||||||
1984194..1985339 | CDS | 382 | ||||||||
1996083..1997171 | CDS | 243 | 243 | 363 | ||||||
comp | 1997415..1997490 | acg | 112 | 112 | 112 | |||||
comp | 1997603..1998583 | CDS | 327 | |||||||
comp | 2263930..2264781 | CDS | 30 | 30 | 284 | 30 | ||||
comp | 2264812..2264886 | gtg | 111 | 111 | ||||||
comp | 2264998..2265768 | CDS | 257 | |||||||
2363764..2364786 | CDS | 18 | 18 | 341 | 18 | |||||
comp | 2364805..2364879 | gaa | + | 140 | 140 | |||||
comp | 2365020..2365094 | gaa | 2 gaa | 69 | 69 | 69 | ||||
comp | 2365164..2366144 | CDS | 327 | |||||||
2367774..2368247 | CDS | 105 | 105 | 158 | ||||||
2368353..2368429 | cca | @3 | 43 | 43 | 43 | |||||
2368473..2368778 | CDS | 36 | 36 | 102 | 36 | |||||
2368815..2368890 | aga | 448 | 448 | |||||||
2369339..2369929 | CDS | 197 | ||||||||
comp | 2401620..2402732 | CDS | 155 | 155 | 371 | 155 | ||||
comp | 2402888..2402963 | aaa | 169 | 169 | ||||||
2403133..2403870 | CDS | 246 | ||||||||
2419689..2420852 | CDS | 13 | 13 | 388 | 13 | |||||
2420866..2420955 | tca | 238 | 238 | |||||||
2421194..2421934 | CDS | 247 | ||||||||
comp | 2601493..2601858 | CDS | 287 | 287 | 122 | 287 | ||||
comp | 2602146..2602222 | gac | + | 58 | 58 | |||||
comp | 2602281..2602357 | gac | 2 gac | 270 | 270 | |||||
2602628..2602703 | gta | @2 | 330 | 330 | ||||||
comp | 2603034..2603312 | CDS | 93 | |||||||
comp | 2608494..2609852 | CDS | 73 | 73 | 453 | 73 | ||||
comp | 2609926..2610009 | cta | 307 | 307 | ||||||
2610317..2610460 | CDS | 48 | ||||||||
comp | 2641174..2641824 | CDS | @3 | 125 | 125 | 217 | 125 | |||
comp | 2641950..2642023 | tgc | 153 | 153 | ||||||
comp < | 2642177..2642443 | CDS | 296 | 296 | 89 | |||||
2642740..2642814 | aac | 269 | 269 | 269 | ||||||
2643084..2644127 | CDS | 348 | ||||||||
comp | 2651145..2652935 | CDS | 239 | 239 | 597 | 239 | ||||
2653175..2653259 | tta | 265 | 265 | |||||||
2653525..2653725 | CDS | 67 | ||||||||
comp | 2749758..2750318 | CDS | 3102 | 3102 | 187 | |||||
comp | 2753421..2753497 | atgf | 83 | 83 | 83 | |||||
comp | 2753581..2754180 | CDS | 200 | |||||||
2768127..2769224 | CDS | 63 | 63 | 366 | 63 | |||||
comp | 2769288..2769364 | ccg | @2 | 173 | 173 | |||||
2769538..2769612 | caa | 528 | 528 | |||||||
comp | 2770141..2770566 | CDS | 142 | |||||||
comp | 2787112..2788920 | CDS | 217 | 217 | 603 | 217 | ||||
comp | 2789138..2789214 | ccc | 265 | 265 | ||||||
comp | 2789480..2790022 | CDS | 181 | |||||||
2927857..2928789 | CDS | 136 | 136 | 311 | 136 | |||||
comp | 2928926..2929010 | ctc | + | 132 | 132 | |||||
comp | 2929143..2929227 | ctc | 2 ctc | 175 | 175 | |||||
2929403..2930164 | CDS | 254 | ||||||||
comp | 2971057..2971257 | CDS | 130 | 130 | 67 | |||||
comp | 2971388..2971463 | tgg | 53 | 53 | 53 | |||||
comp | 2971517..2972374 | CDS | 286 | |||||||
comp | 2973322..2974497 | CDS | 291 | 291 | 392 | |||||
comp | 2974789..2974862 | gga | 24 | 24 | ||||||
comp | 2974887..2974971 | tac | 259 | 259 | 259 | |||||
2975231..2976097 | CDS | 289 | ||||||||
comp | 2979955..2981049 | CDS | 221 | 221 | 365 | |||||
2981271..2981346 | aca | 55 | 55 | 55 | ||||||
comp | 2981402..2981752 | CDS | 117 | |||||||
comp | 3063743..3064045 | CDS | 106 | 106 | 101 | 106 | ||||
comp | 3064152..3064227 | aag | 147 | 147 | ||||||
comp | 3064375..3064803 | CDS | 143 | |||||||
comp | 3194307..3194906 | CDS | 249 | 249 | 200 | |||||
3195156..3195232 | atgj | 173 | 173 | 173 | ||||||
3195406..3196356 | CDS | 317 | ||||||||
comp | 3206006..3206455 | CDS | 743 | 743 | 150 | |||||
comp | 3207199..3207273 | gag | 50 | 50 | 50 | |||||
comp | 3207324..3207689 | CDS | 122 | |||||||
3398165..3399901 | CDS | 554 | 554 | 579 | ||||||
3400456..3400530 | aac | 115 | 115 | 115 | ||||||
3400646..3400924 | CDS | 93 | ||||||||
3401737..3403497 | CDS | 227 | 227 | 587 | ||||||
comp | 3403725..3403799 | ggc | 208 | 208 | ||||||
comp | 3404008..3404082 | ggg | 74 | 74 | 74 | |||||
comp | 3404157..3404819 | CDS | 221 | |||||||
comp | 3597872..3598414 | CDS | 370 | 370 | 181 | |||||
3598785..3598869 | ttg | 151 | 151 | 151 | ||||||
comp | 3599021..3599251 | CDS | 77 |
aua cumuls[modifier | modifier le wikicode]
- Lien tableur: aua cumuls
opérons | Fréquences intercalaires tRNAs | Fréquences intercalaires cds | Fréquences aas cds chromosome | ||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
effectif | gammes | sans rRNAs | avec rRNAs | gammes | cds | gammes | cdsd | gammes | cdsa | gammes | cdsa 300 | ||
avec rRNA | opérons | 1 | 1 | 0 | - | 1 | 1 | 1 | 0 | 100 | 10 | 1 | 0 |
16 aas 23 5s | 0 | 20 | 0 | 50 | 7 | 40 | 7 | 200 | 22 | 30 | 0 | ||
16 atc gca hp | 1 | 40 | 1 | 100 | 10 | 80 | 9 | 300 | 11 | 60 | 1 | ||
16 cds 23 5s | 0 | 60 | 3 | 150 | 14 | 120 | 9 | 400 | 20 | 90 | 7 | ||
max a | 2 | 80 | 0 | 200 | 8 | 160 | 4 | 500 | 5 | 120 | 8 | ||
a doubles | 0 | 100 | 0 | 250 | 8 | 200 | 3 | 600 | 6 | 150 | 7 | ||
spéciaux | 0 | 120 | 0 | 300 | 10 | 240 | 4 | 700 | 3 | 180 | 2 | ||
total aas | 2 | 140 | 3 | 350 | 4 | 280 | 1 | 800 | 1 | 210 | 7 | ||
sans | opérons | 38 | 160 | 0 | 400 | 2 | 320 | 900 | 0 | 240 | 3 | ||
1 aa | 26 | 180 | 2 | 450 | 3 | 360 | 2 | 1000 | 0 | 270 | 5 | ||
max a | 3 | 200 | 1 | 500 | 1 | 400 | 1100 | 0 | 300 | 3 | |||
a doubles | 6 | 3 | 12 | 1 | 0 | 35 | |||||||
total aas | 53 | 13 | 0 | 80 | 40 | 78 | 78 | ||||||
total aas | 55 | ||||||||||||
remarques | 4 | ||||||||||||
avec jaune | moyenne | ||||||||||||
variance | |||||||||||||
sans jaune | moyenne | 131 | 226 | 153 | 235 | 158 | |||||||
variance | 75 | 165 | 128 | 125 | 69 |
aua tRNA-cds[modifier | modifier le wikicode]
- Note: intercalaires prélevés de la colonne cds de aua opérons dans un bloc de tRNAs uniquement. Le début du bloc est dans l'ordre des adresses, deb intercalaire entre le cds et le 1er tRNA dd bloc, fin entre le dernier tRNA et le cds terminal. J'ai procédé, dans les colonnes petit et grand, à la réorientation des blocs d'après la constatation que les blocs à rRNA ont leurs cds de début et de fin sont orientés du cds-16s au 5s-tRNAs-cds, l'intercalaire cds-16s étant plus grands que l'intercalaire avec le cds terminal. En tête de colonne est le % du nombre des intercalaires inférieurs à 201 pbs.
aua 43 58 28 73 deb fin deb fin grand petit grand petit -30 169 105 43 68 60 169 -30 6 105 743 50 69 18 105 6 13 238 130 53 105 43 238 13 18 69 221 55 105 6 69 18 30 111 60 68 111 30 111 30 36 448 300 68 130 53 448 36 60 68 18 69 147 106 105 43 63 528 227 74 153 125 743 50 73 307 3102 83 169 -30 130 53 105 43 6 105 169 155 221 55 106 147 30 111 175 136 68 60 125 153 243 112 221 55 528 63 130 53 554 115 227 74 300 68 136 175 278 121 238 13 307 73 139 825 368 130 243 112 227 74 142 585 106 147 249 173 3102 83 155 169 370 151 265 217 147 106 209 580 125 153 265 239 243 112 217 265 -30 169 278 121 554 115 221 55 155 169 291 259 278 121 227 74 249 173 296 269 153 125 239 265 136 175 300 68 368 130 243 112 640 182 307 73 175 136 249 173 13 238 330 287 825 139 278 121 338 255 338 255 585 142 287 330 291 259 368 130 370 151 291 259 217 265 370 151 169 155 296 269 239 265 448 36 249 173 300 68 296 269 455 414 640 182 338 255 73 307 528 63 580 209 368 130 287 330 529 349 265 217 370 151 529 349 554 115 265 239 455 414 455 414 580 209 338 255 529 349 800 439 585 142 291 259 554 115 36 448 609 589 296 269 589 609 63 528 640 182 330 287 640 182 209 580 743 50 529 349 743 50 142 585 800 439 455 414 800 439 589 609 825 139 800 439 3102 83 139 825 3102 83 609 589
- Comparaison cds-cds tRNA-cds: deb fin, c'est l'ordre des adresses et grand petit l'ordre après réorientation. Leur pourcentage est calculé par rapport à la colonne, c'est à dire la moitié du total des tRNA-cds.
alpha cds total total <0 0-200 201-370 371-600 >600 deb fin grand petit aua 4,721 80 1 39 24 10 6 16 23 11 28 ‰ 13 488 300 125 75 400 575 275 700
aua blocs[modifier | modifier le wikicode]
- Lien tableur: aua blocs
CDS | 1752 | 153 | hp |
16s | 233 | 1486 | |
atc | 33 | ||
gca | 142 | ||
CDS | -15 | 117 | hp |
23s | 82 | 2829 | |
5s | 461 | 115 | |
CDS | 235 | replication initiation protein |
aua remarques[modifier | modifier le wikicode]
- cds de 77 aas: MIVLIAHVHQTSSEDEGERDEQDGFFSSLSALNTGPRATGVGVLRRRSASSRALDGRELAKDQLPETDPDNGGQAR
324..1028 | cds | 461 | 235 | replication initiation protein | |
comp | 1490..1604 | 5s | 82 | 115 | |
comp | 1687..4515 | 23s | -6 | 2829 | |
4510..4740 | cds | 253 | 77 | hp | |
comp | 4994..5069 | gca | 33 | ||
comp | 5103..5179 | atc | 236 | ||
comp | 5416..6898 | 16s | 718 | 1483 | |
comp | 7617..8363 | cds | 287 | 249 | hp |
comp | 8651..9178 | cds | 176 | excisionase family DNA-binding protein |
- Remarques: Le seul génome de cette étude dont l’unique bloc rRNA est dans un tout petit plasmide de 9 kpbs pour un chromosome circulaire de 3 742 793 pbs.
- @ Une protéine candidate à la création est dans le bloc rRNA, hp, petite taille de 77 aas avec un intercalaire négatif avec 23s (voir prélèvement du 6.1.20 ci-dessus)
- @ Des intercalaires entre aas très élevés par rapport aux clusters à plusieurs aas étudiés. Trois très élevés au-delà de 200 pbs, 44 270 208, trois supérieurs à 160, 161 173 186. Alors que la moyenne des autres génomes est autour de 15 pbs.
- @ A l’adresse 2367774, deux aas séparés par un cds à très faibles intercalaires, 43 et 36 pbs. Le cds a une taille de 102 aas. Est-ce un candidat à la création? La même situation se retrouve à l’adresse 2641174, avec des intervals moyens, 153 2936 mais le cds a encore une taille plus petite 89 aas.
- @ Un intercalaire négatif qui souligne surtout la proximité d’un aa et d’un cds se trouvant sur 2 brins différents. Ceci est du certainement aux processus de conversion génique qui agissent sur les blocs à rRNA, ici ceux-là ont disparus laissant cette configuration. Les 2 cds entourant les 2 aas sont énormes, 500 aas environs, et ne sont donc pas candidats à la création.
- Note: En séparant les tRNAs des 2 clusters du @3 le spectre des blocs sans rRNA est le suivant
aas effectif total 1 30 30 2 7 14 3 3 9 total aas 53
- Séquences des doubles: La caractéristique principale des doublons pour ce génome est la grandeur de leurs inteercalaires. Les blocs à doublons se répartissent en
- - 3 blocs à 2 aas doubles, cgt gaa ctc, séparés entre eux par respectivement, 51 140 132 pbs.
- - 2 blocs à 3 aas dont un doublet chacun, ggc atg atg et gta gac gac, avec respectivement entre les doubles 44 et 58 pbs
- - 1 bloc avec un triplet gtc avec les intercalaires de 128 186 pbs.
aua distribution[modifier | modifier le wikicode]
- Lien tableur: aua distribution
- Notes: ctc2 gtc3 gac2 gaa2 cgt2 atgf2
g1 | t1 | ||||||
---|---|---|---|---|---|---|---|
atgi | 1 | tct | tat | atgf | 3 | ||
att | act | aat | agt | ||||
ctt | cct | cat | cgc | ||||
gtt | gct | gat | ggt | ||||
ttc | 1 | tcc | 1 | tac | 1 | tgc | 1 |
atc | 1 | acc | 1 | aac | 2 | agc | 1 |
ctc | 2 | ccc | 1 | cac | 1 | cgt | 2 |
gtc | 3 | gcc | 1 | gac | 2 | ggc | 2 |
tta | 1 | tca | 1 | taa | tga | ||
ata | aca | 1 | aaa | 1 | aga | 1 | |
cta | 1 | cca | 1 | caa | 1 | cga | |
gta | 1 | gca | 1 | gaa | 2 | gga | 1 |
ttg | 1 | tcg | 1 | tag | tgg | 1 | |
atgj | 1 | acg | 1 | aag | 1 | agg | 1 |
ctg | 1 | ccg | 1 | cag | 1 | cgg | 1 |
gtg | 1 | gcg | 1 | gag | 1 | ggg | 1 |
alpha | >1aa | =1aa | -5s | +5s | -16s | +16s | total |
aua | 23 | 30 | 2 | 55 |
alpha synthèse[modifier | modifier le wikicode]
- Liens aux indices des clades: alpha bacilli gamma actino clostridia bacteroide cyano tener spiro beta epsilon delta bactéries
- Liens aux fiches: spiro tener gama alpha beta delta epsilon bacilli clostridia autres firmicutes actino bactero cyano archeo
alpha distribution par génome[modifier | modifier le wikicode]
- Lien tableur: alpha distribution par génome
baci | >1aa | 1aa | -5s | +5s | -16s | +16s | duplica | 1-3aas | total |
rtb | 8 | 25 | 0 | 33 | |||||
rpm | 7 | 30 | 8 | 42 | 5 | 92 | |||
rru | 4 | 36 | 8 | 4 | 3 | 55 | |||
oan | 6 | 41 | 8 | 4 | 59 | ||||
abq | 20 | 38 | 16 | 10 | 3 | 87 | |||
abs | 20 | 39 | 8 | 10 | 3 | 80 | |||
agr | 5 | 35 | 10 | 2 | 5 | 57 | |||
aua | 10 | 30 | 2 | 13 | 55 | ||||
total | 80 | 274 | 0 | 0 | 0 | 60 | 81 | 23 | 518 |
alpha distribution du total[modifier | modifier le wikicode]
- Lien tableur: alpha distribution du total
- - Couleurs du 1er tableau: voir bacilli
- - Couleurs du 2ème tableau: d'après les couleurs du pieds du tableau
- - Tableau des indices, en-tête: total génomes, total tRNAs, indice ttt, indice tgt.
|
|
|
alpha distribution par type[modifier | modifier le wikicode]
- Lien tableur: alpha distribution par type
- Légende: voir bacilli
|
|
|
alpha par rapport au groupe de référence[modifier | modifier le wikicode]
- Lien tableur: alpha par rapport au groupe de référence
- Le groupe de référence: voir la référence
- Légende:
- - carré ccc, c'est ctc gtc ccc gcc
- - g+cga, c'est gtg xcg xag ggg cga (dans l'hypothèse de la bascule des cgx, cgt/cgc cga/cgg)
tRNAs | blocs tRNAs | blocs rRNAs | |||||||
alpha8 | 1aa | >1aa | dup | +5s | 1-3aas | autres | total | ||
---|---|---|---|---|---|---|---|---|---|
21 | faible | 90 | 14 | 38 | 142 | ||||
16 | moyen | 103 | 15 | 16 | 60 | 134 | |||
14 | fort | 81 | 51 | 27 | 23 | 182 | |||
274 | 80 | 81 | 23 | 60 | 518 | ||||
10 | g+cga | 46 | 6 | 27 | 79 | ||||
2 | agg+cgg | 13 | 1 | 14 | |||||
4 | carre ccc | 30 | 7 | 11 | 48 | ||||
5 | autres | 1 | 1 | ||||||
90 | 14 | 38 | 142 | ||||||
total tRNAs ‰ | |||||||||
alpha8 | 1aa | >1aa | dup | +5s | 1-3aas | autres | alpha ‰ | ref.‰ | |
21 | faible | 174 | 27 | 73 | 274 | 26 | |||
16 | moyen | 199 | 29 | 31 | 116 | 259 | 324 | ||
14 | fort | 156 | 98 | 52 | 44 | 351 | 650 | ||
529 | 154 | 156 | 44 | 116 | 518 | 729 | |||
10 | g+cga | 89 | 12 | 52 | 153 | 10 | |||
2 | agg+cgg | 25 | 2 | 0 | 27 | ||||
4 | carre ccc | 58 | 14 | 21 | 93 | 16 | |||
5 | autres | 2 | 0 | 0 | 2 | ||||
174 | 27 | 73 | 274 | ||||||
blocs tRNAs ‰ | total colonne % | ||||||||
alpha8 | 1aa | >1aa | dup | total | ref.‰ | 1aa | >1aa | dup | |
21 | faible | 207 | 32 | 87 | 326 | 26 | 33 | 18 | 47 |
16 | moyen | 237 | 34 | 37 | 308 | 324 | 38 | 19 | 20 |
14 | fort | 186 | 117 | 62 | 366 | 650 | 30 | 64 | 33 |
630 | 184 | 186 | 435 | 729 | 274 | 80 | 81 | ||
10 | g+cga | 106 | 14 | 62 | 182 | 10 | 51 | 71 | |
2 | agg+cgg | 30 | 2 | 0 | 32 | 14 | |||
4 | carre ccc | 69 | 16 | 25 | 110 | 16 | 33 | 29 | |
5 | autres | 2 | 0 | 0 | 2 | 1 | |||
207 | 32 | 87 | 326 | 90 | 38 |
alpha, estimation des -rRNAs[modifier | modifier le wikicode]
- Lien tableur: alpha, estimation des -rRNAs
- Liens fiche: typage
- Légende: prélèvement de la base gtRNAdb le 27.5.20
- - ttt et tgt sont nuls partout
- - atgi, c'est Ile2, mis à la place de ttt, très rare chez les procaryotes.
- - atgf, c'est Metf, mis à la place de tgt, très rare chez les procaryotes.
- - atgj, c'est Met, remplace le atg standard qui est la somme Ile2 Met fMet.
- - Voir la légende des tris, g1 t1 et des couleurs
alpha, calcul des -rRNAs[modifier | modifier le wikicode]
- Lien tableur: alpha, calcul des -rRNAs
|
|
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|
|
alpha, comparaison clade-annexe des -rRNAs[modifier | modifier le wikicode]
- Lien tableur: alpha, comparaison clade-annexe des -rRNAs
- Légende
- - alp7. diff, somme des couleurs de alp7. La différence entre tRNAs est faite entre alp5 et alp6 du tableau précédent. Elle est exprimée en % et rapporté à la plus grande valeur des 2 termes de la différence. Ce qui fait quand un tRNA est à zéro la différence en % est égale à 100.
- - alp8. rap, rapport des sommes couleurs alp5/alp2. Le rapport -rRNA/total est celui du tRNA de alp5 sur celui de alp2.
- Fréquences des différences en % du tableau alp7
gamme 0/0 10 20 30 40 50 60 70 80 90 100 total fréquence 0 18 9 2 6 4 4 1 0 0 2 2 48 tot ≤ 50 39
- Comparaison avec le nombre de tRNAs de la fiche du clade: L’estimation des -rRNA par l'annexe est 19% au dessus de celle de la fiche des alpha.
tRNAs fiche annexe sans 3190 435 avec 525 205 genomes 70 8 indice % 46 54
|
|
Beta[modifier | modifier le wikicode]
Chromobacterium violaceum ATCC 12472[modifier | modifier le wikicode]
cvi opérons[modifier | modifier le wikicode]
- Lien tableur: cvi opérons
- Liens: gtRNAdb [34], NCBI [35], génome [36]
- Phylogénie: Bacteria; Proteobacteria; Betaproteobacteria; Neisseriales; Chromobacteriaceae; Chromobacterium.
- Légende:
65%GC | 30.6.19 Paris | 98 | doubles | intercalaire |
---|---|---|---|---|
421217..422762 | 16s | @1 | 179 | |
422942..423018 | atc | 86 | ||
423105..423180 | gca | 249 | ||
423430..426324 | 23s | 125 | ||
426450..426564 | 5s | |||
502182..503727 | 16s | 79 | ||
503807..503883 | atc | 12 | ||
503896..503971 | gca | 250 | ||
504222..507116 | 23s | 122 | ||
507239..507353 | 5s | |||
comp | 682034..682118 | ttg | ||
759824..759908 | tac | |||
comp | 878775..878849 | agg | ||
955155..955230 | gcg | |||
975612..975696 | ctc | |||
1006822..1006897 | ttc | + | 6 | |
1006904..1006979 | ttc | 2 ttc | ||
1058518..1058611 | agc | 6 | ||
1058618..1058694 | cgt | 3 | ||
1058698..1058772 | gaa | |||
comp | 1061741..1061815 | gaa | + | 3 |
comp | 1061819..1061895 | cgt | 2 gaa | 7 |
comp | 1061903..1061977 | gaa | 2cgt | 5 |
comp | 1061983..1062059 | cgt | ||
1154020..1155565 | 16s | 179 | ||
1155745..1155821 | atc | 86 | ||
1155908..1155983 | gca | 250 | ||
1156234..1159128 | 23s | 122 | ||
1159251..1159365 | 5s | |||
comp | 1263556..1263645 | tcg | ||
1273710..1273786 | atgf | |||
1377435..1377510 | ggc | + | 23 | |
1377534..1377609 | ggc | 5 ggc | 22 | |
1377632..1377707 | ggc | 24 | ||
1377732..1377807 | ggc | 29 | ||
1377837..1377912 | ggc | 45 | ||
1377958..1378031 | tgc | |||
1387010..1387094 | tta | |||
1420085..1420161 | gtc | |||
1427771..1427847 | ccc | |||
comp | 1433244..1433319 | aac | + | 32 |
comp | 1433352..1433427 | aac | 3 aac | 31 |
comp | 1433459..1433534 | aac | ||
1646821..1648366 | 16s | 179 | ||
1648546..1648622 | atc | 86 | ||
1648709..1648784 | gca | 249 | ||
1649034..1651928 | 23s | 122 | ||
1652051..1652165 | 5s | 89 | ||
1652255..1652369 | 5s | |||
1746117..1746207 | tcc | + | 53 | |
1746261..1746351 | tcc | 2 tcc | ||
1978844..1978919 | aac | |||
comp | 2094372..2094447 | cac | + | 26 |
comp | 2094474..2094549 | cac | 3 cac | 45 |
comp | 2094595..2094670 | cac | 27 | |
comp | 2094698..2094774 | aga | 18 | |
comp | 2094793..2094869 | cca | ||
comp | 2511625..2511712 | tca | ||
comp | 2747299..2747375 | gac | 7 | |
comp | 2747383..2747458 | gta | ||
2853221..2853305 | cta | |||
3187082..3187157 | aca | |||
3257362..3257437 | gcc | |||
3262246..3262321 | gcc | + | 8 | |
3262330..3262405 | gaa | 2 gcc | 11 | |
3262417..3262492 | gcc | |||
comp | 3371478..3371592 | 5s | 122 | |
comp | 3371715..3374609 | 23s | 250 | |
comp | 3374860..3374935 | gca | 12 | |
comp | 3374948..3375024 | atc | 79 | |
comp | 3375104..3376649 | 16s | ||
3472822..3472897 | gta | + | 12 | |
3472910..3472986 | gac | 5 gta | 26 | |
3473013..3473088 | gta | 6 gac | 12 | |
3473101..3473177 | gac | 1 gtg | 26 | |
3473204..3473279 | gta | 12 | ||
3473292..3473368 | gac | 26 | ||
3473395..3473470 | gta | 12 | ||
3473483..3473559 | gac | 27 | ||
3473587..3473663 | gta | 6 | ||
3473670..3473746 | gac | 27 | ||
3473774..3473850 | gtg | 6 | ||
3473857..3473933 | gac | |||
3622292..3622365 | ggg | |||
comp | 3820120..3820234 | 5s | 122 | |
comp | 3820357..3823251 | 23s | 249 | |
comp | 3823501..3823576 | gca | 86 | |
comp | 3823663..3823739 | atc | 179 | |
comp | 3823919..3825464 | 16s | ||
3828836..3828922 | ctg | + | 51 | |
3828974..3829060 | ctg | 4 ctg | 33 | |
3829094..3829180 | ctg | 57 | ||
3829238..3829324 | ctg | |||
3854547..3854622 | caa | @2 | 557 | |
3855180..3855255 | acg | 61 | ||
3855317..3855393 | ccg | + | 78 | |
3855472..3855548 | ccg | 2 ccg | ||
comp | 4059834..4059912 | atgi | ||
comp | 4244591..4244705 | 5s | 122 | |
comp | 4244828..4247722 | 23s | 249 | |
comp | 4247972..4248047 | gca | 86 | |
comp | 4248134..4248210 | atc | 179 | |
comp | 4248390..4249935 | 16s | ||
comp | 4325718..4325794 | atgf | ||
comp | 4389268..4389342 | caa | ||
4402077..4402153 | cgg | |||
comp | 4434130..4434244 | 5s | 122 | |
comp | 4434367..4437261 | 23s | 249 | |
comp | 4437511..4437586 | gca | 86 | |
comp | 4437673..4437749 | atc | 179 | |
comp | 4437929..4439474 | 16s | ||
4474196..4474272 | atgj | + | 35 | |
4474308..4474384 | atgj | 2 atgj | ||
comp | 4529616..4529690 | acc | ||
comp | 4532053..4532128 | tgg | ||
comp | 4533370..4533444 | acc | 24 | |
comp | 4533469..4533542 | gga | 52 | |
comp | 4533595..4533679 | tac | ||
comp | 4586712..4586787 | aaa | + | 38 |
comp | 4586826..4586901 | aag | 3 aaa | 35 |
comp | 4586937..4587012 | aaa | 2 aag | 28 |
comp | 4587041..4587116 | aag | 37 | |
comp | 4587154..4587229 | aaa |
cvi cumuls[modifier | modifier le wikicode]
- Lien tableur: cvi cumuls
opérons | Fréquences intercalaires tRNAs | ||||
---|---|---|---|---|---|
effectif | gammes | sans rRNAs | avec rRNAs | ||
avec rRNA | opérons | 8 | 1 | 0 | |
16 23 5s 0 | 0 | 20 | 16 | 2 | |
16 atc gca | 8 | 40 | 20 | ||
16 23 5s a | 0 | 60 | 6 | ||
max a | 2 | 80 | 2 | ||
a doubles | 0 | 100 | 0 | 6 | |
spéciaux | 0 | 120 | 0 | ||
total aas | 16 | 140 | 0 | ||
sans | opérons | 37 | 160 | 0 | |
1 aa | 22 | 180 | 0 | ||
max a | 12 | 200 | 0 | ||
a doubles | 12 | 1 | |||
total aas | 82 | 45 | 8 | ||
total aas | 98 | ||||
remarques | 2 | ||||
avec jaune | moyenne | ||||
variance | |||||
sans jaune | moyenne | 26 | 86 | ||
variance | 18 | 0 |
cvi blocs[modifier | modifier le wikicode]
- Lien tableur: cvi blocs
16s | 179 | 1546 | 79 | 1546 | 179 | 1546 | ||
atc | 86 | 12 | 86 | |||||
gca | 249 | 250 | 250 | |||||
23s | 125 | 2895 | 122 | 2895 | 122 | 2895 | ||
5s | 115 | 115 | 115 | |||||
5s | 122 | 115 | 122 | 115 | 122 | 115 | 122 | 115 |
23s | 250 | 2895 | 249 | 2895 | 249 | 2895 | 249 | 2895 |
gca | 12 | 86 | 86 | 86 | ||||
atc | 79 | 179 | 179 | 179 | ||||
16s | 1546 | 1546 | 1546 | 1546 | ||||
16s | 179 | 1546 | ||||||
atc | 86 | |||||||
gca | 249 | |||||||
23s | 122 | 2895 | ||||||
5s | 89 | 115 | ||||||
5s | 115 |
cvi remarques[modifier | modifier le wikicode]
- Lien tableur: cvi remarques
- Remarques : Pas de blocs 16-23-5s et 8 blocs 16-atc gca 23-5s. Beaucoup de doubles.
- @ 8 blocs 16-atc gca 23-5s tous sans aas supplémentaires.
- - Les intercalaires gca-23s-5s sont tous identiques, 250 122.
- - Un groupe de 2 opérons aux intercalaires 16s-atc-gca 79 12 très différent du suivant
- - Un groupe de 6 opérons aux intercalaires 16s-atc-gca 179 86, respectivement 2 et 7 fois plus grands.
- - Un opéron présente 1 5s supplémentaire collé au 1er.
- @ Un intercallaire très élevé, 557 bases, entre 2 aas d’un opéron à 4aas.
- @ 8 blocs 16-atc gca 23-5s tous sans aas supplémentaires.
- Séquences des doubles : 12 opérons sur 23 à 2aas et plus ont des doubles. 3 opérons à séquences répétées.
- - 12 opérons sans rRNAs sur 15 à 2 aas et plus ont des doubles.
- - 4 opérons avec 1 doublet chacun
- - 1 opéron au doublet séparé (gcc gaa gcc
- - 4 opérons à répétitions multiples non séparées, voir ci-dessous.
- - 3 opérons avec répétition de séquences
- 2gaa 2cgt avec 2*2
- 3aaa 2aag avec 2*2
- 4gta 6gac 2gtg avec 4*2 + 2*2.
2ttc 3aac 2gaa 2cgt 2*2 2tcc cca aga 3cac 3aaa 2aag 2*2 2atg 4ctg 4gta 6gac 2gtg 4*2 + 2*2 caa acg 2ccg tgc 5ggc - - gcc gaa gcc - - -
- Code génétique de cvi:
- Légende: prélèvement de la base gtRNAdb le
- - totaux en en-tête, 99 total de gtRNAdb contenant des pseudo et inconnus; 98 total du cumul. Le tRNA impacté est atgf avec 3 gtRNAdb et 2 en NCBI.
- - atgi, c'est Ile2, mis à la place de ttt, très rare chez les procaryotes.
- - atgf, c'est Metf, mis à la place de tgt, très rare chez les procaryotes.
- - atgj, c'est Met, remplace le atg standard qui est la somme Ile2 Metf Met.
- - Voir la légende des tris et couleurs, g1 t1.
- Légende: prélèvement de la base gtRNAdb le
g1 | t1 | 99 | 98 | ||||
---|---|---|---|---|---|---|---|
atgi | 1 | tct | tat | atgf | 3 | ||
att | act | aat | agt | ||||
ctt | cct | cat | cgc | ||||
gtt | gct | gat | ggt | ||||
ttc | 2 | tcc | 2 | tac | 2 | tgc | 1 |
atc | 8 | acc | 2 | aac | 4 | agc | 1 |
ctc | 1 | ccc | 1 | cac | 3 | cgt | 3 |
gtc | 1 | gcc | 3 | gac | 7 | ggc | 5 |