Recherche:Les clusters de gènes tRNA et rRNA chez les procaryotes/Annexe/alpha
Aller à la navigation
Aller à la recherche
Rickettsia typhi str. B9991CWPP[modifier | modifier le wikicode]
rtb opérons[modifier | modifier le wikicode]
- Liens: gtRNAdb [1], NCBI [2], génome [3]
- Lien tableur: rtb opérons
- Phylogénie: Bacteria; Proteobacteria; Alphaproteobacteria; Rickettsiales; Rickettsiaceae; Rickettsieae; Rickettsia; typhus group.
- Légende: cdsa: cds aas, cdsd: cds dirigé
29%GC | 31.12.19 Paris | 33 | doubles | intercal | cds | aa | avec aa | cdsa | cdsd | protéines |
---|---|---|---|---|---|---|---|---|---|---|
comp | 7429..8469 | cds | 381 | 381 | 347 | UDP-3-O-(3-hydroxymyristoyl)glucosamine N-acyltransferase | ||||
comp | 8851..8926 | ttc | 368 | 368 | ||||||
9295..10278 | cds | 328 | tRNA dihydrouridine synthase DusB | |||||||
14663..18055 | cds | 108 | 108 | 1131 | autotransporter outer membrane beta-barrel domain-containing protein | |||||
18164..18238 | gaa | 1394 | 1394 | |||||||
comp | 19633..20106 | cds | 158 | crossover junction endodeoxyribonuclease RuvC | ||||||
comp | 48065..48709 | cds | 278 | 278 | 215 | YihA family ribosome biogenesis GTP-binding protein | ||||
comp | 48988..49064 | atgf | 110 | 110 | ||||||
comp | 49175..49411 | cds | 79 | 50S ribosomal protein L31 | ||||||
comp | 73627..73929 | cds | 17 | 17 | 101 | preprotein translocase subunit SecG | ||||
comp | 73947..74021 | acc | 139 | 139 | ||||||
comp | 74161..75417 | cds | 419 | MFS transporter | ||||||
155064..157163 | cds | 143 | 143 | 700 | elongation factor G | |||||
157307..157382 | tgg | 167 | 167 | |||||||
157550..157750 | cds | 67 | preprotein translocase subunit SecE | |||||||
189197..189400 | cds | 889 | 889 | 68 | DUF2674 domain-containing protein | |||||
comp | 190290..190365 | acg | 142 | 142 | ||||||
comp | 190508..192814 | cds | 769 | outer membrane protein assembly factor BamA | ||||||
255010..255921 | cds | 732 | 732 | 304 | methionyl-tRNA formyltransferase | |||||
256654..259439 | 23s | 206 | 2786 | |||||||
259646..259760 | 5s | 173 | 173 | 115 | ||||||
comp | 259934..261007 | cds | 358 | cell division protein ZapE | ||||||
291358..291843 | cds | 35 | 35 | 162 | 30S ribosomal protein S9 | |||||
291879..291955 | atgj | 1364 | 1364 | |||||||
comp | 293320..293805 | cds | 162 | RNA pyrophosphohydrolase | ||||||
335194..336996 | cds | 402 | 402 | 601 | elongation factor 4 | |||||
337399..337473 | aac | 633 | 633 | |||||||
comp | 338107..338793 | cds | 229 | hp | ||||||
comp | 440466..440933 | cds | 496 | 496 | 156 | DUF2155 domain-containing protein | ||||
441430..441504 | tgc | 31 | 31 | |||||||
441536..442456 | cds | 307 | site-specific tyrosine recombinase XerD | |||||||
comp | 469056..469781 | cds | 218 | 218 | 242 | 3-deoxy-manno-octulosonate cytidylyltransferase | ||||
470000..470075 | aaa | 15 | 15 | |||||||
470091..470167 | atc | 1922 | 1922 | |||||||
472090..472662 | cds | 191 | GTP cyclohydrolase I FolE | |||||||
comp | 564534..565562 | cds | 1530 | 1530 | 343 | type 2 isopentenyl-diphosphate Delta-isomerase | ||||
comp | 567093..567180 | tcc | 218 | 218 | ||||||
comp | 567399..568145 | cds | 249 | NTP transferase domain-containing protein | ||||||
583250..584149 | cds | 1278 | 1278 | 300 | hydroxymethylbilane synthase | |||||
comp | 585428..585518 | tca | 58 | 58 | ||||||
comp | 585577..586569 | cds | 331 | tryptophan--tRNA ligase | ||||||
598723..599706 | cds | 26 | 26 | 328 | polyprenyl synthetase family protein | |||||
599733..599809 | cgg | 60 | 60 | |||||||
comp | 599870..599944 | caa | 62 | 62 | ||||||
comp | 600007..601779 | cds | 591 | aminopeptidase P family protein | ||||||
comp | 644357..644745 | cds | 499 | 499 | 130 | p-ribosome-associated translation inhibitor RaiA | ||||
645245..645321 | gac | @1 | 1051 | 1051 | ||||||
comp | 646373..646448 | gcc | 222 | 222 | ||||||
comp | 646671..647276 | cds | 202 | ATP-dependent Clp endopeptidase proteolytic subunit ClpP | ||||||
comp | 649389..650048 | cds | 452 | 452 | 220 | (d)CMP kinase | ||||
650501..650577 | gtc | 1274 | 1274 | |||||||
comp | 651852..652094 | cds | 81 | HU family DNA-binding protein | ||||||
comp | 696163..697398 | cds | 1535 | 1535 | 412 | tyrosine--tRNA ligase | ||||
698934..699010 | cgt | 1028 | 1028 | |||||||
700039..705720 | cds | 1894 | alpha-2-macroglobulin family protein | |||||||
comp | 727560..728087 | cds | 1164 | 1164 | 176 | copper chaperone Pcu(A)C | ||||
comp | 729252..729326 | gca | 32 | 32 | ||||||
comp | 729359..729574 | cds | 72 | hp | ||||||
739215..740075 | cds | 181 | 181 | 287 | TIGR01459 family HAD-type hydrolase | |||||
740257..740343 | ctc | 246 | 246 | |||||||
740590..741960 | cds | 1199 | 1199 | 457 | magnesium transporter | |||||
743160..743234 | ggc | 1090 | 1090 | |||||||
744325..744753 | cds | 143 | preprotein translocase subunit YajC | |||||||
comp | 775944..777866 | cds | 2465 | 2465 | 641 | hp | ||||
comp | 780332..781831 | 16s | 1854 | 1854 | 1500 | |||||
comp | 783686..785485 | cds | 600 | PAS domain-containing sensor histidine kinase | ||||||
comp | 814590..814823 | cds | 349 | 349 | 78 | hp | ||||
comp | 815173..815248 | gta | 68 | 68 | ||||||
comp | 815317..815589 | cds | 91 | 30S ribosomal protein S20 | ||||||
comp | 829300..830484 | cds | 82 | 82 | 395 | elongation factor Tu | ||||
comp | 830567..830640 | gga | 95 | 95 | ||||||
comp | 830736..830821 | tac | 183 | 183 | ||||||
831005..831733 | cds | 243 | 23s rRNA (guanosine(2251)-2'-O)-methyltransferase RlmB | |||||||
839841..839969 | cds | 145 | 145 | 43 | dimethyladenosine transferase | |||||
840115..840200 | tta | 2009 | 2009 | |||||||
842210..842446 | cds | 79 | hp | |||||||
comp | 876906..877589 | cds | 401 | 401 | 228 | 7-cyano-7-deazaguanine synthase QueC | ||||
877991..878067 | cac | 145 | 145 | |||||||
878213..879943 | cds | 577 | ATP-binding cassette domain-containing protein | |||||||
918938..919882 | cds | 951 | 951 | 315 | ACP S-malonyltransferase | |||||
920834..920925 | agc | 1945 | 1945 | |||||||
comp | 922871..924049 | cds | 393 | acetyl-CoA C-acetyltransferase | ||||||
comp | 961209..962297 | cds | 41 | 41 | 363 | YjgP/YjgQ family permease | ||||
comp | 962339..962415 | atgi | 390 | 390 | ||||||
comp | 962806..963273 | cds | 156 | peptidoglycan-associated lipoprotein Pal | ||||||
1023375..1023626 | cds | 1585 | 1585 | 84 | BolA family transcriptional regulator | |||||
1025212..1025288 | cca | 17 | 17 | |||||||
1025306..1025521 | cds | 72 | translation initiation factor IF-1 | |||||||
1053321..1054139 | cds | 2191 | 2191 | 273 | alpha/beta hydrolase | |||||
comp | 1056331..1056407 | aga | 98 | 98 | ||||||
1056506..1056823 | cds | 106 | DUF167 domain-containing protein | |||||||
comp | 1098776..1099240 | cds | 40 | 40 | 155 | DNA polymerase III subunit chi | ||||
comp | 1099281..1099365 | cta | 145 | 145 | ||||||
comp | 1099511..1100662 | cds | 384 | succinyl-diaminopimelate desuccinylase | ||||||
comp | 1102351..1102980 | cds | 475 | 475 | 210 | lipoyl(octanoyl) transferase LipB | ||||
comp | 1103456..1103530 | aca | 130 | 130 | ||||||
comp | 1103661..1103996 | cds | 112 | 30S ribosomal protein S16 |
rtb cumuls[modifier | modifier le wikicode]
- Lien tableur: rtb cumuls
- Légende
- Notes: moyenne et variance des intercalaires élevés des 21 cds : 1430 et 491
opérons | Fréquences intercalaires tRNAs | Fréquences intercalaires cds | Fréquences aas cds chromosome | ||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
effectif | gammes | sans rRNAs | avec rRNAs | gammes | cds | gammes | cdsd | gammes | cdsa | gammes | cdsa 300 | ||
avec rRNA | opérons | 2 | 1 | - | 1 | 0 | 1 | 100 | 11 | 30 | 0 | ||
23s5s | 1 | 20 | 1 | 50 | 8 | 40 | 200 | 13 | 60 | 1 | |||
16s | 1 | 40 | 100 | 5 | 80 | 300 | 12 | 90 | 9 | ||||
16s23s | 0 | 60 | 1 | 150 | 9 | 120 | 400 | 13 | 120 | 4 | |||
max a | 0 | 80 | 200 | 4 | 160 | 500 | 3 | 150 | 2 | ||||
a doubles | 0 | 100 | 1 | 250 | 4 | 200 | 600 | 3 | 180 | 7 | |||
spéciaux | 0 | 120 | 300 | 1 | 240 | 700 | 3 | 210 | 3 | ||||
total aas | 0 | 140 | 350 | 1 | 280 | 800 | 1 | 240 | 4 | ||||
sans | opérons | 29 | 160 | 400 | 3 | 320 | 900 | 0 | 270 | 3 | |||
1 aa | 25 | 180 | 450 | 2 | 360 | 1000 | 0 | 300 | 3 | ||||
max a | 2 | 200 | 500 | 4 | 400 | 1100 | 0 | 330 | 5 | ||||
a doubles | 0 | 1 | 21 | 2 | 20 | ||||||||
total aas | 33 | 4 | 0 | 62 | 0 | 61 | 61 | ||||||
total aas | 33 | ||||||||||||
remarques | 1 | ||||||||||||
avec jaune | moyenne | 612 | 310 | ||||||||||
variance | 665 | 291 | |||||||||||
sans jaune | moyenne | 57 | 193 | 269 | 176 | ||||||||
variance | 40 | 148 | 176 | 86 |
rtb blocs[modifier | modifier le wikicode]
- Lien tableur: rtb blocs
cds | 732 | 304 | methionyl-tRNA formyltransferase |
23s | 206 | 2786 | |
5s | 173 | 115 | |
cds | 358 | cell division protein ZapE | |
cds | 2465 | 641 | hp |
16s | 1854 | 1500 | |
cds | 600 | PAS domain-containing sensor histidine kinase |
rtb remarques[modifier | modifier le wikicode]
- Remarques: Les rickettia, rtb et rpl, présentent de nombreux intercalaires très élevés. D’où cet intercalaire @1 entre 2 aas de 1051 pbs. Je détaille ici les intercalaires du tableau des cumuls.
- - Les intercalaires entre aas: Il y a quatre intercalaires de ce type, 1051 95 60 15. A part le 1er les 3 autres sont courants dans cette étude et seulement le dernier est le rprésentant de la moyenne dans cette étude.
- - Les intercalaires avec un cds. Les 31 blocs de ce génomes se répartissent en 3 groupes
- Les RNAs complètement isolés, les 2 intercalaires du bloc sont supérieurs à 400 pbs. Il y a 6 aas dont celui avec 1051, plus le 16s. Sur ces 14 intercalaires 10 sont supérieurs à 900 et 4 entre 400 et 600 pbs.
- Les tRNAs proches de leurs 2 cds. Il y a 6 aas dont les 2 intercalaires sont inférieurs à 300 pbs et 4 aas dont au moins un des 2 intercalaires est entre 300 et 400 pbs et l'autre inférieur à 300 pbs.
- Il reste 14 blocs dont le 23s5s, auxquels il faut ajouter l’aa gcc voisin du gac isolé par 1051. Ces blocs sont très polarisés, leurs 2 intercalaires sont très dissymétriques.
- - 11 aas ont leur intercalaire majeur supérieur à 900 et va jusqu’à 2465 pbs. Le 23s5s a un intercalaire majeur modéré et assez courant pour les blocs à rRNAs.
- - 3 aas ont leur intercalaire majeur de 450 pbs environ.
- Les blocs isolés et les blocs entourés par 2 cds.
Blocs à RNAs isolés par 2 intercalaires de plus de 400 pbs. bloc adresse Blocs entourés par 2 intercalaires de 300 à 400 pbs aac 337399 ttc 8851 gac 645245 gta 815173 gtc 650501 cac 877991 cgt 698934 atgi 962339 ggc 743160 16s 780332 Blocs entourés par 2 intercalaires inférieurs à 300 pbs agc 920834 atgf 48988 : : acc 73947 : : tgg 157307 : : cgg-caa 599733 : : gga-tac 830567 : : cta 1099281
- Les séquences des doubles: Il n'y a aucun double dans ce génome
rtb distribution[modifier | modifier le wikicode]
- Lien tableur: rtb distribution
g1 | t1 | ||||||
---|---|---|---|---|---|---|---|
atgi | 1 | tct | tat | atgf | 1 | ||
att | act | aat | agt | ||||
ctt | cct | cat | cgc | ||||
gtt | gct | gat | ggt | ||||
ttc | 1 | tcc | 1 | tac | 1 | tgc | 1 |
atc | 1 | acc | 1 | aac | 1 | agc | 1 |
ctc | 1 | ccc | cac | 1 | cgt | 1 | |
gtc | 1 | gcc | 1 | gac | 1 | ggc | 1 |
tta | 1 | tca | 1 | taa | tga | ||
ata | aca | 1 | aaa | 1 | aga | 1 | |
cta | 1 | cca | 1 | caa | 1 | cga | |
gta | 1 | gca | 1 | gaa | 1 | gga | 1 |
ttg | tcg | tag | tgg | 1 | |||
atgj | 1 | acg | 1 | aag | agg | ||
ctg | ccg | cag | cgg | 1 | |||
gtg | gcg | gag | ggg | ||||
alpha | >1aa | =1aa | -5s | +5s | -16s | +16s | total |
rtb | 6 | 27 | 33 |
rtb. Intergen51[modifier | modifier le wikicode]
Intergen51. rtb. Le génome[modifier | modifier le wikicode]
- rtb Le prélèvement: Artb
- Le nom et le lien NCBI: rtb, Rickettsia typhi str. B9991CWPP, NCBI [4], date 7.12.20.
- rtb La longueur totale des intercalaires, longueur du génome et taux intercalaires/génome:
Nom intercals génome taux en % rtb 264,633 1,112,957 23.8
rtb données intercalaires[modifier | modifier le wikicode]
- Lien tableur: rtb données intercalaires
- Lien sauvegarde NCBI: Artb
rtb données intercalaires 200[modifier | modifier le wikicode]
- Lien tableur: données intercalaires 200.
rtb autres intercalaires aas[modifier | modifier le wikicode]
- Lien tableur: rtb autres intercalaires aas
- Lien sauvegarde NCBI: Artb
Intergen51. rtb. Les différents types d'intercalaires[modifier | modifier le wikicode]
- Lien au tableur: Intergen51. rtb les différents types d'intercalaires.
- Légende:
- - S pour intercalaire CDS-CDS et R pour tRNA-CDS,
- - c pour intercalaire continu (les 2 gènes sont sur le même brin) et x pour discontinu (les 2 gènes sont sur 2 brins différents, le brin et son complément)
- - %reste = 100*reste/total, le reste étant ce qui reste du total après la fin du diagramme, gamme.
- - %t30 = 100*t30/total, t30 étant le total des fréquences 10 20 30
- - %t5 = 100*t/total, t5 étant le total des fréquences de -1 à -5 dans le diagramme des S-.
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
Intergen51. rtb. Les diagrammes CDS-CDS positifs[modifier | modifier le wikicode]
- Lien tableur: Les diagrammes
- Diagrammes des gamma: rtb présente 2 diagrammes
- - fc40, CDS-CDS continu, fréquence unitaire en abscisses et effectif en ordonnées
- - fx%, CDS-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et pourcentage en ‰ par rapport au total, en ordonnées.
- Équations des courbes de tendance en pour 1000: colonnes %fx %fc
Courbes de tendances pour les diagrammes en pour 1000 Calculs des f.41 rtb R2 x3 x2 x c Inflexion poly3 x c 0.496 2.82E-06 -2.09E-03 3.74E-01 7.33 fx1 abscisse 244.3 230.0 0.570 -2.82E-06 2.21E-03 -6.22E-01 72.4 fc1 ordonnée 15.1 14.6 0.551 8.35E-07 -6.12E-04 4.27E-02 29.0 fx41 0.804 6.45E-06 -4.45E-03 8.03E-01 -13.2 fc41
Intergen51. rtb. Les CDS-CDS négatifs[modifier | modifier le wikicode]
Sous-totaux rtb totale fréquence x- c- x- c- - 1 0 10 4 4140 - 2 1 0 85 11 - 3 0 0 3 12 - 4 0 33 717 10938 - 5 0 0 5 19 sp6 3 55 1642 8424 total 4 98 2,456 23,544 reste 0 0 264 420 s6 0 0 361 41 s7 0 9 321 1438 s8 3 46 696 6525 rappot s1-5 4/2/1 0 3.3 8.4 2.6 % / sp6 s6/sp6 0.0 0.0 22.0 0.5 s7/sp6 0.0 16.4 19.5 17.1 s8/sp6 100.0 83.6 42.4 77.5 reste/sp6 0.0 0.0 16.1 5.0 total s1-5 1 43 814 15120 % / total %s1-5 25.0 43.9 33.1 64.2 %sp6 75.0 56.1 66.9 35.8
Intergen51. rtb. Les intercalaires des blocs[modifier | modifier le wikicode]
- Le détail
RNA-RNA c x CDS-RNA c x 23s 5s 1 CDS 16s 1 16s 23s 5s CDS 16s tRNA 16 CDS 1 1 tRNA 23s CDS 5s 5s tRNA 23s CDS tRNA in CDS 23s 1 tRNA contig 5s 16s tRNA hors 2 2 16s16s tRNA 16s 23s tRNA tRNA 5s 16s 5s 5s 23s 5s 5s total 3 2 total 3 1
- Les rares voir gamma pour la longueur des intercalaires
- Les tRNA-CDS compris, comparaison dans le clade et dans l'étude.
Intergen51. rtb. Les intercalaires tRNA-tRNA extra bloc[modifier | modifier le wikicode]
- Lien tableur: Intergen51. rtb. Les intercalaires tRNA-tRNA extra bloc
- voir les répétitions dans rpm
rtb intercalaires entre cds[modifier | modifier le wikicode]
- Rickettsia typhi str. B9991CWPP, 7.12.2020, NCBI [5]
- Note: Pour les génomes des annexes j'ai relevé les intercalaires entre tRNAs et entre ceux-ci et les cds qui leur sont adjacents. L'exemple est celui de rru du clade alpha. L'idée de départ de ces prélèvements est la recherche d'opérons formés de tRNA et de protéine comme dans le cas d'E.coli: l'intercalaire entre le tRNA et la protéine devrait être faible. Voir l'exemple d'eco (remarque @3) avec tac-tac-tpr et aca-tac-gga-acc-tufB.
rtb intercalaires positifs S+[modifier | modifier le wikicode]
- Lien tableur: rtb intercalaires positifs S+
- Diagrammes 400: rtb cvi, diagramme 1-40: c+ rtb c+ cvi x+ cvi total, texte: cvi.
- Légende: voir la légende de cvi.
rtb | Sx+ | Sc+ | ||||||||||||
Poly3 | -7 | -5 | -3 | 1 | R2 | flex x+ | comment. | -7 | -5 | -3 | 1 | R2 | flex c+ | comment. |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
1 à 400 | 45 | -332 | 590 | 12 | 496 | 246 | max80 | -36 | 279 | -782 | 91 | 569 | 258 | min50 |
31 à 400 | 70 | -478 | 827 | -4.5 | 788 | 228 | 2 parties | |||||||
droite | -a | cste | - | R2 | note | R2’ | -a | cste | - | R2 | note | R2’ | ||
1 à 400 | 91 | 44 | - | 304 | poly | 191 | tF | 174 | 61 | - | 487 | poly | 82 | Sm |
31 à 400 | -36 | 44 | - | 598 | poly | 190 | tF |
- Légende du tableau corrélations et fréquences faibles
effectifs diagramme | corrélation x+ c+, 41-n | corrélation x+ c+, 1-n | |||||||||
gen | minima | x+ | c+ | total | 400 | 200 | 250 | diff | 200 | 250 | 400 |
---|---|---|---|---|---|---|---|---|---|---|---|
bsu | min10 | 1028 | 2444 | 3472 | 659 | 8 | 282 | 274 | 152 | 257 | 470 |
rtb | min30 | 118 | 402 | 520 | 536 | -105 | 148 | 253 | -277 | -165 | 202 |
afn | min10 | 328 | 1323 | 1651 | 603 | -26 | 101 | 127 | -468 | -407 | -9 |
1-30 ‰ | effectifs | 0 ‰ | <0 ‰ | effectifs 1-40 | corel | ||||||
1-30 x+ | 1-30 c+ | x+/c+ | x | c | x | c | x- | c- | x+ | c+ | x+/c+ |
140 | 333 | 0.42 | 1125 | 3091 | 2 | 8 | 31 | 186 | 302 | 936 | -432 |
51 | 294 | 0.17 | 189 | 604 | 5 | 7 | 21 | 162 | 8 | 131 | -81 |
46 | 402 | 0.11 | 350 | 1689 | 6 | 5 | 11 | 179 | 36 | 580 | -369 |
- Diagrammes 400: rtb cvi, diagramme 1-40: c+ rtb c+ cvi x+ cvi total, texte: cvi.
- Résumé: J’ai classé les 21 génomes suivant la forme des diagrammes x+ 1-400. J’ai obtenu 3 groupes,
- Les tildes au nombre de 5. Ils sont réguliers et forts, tF, avec un R2’ supérieur à 138 pour 4 d’entre eux et scc avec 71. Ce sont, cbei mba pmq et blo scc.
- Les formes S au nombre de 6. Leurs forces (R2’) sont variables, ade rru Sf 20-39, ant mja Sm 70-78, pmg pub SF 179-249.
- Les diagrammes à pyramide, c’est à dire présentant une bosse avec 4 ou 5 points contigus. Ils sont au nombre de 10 dont 9 sont des tildes et bsu est un Sf très faible (R2’18). abra rtb spl afn sont des tF avec plus de 96, ase cbn cvi sont des tf avec moins de 30, eco myr sont des tm 43 68.
- - rtb ressemble à cvi par la pyramide de x+ 1-400 avec un maximum à 80 pour rtb et 70 pour cvi et la forme de toutes les courbes ne diffèrent que par leur force. La différence entre les 2 génomes est due à la grande différence des effectifs, 520 pour rtb contre 3328 pour cvi, et des corrélations sur 41-250, de 148 pour rtb contre 891 pour cvi.
- - Les diagrammes 400
- x+ 1-400:
- + Les 2 génomes ont une pyramide à 3 fréquences avec un maximum à 80 pour rtb et 70 pour cvi. Quand j’enlève les fréquences faibles pour ne laisser que la pyramide (6 pour rtb et 5 pour cvi), la courbe rtb devient une S faible, Sf, R2’ à 36 (662 625) et la courbe cvi devient une S moyenne, Sm, R2’ à 68 (794 726). Je n’ai pas représenté les courbes x+ 31-400 à cause des taux peu élevés des fréquences faibles 1-30, 51 pour rtb et 112 pour cvi.
- + Les fréquences faibles 1-30 sont en opposition avec celles des rtb c+1-400 et en parallèle avec cvi. Cette différence va impacter différemment les corrélations 1-n qu’on verra plus loin.
- + Les points d’inflexion sont normaux, 246 pour rtb contre 200 pour cvi.
- c+ 1-400: Ce sont 2 courbes semblables de forme S, moyenne pour rtb avec un R2’ de 82 et forte pour cvi avec un R2’ de 203. Les 2 points d’inflexion normaux, 258 pour rtb et 282 pour cvi. Les fréquences faibles sont positionnées aux fréquences 10 et 20 pour les 2 génomes et les minima locaux sont identiques à la fréquence 50. La différence des effectifs, 402 pour rtb et 2320 pour cvi explique la différence de forme avec des R2 très différents, 569 pour rtb et 852 pour cvi
- x+ 31-400: Je n’ai pas représenté les courbes x+ 31-400 à cause des taux peu élevés des fréquences faibles 1-30. Il faudrait les remplacer par les courbes avec pyramide seule sans les fréquences faibles 1-30, voir le paragraphe x+ 1-400 ci-dessus.
- c+ 31-400: Les 2 formes sont 2 tildes très différents , tF pour rtb, avec un R2’ de 190 (788 598) et très faible pour cvi, tf, R2’ de 30 (525 808) plus proche d’une droite. La forme de rtb est bien différente de celle de cvi car les R2, polynome et droite, sont inversés dans le mauvais sens par rapport aux effectifs, 284 pour rtb et 1621 pour cvi. De même les points d’inflexion sont différents, il est normal pour rtb à la fréquence 228 et négatif pour cvi à -138.
- x+ 1-400:
- - Les corrélations:
- Sur les plages 41-n: Les 2 corrélations sur 41-250 sont très dfiiérentes, 148 pour rtb contre 891 pour cvi.. Par contre rtb chute fortement sur 41-200, avec une différence de 253, alors que cvi se maintient avec une différence de 33.
- Sur les plages 1-n: les 2 génomes chutent fortement, -165 pour rtb et 549 pour cvi, malgré le comportement des fréquences faibles que j’ai signalé au paragraphe x+ 1 -400, en opposition pour rtb et en parallèle avec cvi.
- - Les faibles fréquences: Les faibles fréquences 1-30 ne sont intéressantes à comparer que pour les génomes à courbes 1-400 semblables où le taux de ces fréquences sont élevés et évoluent en parallèle comme entre pmg et pub où le rapport x+/c+ passe de 0.78 à 0.51. rtb fait 0.17 et cvi 0.37 Les zéros sont à 7‰ pour cvi et 12‰ pour rtb et les négatifs sont 50% plus élevés chez cvi que chez rtb, 280 ‰ contre 183 ‰ pour rtb.
- - Les courbes 1-40:
- c+ 1-40: La courbe cvi est semblale et très proche de celle du total des c+ 1-40; celle de rtb le devient aussi en omettant les fréquences 6 et 10.
- x+ 1-40: Avec un effectif de 8 pour rtb la courbe ne peut être significative. Cvi avec 130 est différente du modèle c+ 1-40 avec un effectif aussi grand à la fréquence 6 et 9, un creux profond à la fréquence 11 et aussi à cause de la faible corrélation x+/c+ de 582.
rtb autres intercalaires[modifier | modifier le wikicode]
- Lien tableur: rtb autres intercalaires aas
- Légende:
- - comp, le gène est sur le brin complement
- - deb, fin sont respectivement dans le sens des adresses croissantes, le cds avant le 1er tRNA et le cds après le dernier tRNA du bloc.
- Totaux: 3 ncRNA 1 tmRNA
tRNA-cds tRNA-tRNA autres-cds total c+ x+ x- c+ x+ c- c+ x+ c- 45 17 3 2 6 2 75
- Méthode de calculs des intercalaires autres que les CDS-CDS voir le cas de amed.
Rickettsia prowazekii str. Breinl[modifier | modifier le wikicode]
rpl opérons[modifier | modifier le wikicode]
- Lien tableur: rpl opérons
- Liens: gtRNAdb [6], NCBI [7], génome [8]
- Phylogénie: Bacteria; Proteobacteria; Alphaproteobacteria; Rickettsiales; Rickettsiaceae; Rickettsieae; Rickettsia; typhus group.
- Légende: cdsa: cds aas, cdsd: cds dirigé
29%GC | 30.12.19 Paris | 33 | doubles | intercal | cds | aa | avec aa | cdsa | cdsd | protéines |
---|---|---|---|---|---|---|---|---|---|---|
comp | 31462..31892 | cds | 263 | 263 | 144 | p-preprotein translocase subunit YajC | ||||
comp | 32156..32181 | rpr | 870 | 870 | 26 | tandem | ||||
comp | 33052..33126 | ggc | 1253 | 1253 | ||||||
comp | 34380..35750 | cds | 256 | 256 | magnesium transporter | |||||
comp | 36007..36093 | ctc | 190 | 190 | ||||||
comp | 36284..37144 | cds | 287 | TIGR01459 family HAD-type hydrolase | ||||||
46825..47040 | cds | 31 | 31 | 72 | hp | |||||
47072..47146 | gca | 1964 | 1964 | |||||||
49111..49650 | cds | 180 | copper chaperone Pcu(A)C | |||||||
comp | 71150..76816 | cds | 933 | 933 | 1889 | alpha-2-macroglobulin family protein | ||||
comp | 77750..77826 | cgt | 1179 | 1179 | ||||||
79006..80241 | cds | 412 | tyrosine--tRNA ligase | |||||||
121704..121946 | cds | 984 | 984 | 81 | HU family DNA-binding protein | |||||
comp | 122931..123007 | gtc | 446 | 446 | ||||||
123454..124113 | cds | 220 | (d)CMP kinase | |||||||
126222..126827 | cds | 236 | 236 | 202 | ATP-dependent Clp endopeptidase proteolytic subunit ClpP | |||||
127064..127139 | gcc | @1 | 830 | 830 | ||||||
comp | 127970..128046 | gac | 365 | 365 | ||||||
128412..128843 | cds | 144 | ribosome-associated translation inhibitor RaiA | |||||||
171237..173012 | cds | 50 | 50 | 592 | aminopeptidase P family protein | |||||
173063..173137 | caa | 49 | 49 | |||||||
comp | 173187..173263 | cgg | 18 | 18 | ||||||
comp | 173282..174265 | cds | 328 | polyprenyl synthetase family protein | ||||||
186344..187336 | cds | 58 | 58 | 331 | tryptophan--tRNA ligase | |||||
187395..187484 | tca | 354 | 354 | |||||||
comp | 187839..188738 | cds | 300 | hydroxymethylbilane synthase | ||||||
203097..203846 | cds | 219 | 219 | 250 | bifunctional N-acetylglucosamine-1-phosphate uridyltransferase/glucosamine-1-phosphate acetyltransferase | |||||
204066..204153 | tcc | 1457 | 1457 | |||||||
205611..206639 | cds | 343 | type 2 isopentenyl-diphosphate Delta-isomerase | |||||||
comp | 299321..300853 | cds | 419 | 419 | 511 | hp | ||||
comp | 301273..301349 | atc | 15 | 15 | ||||||
comp | 301365..301440 | aaa | 219 | 219 | ||||||
301660..302400 | cds | 247 | 3-deoxy-manno-octulosonate cytidylyltransferase | |||||||
comp | 328700..329635 | cds | 22 | 22 | 312 | site-specific tyrosine recombinase XerD | ||||
comp | 329658..329732 | tgc | 499 | 499 | ||||||
330232..330699 | cds | 156 | DUF2155 domain-containing protein | |||||||
429121..429807 | cds | 723 | 723 | 229 | hp | |||||
comp | 430531..430605 | aac | 359 | 359 | ||||||
comp | 430965..432767 | cds | 601 | elongation factor 4 | ||||||
473867..474352 | cds | 928 | 928 | 162 | RNA pyrophosphohydrolase | |||||
comp | 475281..475357 | atgj | 40 | 40 | ||||||
comp | 475398..475883 | cds | 162 | 30S ribosomal protein S9 | ||||||
506934..508007 | cds | 183 | 183 | 358 | cell division protein ZapE | |||||
comp | 508191..508305 | 5s | 240 | 115 | ||||||
comp | 508546..511330 | 23s | 716 | 716 | 2785 | |||||
comp | 512047..512958 | cds | 304 | methionyl-tRNA formyltransferase | ||||||
577419..579725 | cds | 138 | 138 | 769 | outer membrane protein assembly factor BamA | |||||
579864..579939 | acg | 1026 | 1179 | |||||||
comp | 580966..581169 | cds | 68 | DUF2674 domain-containing protein | ||||||
comp | 612439..612639 | cds | 143 | 143 | 67 | preprotein translocase subunit SecE | ||||
comp | 612783..612858 | tgg | 143 | 143 | ||||||
comp | 613002..615101 | cds | 700 | elongation factor G | ||||||
comp | 656226..656870 | cds | 296 | 296 | 215 | YihA family ribosome biogenesis GTP-binding protein | ||||
comp | 657167..657243 | atgf | 119 | 119 | ||||||
comp | 657363..657599 | cds | 79 | 50S ribosomal protein L31 | ||||||
comp | 678911..679213 | cds | 19 | 19 | 101 | preprotein translocase subunit SecG | ||||
comp | 679233..679307 | acc | 159 | 159 | ||||||
comp | 679467..680723 | cds | 419 | MFS transporter | ||||||
comp | 746326..746529 | cds | 1664 | 1664 | 68 | hp | ||||
comp | 748194..748268 | gaa | 109 | 109 | ||||||
comp | 748378..749421 | cds | 348 | autotransporter outer membrane beta-barrel domain-containing protein | ||||||
comp | 756703..757686 | cds | 363 | 363 | 328 | tRNA dihydrouridine synthase DusB | ||||
758050..758125 | ttc | 564 | 564 | |||||||
758690..759730 | cds | 347 | UDP-3-O-(3-hydroxymyristoyl)glucosamine N-acyltransferase | |||||||
776202..776537 | cds | 154 | 154 | 112 | 30S ribosomal protein S16 | |||||
776692..776766 | aca | 467 | 467 | |||||||
777234..777863 | cds | 210 | lipoyl(octanoyl) transferase LipB | |||||||
779197..780348 | cds | 140 | 140 | 384 | succinyl-diaminopimelate desuccinylase | |||||
780489..780573 | cta | 37 | 37 | |||||||
780611..781075 | cds | 155 | DNA polymerase III subunit chi | |||||||
comp | 823242..823559 | cds | 98 | 98 | 106 | DUF167 domain-containing protein | ||||
823658..823734 | aga | 1364 | 1364 | |||||||
comp | 825099..825230 | cds | 44 | hp | ||||||
comp | 854241..854456 | cds | 17 | 17 | 72 | translation initiation factor IF-1 | ||||
comp | 854474..854550 | cca | 1573 | 1573 | ||||||
comp | 856124..856357 | cds | 78 | BolA family transcriptional regulator | ||||||
915034..915501 | cds | 391 | 391 | 156 | peptidoglycan-associated lipoprotein Pal | |||||
915893..915969 | atgi | 41 | 41 | |||||||
916011..917099 | cds | 363 | YjgP/YjgQ family permease | |||||||
953564..954742 | cds | 696 | 696 | 393 | acetyl-CoA C-acetyltransferase | |||||
comp | 955439..955530 | agc | 898 | 898 | ||||||
comp | 956429..957373 | cds | 315 | ACP S-malonyltransferase | ||||||
comp | 1009435..1011165 | cds | 142 | 142 | 577 | ATP-binding cassette domain-containing protein | ||||
comp | 1011308..1011384 | cac | 346 | 346 | ||||||
1011731..1012414 | cds | 228 | 7-cyano-7-deazaguanine synthase QueC | |||||||
comp | 1045414..1045656 | cds | 2381 | 2381 | 81 | hp | ||||
comp | 1048038..1048123 | tta | 135 | 135 | ||||||
comp | 1048259..1048387 | cds | 43 | hp | ||||||
comp | 1056245..1056973 | cds | 188 | 188 | 243 | 23s rRNA (guanosine(2251)-2'-O)-methyltransferase RlmB | ||||
1057162..1057247 | tac | 105 | 105 | |||||||
1057353..1057426 | gga | 82 | 82 | |||||||
1057509..1058693 | cds | 395 | elongation factor Tu | |||||||
1072391..1072663 | cds | 62 | 62 | 91 | 30S ribosomal protein S20 | |||||
1072726..1072801 | gta | 1181 | 1181 | |||||||
comp | 1073983..1074648 | cds | 222 | hp | ||||||
1102136..1103935 | cds | 1458 | 1462 | 600 | PAS domain-containing sensor histidine kinase | |||||
1105394..1106893 | 16s | 1462 | 1462 | 1500 | ||||||
1108356..1109301,1..184 | cds | 377 | P-hp |
rpl cumuls[modifier | modifier le wikicode]
- Lien tableur: rpl cumuls
- Légende
- Notes: moyenne et variance des intercalaires élevés des 21 cds : 1204 et 453
opérons | Fréquences intercalaires tRNAs | Fréquences intercalaires cds | Fréquences aas cds chromosome | ||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
effectif | gammes | sans rRNAs | avec rRNAs | gammes | cds | gammes | cdsd | gammes | cdsa | gammes | cdsa 300 | ||
avec rRNA | opérons | 2 | 1 | - | 1 | 0 | 1 | 100 | 12 | 30 | 0 | ||
23s5s | 1 | 20 | 1 | 50 | 9 | 40 | 200 | 11 | 60 | 2 | |||
16s | 1 | 40 | 100 | 4 | 80 | 300 | 12 | 90 | 9 | ||||
16s23s | 0 | 60 | 1 | 150 | 8 | 120 | 400 | 15 | 120 | 4 | |||
max a | 0 | 80 | 200 | 5 | 160 | 500 | 2 | 150 | 2 | ||||
a doubles | 0 | 100 | 250 | 3 | 200 | 600 | 4 | 180 | 6 | ||||
spéciaux | 0 | 120 | 1 | 300 | 3 | 240 | 700 | 2 | 210 | 2 | |||
total aas | 0 | 140 | 350 | 1 | 280 | 800 | 1 | 240 | 5 | ||||
sans | opérons | 29 | 160 | 400 | 5 | 320 | 900 | 0 | 270 | 3 | |||
1 aa | 25 | 180 | 450 | 2 | 360 | 1000 | 0 | 300 | 2 | ||||
max a | 2 | 200 | 500 | 2 | 400 | 1100 | 0 | 330 | 5 | ||||
a doubles | 0 | 1 | 21 | 1 | 20 | ||||||||
total aas | 33 | 4 | 0 | 63 | 0 | 60 | 60 | ||||||
total aas | 33 | ||||||||||||
remarques | 1 | ||||||||||||
avec jaune | moyenne | 528 | 293 | ||||||||||
variance | 558 | 271 | |||||||||||
sans jaune | moyenne | 56 | 191 | 243 | 172 | ||||||||
variance | 45 | 140 | 145 | 89 |
rpl tRNA-cds[modifier | modifier le wikicode]
- Note: intercalaires prélevés de la colonne cds de rpl opérons dans un bloc de tRNAs uniquement. Le début du bloc est dans l'ordre des adresses, deb intercalaire entre le cds et le 1er tRNA dd bloc, fin entre le dernier tRNA et le cds terminal. J'ai procédé, dans les colonnes petit et grand, à la réorientation des blocs d'après la constatation que les blocs à rRNA ont leurs cds de début et de fin sont orientés du cds-16s au 5s-tRNAs-cds, l'intercalaire cds-16s étant plus grands que l'intercalaire avec le cds terminal. En tête de colonne est le % du nombre des intercalaires inférieurs à 201 pbs.
rpl 50 36 18 68 deb fin deb fin grand petit grand petit 17 1573 50 18 50 18 1573 17 19 159 140 37 140 37 50 18 22 499 928 40 143 143 159 19 31 1964 391 41 159 19 499 22 50 18 188 82 188 82 1964 31 58 354 1664 109 296 119 140 37 62 1181 296 119 346 142 928 40 98 1364 2381 135 354 58 391 41 138 1026 143 143 365 236 354 58 140 37 19 159 391 41 1181 62 142 346 419 219 419 219 188 82 143 143 142 346 467 154 1364 98 154 467 58 354 499 22 1664 109 188 82 723 359 564 363 296 119 219 1457 236 365 723 359 2381 135 236 365 984 446 898 696 1026 138 296 119 154 467 928 40 346 142 363 564 22 499 984 446 143 143 391 41 363 564 1026 138 467 154 419 219 696 898 1179 933 419 219 696 898 138 1026 1181 62 1457 219 723 359 933 1179 1253 870 365 236 870 1253 62 1181 1364 98 723 359 928 40 870 1253 1457 219 564 363 933 1179 98 1364 1573 17 984 446 984 446 219 1457 1664 109 898 696 1664 109 17 1573 1964 31 1253 870 2381 135 31 1964 2381 135 1179 933
- Comparaison cds-cds tRNA-cds: deb fin, c'est l'ordre des adresses et grand petit l'ordre après réorientation. Leur pourcentage est calculé par rapport à la colonne, c'est à dire la moitié du total des tRNA-cds.
alpha cds total total <0 0-200 201-370 371-600 >600 deb fin grand petit rpl 850 56 24 9 6 17 14 10 5 19 ‰ 429 161 107 304 500 357 179 679
rpl blocs[modifier | modifier le wikicode]
- Lien tableur: rpl blocs
cds | 183 | 358 | cell division protein ZapE |
5s | 240 | 115 | |
23s | 716 | 2785 | |
cds | 304 | methionyl-tRNA formyltransferase | |
cds | 1458 | 600 | PAS domain-containing sensor histidine kinase |
16s | 1462 | 1500 | |
cds | 377 | P-hp |
rpl remarques[modifier | modifier le wikicode]
- Remarques: Les rickettsia, rtb et rpl, présentent de nombreux intercalaires très élevés. D’où cet intercalaire entre 2 aas de 830 pbs. La phylogénie très forte entre ces 2 génomes donne des blocs analogues mais avec des intercalaires différents. Ici les intercalaires élevés sont atténués. Je détaille ici les intercalaires du tableau des cumuls.
- - Les intercalaires entre aas: Il y a quatre intercalaires de ce type, 830 105 49 15. A part le 1er les 3 autres sont courants dans cette étude et seulement le dernier est le représentant de la moyenne dans cette étude.
- - Les intercalaires avec un cds. Les 31 blocs de ce génomes se répartissent en 3 groupes
- Les RNAs complètement isolés, les 2 intercalaires du bloc sont supérieurs à 400 pbs. Il y a 7 aas dont celui avec 830, et le 16s. Ici aac, gac et ttc ont l’intercalaire mineur à peine inférieur à 400. Sur ces 16 intercalaires 9 sont supérieurs à 800 et 7 entre 360 et 700 pbs.
- Les tRNAs proches de leurs 2 cds. Il y a 6 aas dont les 2 intercalaires sont inférieurs à 300 pbs et 3 aas dont au moins un des 2 intercalaires est entre 300 et 400 pbs.
- Il reste 14 blocs dont le 23s5s, auxquels il faut ajouter l’aa gcc voisin du gac isolé par 830. Ces blocs sont très polarisés, leurs 2 intercalaires sont très dissymétriques.
- 10 aas ont leur intercalaire majeur supérieur à 800 et va jusqu’à 2381 pbs. Le 23s5s a un intercalaire majeur modéré, 723, assez courant pour les blocs à rRNAs.
- 3 aas ont leur intercalaire majeur de 450 pbs environ.
- Les blocs isolés et les blocs entourés par 2 cds
Blocs à RNAs isolés par 2 intercalaires de plus de 400 pbs. bloc adresse intercalaire Blocs entourés par 2 intercalaires de 300 à 400 pbs aac 430531 723-359 cac 1011308 gac 127064 830-365 atgi 915893 gtc 122931 tca 187395 cgt 77750 ggc 33052 Blocs entourés par 2 intercalaires inférieurs à 300 pbs 16s 1105394 atgf 657167 agc 955439 acc 679233 ttc 758050 564-363 tgg 612783 : : cgg-caa 173063 : : gga-tac 1057162 : : cta 780489
- Les séquences des doubles: Il n'y a aucun double dans ce génome
rpl distribution[modifier | modifier le wikicode]
- Lien tableur: rpl distribution
g1 | t1 | ||||||
---|---|---|---|---|---|---|---|
atgi | 1 | tct | tat | atgf | 1 | ||
att | act | aat | agt | ||||
ctt | cct | cat | cgc | ||||
gtt | gct | gat | ggt | ||||
ttc | 1 | tcc | 1 | tac | 1 | tgc | 1 |
atc | 1 | acc | 1 | aac | 1 | agc | 1 |
ctc | 1 | ccc | cac | 1 | cgt | 1 | |
gtc | 1 | gcc | 1 | gac | 1 | ggc | 1 |
tta | 1 | tca | 1 | taa | tga | ||
ata | aca | 1 | aaa | 1 | aga | 1 | |
cta | 1 | cca | 1 | caa | 1 | cga | |
gta | 1 | gca | 1 | gaa | 1 | gga | 1 |
ttg | tcg | tag | tgg | 1 | |||
atgj | 1 | acg | 1 | aag | agg | ||
ctg | ccg | cag | cgg | 1 | |||
gtg | gcg | gag | ggg | ||||
alpha | >1aa | =1aa | -5s | +5s | -16s | +16s | total |
rpl | 8 | 25 | 33 |
rpl. Intergen51[modifier | modifier le wikicode]
Intergen51. rpl. Le génome[modifier | modifier le wikicode]
- rpl Le prélèvement: Aalpha
- Le nom et le lien NCBI: rpl, Rickettsia prowazekii str. Breinl, NCBI [9], date 20.01.22.
- rpl La longueur totale des intercalaires, longueur du génome et taux intercalaires/génome:
Nom intercals génome taux en % rpl 252,952 1,109,301 22.8
rpl données intercalaires[modifier | modifier le wikicode]
- Lien tableur: rpl données intercalaires
- Lien sauvegarde NCBI: Aalpha
rpl données intercalaires 200[modifier | modifier le wikicode]
- Lien tableur: données intercalaires 200.
rpl autres intercalaires aas[modifier | modifier le wikicode]
- Lien tableur: rpl autres intercalaires aas
- Lien sauvegarde NCBI: Aalpha
Intergen51. rpl. Les différents types d'intercalaires[modifier | modifier le wikicode]
- Lien au tableur: Intergen51. rpl les différents types d'intercalaires.
- Légende:
- - S pour intercalaire CDS-CDS et R pour tRNA-CDS,
- - c pour intercalaire continu (les 2 gènes sont sur le même brin) et x pour discontinu (les 2 gènes sont sur 2 brins différents, le brin et son complément)
- - %reste = 100*reste/total, le reste étant ce qui reste du total après la fin du diagramme, gamme.
- - %t30 = 100*t30/total, t30 étant le total des fréquences 10 20 30
- - %t5 = 100*t/total, t5 étant le total des fréquences de -1 à -5 dans le diagramme des S-.
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
Intergen51. rpl. Les diagrammes CDS-CDS positifs[modifier | modifier le wikicode]
- Lien tableur: Les diagrammes
- Diagrammes des gamma: rpl présente 2 diagrammes
- - fc40, CDS-CDS continu, fréquence unitaire en abscisses et effectif en ordonnées
- - fx%, CDS-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et pourcentage en ‰ par rapport au total, en ordonnées.
- Équations des courbes de tendance en pour 1000: colonnes %fx %fc
Courbes de tendances pour les diagrammes en pour 1000 Calculs des f.41 rpl R2 x3 x2 x c Inflexion poly3 x c 0.376 3.82E-06 -2.54E-03 4.15E-01 8.12 fx1 abscisse 221.3 229.1 0.589 -2.38E-06 1.88E-03 -5.50E-01 68.8 fc1 ordonnée 16.9 27.3 0.38 3.78E-06 -2.51E-03 4.07E-01 8.79 fx41 0.822 5.82E-06 -4.00E-03 7.04E-01 5.99 fc41
Intergen51. rpl. Les CDS-CDS négatifs[modifier | modifier le wikicode]
Sous-totaux rpl totale fréquence x- c- x- c- - 1 0 10 4 4140 - 2 1 0 85 11 - 3 0 0 3 12 - 4 0 35 717 10938 - 5 0 0 5 19 sp6 4 58 1642 8424 total 5 103 2,456 23,544 reste 1 0 264 420 s6 0 0 361 41 s7 0 9 321 1438 s8 3 49 696 6525 rappot s1-5 4/2/1 0.0 3.5 8.4 2.6 % / sp6 s6/sp6 0.0 0.0 22.0 0.5 s7/sp6 0.0 15.5 19.5 17.1 s8/sp6 75.0 84.5 42.4 77.5 reste/sp6 25.0 0.0 16.1 5.0 total s1-5 1 45 814 15120 % / total %s1-5 20.0 43.7 33.1 64.2 %sp6 80.0 56.3 66.9 35.8
Intergen51. rpl. Les intercalaires des blocs[modifier | modifier le wikicode]
- Le détail
RNA-RNA c x CDS-RNA c x 23s 5s 1 CDS 16s 1 16s 23s 5s CDS 1 16s tRNA 16 CDS 1 tRNA 23s CDS 5s 5s tRNA 23s CDS tRNA in CDS 23s 1 tRNA contig 5s 16s tRNA hors 2 2 16s16s tRNA 16s 23s tRNA tRNA 5s 16s 5s 5s 23s 5s 5s total 3 2 total 3 1
- Les rares voir gamma pour la longueur des intercalaires
- Les tRNA-CDS compris, comparaison dans le clade et dans l'étude.
Intergen51. rpl. Les intercalaires tRNA-tRNA extra bloc[modifier | modifier le wikicode]
- Lien tableur: Intergen51. rpl. Les intercalaires tRNA-tRNA extra bloc
- voir les répétitions dans rpm
Rhodospirillum photometricum DSM 122[modifier | modifier le wikicode]
rpm opérons[modifier | modifier le wikicode]
- Lien tableur: rpm opérons
- Liens: gtRNAdb [10], NCBI [11], génome [12]
- Phylogénie: Bacteria; Proteobacteria; Alphaproteobacteria; Rhodospirillales; Rhodospirillaceae; Pararhodospirillum.
- Légende: cdsa: cds aas, cdsd: cds dirigé
64.7%GC | 26.12.19 Paris | 95 | doubles | intercal | cds | aa | avec aa | cdsa | cdsd | protéines |
---|---|---|---|---|---|---|---|---|---|---|
comp | 3322..4194 | cds | 30 | 30 | 291 | LysM peptidoglycan-binding domain-containing protein | ||||
comp | 4225..4821 | 23s° | @1 | 196 | 595 | |||||
comp | 5018..5093 | gca | 182 | |||||||
comp | 5276..5684 | 16s° | 38 | 38 | 407 | |||||
5723..6664 | cds | 314 | SEL1-like repeat protein | |||||||
comp < | 12458..13198 | cds | 242 | 242 | 247 | p-transposase | ||||
comp | 13441..13555 | 5s | @2 | 72 | 113 | |||||
comp | 13628..13880 | 23s° | -7 | -7 | 251 | |||||
comp | 13874..15127 | cds | 418 | hp | ||||||
21325..22362 | cds | 586 | 586 | 346 | hp | |||||
22949..23237 | 16s° | 85 | 85 | 287 | ||||||
comp | 23323..23490 | cds | 56 | hp | ||||||
comp | 24015..24287 | cds | 250 | 250 | 91 | TraYdomain-containingprotein | ||||
comp | 24538..24652 | 5s | 71 | 113 | ||||||
comp | 24724..27490 | 23s | 212 | 2765 | ||||||
comp | 27703..27779 | atc | 112 | |||||||
comp | 27892..28378 | 16s° | 18 | 18 | 485 | |||||
<> | 28397..29119 | cds | 241 | p-EscV/YscV/HrcVfamilytypeIIIsecretionsystemexportapparatusprotein | ||||||
comp | 32782..33759 | cds | 190 | 190 | 326 | glycosyltransferase | ||||
33950..34357 | 16s° | 112 | 406 | |||||||
34470..34546 | atc | 216 | ||||||||
34763..35591 | 23s° | 44 | 827 | |||||||
comp | 35636..35750 | 5s | 72 | 113 | ||||||
comp | 35823..38589 | 23s | 215 | 2765 | ||||||
comp | 38805..38881 | atc | 112 | |||||||
comp | 38994..40502 | 16s | 260 | 1507 | ||||||
comp | 40763..42629 | 23s° | -15 | 1865 | ||||||
42615..42903 | 16s° | 112 | 287 | |||||||
43016..43092 | atc | 213 | ||||||||
43306..44132 | 23s° | -1 | 825 | |||||||
comp | 44132..44835 | 23s° | -5 | -5 | 702 | |||||
44831..45121 | cds | 97 | hp | |||||||
< | 45496..45768 | cds | 553 | 553 | 91 | p-glycosyl transferase family 1 | ||||
46322..47040 | 16s° | 0 | 0 | 717 | ||||||
comp | 47041..47433 | cds | 131 | winged helix-turn-helix domain-containing protein | ||||||
comp | 49761..51017 | cds | 128 | 128 | 419 | glycosyltransferase | ||||
comp | 51146..51221 | 23s° | 214 | 74 | ||||||
comp | 51436..51512 | atc | 112 | |||||||
comp | 51625..52017 | 16s° | -7 | 391 | ||||||
52011..52881 | 23s° | 106 | 106 | 869 | ||||||
52988..53464 | cds | -37 | -37 | 159 | hp | |||||
> | 53428..53694 | cds | 86 | 86 | 89 | p-glycosyltransferase | ||||
comp | 53781..54709 | 23s° | 26 | 927 | ||||||
54736..54898 | 16s° | 112 | 161 | |||||||
55011..55087 | atc | 216 | ||||||||
55304..55741 | 23s° | 438 | 438 | 436 | ||||||
56180..56440 | cds | 87 | hp | |||||||
comp | 82891..83088 | cds | 116 | 116 | 66 | preprotein translocase subunit SecE | ||||
comp | 83205..83280 | tgg | 199 | 199 | ||||||
>comp | 83480..84178 | cds | 233 | p-elongation factor Tu | ||||||
417242..417412 | cds | 142 | 142 | 57 | tRNA (5-methylaminomethyl-2-thiouridylate)-methyltransferase | |||||
417555..417631 | atgj | + | 24 | 24 | ||||||
417656..417732 | atgj | 2 atgj | 38 | 38 | ||||||
comp | 417771..418796 | cds | 342 | tRNA epoxyqueuosine(34) reductase QueG | ||||||
434306..435142 | cds | 512 | 512 | 279 | CDP-diacylglycerol--serine O-phosphatidyltransferase | |||||
435655..435842 | 16s° | -6 | 186 | |||||||
435837..436075 | 23s° | 72 | 237 | |||||||
436148..436262 | 5s | 51 | 113 | |||||||
436314..436390 | atgf | 196 | 196 | |||||||
436587..436883 | cds | 99 | hp | |||||||
comp | 467261..468370 | cds | 167 | 167 | 370 | 3-isopropylmalate dehydrogenase | ||||
468538..468667 | 23s° | 72 | 128 | |||||||
468740..468854 | 5s | 51 | 113 | |||||||
468906..468982 | atgf | 125 | 125 | |||||||
469108..469863 | cds | 252 | SAM-dependent chlorinase/fluorinase | |||||||
comp | 534521..536161 | cds | 367 | 367 | 547 | glucose-6-phosphate isomerase | ||||
536529..536603 | acg | 92 | 92 | |||||||
comp | 536696..537778 | cds | 361 | tyrosine-type recombinase/integrase | ||||||
comp | 658467..658931 | cds | 110 | 110 | 155 | GNAT family N-acetyltransferase | ||||
comp | 659042..659116 | gtc | 155 | 155 | ||||||
659272..660159 | cds | 106 | 106 | 296 | N-formylglutamate amidohydrolase | |||||
660266..660340 | gtc | 648 | 648 | |||||||
comp | 660989..661800 | cds | 271 | p-N-formylglutamate amidohydrolase | ||||||
comp | 684188..685141 | cds | 323 | 323 | 318 | cation transporter | ||||
comp | 685465..685539 | gtg | + | 25 | 25 | |||||
comp | 685565..685639 | gtg | 2 gtg | 195 | 195 | |||||
685835..686251 | cds | 139 | NUDIX hydrolase | |||||||
comp | 691078..691773 | cds | 4 | 4 | 232 | ComF family protein | ||||
691778..691897 | 23s° | 72 | 118 | |||||||
691970..692084 | 5s | 114 | 114 | 113 | ||||||
comp | 692199..694505 | cds | 769 | VWA domain-containing protein | ||||||
750262..751398 | cds | 161 | 161 | 379 | [FeFe] hydrogenase H-cluster radical SAM maturase HydE | |||||
comp | 751560..751674 | 5s | 72 | 113 | ||||||
comp | 751747..752005 | 23s° | 597 | 597 | 257 | |||||
752603..752814 | rpr | @4 | 388 | 388 | 21 | CRISPR | ||||
753203..753760 | cds | 186 | hp | |||||||
comp | 839981..840214 | cds | 4 | 4 | 78 | hp | ||||
comp | 840219..840478 | 16s° | 568 | 568 | 258 | |||||
comp | 841047..844388 | cds | 1114 | response regulator | ||||||
874585..875391 | cds | 88 | 88 | 269 | phosphoadenylyl-sulfate reductase | |||||
875480..875556 | cac | 81 | 81 | |||||||
875638..876117 | cds | 160 | CreA family protein | |||||||
885688..886299 | cds | 176 | 176 | 204 | LysE family translocator | |||||
886476..886552 | ccc | 144 | 144 | |||||||
comp | 886697..887233 | cds | 179 | helix-turn-helix transcriptional regulator | ||||||
932708..934243 | cds | 93 | 93 | 512 | Fic family protein | |||||
comp | 934337..934413 | cgt | + | 35 | 35 | |||||
comp | 934449..934525 | cgt | 3 cgt | 44 | 44 | |||||
comp | 934570..934646 | cgt | 449 | 449 | ||||||
935096..936175 | cds | 360 | hp | |||||||
comp | 978995..979396 | cds | 138 | 138 | 134 | MFS transporter | ||||
comp | 979535..979609 | ggc | + | 23 | 23 | |||||
comp | 979633..979707 | ggc | 4 ggc | 45 | 45 | |||||
comp | 979753..979827 | ggc | 29 | 29 | ||||||
comp | 979857..979931 | ggc | 206 | 206 | ||||||
980138..981679 | cds | 514 | murein biosynthesis integral membrane protein MurJ | |||||||
997575..997898 | cds | 95 | 95 | 108 | DUF1476 domain-containing protein | |||||
comp | 997994..998067 | cag | + | 54 | 54 | |||||
comp | 998122..998195 | cag | 2 cag | 168 | 168 | |||||
998364..999509 | cds | 382 | Ppx/GppA family phosphatase | |||||||
1050081..1051028 | cds | 60 | 60 | 316 | NnrS family protein | |||||
comp | 1051089..1051163 | acc | + | 16 | 16 | |||||
comp | 1051180..1051254 | acc | 3 acc | 18 | 18 | |||||
comp | 1051273..1051347 | acc | 170 | 170 | ||||||
comp | 1051518..1053305 | cds | 596 | EAL domain-containing protein | ||||||
1197836..1199341 | cds | 197 | 197 | 502 | aldehyde dehydrogenase | |||||
1199539..1199623 | cta | 126 | 126 | |||||||
1199750..1201090 | cds | 447 | trigger factor | |||||||
1206196..1206501 | cds | 93 | 93 | 102 | HU family DNA-binding protein | |||||
1206595..1206670 | gta | 50 | 50 | |||||||
1206721..1207092 | cds | 124 | hp | |||||||
1213113..1214459 | cds | 210 | 210 | 449 | acetyl-CoA carboxylase biotin carboxylase subunit | |||||
comp | 1214670..1214874 | 16s° | 600 | 600 | 203 | |||||
comp | 1215475..1216716 | cds | 414 | polyphosphate kinase | ||||||
comp | 1349719..1350132 | cds | 109 | 109 | 138 | NAD(P) transhydrogenase subunit alpha | ||||
comp | 1350242..1350608 | 23s° | 212 | 365 | ||||||
comp | 1350821..1350897 | atc | 115 | |||||||
comp | 1351013..1351438 | 16s° | 23 | 23 | 424 | |||||
< comp | 1351462..1352160 | cds | 233 | p-tetratricopeptide repeat protein | ||||||
1359745..1360302 | cds | 176 | 176 | 186 | hp | |||||
1360479..1360555 | gac | + | 37 | 37 | ||||||
1360593..1360669 | gac | 2 gac | 274 | 274 | ||||||
1360944..1361204 | cds | 87 | hp | |||||||
1416615..1417769 | cds | 214 | 214 | 385 | glycosyltransferase family 61 protein | |||||
1417984..1418074 | tcc | 154 | 154 | |||||||
comp | 1418229..1419095 | cds | 289 | LysR family transcriptional regulator | ||||||
comp | 1472421..1473403 | cds | 250 | 250 | 328 | biotin synthase BioB | ||||
comp | 1473654..1473740 | ttg | 77 | 77 | ||||||
comp | 1473818..1474678 | cds | 287 | homocysteine S-methyltransferase family protein | ||||||
comp | 1735298..1736380 | cds | 209 | 209 | 361 | DUF262 domain-containing protein | ||||
1736590..1736859 | 23s° | 72 | 268 | |||||||
1736932..1737046 | 5s | 52 | 113 | |||||||
1737099..1737175 | atgf | 93 | 93 | |||||||
comp | 1737269..1737694 | cds | 142 | type II toxin-antitoxin system VapC family toxin | ||||||
comp | 1812365..1813924 | cds | 894 | 894 | 520 | peptidoglycan DD-metalloendopeptidase family protein | ||||
1814819..1815040 | 16s° | -7 | -7 | 222 | ||||||
<comp | 1815034..1815837 | cds | 80 | 80 | 268 | p-elongation factor Tu | ||||
comp | 1815918..1815991 | gga | 34 | 34 | ||||||
comp | 1816026..1816111 | tac | 144 | 144 | ||||||
1816256..1817143 | cds | 296 | 23S rRNA (guanosine(2251)-2'-O)-methyltransferase RlmB | |||||||
comp | 1833109..1833603 | cds | 83 | 83 | 165 | MBL fold metallo-hydrolase | ||||
comp | 1833687..1833762 | aag | + | 24 | 24 | |||||
comp | 1833787..1833862 | aag | 2 aag | 198 | 198 | |||||
comp | 1834061..1835224 | cds | 388 | rod shape-determining protein RodA | ||||||
> | 1941413..1943059 | cds | -30 | -30 | 549 | p-recombinase family protein | ||||
comp | 1943030..1943121 | agc | 160 | 160 | ||||||
comp | 1943282..1944133 | cds | 284 | FAD-dependent thymidylate synthase | ||||||
comp | 2087696..2090938 | cds | 705 | 705 | 1081 | PAS domain-containing protein | ||||
2091644..2091826 | 16s° | 7 | 7 | 181 | ||||||
2091834..2092247 | cds | 138 | hp | |||||||
comp | 2095044..2095490 | cds | 48 | 48 | 149 | hp | ||||
comp | 2095539..2095733 | 16s° | 614 | 614 | 193 | |||||
comp | 2096348..2097337 | cds | 330 | trypsin-like serine protease | ||||||
comp | 2113248..2114603 | cds | 219 | 219 | 452 | hp | ||||
comp | 2114823..2114899 | aga | 55 | 55 | ||||||
comp | 2114955..2115251 | cds | 71 | 71 | 99 | ETC complex I subunit | ||||
comp | 2115323..2115399 | cca | 261 | 261 | ||||||
comp | 2115661..2115960 | cds | 100 | hp | ||||||
comp | 2144042..2146288 | cds | 308 | 308 | 749 | HAMP domain-containing protein | ||||
2146597..2147256 | 23s° | 72 | 658 | |||||||
2147329..2147443 | 5s | 52 | 113 | |||||||
2147496..2147572 | atgf | 645 | 645 | |||||||
comp | 2148218..2148664 | cds | 149 | hp | ||||||
2268003..2268461 | cds | 87 | 87 | 153 | 23S rRNA (pseudouridine(1915)-N(3))-methyltransferase RlmH | |||||
comp | 2268549..2268625 | ccg | + | 165 | 165 | |||||
comp | 2268791..2268867 | ccg | 2 ccg | 56 | 56 | |||||
comp | 2268924..2269910 | cds | 329 | farnesyltranstransferase | ||||||
comp | 2321621..2322145 | cds | 332 | 332 | 175 | hp | ||||
2322478..2322554 | ccc | 225 | 225 | |||||||
2322780..2322974 | cds | 65 | hp | |||||||
comp | 2393295..2396009 | cds | @3 | 1003 | 1003 | 905 | CRISPR-associated helicase/endonuclease Cas3 | |||
2397013..2397919 | 16s° | 2 | 2 | 905 | ||||||
2397922..2400888 | cds | 989 | hp | |||||||
comp | 2517845..2520559 | cds | 229 | 229 | 905 | phosphoenolpyruvate carboxylase | ||||
comp | 2520789..2520903 | 5s | 72 | 113 | ||||||
comp | 2520976..2521339 | 23s° | 189 | 189 | 362 | |||||
comp | 2521529..2522152 | cds | 208 | 3-isopropylmalate dehydratase small subunit | ||||||
comp | 2596508..2596738 | cds | 989 | 989 | 77 | motility twitching protein PilT | ||||
comp | 2597728..2597815 | tca | 194 | 194 | ||||||
2598010..2599204 | cds | 398 | hp | |||||||
comp | 2621435..2622058 | cds | 106 | 106 | 208 | helix-turn-helix transcriptional regulator | ||||
comp | 2622165..2622251 | ctc | 202 | 202 | ||||||
2622454..2623107 | cds | 218 | lipoyl(octanoyl) transferase LipB | |||||||
2631201..2631554 | cds | 192 | 192 | 118 | hp | |||||
2631747..2631822 | gcc | + | 70 | 70 | ||||||
2631893..2631968 | gcc | 4 gcc | 69 | 69 | ||||||
2632038..2632113 | gcc | 57 | 57 | |||||||
2632171..2632246 | gcc | 166 | 166 | |||||||
< | 2632413..2632965 | cds | -41 | -41 | 184 | p-IS256 family transposase | ||||
2632925..2633473 | cds | 30 | 30 | 183 | hp | |||||
comp | 2633504..2633579 | aca | 93 | 93 | ||||||
comp | 2633673..2634200 | cds | 271 | 271 | 176 | N-acetyltransferase | ||||
comp | 2634472..2634561 | tcg | 155 | 155 | ||||||
2634717..2635742 | cds | 342 | hp | |||||||
comp | 2655872..2656489 | cds | 182 | 182 | 206 | YitT family protein | ||||
comp | 2656672..2656747 | gag | 141 | 141 | ||||||
comp | 2656889..2657674 | cds | 262 | MetQ/NlpA family ABC transporter substrate-binding protein | ||||||
2758160..2758312 | cds | 110 | 110 | 51 | light-harvesting protein | |||||
comp | 2758423..2758509 | tta | 94 | 94 | ||||||
comp | 2758604..2759899 | cds | 432 | bifunctional folylpolyglutamate synthase/dihydrofolate synthase | ||||||
> | 2768823..2769518 | cds | -12 | -12 | 232 | methyltransferase | ||||
2769507..2769776 | 23s° | 71 | 268 | |||||||
2769848..2769962 | 5s | 118 | 118 | 113 | ||||||
comp | 2770081..2771016 | cds | 312 | tetratricopeptide repeat protein | ||||||
2792922..2794778 | cds | 129 | 129 | 619 | glutathione-regulated potassium-efflux system protein KefB | |||||
2794908..2794982 | caa | 92 | 92 | |||||||
comp | 2795075..2795686 | cds | 204 | hp | ||||||
2862755..2862982 | cds | 123 | 123 | 76 | hp | |||||
2863106..2863182 | cca | 117 | 117 | |||||||
2863300..2863374 | atgi | 373 | 373 | |||||||
2863748..2863823 | gca | 157 | 157 | |||||||
2863981..2864056 | aca | 15 | ||||||||
2864072..2864317 | cds | 8 | 82 | DUF2829 domain-containing protein | ||||||
2864326..2864401 | aaa | 250 | 250 | |||||||
> | 2864652..2865041 | cds | 130 | p-hp | ||||||
2867066..2868112 | cds | 76 | 76 | 349 | tyrosine-type recombinase/integrase | |||||
comp | 2868189..2868264 | aaa | 99 | 99 | ||||||
comp | 2868364..2868870 | cds | 169 | peptidylprolyl isomerase | ||||||
2893891..2894430 | cds | 25 | 25 | 180 | phage portal protein | |||||
2894456..2894570 | 5s | 51 | 113 | |||||||
2894622..2894698 | atgf | 285 | 285 | |||||||
2894984..2895400 | cds | 139 | p-hp | |||||||
comp | 3034652..3035092 | cds | 250 | 250 | 147 | hp | ||||
comp | 3035343..3035418 | aaa | 8 | 8 | ||||||
comp | 3035427..3035986 | cds | 187 | DUF2829 domain-containing protein | ||||||
comp | 3305068..3306534 | cds | 379 | 379 | 489 | S8 family serine peptidase | ||||
comp | 3306914..3306989 | ttc | + | 29 | 29 | |||||
comp | 3307019..3307094 | ttc | 4 ttc | 34 | 34 | |||||
comp | 3307129..3307204 | ttc | 33 | 33 | ||||||
comp | 3307238..3307313 | ttc | 60 | 60 | ||||||
comp | 3307374..3308864 | cds | 497 | RimK family protein | ||||||
comp | 3332977..3334356 | cds | 54 | 54 | 460 | type II secretion system protein | ||||
3334411..3334487 | cgg | 176 | 176 | |||||||
< comp | 3334664..3335983 | cds | 440 | p-hp | ||||||
3408217..3409026 | cds | 91 | 91 | 270 | hp | |||||
comp | 3409118..3409232 | 5s | 71 | 113 | ||||||
comp | 3409304..3409410 | 23s° | 1 | 1 | 105 | |||||
< | 3409412..3409711 | cds | 100 | p-IS5/IS1182 family transposase | ||||||
comp | 3456276..3461666 | cds | 387 | 387 | 1797 | alpha-2-macroglobulin family protein | ||||
3462054..3462130 | agg | 29 | 29 | |||||||
3462160..3462951 | cds | 264 | amino acid ABC transporter substrate-binding protein | |||||||
comp | 3500025..3500675 | cds | 210 | 210 | 217 | protein-L-isoaspartate O-methyltransferase | ||||
3500886..3500959 | tgc | + | 27 | 27 | ||||||
3500987..3501061 | aac | 2 aac | 31 | 31 | ||||||
3501093..3501167 | aac | 84 | 84 | |||||||
comp | 3501252..3501659 | cds | 136 | hp | ||||||
3639978..3641276 | cds | 172 | 172 | 433 | outer membrane efflux protein | |||||
3641449..3641525 | gcg | + | 70 | 70 | ||||||
3641596..3641671 | gcg | 3 gcg | 33 | 33 | ||||||
3641705..3641780 | gcg | 389 | 389 | |||||||
3642170..3644392 | cds | 741 | sigma-54-dependent Fis family transcriptional regulator | |||||||
3651524..3652711 | cds | 55 | 55 | 396 | aminotransferase | |||||
3652767..3652843 | cac | 202 | 202 | |||||||
<comp | 3653046..3653543 | cds | 166 | arsenical-resistance protein | ||||||
3710072..3710840 | cds | 126 | 126 | 256 | TonB family protein | |||||
comp | 3710967..3711042 | gaa | + | 214 | 214 | |||||
comp | 3711257..3711332 | gaa | 2 gaa | 125 | 125 | |||||
comp | 3711458..3711664 | cds | 69 | cold-shock protein | ||||||
comp | 3727874..3729085 | cds | 828 | 828 | 404 | hp | ||||
3729914..3730068 | 16s° | 87 | 87 | 153 | ||||||
3730156..3730545 | cds | 130 | hp | |||||||
comp | 3804728..3805231 | cds | 118 | 118 | 168 | response regulator | ||||
comp | 3805350..3805425 | gag | 241 | 241 | ||||||
comp | 3805667..3806140 | cds | 158 | transcription elongation factor GreA | ||||||
3813820..3815895 | cds | 138 | 138 | 692 | RNA polymerase sigma factor RpoD | |||||
3816034..3816109 | atgi | 94 | 94 | |||||||
3816204..3818993 | cds | 930 | diguanylate cyclase | |||||||
comp | 3827982..3828878 | cds | 90 | 90 | 299 | phosphoserine phosphatase SerB | ||||
comp | 3828969..3829042 | ggg | @5 | 292 | 292 | |||||
3829335..3830670 | cds | 445 | chemotaxis protein | |||||||
comp | 3832305..3833264 | cds | 311 | 311 | 320 | complex I NDUFA9 subunit family protein | ||||
3833576..3833662 | ctg | + | 47 | 47 | ||||||
3833710..3833796 | ctg | 5 ctg | 153 | 153 | ||||||
3833950..3834036 | ctg | 48 | 48 | |||||||
3834085..3834171 | ctg | 47 | 47 | |||||||
3834219..3834305 | ctg | 113 | 113 | |||||||
3834419..3835039 | cds | 207 | ribonuclease D |
rpm cumuls[modifier | modifier le wikicode]
- Lien tableur: rpm cumuls
opérons | Fréquences intercalaires tRNAs | Fréquences intercalaires cds | Fréquences aas cds chromosome | ||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
effectif | gammes | sans rRNAs | avec rRNAs | gammes | cds | gammes | cdsd | gammes | cdsa | gammes | cdsa 300 | ||
avec rRNA | opérons | 27 | 1 | 0 | 1 | 9 | 1 | 100 | 20 | 1 | 0 | ||
16s°atc23s° | 7 | 20 | 2 | 50 | 15 | 40 | 200 | 35 | 30 | 0 | |||
16s°gca23s° | 1 | 40 | 14 | 100 | 30 | 80 | 300 | 30 | 60 | 3 | |||
16s°23s° | 1 | 60 | 7 | 150 | 24 | 120 | 400 | 23 | 90 | 10 | |||
max a | 1 | 80 | 3 | 200 | 23 | 160 | 500 | 14 | 120 | 10 | |||
a doubles | 0 | 100 | 0 | 250 | 16 | 200 | 600 | 7 | 150 | 14 | |||
spéciaux | 18 | 120 | 1 | 300 | 5 | 240 | 700 | 2 | 180 | 13 | |||
total aas | 13 | 140 | 0 | 350 | 4 | 280 | 800 | 3 | 210 | 11 | |||
sans | opérons | 47 | 160 | 2 | 400 | 5 | 320 | 900 | 0 | 240 | 6 | ||
1 aa | 30 | 180 | 1 | 450 | 2 | 360 | 1000 | 4 | 270 | 9 | |||
max a | 5 | 200 | 0 | 500 | 0 | 400 | 1100 | 1 | 300 | 9 | |||
a doubles | 15 | 2 | 14 | 2 | 56 | ||||||||
total aas | 79 | 32 | 0 | 147 | 0 | 141 | 141 | ||||||
total aas | 92 | ||||||||||||
remarques | 5 | ||||||||||||
avec jaune | moyenne | 69 | 194 | 310 | |||||||||
variance | 75 | 197 | 248 | ||||||||||
sans jaune | moyenne | 39 | 147 | 252 | 170 | ||||||||
variance | 16 | 112 | 134 | 71 |
rpm tRNA-cds[modifier | modifier le wikicode]
- Note: intercalaires prélevés de la colonne cds de rpm opérons dans un bloc de tRNAs uniquement. Le début du bloc est dans l'ordre des adresses, deb intercalaire entre le cds et le 1er tRNA dd bloc, fin entre le dernier tRNA et le cds terminal. J'ai procédé, dans les colonnes petit et grand, à la réorientation des blocs d'après la constatation que les blocs à rRNA ont leurs cds de début et de fin sont orientés du cds-16s au 5s-tRNAs-cds, l'intercalaire cds-16s étant plus grands que l'intercalaire avec le cds terminal. En tête de colonne est le % du nombre des intercalaires inférieurs à 201 pbs.
rpm 71 73 47 98 deb fin deb fin grand petit grand petit -30 160 250 8 87 56 160 -30 30 93 387 29 88 81 250 8 54 176 142 38 93 50 387 29 55 202 93 50 93 30 93 30 60 170 219 55 99 76 142 38 71 261 87 56 110 94 93 50 76 99 379 60 126 125 176 54 83 198 250 77 129 92 202 55 87 56 88 81 138 94 219 55 88 81 210 84 142 38 87 56 90 292 129 92 155 110 170 60 93 449 367 92 160 -30 379 60 93 50 30 93 168 95 261 71 95 168 110 94 170 60 99 76 106 648 138 94 176 144 250 77 106 202 76 99 176 54 88 81 110 155 311 113 182 141 198 83 110 94 126 125 192 166 210 84 116 199 197 126 197 126 292 90 118 241 182 141 198 83 129 92 123 250 176 144 199 116 367 92 126 125 214 154 202 55 449 93 129 92 110 155 202 106 110 94 138 206 271 155 206 138 138 94 138 94 -30 160 210 84 168 95 142 38 192 166 214 154 202 106 172 389 95 168 219 55 648 106 176 144 60 170 241 118 155 110 176 274 54 176 250 8 311 113 182 141 989 194 250 77 199 116 192 166 323 195 250 123 241 118 197 126 83 198 261 71 250 123 210 84 116 199 271 155 126 125 214 154 55 202 274 176 197 126 219 55 106 202 292 90 206 138 250 77 138 206 311 113 182 141 250 8 332 225 323 195 176 144 271 155 118 241 332 225 214 154 311 113 123 250 367 92 271 155 323 195 71 261 379 60 192 166 332 225 176 274 387 29 389 172 367 92 90 292 389 172 274 176 379 60 172 389 449 93 989 194 387 29 93 449 648 106 323 195 989 194 106 648 989 194 332 225
- Comparaison cds-cds tRNA-cds: deb fin, c'est l'ordre des adresses et grand petit l'ordre après réorientation. Leur pourcentage est calculé par rapport à la colonne, c'est à dire la moitié du total des tRNA-cds.
alpha cds total total <0 0-200 201-370 371-600 >600 deb fin grand petit rpm 3,484 90 1 64 19 4 2 31 33 21 43 rpm ‰ 11 711 211 44 22 689 733 467 956
rpm blocs[modifier | modifier le wikicode]
rpm blocs protéines[modifier | modifier le wikicode]
- Lien tableur: rpm blocs protéines
- Note:
- - hp pour hypothetical protein
- - p- pour pseudo, par exemple p-elon en abrégé donne p-elongation factor Tu.
abrégé | nom |
---|---|
23s | 23s rRNA (guanosine(2251)-2'-O)-methyltransferase RlmB |
3-isop | 3-isopropylmalate dehydrogenase |
3-isop-sub | 3-isopropylmalate dehydratase small subunit |
acetyl | acetyl-CoA carboxylase biotin carboxylase subunit |
cas3 | CRISPR-associated helicase/endonuclease Cas3 |
CDP | CDP-diacylglycerol--serine O-phosphatidyltransferase |
ComF | ComF family protein |
CRISPR | CRISPR |
DUF262 | DUF262 domain-containing protein |
FeFe | [FeFe] hydrogenase H-cluster radical SAM maturase HydE |
glyco | glycosyltransferase |
HAMP | HAMP domain-containing protein |
LysM | LysM peptidoglycan-binding domain-containing protein |
methyl | methyltransferase |
NAD | NAD(P) transhydrogenase subunit alpha |
p-elon | p-elongation factor Tu |
p-EscV | p-EscV/YscV/HrcVfamilytypeIIIsecretionsystemexportapparatusprotein |
p-glyco | p-glycosyltransferase |
P-glyco1 | p-glycosyl transferase family 1 |
p-IS5 | p-IS5/IS1182 family transposase |
p-tetra | p-tetratricopeptide repeat protein |
p-trans | p-transposase |
PAS | PAS domain-containing protein |
peptido | peptidoglycan DD-metalloendopeptidase family protein |
phage | phage portal protein |
phospho | phosphoenolpyruvate carboxylase |
polypho | polyphosphate kinase |
respons | response regulator |
SAM | SAM-dependent chlorinase/fluorinase |
SEL1 | SEL1-like repeat protein |
tetra | tetratricopeptide repeat protein |
TraY | TraY domain-containing protein |
trypsin | trypsin-like serine protease |
type II | type II toxin-antitoxin system VapC family toxin |
VWA | VWA domain-containing protein |
winged | winged helix-turn-helix domain-containing protein |
rpm blocs construits[modifier | modifier le wikicode]
- Lien tableur: rpm blocs construits
- Légende: lien au tableau des protéines, abrégés
- - vert: la taille des rRNAs en pbs alors que les protéines (cdsa) sont en aas.
- - bleu: protéines bien caractérisées alors qu'en clair sont les protéines candidates à la création, hp pour hypothetical protein, p-protéine pour pseudo-protéine et les protéines caractérisées seulement par un domaine comme DUF262 par exemple.
- - cyan: Les intercalaires constantes vestiges des blocs complets représentés par l'unique bloc contenant le 16s avec les intercalaires 71 pour 5s-23s, 212 pour 23s-atc, 112 pour atc-16s et 52 dans le cas de 5s-atgf.
- - gris: Je ne considère ici que les protéines créées à l'intérieur d'un bloc rRNA. Les protéines non canditates à la création sont en bleu, voir ci-dessus le bleu, mais la reconstruction des blocs détruits m'a obligé à considérer des protéines internes au bloc, bien caractérisées non candiates à la création. Aussi je n'ai conservé que les plus petites, metyl adresse 2768823, 3-isop-sub adresse 2521529 et glyco adresse 49761. La reconstruction ne m'a pas permis de faire de grands blocs pour 4 clusters listés à la fin des 2 derniers tableaux en gris. Ces clusters sont restés parce qu'ils mettraient des protéines non candidates en intra bloc avec de grande taille.
- Notes: Il faut noter que théoriquement, pour cet organisme où la destruction des blocs est spéctaculaire, les protéines créées pourraient être aussi grande que le 23s en paires de base, 2765 soit 900 aas à peu près. C'est ce que j'ai suggéré en plaçant le 16s° contenant 1 grosse protéine candidate pour la création parce qu'elle est hypothétique dans le reconstruction du bloc b10, cas3-16s°-hp, 905-16s°-989. La même situation est reproduite dans le bloc b9 avec PAS-16s°-hp, 1081-16s°-138.
- @ Les blocs à rRNAs: texte de rpm remarques, remarque @3.
- - Les clusters de rpm tels qu’ils apparaissent dans la séquence des adresses sont présentés au chapitre rpm blocs construits, tableaux A5b1 et A5b2.
- + A5b1 rassemble 9 16s° solitaires suivis de longs clusters où on peut repérer les blocs d’origine altérés caractérisés par les intercalaires 16s-atc-23s, respectivement de 112 pbs et 216 pbs. Ainsi je suppose qu’il y a 5 blocs d’origine de type 16s-atc-23s-5s et un,isolé, de type 16s-gca-23s-5s. Dans ces grands clusters seul subsiste un seul 5s appartenant au bloc complet et intègre que j’ai nommé b0.
- + A5b2 rassemble 9 23s°5s solitaires et 3 blocs complets et un 5s solitaire. Les 23s°5s sont mis en face des 16s° du tableau A5b1. Les blocs complets contiennent un représentant de 16s, un de 23s et un 5s. Dans cette partie du tableau A5b2 j’ai ajouté le bloc b0 séparé de son cluster pour comparaison. Le bloc analogue au b0 est le bloc b1 qui est isolé et où seul le 16s est altéré. Le bloc b3 de cette partie du tableau apparaît comme un racollage d’un 16s° solitaire et d’un 23s°5s solitaire puisque l’intercalaire 16s°-23s° est négatif, c’est-à-dire qu’il y a recouvrement des 2 morceaux, ce qui ne serait pas le cas s’il y avait une délétion entre le 16s et le 23s d’origine.
- - Le parallélisme et l'égalité en nombres entre les 16s° et les 23s°5s solitaires, ainsi que l'analyse des intercalaires petits et négatifs de la remarque @2 m’ont poussé à reconstruire les blocs d’origines en rapprochant des 16s° solitaires à d’autres 16s° solitaires ou non tous 2 avec leurs cds, selon l’hypothèse que les 2 cds internes résultant font partie de l’altération ou de la délétion du 16s original et du coup ces cds seraient des candidats à la création de gènes nouveaux. Le même procédé et la même hypothèse sont appliqués pour un 23° et un 23s°5s.
- - Cette reconstruction se trouve dans les tableaux A5b3 et A5b4. Ainsi en optimisant les tailles des 16s et 23s reconstruits pour se rapprocher le plus aux tailles de ces rRNAs du bloc intègre b0, j’ai pu construire 11 blocs. J’ai séparé le 16s° du 23s°5s du bloc b3 du tableau A5b2. Il reste cependant un 16s°, un 23s° et un 5s-atgf que je n’ai pas pu réunir car leurs cds sont tous bien caractérisés et ne répondent aux critères des candidats à la création. L’hypothèse de 11 blocs ou 12 blocs à l’origine est tout à fait probable en comparaison des 9 blocs de abq.
- - Je n'ai pas pu faire une reconstruction analogue avec abs malgré la proximité phylogénique de abq car la complémentarité 16s° et 23s°5s n’existe pas comme si l’altération faisait disparaître une partie du rRNA, ceux qui restent indiquant la position des originaux. Cela indiquerait que ce sont 2 processus d’altération différents certainement reliés à la présence des tRNAs intra bloc, atc pour rpm et atc-gca pour abs.
- - Le génome analogue avec que des atc Tistrella mobilis KA081020-065, voir proteobacteria et Tistrella mobilis KA081020-065 [[13]]
- - Les clusters de rpm tels qu’ils apparaissent dans la séquence des adresses sont présentés au chapitre rpm blocs construits, tableaux A5b1 et A5b2.
- @ Les blocs à rRNAs: texte de rpm remarques, remarque @3.
|
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|
rpm remarques[modifier | modifier le wikicode]
rpm remarques texte[modifier | modifier le wikicode]
- Remarques:
- @ Il y a 7 atc dans 7 blocs à rRNAs courts ou longs et il n’y a qu’un seul gca de ce type. Il y a un 2ème gca mais dans un bloc sans rRNAs. C’est un génome à 16satc23s5s comme Tistrella mobilis KA081020-065 [[14]]. Voir fiche alpha.
- @ Il y a 12 blocs à rRNAs courts ou complets et tous ont un intercalaire 23s-5s ou 23s°-5s de 72 ou 71. Les intercalaires avec cds et entre aas
- - Les intercalaires élevés: Ils sont peu nombreux et modérés.
- + Les cds avec les blocs à rRNAs sont en général élevés jusqu’à 600 pbs. Sur les 13 de rpm seulement 4 dépassent 700, 705 828 894 1003.
- + Il y a 3 intercalaires avec les tRNAs supérieurs à 400, 489 648 989. Le génome rpm n’échappe donc pas au comportement des alpha.Voir le tableau des spectres des intercalaires avec les cds. Bien que rpm présente un maximum élevé il affiche un minimum de 3 intercalaires avec les tRNAs, élevés, supérieurs à 400 contre un maximum de 24 pour rpl.
- - Les intercalaires négatifs et petits, voir le tableau des spectres et la liste de ces intercalaires.
- + Dans le tableau des spectres des intercalaires, rpm et aon sont les seuls à présenter une proportion significative de ces intercalaires négatifs avec 6% alors que les 7 autres alpha n’en présentent aucun.
- + Dans la liste de rpm sur 24 intercalaires inférieurs à 51, 7 sont négatifs un nul et un égale à l’unité. Six autres ont des intercalaires positifs inférieurs à 9. Cette liste laisse penser que ce comportement est très lié à l’altération des blocs à rRNAs. Puisque, 16 de ces intercalaires concernent les rRNAs altérés de même que les intercalaires élevés, supérieurs à 400, concernent 12 de ces RNAs.
- + C'est comme si l'altération des blocs à rRNAs se faisait à l'intérieur du bloc et épargnait son extérieur. D'où cette hypothèse que les cds à intercalaires petits ou négatifs collés aux rRNAs altérés seraient des candidats à la création de gènes, petits, hypothétiques et/ou pseudo.
- + Ces intercalaires ne seraient pas dus seulement au changement de brin lors de la recombinaison ou de la conversion, puisque les changements de brin (présentés ici par comp) ne représentent que le tiers, 6 sur 16.
- + Dans ce génome les intercalaires négatifs et petits existent entre 2 cds contigus et un cds et un tRNA (agc).Mais les intercalaires des 5 autres tRNAs sont assez élevés et correspondent à la dissymétrie, constatée chez beaucoup de génomes, entre les 2 cds encadrant un bloc sans rRNAs.
- - Spectre des intercalaires avec les cds: rapportés au total j’ai distingué 4 intervalles de ces intercalaires en pbs, inférieur à 51, de 51-200, de 201-400 et supérieur à 400. A part les génomes à phylogénie étroite, abq abs et rtb rpl, il y a 6 génomes différents.
- + rru et abq sont identiques
- + rpm et oan sont différents avec tous les autres à cause des négatifs et ils sont différents entre eux par l'intervalle 51-200, 0.52 contre 0.36.
- + agr a l'intervalle 201-400 le plus élevé de tous, 0.34 contre 0.15 à 0.28. Et le génome dont il se rapproche le plus, aua, diffère avec lui pour tous les autres intervalles.
- + rtb diffère de tous les autres par un intervalle > 400 élevé qui est de 0.44 contre moins de 0.20 pour tous les autres. En même temps ce génome est très dissymétrique puisqu’il a un intervalle < 51 aussi élevé que rpm et oan, 13 contre 16 et 19 respectivement, alors que les autres tournent autour de 0.05 jusqu’à 0.10 pour aua.
- - Les intercalaires entre tRNAs notés aussi aas, voir la liste entre aas.
- + Pour ces intercalaires, rpm se comporte comme les autres alpha et gamma (spl eco) avec 2 groupes, ceux supérieurs à 80 et pouvant atteindre des maxima élevés jusqu’à 1172 pour spl et 373 pour rpm, et le 2ème groupe ,le plus nombreux, aux intercalaires inférieurs à 81 avec une moyenne proche de 30 (variance inférieure à 20).
- + Le comportement des gamma et alpha est nettement différent de celui des firmicutes (ban lbu cbc) où le 2ème groupe fait à peine 5% du total (5 pour 113) mais avec des maxima aussi élevés que rpm. Le 2ème groupe des alpha dépasse les 50% ( 24 pour 45) et celui des gamma fait 25% ( 31 pour 129).
- - Les intercalaires élevés: Ils sont peu nombreux et modérés.
- @ Les blocs à rRNAs:
- - Les clusters de rpm tels qu’ils apparaissent dans la séquence des adresses sont présentés au chapitre rpm blocs construits, tableaux A5b1 et A5b2.
- + A5b1 rassemble 9 16s° solitaires suivis de longs clusters où on peut repérer les blocs d’origine altérés caractérisés par les intercalaires 16s-atc-23s, respectivement de 112 pbs et 216 pbs. Ainsi je suppose qu’il y a 5 blocs d’origine de type 16s-atc-23s-5s et un,isolé, de type 16s-gca-23s-5s. Dans ces grands clusters seul subsiste un seul 5s appartenant au bloc complet et intègre que j’ai nommé b0.
- + A5b2 rassemble 9 23s°5s solitaires et 3 blocs complets et un 5s solitaire. Les 23s°5s sont mis en face des 16s° du tableau A5b1. Les blocs complets contiennent un représentant de 16s, un de 23s et un 5s. Dans cette partie du tableau A5b2 j’ai ajouté le bloc b0 séparé de son cluster pour comparaison. Le bloc analogue au b0 est le bloc b1 qui est isolé et où seul le 16s est altéré. Le bloc b3 de cette partie du tableau apparaît comme un racollage d’un 16s° solitaire et d’un 23s°5s solitaire puisque l’intercalaire 16s°-23s° est négatif, c’est-à-dire qu’il y a recouvrement des 2 morceaux, ce qui ne serait pas le cas s’il y avait une délétion entre le 16s et le 23s d’origine.
- - Le parallélisme et l'égalité en nombres entre les 16s° et les 23s°5s solitaires, ainsi que l'analyse des intercalaires petits et négatifs de la remarque @2 m’ont poussé à reconstruire les blocs d’origines en rapprochant des 16s° solitaires à d’autres 16s° solitaires ou non tous 2 avec leurs cds, selon l’hypothèse que les 2 cds internes résultant font partie de l’altération ou de la délétion du 16s original et du coup ces cds seraient des candidats à la création de gènes nouveaux. Le même procédé et la même hypothèse sont appliqués pour un 23° et un 23s°5s.
- - Cette reconstruction se trouve dans les tableaux A5b3 et A5b4. Ainsi en optimisant les tailles des 16s et 23s reconstruits pour se rapprocher le plus aux tailles de ces rRNAs du bloc intègre b0, j’ai pu construire 11 blocs. J’ai séparé le 16s° du 23s°5s du bloc b3 du tableau A5b2. Il reste cependant un 16s°, un 23s° et un 5s-atgf que je n’ai pas pu réunir car leurs cds sont tous bien caractérisés et ne répondent aux critères des candidats à la création. L’hypothèse de 11 blocs ou 12 blocs à l’origine est tout à fait probable en comparaison des 9 blocs de abq.
- - Je n'ai pas pu faire une reconstruction analogue avec abs malgré la proximité phylogénique de abq car la complémentarité 16s° et 23s°5s n’existe pas comme si l’altération faisait disparaître une partie du rRNA, ceux qui restent indiquant la position des originaux. Cela indiquerait que ce sont 2 processus d’altération différents certainement reliés à la présence des tRNAs intra bloc, atc pour rpm et atc-gca pour abs.
- - Le génome analogue avec que des atc Tistrella mobilis KA081020-065, voir proteobacteria et Tistrella mobilis KA081020-065 [[15]]
- - Les clusters de rpm tels qu’ils apparaissent dans la séquence des adresses sont présentés au chapitre rpm blocs construits, tableaux A5b1 et A5b2.
- @ CRISPR, en relation avec la création des gènes et la conversion?
- Adresse 752603
- /rpt_family="CRISPR"
- /rpt_type=direct
- /rpt_unit_range=752664..752692
- /rpt_unit_seq="gggttcatccctgcgcatgcaggggatac"
- @ Les tRNAs rares : liens aux indices de l'ensemble des alpha, de l'ensemble des bacilli et de l'ensemble des gamma
- - Les 11 tRNAs se terminant par g, à part ttg agg tgg atg et tag, sont souvent les premiers absents chez certains génomes bactériens. A ceux-là il faut ajouter ccc et cga: ccc s’expliquerait par complémentarité avec ggg; cga est du au fait que chez les bactéries il y a bascule cgt/cgc et cgg/cga (cgc devenant rare comme pour tous les autres doublets xyt et de même cga par rapport à cgg). Chez les bacilli par exemple ces 13 tRNAs sont très rares alors que chez les alphaproteobacteria sont aussi abondants que les xyc et xya, à part cga est absent dans les 9 génomes étudiés ici.
- - Indices pour 100 génomes des aas les plus faibles, < 80: cgg et ttg soupçonnés ne présentent aucune faiblesse. Par contre je découvre 4 tRNAs présentant une seule faiblesse sur les 4 clades et seul le clade bacilli présente cette faiblesse, ce sont ctc gtc gcc ctg. Est-ce que ce foisonnement de doubles est en relation avec l'étendue des altérations des blocs à rRNAs?
génomes 354 1161 672 4032 clade alpha gamma bacilli bacteria cga 8.5 13.4 5.4 22 ccc 78 87 5.7 68 gtc 101 176 47 110 gcc 94 170 26 103 ctc 110 104 67 95 gtg 55 8.4 0.7 33 gcg 55 7.1 7.9 30 gag 50 7.8 15 34 ggg 66 74 17 56 ctg 87 256 57 129 ccg 68 63 17 54 cag 62 104 16 59 cgg 101 102 99 83 acg 86 73 43 68 aag 74 24 67 60 agg 71 112 66 86 ttg 84 105 112 99 tcg 76 85 46 65
- séquences des doubles: C'est le génome des 9 alpha étudiés qui présente le plus de doubles avec 15 contre 1 ou 2 cluster pour les autres présentant des doubles. En plus, même les tRNAs les plus faibles présentent des doublets, ccg aag cag gtg, et même un triplet gcg.
n aas effectif total doubles 1 30 30 2 7 14 ccg aag gac cag gtg atgi gaa 3 4 12 gcgx3 cgtx3 accx3 tgc.aacx2 4 4 16 ttcx4 gccx4 ggcx4 simplesx4 5 1 5 ctgx5 total 46 77
rpm listes[modifier | modifier le wikicode]
rpm intercalaires entre aas[modifier | modifier le wikicode]
- Tableau des intercalaires entre aas dans les blocs sans rRNAs
2863300 373 atgi-gca 3710967 214 gaa-gaa 2268549 165 ccg-ccg 2863748 157 gca-aca 3833710 153 ctg-ctg 2863106 117 cca-atgi
- Comparaison avec les gamma et les firmicutes
clade génome < 80 > 80 moyenne ecartype maximum alpha rpm 26 6 39 16 373 rru 1 3 - 202 abq 11 6 - 220 abs 11 6 - 219 oan 1 2 - 245 agr 2 2 - 793 aua 4 9 - 404 rtb 2 2 - 1051 rpl 2 2 - 830 alpha total-rpm 34 32 - - alpha sans double 21 24 - - bacilli ban 35 2 14 14 87 bacilli lbu 46 2 14 12 258 clostridia cbc 27 1 15 14 306 gama spl 70 23 39 14 1172 gama eco 28 8 28 18 209
rpm intercalaires avec les cds[modifier | modifier le wikicode]
cds > 400 adresse intercalaire RNA 435655 512 16s° 46322 553 16s° 840219 568 16s° 22949 586 16s° 1214670 600 16s° 2095539 614 16s° 2091644 705 16s° comp 3729914 828 16s° comp 1814819 894 16s° comp 2393295 1003 16s° comp 55304 438 23s° 751747 597 23s° comp 2147496 645 atgf comp 934570 449 cgt comp 660266 648 gtc comp 2597728 989 tca
- Tableau des intercalaires négatifs ou petits avec les cds
cds < 50 adresse intercalaire RNA ou cds 1814819 -7 16s° comp 46322 0 16s° 2397013 2 16s° 840219 4 16s° 2091644 7 16s° 27892 18 16s° comp 1351013 23 16s° 5276 38 16s° comp 2095539 48 16s° 2769507 -12 23s° 13628 -7 23s° 44132 -5 23s° comp 3409304 1 23s° comp 691778 4 23s° comp 4225 30 23s° 2894456 25 5s 52988 -37 cds 2632925 -41 cds 1814819 -30 agc comp 3035343 8 aaa 3462054 29 agg 2633504 30 aca comp 417656 38 atgj comp 1206595 50 gta
- Spectre des intercalaires avec les cds
- Liens aux cumuls
- - spl cumuls, gamma
- - lbu cumuls, bacilli
- - fiche alpha
- - ban cumuls, bacilli
- - cbc cumuls, clostridia
- - eco cumuls, gamma
- Tableau des intercalaires élevés avec les cds
intercalaires rru rpm oan abs abq agr rtb rpl aua < 2 0 0.06 0.05 0 0 0 0 0 0.01 < 51 0.07 0.16 0.19 0.04 0.06 0.03 0.13 0.14 0.10 51-200 0.53 0.52 0.36 0.55 0.54 0.53 0.29 0.27 0.40 201-400 0.25 0.20 0.28 0.26 0.24 0.34 0.15 0.19 0.30 > 400 0.15 0.11 0.17 0.14 0.17 0.10 0.44 0.40 0.20 total 88 147 107 125 121 97 62 63 80 Aas > 400 7 3 13 6 9 8 24 22 16 max aas 1389 989 1650 746 688 660 2465 2381 3102
alpha codes[modifier | modifier le wikicode]
- Lien tableur: alpha codes
- Légende: prélèvement de la base gtRNAdb le 19/1/20 Paris
- - totaux en en-tête, exemple pour A5c, 25 98 95, 12 somme des tRNAs faibles ccc cga les jaunes et les 3 oranges de la colonne 6; 98 total de gtRNAdb contenant des pseudo et inconnus; 95 total du tableau.
- - ata très rare est remplacé par atgi (Ile2)
- - Met comprend atgf (Metf) et atgj (Met) sous la forme atgf/atgj, sauf pour A1c dont il faut les différencier.
- - Voir la légende des tris et couleurs, g1 t1.
|
|
|
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|
|
|
gamma codes[modifier | modifier le wikicode]
- Lien tableur: gamma codes
- Légende: prélèvement de la base gtRNAdb le 19/1/20 Paris
- - totaux en en-tête, exemple pour G1c, 88642 86720, 88642 total de la requête pour tout gamma dans gtRNAdb, 86720 total du tableau.
- - Voir la légende des tris et couleurs, g1 t1.
- Liens aux indices de l'ensemble des alpha et de l'ensemble des bacilli
|
|
rpm distribution[modifier | modifier le wikicode]
- Lien tableur: rpm distribution
- Notes:
aac2 aag2 acc3 atgj2 cag2 ccg2 cgt3 ctg5 gaa2 gac2 gcc4 gcg3 ggc4 gtg2 ttc4 gca >1 16s
g1 | t1 | ||||||
---|---|---|---|---|---|---|---|
atgi | 2 | tct | tat | atgf | 5 | ||
att | act | aat | agt | ||||
ctt | cct | cat | cgc | ||||
gtt | gct | gat | ggt | ||||
ttc | 4 | tcc | 1 | tac | 1 | tgc | 1 |
atc | 7 | acc | 3 | aac | 2 | agc | 1 |
ctc | 1 | ccc | 2 | cac | 2 | cgt | 3 |
gtc | 2 | gcc | 4 | gac | 2 | ggc | 4 |
tta | 1 | tca | 1 | taa | tga | ||
ata | aca | 2 | aaa | 3 | aga | 1 | |
cta | 1 | cca | 2 | caa | 1 | cga | |
gta | 1 | gca | 2 | gaa | 2 | gga | 1 |
ttg | 1 | tcg | 1 | tag | tgg | 1 | |
atgj | 2 | acg | 1 | aag | 2 | agg | 1 |
ctg | 5 | ccg | 2 | cag | 2 | cgg | 1 |
gtg | 2 | gcg | 3 | gag | 2 | ggg | 1 |
alpha | >1aa | =1aa | -5s | +5s | -16s | +16s | total |
rpm | 49 | 30 | 5 | 8 | 92 |
rpm. Intergen51[modifier | modifier le wikicode]
Intergen51. rpm. Le génome[modifier | modifier le wikicode]
- rpm Le prélèvement: Aalpha
- Le nom et le lien NCBI: rpm, Pararhodospirillum photometricum DSM 122 chromosome DSM 122, NCBI [16], date 12.3.21.
- rpm La longueur totale des intercalaires, longueur du génome et taux intercalaires/génome:
Nom intercals génome taux en % rpm 461,433 3,876,289 11.9
rpm données intercalaires[modifier | modifier le wikicode]
- Lien tableur: rpm données intercalaires
- Lien sauvegarde NCBI: Aalpha
rpm données intercalaires 200[modifier | modifier le wikicode]
- Lien tableur: données intercalaires 200.
rpm autres intercalaires aas[modifier | modifier le wikicode]
- Lien tableur: rpm autres intercalaires aas
- Lien sauvegarde NCBI: Aalpha
Intergen51. rpm. Les différents types d'intercalaires[modifier | modifier le wikicode]
- Lien au tableur: Intergen51. rpm les différents types d'intercalaires.
- Légende:
- - S pour intercalaire CDS-CDS et R pour tRNA-CDS,
- - c pour intercalaire continu (les 2 gènes sont sur le même brin) et x pour discontinu (les 2 gènes sont sur 2 brins différents, le brin et son complément)
- - %reste = 100*reste/total, le reste étant ce qui reste du total après la fin du diagramme, gamme.
- - %t30 = 100*t30/total, t30 étant le total des fréquences 10 20 30
- - %t5 = 100*t/total, t5 étant le total des fréquences de -1 à -5 dans le diagramme des S-.
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
Intergen51. rpm. Les diagrammes CDS-CDS positifs[modifier | modifier le wikicode]
- Lien tableur: Les diagrammes
- Diagrammes des gamma: rpm présente 2 diagrammes
- - fc40, CDS-CDS continu, fréquence unitaire en abscisses et effectif en ordonnées
- - fx%, CDS-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et pourcentage en ‰ par rapport au total, en ordonnées.
- Équations des courbes de tendance en pour 1000: colonnes %fx %fc
Courbes de tendances pour les diagrammes en pour 1000 Calculs des f.41 rpm R2 x3 x2 x c Inflexion poly3 x c 0.287 2.67E-06 -1.61E-03 1.76E-01 30.3 fx1 abscisse 256.4 195.3 0.846 -4.09E-06 3.19E-03 -8.62E-01 92.7 fc1 ordonnée 16.6 20.4 0.792 -9.05E-06 6.96E-03 -1.71E+00 150.0 fx41 0.945 1.86E-06 -1.09E-03 5.46E-02 37.5 fc41
Intergen51. rpm. Les CDS-CDS négatifs[modifier | modifier le wikicode]
Sous-totaux rpm totale fréquence x- c- x- c- - 1 0 65 4 4140 - 2 3 1 85 11 - 3 0 0 3 12 - 4 7 338 717 10938 - 5 0 0 5 19 sp6 36 199 1642 8424 total 46 603 2,456 23,544 reste 16 32 264 420 s6 5 0 361 41 s7 4 43 321 1438 s8 11 124 696 6525 rappot s1-5 4/2/1 2.3 5.2 8.4 2.6 % / sp6 s6/sp6 13.9 0.0 22.0 0.5 s7/sp6 11.1 21.6 19.5 17.1 s8/sp6 30.6 62.3 42.4 77.5 reste/sp6 44.4 16.1 16.1 5.0 total s1-5 10 404 814 15120 % / total %s1-5 21.7 67.0 33.1 64.2 %sp6 78.3 33.0 66.9 35.8
Intergen51. rpm. Les intercalaires des blocs[modifier | modifier le wikicode]
- Le détail
RNA-RNA c x CDS-RNA c x 23s 5s 1 CDS 16s 1 16s 23s 5s CDS 4 4 16s tRNA 1 16 CDS 1 tRNA 23s 2 CDS 5s 5s tRNA 5 23s CDS tRNA in CDS 23s tRNA contig 5s 16s tRNA hors 32 16s16s tRNA 16s 23s tRNA tRNA 5s 16s 5s 5s 23s 5s 5s total 41 0 total 5 5
- Les rares voir gamma pour la longueur des intercalaires
- Les tRNA-CDS compris, comparaison dans le clade et dans l'étude.
Intergen51. rpm. Les intercalaires tRNA-tRNA extra bloc[modifier | modifier le wikicode]
- Lien tableur: Intergen51. rpm. Les intercalaires tRNA-tRNA extra bloc
- Pas de tRNA-tRNA extra bloc pour oan2
abq | abs | absp | aua | agrc | pub | rpl | rpm1 | rpm2 | rpm3 | |||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
inter | aa | inter | aa | inter | aa | inter | aa | inter | aa | inter | aa | inter | aa | inter | aa | inter | aa | inter | aa | |||||||||
206 | ccg | 109 | cac | 30 | ctg | x404 | ggc | 41 | gac | 66 | atgi | x830 | gcc | 24 | atgj | 37 | gac | 29 | ttc | |||||||||
** | ccg | ** | cac | ** | gcc | 44 | atgf | ** | gac | ** | gtc | ** | gac | ** | atgj | ** | gac | 34 | ttc | |||||||||
60 | tac | 163 | gta | 1 | acc | ** | atgf | 452 | gaa | 13 | gta | x49 | caa | 25 | gtg | 34 | gga | 33 | ttc | |||||||||
** | gga | ** | gac | 99 | gcg | 51 | cgt | ** | gaa | ** | gac | ** | cgg | ** | gtg | ** | tac | ** | ttc | |||||||||
76 | aag | 219 | aac | 35 | gac | ** | cgt | 26 | gga | 52 | aac | 15 | atc | 35 | cgt | 24 | aag | 27 | tgc | |||||||||
** | aag | ** | tgc | 1 | gtc | x161 | ttc | ** | tac | ** | tgc | ** | aaa | 44 | cgt | ** | aag | 31 | aac | |||||||||
38 | gag | 132 | gtg | ** | cag | ** | acc | agrl | 46 | gga | 105 | tac | ** | cgt | 165 | ccg | ** | aac | ||||||||||
** | gag | ** | gtg | 4 | aac | 128 | gtc | x793 | ggc | ** | tac | ** | gga | 23 | ggc | ** | ccg | 70 | gcg | |||||||||
132 | gtg | 30 | gcc | ** | gac | 186 | gtc | ** | atgj | rru | rtb | 45 | ggc | 70 | gcc | 33 | gcg | |||||||||||
** | gtg | ** | ctg | abqp | ** | gtc | oan1 | 202 | gcc | 15 | aaa | 29 | ggc | 69 | gcc | ** | gcg | |||||||||||
220 | aac | 38 | gag | 29 | ctg | 140 | gaa | 146 | gaa | ** | gcc | ** | atc | ** | ggc | 57 | gcc | 214 | gaa | |||||||||
** | tgc | ** | gag | ** | gcc | ** | gaa | ** | gaa | 81 | tgc | x60 | cgg | 54 | cag | ** | gcc | ** | gaa | |||||||||
164 | gac | 74 | aag | 4 | aac | 58 | gac | 24 | tac | ** | aac | ** | caa | ** | cag | 117 | cca | 47 | ctg | |||||||||
** | gta | ** | aag | ** | gac | x270 | gac | ** | gga | 27 | gga | x1051 | gac | 16 | acc | 373 | atgi | 153 | ctg | |||||||||
109 | cac | 60 | gga | 1 | acc | ** | gta | 245 | gac | ** | tac | ** | gcc | 18 | acc | 157 | gca | 48 | ctg | |||||||||
** | cac | ** | tac | 99 | gcg | x173 | ccg | ** | gac | 165 | acc | 95 | gga | ** | acc | ** | aca | 47 | ctg | |||||||||
205 | ccg | 44 | gac | ** | caa | ** | acc | ** | tac | ** | ctg | |||||||||||||||||
** | ccg | 1 | gtc | 132 | ctc | |||||||||||||||||||||||
** | cag | ** | ctc | |||||||||||||||||||||||||
24 | gga | |||||||||||||||||||||||||||
** | tac | |||||||||||||||||||||||||||
208 | ggc | |||||||||||||||||||||||||||
** | ggg |
Rhodospirillum rubrum ATCC 11170[modifier | modifier le wikicode]
rru opérons[modifier | modifier le wikicode]
- Lien tableur: rru opérons
- Liens: gtRNAdb [17], NCBI [18], génome [orgn]
- Phylogénie: Bacteria; Proteobacteria; Alphaproteobacteria; Rhodospirillales; Rhodospirillaceae; Rhodospirillum.
- Légende: cdsa: cds aas, cdsd: cds dirigé
64.97%GC | 26.12.19 Paris | 55 | doubles | intercal | cds | aa | avec aa | cdsa | cdsd | protéines |
---|---|---|---|---|---|---|---|---|---|---|
chromosome | ||||||||||
comp | 16232..16852 | cds | 163 | 163 | 207 | 3'-5' exonuclease | ||||
comp | 17016..17102 | ctg | 253 | 253 | ||||||
17356..18378 | cds | 341 | 3-beta-hydroxy-delta(5)-steroid dehydrogenase | |||||||
117072..117287 | cds | 37 | 37 | 72 | slyX | |||||
comp | 117325..117401 | agg | 341 | 341 | ||||||
117743..123022 | cds | 1760 | alpha-2-macroglobulin-like protein | |||||||
comp | 149921..151015 | cds | 225 | 225 | 365 | hp | ||||
151241..151317 | cgg | 136 | 136 | |||||||
comp | 151454..152929 | cds | 492 | chemotaxis sensory transducer protein | ||||||
189941..191668 | cds | 859 | 859 | 576 | sulfate transporter/antisigma-factor antagonist | |||||
192528..194004 | 16s | 184 | 1477 | |||||||
194189..194265 | atc | 66 | 66 | |||||||
194332..194407 | gca | 362 | ||||||||
194770..197527 | 23s | 119 | 2758 | |||||||
197647..197761 | 5s | 96 | 115 | |||||||
197858..197934 | atgf | 287 | 287 | |||||||
comp | 198222..198455 | cds | 78 | hp | ||||||
comp | 305449..306648 | cds | 257 | 257 | 400 | Ppx/GppA phosphatase | ||||
306906..306979 | cag | 319 | 319 | |||||||
comp | 307299..308303 | cds | 335 | LacI family transcriptional regulator | ||||||
comp | 322896..323807 | cds | 292 | 292 | 304 | hp | ||||
comp | 324100..324174 | caa | 98 | 98 | ||||||
comp | 324273..325601 | cds | 443 | chemotaxis sensory transducer protein | ||||||
362552..362881 | cds | 224 | 224 | 110 | hp | |||||
363106..363181 | gcc | + | 202 | 202 | ||||||
363384..363459 | gcc | 2 gcc | 43 | 43 | ||||||
comp | 363503..364531 | cds | 343 | esterase | ||||||
407067..407606 | cds | 92 | 92 | 180 | YbaK/prolyl-tRNA synthetase associated domain-containing protein | |||||
407699..407790 | agc | 141 | 141 | |||||||
407932..408774 | cds | 281 | hp | |||||||
466945..467925 | cds | 115 | 115 | 327 | hp | |||||
comp | 468041..468126 | tta | 83 | 83 | ||||||
comp | 468210..468458 | cds | 83 | hp | ||||||
comp | 559038..559610 | cds | 86 | 86 | 191 | OsmC-like protein | ||||
559697..559772 | aag | 140 | 140 | |||||||
559913..560608 | cds | 232 | hp | |||||||
comp | 794877..795188 | cds | -81 | -81 | 104 | hp | ||||
comp | 795108..795188 | Sig-pep | 217 | 217 | 27 | hp | ||||
795406..795496 | tcc | 44 | 44 | |||||||
795541..795846 | cds | 102 | hp | |||||||
comp | 908584..910185 | cds | -102 | -102 | 534 | peptidase M23B | ||||
comp | 910084..910185 | Sig-pep | @1 | 1212 | 1212 | 34 | hp | |||
911398..912874 | 16s | 182 | 1477 | |||||||
913057..913133 | atc | 66 | 66 | |||||||
913200..913275 | gca | 361 | ||||||||
913637..916394 | 23s | 118 | 2758 | |||||||
916513..916627 | 5s | 95 | 115 | |||||||
916723..916799 | atgf | 573 | 573 | |||||||
917373..921860 | cds | 1496 | hp | |||||||
1159249..1160091 | cds | 71 | 71 | 281 | Linocin_M18 bacteriocin protein | |||||
1160163..1160238 | gag | 117 | 117 | |||||||
1160356..1160613 | cds | 86 | prevent-host-death protein | |||||||
comp | 1464820..1465122 | cds | 283 | 283 | 101 | 50S ribosomal protein L21 | ||||
1465406..1465495 | tcg | 139 | 139 | |||||||
comp | 1465635..1466303 | cds | 223 | cytochrome B561 | ||||||
1791953..1792159 | cds | 116 | 116 | 69 | hp | |||||
comp | 1792276..1792351 | gaa | 131 | 131 | ||||||
comp | 1792483..1792689 | cds | 69 | cold-shock DNA-binding protein family protein | ||||||
1824302..1825738 | cds | 98 | 98 | 479 | malonyl-CoA decarboxylase | |||||
1825837..1825921 | cta | 102 | 102 | |||||||
1826024..1827415 | cds | 464 | trigger factor | |||||||
1833133..1833408 | cds | 284 | 284 | 92 | histone-like DNA-binding protein | |||||
1833693..1833768 | gta | 70 | 70 | |||||||
comp | 1833839..1835326 | cds | 496 | methyl-accepting chemotaxis sensory transducer | ||||||
1933506..1934138 | cds | -633 | -633 | 211 | hp | |||||
1933506..1933652 | Sig-pep | 571 | 571 | 49 | hp | |||||
1934224..1934300 | cca | 63 | 63 | |||||||
1934364..1934663 | cds | 12 | 12 | 100 | ETC complex I subunit region | |||||
1934676..1934752 | aga | 396 | 396 | |||||||
1935149..1939624 | cds | 1492 | hp | |||||||
1959133..1959858 | cds | 175 | 175 | 242 | MerR family transcriptional regulator | |||||
1960034..1960110 | ccc | @2 | 1062 | 1062 | ||||||
1961173..1961367 | cds | 65 | hp | |||||||
comp | 1996760..1998124 | cds | -120 | -120 | 455 | lytic murein transglycosylase | ||||
comp | 1998005..1998124 | Sig-pep | 119 | 119 | 40 | hp | ||||
1998244..1998333 | tca | 927 | 927 | |||||||
comp | 1999261..1999929 | cds | 223 | hp | ||||||
2032027..2032863 | cds | 123 | 123 | 279 | phage integrase | |||||
comp | 2032987..2033062 | aaa | 186 | 186 | ||||||
comp | 2033249..2033755 | cds | 169 | peptidyl-prolyl isomerase | ||||||
comp | 2093327..2093977 | cds | 295 | 295 | 217 | protein-L-isoaspartate(D-aspartate) O-methyltransferase | ||||
2094273..2094346 | tgc | 81 | 81 | |||||||
2094428..2094502 | aac | 150 | 150 | |||||||
2094653..2094916 | cds | 88 | prevent-host-death protein | |||||||
comp | 2304404..2305834 | cds | 89 | 89 | 477 | divalent cation transporter | ||||
comp | 2305924..2306010 | ctc | 178 | 178 | ||||||
2306189..2306839 | cds | 217 | lipoate-protein ligase B | |||||||
2331183..2331521 | cds | 73 | 73 | 113 | hp | |||||
2331595..2331671 | atgj | 126 | 126 | |||||||
comp | 2331798..2332040 | cds | 81 | hp | ||||||
comp | 2411337..2411804 | cds | -72 | -72 | 156 | CreA | ||||
comp | 2411733..2411804 | Sig-pep | 202 | 202 | 24 | hp | ||||
comp | 2412007..2412083 | cac | 75 | 75 | ||||||
comp | 2412159..2413343 | cds | 395 | hp | ||||||
2729598..2731271 | cds | 449 | 449 | 558 | macrocin-O-methyltransferase | |||||
comp | 2731721..2731797 | atgf | 95 | |||||||
comp | 2731893..2732007 | 5s | 119 | 115 | ||||||
comp | 2732127..2734884 | 23s | 362 | 2758 | ||||||
comp | 2735247..2735322 | gca | 66 | 66 | ||||||
comp | 2735389..2735465 | atc | 184 | |||||||
comp | 2735650..2737126 | 16s | 606 | 606 | 1477 | |||||
comp | 2737733..2738110 | cds | 126 | hp | ||||||
comp | 2959802..2961874 | cds | 354 | 354 | 691 | chemotaxis sensory transducer protein | ||||
comp | 2962229..2962303 | gtc | 123 | 123 | ||||||
2962427..2963359 | cds | 311 | N-formylglutamate amidohydrolase | |||||||
comp | 3124836..3125033 | cds | 151 | 151 | 66 | preprotein translocase subunit SecE | ||||
comp | 3125185..3125260 | tgg | 343 | 343 | ||||||
comp | 3125604..3126794 | cds | 93 | 93 | 397 | elongation factor Tu | ||||
comp | 3126888..3126961 | gga | 27 | 27 | ||||||
comp | 3126989..3127074 | tac | 37 | 37 | ||||||
3127112..3128158 | cds | 57 | 57 | 349 | 23s rRNA (guanosine(2251)-2'-O)-methyltransferase RlmB | |||||
3128216..3128291 | aca | 127 | 127 | |||||||
3128419..3128652 | cds | 78 | hp | |||||||
comp | 3193350..3194507 | cds | 430 | 430 | 386 | acyltransferase | ||||
comp | 3194938..3195013 | ttc | 103 | 103 | ||||||
comp | 3195117..3195635 | cds | 173 | hp | ||||||
3320745..3322115 | cds | -1371 | -1371 | 457 | virulence protein | |||||
3320745..3320816 | Sig-pep | 1389 | 1389 | 24 | hp | |||||
comp | 3322206..3322281 | atgi | 60 | 60 | ||||||
comp | 3322342..3324432 | cds | 697 | RNA polymerase sigma factor RpoD | ||||||
comp | 3377932..3378114 | cds | 140 | 140 | 61 | hp | ||||
3378255..3378329 | acc | + | 165 | 165 | ||||||
3378495..3378569 | acc | 2 acc | 237 | 237 | ||||||
3378807..3379370 | cds | 234 | 234 | 188 | hp | |||||
3379605..3379681 | gac | 77 | 77 | |||||||
comp | 3379759..3380517 | cds | 253 | diguanylate phosphodiesterase | ||||||
comp | 3399207..3399494 | cds | 262 | 262 | 96 | hp | ||||
comp | 3399757..3399833 | ccg | 56 | 56 | ||||||
comp | 3399890..3400972 | cds | 361 | farnesyltranstransferase | ||||||
3490378..3491148 | cds | 84 | 84 | 257 | 2-phosphoglycolate phosphatase | |||||
3491233..3491307 | gtg | 407 | 407 | |||||||
3491715..3492080 | cds | 122 | hp | |||||||
comp | 3719367..3719753 | cds | 163 | 163 | 129 | hp | ||||
comp | 3719917..3719990 | ggg | 95 | 95 | ||||||
comp | 3720086..3720859 | cds | 258 | enoyl-ACP reductase | ||||||
3805869..3806813 | cds | 130 | 130 | 315 | inner-membrane translocator | |||||
comp | 3806944..3807058 | 5s | 116 | 115 | ||||||
comp | 3807175..3809932 | 23s | 362 | 2758 | ||||||
comp | 3810295..3810370 | gca | 66 | 66 | ||||||
comp | 3810437..3810513 | atc | 184 | |||||||
comp | 3810698..3812174 | 16s | 1227 | 1227 | 1477 | |||||
3813402..3814118 | cds | 239 | transposase | |||||||
comp | 3824154..3825854 | cds | 76 | 76 | 567 | phage integrase | ||||
comp | 3825931..3826007 | cgt | 387 | 387 | ||||||
3826395..3827531 | cds | 379 | hp | |||||||
4021982..4023163 | cds | 27 | 27 | 394 | diguanylate phosphodiesterase | |||||
comp | 4023191..4023277 | ttg | 224 | 224 | ||||||
4023502..4023855 | cds | 118 | hp | |||||||
comp | 4058818..4059117 | cds | 187 | 187 | 100 | hp | ||||
4059305..4059380 | gcg | 179 | 179 | |||||||
comp | 4059560..4060126 | cds | 189 | hp | ||||||
comp | 4105626..4107317 | cds | -114 | -114 | 564 | chemotaxis sensory transducer | ||||
comp | 4107204..4107317 | Sig-pep | 721 | 721 | 38 | hp | ||||
comp | 4108039..4108113 | acg | 148 | 148 | ||||||
4108262..4108843 | cds | 194 | D-alpha,beta-D-heptose 1,7-bisphosphate phosphatase | |||||||
comp | 4261100..4262038 | cds | 269 | 269 | 313 | thioredoxin-like protein | ||||
4262308..4262382 | ggc | 118 | 118 | |||||||
4262501..4263136 | cds | 212 | lysine exporter protein LysE/YggA |
rru cumuls[modifier | modifier le wikicode]
- Lien tableur: rru cumuls
opérons | Fréquences intercalaires tRNAs | Fréquences intercalaires cds | Fréquences aas cds chromosome | ||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
effectif | gammes | sans rRNAs | avec rRNAs | gammes | cds | gammes | cdsd | gammes | cdsa | gammes | cdsa 300 | ||
avec rRNA | opérons | 4 | 1 | 1 | 7 | 1 | 100 | 23 | 1 | 0 | |||
16atcgca235 | 1 | 20 | 50 | 6 | 40 | 200 | 17 | 30 | 3 | ||||
Id-atgf | 3 | 40 | 1 | 100 | 19 | 80 | 300 | 16 | 60 | 4 | |||
- | 60 | 150 | 20 | 120 | 400 | 17 | 90 | 12 | |||||
max a | 3 | 80 | 4 | 200 | 8 | 160 | 500 | 8 | 120 | 10 | |||
a doubles | 0 | 100 | 1 | 250 | 7 | 200 | 600 | 5 | 150 | 3 | |||
spéciaux | 0 | 120 | 300 | 9 | 240 | 700 | 2 | 180 | 4 | ||||
total aas | 11 | 140 | 350 | 3 | 280 | 800 | 0 | 210 | 5 | ||||
sans | opérons | 40 | 160 | 400 | 3 | 320 | 900 | 0 | 240 | 8 | |||
1 aa | 36 | 180 | 1 | 450 | 3 | 360 | 1000 | 0 | 270 | 4 | |||
max a | 2 | 200 | 500 | 0 | 400 | 1100 | 0 | 300 | 3 | ||||
a doubles | 2 | 1 | 10 | 3 | 35 | ||||||||
total aas | 44 | 4 | 4 | 95 | 0 | 91 | 91 | ||||||
total aas | 55 | ||||||||||||
remarques | |||||||||||||
avec jaune | moyenne | 119 | 66 | 208 | 292 | ||||||||
variance | 79 | 0 | 333 | 187 | |||||||||
sans jaune | moyenne | 148 | 237 | 140 | |||||||||
variance | 83 | 132 | 69 |
rru blocs[modifier | modifier le wikicode]
- Lien tableur: rru blocs
- Légende:
- sulfate sulfate transporter/antisigma-factor antagonist
- inner inner-membrane translocator
- macrocin macrocin-O-methyltransferase
- peptidase peptidase M23B
- hp Hypothetical protein
cds | 859 | 576 | sulfate | cds | 606 | 126 | hp |
16s | 184 | 1477 | 16s | 184 | 1477 | ||
atc | 66 | atc | 66 | ||||
gca | 362 | gca | 362 | ||||
23s | 119 | 2758 | 23s | 119 | 2758 | ||
5s | 96 | 115 | 5s | 95 | 115 | ||
atgf | 287 | atgf | 449 | ||||
cds | 78 | hp | cds | 558 | macrocin | ||
cds | -102 | 534 | peptidase | ||||
Sig-pep | 1212 | 34 | hp | cds | 1227 | 239 | transposase |
16s | 182 | 1477 | 16s | 184 | 1477 | ||
atc | 66 | atc | 66 | ||||
gca | 361 | gca | 362 | ||||
23s | 118 | 2758 | 23s | 116 | 2758 | ||
5s | 95 | 115 | 5s | 130 | 115 | ||
atgf | 573 | cds | 315 | inner | |||
cds | 1496 | hp |
rru remarques[modifier | modifier le wikicode]
- Remarques: Par rapport aux rickettsia rtb et rpl, les intercalaires élevés sont rares.
- @ Les intercalaires élevés
- - il n’y a pas d’aas isolés et les mineurs des blocs à rRNAs sont normaux pour ces blocs, inférieurs à 573.
- - Pour les aas il n’y a que 5 intercalaires élevés entre 571-1389, et 2 dépassant à peine 400 pbs.
- - Pour les blocs à rRNAs il n’y a que 3 intercalaires franchement élevés, 1227 1212 859.
- @ Sig-pep, signal peptide.
- - Il y a 580 sig-peptide dans ce génome. Dans le tableau des opérons ce sont de petites séquences peptidiques de moins de 30 aas placsés au début du cds. D’où l’intercalaire négatif.
- - Dans le tableau sur les 7 seg-pep, 4 sont associés à des intercalaires élevés (voir tableau ci-dessous) et 3 à des intercalaires inférieurs à 219 pbs.
- @ Les intercalaires élevés
- Note: Les 4 blocs à rRNAs sont tous complets ayant atcgca en interne dont 3 ont atgf qui suit 5s. Aucun bloc ne contient un cds en interne.
- Séquences des doubles: Sur 40 blocs sans rRNAs seulement 4 ont 2 aas dont 2 ont un doublet, gcc et acc.
- Tableau des intercalaires
16s aas Sig-pep adresse intercalaire adresse intercalaire intercalaire 911398 1212-573 atgi 3322206 1389 1389 2735650 606-449 ccc 1960034 1062 1212 3810698 1227-130 tca 1998244 927 721 192528 859-257 acg 4108039 721 571 cca 1934224 571 3 <219 ttc 3194938 430 gtg 3491233 407
rru distribution[modifier | modifier le wikicode]
- Lien tableur: rru distribution
- Notes: gcc2 acc2
g1 | t1 | ||||||
---|---|---|---|---|---|---|---|
atgi | 1 | tct | tat | atgf | 3 | ||
att | act | aat | agt | ||||
ctt | cct | cat | cgc | ||||
gtt | gct | gat | ggt | ||||
ttc | 1 | tcc | 1 | tac | 1 | tgc | 1 |
atc | 4 | acc | 2 | aac | 1 | agc | 1 |
ctc | 1 | ccc | 1 | cac | 1 | cgt | 1 |
gtc | 1 | gcc | 2 | gac | 1 | ggc | 1 |
tta | 1 | tca | 1 | taa | tga | ||
ata | aca | 1 | aaa | 1 | aga | 1 | |
cta | 1 | cca | 1 | caa | 1 | cga | |
gta | 1 | gca | 4 | gaa | 1 | gga | 1 |
ttg | 1 | tcg | 1 | tag | tgg | 1 | |
atgj | 1 | acg | 1 | aag | 1 | agg | 1 |
ctg | 1 | ccg | 1 | cag | 1 | cgg | 1 |
gtg | 1 | gcg | 1 | gag | 1 | ggg | 1 |
alpha | >1aa | =1aa | -5s | +5s | -16s | +16s | total |
rru | 8 | 36 | 3 | 8 | 55 |
rru. Intergen51[modifier | modifier le wikicode]
Intergen51. rru. Le génome[modifier | modifier le wikicode]
- rru Le prélèvement: Acbn
- Le nom et le lien NCBI: rru, Rhodospirillum rubrum ATCC 11170, NCBI [19], date 10.03.20.
- rru La longueur totale des intercalaires, longueur du génome et taux intercalaires/génome:
Nom intercals génome taux en % rru 461,427 4,352,825 10.6
rru données intercalaires[modifier | modifier le wikicode]
- Lien tableur: rru données intercalaires
- Lien sauvegarde NCBI: Acbn
rru données intercalaires 200[modifier | modifier le wikicode]
- Lien tableur: données intercalaires 200.
rru autres intercalaires aas[modifier | modifier le wikicode]
- Lien tableur: rru autres intercalaires aas
- Lien sauvegarde NCBI: Acbn
Intergen51. rru. Les différents types d'intercalaires[modifier | modifier le wikicode]
- Lien au tableur: Intergen51. rru les différents types d'intercalaires.
- Légende:
- - S pour intercalaire CDS-CDS et R pour tRNA-CDS,
- - c pour intercalaire continu (les 2 gènes sont sur le même brin) et x pour discontinu (les 2 gènes sont sur 2 brins différents, le brin et son complément)
- - %reste = 100*reste/total, le reste étant ce qui reste du total après la fin du diagramme, gamme.
- - %t30 = 100*t30/total, t30 étant le total des fréquences 10 20 30
- - %t5 = 100*t/total, t5 étant le total des fréquences de -1 à -5 dans le diagramme des S-.
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
Intergen51. rru. Les diagrammes CDS-CDS positifs[modifier | modifier le wikicode]
- Lien tableur: Les diagrammes
- Diagrammes des gamma: rru présente 2 diagrammes
- - fc40, CDS-CDS continu, fréquence unitaire en abscisses et effectif en ordonnées
- - fx%, CDS-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et pourcentage en ‰ par rapport au total, en ordonnées.
- Équations des courbes de tendance en pour 1000: colonnes %fx %fc
Courbes de tendances pour les diagrammes en pour 1000 Calculs des f.41 rru R2 x3 x2 x c Inflexion poly3 x c 0.814 -1.20E-06 8.00E-04 -2.40E-01 47.80 fx1 abscisse 268.5 52.4 0.876 -3.23E-06 2.65E-03 -7.77E-01 90.9 fc1 ordonnée 17.1 46.8 0.831 9.36E-07 -7.54E-04 9.93E-02 26.7 fx41 0.963 6.49E-07 -1.02E-04 -1.99E-01 57.4 fc41
Intergen51. rru. Les CDS-CDS négatifs[modifier | modifier le wikicode]
Sous-totaux rru totale fréquence x- c- x- c- - 1 0 81 4 4140 - 2 1 0 85 11 - 3 0 0 3 12 - 4 27 394 717 10938 - 5 0 0 5 19 sp6 46 134 1642 8424 total 74 609 2,456 23,544 reste 9 11 264 420 s6 6 0 361 41 s7 10 26 321 1438 s8 21 97 696 6525 rappot s1-5 4/2/1 27 4.9 8.4 2.6 % / sp6 s6/sp6 13.0 0.0 22.0 0.5 s7/sp6 21.7 19.4 19.5 17.1 s8/sp6 45.7 72.4 42.4 77.5 reste/sp6 19.6 8.2 16.1 5.0 total s1-5 28 475 814 15120 % / total %s1-5 37.8 78.0 33.1 64.2 %sp6 62.2 22.0 66.9 35.8
Intergen51. rru. Les intercalaires des blocs[modifier | modifier le wikicode]
- Le détail
RNA-RNA c x CDS-RNA c x 23s 5s 4 CDS 16s 2 2 16s 23s 5s CDS 1 16s tRNA 4 16 CDS tRNA 23s 4 CDS 5s 5s tRNA 3 23s CDS tRNA in 4 CDS 23s tRNA contig 5s 16s tRNA hors 4 16s16s tRNA 16s 23s tRNA tRNA 5s 16s 5s 5s 23s 5s 5s total 23 0 total 2 3
- Les rares voir gamma pour la longueur des intercalaires
- Les tRNA-CDS compris, comparaison dans le clade et dans l'étude.
Intergen51. rru. Les intercalaires tRNA-tRNA extra bloc[modifier | modifier le wikicode]
- Lien tableur: Intergen51. rru. Les intercalaires tRNA-tRNA extra bloc
- voir les répétitions dans rpm
rru intercalaires entre cds[modifier | modifier le wikicode]
- Rhodospirillum rubrum ATCC 11170, 10.3.2020, NCBI [20]
- Note: Pour les génomes des annexes j'ai relevé les intercalaires entre tRNAs et entre ceux-ci et les cds qui leur sont adjacents. L'exemple est celui de rru du clade alpha. L'idée de départ de ces prélèvements est la recherche d'opérons formés de tRNA et de protéine comme dans le cas d'E.coli: l'intercalaire entre le tRNA et la protéine devrait être faible. Voir l'exemple d'eco (remarque @3) avec tac-tac-tpr et aca-tac-gga-acc-tufB.
rru intercalaires positifs S+[modifier | modifier le wikicode]
- Lien tableur: rru intercalaires positifs S+
- Diagrammes 400: rru ade, diagramme 1-40: c+ rru c+ ade x+ rru x+ ade total, texte: ade.
- Légende: voir la légende de cvi.
rru | Sx+ | Sc+ | ||||||||||||
Poly3 | -7 | -5 | -3 | 1 | R2 | flex x+ | comment. | -7 | -5 | -3 | 1 | R2 | flex c+ | comment. |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
1 à 400 | -13 | 90 | -272 | 53 | 818 | 231 | min50 | -34 | 275 | -804 | 94 | 878 | 270 | min40 |
31 à 400 | 12 | -97 | 135 | 28 | 833 | 269 | 2 parties | 13 | -61 | -91 | 52 | 957 | 156 | 2 parties |
droite | -a | cste | - | R2 | note | R2’ | -a | cste | - | R2 | note | R2’ | ||
1 à 400 | 103 | 46 | - | 798 | dte | 20 | Sf | 181 | 62 | - | 739 | poly | 139 | SF |
31 à 400 | 86 | 41 | - | 797 | dte | 36 | tf | 137 | 50 | - | 916 | dte | 41 | tf |
- Légende du tableau corrélations et fréquences faibles
effectifs diagramme | corrélation x+ c+, 41-n | corrélation x+ c+, 1-n | |||||||||
gen | minima | x+ | c+ | total | 400 | 200 | 250 | diff | 200 | 250 | 400 |
---|---|---|---|---|---|---|---|---|---|---|---|
spl | min10 | 1071 | 2215 | 3286 | 884 | 735 | 784 | 49 | -353 | -202 | 172 |
rru | min40 | 874 | 2056 | 2930 | 829 | 193 | 611 | 418 | 722 | 792 | 861 |
mja | min30 | 406 | 1047 | 1453 | 776 | 326 | 571 | 245 | 844 | 857 | 881 |
1-30 ‰ | effectifs | 0 ‰ | <0 ‰ | effectifs 1-40 | corel | ||||||
1-30 x+ | 1-30 c+ | x+/c+ | x | c | x | c | x- | c- | x+ | c+ | x+/c+ |
37 | 270 | 0.14 | 1313 | 2900 | 1 | 6 | 9 | 143 | 69 | 683 | -342 |
169 | 266 | 0.64 | 1037 | 2749 | 1 | 4 | 71 | 222 | 175 | 630 | 17 |
239 | 405 | 0.59 | 495 | 1234 | 20 | 9 | 113 | 132 | 113 | 474 | 502 |
- Diagrammes 400: rru ade, diagramme 1-40: c+ rru c+ ade x+ rru x+ ade total, texte: ade.
- Résumé: Ici je ne compare que les 2 génomes rru et ade en sachant que pmg est semblable à ade. Car rru et ade se ressemblent beaucoup avec des effectif des diagrammes 400 presque égaux, 2930 contre 3471, et un rapport des fréquences faibles c+/x+ aussi presque égaux, 0.64 contre 0.66. Par contre les corrélations à 41-250 sont très différentes, 611 contre 758.
- - La forme des courbes 400: Les 4 courbes de rru sont identiques une à une aux 4 courbes de ade, seules les forces des courbes tildes 31-400 diffèrent, elles sont fortes pour ade, tF, et faibles pour rru, tf.
- Les 2 courbes, c+ 1-400 rru ade, sont SF avec R2’ 139 232.
- Les 2 courbes, x+ 1-400 rru ade, sont Sf avec R2’ 20 39.
- Les 2 courbes rru 31-400 sont tf avec R2’ x+ à 31 et c+ à 41. Les courbes sont presque des droites mais toujours avec des renflements en 1ère partie.
- Les 2 courbes ade 31-400 sont tF avec R2’ x+ à 67 et c+ à 103 avec 2 parties nettes.
- Les points d’inflexion sont compris entre 230 et 271 sauf pour rru c+ 31-400 avec 156 et ade c+ 31-400 avec -507.
- - Les corrélations des courbes 400: C’est la différence la plus importante entre les 2 génômes.
- Chez ade la corrélation 41-250, de 758 chute à 624 pour 41-200 avec une différence de 134. Et rru en parallèle passe de 611 à 193 avec une différence de 418.
- Les 3 corrélations 1-n de ade tournent autour de 900 alors que celles de rru sont plutôt négatives -353 -202 172.
- - Les fréquences faibles 1-30:
- Elles sont du même ordre de grandeur et dans le même rapport x+/c+: 169/266 pour rru et 221/335 pour ade, donnant les rapports respectifs 0.66 0.64.
- Elles sont réparties sur les 3 fréquences 10 20 30 dans les 2 génomes.
- Les minima des fréquences faibles: elles sont bien prononcées mais plus chez ade que chez rru.
- Les fréquences des zéros sont faibles mais plus élevées chez ade avec 14‰ que chez rr avec 5‰.
- Les fréquences négatives sont réparties entre x- et c- de la même façon chez les 2 génômes: 72/234 pour ade et 71/222 pour rru
- - La forme des courbes 1-40:
- La courbe c+1-40: avec un effectif élevé de 876 pour ade contre 630 pour rru, les 2 courbes sont très proches de la courbe du total. Cependant les sommets à 2 et 10 de rru sont déplacés à 4 et 12 chez ade.
- La courbe x+1-40: Les 2 courbes diffèrent du modèle c+ 1-40 et entre elles:
- + La courbe de rru, avec un effectif de 175, n’a pas le maximum à la fréquence 2 du modèle par contre elle a le minimum à 6 et la bosse à 10 comme lui. La bosse du 10 est suivie par un plateau et non par une pente comme le modèle.
- + La courbe de ade, avec un effectif de 304, a le maximum à la fréquence 3 du modèle par contre le minimum à 6 devient une bosse et la bosse du 11 est un creux profond. La bosse du 11 du modèle est remplacée par une forte bosse à 17.
- - Les corrélations des courbes 1-40:
- La corrélation x+/c+ de rru à 17 est quasiment nulle et va de pair avec les coorélations négatives des courbes 400 des 3 plages de fréquences 1-n.
- La corrélation x+/c+ de ade à 459 est moyenne et va de pair avec les coorélations élevées des courbes 400 des 3 plages de fréquences 1-n.
- - La forme des courbes 400: Les 4 courbes de rru sont identiques une à une aux 4 courbes de ade, seules les forces des courbes tildes 31-400 diffèrent, elles sont fortes pour ade, tF, et faibles pour rru, tf.
rru autres intercalaires[modifier | modifier le wikicode]
- Lien tableur: rru autres intercalaires aas
- Légende:
- - comp, le gène est sur le brin complement
- - deb, fin sont respectivement dans le sens des adresses croissantes, le cds avant le 1er tRNA et le cds après le dernier tRNA du bloc.
- Totaux: 11 regulatory 2 ncRNA 1 tmRNA 11 repeat_region
tRNA-cds tRNA-tRNA autres-cds total 160 c+ x+ x- c+ x+ c- c+ x+ c- 50 38 23 28 20 159 1 ac+
- Méthode de calculs des intercalaires autres que les CDS-CDS voir le cas de amed.
Ochrobactrum anthropi ATCC 49188[modifier | modifier le wikicode]
oan opérons[modifier | modifier le wikicode]
- Lien tableur: oan opérons
- Liens: gtRNAdb [21], NCBI [22], génome [orgn]
- Phylogénie: Bacteria; Proteobacteria; Alphaproteobacteria; Rhizobiales; Brucellaceae; Ochrobactrum.
- Légende: cdsa: cds aas, cdsd: cds dirigé
56.1%GC | 27.12.19 Paris | 61 | doubles | intercal | cds | aa | avec aa | cdsa | cdsd | protéines |
---|---|---|---|---|---|---|---|---|---|---|
chromosom1 | ||||||||||
34057..34446 | cds | 224 | 224 | 130 | TIGR02300 family protein | |||||
34671..34746 | gcc | @1 | -40 | -40 | ||||||
34707..35480 | cds | 258 | glutathione S-transferase family protein | |||||||
223549..224394 | cds | 164 | 164 | 282 | 3'(2'),5'-bisphosphate nucleotidase CysQ | |||||
224559..224635 | ccg | 109 | 109 | |||||||
comp | 224745..225806 | cds | 354 | site-specific integrase | ||||||
comp | 337757..338197 | cds | 158 | 158 | 147 | DMT family transporter | ||||
comp | 338356..338431 | ttc | 171 | 171 | ||||||
comp | 338603..338818 | cds | 72 | DNA gyrase inhibitor YacG | ||||||
comp | 344419..344598 | cds | 147 | 147 | 60 | hp | ||||
344746..344820 | acc | 397 | 397 | |||||||
345218..346030 | cds | 271 | DUF2189 domain-containing protein | |||||||
comp | 351922..353328 | cds | 167 | 167 | 469 | deoxyribodipyrimidine photo-lyase | ||||
comp | 353496..353572 | cgt | 159 | 159 | ||||||
comp | 353732..355285 | cds | 518 | HAMP domain-containing histidine kinase | ||||||
comp | 725472..726479 | cds | 219 | 219 | 336 | glycosyltransferase family 4 protein | ||||
726699..726773 | caa | 61 | 61 | |||||||
comp | 726835..727413 | cds | 193 | hp | ||||||
comp | 934613..934987 | cds | 333 | 333 | 125 | transposase | ||||
comp | 935321..935397 | agg | 114 | 114 | ||||||
comp | 935512..936675 | cds | 388 | amidohydrolase | ||||||
1049919..1051202 | cds | 24 | 24 | 428 | cystathionine gamma-synthase family protein | |||||
comp | 1051227..1051311 | ttg | @2 | 593 | 593 | |||||
comp | 1051905..1053539 | cds | 545 | phosphoethanolamine transferase | ||||||
comp | 1081066..1083021 | cds | 998 | 998 | 652 | M23 family metallopeptidase | ||||
1084020..1085508 | 16s | 268 | 1489 | |||||||
1085777..1085853 | atc | 11 | 11 | |||||||
1085865..1085940 | gca | 39 | 39 | |||||||
>comp | 1085980..1086168 | cds | @3 | 38 | 38 | 63 | P-hp | |||
1086207..1089125 | 23s | 186 | 2919 | |||||||
1089312..1089426 | 5s | 54 | 115 | |||||||
1089481..1089557 | atgf | 363 | 363 | |||||||
1089921..1090091 | cds | 57 | LysR family transcriptional regulator | |||||||
1096454..1096912 | cds | 7 | 7 | 153 | hp | |||||
comp | 1096920..1097009 | tcg | 352 | 352 | ||||||
1097362..1097751 | cds | 130 | 50S ribosomal protein L21 | |||||||
1311344..1311823 | cds | 211 | 211 | 160 | hp | |||||
1312035..1312109 | gag | 88 | 88 | |||||||
1312198..1312467 | cds | 90 | hp | |||||||
1344750..1345565 | cds | 677 | 677 | 272 | IclR family transcriptional regulator | |||||
1346243..1347731 | 16s | 268 | 1489 | |||||||
1348000..1348076 | atc | 11 | 11 | |||||||
1348088..1348163 | gca | 39 | 39 | |||||||
>comp | 1348203..1348391 | cds | 38 | 38 | 63 | P-hp | ||||
1348430..1351348 | 23s | 186 | 2919 | |||||||
1351535..1351649 | 5s | 54 | 115 | |||||||
1351704..1351780 | atgf | 360 | 360 | |||||||
1352141..1353082 | cds | 314 | LysR family transcriptional regulator | |||||||
1354558..1355604 | cds | 85 | 85 | 349 | polysaccharide deacetylase family protein | |||||
comp | 1355690..1355764 | ggc | 136 | 136 | ||||||
comp | 1355901..1357280 | cds | 460 | MFS transporter | ||||||
comp | 1386666..1387982 | cds | 819 | 819 | 439 | hp | ||||
comp | 1388802..1388891 | tcc | 374 | 374 | ||||||
1389266..1389589 | cds | 108 | hp | |||||||
comp | 1405236..1405859 | cds | 139 | 139 | 208 | 5,6-dimethylbenzimidazole synthase | ||||
comp | 1405999..1406085 | ctg | 146 | 146 | ||||||
comp | 1406232..1406852 | cds | 207 | 2,3-bisphosphoglycerate-dependent phosphoglycerate mutase | ||||||
comp | 1604615..1604854 | cds | 26 | 26 | 80 | hp | ||||
comp | 1604881..1604958 | atgj | 10 | 10 | ||||||
comp | 1604969..1605214 | cds | 82 | hp | ||||||
1639492..1640289 | cds | -44 | -44 | 266 | hp | |||||
comp | 1640246..1640322 | atgj | 55 | 55 | ||||||
1640378..1640572 | cds | 65 | hp | |||||||
comp | 1778816..1779571 | cds | 385 | 385 | 252 | SIMPL domain-containing protein | ||||
1779957..1780033 | atgi | 265 | 265 | |||||||
1780299..1780844 | cds | 182 | sigma-70 family RNA polymerase sigma factor | |||||||
> | 1945985..1946374 | cds | 721 | 721 | 130 | P-hp | ||||
comp | 1947096..1947171 | aag | -38 | -38 | ||||||
comp | 1947134..1947319 | cds | 62 | hp | ||||||
comp | 2014813..2015097 | cds | 103 | 103 | 95 | DUF2218 domain-containing protein | ||||
comp | 2015201..2015275 | gaa | + | 146 | 146 | |||||
comp | 2015422..2015496 | gaa | 2 gaa | 200 | 200 | |||||
comp | 2015697..2016962 | cds | 422 | DUF882 domain-containing protein | ||||||
comp | 2040234..2040453 | cds | 91 | 91 | 73 | hp | ||||
2040545..2040629 | tac | 24 | 24 | |||||||
2040654..2040727 | gga | 6 | 6 | |||||||
comp | 2040734..2040916 | cds | -50 | -50 | 61 | hp | ||||
2040867..2042042 | cds | 65 | 65 | 392 | elongation factor Tu | |||||
2042108..2042183 | tgg | 420 | 420 | |||||||
2042604..2042804 | cds | 67 | preprotein translocase subunit SecE | |||||||
2168416..2168658 | cds | 28 | 28 | 81 | PepSY domain-containing protein | |||||
comp | 2168687..2168760 | ggg | 289 | 289 | ||||||
2169050..2169946 | cds | 299 | lipid kinase | |||||||
comp | 2244184..2245050 | cds | 112 | 112 | 289 | mechanosensitive ion channel | ||||
comp | 2245163..2245248 | tta | 200 | 200 | ||||||
2245449..2246705 | cds | 419 | threonine ammonia-lyase IlvA | |||||||
2267888..2268835 | cds | 305 | 305 | 316 | patatin family protein | |||||
2269141..2269225 | ctc | 66 | 66 | |||||||
comp | 2269292..2270185 | cds | 298 | tyrosine-type recombinase/integrase | ||||||
2332394..2333530 | cds | 393 | 393 | 379 | glycosyltransferase family 2 protein | |||||
comp | 2333924..2334000 | cgg | 169 | 169 | ||||||
comp | 2334170..2335792 | cds | 541 | ABC-F family ATP-binding cassette domain-containing protein | ||||||
comp | 2339396..2340514 | cds | 1650 | 1650 | 373 | porin | ||||
comp | 2342165..2342239 | gtg | 178 | 178 | ||||||
comp | 2342418..2344424 | cds | 669 | murein L,D-transpeptidase | ||||||
comp | 2369668..2370441 | cds | 152 | 152 | 258 | NAD kinase | ||||
2370594..2370669 | aca | 987 | 987 | |||||||
comp | 2371657..2372076 | cds | 140 | SUF system Fe-S cluster assembly protein | ||||||
comp | 2442729..2443145 | cds | 299 | 299 | 139 | hp | ||||
comp | 2443445..2443519 | atgf | 70 | 70 | ||||||
<comp | 2443590..2443799 | cds | 70 | helix-turn-helix domain-containing protein | ||||||
comp | 2449947..2451311 | cds | 156 | 156 | 455 | tyrosine-type recombinase/integrase | ||||
comp | 2451468..2451550 | cta | 236 | 236 | ||||||
comp | 2451787..2452356 | cds | 190 | hp | ||||||
comp | 2548914..2550098 | cds | 513 | 513 | 395 | alpha/beta hydrolase | ||||
comp | 2550612..2550688 | gac | + | 245 | 245 | |||||
comp | 2550934..2551010 | gac | 2 gac | 328 | 328 | |||||
2551339..2551956 | cds | 206 | TetR/AcrR family transcriptional regulator | |||||||
2604616..2605908 | cds | 824 | 824 | 431 | FAD-binding oxidoreductase | |||||
comp | 2606733..2606808 | gta | 264 | 264 | ||||||
comp | 2607073..2607996 | cds | 308 | sugar kinase | ||||||
2641040..2641360 | cds | 97 | 97 | 107 | YnfA family protein | |||||
2641458..2641534 | ccc | 94 | 94 | |||||||
2641629..2642357 | cds | 243 | SDR family oxidoreductase | |||||||
2696299..2697183 | cds | 54 | 54 | 295 | transcriptional regulator GcvA | |||||
comp | 2697238..2697314 | aga | 123 | 123 | ||||||
comp | 2697438..2697743 | cds | 156 | 156 | 102 | ETC complex I subunit | ||||
comp | 2697900..2697976 | cca | 186 | 186 | ||||||
2698163..2698309 | cds | 49 | hp | |||||||
comp | 2771579..2772697 | cds | 584 | 584 | 373 | porin | ||||
2773282..2773372 | agc | 203 | 203 | |||||||
2773576..2774643 | cds | 356 | porin | |||||||
chromosom2 | ||||||||||
149537..151504 | cds | 355 | 355 | 656 | selenocysteine-specific translation elongation factor | |||||
151860..151955 | tga | 14 | 14 | |||||||
comp | 151970..152605 | cds | 212 | lipase | ||||||
comp | 298403..299422 | cds | 300 | 300 | 340 | TerC family protein | ||||
comp | 299723..299796 | cag | 361 | 361 | ||||||
comp | 300158..300460 | cds | 101 | DUF1127 domain-containing protein | ||||||
455428..456111 | cds | 713 | 713 | 228 | FkbM family methyltransferase | |||||
456825..458313 | 16s | 268 | 1489 | |||||||
458582..458658 | atc | 11 | 11 | |||||||
458670..458745 | gca | 39 | 39 | |||||||
>comp | 458785..458973 | cds | 38 | 38 | 63 | P-hp | ||||
459012..461930 | 23s | 186 | 2919 | |||||||
462117..462231 | 5s | 54 | 115 | |||||||
462286..462362 | atgf | -44 | -44 | |||||||
comp | 462319..463974 | cds | 552 | recombinase family protein | ||||||
comp | 572059..572721 | cds | 545 | 545 | 221 | response regulator transcription factor | ||||
comp | 573267..573357 | other | @4 | 620 | 620 | |||||
comp | 573978..575285 | cds | 436 | SidA/IucD/PvdA family monooxygenase | ||||||
comp | 611464..611742 | cds | 88 | 88 | 93 | hp | ||||
comp | 611831..611905 | ggc | 387 | 387 | ||||||
612293..612814 | cds | 174 | prolyl-tRNA synthetase associated domain-containing protein | |||||||
991265..991999 | cds | 217 | 217 | 245 | alpha/beta hydrolase | |||||
comp | 992217..992306 | tca | 323 | 323 | ||||||
992630..992884 | cds | 85 | DUF2171 domain-containing protein | |||||||
comp | 1031528..1032946 | cds | 607 | 607 | 473 | PepSY domain-containing protein | ||||
comp | 1033554..1033629 | aaa | 327 | 327 | ||||||
1033957..1035651 | cds | 565 | membrane protein | |||||||
1067405..1068742 | cds | 131 | 131 | 446 | DNA polymerase IV | |||||
1068874..1068947 | tgc | 739 | 739 | |||||||
1069687..1069905 | cds | 73 | hp | |||||||
1081639..1082031 | cds | 103 | 103 | 131 | hp | |||||
comp | 1082135..1082209 | aac | 168 | 168 | ||||||
1082378..1082653 | cds | 92 | hp | |||||||
comp | 1333375..1333587 | cds | 209 | 209 | 71 | hp | ||||
comp | 1333797..1333873 | cac | 352 | 352 | ||||||
1334226..1337393 | cds | 1056 | PAS domain S-box protein | |||||||
1473437..1474405 | cds | 269 | 269 | 323 | nitronate monooxygenase | |||||
1474675..1474750 | acg | 156 | 156 | |||||||
>comp | 1474907..1475239 | cds | 111 | DNA adenine methylase | ||||||
comp | 1597496..1597666 | cds | 363 | 363 | 57 | LysR family transcriptional regulator | ||||
comp | 1598030..1598106 | atgf | 54 | |||||||
comp | 1598161..1598275 | 5s | 186 | 115 | ||||||
comp | 1598462..1601380 | 23s | 38 | 38 | 2919 | |||||
< | 1601419..1601607 | cds | 39 | 39 | 63 | P-hp | ||||
comp | 1601647..1601722 | gca | 11 | 11 | ||||||
comp | 1601734..1601810 | atc | 268 | |||||||
comp | 1602079..1603567 | 16s | 743 | 743 | 1489 | |||||
1604311..1605192 | cds | 294 | ATPase | |||||||
1720169..1720531 | cds | 113 | 113 | 121 | response regulator | |||||
1720645..1720719 | gtc | 465 | 465 | |||||||
1721185..1721838 | cds | 218 | protein-L-isoaspartate(D-aspartate) O-methyltransferase |
oan cumuls[modifier | modifier le wikicode]
- Lien tableur: oan cumuls
opérons | Fréquences intercalaires tRNAs | Fréquences intercalaires cds | Fréquences aas cds chromosome | ||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
effectif | gammes | sans rRNAs | avec rRNAs | gammes | cds | gammes | cdsd | gammes | cdsa | gammes | cdsa 300 | ||
avec rRNA | opérons | 4 | 1 | 4 | 1 | 5 | 1 | 100 | 25 | 1 | 0 | ||
16atcgca-cds | 4 | 20 | 50 | 15 | 40 | 200 | 20 | 30 | 0 | ||||
- | 40 | 1 | 100 | 12 | 80 | 300 | 21 | 60 | 4 | ||||
- | 60 | 150 | 12 | 120 | 400 | 15 | 90 | 18 | |||||
max a | 3 | 80 | 200 | 15 | 160 | 500 | 11 | 120 | 8 | ||||
a doubles | 0 | 100 | 250 | 7 | 200 | 600 | 5 | 150 | 9 | ||||
spéciaux | 0 | 120 | 300 | 6 | 240 | 700 | 3 | 180 | 3 | ||||
total aas | 12 | 140 | 350 | 5 | 280 | 800 | 0 | 210 | 6 | ||||
sans | opérons | 45 | 160 | 1 | 400 | 12 | 320 | 900 | 0 | 240 | 4 | ||
1 aa | 42 | 180 | 450 | 1 | 360 | 1000 | 0 | 270 | 6 | ||||
max a | 2 | 200 | 500 | 1 | 400 | 1100 | 1 | 300 | 8 | ||||
a doubles | 2 | 1 | 16 | 0 | 35 | ||||||||
total aas | 48 | 3 | 4 | 107 | 0 | 101 | 101 | ||||||
total aas | 60 | ||||||||||||
remarques | 4 | ||||||||||||
avec jaune | moyenne | 138 | 11 | 258 | 256 | ||||||||
variance | 111 | 0 | 268 | 180 | |||||||||
sans jaune | moyenne | 174 | 218 | 150 | |||||||||
variance | 117 | 132 | 81 |
oan tRNA-cds[modifier | modifier le wikicode]
- Note: intercalaires prélevés de la colonne cds de oan opérons dans un bloc de tRNAs uniquement. Le début du bloc est dans l'ordre des adresses, deb intercalaire entre le cds et le 1er tRNA dd bloc, fin entre le dernier tRNA et le cds terminal. J'ai procédé, dans les colonnes petit et grand, à la réorientation des blocs d'après la constatation que les blocs à rRNA ont leurs cds de début et de fin sont orientés du cds-16s au 5s-tRNAs-cds, l'intercalaire cds-16s étant plus grands que l'intercalaire avec le cds terminal. En tête de colonne est le % du nombre des intercalaires inférieurs à 201 pbs.
oan 53 56 31 78 deb fin deb fin grand petit grand petit -44 55 224 -40 26 10 55 -44 7 352 721 -38 55 -44 224 -40 24 593 91 6 91 6 721 -38 26 10 26 10 97 94 91 6 28 289 355 14 123 54 352 7 54 123 -44 55 136 85 26 10 65 420 219 61 146 139 355 14 85 136 305 66 164 109 593 24 88 387 299 70 167 159 289 28 91 6 211 88 168 103 123 54 97 94 97 94 171 158 219 61 103 200 164 109 186 156 420 65 103 168 333 114 200 103 305 66 112 200 54 123 200 112 299 70 113 465 85 136 211 88 136 85 131 739 139 146 219 61 211 88 139 146 269 156 224 -40 387 88 147 397 167 159 236 156 97 94 152 987 103 168 269 156 168 103 156 236 393 169 289 28 200 103 156 186 158 171 299 70 164 109 158 171 1650 178 305 66 200 112 164 109 156 186 323 217 465 113 167 159 103 200 333 114 333 114 209 352 112 200 352 7 739 131 211 88 584 203 352 209 146 139 217 323 156 236 355 14 397 147 219 61 824 264 361 300 987 152 224 -40 385 265 385 265 269 156 269 156 28 289 387 88 186 156 299 70 217 323 393 169 236 156 300 361 607 327 397 147 171 158 305 66 513 328 420 65 167 159 333 114 7 352 465 113 393 169 355 14 209 352 513 328 1650 178 385 265 300 361 584 203 584 203 393 169 819 374 593 24 352 209 513 328 88 387 607 327 323 217 545 620 147 397 620 545 824 264 584 203 65 420 721 -38 385 265 607 327 113 465 739 131 361 300 721 -38 24 593 819 374 607 327 819 374 545 620 824 264 513 328 824 264 131 739 987 152 819 374 1650 178 152 987 1650 178 620 545
- Comparaison cds-cds tRNA-cds: deb fin, c'est l'ordre des adresses et grand petit l'ordre après réorientation. Leur pourcentage est calculé par rapport à la colonne, c'est à dire la moitié du total des tRNA-cds.
alpha cds total total <0 0-200 201-370 371-600 >600 deb fin grand petit oan 4,900 90 3 46 22 11 8 23 23 14 32 ‰ 33 511 244 122 89 511 511 311 711
oan blocs[modifier | modifier le wikicode]
- Lien tableur: oan blocs
- Légende:
- p-hp pseudo hypothetical protein
Constantes | |||
cds | intercal | cdsa | |
16s | 268 | 1489 | |
atc | 11 | ||
gca | 39 | ||
cds | 38 | 63 | p-hp |
23s | 186 | 2919 | |
5s | 54 | 115 | |
atgf | |||
cds | |||
Variations | |||
bloc 16s | intercal | cdsa | |
---|---|---|---|
1084020..1085508 | 998 | 652 | M23 family metallopeptidase |
363 | 57 | LysR family transcriptional regulator | |
1346243..1347731 | 677 | 272 | IclR family transcriptional regulator |
360 | 314 | LysR family transcriptional regulator | |
456825..458313 | 713 | 228 | FkbM family methyltransferase |
-44 | 552 | recombinase family protein | |
1602079..1603567 | 743 | 294 | ATPase |
363 | 57 | LysR family transcriptional regulator |
- Détails: tous les blocs sont identiques avec comp' pour le cds du mileieu (jaune). Comp' pour sens direct quand les autres sont complement et complement quand les autres sont directs. Trois cds externes sont comp' aussi. Les intercalaires entourant ces cds sont en gras et primés.
cds | 743’ | 713 | 677 | 998’ |
16s | 268 | 268 | 268 | 268 |
atc | 11 | 11 | 11 | 11 |
gca | 39’ | 39’ | 39’ | 39’ |
cds | 38’ | 38’ | 38’ | 38’ |
23s | 186 | 186 | 186 | 186 |
5s | 54 | 54 | 54 | 54 |
atgf | 363 | -44' | 360 | 363 |
cds |
oan remarques[modifier | modifier le wikicode]
- Remarques: Par rapport aux rickettsia rtb et rpl, les intercalaires très élevés existent, 3 contre 10, 987 988 1650. Ce génome est analogue à agr pour les cds internes aux blocs à RNAs.
- @ Des intercalaires négatifs avec les cds, 5, de -40 à -50 même dans un bloc à rRNAs, -44.
- @ Les intercalaires avec les cds élevés supérieurs à 500, 16 dont 4 pour les blocs. Voir le tableau des intercalaires ci-dessous .
- - Par rapport à agr analogue de ce génome, il y a nettement plus d’intercalaires élevés. Sur 45 blocs à aas il y a 12 intercalaires supérieurs à 500, contre 6 pour 38 aas chez agr.
- - Un seul cas où les 2 intercailaires d’un cluster sont supérieurs à 500, other, voir @4 ici.
- - Tous les 11 autres paires sont très assymétriques.
- - 2 intercalaires sur 3 entre aas sont du même ordre que la moyenne de ceux des cds sans jaune, 245 et 146 contre 174 pour la moyenne de ceux des cds.
- @ Les blocs à rRNAs sont identiques et ne diffèrent que par l’intercalaire du cds.
- - Le cds intra blocs est une pseudo protéine hypothétique, de faible taille, 63aas.
- - Ses intercalaires avec gca et 23s sont quasi identiques, très faibles et se situent dans la 1ère gamme des intercalaires cds.
- @ other, cela doit être un tRNA incomplet comme ceux des mitochondries
- Note: les cds intra bloc à rRNAs. Les 4 blocs sont identiques. Cela veut dire que le cds interne est bien du au processus de la création des blocs. Le fait que le cds soit un pseudo renforce encore l’hypothèse de la création de ce cds par le processus de création ou de conversion. Voir remarque @2 de agr remarques.
- Note du 3.10.20: le contrôle des 4 cds montre qu'ils sont absents au 31.7.20, date du NCBI.
- Séquences des doubles, quasiment pas de doubles, 42 solitaires sur 45 opérons et 2 doubles seulement, gac et gaa.
- Tableau des intercalaires
Intercalaires élevés Intercalaires moyens pbs adresse RNA pbs adresse tRNA 1650 2342165 gtg 465 1720645 gtc 987 2370594 aca 420 2042108 tgg 824 2606733 gta 397 344746 acc 819 1096920 tcg 387 611831 ggc 739 1068874 tgc 385 1779957 atgi 721 1947096 aag 363 1089481 atgf 620 573267 other isolé 363 1598030 atgf 607 1033554 aaa 352 1333797 cac 593 1051227 ttg 333 935321 agg 584 2773282 agc 323 992217 tca 513 2550612 gac 305 2269141 ctc 998 1084020 16s 743 1602079 16s 713 456825 16s 677 1346243 16s
oan distribution[modifier | modifier le wikicode]
- Lien tableur: oan distribution
g1 | t1 | ||||||
---|---|---|---|---|---|---|---|
atgi | 1 | tct | tat | atgf | 5 | ||
att | act | aat | agt | ||||
ctt | cct | cat | cgc | ||||
gtt | gct | gat | ggt | ||||
ttc | 1 | tcc | 1 | tac | 1 | tgc | 1 |
atc | 4 | acc | 1 | aac | 1 | agc | 1 |
ctc | 1 | ccc | 1 | cac | 1 | cgt | 1 |
gtc | 1 | gcc | 1 | gac | 2 | ggc | 2 |
tta | 1 | tca | 1 | taa | tga | 1 | |
ata | aca | 1 | aaa | 1 | aga | 1 | |
cta | 1 | cca | 1 | caa | 1 | cga | |
gta | 1 | gca | 4 | gaa | 2 | gga | 1 |
ttg | 1 | tcg | 1 | tag | tgg | 1 | |
atgj | 2 | acg | 1 | aag | 1 | agg | 1 |
ctg | 1 | ccg | 1 | cag | 1 | cgg | 1 |
gtg | 1 | gcg | gag | 1 | ggg | 1 | |
alpha | >1aa | =1aa | -5s | +5s | -16s | +16s | total |
oan | 6 | 41 | 4 | 8 | 59 |
oan1. Intergen51[modifier | modifier le wikicode]
Intergen51. oan1. Le génome[modifier | modifier le wikicode]
- oan1 Le prélèvement: Aalpha
- Le nom et le lien NCBI: oan1, Brucella anthropi ATCC 49188 chromosome 1, NCBI [23], date 1.8.21.
- oan1 La longueur totale des intercalaires, longueur du génome et taux intercalaires/génome:
Nom intercals génome taux en % oan1 364,228 2,887,297 12.6
oan1 données intercalaires[modifier | modifier le wikicode]
- Lien tableur: oan1 données intercalaires
- Lien sauvegarde NCBI: Aalpha
oan1 données intercalaires 200[modifier | modifier le wikicode]
- Lien tableur: données intercalaires 200.
oan1 autres intercalaires aas[modifier | modifier le wikicode]
- Lien tableur: oan1 autres intercalaires aas
- Lien sauvegarde NCBI: Aalpha
Intergen51. oan1. Les différents types d'intercalaires[modifier | modifier le wikicode]
- Lien au tableur: Intergen51. oan1 les différents types d'intercalaires.
- Légende:
- - S pour intercalaire CDS-CDS et R pour tRNA-CDS,
- - c pour intercalaire continu (les 2 gènes sont sur le même brin) et x pour discontinu (les 2 gènes sont sur 2 brins différents, le brin et son complément)
- - %reste = 100*reste/total, le reste étant ce qui reste du total après la fin du diagramme, gamme.
- - %t30 = 100*t30/total, t30 étant le total des fréquences 10 20 30
- - %t5 = 100*t/total, t5 étant le total des fréquences de -1 à -5 dans le diagramme des S-.
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
Intergen51. oan1. Les diagrammes CDS-CDS positifs[modifier | modifier le wikicode]
- Lien tableur: Les diagrammes
- Diagrammes des gamma: oan1 présente 2 diagrammes
- - fc40, CDS-CDS continu, fréquence unitaire en abscisses et effectif en ordonnées
- - fx%, CDS-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et pourcentage en ‰ par rapport au total, en ordonnées.
- Équations des courbes de tendance en pour 1000: colonnes %fx %fc
Courbes de tendances pour les diagrammes en pour 1000 Calculs des f.41 oan1 R2 x3 x2 x c Inflexion poly3 x c 0.686 -3.12E-08 8.32E-05 -1.21E-01 43.0 fx1 abscisse 269.0 188.3 0.707 -5.22E-06 3.95E-03 -9.93E-01 96.4 fc1 ordonnée 16.4 20.9 0.758 -1.45E-06 1.17E-03 -3.74E-01 60.6 fx41 0.901 1.59E-06 -8.98E-04 3.01E-02 36.5 fc41
Intergen51. oan1. Les CDS-CDS négatifs[modifier | modifier le wikicode]
Sous-totaux oan1 totale fréquence x- c- x- c- - 1 0 93 4 4140 - 2 1 0 85 11 - 3 0 0 3 12 - 4 22 215 717 10938 - 5 0 0 5 19 sp6 32 94 1642 8424 total 55 402 2,456 23,544 reste 3 4 264 420 s6 9 2 361 41 s7 10 13 321 1438 s8 10 75 696 6525 rappot s1-5 4/2/1 22.0 2.3 8.4 2.6 % / sp6 s6/sp6 28.1 2.1 22.0 0.5 s7/sp6 31.3 13.8 19.5 17.1 s8/sp6 31.3 79.8 42.4 77.5 reste/sp6 9.4 4.3 16.1 5.0 total s1-5 23 308 814 15120 % / total %s1-5 41.8 76.6 33.1 64.2 %sp6 58.2 23.4 66.9 35.8
Intergen51. oan1. Les intercalaires des blocs[modifier | modifier le wikicode]
- Le détail
RNA-RNA c x CDS-RNA c x 23s 5s 2 CDS 16s 1 1 16s 23s 5s CDS 16s tRNA 2 16 CDS tRNA 23s 2 CDS 5s 5s tRNA 2 23s CDS tRNA in 2 CDS 23s tRNA contig 5s 16s tRNA hors 3 16s16s tRNA 16s 23s tRNA tRNA 5s 16s 5s 5s 23s 5s 5s total 13 0 total 1 1
- Les rares voir gamma pour la longueur des intercalaires
- Les tRNA-CDS compris, comparaison dans le clade et dans l'étude.
Intergen51. oan1. Les intercalaires tRNA-tRNA extra bloc[modifier | modifier le wikicode]
- Lien tableur: Intergen51. oan1. Les intercalaires tRNA-tRNA extra bloc
- voir les répétitions dans rpm
oan2. Intergen51[modifier | modifier le wikicode]
Intergen51. oan2. Le génome[modifier | modifier le wikicode]
- oan2 Le prélèvement: Aalpha
- Le nom et le lien NCBI: oan2, Brucella anthropi ATCC 49188 chromosome 2, NCBI [24], date 1.8.21.
- oan2 La longueur totale des intercalaires, longueur du génome et taux intercalaires/génome:
Nom intercals génome taux en % oan2 199,249 1,895,911 10.5
oan2 données intercalaires[modifier | modifier le wikicode]
- Lien tableur: oan2 données intercalaires
- Lien sauvegarde NCBI: Aalpha
oan2 données intercalaires 200[modifier | modifier le wikicode]
- Lien tableur: données intercalaires 200.
oan2 autres intercalaires aas[modifier | modifier le wikicode]
- Lien tableur: oan2 autres intercalaires aas
- Lien sauvegarde NCBI: Aalpha
Intergen51. oan2. Les différents types d'intercalaires[modifier | modifier le wikicode]
- Lien au tableur: Intergen51. oan2 les différents types d'intercalaires.
- Légende:
- - S pour intercalaire CDS-CDS et R pour tRNA-CDS,
- - c pour intercalaire continu (les 2 gènes sont sur le même brin) et x pour discontinu (les 2 gènes sont sur 2 brins différents, le brin et son complément)
- - %reste = 100*reste/total, le reste étant ce qui reste du total après la fin du diagramme, gamme.
- - %t30 = 100*t30/total, t30 étant le total des fréquences 10 20 30
- - %t5 = 100*t/total, t5 étant le total des fréquences de -1 à -5 dans le diagramme des S-.
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
Intergen51. oan2. Les diagrammes CDS-CDS positifs[modifier | modifier le wikicode]
- Lien tableur: Les diagrammes
- Diagrammes des gamma: oan2 présente 2 diagrammes
- - fc40, CDS-CDS continu, fréquence unitaire en abscisses et effectif en ordonnées
- - fx%, CDS-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et pourcentage en ‰ par rapport au total, en ordonnées.
- Équations des courbes de tendance en pour 1000: colonnes %fx %fc
Courbes de tendances pour les diagrammes en pour 1000 Calculs des f.41 oan2 R2 x3 x2 x c Inflexion poly3 x c 0.685 -1.69E-07 3.15E-04 -2.02E-01 49.5 fx1 abscisse 202.3 129.8 0.772 -7.79E-06 5.93E-03 -1.46E+00 126.0 fc1 ordonnée 21.4 26.7 0.678 1.73E-06 -1.05E-03 8.71E-02 32.4 fx41 0.863 1.04E-06 -4.05E-04 -1.06E-01 45.0 fc41
Intergen51. oan2. Les CDS-CDS négatifs[modifier | modifier le wikicode]
Sous-totaux oan2 totale fréquence x- c- x- c- - 1 0 48 4 4140 - 2 1 0 85 11 - 3 1 0 3 12 - 4 12 195 717 10938 - 5 0 0 5 19 sp6 14 49 1642 8424 total 28 292 2,456 23,544 reste 2 2 264 420 s6 4 0 361 41 s7 4 6 321 1438 s8 4 41 696 6525 rappot s1-5 4/2/1 12.0 4.1 8.4 2.6 % / sp6 s6/sp6 28.6 0.0 22.0 0.5 s7/sp6 28.6 12.2 19.5 17.1 s8/sp6 28.6 83.7 42.4 77.5 reste/sp6 14.3 4.1 16.1 5.0 total s1-5 14 243 814 15120 % / total %s1-5 50.0 83.2 33.1 64.2 %sp6 50.0 16.8 66.9 35.8
Intergen51. oan2. Les intercalaires des blocs[modifier | modifier le wikicode]
- Le détail
RNA-RNA c x CDS-RNA c x 23s 5s 2 CDS 16s 1 1 16s 23s 5s CDS 16s tRNA 2 16 CDS tRNA 23s 2 CDS 5s 5s tRNA 2 23s CDS tRNA in 2 CDS 23s tRNA contig 5s 16s tRNA hors 16s16s tRNA 16s 23s tRNA tRNA 5s 16s 5s 5s 23s 5s 5s total 10 0 total 1 1
- Les rares voir gamma pour la longueur des intercalaires
- Les tRNA-CDS compris, comparaison dans le clade et dans l'étude.
Intergen51. oan2. Les intercalaires tRNA-tRNA extra bloc[modifier | modifier le wikicode]
- Lien tableur: Intergen51. oan2. Les intercalaires tRNA-tRNA extra bloc
- voir les répétitions dans rpm
Azospirillum brasilense Az39[modifier | modifier le wikicode]
abq opérons[modifier | modifier le wikicode]
- Lien tableur: abq opérons
- Liens: gtRNAdb [25], NCBI [26], génome [27]
- Phylogénie: Bacteria; Proteobacteria; Alphaproteobacteria; Rhodospirillales; Rhodospirillaceae; Azospirillum.
- Légende: cdsa: cds aas, cdsd: cds dirigé
68.45%GC | 29.12.19 Paris | 88 | doubles | intercal | cds | aa | avec aa | cdsa | cdsd | protéines |
---|---|---|---|---|---|---|---|---|---|---|
chromosome | ||||||||||
125527..126444 | cds | 127 | 127 | 306 | restriction endonuclease | |||||
comp | 126572..126647 | gcg | 206 | 206 | ||||||
126854..127138 | cds | 95 | YggT family protein | |||||||
comp | 163237..164982 | cds | 175 | 175 | 582 | hydrogenase maturation nickel metallochaperone HypA | ||||
165158..165234 | agg | 59 | 59 | |||||||
165294..166022 | cds | 243 | SDR family NAD(P)-dependent oxidoreductase | |||||||
comp | 188235..189860 | cds | 42 | 42 | 542 | glycosyltransferase | ||||
comp | 189903..189977 | acg | 81 | 81 | ||||||
comp | 190059..191987 | cds | 643 | DNA helicase RecQ | ||||||
comp | 250833..251111 | cds | 169 | 169 | 93 | hp | ||||
comp | 251281..251356 | gcc | 141 | 141 | ||||||
comp | 251498..251893 | cds | 132 | TIGR02300 family protein | ||||||
comp | 458142..458459 | cds | 209 | 209 | 106 | 50S ribosomal protein L21 | ||||
458669..458758 | tcg | 63 | 63 | |||||||
comp | 458822..459664 | cds | 281 | alpha/beta hydrolase fold domain-containing protein | ||||||
comp | 496776..497171 | cds | 162 | 162 | 132 | cupin domain-containing protein | ||||
comp | 497334..497420 | ttg | 137 | 137 | ||||||
497558..498085 | cds | 176 | disulfide bond formation protein B | |||||||
comp | 615937..616350 | cds | 121 | 121 | 138 | hp | ||||
comp | 616472..616548 | ccg | + | 206 | 206 | |||||
comp | 616755..616831 | ccg | 2 ccg | 109 | 109 | |||||
comp | 616941..617957 | cds | 339 | farnesyltranstransferase | ||||||
comp | 748703..749161 | cds | 38 | 38 | 153 | hp | ||||
comp | 749200..749275 | aca | 91 | 91 | ||||||
comp | 749367..750221 | cds | 144 | 144 | 285 | 23s rRNA (guanosine(2251)-2'-O)-methyltransferase RlmB | ||||
750366..750451 | tac | 60 | 60 | |||||||
750512..750585 | gga | 81 | 81 | |||||||
750667..751857 | cds | 153 | 153 | 397 | elongation factor Tu | |||||
752011..752086 | tgg | 69 | 69 | |||||||
752156..752353 | cds | 66 | preprotein translocase subunit SecE | |||||||
comp | 794457..795983 | cds | 296 | 296 | 509 | methyltransferase domain-containing protein | ||||
796280..796355 | aag | + | 76 | 76 | ||||||
796432..796507 | aag | 2 aag | 109 | 109 | ||||||
comp | 796617..797057 | cds | 147 | MaoC family dehydratase | ||||||
870412..872373 | cds | 159 | 159 | 654 | RNA polymerase sigma factor RpoD | |||||
872533..872608 | atgi | 5 | 5 | |||||||
comp | 872614..873093 | cds | 134 | 134 | 160 | GNAT family N-acetyltransferase | ||||
comp | 873228..873304 | cgt | 212 | 212 | ||||||
873517..874023 | cds | 169 | hp | |||||||
931962..933011 | cds | 68 | 68 | 350 | low specificity L-threonine aldolase | |||||
933080..933155 | gag | + | 38 | 38 | ||||||
933194..933269 | gag | 2 gag | 72 | 72 | ||||||
comp | 933342..934340 | cds | 333 | transglycosylase SLT domain-containing protein | ||||||
997881..998357 | cds | 246 | 246 | 159 | peptidoglycan-associated lipoprotein Pal | |||||
comp | 998604..998678 | acc | 175 | 175 | ||||||
comp | 998854..1000815 | cds | 654 | polysaccharide biosynthesis protein | ||||||
comp | 1164137..1165048 | cds | 159 | 159 | 304 | DUF3108 domain-containing protein | ||||
1165208..1165282 | gtg | + | 132 | 132 | ||||||
1165415..1165489 | gtg | 2 gtg | 231 | 231 | ||||||
1165721..1165885 | cds | 55 | hp | |||||||
1242416..1242919 | cds | 85 | 85 | 168 | MerR family transcriptional regulator | |||||
1243005..1243081 | ccc | 139 | 139 | |||||||
comp | 1243221..1244999 | cds | 593 | cyclic nucleotide-binding domain-containing protein | ||||||
comp | 1353398..1353895 | cds | 118 | 118 | 166 | hp | ||||
1354014..1354091 | cca | 49 | 49 | |||||||
1354141..1354437 | cds | 10 | 10 | 99 | ETC complex I subunit | |||||
1354448..1354524 | aga | 443 | 443 | |||||||
1354968..1355213 | cds | 82 | hp | |||||||
comp | 1370270..1370500 | cds | 196 | 196 | 77 | hp | ||||
comp | 1370697..1370772 | aac | @2 | 220 | 220 | |||||
comp | 1370993..1371066 | tgc | 218 | 218 | ||||||
1371285..1371941 | cds | 219 | protein-L-isoaspartate O-methyltransferase | |||||||
comp | 1427443..1427733 | cds | 236 | 236 | 97 | YkgJ family cysteine cluster protein | ||||
comp | 1427970..1428085 | 5s | 129 | 116 | ||||||
comp | 1428215..1430967 | 23s | 266 | 2753 | ||||||
comp | 1431234..1431309 | gca | 30 | 30 | ||||||
comp | 1431340..1431416 | atc | 108 | |||||||
comp | 1431525..1433015 | 16s | 779 | 779 | 1491 | |||||
1433795..1437778 | cds | 1328 | non-ribosomal peptide synthetase | |||||||
comp | 1576457..1577296 | cds | 243 | 243 | 280 | aldo/keto reductase | ||||
comp | 1577540..1577615 | gaa | 123 | 123 | ||||||
comp | 1577739..1579538 | cds | 600 | single-stranded-DNA-specific exonuclease RecJ | ||||||
comp | 1723089..1723457 | cds | 344 | 344 | 123 | NADH-quinone oxidoreductase subunit A | ||||
comp | 1723802..1723878 | gac | 164 | 164 | ||||||
comp | 1724043..1724117 | gta | 106 | 106 | ||||||
comp | 1724224..1724496 | cds | 91 | HU family DNA-binding protein | ||||||
comp | 1730385..1731719 | cds | 91 | 91 | 445 | trigger factor | ||||
comp | 1731811..1731895 | cta | 173 | 173 | ||||||
comp | 1732069..1733634 | cds | 522 | malonyl-CoA decarboxylase | ||||||
comp | 1733741..1735207 | cds | 129 | 129 | 489 | bifunctional ADP-dependent NAD(P)H-hydrate dehydratase/NAD(P)H-hydrate epimerase | ||||
comp | 1735337..1735412 | cac | + | 109 | 109 | |||||
comp | 1735522..1735597 | cac | 2 cac | 337 | 337 | |||||
1735935..1736273 | cds | 113 | P-II family nitrogen regulator | |||||||
1951126..1951752 | cds | 149 | 149 | 209 | nitrogen fixation protein NifQ | |||||
1951902..1951987 | tac | 74 | 74 | |||||||
comp | 1952062..1952424 | cds | 121 | hp | ||||||
1996903..1997244 | cds | 595 | 595 | 114 | hp | |||||
comp | 1997840..1997914 | atgj | 131 | 131 | ||||||
comp | 1998046..1999179 | cds | 378 | tRNA 2-thiouridine(34) synthase MnmA | ||||||
2086487..2088658 | cds | 156 | 156 | 724 | malate synthase G | |||||
comp | 2088815..2088889 | gtc | 234 | 234 | ||||||
2089124..2090002 | cds | 293 | N-formylglutamate amidohydrolase | |||||||
comp | 2303404..2303880 | cds | 414 | 414 | 159 | bacterioferritin | ||||
comp | 2304295..2304377 | tta | 406 | 406 | ||||||
comp | 2304784..2305029 | cds | 82 | hp | ||||||
2482875..2484518 | cds | 365 | 365 | 548 | recombinase family protein | |||||
comp | 2484884..2484974 | tcc | 120 | 120 | ||||||
comp | 2485095..2485898 | cds | 268 | alpha/beta hydrolase | ||||||
comp | 2640759..2641325 | cds | 149 | 149 | 189 | prolyl-tRNA synthetase associated domain-containing protein | ||||
2641475..2641549 | ggc | 688 | 688 | |||||||
2642238..2642915 | cds | 226 | dimethylmenaquinone methyltransferase | |||||||
comp | 2764482..2765567 | cds | 659 | 659 | 362 | hp | ||||
comp | 2766227..2766300 | ggg | 35 | 35 | ||||||
comp | 2766336..2766995 | cds | 220 | N-acetyltransferase | ||||||
2781933..2783774 | cds | 187 | 187 | 614 | EAL and GGDEF domain-containing protein | |||||
comp | 2783962..2784077 | 5s | 129 | 116 | ||||||
comp | 2784207..2786959 | 23s | 255 | 2753 | ||||||
comp | 2787215..2787290 | gca | 30 | 30 | ||||||
comp | 2787321..2787397 | atc | 108 | |||||||
comp | 2787506..2789006 | 16s | 496 | 496 | 1501 | |||||
comp | 2789503..2790207 | cds | 235 | phosphatase PAP2 family protein | ||||||
2843264..2843443 | cds | 77 | 77 | 60 | hp | |||||
comp | 2843521..2843597 | cgt | 170 | 170 | ||||||
2843768..2844268 | cds | 167 | xanthine phosphoribosyltransferase | |||||||
plasmide2 | ||||||||||
comp | 51090..51836 | cds | 481 | 481 | 249 | sigma-70 family RNA polymerase sigma factor | ||||
comp | 52318..52393 | tgg | 363 | 363 | ||||||
52757..53587 | cds | 277 | hp | |||||||
comp | 809229..810019 | cds | 870 | 870 | 264 | IS5 family transposase | ||||
comp | 810890..810966 | atgf | 96 | |||||||
comp | 811063..811178 | 5s | 127 | 116 | ||||||
comp | 811306..814058 | 23s | 266 | 2753 | ||||||
comp | 814325..814400 | gca | 30 | 30 | ||||||
comp | 814431..814507 | atc | 108 | |||||||
comp | 814616..816106 | 16s | 452 | 452 | 1491 | |||||
comp | 816559..817443 | cds | 295 | helix-turn-helix domain-containing protein | ||||||
plasmide4 | ||||||||||
196992..199346 | cds | 148 | 148 | 785 | mechanosensitive ion channel | |||||
199495..199581 | ctg | 30 | 30 | |||||||
199612..199687 | gcc | 188 | 188 | |||||||
199876..201333 | cds | 486 | hp | |||||||
237538..238578 | cds | 92 | 92 | 347 | response regulator | |||||
comp | 238671..238747 | cgg | 96 | 96 | ||||||
comp | 238844..239821 | cds | 326 | alpha/beta hydrolase | ||||||
comp | 257739..258470 | cds | 125 | 125 | 244 | lipoyl(octanoyl) transferase LipB | ||||
258596..258682 | ctc | 123 | 123 | |||||||
comp | 258806..259108 | cds | 101 | STAS domain-containing protein | ||||||
comp | 399367..400527 | cds | 278 | 278 | 387 | PQQ-dependent sugar dehydrogenase | ||||
comp | 400806..400921 | 5s | 129 | 116 | ||||||
comp | 401051..403803 | 23s | 255 | 2753 | ||||||
comp | 404059..404134 | gca | 30 | 30 | ||||||
comp | 404165..404241 | atc | 108 | |||||||
comp | 404350..405850 | 16s | 502 | 502 | 1501 | |||||
comp | 406353..406547 | cds | 65 | hp | ||||||
504531..504893 | cds | 82 | 82 | 121 | response regulator | |||||
504976..505051 | aac | 3 | 3 | |||||||
505055..505131 | gac | 4 | 4 | |||||||
505136..505210 | ggc | 102 | 102 | |||||||
comp | 505313..506080 | cds | 83 | 83 | 256 | helix-turn-helix transcriptional regulator | ||||
506164..506790 | cds | 202 | 202 | 209 | pyridoxamine 5'-phosphate oxidase | |||||
comp | 506993..507108 | 5s | 127 | 116 | ||||||
comp | 507236..509988 | 23s | 266 | 2753 | ||||||
comp | 510255..510330 | gca | 30 | 30 | ||||||
comp | 510361..510437 | atc | 110 | |||||||
comp | 510548..512038 | 16s | 615 | 615 | 1491 | |||||
512654..513568 | cds | 305 | lytic transglycosylase domain-containing protein | |||||||
comp | 588108..590768 | cds | 340 | 340 | 887 | bifunctional acetaldehyde-CoA/alcohol dehydrogenase | ||||
591109..591184 | ttc | 286 | 286 | |||||||
591471..592979 | cds | 503 | FAD-binding oxidoreductase | |||||||
plasmide5 | ||||||||||
86421..87089 | cds | 455 | 455 | 223 | RraA family protein | |||||
87545..87619 | ggc | 193 | 193 | |||||||
87813..88865 | cds | 351 | UDP-N-acetylglucosamine 4,6-dehydratase (inverting) | |||||||
plasmide1 | @3 | |||||||||
>comp | 115594..115896 | cds | 394 | 394 | 101 | P-IS5/IS1182 family transposase | ||||
comp | 116291..116367 | atgf | 96 | |||||||
comp | 116464..116579 | 5s | 129 | 116 | ||||||
comp | 116709..119461 | 23s | 255 | 2753 | ||||||
comp | 119717..119792 | gca | 30 | 30 | ||||||
comp | 119823..119899 | atc | 108 | |||||||
comp | 120008..121498 | 16s | 740 | 740 | 1491 | |||||
122239..123597 | cds | 453 | peptidoglycan DD-metalloendopeptidase family protein | |||||||
comp | 217550..218176 | cds | 123 | 123 | 209 | ribonuclease D | ||||
comp | 218300..218386 | ctg | 228 | 228 | ||||||
218615..219604 | cds | 330 | complex I NDUFA9 subunit family protein | |||||||
comp | 300477..301733 | cds | 472 | 472 | 419 | exonuclease subunit SbcD | ||||
302206..303696 | 16s | 108 | 1491 | |||||||
303805..303881 | atc | 30 | 30 | |||||||
303912..303987 | gca | 255 | ||||||||
304243..306995 | 23s | 129 | 2753 | |||||||
307125..307240 | 5s | 96 | 116 | |||||||
307337..307413 | atgf | 161 | 161 | |||||||
<comp | 307575..307805 | cds | 77 | p-ATP-binding protein | ||||||
comp | 466493..467710 | cds | 231 | 231 | 406 | site-specific integrase | ||||
comp | 467942..468031 | tca | 205 | 205 | ||||||
comp | 468237..468809 | cds | 191 | hp | ||||||
512242..512790 | cds | 136 | 136 | 183 | pantetheine-phosphate adenylyltransferase | |||||
512927..513002 | aaa | 209 | 209 | |||||||
513212..514036 | cds | 275 | DUF3618 domain-containing protein | |||||||
931813..933912 | cds | 79 | 79 | 700 | membrane protein | |||||
933992..934066 | caa | 382 | 382 | |||||||
comp | 934449..935270 | cds | 274 | hp | ||||||
comp | 948715..949743 | cds | 199 | 199 | 343 | Ppx/GppA family phosphatase | ||||
949943..950016 | cag | 246 | 246 | |||||||
comp | 950263..950829 | cds | 189 | IS3 family transposase | ||||||
> | 971260..971532 | cds | 493 | 493 | 91 | P-hp | ||||
comp | 972026..972119 | agc | 197 | 197 | ||||||
972317..972550 | cds | 78 | hp | |||||||
comp | 1302373..1303350 | cds | 166 | 166 | 326 | alpha-1,3-fucosyltransferase | ||||
comp | 1303517..1303592 | ttc | 98 | 98 | ||||||
comp | 1303691..1303876 | cds | 62 | DNA gyrase inhibitor YacG | ||||||
1349823..1350929 | cds | 145 | 145 | 369 | GNAT family N-acetyltransferase | |||||
comp | 1351075..1353828 | 23s | 262 | 2754 | ||||||
comp | 1354091..1355591 | 16s | @1 | 676 | 676 | 1501 | ||||
1356268..1356726 | cds | 153 | MarR family transcriptional regulator | |||||||
comp | 1441708..1443066 | cds | 153 | 153 | 453 | hp | ||||
1443220..1443294 | acc | 1 | 1 | |||||||
1443296..1443371 | gcg | 99 | 99 | |||||||
1443471..1443547 | gac | 44 | 44 | |||||||
1443592..1443666 | gtc | 1 | 1 | |||||||
1443668..1443741 | cag | 137 | 137 | |||||||
comp | 1443879..1446428 | cds | 850 | dipeptide ABC transporter ATP-binding protein | ||||||
1566394..1566612 | cds | 193 | 193 | 73 | hp | |||||
comp | 1566806..1566921 | 5s | 128 | 116 | ||||||
comp | 1567050..1569802 | 23s | 254 | 2753 | ||||||
comp | 1570057..1570132 | gca | 30 | 30 | ||||||
comp | 1570163..1570239 | atc | 94 | |||||||
comp | 1570334..1571834 | 16s | 444 | 444 | 1501 | |||||
comp | 1572279..1572707 | cds | 143 | DUF1489 domain-containing protein | ||||||
1723583..1724962 | cds | 94 | 94 | 460 | hp | |||||
comp | 1725057..1725143 | ctc | 475 | 475 | ||||||
1725619..1726311 | cds | 231 | FadR family transcriptional regulator | |||||||
1757680..1760568 | cds | 308 | 308 | 963 | PAS domain-containing protein | |||||
1760877..1760963 | ctg | 29 | 29 | |||||||
1760993..1761068 | gcc | 247 | 247 | |||||||
comp | 1761316..1761840 | cds | 175 | helix-turn-helix transcriptional regulator | ||||||
1854042..1855049 | cds | 135 | 135 | 336 | inorganic phosphate transporter | |||||
comp | 1855185..1855259 | ggc | 243 | 243 | ||||||
1855503..1858685 | cds | 1061 | AAA family ATPase | |||||||
>comp | 1883235..1883816 | cds | 210 | 210 | 194 | P-hp | ||||
1884027..1884102 | aac | 4 | 4 | |||||||
1884107..1884183 | gac | 32 | 32 | |||||||
comp | 1884216..1884821 | cds | 202 | hp |
abq cumuls[modifier | modifier le wikicode]
- Lien tableur: abq cumuls
opérons | Fréquences intercalaires tRNAs | Fréquences intercalaires cds | Fréquences aas cds chromosome | ||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
effectif | gammes | sans rRNAs | avec rRNAs | gammes | cds | gammes | cdsd | gammes | cdsa | gammes | cdsa 300 | ||
avec rRNA | opérons | 9 | 1 | 2 | 1 | 0 | 1 | 100 | 17 | 1 | 0 | ||
16atcgca235 | 5 | 20 | 3 | 50 | 7 | 40 | 200 | 29 | 30 | 0 | |||
Id-atgf | 3 | 40 | 3 | 8 | 100 | 19 | 80 | 300 | 24 | 60 | 2 | ||
16s23s | 1 | 60 | 2 | 150 | 26 | 120 | 400 | 18 | 90 | 9 | |||
max a | 3 | 80 | 1 | 200 | 20 | 160 | 500 | 8 | 120 | 11 | |||
a doubles | 0 | 100 | 1 | 250 | 18 | 200 | 600 | 8 | 150 | 8 | |||
spéciaux | 0 | 120 | 1 | 300 | 3 | 240 | 700 | 5 | 180 | 11 | |||
total aas | 19 | 140 | 1 | 350 | 4 | 280 | 800 | 2 | 210 | 9 | |||
sans | opérons | 51 | 160 | 0 | 400 | 4 | 320 | 900 | 2 | 240 | 6 | ||
1 aa | 38 | 180 | 1 | 450 | 4 | 360 | 1000 | 1 | 270 | 6 | |||
max a | 5 | 200 | 0 | 500 | 7 | 400 | 1100 | 1 | 300 | 8 | |||
a doubles | 5 | 2 | 9 | 1 | 46 | ||||||||
total aas | 68 | 17 | 8 | 121 | 0 | 116 | 116 | ||||||
total aas | 87 | ||||||||||||
remarques | 3 | ||||||||||||
avec jaune | moyenne | 72 | 30 | 227 | 308 | ||||||||
variance | 72 | 0 | 175 | 230 | |||||||||
sans jaune | moyenne | 153 | 249 | 166 | |||||||||
variance | 74 | 142 | 71 |
abq tRNA-cds[modifier | modifier le wikicode]
- Note: intercalaires prélevés de la colonne cds de abq opérons dans un bloc de tRNAs uniquement. Le début du bloc est dans l'ordre des adresses, deb intercalaire entre le cds et le 1er tRNA dd bloc, fin entre le dernier tRNA et le cds terminal. J'ai procédé, dans les colonnes petit et grand, à la réorientation des blocs d'après la constatation que les blocs à rRNA ont leurs cds de début et de fin sont orientés du cds-16s au 5s-tRNAs-cds, l'intercalaire cds-16s étant plus grands que l'intercalaire avec le cds terminal. En tête de colonne est le % du nombre des intercalaires inférieurs à 201 pbs.
abq 67 60 38 90 deb fin deb fin grand petit grand petit 38 91 159 5 72 68 159 5 42 81 210 32 81 42 210 32 68 72 659 35 91 38 659 35 77 170 175 59 96 92 91 38 79 382 209 63 125 123 81 42 85 139 153 69 139 85 175 59 91 173 68 72 144 81 209 63 92 96 149 74 149 74 72 68 94 475 42 81 153 69 153 69 118 443 144 81 153 137 149 74 123 228 38 91 159 5 170 77 125 123 92 96 162 137 382 79 127 206 166 98 166 98 144 81 129 337 344 106 169 141 139 85 134 212 296 109 170 77 173 91 135 243 365 120 173 91 96 92 136 209 125 123 175 59 475 94 144 81 243 123 188 148 166 98 148 188 595 131 206 127 344 106 149 74 153 137 209 63 296 109 149 688 162 137 209 136 443 118 153 69 85 139 210 32 365 120 153 137 169 141 212 134 125 123 156 234 77 170 218 196 243 123 159 5 91 173 228 123 228 123 159 231 246 175 231 205 206 127 162 137 148 188 231 159 337 129 166 98 455 193 234 156 595 131 169 141 493 197 243 123 212 134 175 59 231 205 243 135 243 135 196 218 127 206 246 175 209 136 199 246 136 209 246 199 153 137 209 63 134 212 296 109 162 137 210 32 196 218 308 247 169 141 231 205 123 228 337 129 188 148 243 123 159 231 340 286 688 149 246 175 156 234 344 106 234 156 296 109 135 243 365 120 231 159 308 247 199 246 382 79 246 175 340 286 308 247 414 406 455 193 344 106 340 286 443 118 218 196 365 120 129 337 455 193 493 197 414 406 481 363 475 94 246 199 455 193 79 382 481 363 231 205 481 363 414 406 493 197 308 247 493 197 118 443 595 131 340 286 595 131 94 475 659 35 481 363 659 35 149 688 688 149 414 406
- Comparaison cds-cds tRNA-cds: deb fin, c'est l'ordre des adresses et grand petit l'ordre après réorientation. Leur pourcentage est calculé par rapport à la colonne, c'est à dire la moitié du total des tRNA-cds.
alpha cds total total <0 0-200 201-370 371-600 >600 deb fin grand petit abq 6,576 96 61 24 9 2 32 29 18 43 ‰ 635 250 94 21 667 604 375 896
abq blocs[modifier | modifier le wikicode]
- Lien tableur: abq blocs
- Légende: lien au tableau des protéines, abrégé
- - vert: la taille des rRNAs en pbs alors que les protéines (cds) sont en aas.
bloc | intercal | cdsa | intercal | cdsa | intercal | cdsa | intercal | cdsa | intercal | cdsa | |||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
cds | 779 | 1328 | non ribosom | 496 | 235 | PAP2 fam | 502 | 65 | hp | 615 | 305 | lytic dom | 444 | 143 | DUF1489 |
16s | 108 | 1491 | 108 | 1501 | 108 | 1501 | 110 | 1491 | 94 | 1501 | |||||
atc | 30 | 30 | 30 | 30 | 30 | ||||||||||
gca | 266 | 255 | 255 | 266 | 254 | ||||||||||
23s | 129 | 2753 | 129 | 2753 | 129 | 2753 | 127 | 2753 | 128 | 2753 | |||||
5s | 236 | 116 | 187 | 116 | 278 | 116 | 202 | 116 | 193 | 116 | |||||
cds | 97 | YkgJ fam | 614 | EAL & GGDEF | 387 | PQQ | 209 | pyridoxamine | 73 | hp | |||||
cds | 452 | 295 | Hx-t-Hx | 740 | 453 | peptido fam | 472 | 419 | exo SbcD | ||||||
16s | 108 | 1491 | 108 | 1491 | 108 | 1491 | |||||||||
atc | 30 | 30 | 30 | ||||||||||||
gca | 266 | 255 | 255 | cds | 676 | 153 | MarR fam | ||||||||
23s | 127 | 2753 | 129 | 2753 | 129 | 2753 | 16s | 262 | 1501 | ||||||
5s | 96 | 116 | 96 | 116 | 96 | 116 | 23s | 145 | 2754 | ||||||
atgf | 870 | 394 | 161 | cds | 369 | GNAT fam | |||||||||
cds | 264 | IS5 fam | 101 | p-IS5/IS1182 | 77 | p-ATP-bind |
abq remarques[modifier | modifier le wikicode]
- Remarques
- - Les intercalaires élevés des cds: Ce génome ressemble à agr plus qu’à oan, voir le tableau des intercalaires ci-dessous. Le génome oan se rapproche plus des rickettsia avec 12 intercalaires cds-aa supérieurs à 500 et un maximum de 1650. Le génome abq a des intercalaires cds-aa inférieurs à 700 comme agr mais en plus grand nombre, 6 contre 3.
- @ Les blocs à RNAs: Les blocs sont nombreux, 9 16s, quasiment identiques et complets.
- - Sur 18 cds 2 hp 1 pseudo et 5 petits avec moins de 210 aas.
- - Tous les blocs sauf un (incomplet, 16s23s) sont de type 16satcgca23s5s dont 5 se terminent avec 5s et 3 avec 5s-atgf.
- - Les intercalaires internes, hors cds, sont quasiment identiques.
- - Les tailles des rRNAs du 23s et du 5s ne varient pas. Il y a 5 16s à 1491 pbs et 4 avec 1501 pbs.
- @ Les intercalaires entre aas: Il y a 13 blocs à plusieurs aas, pour 51 au total, contre 3 pour 45 chez oan et 3 pour 38 chez agr. Aussi je distingue 2 groupes comme avec agr et oan qui ont des effectifs très faibles.
- - un groupe de 10, normal dans cette étude, autour de 15 de moyenne, de 3 à 60 pbs
- - un groupe de 7, extrême, de 76 à 220 pbs. Le maximum est équivalent à celui de oan mais nettement inférieur aux 2 extrêmes de agr, 793 et 446.
- @ Les plasmides: génome exceptionnel avec 5 plasmides et 9 blocs à rRNAs. Exceptionnel aussi du fait qu’un plasmide, le plasmide 1, contient 4 blocs à rRNAs, soit 2 fois plus que le chromosome avec 2 blocs. Cette situation rappelle le cas unique du génome aua où le seul bloc à rRNA se trouve sur l’unique et tout petit plasmide de 10k pbs.
- Séquences des doubles: sur les 51 blocs à aas seulement 13 ont plus d’un aa. Les doubles sont tous des doublets de blocs à 2 aas, 5 sur 11, ccg aag gag gtg cac.
- Tableau des intercalaires
abq intercalaires entre aas abq intercalaires cds abq intercalaires cds 1370697 aac-tgc 220 810890 atgf 870 2641475 ggc 688 616472 ccg-ccg 206 1431525 16s 779 2766227 ggg 659 1723802 gac-gta 164 120008 16s 740 1997840 atgj 595 1165208 gtg-gtg 132 1354091 16s 676 972026 agc 493 1735337 cac-cac 109 510548 16s 615 1725057 ctc 475 1443296 gcg-gac 99 404350 16s 502 86421 ggc 455 796280 aag-aag 76 2787506 16s 496 1354448 aga 443 302206 16s 472 52318 tgg 481-363 814616 16s 452 2304295 tta 414-406 isolé 1570334 16s 444 intercalaires supérieurs à 500 pbs. agr oan abq 16s 2 4 6 aas 6 12 3 max 16s 633 998 870 max aas 793 1650 688
abq distribution[modifier | modifier le wikicode]
- Lien tableur: abq distribution
- Notes
aag2 cac2 ccg2 gag3 gtg3 ggc: 3 1aa et 1 >1aa
g1 | t1 | ||||||
---|---|---|---|---|---|---|---|
atgi | 1 | tct | tat | atgf | 3 | ||
att | act | aat | agt | ||||
ctt | cct | cat | cgc | ||||
gtt | gct | gat | ggt | ||||
ttc | 2 | tcc | 1 | tac | 2 | tgc | 1 |
atc | 8 | acc | 2 | aac | 3 | agc | 1 |
ctc | 2 | ccc | 1 | cac | 2 | cgt | 2 |
gtc | 2 | gcc | 3 | gac | 3 | ggc | 4 |
tta | 1 | tca | 1 | taa | tga | ||
ata | aca | 1 | aaa | 1 | aga | 1 | |
cta | 1 | cca | 1 | caa | 1 | cga | |
gta | gca | 8 | gaa | 1 | gga | 1 | |
ttg | 1 | tcg | 1 | tag | tgg | 2 | |
atgj | 1 | acg | 1 | aag | 2 | agg | 1 |
ctg | 3 | ccg | 2 | cag | 2 | cgg | 1 |
gtg | 3 | gcg | 2 | gag | 3 | ggg | 1 |
alpha | >1aa | =1aa | -5s | +5s | -16s | +16s | total |
abq | 30 | 38 | 3 | 16 | 87 |
abq. Intergen51[modifier | modifier le wikicode]
Intergen51. abq. Le génome[modifier | modifier le wikicode]
- abq Le prélèvement: Aalpha
- Le nom et le lien NCBI: abq, Azospirillum brasilense strain Az39 chromosome, NCBI [28], date 25.4.21.
- abq La longueur totale des intercalaires, longueur du génome et taux intercalaires/génome:
Nom intercals génome taux en % abq 356,439 3,064,393 11.6
abq données intercalaires[modifier | modifier le wikicode]
- Lien tableur: abq données intercalaires
- Lien sauvegarde NCBI:Aalpha
abq données intercalaires 200[modifier | modifier le wikicode]
- Lien tableur: données intercalaires 200.
abq autres intercalaires aas[modifier | modifier le wikicode]
- Lien tableur: abq données intercalaires
- Lien sauvegarde NCBI:Aalpha
Intergen51. abq. Les différents types d'intercalaires[modifier | modifier le wikicode]
- Lien au tableur: Intergen51. abq les différents types d'intercalaires.
- Légende:
- - S pour intercalaire CDS-CDS et R pour tRNA-CDS,
- - c pour intercalaire continu (les 2 gènes sont sur le même brin) et x pour discontinu (les 2 gènes sont sur 2 brins différents, le brin et son complément)
- - %reste = 100*reste/total, le reste étant ce qui reste du total après la fin du diagramme, gamme.
- - %t30 = 100*t30/total, t30 étant le total des fréquences 10 20 30
- - %t5 = 100*t/total, t5 étant le total des fréquences de -1 à -5 dans le diagramme des S-.
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
Intergen51. abq. Les diagrammes CDS-CDS positifs[modifier | modifier le wikicode]
- Lien tableur: Les diagrammes
- Diagrammes des gamma: abq présente 2 diagrammes
- - fc40, CDS-CDS continu, fréquence unitaire en abscisses et effectif en ordonnées
- - fx%, CDS-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et pourcentage en ‰ par rapport au total, en ordonnées.
- Équations des courbes de tendance en pour 1000: colonnes %fx %fc
Courbes de tendances pour les diagrammes en pour 1000 Calculs des f.41 abq R2 x3 x2 x c Inflexion poly3 x c 0.726 -2.54E-06 1.74E-03 -4.43E-01 59.8 fx1 abscisse 255.0 188.0 0.871 -2.17E-06 1.96E-03 -6.55E-01 86.2 fc1 ordonnée 17.0 22.6 0.846 2.17E-06 -1.66E-03 2.89E-01 15.3 fx41 0.949 2.66E-06 -1.50E-03 8.29E-02 42.3 fc41
Intergen51. abq. Les CDS-CDS négatifs[modifier | modifier le wikicode]
Sous-totaux abq totale fréquence x- c- x- c- - 1 0 61 4 4140 - 2 1 0 85 11 - 3 0 0 3 12 - 4 6 199 717 10938 - 5 0 0 5 19 sp6 30 70 1642 8424 total 37 330 2,456 23,544 reste 5 7 264 420 s6 2 1 361 41 s7 4 14 321 1438 s8 19 48 696 6525 rappot s1-5 4/2/1 6.0 3.3 8.4 2.6 % / sp6 s6/sp6 6.7 1.4 22.0 0.5 s7/sp6 13.3 20.0 19.5 17.1 s8/sp6 63.3 68.6 42.4 77.5 reste/sp6 16.7 10.0 16.1 5.0 total s1-5 7 260 814 15120 % / total %s1-5 18.9 78.8 33.1 64.2 %sp6 81.1 21.2 66.9 35.8
Intergen51. abq. Les intercalaires des blocs[modifier | modifier le wikicode]
- Le détail
RNA-RNA c x CDS-RNA c x 23s 5s 2 CDS 16s 1 1 16s 23s 5s CDS 1 1 16s tRNA 2 16 CDS tRNA 23s 2 CDS 5s 5s tRNA 23s CDS tRNA in 2 CDS 23s tRNA contig 5s 16s tRNA hors 8 16s16s tRNA 16s 23s tRNA tRNA 5s 16s 5s 5s 23s 5s 5s total 16 0 total 2 2
- Les rares voir gamma pour la longueur des intercalaires
- Les tRNA-CDS compris, comparaison dans le clade et dans l'étude.
Intergen51. abq. Les intercalaires tRNA-tRNA extra bloc[modifier | modifier le wikicode]
- Lien tableur: Intergen51. abq. Les intercalaires tRNA-tRNA extra bloc
- voir les répétitions dans rpm
abqp. Intergen51[modifier | modifier le wikicode]
Intergen51. abqp. Le génome[modifier | modifier le wikicode]
- abqp Le prélèvement: Aabqp
- Le nom et le lien NCBI: abqp, Azospirillum brasilense strain Az39 plasmid AbAZ39_p1, NCBI [29], date 26.4.22.
- abqp La longueur totale des intercalaires, longueur du génome et taux intercalaires/génome:
Nom intercals génome taux en % abqp 217,409 1,901,707 11.4
abqp données intercalaires[modifier | modifier le wikicode]
- Lien tableur: abqp données intercalaires
- Lien sauvegarde NCBI: Aalpha
abqp données intercalaires 200[modifier | modifier le wikicode]
- Lien tableur: données intercalaires 200.
abqp autres intercalaires aas[modifier | modifier le wikicode]
- Lien tableur: abqp autres intercalaires aas
- Lien sauvegarde NCBI: Aalpha
Intergen51. abqp. Les différents types d'intercalaires[modifier | modifier le wikicode]
- Lien au tableur: Intergen51. abqp les différents types d'intercalaires.
- Légende:
- - S pour intercalaire CDS-CDS et R pour tRNA-CDS,
- - c pour intercalaire continu (les 2 gènes sont sur le même brin) et x pour discontinu (les 2 gènes sont sur 2 brins différents, le brin et son complément)
- - %reste = 100*reste/total, le reste étant ce qui reste du total après la fin du diagramme, gamme.
- - %t30 = 100*t30/total, t30 étant le total des fréquences 10 20 30
- - %t5 = 100*t/total, t5 étant le total des fréquences de -1 à -5 dans le diagramme des S-.
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
Intergen51. abqp. Les diagrammes CDS-CDS positifs[modifier | modifier le wikicode]
- Lien tableur: Les diagrammes
- Diagrammes des gamma: abqp présente 2 diagrammes
- - fc40, CDS-CDS continu, fréquence unitaire en abscisses et effectif en ordonnées
- - fx%, CDS-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et pourcentage en ‰ par rapport au total, en ordonnées.
- Équations des courbes de tendance en pour 1000: colonnes %fx %fc
Courbes de tendances pour les diagrammes en pour 1000 Calculs des f.41 abqp R2 x3 x2 x c Inflexion poly3 x c 0.650 -2.13E-06 1.44E-03 -3.77E-01 56.1 fx1 abscisse 251.5 176.0 0.923 -2.61E-06 2.27E-03 -7.16E-01 89.0 fc1 ordonnée 18.5 23.2 0.762 2.24E-06 -1.69E-03 2.93E-01 16.1 fx41 0.930 1.78E-06 -9.40E-04 -1.28E-02 44.9 fc41
Intergen51. abqp. Les CDS-CDS négatifs[modifier | modifier le wikicode]
Sous-totaux abqp totale fréquence x- c- x- c- - 1 0 30 4 4140 - 2 1 0 85 11 - 3 0 0 3 12 - 4 1 143 717 10938 - 5 0 0 5 19 sp6 24 62 1642 8424 total 26 235 2,456 23,544 reste 6 7 264 420 s6 2 1 361 41 s7 7 14 321 1438 s8 9 40 696 6525 rappot s1-5 4/2/1 1.0 4.8 8.4 2.6 % / sp6 s6/sp6 8.3 1.6 22.0 0.5 s7/sp6 29.2 22.6 19.5 17.1 s8/sp6 37.5 64.5 42.4 77.5 reste/sp6 25.0 11.3 16.1 5.0 total s1-5 2 173 814 15120 % / total %s1-5 7.7 73.6 33.1 64.2 %sp6 92.3 26.4 66.9 35.8
Intergen51. abqp. Les intercalaires des blocs[modifier | modifier le wikicode]
- Le détail
RNA-RNA c x CDS-RNA c x 23s 5s 3 CDS 16s 1 3 16s 23s 1 5s CDS 1 16s tRNA 3 16 CDS tRNA 23s 3 CDS 5s 5s tRNA 2 23s CDS 1 tRNA in 3 CDS 23s tRNA contig 5s 16s tRNA hors 6 16s16s tRNA 16s 23s tRNA tRNA 5s 16s 5s 5s 23s 5s 5s total 21 0 total 1 5
- Les rares voir gamma pour la longueur des intercalaires
- Les tRNA-CDS compris, comparaison dans le clade et dans l'étude.
Intergen51. abqp. Les intercalaires tRNA-tRNA extra bloc[modifier | modifier le wikicode]
- Lien tableur: Intergen51. abqp. Les intercalaires tRNA-tRNA extra bloc
- voir les répétitions dans rpm
Azospirillum brasilense Sp245[modifier | modifier le wikicode]
abs opérons[modifier | modifier le wikicode]
- Lien tableur: abs opérons
- Liens: gtRNAdb [30], NCBI [31], génome [32]
- Phylogénie: Bacteria; Proteobacteria; Alphaproteobacteria; Rhodospirillales; Rhodospirillaceae; Azospirillum.
- Légende: cdsa: cds aas, cdsd: cds dirigé
68.45%GC | 10.1.20 Paris | 80 | doubles | intercal | cds | aa | avec aa | cdsa | cdsd | protéines |
---|---|---|---|---|---|---|---|---|---|---|
chromosome [33] | ||||||||||
comp | 16414..16980 | cds | 163 | 163 | 189 | prolyl-tRNA synthetase associated domain-containing protein | ||||
17144..17218 | ggc | 670 | 670 | |||||||
17889..18566 | cds | 226 | demethylmenaquinone methyltransferase | |||||||
84790..85017 | cds | 114 | 114 | 76 | osmotically-inducible lipoprotein B | |||||
comp | 85132..85205 | ggg | 35 | 35 | ||||||
comp | 85241..85900 | cds | 220 | N-acetyltransferase | ||||||
comp | 93530..94258 | cds | 60 | 60 | 243 | SDR family NAD(P)-dependent oxidoreductase | ||||
comp | 94319..94395 | agg | 175 | 175 | ||||||
94571..96262 | cds | 564 | hp | |||||||
comp | 131833..132117 | cds | 206 | 206 | 95 | YggT family protein | ||||
132324..132399 | gcg | 140 | 140 | |||||||
comp | 132540..133586 | cds | 349 | DMT family transporter | ||||||
comp | 483582..484082 | cds | 170 | 170 | 167 | xanthine phosphoribosyltransferase | ||||
484253..484329 | cgt | 77 | 77 | |||||||
comp | 484407..484586 | cds | 60 | hp | ||||||
536869..537573 | cds | 495 | 495 | 235 | phosphatase PAP2 family protein | |||||
538069..539152 | 16s’ | @1 | 189 | 1084 | ||||||
539342..540019 | 23s° | 127 | 678 | |||||||
540147..540262 | 5s | 153 | 153 | 116 | ||||||
comp | 540416..542290 | cds | 625 | GGDEF domain-containing protein | ||||||
600048..601079 | cds | 79 | 79 | 344 | tyrosine-type recombinase/integrase | |||||
comp | 601159..601233 | acg | 81 | 81 | ||||||
comp | 601315..603243 | cds | 643 | DNA helicase RecQ | ||||||
comp | 656242..656520 | cds | 169 | 169 | 93 | hp | ||||
comp | 656690..656765 | gcc | 141 | 141 | ||||||
comp | 656907..657305 | cds | 133 | TIGR02300 family protein | ||||||
comp | 864141..864458 | cds | 209 | 209 | 106 | 50S ribosomal protein L21 | ||||
864668..864757 | tcg | 79 | 79 | |||||||
comp | 864837..865679 | cds | 281 | alpha/beta hydrolase | ||||||
927651..927896 | cds | 392 | 392 | 82 | hp | |||||
928289..928371 | tta | 175 | 175 | |||||||
928547..929164 | cds | 206 | hp | |||||||
comp | 1148345..1149223 | cds | 234 | 234 | 293 | N-formylglutamate amidohydrolase | ||||
1149458..1149532 | gtc | 106 | 106 | |||||||
comp | 1149639..1151516 | cds | 626 | methyl-accepting chemotaxis protein | ||||||
1243974..1245108 | cds | 131 | 131 | 378 | tRNA 2-thiouridine(34) synthase MnmA | |||||
1245240..1245314 | atgj | 354 | 354 | |||||||
comp | 1245669..1246637 | cds | 323 | NAD(+) diphosphatase | ||||||
1279875..1280237 | cds | 74 | 74 | 121 | hp | |||||
comp | 1280312..1280397 | tac | 148 | 148 | ||||||
comp | 1280546..1281172 | cds | 209 | nitrogen fixation protein NifQ | ||||||
comp | 1500772..1501110 | cds | 338 | 338 | 113 | P-II family nitrogen regulator | ||||
1501449..1501524 | cac | + | 109 | 109 | ||||||
1501634..1501709 | cac | 2 cac | 129 | 129 | ||||||
1501839..1503305 | cds | 106 | 106 | 489 | bifunctional ADP-dependent NAD(P)H-hydrate dehydratase/NAD(P)H-hydrate epimerase | |||||
1503412..1504977 | cds | 173 | 173 | 522 | malonyl-CoA decarboxylase | |||||
1505151..1505235 | cta | 91 | 91 | |||||||
1505327..1506661 | cds | 445 | trigger factor | |||||||
1511745..1512017 | cds | 105 | 105 | 91 | HU family DNA-binding protein | |||||
1512123..1512197 | gta | 163 | 163 | |||||||
1512361..1512437 | gac | 344 | 344 | |||||||
1512782..1513150 | cds | 123 | NADH-quinone oxidoreductase subunit A | |||||||
1657596..1659397 | cds | 123 | 123 | 601 | p-single-stranded-DNA-specific exonuclease RecJ | |||||
1659521..1659596 | gaa | 234 | 234 | |||||||
1659831..1660671 | cds | 280 | aldo/keto reductase | |||||||
comp | 1808199..1808735 | cds | 79 | 79 | 179 | hp | ||||
1808815..1808892 | cca | 49 | 49 | |||||||
1808942..1809238 | cds | 10 | 10 | 99 | ETC complex I subunit | |||||
1809249..1809325 | aga | 442 | 442 | |||||||
1809768..1810013 | cds | 82 | hp | |||||||
comp | 1825075..1825305 | cds | 210 | 210 | 77 | hp | ||||
comp | 1825516..1825591 | aac | @2 | 219 | 219 | |||||
comp | 1825811..1825884 | tgc | 217 | 217 | ||||||
1826102..1826758 | cds | 219 | protein-L-isoaspartate O-methyltransferase | |||||||
comp | 1878424..1878714 | cds | 244 | 244 | 97 | YkgJ family cysteine cluster protein | ||||
comp | 1878959..1879074 | 5s | 123 | 116 | ||||||
comp | 1879198..1881950 | 23s | 272 | 2753 | ||||||
comp | 1882223..1882298 | gca | 32 | 32 | ||||||
comp | 1882331..1882407 | atc | 110 | |||||||
comp | 1882518..1883224 | 16s° | 100 | 100 | 707 | |||||
<comp | 1883325..1883763 | cds | 146 | p-erythrose-4-phosphate dehydrogenase | ||||||
1896604..1897080 | cds | 192 | 192 | 159 | peptidoglycan-associated lipoprotein Pal | |||||
comp | 1897273..1897347 | acc | 162 | 162 | ||||||
comp | 1897510..1899495 | cds | 662 | polysaccharide biosynthesis protein | ||||||
comp | 2032701..2033588 | cds | 165 | 165 | 296 | DUF3108 domain-containing protein | ||||
2033754..2033828 | gtg | + | 132 | 132 | ||||||
2033961..2034035 | gtg | 2 gtg | 231 | 231 | ||||||
2034267..2034431 | cds | 55 | hp | |||||||
2113098..2113601 | cds | 85 | 85 | 168 | MerR family transcriptional regulator | |||||
2113687..2113763 | ccc | 140 | 140 | |||||||
comp | 2113904..2115682 | cds | 593 | cyclic nucleotide-binding domain-containing protein | ||||||
comp | 2163405..2167388 | cds | 775 | 775 | 1328 | non-ribosomal peptide synthetase | ||||
2168164..2168552 | 16s° | 100 | 389 | |||||||
comp | 2168653..2169323 | 16s° | 522 | 522 | 671 | |||||
comp | 2169846..2170325 | cds | 160 | DUF2141 domain-containing protein | ||||||
2176963..2177427 | cds | 107 | 107 | 155 | membrane protein | |||||
comp | 2177535..2177610 | gcc | 30 | 30 | ||||||
comp | 2177641..2177727 | ctg | 135 | 135 | ||||||
comp | 2177863..2180208 | cds | 782 | mechanosensitive ion channel | ||||||
2233677..2234435 | cds | 92 | 92 | 253 | hp | |||||
comp | 2234528..2234603 | gag | + | 38 | 38 | |||||
comp | 2234642..2234717 | gag | 2 gag | 68 | 68 | |||||
comp | 2234786..2235836 | cds | 350 | p-low specificity L-threonine aldolase | ||||||
comp | 2293087..2293593 | cds | 211 | 211 | 169 | hp | ||||
2293805..2293881 | cgt | 137 | 137 | |||||||
2294019..2294495 | cds | 5 | 5 | 159 | GNAT family N-acetyltransferase | |||||
comp | 2294501..2294576 | atgi | 145 | 145 | ||||||
comp | 2294722..2296683 | cds | 654 | RNA polymerase sigma factor RpoD | ||||||
2372946..2373401 | cds | 86 | 86 | 152 | MaoC family dehydratase | |||||
comp | 2373488..2373563 | aag | + | 74 | 74 | |||||
comp | 2373638..2373713 | aag | 2 aag | 309 | 309 | |||||
2374023..2375549 | cds | 509 | methyltransferase domain-containing protein | |||||||
comp | 2418203..2418400 | cds | 69 | 69 | 66 | preprotein translocase subunit SecE | ||||
comp | 2418470..2418545 | tgg | 152 | 152 | ||||||
comp | 2418698..2419888 | cds | 81 | 81 | 397 | elongation factor Tu | ||||
comp | 2419970..2420043 | gga | 60 | 60 | ||||||
comp | 2420104..2420189 | tac | 144 | 144 | ||||||
2420334..2421188 | cds | 91 | 91 | 285 | 23S rRNA (guanosine(2251)-2'-O)-methyltransferase RlmB | |||||
2421280..2421355 | aca | 137 | 137 | |||||||
2421493..2423187 | cds | 565 | site-specific integrase | |||||||
2561207..2562223 | cds | 109 | 109 | 339 | farnesyltranstransferase | |||||
2562333..2562409 | ccg | + | 205 | 205 | ||||||
2562615..2562691 | ccg | 2 ccg | 136 | 136 | ||||||
2562828..2563241 | cds | 138 | hp | |||||||
comp | 2680406..2680930 | cds | 140 | 140 | 175 | disulfide bond formation protein B | ||||
2681071..2681157 | ttg | 162 | 162 | |||||||
2681320..2681715 | cds | 132 | cupin domain-containing protein | |||||||
2856509..2858152 | cds | 365 | 365 | 548 | recombinase family protein | |||||
comp | 2858518..2858608 | tcc | 118 | 118 | ||||||
comp | 2858727..2859530 | cds | 268 | alpha/beta hydrolase | ||||||
plasmide1 [34] | @3 | |||||||||
198109..199200 | cds | 84 | 84 | 364 | tyrosine-type recombinase/integrase | |||||
comp | 199285..199360 | aaa | 135 | 135 | ||||||
comp | 199496..200044 | cds | 183 | pantetheine-phosphate adenylyltransferase | ||||||
243776..244348 | cds | 205 | 205 | 191 | hp | |||||
244554..244643 | tca | 143 | 143 | |||||||
244787..245683 | cds | 299 | diguanylate cyclase | |||||||
338004..339383 | cds | 116 | 116 | 460 | hp | |||||
comp | 339500..339586 | ctc | 257 | 257 | ||||||
comp | 339844..340836 | cds | 331 | alpha/beta hydrolase | ||||||
comp | 364473..365501 | cds | 200 | 200 | 343 | Ppx/GppA family phosphatase | ||||
365702..365775 | cag | 746 | 746 | |||||||
366522..367214 | cds | 231 | FadR family transcriptional regulator | |||||||
474173..477079 | cds | 298 | 298 | 969 | PAS domain-containing protein | |||||
477378..477464 | ctg | 30 | 30 | |||||||
477495..477570 | gcc | 238 | 238 | |||||||
477809..478123 | cds | 105 | hp | |||||||
599223..600230 | cds | 245 | 245 | 336 | inorganic phosphate transporter | |||||
comp | 600476..600550 | ggc | 351 | 351 | ||||||
600902..602071 | cds | 390 | adenylate/guanylate cyclase domain-containing protein | |||||||
comp | 629856..631229 | cds | 154 | 154 | 458 | tetratricopeptide repeat protein | ||||
631384..631458 | acc | 1 | 1 | |||||||
631460..631535 | gcg | 99 | 99 | |||||||
631635..631711 | gac | 35 | 35 | |||||||
631747..631821 | gtc | 1 | 1 | |||||||
631823..631896 | cag | 153 | 153 | |||||||
632050..632259 | cds | 70 | hp | |||||||
>comp | 699265..699846 | cds | 210 | 210 | 194 | P-hp | ||||
700057..700132 | aac | 4 | 4 | |||||||
700137..700213 | gac | 32 | 32 | |||||||
comp | 700246..700851 | cds | 202 | hp | ||||||
909530..909766 | cds | 153 | 153 | 79 | hp | |||||
comp | 909920..910035 | 5s | 127 | 116 | ||||||
comp | 910163..912915 | 23s | 271 | 2753 | ||||||
comp | 913187..913262 | gca | 30 | 30 | ||||||
comp | 913293..913369 | atc | 110 | |||||||
comp | 913480..914970 | 16s | 486 | 486 | 1491 | |||||
915457..916713 | cds | 419 | exonuclease subunit SbcD | |||||||
comp | 998160..999149 | cds | 229 | 229 | 330 | complex I NDUFA9 subunit family protein | ||||
999379..999465 | ctg | 123 | 123 | |||||||
999589..1000215 | cds | 209 | ribonuclease D | |||||||
comp | 1098197..1098655 | cds | 675 | 675 | 153 | MarR family transcriptional regulator | ||||
1099331..1100821 | 16s | 107 | 1491 | |||||||
1100929..1101005 | atc | 31 | 31 | |||||||
1101037..1101112 | gca | 271 | ||||||||
1101384..1104136 | 23s | 147 | 147 | 2753 | ||||||
comp | 1104284..1105390 | cds | 369 | GNAT family N-acetyltransferase | ||||||
1157171..1157356 | cds | 98 | 98 | 62 | DNA gyrase inhibitor YacG | |||||
1157455..1157530 | ttc | 178 | 178 | |||||||
1157709..1158686 | cds | 326 | alpha-(1,3)-fucosyltransferase | |||||||
1394614..1396740 | cds | 453 | 453 | 709 | PAS domain S-box protein | |||||
1397194..1397287 | agc | 52 | 52 | |||||||
comp | 1397340..1397858 | cds | 173 | tyrosine-type recombinase/integrase | ||||||
1399009..1399830 | cds | 301 | 301 | 274 | hp | |||||
comp | 1400132..1400206 | caa | 79 | 79 | ||||||
comp | 1400286..1402379 | cds | 698 | hp | ||||||
1577667..1578095 | cds | 457 | 457 | 143 | DUF1489 domain-containing protein | |||||
1578553..1580043 | 16s | 110 | 1491 | |||||||
1580154..1580230 | atc | 31 | 31 | |||||||
1580262..1580337 | gca | 269 | ||||||||
1580607..1581986 | 23s° | 100 | 1380 | |||||||
1582087..1582616 | 23s° | 123 | 530 | |||||||
1582740..1582855 | 5s | 100 | 116 | |||||||
1582956..1583032 | atgf | 706 | 706 | |||||||
1583739..1585157 | cds | 473 | pyruvate kinase | |||||||
plasmide2 [35] | ||||||||||
271302..272090 | cds | 529 | 529 | 263 | ATP-binding cassette domain-containing protein | |||||
272620..272695 | tgg | 480 | 480 | |||||||
273176..273922 | cds | 249 | sigma-70 family RNA polymerase sigma factor | |||||||
449562..450338 | cds | 465 | 465 | 259 | IclR family transcriptional regulator | |||||
450804..452289 | 16s | 584 | 1486 | |||||||
452874..453640 | 23s° | 128 | 767 | |||||||
453769..453884 | 5s | 101 | 116 | |||||||
453986..454062 | atgf | 359 | 359 | |||||||
comp | 454422..457751 | cds | 1110 | NERD domain-containing protein | ||||||
plasmide4 [36] | ||||||||||
>comp | 131140..131621 | cds | 193 | 193 | 161 | p-erythrose-4-phosphate dehydrogenase | ||||
131815..131891 | atgf | 202 | 202 | |||||||
comp | 132094..132276 | cds | 61 | hp | ||||||
comp | 197300..198643 | cds | 738 | 738 | 448 | peptidoglycan DD-metalloendopeptidase family protein | ||||
199382..199953 | 16s° | 193 | 572 | |||||||
200147..200223 | atgf | 437 | 437 | |||||||
comp | 200661..202571 | cds | 637 | PAS domain-containing sensor histidine kinase | ||||||
246777..248687 | cds | 208 | 208 | 637 | RNA-directed DNA polymerase | |||||
comp | 248896..248972 | cgg | 96 | 96 | ||||||
comp | 249069..249983 | cds | 305 | alpha/beta hydrolase | ||||||
319641..319943 | cds | 134 | 134 | 101 | STAS domain-containing protein | |||||
comp | 320078..320164 | ctc | 125 | 125 | ||||||
320290..321018 | cds | 243 | lipoyl(octanoyl) transferase LipB | |||||||
comp | 401067..402227 | cds | 281 | 281 | 387 | PQQ-dependent sugar dehydrogenase | ||||
comp | 402509..402624 | 5s | 129 | 116 | ||||||
comp | 402754..403402 | 23s° | 106 | 649 | ||||||
comp | 403509..403880 | 16s° | 502 | 502 | 372 | |||||
comp | 404383..404577 | cds | 65 | hp | ||||||
501394..501756 | cds | 95 | 95 | 121 | response regulator | |||||
501852..501927 | aac | 4 | 4 | |||||||
501932..502008 | gac | 4 | 4 | |||||||
502013..502087 | ggc | 102 | 102 | |||||||
comp | 502190..502957 | cds | 256 | helix-turn-helix transcriptional regulator | ||||||
503041..503667 | cds | 249 | 249 | 209 | pyridoxamine 5'-phosphate oxidase | |||||
comp | 503917..504474 | 16s° | 547 | 547 | 558 | |||||
505022..506005 | cds | 328 | lytic transglycosylase domain-containing protein | |||||||
comp | 601019..603679 | cds | 358 | 358 | 887 | bifunctional acetaldehyde-CoA/alcohol dehydrogenase | ||||
604038..604113 | ttc | 318 | 318 | |||||||
> | 604432..605613 | cds | 394 | site-specific integrase | ||||||
plasmide6 [37] | ||||||||||
88804..89472 | cds | 397 | 397 | 223 | RraA family protein | |||||
89870..89944 | ggc | 249 | 249 | |||||||
90194..91186 | cds | 331 | UDP-N-acetylglucosamine 4,6-dehydratase (inverting) |
abs cumuls[modifier | modifier le wikicode]
- Lien tableur: abs cumuls
opérons | Fréquences intercalaires tRNAs | Fréquences intercalaires cds | Fréquences aas cds chromosome | ||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
effectif | gammes | sans rRNAs | avec rRNAs | gammes | cds | gammes | cdsd | gammes | cdsa | gammes | cdsa 30-300 | ||
avec rRNA | opérons | 10 | 1 | 2 | 1 | 0 | 1 | 100 | 18 | 1 | 0 | ||
16atcgca235 | 1 | 20 | 3 | 50 | 5 | 40 | 200 | 29 | 30 | 0 | |||
Id-23s°-atgf | 1 | 40 | 4 | 4 | 100 | 22 | 80 | 300 | 26 | 60 | 3 | ||
1623s°5atgf | 1 | 60 | 1 | 150 | 29 | 120 | 400 | 20 | 90 | 10 | |||
max a | 3 | 80 | 1 | 200 | 18 | 160 | 500 | 7 | 120 | 9 | |||
a doubles | 0 | 100 | 1 | 250 | 18 | 200 | 600 | 6 | 150 | 8 | |||
autres | 7 | 120 | 1 | 300 | 3 | 240 | 700 | 9 | 180 | 13 | |||
total aas | 10 | 140 | 1 | 350 | 5 | 280 | 800 | 2 | 210 | 9 | |||
sans | opérons | 51 | 160 | 0 | 400 | 7 | 320 | 900 | 1 | 240 | 6 | ||
1 aa | 39 | 180 | 1 | 450 | 2 | 360 | 1000 | 1 | 270 | 8 | |||
max a | 5 | 200 | 0 | 500 | 6 | 400 | 1100 | 0 | 300 | 7 | |||
a doubles | 5 | 2 | 10 | 2 | 48 | ||||||||
total aas | 67 | 17 | 4 | 125 | 0 | 121 | 121 | ||||||
total aas | |||||||||||||
remarques | 3 | ||||||||||||
avec jaune | moyenne | 71 | 31 | 221 | 308 | ||||||||
variance | 72 | 1 | 168 | 230 | |||||||||
sans jaune | moyenne | 151 | 242 | 166 | |||||||||
variance | 72 | 137 | 72 |
abs tRNA-cds[modifier | modifier le wikicode]
- Note: intercalaires prélevés de la colonne cds de abs opérons dans un bloc de tRNAs uniquement. Le début du bloc est dans l'ordre des adresses, deb intercalaire entre le cds et le 1er tRNA dd bloc, fin entre le dernier tRNA et le cds terminal. J'ai procédé, dans les colonnes petit et grand, à la réorientation des blocs d'après la constatation que les blocs à rRNA ont leurs cds de début et de fin sont orientés du cds-16s au 5s-tRNAs-cds, l'intercalaire cds-16s étant plus grands que l'intercalaire avec le cds terminal. En tête de colonne est le % du nombre des intercalaires inférieurs à 201 pbs.
abs 63 69 44 88 deb fin deb fin grand petit grand petit 5 145 210 32 79 49 145 5 10 442 114 35 81 79 442 10 60 175 79 49 92 68 210 32 69 152 453 52 102 95 114 35 74 148 92 68 114 35 79 49 79 81 170 77 134 125 453 52 79 49 209 79 135 84 175 60 81 144 301 79 135 107 92 68 84 135 79 81 136 109 152 69 85 140 173 91 137 91 148 74 86 309 208 96 140 85 170 77 91 137 95 102 144 81 81 79 92 68 234 106 145 5 209 79 95 102 365 118 148 74 301 79 98 178 229 123 152 69 144 81 105 344 134 125 154 153 135 84 107 135 338 129 162 140 140 85 109 136 84 135 169 141 309 86 114 35 107 135 170 77 137 91 116 257 109 136 173 91 173 91 123 234 91 137 175 60 102 95 131 354 211 137 178 98 208 96 134 125 85 140 192 162 178 98 140 162 206 140 202 193 344 105 154 153 169 141 205 143 234 106 163 670 205 143 206 140 135 107 165 231 81 144 208 96 136 109 169 141 5 145 209 79 257 116 170 77 74 148 210 32 365 118 173 91 69 152 211 137 229 123 192 162 154 153 217 210 234 123 193 202 140 162 229 123 134 125 200 746 192 162 231 165 338 129 205 143 60 175 234 106 354 131 206 140 392 175 234 123 211 137 208 96 98 178 257 116 162 140 209 79 193 202 298 238 206 140 210 217 210 217 301 79 169 141 210 32 165 231 309 86 205 143 211 137 123 234 338 129 154 153 229 123 298 238 344 105 192 162 234 106 397 249 351 245 670 163 245 351 116 257 354 131 231 165 298 238 86 309 358 318 392 175 301 79 358 318 365 118 202 193 338 129 105 344 392 175 746 200 358 318 245 351 397 249 217 210 365 118 131 354 442 10 298 238 392 175 10 442 453 52 351 245 397 249 529 480 529 480 397 249 453 52 163 670 670 163 358 318 529 480 200 746 746 200 529 480
- Comparaison cds-cds tRNA-cds: deb fin, c'est l'ordre des adresses et grand petit l'ordre après réorientation. Leur pourcentage est calculé par rapport à la colonne, c'est à dire la moitié du total des tRNA-cds.
alpha cds total total <0 0-200 201-370 371-600 >600 deb fin grand petit abs 6,817 104 69 27 6 2 33 36 23 46 ‰ 663 260 58 19 635 692 442 885
abs blocs[modifier | modifier le wikicode]
abs blocs abrégé[modifier | modifier le wikicode]
- Lien tableur: abs blocs abrégé
- Note:
- - hp pour hypothetical protein
- - p- pour pseudo, par exemple p-elon en abrégé donne p-elongation factor Tu.
abrégé | nom |
---|---|
23s RlmB | 23S rRNA (guanosine(2251)-2'-O)-methyltransferase RlmB |
50s L21 | 50S ribosomal protein L21 |
AAA fam | AAA family ATPase |
ab hydrolase | alpha/beta hydrolase |
ab hydrolase f | alpha/beta hydrolase fold domain-containing protein |
AG cyclase | adenylate/guanylate cyclase domain-containing protein |
ak reductase | aldo/keto reductase |
ATP bind | ATP-binding cassette domain-containing protein |
bacteriofer | bacterioferritin |
bif CoA | bifunctional acetaldehyde-CoA/alcohol dehydrogenase |
bif NAD | bifunctional ADP-dependent NAD(P)H-hydrate dehydratase/NAD(P)H-hydrate epimerase |
chemotaxis p | methyl-accepting chemotaxis protein |
cupin dom | cupin domain-containing protein |
cyclicN bind | cyclic nucleotide-binding domain-containing protein |
diG cyclase | diguanylate cyclase |
dip ABC | dipeptide ABC transporter ATP-binding protein |
disulfide | disulfide bond formation protein B |
DMT fam | DMT family transporter |
DUF1489 | DUF1489 domain-containing protein |
DUF2141 | DUF2141 domain-containing protein |
DUF3108 | DUF3108 domain-containing protein |
DUF3618 | DUF3618 domain-containing protein |
EAL & GGDEF | EAL and GGDEF domain-containing protein |
elonga Tu | elongation factor Tu |
ETC complex | ETC complex I subunit |
exo SbcD | exonuclease subunit SbcD |
FAD bind | FAD-binding oxidoreductase |
FadR fam | FadR family transcriptional regulator |
farnesyl | farnesyltranstransferase |
fucosyl | alpha-1,3-fucosyltransferase |
GGDEF dom | GGDEF domain-containing protein |
glycosyl | glycosyltransferase |
GNAT fam | GNAT family N-acetyltransferase |
gyrase YacG | DNA gyrase inhibitor YacG |
Hase HypA | hydrogenase maturation nickel metallochaperone HypA |
helicas RecQ | DNA helicase RecQ |
HU bind | HU family DNA-binding protein |
Hx-t-Hx | helix-turn-helix transcriptional regulator |
Hx-t-Hx dom | helix-turn-helix domain-containing protein |
IclR fam | IclR family transcriptional regulator |
inorganic P | inorganic phosphate transporter |
IS3 fam | IS3 family transposase |
IS5 fam | IS5 family transposase |
L-iso-Asp | protein-L-isoaspartate O-methyltransferase |
lipoyl LipB | lipoyl(octanoyl) transferase LipB |
low Thr | low specificity L-threonine aldolase |
lytic dom | lytic transglycosylase domain-containing protein |
malate G | malate synthase G |
malonyl CoA | malonyl-CoA decarboxylase |
MaoC fam | MaoC family dehydratase |
MarR fam | MarR family transcriptional regulator |
mecano ion | mechanosensitive ion channel |
membrane p | membrane protein |
menaquinone | dimethylmenaquinone methyltransferase |
MerR fam | MerR family transcriptional regulator |
methyl trans | methyltransferase domain-containing protein |
N-acetyl trans | N-acetyltransferase |
N-formyl Glu | N-formylglutamate amidohydrolase |
NAD diP | NAD(+) diphosphatase |
NADH-quinone | NADH-quinone oxidoreductase subunit A |
NDUFA9 | complex I NDUFA9 subunit family protein |
NERD dom | NERD domain-containing protein |
nitrogen NifQ | nitrogen fixation protein NifQ |
non ribosom | non-ribosomal peptide synthetase |
osmose LipB | osmotically-inducible lipoprotein B |
p-ATP-bind | p-ATP-binding protein |
p-erythrose | p-erythrose-4-phosphate dehydrogenase |
P-II nitrogen | P-II family nitrogen regulator |
p-IS5/IS1182 | P-IS5/IS1182 family transposase |
p-low Thr | p-low specificity L-threonine aldolase |
p-ssDNA exo | p-single-stranded-DNA-specific exonuclease RecJ |
pantetheine | pantetheine-phosphate adenylyltransferase |
PAP2 fam | phosphatase PAP2 family protein |
PAS dom | PAS domain-containing protein |
PAS kinase | PAS domain-containing sensor histidine kinase |
PAS S-box | PAS domain S-box protein |
peptido fam | peptidoglycan DD-metalloendopeptidase family protein |
peptido Pal | peptidoglycan-associated lipoprotein Pal |
polymerase | RNA-directed DNA polymerase |
polysacchard | polysaccharide biosynthesis protein |
Ppx/GppA | Ppx/GppA family phosphatase |
PQQ | PQQ-dependent sugar dehydrogenase |
Prolyl-tRNA | prolyl-tRNA synthetase associated domain-containing protein |
pyridoxamine | pyridoxamine 5'-phosphate oxidase |
pyruvate kin | pyruvate kinase |
recombinase | recombinase family protein |
response reg | response regulator |
restriction end | restriction endonuclease |
ribonucleaseD | ribonuclease D |
RraA fam | RraA family protein |
SDR fam | SDR family NAD(P)-dependent oxidoreductase |
sigma RpoD | RNA polymerase sigma factor RpoD |
sigma-70 fam | sigma-70 family RNA polymerase sigma factor |
SLT dom | transglycosylase SLT domain-containing protein |
ss integrase | site-specific integrase |
Ss-DNA | single-stranded-DNA-specific exonuclease RecJ |
STAS dom | STAS domain-containing protein |
subunit SecE | preprotein translocase subunit SecE |
tetratricopep | tetratricopeptide repeat protein |
TIGR02300 | TIGR02300 family protein |
trigger factor | trigger factor |
tRNA MnmA | tRNA 2-thiouridine(34) synthase MnmA |
Tyr rec/int | tyrosine-type recombinase/integrase |
UDP-N-acetyl | UDP-N-acetylglucosamine 4,6-dehydratase (inverting) |
xanthine | xanthine phosphoribosyltransferase |
YggT fam | YggT family protein |
YkgJ fam | YkgJ family cysteine cluster protein |
abs blocs tableau[modifier | modifier le wikicode]
- Lien tableur: abs blocs tableau
- Légende: lien au tableau des protéines, abrégé
- - vert: la taille des rRNAs en pbs alors que les protéines (cds) sont en aas.
- Note: 10 cds < 259 sur 20 dont 2 hp + 1 p
gène | inter | long | abrégé | gène | inter | long | abrégé | gène | inter | long | abrégé |
---|---|---|---|---|---|---|---|---|---|---|---|
cds | 486 | 419 | SbcD | cds | 100 | 146 | P-eryt | cds | 675 | 153 | MarR |
16s | 110 | 1491 | 16s° | 110 | 707 | 16s | 107 | 1491 | |||
atc | 30 | atc | 32 | atc | 31 | ||||||
gca | 271 | gca | 272 | gca | 271 | ||||||
23s | 127 | 2753 | 23s | 123 | 2753 | 23s | 147 | 2753 | |||
5s | 153 | 116 | 5s | 244 | 116 | cds | 369 | GNAT | |||
cds | 79 | hp | cds | 97 | YkgJ | ||||||
cds | 457 | 143 | DUF1489 | ||||||||
16s | 110 | 1491 | |||||||||
atc | 31 | ||||||||||
gca | 269 | ||||||||||
23s° | 100 | 1380 | |||||||||
23s° | 123 | 530 | |||||||||
5s | 100 | 116 | |||||||||
atgf | 706 | ||||||||||
cds | 473 | pyruvat | |||||||||
cds | 465 | 259 | IclR | cds | 502 | 65 | hp | cds | 495 | 235 | PAP2 |
16s | 584 | 1486 | 16s° | 106 | 372 | 16s' | 189 | 1084 | |||
23s° | 128 | 767 | 23s° | 129 | 649 | 23s° | 127 | 678 | |||
5s | 101 | 116 | 5s | 281 | 116 | 5s | 153 | v116 | |||
atgf | 359 | cds | 387 | PQQ | cds | 625 | GGDEF | ||||
cds | 1110 | NERD | |||||||||
cds | 775 | 1328 | non-rib | cds | 738 | 448 | peptido | cds | 249 | 209 | pyridox |
16s° | 100 | 389 | 16s° | 193 | 16s° | 547 | 558 | ||||
16s° | 522 | 671 | atgf | 437 | cds | 328 | lytic | ||||
cds | 160 | DUF2141 | cds | 637 | PAS |
abs abq blocs[modifier | modifier le wikicode]
- Lien tableur: abs abq blocs
- Légende: lien au tableau des protéines, abs abq blocs abrégé
- - vert: la taille des rRNAs en pbs alors qu'en clair les protéines (cdsa) sont en aas.
- - 16s° 16s' 23s°
- - comp: complement, le cds a changé de brin. Cela ressemble à une recombinaison. Exemple CHA1
- - hp caracter: hypothetical protein caractérisée. Le cds est, dans un génome hypothétique, alors que dans l'autre il est caractérisé,tout en ayant à peu près même taille et même intercalaire. Exemple CHA
- - modif: le cds a le même nom mais la taille est légèrement modifiée, ou bien le nom est modifié et nom et intercalaire sont les mêmes. Exemple CHA CHC
- - déplacé: Le cds est déplacé avec son rRNA, tout en conservant taille et intercalaire. Exemple le pavé après CHE
- - d’où?: je ne peux pas savoir de quel bloc à rRNAs, il vient. Exemple le pavé après CHE
- - recomb: En bordure un changement net du cds est du à la recombinaison d'un pavé de clusters. Exemple CHC
- - recombi: à l'intérieur, un changement net de cds est du à un déplacement ou à une recombinaison interne. Exemple CHC
- - insertion: C'est le cas typique du bloc à rRNAs incomplet qui lui manque 5s et atcgca dans abq. Exemple PL1G
- - bloc?: cela vient de quel bloc à rRNA? Exemple PL1I
- - réunion: 2 déplacés réunis. Exemple PL1I, réunion de bloc? et où?.
- Notes:
- - PL1G
- - disparition des atc et gca internes non retrouvés dans les blocs aas
- - Les 5s ne sont pas abimés mais 2 disparaissent
- - Les atgf disparaissent aussi
- - Les 23s, 2 de perdus et 4 de modifiés et perdent leur 5s et 5satgf au contraire de rpm
- - Les 16s, aucun perdu, 4 modifiés s° et 1 modifié s'.
- - Les blocs rRNAs modifiés restent sur place.
|
|
abs remarques[modifier | modifier le wikicode]
- Remarques:
- - Les remarques de abq qui ne changent pas: les intercalaires élevés avec les cds, les intercalaires entre aas (@2) et les séquences des doubles. La phylogénie étroite entre les 2 souches explique cette étroite ressemblance en tout cas pour les intercalaires et les doubles, mais pas pour les blocs à rRNAs.
- - Le tableau des intercalaires et des doubles ci-dessous met en parallèle ces 3 remarques.
- - Les remarques qui changent fondamentalement: ce sont les blocs à rRNAs (@1) et les plasmides (@3). J’ai fait une comparaison détaillée entre les 2 génomes dans abs abq blocs. Elle montre 2 processus distincts:
- Le processus de recombinaison qui explique l’ordre des blocs et le changement de certains cds.
- Le processus de conversion génique qui, en grande partie, a détruit partiellement les rRNAs 16s et 23s et non les 5s. Cependant un 5s a disparu en laissant son atgf. D’après la majorité des cds identiques entre abs et abq et qui sont attachés à ces blocs, les rRNas modifiés restent sur place.
- Tableau des intercalaires et des doubles
abs intercalaires aas abs intercalaires cds abs intercalaires cds adresse aas adresse rRNA adresse aas 1825516 aac-tgc 219 2168164 16s° 775 365702 cag 746 2562333 ccg-ccg 205 199382 16s° 738 17144 ggc 670 1512123 gta-gac 163 1582956 atgf 706 272620 tgg 529-480 isolé 2033754 gtg-gtg 132 913480 16s 675 1397194 agc 453 1501449 cac-cac 109 503917 16s° 547 1809249 aga 442 631460 gcg-gac 99 2168653 16s° 522 2373488 aag-aag 74 403509 16s° 502 atgj 354 538069 16s’ 495 ctc 257 913480 16s 486 ggg 114 450804 16s 465 1578553 16s 457 cag abq 246 200147 atgf 437 abq intercalaires entre aas abq intercalaires cds abq intercalaires cds 1370697 aac-tgc 220 810890 atgf 870 2641475 ggc 688 616472 ccg-ccg 206 1431525 16s 779 2766227 ggg 659 1723802 gac-gta 164 120008 16s 740 1997840 atgj 595 1165208 gtg-gtg 132 1354091 16s 676 972026 agc 493 1735337 cac-cac 109 510548 16s 615 1725057 ctc 475 1443296 gcg-gac 99 404350 16s 502 86421 ggc 455 796280 aag-aag 76 2787506 16s 496 1354448 aga 443 302206 16s 472 52318 tgg 481-363 814616 16s 452 2304295 tta 414-406 isolé 1570334 16s 444 intercalaires supérieurs à 500 pbs. agr oan abq abs 16s 2 4 6 7 aas 6 12 3 3 max 16s 633 998 870 775 max aas 793 1650 688 746 Doubles abs Doubles abq aas n doublets aas n doublets 1 39 ccg 1 38 ccg 2 10 aag 2 11 aag 3 1 gag 3 1 gag 4 gtg 4 gtg 5 1 cac 5 1 cac
abs distribution[modifier | modifier le wikicode]
- Lien tableur: abs distribution
- Notes
aag2 cac2 ccg2 gag2 gtg2 ggc: 3 1aa et 1 >1aa
g1 | t1 | ||||||
---|---|---|---|---|---|---|---|
atgi | 1 | tct | tat | atgf | 4 | ||
att | act | aat | agt | ||||
ctt | cct | cat | cgc | ||||
gtt | gct | gat | ggt | ||||
ttc | 2 | tcc | 1 | tac | 2 | tgc | 1 |
atc | 4 | acc | 2 | aac | 3 | agc | 1 |
ctc | 2 | ccc | 1 | cac | 2 | cgt | 2 |
gtc | 2 | gcc | 3 | gac | 4 | ggc | 4 |
tta | 1 | tca | 1 | taa | tga | ||
ata | aca | 1 | aaa | 1 | aga | 1 | |
cta | 1 | cca | 1 | caa | 1 | cga | |
gta | 1 | gca | 4 | gaa | 1 | gga | 1 |
ttg | 1 | tcg | 1 | tag | tgg | 2 | |
atgj | 1 | acg | 1 | aag | 2 | agg | 1 |
ctg | 3 | ccg | 2 | cag | 2 | cgg | 1 |
gtg | 2 | gcg | 2 | gag | 2 | ggg | 1 |
alpha | >1aa | =1aa | -5s | +5s | -16s | +16s | total |
abs | 30 | 39 | 3 | 8 | 80 |
abs. Intergen51[modifier | modifier le wikicode]
Intergen51. abs. Le génome[modifier | modifier le wikicode]
- abs Le prélèvement: Aalpha
- Le nom et le lien NCBI: abs, Azospirillum baldaniorum, NCBI [38], date 25.4.21.
- abs La longueur totale des intercalaires, longueur du génome et taux intercalaires/génome:
Nom intercals génome taux en % abs 363,304 3,023,440 12.0
abs données intercalaires[modifier | modifier le wikicode]
- Lien tableur: abs données intercalaires
- Lien sauvegarde NCBI: Aalpha
abs données intercalaires 200[modifier | modifier le wikicode]
- Lien tableur: données intercalaires 200.
abs autres intercalaires aas[modifier | modifier le wikicode]
- Lien tableur: abs autres intercalaires aas
- Lien sauvegarde NCBI: Aalpha
Intergen51. abs. Les différents types d'intercalaires[modifier | modifier le wikicode]
- Lien au tableur: Intergen51. abs les différents types d'intercalaires.
- Légende:
- - S pour intercalaire CDS-CDS et R pour tRNA-CDS,
- - c pour intercalaire continu (les 2 gènes sont sur le même brin) et x pour discontinu (les 2 gènes sont sur 2 brins différents, le brin et son complément)
- - %reste = 100*reste/total, le reste étant ce qui reste du total après la fin du diagramme, gamme.
- - %t30 = 100*t30/total, t30 étant le total des fréquences 10 20 30
- - %t5 = 100*t/total, t5 étant le total des fréquences de -1 à -5 dans le diagramme des S-.
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
Intergen51. abs. Les diagrammes CDS-CDS positifs[modifier | modifier le wikicode]
- Lien tableur: Les diagrammes
- Diagrammes des gamma: abs présente 2 diagrammes
- - fc40, CDS-CDS continu, fréquence unitaire en abscisses et effectif en ordonnées
- - fx%, CDS-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et pourcentage en ‰ par rapport au total, en ordonnées.
- Équations des courbes de tendance en pour 1000: colonnes %fx %fc
Courbes de tendances pour les diagrammes en pour 1000 Calculs des f.41 abs R2 x3 x2 x c Inflexion poly3 x c 0.750 -1.80E-06 1.34E-03 -3.91E-01 58.8 fx1 abscisse 235.5 197.1 0.883 -2.23E-06 1.96E-03 -6.44E-01 85.2 fc1 ordonnée 18.4 21.2 0.822 2.18E-06 -1.54E-03 2.33E-01 20.5 fx41 0.952 2.74E-06 -1.62E-03 1.23E-01 38.9 fc41
Intergen51. abs. Les CDS-CDS négatifs[modifier | modifier le wikicode]
Sous-totaux abs totale fréquence x- c- x- c- - 1 0 55 4 4140 - 2 1 0 85 11 - 3 0 0 3 12 - 4 3 194 717 10938 - 5 0 0 5 19 sp6 30 75 1642 8424 total 34 324 2,456 23,544 reste 3 11 264 420 s6 3 2 361 41 s7 7 15 321 1438 s8 17 47 696 6525 rappot s1-5 4/2/1 3.0 3.5 8.4 2.6 % / sp6 s6/sp6 10.0 2.7 22.0 0.5 s7/sp6 23.3 20.0 19.5 17.1 s8/sp6 56.7 62.7 42.4 77.5 reste/sp6 10.0 14.7 16.1 5.0 total s1-5 4 249 814 15120 % / total %s1-5 11.8 76.9 33.1 64.2 %sp6 88.2 23.1 66.9 35.8
Intergen51. abs. Les intercalaires des blocs[modifier | modifier le wikicode]
- Le détail
RNA-RNA c x CDS-RNA c x 23s 5s 1 CDS 16s 16s 23s 5s CDS 1 1 16s tRNA 16 CDS tRNA 23s 1 CDS 5s 5s tRNA 23s CDS tRNA in CDS 23s tRNA contig 1 5s 16s tRNA hors 9 16s16s tRNA 16s 23s tRNA tRNA 5s 16s 5s 5s 23s 5s 5s total 12 0 total 1 1
- Les rares voir gamma pour la longueur des intercalaires
- Les tRNA-CDS compris, comparaison dans le clade et dans l'étude.
Intergen51. abs. Les intercalaires tRNA-tRNA extra bloc[modifier | modifier le wikicode]
- Lien tableur: Intergen51. abs. Les intercalaires tRNA-tRNA extra bloc
- voir les répétitions dans rpm
absp. Intergen51[modifier | modifier le wikicode]
Intergen51. absp. Le génome[modifier | modifier le wikicode]
- absp Le prélèvement: Aalpha
- Le nom et le lien NCBI: absp, Azospirillum baldaniorum plasmid AZOBR_p1, NCBI [39], date 11.4.22.
- absp La longueur totale des intercalaires, longueur du génome et taux intercalaires/génome:
Nom intercals génome taux en % absp 211,208 1,766,028 12.0
absp données intercalaires[modifier | modifier le wikicode]
- Lien tableur: absp données intercalaires
- Lien sauvegarde NCBI: Aalpha
absp données intercalaires 200[modifier | modifier le wikicode]
- Lien tableur: données intercalaires 200.
absp autres intercalaires aas[modifier | modifier le wikicode]
- Lien tableur: absp autres intercalaires aas
- Lien sauvegarde NCBI: Aalpha
Intergen51. absp. Les différents types d'intercalaires[modifier | modifier le wikicode]
- Lien au tableur: Intergen51. absp les différents types d'intercalaires.
- Légende:
- - S pour intercalaire CDS-CDS et R pour tRNA-CDS,
- - c pour intercalaire continu (les 2 gènes sont sur le même brin) et x pour discontinu (les 2 gènes sont sur 2 brins différents, le brin et son complément)
- - %reste = 100*reste/total, le reste étant ce qui reste du total après la fin du diagramme, gamme.
- - %t30 = 100*t30/total, t30 étant le total des fréquences 10 20 30
- - %t5 = 100*t/total, t5 étant le total des fréquences de -1 à -5 dans le diagramme des S-.
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
Intergen51. absp. Les diagrammes CDS-CDS positifs[modifier | modifier le wikicode]
- Lien tableur: Les diagrammes
- Diagrammes des gamma: absp présente 2 diagrammes
- - fc40, CDS-CDS continu, fréquence unitaire en abscisses et effectif en ordonnées
- - fx%, CDS-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et pourcentage en ‰ par rapport au total, en ordonnées.
- Équations des courbes de tendance en pour 1000: colonnes %fx %fc
Courbes de tendances pour les diagrammes en pour 1000 Calculs des f.41 absp R2 x3 x2 x c Inflexion poly3 x c 0.660 -2.95E-06 2.02E-03 -4.99E-01 62.4 fx1 abscisse 260.6 168.6 0.899 -3.10E-06 2.57E-03 -7.65E-01 90.5 fc1 ordonnée 15.9 24.5 0.599 1.88E-06 -1.47E-03 2.52E-01 16.8 fx41 0.910 1.52E-06 -7.69E-04 -4.39E-02 46.5 fc41
Intergen51. absp. Les CDS-CDS négatifs[modifier | modifier le wikicode]
Sous-totaux absp totale fréquence x- c- x- c- - 1 0 26 4 4140 - 2 2 0 85 11 - 3 0 0 3 12 - 4 2 124 717 10938 - 5 0 0 5 19 sp6 21 56 1642 8424 total 25 206 2,456 23,544 reste 5 14 264 420 s6 1 0 361 41 s7 7 8 321 1438 s8 8 34 696 6525 rappot s1-5 4/2/1 1.0 4.8 8.4 2.6 % / sp6 s6/sp6 4.8 0.0 22.0 0.5 s7/sp6 33.3 14.3 19.5 17.1 s8/sp6 38.1 60.7 42.4 77.5 reste/sp6 23.8 25.0 16.1 5.0 total s1-5 4 150 814 15120 % / total %s1-5 16.0 72.8 33.1 64.2 %sp6 84.0 27.2 66.9 35.8
Intergen51. absp. Les intercalaires des blocs[modifier | modifier le wikicode]
- Le détail
RNA-RNA c x CDS-RNA c x 23s 5s 2 CDS 16s 1 2 16s 23s 5s CDS 1 16s tRNA 3 16 CDS tRNA 23s 3 CDS 5s 5s tRNA 1 23s CDS 1 tRNA in 3 CDS 23s tRNA contig 5s 16s tRNA hors 6 16s16s tRNA 16s 23s tRNA tRNA 5s 16s 5s 5s 23s 5s 5s total 18 0 total 1 4
- Les rares voir gamma pour la longueur des intercalaires
- Les tRNA-CDS compris, comparaison dans le clade et dans l'étude.
Intergen51. absp. Les intercalaires tRNA-tRNA extra bloc[modifier | modifier le wikicode]
- Lien tableur: Intergen51. absp. Les intercalaires tRNA-tRNA extra bloc
- voir les répétitions dans rpm
Agrobacterium sp. H13-3[modifier | modifier le wikicode]
agr opérons[modifier | modifier le wikicode]
- Lien tableur: agr opérons
- Liens: gtRNAdb [40], NCBI [41], génome [orgn]
- Phylogénie: Bacteria; Proteobacteria; Alphaproteobacteria; Rhizobiales; Rhizobiaceae; Rhizobium/Agrobacterium group; Agrobacterium.
- Légende: cdsa: cds aas, cdsd: cds dirigé
59.3%GC | 29.12.19 Paris | 58 | doubles | intercal | cds | aa | avec aa | cdsa | cdsd | protéines |
---|---|---|---|---|---|---|---|---|---|---|
chromosoml | ||||||||||
comp | 1064633..1065274 | cds | 296 | 296 | 214 | hp | ||||
1065571..1065655 | ttg | 266 | 266 | |||||||
1065922..1066437 | cds | 172 | disulfide bond formation protein B | |||||||
comp | 1178605..1179114 | cds | 256 | 256 | 170 | prolyl-tRNA synthetase associated domain-containing protein | ||||
1179371..1179445 | ggc | @1 | 793 | 793 | ||||||
comp | 1180239..1180315 | atgj | 135 | 135 | ||||||
comp | 1180451..1181647 | cds | 399 | tRNA 2-thiouridine(34) synthase MnmA | ||||||
comp | 1320644..1321006 | cds | 318 | 318 | 121 | hp | ||||
comp | 1321325..1321414 | tcg | 197 | 197 | ||||||
comp | 1321612..1322493 | cds | 294 | dihydrodipicolinate synthase family protein | ||||||
comp | 1361929..1362942 | cds | 554 | 554 | 338 | sugar ABC transporter substrate-binding protein | ||||
comp | 1363497..1363571 | gtc | 81 | 81 | ||||||
comp | 1363653..1364015 | cds | 121 | response regulator | ||||||
<comp | 1426814..1427137 | cds | 105 | 105 | 108 | hp | ||||
1427243..1428733 | 16s | 337 | 1491 | |||||||
1429071..1429147 | atc | 59 | 59 | |||||||
1429207..1429282 | gca | 146 | 146 | |||||||
<comp | 1429429..1429626 | cds | @2 | 241 | 241 | 66 | P-hp | |||
1429868..1432681 | 23s | 242 | 2814 | |||||||
1432924..1433038 | 5s | 257 | 115 | |||||||
1433296..1433372 | atgf | 311 | 311 | |||||||
1433684..1434118 | cds | 145 | acetyl-CoA carboxylase biotin carboxyl carrier protein subunit | |||||||
1503534..1504520 | cds | 122 | 122 | 329 | beta-ketoacyl-ACP synthase III | |||||
comp | 1504643..1504716 | cag | 123 | 123 | ||||||
comp | 1504840..1505277 | cds | 146 | Lrp/AsnC family transcriptional regulator | ||||||
1605356..1605856 | cds | 71 | 71 | 167 | hp | |||||
comp | 1605928..1606003 | gcc | 152 | 152 | ||||||
comp | 1606156..1606545 | cds | 130 | TIGR02300 family protein | ||||||
<comp | 1687683..1688015 | cds | 105 | 105 | 111 | hp | ||||
1688121..1689611 | 16s | 337 | 1491 | |||||||
1689949..1690025 | atc | 59 | 59 | |||||||
1690085..1690160 | gca | 146 | 146 | |||||||
<comp | 1690307..1690504 | cds | 241 | 241 | 66 | P-hp | ||||
1690746..1693559 | 23s | 242 | 2814 | |||||||
1693802..1693916 | 5s | 257 | 115 | |||||||
1694174..1694250 | atgf | 203 | 203 | |||||||
comp | 1694454..1694645 | cds | 64 | hp | ||||||
<comp | 2103153..2103404 | cds | 105 | 105 | 84 | P-hp | ||||
2103510..2105000 | 16s | 337 | 1491 | |||||||
2105338..2105414 | atc | 59 | 59 | |||||||
2105474..2105549 | gca | 146 | 146 | |||||||
<comp | 2105696..2105893 | cds | 241 | 241 | 66 | P-hp | ||||
2106135..2108948 | 23s | 242 | 2814 | |||||||
2109191..2109305 | 5s | 257 | 115 | |||||||
2109563..2109639 | atgf | 633 | 633 | |||||||
2110273..2110680 | cds | 136 | membrane protein | |||||||
chromosomc | ||||||||||
<comp | 56862..57137 | cds | 105 | 105 | 92 | P-hp | ||||
57243..58733 | 16s | 337 | 1491 | |||||||
59071..59147 | atc | 59 | 59 | |||||||
59207..59282 | gca | 146 | 146 | |||||||
<comp | 59429..59626 | cds | 241 | 241 | 66 | P-hp | ||||
59868..62681 | 23s | 242 | 2814 | |||||||
62924..63038 | 5s | 257 | 115 | |||||||
63296..63372 | atgf | 196 | 196 | |||||||
63569..65377 | cds | 603 | DNA helicase RecQ | |||||||
comp | 125821..127722 | cds | 287 | 287 | 634 | molecular chaperone DnaK | ||||
comp | 128010..128099 | tcc | 220 | 220 | ||||||
128320..128637 | cds | 106 | hp | |||||||
227621..228004 | cds | 240 | 240 | 128 | membrane protein | |||||
comp | 228245..228331 | ctg | 120 | 120 | ||||||
comp | 228452..228757 | cds | 102 | SelT/SelW/SelH family protein | ||||||
> | 378307..378396 | cds | 40 | 40 | 30 | P-hp | ||||
378437..378513 | cgt | 174 | 174 | |||||||
378688..379500 | cds | 271 | class I SAM-dependent methyltransferase | |||||||
comp | 407277..407435 | cds | 167 | 167 | 53 | YqaE/Pmp3 family membrane protein | ||||
comp | 407603..407678 | acg | 137 | 137 | ||||||
comp | 407816..408778 | cds | 321 | nitronate monooxygenase | ||||||
425990..427087 | cds | 56 | 56 | 366 | 2'-deoxycytidine 5'-triphosphate deaminase | |||||
427144..427217 | ggg | 154 | 154 | |||||||
427372..428058 | cds | 229 | aquaporin Z | |||||||
458659..459081 | cds | 285 | 285 | 141 | hp | |||||
459367..459442 | ttc | 246 | 246 | |||||||
comp | 459689..460033 | cds | 115 | cation:proton antiporter | ||||||
comp | 493759..494025 | cds | 155 | 155 | 89 | hp | ||||
494181..494255 | acc | 195 | 195 | |||||||
comp | 494451..495686 | cds | 412 | flagellin | ||||||
comp | 564938..568684 | cds | 361 | 361 | 1249 | PAS domain S-box protein | ||||
569046..569122 | cac | 79 | 79 | |||||||
569202..570920 | cds | 573 | Ppx/GppA family phosphatase | |||||||
comp | 763448..764356 | cds | 202 | 202 | 303 | MBL fold metallo-hydrolase | ||||
764559..764633 | caa | 263 | 263 | |||||||
comp | 764897..766549 | cds | 551 | malate dehydrogenase (quinone) | ||||||
comp | 767020..767439 | cds | 264 | 264 | 140 | hp | ||||
767704..767780 | ccg | 159 | 159 | |||||||
comp | 767940..768260 | cds | 107 | hp | ||||||
comp | 960360..960701 | cds | 163 | 163 | 114 | hp | ||||
960865..960955 | agc | 500 | 500 | |||||||
comp | 961456..961671 | cds | 72 | hp | ||||||
1123408..1124136 | cds | 141 | 141 | 243 | hp | |||||
1124278..1124363 | tta | 241 | 241 | |||||||
1124605..1127115 | cds | 837 | copper-translocating P-type ATPase | |||||||
1154411..1154803 | cds | 91 | 91 | 131 | DUF2934 domain-containing protein | |||||
comp | 1154895..1154969 | aac | 176 | 176 | ||||||
1155146..1155424 | cds | 93 | hp | |||||||
comp | 1162767..1163027 | cds | 138 | 138 | 87 | hp | ||||
comp | 1163166..1163242 | ccc | 218 | 218 | ||||||
1163461..1163997 | cds | 179 | DUF1269 domain-containing protein | |||||||
1192452..1194650 | cds | 660 | 660 | 733 | esterase-like activity of phytase family protein | |||||
comp | 1195311..1195386 | gta | + | 446 | 446 | |||||
1195833..1195909 | gac | 2 gac | 41 | 41 | ||||||
1195951..1196027 | gac | 435 | 435 | |||||||
1196463..1196828 | cds | 122 | NADH-quinone oxidoreductase subunit A | |||||||
1421863..1422201 | cds | 134 | 134 | 113 | hp | |||||
comp | 1422336..1422425 | tca | 88 | 88 | ||||||
comp | 1422514..1422678 | cds | 55 | hp | ||||||
comp | 1468229..1469110 | cds | 180 | 180 | 294 | HNH endonuclease | ||||
comp | 1469291..1469367 | atgf | 132 | 132 | ||||||
comp | 1469500..1470450 | cds | 317 | hp | ||||||
comp | 1508458..1508883 | cds | 558 | 558 | 142 | PAS domain-containing protein | ||||
comp | 1509442..1509526 | ctc | 189 | 189 | ||||||
1509716..1510447 | cds | 244 | lipoyl(octanoyl) transferase LipB | |||||||
1531160..1531933 | cds | 447 | 447 | 258 | amino acid ABC transporter ATP-binding protein | |||||
1532381..1532455 | gaa | 121 | 121 | |||||||
1532577..1532818 | cds | 89 | 89 | 81 | P-hp | |||||
1532908..1532982 | gaa | 129 | 129 | |||||||
comp | 1533112..1534920 | cds | 603 | single-stranded-DNA-specific exonuclease RecJ | ||||||
1584509..1584763 | cds | 155 | 155 | 85 | GlsB/YeaQ/YmgE family stress response membrane protein | |||||
1584919..1584994 | aag | 134 | 134 | |||||||
comp | 1585129..1585575 | cds | 149 | hp | ||||||
comp | 1612420..1613898 | cds | 240 | 240 | 493 | trigger factor | ||||
comp | 1614139..1614221 | cta | 447 | 447 | ||||||
< | 1614669..1614876 | cds | 69 | P-hp | ||||||
comp | 1672216..1672887 | cds | 245 | 245 | 224 | protein-L-isoaspartate O-methyltransferase | ||||
comp | 1673133..1673206 | tgc | 240 | 240 | ||||||
comp | 1673447..1673599 | cds | 51 | DUF3309 family protein | ||||||
comp | 1744688..1745434 | cds | 341 | 341 | 249 | cytochrome c biogenesis protein CcdA | ||||
1745776..1745851 | aaa | 310 | 310 | |||||||
1746162..1746743 | cds | 194 | DUF1003 domain-containing protein | |||||||
comp | 1770727..1772280 | cds | 91 | 91 | 518 | tyrosine-type recombinase/integrase | ||||
comp | 1772372..1772448 | cca | 265 | 265 | ||||||
1772714..1773019 | cds | 51 | 51 | 102 | ETC complex I subunit | |||||
1773071..1773147 | aga | 7 | 7 | |||||||
comp | 1773155..1773892 | cds | 246 | DUF429 domain-containing protein | ||||||
comp | 1902337..1902537 | cds | 184 | 184 | 67 | preprotein translocase subunit SecE | ||||
comp | 1902722..1902797 | tgg | 241 | 241 | ||||||
comp | 1903039..1903845 | cds | 269 | glycosyltransferase | ||||||
1908698..1908892 | cds | 70 | 70 | 65 | hp | |||||
comp | 1908963..1909036 | gga | 26 | 26 | 26 | |||||
comp | 1909063..1909147 | tac | 209 | 209 | ||||||
1909357..1910244 | cds | 296 | 23s rRNA (guanosine(2251)-2'-O)-methyltransferase RlmB | |||||||
1922447..1922800 | cds | 55 | 55 | 118 | hp | |||||
comp | 1922856..1922931 | aca | 207 | 207 | ||||||
1923139..1924878 | cds | 580 | GGDEF domain-containing protein | |||||||
2079925..2080287 | cds | 156 | 156 | 121 | hp | |||||
comp | 2080444..2080519 | atgi | 178 | 178 | ||||||
2080698..2081441 | cds | 248 | SIMPL domain-containing protein | |||||||
comp | 2275632..2276138 | cds | 522 | 522 | 169 | winged helix-turn-helix transcriptional regulator | ||||
2276661..2276737 | cgg | 287 | 287 | |||||||
2277025..2277264 | cds | 80 | hp | |||||||
comp | 2388300..2388497 | cds | 87 | 87 | 66 | hp | ||||
2388585..2388659 | ggc | 361 | 361 | |||||||
2389021..2391024 | cds | 668 | methyl-accepting chemotaxis protein | |||||||
comp | 2490745..2491854 | cds | 535 | 535 | 370 | 2Fe-2S iron-sulfur cluster binding domain-containing protein | ||||
comp | 2492390..2492466 | atgf | 287 | 115 | ||||||
comp | 2492754..2492868 | 5s | 242 | 2814 | ||||||
comp | 2493111..2495924 | 23s | 241 | 241 | ||||||
> | 2496166..2496363 | cds | 146 | 146 | 66 | P-hp | ||||
comp | 2496510..2496585 | gca | 59 | 59 | ||||||
comp | 2496645..2496721 | atc | 337 | |||||||
comp | 2497059..2498549 | 16s | 105 | 105 | 1491 | |||||
> | 2498655..2498930 | cds | 92 | P-hp |
agr cumuls[modifier | modifier le wikicode]
- Lien tableur: agr cumuls
opérons | Fréquences intercalaires tRNAs | Fréquences intercalaires cds | Fréquences aas cds chromosome | ||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
effectif | gammes | sans rRNAs | avec rRNAs | gammes | cds | gammes | cdsd | gammes | cdsa | gammes | cdsa 300 | ||
avec rRNA | opérons | 5 | 1 | 1 | 0 | 1 | 100 | 24 | 1 | 0 | |||
16atcgca235 | 0 | 20 | 50 | 3 | 40 | 200 | 30 | 30 | 1 | ||||
Id-atgf | 5 | 40 | 1 | 100 | 12 | 80 | 300 | 14 | 60 | 3 | |||
16s23s | 0 | 60 | 1 | 5 | 150 | 22 | 120 | 400 | 8 | 90 | 17 | ||
max a | 3 | 80 | 200 | 17 | 160 | 500 | 2 | 120 | 13 | ||||
a doubles | 0 | 100 | 250 | 18 | 200 | 600 | 4 | 150 | 14 | ||||
spéciaux | 0 | 120 | 300 | 9 | 240 | 700 | 4 | 180 | 5 | ||||
total aas | 15 | 140 | 350 | 4 | 280 | 800 | 1 | 210 | 1 | ||||
sans | opérons | 38 | 160 | 400 | 2 | 320 | 900 | 1 | 240 | 3 | |||
1 aa | 35 | 180 | 450 | 3 | 360 | 1000 | 0 | 270 | 7 | ||||
max a | 3 | 200 | 500 | 1 | 400 | 1100 | 0 | 300 | 4 | ||||
a doubles | 1 | 2 | 6 | 1 | 21 | ||||||||
total aas | 42 | 4 | 5 | 97 | 0 | 89 | 89 | ||||||
total aas | 57 | ||||||||||||
remarques | 2 | ||||||||||||
avec jaune | moyenne | 59 | 213 | 230 | |||||||||
variance | 0 | 134 | 209 | ||||||||||
sans jaune | moyenne | 33 | 172 | 185 | 137 | ||||||||
variance | 76 | 131 | 71 |
agr tRNA-cds[modifier | modifier le wikicode]
- Note: intercalaires prélevés de la colonne cds de agr opérons dans un bloc de tRNAs uniquement. Le début du bloc est dans l'ordre des adresses, deb intercalaire entre le cds et le 1er tRNA dd bloc, fin entre le dernier tRNA et le cds terminal. J'ai procédé, dans les colonnes petit et grand, à la réorientation des blocs d'après la constatation que les blocs à rRNA ont leurs cds de début et de fin sont orientés du cds-16s au 5s-tRNAs-cds, l'intercalaire cds-16s étant plus grands que l'intercalaire avec le cds terminal. En tête de colonne est le % du nombre des intercalaires inférieurs à 201 pbs.
agr 55 55 34 76 deb fin deb fin grand petit grand petit 40 174 51 7 51 7 51 7 51 7 361 79 123 122 174 40 55 207 554 81 129 89 207 55 56 154 134 88 134 88 154 56 70 209 240 120 152 71 209 70 71 152 447 121 154 56 152 71 87 361 122 123 155 134 361 79 89 129 89 129 167 137 554 81 91 176 180 132 174 40 361 87 91 265 155 134 176 91 134 88 122 123 256 135 178 156 129 89 134 88 167 137 180 132 176 91 138 218 71 152 195 155 265 91 141 241 56 154 207 55 240 120 155 195 264 159 209 70 447 121 155 134 40 174 218 138 123 122 156 178 91 176 240 120 180 132 163 500 156 178 241 141 155 134 167 137 558 189 241 184 256 135 180 132 155 195 245 240 167 137 184 241 318 197 256 135 218 138 202 263 55 207 263 202 241 141 240 120 70 209 264 159 195 155 240 447 138 218 265 91 178 156 245 240 287 220 285 246 264 159 256 135 245 240 287 220 500 163 264 159 141 241 296 266 241 184 285 246 184 241 318 197 558 189 287 220 285 246 341 310 318 197 296 266 202 263 361 79 263 202 318 197 91 265 361 87 287 220 341 310 296 266 447 121 245 240 361 79 522 287 447 240 447 240 447 121 341 310 500 163 285 246 522 287 87 361 522 287 296 266 554 81 660 435 554 81 522 287 558 189 240 447 558 189 341 310 660 435 163 500 660 435 660 435
- Comparaison cds-cds tRNA-cds: deb fin, c'est l'ordre des adresses et grand petit l'ordre après réorientation. Leur pourcentage est calculé par rapport à la colonne, c'est à dire la moitié du total des tRNA-cds.
alpha cds total total <0 0-200 201-370 371-600 >600 deb fin grand petit agr 5,159 76 42 26 7 1 21 21 13 29 ‰ 553 342 92 13 553 553 342 763
agr blocs[modifier | modifier le wikicode]
- Lien tableur: agr blocs
- Légende:
- CoA acetyl-CoA carboxylase biotin carboxyl carrier protein subunit
- helicase DNA helicase RecQ
- 2Fe-2S 2Fe-2S iron-sulfur cluster binding domain-containing protein
- membrane membrane protein
- hp hypothetical protein
- p-hp pseudo hp
chromomel | intercal | cdsa | intercal | cdsa | intercal | cdsa | |||
---|---|---|---|---|---|---|---|---|---|
cds | 105 | 108 | hp | 105 | 111 | hp | 105 | 84 | P-hp |
16s | 337 | 1491 | 337 | 1491 | 337 | 1491 | |||
atc | 59 | 59 | 59 | ||||||
gca | 146 | 146 | 146 | ||||||
cds | 241 | 66 | P-hp | 241 | 66 | P-hp | 241 | 66 | P-hp |
23s | 242 | 2814 | 242 | 2814 | 242 | 2814 | |||
5s | 257 | 115 | 257 | 115 | 257 | 115 | |||
atgf | 311 | 203 | 633 | ||||||
cds | 145 | CoA | 64 | hp | 136 | membrane | |||
chromosomec | |||||||||
cds | 105 | 92 | P-hp | 105 | 92 | P-hp | |||
16s | 337 | 1491 | 337 | 1491 | |||||
atc | 59 | 59 | |||||||
gca | 146 | 146 | |||||||
cds | 241 | 66 | P-hp | 241 | 66 | P-hp | |||
23s | 242 | 2814 | 242 | 2814 | |||||
5s | 257 | 115 | 287 | 115 | |||||
atgf | 196 | 535 | |||||||
cds | 603 | helicase | 370 | 2Fe-2S |
agr remarques[modifier | modifier le wikicode]
- Remarques
- @: Par rapport aux rickettsia rtb et rpl, les intercalaires élevés sont rares et faibles, 6 sur 38 aas sont entre 500 et 793. Voir tableau ci-dessous.
- - un seul aa isolé, gta , 660-446.
- - 2 intercalaires élevés entre 2 aas, ggc-atgi 793 et gta-gac 446. Le 1er est du même ordre que celui de rtb et rpl, 1051 830.
- - Les intercalaires entre aas: Il y en a quatre comme les rickettsia, 793 446 41 26. Les 2 petits sont proches de la moyenne de cette étude de 15 pbs.
- - Les intercalaires avec un cds. Ils sont très faibles sur les 38 aas un seul atteint 660 pbs les autres élevés se répartissent en 4 entre 500-558 et 3 entre 435-447. Ces valeurs sont analogues à ceux des blocs à rRNA, 535 et 633 tout à fait courants dans le haut de gamme de cette étude. Les 30 aas restants ont des intercalaires cds inférieurs à 400 dont 3 seulement dépassent les 300, cac aaa ggc.
- @ Les cds dans les blocs à rRNAs. Voir agr blocs.
- - Les 5 blocs sont identiques qu’ils soient sur le chromosome linéaire ou circulaire. C’est comme une duplication répétée 5 fois.
- - Le cds interne a toutes les caractéristiques d’un candidat à la création: interne, hypothétique et petit. La caractéristique pseudo est encore un indice très fort de la genèse, la séquence acquiera plus tard le codon initial et le codon stop ou tout autre complément imposé par le système de réparation contraint par l’évolution de l’environnement du génome.
- - On retrouve la situation du génome oan, avec un p-hp de 63 aas contre 66 ici. Ces 2 génomes se ressemblent beaucoup,
- + DNAa total identique oan et agr 4,8 mega, 2 chromosomes dont 1 linéaire pour agr. Tous les blocs se terminent par atgf et sont complets.
- + Beaucoup de cds hp externes.
- - Chez agr, 5 hp dont 3 p-hp au-dessus de 16s de la même taille que le p-hp interne. Ils se comportent comme lui, quasimment même petite taille et des intercalaires identiques de 105 pbs. Ces 10 cds font partie intégrante du processus de réparation ou de conversion qui a créé les 5 blocs. Après 5s 3 cds de petites tailles dont un hpcomme ceux au-dessus du 16s. Donc 2 cds bien caractérisés se comportant comme le p-hp interne candidat à la création. Cependant ces 3 cds apparemment ne font pas partie intégrante du processus de conversion puisque leurs intercalaires avec atgf varient beaucoup de 203 à 633, comme les 2 restant.
- - Chez oan seulement 2 cds de 57 aas sur un total de 8 cds. Ils sont bien caractérisés.
- - La question qui se pose alors est : est-ce que ces 10 cds analogues aux internes peuvent ils être des candidats à la création?
- - Note du 4.10.20: les 5 cds disparaissent dans NCBI du 12.4.20, après contrôle.
- @: Par rapport aux rickettsia rtb et rpl, les intercalaires élevés sont rares et faibles, 6 sur 38 aas sont entre 500 et 793. Voir tableau ci-dessous.
- Séquence des doubles: très peu de doubles, 1 doublets pour 38 opérons à aas.
- Tableau des intercalaires élevés
aas adresse pbs note ggc 1179371 793 aa-aa gta 1195311 660-446 isolé ctc 1509442 558 gtc 1363497 554 cgg 2276661 522 agc 960865 500 gaa 1532381 447 cta 1614139 447 gac 1195833 446 aa-aa gac 1195951 435 cac 569046 361 aaa 1745776 341-310 ggc 2388585 361 atgf 2492390 535 5s-aa atgf 2109563 633 5s-aa
agr distribution[modifier | modifier le wikicode]
- Lien tableur: agr distribution
- Notes: gac2
g1 | t1 | ||||||
---|---|---|---|---|---|---|---|
atgi | 1 | tct | tat | atgf | 6 | ||
att | act | aat | agt | ||||
ctt | cct | cat | cgc | ||||
gtt | gct | gat | ggt | ||||
ttc | 1 | tcc | 1 | tac | 1 | tgc | 1 |
atc | 5 | acc | 1 | aac | 1 | agc | 1 |
ctc | 1 | ccc | 1 | cac | 1 | cgt | 1 |
gtc | 1 | gcc | 1 | gac | 2 | ggc | 2 |
tta | 1 | tca | 1 | taa | tga | ||
ata | aca | 1 | aaa | 1 | aga | 1 | |
cta | 1 | cca | 1 | caa | 1 | cga | |
gta | 1 | gca | 5 | gaa | 2 | gga | 1 |
ttg | 1 | tcg | 1 | tag | tgg | 1 | |
atgj | 1 | acg | 1 | aag | 1 | agg | |
ctg | 1 | ccg | 1 | cag | 1 | cgg | 1 |
gtg | gcg | gag | ggg | 1 | |||
alpha | >1aa | =1aa | -5s | +5s | -16s | +16s | total |
agr | 7 | 35 | 5 | 10 | 57 |
agrl. Intergen51[modifier | modifier le wikicode]
Intergen51. agrl. Le génome[modifier | modifier le wikicode]
- agrl Le prélèvement: alpha gama
- Le nom et le lien NCBI: agrl, Agrobacterium fabacearum chromosome linear, NCBI [42], date 19.4.21.
- agrl La longueur totale des intercalaires, longueur du génome et taux intercalaires/génome:
Nom intercals génome taux en % agrl 225,474 2,148,289 10.5
agrl données intercalaires[modifier | modifier le wikicode]
- Lien tableur: agrl données intercalaires
- Lien sauvegarde NCBI: alpha gama
agrl données intercalaires 200[modifier | modifier le wikicode]
- Lien tableur: données intercalaires 200.
agrl autres intercalaires aas[modifier | modifier le wikicode]
- Lien tableur: agrl autres intercalaires aas
- Lien sauvegarde NCBI: alpha gama]
Intergen51. agrl. Les différents types d'intercalaires[modifier | modifier le wikicode]
- Lien au tableur: Intergen51. agrl les différents types d'intercalaires.
- Légende:
- - S pour intercalaire CDS-CDS et R pour tRNA-CDS,
- - c pour intercalaire continu (les 2 gènes sont sur le même brin) et x pour discontinu (les 2 gènes sont sur 2 brins différents, le brin et son complément)
- - %reste = 100*reste/total, le reste étant ce qui reste du total après la fin du diagramme, gamme.
- - %t30 = 100*t30/total, t30 étant le total des fréquences 10 20 30
- - %t5 = 100*t/total, t5 étant le total des fréquences de -1 à -5 dans le diagramme des S-.
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
Intergen51. agrl. Les diagrammes CDS-CDS positifs[modifier | modifier le wikicode]
- Lien tableur: Les diagrammes
- Diagrammes des gamma: agrl présente 2 diagrammes
- - fc40, CDS-CDS continu, fréquence unitaire en abscisses et effectif en ordonnées
- - fx%, CDS-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et pourcentage en ‰ par rapport au total, en ordonnées.
- Équations des courbes de tendance en pour 1000: colonnes %fx %fc
Courbes de tendances pour les diagrammes en pour 1000 Calculs des f.41 agrl R2 x3 x2 x c Inflexion poly3 x c 0.762 2.42E-07 -7.81E-05 -9.33E-02 42.2 fx1 abscisse -112.4 507.0 0.813 -6.76E-06 5.18E-03 -1.30E+00 117.0 fc1 ordonnée 57.3 1.8 0.695 9.34E-08 3.15E-05 -1.18E-01 43.8 fx41 0.924 -4.55E-07 6.92E-04 -3.52E-01 61.7 fc41
Intergen51. agrl. Les CDS-CDS négatifs[modifier | modifier le wikicode]
Sous-totaux agrl totale fréquence x- c- x- c- - 1 0 46 4 4140 - 2 1 0 85 11 - 3 0 0 3 12 - 4 9 199 717 10938 - 5 0 0 5 19 sp6 15 63 1642 8424 total 25 308 2,456 23,544 reste 0 1 264 420 s6 4 0 361 41 s7 6 9 321 1438 s8 5 53 696 6525 rappot s1-5 4/2/1 9.0 4.3 8.4 2.6 % / sp6 s6/sp6 26.7 0.0 22.0 0.5 s7/sp6 40.0 14.3 19.5 17.1 s8/sp6 33.3 84.1 42.4 77.5 reste/sp6 0.0 1.6 16.1 5.0 total s1-5 10 245 814 15120 % / total %s1-5 40.0 79.5 33.1 64.2 %sp6 60.0 20.5 66.9 35.8
Intergen51. agrl. Les intercalaires des blocs[modifier | modifier le wikicode]
- Le détail
RNA-RNA c x CDS-RNA c x 23s 5s 3 CDS 16s 2 1 16s 23s 5s CDS 16s tRNA 3 16 CDS tRNA 23s 3 CDS 5s 5s tRNA 3 23s CDS tRNA in 3 CDS 23s tRNA contig 5s 16s tRNA hors 1 16s16s tRNA 16s 23s tRNA tRNA 5s 16s 5s 5s 23s 5s 5s total 15 1 total 2 1
- Les rares voir gamma pour la longueur des intercalaires
- Les tRNA-CDS compris, comparaison dans le clade et dans l'étude.
Intergen51. agrl. Les intercalaires tRNA-tRNA extra bloc[modifier | modifier le wikicode]
- Lien tableur: Intergen51. agrl. Les intercalaires tRNA-tRNA extra bloc
- voir les répétitions dans rpm
agrc. Intergen51[modifier | modifier le wikicode]
Intergen51. agrc. Le génome[modifier | modifier le wikicode]
- agrc Le prélèvement: alpha gama
- Le nom et le lien NCBI: agrc, Agrobacterium fabacearum chromosome circular, NCBI [43], date 24.4.22.
- agrc La longueur totale des intercalaires, longueur du génome et taux intercalaires/génome:
Nom intercals génome taux en % agrc 332,177 2,823,930 11.8
agrc données intercalaires[modifier | modifier le wikicode]
- Lien tableur: agrc données intercalaires
- Lien sauvegarde NCBI: alpha gama
agrc données intercalaires 200[modifier | modifier le wikicode]
- Lien tableur: données intercalaires 200.
agrc autres intercalaires aas[modifier | modifier le wikicode]
- Lien tableur: agrc autres intercalaires aas
- Lien sauvegarde NCBI: alpha gama
Intergen51. agrc. Les différents types d'intercalaires[modifier | modifier le wikicode]
- Lien au tableur: Intergen51. agrc les différents types d'intercalaires.
- Légende:
- - S pour intercalaire CDS-CDS et R pour tRNA-CDS,
- - c pour intercalaire continu (les 2 gènes sont sur le même brin) et x pour discontinu (les 2 gènes sont sur 2 brins différents, le brin et son complément)
- - %reste = 100*reste/total, le reste étant ce qui reste du total après la fin du diagramme, gamme.
- - %t30 = 100*t30/total, t30 étant le total des fréquences 10 20 30
- - %t5 = 100*t/total, t5 étant le total des fréquences de -1 à -5 dans le diagramme des S-.
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
Intergen51. agrc. Les diagrammes CDS-CDS positifs[modifier | modifier le wikicode]
- Lien tableur: Les diagrammes
- Diagrammes des gamma: agrc présente 2 diagrammes
- - fc40, CDS-CDS continu, fréquence unitaire en abscisses et effectif en ordonnées
- - fx%, CDS-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et pourcentage en ‰ par rapport au total, en ordonnées.
- Équations des courbes de tendance en pour 1000: colonnes %fx %fc
Courbes de tendances pour les diagrammes en pour 1000 Calculs des f.41 agrc R2 x3 x2 x c Inflexion poly3 x c 0.828 -3.27E-07 2.41E-04 -1.52E-01 46.3 fx1 abscisse 266.8 216.8 0.760 -2.84E-06 2.34E-03 -6.99E-01 86.0 fc1 ordonnée 16.5 19.1 0.829 -5.06E-07 4.05E-04 -1.99E-01 50.4 fx41 0.908 4.29E-06 -2.79E-03 3.98E-01 20.2 fc41
Intergen51. agrc. Les CDS-CDS négatifs[modifier | modifier le wikicode]
Sous-totaux agrc totale fréquence x- c- x- c- - 1 0 57 4 4140 - 2 5 0 85 11 - 3 0 0 3 12 - 4 6 226 717 10938 - 5 0 1 5 19 sp6 24 61 1642 8424 total 35 345 2,456 23,544 reste 1 2 264 420 s6 3 0 361 41 s7 8 8 321 1438 s8 12 51 696 6525 rappot s1-5 4/2/1 1.2 4.0 8.4 2.6 % / sp6 s6/sp6 12.5 0.0 22.0 0.5 s7/sp6 33.3 13.1 19.5 17.1 s8/sp6 50.0 83.6 42.4 77.5 reste/sp6 4.2 3.3 16.1 5.0 total s1-5 11 284 814 15120 % / total %s1-5 31.4 82.3 33.1 64.2 %sp6 68.6 17.7 66.9 35.8
Intergen51. agrc. Les intercalaires des blocs[modifier | modifier le wikicode]
- Le détail
RNA-RNA c x CDS-RNA c x 23s 5s 2 CDS 16s 2 16s 23s 5s CDS 16s tRNA 2 16 CDS tRNA 23s 2 CDS 5s 5s tRNA 2 23s CDS tRNA in 2 CDS 23s tRNA contig 5s 16s tRNA hors 3 16s16s tRNA 16s 23s tRNA tRNA 5s 16s 5s 5s 23s 5s 5s total 13 0 total 0 2
- Les rares voir gamma pour la longueur des intercalaires
- Les tRNA-CDS compris, comparaison dans le clade et dans l'étude.
Intergen51. agrc. Les intercalaires tRNA-tRNA extra bloc[modifier | modifier le wikicode]
- Lien tableur: Intergen51. agrc. Les intercalaires tRNA-tRNA extra bloc
- voir les répétitions dans rpm
Aureimonas sp. AU20[modifier | modifier le wikicode]
aua opérons[modifier | modifier le wikicode]
- Lien tableur: aua opérons
- Liens: gtRNAdb [], NCBI [44], génome [orgn], pau20rrn [45]
- Phylogénie: Bacteria; Proteobacteria; Alphaproteobacteria; Rhizobiales; Aurantimonadaceae; Aureimonas.
- Légende: cdsa: cds aas, cdsd: cds dirigé
- Note: il n'y a pas de gtRNAdb. Aussi j'ai comparé (EXACT NB.CAR STXT) les 1ers atgf atgi atgj du génome cdc, avec les atg de aua sauf atgi qui est défini dans NCB. Les 2 atgf de atgf2 (331629..331705) sont identiques.
67%GC | 8.8.19 Paris | 55 | doubles | intercal | cds | aa | avec aa | cdsa | cdsd | protéines |
---|---|---|---|---|---|---|---|---|---|---|
pAU20rrn | ||||||||||
324..1028 | CDS rep | 461 | 235 | replication initiation protein | ||||||
comp | 1490..1604 | 5s | @1 | 82 | 115 | |||||
comp | 1687..4515 | 23s | -15 | 2829 | ||||||
comp | 4501..4851 | CDS hp | 142 | 117 | hp | |||||
comp | 4994..5069 | gca | 33 | 33 | ||||||
comp | 5103..5179 | atc | 233 | |||||||
comp | 5413..6898 | 16s | 1752 | 1486 | ||||||
comp | 8651..9109 | CDS hp | 153 | hp | ||||||
Chromosome | ||||||||||
comp | 170900..171925 | CDS | 368 | 368 | 342 | |||||
172294..172378 | ctg | 130 | 130 | 130 | ||||||
172509..172772 | CDS | 88 | ||||||||
comp | 330094..330690 | CDS | 338 | 338 | 199 | |||||
331029..331103 | ggc | @2 | 404 | 404 | ||||||
comp | 331508..331584 | atgf | + | 44 | 44 | |||||
comp | 331629..331705 | atgf | 2 atg | 255 | 255 | 255 | ||||
comp | 331961..333217 | CDS | 419 | |||||||
344949..346025 | CDS | 589 | 589 | 359 | 589 | |||||
346615..346704 | tcg | 609 | 609 | |||||||
347314..348471 | CDS | 386 | ||||||||
comp | 393335..395356 | CDS | 800 | 800 | 674 | |||||
comp | 396157..396232 | gcc | 439 | 439 | 439 | |||||
comp | 396672..397094 | CDS | 141 | |||||||
635177..637537 | CDS | 640 | 640 | 787 | ||||||
comp | 638178..638253 | gcg | 182 | 182 | 182 | |||||
638436..638738 | CDS | 101 | ||||||||
comp | 924507..925466 | CDS | 529 | 529 | 320 | |||||
comp | 925996..926085 | tcc | 349 | 349 | 349 | |||||
926435..926767 | CDS | 111 | ||||||||
1216789..1217439 | CDS | 60 | 60 | 217 | 60 | |||||
1217500..1217576 | agg | 68 | 68 | |||||||
comp | 1217645..1218760 | CDS | 372 | |||||||
1350534..1352180 | CDS | @4 | -30 | -30 | 549 | |||||
comp | 1352151..1352227 | cgt | + | 51 | 51 | |||||
comp | 1352279..1352355 | cgt | 2 cgt | 169 | 169 | |||||
comp | 1352525..1353967 | CDS | 481 | |||||||
1401921..1402442 | CDS | 142 | 142 | 174 | 142 | |||||
1402585..1402661 | cac | 585 | 585 | |||||||
1403247..1404875 | CDS | 543 | ||||||||
1544580..1546277 | CDS | 455 | 455 | 566 | ||||||
comp | 1546733..1546808 | ttc | @2 | 161 | 161 | |||||
1546970..1547044 | acc | 414 | 414 | 414 | ||||||
1547459..1549516 | CDS | 686 | ||||||||
1609269..1610216 | CDS | 278 | 278 | 316 | ||||||
comp | 1610495..1610571 | cgg | 121 | 121 | 121 | |||||
comp | 1610693..1611427 | CDS | 245 | |||||||
> | 1683255..1683581 | CDS | 209 | 209 | 109 | 209 | ||||
comp | 1683791..1683864 | cag | 580 | 580 | ||||||
1684445..1685734 | CDS | 430 | ||||||||
1700827..1701852 | CDS | 300 | 300 | 342 | ||||||
comp | 1702153..1702227 | gtc | + | 128 | 128 | |||||
comp | 1702356..1702430 | gtc | 3 gtc | 186 | 186 | |||||
comp | 1702617..1702691 | gtc | 68 | 68 | 68 | |||||
comp | 1702760..1703125 | CDS | 122 | |||||||
1946715..1946936 | CDS | 6 | 6 | 74 | 6 | |||||
comp | 1946943..1947018 | atgi | 105 | 105 | ||||||
1947124..1947345 | CDS | 74 | ||||||||
1981934..1983139 | CDS | 139 | 139 | 402 | 139 | |||||
1983279..1983368 | agc | 825 | 825 | |||||||
1984194..1985339 | CDS | 382 | ||||||||
1996083..1997171 | CDS | 243 | 243 | 363 | ||||||
comp | 1997415..1997490 | acg | 112 | 112 | 112 | |||||
comp | 1997603..1998583 | CDS | 327 | |||||||
comp | 2263930..2264781 | CDS | 30 | 30 | 284 | 30 | ||||
comp | 2264812..2264886 | gtg | 111 | 111 | ||||||
comp | 2264998..2265768 | CDS | 257 | |||||||
2363764..2364786 | CDS | 18 | 18 | 341 | 18 | |||||
comp | 2364805..2364879 | gaa | + | 140 | 140 | |||||
comp | 2365020..2365094 | gaa | 2 gaa | 69 | 69 | 69 | ||||
comp | 2365164..2366144 | CDS | 327 | |||||||
2367774..2368247 | CDS | 105 | 105 | 158 | ||||||
2368353..2368429 | cca | @3 | 43 | 43 | 43 | |||||
2368473..2368778 | CDS | 36 | 36 | 102 | 36 | |||||
2368815..2368890 | aga | 448 | 448 | |||||||
2369339..2369929 | CDS | 197 | ||||||||
comp | 2401620..2402732 | CDS | 155 | 155 | 371 | 155 | ||||
comp | 2402888..2402963 | aaa | 169 | 169 | ||||||
2403133..2403870 | CDS | 246 | ||||||||
2419689..2420852 | CDS | 13 | 13 | 388 | 13 | |||||
2420866..2420955 | tca | 238 | 238 | |||||||
2421194..2421934 | CDS | 247 | ||||||||
comp | 2601493..2601858 | CDS | 287 | 287 | 122 | 287 | ||||
comp | 2602146..2602222 | gac | + | 58 | 58 | |||||
comp | 2602281..2602357 | gac | 2 gac | 270 | 270 | |||||
2602628..2602703 | gta | @2 | 330 | 330 | ||||||
comp | 2603034..2603312 | CDS | 93 | |||||||
comp | 2608494..2609852 | CDS | 73 | 73 | 453 | 73 | ||||
comp | 2609926..2610009 | cta | 307 | 307 | ||||||
2610317..2610460 | CDS | 48 | ||||||||
comp | 2641174..2641824 | CDS | @3 | 125 | 125 | 217 | 125 | |||
comp | 2641950..2642023 | tgc | 153 | 153 | ||||||
comp < | 2642177..2642443 | CDS | 296 | 296 | 89 | |||||
2642740..2642814 | aac | 269 | 269 | 269 | ||||||
2643084..2644127 | CDS | 348 | ||||||||
comp | 2651145..2652935 | CDS | 239 | 239 | 597 | 239 | ||||
2653175..2653259 | tta | 265 | 265 | |||||||
2653525..2653725 | CDS | 67 | ||||||||
comp | 2749758..2750318 | CDS | 3102 | 3102 | 187 | |||||
comp | 2753421..2753497 | atgf | 83 | 83 | 83 | |||||
comp | 2753581..2754180 | CDS | 200 | |||||||
2768127..2769224 | CDS | 63 | 63 | 366 | 63 | |||||
comp | 2769288..2769364 | ccg | @2 | 173 | 173 | |||||
2769538..2769612 | caa | 528 | 528 | |||||||
comp | 2770141..2770566 | CDS | 142 | |||||||
comp | 2787112..2788920 | CDS | 217 | 217 | 603 | 217 | ||||
comp | 2789138..2789214 | ccc | 265 | 265 | ||||||
comp | 2789480..2790022 | CDS | 181 | |||||||
2927857..2928789 | CDS | 136 | 136 | 311 | 136 | |||||
comp | 2928926..2929010 | ctc | + | 132 | 132 | |||||
comp | 2929143..2929227 | ctc | 2 ctc | 175 | 175 | |||||