Recherche:Les clusters de gènes tRNA et rRNA chez les procaryotes/Annexe/gamma
Aller à la navigation
Aller à la recherche
Shewanella[modifier | modifier le wikicode]
spl opérons[modifier | modifier le wikicode]
- Liens: gtRNAdb [1], NCBI [2], génome []
- Lien tableur: spl opérons
39.1%GC | 30.6.19 Paris | 147 | doubles | interca |
---|---|---|---|---|
45136..46685 | 16s | @1 | 339 | |
47025..49946 | 23s | 112 | ||
50059..50174 | 5s | |||
51490..53039 | 16s | 339 | ||
53379..56298 | 23s | 114 | ||
56413..56528 | 5s | |||
182271..183820 | 16s | @2 | 71 | |
183892..183968 | atc | 65 | ||
184034..184109 | gca | 364 | ||
184474..187395 | 23s | 112 | ||
187508..187623 | 5s | 100 | ||
187724..187800 | gac | |||
191614..191689 | aca | 8 | ||
191698..191782 | tac | 35 | ||
191818..191891 | gga | |||
235182..236731 | 16s | 374 | ||
237106..240025 | 23s | 114 | ||
240140..240255 | 5s | |||
243631..245180 | 16s | 338 | ||
245519..248440 | 23s | 113 | ||
248554..248669 | 5s | 68 | ||
248738..248813 | acc | 17 | ||
248831..248946 | 5s | |||
416766..416842 | cgg | 39 | ||
416882..416957 | cac | 41 | ||
416999..417075 | cca | + | 58 | |
417134..417210 | cca | 2 cca | ||
493711..495260 | 16s | 339 | ||
495600..498519 | 23s | 114 | ||
498634..498749 | 5s | |||
641376..641466 | tca | @3 | 1172 | |
642639..642729 | tca | |||
645847..647396 | 16s | 71 | ||
647468..647544 | atc | 65 | ||
647610..647685 | gca | 329 | ||
648015..650937 | 23s | 156 | ||
651094..651209 | 5s | |||
728115..728199 | ttg | |||
comp | 1168942..1169018 | atgi | ||
comp | 1339706..1339781 | aca | + | 52 |
comp | 1339834..1339909 | ttc | 2 ttc | 539 |
comp | 1340449..1340524 | aca | 2 aca | 52 |
comp | 1340577..1340652 | ttc | ||
comp | 1342467..1342542 | aca | 52 | |
comp | 1342595..1342670 | ttc | ||
1456724..1456815 | agc | 21 | ||
1456837..1456913 | cgt | + | 30 | |
1456944..1457020 | cgt | 7 cgt | 32 | |
1457053..1457129 | cgt | 3 agc | 30 | |
1457160..1457236 | cgt | 33 | ||
1457270..1457346 | cgt | 9 | ||
1457356..1457447 | agc | 76 | ||
1457524..1457600 | cgt | 35 | ||
1457636..1457712 | cgt | 9 | ||
1457722..1457813 | agc | |||
comp | 1627363..1627438 | agg | ||
comp | 1770483..1770558 | gta | + | 37 |
comp | 1770596..1770671 | gta | 11 gta | 37 |
comp | 1770709..1770784 | gta | 37 | |
comp | 1770822..1770897 | gta | 37 | |
comp | 1770935..1771010 | gta | 37 | |
comp | 1771048..1771123 | gta | 37 | |
comp | 1771161..1771236 | gta | 37 | |
comp | 1771274..1771349 | gta | 37 | |
comp | 1771387..1771462 | gta | 37 | |
comp | 1771500..1771575 | gta | 39 | |
comp | 1771615..1771690 | gta | ||
1773910..1773985 | gcc | + | 80 | |
1774066..1774141 | gaa | 13 gaa | 102 | |
1774244..1774319 | gaa | 2 gcc | 102 | |
1774422..1774497 | gaa | 102 | ||
1774600..1774675 | gaa | 102 | ||
1774778..1774853 | gaa | 102 | ||
1774956..1775031 | gaa | 102 | ||
1775134..1775209 | gaa | 102 | ||
1775312..1775387 | gaa | 253 | ||
1775641..1775716 | gaa | 102 | ||
1775819..1775894 | gaa | 102 | ||
1775997..1776072 | gaa | 102 | ||
1776175..1776250 | gaa | 102 | ||
1776353..1776428 | gaa | 47 | ||
1776476..1776551 | gcc | |||
2081297..2082846 | 16s | 338 | ||
2083185..2086104 | 23s | 114 | ||
2086219..2086334 | 5s | |||
comp | 2143274..2143350 | ccc | ||
comp | 2366164..2366240 | atgf | + | 40 |
comp | 2366281..2366357 | atgf | 4 atgf | 40 |
comp | 2366398..2366474 | atgf | 40 | |
comp | 2366515..2366591 | atgf | ||
2376218..2376308 | tca | |||
2379767..2379842 | ggc | 13 | ||
2379856..2379929 | tgc | 85 | ||
2380015..2380100 | tta | |||
2550857..2550932 | ggc | 13 | ||
2550946..2551019 | tgc | + | 95 | |
2551115..2551200 | tta | 3 tgc | 634 | |
2551835..2551908 | tgc | 3 tta | 95 | |
2552004..2552089 | tta | 479 | ||
2552569..2552642 | tgc | 132 | ||
2552775..2552860 | tta | |||
2558019..2558109 | tca | |||
comp | 2717566..2717655 | tcc | ||
comp | 2759730..2759806 | atgf | + | 189 |
comp | 2759996..2760072 | atgf | 4 atgf | 45 |
comp | 2760118..2760194 | gtc | 2 gtc | 2 |
comp | 2760197..2760273 | atgf | 35 | |
comp | 2760309..2760385 | gtc | 13 | |
comp | 2760399..2760475 | atgf | ||
2858823..2858907 | tac | + | 30 | |
2858938..2859022 | tac | 5 tac | 85 | |
2859108..2859192 | tac | 107 | ||
2859300..2859384 | tac | 107 | ||
2859492..2859576 | tac | |||
2866268..2866343 | aac | + | 45 | |
2866389..2866464 | aac | 7aac | 41 | |
2866506..2866581 | aac | 26 | ||
2866608..2866683 | aac | 32 | ||
2866716..2866791 | aac | 33 | ||
2866825..2866900 | aac | 40 | ||
2866941..2867016 | aac | |||
comp | 2929429..2929505 | gac | + | 97 |
comp | 2929603..2929679 | gac | 4 gac | 97 |
comp | 2929777..2929853 | gac | 83 | |
comp | 2929937..2930013 | gac | ||
comp | 3120289..3120364 | aaa | + | 58 |
comp | 3120423..3120498 | aaa | 12 aaa | 58 |
comp | 3120557..3120632 | aaa | 58 | |
comp | 3120691..3120766 | aaa | 59 | |
comp | 3120826..3120901 | aaa | 57 | |
comp | 3120959..3121034 | aaa | 58 | |
comp | 3121093..3121168 | aaa | 58 | |
comp | 3121227..3121302 | aaa | 59 | |
comp | 3121362..3121437 | aaa | 58 | |
comp | 3121496..3121571 | aaa | 59 | |
comp | 3121631..3121706 | aaa | 59 | |
comp | 3121766..3121841 | aaa | ||
comp | 3269860..3269935 | cac | 8 | |
comp | 3269944..3270020 | aga | 63 | |
comp | 3270084..3270160 | cca | ||
comp | 3757983..3758059 | atgf | ||
comp | 3758163..3758249 | ctc | ||
comp | 3835257..3835331 | caa | + | 51 |
comp | 3835383..3835467 | cta | 5 caa | 131 |
comp | 3835599..3835673 | caa | 5 cta | 20 |
comp | 3835694..3835778 | cta | 3 atg | 96 |
comp | 3835875..3835949 | caa | 49 | |
comp | 3835999..3836083 | cta | 211 | |
comp | 3836295..3836371 | atg | 5 | |
comp | 3836377..3836451 | caa | 47 | |
comp | 3836499..3836583 | cta | 55 | |
comp | 3836639..3836715 | atg | 5 | |
comp | 3836721..3836795 | caa | 47 | |
comp | 3836843..3836927 | cta | 55 | |
comp | 3836983..3837059 | atg | ||
comp | 3862885..3862961 | tgg | + | 167 |
comp | 3863129..3863205 | tgg | 2 tgg | |
comp | 3867049..3867164 | 5s | 114 | |
comp | 3867279..3870198 | 23s | 338 | |
comp | 3870537..3872086 | 16s | ||
3882154..3882229 | ttc | |||
comp | 4331488..4331563 | ggc | + | 130 |
comp | 4331694..4331769 | ggc | 6 ggc | 47 |
comp | 4331817..4331892 | ggc | 162 | |
comp | 4332055..4332130 | ggc | 16 | |
comp | 4332147..4332222 | ggc | 48 | |
comp | 4332271..4332346 | ggc | ||
comp | 4616881..4616996 | 5s | 112 | |
comp | 4617109..4620030 | 23s | 364 | |
comp | 4620395..4620470 | gca | 65 | |
comp | 4620536..4620612 | atc | 71 | |
comp | 4620684..4622233 | 16s | ||
comp | 5129770..5129846 | gac | 100 | |
comp | 5129947..5130062 | 5s | 115 | |
comp | 5130178..5133097 | 23s | 339 | |
comp | 5133437..5134986 | 16s |
spl cumuls[modifier | modifier le wikicode]
- Note: Les statistiques sur les intercalaires entre tRNA ne sont pas correctes. Se reporter à intergen51.spl. Il n'y a aucun commentaire sur les CDS. J'ai réduit le tableau aux clusters à rRNA. L'intitulé opéron doit d'être compris dans le sens cluster ou bloc de RNA, rRNA ou tRNA.
spl cumuls opérons effectif avec rRNA opérons 11 16 23 5s 0 6 16 atc gca 3 16 23 5s a 2 max a 3 a doubles 0 spéciaux 0 total aas 9 sans opérons 29 1 aa 8 max a 15 a doubles 15 total aas 133 total aas 142 remarques 3
spl blocs[modifier | modifier le wikicode]
- Lien tableur: spl blocs
16s | 339 | 339 | 374 | 339 | 338 | 338 | |
23s | 112 | 114 | 114 | 114 | 114 | 114 | |
5s | |||||||
16s | 71 | 71 | 71 | 16s | 338 | 16s | 339 |
atc | 65 | 65 | 65 | 23s | 113 | 23s | 115 |
gca | 364 | 329 | 364 | 5s | 68 | 5s | 100 |
23s | 112 | 156 | 112 | acc | 17 | gac | |
5s | 100 | 5s | |||||
gac |
spl remarques[modifier | modifier le wikicode]
- Remarques :
- @1 8 blocs 16-23-5s. Ils ont tous les mêmes intercalaires, 338 113 68.
- - 6 blocs sont solo avec un dont l'intercalaire 16s-23s fait 11% de plus que le reste, 36/338.
- - 2 blocs avec 1 aa dont un possède en plus un 5s, gac et acc-5s.
- @2 Les 2 blocs 16-atc-gca ont les mêmes intercalaires, 71 65 364 112. L’intercalaire 23s-5s est le même que les 6 autres blocs.
- - Les 2 blocs n'ont que 5 aas, soit pour les 8 opérons à rRNA 7 aas au total. Ce qui est quasiment nul.
- @3 Les intercalaires élevés ne touchent que 3 opérons sans rRNAs
- @1 8 blocs 16-23-5s. Ils ont tous les mêmes intercalaires, 338 113 68.
- anciens - nouveaux - intercalires n aas doubles nv doubles nv opérons 1172 2 2 0 2 539 4 2,2 0 2 634, 479 6 3,3 0 3 résultats ancien nouveau total opérons 29 33 1 aa 8 10 max aa 15 15 doubles 15 12
- Séquences des doubles : Les intercalaires excessives ne changent pas fondamentalement le spectre des doubles et leurs séquences. Ainsi les répétitions suivantes sont caractéristiques de ce génome.
- - opéron à 13 gaa avec 11 intercalalires identiques de 102 bases, soit 11 répétitions d’une séquence de 180 bases environ, longueur de gaa+102.
- - Les répétitions de séquences sont nombreuses. La plus longue est celle de l’opéron à 5 cta 5 caa 3 atg. Ce sont 5 séquences caa-cta avec un intercalaire de 50 interrompues par 2 atg et 2 intercalaires de 100 bases environ.
- - Les 2 autres opérons à séquences répétées sont, 4atgf 2gtc (2*(2atgf-gtc)) et 6 ggc (avec 2 ggc-ggc séparées par des intercalaires longs).
- - Répétitions du même codon avec son intercalaire comme pour le cas de l'opéron à 15 codons,
codon répétition intercalaire gaa 13 102 gta 11 37 tac 5 100 aac 7 35 gac 4 97 aaa 12 58 atgf 4 40
spl distribution[modifier | modifier le wikicode]
- Lien tableur: spl distribution
- Notes:
- - gta11 tca2 cca2 tac5 aac7 gac4 aaa12 gaa13 atgf4+2 cgt5+2 ggc8 tgg2
- - tca: tca2, 2 1aa
- - gac: 2 5s, gac4
- - Séquences:
- (aca ttc)2
- (tgc tta)3
- (atf gtc)2
- (caa cta atgj)3 ou (caa cta)5
g1 | t1 | ||||||
---|---|---|---|---|---|---|---|
atgi | 1 | tct | tat | atgf | 9 | ||
att | act | aat | agt | ||||
ctt | cct | cat | cgc | ||||
gtt | gct | gat | ggt | ||||
ttc | 4 | tcc | 1 | tac | 6 | tgc | 4 |
atc | 3 | acc | 1 | aac | 7 | agc | 3 |
ctc | 1 | ccc | 1 | cac | 2 | cgt | 7 |
gtc | 2 | gcc | 2 | gac | 6 | ggc | 8 |
tta | 4 | tca | 4 | taa | tga | ||
ata | aca | 4 | aaa | 12 | aga | 1 | |
cta | 5 | cca | 3 | caa | 5 | cga | |
gta | 11 | gca | 3 | gaa | 13 | gga | 1 |
ttg | 1 | tcg | tag | tgg | 2 | ||
atgj | 3 | acg | aag | agg | 1 | ||
ctg | ccg | cag | cgg | 1 | |||
gtg | gcg | gag | ggg | ||||
gama | >1aa | =1aa | -5s | +5s | -16s | +16s | total |
spl | 125 | 8 | 3 | 6 | 140 |
spl intergen51[modifier | modifier le wikicode]
Intergen51. spl. Le génome[modifier | modifier le wikicode]
- spl Le prélèvement: Aspl
- Le nom et le lien NCBI: spl, Shewanella pealeana ATCC 700345, NCBI [3], date 24.09.20.
- Note de l'étude préliminaire pour l'étude des intercalaires cds-cds:
- - Pour les génomes des annexes j'ai relevé les intercalaires entre tRNAs et entre ceux-ci et les cds qui leur sont adjacents. L'exemple est celui de rru du clade alpha. L'idée de départ de ces prélèvements est la recherche d'opérons formés de tRNA et de protéine comme dans le cas d'E.coli: l'intercalaire entre le tRNA et la protéine devrait être faible. Voir l'exemple d'eco (remarque @3) avec tac-tac-tpr et aca-tac-gga-acc-tufB.
- spl La longueur totale des intercalaires, longueur du génome et taux intercalaires/génome:
Nom intercals génome taux en % spl 789 212 5 174 581 15,3
spl données intercalaires[modifier | modifier le wikicode]
- Lien tableur: spl données intercalaires
- Lien sauvegarde NCBI: Aspl
spl données intercalaires 200[modifier | modifier le wikicode]
- Lien tableur: données intercalaires 200.
spl autres intercalaires aas[modifier | modifier le wikicode]
- Lien tableur: spl autres intercalaires aas
- Lien sauvegarde NCBI: Aspl
Intergen51. spl. Les différents types d'intercalaires[modifier | modifier le wikicode]
- Lien au tableur: Intergen51. spl les différents types d'intercalaires.
- Légende:
- - S pour intercalaire CDS-CDS et R pour tRNA-CDS,
- - c pour intercalaire continu (les 2 gènes sont sur le même brin) et x pour discontinu (les 2 gènes sont sur 2 brins différents, le brin et son complément)
- - %reste = 100*reste/total, le reste étant ce qui reste du total après la fin du diagramme, gamme.
- - %t30 = 100*t30/total, t30 étant le total des fréquences 10 20 30
- - %t5 = 100*t/total, t5 étant le total des fréquences de -1 à -5 dans le diagramme des S-.
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
Intergen51. spl. Les diagrammes CDS-CDS positifs[modifier | modifier le wikicode]
- Lien tableur: Les diagrammes
- Diagrammes des gamma: spl présente 2 diagrammes
- - fc40, CDS-CDS continu, fréquence unitaire en abscisses et effectif en ordonnées
- - fx%, CDS-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et pourcentage en ‰ par rapport au total, en ordonnées.
- Équations des courbes de tendance en pour 1000: à partir des colonnes fx fc des données intercalaires.
Courbes de tendances pour les diagrammes en pour 1000 Calculs des f.41 spl R2 x3 x2 x c Inflexion poly3 x c 0,613 3,91E-06 -2,74E-03 4,89E-01 6,45 fx1 abscisse 220,9 150,5 0,805 -4,24E-06 3,25E-03 -8,35E-01 85,1 fc1 ordonnée 21,5 23,9 0,655 1,66E-06 -1,10E-03 1,26E-01 29,4 fx41 0,976 8,15E-07 -3,68E-04 -6,78E-02 39,7 fc41
Intergen51. spl. Les CDS-CDS négatifs[modifier | modifier le wikicode]
Sous-totaux spl totale fréquence x- c- x- c- -1 0 126 4 4140 -2 2 0 85 11 -3 0 0 3 12 -4 5 136 717 10938 -5 0 0 5 19 sp6 5 152 1642 8424 total 12 414 2 456 23 544 reste 1 5 264 420 s6 1 0 361 41 s7 0 30 321 1438 s8 3 117 696 6525 rappot s1-5 4/2/1 2,5 1,1 8,4 2,6 % / sp6 s6/sp6 20,0 0,0 22,0 0,5 s7/sp6 0,0 19,7 19,5 17,1 s8/sp6 60,0 77,0 42,4 77,5 reste/sp6 20,0 3,3 16,1 5,0 total s1-5 7 262 814 15120 % / total %s1-5 58,3 63,3 33,1 64,2 %sp6 41,7 36,7 66,9 35,8
Intergen51. spl. Les intercalaires des blocs[modifier | modifier le wikicode]
- Le détail
RNA-RNA c x CDS-RNA c x 23s 5s 11 CDS 16s 5 5 16s 23s 8 5s CDS 2 6 16s tRNA 3 16 CDS tRNA 23s 3 CDS 5s 5s tRNA 3 23s CDS tRNA in 3 CDS 23s tRNA contig 5s 16s 1 tRNA hors 108 16s16s tRNA 16s 23s tRNA tRNA 5s 1 16s 5s 5s 23s 5s 5s total 140 0 total 8 11
- Les rares voir gamma pour la longueur des intercalaires
type c x tRNA CDS -23 tRNA5s-acc 17 5s16s 1319
- Les tRNA-CDS compris, comparaison dans le clade et dans l'étude.
Intergen51. spl. Les intercalaires tRNA-tRNA extra bloc[modifier | modifier le wikicode]
- Lien tableur: Intergen51. spl. Les intercalaires tRNA-tRNA extra bloc
- Les contigus aux blocs: inexistants
- Les hors blocs: 108 au total avec de fortes répétitions qui donnent un diagramme en dents de scie (tableur). Voir les doubles dans ancien spl et le chapitre distribution qui le suit.
- Notes: les 12 intercalaires supérieurs à 120 pdbs sont dans des séquences à répétition
1172 tca 51 caa 80 gcc ** tca 131 cta 11* 102 gaa 52 aca 20 caa 253 gaa 539 ttc 96 cta 47 gaa 52 aca 49 caa ** gcc ** ttc 211 cta 13 ggc 128 cat 5 atgj 95 tgc 128 cat 47 caa 634 tta 189 atgf 55 cta 95 tgc 45 atgf 5 atgj 479 tta 2 gtc 47 caa 132 tgc 35 atgf 55 cta ** tta 13 gtc ** atgj ** atgf 167 tgg ** tgg
inter | aa | inter | aa | inter | aa | inter | aa | |||
---|---|---|---|---|---|---|---|---|---|---|
8 | aca | 9* 37 | gta | 30 | tac | 8 | cac | |||
35 | tac | 39 | gta | 85 | tac | 63 | aga | |||
** | gga | ** | gta | 107 | tac | ** | cca | |||
39 | cgg | 80 | gcc | 107 | tac | 103 | atgf | |||
41 | cac | 11* 102 | gaa | ** | tac | ** | ctc | |||
58 | cca | 253 | gaa | 45 | aac | 51 | caa | |||
** | cca | 47 | gaa | 41 | aac | 131 | cta | |||
1172 | tca | ** | gcc | 26 | aac | 20 | caa | |||
** | tca | 3* 40 | atgf | 32 | aac | 96 | cta | |||
52 | aca | ** | atgf | 33 | aac | 49 | caa | |||
539 | ttc | 13 | ggc | 40 | aac | 211 | cta | |||
52 | aca | 85 | tgc | ** | aac | 5 | atgj | |||
** | ttc | ** | tta | 97 | gac | 47 | caa | |||
52 | aca | 13 | ggc | 97 | gac | 55 | cta | |||
** | ttc | 95 | tgc | 83 | gac | 5 | atgj | |||
21 | agc | 634 | tta | ** | gac | 47 | caa | |||
30 | cgt | 95 | tgc | 58 | aaa | 55 | cta | |||
32 | cgt | 479 | tta | 58 | aaa | ** | atgj | |||
30 | cgt | 132 | tgc | 58 | aaa | 167 | tgg | |||
33 | cgt | ** | tta | 59 | aaa | ** | tgg | |||
9 | cgt | 128 | cat | 57 | aaa | 20 | ggc | |||
76 | agc | 128 | cat | 58 | aaa | 13 | ggt | |||
35 | cgt | 189 | atgf | 58 | aaa | 47 | ggc | |||
9 | cgt | 45 | atgf | 59 | aaa | 47 | ggc | |||
** | agc | 2 | gtc | 58 | aaa | 15 | ggt | |||
35 | atgf | 59 | aaa | 16 | ggc | |||||
13 | gtc | 59 | aaa | 48 | ggc | |||||
** | atgf | ** | aaa | ** | ggc |
spl intercalaires entre cds[modifier | modifier le wikicode]
- Lien NCBI [4]
- Note: Pour les génomes des annexes j'ai relevé les intercalaires entre tRNAs et entre ceux-ci et les cds qui leur sont adjacents. L'exemple est celui de rru du clade alpha. L'idée de départ de ces prélèvements est la recherche d'opérons formés de tRNA et de protéine comme dans le cas d'E.coli: l'intercalaire entre le tRNA et la protéine devrait être faible. Voir l'exemple d'eco (remarque @3) avec tac-tac-tpr et aca-tac-gga-acc-tufB.
spl intercalaires positifs S+[modifier | modifier le wikicode]
- Lien tableur: spl intercalaires positifs S+
- Diagrammes 400: spl myr, diagramme 1-40: c+ spl myr total, texte: myr.
- Légende du tableau diagrammes 400: voir la légende de cvi.
spl | Sx+ | Sc+ | ||||||||||||
Poly3 | -7 | -5 | -3 | 1 | R2 | flex x+ | comment. | -7 | -5 | -3 | 1 | R2 | flex c+ | comment. |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
1 à 400 | 47 | -333 | 594 | 7.7 | 611 | 236 | max80 | -47 | 363 | -934 | 95 | 806 | 257 | min50 |
31 à 400 | - | - | - | - | - | - | 10.3 | -50 | -57 | 43 | 915 | 162 | 2 parties | |
droite | -a | cste | - | R2 | note | R2’ | -a | cste | - | R2 | note | R2’ | ||
1 à 400 | 59 | 37 | - | 275 | poly | 336 | tF | 158 | 57 | 614 | poly | 192 | SF | |
31 à 400 | 106 | 43 | - | 885 | dte | 30 | tf |
- Légende du tableau corrélations et fréquences faibles
effectifs diagramme | corrélation x+ c+, 41-n | corrélation x+ c+, 1-n | |||||||||
gen | minima | x+ | c+ | total | 400 | 200 | 250 | diff | 200 | 250 | 400 |
---|---|---|---|---|---|---|---|---|---|---|---|
myr | min20 | 828 | 2081 | 2909 | 872 | 649 | 764 | 115 | -143 | 41 | 323 |
spl | min10 | 1071 | 2215 | 3286 | 884 | 735 | 784 | 49 | -353 | -202 | 172 |
rru | min40 | 874 | 2056 | 2930 | 829 | 193 | 611 | 418 | 722 | 792 | 861 |
1-30 ‰ | effectifs | 0 ‰ | <0 ‰ | effectifs 1-40 | corel | ||||||
1-30 x+ | 1-30 c+ | x+/c+ | x | c | x | c | x- | c- | x+ | c+ | x+/c+ |
71 | 392 | 0.18 | 999 | 2556 | 5 | 5 | 20 | 110 | 97 | 899 | -78 |
37 | 270 | 0.14 | 1313 | 2900 | 1 | 6 | 9 | 143 | 69 | 683 | -342 |
169 | 266 | 0.64 | 1037 | 2749 | 1 | 4 | 71 | 222 | 175 | 630 | 17 |
- Diagrammes 400: spl myr, diagramme 1-40: c+ spl myr total, texte: myr.
- Résumé: spl ressemble beaucoup à myr. C’est le 3ème génome sans fréquences faibles, 1-30, sur les 13 que j’ai signalés dans ase et cvi. Son minimum x+ est à la fréquence 10, min10. La conséquence, c’est 1 tilde fort du diagramme x+ 31-400. Mais ce génome a la particularité d’avoir une corrélation forte comme ase cvi abra myr dans la plage 41-250, en plus de n’avoir quasiment pas de fréquences faibles.
- - Les courbes des diagrammes 400
- Je n’ai pas représenté le diagramme x+ 31-400, les fréquences faibles ayant très peu d’effectifs pour modifier notablement la courbe de x+ 1-400.
- Au minimum local min50 de c+ 1-400, x+ 1-400 présente un maximum local max80, décalé par rapport à celui de myr, max70.
- Et toujours la courbe du c+ 1-400 est un SF.
- x+ 1-400 a un tilde très fort, tF, avec un R2’ de 336 comme cbei et pmq, et plus fort que celui de abra et myr , R2’ 96 68.
- c+ 31-400 a un tilde très faible, tf, avec un R2’ 30 contre 85 86 pour respectivement abra et myr. La courbe est quasiment une droite avec 2 renflements dans la 1ère partie.
- - Les corrélations
- Le total des effectifs est aussi élevé que celui de myr, 3286 contre 2909 et comme myr sa corrélation 41-250 est forte, 784 contre 764. Par contre sa corrélation se maintient dans la plage de fréquences 41-200, avec une différence (diff) de 49 contre 115 pour myr.
- A cause des fréquences faibles inexistantes les corrélations 1-n sont très faibles en positif ou en négatif, comme abra, mais au contraire de pmg qui a des taux de fréquences faibles élevés et des corrélations 1-n nettement supérieures à celles du 41-250, autour de 900.
- - Les courbes des diagrammes 1-40
- Avec un effectif réduit de 69 pour le total des fréquences x+ 1-40, le diagramme et la corrélation c+/x+ sont peu significatifs.
- Avec un effectif élevé de 683 le diagramme des c+ 1-40 ressemble beaucoup au modèle et à celui de ade avec un effectif de 876, nette mieux que celui de myr avec un effectif de 899.
- - Les courbes des diagrammes 400
Vibrio parahaemolyticus[modifier | modifier le wikicode]
vpb opérons[modifier | modifier le wikicode]
- Liens: gtRNAdb [5], NCBI chr1 [6], NCBI chr2 [7], génome []
- Lien tableur: vpb opérons
- Légende:
- - cds1 198 MQTRFCRTQIPRTLECVILVFVIKTNIENFTNNNKLLFCQLSKLLKSYVSSQGSTFSKDFQSRRF
- - cds2 198 MQTRFCRTQIPRTLECVILVFVIKTNIENFTNNNKLLFCQLSKLLKSYVSSQGSTFSKDFQSRRF
- - cds3 180 MTSHQSCLQFLNMMQTRFCRTQIPRTLECVILVFVIKTNIENFTNNNKLLFCQLSKLLKS
45.3%GC | 6.7.19 Paris | 126 | doubles | interca |
---|---|---|---|---|
chr1 | ||||
33614..35175 | 16s | @4 | 80 | |
35256..35331 | gaa | 2 | ||
35334..35409 | aaa | 30 | ||
35440..35515 | gta | 55 | ||
comp | 35571..35768 | cds1 | 59 | |
35828..38743 | 23s | 73 | ||
38817..38932 | 5s | |||
49997..50073 | cgg | 32 | ||
50106..50181 | cac | + | 72 | |
50254..50330 | cca | 2 cac | 49 | |
50380..50455 | cac | 2 cca | 24 | |
50480..50556 | cca | |||
comp | 400045..400120 | atgi | ||
577971..579532 | 16s | 88 | ||
579621..579696 | gcc | 12 | ||
579709..579784 | gaa | 258 | ||
580043..582958 | 23s | 73 | ||
583032..583147 | 5s | 30 | ||
583178..583254 | gac | 35 | ||
583290..583366 | tgg | |||
comp | 769649..769733 | cta | + | 29 |
comp | 769763..769847 | cta | 10 cta | 47 |
comp | 769895..769971 | atg | 4 atg | 24 |
comp | 769996..770080 | cta | 5 caa | 52 |
comp | 770133..770207 | caa | 29 | |
comp | 770237..770321 | cta | 53 | |
comp | 770375..770451 | atg | 24 | |
comp | 770476..770560 | cta | 52 | |
comp | 770613..770687 | caa | 29 | |
comp | 770717..770801 | cta | 54 | |
comp | 770856..770930 | caa | 29 | |
comp | 770960..771044 | cta | 35 | |
comp | 771080..771154 | caa | 48 | |
comp | 771203..771287 | cta | 31 | |
comp | 771319..771403 | cta | 77 | |
comp | 771481..771557 | atg | 77 | |
comp | 771635..771709 | caa | 31 | |
comp | 771741..771825 | cta | 40 | |
comp | 771866..771942 | atg | ||
786939..787015 | cca | |||
comp | 802315..802391 | agg | ||
910219..910295 | aga | |||
comp | 982089..982173 | tac | + | 81 |
comp | 982255..982339 | tac | 4 tac | 81 |
comp | 982421..982505 | tac | 81 | |
comp | 982587..982671 | tac | ||
1124715..1124802 | tcc | |||
1418321..1418397 | gtc | + | 32 | |
1418430..1418506 | gtc | 2gtc | ||
comp | 1988127..1988202 | ggc | + | 10 |
comp | 1988213..1988299 | tta | 2 ggc | 76 |
comp | 1988376..1988451 | ggc | 20 | |
comp | 1988472..1988545 | tgc | ||
2164082..2164157 | aac | |||
2193593..2193683 | tca | |||
comp | 2547884..2547960 | atgf | 56 | |
comp | 2548017..2548100 | ctc | ||
2652092..2652168 | cgt | + | 56 | |
comp | 2652225..2652301 | cgt | 9 cgt | 57 |
comp | 2652359..2652435 | cgt | 2 agc | 57 |
comp | 2652493..2652569 | cgt | 57 | |
comp | 2652627..2652703 | cgt | 57 | |
comp | 2652761..2652837 | cgt | 56 | |
comp | 2652894..2652970 | cgt | 210 | |
comp | 2653181..2653257 | cgt | 31 | |
comp | 2653289..2653380 | agc | @5 | 320 |
comp | 2653701..2653777 | cgt | 31 | |
comp | 2653809..2653900 | agc | ||
2735697..2735772 | ttc | + | 64 | |
2735837..2735912 | aca | 3 ttc | 7 | |
2735920..2735995 | ttc | 2 aca | 70 | |
2736066..2736141 | aac | 2 aac | 71 | |
2736213..2736288 | aca | 7 | ||
2736296..2736371 | ttc | 43 | ||
2736415..2736490 | aac | |||
2738623..2738698 | ttc | 51 | ||
2738750..2738825 | aca | + | 21 | |
2738847..2738922 | aac | 2 aca | 39 | |
2738962..2739037 | aca | 2 aac | 15 | |
2739053..2739128 | aac | |||
comp | 2741263..2741339 | gac | 31 | |
comp | 2741371..2741487 | 5s | 57 | |
comp | 2741545..2741620 | acc | 100 | |
comp | 2741721..2741836 | 5s | 73 | |
comp | 2741910..2744825 | 23s | 257 | |
comp | 2745083..2745158 | gca | 41 | |
comp | 2745200..2745276 | atc | 56 | |
comp | 2745333..2746894 | 16s | ||
comp | 2755928..2756012 | ttg | ||
comp | 2847646..2847722 | tgg | 68 | |
comp | 2847791..2847867 | gac | 30 | |
comp | 2847898..2848013 | 5s | 73 | |
comp | 2848087..2851002 | 23s | 258 | |
comp | 2851261..2851336 | gaa | 80 | |
comp | 2851417..2852978 | 16s | ||
comp | 2987485..2987561 | atgf | + | 56 |
comp | 2987618..2987693 | ggc | 5 atgf | 18 |
comp | 2987712..2987788 | atgf | 8 ggc | 35 |
comp | 2987824..2987899 | ggc | 50 | |
comp | 2987950..2988025 | ggc | 49 | |
comp | 2988075..2988150 | ggc | 49 | |
comp | 2988200..2988275 | ggc | 30 | |
comp | 2988306..2988382 | atgf | 55 | |
comp | 2988438..2988513 | ggc | 30 | |
comp | 2988544..2988620 | atgf | 39 | |
comp | 2988660..2988735 | ggc | 19 | |
comp | 2988755..2988831 | atgf | 35 | |
comp | 2988867..2988942 | ggc | ||
comp | 3060924..3061000 | tgg | 68 | |
comp | 3061069..3061145 | gac | 30 | |
comp | 3061176..3061291 | 5s | 73 | |
comp | 3061365..3064280 | 23s | 257 | |
comp | 3064538..3064613 | gta | 14 | |
comp | 3064628..3064703 | gca | 32 | |
comp | 3064736..3064811 | aaa | 2 | |
comp | 3064814..3064889 | gaa | 80 | |
comp | 3064970..3066531 | 16s | @3 | 319 |
comp | 3066851..3066966 | 5s | 73 | |
comp | 3067040..3069955 | 23s | 261 | |
comp | 3070217..3071778 | 16s | ||
comp | 3105094..3105169 | acc | 13 | |
comp | 3105183..3105257 | gga | 35 | |
comp | 3105293..3105377 | tac | 36 | |
comp | 3105414..3105489 | aca | ||
comp | 3111073..3111149 | gac | 30 | |
comp | 3111180..3111295 | 5s | 73 | |
comp | 3111369..3114284 | 23s | 261 | |
comp | 3114546..3116107 | 16s | @1 | 317 |
comp | 3116425..3116540 | 5s | 73 | |
comp | 3116614..3119529 | 23s | 261 | |
comp | 3119791..3121352 | 16s | ||
comp | 3175944..3176034 | tca | 69 | |
comp | 3176104..3176219 | 5s | 73 | |
comp | 3176293..3179211 | 23s | 257 | |
comp | 3179469..3179544 | gca | 41 | |
comp | 3179586..3179662 | atc | 56 | |
comp | 3179719..3181280 | 16s | @2 | |
comp | 3217187..3217263 | gac | 30 | |
comp | 3217294..3217409 | 5s | 73 | |
comp | 3217483..3220398 | 23s | 59 | |
3220458..3220655 | cds2 | 55 | ||
comp | 3220711..3220786 | gta | 30 | |
comp | 3220817..3220892 | aaa | 2 | |
comp | 3220895..3220970 | gaa | 80 | |
comp | 3221051..3222612 | 16s | ||
chr2 | ||||
132908..134469 | 16s | 80 | ||
134550..134625 | gaa | 2 | ||
134628..134703 | aaa | 16 | ||
134720..134795 | gca | 14 | ||
134810..134885 | gta | 54 | ||
comp | 134940..135122 | cds3 | 19 | |
135142..138059 | 23s | 73 | ||
138133..138248 | 5s | 69 | ||
138318..138408 | tca | |||
comp | 192886..192969 | ctc | ||
comp | 591931..592021 | tca | ||
comp | 1009457..1009530 | tgc | 73 | |
comp | 1009604..1009690 | tta | ||
comp | 1021568..1021641 | tgc | 73 | |
comp | 1021715..1021801 | tta | ||
comp | 1029973..1030048 | ggc | 3 | |
comp | 1030052..1030125 | tgc | ||
1125193..1125267 | gga |
vpb cumuls[modifier | modifier le wikicode]
- Note: Les statistiques sur les intercalaires entre tRNA ne sont pas correctes. Se reporter à intergen51.vpb. Il n'y a aucun commentaire sur les CDS. J'ai réduit le tableau aux clusters à rRNA. L'intitulé opéron doit d'être compris dans le sens cluster ou bloc de RNA, rRNA ou tRNA.
vpb cumuls opérons effectif avec rRNA opérons 9 16 23 5s 0 0 16 atc gca 2 16 23 5s a 1 max a 6 a doubles 0 spéciaux 6 total aas 33 sans opérons 25 1 aa 11 max a 19 a doubles 8 total aas 93 total aas 126 remarques 5
vpb blocs[modifier | modifier le wikicode]
- Lien tableur: vpb blocs
16s | 80 | 16s | 80 | 16s | 80 | ||
gaa | 2 | gaa | 2 | gaa | 2 | ||
aaa | 30 | aaa | 30 | aaa | 16 | ||
gta | 55 | gta | 55 | gca | 14 | ||
cds 198 | 59 | cds 198 | 59 | gta | 54 | ||
23s | 73 | 23s | 73 | cds 180 | 19 | ||
5s | 5s | 30 | 23s | 73 | |||
gac | 5s | 69 | |||||
tca | |||||||
16s | 56 | 16s | 56 | 16s | 88 | 16s | 80 |
atc | 41 | atc | 41 | gcc | 12 | gaa | 258 |
gca | 257 | gca | 257 | gaa | 258 | 23s | 73 |
23s | 73 | 23s | 73 | 23s | 73 | 5s | 30 |
5s | 100 | 5s | 69 | 5s | 30 | gac | |
acc | 57 | tca | gac | ||||
5s | 31 | ||||||
gac | |||||||
16s | 261 | 16s | 261 | ||||
23s | 73 | 23s | 73 | ||||
5s | 319 | 5s | 317 | ||||
16s | 80 | 16s | 261 | ||||
gaa | 2 | 23s | 73 | ||||
aaa | 32 | 5s | 30 | ||||
gca | 14 | gac | |||||
gta | 257 | ||||||
23s | 73 | ||||||
5s | 30 | ||||||
gac |
vpb remarques[modifier | modifier le wikicode]
- Remarques : 2 chromosomes circulaires. EFTU et beaucoup de doubles.
- @1 Blocs 16-23-5s, il y en a 3 dont 2 sont sur un opéron avec 1 aa. Le 4ème appartient à un opéron spécial.
- - Les 3 ont les mêmes Intercalaires, 73 261. L’intercalaire 23-5s se retrouve dans tout les autres opérons.
- - Les 2 blocs accolés sont séparés du reste par de grands intercalaires, 320 bases.
- @2 Les opérons 16-atc-gca sont au nombre de 2 avec 3 aas en plus.
- - 4 de leurs intercalaires, 73 257 41 56, sont identiques et le 5ème est du même ordre de grandeur, 100 69.
- - Un opéron est clasisque et a un aa en plus, le 2ème a la séquence 5s-aa-5s-aa donc 2 aa en +.
- @3 Les opérons analogues aux 16-atc-gca sont au nombre de 3 et ont 2 intercalaires en commun avec eux, 257 73 correspondant à aa-23s-5s.
- - Un opéron 16-gcc-gaa-23s-5s avec 2 aas entre les 2 rRNAs. Il a 4 aas.
- - Un opéron 16-gaa-23s-5s avec 1 aa entre les 2 rRNAs. Il a 3 aas.
- - Un opéron 16-gaa-3aas-23s-5s avec 4 aas entre les 2 rRNAs. Il a 6 aas.
- @4 Les opérons analogues aux 16-atc-gca avec une protéine sont au nombre de 3 et ont l’intercalaire 73 du 23s-5s comme tous les autres opérons.
- - Différence importante avec lam qui a des opérons analogues, la protéine est dans le brin complémentaire du brin des RNAs. Alors que dans lam protéine et RNAs sont sur le même brin.
- - La séquence est 16s-gaa-aaa-xxx-gta-protéine-23s-5s et les 3 opérons ont en commun les 4 mêmes intercalaires, 16s-80-aaa-2-xxx-gta-55-protéine-23s-73-5s.
- - Deux opérons, sans xxx, sont identiques en aas, intercalaires et protéines mais un a un aa en plus après 5s. Ils ont respectivement 3 et 4 aas.
- - Un opéron a une protéine plus petite, 180 aas au lieu de 198, avec xxx=gca entre les rRNAs plus 1 au-delà du 5s, soit 5 aas au total.
- - Note du 4.10.20: contrôle des cds au 10.2.20 du NCBI, 0 cds.
- @5 L’opéron 9cgt 2agc a une intercalaire élevée, 320 bases.
- @1 Blocs 16-23-5s, il y en a 3 dont 2 sont sur un opéron avec 1 aa. Le 4ème appartient à un opéron spécial.
- Séquences des doubles : beaucoup de doubles et de séquences répétées comme cbn.
- - 8 opérons sur 14 à 2aas et plus sont remarquables :
opéron n*séquence cgg+4 2*2 10 cta 5caa 4atg 3*4 4 tac 4*1 2 gtc 2*1 9 cgt 2agc 8*1 ttc+6 2*3 ttc+4 2*2 8 ggc 5atgf 5*2
vpb distribution[modifier | modifier le wikicode]
- Lien tableur: vpb distribution
- Notes:
- - gtc2 cta2+2 tac4 cgt8 ggc4
- - acc: 5s + >1aa
- - tca: 2 5s + 2 1aa
- - Séquences:
- (cac cca)2
- (cgt agc)2
- ttc (aca aac)2
- ttc (aca ttc aac)2
- cta (cta atgj cta caa)2 (cta caa)2 cta (cta atgj) caa (cta atgj)
- (atgf ggc)2 ggc3 (atgf ggc)3
g1 | t1 | ||||||
---|---|---|---|---|---|---|---|
atgi | 1 | tct | tat | atgf | 6 | ||
att | act | aat | agt | ||||
ctt | cct | cat | cgc | ||||
gtt | gct | gat | ggt | ||||
ttc | 4 | tcc | 1 | tac | 5 | tgc | 4 |
atc | 2 | acc | 2 | aac | 5 | agc | 2 |
ctc | 2 | ccc | cac | 2 | cgt | 9 | |
gtc | 2 | gcc | 1 | gac | 6 | ggc | 11 |
tta | 3 | tca | 4 | taa | tga | ||
ata | aca | 5 | aaa | 4 | aga | 1 | |
cta | 10 | cca | 3 | caa | 5 | cga | |
gta | 4 | gca | 4 | gaa | 6 | gga | 2 |
ttg | 1 | tcg | tag | tgg | 3 | ||
atgj | 4 | acg | aag | agg | 1 | ||
ctg | ccg | cag | cgg | 1 | |||
gtg | gcg | gag | ggg | ||||
gama | >1aa | =1aa | -5s | +5s | -16s | +16s | total |
vpb | 82 | 11 | 12 | 21 | 126 |
vpb1. Intergen51[modifier | modifier le wikicode]
Intergen51. vpb1. Le génome[modifier | modifier le wikicode]
- vpb1 Le prélèvement: gama
- Le nom et le lien NCBI: vpb1, Vibrio parahaemolyticus BB22OP chromosome 1, NCBI [8], date 20.02.22.
- vpb1 La longueur totale des intercalaires, longueur du génome et taux intercalaires/génome:
Nom intercals génome taux en % vpb1 403,530 3,297,305 12.2
vpb1 données intercalaires[modifier | modifier le wikicode]
- Lien tableur: vpb1 données intercalaires
- Lien sauvegarde NCBI:gama
vpb1 données intercalaires 200[modifier | modifier le wikicode]
- Lien tableur: données intercalaires 200.
vpb1 autres intercalaires aas[modifier | modifier le wikicode]
- Lien tableur: vpb1 autres intercalaires aas
- Lien sauvegarde NCBI:gama
Intergen51. vpb1. Les différents types d'intercalaires[modifier | modifier le wikicode]
- Lien au tableur: Intergen51. vpb1 les différents types d'intercalaires.
- Légende:
- - S pour intercalaire CDS-CDS et R pour tRNA-CDS,
- - c pour intercalaire continu (les 2 gènes sont sur le même brin) et x pour discontinu (les 2 gènes sont sur 2 brins différents, le brin et son complément)
- - %reste = 100*reste/total, le reste étant ce qui reste du total après la fin du diagramme, gamme.
- - %t30 = 100*t30/total, t30 étant le total des fréquences 10 20 30
- - %t5 = 100*t/total, t5 étant le total des fréquences de -1 à -5 dans le diagramme des S-.
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
Intergen51. vpb1. Les diagrammes CDS-CDS positifs[modifier | modifier le wikicode]
- Lien tableur: Les diagrammes
- Diagrammes des gamma: vpb1 présente 2 diagrammes
- - fc40, CDS-CDS continu, fréquence unitaire en abscisses et effectif en ordonnées
- - fx%, CDS-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et pourcentage en ‰ par rapport au total, en ordonnées.
- Équations des courbes de tendance en pour 1000: colonnes %fx %fc
Courbes de tendances pour les diagrammes en pour 1000 Calculs des f.41 vpb1 R2 x3 x2 x c Inflexion poly3 x c 0.539 5.80E-06 -3.66E-03 5.44E-01 16.10 fx1 abscisse 574.0 214.3 0.786 -6.92E-06 5.11E-03 -1.23E+00 110.0 fc1 ordonnée 24.1 17.1 0.749 -6.04E-07 1.04E-03 -5.00E-01 82.7 fx41 0.947 1.82E-06 -1.17E-03 1.15E-01 28.3 fc41
Intergen51. vpb1. Les CDS-CDS négatifs[modifier | modifier le wikicode]
Sous-totaux vpb1 totale fréquence x- c- x- c- - 1 0 83 4 4140 - 2 0 0 85 11 - 3 0 0 3 12 - 4 2 115 717 10938 - 5 0 0 5 19 sp6 11 146 1642 8424 total 13 344 2,456 23,544 reste 1 0 264 420 s6 3 0 361 41 s7 1 21 321 1438 s8 6 125 696 6525 rappot s1-5 4/2/1 - 1.4 8.4 2.6 % / sp6 s6/sp6 27.3 0.0 22.0 0.5 s7/sp6 9.1 14.4 19.5 17.1 s8/sp6 54.5 85.6 42.4 77.5 reste/sp6 9.1 0.0 16.1 5.0 total s1-5 2 198 814 15120 % / total %s1-5 15.4 57.6 33.1 64.2 %sp6 84.6 42.4 66.9 35.8
Intergen51. vpb1. Les intercalaires des blocs[modifier | modifier le wikicode]
- Le détail
RNA-RNA c x CDS-RNA c x 23s 5s 10 CDS 16s 6 2 16s 23s 3 5s CDS 1 16s tRNA 7 16 CDS tRNA 23s 7 CDS 5s 5s tRNA 8 23s CDS tRNA in 10 CDS 23s tRNA contig 3 5s 16s 2 tRNA hors 64 16s16s tRNA 16s 23s tRNA tRNA 5s 1 16s 5s 5s 23s 5s 5s total 113 0 total 8 3
- Les rares voir gamma pour la longueur des intercalaires
- Les tRNA-CDS compris, comparaison dans le clade et dans l'étude.
Intergen51. vpb1. Les intercalaires tRNA-tRNA extra bloc[modifier | modifier le wikicode]
- Lien tableur: Intergen51. vpb1. Les intercalaires tRNA-tRNA extra bloc
contig aa 35 gac ** tgg 68 tgg ** gac 68 tgg ** gac
inter | aa | inter | aa | inter | aa | inter | aa | |||
---|---|---|---|---|---|---|---|---|---|---|
32 | cgg | 81 | tac | 31 | cgt | 56 | atgf | |||
72 | cac | 81 | tac | ** | agc | 18 | ggc | |||
49 | cac | 81 | tac | 64 | ttc | 35 | atgf | |||
24 | cac | ** | tac | 7 | aca | 50 | ggc | |||
** | cac | 32 | gtc | 70 | ttc | 49 | ggc | |||
29 | cta | ** | gtc | 71 | aac | 49 | ggc | |||
47 | cta | 10 | ggc | 7 | aca | 30 | ggc | |||
24 | atgj | 76 | tta | 43 | ttc | 55 | atgf | |||
52 | cta | 20 | ggc | ** | aac | 30 | ggc | |||
29 | caa | ** | tgc | 51 | ttc | 39 | atgf | |||
53 | cta | 56 | atgf | 21 | aca | 19 | ggc | |||
24 | atgj | ** | ctc | 39 | aac | 35 | atgf | |||
52 | cta | 56 | cgt | 15 | aca | ** | ggc | |||
29 | caa | 57 | cgt | ** | aac | 13 | acc | |||
54 | cta | 57 | cgt | 35 | gga | |||||
29 | caa | 57 | cgt | 36 | tac | |||||
35 | cta | 57 | cgt | ** | aca | |||||
48 | caa | 56 | cgt | |||||||
31 | cta | 210 | cgt | |||||||
77 | cta | 31 | cgt | |||||||
77 | atgj | ** | agc | |||||||
31 | caa | |||||||||
40 | cta | |||||||||
** | atgj |
vpb2. Intergen51[modifier | modifier le wikicode]
Intergen51. vpb2. Le génome[modifier | modifier le wikicode]
- vpb2 Le prélèvement: gama
- Le nom et le lien NCBI: vpb2, Vibrio parahaemolyticus BB22OP chromosome 2, NCBI [9], date 20.02.22.
- vpb2 La longueur totale des intercalaires, longueur du génome et taux intercalaires/génome:
Nom intercals génome taux en % vpb2 242,529 1,806,219 13.4
vpb2 données intercalaires[modifier | modifier le wikicode]
- Lien tableur: vpb2 données intercalaires
- Lien sauvegarde NCBI:gama
vpb2 données intercalaires 200[modifier | modifier le wikicode]
- Lien tableur: données intercalaires 200.
vpb2 autres intercalaires aas[modifier | modifier le wikicode]
- Lien tableur: vpb2 autres intercalaires aas
- Lien sauvegarde NCBI:gama
Intergen51. vpb2. Les différents types d'intercalaires[modifier | modifier le wikicode]
- Lien au tableur: Intergen51. vpb2 les différents types d'intercalaires.
- Légende:
- - S pour intercalaire CDS-CDS et R pour tRNA-CDS,
- - c pour intercalaire continu (les 2 gènes sont sur le même brin) et x pour discontinu (les 2 gènes sont sur 2 brins différents, le brin et son complément)
- - %reste = 100*reste/total, le reste étant ce qui reste du total après la fin du diagramme, gamme.
- - %t30 = 100*t30/total, t30 étant le total des fréquences 10 20 30
- - %t5 = 100*t/total, t5 étant le total des fréquences de -1 à -5 dans le diagramme des S-.
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
Intergen51. vpb2. Les diagrammes CDS-CDS positifs[modifier | modifier le wikicode]
- Lien tableur: Les diagrammes
- Diagrammes des gamma: vpb2 présente 2 diagrammes
- - fc40, CDS-CDS continu, fréquence unitaire en abscisses et effectif en ordonnées
- - fx%, CDS-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et pourcentage en ‰ par rapport au total, en ordonnées.
- Équations des courbes de tendance en pour 1000: colonnes %fx %fc
Courbes de tendances pour les diagrammes en pour 1000 Calculs des f.41 vpb2 R2 x3 x2 x c Inflexion poly3 x c 0.570 5.31E-06 -3.50E-03 5.58E-01 12.10 fx1 abscisse 161.6 185.9 0.735 -6.33E-06 4.65E-03 -1.11E+00 99.2 fc1 ordonnée 29.8 19.7 0.672 1.64E-06 -7.95E-04 -4.75E-02 51.3 fx41 0.764 7.96E-07 -4.44E-04 -2.56E-02 34.7 fc41
Intergen51. vpb2. Les CDS-CDS négatifs[modifier | modifier le wikicode]
Sous-totaux vpb2 totale fréquence x- c- x- c- - 1 0 50 4 4140 - 2 1 0 85 11 - 3 0 0 3 12 - 4 4 53 717 10938 - 5 0 0 5 19 sp6 9 68 1642 8424 total 14 171 2,456 23,544 reste 1 0 264 420 s6 3 0 361 41 s7 0 6 321 1438 s8 5 62 696 6525 rappot s1-5 4/2/1 4 1.1 8.4 2.6 % / sp6 s6/sp6 33.3 0.0 22.0 0.5 s7/sp6 0.0 8.8 19.5 17.1 s8/sp6 55.6 91.2 42.4 77.5 reste/sp6 11.1 0.0 16.1 5.0 total s1-5 5 103 814 15120 % / total %s1-5 35.7 60.2 33.1 64.2 %sp6 64.3 39.8 66.9 35.8
Intergen51. vpb2. Les intercalaires des blocs[modifier | modifier le wikicode]
- Le détail
RNA-RNA c x CDS-RNA c x 23s 5s 1 CDS 16s 1 16s 23s 5s CDS 16s tRNA 1 16 CDS tRNA 23s 1 CDS 5s 5s tRNA 1 23s CDS tRNA in 3 CDS 23s tRNA contig 5s 16s tRNA hors 3 16s16s tRNA 16s 23s tRNA tRNA 5s 16s 5s 5s 23s 5s 5s total 10 0 total 1 0
- Les rares voir gamma pour la longueur des intercalaires
- Les tRNA-CDS compris, comparaison dans le clade et dans l'étude.
Intergen51. vpb2. Les intercalaires tRNA-tRNA extra bloc[modifier | modifier le wikicode]
- Lien tableur: Intergen51. vpb2. Les intercalaires tRNA-tRNA extra bloc
hors b aa 73 tgc ** tta 73 tgc ** tta 3 ggc ** tgc
Escherichia albertii[modifier | modifier le wikicode]
eal opérons[modifier | modifier le wikicode]
- Liens: gtRNAdb [10], NCBI [11], génome [orgn]
- Lien tableur: eal opérons
49.6%GC | 10.3.19 Paris | 89 | doubles | interca |
---|---|---|---|---|
219063..219144 | tac | + | 212 | |
219357..219438 | tac | 2 tac | ||
413135..413219 | tcc | |||
462888..462972 | tca | |||
comp | 489120..489191 | gga | 6 | |
comp | 489198..489270 | aca | ||
615149..615233 | tcc | |||
comp | 756823..756895 | aaa | + | 5 |
comp | 756901..756973 | gta | 3 aaa | 48 |
comp | 757022..757094 | aaa | 2 gta | 5 |
comp | 757100..757172 | gta | 48 | |
comp | 757221..757293 | aaa | ||
834529..834602 | atgj | + | 10 | |
834613..834694 | cta | 2atgj | 26 | |
834721..834792 | caa | 2caa | 37 | |
834830..834901 | caa | 2 cag | 18 | |
834920..834993 | atgj | 51 | ||
835045..835116 | cag | 35 | ||
835152..835223 | cag | |||
comp | 968958..969031 | aga | ||
comp | 1192416..1192488 | acg | ||
comp | 1269526..1269599 | gac | ||
comp | 1277040..1277113 | gac | 52 | |
comp | 1277166..1277285 | 5s | @1 | 169 |
comp | 1277455..1280377 | 23s | 186 | |
comp | 1280564..1280636 | gca | 45 | |
comp | 1280682..1280755 | atc | 70 | |
comp | 1280826..1282367 | 16s | ||
1567231..1567314 | ctg | + | 31 | |
1567346..1567429 | ctg | 3 ctg | 35 | |
1567465..1567548 | ctg | |||
comp | 1657309..1657390 | ttg | ||
comp | 1765401..1765473 | ggc | + | 159 |
comp | 1765633..1765705 | ggc | 2 ggc | |
1795516..1795588 | ttc | |||
comp | 2006002..2006121 | 5s | 169 | |
comp | 2006291..2009214 | 23s | 186 | |
comp | 2009401..2009473 | gca | 45 | |
comp | 2009519..2009592 | atc | 70 | |
comp | 2009663..2011202 | 16s | ||
comp | 2042057..2043241 | tuf1 | CDS 1185pb | 117 |
comp | 2043359..2043431 | acc | 9 | |
comp | 2043441..2043512 | gga | 119 | |
comp | 2043632..2043713 | tac | 11 | |
comp | 2043725..2043797 | aca | @3 | |
comp | 2047429..2047548 | 5s | 169 | |
comp | 2047718..2050648 | 23s | 186 | |
comp | 2050835..2050907 | gca | 45 | |
comp | 2050953..2051026 | atc | 68 | |
comp | 2051095..2052636 | 16s | ||
comp | 2208305..2208424 | 5s | @2 | 169 |
comp | 2208594..2211517 | 23s | 198 | |
comp | 2211716..2211788 | gaa | 85 | |
comp | 2211874..2213418 | 16s | ||
comp | 2267554..2267627 | cca | 43 | |
comp | 2267671..2267754 | ctg | 23 | |
comp | 2267778..2267850 | cac | 61 | |
comp | 2267912..2267985 | cgg | ||
comp | 2305358..2305430 | tgg | 11 | |
comp | 2305442..2305515 | gac | 52 | |
comp | 2305568..2305687 | 5s | 169 | |
comp | 2305857..2308779 | 23s | 198 | |
comp | 2308978..2309050 | gaa | 85 | |
comp | 2309136..2310676 | 16s | ||
comp | 2426158..2426248 | tga | ||
2556305..2556378 | ccg | |||
2810766..2812307 | 16s | 85 | ||
2812393..2812465 | gaa | 198 | ||
2812664..2815586 | 23s | 169 | ||
2815756..2815875 | 5s | 151 | ||
2816027..2816099 | acc | 40 | ||
2816140..2816259 | 5s | |||
2911129..2911212 | ctc | |||
2913088..2913161 | atgf | |||
comp | 3010332..3010404 | atgi | ||
comp | 3177717..3177789 | ttc | ||
3301617..3301687 | ggg | |||
comp | 3366868..3366941 | atgf | + | 37 |
comp | 3366979..3367052 | atgf | 3 atgf | 37 |
comp | 3367090..3367163 | atgf | ||
3469914..3470003 | agc | 6 | ||
3470010..3470083 | cgt | + | 201 | |
3470285..3470358 | cgt | 3 cgt | 200 | |
3470559..3470632 | cgt | |||
3505321..3505393 | atgi | |||
3563056..3564598 | 16s | 85 | ||
3564684..3564756 | gaa | 198 | ||
3564955..3567876 | 23s | 169 | ||
3568046..3568165 | 5s | |||
comp | 3779750..3779822 | aaa | 7 | |
comp | 3779830..3779902 | gta | + | 47 |
comp | 3779950..3780022 | gta | 2 gta | |
3782718..3782790 | gcc | + | 42 | |
3782833..3782905 | gcc | 2 gcc | ||
comp | 3810369..3810440 | agg | ||
comp | 3993500..3993573 | ccc | ||
comp | 4232176..4232248 | aac | ||
4233996..4234068 | aac | |||
comp | 4242952..4243024 | aac | ||
comp | 4248342..4248414 | aac | ||
4249406..4249492 | tcg | |||
4256696..4256768 | atgi | 100 | ||
4256869..4256942 | aga | |||
4317980..4318052 | ggc | 56 | ||
4318109..4318179 | tgc | 14 | ||
4318194..4318277 | tta | |||
comp | 4556753..4556826 | gtc | + | 7 |
comp | 4556834..4556907 | gtc | 2 gtc |
eal cumuls[modifier | modifier le wikicode]
- Note: Les statistiques sur les intercalaires entre tRNA ne sont pas correctes. Se reporter à intergen51.eal. Il n'y a aucun commentaire sur les CDS. J'ai réduit le tableau aux clusters à rRNA. L'intitulé opéron doit d'être compris dans le sens cluster ou bloc de RNA, rRNA ou tRNA.
eal cumuls opérons effectif avec rRNA opérons 7 16 23 5s 0 0 16 atc gca 3 16 23 5s a 0 max a 3 a doubles 0 spéciaux 4 total aas 13 sans opérons 38 1 aa 23 max a 7 a doubles 10 total aas 71 total aas 84 remarques 3
eal blocs[modifier | modifier le wikicode]
- Lien tableur: eal blocs
16s | 70 | 70 | 68 |
atc | 45 | 45 | 45 |
gca | 186 | 186 | 186 |
23s | 169 | 169 | 169 |
5s | 52 | ||
gac | |||
16s | 85 | 85 | 85 |
gaa | 198 | 198 | 198 |
23s | 169 | 169 | 169 |
5s | 52 | ||
gac | |||
16s | 85 | ||
gaa | 198 | ||
23s | 169 | ||
5s | 151 | ||
acc | 40 | ||
5s |
eal remarques[modifier | modifier le wikicode]
- Remarques : Pas de blocs 16-23-5s, un nouveau bloc 16-gaa-23-5s, beaucoup de doubles.
- @1 Les blocs 16-atc gca-23-5s sont au nombre de 3 avec 1 seul aa en plus.
- - Les intercalaires sont les mêmes pour les 3 opérons, 70 45 186 169.
- - Un seul opéron a un aa en plus.
- @2 4 nouveaux blocs analogues aux précédents, 16-gaa-23-5s.
- - Les intercalaires sont les mêmes pour les 4 opérons, 85 198 169.
- - Elles sont, dans le même ordre, analogue à celles des blocs 16-atc gca-23-5s.
- - Les aas suplémentaires sont absents pour 2 opérons et sont 2 pour un autre.
- - Le 4ème opéron a 1 aa et 1 5s en supplément.
- @3 2 opérons tRNAs+protéine : tactac-tpr et acatacggaacc-tufB
- Séquences des doubles : beaucoup de doubles mais peu de séquences répétées.
- - 5 opérons à 2 aas répétés
- - 3 opérons à 3 aas répétés
- - L'opéron au maximum de 7 aas a 2 répétitions de 2 aas en séquence et la 3ème a ses 2 aas séparés : atg cta 2caa atg 2cag.
- - Un opéron à 5 aas a une séquence répétée, aaa + 2*2.
- - 5 opérons sans répétitions
eco eal Opérons sans rRNAs avec doubles 2tac 2tac 2gtc 2gtc 2gcc 2gcc 3ctg 3ctg 3atgf 3atgf atg cta 2caa atg 2cag atg cta 2caa atg 2cag Remaniements des répétitions 3ggc 2ggc aaa 3gta aaa 2gta agc 4cgt agc 3cgt 5aaa 2gta 3aaa 2gta Opérons sans rRNAs sans doubles tta tgc ggc tta tgc ggc cgg cac ctg cca cgg cac ctg cca aca tac gga acc aca tac gga acc Disparition de 2 opérons chez eco - atgi aga - gga aca
- Notes :
eal distribution[modifier | modifier le wikicode]
- Lien tableur: eal distribution
- Notes:
- - gtc2 gta2 ctg3 gcc2 tac2 caa2 cag2 atgf3 cgt3 ggc2
- - atgi: 2 1aa + 1 >1aa
- - gac: 1aa + 2 5s
- - Séquences:
- aaa (gta aaa)2
g1 | t1 | ||||||
---|---|---|---|---|---|---|---|
atgi | 3 | tct | tat | atgf | 4 | ||
att | act | aat | agt | ||||
ctt | cct | cat | cgc | ||||
gtt | gct | gat | ggt | ||||
ttc | 2 | tcc | 2 | tac | 3 | tgc | 1 |
atc | 3 | acc | 2 | aac | 4 | agc | 1 |
ctc | 1 | ccc | 1 | cac | 1 | cgt | 3 |
gtc | 2 | gcc | 2 | gac | 3 | ggc | 3 |
tta | 1 | tca | 1 | taa | tga | 1 | |
ata | aca | 2 | aaa | 4 | aga | 2 | |
cta | 1 | cca | 1 | caa | 2 | cga | |
gta | 4 | gca | 3 | gaa | 4 | gga | 2 |
ttg | 1 | tcg | 1 | tag | tgg | 1 | |
atgj | 2 | acg | 1 | aag | agg | 1 | |
ctg | 4 | ccg | 1 | cag | 2 | cgg | 1 |
gtg | gcg | gag | ggg | 1 | |||
gama | >1aa | =1aa | -5s | +5s | -16s | +16s | total |
eal | 48 | 23 | 4 | 10 | 85 |
eal intergen51[modifier | modifier le wikicode]
Intergen51. eal. Le génome[modifier | modifier le wikicode]
- eal Le prélèvement: gama
- Le nom et le lien NCBI: eal, Escherichia albertii KF1, NCBI [12], date 28.2.14.
- eal La longueur totale des intercalaires, longueur du génome et taux intercalaires/génome:
Nom intercals génome taux en % eal 594,081 4,701,875 12.6
eal données intercalaires[modifier | modifier le wikicode]
- Lien tableur: eal données intercalaires
- Lien sauvegarde NCBI: gama
eal données intercalaires 200[modifier | modifier le wikicode]
- Lien tableur: données intercalaires 200.
eal autres intercalaires aas[modifier | modifier le wikicode]
- Lien tableur: eal autres intercalaires aas
- Lien sauvegarde NCBI: gama
Intergen51. eal. Les différents types d'intercalaires[modifier | modifier le wikicode]
- Lien au tableur: Intergen51. eal les différents types d'intercalaires.
- Légende:
- - S pour intercalaire CDS-CDS et R pour tRNA-CDS,
- - c pour intercalaire continu (les 2 gènes sont sur le même brin) et x pour discontinu (les 2 gènes sont sur 2 brins différents, le brin et son complément)
- - %reste = 100*reste/total, le reste étant ce qui reste du total après la fin du diagramme, gamme.
- - %t30 = 100*t30/total, t30 étant le total des fréquences 10 20 30
- - %t5 = 100*t/total, t5 étant le total des fréquences de -1 à -5 dans le diagramme des S-.
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
Intergen51. eal. Les diagrammes CDS-CDS positifs[modifier | modifier le wikicode]
- Lien tableur: Les diagrammes
- Diagrammes des gamma: eal présente 2 diagrammes
- - fc40, CDS-CDS continu, fréquence unitaire en abscisses et effectif en ordonnées
- - fx%, CDS-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et pourcentage en ‰ par rapport au total, en ordonnées.
- Équations des courbes de tendance en pour 1000: colonnes %fx %fc
Courbes de tendances pour les diagrammes en pour 1000 Calculs des f.41 eal R2 x3 x2 x c Inflexion poly3 x c 0.697 2.04E-06 -1.21E-03 9.15E-02 36.00 fx1 abscisse 348.9 349.1 0.837 -6.99E-06 5.31E-03 -1.31E+00 115.0 fc1 ordonnée 9.0 4.6 0.791 -8.80E-07 9.21E-04 -3.75E-01 65.1 fx41 0.966 -9.74E-07 1.02E-03 -4.00E-01 61.4 fc41
Intergen51. eal. Les CDS-CDS négatifs[modifier | modifier le wikicode]
Sous-totaux eal totale fréquence x- c- x- c- - 1 0 157 4 4140 - 2 4 0 85 11 - 3 0 0 3 12 - 4 39 250 717 10938 - 5 0 0 5 19 sp6 76 210 1642 8424 total 119 617 2,456 23,544 reste 7 4 264 420 s6 23 0 361 41 s7 16 42 321 1438 s8 30 164 696 6525 rappot s1-5 4/2/1 9.75 1.6 8.4 2.6 % / sp6 s6/sp6 30.3 0.0 22.0 0.5 s7/sp6 21.1 20.0 19.5 17.1 s8/sp6 39.5 78.1 42.4 77.5 reste/sp6 9.2 1.9 16.1 5.0 total s1-5 43 407 814 15120 % / total %s1-5 36.1 66.0 33.1 64.2 %sp6 63.9 34.0 66.9 35.8
Intergen51. eal. Les intercalaires des blocs[modifier | modifier le wikicode]
- Le détail
RNA-RNA c x CDS-RNA c x 23s 5s 7 CDS 16s 3 4 16s 23s 5s CDS 2 3 16s tRNA 7 16 CDS tRNA 23s 7 CDS 5s 5s tRNA 3 23s CDS tRNA in 3 CDS 23s tRNA contig 1 5s 16s tRNA hors 33 16s16s tRNA 16s 23s tRNA tRNA 5s 1 16s 5s 5s 23s 5s 5s total 62 0 total 5 7
- Les rares voir gamma pour la longueur des intercalaires
- Les tRNA-CDS compris, comparaison dans le clade et dans l'étude.
Intergen51. eal. Les intercalaires tRNA-tRNA extra bloc[modifier | modifier le wikicode]
- Lien tableur: Intergen51. eal. Les intercalaires tRNA-tRNA extra bloc
inter | aa | inter | aa | inter | aa | ||
---|---|---|---|---|---|---|---|
212 | tac | 31 | ctg | 6 | agc | ||
** | tac | 35 | ctg | 201 | cgt | ||
6 | gga | ** | ctg | 200 | cgt | ||
** | aca | 159 | ggc | ** | cgt | ||
5 | aaa | ** | ggc | 7 | aaa | ||
48 | gta | 9 | acc | 47 | gta | ||
5 | aaa | 119 | gga | ** | gta | ||
48 | gta | 11 | tac | 42 | gcc | ||
** | aaa | ** | aca | ** | gcc | ||
10 | atgj | 43 | cca | 100 | atgi | ||
26 | cta | 23 | ctc | ** | aga | ||
37 | caa | 61 | cac | 56 | ggc | ||
18 | caa | ** | cgg | 14 | tgc | ||
51 | atgj | 37 | atgf | ** | tta | ||
35 | cag | 37 | atgf | 7 | gtc | ||
** | cag | ** | atgf | ** | gtc |
Escherichia coli[modifier | modifier le wikicode]
eco opérons[modifier | modifier le wikicode]
- Liens: gtRNAdb [13], NCBI [14], génome [orgn]
- Lien tableur: eco opérons
50.6%GC | 10.3.19 Paris | 89 | doubles | interca | EcoCyc | adIP |
---|---|---|---|---|---|---|
223771..225312 | 16s | 68 | opéron | |||
225381..225457 | atc | 42 | ileV | [15] | ||
225500..225575 | gca | 183 | « | |||
225759..228662 | 23s | 93 | « | |||
228756..228875 | 5s | @1 | 52 | « | ||
228928..229004 | gac | aspU | [16] | |||
236931..237007 | gac | |||||
262871..262946 | acg | |||||
564723..564799 | aga | |||||
comp | 696430..696504 | cag | + | 37 | opéron | |
comp | 696542..696616 | cag | 2 cag | 47 | glnT | [17] |
comp | 696664..696740 | atg | 2 atg | 15 | « | |
comp | 696756..696830 | caa | 2 caa | 34 | « | |
comp | 696865..696939 | caa | 23 | « | ||
comp | 696963..697047 | cta | 9 | « | ||
comp | 697057..697133 | atg | ||||
780554..780629 | aaa | + | 135 | lysT | [18] | |
780765..780840 | gta | 5 aaa | 2 | opéron | ||
780843..780918 | aaa | 2 gta | 149 | « | ||
781068..781143 | gta | 3 | valZ | [19] | ||
781147..781222 | aaa | 146 | opéron | |||
781369..781444 | aaa | 132 | lysZ | [20] | ||
781577..781652 | aaa | lysQ | [21] | |||
EcoCyc | [22] | |||||
comp | 925884..925971 | tcc | InfA-serW | [23] | ||
comp | 1031625..1031712 | tca | ||||
comp | 1097565..1097652 | tcc | ||||
comp | 1287087..1287176 | tpr | cds 90pb | 67 | tpr | |
comp | 1287244..1287328 | tac | + | 209 | opéron | |
comp | 1287538..1287622 | tac | 2 tac | tyrT | [24] | |
1746435..1746511 | gtc | + | 4 | valV | [25] | |
1746516..1746592 | gtc | 2 gtc | opéron | |||
«RNA 67pb | ||||||
comp | 1991815..1991901 | tta | 12 | leuZ | [26] | |
comp | 1991914..1991987 | tgc | 54 | « | ||
comp | 1992042..1992117 | ggc | opéron | |||
comp | 2043468..2043557 | tcg | ||||
2044549..2044624 | aac | |||||
comp | 2058027..2058102 | aac | ||||
2059851..2059926 | aac | |||||
2062260..2062335 | aac | |||||
2286211..2286287 | ccc | |||||
2466309..2466383 | agg | |||||
comp | 2518041..2518116 | gcc | + | 39 | alaX | [27] |
comp | 2518156..2518231 | gcc | 2 gcc | opéron | ||
2520931..2521006 | gta | + | 44 | valU | [28] | |
2521051..2521126 | gta | 3gta | 46 | opéron | ||
2521173..2521248 | gta | 4 | « | |||
2521253..2521328 | aaa | « | ||||
comp | 2726069..2726188 | 5s | @2 | 92 | opéron | |
comp | 2726281..2729184 | 23s | 184 | |||
comp | 2729369..2729444 | gaa | 171 | |||
comp | 2729616..2731157 | 16s | ||||
comp | 2785762..2785837 | atgi | ||||
comp | 2817784..2817860 | cgt | + | 198 | « | |
comp | 2818059..2818135 | cgt | 4 cgt | 62 | « | |
comp | 2818198..2818274 | cgt | 198 | « | ||
comp | 2818473..2818549 | cgt | 3 | opéron | ||
comp | 2818553..2818645 | agc | serV | [29] | ||
2947387..2947463 | atgf | + | 33 | opéron | ||
2947497..2947573 | atgf | 3 atgf | 33 | metW | [30] | |
2947607..2947683 | atgf | « | ||||
comp | 2998984..2999057 | ggg | ||||
3110366..3110441 | ttc | |||||
3215598..3215673 | atgi | |||||
comp | 3318213..3318289 | atgf | ||||
comp | 3322072..3322158 | ctc | ||||
comp | 3423423..3423542 | 5s | 37 | « | ||
comp | 3423580..3423655 | acc | 12 | « | ||
comp | 3423668..3423787 | 5s | 92 | « | ||
comp | 3423880..3426783 | 23s | 174 | « | ||
comp | 3426958..3427033 | gca | 42 | « | ||
comp | 3427076..3427152 | atc | 68 | ileU | [31] | |
comp | 3427221..3428762 | 16s | opéron | |||
comp | 3708616..3708692 | ccg | ||||
3836222..3836316 | tga | |||||
ecoliwiki | [32] | |||||
3941808..3943349 | 16s | 85 | gltU | [33] | ||
3943435..3943510 | gaa | 193 | opéron | |||
3943704..3946607 | 23s | 92 | « | |||
3946700..3946819 | 5s | 52 | « | |||
3946872..3946948 | gac | 8 | aspT | [34] | ||
3946957..3947032 | tgg | trpT | [35] | |||
3982375..3982451 | cgg | 57 | argX | [36] | ||
3982509..3982585 | cac | 20 | opéron | |||
3982606..3982692 | ctg | 42 | « | |||
3982735..3982811 | cca | « | ||||
4035531..4037072 | 16s | 68 | opéron | |||
4037141..4037217 | atc | 42 | ileT | [37] | ||
4037260..4037335 | gca | 183 | « | |||
4037519..4040423 | 23s | 93 | « | |||
4040517..4040636 | 5s | « | ||||
4166659..4168200 | 16s | 171 | opéron | |||
4168372..4168447 | gaa | 193 | ||||
4168641..4171544 | 23s | 92 | ||||
4171637..4171756 | 5s | |||||
4175388..4175463 | aca | @3 | 8 | thrU | [38] | |
4175472..4175556 | tac | 116 | opéron | |||
4175673..4175747 | gga | 6 | « | |||
4175754..4175829 | acc | 114 | « | |||
4175944..4177128 | tufb | cds 1185 pb | « | |||
4208147..4209688 | 16s | 85 | opéron | |||
4209774..4209849 | gaa | 193 | ||||
4210043..4212946 | 23s | 93 | ||||
4213040..4213159 | 5s | |||||
comp | 4362551..4362626 | ttc | ||||
4392360..4392435 | ggc | + | 36 | opéron | ||
4392472..4392547 | ggc | 3 ggc | 35 | glyX | [39] | |
4392583..4392658 | ggc | « | ||||
4496405..4496489 | ttg | |||||
comp | 4606079..4606165 | ctg | + | 34 | opéron | |
comp | 4606200..4606286 | ctg | 3 ctg | 28 | leuV | [40] |
comp | 4606315..4606401 | ctg | « |
eco cds[modifier | modifier le wikicode]
- Liens: gtRNAdb [41], NCBI [42], génome [orgn]
- Lien tableur: eco cds
- Légende
- - protéines1: metY-yhbC-nusA-infB-rbfA-truB-rpsO-pnp
- - protéine2: secG
- - évidence faible1, avec un pseudo.
cluster | 6.8.19 Paris | interca | cdsa | promoteur | terminateur | notes | |||
---|---|---|---|---|---|---|---|---|---|
222833..223408 | cds | 362 | 192 | sigma FIS | |||||
223771..225312 | 16s | 68 | |||||||
225381..225457 | atc | 42 | |||||||
225500..225575 | gca | 183 | |||||||
225759..228662 | 23s | 93 | |||||||
228756..228875 | 5s | 52 | |||||||
228928..229004 | gac | 162 | Terminateur | + sigma | |||||
229167..229970 | cds | 268 | |||||||
comp | 2724448..2725746 | cds | 322 | 433 | rien | début opéron | rien | ||
comp | 2726069..2726188 | 5s | 92 | ||||||
comp | 2726281..2729184 | 23s | 184 | ||||||
comp | 2729369..2729444 | gaa | 171 | ||||||
comp | 2729616..2731157 | 16s | 442 | sigma FIS | |||||
comp | 2731600..2734173 | cds | 858 | ||||||
3422436..3423194 | cds | 228 | 253 | Terminateur | fin opéron | rien | |||
comp | 3423423..3423542 | 5s | 37 | ||||||
comp | 3423580..3423655 | acc | 12 | ||||||
comp | 3423668..3423787 | 5s | 92 | ||||||
comp | 3423880..3426783 | 23s | 174 | ||||||
comp | 3426958..3427033 | gca | 42 | ||||||
comp | 3427076..3427152 | atc | 68 | ||||||
comp | 3427221..3428762 | 16s | 473 | sigma FIS | |||||
3429236..3429790 | cds | 185 | |||||||
comp | 3940635..3941327 | cds | 480 | 231 | sigma FIS | ||||
3941808..3943349 | 16s | 85 | |||||||
3943435..3943510 | gaa | 193 | |||||||
3943704..3946607 | 23s | 92 | |||||||
3946700..3946819 | 5s | 52 | |||||||
3946872..3946948 | gac | 8 | |||||||
3946957..3947032 | tgg | 95 | Terminateur | fin opéron | rien | ||||
comp | 3947128..3947967 | cds | 280 | ||||||
4034608..4035153 | cds | 377 | 182 | Sigma Lrp-leu | |||||
4035531..4037072 | 16s | 68 | |||||||
4037141..4037217 | atc | 42 | |||||||
4037260..4037335 | gca | 183 | |||||||
4037519..4040423 | 23s | 93 | |||||||
4040517..4040636 | 5s | 228 | |||||||
4040865..4040900 | rprg | 5 | pas de Term | fin opéron | rien | ||||
comp | 4040906..4041433 | cds | 176 | ||||||
4165428..4166285 | cds | 373 | 286 | Sigma Lrp-leu | |||||
4166659..4168200 | 16s | 171 | |||||||
4168372..4168447 | gaa | 193 | |||||||
4168641..4171544 | 23s | 92 | |||||||
4171637..4171756 | 5s | 300 | Terminateur | début opéron | rien | ||||
4172057..4173085 | cds | 343 | |||||||
comp | 4205943..4207532 | cds | 614 | 530 | sigma FIS | ||||
4208147..4209688 | 16s | 85 | |||||||
4209774..4209849 | gaa | 193 | |||||||
4210043..4212946 | 23s | 93 | |||||||
4213040..4213159 | 5s | 74 | Terminateur | début opéron | rien | ||||
4213234..4213617 | cds | 128 | |||||||
695101..696276 | cds | 31 | 392 | ||||||
comp | 696308..696378 | rprg | 51 | Terminateur | fin opéron | rien | |||
comp | 696430..696504 | cag | 37 | ||||||
comp | 696542..696616 | cag | 47 | ||||||
comp | 696664..696740 | atg | 15 | ||||||
comp | 696756..696830 | caa | 34 | ||||||
comp | 696865..696939 | caa | 23 | ||||||
comp | 696963..697047 | cta | 9 | ||||||
comp | 697057..697133 | atg | 379 | sigma FIS | fin opéron | rien | |||
comp | 697513..699177 | cds | 555 | ||||||
779598..780389 | cds | 164 | 264 | sigma FIS | fin opéron | rien | |||
780554..780629 | aaa | 135 | |||||||
780765..780840 | gta | 2 | |||||||
780843..780918 | aaa | 149 | |||||||
781068..781143 | gta | 3 | |||||||
781147..781222 | aaa | 146 | |||||||
781369..781444 | aaa | 132 | |||||||
781577..781652 | aaa | 432 | Terminateur | début opéron | NadR pas sigma | ||||
782085..783128 | cds | 348 | |||||||
1286709..1286984 | cds | 81 | 92 | Terminateur | |||||
comp | 1287066..1287236 | ncRNA | -150 | ||||||
comp | 1287087..1287176 | tpr | 67 | 30 | |||||
comp | 1287244..1287328 | tac | 209 | ||||||
comp | 1287538..1287622 | tac | 159 | sigma FIS | |||||
comp | 1287782..1288624 | cds | 281 | ||||||
solitaire | promoteur | terminateur | interc avant | interc après | protéines | lien | |||
236931..237007 | gac | sigma FIS | Term 1 | 133 | 328 | [43] | |||
262871..262946 | acg | sigma FIS | rien | 115 | 204 | [44] | |||
564723..564799 | aga | sigma FIS | rien | 243 | 16 | [45] | |||
comp | 925884..925971 | InfA-tcc | sigma FIS | Term 1 | 344 | 254 | [46] | ||
comp | 1031625..1031712 | tca | sigma FIS | Term 2 | 207 | 427 | [47] | ||
comp | 1097565..1097652 | tcc | sigma FIS | Term 4 | 736 | 234 | [48] | ||
comp | 2043468..2043557 | tcg | sigma - | Term 1 | 570 | 94 | [49] | ||
2044549..2044624 | aac | sigma - | Term 1 | 101 | 314 | [50] | |||
comp | 2058027..2058102 | aac | sigma - | Term 1 | 453 | 101 | [51] | ||
2059851..2059926 | aac | sigma - | Term 1 | 5 | 38 | [52] | |||
2062260..2062335 | aac | sigma NtrC | rien | 327 | 56 | [53] | |||
2286211..2286287 | ccc | sigma FIS | Term 1 | 75 | 103 | [54] | |||
2466309..2466383 | agg | sigma - | Term 1 | 76 | 162 | [55] | |||
comp | 2785762..2785837 | atgi | rien | rien | 410 | -37 | évidence faible1 | [56] | |
comp | 2998984..2999057 | ggg | sigma FIS | rien | 156 | 79 | évidence faible | [57] | |
3110366..3110441 | ttc | sigma FIS | Term 1 | 106 | 149 | [58] | |||
3215598..3215673 | atgi | sigma - | Term 1 | 125 | 54 | [59] | |||
comp | 3318213..3318289 | atgf | sigma FIS | Term 2 | 207 | 348 | protéines1 | [60] | |
comp | 3322072..3322158 | ctc | sigma - | Term 1 | 459 | 15 | protéine2 | [61] | |
comp | 3708616..3708692 | ccg | sigma FIS | Term 2 | 911 | 92 | [62] | ||
3836222..3836316 | tga | sigma - | rien | 293 | 109 | [63] | |||
comp | 4362551..4362626 | ttc | sigma FIS | Term 1 | 198 | 107 | [64] | ||
4496405..4496489 | ttg | sigma FIS | Term 1 | 196 | 261 | [65] |
eco cumuls[modifier | modifier le wikicode]
- Note: Les statistiques sur les intercalaires entre tRNA ne sont pas correctes. Se reporter à intergen51.eco. Il n'y a aucun commentaire sur les CDS. J'ai réduit le tableau aux clusters à rRNA. L'intitulé opéron doit d'être compris dans le sens cluster ou bloc de RNA, rRNA ou tRNA.
eco cumuls opérons effectif avec rRNA opérons 7 16 23 5s 0 0 16 atc gca 3 16 23 5s a 0 max a 3 a doubles 0 spéciaux 4 total aas 14 sans opérons 36 1 aa 23 max a 7 a doubles 10 total aas 72 total aas 86 remarques 3
eco blocs[modifier | modifier le wikicode]
- Lien tableur: eco blocs
16s | 68 | 16s | 68 | 68 |
atc | 42 | atc | 42 | 42 |
gca | 174 | gca | 183 | 183 |
23s | 92 | 23s | 93 | 93 |
5s | 12 | 5s | 52 | |
acc | 37 | gac | ||
5s | ||||
16s | 85 | 171 | 171 | 85 |
gaa | 193 | 184 | 193 | 193 |
23s | 92 | 92 | 92 | 93 |
5s | 52 | |||
gac |
eco remarques[modifier | modifier le wikicode]
- Remarques : Pas de blocs 16-23-5s, un nouveau bloc 16-gaa-23-5s, beaucoup de doubles. Comme eal.
- @1 Les blocs 16-atc gca-23-5s sont au nombre de 3 avec 1 seul aa en plus.
- - Les intercalaires sont les mêmes pour les 3 opérons, 68 42 183 93.
- - Cependant les 3 1ers intercalaires diminuent de 3 bases chacun et le 4ème est divisé par 2.
- - Par rapport à eal un opéron sans aa de plus, s'est transformé avec 1 aa et 1 5s en plus. Son intercalaire gca-23s a diminué de 5 % par rapport aux 2 autres, 9/183.
- @2 4 nouveaux blocs analogues aux précédents, 16-gaa-23-5s, comme eal.
- - Les intercalaires sont les mêmes pour 2 opérons sans aa supplémentaire, 171 193 92.
- - Pour les 2 autres opérons le 1er intrcalaire est divisé par 2, 85 193 92.
- - Elles sont, dans le même ordre, analogue à celles des blocs 16-atc gca-23-5s.
- - Par rapport à eal, l'opéron avec 1 aa et 1 5s a perdu ces suppléments. Et l’on a 3 opérons sans et 1 opéron avec 2 aas en supplément.
- @3 2 opérons tRNAs+protéine : tactac-tpr et acatacggaacc-tufB
- @1 Les blocs 16-atc gca-23-5s sont au nombre de 3 avec 1 seul aa en plus.
- Séquences des doubles : beaucoup de doubles mais peu de séquences répétées.
- - Il y a 4 remaniements qui consistent tous en une ou 2 répétions de plus des répétitions déjà existantes
- - 2 opérons sans rRNAs et sans doubles ont été perdus de eal à eco.
- - Pour eco il y a toujours 10 opérons avec répétition et 3 sans répétitions:
- - 3 opérons à 2 aas répétés
- - 4 opérons à 3 aas répétés
- - 1 opéron à 4 aas répétés.
- - L'opéron au maximum de 7 aas a 2 répétitions de 2 aas en séquence et la 3ème a ses 2 aas séparés : atg cta 2caa atg 2cag.
- - Un opéron à 7 aas a une séquence répétée, 3aaa + 2*2.
eco eal Opérons sans rRNAs avec doubles 2tac 2tac 2gtc 2gtc 2gcc 2gcc 3ctg 3ctg 3atgf 3atgf atg cta 2caa atg 2cag atg cta 2caa atg 2cag Remaniements des répétitions 3ggc 2ggc aaa 3gta aaa 2gta agc 4cgt agc 3cgt 5aaa 2gta 3aaa 2gta Opérons sans rRNAs sans doubles tta tgc ggc tta tgc ggc cgg cac ctg cca cgg cac ctg cca aca tac gga acc aca tac gga acc Disparition de 2 opérons chez eco - atgi aga - gga aca
- Notes :
eco distribution[modifier | modifier le wikicode]
- Lien tableur: eco distribution
- Notes:
- - gtc2 gta3 ctg3 gcc2 tac2 aaa3 caa2 cag2 atgf3 cgt4 ggc3
- - gac: 1aa + 2 5s
- - Séquences:
- (aaa gta)2 aaa3
g1 | t1 | ||||||
---|---|---|---|---|---|---|---|
atgi | 2 | tct | tat | atgf | 4 | ||
att | act | aat | agt | ||||
ctt | cct | cat | cgc | ||||
gtt | gct | gat | ggt | ||||
ttc | 2 | tcc | 2 | tac | 3 | tgc | 1 |
atc | 3 | acc | 2 | aac | 4 | agc | 1 |
ctc | 1 | ccc | 1 | cac | 1 | cgt | 4 |
gtc | 2 | gcc | 2 | gac | 3 | ggc | 4 |
tta | 1 | tca | 1 | taa | tga | 1 | |
ata | aca | 1 | aaa | 6 | aga | 1 | |
cta | 1 | cca | 1 | caa | 2 | cga | |
gta | 5 | gca | 3 | gaa | 4 | gga | 1 |
ttg | 1 | tcg | 1 | tag | tgg | 1 | |
atgj | 2 | acg | 1 | aag | agg | 1 | |
ctg | 4 | ccg | 1 | cag | 2 | cgg | 1 |
gtg | gcg | gag | ggg | 1 | |||
gama | >1aa | =1aa | -5s | +5s | -16s | +16s | total |
eco | 49 | 23 | 4 | 10 | 86 |
eco intergen51[modifier | modifier le wikicode]
Intergen51. eco. Le génome[modifier | modifier le wikicode]
- eco Le prélèvement: alpha gama
- Le nom et le lien NCBI: eco, Escherichia coli str. K-12 substr. MG1655, NCBI [66], date 7.3.22.
- spl La longueur totale des intercalaires, longueur du génome et taux intercalaires/génome:
Nom intercals génome taux en % eco 501 283 4 641 652 10.8
eco données intercalaires[modifier | modifier le wikicode]
- Lien tableur: eco données intercalaires
- Lien sauvegarde NCBI:alpha gama
eco données intercalaires 200[modifier | modifier le wikicode]
- Lien tableur: données intercalaires 200.
eco autres intercalaires aas[modifier | modifier le wikicode]
- Lien tableur: eco autres intercalaires aas
- Lien sauvegarde NCBI:alpha gama
Intergen51. eco. Les différents types d'intercalaires[modifier | modifier le wikicode]
- Lien au tableur: Intergen51. eco les différents types d'intercalaires.
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
Intergen51. eco. Les diagrammes CDS-CDS positifs[modifier | modifier le wikicode]
Courbes de tendances pour les diagrammes en pour 1000 Calculs des f.41 eco R2 x3 x2 x c Inflexion poly3 x c 0,538 2,01E-06 -1,39E-03 1,81E-01 29,40 fx1 abscisse 257,1 -1789,2 0,802 -7,30E-06 5,57E-03 1,38E+00 121,0 fc1 ordonnée 19,9 1199,7 0,706 -1,40E-06 1,08E-03 -3,51E-01 62,5 fx41 0,938 5,85E-08 3,14E-04 -2,65E-01 55,5 fc41
Intergen51. eco. Les CDS-CDS négatifs[modifier | modifier le wikicode]
Sous-totaux eco totale fréquence x- c- x- c- -1 0 162 4 4140 -2 2 0 85 11 -3 0 0 3 12 -4 43 260 717 10938 -5 0 0 5 19 sp6 50 225 1642 8424 total 95 647 2 456 23 544 reste 13 25 264 420 s6 14 0 361 41 s7 6 48 321 1438 s8 17 152 696 6525 rappot s1-5 4/2/1 21,5 1,6 8,4 2,6 % / sp6 s6/sp6 28,0 0,0 22,0 0,5 s7/sp6 12,0 21,3 19,5 17,1 s8/sp6 34,0 67,6 42,4 77,5 reste/sp6 26,0 11,1 16,1 5,0 total s1-5 45 422 814 15120 % / total %s1-5 47,4 65,2 33,1 64,2 %sp6 52,6 34,8 66,9 35,8
Intergen51. eco. Les intercalaires des blocs[modifier | modifier le wikicode]
- Le détail et les rares
- Les tRNA-CDS compris, comparaison dans le clade et dans l'étude.
RNA-RNA c x CDS-RNA c x 23s 5s 7 CDS 16s 4 3 16s 23s 7 5s CDS 2 3 16s tRNA 16 CDS tRNA 23s 7 CDS 5s 5s tRNA 3 23s CDS tRNA in 3 CDS 23s tRNA contig 5s 16s tRNA hors 37 16s16s tRNA 16s 23s tRNA tRNA 5s 1 16s 5s 5s 23s 5s 5s total 65 0 total 6 6
Intergen51. eco. Les intercalaires tRNA-tRNA extra bloc[modifier | modifier le wikicode]
- Lien tableur: Intergen51. eco. Les intercalaires tRNA-tRNA extra bloc
- Les contigus aux blocs: inexistants
- Les hors blocs: 37 au total avec de fortes répétitions qui donnent un diagramme à 2 pics aux abscisses 5 35. Voir les doubles dans ancien eco et le chapitre distribution qui le suit. Faire un tableau avec couleurs.
- Notes: les 7 intercalaires supérieurs à 120 pdbs sont dans des séquences à répétition
inter | aa | inter | aa | inter | aa | ||
---|---|---|---|---|---|---|---|
37 | cag | 4 | gtc | 33 | atgf | ||
47 | cag | ** | gtc | 33 | atgf | ||
15 | atgj | 12 | tta | ** | atgf | ||
34 | caa | 54 | tgc | 8 | gac | ||
23 | caa | ** | ggc | ** | tgg | ||
9 | cta | 39 | ggc | 57 | cgg | ||
** | atgj | ** | ggc | 20 | cac | ||
135 | aaa | 44 | gta | 42 | ctg | ||
2 | gta | 46 | gta | ** | cca | ||
149 | aaa | 4 | gta | 8 | aca | ||
3 | gta | ** | aaa | 116 | tac | ||
146 | aaa | 198 | cgt | 6 | gga | ||
132 | aaa | 62 | cgt | ** | acc | ||
** | aaa | 198 | cgt | 36 | ggc | ||
209 | tac | 3 | cgt | 35 | ggc | ||
** | tac | ** | agc | ** | ggc | ||
34 | ctg | ||||||
28 | ctg | ||||||
** | ctg |
eco intercalaires entre cds[modifier | modifier le wikicode]
- Lien NCBI [67] daté du 23-9-2020 pour ces prélèvements.
- Note: Pour les génomes des annexes j'ai relevé les intercalaires entre tRNAs et entre ceux-ci et les cds qui leur sont adjacents. L'exemple est celui de rru du clade alpha. L'idée de départ de ces prélèvements est la recherche d'opérons formés de tRNA et de protéine comme dans le cas d'E.coli: l'intercalaire entre le tRNA et la protéine devrait être faible. Voir l'exemple d'eco (remarque @3) avec tac-tac-tpr et aca-tac-gga-acc-tufB.
eco intercalaires positifs S+[modifier | modifier le wikicode]
- Lien tableur: eco intercalaires positifs S+
- Diagrammes 400: eco cbn, diagramme 1-40: c+ eco c+ cbn x+ eco total, texte: cbn.
- Légende: voir la légende de cvi.
eco | Sx+ | Sc+ | ||||||||||||
Poly3 | -7 | -5 | -3 | 1 | R2 | flex x+ | comment. | -7 | -5 | -3 | 1 | R2 | flex c+ | comment. |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
1 à 400 | 22 | -151 | 195 | 32 | 532 | 230 | max50 | -74 | 565 | -1405 | 124 | 805 | 255 | min50 |
31 à 400 | 7.6 | -18 | -162 | 50 | 934 | 79 | 2 parties | |||||||
droite | -a | cste | - | R2 | note | R2’ | -a | cste | - | R2 | note | R2’ | ||
1 à 400 | 94 | 44 | - | 489 | dte | 43 | tm | 197 | 65 | - | 540 | poly | 265 | SF |
31 à 400 | 117 | 43 | - | 873 | poly | 61 | tm |
- Légende du tableau des corrélations et des fréquences faibles
effectifs diagramme | corrélation x+ c+, 41-n | corrélation x+ c+, 1-n | |||||||||
gen | minima | x+ | c+ | total | 400 | 200 | 250 | diff | 200 | 250 | 400 |
---|---|---|---|---|---|---|---|---|---|---|---|
cbn | min20 | 489 | 1701 | 2190 | 731 | 543 | 505 | -38 | -222 | -114 | 271 |
eco | min20 | 1003 | 2130 | 3133 | 735 | 296 | 440 | 144 | -178 | -64 | 287 |
bsu | min10 | 1028 | 2444 | 3472 | 659 | 8 | 282 | 274 | 152 | 257 | 470 |
1-30 ‰ | effectifs | 0 ‰ | <0 ‰ | effectifs 1-40 | corel | ||||||
1-30 x+ | 1-30 c+ | x+/c+ | x | c | x | c | x- | c- | x+ | c+ | x+/c+ |
65 | 312 | 0.21 | 553 | 1940 | 2 | 5 | 17 | 86 | 56 | 620 | -382 |
63 | 348 | 0.18 | 1169 | 2855 | 11 | 6 | 80 | 226 | 126 | 821 | -119 |
140 | 333 | 0.42 | 1125 | 3091 | 2 | 8 | 31 | 186 | 302 | 936 | -432 |
- Diagrammes 400: eco cbn, diagramme 1-40: c+ eco c+ cbn x+ eco total, texte: cbn.
- Résumé: J’ai classé les 21 génomes suivant la forme des diagrammes x+ 1-400. J’ai obtenu 3 groupes,
- Les tildes au nombre de 5. Ils sont réguliers et forts, tF, avec un R2’ supérieur à 138 pour 4 d’entre eux et scc avec 71. Ce sont, cbei mba pmq et blo scc.
- Les formes S au nombre de 6. Leurs forces (R2’) sont variables, ade rru Sf 20-39, ant mja Sm 70-78, pmg pub SF 179-249.
- Les diagrammes à pyramide, c’est à dire présentant une bosse avec 4 ou 5 points contigus. Ils sont au nombre de 10 dont 9 sont des tildes et bsu est un Sf très faible (R2’18). abra rtb spl afn sont des tF avec plus de 96, ase cbn cvi sont des tf avec moins de 30, eco myr sont des tm 43 68.
- - eco ressemble beaucoup à cbn comme on vient de le voir avec des courbes x+ 1-400 à pyramide et de forme tilde faible et moyen (R2’ 43 26). Ils ne diffèrent que par le total des effectifs 3133 contre 2190.
- - Les diagrammes 400
- x+ 1-400:
- + Les 2 génomes ont une pyramide à 4 fréquences avec un maximum à 50. Quand j’enlève les 3 fréquences faibles pour ne laisser que la pyramide, la courbe eco devient une S faible, Sf, R2’ à 36 et la courbe cbn devient une S forte, SF, R2’ à 75. Je n’ai pas représenté les courbes x+ 31-400 à cause des taux peu élevés des fréquences faibles 1-30 65 pour cbn et eco.
- + Les fréquences faibles 1-30 sont en opposition avec celles des cbn c+1-400 et en parallèle avec eco. Cette différence va impacter différemment les corrélations 1-n qu’on verra plus loin.
- + Les points d’inflexion sont normaux et presque égaux 238 pour cbn contre 230.
- c+ 1-400: Ce sont 2 courbes presque identiques de formes S fort avec un R2’ de 265 pour eco contre 203 et des 2 points d’inflexion normaux, 255 pour eco et 263 pour cbn.
- x+ 31-400: Je n’ai pas représenté les courbes x+ 31-400 à cause des taux peu élevés des fréquences faibles 1-30, 65 environ pour les 2. Il faudrait les remplacer par les courbes avec pyramide seule sans les fréquences faibles 1-30, voir le paragraphe x+ 1-400 ci-dessus.
- c+ 31-400: Les 2 formes sont des tildes moyens , tm, avec un R2’ de 61 pour eco et 41 pour cbn. Les 2 points d’inflexions sont différents mais petits, 79 pour eco contre 121.
- x+ 1-400:
- - Les corrélations:
- Sur les plages 41-n: Les 2 corrélations sur 41-250 sont quasiment identiques 440 pour eco contre 505. Par contre eco chute fortement sur 41-200, avec une différence de 144, alors que cbn s’améliore avec une différence de -38.
- Sur les plages 1-n: les évolutions contraires des fréquences faibles 1-30 que j’ai mentionnées au paragraphe x+ 1-400 agissent fortement sur les corrélations 1-n.
- + Chez eco les fréquences faibles évoluent en parallèle entre celles de x+ 1-400 et c+ 1-400 d’où des corrélations sur 1-n fortement négatives -178 pour 1-200 et -64 pour 1-250.
- + Chez cbn les fréquences faibles évoluent en opposition entre celles de x+ 1-400 et c+ 1-400 d’où des corrélations sur 1-n fortement négatives comme eco -222 pour 1-200 et -114 pour 1-250.
- - Les faibles fréquences: Les faibles fréquences 1-30 ne sont intéressantes à comparer que pour les génomes à courbes 1-400 semblables où le taux de ces fréquences sont élevés et évoluent en parallèle comme entre pmg et pub où le rapport x+/c+ passe de 0.78 à 0.51. Pour eco et cbn ils sont autour de 0.20. Les zéros sont à 7‰ pour cbn et 17‰ pour eco, avantage donné par les x+; alors que le taux des négatifs fait le triple de cbn chez eco, 103‰ contre 306‰ comme chez cvi.
- - Les courbes 1-40:
- c+ 1-40: Les 2 courbes sont semblables et très proche de celle du total des c+ 1-40.
- x+ 1-40: Avec un effectif de 56 pour cbn la courbe ne peut être significative. Eco avec 126 est différente du modèle c+ 1-40 car c’est une courbe régulièrement croissante à partir de la fréquence 8 et aussi à cause de la corrélation négative x+/c+ de -119.
eco autres intercalaires[modifier | modifier le wikicode]
- Lien tableur: eco autres intercalaires aas
- Légende:
- - comp, le gène est sur le brin complement
- - deb, fin sont respectivement dans le sens des adresses croissantes, le cds avant le 1er tRNA et le cds après le dernier tRNA du bloc.
- - misc_f, pour misc_feature
- - regul, pour regulatory
- - mobile, pour mobile_element
- - rep_or, pour rep_origin
- - gene, est dans NCBI, un pseudo gène
- Note: attention le dernier 233 n'est pas comp', contrôle à l'adresse 4392892. corrigé ici
- Totaux:
tRNA-cds tRNA-tRNA autres-cds total 676 c+ x+ x- c+ x+ c- c+ c- x+ 49 28 0 65 0 0 142 cds-mob 19 44 63 cds-gen 149 30 1 180 cds-misc 39 17 56 cds-ncR 118 25 143 1 x- non cds 57 31 1 89 rep-O 2 2 gene mobile misc_f ncRNA rep-O total 384 147 2 675 129 50 48 79 1 307
- Méthode de calculs des intercalaires autres que les CDS-CDS voir le cas de amed.
Escherichia coli Nissle 1917[modifier | modifier le wikicode]
ecoN opérons[modifier | modifier le wikicode]
- Liens: gtRNAdb [68], NCBI [69], génome [70]
- Lien tableur: ecoN opérons
- Phylogénie: Bacteria; Proteobacteria; Gammaproteobacteria; Enterobacterales; Enterobacteriaceae; Escherichia.
- Légende: cdsa: cds aas, cdsd: cds dirigé
50%GC | 21.8.19 Paris | 123 | doubles | intercal | cds | aa | avec aa | cdsa | cdsd | protéines |
---|---|---|---|---|---|---|---|---|---|---|
231864..232436 | CDS | 365 | 365 | 191 | D-glycero-beta-D-manno-heptose 1,7-bisphosphate 7-phosphatase | |||||
232802..234321 | 16s | 73 | 1520 | |||||||
234395..234471 | gaa | 12 | 12 | |||||||
234484..234557 | gca | 174 | ||||||||
234732..237319 | 23s | 83 | 2588 | |||||||
237403..237518 | 5s | 54 | 116 | |||||||
237573..237649 | gac | 162 | 162 | 162 | ||||||
237812..238615 | CDS | 268 | 2,5-didehydrogluconate reductase DkgB | |||||||
244934..245665 | CDS | 132 | 132 | 244 | DNA polymerase III subunit epsilon | |||||
245798..245874 | gac | 120 | 120 | 120 | ||||||
comp | 245995..246852 | CDS | 286 | DUF4942 domain-containing protein | ||||||
367329..368582 | CDS | 114 | 114 | 418 | 114 | glutamate-5-semialdehyde dehydrogenase | ||||
368697..368772 | acg | 154 | 154 | |||||||
368927..369265 | CDS | 113 | DUF4102 domain-containing protein | |||||||
comp | 631149..632015 | CDS | 270 | 270 | 289 | bifunctional methylenetetrahydrofolate dehydrogenase/methenyltetrahydrofolate cyclohydrolase FolD | ||||
632286..632362 | aga | 15 | 15 | 15 | ||||||
comp | 632378..632997 | CDS | 207 | tyrosine-type recombinase/integrase | ||||||
733188..734363 | CDS | 153 | 153 | 392 | 153 | 2-octaprenyl-3-methyl-6-methoxy-1,4-benzoquinol hydroxylase | ||||
comp | 734517..734591 | cag | + | 37 | 37 | |||||
comp | 734629..734703 | cag | 2 cag | 48 | 48 | |||||
comp | 734752..734828 | atgj | 2 atgj | 15 | 15 | |||||
comp | 734844..734918 | caa | 2 caa | 34 | 34 | |||||
comp | 734953..735027 | caa | 23 | 23 | ||||||
comp | 735051..735135 | cta | 10 | 10 | ||||||
comp | 735146..735222 | atgj | 380 | 380 | ||||||
comp | 735603..737267 | CDS | 555 | asparagine synthase B | ||||||
807377..808169 | CDS | 164 | 164 | 264 | 164 | Pseudo, cell division protein CpoB | ||||
808334..808409 | aaa | + | 35 | 35 | ||||||
808445..808520 | gta | 5 aaa | 2 | 2 | ||||||
808523..808598 | aaa | 2 gta | 51 | 51 | ||||||
808650..808725 | gta | 3 | 3 | |||||||
808729..808804 | aaa | 48 | 48 | |||||||
808853..808928 | aaa | 33 | 33 | |||||||
808962..809037 | aaa | 277 | 277 | |||||||
809315..810358 | CDS | 348 | quinolinate synthase NadA | |||||||
950069..952345 | CDS | 343 | 343 | 759 | 343 | ATP-dependent Clp protease ATP-binding subunit ClpA | ||||
comp | 952689..952776 | tcc | 253 | 253 | ||||||
comp | 953030..953248 | CDS | 73 | translation initiation factor IF-1 | ||||||
comp | 1047224..1047883 | CDS | 206 | 206 | 220 | 206 | FtsH protease modulator YccA | |||
comp | 1048090..1048177 | tca | 426 | 426 | ||||||
1048604..1049722 | CDS | 373 | hydrogenase 1 small subunit | |||||||
1183656..1184018 | CDS | 463 | 463 | 121 | hp | |||||
1184482..1184558 | aga | 278 | 278 | 278 | ||||||
> comp | 1184837..1185786 | CDS | 317 | Pseudo, IS4 family transposase | ||||||
1213982..1214809 | CDS | 165 | 165 | 276 | 165 | DUF4942 domain-containing protein | ||||
comp | 1214975..1215062 | tcc | 233 | 233 | ||||||
1215296..1216234 | CDS | 313 | glyoxylate/hydroxypyruvate reductase GhrA | |||||||
1216817..1217098 | CDS | 165 | 165 | 94 | 165 | DUF4942 domain-containing protein | ||||
comp | 1217264..1217351 | tcc | 234 | 234 | ||||||
1217586..1218524 | CDS | 313 | glyoxylate/hydroxypyruvate reductase GhrA | |||||||
1457038..1458129 | CDS | 16 | 16 | 364 | 16 | acyl-CoA desaturase | ||||
comp | 1458146..1458277 | ncRNA | 46 | 44 | RtT sRNA | |||||
comp | 1458324..1458408 | tac | + | 33 | 33 | |||||
comp | 1458442..1458526 | tac | 2 tac | 159 | 159 | |||||
comp | 1458686..1459528 | CDS | 281 | formyltetrahydrofolate deformylase | ||||||
comp | 1829066..1830322 | CDS | 307 | 307 | 419 | hp | ||||
1830630..1830706 | gtc | + | 4 | 4 | ||||||
1830711..1830787 | gtc | 2 gtc | 6 | 6 | 6 | |||||
< | 1830794..1831177 | CDS | @4 | 128 | Pseudo, multidrug efflux MATE transporter MdtK | |||||
comp | 1831218..1832474 | CDS | 307 | 307 | 419 | hp | ||||
1832782..1832858 | gtc | + | 4 | 4 | ||||||
1832863..1832939 | gtc | 2 gtc | 8 | 8 | 8 | |||||
< | 1832948..1833280 | CDS | 111 | Pseudo, MATE family efflux transporter | ||||||
comp | 1833321..1834577 | CDS | 307 | 307 | 419 | hp | ||||
1834885..1834961 | gtc | + | 4 | 4 | ||||||
1834966..1835042 | gtc | 2 gtc | 108 | 108 | 108 | |||||
1835151..1835456 | CDS | 102 | monooxygenase | |||||||
comp | 2115794..2116459 | CDS | 195 | 195 | 222 | UPF0149 family protein YecA | ||||
comp | 2116655..2116741 | tta | 12 | 12 | ||||||
comp | 2116754..2116827 | tgc | 53 | 53 | ||||||
comp | 2116881..2116956 | ggc | 151 | 151 | 151 | |||||
comp | 2117108..2117656 | CDS | 183 | CDP-diacylglycerol--glycerol-3-phosphate 3-phosphatidyltransferase | ||||||
comp | 2191451..2192287 | CDS | 278 | 278 | 279 | hp | ||||
comp | 2192566..2192655 | tcg | 93 | 93 | 93 | |||||
2192749..2193546 | CDS | 100 | 100 | 266 | 100 | DgsA anti-repressor MtfA | ||||
2193647..2193722 | aac | 161 | 161 | |||||||
2193884..2195146 | CDS | 421 | tyrosine-type recombinase/integrase | |||||||
2232607..2233323 | CDS | 453 | 453 | 239 | YebC/PmpR family DNA-binding transcriptional regulator | |||||
comp | 2233777..2233852 | acc | 326 | 326 | 326 | |||||
2234179..2235096 | CDS | 306 | nitrogen assimilation transcriptional regulator | |||||||
2235198..2236148 | CDS | 37 | 37 | 317 | HTH-type transcriptional regulator Cbl | |||||
comp | 2236186..2236261 | aac | 4 | 4 | 4 | |||||
2236266..2237909 | CDS | 100 | 100 | 548 | 100 | toxic metabolite efflux MATE transporter YeeO | ||||
2238010..2238085 | aac | 161 | 161 | |||||||
2238247..2239518 | CDS | 424 | tyrosine-type recombinase/integrase | |||||||
2546968..2548728 | CDS | 74 | 74 | 587 | 74 | cardiolipin transport protein PbgA | ||||
2548803..2548879 | ccc | 101 | 101 | |||||||
comp | 2548981..2549136 | CDS | 52 | autotransporter outer membrane beta-barrel domain-containing protein | ||||||
2717780..2718712 | CDS | 75 | 75 | 311 | 75 | formate/nitrite transporter family protein | ||||
2718788..2718862 | agg | 437 | 437 | |||||||
comp | 2719300..2719830 | CDS | 177 | OmpH family outer membrane protein | ||||||
comp | 2768744..2770933 | CDS | 206 | 206 | 730 | 206 | sensor domain-containing phosphodiesterase | |||
comp | 2771140..2771215 | gcc | + | 39 | 39 | |||||
comp | 2771255..2771330 | gcc | 2 gcc | 220 | 220 | |||||
2771551..2771910 | CDS | 120 | putative DNA-binding transcriptional regulator | |||||||
comp | 2772355..2773770 | CDS | 258 | 258 | 472 | glutamate--tRNA ligase | ||||
2774029..2774104 | gta | + | 43 | 43 | ||||||
2774148..2774223 | gta | 3 gta | 46 | 46 | ||||||
2774270..2774345 | gta | 4 | 4 | |||||||
2774350..2774425 | aaa | 110 | 110 | 110 | ||||||
comp | 2774536..2775420 | CDS | 295 | LysR family transcriptional regulator | ||||||
comp | 2959205..2960503 | CDS | 323 | 323 | 433 | 323 | alpha-ketoglutarate permease | |||
comp | 2960827..2960942 | 5s | 83 | 116 | ||||||
comp | 2961026..2965477 | 23s | 184 | 4452 | ||||||
comp | 2965662..2965737 | gaa | 431 | |||||||
comp | 2966169..2967720 | 16s | 441 | 441 | 1552 | |||||
comp | 2968162..2970735 | CDS | 858 | ATP-dependent chaperone ClpB | ||||||
comp | 3027207..3027773 | CDS | 280 | 280 | 189 | 280 | fructose-1-phosphate/6-phosphogluconate phosphatase | |||
comp | 3028054..3028130 | cgt | + | 63 | 63 | |||||
comp | 3028194..3028270 | cgt | 5 cgt | 62 | 62 | |||||
comp | 3028333..3028409 | cgt | 62 | 62 | ||||||
comp | 3028472..3028548 | cgt | 64 | 64 | ||||||
comp | 3028613..3028689 | cgt | 3 | 3 | ||||||
comp | 3028693..3028785 | agc | 315 | 315 | ||||||
comp | 3029101..3029286 | CDS | 62 | carbon storage regulator CsrA | ||||||
comp | 3157337..3158434 | CDS | 208 | 208 | 366 | 208 | murein transglycosylase A | |||
3158643..3158719 | atgf | + | 33 | 33 | ||||||
3158753..3158829 | atgf | 3 atgf | 33 | 33 | ||||||
3158863..3158939 | atgf | 635 | 635 | |||||||
3159575..3160075 | CDS | 167 | type VI secretion system contractile sheath small subunit | |||||||
3230172..3231401 | CDS | 316 | 316 | 410 | HAAAP family serine/threonine permease | |||||
comp | 3231718..3231791 | ggg | 78 | 78 | 78 | |||||
comp | 3231870..3232625 | CDS | 252 | peptidoglycan DD-metalloendopeptidase family protein | ||||||
3341048..3341755 | CDS | 105 | 105 | 236 | 105 | DUF554 domain-containing protein | ||||
3341861..3341936 | ttc | 197 | 197 | |||||||
3342134..3343399 | CDS | 422 | integrase arm-type DNA-binding domain-containing protein | |||||||
comp | 3569308..3569814 | CDS | 124 | 124 | 169 | G/U mismatch-specific DNA glycosylase | ||||
3569939..3570014 | atgi | 53 | 53 | 53 | ||||||
comp | 3570068..3570832 | CDS | 255 | NADPH-dependent ferric chelate reductase | ||||||
comp | 3670227..3670679 | CDS | 206 | 206 | 151 | 206 | ribosome maturation factor RimP | |||
comp | 3670886..3670962 | atgf | 347 | 347 | ||||||
> | 3671310..3672155 | CDS | 282 | Pseudo, argininosuccinate synthase | ||||||
comp | 3673935..3674387 | CDS | 206 | 206 | 151 | 206 | ribosome maturation factor RimP | |||
comp | 3674594..3674670 | atgf | 347 | 347 | ||||||
> | 3675018..3675869 | CDS | 284 | Pseudo, argininosuccinate synthase | ||||||
comp | 3677794..3678246 | CDS | 206 | 206 | 151 | 206 | ribosome maturation factor RimP | |||
comp | 3678453..3678529 | atgf | 347 | 347 | ||||||
> | 3678877..3679722 | CDS | 282 | Pseudo, argininosuccinate synthase | ||||||
comp | 3681532..3681984 | CDS | 206 | 206 | 151 | 206 | ribosome maturation factor RimP | |||
comp | 3682191..3682267 | atgf | 347 | 347 | ||||||
3682615..3683958 | CDS | 448 | argininosuccinate synthase | |||||||
comp | 3683966..3685591 | CDS | 456 | 456 | 542 | phosphoethanolamine transferase | ||||
comp | 3686048..3686134 | ctc | 14 | 14 | 14 | |||||
comp | 3686149..3686481 | CDS | 111 | preprotein translocase subunit SecG | ||||||
3784553..3785311 | CDS | 62 | 62 | 253 | 62 | amino acid ABC transporter ATP-binding protein | ||||
comp | 3785374..3785489 | 5s | @3 | 39 | 116 | |||||
comp | 3785529..3785605 | acc | 14 | |||||||
comp | 3785620..3785735 | 5s | 777 | 116 | ||||||
comp | 3786513..3786588 | acc | 14 | |||||||
comp | 3786603..3786718 | 5s | 1834 | 116 | ||||||
comp | 3788553..3788628 | gaa | 1360 | 1360 | ||||||
3789989..3790543 | CDS | 185 | gamma carbonic anhydrase family protein | |||||||
comp | 4078635..4080242 | CDS | 743 | 743 | 536 | dipeptide ABC transporter substrate-binding protein DppA | ||||
comp | 4080986..4081062 | ccg | 91 | 91 | 91 | |||||
comp | 4081154..4082845 | CDS | 564 | kdo(2)-lipid A phosphoethanolamine 7-transferase | ||||||
comp | 4205966..4207348 | CDS | 292 | 292 | 461 | 292 | glycoside-pentoside-hexuronide family transporter | |||
4207641..4207735 | tga | 300 | 300 | |||||||
> | 4208036..4208857 | CDS | 274 | Pseudo, DUF4102 domain-containing protein | ||||||
comp | 4338643..4339335 | CDS | 479 | 479 | 231 | FadR family transcriptional regulator | ||||
4339815..4341342 | 16s | 73 | 1528 | |||||||
4341416..4341491 | gaa | 184 | ||||||||
4341676..4344286 | 23s | 83 | 2611 | |||||||
4344370..4344485 | 5s | 53 | 116 | |||||||
4344539..4344615 | gac | 8 | ||||||||
4344624..4344699 | tgg | 95 | 95 | 95 | ||||||
comp | 4344795..4345634 | CDS | 280 | HTH-type transcriptional regulator HdfR | ||||||
4377681..4379066 | CDS | 102 | 102 | 462 | 102 | amino acid permease | ||||
4379169..4379245 | cgg | 58 | 58 | |||||||
4379304..4379379 | cac | 20 | 20 | |||||||
4379400..4379486 | ctg | 42 | 42 | |||||||
4379529..4379605 | cca | 146 | 146 | |||||||
4379752..4380987 | CDS | 412 | anaerobic sulfatase maturase | |||||||
4460971..4461516 | CDS | 377 | 377 | 182 | menaquinone-dependent protoporphyrinogen IX dehydrogenase | |||||
4461894..4463631 | 16s | 56 | 1738 | |||||||
4463688..4463764 | atc | 42 | 42 | |||||||
4463807..4463882 | gca | 165 | ||||||||
4464048..4467338 | 23s | 83 | 3291 | |||||||
4467422..4467537 | 5s | 104 | 104 | 116 | 104 | |||||
comp | 4467642..4468169 | CDS | 176 | molybdopterin-guanine dinucleotide biosynthesis protein B | ||||||
4605577..4606434 | CDS | 374 | 374 | 286 | glutamate racemase | |||||
4606809..4608362 | 16s | 363 | 1554 | |||||||
4608726..4608801 | gaa | 1112 | ||||||||
4609914..4610029 | 5s | 136 | 136 | 116 | 136 | |||||
4610166..4611194 | CDS | 343 | UDP-N-acetylenolpyruvoylglucosamine reductase | |||||||
comp | 4612185..4613135 | CDS | 361 | 361 | 317 | type I pantothenate kinase | ||||
4613497..4613572 | aca | 8 | 8 | |||||||
4613581..4613665 | tac | 116 | 116 | |||||||
4613782..4613856 | gga | 6 | 6 | |||||||
4613863..4613938 | acc | 114 | 114 | 114 | ||||||
4614053..4615237 | CDS | 395 | elongation factor Tu | |||||||
comp | 4642984..4644573 | CDS | 616 | 616 | 530 | bifunctional phosphoribosylaminoimidazolecarboxamide formyltransferase/IMP cyclohydrolase | ||||
4645190..4646378 | 16s’ | @1 | 83 | 83 | 1189 | 83 | ||||
4646462..4648150 | CDS | 436 | 436 | 563 | bifunctional isocitrate dehydrogenase kinase/phosphatase | |||||
4648587..4648662 | gaa | 185 | ||||||||
4648848..4651319 | 23s | 83 | 2472 | |||||||
4651403..4651518 | 5s | 76 | 76 | 116 | 76 | |||||
4651595..4651978 | CDS | 128 | hypothetical protein | |||||||
< comp | 4834504..4834961 | CDS | 197 | 197 | 153 | pseudo, integrase | ||||
comp | 4835159..4835234 | ttc | 106 | 106 | 106 | |||||
comp | 4835341..4835916 | CDS | 192 | transcriptional regulator | ||||||
4864628..4865173 | CDS | 210 | 210 | 182 | 210 | oligoribonuclease | ||||
4865384..4865459 | ggc | + | 36 | 36 | ||||||
4865496..4865571 | ggc | 3 ggc | 35 | 35 | ||||||
4865607..4865682 | ggc | 233 | 233 | |||||||
4865916..4865969 | CDS | 18 | hp | |||||||
comp | 4974178..4975197 | CDS | 195 | 195 | 340 | NADPH-dependent aldehyde reductase Ahr | ||||
4975393..4975477 | ttg | 39 | 39 | 39 | ||||||
<> comp | 4975517..4976055 | CDS | 180 | pseudo, IS630 family transposase | ||||||
5042527..5042763 | CDS | 38 | 38 | 79 | 38 | DUF1435 domain-containing protein | ||||
comp | 5042802..5042888 | ctg | + | 34 | 34 | |||||
comp | 5042923..5043009 | ctg | 3 ctg | 28 | 28 | |||||
comp | 5043038..5043124 | ctg | 290 | 290 | ||||||
comp | 5043415..5044446 | CDS | 344 | 16S rRNA (guanine(1207)-N(2))-methyltransferase RsmC | ||||||
comp | 5079375..5079581 | CDS | 117 | 117 | 69 | 117 | AlpA family transcriptional regulator | |||
5079699..5081218 | 16s | 73 | 1520 | |||||||
5081292..5081368 | gaa | 12 | 12 | |||||||
5081381..5081454 | gca | 366 | 366 | |||||||
5081821..5082018 | CDS | 524 | 524 | 66 | hypothetical protein | |||||
comp | 5082543..5082754 | CDS | 71 | hypothetical protein | ||||||
comp | 5090325..5090876 | CDS | 1808 | 1808 | 184 | MarR family transcriptional regulator | ||||
comp | 5092685..5092760 | gaa | 588 | 588 | 588 | |||||
< comp | 5093349..5093474 | CDS | 592 | 592 | 42 | sn-glycerol-3-phosphate ABC transporter substrate-binding protein UgpB | ||||
5094067..5094142 | gaa | + | 1472 | 1472 | ||||||
5095615..5095691 | atc | 3 gaa | 42 | 42 | ||||||
5095734..5095809 | atc | 2 atc | 1130 | 1130 | ||||||
5096940..5097015 | gaa | 1145 | 1145 | |||||||
5098161..5098236 | gaa | 185 | ||||||||
5098422..5100893 | 23s | 83 | 2472 | |||||||
5100977..5101092 | 5s | 76 | 76 | 116 | 76 | |||||
5101169..5101552 | CDS | 63 | 63 | 128 | hypothetical protein | |||||
comp | 5101616..5102059 | CDS | 148 | acetyltransferase | ||||||
5124754..5125197 | CDS | 63 | 63 | 148 | acetyltransferase | |||||
comp | 5125261..5125644 | CDS | 76 | 76 | 128 | hypothetical protein | ||||
comp | 5125721..5125836 | 5s | 83 | 116 | ||||||
comp | 5125920..5128366 | 23s’ | @2 | -10 | -10 | 2447 | -10 | |||
< | 5128357..5128479 | CDS | 41 | pilus assembly protein | ||||||
comp | 5252659..5253870 | CDS | 300 | 300 | 404 | tyrosine-type recombinase/integrase | ||||
comp | 5254171..5254249 | tga | 292 | 292 | 292 | |||||
> | 5254542..5255171 | CDS | 210 | pseudo, glycoside-pentoside-hexuronide family transporter | ||||||
> comp | 5305902..5306228 | CDS | 0 | 0 | 109 | 0 | pseudo, hp | |||
comp | 5306229..5306302 | atc | 1096 | 1096 | ||||||
5307399..5308450 | CDS | 351 | pseudo, bifunctional DNA-binding transcriptional regulator/O6-methylguanine-DNA methyltransferase Ada | |||||||
comp | 5321144..5321869 | CDS | 206 | 206 | 242 | 206 | pseudo, histidine kinase | |||
comp | 5322076..5322151 | gcc | + | 39 | 39 | |||||
comp | 5322191..5322266 | gcc | 3 gcc | 39 | 39 | |||||
comp | 5322306..5322381 | gcc | 220 | 220 | ||||||
5322602..5322961 | CDS | 120 | putative DNA-binding transcriptional regulator | |||||||
comp | 5323406..5324821 | CDS | 258 | 258 | 472 | glutamate--tRNA ligase | ||||
5325080..5325155 | gta | + | 44 | 44 | ||||||
5325200..5325275 | gta | 2 gta | 0 | 0 | 0 | |||||
< | 5325276..5325389 | CDS | 38 | pseudo, putative DNA-binding transcriptional regulator | ||||||
> | 5375524..5376270 | CDS | 891 | 891 | 249 | 891 | pseudo, AI-2E family transporter | |||
5377162..5377237 | gaa | 1047 | 1047 | |||||||
comp | 5378285..5379589 | CDS | 435 | isocitrate lyase | ||||||
comp > | 5341397..5341492 | CDS | -2 | -2 | 32 | -2 | ABC transporter ATP-binding protein | |||
comp | 5341491..5344303 | 23s | 174 | 2813 | ||||||
comp | 5344478..5344553 | gca | 42 | 42 | ||||||
comp | 5344596..5344672 | atc | 56 | |||||||
comp | 5344729..5346282 | 16s | 1063 | 1554 | ||||||
comp | 5347346..5347421 | gca | 42 | 42 | ||||||
comp | 5347464..5347540 | atc | 56 | |||||||
comp | 5347597..5349150 | 16s | 365 | 365 | 1554 | |||||
comp | 5349516..5350088 | CDS | 187 | 187 | 191 | D-glycero-beta-D-manno-heptose 1,7-bisphosphate 7-phosphatase | ||||
> | 5350276..5350914 | CDS | 213 | methionine ABC transporter ATP-binding protein MetN | ||||||
> comp | 5359583..5360512 | CDS | 120 | 120 | 310 | tyrosine-type recombinase/integrase | ||||
comp | 5360633..5360708 | gca | 42 | |||||||
comp | 5360751..5360827 | atc | 56 | |||||||
comp | 5360884..5362138 | 16s’ | 1 | 1 | 1255 | 1 | ||||
< comp | 5362140..5363543 | CDS | 468 | IS66 family transposase | ||||||
5425965..5426201 | CDS | 38 | 38 | 79 | 38 | DUF1435 domain-containing protein | ||||
comp | 5426240..5426325 | ctg | + | 26 | 26 | a disparu le 20.12.19 | ||||
comp | 5426352..5426438 | ctg | 3 ctg | 28 | 28 | |||||
comp | 5426467..5426553 | ctg | 63 | 63 | ||||||
< comp | 5426617..5427150 | CDS | 178 | pseudo, IS630-like element IS630 family transposase | ||||||
> | 5433568..5433687 | CDS | 39 | 39 | 40 | 39 | pseudo, nicotinamide-nucleotide amidase | |||
comp | 5433727..5433814 | tcc | 253 | 253 | ||||||
comp | 5434068..5434286 | CDS | 73 | translation initiation factor IF-1 |
ecoN cumuls[modifier | modifier le wikicode]
- Note: Les statistiques sur les intercalaires entre tRNA ne sont pas correctes. Se reporter à intergen51.ecoN. Il n'y a aucun commentaire sur les CDS. J'ai réduit le tableau aux clusters à rRNA. L'intitulé opéron doit d'être compris dans le sens cluster ou bloc de RNA, rRNA ou tRNA.
- Lien tableur: ecoN cumuls
opérons | Fréquences intercalaires tRNAs | Fréquences intercalaires cds | Fréquences aas cds | ||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
effectif | gammes | sans rRNAs | avec rRNAs | gammes | cds | gammes | cdsd | gammes | cdsa | gammes | cdsa 300 | ||
avec rRNA | opérons | 12 | 1 | 0 | 1 | 5 | 1 | 5 | 100 | 16 | 1 | 0 | |
16 23 5s | 0 | 20 | 13 | 2 | 50 | 11 | 40 | 10 | 200 | 34 | 30 | 1 | |
16 atc gca | 2 | 40 | 17 | 100 | 17 | 80 | 7 | 300 | 29 | 60 | 6 | ||
16 gaa 235 | 2 | 60 | 9 | 4 | 150 | 16 | 120 | 16 | 400 | 18 | 90 | 8 | |
max a | 5 | 80 | 4 | 200 | 15 | 160 | 3 | 500 | 18 | 120 | 8 | ||
a doubles | 1 | 100 | 0 | 250 | 14 | 200 | 4 | 600 | 8 | 150 | 7 | ||
spéciaux | 8 | 120 | 1 | 300 | 14 | 240 | 9 | 700 | 0 | 180 | 11 | ||
total aas | 27 | 140 | 0 | 350 | 12 | 280 | 2 | 800 | 2 | 210 | 11 | ||
sans | opérons | 50 | 160 | 0 | 400 | 7 | 320 | 2 | 900 | 1 | 240 | 6 | |
1 aa | 32 | 180 | 0 | 450 | 4 | 360 | 3 | 1000 | 0 | 270 | 9 | ||
max a | 7 | 200 | 0 | 500 | 4 | 400 | 0 | 1100 | 0 | 300 | 12 | ||
a doubles | 15 | 0 | 11 | 2 | 0 | 0 | |||||||
total aas | 94 | 44 | 6 | 130 | 63 | 126 | 79 | ||||||
total aas | 121 | ||||||||||||
remarques | 4 | ||||||||||||
avec jaune | moyenne | 33 | 32 | 253 | 142 | 272 | 172 | ||||||
variance | 23 | 15 | 258 | 145 | 162 | 79 | |||||||
sans jaune | moyenne | 31 | 178 | 127 | 260 | ||||||||
variance | 19 | 109 | 91 | 142 |
ecoN blocs[modifier | modifier le wikicode]
- Lien tableur: ecoN blocs
- Légende:
- - 23s': possible 23S ribosomal RNA but does not have good blast hits on one or both of the ends.
- - 16s': possible 16S ribosomal RNA but does not have good blast hits on one or both of the ends.
- - Protéines en vert, sont hypothétiques ou typées, gc anhydrase. Voir les noms longs.
|
|
|
ecoN remarques[modifier | modifier le wikicode]
- Remarques: ecoN opérons
- Beaucoup de blocs à rRNAs incomplets, 7 sur 12. Parmi les 5 complets 1 est semi-complet puisqu’il manque le 5s peu important. Les 5 blocs complets sont conformes au typage des gamma, avec y atcgca gaagca gaa et avec z sans gactgg gac.
- @1
- - Deux 16s aux extrémités non conformes, 16s’, adresses 4645190..4646378 et 5360884..5362138 .
- - Il n’y a pas de 16s° ou de 23s° courts, apparemment ils n’ont pas laissé de traces.
- - C’est ce qui expliquerait les 7 blocs incomplets et le nombre élevé de 32 des clusters sans rRNAs et à 1 seul tRNA.
- @2
- - Un 23s aux extrémités non comforme, 23s’, adresse 5125920..5128366 .
- - Même remarque que pour les 16s’, mais en plus je peux attribuer le grand nombre de petits cds aux remaniements qu’ont du subir ces blocs incomplets, voir ecoN blocs.
- 5128357..5128479 -10 cp 23s'
- 5341397..5341492 atcgca -2
- 5360884..5362138 16s’ 1
- @3
- - Les 5s se comportent en typage gamma même pour ceux qui sont dans un bloc incomplet. Parmi ces derniers la plupart n’ont pas de z mais dans le cluster comportant 3 5s, adresse 3785374..3785489 , on peut distinguer avec des intercalaires faibles un 5s-acc-5s et un 5s-acc, où les 5s du début appartiendraient à un bloc complet.
- @4
- - Parmi les 6 clusters sans rRNA et à 2 tRNAs tous sont doubles et 3 sont identiques même en intercalaires, les 3 gtc. Les 3 autres sont gta tac et gcc.
- - Parmi les 6 clusters sans rRNA et à 3 tRNAs 5 sont des triples dont 2 à cgt ont même 2 intercalaires identiques, adresses. Les tRNAs de ces triplets sont atgf ggc gcc et 2 fois cgt. Le 6ème cluster à 3 tRNAs n’ a pas de doubles.
- Séquences des doubles:
aas clusters doubles séquences 1 32 - 2 6 6 2 tac 2 gtc*3 2 gcc 2 gta 3 6 5 3 atgf 3 ctg*2 3 ggc 3 gcc 4 3 1 3 gta 5 0 6 1 1 5 cgt 7 2 2 5 aaa 2 gta 2 cag 2 atgj 2 caa
ecoN distribution[modifier | modifier le wikicode]
- Lien tableur: ecoN distribution
- Notes:
- - 3gtc2 gta2+3 2ctg3 gcc2+3 tac2 aaa3 atgf3 ggc3
- - atc: 4 16s, atc2, 1aa
- - gaa: 7 16s, 5s, 4 1aa
- - acc: 2 5s, >1aa, 1aa
- - gac: 2 5s, 1aa
- - Séquences: (aaa gta)2 aaa3
- - Adresse 5098422: ce bloc est compté dans « avec rRNA » dans cumuls. Mais ici je compte
- 1 gaa avec rRNA
- 2 gaa 1aa
- 2 atc >1aa
g1 | t1 | ||||||
---|---|---|---|---|---|---|---|
atgi | 1 | tct | tat | atgf | 7 | ||
att | act | aat | agt | ||||
ctt | cct | cat | cgc | ||||
gtt | gct | gat | ggt | ||||
ttc | 2 | tcc | tac | 3 | tgc | 1 | |
atc | 7 | acc | 4 | aac | 3 | agc | 1 |
ctc | 1 | ccc | 4 | cac | 1 | cgt | 5 |
gtc | 6 | gcc | 1 | gac | 3 | ggc | 4 |
tta | 1 | tca | 5 | taa | tga | 2 | |
ata | aca | 1 | aaa | 6 | aga | 2 | |
cta | 1 | cca | 1 | caa | 2 | cga | |
gta | 7 | gca | 1 | gaa | 12 | gga | 1 |
ttg | 1 | tcg | 6 | tag | tgg | 1 | |
atgj | 2 | acg | 1 | aag | agg | 1 | |
ctg | 7 | ccg | 1 | cag | 2 | cgg | 1 |
gtg | gcg | 1 | gag | ggg | 1 | ||
gama | >1aa | =1aa | -5s | +5s | -16s | +16s | total |
ecoN | 64 | 34 | 6 | 17 | 121 |
ecoN eco[modifier | modifier le wikicode]
ecoN eco tableaux[modifier | modifier le wikicode]
- Lien tableur: ecoN eco tableaux
- Légende: eco 435, la recherche de isocitrate, voir noms longs, se trouve à l'adresse 4217109..4218413 chez eco.
- - 23s': possible 23S ribosomal RNA but does not have good blast hits on one or both of the ends.
- - 16s': possible 16S ribosomal RNA but does not have good blast hits on one or both of the ends.
- - Colonne cdsa
- . en clair la longueur de la protéine en aas
- . en orange 1542, longueur des rRNAs en pbs.
- - Colonne cds, les noms courts des cds
- . en clair
- . en vert D glycero, protéine identique entre eco et ecoN, à peu près en longueur et par le nom.
- . en bleu YdiA, protéine complètement différente en nom et/ou en longueur, entre ecoN et eco
- . en turquoise hp-419, protéine identique par la longueur mais différente par le nom, entre ecoN et eco
- . en gris clair D glycero, dans le tableau E13, protéine transposée par complement (colonne sens) entre ecoN et eco alors qu'il y a transposition des intercalaires (colonne interca), 365.
- . en gris foncé ABC 32, dans le tableau E13, protéine non transposée par complement (colonne sens) entre ecoN et eco alors qu'il n'y a pas transposition des intercalaires (colonne interca), 174.
- . en vert très foncé, dans le tableau E13, Tyr recb 404,protéine existant dans ecoN mais non trouvée dans eco.
- Notes: Les dates de prélèvements des blocs de eco sont ceux de eco opérons du 10.3.19 alors que les cds de eco ont été prélevés le 19.12.19, qu'on voit dans le tableur ecoN eco tableaux. Pour ecoN la date de prélèvement est celle de ecoN opérons.
|
|
|
ecoN eco noms cds[modifier | modifier le wikicode]
- Lien tableur: ecoN eco noms cds
- Légende
fonction | Noms courts | Noms longs |
---|---|---|
tr-regulator | XapR | DNA-binding transcriptional activator XapR |
permease | aa permease | amino acid permease |
ABC bind | ABC 32 | ABC transporter ATP-binding protein |
ABC bind | ABC MetN | methionine ABC transporter ATP-binding protein MetN |
desaturase | acyl-CoA | acyl-CoA desaturase |
adhesin | adhes YdhQ | adhesin-like autotransporter YdhQ |
adhesin | adhes YejO | adhesin-like autotransporter YejO, gene fragment 2 of yejO, misc_feature |
hydrolase | AICAR1 | bifunctional AICAR transformylase/IMP cyclohydrolase |
hydrolase | AICAR2 | bifunctional phosphoribosylaminoimidazolecarboxamide formyltransferase/IMP cyclohydrolase |
amidase | Ala C | N-acetylmuramoyl-L-alanine amidase C |
maturase | ans maturase | anaerobic sulfatase maturase |
synthetase | Arg-suc | argininosuccinate synthetase |
integrase | arm-type | integrase arm-type DNA-binding domain-containing protein |
synthetase | Asn B | asparagine synthetase B |
protease b | ATP ClpA | ATP-dependent Clp protease ATP-binding subunit ClpA |
kinase | B5 kinase | pantothenate kinase |
kinase | B5 kinase I | type I pantothenate kinase |
transporter | barrel | autotransporter outer membrane beta-barrel domain-containing protein |
tr-regulator | CadC | DNA-binding transcriptional activator CadC |
cardiolipin | cardiolipine | cardiolipin transport protein PbgA |
transferase | CDP-diacyl | CDP-diacylglycerol--glycerol-3-phosphate 3-phosphatidyltransferase |
division | cell CpoB | cell division coordinator CpoB |
chaperone | ClpB | ClpB chaperone |
chaperone | ClpB dep | ATP-dependent chaperone ClpB |
storage | Csr | carbon storage regulator |
storage | CsrA | carbon storage regulator CsrA |
hydrolase | cyclo FolD | bifunctional methylenetetrahydrofolate dehydrogenase/methenyltetrahydrofolate cyclohydrolase FolD |
phosphatase | D-glycero | D-glycero-beta-D-manno-heptose-1,7-bisphosphate 7-phosphatase |
ABC bind | dip ABC | dipeptide ABC transporter periplasmic binding protein |
polymerase | DNAIIIe | DNA polymerase III subunit epsilon |
ABC bind | DppA | dipeptide ABC transporter substrate-binding protein DppA |
DUF | DUF1435 | DUF1435 domain-containing protein |
DUF | DUF4102 | DUF4102 domain-containing protein |
DUF | DUF4942 | DUF4942 domain-containing protein |
DUF | DUF5507 | DUF5507 domain-containing protein YpjC |
DUF | DUF554 | DUF554 domain-containing protein |
DUF | DUF554 Yqg | DUF554 domain-containing protein YqgA |
peptidase | ErfK | L,D-transpeptidase ErfK |
exporter | exporter | FMN/FAD exporter |
tr-regulator | FadR tr | FadR family transcriptional regulator |
reductase | ferric | NADPH-dependent ferric chelate reductase |
phosphatase | fructose | fructose-1-phosphatase |
phosphatase | fructose 6 | fructose-1-phosphate/6-phosphogluconate phosphatase |
deformylase | fTHF | formyltetrahydrofolate deformylase |
protase | FtsH | modulator of FtsH protease |
protease | FtsH YccA | FtsH protease modulator YccA |
glycosylase | G/U | G/U mismatch-specific DNA glycosylase |
glycosylase | G/U station | stationary phase mismatch/uracil DNA glycosylase |
transferase | G1207 | 16S rRNA m(2)G1207 methyltransferase |
transferase | G1207 RsmC | 16S rRNA (guanine(1207)-N(2))-methyltransferase RsmC |
anhydrase | gc anhydrase | gamma carbonic anhydrase family protein |
ligase | Glu ligase | glutamate--tRNA ligase |
racemase | Glu race | glutamate racemase |
dehydrogenase | glu5dH | glutamate-5-semialdehyde dehydrogenase |
reductase | gluDkgB | 2,5-didehydrogluconate reductase DkgB |
permease | glutarate pm | alpha-ketoglutarate permease |
symporter | glutarate sm | alpha-ketoglutarate:H(+) symporter |
peptidase | glycan DD | peptidoglycan DD-metalloendopeptidase family protein |
synthetase | glycerolP | phosphatidylglycerophosphate synthase |
transporter | glycoside-p5 | glycoside-pentoside-hexuronide family transporter |
reductase | glyoxyl A | glyoxylate/hydroxypyruvate reductase A |
reductase | glyoxyl GhrA | glyoxylate/hydroxypyruvate reductase GhrA |
permease | HAAAP | HAAAP family serine/threonine permease |
tr-regulator | HdfR | DNA-binding transcriptional dual regulator HdfR |
tr-regulator | HdfR HTH | HTH-type transcriptional regulator HdfR |
hydrogenase | Hnase1 | hydrogenase 1 small subunit |
hp | hp-121 | hp-121 |
hp | hp-128 | hypothetical protein |
hp | hp-18 | hp-18 |
adhesin | Inv-adhesin | inverse autotransporter adhesin |
transposase | IS66 | IS66 family transposase |
lyase | isocitrate | isocitrate lyase |
transferase | kdo2 | kdo(2)-lipid A phosphoethanolamine 7-transferase |
kinase/Pase | kinase isocit | bifunctional isocitrate dehydrogenase kinase/phosphatase |
prophage | KpLE1 | CPS-53 (KpLE1) prophage; prophage CPS-53 integrase |
lipoprotein | lipo YafT | lipoprotein YafT |
tr-regulator | LysR | LysR family transcriptional regulator |
tr-regulator | MarR | MarR family transcriptional regulator |
reductase | metDkgB | methylglyoxal reductase DkgB |
GDP | Mlb adapt | molybdopterin-guanine dinucleotide biosynthesis adaptor protein |
GDP | Mlb pB | molybdopterin-guanine dinucleotide biosynthesis protein B |
oxygenase | mono-O2 | monooxygenase |
titration | Mtf | Mlc titration factor |
tr-regulator | MtfA | DgsA anti-repressor MtfA |
glycosylase | murein | murein transglycosylase A |
glycosylase | murein lytic | membrane-bound lytic murein transglycosylase A |
reductase | NADPH- Ah | aldehyde reductase, NADPH-dependent |
reductase | NADPH- Ahr | NADPH-dependent aldehyde reductase Ahr |
transporter | nitrite | formate/nitrite transporter family protein |
hydroxylase | octaprenyl | 2-octaprenyl-3-methyl-6-methoxy-1,4-benzoquinol hydroxylase |
rnase | oligo-rnase | oligoribonuclease |
protein | OmpH | OmpH family outer membrane protein |
transferase | p-Ada | pseudo, bifunctional DNA-binding transcriptional regulator/O6-methylguanine-DNA methyltransferase Ada |
transporter | p-AI-2E | pseudo, AI-2E family transporter |
synthetase | p-Arg-sc 282 | Pseudo, argininosuccinate synthase |
synthetase | p-Arg-sc 284 | Pseudo, argininosuccinate synthase |
division | p-cell CpoB | Pseudo, cell division protein CpoB |
DUF | p-DUF4102 | Pseudo, DUF4102 domain-containing protein |
transporter | p-glycoside | pseudo, glycoside-pentoside-hexuronide family transporter |
kinase | p-His kinase | pseudo, histidine kinase |
hp | p-hp | pseudo, hp 109 |
integrase | p-integrase | pseudo, integrase |
transposase | p-IS4 | Pseudo, IS4 family transposase |
transposase | p-IS630 | pseudo, IS630 family transposase |
transporter | p-MATE | Pseudo, MATE family efflux transporter |
transporter | p-MdtK | Pseudo, multidrug efflux MATE transporter MdtK |
amidase | p-Nam | pseudo, nicotinamide-nucleotide amidase |
tr-regulator | p-pu-tr 38 | pseudo, putative DNA-binding transcriptional regulator |
protein | p-un-YchS | putative uncharacterized protein YchS |
gene | p-yicT | p-yicT |
transferase | Pet | phosphoethanolamine transferase |
protein | pilus | pilus assembly protein |
dehydrogenase | porphyrine M | menaquinone-dependent protoporphyrinogen IX dehydrogenase |
oxidase | porphyrine O | protoporphyrinogen oxidase |
prophage | pp CP4-6 | note="cryptic prophage CP4-6" misc_feature |
prophage | pp CPS-53 | cryptic prophage CPS-53, misc_feature |
prophage | pp DLP12 | note="cryptic prophage DLP12" misc_feature |
prophage | pp PR-Y | cryptic prophage PR-Y |
protein | protein YjjZ | protein YjjZ |
protein | protein YrdA | protein YrdA |
tr-regulator | pu- YfeC | putative DNA-binding transcriptional regulator YfeC |
ABC bind | pu-ABC | amino acid ABC transporter ATP-binding protein |
exporter | pu-arabi | putative arabinose exporter |
sulfatase | pu-AslB | putative anaerobic sulfatase maturation enzyme AslB |
cardiolipin | pu-cardiolip | putative cardiolipin transport protein |
cytochrome | pu-cytochrom | putative cytochrome |
hydrolase | pu-hydrolase | putative hydrolase, inner membrane |
integrase | pu-KpLE2 | KpLE2 phage-like element; putative integrase |
peptidase | pu-LysM | LysM domain-containing putative peptidase lipoprotein YgeR |
GMP | pu-sensor | putative c-di-GMP phosphodiesterase PdeA |
protein | Pu-ssM | putative type II secretion system M-type protein |
tr-regulator | pu-tr 120 | putative DNA-binding transcriptional regulator |
tr-regulator | pu-tr YieP | putative transcriptional regulator YieP |
tr-regulator | pu-tr YjdC | putative DNA-binding transcriptional regulator YjdC |
tr-regulator | pu-tr-YeeN | putative transcriptional regulator YeeN |
protein | pu-unYgaQ | putative uncharacterized protein YgaQ |
oxygenase | pu-YdhR | putative monooxygenase YdhR |
ABC bind | pu-YhdZ | putative ABC transporter ATP-binding subunit YhdZ |
transporter | pu-YicJ | putative xyloside transporter YicJ |
transporter | pu-YifK | putative transporter YifK |
prophage | put DLP12 | DLP12 prophage; putative integrase |
tr-regulator | put FimZ | putative LuxR family transcriptional regulator FimZ |
synthetase | quino | quinolinate synthase |
synthetase | quino NadA | quinolinate synthase NadA |
ribosome | RimP | ribosome maturation factor RimP |
rpt | rpt-29 | rpt-29 |
rpt | rpt-34 | rpt_type=other |
rpt | rpt-36 | rpt_type=other |
rpt | rpt71 | rpt_type=other 71 |
sRNA | RttR sRNA | small RNA RttR |
translocase | SecE | Sec translocon subunit SecE |
translocase | SecG-p | preprotein translocase subunit SecG |
translocase | SecG-t | Sec translocon subunit SecG |
esterase | sensor | sensor domain-containing phosphodiesterase |
ABC bind | sn-glycerol | sn-glycerol-3-phosphate ABC transporter substrate-binding protein UgpB |
protein | sscs VI | type VI secretion system contractile sheath small subunit |
protein | stress | stress response protein |
tr-regulator | tact Cbl | DNA-binding transcriptional activator Cbl |
translation | tif IF-1 | translation initiation factor IF-1 |
protein | tpr | protamine-like protein |
tr-regulator | tr 192 | transcriptional regulator |
tr-regulator | tr AlpA | AlpA family transcriptional regulator |
tr-regulator | tr-Cbl | HTH-type transcriptional regulator Cbl |
tr-regulator | tr-Nac | DNA-binding transcriptional dual regulator Nac |
tr-regulator | tr-nitrogen | nitrogen assimilation transcriptional regulator |
tr-regulator | tr-YebC | YebC/PmpR family DNA-binding transcriptional regulator |
transferase | transferase | acetyltransferase |
transporter | trp-YeeO | toxic metabolite efflux MATE transporter YeeO |
translation | tuf | elongation factor Tu |
translation | tufb | tufb, translation elongation factor Tu 2 |
integrase | Tyr recb 207 | tyrosine-type recombinase/integrase |
integrase | Tyr recb 404 | tyrosine-type recombinase/integrase |
integrase | Tyr recb 421 | tyrosine-type recombinase/integrase |
integrase | Tyr recb 424 | tyrosine-type recombinase/integrase |
reductase | UDP-N | UDP-N-acetylenolpyruvoylglucosamine reductase |
protein | un-YcdU | uncharacterized protein YcdU |
protein | un-YjeV | uncharacterized protein YjeV |
protein | UPF0149 YecA | UPF0149 family protein YecA |
protein | YdiA | YdiA family protein |
protein | YfdC | inner membrane protein YfdC |
protein | YgeQ | protein YgeQ |
gene | yjdQ | gene="yjdQ" |
DUF | DUF1435 | DUF1435 domain-containing protein |
transposase | p-IS630 | pseudo, IS630-like element IS630 family transposase |
ecoN. Intergen51[modifier | modifier le wikicode]
Intergen51. ecoN. Le génome[modifier | modifier le wikicode]
- ecoN Le prélèvement: gama
- Le nom et le lien NCBI: ecoN, Escherichia coli Nissle 1917 chromosome, NCBI [71], date 11.5.21.
- ecoN La longueur totale des intercalaires, longueur du génome et taux intercalaires/génome:
Nom intercals génome taux en % ecoN 646,219 5,441,200 11.9
ecoN données intercalaires[modifier | modifier le wikicode]
- Lien tableur: ecoN données intercalaires
- Lien sauvegarde NCBI:gama
ecoN données intercalaires 200[modifier | modifier le wikicode]
- Lien tableur: données intercalaires 200.
ecoN autres intercalaires aas[modifier | modifier le wikicode]
- Lien tableur: ecoN autres intercalaires aas
- Lien sauvegarde NCBI:gama
Intergen51. ecoN. Les différents types d'intercalaires[modifier | modifier le wikicode]
- Lien au tableur: Intergen51. ecoN les différents types d'intercalaires.
- Légende:
- - S pour intercalaire CDS-CDS et R pour tRNA-CDS,
- - c pour intercalaire continu (les 2 gènes sont sur le même brin) et x pour discontinu (les 2 gènes sont sur 2 brins différents, le brin et son complément)
- - %reste = 100*reste/total, le reste étant ce qui reste du total après la fin du diagramme, gamme.
- - %t30 = 100*t30/total, t30 étant le total des fréquences 10 20 30
- - %t5 = 100*t/total, t5 étant le total des fréquences de -1 à -5 dans le diagramme des S-.
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
Intergen51. ecoN. Les diagrammes CDS-CDS positifs[modifier | modifier le wikicode]
- Lien tableur: Les diagrammes
- Diagrammes des gamma: ecoN présente 2 diagrammes
- - fc40, CDS-CDS continu, fréquence unitaire en abscisses et effectif en ordonnées
- - fx%, CDS-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et pourcentage en ‰ par rapport au total, en ordonnées.
- Équations des courbes de tendance en pour 1000: colonnes %fx %fc
Courbes de tendances pour les diagrammes en pour 1000 Calculs des f.41 ecoN R2 x3 x2 x c Inflexion poly3 x c 0.561 1.45E-06 -8.87E-04 5.65E-02 35.30 fx1 abscisse 261.5 434.8 0.853 -6.60E-06 5.18E-03 -1.32E+00 119.0 fc1 ordonnée 15.7 5.2 0.784 -2.46E-06 1.93E-03 -5.54E-01 72.6 fx41 0.959 -8.05E-07 1.05E-03 -4.48E-01 67.7 fc41
Intergen51. ecoN. Les CDS-CDS négatifs[modifier | modifier le wikicode]
Sous-totaux ecoN totale fréquence x- c- x- c- - 1 2 173 4 4140 - 2 4 5 85 11 - 3 2 0 3 12 - 4 39 328 717 10938 - 5 2 2 5 19 sp6 56 274 1642 8424 total 105 782 2,456 23,544 reste 5 10 264 420 s6 18 5 361 41 s7 10 51 321 1438 s8 23 208 696 6525 rappot s1-5 4/2/1 9.75 1.9 8.4 2.6 % / sp6 s6/sp6 32.1 1.8 22.0 0.5 s7/sp6 17.9 18.6 19.5 17.1 s8/sp6 41.1 75.9 42.4 77.5 reste/sp6 8.9 3.6 16.1 5.0 total s1-5 49 508 814 15120 % / total %s1-5 46.7 65.0 33.1 64.2 %sp6 53.3 35.0 66.9 35.8
Intergen51. ecoN. Les intercalaires des blocs[modifier | modifier le wikicode]
- Le détail
RNA-RNA c x CDS-RNA c x 23s 5s 7 CDS 16s 6 2 16s 23s 5s CDS 5 2 16s tRNA 9 16 CDS tRNA 23s 7 CDS 5s 5s tRNA 4 23s CDS 2 tRNA in 4 CDS 23s tRNA contig 5 5s 16s tRNA hors 43 16s16s tRNA 16s 1 23s tRNA tRNA 5s 4 16s 5s 5s 23s 5s 5s total 84 0 total 13 4
- Les rares voir gamma pour la longueur des intercalaires
- Les tRNA-CDS compris, comparaison dans le clade et dans l'étude.
Intergen51. ecoN. Les intercalaires tRNA-tRNA extra bloc[modifier | modifier le wikicode]
- Lien tableur: Intergen51. ecoN. Les intercalaires tRNA-tRNA extra bloc
- ecoN. Les intercalaires tRNA-tRNA contigus aux blocs
inter aa 8 gac ** tgg 1472 °gaa 42 °atc 2351 $atc ** $gaa 42 gca ** atc
inter | aa | inter | aa | inter | aa | ||
---|---|---|---|---|---|---|---|
37 | cag | 4 | gtc | 58 | cgg | ||
48 | cag | ** | gtc | 20 | cac | ||
15 | atgj | 12 | tta | 42 | ctg | ||
34 | caa | 53 | tgc | ** | cca | ||
23 | caa | ** | ggc | 8 | aca | ||
10 | cta | 39 | gcc | 116 | tac | ||
** | atgj | ** | gcc | 6 | gga | ||
35 | aaa | 43 | gta | ** | acc | ||
2 | gta | 46 | gta | 36 | ggc | ||
51 | aaa | 4 | gta | 35 | ggc | ||
3 | gta | ** | aaa | ** | ggc | ||
48 | aaa | 63 | cgt | 34 | ctg | ||
33 | aaa | 62 | cgt | 28 | ctg | ||
** | aaa | 62 | cgt | ** | ctg | ||
33 | tac | 64 | cgt | 39 | gcc | ||
** | tac | 3 | cgt | 39 | gcc | ||
4 | gtc | ** | agc | ** | gcc | ||
** | gtc | 33 | atgf | 44 | gta | ||
4 | gtc | 33 | atgf | ** | gta | ||
** | gtc | ** | atgf | 28 | ctg | ||
** | ctg |
Vibrio campbellii[modifier | modifier le wikicode]
vha opérons[modifier | modifier le wikicode]
- Liens: gtRNAdb [72], NCBI chr1 [73], NCBI chr2 [74], génome [75]
- Lien tableur: vha opérons
45.4%GC | 26.7.19 Paris | 121 | doubles | interca | cds | aa | avec aa | cdsa | cdsd |
---|---|---|---|---|---|---|---|---|---|
Chromosome I | |||||||||
comp | 1..1384 | 16s | @1 | 103 | 103 | ||||
comp | 1488..1604 | cds | 102507 | 39 | |||||
104112..105239 | cds | 529 | 529 | 376 | 529 | ||||
comp | 105769..105845 | atgf | + | 158 | 158 | ||||
comp | 106004..106079 | ggc | 7 ggc | 35 | 35 | ||||
comp | 106115..106190 | ggc | 5 atgf | 35 | 35 | ||||
comp | 106226..106301 | ggc | 18 | 18 | |||||
comp | 106320..106396 | atgf | 39 | 39 | |||||
comp | 106436..106511 | ggc | 90 | 90 | |||||
comp | 106602..106678 | atgf | 39 | 39 | |||||
comp | 106718..106793 | ggc | 18 | 18 | |||||
comp | 106812..106888 | atgf | 39 | 39 | |||||
comp | 106928..107003 | ggc | 18 | 18 | |||||
comp | 107022..107098 | atgf | 39 | 39 | |||||
comp | 107138..107213 | ggc | 156 | 156 | 156 | ||||
comp | 107370..107915 | cds | 81764 | 182 | |||||
189680..190715 | cds | 101 | 101 | 345 | 101 | ||||
comp | 190817..190933 | 5s | 107 | ||||||
comp | 191041..193955 | 23s | 290 | ||||||
comp | 194246..194321 | gca | 43 | 43 | |||||
comp | 194365..194441 | atc | 97 | ||||||
comp | 194539..196096 | 16s | @2 | 371 | |||||
comp | 196468..196584 | 5s | 77 | ||||||
comp | 196662..199576 | 23s | 290 | ||||||
comp | 199867..199942 | gca | 43 | 43 | |||||
comp | 199986..200062 | atc | 97 | ||||||
comp | 200160..201717 | 16s | 853 | 853 | 853 | ||||
comp | 202571..204706 | cds | 29595 | 712 | |||||
comp | 234302..235486 | cds | 101 | 101 | 395 | 101 | |||
comp | 235588..235663 | acc | 13 | 13 | |||||
comp | 235677..235751 | gga | 35 | 35 | |||||
comp | 235787..235871 | tac | 52 | 52 | |||||
comp | 235924..235999 | aca | 206 | 206 | |||||
236206..237129 | cds | 4144 | 308 | ||||||
comp | 241274..242467 | cds | 546 | 546 | 398 | 546 | |||
comp | 243014..243090 | tgg | 68 | 68 | |||||
comp | 243159..243235 | gac | 32 | ||||||
comp | 243268..243384 | 5s | 117 | ||||||
comp | 243502..246404 | 23s | 310 | ||||||
comp | 246715..246790 | gta | 30 | 30 | |||||
comp | 246821..246896 | aaa | 2 | 2 | |||||
comp | 246899..246974 | gaa | 122 | ||||||
comp | 247097..248654 | 16s | 554 | 554 | 554 | ||||
249209..249664 | cds | 60596 | 152 | ||||||
310261..311296 | cds | 121 | 121 | 345 | 121 | ||||
comp | 311418..311508 | tca | 91 | ||||||
comp | 311600..311716 | 5s | 108 | ||||||
comp | 311825..314739 | 23s | 289 | ||||||
comp | 315029..315104 | gca | 43 | 43 | |||||
comp | 315148..315224 | atc | 56 | ||||||
comp | 315281..316842 | 16s | 471 | 471 | 471 | ||||
comp | 317314..318027 | cds | 40242 | 238 | |||||
358270..359305 | cds | 147 | 147 | 345 | |||||
comp | 359453..359529 | gac | 31 | ||||||
comp | 359561..359677 | 5s | 108 | ||||||
comp | 359786..362700 | 23s | 310 | ||||||
comp | 363011..363086 | gta | 30 | 30 | |||||
comp | 363117..363192 | aaa | 2 | 2 | |||||
comp | 363195..363270 | gaa | 82 | ||||||
comp | 363353..364914 | 16s | 83 | 83 | 83 | ||||
comp | 364998..365133 | cds | 84252 | 45 | |||||
449386..449521 | cds | 83 | 83 | 45 | 83 | ||||
449605..451162 | 16s | 122 | |||||||
451285..451360 | gaa | 2 | 2 | ||||||
451363..451438 | aaa | 9 | 9 | ||||||
451448..451523 | gca | 37 | 37 | ||||||
451561..451636 | gta | 51 | 51 | 51 | |||||
comp | 451688..451873 | cds | 16 | 16 | 62 | 16 | |||
451890..454804 | 23s | 77 | |||||||
454882..454998 | 5s | 32 | |||||||
455031..455107 | gac | 162 | 162 | ||||||
comp | 455270..455533 | cds | 11718 | 88 | |||||
comp | 467252..467665 | cds | 361 | 361 | 138 | ||||
468027..468103 | cgg | 35 | 35 | ||||||
468139..468214 | cac | 76 | 76 | ||||||
468291..468367 | cca | 46 | 46 | ||||||
468414..468489 | cac | 64 | 64 | ||||||
468554..468630 | cca | 194 | 194 | 194 | |||||
comp | 468825..469550 | cds | 365688 | 242 | |||||
comp | 835239..835550 | cds | 138 | 138 | 104 | 138 | |||
comp | 835689..835764 | atgi | 145 | 145 | |||||
comp | 835910..837772 | cds | 182191 | 621 | |||||
1019964..1020128 | cds | 119 | 119 | 55 | |||||
1020248..1021805 | 16s | 129 | |||||||
1021935..1022010 | gcc | 41 | 41 | ||||||
1022052..1022127 | gaa | 55 | 55 | 55 | |||||
comp | 1022183..1022368 | cds | 16 | 16 | 62 | 16 | |||
1022385..1025299 | 23s | 111 | |||||||
1025411..1025527 | 5s | 31 | |||||||
1025559..1025635 | gac | 35 | 35 | ||||||
1025671..1025747 | tgg | 3 | 3 | 3 | |||||
comp | 1025751..1025933 | cds | 225465 | 61 | |||||
1251399..1252574 | cds | 158 | 158 | 392 | |||||
comp | 1252733..1252817 | cta | + | 54 | 54 | ||||
comp | 1252872..1252946 | caa | 5 cta | 46 | 46 | ||||
comp | 1252993..1253077 | cta | 3 atgj | 21 | 21 | ||||
comp | 1253099..1253183 | cta | 2 caa | 18 | 18 | ||||
comp | 1253202..1253278 | atgj | 23 | 23 | |||||
comp | 1253302..1253386 | cta | 70 | 70 | |||||
comp | 1253457..1253533 | atgj | 79 | 79 | |||||
comp | 1253613..1253687 | caa | 31 | 31 | |||||
comp | 1253719..1253803 | cta | 39 | 39 | |||||
comp | 1253843..1253919 | atgj | 26 | 26 | 26 | ||||
comp | 1253946..1254157 | cds | 14564 | 71 | |||||
comp | 1268722..1268862 | cds | 260 | 260 | 47 | ||||
1269123..1269199 | cca | 243 | 243 | 243 | |||||
comp | 1269443..1269628 | cds | 16361 | 62 | |||||
1285990..1286571 | cds | 88 | 88 | 194 | |||||
comp | 1286660..1286736 | agg | 68 | 68 | 68 | ||||
comp | 1286805..1287938 | cds | 116753 | 378 | |||||
comp | 1404692..1405552 | cds | 204 | 204 | 287 | 204 | |||
1405757..1405833 | aga | 244 | 244 | ||||||
1406078..1407685 | cds | 49950 | 536 | ||||||
1457636..1458508 | cds | 407 | 407 | 291 | |||||
comp | 1458916..1459000 | tac | + | 100 | 100 | ||||
comp | 1459101..1459185 | tac | 4 tac | 100 | 100 | ||||
comp | 1459286..1459370 | tac | @7 | 100 | 100 | ||||
comp | 1459471..1459555 | tac | 282 | 282 | 282 | ||||
1459838..1460935 | cds | 170368 | 366 | ||||||
1631304..1631753 | cds | 144 | 144 | 150 | 144 | ||||
1631898..1631985 | tcc | 312 | 312 | ||||||
1632298..1632684 | cds | 550413 | 129 | ||||||
2183098..2183436 | cds | 179 | 179 | 113 | |||||
2183616..2183692 | gtc | + | 46 | 46 | |||||
2183739..2183815 | gtc | 2 gtc | 149 | 149 | 149 | ||||
2183965..2185344 | cds | 578546 | 460 | ||||||
comp | 2763891..2766782 | cds | 763 | 763 | 964 | 763 | |||
comp | 2767546..2767621 | ggc | + | 11 | 11 | ||||
comp | 2767633..2767719 | tta | 2 ggc | 78 | 78 | ||||
comp | 2767798..2767873 | ggc | 37 | 37 | |||||
comp | 2767911..2767984 | tgc | 400 | 400 | 400 | ||||
comp | 2768385..2768942 | cds | 82481 | 186 | |||||
2851424..2851855 | cds | 62 | 62 | 144 | 62 | ||||
2851918..2851992 | gga | 333 | 333 | ||||||
2852326..2852970 | cds | 133282 | 215 | ||||||
comp | 2986253..2986402 | cds | 1 | 1 | 50 | 1 | |||
2986404..2986479 | aac | 372 | 372 | ||||||
2986852..2989149 | cds | 60873 | 766 | ||||||
3050023..3051831 | cds | 139 | 139 | 603 | 139 | ||||
3051971..3052061 | tca | 321 | 321 | ||||||
3052383..3053693 | cds | 384243 | 437 | ||||||
comp | 3437937..3438392 | cds | 233 | 233 | 152 | ||||
comp | 3438626..3438702 | atgf | 56 | 56 | |||||
comp | 3438759..3438842 | ctc | 18 | 18 | 18 | ||||
comp | 3438861..3439199 | cds | 113972 | 113 | |||||
comp | 3553172..3554167 | cds | 189 | 189 | 332 | 189 | |||
comp | 3554357..3554433 | cgt | + | 59 | 59 | ||||
comp | 3554493..3554569 | cgt | 7 cgt | 57 | 57 | ||||
comp | 3554627..3554703 | cgt | 2 agc | 57 | 57 | ||||
comp | 3554761..3554837 | cgt | 57 | 57 | |||||
comp | 3554895..3554971 | cgt | 57 | 57 | |||||
comp | 3555029..3555105 | cgt | 85 | 85 | |||||
comp | 3555191..3555282 | agc | 29 | 29 | |||||
comp | 3555312..3555388 | cgt | 31 | 31 | |||||
comp | 3555420..3555511 | agc | 243 | 243 | |||||
comp | 3555755..3555952 | cds | 83212 | 66 | |||||
3639165..3640295 | cds | 108 | 108 | 377 | 108 | ||||
3640404..3640479 | ttc | + | 51 | 51 | |||||
3640531..3640606 | aca | 3 ttc | 7 | 7 | |||||
3640614..3640689 | ttc | 2 aca | 43 | 43 | |||||
3640733..3640808 | aac | 2 aac | 69 | 69 | |||||
3640878..3640953 | aca | 10 | 10 | ||||||
3640964..3641039 | ttc | 42 | 42 | ||||||
3641082..3641158 | aac | 292 | 292 | ||||||
3641451..3643076 | cds | 233 | 233 | 542 | |||||
3643310..3643385 | ttc | 51 | 51 | ||||||
3643437..3643512 | aca | + | 21 | 21 | |||||
3643534..3643609 | aac | 2 aca | 39 | 39 | |||||
3643649..3643724 | aca | 2 aac | 15 | 15 | |||||
3643740..3643815 | aac | 156 | 156 | 156 | |||||
comp | 3643972..3645405 | cds | 561 | 561 | 478 | 561 | |||
comp | 3645967..3646043 | gac | 31 | ||||||
comp | 3646075..3646191 | 5s | 57 | ||||||
comp | 3646249..3646324 | acc | 100 | ||||||
comp | 3646425..3646541 | 5s | 111 | ||||||
comp | 3646653..3649567 | 23s | -13 | -13 | -13 | ||||
comp | 3649555..3649797 | cds | @3 | 35 | 35 | 81 | 35 | ||
comp | 3649833..3649908 | gca | 43 | 43 | |||||
comp | 3649952..3650028 | atc | 97 | ||||||
comp | 3650126..3651683 | 16s | 557 | 557 | 557 | ||||
comp | 3652241..3653491 | cds | 9514 | 417 | |||||
comp | 3663006..3663598 | cds | 181 | 181 | 198 | ||||
comp | 3663780..3663864 | ttg | 177 | 177 | 177 | ||||
comp | 3664042..3664707 | cds | 93515 | 222 | |||||
3758223..3759258 | cds | 578 | 578 | 345 | 578 | ||||
comp | 3759837..3759913 | gac | 68 | ||||||
comp | 3759982..3760098 | 5s | 111 | ||||||
comp | 3760210..3763124 | 23s | 290 | ||||||
comp | 3763415..3763490 | gca | 43 | 43 | |||||
comp | 3763534..3763610 | atc | 97 | ||||||
comp | 3763708..3765265 | 16s | 86 | ||||||
comp | 3765351 | 16s | début | ||||||
Chromosome II | |||||||||
comp | 673782..674186 | cds | 358 | 358 | 135 | ||||
comp | 674545..674635 | tca | 329 | 329 | 329 | ||||
674965..675645 | cds | 205537 | 227 | ||||||
881183..882640 | cds | 244 | 244 | 486 | 244 | ||||
882885..882958 | tgc | 302 | 302 | ||||||
883261..883725 | cds | 1229 | 155 | ||||||
884955..886649 | cds | 245 | 245 | 565 | 245 | ||||
886895..886981 | tta | 97 | 97 | ||||||
887079..887154 | ggc | 5 | 5 | ||||||
887160..887233 | tgc | 317 | 317 | ||||||
887551..889074 | cds | 465 | 508 | ||||||
comp | 889540..890328 | cds | 386 | 386 | 263 | ||||
890715..890801 | tta | + | 53 | 53 | |||||
890855..890928 | tgc | 2 tgc | 181 | 181 | |||||
891110..891183 | tgc | 366 | 366 | 366 | |||||
891550..891891 | cds | 443950 | 114 | ||||||
1335842..1336042 | cds | 17 | 17 | 17 | |||||
1336060..1336134 | gga | 272 | 272 | ||||||
comp | 1336407..1337222 | cds | 505333 | 272 | |||||
1842556..1842741 | cds | -36 | -36 | 62 | -36 | ||||
1842706..1842789 | ctc | 29 | 29 | 29 | |||||
1842819..1843430 | cds | 77699 | 204 | ||||||
1921130..1921561 | cds | 62 | 62 | 144 | 62 | ||||
1921624..1921698 | gga | 337 | 337 | ||||||
comp | 1922036..1922209 | cds | 15660 | 58 | |||||
comp | 1937870..1939129 | cds | 84 | 84 | 420 | ||||
comp | 1939214..1939304 | tca | 90 | ||||||
comp | 1939395..1939511 | 5s | 77 | ||||||
comp | 1939589..1942503 | 23s | 306 | ||||||
comp | 1942810..1942885 | gta | 35 | 35 | |||||
comp | 1942921..1942996 | gca | 24 | 24 | |||||
comp | 1943021..1943096 | aaa | 2 | 2 | |||||
comp | 1943099..1943174 | gaa | 114 | ||||||
comp | 1943289..1944850 | 16s | 83 | 83 | 83 | ||||
comp | 1944934..1945071 | cds | 46 |
vha cumuls[modifier | modifier le wikicode]
- Lien tableur: vha cumuls
- Note: Les statistiques sur les intercalaires entre tRNA ne sont pas correctes. Se reporter à intergen51.vha. Il n'y a aucun commentaire sur les CDS. J'ai réduit le tableau aux clusters à rRNA. L'intitulé opéron doit d'être compris dans le sens cluster ou bloc de RNA, rRNA ou tRNA.
opérons | Fréquences intercalaires tRNAs | Fréquences intercalaires cds | Fréquences aas cds | ||||||||
---|---|---|---|---|---|---|---|---|---|---|---|
effectif | gammes | sans rRNAs | avec rRNAs | gammes | cds | gammes | cdsd | gammes | cdsa | ||
avec rRNA | opérons | 11 | 1 | 0 | 0 | 1 | 3 | 1 | 1 | 100 | 17 |
16 aas 23 5s | 3 | 20 | 10 | 5 | 50 | 8 | 20 | 5 | 200 | 17 | |
16 atc gca | 4 | 40 | 17 | 6 | 100 | 10 | 40 | 3 | 300 | 10 | |
16 cds 23 5s | 3 | 60 | 16 | 6 | 150 | 12 | 60 | 2 | 400 | 13 | |
max a | 5 | 80 | 6 | 1 | 200 | 9 | 80 | 3 | 500 | 6 | |
a doubles | 0 | 100 | 6 | 0 | 250 | 9 | 100 | 3 | 600 | 4 | |
spéciaux | 1 | 120 | 0 | 0 | 300 | 4 | 120 | 3 | 700 | 2 | |
total aas | 37 | 140 | 0 | 0 | 350 | 7 | 140 | 3 | 800 | 2 | |
sans | opérons | 27 | 160 | 1 | 0 | 400 | 6 | 160 | 4 | 900 | 0 |
1 aa | 14 | 180 | 0 | 0 | 450 | 1 | 180 | 1 | 1000 | 1 | |
max a | 12 | 200 | 1 | 0 | 500 | 1 | 200 | 2 | 1100 | 0 | |
a doubles | 10 | 0 | 0 | 8 | 8 | 0 | |||||
total aas | 84 | 57 | 18 | 78 | 38 | 72 | |||||
total aas | 121 | ||||||||||
remarques | 3 | ||||||||||
avec jaune | moyenne | 30 | 266 | ||||||||
variance | 19 | 199 | |||||||||
sans jaune | moyenne | 46 | 183 | 86 | 240 | ||||||
variance | 25 | 114 | 59 | 178 |
vha tRNA-cds[modifier | modifier le wikicode]
- Note: intercalaires prélevés de la colonne cds de vha opérons dans un bloc de tRNAs uniquement. Le début du bloc est dans l'ordre des adresses, deb intercalaire entre le cds et le 1er tRNA dd bloc, fin entre le dernier tRNA et le cds terminal. J'ai procédé, dans les colonnes petit et grand, à la réorientation des blocs d'après la constatation que les blocs à rRNA ont leurs cds de début et de fin sont orientés du cds-16s au 5s-tRNAs-cds, l'intercalaire cds-16s étant plus grands que l'intercalaire avec le cds terminal. En tête de colonne est le % du nombre des intercalaires inférieurs à 201 pbs.
vha 56 37 22 70 deb fin deb fin grand petit grand petit -36 29 233 18 29 -36 29 -36 1 372 158 26 88 68 372 1 17 272 -36 29 145 138 272 17 62 333 88 68 158 26 233 18 62 337 138 145 179 149 158 26 88 68 179 149 181 177 333 62 101 206 233 156 206 101 337 62 108 292 529 156 233 18 88 68 138 145 181 177 233 156 206 101 139 321 361 194 243 189 292 108 144 312 101 206 244 204 145 138 158 26 189 243 260 243 321 139 179 149 260 243 272 17 312 144 181 177 204 244 292 108 179 149 189 243 17 272 302 244 233 156 204 244 407 282 312 144 529 156 233 18 108 292 317 245 181 177 233 156 244 302 321 139 243 189 244 302 144 312 333 62 361 194 245 317 245 317 337 62 244 204 260 243 139 321 358 329 260 243 358 329 358 329 361 194 302 244 361 194 62 333 372 1 317 245 386 366 62 337 386 366 407 282 407 282 386 366 407 282 358 329 529 156 1 372 529 156 386 366 763 400 763 400 763 400 763 400
- Comparaison cds-cds tRNA-cds: deb fin, c'est l'ordre des adresses et grand petit l'ordre après réorientation. Leur pourcentage est calculé par rapport à la colonne, c'est à dire la moitié du total des tRNA-cds.
gama cds total total <0 0-200 201-370 371-600 >600 deb fin grand petit vha 5,432 54 1 24 23 5 1 14 10 6 18 ‰ 19 444 426 93 19 519 370 222 667
vha blocs[modifier | modifier le wikicode]
- Lien tableur: vha blocs
cds | 853 | cds | 471 | cds | 103 |
16s | 97 | 16s | 56 | 16s | 86 |
atc | 43 | atc | 43 | 16s | 97 |
gca | 290 | gca | 289 | atc | 43 |
23s | 77 | 23s | 108 | gca | 290 |
5s | 371 | 5s | 91 | 23s | 111 |
16s | 97 | tca | 121 | 5s | 68 |
atc | 43 | cds | gac | 578 | |
gca | 290 | cds | |||
23s | 107 | ||||
5s | 101 | ||||
cds | |||||
cds | 554 | cds | 83 | cds | 119 |
16s | 122 | 16s | 82 | 16s | 129 |
gaa | 2 | gaa | 2 | gcc | 41 |
aaa | 30 | aaa | 30 | gaa | 55 |
gta | 310 | gta | 310 | cds | 16 |
23s | 117 | 23s | 108 | 23s | 111 |
5s | 32 | 5s | 31 | 5s | 31 |
gac | 68 | gac | 147 | gac | 35 |
tgg | 546 | cds | tgg | 3 | |
cds | cds | ||||
cds | 83 | cds | 83 | cds | 557 |
16s | 114 | 16s | 122 | 16s | 97 |
gaa | 2 | gaa | 2 | atc | 43 |
aaa | 24 | aaa | 9 | gca | 35 |
gca | 35 | gca | 37 | cds | -13 |
gta | 306 | gta | 51 | 23s | 111 |
23s | 77 | cds | 16 | 5s | 100 |
5s | 90 | 23s | 77 | acc | 57 |
tca | 84 | 5s | 32 | 5s | 31 |
cds | gac | 162 | gac | 561 | |
cds | cds |
vha remarques[modifier | modifier le wikicode]
- A faire, en comparaison avec vpb
- Note du 4.10.20: contrôle des cds, 0/3 cds dans NCBI du 1.8.20
vha distribution[modifier | modifier le wikicode]
- Lien tableur: vha distribution
- Notes:
- - gtc2 cta2 tac4 tgc2 cgt6 ggc3
- - acc: 5s + >1aa
- - tca: 2 5s+ 2 1aa
- - gga: 1>a + 3 1aa
- - Séquences:
- (cac cca)2
- cgt5 (cgt agc)2
- ttc (aca aac)2
- (atgf ggc) ggc2 (atgf ggc)4
- ttc aca (ttc aac) aca (ttc aac)
g1 | t1 | ||||||
---|---|---|---|---|---|---|---|
atgi | 1 | tct | tat | atgf | 8 | ||
att | act | aat | agt | ||||
ctt | cct | cat | cgc | ||||
gtt | gct | gat | ggt | ||||
ttc | 4 | tcc | 1 | tac | 5 | tgc | 5 |
atc | 5 | acc | 2 | aac | 5 | agc | 2 |
ctc | 2 | ccc | cac | 2 | cgt | 7 | |
gtc | 2 | gcc | 1 | gac | 6 | ggc | 8 |
tta | 3 | tca | 4 | taa | tga | ||
ata | aca | 5 | aaa | 4 | aga | 1 | |
cta | 5 | cca | 3 | caa | 2 | cga | |
gta | 4 | gca | 7 | gaa | 5 | gga | 4 |
ttg | 1 | tcg | tag | tgg | 2 | ||
atgj | 3 | acg | aag | agg | 1 | ||
ctg | ccg | cag | cgg | 1 | |||
gtg | gcg | gag | ggg | ||||
gama | >1aa | =1aa | -5s | +5s | -16s | +16s | total |
vha | 70 | 14 | 11 | 26 | 121 |
vha1. Intergen51[modifier | modifier le wikicode]
Intergen51. vha1. Le génome[modifier | modifier le wikicode]
- vha1 Le prélèvement: gama
- Le nom et le lien NCBI: vha1, Vibrio campbellii ATCC BAA-1116 chromosome I, NCBI [76], date 12.12.21.
- vha1 La longueur totale des intercalaires, longueur du génome et taux intercalaires/génome:
Nom intercals génome taux en % vha1 499,733 3,765,351 13.3
vha1 données intercalaires[modifier | modifier le wikicode]
- Lien tableur: vha1 données intercalaires
- Lien sauvegarde NCBI: gama
vha1 données intercalaires 200[modifier | modifier le wikicode]
- Lien tableur: données intercalaires 200.
vha1 autres intercalaires aas[modifier | modifier le wikicode]
- Lien tableur: vha1 autres intercalaires aas
- Lien sauvegarde NCBI: gama
Intergen51. vha1. Les différents types d'intercalaires[modifier | modifier le wikicode]
- Lien au tableur: Intergen51. vha1 les différents types d'intercalaires.
- Légende:
- - S pour intercalaire CDS-CDS et R pour tRNA-CDS,
- - c pour intercalaire continu (les 2 gènes sont sur le même brin) et x pour discontinu (les 2 gènes sont sur 2 brins différents, le brin et son complément)
- - %reste = 100*reste/total, le reste étant ce qui reste du total après la fin du diagramme, gamme.
- - %t30 = 100*t30/total, t30 étant le total des fréquences 10 20 30
- - %t5 = 100*t/total, t5 étant le total des fréquences de -1 à -5 dans le diagramme des S-.
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
Intergen51. vha1. Les diagrammes CDS-CDS positifs[modifier | modifier le wikicode]
- Lien tableur: Les diagrammes
- Diagrammes des gamma: vha1 présente 2 diagrammes
- - fc40, CDS-CDS continu, fréquence unitaire en abscisses et effectif en ordonnées
- - fx%, CDS-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et pourcentage en ‰ par rapport au total, en ordonnées.
- Équations des courbes de tendance en pour 1000: colonnes %fx %fc
Courbes de tendances pour les diagrammes en pour 1000 Calculs des f.41 vha1 R2 x3 x2 x c Inflexion poly3 x c 0.625 4.79E-06 -3.09E-03 4.70E-01 15.50 fx1 abscisse 82.7 189.7 0.796 -5.34E-06 4.01E-03 -1.01E+00 96.9 fc1 ordonnée 40.9 20.0 0.736 8.54E-07 -2.12E-04 -1.61E-01 55.2 fx41 0.929 1.23E-06 -7.00E-04 -8.87E-04 37.0 fc41
Intergen51. vha1. Les CDS-CDS négatifs[modifier | modifier le wikicode]
Sous-totaux vha1 totale fréquence x- c- x- c- - 1 0 98 4 4140 - 2 0 0 85 11 - 3 0 2 3 12 - 4 9 141 717 10938 - 5 0 1 5 19 sp6 16 160 1642 8424 total 25 402 2,456 23,544 reste 0 0 264 420 s6 7 0 361 41 s7 1 27 321 1438 s8 8 133 696 6525 rappot s1-5 4/2/1 - 1.4 8.4 2.6 % / sp6 s6/sp6 43.8 0.0 22.0 0.5 s7/sp6 6.3 16.9 19.5 17.1 s8/sp6 50.0 83.1 42.4 77.5 reste/sp6 0.0 0.0 16.1 5.0 total s1-5 9 242 814 15120 % / total %s1-5 36.0 60.2 33.1 64.2 %sp6 64.0 39.8 66.9 35.8
Intergen51. vha1. Les intercalaires des blocs[modifier | modifier le wikicode]
- Le détail
RNA-RNA c x CDS-RNA c x 23s 5s 9 CDS 16s 6 2 16s 23s 5s CDS 1 16s tRNA 9 16 CDS tRNA 23s 9 CDS 5s 5s tRNA 8 23s CDS tRNA in 13 CDS 23s tRNA contig 2 5s 16s 1 tRNA hors 53 16s16s 1 tRNA 16s 23s tRNA tRNA 5s 1 16s 5s 5s 23s 5s 5s total 104 0 total 8 3
- Les rares voir gamma pour la longueur des intercalaires
- Les tRNA-CDS compris, comparaison dans le clade et dans l'étude.
Intergen51. vha1. Les intercalaires tRNA-tRNA extra bloc[modifier | modifier le wikicode]
- Lien tableur: Intergen51. vha1. Les intercalaires tRNA-tRNA extra bloc
contig aa 68 tgg ** gac 35 gac ** tgg
inter | aa | inter | aa | inter | aa | ||
---|---|---|---|---|---|---|---|
158 | atgf | 54 | cta | 59 | cgt | ||
35 | ggc | 46 | caa | 57 | cgt | ||
35 | ggc | 21 | cta | 57 | cgt | ||
18 | ggc | 18 | cta | 57 | cgt | ||
39 | atgf | 23 | atgj | 57 | cgt | ||
90 | ggc | 70 | cta | 85 | cgt | ||
39 | atgf | 79 | atgj | 29 | agc | ||
18 | ggc | 31 | caa | 31 | cgt | ||
39 | atgf | 39 | cta | ** | agc | ||
18 | ggc | ** | atgj | 51 | ttc | ||
39 | atgf | 100 | tac | 7 | aca | ||
** | ggc | 100 | tac | 43 | ttc | ||
13 | acc | 100 | tac | 69 | aac | ||
35 | gga | ** | tac | 10 | aca | ||
52 | tac | 46 | gtc | 42 | ttc | ||
** | aca | ** | gtc | ** | aac | ||
35 | cgg | 11 | ggc | 51 | ttc | ||
76 | cac | 78 | tta | 21 | aca | ||
46 | cca | 37 | ggc | 39 | aac | ||
64 | cac | ** | tgc | 15 | aca | ||
** | cca | 56 | atgf | ** | aac | ||
** | ctc |
vha2. Intergen51[modifier | modifier le wikicode]
Intergen51. vha2. Le génome[modifier | modifier le wikicode]
- vha2 Le prélèvement: gama
- Le nom et le lien NCBI: vha2, Vibrio campbellii ATCC BAA-1116 chromosome II, NCBI [77], date 12.12.21.
- vha2 La longueur totale des intercalaires, longueur du génome et taux intercalaires/génome:
Nom intercals génome taux en % vha2 317,649 2,204,018 14.4
vha2 données intercalaires[modifier | modifier le wikicode]
- Lien tableur: vha2 données intercalaires
- Lien sauvegarde NCBI: gama
vha2 données intercalaires 200[modifier | modifier le wikicode]
- Lien tableur: données intercalaires 200.
vha2 autres intercalaires aas[modifier | modifier le wikicode]
- Lien tableur: vha2 autres intercalaires aas
- Lien sauvegarde NCBI: gama
Intergen51. vha2. Les différents types d'intercalaires[modifier | modifier le wikicode]
- Lien au tableur: Intergen51. vha2 les différents types d'intercalaires.
- Légende:
- - S pour intercalaire CDS-CDS et R pour tRNA-CDS,
- - c pour intercalaire continu (les 2 gènes sont sur le même brin) et x pour discontinu (les 2 gènes sont sur 2 brins différents, le brin et son complément)
- - %reste = 100*reste/total, le reste étant ce qui reste du total après la fin du diagramme, gamme.
- - %t30 = 100*t30/total, t30 étant le total des fréquences 10 20 30
- - %t5 = 100*t/total, t5 étant le total des fréquences de -1 à -5 dans le diagramme des S-.
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
Intergen51. vha2. Les diagrammes CDS-CDS positifs[modifier | modifier le wikicode]
- Lien tableur: Les diagrammes
- Diagrammes des gamma: vha2 présente 2 diagrammes
- - fc40, CDS-CDS continu, fréquence unitaire en abscisses et effectif en ordonnées
- - fx%, CDS-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et pourcentage en ‰ par rapport au total, en ordonnées.
- Équations des courbes de tendance en pour 1000: colonnes %fx %fc
Courbes de tendances pour les diagrammes en pour 1000 Calculs des f.41 vha2 R2 x3 x2 x c Inflexion poly3 x c 0.661 4.10E-06 -2.65E-03 3.97E-01 17.80 fx1 abscisse 155.6 3.6 0.763 -3.90E-06 3.05E-03 -8.11E-01 85.8 fc1 ordonnée 28.4 49.0 0.742 1.39E-06 -6.49E-04 -4.87E-02 46.5 fx41 0.877 4.22E-07 -4.59E-06 -1.76E-01 49.6 fc41
Intergen51. vha2. Les CDS-CDS négatifs[modifier | modifier le wikicode]
Sous-totaux vha2 totale fréquence x- c- x- c- - 1 0 62 4 4140 - 2 2 0 85 11 - 3 0 0 3 12 - 4 3 77 717 10938 - 5 0 1 5 19 sp6 20 87 1642 8424 total 25 227 2,456 23,544 reste 0 0 264 420 s6 7 0 361 41 s7 1 12 321 1438 s8 12 75 696 6525 rappot s1-5 4/2/1 1.5 1.2 8.4 2.6 % / sp6 s6/sp6 35.0 0.0 22.0 0.5 s7/sp6 5.0 13.8 19.5 17.1 s8/sp6 60.0 86.2 42.4 77.5 reste/sp6 0.0 0.0 16.1 5.0 total s1-5 5 140 814 15120 % / total %s1-5 20.0 61.7 33.1 64.2 %sp6 80.0 38.3 66.9 35.8
Intergen51. vha2. Les intercalaires des blocs[modifier | modifier le wikicode]
- Le détail
RNA-RNA c x CDS-RNA c x 23s 5s 1 CDS 16s 1 16s 23s 5s CDS 16s tRNA 1 16 CDS tRNA 23s 1 CDS 5s 5s tRNA 1 23s CDS tRNA in 3 CDS 23s tRNA contig 5s 16s tRNA hors 4 16s16s tRNA 16s 23s tRNA tRNA 5s 16s 5s 5s 23s 5s 5s total 11 0 total 1 0
- Les rares voir gamma pour la longueur des intercalaires
- Les tRNA-CDS compris, comparaison dans le clade et dans l'étude.
Intergen51. vha2. Les intercalaires tRNA-tRNA extra bloc[modifier | modifier le wikicode]
- Lien tableur: Intergen51. vha2. Les intercalaires tRNA-tRNA extra bloc
hors b aa 97 tta 5 ggc ** tgc 53 tta 181 tgc° ** tgc°
Aeromonas media WS[modifier | modifier le wikicode]
amed opérons[modifier | modifier le wikicode]
- Liens: gtRNAdb [78], NCBI [79], génome [80]
- Lien tableur: amed opérons
61.2%GC | 25.7.19 Paris | 126 | doubles | interca | cds | aa | avec aa | cdsa | cdsd |
---|---|---|---|---|---|---|---|---|---|
6590..7159 | cds | 3 | 190 | ||||||
comp | 7163..8359 | cds | 512 | 512 | 399 | ||||
8872..10421 | 16s | 66 | |||||||
10488..10564 | atc | 10 | 10 | ||||||
10575..10650 | gca | 231 | |||||||
10882..13800 | 23s | 98 | |||||||
13899..14013 | 5s | 386 | 386 | 386 | |||||
14400..14717 | cds | 102422 | 106 | ||||||
117140..117850 | cds | 47 | 47 | 237 | 47 | ||||
117898..117973 | ttc | 52 | 52 | ||||||
118026..118101 | aca | 3 | 3 | ||||||
118105..118180 | ttc | 45 | 45 | ||||||
118226..118301 | aac | 252 | 252 | ||||||
118554..119573 | cds | 50489 | 340 | ||||||
comp | 170063..170329 | cds | 103 | 103 | 89 | 103 | |||
comp | 170433..170518 | ctg | + | 71 | 71 | ||||
comp | 170590..170675 | ctg | 5 ctg | 46 | 46 | ||||
comp | 170722..170807 | ctg | 46 | 46 | |||||
comp | 170854..170939 | ctg | 51 | 51 | |||||
comp | 170991..171076 | ctg | 116 | 116 | |||||
comp | 171193..172653 | cds | 146173 | 487 | |||||
318827..320692 | cds | 190 | 190 | 622 | 190 | ||||
320883..320959 | atgi | 244 | 244 | ||||||
comp | 321204..323780 | cds | 62601 | 859 | |||||
386382..386732 | cds | 514 | 514 | 117 | |||||
387247..388802 | 16s | 268 | |||||||
389071..389146 | gaa | 245 | |||||||
389392..392312 | 23s | 104 | |||||||
392417..392531 | 5s | 268 | 268 | 268 | |||||
comp | 392800..394413 | cds | 81847 | 538 | |||||
476261..476482 | cds | 64 | 64 | 74 | 64 | ||||
comp | 476547..476622 | aac | 5 | 5 | |||||
comp | 476628..476703 | ttc | 622 | 622 | |||||
477326..477547 | cds | 22721 | 74 | ||||||
500269..500814 | cds | 177 | 177 | 182 | 177 | ||||
500992..501067 | ggc | + | 24 | 24 | |||||
501092..501167 | ggc | 6 ggc | 29 | 29 | |||||
501197..501272 | ggc | 38 | 38 | ||||||
501311..501386 | ggc | 25 | 25 | ||||||
501412..501487 | ggc | 23 | 23 | ||||||
501511..501586 | ggc | 363 | 363 | ||||||
comp | 501950..502159 | cds | 4810 | 70 | |||||
506970..507110 | cds | 236 | 236 | 47 | 236 | ||||
507347..507422 | gcc | + | 28 | 28 | |||||
507451..507526 | gcc | 5 gcc | 66 | 66 | |||||
507593..507668 | gcc | 58 | 58 | ||||||
507727..507802 | gcc | 40 | 40 | ||||||
507843..507918 | gcc | 471 | 471 | ||||||
508390..508473 | riboswitch | @1 | 134002 | 28 | |||||
642476..642802 | cds | 9 | 9 | 109 | 9 | ||||
642812..642896 | ctc | 91 | 91 | ||||||
642988..643064 | atgf | 166 | 166 | ||||||
643231..643689 | cds | 128528 | 153 | ||||||
772218..774050 | cds | 195 | 195 | 611 | 195 | ||||
comp | 774246..774329 | cta | + | 8 | 8 | ||||
comp | 774338..774414 | atg | 3 atg | 38 | 38 | ||||
comp | 774453..774527 | caa | 4 caa | 47 | 47 | ||||
comp | 774575..774649 | caa | 17 | 17 | |||||
comp | 774667..774743 | atg | 35 | 35 | |||||
comp | 774779..774853 | caa | 47 | 47 | |||||
comp | 774901..774975 | caa | 13 | 13 | |||||
comp | 774989..775065 | atg | 235 | 235 | |||||
comp | 775301..776392 | cds | 3148 | 364 | |||||
comp | 779541..780557 | cds | 104 | 104 | 339 | 104 | |||
comp | 780662..780736 | caa | -21 | -21 | -21 | ||||
comp | 780716..781612 | cds | 373301 | 299 | |||||
comp | 1154914..1155384 | cds | 131 | 131 | 157 | 131 | |||
comp | 1155516..1155592 | ccc | 226 | 226 | |||||
comp | 1155819..1157162 | cds | 67691 | 448 | |||||
comp | 1224854..1226290 | cds | 301 | 301 | 479 | ||||
comp | 1226592..1226667 | aac | 2 | 2 | |||||
comp | 1226670..1226744 | gga | 164 | 164 | 164 | ||||
comp | 1226909..1227181 | cds | 13604 | 91 | |||||
comp | 1240786..1241733 | cds | 350 | 350 | 316 | ||||
comp | 1242084..1242156 | aac | + | 2 | 2 | ||||
comp | 1242159..1242234 | aac | 2 aac | 49 | 49 | 49 | |||
1242284..1242496 | cds | 294 | 71 | ||||||
1242791..1244527 | cds | 181 | 181 | 579 | 181 | ||||
1244709..1244796 | tcc | 407 | 407 | ||||||
1245204..1246064 | cds | 161293 | 287 | ||||||
comp | 1407358..1408338 | cds | 410 | 410 | 327 | ||||
comp | 1408749..1408836 | tcc | 177 | 177 | 177 | ||||
comp | 1409014..1409631 | cds | 34595 | 206 | |||||
1444227..1444688 | cds | 146 | 146 | 154 | |||||
1444835..1444922 | tcc | 127 | 127 | 127 | |||||
1445050..1446834 | cds | 14349 | 595 | ||||||
comp | 1461184..1462401 | cds | 163 | 163 | 406 | 163 | |||
comp | 1462565..1462640 | cac | 124 | 124 | |||||
comp | 1462765..1462838 | aga | 240 | 240 | |||||
comp | 1463079..1464389 | cds | 61984 | 437 | |||||
comp | 1526374..1527606 | cds | 151 | 151 | 411 | 151 | |||
comp | 1527758..1527833 | cac | 123 | 123 | |||||
comp | 1527957..1528033 | aga | 36 | 36 | |||||
comp | 1528070..1528146 | cca | 203 | 203 | |||||
1528350..1529207 | cds | 60230 | 286 | ||||||
1589438..1589644 | cds | 138 | 138 | 69 | |||||
comp | 1589783..1589858 | aac | 132 | 132 | 132 | ||||
1589991..1592003 | cds | 57434 | 671 | ||||||
1649438..1651867 | cds | 104 | 104 | 810 | 104 | ||||
comp | 1651972..1652048 | gtc | + | 36 | 36 | ||||
comp | 1652085..1652161 | gtc | 5 gtc | 26 | 26 | ||||
comp | 1652188..1652264 | gtc | 15 | 15 | |||||
comp | 1652280..1652356 | gtc | 11 | 11 | |||||
comp | 1652368..1652444 | gtc | 170 | 170 | |||||
comp | 1652615..1653994 | cds | 277443 | 460 | |||||
comp | 1931438..1932934 | cds | 145 | 145 | 499 | 145 | |||
comp | 1933080..1933156 | atgf | + | 110 | 110 | ||||
comp | 1933267..1933343 | atgf | 9 atgf | 102 | 102 | ||||
comp | 1933446..1933522 | atgf | @2 | 101 | 101 | ||||
comp | 1933624..1933700 | atgf | 101 | 101 | |||||
comp | 1933802..1933877 | atgf | 103 | 103 | |||||
comp | 1933981..1934057 | atgf | 102 | 102 | |||||
comp | 1934160..1934236 | atgf | 102 | 102 | |||||
comp | 1934339..1934415 | atgf | 92 | 92 | |||||
comp | 1934508..1934584 | atgf | 268 | 268 | |||||
comp | 1934853..1935572 | cds | 490897 | 240 | |||||
comp | 2426470..2427675 | cds | 350 | 350 | 402 | ||||
comp | 2428026..2428112 | tta | 40 | 40 | |||||
comp | 2428153..2428226 | tgc | 35 | 35 | |||||
comp | 2428262..2428337 | ggc | 181 | 181 | 181 | ||||
comp | 2428519..2429073 | cds | 117921 | 185 | |||||
comp | 2546995..2547534 | cds | 271 | 271 | 180 | 271 | |||
2547806..2547882 | ccc | 1103 | 1103 | ||||||
2548986..2550593 | cds | 107760 | 536 | ||||||
2658354..2659094 | cds | 87 | 87 | 247 | 87 | ||||
2659182..2659257 | acg | 108 | 108 | ||||||
< comp | 2659366..2659705 | cds | 198821 | 113 | |||||
comp | 2858527..2859036 | cds | 126 | 126 | 170 | ||||
2859163..2859247 | tac | + | 30 | 30 | |||||
2859278..2859362 | tac | 2 tac | 121 | 121 | 121 | ||||
comp | 2859484..2863335 | cds | 115303 | 1284 | |||||
2978639..2979358 | cds | 119 | 119 | 240 | 119 | ||||
comp | 2979478..2979552 | gga | 104 | 104 | |||||
comp | 2979657..2979730 | ggg | 201 | 201 | |||||
2979932..2981701 | cds | 41492 | 590 | ||||||
3023194..3023487 | cds | 75 | 75 | 98 | 75 | ||||
comp | 3023563..3023636 | tgc | 57 | 57 | |||||
comp | 3023694..3023769 | ggc | 248 | 248 | |||||
3024018..3027455 | cds | 17375 | 1146 | ||||||
3044831..3045361 | cds | 133 | 133 | 177 | 133 | ||||
comp | 3045495..3045584 | tcg | 380 | 380 | |||||
3045965..3046882 | cds | 221147 | 306 | ||||||
comp | 3268030..3268398 | cds | 318 | 318 | 123 | ||||
comp | 3268717..3268804 | tca | 198 | 198 | 198 | ||||
3269003..3269752 | cds | 20717 | 250 | ||||||
3290470..3291624 | cds | 50 | 50 | 385 | 50 | ||||
3291675..3291751 | agg | 126 | 126 | ||||||
comp | 3291878..3292804 | cds | 41865 | 309 | |||||
3334670..3335758 | cds | 230 | 230 | 363 | |||||
3335989..3336073 | tac | + | 32 | 32 | |||||
3336106..3336190 | tac | 3 tac | 45 | 45 | |||||
3336236..3336320 | tac | 135 | 135 | 135 | |||||
3336456..3336731 | cds | 169091 | 92 | ||||||
comp | 3505823..3506272 | cds | 275 | 275 | 150 | 275 | |||
comp | 3506548..3506662 | 5s | 101 | ||||||
comp | 3506764..3509682 | 23s | 229 | ||||||
comp | 3509912..3509987 | gaa | 218 | ||||||
comp | 3510206..3511760 | 16s | 592 | 592 | |||||
3512353..3515220 | cds | 161083 | 956 | ||||||
comp | 3676304..3677323 | cds | 113 | 113 | 340 | ||||
comp | 3677437..3677521 | ttg | 49 | 49 | 49 | ||||
3677571..3678182 | cds | 9862 | 204 | ||||||
3688045..3688872 | cds | 369 | 369 | 276 | |||||
comp | 3689242..3689318 | cgt | + | 25 | 25 | ||||
comp | 3689344..3689420 | cgt | 5 cgt | 25 | 25 | ||||
comp | 3689446..3689522 | cgt | 26 | 26 | |||||
comp | 3689549..3689625 | cgt | 98 | 98 | |||||
comp | 3689724..3689800 | cgt | 4 | 4 | |||||
comp | 3689805..3689897 | agc | 213 | 213 | 213 | ||||
comp | 3690111..3690299 | cds | 196546 | 63 | |||||
3886846..3887601 | cds | 302 | 302 | 252 | 302 | ||||
comp | 3887904..3887980 | gac | 98 | ||||||
comp | 3888079..3888193 | 5s | 105 | ||||||
comp | 3888299..3891217 | 23s | 231 | ||||||
comp | 3891449..3891524 | gca | 10 | 10 | |||||
comp | 3891535..3891611 | atc | 66 | ||||||
comp | 3891678..3893232 | 16s | 420 | 420 | |||||
comp | 3893653..3894195 | cds | 18750 | 181 | |||||
comp | 3912946..3913317 | cds | 60 | 60 | 124 | ||||
comp | 3913378..3913454 | tgg | 52 | 52 | 52 | ||||
comp | 3913507..3914691 | cds | @3 | 171 | 171 | 395 | 171 | ||
comp | 3914863..3914937 | gga | 38 | 38 | |||||
comp | 3914976..3915060 | tac | 263 | 263 | |||||
3915324..3916262 | cds | 45900 | 313 | ||||||
comp | 3962163..3963533 | cds | 306 | 306 | 457 | ||||
comp | 3963840..3963916 | tgg | 202 | 202 | 202 | ||||
3964119..3964703 | cds | 59641 | 195 | ||||||
comp | 4024345..4026816 | cds | 658 | 658 | 824 | ||||
comp | 4027475..4027551 | ccg | 140 | 140 | 140 | ||||
comp | 4027692..4028417 | cds | 80995 | 242 | |||||
4109413..4111986 | cds | 99 | 99 | 858 | |||||
comp | 4112086..4112200 | 5s | 101 | ||||||
comp | 4112302..4115220 | 23s | 231 | ||||||
comp | 4115452..4115527 | gaa | 192 | ||||||
comp | 4115720..4117273 | 16s | 94 | 94 | 94 | ||||
comp | 4117368..4117547 | cds | 32227 | 60 | |||||
comp | 4149775..4150248 | cds | 204 | 204 | 158 | 204 | |||
comp | 4150453..4150529 | cca | 58 | 58 | |||||
comp | 4150588..4150673 | ctg | 20 | 20 | |||||
comp | 4150694..4150769 | cac | 49 | 49 | |||||
comp | 4150819..4150895 | cgg | 258 | 258 | |||||
4151154..4151744 | cds | 74862 | 197 | ||||||
4226607..4227725 | cds | 428 | 428 | 373 | |||||
4228154..4229708 | 16s | 192 | |||||||
4229901..4229976 | gaa | 229 | |||||||
4230206..4233124 | 23s | 104 | |||||||
4233229..4233343 | 5s | 106 | |||||||
4233450..4233525 | acc | 23 | |||||||
4233549..4233663 | 5s | 164 | 164 | 164 | |||||
4233828..4234793 | cds | 119351 | 322 | ||||||
comp | 4354145..4355686 | cds | 622 | 622 | 514 | ||||
4356309..4357863 | 16s | 268 | |||||||
4358132..4358207 | gaa | 230 | |||||||
4358438..4361364 | 23s | 102 | |||||||
4361467..4361581 | 5s | 106 | |||||||
4361688..4361763 | acc | 233 | 233 | 233 | |||||
4361997..4363241 | cds | 71363 | 415 | ||||||
4434605..4435198 | cds | 465 | 465 | 198 | |||||
4435664..4437217 | 16s | 219 | |||||||
4437437..4437512 | gaa | 229 | |||||||
4437742..4440657 | 23s | 103 | |||||||
4440761..4440875 | 5s | 98 | |||||||
4440974..4441050 | gac | 167 | 167 | 167 | |||||
4441218..4442054 | cds | 39919 | 279 | ||||||
comp | 4481974..4482513 | cds | 477 | 477 | 180 | ||||
4482991..4484545 | 16s | 513 | |||||||
4485059..4485549 | 23s° | 37 | |||||||
comp | 4485587..4486115 | 23s° | 229 | ||||||
comp | 4486345..4486419 | gaa | 218 | ||||||
comp | 4486638..4488193 | 16s | 94 | 94 | 94 | ||||
comp | 4488288..4488509 | cds | 72132 | 74 | |||||
comp | 4560642..4561676 | cds | 192 | 192 | 345 | ||||
comp | 4561869..4561944 | gta | + | 18 | 18 | ||||
comp | 4561963..4562038 | aaa | 7 gta | 34 | 34 | ||||
comp | 4562073..4562148 | gta | 5 aaa | 18 | 18 | ||||
comp | 4562167..4562242 | aaa | 2 aag | 23 | 23 | ||||
comp | 4562266..4562341 | gta | 18 | 18 | |||||
comp | 4562360..4562435 | aaa | 23 | 23 | |||||
comp | 4562459..4562534 | gta | 18 | 18 | |||||
comp | 4562553..4562628 | aaa | 34 | 34 | |||||
comp | 4562663..4562738 | gta | 22 | 22 | |||||
comp | 4562761..4562836 | aag | 46 | 46 | |||||
comp | 4562883..4562958 | gta | 22 | 22 | |||||
comp | 4562981..4563056 | aag | 46 | 46 | |||||
comp | 4563103..4563178 | gta | 32 | 32 | |||||
comp | 4563211..4563286 | aaa | 174 | 174 | 174 | ||||
comp | 4563461..4564276 | cds | 70895 | 272 | |||||
comp | 4635172..4636173 | cds | 275 | 275 | 334 | 275 | |||
comp | 4636449..4636525 | gac | 95 | ||||||
comp | 4636621..4636735 | 5s | 101 | ||||||
comp | 4636837..4639756 | 23s | 231 | ||||||
comp | 4639988..4640063 | gca | 10 | 10 | |||||
comp | 4640074..4640150 | atc | 66 | ||||||
comp | 4640217..4641771 | 16s | 512 | 512 | |||||
4642284..4643480 | cds | 3 | 399 | ||||||
comp | 4643484..4644053 | cds | 190 |
amed cumuls[modifier | modifier le wikicode]
- Lien tableur: amed cumuls
- Note: Les statistiques sur les intercalaires entre tRNA ne sont pas correctes. Se reporter à intergen51.amed. Il n'y a aucun commentaire sur les CDS. J'ai réduit le tableau aux clusters à rRNA. L'intitulé opéron doit d'être compris dans le sens cluster ou bloc de RNA, rRNA ou tRNA.
opérons | Fréquences intercalaires tRNAs | Fréquences intercalaires cds | Fréquences aas cds | ||||||||
---|---|---|---|---|---|---|---|---|---|---|---|
effectif | gammes | sans rRNAs | avec rRNAs | gammes | cds | gammes | cdsd | gammes | cdsa | ||
avec rRNA | opérons | 10 | 1 | 0 | - | 1 | 1 | 40 | 1 | 100 | 14 |
16 gaa 23 5s | 6 | 20 | 15 | 50 | 5 | 60 | 5 | 200 | 21 | ||
16 atc gca | 3 | 40 | 27 | 100 | 8 | 80 | 2 | 300 | 15 | ||
16 23 5s | 0 | 60 | 14 | 150 | 19 | 100 | 3 | 400 | 18 | ||
max a | 3 | 80 | 2 | 200 | 17 | 120 | 4 | 500 | 11 | ||
a doubles | 0 | 100 | 3 | 250 | 13 | 140 | 7 | 600 | 6 | ||
spéciaux | 1 | 120 | 8 | 300 | 8 | 160 | 2 | 700 | 3 | ||
total aas | 18 | 140 | 2 | 350 | 6 | 180 | 8 | 800 | 0 | ||
sans | opérons | 38 | 160 | 0 | 400 | 4 | 200 | 5 | 900 | 4 | |
1 aa | 16 | 180 | 0 | 450 | 4 | 220 | 3 | 1000 | 1 | ||
max a | 14 | 200 | 0 | 500 | 3 | 240 | 2 | 1100 | 0 | ||
a doubles | 12 | 0 | 8 | 6 | 2 | ||||||
total aas | 109 | 71 | 0 | 96 | 48 | 95 | |||||
total aas | 127 | ||||||||||
remarques | 3 | ||||||||||
avec jaune | moyenne | 49 | 156 | ||||||||
variance | 34 | 77 | |||||||||
sans jaune | moyenne | 214 | 274 | ||||||||
variance | 122 | 157 |
amed blocs[modifier | modifier le wikicode]
- Lien tableur: amed blocs
cds | 512 | cds | 302 | cds | 275 |
16s | 66 | gac | 98 | gac | 95 |
atc | 10 | 5s | 105 | 5s | 101 |
gca | 231 | 23s | 231 | 23s | 231 |
23s | 98 | gca | 10 | gca | 10 |
5s | 386 | atc | 66 | atc | 66 |
16s | 420 | 16s | 512 | ||
cds | 514 | 275 | 99 | ||
16s | 268 | 101 | 101 | ||
gaa | 245 | 229 | 231 | ||
23s | 104 | 218 | 192 | ||
5s | 268 | 592 | 94 | ||
cds | 428 | cds | 622 | cds | 465 |
16s | 192 | 16s | 268 | 16s | 219 |
gaa | 229 | gaa | 230 | gaa | 229 |
23s | 104 | 23s | 102 | 23s | 103 |
5s | 106 | 5s | 106 | 5s | 98 |
acc | 23 | acc | 233 | gac | 167 |
5s | 164 |
amed remarques[modifier | modifier le wikicode]
- A faire
amed distribution[modifier | modifier le wikicode]
- Lien tableur: amed distribution
- Notes:
- - gtc5 ctg5 gcc5 tac3+2 aac2 caa2+2 atgf9 cgt5 ggc6
- - Séquences
- (atgj caa2)2
- (gta aaa)4 (gta aag)2 gta aaa
g1 | t1 | ||||||
---|---|---|---|---|---|---|---|
atgi | 1 | tct | tat | atgf | 10 | ||
att | act | aat | agt | ||||
ctt | cct | cat | cgc | ||||
gtt | gct | gat | ggt | ||||
ttc | 3 | tcc | 3 | tac | 6 | tgc | 2 |
atc | 3 | acc | 2 | aac | 6 | agc | 1 |
ctc | 1 | ccc | 2 | cac | 3 | cgt | 5 |
gtc | 5 | gcc | 5 | gac | 3 | ggc | 8 |
tta | 1 | tca | 1 | taa | tga | ||
ata | aca | 1 | aaa | 5 | aga | 2 | |
cta | 1 | cca | 2 | caa | 5 | cga | |
gta | 7 | gca | 3 | gaa | 7 | gga | 3 |
ttg | 1 | tcg | 1 | tag | tgg | 2 | |
atgj | 3 | acg | 1 | aag | 2 | agg | 1 |
ctg | 6 | ccg | 1 | cag | cgg | 1 | |
gtg | gcg | gag | ggg | 1 | |||
gama | >1aa | =1aa | -5s | +5s | -16s | +16s | total |
amed | 93 | 16 | 5 | 13 | 127 |
amed autres intercalaires[modifier | modifier le wikicode]
- Lien tableur: amed autres intercalaires
- Voir la méthode pour le formatage des autres intercalaires
amed. Intergen51[modifier | modifier le wikicode]
Intergen51. amed. Le génome[modifier | modifier le wikicode]
- amed Le prélèvement: alpha gama
- Le nom et le lien NCBI: amed, Aeromonas media WS chromosome, NCBI [81], date 15.1.22.
- amed La longueur totale des intercalaires, longueur du génome et taux intercalaires/génome:
Nom intercals génome taux en % amed 601,332 4,777,154 12.6
amed données intercalaires[modifier | modifier le wikicode]
- Lien tableur: amed données intercalaires
- Lien sauvegarde NCBI:alpha gama
amed données intercalaires 200[modifier | modifier le wikicode]
- Lien tableur: données intercalaires 200.
amed autres intercalaires aas[modifier | modifier le wikicode]
- Lien tableur: amed autres intercalaires aas
- Lien sauvegarde NCBI:alpha gama
Intergen51. amed. Les différents types d'intercalaires[modifier | modifier le wikicode]
- Lien au tableur: Intergen51. amed les différents types d'intercalaires.
- Légende:
- - S pour intercalaire CDS-CDS et R pour tRNA-CDS,
- - c pour intercalaire continu (les 2 gènes sont sur le même brin) et x pour discontinu (les 2 gènes sont sur 2 brins différents, le brin et son complément)
- - %reste = 100*reste/total, le reste étant ce qui reste du total après la fin du diagramme, gamme.
- - %t30 = 100*t30/total, t30 étant le total des fréquences 10 20 30
- - %t5 = 100*t/total, t5 étant le total des fréquences de -1 à -5 dans le diagramme des S-.
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
Intergen51. amed. Les diagrammes CDS-CDS positifs[modifier | modifier le wikicode]
- Lien tableur: Les diagrammes
- Diagrammes des gamma: amed présente 2 diagrammes
- - fc40, CDS-CDS continu, fréquence unitaire en abscisses et effectif en ordonnées
- - fx%, CDS-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et pourcentage en ‰ par rapport au total, en ordonnées.
- Équations des courbes de tendance en pour 1000: colonnes %fx %fc
Courbes de tendances pour les diagrammes en pour 1000 Calculs des f.41 amed R2 x3 x2 x c Inflexion poly3 x c 0.603 4.21E-06 -2.73E-03 3.91E-01 23.20 fx1 abscisse 366.7 186.0 0.856 -1.07E-06 1.09E-03 -4.42E-01 71.9 fc1 ordonnée 7.2 8.7 0.777 -1.00E-06 1.10E-03 -4.62E-01 78.0 fx41 0.902 2.15E-06 -1.20E-03 -4.04E-02 43.9 fc41
Intergen51. amed. Les CDS-CDS négatifs[modifier | modifier le wikicode]
Sous-totaux amed totale fréquence x- c- x- c- - 1 0 91 4 4140 - 2 1 0 85 11 - 3 0 0 3 12 - 4 8 212 717 10938 - 5 0 0 5 19 sp6 33 141 1642 8424 total 42 444 2,456 23,544 reste 4 6 264 420 s6 8 0 361 41 s7 9 33 321 1438 s8 12 102 696 6525 rappot s1-5 4/2/1 8 2.3 8.4 2.6 % / sp6 s6/sp6 24.2 0.0 22.0 0.5 s7/sp6 27.3 23.4 19.5 17.1 s8/sp6 36.4 72.3 42.4 77.5 reste/sp6 12.1 4.3 16.1 5.0 total s1-5 9 303 814 15120 % / total %s1-5 21.4 68.2 33.1 64.2 %sp6 78.6 31.8 66.9 35.8
Intergen51. amed. Les intercalaires des blocs[modifier | modifier le wikicode]
- Le détail
RNA-RNA c x CDS-RNA c x 23s 5s 9 CDS 16s 5 6 16s 23s 5s CDS 3 2 16s tRNA 10 16 CDS tRNA 23s 9 CDS 5s 5s tRNA 5 23s CDS tRNA in 3 CDS 23s tRNA contig 5s 16s tRNA hors 69 16s16s tRNA 16s 23s tRNA tRNA 5s 1 16s 5s 5s 23s 5s 5s total 106 0 total 8 8
- Les rares voir gamma pour la longueur des intercalaires
- Les tRNA-CDS compris, comparaison dans le clade et dans l'étude.
Intergen51. amed. Les intercalaires tRNA-tRNA extra bloc[modifier | modifier le wikicode]
- Lien tableur: Intergen51. amed. Les intercalaires tRNA-tRNA extra bloc
inter | aa | inter | aa | inter | aa | inter | aa | inter | aa | ||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
52 | ttc | 28 | gcc | 36 | gtc | 30 | tac | 58 | cca | ||||
3 | aca | 66 | gcc | 26 | gtc | ** | tac | 20 | ctg | ||||
45 | ttc | 58 | gcc | 15 | gtc | 104 | gga | 49 | cac | ||||
** | aac | 40 | gcc | 11 | gtc | ** | ggg | ** | cgg | ||||
71 | ctg | ** | gcc | ** | gtc | 57 | tgc | 18 | gta | ||||
46 | ctg | 91 | ctc | 110 | atgf | ** | ggc | 34 | aaa | ||||
46 | ctg | ** | atgf | 102 | atgf | 32 | tac | 18 | gta | ||||
51 | ctg | 8 | cta | 101 | atgf | 45 | tac | 23 | aaa | ||||
** | ctg | 38 | atgj | 101 | atgf | ** | tac | 18 | gta | ||||
5 | aac | 47 | caa | 103 | atgf | 25 | cgt | 23 | aaa | ||||
** | ttc | 17 | caa | 102 | atgf | 25 | cgt | 18 | gta | ||||
24 | ggc | 35 | atgj | 102 | atgf | 26 | cgt | 34 | aaa | ||||
29 | ggc | 47 | caa | 92 | atgf | 98 | cgt | 22 | gta | ||||
38 | ggc | 13 | caa | ** | atgf | 4 | cgt | 46 | aag | ||||
25 | ggc | ** | atgj | 40 | tta | ** | agc | 22 | gta | ||||
23 | ggc | 2 | aac | 35 | tgc | 38 | gga | 46 | aag | ||||
** | ggc | ** | gga | ** | ggc | ** | tac | 32 | gta | ||||
123 | cac | ** | aaa | ||||||||||
36 | aga | ||||||||||||
** | cca |
gamma synthèse[modifier | modifier le wikicode]
- Liens aux indices des clades: alpha bacilli gamma actino clostridia bacteroide cyano tener spiro beta epsilon delta bactéries
- Liens aux fiches: spiro tener gama alpha beta delta epsilon bacilli clostridia autres firmicutes actino bactero cyano archeo
gamma distribution par génome[modifier | modifier le wikicode]
- Lien tableur: gamma distribution par génome
gama | >1aa | 1aa | -5s | +5s | -16s | +16s | duplica | 1-3aas | total |
spl | 46 | 8 | 6 | 79 | 3 | 142 | |||
vpb | 60 | 11 | 21 | 22 | 12 | 126 | |||
vha | 51 | 14 | 26 | 19 | 11 | 121 | |||
amed | 47 | 16 | 13 | 46 | 5 | 127 | |||
eal | 25 | 23 | 10 | 23 | 4 | 85 | |||
eco | 20 | 23 | 10 | 29 | 4 | 86 | |||
ecoN | 20 | 34 | 17 | 44 | 6 | 121 | |||
total | 269 | 129 | 0 | 0 | 0 | 103 | 262 | 45 | 808 |
gamma distribution du total[modifier | modifier le wikicode]
- Lien tableur: gamma distribution du total
- Notes: dans le tableau de droite gaa comprend 33 +16s et 1 +5s.
- Légende:
- - Couleurs du 1er tableau: voir bacilli
- - Couleurs du 2ème tableau: d'après les couleurs du pieds du tableau
- - Tableau des indices, en-tête: total des génomes, total des tRNAs, indice ttt, indice tgt.
|
|
|
gamma distribution par type[modifier | modifier le wikicode]
- Lien tableur: gamma distribution par type
- Légende: voir bacilli
|
|
|
gamma par rapport au groupe de référence[modifier | modifier le wikicode]
- Lien tableur: gamma par rapport au groupe de référence
- Le groupe de référence: voir la référence
- Légende:
- - carré ccc, c'est ctc gtc ccc gcc
- - g+cga, c'est gtg xcg xag ggg cga (dans l'hypothèse de la bascule des cgx, cgt/cgc cga/cgg)
tRNAs | blocs tRNAs | blocs rRNAs | |||||||
gama7 | 1aa | >1aa | dup | +5s | 1-3aas | autres | total | ||
---|---|---|---|---|---|---|---|---|---|
21 | faible | 37 | 18 | 39 | 2 | 96 | |||
16 | moyen | 51 | 104 | 31 | 21 | 52 | 259 | ||
14 | fort | 41 | 147 | 192 | 24 | 49 | 453 | ||
129 | 269 | 262 | 45 | 103 | 808 | ||||
10 | g+cga | 15 | 3 | 6 | 24 | ||||
2 | agg+cgg | 7 | 7 | 14 | |||||
4 | carre ccc | 11 | 8 | 33 | 2 | 54 | |||
5 | autres | 4 | 4 | ||||||
37 | 18 | 39 | 2 | 96 | |||||
total tRNAs ‰ | |||||||||
gama7 | 1aa | >1aa | dup | +5s | 1-3aas | autres | gama ‰ | ref.‰ | |
21 | faible | 46 | 22 | 48 | 2 | 119 | 26 | ||
16 | moyen | 63 | 129 | 38 | 26 | 64 | 321 | 324 | |
14 | fort | 51 | 182 | 238 | 30 | 61 | 561 | 650 | |
160 | 333 | 324 | 56 | 127 | 808 | 729 | |||
10 | g+cga | 19 | 4 | 7 | 30 | 10 | |||
2 | agg+cgg | 9 | 9 | 17 | |||||
4 | carre ccc | 14 | 10 | 41 | 2 | 67 | 16 | ||
5 | autres | 5 | 5 | ||||||
46 | 22 | 48 | 2 | 119 | |||||
blocs tRNAs ‰ | total colonne % | ||||||||
gama7 | 1aa | >1aa | dup | total | ref.‰ | 1aa | >1aa | dup | |
21 | faible | 56 | 27 | 59 | 142 | 26 | 29 | 7 | 15 |
16 | moyen | 77 | 158 | 47 | 282 | 324 | 40 | 39 | 12 |
14 | fort | 62 | 223 | 291 | 576 | 650 | 32 | 55 | 73 |
195 | 408 | 397 | 660 | 729 | 129 | 269 | 262 | ||
10 | g+cga | 23 | 5 | 9 | 36 | 10 | 41 | 15 | |
2 | agg+cgg | 11 | 11 | 21 | 19 | ||||
4 | carre ccc | 17 | 12 | 50 | 79 | 16 | 30 | 85 | |
5 | autres | 6 | 6 | 11 | |||||
56 | 27 | 59 | 142 | 37 | 39 |
gamma, estimation des -rRNAs[modifier | modifier le wikicode]
- Lien tableur: gamma, estimation des -rRNAs
- Liens fiche: typage
- Légende: prélèvement de la base gtRNAdb le 22.1.21
- - ttt et tgt sont nuls partout
- - atgi, c'est Ile2, mis à la place de ttt, très rare chez les procaryotes.
- - atgf, c'est Metf, mis à la place de tgt, très rare chez les procaryotes.
- - atgj, c'est Met, remplace le atg standard qui est la somme Ile2 Met fMet.
- - Voir la légende des tris, g1 t1 et des couleurs
gamma, calcul des -rRNAs[modifier | modifier le wikicode]
- Lien tableur: gamma, calcul des -rRNAs
|
|
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|
|
gamma, comparaison clade-annexe des -rRNAs[modifier | modifier le wikicode]
- Lien tableur: gamma, comparaison clade-annexe des -rRNAs
- Légende
- - gam7. diff, somme des couleurs de gam7. La différence entre tRNAs est faite entre gam5 et gam6 du tableau précédent. Elle est exprimée en % et rapporté à la plus grande valeur des 2 termes de la différence. Ce qui fait quand un tRNA est à zéro la différence en % est égale à 100.
- - gam8. rap, rapport des sommes couleurs gam5/gam2. Le rapport -rRNA/total est celui du tRNA de gam5 sur celui de gam2.
- Fréquences des différences en % du tableau gam7
gamme 0/0 10 20 30 40 50 60 70 80 90 100 total fréquence 0 7 7 6 8 10 2 1 0 1 6 0 48 tot ≤ 50 38
- Comparaison avec le nombre de tRNAs de la fiche du clade: L’estimation des -rRNA par l'annexe est 62% au dessus de celle de la fiche des gamma.
tRNAs fiche annexe sans 8335 660 avec 1401 148 genomes 144 7 indice % 58 94
|
|
gamma intergen51[modifier | modifier le wikicode]
Intergen51. Introduction[modifier | modifier le wikicode]
- Voir les 51 génomes
Intergen51. Historique des pré-études[modifier | modifier le wikicode]
- Voir les 51 génomes
Intergen51. Formatage des résultats pour 7 génomes[modifier | modifier le wikicode]
gamma données intercalaires[modifier | modifier le wikicode]
- Lien tableur: gamma données intercalaires
gamma données intercalaires 200[modifier | modifier le wikicode]
- Lien tableur: gamma données intercalaires 200
Intergen51. Gamma vue de l'ensemble[modifier | modifier le wikicode]
Intergen51. La longueur totale des intercalaires d'un génome[modifier | modifier le wikicode]
- Légende: intercals pour longueur totale des intercalaires positifs en pdb et génome pour celle de l'ADN du génome donnée par NCBI
- Note: Les 9 éléments ont un taux autour de 12%
Nom intercals génome taux en % amed 601 332 4 777 154 12,6 eal 594 081 4 701 875 12,6 eco 501 283 4 641 652 10,8 ecoN 646 219 5 441 200 11,9 spl 789 212 5 174 581 15,3 vha1 499 733 3 765 351 13,3 vha2 317 649 2 204 018 14,4 vpb1 403 530 3 297 305 12,2 vpb2 242 529 1 806 219 13,4
Intergen51. Gamma les différents types d'intercalaires[modifier | modifier le wikicode]
- Lien au tableur: Intergen51. Gamma les différents types d'intercalaires.
- Légende:
- - S pour intercalaire CDS-CDS et R pour tRNA-CDS,
- - c pour intercalaire continu (les 2 gènes sont sur le même brin) et x pour discontinu (les 2 gènes sont sur 2 brins différents, le brin et son complément)
- - %reste = 100*reste/total, le reste étant ce qui reste du total après la fin du diagramme, gamme.
- - %t30 = 100*t30/total, t30 étant le total des fréquences 10 20 30
- - %t5 = 100*t/total, t5 étant le total des fréquences de -1 à -5 dans le diagramme des S-.
- Note:
- - taux des R-: c-/c = 100*2/301 = 0.7 et x-/x = 100*1/208 = 0.5.
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
Intergen51. Gamma Détail des intercalaires RNA-RNA et CDS-rRNA[modifier | modifier le wikicode]
- Lien aux données intercalaires.
RNA-RNA c x CDS-RNA c x 23s 5s 62 CDS 16s 37 24 16s 23s 11 5s CDS 14 18 16s tRNA 54 16 CDS tRNA 23s 51 CDS 5s 5s tRNA 36 23s CDS 2 tRNA in 45 CDS 23s tRNA contig 11 5s 16s 4 tRNA hors 414 16s16s 1 tRNA 16s 1 23s tRNA tRNA 5s 10 16s 5s 5s 23s 5s 5s total 695 0 total 58 42
Intergen51. Gamma Les intercalaires rares[modifier | modifier le wikicode]
- Lien aux données intercalaires.
- Note: 5 au total
tRNA-CDS gen x- c- zéro c spl -23 ecoN 2 vha2 -36 amed -21 16s16s c+ vha1 0
Intergen51. Les diagrammes des gamma[modifier | modifier le wikicode]
Intergen51. Les diagrammes CDS-CDS et tRNA-CDS[modifier | modifier le wikicode]
Intergen51. Les diagrammes CDS-CDS et tRNA-CDS positifs[modifier | modifier le wikicode]
- Lien aux données intercalaires.
- Diagrammes des gamma: tg présente 4 diagrammes
- - fc40, CDS-CDS continu, fréquence unitaire en abscisses et effectif en ordonnées
- - fx%, CDS-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et pourcentage en ‰ par rapport au total, en ordonnées.
- - ftc, tRNA-CDS continu, fréquences regroupées par 10 (freq10) en abscisses et effectif en ordonnées
- - ftx, tRNA-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et effectif en ordonnées
- Équations des courbes de tendance en pour 1000: colonnes %fx %fc
Courbes de tendances pour les diagrammes en pour 1000 Calculs des f.41 et autres R2 des f.1 R2 x3 x2 x c Inflexion poly3 x c 0,790 3,47E-06 -2,26E-03 3,24E-01 22,6 fx1 abscisse 534,8 55,7 0,828 -5,39E-06 4,14E-03 1,06E+00 101,0 fc1 ordonnée 4,7 39,3 poly3/droite -12,8 35,3 0,963 -3,16E-07 5,07E-04 -2,86E-01 61,0 fx41 0,976 5,33E-07 -8,91E-05 -1,60E-01 48,4 fc41 R2 f.1 x c Poly 3 790 828 0,908 -1,12E-01 47,1 fx41 Poly 6 899 970 0,925 -1,09E-01 41,4 fc41 Poly 9 977 986 0,650 -8,30E-02 39,1 fx1 0,650 -1,68E-01 57,8 fc1
Intergen51. Gamma CDS-CDS négatifs[modifier | modifier le wikicode]
Intergen51. Gama comparaison avec la totale[modifier | modifier le wikicode]
- Lien aux données intercalaires.
- Gamma se distingue de la totale par le 4/1 des négatifs c, avec 1.6 contre 2.6
Sous-totaux gama totale fréquence x- c- x- c- -1 2 1 002 4 4 140 -2 16 5 85 11 -3 2 2 3 12 -4 152 1 572 717 10 938 -5 2 4 5 19 sp6 276 1 463 1 642 8 424 total 450 4 048 2 456 23 544 reste 35 53 264 420 s6 84 5 361 41 s7 44 270 321 1 438 s8 113 1 135 696 6 525 rapport s1-5 4/2/1 9,5 1,6 8,4 2,6 % / sp6 s6/sp6 30,4 0,3 22,0 0,5 s7/sp6 15,9 18,5 19,5 17,1 s8/sp6 40,9 77,6 42,4 77,5 reste/sp6 12,7 3,6 16,1 5,0 total s1-5 174 2 585 814 15 120 % / total %s1-5 38,7 63,9 33,1 64,2 %sp6 61,3 36,1 66,9 35,8
Intergen51. Gama homogénéité des génomes[modifier | modifier le wikicode]
- Lien aux données intercalaires des génomes
- Grande homogénéité des génomes qui confirme la faiblesse du 4/1 des continus, à part amed avec 2.3 proche de 2.6 la totale.
négatifs x amed spl eco ecoN eal vpb1 vpb2 vha1 vha2 total total 42 12 95 105 119 13 14 25 25 450 s1-5 9 7 45 49 43 2 5 9 5 174 sp6 33 5 50 56 76 11 9 16 20 276 rapport s1-5 4/2 8.0 2.5 21.5 9.8 9.8 - 4.0 - 1.5 9.5 % / sp6 s6 24 20 28 32 30 27 33 44 35 30 s7 27 0 12 18 21 9 0 6 5 16 s8 36 60 34 41 39 55 56 50 60 41 reste 12 20 26 9 9 9 11 0 0 13 % / total s1-5 21 58 47 47 36 15 36 36 20 39 sp6 79 42 53 53 64 85 64 64 80 61 négatifs c amed spl eco ecoN eal vpb1 vpb2 vha1 vha2 total total 444 414 647 782 617 344 171 402 227 4048 s1-5 303 262 422 508 407 198 103 242 140 2585 sp6 141 152 225 274 210 146 68 160 87 1463 rapport s1-5 4/1 2.3 1.1 1.6 1.9 1.6 1.4 1.1 1.4 1.2 1.6 % / sp6 s6 0 0 0 2 0 0 0 0 0 0 s7 23 20 21 19 20 14 9 17 14 18 s8 72 77 68 76 78 86 91 83 86 78 reste 4 3 11 4 2 0 0 0 0 4 % / total s1-5 68 63 65 65 66 58 60 60 62 64 sp6 32 37 35 35 34 42 40 40 38 36
Intergen51. Gama Les grands négatifs inférieurs à -120[modifier | modifier le wikicode]
- Voir intergen51
Intergen51. Les diagrammes CDS-rRNA[modifier | modifier le wikicode]
Intergen51. Gamma. Les diagrammes CDS-16s[modifier | modifier le wikicode]
- Lien au tableur: Intergen51. Gamma. Les diagrammes CDS-16s.
- Lien aux données intercalaires.
- Les diagrammes CDS-16s
gama CDS16sc CDS16sx 5sCDSc 5sCDSx R2 - - - - moyenne 473,0 533,2 186,8 221,5 plage 360-690 450-630 30-390 60-480 total-p 31 17 12 14 % 84 71 86 78 queue 4 3 2 2 % 11 12,5 14 11 tête 2 4 0 0 % 5,4 16,7 0 0 max 390;9 480;4 90;4 120;6 total7 37 24 14 18 freq 30 30 30 30
- Les moyennes CDS-16s par génome
|
|
Intergen51. Les diagrammes 5s-CDS[modifier | modifier le wikicode]
- Lien aux données intercalaires.
- Comparaison avec les tRNA-CDS
- - Les équations des polynômes de d°3
- fct f(x) = 1.16E-06 x3 – 9,33E-04 x2 + 1,98E-01 x – 2,05
- fxt f(X) = -2.37E-07 x3 + 7.01E-05 x2 + 6.66E-03 x +3.00E+00
- - Les caractéristiques des courbes: xs abscisse calculée du maximum de la courbe en pbs, plage des effectifs forts et max de l'effectif maximum et son abscisse.
- - Les équations des polynômes de d°3
gama fct fxt 5sCDSc 5sCDSx R2 0,509 0,105 - - xs 145,7 236,8 186,8 221,5 plage 80-240 40-370 30-390 60-480 total-p 170 162 12 14 % 56 78 86 78 queue 103 40 2 2 % 34 19 14 11 tête 24 5 0 0 % 8,0 2,4 0 0 max 160;18 100;10 90;4 120;6 total7 301 208 14 18 freq 10 10 30 30
Intergen51.gamma. Comparaison 5s-CDS tRNA-CDS CDS-CDS[modifier | modifier le wikicode]
- Lien tableur: Intergen51.gamma. Comparaison 5s-CDS tRNA-CDS CDS-CDS.
- Légende:
- - Inf40, Sup700: nombre d'intercalaires du génome inférieurs à 41 et supérieurs à 700. Dans les tableaux 5sCDS ils sont notés en gras avec un *. A voir aux données intercalaires du génome.
- - moyenne: elle est calculée pour tous les intercalaires compris entre inf40 et sup700, 40 exclu. Et son écart est la fonction ecartype.
- - haut, bas: pour estimer que la moyenne du génome est très élevée ou trop basse par rapport à celle du total des alpha.
- + la référence du haut est égale à (total + total/10), indiquée sur la ligne total.
- + la référence du bas est égale à (total - total/10), indiquée sur la ligne total.
- + Pour un génome le haut est égal à (haut référence - sa moyenne): si cette différence est négative la moyenne est considérée trop élevée.
- + Pour un génome le bas est égal à (sa moyenne - haut référence): si cette différence est négative la moyenne est considérée trop basse.
- + pour les tableaux 5sCDS les références sont sur la ligne du total précédés du signe ++
- - Les colonnes f*t-f* représentent la différence entre les 2 moyennes.
- - intercalaires: pour les tableaux 5sCDS où les effectifs sont très faibles. Une plage continue de plus de 2 effectifs est représentée par un tiret, inférieur - supérieur. S'il n'y a que 2 intercalaires, ils sont séparés par 2 points, :.
- Note: Sommes des différences f*t-f*, positives et négatives, dans les tableaux correspondants
fct-fc 509,0 fct-fc -0 fxt-fx 804,9 fxt-fx -0
|
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|
Intergen51. Les CDS-rRNA rares[modifier | modifier le wikicode]
- Lien aux données intercalaires.
23sCDSc tRNA16sc 16s16sc 331 1063 0 385
Intergen51. Les diagrammes RNA-RNA[modifier | modifier le wikicode]
Intergen51. Gamma. Les diagrammes rRNA-rRNA[modifier | modifier le wikicode]
- Lien au tableur: Intergen51. Gamma. Les diagrammes rRNA-rRNA.
- Lien aux données intercalaires.
gama 16s23s 16stRNA tRNA23sc 23s5sc R2 - - - - moyenne 332,3 118,7 243,8 118,0 plage 280-360 80-140 180-340 80-180 total-p 10 43 49 61 % 91 80 96 98 queue 1 11 2 1 % 9,1 20 4,0 1,6 tête 0 0 0 0 % 0 0 0 0 max 360;7 80;19 200;18 100;27 total7 11 54 51 61 freq 20 20 20 20
Intergen51. Les diagrammes rRNA-RNA[modifier | modifier le wikicode]
- Lien au tableur: Intergen51. Gamma. Les diagrammes rRNA-RNA.
|
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|
Intergen51. Gamma. Les diagrammes tRNA-tRNA[modifier | modifier le wikicode]
- Lien au tableur: Intergen51. Gamma. Les diagrammes tRNA-tRNA.
- Lien aux données intercalaires.
Les diagrammes des tRNA-tRNA[modifier | modifier le wikicode]
type c S40 % R2 diag total reste x+ restes 5stRNA hors contig tRNA 5s hors 213 51 0,656 260 414 4 - 151 479 1472 777 contig 4 36 - 70 11 2 - 539 2351 1112 in 24 53 - 70 45 0 - 634 1360 5stRNA 14 39 - 120 36 1 - 1172 tRNA5s 5 50 - 60 10 3 -
Pourcentage des tRNA-tRNA hors blocs[modifier | modifier le wikicode]
tRNA h amed spl eco ecoN eal vpb vha vpb2 vha2 total % 20 14 15 12 13 11 9 10 1 1 84 20.3 40 27 27 10 16 8 24 17 129 31.2 60 14 29 6 9 7 21 16 1 102 24.6 80 2 3 1 4 1 9 6 2 26 6.3 100 3 8 0 0 1 3 6 1 21 5.1 120 8 14 1 1 1 25 6.0 140 1 4 2 0 0 7 2 160 0 0 2 0 1 1 4 1 180 1 1 0 200 1 2 1 1 1 5 1 220 1 1 2 1 5 1 240 0 0 0 260 1 1 0 reste 4 4 1 total 69 108 37 43 33 67 57 3 4 414 100 repete 8 9 8 13 8 4 5 0 1 55 48 séquence 3 7 2 2 2 4 5 0 0 25 22 sans 9 5 4 3 4 7 3 3 1 35 30 clusters 20 21 14 18 14 15 13 3 2 115 100
Les moyennes des tRNA-tRNA par génome[modifier | modifier le wikicode]
|
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|
Intergen51. Les RNA-RNA rares[modifier | modifier le wikicode]
- Lien aux données intercalaires.
- Les tRNA5sc cités ci-dessus