Recherche:Les clusters de gènes tRNA et rRNA chez les procaryotes/Annexe/archeo
Aller à la navigation
Aller à la recherche
Methanobacterium formicicum DSM1535[modifier | modifier le wikicode]
mfi opérons[modifier | modifier le wikicode]
- Lien tableur: mfi opérons
- Liens: gtRNAdb [1], NCBI [2], génome [orgn]
- Phylogénie: Archaea; Euryarchaeota; Methanomada group; Methanobacteria; Methanobacteriales; Methanobacteriaceae; Methanobacterium.
- Légende: cdsa: cds aas, cdsd: cds dirigé
41.2%GC | 17.8.19 Paris | 47 | doubles | intercal | cds | aa | avec aa | cdsa | cdsd | protéines |
---|---|---|---|---|---|---|---|---|---|---|
157153..157563 | CDS | 36 | 36 | 137 | ||||||
comp | 157600..157683 | ctc | 246 | 246 | ||||||
157930..158232 | CDS | 101 | ||||||||
comp | 211693..213681 | CDS | 206 | 206 | 663 | |||||
213888..213971 | tcg | 281 | 281 | |||||||
214253..215677 | CDS | 475 | ||||||||
comp | 314088..314264 | CDS | 50 | 50 | 59 | |||||
comp | 314315..314487 | caa | @1 | -1 | -1 | |||||
comp | 314487..314654 | CDS | 56 | |||||||
comp | 317759..318211 | CDS | 198 | 198 | 151 | |||||
comp | 318410..318494 | tcc | 177 | 177 | ||||||
comp | 318672..319634 | CDS | 321 | |||||||
comp | 419250..419975 | CDS | 156 | 156 | 242 | |||||
comp | 420132..420204 | aac | 29 | 29 | ||||||
comp | 420234..420545 | CDS | 104 | |||||||
comp | 466570..467484 | CDS | 223 | 223 | 305 | |||||
comp | 467708..467792 | agc | 186 | 186 | ||||||
comp | 467979..468294 | ncRNA | @2 | 122 | 122 | 316 | ||||
468417..469397 | CDS | 327 | ||||||||
681116..681676 | CDS | 37 | 37 | 187 | ||||||
comp | 681714..681786 | gcg | 195 | 195 | ||||||
comp | 681982..682488 | CDS | 169 | |||||||
695936..696538 | CDS | 939 | 939 | 201 | ||||||
comp | 697478..697600 | 5s | 305 | 123 | ||||||
comp | 697906..700772 | 23s | 233 | 2867 | ||||||
comp | 701006..701079 | gca | 87 | |||||||
comp | 701167..702646 | 16s | 724 | 724 | 1480 | |||||
703371..704336 | CDS | 322 | ||||||||
comp | 746487..747290 | CDS | 155 | 155 | 268 | |||||
comp | 747446..747518 | acc | 85 | 85 | ||||||
comp | 747604..747686 | tta | 303 | 303 | ||||||
747990..748163 | CDS | 58 | ||||||||
comp | 800615..801820 | CDS | 43 | 43 | 402 | |||||
comp | 801864..801935 | caa | 72 | 72 | ||||||
comp | 802008..802697 | CDS | 230 | |||||||
comp | 963425..964432 | CDS | 273 | 273 | 336 | |||||
964706..964778 | aac | 5 | 5 | |||||||
964784..964857 | atgi | 58 | 58 | |||||||
964916..964990 | gaa | 53 | 53 | |||||||
965044..965127 | cta | 29 | 29 | |||||||
965157..965232 | cac | 146 | 146 | |||||||
965379..965717 | CDS | 113 | ||||||||
comp | 974621..974842 | CDS | 564 | 564 | 74 | |||||
975407..975480 | aag | 90 | 90 | |||||||
975571..975653 | ttg | 504 | 504 | |||||||
976158..976231 | aaa | 148 | 148 | |||||||
comp | 976380..976679 | CDS | 100 | |||||||
comp | 1006329..1008095 | CDS | 397 | 397 | 589 | |||||
1008493..1008614 | 5s | @3 | 748 | 122 | ||||||
1009363..1009485 | 5s | 286 | 123 | |||||||
1009772..1012638 | 23s | 233 | 2867 | |||||||
1012872..1012945 | gca | 72 | ||||||||
1013018..1014497 | 16s | 454 | 454 | 1480 | ||||||
1014952..1016097 | CDS | 382 | ||||||||
comp | 1088211..1088831 | CDS | 53 | 53 | 207 | |||||
comp | 1088885..1089038 | tgg | @1 | 40 | 40 | |||||
comp | 1089079..1089150 | tgc | 212 | 212 | ||||||
comp | 1089363..1089746 | CDS | 128 | |||||||
1143658..1144137 | CDS | 166 | 166 | 160 | ||||||
comp | 1144304..1144610 | ncRNA | @2 | 14 | 14 | 307 | ||||
comp | 1144625..1144699 | atgf | 139 | 139 | ||||||
comp | 1144839..1145162 | CDS | 108 | |||||||
1153368..1154087 | CDS | 56 | 56 | 240 | ||||||
1154144..1154217 | aga | 62 | 62 | |||||||
1154280..1154354 | agg | 552 | 552 | |||||||
comp | 1154907..1156157 | CDS | 417 | |||||||
1247204..1247659 | CDS | 4 | 4 | 152 | ||||||
comp | 1247664..1247739 | cga | 133 | 133 | ||||||
comp | 1247873..1248481 | CDS | 203 | |||||||
comp | 1320721..1321641 | CDS | 183 | 183 | 307 | |||||
1321825..1321896 | gta | 99 | 99 | |||||||
1321996..1322067 | gtg | 228 | 228 | |||||||
comp | 1322296..1323084 | CDS | 263 | |||||||
comp | 1403886..1409507 | CDS | 351 | 351 | 1874 | |||||
comp | 1409859..1409930 | cgc | 222 | 222 | ||||||
comp | 1410153..1410620 | CDS | 156 | |||||||
1532795..1533088 | CDS | 127 | 127 | 98 | ||||||
comp | 1533216..1533325 | atgj | @1 | 246 | 246 | |||||
1533572..1534402 | CDS | 277 | ||||||||
1541929..1542321 | CDS | 127 | 127 | 131 | ||||||
1542449..1542522 | ggg | 1 | 1 | |||||||
comp | 1542524..1543528 | CDS | 335 | |||||||
1602054..1603277 | CDS | 257 | 257 | 408 | ||||||
1603535..1603608 | aca | 76 | 76 | |||||||
1603685..1603759 | cca | 44 | 44 | |||||||
1603804..1603877 | tac | 170 | 170 | |||||||
1604048..1604119 | gac | 7 | 7 | |||||||
1604127..1604200 | aaa | 24 | 24 | |||||||
1604225..1604461 | CDS | 79 | ||||||||
1617553..1617861 | CDS | 187 | 187 | 103 | ||||||
1618049..1618133 | tca | 252 | 252 | |||||||
1618386..1619444 | CDS | 353 | ||||||||
comp | 1692202..1692552 | CDS | 271 | 271 | 117 | |||||
comp | 1692824..1692895 | cag | 156 | 156 | ||||||
comp | 1693052..1693972 | CDS | 307 | |||||||
1887796..1888038 | CDS | 136 | 136 | 81 | ||||||
1888175..1888257 | ctg | 193 | 193 | |||||||
1888451..1891267 | CDS | 939 | ||||||||
2057488..2057883 | CDS | 230 | 230 | 132 | ||||||
2058114..2058184 | tgc | 143 | 143 | |||||||
2058328..2059713 | CDS | 462 | ||||||||
2128536..2129312 | CDS | 123 | 123 | 259 | ||||||
2129436..2129509 | acg | 362 | 362 | |||||||
comp | 2129872..2130963 | CDS | ||||||||
comp | 2204492..2204932 | CDS | 178 | 178 | 147 | |||||
2205111..2205182 | gtc | 4 | 4 | |||||||
2205187..2205259 | ttc | 283 | 283 | |||||||
comp | 2205543..2205875 | CDS | 111 | |||||||
2317208..2317498 | CDS | 271 | 271 | 97 | ||||||
2317770..2317842 | atc | 460 | 460 | |||||||
2318303..2318863 | CDS | 187 | ||||||||
comp | 2414821..2415903 | CDS | 491 | 491 | 361 | |||||
2416395..2416468 | gcc | 303 | 303 | |||||||
comp | 2416772..2417797 | CDS | 342 | |||||||
comp | 2432399..2432848 | CDS | 537 | 537 | 150 | |||||
2433386..2433459 | ggc | 2 | 2 | |||||||
2433462..2433535 | gga | 326 | 326 | |||||||
comp | 2433862..2434263 | CDS | 134 |
mfi cumuls[modifier | modifier le wikicode]
- Lien tableur: mfi cumuls
opérons | Fréquences intercalaires tRNAs | Fréquences intercalaires cds | Fréquences aas cds chromosome | ||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
effectif | gammes | sans rRNAs | avec rRNAs | gammes | cds | gammes | cdsd | gammes | cdsa | gammes | cdsa 300 | ||
avec rRNA | opérons | 2 | 1 | 0 | - | 1 | 2 | 1 | 100 | 9 | 30 | 0 | |
16 23 5s 0 | 0 | 20 | 4 | 50 | 8 | 20 | 200 | 21 | 60 | 3 | |||
16 gca 235 | 2 | 40 | 2 | 100 | 3 | 40 | 300 | 10 | 90 | 3 | |||
16 23 5s a | 0 | 60 | 3 | 150 | 10 | 60 | 400 | 12 | 120 | 10 | |||
max a | 1 | 80 | 2 | 200 | 12 | 80 | 500 | 5 | 150 | 7 | |||
a doubles | 0 | 100 | 3 | 250 | 8 | 100 | 600 | 1 | 180 | 5 | |||
autres | 2 | 120 | 0 | 300 | 7 | 120 | 700 | 1 | 210 | 5 | |||
total aas | 2 | 140 | 0 | 350 | 3 | 140 | 800 | 0 | 240 | 2 | |||
sans | opérons | 29 | 160 | 0 | 400 | 3 | 160 | 900 | 0 | 270 | 4 | ||
1 aa | 20 | 180 | 1 | 450 | 0 | 180 | 1000 | 1 | 300 | 1 | |||
max a | 5 | 200 | 0 | 500 | 3 | 200 | 1100 | 0 | 330 | 6 | |||
a doubles | 0 | 1 | 5 | 1 | 15 | ||||||||
total aas | 45 | 16 | 0 | 64 | 0 | 61 | 61 | ||||||
total aas | 47 | ||||||||||||
remarques | 3 | ||||||||||||
avec jaune | moyenne | 83 | 224 | 266 | |||||||||
variance | 121 | 176 | 265 | ||||||||||
sans jaune | moyenne | 35 | 178 | 213 | 171 | ||||||||
variance | 27 | 96 | 115 | 81 |
mfi tRNA-cds[modifier | modifier le wikicode]
- Note: intercalaires prélevés de la colonne cds de mfi opérons dans un bloc de tRNAs uniquement. Le début du bloc est dans l'ordre des adresses, deb intercalaire entre le cds et le 1er tRNA dd bloc, fin entre le dernier tRNA et le cds terminal. J'ai procédé, dans les colonnes petit et grand, à la réorientation des blocs d'après la constatation que les blocs à rRNA ont leurs cds de début et de fin sont orientés du cds-16s au 5s-tRNAs-cds, l'intercalaire cds-16s étant plus grands que l'intercalaire avec le cds terminal. En tête de colonne est le % du nombre des intercalaires inférieurs à 201 pbs.
mfi 62 52 31 83 deb fin deb fin grand petit grand petit 4 133 50 -1 50 -1 50 -1 14 139 127 1 72 43 127 1 36 246 257 24 127 1 133 4 37 195 156 29 133 4 139 14 43 72 43 72 139 14 257 24 50 -1 4 133 156 29 156 29 53 212 14 139 193 136 246 36 56 552 230 143 195 37 195 37 123 362 273 146 198 177 72 43 127 246 564 148 212 53 212 53 127 1 271 156 223 186 552 56 136 193 198 177 228 183 362 123 155 303 223 186 230 143 246 127 156 29 136 193 246 36 193 136 178 283 37 195 246 127 230 143 183 228 53 212 252 187 273 146 187 252 351 222 257 24 564 148 198 177 183 228 271 156 303 155 206 281 36 246 273 146 271 156 223 186 127 246 281 206 198 177 230 143 187 252 283 178 283 178 257 24 206 281 303 155 228 183 271 156 178 283 351 222 223 186 271 460 155 303 362 123 252 187 273 146 491 303 460 271 281 206 351 222 537 326 491 303 351 222 491 303 123 362 537 326 460 271 537 326 271 460 552 56 491 303 564 148 56 552 564 148 537 326
- Comparaison cds-cds tRNA-cds: deb fin, c'est l'ordre des adresses et grand petit l'ordre après réorientation. Leur pourcentage est calculé par rapport à la colonne, c'est à dire la moitié du total des tRNA-cds.
archeo cds total total <0 0-200 201-370 371-600 >600 deb fin grand petit mfi 3,381 58 1 32 20 5 18 14 9 23 ‰ 17 552 345 86 621 483 310 793
mfi blocs[modifier | modifier le wikicode]
- Lien tableur: mfi blocs
CDS | 939 | 201 |
5s | 305 | 123 |
23s | 233 | 2867 |
gca | 87 | |
16s | 724 | 1480 |
CDS | 322 | |
CDS | 397 | 589 |
5s | 748 | 122 |
5s | 286 | 123 |
23s | 233 | 2867 |
gca | 72 | |
16s | 454 | 1480 |
CDS | 382 |
mfi remarques[modifier | modifier le wikicode]
- Lien tableur: mfi remarques
- Remarques: pas de doubles mais des séquences. Il n’y a pas de cgt, on est avec les archées.
- @ Les introns des(gtRNAdb) archées existent pour tgg et atgj tujours. Ici en plus il y a un caa.
- - caa (Join(314315..314349,314448..314487)), l’intron empiète sur le cds d’où l’intercalaire négatif.
- - tgg ( join(1088885..1088919,1089000..1089038)), l’intron mais n’empiète pas sur les cds.
- - atgj Join(1533216..1533251,1533288..1533325), n’empiète pas sur les cds. C’est Met mais pas Il2 ni atgf.
- @ Ces ncRNAs sont dans le même cluster, sur le même brin qu’ un tRNA et très proche de lui, agc 186 et atgf 14. Ils sont petits respectivement 316 et 307 pbs.
- @ Le 5s collé au cluster du 16sgca23s5s, il se comporte comme un tRNA. Il a une pb de moins que les 2 autres 5s.
- @ Les introns des(gtRNAdb) archées existent pour tgg et atgj tujours. Ici en plus il y a un caa.
- Séquence des doubles: aucun double dans une séquence. Les doubles exitants sont gca aac aaa caa tgc.
- Tableau du code génétique de mfi
- Légende: prélèvement de la base gtRNAdb le 17.8.19
- - totaux en en-tête, 47 total de gtRNAdb contenant des pseudo et inconnus; 47 total du cumul.
- - atgi, c'est Ile2, mis à la place de ttt, très rare chez les procaryotes.
- - atgf, c'est Metf, mis à la place de tgt, très rare chez les procaryotes.
- - atgj, c'est Met, remplace le atg standard qui est la somme Ile2 Metf Met.
- - Voir la légende des tris et couleurs, g1 t1.
- Légende: prélèvement de la base gtRNAdb le 17.8.19
g1 | t1 | 47 | 47 | ||||
---|---|---|---|---|---|---|---|
atgi | 1 | tct | tat | atgf | 1 | ||
att | act | aat | agt | ||||
ctt | cct | cat | cgt | ||||
gtt | gct | gat | ggt | ||||
ttc | 1 | tcc | 1 | tac | 1 | tgc | 2 |
atc | 1 | acc | 1 | aac | 2 | agc | 1 |
ctc | 1 | ccc | cac | 1 | cgc | 1 | |
gtc | 1 | gcc | 1 | gac | 1 | ggc | 1 |
tta | 1 | tca | 1 | taa | tga | ||
ata | aca | 1 | aaa | 2 | aga | 1 | |
cta | 1 | cca | 1 | caa | 2 | cga | 1 |
gta | 1 | gca | 2 | gaa | 1 | gga | 1 |
ttg | 1 | tcg | 1 | tag | tgg | 1 | |
atgj | 1 | acg | 1 | aag | 1 | agg | 1 |
ctg | 1 | ccg | cag | 1 | cgg | ||
gtg | 1 | gcg | 1 | gag | ggg | 1 |
mfi distribution[modifier | modifier le wikicode]
- Lien tableur: mfi distribution
g1 | t1 | ||||||
---|---|---|---|---|---|---|---|
atgi | 1 | tct | tat | atgf | 1 | ||
att | act | aat | agt | ||||
ctt | cct | cat | cgt | ||||
gtt | gct | gat | ggt | ||||
ttc | 1 | tcc | 1 | tac | 1 | tgc | 2 |
atc | 1 | acc | 1 | aac | 2 | agc | 1 |
ctc | 1 | ccc | cac | 1 | cgc | 1 | |
gtc | 1 | gcc | 1 | gac | 1 | ggc | 1 |
tta | 1 | tca | 1 | taa | tga | ||
ata | aca | 1 | aaa | 2 | aga | 1 | |
cta | 1 | cca | 1 | caa | 2 | cga | 1 |
gta | 1 | gca | 2 | gaa | 1 | gga | 1 |
ttg | 1 | tcg | 1 | tag | tgg | 1 | |
atgj | 1 | acg | 1 | aag | 1 | agg | 1 |
ctg | 1 | ccg | cag | 1 | cgg | ||
gtg | 1 | gcg | 1 | gag | ggg | 1 | |
arch | >1aa | =1aa | -5s | +5s | -16s | +16s | total |
mfi | 25 | 20 * | 2 | 47 |
mfi. Intergen51[modifier | modifier le wikicode]
Intergen51. mfi. Le génome[modifier | modifier le wikicode]
- mfi Le prélèvement: Aapal
- Le nom et le lien NCBI: mfi, Methanobacterium formicicum genome assembly DSM1535, chromosome:chrI, NCBI [3], date 25.9.19.
- mfi La longueur totale des intercalaires, longueur du génome et taux intercalaires/génome:
Nom intercals génome taux en % mfi 403,834 2,478,074 16.3
mfi données intercalaires[modifier | modifier le wikicode]
- Lien tableur: mfi données intercalaires
- Lien sauvegarde NCBI: Aapal
mfi autres intercalaires aas[modifier | modifier le wikicode]
- Lien tableur: mfi autres intercalaires aas
- Lien sauvegarde NCBI: Aapal
Intergen51. mfi. Les différents types d'intercalaires[modifier | modifier le wikicode]
- Lien au tableur: Intergen51. mfi les différents types d'intercalaires.
- Légende:
- - S pour intercalaire CDS-CDS et R pour tRNA-CDS,
- - c pour intercalaire continu (les 2 gènes sont sur le même brin) et x pour discontinu (les 2 gènes sont sur 2 brins différents, le brin et son complément)
- - %reste = 100*reste/total, le reste étant ce qui reste du total après la fin du diagramme, gamme.
- - %t30 = 100*t30/total, t30 étant le total des fréquences 10 20 30
- - %t5 = 100*t/total, t5 étant le total des fréquences de -1 à -5 dans le diagramme des S-.
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
Intergen51. mfi. Les diagrammes CDS-CDS positifs[modifier | modifier le wikicode]
- Lien tableur: Les diagrammes
- Diagrammes des gamma: mfi présente 2 diagrammes
- - fc40, CDS-CDS continu, fréquence unitaire en abscisses et effectif en ordonnées
- - fx%, CDS-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et pourcentage en ‰ par rapport au total, en ordonnées.
- Équations des courbes de tendance en pour 1000: colonnes %fx %fc
Courbes de tendances pour les diagrammes en pour 1000 Calculs des f.41 mfi R2 x3 x2 x c Inflexion poly3 x c 0.600 2.45E-06 -1.82E-03 3.38E-01 11.20 fx1 abscisse 246.8 164.3 0.837 -1.93E-06 1.64E-03 -5.19E-01 71.0 fc1 ordonnée 20.9 25.1 0.646 3.39E-06 -2.51E-03 4.92E-01 1.36 fx41 0.937 1.27E-06 -6.26E-04 -4.42E-02 43.6 fc41
Intergen51. mfi. Les CDS-CDS négatifs[modifier | modifier le wikicode]
Sous-totaux mfi totale fréquence x- c- x- c- - 1 0 22 4 4140 - 2 0 0 85 11 - 3 0 0 3 12 - 4 1 70 717 10938 - 5 0 0 5 19 sp6 4 75 1642 8424 total 5 167 2,456 23,544 reste 2 7 264 420 s6 1 0 361 41 s7 0 13 321 1438 s8 1 55 696 6525 rappot s1-5 4/2/1 - 3.2 8.4 2.6 % / sp6 s6/sp6 25.0 0.0 22.0 0.5 s7/sp6 0.0 17.3 19.5 17.1 s8/sp6 25.0 73.3 42.4 77.5 reste/sp6 50.0 9.3 16.1 5.0 total s1-5 1 92 814 15120 % / total %s1-5 20.0 55.1 33.1 64.2 %sp6 80.0 44.9 66.9 35.8
Intergen51. mfi. Les intercalaires des blocs[modifier | modifier le wikicode]
- Le détail
RNA-RNA c x CDS-RNA c x 23s 5s 2 CDS 16s 1 1 16s 23s 5s CDS 2 16s tRNA 2 16 CDS tRNA 23s 2 CDS 5s 5s tRNA 23s CDS tRNA in CDS 23s tRNA contig 5s 16s tRNA hors 16 16s16s tRNA 16s 23s tRNA tRNA 5s 16s 5s 5s 23s 5s 5s 1 total 23 0 total 1 3
- Les rares voir gamma pour la longueur des intercalaires
- Les tRNA-CDS compris, comparaison dans le clade et dans l'étude.
Intergen51. mfi. Les intercalaires tRNA-tRNA extra bloc[modifier | modifier le wikicode]
- Lien tableur: Intergen51. mfi. Les intercalaires tRNA-tRNA extra bloc
- Voir mfe
Methanocaldococcus jannaschii DSM 2661[modifier | modifier le wikicode]
mja opérons[modifier | modifier le wikicode]
- Lien tableur: mja opérons
- Liens: gtRNAdb [4], NCBI [5], génome [6]
- Phylogénie: Archaea; Euryarchaeota; Methanomada group; Methanococci; Methanococcales; Methanocaldococcaceae; Methanocaldococcus.
- Légende: cdsa: cds aas, cdsd: cds dirigé
31.3%GC | 17.8.19 Paris | 37 | doubles | intercal | cds | aa | avec aa | cdsa | cdsd | protéines |
---|---|---|---|---|---|---|---|---|---|---|
comp | 96499..97053 | CDS | 372 | 372 | 185 | |||||
comp | 97426..97537 | atgj | @1 | 91 | 91 | |||||
97629..97716 | ctc | 241 | 241 | |||||||
97958..99259 | CDS | 434 | ||||||||
comp | 110328..111545 | CDS | 222 | 222 | 406 | |||||
111768..111852 | tga | 21 | 21 | |||||||
111874..112785 | CDS | 304 | ||||||||
137244..138245 | CDS | 98 | 98 | 334 | ||||||
comp | 138344..138419 | gtg | 59 | 59 | ||||||
comp | 138479..138781 | CDS | 101 | |||||||
153070..154479 | CDS | 182 | 182 | 470 | ||||||
comp | 154662..157639 | 23s | 207 | 2978 | ||||||
comp | 157847..157919 | gca | 64 | |||||||
comp | 157984..159463 | 16s | 340 | 340 | 1480 | |||||
159804..160085 | CDS | 94 | ||||||||
comp | 185874..186671 | CDS | 306 | 306 | 266 | |||||
186978..187066 | tcc | 71 | 71 | |||||||
187138..187590 | CDS | 151 | ||||||||
190579..190800 | CDS | 31 | 31 | 74 | ||||||
190832..190908 | ccc | 32 | 32 | |||||||
190941..191114 | CDS | 58 | ||||||||
comp | 214560..215060 | CDS | 149 | 149 | 167 | |||||
215210..215297 | tta | 154 | 154 | |||||||
215452..216240 | CDS | 263 | ||||||||
226386..227639 | CDS | 64 | 64 | 418 | ||||||
comp | 227704..227780 | gcc | 239 | 239 | ||||||
228020..229720 | CDS | 567 | ||||||||
303613..303927 | CDS | 64 | 64 | 105 | ||||||
303992..304081 | tca | 230 | 230 | |||||||
comp | 304312..304752 | CDS | 147 | |||||||
comp | 357984..358547 | CDS | 220 | 220 | 188 | |||||
358768..358845 | aga | 23 | 23 | |||||||
358869..358943 | gaa | 164 | 164 | |||||||
359108..359923 | CDS | 272 | ||||||||
359108..359923 | CDS | 48 | 48 | 272 | ||||||
comp | 359972..360047 | atgf | 103 | 103 | ||||||
comp | 360151..361485 | CDS | 445 | |||||||
401945..402796 | CDS | 171 | 171 | 284 | ||||||
comp | 402968..403044 | gtc | 229 | 229 | ||||||
403274..403834 | CDS | 187 | ||||||||
comp | 618311..618757 | CDS | 402 | 402 | 149 | |||||
comp | 619160..619234 | tgc | 63 | 63 | ||||||
comp | 619298..619915 | CDS | 206 | |||||||
636394..637449 | CDS | 133 | 133 | 352 | ||||||
637583..637659 | ttc | 7 | 7 | |||||||
637667..637742 | aac | 29 | 29 | |||||||
637772..637849 | atgi | 18 | 18 | |||||||
637868..637942 | gaa | 39 | 39 | |||||||
637982..638069 | cta | 11 | 11 | |||||||
638081..638152 | cac | 295 | ||||||||
638448..639930 | 16s | 64 | 1483 | |||||||
639995..640067 | gca | 207 | ||||||||
640275..643254 | 23s | 78 | 2980 | |||||||
643333..643447 | 5s | 56 | 115 | |||||||
643504..643761 | ncRNA | @2 | 232 | 232 | 258 | |||||
643994..644962 | CDS | 323 | ||||||||
762859..763608 | CDS | 157 | 157 | 250 | ||||||
comp | 763766..763842 | acc | 178 | 178 | ||||||
764021..764096 | caa | 50 | 50 | |||||||
764147..764818 | CDS | 224 | ||||||||
862207..862410 | CDS | 179 | 179 | 68 | ||||||
862590..862661 | cga | 41 | 41 | |||||||
862703..863392 | CDS | 86 | 86 | 230 | ||||||
863479..863555 | aca | 14 | 14 | |||||||
863570..863647 | cca | 8 | 8 | |||||||
863656..863732 | tac | 83 | 83 | |||||||
863816..863889 | aaa | 13 | ||||||||
863903..864017 | 5s | @3 | 46 | 115 | ||||||
864064..864141 | gac | 80 | 80 | |||||||
864222..864842 | CDS | 207 | ||||||||
871492..873447 | CDS | 238 | 238 | 652 | ||||||
comp | 873686..873763 | atc | 102 | 102 | ||||||
comp | 873866..875110 | CDS | 415 | |||||||
comp | 882566..883615 | CDS | 65 | 65 | 350 | |||||
883681..883754 | gta | 123 | 123 | |||||||
comp | 883878..884297 | CDS | 140 | |||||||
comp | 1037197..1038504 | CDS | 39 | 39 | 436 | |||||
comp | 1038544..1038620 | cgc | @4 | 1 | 1 | |||||
comp | 1038622..1039386 | CDS | 255 | |||||||
comp | 1148669..1149934 | CDS | 210 | 210 | 422 | |||||
1150145..1150220 | ggc | 34 | 34 | |||||||
1150255..1150330 | gga | 243 | 243 | |||||||
1150574..1151254 | CDS | 227 | ||||||||
comp | 1188906..1189772 | CDS | 172 | 172 | 289 | |||||
1189945..1190055 | tgg | @1 | 95 | 95 | ||||||
1190151..1190684 | CDS | 178 | ||||||||
comp | 1312335..1312781 | CDS | 383 | 383 | 149 | |||||
1313165..1313249 | agc | 177 | 177 | |||||||
1313427..1314617 | CDS | 397 |
mja cumuls[modifier | modifier le wikicode]
- Lien tableur: mja cumuls
opérons | Fréquences intercalaires tRNAs | Fréquences intercalaires cds | Fréquences aas cds chromosome | ||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
effectif | gammes | sans rRNAs | avec rRNAs | gammes | cds | gammes | cdsd | gammes | cdsa | gammes | cdsa 300 | ||
avec rRNA | opérons | 2 | 1 | 0 | 0 | 1 | 1 | 1 | 100 | 4 | 30 | 0 | |
16 23 5s 0 | 0 | 20 | 0 | 5 | 50 | 7 | 20 | 200 | 12 | 60 | 1 | ||
16 atc gca | 0 | 40 | 2 | 2 | 100 | 10 | 40 | 300 | 13 | 90 | 2 | ||
16 23 5s a | 0 | 60 | 0 | 0 | 150 | 5 | 60 | 400 | 6 | 120 | 3 | ||
max a | 7 | 80 | 0 | 0 | 200 | 8 | 80 | 500 | 8 | 150 | 4 | ||
a doubles | 0 | 100 | 1 | 1 | 250 | 10 | 100 | 600 | 1 | 180 | 3 | ||
autres | 2 | 120 | 0 | 0 | 300 | 0 | 120 | 700 | 1 | 210 | 5 | ||
total aas | 13 | 140 | 0 | 0 | 350 | 2 | 140 | 800 | 0 | 240 | 3 | ||
sans | opérons | 20 | 160 | 0 | 0 | 400 | 2 | 160 | 900 | 0 | 270 | 4 | |
1 aa | 16 | 180 | 1 | 0 | 450 | 1 | 180 | 1000 | 0 | 300 | 4 | ||
max a | 2 | 200 | 0 | 0 | 500 | 0 | 200 | 1100 | 0 | 330 | 2 | ||
a doubles | 0 | 0 | 0 | 0 | 0 | 14 | |||||||
total aas | 24 | 4 | 8 | 46 | 0 | 45 | 45 | ||||||
total aas | 37 | ||||||||||||
remarques | 4 | ||||||||||||
avec jaune | moyenne | 82 | 26 | 154 | 269 | ||||||||
variance | 71 | 25 | 102 | 137 | |||||||||
sans jaune | moyenne | 29 | 18 | 152 | 253 | 194 | |||||||
variance | 8 | 12 | 95 | 117 | 74 |
mja blocs[modifier | modifier le wikicode]
- Lien tableur: mja blocs
CDS | 182 | |
23s | 207 | 2978 |
gca | 64 | |
16s | 340 | 1480 |
CDS | ||
cac | 295 | |
16s | 64 | 1483 |
gca | 207 | |
23s | 78 | 2980 |
5s | 56 | 115 |
ncRNA | 232 | 258 |
CDS | ||
aaa | 13 | |
5s | 46 | 115 |
gac | 80 | |
CDS |
mja remarques[modifier | modifier le wikicode]
- Lien tableur: mja remarques
- Remarques: pas de doubles mais des séquences. Il n’y a pas de cgt, on est avec les archées.
- @ Les introns (gtRNAdb) des archées existent toujours pour tgg et atgj.
- - tgg, Join(1189945..1189984,1190018..1190055), l’ intron mais n’empiète pas sur les cds.
- - atgj, Join(97426..97464,97500..97537), n’empiète pas sur les cds. C’est Met mais pas Il2 ni atgf.
- @ Ce ncRNA est dans et sur le même brin que le cluster et très proche de lui, 56 au lieu de 232 avec cds. Il est petit, 258 pbs comme pour mfi.
- @ Le 5s est décollé du cluster du 16sgca23s, il se comporte comme un tRNA et est dans leur séquence. C’est pour ça que j’ai ces aas dans la colonne “avec rRNAs”.
- @ cgc très collé à ses 2 cds
- @ Les introns (gtRNAdb) des archées existent toujours pour tgg et atgj.
- Séquence des doubles: aucun double dans une séquence. Les doubles exitants sont gca gaa.
- Tableau du code génétique de mja
- Légende: prélèvement de la base gtRNAdb le 17.8.19
- - totaux en en-tête, 37 total de gtRNAdb contenant des pseudo et inconnus; 37 total du cumul.
- - atgi, c'est Ile2, mis à la place de ttt, très rare chez les procaryotes.
- - atgf, c'est Metf, mis à la place de tgt, très rare chez les procaryotes.
- - atgj, c'est Met, remplace le atg standard qui est la somme Ile2 Metf Met.
- - Voir la légende des tris et couleurs, g1 t1.
- Légende: prélèvement de la base gtRNAdb le 17.8.19
g1 | t1 | 37 | 37 | ||||
---|---|---|---|---|---|---|---|
atgi | 1 | tct | tat | atgf | 1 | ||
att | act | aat | agt | ||||
ctt | cct | cat | cgt | ||||
gtt | gct | gat | ggt | ||||
ttc | 1 | tcc | 1 | tac | 1 | tgc | 1 |
atc | 1 | acc | 1 | aac | 1 | agc | 1 |
ctc | 1 | ccc | 1 | cac | 1 | cgc | 1 |
gtc | 1 | gcc | 1 | gac | 1 | ggc | 1 |
tta | 1 | tca | 1 | taa | tga | 1 | |
ata | aca | 1 | aaa | 1 | aga | 1 | |
cta | 1 | cca | 1 | caa | 1 | cga | 1 |
gta | 1 | gca | 2 | gaa | 2 | gga | 1 |
ttg | tcg | tag | tgg | 1 | |||
atg | 1 | acg | aag | agg | |||
ctg | ccg | cag | cgg | ||||
gtg | 1 | gcg | gag | ggg |
mja distribution[modifier | modifier le wikicode]
- Lien tableur: mja distribution
g1 | t1 | ||||||
---|---|---|---|---|---|---|---|
atgi | 1 | tct | tat | atgf | 1 | ||
att | act | aat | agt | ||||
ctt | cct | cat | cgt | ||||
gtt | gct | gat | ggt | ||||
ttc | 1 | tcc | 1 | tac | 1 | tgc | 1 |
atc | 1 | acc | 1 | aac | 1 | agc | 1 |
ctc | 1 | ccc | 1 | cac | 1 | cgc | 1 |
gtc | 1 | gcc | 1 | gac | 1 | ggc | 1 |
tta | 1 | tca | 1 | taa | tga | 1 | |
ata | aca | 1 | aaa | 1 | aga | 1 | |
cta | 1 | cca | 1 | caa | 1 | cga | 1 |
gta | 1 | gca | 2 | gaa | 2 | gga | 1 |
ttg | tcg | tag | tgg | 1 | |||
atgj | 1 | acg | aag | agg | |||
ctg | ccg | cag | cgg | ||||
gtg | 1 | gcg | gag | ggg | |||
arch | >1aa | =1aa | -5s | +5s | -16s | +16s | total |
mja | 8 | 16 | 1 | 4 | 6 * | 2 | 37 |
mja. Intergen51[modifier | modifier le wikicode]
Intergen51. mja. Le génome[modifier | modifier le wikicode]
- mja Le prélèvement: Artb
- Le nom et le lien NCBI: mja, Methanocaldococcus jannaschii DSM 2661, NCBI [7], date 09.04.20.
- mja La longueur totale des intercalaires, longueur du génome et taux intercalaires/génome:
Nom intercals génome taux en % mja 168,865 1,664,970 10.1
mja données intercalaires[modifier | modifier le wikicode]
- Lien tableur: mja données intercalaires
- Lien sauvegarde NCBI: Artb
mja autres intercalaires aas[modifier | modifier le wikicode]
- Lien tableur: mja autres intercalaires aas
- Lien sauvegarde NCBI: Artb
Intergen51. mja. Les différents types d'intercalaires[modifier | modifier le wikicode]
- Lien au tableur: Intergen51. mja les différents types d'intercalaires.
- Légende:
- - S pour intercalaire CDS-CDS et R pour tRNA-CDS,
- - c pour intercalaire continu (les 2 gènes sont sur le même brin) et x pour discontinu (les 2 gènes sont sur 2 brins différents, le brin et son complément)
- - %reste = 100*reste/total, le reste étant ce qui reste du total après la fin du diagramme, gamme.
- - %t30 = 100*t30/total, t30 étant le total des fréquences 10 20 30
- - %t5 = 100*t/total, t5 étant le total des fréquences de -1 à -5 dans le diagramme des S-.
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
Intergen51. mja. Les diagrammes CDS-CDS positifs[modifier | modifier le wikicode]
- Lien tableur: Les diagrammes
- Diagrammes des gamma: mja présente 2 diagrammes
- - fc40, CDS-CDS continu, fréquence unitaire en abscisses et effectif en ordonnées
- - fx%, CDS-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et pourcentage en ‰ par rapport au total, en ordonnées.
- Équations des courbes de tendance en pour 1000: colonnes %fx %fc
Courbes de tendances pour les diagrammes en pour 1000 Calculs des f.41 mja R2 x3 x2 x c Inflexion poly3 x c 0.659 -1.51E-06 1.41E-03 -4.93E-01 71.50 fx1 abscisse 216.0 413.1 0.856 -9.20E-06 7.03E-03 -1.72E+00 143.0 fc1 ordonnée 5.5 0.4 0.703 4.80E-06 -3.11E-03 4.71E-01 13.9 fx41 0.960 -8.15E-07 1.01E-03 -4.38E-01 66.4 fc41
Intergen51. mja. Les CDS-CDS négatifs[modifier | modifier le wikicode]
Sous-totaux mja totale fréquence x- c- x- c- - 1 0 25 4 4140 - 2 0 0 85 11 - 3 0 0 3 12 - 4 26 51 717 10938 - 5 0 2 5 19 sp6 30 85 1642 8424 total 56 163 2,456 23,544 reste 1 6 264 420 s6 19 0 361 41 s7 3 17 321 1438 s8 7 62 696 6525 rappot s1-5 4/2/1 - 2.0 8.4 2.6 % / sp6 s6/sp6 63.3 0.0 22.0 0.5 s7/sp6 10.0 20.0 19.5 17.1 s8/sp6 23.3 72.9 42.4 77.5 reste/sp6 3.3 7.1 16.1 5.0 total s1-5 26 78 814 15120 % / total %s1-5 46.4 47.9 33.1 64.2 %sp6 53.6 52.1 66.9 35.8
Intergen51. mja. Les intercalaires des blocs[modifier | modifier le wikicode]
- Le détail
RNA-RNA c x CDS-RNA c x 23s 5s 1 CDS 16s 1 16s 23s 5s CDS 16s tRNA 2 16 CDS tRNA 23s 2 CDS 5s 5s tRNA 1 23s CDS tRNA in CDS 23s tRNA contig 8 5s 16s 1 tRNA hors 4 16s16s tRNA 16s 1 23s tRNA tRNA 5s 1 16s 5s 5s 23s 5s 5s total 20 0 total 0 2
- Les rares voir gamma pour la longueur des intercalaires
- Les tRNA-CDS compris, comparaison dans le clade et dans l'étude.
Intergen51. mja. Les intercalaires tRNA-tRNA extra bloc[modifier | modifier le wikicode]
- Lien tableur: Intergen51. mja. Les intercalaires tRNA-tRNA extra bloc
- Voir mfe
mja intercalaires entre cds[modifier | modifier le wikicode]
- Lien NCBI [8] 9.4.20
- Note: Pour les génomes des annexes j'ai relevé les intercalaires entre tRNAs et entre ceux-ci et les cds qui leur sont adjacents. L'exemple est celui de rru du clade alpha. L'idée de départ de ces prélèvements est la recherche d'opérons formés de tRNA et de protéine comme dans le cas d'E.coli: l'intercalaire entre le tRNA et la protéine devrait être faible. Voir l'exemple d'eco (remarque @3) avec tac-tac-tpr et aca-tac-gga-acc-tufB.
mja intercalaires positifs S+[modifier | modifier le wikicode]
- Lien tableur: mja intercalaires positifs S+
- Diagrammes 400: mja pmg, diagramme 1-40: c+ mja c+ pmg x+ pmg total, texte: pmg.
- Légende du tableau diagrammes 400: voir la légende de cvi.
mja | Sx+ | Sc+ | ||||||||||||
Poly3 | -7 | -5 | -3 | 1 | R2 | flex x+ | comment. | -7 | -5 | -3 | 1 | R2 | flex c+ | comment. |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
1 à 400 | -16 | 150 | -532 | 77 | 660 | 313 | min50 | -94 | 719 | -1762 | 147 | 856 | 255 | min40 |
31 à 400 | 47 | -300 | 424 | 21 | 711 | 213 | 2 parties | -6.2 | 87 | -410 | 65 | 964 | 468 | 2 parties |
droite | -a | cste | - | R2 | note | R2’ | -a | cste | - | R2 | note | R2’ | ||
1 à 400 | 154 | 57 | - | 582 | poly | 78 | SF | 227 | 71 | 537 | poly | 319 | SF | |
31 à 400 | 115 | 46 | - | 623 | poly | 88 | tF | 128 | 44 | - | 859 | poly | 105 | SF |
- Légende du tableau des corrélations
effectifs diagramme | corrélation x+ c+, 41-n | corrélation x+ c+, 1-n | |||||||||
gen | minima | x+ | c+ | total | 400 | 200 | 250 | diff | 200 | 250 | 400 |
---|---|---|---|---|---|---|---|---|---|---|---|
rru | min40 | 874 | 2056 | 2930 | 829 | 193 | 611 | 418 | 722 | 792 | 861 |
mja | min30 | 406 | 1047 | 1453 | 776 | 326 | 571 | 245 | 844 | 857 | 881 |
ant | min40 | 601 | 1616 | 2217 | 730 | 271 | 538 | 267 | 892 | 886 | 876 |
1-30 ‰ | effectifs | 0 ‰ | <0 ‰ | effectifs 1-40 | corel | ||||||
1-30 x+ | 1-30 c+ | x+/c+ | x | c | x | c | x- | c- | x+ | c+ | x+/c+ |
169 | 266 | 0.64 | 1037 | 2749 | 1 | 4 | 71 | 222 | 175 | 630 | 17 |
239 | 405 | 0.59 | 495 | 1234 | 20 | 9 | 113 | 132 | 113 | 474 | 502 |
281 | 485 | 0.58 | 714 | 2381 | 13 | 24 | 116 | 285 | 186 | 836 | 575 |
- Diagrammes 400: mja pmg, diagramme 1-40: c+ mja c+ pmg x+ pmg total, texte: pmg.
- Résumé: Ici je ne compare que les 2 génomes mja et pmg en sachant que pub est semblable à pmg. Car mja et pmg se ressemblent beaucoup avec des effectif des diagrammes 400 égaux, 1 454 contre 1453, et un rapport des fréquences faibles c+/x+ presque égaux, 0.59 contre 0.76. Par contre les corrélations à 41-250 sont très différentes, 571 contre 802.
- - La forme des courbes 400: Les 4 courbes de mja sont identiques une à une aux 4 courbes de pmg, seule la force de mja x+ 31-400 est légèrement supérieure, 88, à celle de pmg de la même courbe, 48.
- Les 2 courbes, c+ 1-400 mja pmg, sont SF avec R2’ 319 368.
- Les 2 courbes, x+ 1-400 mja pmg, sont SF avec R2’ 78 257.
- Les 2 courbes x+ 31-400 sont des tildes forts avec un R2’ de mja supérieur à celui de pmg noté quand même tm, 88 contre 48. Les 2 parties sont bien nettes.
- Les 2 courbes c+ 31-400 sont SF avec R2’ 105 286. Les 2 parties sont bien nettes. Il faut noter que les 2 SF de mja, c+ 31-400 et x+ 1-400, sont plus faibles que ceux de pmg, 105-78 contre 286-257.
- Les points d’inflexion des SF sont compris entre 255 et 313, 468 pour mja c+ 1-400. Les 2 tildes ont leurs points d’inflexion presque identiques 213 contre 180.
- - Les corrélations des courbes 400: C’est la différence la plus importante entre les 2 génômes.
- Chez pmg la corrélation 41-250, de 802 chute à 728 pour 41-200 avec une différence de 74. Et mja en parallèle passe de 571 à 326 avec une différence de 245.
- Par contre les 3 corrélations 1-n se comportent de la même façon chez les 2 génomes, elles augmentent fortement autour de 850 pour mja et 900 pour pmg.
- - Les fréquences faibles 1-30:
- Elles sont du même ordre de grandeur et dans des rapports x+/c+ élevés: 239/405 pour mja et 326/430 pour pmg, donnant les rapports respectifs 0.58 0.76.
- Elles sont réparties sur les 2 fréquences 10 20 dans les 4 courbes 1-400 des 2 génomes.
- Les minima des fréquences faibles: elles sont bien prononcées chez les 2 génomes x+ 1-400 et faiblement chez les 2 aussi dans c+ 1-400.
- Les fréquences des zéros sont moyens mais plus élevées chez pmg avec 46‰ que chez mja avec 29‰.
- Les fréquences négatives sont réparties entre x- et c- de la même façon chez les 2 génômes: 128/144 pour ade et 113/132 pour mja.
- - La forme des courbes 1-40:
- La courbe c+1-40: Les effectifs sont moyens, 449 pour pmg contre 474 pour mja. La courbe de mja est plus proche du total que pmg avec un excès à la fréquence 4. La courbe de pmg est moins nette à cause d’un excès à la fréquence 6. J’ai ajouté pour chaque génome un diagramme sans la fréquence en excès. La courbe de pmg ressemble alors à celle du total.
- La courbe x+1-40: Les 2 courbes sont différentes du modèle. Il y a un excès à la fréquence 6 et un creux profond à 11, et la bosse du 10 et très petite par rapport au modèle.Il faut que je publie la courbe de mja avec un effectif de 113. Les 2 courbes ont à peu près la même allure décroissante et les mêmes défauts par rapport au modèle.
- - Les corrélations des courbes 1-40: Les corrélations x+/c+ sont fortes pour les 2 génomes ce qui explique l’augmentation chez tous les 2 de celles des 3 plages de fréquences 1-n.
- - La forme des courbes 400: Les 4 courbes de mja sont identiques une à une aux 4 courbes de pmg, seule la force de mja x+ 31-400 est légèrement supérieure, 88, à celle de pmg de la même courbe, 48.
mja autres intercalaires[modifier | modifier le wikicode]
- Lien tableur: mja autres intercalaires aas
- Légende:
- - comp, le gène est sur le brin complement
- - deb, fin sont respectivement dans le sens des adresses croissantes, le cds avant le 1er tRNA et le cds après le dernier tRNA du bloc.
- Totaux: 15 repeat_region et 1 ncRNA
tRNA-cds tRNA-tRNA autres-cds total c+ x+ x- c+ x+ c- c+ x+ c- 26 20 19 2 15 17 99
- Méthode de calculs des intercalaires autres que les CDS-CDS voir le cas de amed.
Methanosarcina barkeri str. Fusaro[modifier | modifier le wikicode]
mba opérons[modifier | modifier le wikicode]
- Lien tableur: mba opérons
- Liens: gtRNAdb [9], NCBI [10], génome [11]
- Phylogénie: Archaea; Euryarchaeota; Stenosarchaea group; Methanomicrobia; Methanosarcinales; Methanosarcinaceae; Methanosarcina.
- Légende: cdsa: cds aas, cdsd: cds dirigé
39.2%GC | 2.2.20 Paris | 62 | doubles | intercal | cds | aa | avec aa | cdsa | cdsd | protéines |
---|---|---|---|---|---|---|---|---|---|---|
91192..91938 | cds | 137 | 137 | 249 | DUF429 domain-containing protein | |||||
comp | 92076..92160 | ctc | + | 132 | 132 | |||||
comp | 92293..92377 | ctc | 2 ctc | 298 | 298 | |||||
comp | 92676..93476 | cds | 267 | DNA-directed RNA polymerase subunit D | ||||||
comp | 98630..99337 | cds | 535 | 535 | 236 | ABC transporter ATP-binding protein | ||||
comp | 99873..99955 | tcc | 222 | 222 | ||||||
comp | 100178..101194 | cds | 339 | RNA-guided pseudouridylation complex pseudouridine synthase subunit Cbf5 | ||||||
comp | 146979..147518 | cds | 80 | 80 | 180 | tyrosine-type recombinase/integrase | ||||
comp | 147599..147670 | acc | 198 | 198 | ||||||
comp | 147869..148381 | cds | 171 | DUF98 domain-containing protein | ||||||
comp | 199345..200268 | cds | 492 | 492 | 308 | aldolase | ||||
comp | 200761..200833 | aac | + | 71 | 71 | |||||
comp | 200905..200979 | atgi | 2 aac | 119 | 119 | |||||
comp | 201099..201171 | aac | 964 | 964 | ||||||
202136..202366 | cds | 77 | hp | |||||||
260990..261532 | cds | 173 | 173 | 181 | nitroreductase family protein" | |||||
261706..261777 | cgg | 673 | 673 | |||||||
262451..262960 | cds | 170 | hp | |||||||
comp | 463836..464723 | cds | 2075 | 2075 | 296 | polyprenyl synthetase family protein | ||||
466799..466870 | gga | 94 | 94 | |||||||
466965..467049 | cta | 221 | 221 | |||||||
comp | 467271..468818 | cds | 516 | MBL fold metallo-hydrolase | ||||||
473154..473723 | cds | 298 | 298 | 190 | hp | |||||
comp | 474022..474096 | gag | 246 | 246 | ||||||
comp | 474343..475584 | cds | 414 | proteasome-activating nucleotidase | ||||||
comp | 692109..692987 | cds | 349 | 349 | 293 | branched-chain-amino-acid transaminase | ||||
693337..693411 | aga | 400 | 400 | |||||||
comp | 693812..694420 | cds | 203 | sulfite exporter TauE/SafE family protein | ||||||
comp | 703446..703958 | cds | 488 | 488 | 171 | biotin transporter BioY | ||||
704447..704521 | agg | 283 | 283 | |||||||
704805..705284 | cds | 160 | N-acetyltransferase | |||||||
comp | 800463..800642 | cds | 799 | 799 | 60 | hp | ||||
comp | 801442..801526 | agc | 137 | 137 | ||||||
comp | 801664..801978 | ncRNA | @1 | 327 | 327 | 315 | ||||
802306..803931 | cds | 542 | methylamine methyltransferase corrinoid protein reductive activase | |||||||
1109819..1110013 | cds | 15 | 15 | 65 | hp | |||||
1110029..1110103 | atgf | + | 63 | 63 | ||||||
1110167..1110241 | atgf | 3 atg | 63 | 63 | ||||||
1110305..1110379 | atgf | 273 | 273 | |||||||
1110653..1111984 | cds | 444 | signal recognition particle protein | |||||||
comp | 1134460..1135074 | cds | 235 | 235 | 205 | endonuclease III | ||||
comp | 1135310..1135381 | tgc | + | 65 | 65 | |||||
comp | 1135447..1135518 | tgc | 2 tgc | 126 | 126 | |||||
comp | 1135645..1136277 | cds | 211 | hp | ||||||
1137210..1137680 | cds | 488 | 488 | 157 | P-bacterioferritin | |||||
comp | 1138169..1138290 | 5s | 129 | 122 | ||||||
comp | 1138420..1141252 | 23s | 222 | 2833 | ||||||
comp | 1141475..1142963 | 16s | 830 | 830 | 1489 | |||||
1143794..1145302 | cds | 503 | 2-isopropylmalate synthase | |||||||
comp | 1249870..1250040 | cds | 423 | 423 | 57 | CopG family transcriptional regulator | ||||
comp | 1250464..1250537 | aag | 546 | 546 | ||||||
1251084..1251290 | cds | 69 | TRAM domain-containing protein | |||||||
1315521..1315691 | cds | @2 | -12 | -12 | 57 | hp | ||||
comp | 1315680..1315751 | cgc | 174 | 174 | ||||||
1315926..1317110 | cds | 395 | redox-regulated ATPase YchF | |||||||
<comp | 1514831..1515373 | cds | 1133 | 1133 | 181 | ArsR family transcriptional regulator | ||||
1516507..1516579 | caa | 760 | 760 | |||||||
comp | 1517340..1517663 | cds | 108 | hp | ||||||
comp | 1538879..1539286 | cds | 36 | 36 | 136 | sensor histidine kinase | ||||
comp | 1539323..1539395 | other | @3 | 1249 | 1249 | 73 | ||||
>comp | 1540645..1540794 | cds | 50 | PKD domain-containing protein | ||||||
comp | 1546247..1547791 | cds | 576 | 576 | 515 | aminotransferase class V-fold PLP-dependent enzyme | ||||
comp | 1548368..1548441 | aca | 448 | 448 | ||||||
< | 1548890..1549093 | cds | 68 | matrixin family metalloprotease | ||||||
1550566..1550760 | cds | 745 | 745 | 65 | DeoR family transcriptional regulator | |||||
comp | 1551506..1551579 | aca | 506 | 506 | ||||||
1552086..1552640 | cds | 185 | YkgJ family cysteine cluster protein | |||||||
1621639..1622835 | cds | 433 | 433 | 399 | methionine adenosyltransferase | |||||
1623269..1623384 | tac | @4 | 112 | 112 | ||||||
1623497..1623569 | gac | 300 | 300 | |||||||
comp | 1623870..1624067 | cds | 66 | hp | ||||||
1714788..1715069 | cds | 154 | 154 | 94 | hp | |||||
comp | 1715224..1715295 | acg | 187 | 187 | ||||||
comp | 1715483..1716493 | cds | 337 | class I SAM-dependent methyltransferase family protein | ||||||
comp | 1755811..1755993 | cds | 113 | 113 | 61 | DNA-directed RNA polymerase subunit K | ||||
comp | 1756107..1756181 | ccg | @5 | 0 | 0 | |||||
comp | 1756182..1756370 | cds | 63 | DNA-directed RNA polymerase subunit N | ||||||
1842058..1842195 | cds | 16 | 16 | 46 | hp | |||||
comp | 1842212..1842285 | gtg | 717 | 717 | ||||||
1843003..1843767 | cds | 255 | peptidase A24 | |||||||
comp | 1852573..1852896 | cds | 1364 | 1364 | 108 | PadR family transcriptional regulator | ||||
comp | 1854261..1854338 | ccc | 198 | 198 | ||||||
comp | 1854537..1855097 | cds | 187 | CDP-alcohol phosphatidyltransferase family protein | ||||||
comp | 1908225..1908989 | cds | 349 | 349 | 255 | hp | ||||
comp | 1909339..1909530 | tgg | 445 | 445 | ||||||
> | 1909976..1910152 | cds | 59 | nitrogenase reductase | ||||||
1926717..1927178 | cds | 183 | 183 | 154 | DUF4145 domain-containing protein | |||||
comp | 1927362..1927445 | tcg | 125 | 125 | ||||||
comp | 1927571..1928944 | cds | 458 | endonuclease Q family protein | ||||||
comp | 2005431..2007053 | cds | 2315 | 2315 | 541 | PKD domain-containing protein | ||||
comp | 2009369..2009443 | cca | 199 | 199 | ||||||
comp | 2009643..2010194 | cds | 184 | UbiX family flavin prenyltransferase | ||||||
comp | 2026807..2028456 | cds | 314 | 314 | 550 | ATP-dependent DNA ligase | ||||
2028771..2028842 | ggg | 513 | 513 | |||||||
comp | 2029356..2029766 | cds | 137 | PaaI family thioesterase | ||||||
2157926..2158684 | cds | 567 | 567 | 253 | hp | |||||
2159252..2159362 | atgj | 349 | 349 | |||||||
2159712..2160225 | cds | 171 | amidohydrolase family protein | |||||||
comp | 2194967..2195302 | cds | 713 | 713 | 112 | translation initiation factor eIF-1A | ||||
2196016..2197504 | 16s | 222 | 1489 | |||||||
2197727..2200559 | 23s | 129 | 2833 | |||||||
2200689..2200810 | 5s | 607 | 607 | 122 | ||||||
comp | 2201418..2201615 | cds | 66 | hp | ||||||
>comp | 2434335..2434609 | cds | 603 | 603 | 92 | nucleoside deaminase | ||||
comp | 2435213..2435284 | gcc | 223 | 223 | ||||||
2435508..2435584 | atc | + | 74 | 74 | ||||||
2435659..2435735 | atc | 2 atc | 241 | 241 | ||||||
comp | 2435977..2436390 | cds | 138 | transcriptional regulator | ||||||
2622097..2624025 | cds | 1489 | 1489 | 643 | replication factor C large subunit | |||||
2625515..2625588 | gta | 1102 | 1102 | |||||||
2626691..2626918 | cds | 76 | hp | |||||||
2650514..2651296 | cds | 164 | 164 | 261 | thiazole biosynthesis protein | |||||
2651461..2651532 | cac | 218 | 218 | |||||||
2651751..2653460 | cds | 570 | radical SAM protein | |||||||
2663547..2664668 | cds | 318 | 318 | 374 | PGF-pre-PGF domain-containing protein | |||||
comp | 2664987..2665058 | ggc | 263 | 263 | ||||||
2665322..2666563 | cds | 414 | hp | |||||||
2856552..2857409 | cds | 134 | 134 | 286 | hp | |||||
comp | 2857544..2857628 | tca | 153 | 153 | ||||||
comp | 2857782..2858546 | cds | 255 | peptidylprolyl isomerase | ||||||
3326036..3326557 | cds | 539 | 539 | 174 | hp | |||||
3327097..3327168 | tgc | 995 | 995 | |||||||
3328164..3328898 | cds | 245 | hp | |||||||
3994472..3994921 | cds | 514 | 514 | 150 | IS200/IS605 family transposase | |||||
comp | 3995436..3995529 | cga | 477 | 477 | ||||||
3996007..3996714 | cds | 236 | hp | |||||||
4005709..4006026 | cds | 269 | 269 | 106 | divalent-cation tolerance protein CutA | |||||
4006296..4006378 | ttg | 860 | 860 | |||||||
4007239..4009012 | rpr | @6 | 169 | 169 | 1774 | Family CRISPR | ||||
comp | 4009182..4009478 | cds | 99 | CRISPR-associated endonuclease Cas2 | ||||||
comp | 4031590..4031871 | cds | 1075 | 1075 | 94 | hp | ||||
4032947..4033019 | cag | 182 | 182 | |||||||
comp | 4033202..4033765 | cds | 188 | hp | ||||||
comp | 4041205..4041960 | cds | 96 | 96 | 252 | MBL fold metallo-hydrolase | ||||
4042057..4042141 | tta | 375 | 375 | |||||||
comp | 4042517..4044976 | cds | 820 | beta-propeller fold lactonase family protein | ||||||
comp | 4045359..4048274 | cds | 718 | 718 | 972 | PKD domain-containing protein | ||||
4048993..4049077 | tta | 35 | 35 | |||||||
comp | 4049113..4052403 | cds | 241 | 241 | 1097 | PGF-pre-PGF domain-containing protein | ||||
4052645..4052729 | tta | 177 | 177 | |||||||
comp | 4052907..4053395 | cds | 163 | MarR family transcriptional regulator | ||||||
4407561..4407830 | cds | 64 | 64 | 90 | elongation factor 1-beta | |||||
4407895..4407966 | gcg | 675 | 675 | |||||||
comp | 4408642..4409715 | cds | 358 | radical SAM protein | ||||||
comp | 4504139..4504300 | cds | 536 | 536 | 54 | hp | ||||
comp | 4504837..4504921 | ctg | 220 | 220 | ||||||
comp | 4505142..4506050 | cds | 303 | ornithine carbamoyltransferase | ||||||
comp | 4551177..4551851 | cds | 566 | 566 | 225 | MBL fold metallo-hydrolase | ||||
4552418..4552491 | gtc | + | 94 | 94 | ||||||
4552586..4552660 | ttc | 2 gtc | 7 | 7 | ||||||
4552668..4552739 | ggc | 2 ttc | 61 | 61 | ||||||
4552801..4552874 | gtc | 2 ggc | 94 | 94 | ||||||
4552969..4553043 | ttc | 7 | 7 | |||||||
4553051..4553122 | ggc | 717 | 717 | |||||||
4553840..4554052 | cds | 71 | MoaD/ThiS family protein | |||||||
4617920..4618339 | cds | 200 | 200 | 140 | hp | |||||
4618540..4618617 | gaa | 351 | 351 | |||||||
4618969..4619190 | cds | 377 | 377 | 74 | hp | |||||
4619568..4619645 | gaa | 214 | 214 | |||||||
comp | 4619860..4620678 | cds | 273 | hp | ||||||
4673041..4673643 | cds | 289 | 289 | 201 | adenosylcobinamide amidohydrolase | |||||
comp | 4673933..4674054 | 5s | 129 | 122 | ||||||
comp | 4674184..4677016 | 23s | 135 | 2833 | ||||||
comp | 4677152..4677224 | gca | 79 | |||||||
comp | 4677304..4678792 | 16s | 1242 | 1242 | 1489 | |||||
4680035..4680817 | cds | 261 | methanol-5-hydroxybenzimidazolylcobamide methyltransferase | |||||||
comp | 4759174..4759410 | cds | 89 | 89 | 79 | DNA-directed RNA polymerase subunit H | ||||
comp | 4759500..4759576 | aaa | 655 | 655 | ||||||
comp | 4760232..4760801 | cds | 190 | DJ-1/PfpI family protein |
mba cumuls[modifier | modifier le wikicode]
- Lien tableur: mba cumuls
opérons | Fréquences intercalaires tRNAs | Fréquences intercalaires cds | Fréquences aas cds chromosome | ||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
effectif | gammes | sans rRNAs | avec rRNAs | gammes | cds | gammes | cdsd | gammes | cdsa | gammes | cdsa 300 | ||
avec rRNA | opérons | 3 | 1 | 0 | - | 1 | 2 | 1 | 100 | 25 | 30 | 0 | |
16 23 5s 0 | 2 | 20 | 2 | 50 | 4 | 20 | 200 | 27 | 60 | 7 | |||
16 gca 235 | 1 | 40 | 0 | 100 | 4 | 40 | 300 | 21 | 90 | 14 | |||
16 23 5s a | 0 | 60 | 0 | 150 | 6 | 60 | 400 | 8 | 120 | 8 | |||
max a | 1 | 80 | 6 | 200 | 14 | 80 | 500 | 4 | 150 | 5 | |||
a doubles | 0 | 100 | 3 | 250 | 9 | 100 | 600 | 7 | 180 | 10 | |||
autres | 0 | 120 | 2 | 300 | 8 | 120 | 700 | 1 | 210 | 11 | |||
total aas | 1 | 140 | 1 | 350 | 6 | 140 | 800 | 0 | 240 | 4 | |||
sans | opérons | 44 | 160 | 0 | 400 | 4 | 160 | 900 | 1 | 270 | 10 | ||
1 aa | 37 | 180 | 0 | 450 | 4 | 180 | 1000 | 1 | 300 | 4 | |||
max a | 6 | 200 | 0 | 500 | 4 | 200 | 1100 | 1 | 330 | 2 | |||
a doubles | 6 | 1 | 35 | 0 | 21 | ||||||||
total aas | 61 | 15 | 0 | 100 | 0 | 96 | 96 | ||||||
total aas | 62 | ||||||||||||
remarques | 6 | ||||||||||||
avec jaune | moyenne | 85 | 457 | 240 | |||||||||
variance | 52 | 407 | 194 | ||||||||||
sans jaune | moyenne | 51 | 210 | 186 | 158 | ||||||||
variance | 28 | 98 | 106 | 78 |
mba blocs[modifier | modifier le wikicode]
- Lien tableur: mba blocs
cds | 289 | 201 | adenosylcobinamide amidohydrolase |
5s | 129 | 122 | |
23s | 135 | 2833 | |
gca | 79 | ||
16s | 1242 | 1489 | |
cds | 261 | methanol-5-hydroxybenzimidazolylcobamide methyltransferase | |
cds | 713 | 112 | translation initiation factor eIF-1A |
16s | 222 | 1489 | |
23s | 129 | 2833 | |
5s | 607 | 122 | |
cds | 66 | hp | |
cds | 488 | 157 | P-bacterioferritin |
5s | 129 | 122 | |
23s | 222 | 2833 | |
16s | 830 | 1489 | |
cds | 503 | 2-isopropylmalate synthase |
mba remarques[modifier | modifier le wikicode]
- Lien tableur: mba remarques
- Remarques un génome avec beaucoup de doubles dont une séquence de 3 aas.
- @ ncRNA, dans le même ques l que’aa, taille de 315 pbs.
- @ intercalaire négatif du au changement de sens
- @ un autre aa, other
- @ 4 introns
- - tac 1623269..1623304,1623349..1623384
- - tgg 1909339..1909374,1909493..1909530
- - atgj 2159252..2159289,2159327..2159362
- - cga 3995436..3995470,3995491..3995529
- @ un intercalaire nul sans changement de sens
- @ rpr, repeat région famille CRISPR, assez grand 1774 pbs. Dans le même sens que l’aa.
- Séquence des doubles: 6 clusters avec des doubles dont une séquence de 3 aas et un triplet.
- - 2 doublets seuls ctc tgc
- - gcc 2atc
- - aac atgi aac
- - 3 atgf
- - 2 (gtc ttc ggc)
- Tableau du code génétique de mba
- Légende: prélèvement de la base gtRNAdb le 2.2.20
- - totaux en en-tête, 62 total de gtRNAdb contenant des pseudo et inconnus; 62 total du cumul.
- - atgi, c'est Ile2, mis à la place de ttt, très rare chez les procaryotes.
- - atgf, c'est Metf, mis à la place de tgt, très rare chez les procaryotes.
- - atgj, c'est Met, remplace le atg standard qui est la somme Ile2 Metf Met.
- - Voir la légende des tris et couleurs, g1 t1.
- Légende: prélèvement de la base gtRNAdb le 2.2.20
g1 | t1 | 62 | 62 | ||||
---|---|---|---|---|---|---|---|
atgi | 1 | tct | tat | atgf | 3 | ||
att | act | aat | agt | ||||
ctt | cct | cat | cgt | ||||
gtt | gct | gat | ggt | ||||
ttc | 2 | tcc | 1 | tac | 1 | tgc | 4 |
atc | 2 | acc | 1 | aac | 2 | agc | 1 |
ctc | 2 | ccc | 1 | cac | 1 | cgc | 1 |
gtc | 2 | gcc | 1 | gac | 1 | ggc | 3 |
tta | 3 | tca | 1 | taa | tga | ||
ata | aca | 2 | aaa | 1 | aga | 1 | |
cta | 1 | cca | 1 | caa | 1 | cga | 1 |
gta | 1 | gca | 1 | gaa | 2 | gga | 1 |
ttg | 1 | tcg | 1 | tag | tgg | 1 | |
atg | 1 | acg | 1 | aag | 1 | agg | 1 |
ctg | 1 | ccg | 1 | cag | 1 | cgg | 1 |
gtg | 1 | gcg | 1 | gag | 1 | ggg | 1 |
- intercalaires élevés avec le cds 43/100
1315680 cgc -12 comp 1756107 ccg 0 1250464 aag 423 1623269 tac 433 1909339 tgg 445 comp 1548368 aca 448 comp 3995436 cga 477 comp 704447 agg 488 comp 1138169 5s 488 comp 200761 aac 492 1551506 aca 506 comp 2028771 ggg 513 comp 3995436 cga 514 comp 99873 tcc 535 4504837 ctg 536 3327097 tgc 539 1250464 aag 546 comp 4552418 gtc 566 comp 2159252 atgj 567 1548368 aca 576 2435213 gcc 603 2200689 5s 607 comp 4759500 aaa 655 261706 cgg 673 4407895 gcg 675 comp 2194967 16s 713 comp 1842212 gtg 717 comp 4553840 ggc 717 4048993 tta 718 comp 1551506 aca 745 comp 1516507 caa 760 comp 801442 agc 799 1141475 16s 830 comp 4006296 ttg 860 201099 aac 964 comp 3327097 tgc 995 4032947 cag 1075 comp 2625515 gta 1102 1516507 caa 1133 comp 4677304 16s 1242 comp 1539323 other 1249 1854261 ccc 1364 2625515 gta 1489 466799 gga 2075 2009369 cca 2315 moyenne 795 écart 415
- intercalaires élevés entre aas
ttc-ggc 7 ttc-ggc 7 ggc-gtc 61 atgf-atgf 63 atgf-atgf 63 tgc-tgc 65 aac-atgi 71 atc-atc 74 -- -- gga-cta 94 gtc-ttc 94 gtc-ttc 94 tac-gac 112 intron atgi-aac 119 intron ctc-ctc 132 gcc-atc 223
mba distribution[modifier | modifier le wikicode]
- Lien tableur: mba distribution
- Notes
- - 9 duplicata: atc2 ctc2 atgf3 tgc2
g1 | t1 | ||||||
---|---|---|---|---|---|---|---|
atgi | 1 | tct | tat | atgf | 3 | ||
att | act | aat | agt | ||||
ctt | cct | cat | cgt | ||||
gtt | gct | gat | ggt | ||||
ttc | 2 | tcc | 1 | tac | 1 | tgc | 3 |
atc | 2 | acc | 1 | aac | 2 | agc | 1 |
ctc | 2 | ccc | 1 | cac | 1 | cgc | 1 |
gtc | 2 | gcc | 1 | gac | 1 | ggc | 3 |
tta | 3 | tca | 1 | taa | tga | ||
ata | aca | 2 | aaa | 1 | aga | 1 | |
cta | 1 | cca | 1 | caa | 1 | cga | 1 |
gta | 1 | gca | 1 | gaa | 2 | gga | 1 |
ttg | 1 | tcg | 1 | tag | tgg | 1 | |
atgj | 1 | acg | 1 | aag | 1 | agg | 1 |
ctg | 1 | ccg | 1 | cag | 1 | cgg | 1 |
gtg | 1 | gcg | 1 | gag | 1 | ggg | 1 |
arch | >1aa | =1aa | -5s | +5s | -16s | +16s | total |
mba | 23 * | 37 * | 1 | 61 |
mba. Intergen51[modifier | modifier le wikicode]
Intergen51. mba. Le génome[modifier | modifier le wikicode]
- mba Le prélèvement: Acbn
- Le nom et le lien NCBI: mba, Methanosarcina barkeri str. Fusaro, NCBI [12], date 17.12.20.
- mba La longueur totale des intercalaires, longueur du génome et taux intercalaires/génome:
Nom intercals génome taux en % mba 1,341,425 4,837,408 27.7
mba données intercalaires[modifier | modifier le wikicode]
- Lien tableur: mba données intercalaires
- Lien sauvegarde NCBI: Acbn
mba autres intercalaires aas[modifier | modifier le wikicode]
- Lien tableur: mba autres intercalaires aas
- Lien sauvegarde NCBI: Acbn
Intergen51. mba. Les différents types d'intercalaires[modifier | modifier le wikicode]
- Lien au tableur: Intergen51. mba les différents types d'intercalaires.
- Légende:
- - S pour intercalaire CDS-CDS et R pour tRNA-CDS,
- - c pour intercalaire continu (les 2 gènes sont sur le même brin) et x pour discontinu (les 2 gènes sont sur 2 brins différents, le brin et son complément)
- - %reste = 100*reste/total, le reste étant ce qui reste du total après la fin du diagramme, gamme.
- - %t30 = 100*t30/total, t30 étant le total des fréquences 10 20 30
- - %t5 = 100*t/total, t5 étant le total des fréquences de -1 à -5 dans le diagramme des S-.
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
Intergen51. mba. Les diagrammes CDS-CDS positifs[modifier | modifier le wikicode]
- Lien tableur: Les diagrammes
- Diagrammes des gamma: mba présente 2 diagrammes
- - fc40, CDS-CDS continu, fréquence unitaire en abscisses et effectif en ordonnées
- - fx%, CDS-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et pourcentage en ‰ par rapport au total, en ordonnées.
- Équations des courbes de tendance en pour 1000: colonnes %fx %fc
Courbes de tendances pour les diagrammes en pour 1000 Calculs des f.41 mba R2 x3 x2 x c Inflexion poly3 x c 0.351 2.63E-07 -3.94E-04 1.23E-01 6.43 fx1 abscisse 347.8 246.6 0.821 -3.44E-06 2.49E-03 5.76E-01 55.6 fc1 ordonnée 11.0 13.3 0.304 6.70E-07 -6.99E-04 1.93E-01 1.78 fx41 0.739 -7.30E-07 5.40E-04 -1.58E-01 30.4 fc41
Intergen51. mba. Les CDS-CDS négatifs[modifier | modifier le wikicode]
Sous-totaux mba totale fréquence x- c- x- c- - 1 0 33 4 4140 - 2 2 0 85 11 - 3 0 2 3 12 - 4 3 117 717 10938 - 5 1 0 5 19 sp6 16 155 1642 8424 total 22 307 2,456 23,544 reste 3 6 264 420 s6 2 7 361 41 s7 2 34 321 1438 s8 9 108 696 6525 rappot s1-5 4/2/1 1.5 3.5 8.4 2.6 % / sp6 s6/sp6 12.5 4.5 22.0 0.5 s7/sp6 12.5 21.9 19.5 17.1 s8/sp6 56.3 69.7 42.4 77.5 reste/sp6 18.8 3.9 16.1 5.0 total s1-5 6 152 814 15120 % / total %s1-5 27.3 49.5 33.1 64.2 %sp6 72.7 50.5 66.9 35.8
Intergen51. mba. Les intercalaires des blocs[modifier | modifier le wikicode]
- Le détail
RNA-RNA c x CDS-RNA c x 23s 5s 3 CDS 16s 3 16s 23s 2 5s CDS 3 16s tRNA 1 16 CDS tRNA 23s 1 CDS 5s 5s tRNA 23s CDS tRNA in CDS 23s tRNA contig 5s 16s tRNA hors 15 16s16s tRNA 16s 23s tRNA tRNA 5s 16s 5s 5s 23s 5s 5s total 22 0 total 0 6
- Les rares voir gamma pour la longueur des intercalaires
- Les tRNA-CDS compris, comparaison dans le clade et dans l'étude.
Intergen51. mba. Les intercalaires tRNA-tRNA extra bloc[modifier | modifier le wikicode]
- Lien tableur: Intergen51. mba. Les intercalaires tRNA-tRNA extra bloc
- Voir mfe
mba intercalaires entre cds[modifier | modifier le wikicode]
- Lien NCBI [13] 17.12.20
- Note: Pour les génomes des annexes j'ai relevé les intercalaires entre tRNAs et entre ceux-ci et les cds qui leur sont adjacents. L'exemple est celui de rru du clade alpha. L'idée de départ de ces prélèvements est la recherche d'opérons formés de tRNA et de protéine comme dans le cas d'E.coli: l'intercalaire entre le tRNA et la protéine devrait être faible. Voir l'exemple d'eco (remarque @3) avec tac-tac-tpr et aca-tac-gga-acc-tufB.
mba intercalaires positifs S+[modifier | modifier le wikicode]
- Lien tableur: mba intercalaires positifs S+
- Diagrammes 400: mba cbei mba 600 , diagramme 1-40: c+ mba c+ cbei total, texte: cbei.
- Légende: voir la légende de cvi.
mba | Sx+ | Sc+ | ||||||||||||
Poly3 | -7 | -5 | -3 | 1 | R2 | flex x+ | comment. | -7 | -5 | -3 | 1 | R2 | flex c+ | comment. |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
1 à 400 | 4.9 | -71 | 219 | 11 | 350 | 483 | min10 | -50 | 359 | -832 | 80 | 823 | 239 | min50 |
1 à 600 | 5.8 | -62 | 170 | 7.4 | 465 | 354 | 2 parties | -6.7 | 100 | -498 | 10 | 789 | 495 | 2 parties |
droite | -a | cste | - | R2 | note | R2’ | -a | cste | - | R2 | note | R2’ | ||
1 à 400 | 2 | 25 | - | 1 | poly | 348 | tF | 104 | 46 | 536 | poly | 287 | SF | |
1 à 600 | 14 | 20 | - | 146 | poly | 309 | tF | 80 | 59 | - | 580 | poly | 209 | SF |
- Légende du tableau des corrélations et des fréquences faibles
effectifs diagramme | corrélation x+ c+, 41-n | corrélation x+ c+, 1-n | |||||||||
gen | minima | x+ | c+ | total | 400 | 200 | 250 | diff | 200 | 250 | 400 |
---|---|---|---|---|---|---|---|---|---|---|---|
afn | min10 | 328 | 1322 | 1650 | 607 | -17 | 108 | 125 | -467 | -407 | -8 |
mba | min10 | 705 | 1651 | 2356 | 154 | -330 | -221 | 109 | -512 | -477 | -223 |
cbei | min10 | 950 | 3395 | 4345 | 402 | -509 | -375 | 134 | -649 | -648 | -290 |
1-30 ‰ | effectifs | 0 ‰ | <0 ‰ | effectifs 1-40 | corel | ||||||
1-30 x+ | 1-30 c+ | x+/c+ | x | c | x | c | x- | c- | x+ | c+ | x+/c+ |
46 | 402 | 0.11 | 350 | 1688 | 6 | 5 | 11 | 180 | 36 | 580 | -369 |
45 | 214 | 0.21 | 1255 | 2688 | 1 | 8 | 18 | 114 | 51 | 428 | -74 |
26 | 244 | 0.11 | 1212 | 4400 | 0 | 4 | 8 | 89 | 35 | 954 | 272 |
- Diagrammes 400: mba cbei mba 600 , diagramme 1-40: c+ mba c+ cbei total, texte: cbei.
- Résumé: J’ai classé les 21 génomes suivant la forme des diagrammes x+ 1-400. J’ai obtenu 3 groupes,
- Les tildes au nombre de 5. Ils sont réguliers et forts, tF, avec un R2’ supérieur à 138 pour 4 d’entre eux et scc avec 71. Ce sont, cbei mba pmq et blo scc.
- Les formes S au nombre de 6. Leurs forces (R2’) sont variables, ade rru Sf 20-39, ant mja Sm 70-78, pmg pub SF 179-249.
- Les diagrammes à pyramide, c’est à dire présentant une bosse avec 4 ou 5 points contigus. Ils sont au nombre de 10 dont 9 sont des tildes et bsu est un Sf très faible (R2’18). abra rtb spl afn sont des tF avec plus de 96, ase cbn cvi sont des tf avec moins de 30, eco myr sont des tm 43 68.
- - mba / cbei: mba est un génome bien particulier avec une courbe x+ 1-400 sous forme d’un demi cercle. En fait c’est un tilde très fort, tF, avec un R2’ de 348, mais aussi un R2 très faible de 350 montrant sa grande variabilité. Cbei lui ressemble par ces 2 paramètres mais cbei a un tilde bien dessiné avec un R2’ de 708 et un R2 de 712. J’ai montré que pmq qui est un tilde très fort avec un R2’ de 813 et qui appartient au groupe des tildes réguliers varie beaucoup moins que cbei avec un R2 de 878. Ces 3 génomes ressemblent beaucoup entre eux pour les autres paramètres aussi mais se différencient pour de blo et scc qui ont des taux élevés en faibles fréquences 1-30. La ressemblance de mba avec cbei et non avec pmq est accentuée par le reste des intercalaires (reste) non pris en compte dans les diagrammes x+ 1-400. Le rapport de ce reste pour mba cbei pmq est respectivement 0.75 0.33 0.16. Aussi je vais comparer mba et cbei sur 1-400 et 1-600 pour apprécier mieux la forme des courbes et leurs variabilités.
- - Les diagrammes 400
- x+ 1-400:
- + Les 2 courbes ont des taux peu élevés des fréquences faibles, 26‰ pour cbei et 45‰ pour mba à comparer à 89‰ de blo. Ensuite leur tilde est fort, 708 (R2 712 4) pour cbei contre 348 (R2 350 1). Les R2 montrent bien la régularité de cbei par rapport à mba, 712 contre 350.
- + Le point d’inflexion est normal pour cbei 269, par conre celui de mba est très élevé 483 du au reste de 527 (reste) non compris dans l’effectif de x- 1-400.
- c+ 1-400: Ce sont 2 courbes de formes S fort, SF, avec un R2’ de 213 pour cbei contre 287 et 2 points d’inflexion normaux, 245 pour cbei et 239 pour mba. Les fréquences faibles s’accumulent à la fréquence 20 pour cbei qui est un maximum, alors que pour mba elles sont étalées sur 10 et 20 avec le maximum à 10.
- x+ 31-400: Je n’ai pas représenté les courbes x+ 31-400 à cause des taux peu élevés des fréquences faibles 1-30, 26‰ pour cbei et 45‰ pour mba.
- c+ 31-400: La courbe cbei présente le plus faible R2’ des 21 génomes avec 8, ce qui la rend quasiment une droite et je n’arrive pas à distinguer une première partie en bosse comme pour les autres génomes, c’est pour ça que j’ai indiqué 1 partie en commentaire. La courbe de afn est un tilde moyen, tm, R2’ de 45 (904 859). Les points d’inflexion sont aussi différents, il est faible pour afn à 147 et très faible pour cbei à 38.
- x+ 1-400:
- - Les corrélations:
- Sur les plages 41-n: Les 2 corrélations sur 41-250 sont proches mais négatives, c’est à dire x+ et c+ s’opposent entre elles, -221 pour mba contre -377 pour cbei. Leurs comportements sont semblables quand on passe aux autres plages. Sur 41-200 leurs corrélations chutent avec à peu près la même différence (diff), 109 pour mba contre 133. La chute est aussi forte quand on passe à 1-250, de -221 à -512 pour mba et de -377 à -649 pour cbei.
- - Les faibles fréquences: Les faibles fréquences 1-30 ne sont intéressantes à comparer que pour les génomes à courbes 1-400 semblables où le taux de ces fréquences sont élevés et évoluent en parallèle comme entre pmg et pub où le rapport x+/c+ passe de 0.78 à 0.51. Pour cbei et mba ils sont très faibles, respectivement 0.11 et 0.21. Les zéros sont à 4‰ pour cbei et 9‰ pour mba, alors que le taux des négatifs est légèrement plus élevé chez mba que chez cbei, 132‰ contre 97‰.
- - Les courbes 1-40:
- c+ 1-40: La courbe de cbei est très proche de celle du total des c+ 1-40, mais celle de mba en est proche avec le minimum du creux à la fréquence 7 et 8, mais avec un maximum local à 5 et un creux en 12.
- x+ 1-40: Avec des effectifs de 35 et 51, les courbes ne peuvent pas être significatives.
- - Les diagrammes x+ 1-600: Ces diagrammes affinent la forme des courbes x+ 1-400 en la prolongeant à 600 à cause de nombreux restes (reste) non intégrés pour les 2 génomes, pour mba 705 sont représentés contre 527 en reste et pour cbei 946 contre 262.
- cbei x+ 1-600: Le tilde se renforce avec R2p R2d R2’ qui passent respectivement de 712 4 708 à 783 344 439. Le R2 de la droite, R2d, devient conséquent à 344 contre 4. La corrélation 41-400 de 395 passe à 651, elle reste faible pour la longueur de la plage 41-600.
- mba x+ 1-600: La forme devient clairement tilde et se renforce en passant de 350 1 349 à 465 156 309. Le R2 de la droite devient conséquent à 156 contre 1. La variabilité entre cbei et mba est maintenue et passe, en faisant la différence des R2 des tildes cbei-mba, de 712-349 = 363 à 783-465= 318 avec des effectifs qui passent de 946 à 1126 (reste 82 non pris en compte) pour cbei et de 705 à 937 (reste 295 non pris en compte) pour mba. La corrélation 41-400 de 154 passe à 435, elle reste faible pour la longueur de la plage 41-600.
mba autres intercalaires[modifier | modifier le wikicode]
- Lien tableur: mba autres intercalaires aas
- Légende:
- - comp, le gène est sur le brin complement
- - deb, fin sont respectivement dans le sens des adresses croissantes, le cds avant le 1er tRNA et le cds après le dernier tRNA du bloc.
- Totaux: 2 repeat_region et 3 ncRNA
tRNA-cds tRNA-tRNA autres-cds total c+ x+ x- c+ x+ c- c+ x+ c- 49 46 1 21 1 3 5 126 2 ac+
- Méthode de calculs des intercalaires autres que les CDS-CDS voir le cas de amed.
Methanosarcina sp. WH1[modifier | modifier le wikicode]
mfe opérons[modifier | modifier le wikicode]
- Lien tableur: mfe opérons
- Liens: gtRNAdb [14], NCBI [15], génome [16], %GC 41.80 [17]
- Phylogénie: Archaea; Euryarchaeota; Stenosarchaea group; Methanomicrobia; Methanosarcinales; Methanosarcinaceae; Methanosarcina; unclassified Methanosarcina
- Légende: cdsa: cds aas, cdsd: cds dirigé
40.2%GC | 2.2.20 Paris | 56 | doubles | intercal | cds | aa | avec aa | cdsa | cdsd | protéines |
---|---|---|---|---|---|---|---|---|---|---|
comp | 38726..40264 | cds | 698 | 698 | 513 | 2-isopropylmalate synthase | ||||
40963..42450 | 16s | 208 | 1488 | |||||||
42659..45491 | 23s | 130 | 2833 | |||||||
45622..45743 | 5s | 857 | 857 | 122 | ||||||
46601..47164 | cds | 102 | 102 | 188 | hp | |||||
47267..47338 | tgc | + | 72 | 72 | ||||||
47411..47482 | tgc | 2 tgc | 411 | 411 | ||||||
47894..48508 | cds | 205 | endonuclease III | |||||||
comp | 71092..72423 | cds | 384 | 384 | 444 | signal recognition particle protein | ||||
comp | 72808..72882 | atgf | + | 89 | 89 | |||||
comp | 72972..73046 | atgf | 2 atgf | 234 | 234 | |||||
73281..73472 | cds | 64 | hp | |||||||
comp | 175573..176153 | cds | 163 | 163 | 194 | hp | ||||
comp | 176317..176389 | gac | 111 | 111 | ||||||
comp | 176501..176614 | tac | @1 | 295 | 295 | |||||
176910..177248 | cds | 113 | hp | |||||||
comp | 214884..215966 | cds | 801 | 801 | 361 | hp | ||||
comp | 216768..216841 | aca | 150 | 150 | ||||||
216992..217582 | cds | 197 | aldolase | |||||||
comp | 372219..373091 | cds | 558 | 558 | 291 | hp | ||||
comp | 373650..373723 | gtg | 340 | 340 | ||||||
374064..374828 | cds | 255 | peptidase A24 | |||||||
comp | 379248..381950 | cds | 1076 | 1076 | 901 | DNA mismatch repair protein MutS | ||||
comp | 383027..383104 | ccc | 193 | 193 | ||||||
comp | 383298..383882 | cds | 195 | CDP-alcohol phosphatidyltransferase family protein | ||||||
comp | 532751..533176 | cds | 356 | 356 | 142 | hp | ||||
comp | 533533..533607 | cca | 149 | 149 | ||||||
comp | 533757..534308 | cds | 184 | UbiX family flavin prenyltransferase | ||||||
comp | 598666..599850 | cds | 170 | 170 | 395 | redox-regulated ATPase YchF | ||||
600021..600092 | cgc | 341 | 341 | |||||||
600434..600868 | cds | 145 | cell surface lipoprotein | |||||||
680493..681734 | cds | 185 | 185 | 414 | proteasome-activating nucleotidase | |||||
681920..681994 | gag | 242 | 242 | |||||||
> | 682237..682560 | cds | 108 | p-IS200/IS605 family transposase | ||||||
689062..689631 | cds | 36 | 36 | 190 | phosphatase PAP2 family protein | |||||
comp | 689668..689752 | cta | 73 | 73 | ||||||
comp | 689826..689897 | gga | 1481 | 1481 | ||||||
691379..691483 | cds | 35 | CcmD family protein | |||||||
comp | 793563..795017 | cds | 111 | 111 | 485 | p-IS66 family transposase | ||||
comp | 795129..795213 | ctc | + | 117 | 117 | |||||
comp | 795331..795418 | ctc | 2 ctc | 235 | 235 | |||||
comp | 795654..796454 | cds | 267 | DNA-directed RNA polymerase subunit D | ||||||
810088..810471 | cds | 861 | 861 | 128 | hp | |||||
comp | 811333..811415 | tcc | 123 | 123 | ||||||
comp | 811539..812555 | cds | 339 | RNA-guided pseudouridylation complex pseudouridine synthase subunit Cbf5 | ||||||
comp | 893309..894232 | cds | 391 | 391 | 308 | aldolase | ||||
comp | 894624..894696 | aac | + | 87 | 87 | |||||
comp | 894784..894858 | atgi | 2 aac | 110 | 110 | |||||
comp | 894969..895041 | aac | 1415 | 1415 | ||||||
comp | 896457..897506 | cds | 350 | TIGR00303 family protein | ||||||
949570..950112 | cds | 208 | 208 | 181 | nitroreductase family protein | |||||
950321..950392 | cgg | 498 | 498 | |||||||
comp | 950891..952300 | cds | 470 | NADPH-dependent glutamate synthase | ||||||
1088496..1090946 | cds | 360 | 360 | 817 | PGF-pre-PGF domain-containing protein | |||||
comp | 1091307..1091378 | gcc | 227 | 227 | ||||||
1091606..1091682 | atc | + | 62 | 62 | ||||||
1091745..1091818 | atc | 2 atc | 353 | 353 | ||||||
comp | 1092172..1092585 | cds | 138 | transcriptional regulator | ||||||
1155736..1156137 | cds | 210 | 210 | 134 | AsnC family transcriptional regulator | |||||
1156348..1156425 | gaa | + | 718 | 718 | ||||||
1157144..1157221 | gaa | 2 gaa | 233 | 233 | ||||||
comp | 1157455..1158645 | cds | @4 | 397 | ISH3 family transposase | |||||
comp | 1199367..1200149 | cds | 967 | 967 | 261 | methanol-5-hydroxybenzimidazolylcobamide methyltransferase | ||||
1201117..1202604 | 16s | 80 | 1488 | |||||||
1202685..1202757 | gca | 135 | ||||||||
1202893..1205725 | 23s | 130 | 2833 | |||||||
1205856..1205977 | 5s | 5 | 5 | 122 | ||||||
comp | 1205983..1206231 | cds | 83 | hp | ||||||
1207508..1211485 | cds | 12 | 12 | 1326 | PAS domain S-box protein | |||||
comp | 1211498..1211582 | ctg | 190 | 190 | ||||||
comp | 1211773..1212681 | cds | 303 | ornithine carbamoyltransferase | ||||||
comp | 1220571..1220783 | cds | 596 | 596 | 71 | MoaD/ThiS family protein | ||||
comp | 1221380..1221451 | ggc | + | 25 | 25 | |||||
comp | 1221477..1221551 | ttc | 2 ggc | 57 | 57 | |||||
comp | 1221609..1221682 | gtc | 2 ttc | 71 | 71 | |||||
comp | 1221754..1221825 | ggc | 2 gtc | 25 | 25 | |||||
comp | 1221851..1221925 | ttc | 118 | 118 | ||||||
comp | 1222044..1222117 | gtc | 358 | 358 | ||||||
1222476..1223792 | cds | 439 | methanogenesis marker 16 metalloprotein | |||||||
1400830..1401773 | cds | 914 | 914 | 315 | helix-turn-helix domain-containing protein | |||||
1402688..1402761 | gta | 287 | 287 | |||||||
1403049..1403276 | cds | 76 | hp | |||||||
comp | 1504221..1505630 | cds | 686 | 686 | 470 | F0F1 ATP synthase subunit beta | ||||
comp | 1506317..1506410 | cga | 750 | 750 | ||||||
1507161..1508039 | cds | 293 | response regulator | |||||||
1513245..1513562 | cds | 213 | 213 | 106 | divalent-cation tolerance protein CutA | |||||
1513776..1513858 | ttg | 268 | 268 | |||||||
> | 1514127..1514647 | cds | 174 | p-IS1634 family transposase | ||||||
1887880..1888338 | cds | 392 | 392 | 153 | pyridoxamine 5'-phosphate oxidase family protein | |||||
comp | 1888731..1888802 | ggc | 378 | 378 | ||||||
1889181..1890518 | cds | 446 | DHH family phosphoesterase | |||||||
1962666..1963553 | cds | 130 | 130 | 296 | hp | |||||
comp | 1963684..1963768 | tta | 235 | 235 | ||||||
1964004..1964759 | cds | 252 | MBL fold metallo-hydrolase | |||||||
1971331..1971852 | cds | 319 | 319 | 174 | hp | |||||
comp | 1972172..1972244 | cag | 204 | 204 | ||||||
comp | 1972449..1972850 | cds | 134 | hp | ||||||
comp | 2170713..2172446 | cds | 156 | 156 | 578 | radical SAM protein | ||||
comp | 2172603..2172674 | cac | 174 | 174 | ||||||
comp | 2172849..2173631 | cds | 261 | thiazole biosynthesis protein | ||||||
<comp | 2320809..2321131 | cds | 141 | 141 | 108 | p-IS200/IS605 family transposase | ||||
comp | 2321273..2321344 | gcg | 65 | 65 | ||||||
comp | 2321410..2321679 | cds | 90 | elongation factor 1-beta | ||||||
2387890..2388675 | cds | 150 | 150 | 262 | peptidylprolyl isomerase | |||||
2388826..2388911 | tca | 326 | 326 | |||||||
comp | 2389238..2389453 | cds | 72 | hp | ||||||
comp | 2678132..2678368 | cds | 85 | 85 | 79 | DNA-directed RNA polymerase subunit H | ||||
comp | 2678454..2678530 | aaa | 824 | 824 | ||||||
comp | 2679355..2679537 | cds | 61 | hp | ||||||
3091524..3091754 | cds | 271 | 271 | 77 | hp | |||||
comp | 3092026..3092147 | 5s | 130 | 122 | ||||||
comp | 3092278..3095110 | 23s | 208 | 2833 | ||||||
comp | 3095319..3096806 | 16s | 839 | 839 | 1488 | |||||
3097646..3097975 | cds | 110 | translation initiation factor eIF-1A | |||||||
comp | 3153517..3155214 | cds | 599 | 599 | 566 | diguanylate phosphodiesterase | ||||
comp | 3155814..3155923 | atgj | 799 | 799 | ||||||
3156723..3157106 | cds | 128 | tRNA CCA-pyrophosphorylase | |||||||
comp | 3241682..3242944 | cds | 473 | 473 | 421 | diaminopimelate decarboxylase | ||||
3243418..3243489 | ggg | 377 | 377 | |||||||
3243867..3244073 | cds | 69 | hp | |||||||
3341829..3342017 | cds | @2 | 0 | 0 | 63 | DNA-directed RNA polymerase subunit N | ||||
3342018..3342092 | ccg | 112 | 112 | |||||||
3342205..3342387 | cds | 61 | DNA-directed RNA polymerase subunit K | |||||||
3358176..3359186 | cds | 533 | 533 | 337 | class I SAM-dependent methyltransferase family protein | |||||
3359720..3359791 | acg | 52 | 52 | |||||||
comp | 3359844..3360305 | cds | 154 | peroxiredoxin | ||||||
comp | 3397316..3398947 | cds | 422 | 422 | 544 | methylamine methyltransferase corrinoid protein reductive activase | ||||
3399370..3399684 | ncRNA | @3 | 149 | 149 | 315 | |||||
3399834..3399918 | agc | 230 | 230 | |||||||
3400149..3400847 | cds | 233 | ATPase | |||||||
3435506..3436918 | cds | 181 | 181 | 471 | phosphotransferase | |||||
3437100..3437183 | tcg | 273 | 273 | |||||||
3437457..3437948 | cds | 870 | 870 | 164 | rubrerythrin family protein | |||||
3438819..3438989 | cds | 107 | 107 | 57 | hp | |||||
3439097..3439289 | tgg | 42 | 42 | |||||||
comp | 3439332..3439484 | cds | 51 | hp MLELDILDLDILDLDILDLKILELEILELEVLELEILELEILELEVLVQS | ||||||
3456114..3456473 | cds | 260 | 260 | 120 | hp | |||||
comp | 3456734..3456805 | acc | 200 | 200 | ||||||
comp | 3457006..3457518 | cds | 171 | DUF98 domain-containing protein | ||||||
comp | 3583589..3584044 | cds | 295 | 295 | 152 | N-acetyltransferase | ||||
comp | 3584340..3584414 | agg | 339 | 339 | ||||||
3584754..3585317 | cds | 188 | biotin transporter BioY | |||||||
3593430..3593861 | cds | 343 | 343 | 144 | PspC domain-containing protein | |||||
comp | 3594205..3594279 | aga | 348 | 348 | ||||||
3594628..3595506 | cds | 293 | branched-chain-amino-acid transaminase | |||||||
3603458..3603697 | cds | 389 | 389 | 80 | type II toxin-antitoxin system HicB family antitoxin | |||||
3604087..3604159 | caa | 633 | 633 | |||||||
comp | 3604793..3606301 | cds | 503 | lipopolysaccharide biosynthesis protein | ||||||
comp | 3856073..3856279 | cds | 402 | 402 | 69 | TRAM domain-containing protein | ||||
3856682..3856755 | aag | 498 | 498 | |||||||
3857254..3857424 | cds | 57 | CopG family transcriptional regulator |
mfe cumuls[modifier | modifier le wikicode]
- Lien tableur: mfe cumuls
opérons | Fréquences intercalaires tRNAs | Fréquences intercalaires cds | Fréquences aas cds chromosome | ||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
effectif | gammes | sans rRNAs | avec rRNAs | gammes | cds | gammes | cdsd | gammes | cdsa | gammes | cdsa 300 | ||
avec rRNA | opérons | 3 | 1 | 0 | - | 1 | 1 | 1 | 100 | 18 | 30 | 0 | |
16 23 5s 0 | 2 | 20 | 0 | 50 | 4 | 20 | 200 | 29 | 60 | 4 | |||
16 gca 235 | 1 | 40 | 2 | 100 | 3 | 40 | 300 | 12 | 90 | 14 | |||
16 23 5s a | 0 | 60 | 1 | 150 | 11 | 60 | 400 | 9 | 120 | 6 | |||
max a | 1 | 80 | 4 | 200 | 9 | 80 | 500 | 9 | 150 | 8 | |||
a doubles | 0 | 100 | 2 | 250 | 10 | 100 | 600 | 5 | 180 | 7 | |||
autres | 0 | 120 | 4 | 300 | 7 | 120 | 700 | 0 | 210 | 9 | |||
total aas | 1 | 140 | 0 | 350 | 7 | 140 | 800 | 0 | 240 | 1 | |||
sans | opérons | 40 | 160 | 0 | 400 | 10 | 160 | 900 | 1 | 270 | 6 | ||
1 aa | 31 | 180 | 0 | 450 | 3 | 180 | 1000 | 1 | 300 | 4 | |||
max a | 6 | 200 | 0 | 500 | 3 | 200 | 1100 | 0 | 330 | 3 | |||
a doubles | 7 | 2 | 20 | 1 | 23 | ||||||||
total aas | 55 | 15 | 0 | 88 | 0 | 85 | 85 | ||||||
total aas | 56 | ||||||||||||
remarques | |||||||||||||
avec jaune | moyenne | 131 | 376 | 255 | |||||||||
variance | 169 | 299 | 210 | ||||||||||
sans jaune | moyenne | 55 | 223 | 207 | 157 | ||||||||
variance | 21 | 108 | 127 | 80 |
mfe tRNA-cds[modifier | modifier le wikicode]
- Note: intercalaires prélevés de la colonne cds de mfe opérons dans un bloc de tRNAs uniquement. Le début du bloc est dans l'ordre des adresses, deb intercalaire entre le cds et le 1er tRNA dd bloc, fin entre le dernier tRNA et le cds terminal. J'ai procédé, dans les colonnes petit et grand, à la réorientation des blocs d'après la constatation que les blocs à rRNA ont leurs cds de début et de fin sont orientés du cds-16s au 5s-tRNAs-cds, l'intercalaire cds-16s étant plus grands que l'intercalaire avec le cds terminal. En tête de colonne est le % du nombre des intercalaires inférieurs à 201 pbs.
mfe 38 28 13 54 deb fin deb fin grand petit grand petit 0 112 107 42 107 42 112 0 12 190 533 52 112 0 190 12 36 1481 141 65 141 65 1481 36 85 824 0 112 174 156 107 42 107 42 861 123 190 12 533 52 111 235 356 149 230 149 141 65 130 235 801 150 233 210 824 85 141 65 156 174 235 111 235 111 149 230 12 190 235 130 861 123 150 326 1076 193 242 185 235 130 156 174 260 200 260 200 230 149 163 295 319 204 268 213 356 149 170 341 149 230 273 181 326 150 181 273 210 233 295 163 801 150 185 242 384 234 319 204 174 156 208 498 111 235 326 150 295 163 210 233 130 235 339 295 341 170 213 268 185 242 341 170 273 181 260 200 213 268 348 343 242 185 295 339 181 273 356 149 1076 193 319 204 914 287 360 353 260 200 343 348 163 295 384 234 319 204 356 149 150 326 392 378 498 208 360 353 295 339 473 377 233 210 384 234 558 340 498 208 268 213 389 633 170 341 498 402 384 234 391 1415 343 348 533 52 914 287 392 378 360 353 558 340 339 295 402 498 596 358 596 358 558 340 473 377 473 377 633 389 348 343 533 52 392 378 750 686 360 353 558 340 208 498 799 599 596 358 596 358 402 498 801 150 473 377 599 799 389 633 824 85 392 378 686 750 686 750 861 123 633 389 801 150 599 799 914 287 1415 391 861 123 85 824 1076 193 498 402 914 287 391 1415 1415 391 799 599 1076 193 36 1481 1481 36 750 686
- Comparaison cds-cds tRNA-cds: deb fin, c'est l'ordre des adresses et grand petit l'ordre après réorientation. Leur pourcentage est calculé par rapport à la colonne, c'est à dire la moitié du total des tRNA-cds.
archeo cds total total <0 0-200 201-370 371-600 >600 deb fin grand petit mfe 2,374 78 26 27 14 11 15 11 5 21 ‰ 333 346 179 141 385 282 128 538
mfe blocs[modifier | modifier le wikicode]
- Lien tableur: mfe blocs
cds | 698 | 513 | 2-isopropylmalate synthase |
16s | 208 | 1488 | |
23s | 130 | 2833 | |
5s | 857 | 122 | |
cds | 102 | 188 | hp |
cds | 967 | 261 | methanol-5-hydroxybenzimidazolylcobamide methyltransferase |
16s | 80 | 1488 | |
gca | 135 | ||
23s | 130 | 2833 | |
5s | 5 | 122 | |
cds | 83 | hp | |
cds | 271 | 77 | hp |
5s | 130 | 122 | |
23s | 208 | 2833 | |
16s | 839 | 1488 | |
cds | 110 | translation initiation factor eIF-1A |
mfe remarques[modifier | modifier le wikicode]
- Lien tableur: mfe remarques
- Remarques un génome avec beaucoup de doubles dont une séquence de 3 aas.
- @ ncRNA, dans le même ques l que’aa, taille de 315 pbs.
- @ 4 introns
- - tac 176501..176536,176579..176614
- - tgg 3439097..3439134,3439254..3439289
- - atgj 3155814..3155849,3155886..3155923
- - cga 1506317..1506351,1506372..1506410
- @ un intercalaire nul sans changement de sens
- @ intercalaire très élevé 718 pbs entre 2 aas, le nouveau doublet gaa.
- Séquence des doubles: 7 clusters avec des doubles dont une séquence de 3 aas
- - 4 doublets seuls ctc tgc atgf gaa
- - gcc 2atc
- - aac atgi aac
- - 2 (gtc ttc ggc)
- - par rapport à mja un noveau doublet, gaa. Le triplet atgf est changé en doublet. Les autres restent identiques.
- Tableau du code génétique de mfe
- Légende: prélèvement de la base gtRNAdb le 2.2.20
- - totaux en en-tête, 56 total de gtRNAdb contenant des pseudo et inconnus; 56 total du cumul.
- - atgi, c'est Ile2, mis à la place de ttt, très rare chez les procaryotes.
- - atgf, c'est Metf, mis à la place de tgt, très rare chez les procaryotes.
- - atgj, c'est Met, remplace le atg standard qui est la somme Ile2 Metf Met.
- - Voir la légende des tris et couleurs, g1 t1.
- Légende: prélèvement de la base gtRNAdb le 2.2.20
g1 | t1 | 56 | 56 | ||||
---|---|---|---|---|---|---|---|
atgi | 1 | tct | tat | atgf | 2 | ||
att | act | aat | agt | ||||
ctt | cct | cat | cgt | ||||
gtt | gct | gat | ggt | ||||
ttc | 2 | tcc | 1 | tac | 1 | tgc | 2 |
atc | 2 | acc | 1 | aac | 2 | agc | 1 |
ctc | 2 | ccc | 1 | cac | 1 | cgc | 1 |
gtc | 2 | gcc | 1 | gac | 1 | ggc | 3 |
tta | 1 | tca | 1 | taa | tga | ||
ata | aca | 1 | aaa | 1 | aga | 1 | |
cta | 1 | cca | 1 | caa | 1 | cga | 1 |
gta | 1 | gca | 1 | gaa | 2 | gga | 1 |
ttg | 1 | tcg | 1 | tag | tgg | 1 | |
atg | 1 | acg | 1 | aag | 1 | agg | 1 |
ctg | 1 | ccg | 1 | cag | 1 | cgg | 1 |
gtg | 1 | gcg | 1 | gag | 1 | ggg | 1 |
- intercalaires élevés avec le cds 26/88
3856682 aag 402 comp 47411 tgc 411 3399370 ncRNA 422 comp 3243418 ggg 473 comp 950321 cgg 498 comp 3856682 aag 498 3359720 acg 533 373650 gtg 558 1221380 ggc 596 3155814 atgj 599 3604087 caa 633 comp 1506317 cga 686 40963 16s 698 comp 1506317 cga 750 comp 3155814 atgj 799 comp 216768 aca 801 2678454 aaa 824 3095319 16s 839 comp 45622 5s 857 811333 tcc 861 comp 3438819 cds 870 1402688 gta 914 1201117 16s 967 comp 383027 ccc 1076 894969 aac 1415 689826 gga 1481 comp
- intercalaires élevés entre aas
ggc-ttc 25 ggc-ttc 25 ttc-gtc 57 atc-atc 62 gtc-ggc 71 tgc-tgc 72 cta-gga 73 aac-atgi 87 atgf-atgf 89 atgi-aac 110 gac-tac 111 ctc-ctc 117 ttc-gtc 118 gcc-atc 227 gaa-gaa 718
mfe distribution[modifier | modifier le wikicode]
- Lien tableur: mfe distribution
g1 | t1 | ||||||
---|---|---|---|---|---|---|---|
atgi | 1 | tct | tat | atgf | 2 | ||
att | act | aat | agt | ||||
ctt | cct | cat | cgt | ||||
gtt | gct | gat | ggt | ||||
ttc | 2 | tcc | 1 | tac | 1 | tgc | 2 |
atc | 2 | acc | 1 | aac | 2 | agc | 1 |
ctc | 2 | ccc | 1 | cac | 1 | cgc | 1 |
gtc | 2 | gcc | 1 | gac | 1 | ggc | 3 |
tta | 1 | tca | 1 | taa | tga | ||
ata | aca | 1 | aaa | 1 | aga | 1 | |
cta | 1 | cca | 1 | caa | 1 | cga | 1 |
gta | 1 | gca | 1 | gaa | 2 | gga | 1 |
ttg | 1 | tcg | 1 | tag | tgg | 1 | |
atgj | 1 | acg | 1 | aag | 1 | agg | 1 |
ctg | 1 | ccg | 1 | cag | 1 | cgg | 1 |
gtg | 1 | gcg | 1 | gag | 1 | ggg | 1 |
arch | >1aa | =1aa | -5s | +5s | -16s | +16s | total |
mfe | 24 * | 31 * | 1 | 56 |
mfe. Intergen51[modifier | modifier le wikicode]
Intergen51. mfe. Le génome[modifier | modifier le wikicode]
- mfe Le prélèvement: Aapal
- Le nom et le lien NCBI: mfe, Methanosarcina sp. WH1 chromosome, NCBI [18], date 11.12.21.
- mfe La longueur totale des intercalaires, longueur du génome et taux intercalaires/génome:
Nom intercals génome taux en % mfe 987,074 3,914,091 25.2
mfe données intercalaires[modifier | modifier le wikicode]
- Lien tableur: mfe données intercalaires
- Lien sauvegarde NCBI: Aapal
mfe autres intercalaires aas[modifier | modifier le wikicode]
- Lien tableur: mfe autres intercalaires aas
- Lien sauvegarde NCBI: Aapal
Intergen51. mfe. Les différents types d'intercalaires[modifier | modifier le wikicode]
- Lien au tableur: Intergen51. mfe les différents types d'intercalaires.
- Légende:
- - S pour intercalaire CDS-CDS et R pour tRNA-CDS,
- - c pour intercalaire continu (les 2 gènes sont sur le même brin) et x pour discontinu (les 2 gènes sont sur 2 brins différents, le brin et son complément)
- - %reste = 100*reste/total, le reste étant ce qui reste du total après la fin du diagramme, gamme.
- - %t30 = 100*t30/total, t30 étant le total des fréquences 10 20 30
- - %t5 = 100*t/total, t5 étant le total des fréquences de -1 à -5 dans le diagramme des S-.
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
Intergen51. mfe. Les diagrammes CDS-CDS positifs[modifier | modifier le wikicode]
- Lien tableur: Les diagrammes
- Diagrammes des gamma: mfe présente 2 diagrammes
- - fc40, CDS-CDS continu, fréquence unitaire en abscisses et effectif en ordonnées
- - fx%, CDS-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et pourcentage en ‰ par rapport au total, en ordonnées.
- Équations des courbes de tendance en pour 1000: colonnes %fx %fc
Courbes de tendances pour les diagrammes en pour 1000 Calculs des f.41 mfe R2 x3 x2 x c Inflexion poly3 x c 0.317 1.04E-06 -7.63E-04 1.38E-01 12.80 fx1 abscisse 248.3 4261.2 0.809 -3.02E-06 2.21E-03 -5.36E-01 57.3 fc1 ordonnée 2.4 309.8 0.309 8.74E-07 -6.51E-04 1.17E-01 13.6 fx41 0.872 -3.88E-09 4.96E-05 -7.52E-02 29.8 fc41
Intergen51. mfe. Les CDS-CDS négatifs[modifier | modifier le wikicode]
Sous-totaux mfe totale fréquence x- c- x- c- - 1 0 26 4 4140 - 2 1 0 85 11 - 3 0 0 3 12 - 4 4 116 717 10938 - 5 0 0 5 19 sp6 12 108 1642 8424 total 17 250 2,456 23,544 reste 3 3 264 420 s6 5 3 361 41 s7 2 22 321 1438 s8 2 80 696 6525 rapport s1-5 4/2/1 4.0 4.5 8.4 2.6 % / sp6 s6/sp6 41.7 2.8 22.0 0.5 s7/sp6 16.7 20.4 19.5 17.1 s8/sp6 16.7 74.1 42.4 77.5 reste/sp6 25.0 2.8 16.1 5.0 total s1-5 5 142 814 15120 % / total %s1-5 29.4 56.8 33.1 64.2 %sp6 70.6 43.2 66.9 35.8
Intergen51. mfe. Les intercalaires des blocs[modifier | modifier le wikicode]
- Le détail
RNA-RNA c x CDS-RNA c x 23s 5s 3 CDS 16s 3 16s 23s 2 5s CDS 1 2 16s tRNA 1 16 CDS tRNA 23s 1 CDS 5s 5s tRNA 23s CDS tRNA in CDS 23s tRNA contig 5s 16s tRNA hors 14 1 16s16s tRNA 16s 23s tRNA tRNA 5s 16s 5s 5s 23s 5s 5s total 21 1 total 1 5
- Les rares voir gamma pour la longueur des intercalaires
- Les tRNA-CDS compris, comparaison dans le clade et dans l'étude.
Intergen51. mfe. Les intercalaires tRNA-tRNA extra blocc[modifier | modifier le wikicode]
- Lien tableur: Intergen51. mfe. Les intercalaires tRNA-tRNA extra bloc
mfe | hors | mfi | hors | mba | hors | mja | hors | |||
---|---|---|---|---|---|---|---|---|---|---|
inter | aa | inter | aa | inter | aa | inter | aa | |||
72 | tgc | 85 | acc | 132 | ctc | 91 | atgj | |||
** | tgc | ** | tta | ** | ctc | ** | ctc | |||
89 | atgf | 5 | aac | 71 | aac | 23 | aga | |||
** | atgf | 58 | atgi | 119 | atgi | ** | gaa | |||
111 | gac | 53 | gaa | ** | aac | 178 | acc | |||
** | tac | 29 | cta | 94 | gga | ** | caa | |||
73 | cta | ** | cac | ** | cta | 34 | ggc | |||
** | gga | 90 | aag | 63 | atgf | ** | gga | |||
117 | ctc | 504 | ttg | 63 | atgf | |||||
** | ctc | ** | aaa | ** | atgf | |||||
87 | aac | 40 | tgg | 65 | tgc | |||||
110 | atgi | ** | tgc | ** | tgc | |||||
** | aac | 62 | aga | 112 | tac | mja | cont | |||
227 | gcc | ** | agg | ** | gac | 7 | ttc | |||
62 | atc | 99 | gta | 223 | gcc | 29 | aac | |||
** | atc | ** | gtg | 74 | atc | 18 | atgi | |||
718 | gaa | 76 | aca | ** | atc | 39 | gaa | |||
** | gaa | 44 | cca | 94 | gtc | 11 | cta | |||
25 | ggc | 170 | tac | 7 | ttc | ** | cac | |||
57 | ttc | 7 | gac | 61 | ggc | 14 | aca | |||
71 | gtc | ** | aaa | 94 | gtc | 8 | cca | |||
25 | ggc | 4 | gtc | 7 | ttc | 83 | tac | |||
118 | ttc | ** | ttc | ** | ggc | ** | aaa | |||
** | gtc | 2 | ggc | |||||||
** | gga | |||||||||
- |
archées synthèse[modifier | modifier le wikicode]
- Liens aux fiches: spiro tener gama alpha beta delta epsilon bacilli clostridia autres firmicutes actino bactero cyano archeo
archées distribution par génome[modifier | modifier le wikicode]
- Lien tableur: archées distribution par génome
- Notes: -5s et +5s sont inversés et le -16s est d'un seul bloc de 6 aas.
arch | >1aa | 1aa | -5s | +5s | -16s | +16s | duplica | 1-3aas | total |
mba | 14 | 37 | 1 | 9 | 61 | ||||
mfe | 14 | 31 | 1 | 10 | 56 | ||||
mfi | 25 | 20 | 2 | 47 | |||||
mja | 8 | 16 | 1 | 4 | 6 | 2 | 37 | ||
total | 61 | 104 | 1 | 4 | 6 | 6 | 19 | 0 | 201 |
archées distribution du total[modifier | modifier le wikicode]
- Lien tableur: archées distribution du total
- Liens indices: euryarchaeota
- Notes: Les -5s +5s et -16s sont colorés et correspondent à un seul tRNA du génome mja. Les +16s sont tout les 6 des gca. Les -16s sont d'un seul bloc de 6 aas. Les -5s et +5s sont inversés dans le bloc 4aas-5s-gac.
- Légende: Tableau des indices, en-tête: total des génomes, total des tRNAs, indice ttt, indice tgt.
|
|
archées distribution par type[modifier | modifier le wikicode]
- Lien tableur: archées distribution par type
- Notes: Le cyan pour les effectifs élevés des solitaires, le jaune celui des multiples sans duplicata et le blanc, le reste. En rapportant au total de chaque type je constate que les 3 processus sont distincts et se chevauchent très peu, respectivement pour 1aa >1aa duplicata, % 65 61 79.
1aa >1aa duplica % 104 % 61 % 19 jaune 4 4 37 61 0 0 cyan 68 65 7 11 4 21 blanc 32 31 17 28 15 79
|
|
|
archées par rapport au groupe de référence[modifier | modifier le wikicode]
- Lien tableur: archées par rapport au groupe de référence
- Le groupe de référence: voir la référence
- Légende:
- - carré ccc, c'est ctc gtc ccc gcc
- - g+cgg, c'est gtg xcg xag ggg cgg (dans l'hypothèse de la bascule des cgx, cgt/cgc cga/cgg chez les archées)
tRNAs | blocs tRNAs | blocs rRNAs | |||||||
archeo4 | 1aa | >1aa | dup | +5s | 1-3aas | autres | total | ||
---|---|---|---|---|---|---|---|---|---|
21 | faible | 40 | 11 | 4 | 55 | ||||
16 | moyen | 39 | 16 | 8 | 9 | 72 | |||
14 | fort | 25 | 34 | 7 | 4 | 4 | 74 | ||
104 | 61 | 19 | 4 | 13 | 201 | ||||
10 | g+cgg | 26 | 2 | 28 | |||||
2 | agg+cga | 6 | 1 | 7 | |||||
4 | carre ccc | 7 | 8 | 4 | 19 | ||||
5 | autres | 1 | 1 | ||||||
40 | 11 | 4 | 55 | ||||||
total tRNAs ‰ | |||||||||
archeo4 | 1aa | >1aa | dup | +5s | 1-3aas | autres | archeo ‰ | ref.‰ | |
21 | faible | 199 | 55 | 20 | 274 | 26 | |||
16 | moyen | 194 | 80 | 40 | 45 | 358 | 324 | ||
14 | fort | 124 | 169 | 35 | 20 | 20 | 368 | 650 | |
517 | 303 | 95 | 20 | 65 | 201 | 729 | |||
10 | g+cgg | 129 | 10 | 139 | 10 | ||||
2 | agg+cga | 30 | 5 | 35 | |||||
4 | carre ccc | 35 | 40 | 20 | 95 | 16 | |||
5 | autres | 5 | 5 | ||||||
199 | 55 | 20 | 274 | ||||||
blocs tRNAs ‰ | total colonne % | ||||||||
archeo4 | 1aa | >1aa | dup | total | ref.‰ | 1aa | >1aa | dup | |
21 | faible | 217 | 60 | 22 | 299 | 26 | 38 | 18 | |
16 | moyen | 212 | 87 | 43 | 342 | 324 | 38 | 26 | |
14 | fort | 136 | 185 | 38 | 359 | 650 | 24 | 56 | |
565 | 332 | 103 | 184 | 729 | 104 | 61 | |||
10 | g+cgg | 141 | 11 | 152 | 10 | 65 | |||
2 | agg+cga | 33 | 5 | 38 | 15 | ||||
4 | carre ccc | 38 | 43 | 22 | 103 | 16 | 18 | ||
5 | autres | 5 | 5 | 3 | |||||
217 | 60 | 22 | 299 | 40 |
euryarchaeota, estimation des -rRNAs[modifier | modifier le wikicode]
- Lien tableur: euryarchaeota, estimation des -rRNAs
- Liens fiche: typage
- Légende: prélèvement de la base gtRNAdb le 16.1.21
- - ttt et tgt sont nuls partout
- - atgi, c'est Ile2, mis à la place de ttt, très rare chez les procaryotes.
- - atgf, c'est iMet, mis à la place de tgt, très rare chez les procaryotes.
- - atgj, c'est Met, remplace le atg standard qui est la somme Ile2 Met iMet.
- - Voir la légende des tris, g1 t1 et des couleurs
euryarchaeota, calcul des -rRNAs[modifier | modifier le wikicode]
- Lien tableur: euryarchaeota, calcul des -rRNAs
|
|
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|
|
euryarchaeota, comparaison clade-annexe des -rRNAs[modifier | modifier le wikicode]
- Lien tableur: euryarchaeota, comparaison clade-annexe des -rRNAs
- Légende
- - eur7. diff, somme des couleurs de eur7. La différence entre tRNAs est faite entre eur5 et eur6 du tableau précédent. Elle est exprimée en % et rapporté à la plus grande valeur des 2 termes de la différence. Ce qui fait quand un tRNA est à zéro la différence en % est égale à 100.
- - eur8. rap, rapport des sommes couleurs eur5/eur2. Le rapport -rRNA/total est celui du tRNA de eur5 sur celui de eur2.
- Fréquences des différences en % du tableau eur7
gamme 0/0 10 20 30 40 50 60 70 80 90 100 total fréquence 1 17 14 10 3 2 0 0 0 0 0 1 48 tot ≤ 50 41
- Comparaison avec le nombre de tRNAs de la fiche du clade: L’estimation des -rRNA par l'annexe est 10% au dessus de celle de la fiche des archées.
tRNAs fiche annexe sans 2642 184 avec 150 17 genomes 63 4 indice % 42 46
|
|
Archeo. Intergen51[modifier | modifier le wikicode]
Intergen51. Archeo. Introduction[modifier | modifier le wikicode]
Intergen51. Archeo. Historique des pré-études[modifier | modifier le wikicode]
Intergen51. Archeo. Formatage des résultats pour 51 génomes[modifier | modifier le wikicode]
- Lien au tableur:
archées données intercalaires[modifier | modifier le wikicode]
- Lien tableur: archées données intercalaires
Intergen51. Archeo. Vue de l'ensemble[modifier | modifier le wikicode]
Intergen51. Archeo. La longueur totale des intercalaires d'un génome[modifier | modifier le wikicode]
- Note: voir la totale. Deux des archées présentent les taux les plus élevés de cette étude des 51 génomes, plus de 25% les 2 autres sont dans la moyenne des 12%.
Nom intercalaires génome taux en % archeo mba 1,341,425 4,837,408 27.7 mfe 987,074 3,914,091 25.2 mfi 403,834 2,478,074 16.3 mja 168,865 1,664,970 10.1
Intergen51. Archeo. Les différents types d'intercalaires[modifier | modifier le wikicode]
- Lien au tableur: Intergen51. Archeo. Les différents types d'intercalaires.
- Légende:
- - S pour intercalaire CDS-CDS et R pour tRNA-CDS,
- - c pour intercalaire continu (les 2 gènes sont sur le même brin) et x pour discontinu (les 2 gènes sont sur 2 brins différents, le brin et son complément)
- - %reste = 100*reste/total, le reste étant ce qui reste du total après la fin du diagramme, gamme.
- - %t30 = 100*t30/total, t30 étant le total des fréquences 10 20 30
- - %t5 = 100*t5/total, t5 étant le total des fréquences de -1 à -5 dans le diagramme des S-.
- Note:
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
Intergen51. Archeo. Détail des intercalaires RNA-RNA et CDS-rRNA[modifier | modifier le wikicode]
archeo RNA-RNA c x CDS-RNA c x 23s5s 9 CDS 16s 1 7 16s23s 4 5s CDS 1 7 16stRNA 6 16 CDS tRNA23s 6 CDS 5s 5stRNA 1 23s CDS tRNAin 0 CDS 23s 1 tRNAcontig 8 5s 16s 1 tRNAhors 49 1 16s16s tRNA16s 1 23stRNA tRNA5s 1 16s5s 5s23s 5s5s 1 total 86 1 total 2 16
Intergen51. Archeo. Les intercalaires rares[modifier | modifier le wikicode]
- Note:
tRNA-CDS gen x- c- c0 mfi -1 mba -12 1 mfe 1 tRNA h x+ mfe 227 5s5s c+ mfi 748 5s16s x+ mja 340
Intergen51. Archeo. Les diagrammes de la totale[modifier | modifier le wikicode]
Intergen51. Archeo. Les diagrammes CDS-CDS et tRNA-CDS[modifier | modifier le wikicode]
Intergen51. Archeo. Les diagrammes CDS-CDS et tRNA-CDS positifs[modifier | modifier le wikicode]
- Lien aux archées données intercalaires.
- Diagrammes des archeo: tar présente 4 diagrammes
- - fc40, CDS-CDS continu, fréquence unitaire en abscisses et effectif en ordonnées
- - fx% fc%, CDS-CDS discontinu continu, fréquences regroupées par 10 (freq10) en abscisses et pourcentage en ‰ par rapport au total, en ordonnées.
- - ftc, tRNA-CDS continu, fréquences regroupées par 10 (freq10) en abscisses et effectif en ordonnées
- - ftx, tRNA-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et effectif en ordonnées
- Équations des courbes de tendance en pour 1000: colonnes %fx %fc
Courbes de tendances pour les diagrammes en pour 1000 Calculs des f.41 et autres R2 des f.1 R2 x3 x2 x c Inflexion poly3 x c 0,691 6,84E-07 -5,39E-04 8,70E-02 1,78E+01 fx1 abscisse 250,9 762,1 0,856 -3,86E-06 2,91E-03 -7,27E-01 7,29E+01 fc1 ordonnée 16,3 5,6 poly3/droite 15,9 -22,9 0,753 1,78E-06 -1,34E-03 2,61E-01 7,03E+00 fx41 0,976 -9,36E-08 2,14E-04 -1,52E-01 3,86E+01 fc41 R2 f.1 x c Poly 3 691 856 0,578 -0,036 24,9 fx41 Poly 6 761 979 0,940 -0,072 32,0 fc41 Poly 9 774 991 0,575 -0,031 23,8 fx1 0,623 -0,112 43,1 fc1
Intergen51. Archeo. Les diagrammes CDS-CDS négatifs[modifier | modifier le wikicode]
Intergen51. Archeo. comparaison avec la totale[modifier | modifier le wikicode]
- Lien aux données intercalaires.
Sous-totaux archeo totale fréquence x- c- x- c- -1 0 106 4 4140 -2 3 0 85 11 -3 0 2 3 12 -4 34 354 717 10938 -5 1 2 5 19 sp6 62 423 1642 8424 total 100 887 2 456 23 544 reste 9 22 264 420 s6 27 10 361 41 s7 7 86 321 1438 s8 19 305 696 6525 rappot s1-5 4/2/1 11,3 3,3 8,4 2,6 % / sp6 s6/sp6 43,5 2,4 22,0 0,5 s7/sp6 11,3 20,3 19,5 17,1 s8/sp6 30,6 72,1 42,4 77,5 reste/sp6 14,5 5,2 16,1 5,0 total s1-5 38 464 814 15120 % / total %s1-5 38,0 52,3 33,1 64,2 %sp6 62,0 47,7 66,9 35,8
Intergen51. Archeo. homogénéité des génomes[modifier | modifier le wikicode]
- Lien aux données intercalaires des génomes
- Homogénéité des génomes:
- - Dans les discontinus mfe mfi mba sont homogènes pour s1-5/sp6 avec 1/4 et mja fait 1/1. Les 4 génomes sont hétérogènes pour le rapport 4/2, 4.0 ? 1.5 (mfe mfi mba) etsupérieur à 25 pour mja. Ils sont aussi hétérogènes pour s6 et s8, peut être homogènes pour s7.
- - Dans les continus les 4 génomes sont homogènes partout sauf mja qui a un rapport 4/1 de 2.0 contre plus de 3 pour les 3 autres. Les continus se distinguent des autres clades par un rapport s1-5/sp6 de 1/1 alors qu'en général il est de 1/4.
négatifs x mfe mfi mba mja total total 17 5 22 56 100 s1-5 5 1 6 26 38 sp6 12 4 16 30 62 rapport s1-5 4/2 4.0 - 1.5 - 11.3 % / sp6 s6 42 25 13 63 44 s7 17 0 13 10 11 s8 17 25 56 23 31 reste 25 50 19 3 15 % / total s1-5 29 20 27 46 38 sp6 71 80 73 54 62 négatifs c mfe mfi mba mja total total 250 167 307 163 887 s1-5 142 92 152 78 464 sp6 108 75 155 85 423 rapport s1-5 4/1 4.5 3.2 3.5 2.0 3.3 % / sp6 s6 3 0 5 0 2 s7 20 17 22 20 20 s8 74 73 70 73 72 reste 3 9 4 7 5 % / total s1-5 57 55 50 48 52 sp6 43 45 50 52 48
Intergen51. Archeo. Les grands négatifs inférieurs à -120[modifier | modifier le wikicode]
- Voir intergen51
Intergen51. Archeo. Les diagrammes CDS-rRNA[modifier | modifier le wikicode]
Intergen51. Archeo. Les diagrammes CDS-16s[modifier | modifier le wikicode]
- Lien au tableur: Les diagrammes CDS-16s.
- Les diagrammes
archeo CDS16sc CDS16sx 5sCDSc 5sCDSx R2 - - - - xs 454 799,8 857 410,4 plage 480 690-990 870 270-630 total-p 1 6 1 5 % 100 86 100 71 queue 0 1 0 1 % 0 14 0 14 tête 0 0 0 1 % 0 0 0 14 max 450;1 720;2 870;1 300;2 total4 1 7 1 7 freq 30 30 30 30
- Les moyennes par génome
|
|
Intergen51. Archeo. Les diagrammes 5s-CDS[modifier | modifier le wikicode]
voir données intercalaires
archeo 5sCDSc 5sCDSx ftx ftc R2 - - 0,127 0,393 xs 857 410,4 285,9 138,7 plage 870 270-630 40-250 40-300 total-p 1 5 48 102 % 100 71 43 65 queue 0 1 59 46 % 0 14 53 29 tête 0 1 4 5 % 0 14 4 3 max 870;1 300;2 250;5 200;9 total4 1 7 112 156 freq 30 30 10 10
Intergen51.archeo. Comparaison 5s-CDS tRNA-CDS CDS-CDS[modifier | modifier le wikicode]
- Lien tableur: Intergen51.archeo. Comparaison 5s-CDS tRNA-CDS CDS-CDS.
- Légende: Voir bacilli.
- Note: Sommes des différences ft*-f*, positives et négatives, dans les tableaux correspondants
ftx-fx 92,7 ftc-fc 127,4 ftx-fx -1,7 ftc-fc -19,6
|
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|
Intergen51. Archeo. Les CDS-rRNA rares[modifier | modifier le wikicode]
- CDS 23s x, 182.
Intergen51. Archeo. Les diagrammes RNA-RNA[modifier | modifier le wikicode]
Intergen51. Archeo. Les diagrammes rRNA-rRNA[modifier | modifier le wikicode]
- Lien au tableur: Les diagrammes rRNA-rRNA.
archeo 16s23s 16stRNA tRNA23s 23s5s R2 - - - - xs 202,5 76,0 185,8 110,6 plage 180-220 60-100 100-240 60-180 total-p 4 6 6 25 % 100 100 100 100 queue 0 0 0 0 % 0 0 0 0 tête 0 0 0 0 % 0 0 0 0 max 220;2 100;3 220;2 80;8 total8 4 6 6 25 freq 20 20 20 20
Intergen51. Archeo. Les diagrammes tRNA-rRNA[modifier | modifier le wikicode]
- Lien au tableur: Les diagrammes tRNA-rRNA.
|
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|
Intergen51. Archeo. Les diagrammes tRNA-tRNA[modifier | modifier le wikicode]
- Lien au tableur: Les diagrammes tRNA-tRNA.
Les diagrammes[modifier | modifier le wikicode]
type c S40 % R2 diag total reste x+ restes hors tRNA 5s 5stRNA hors 12 24 0,142 140 49 4 227 178 13 80 5s tRNA 0 1 1 223 tRNA 5s 1 1 1 504 tRNA contig tRNA contig 7 87 40 8 1 718 83
Les pourcentages des tRNA-tRNA hors blocs[modifier | modifier le wikicode]
tRNA h mba mja mfi mfe total % 20 2 4 0 6 12.2 40 2 2 2 6 12.2 60 3 1 4 8.2 80 6 2 4 12 24.5 100 3 1 3 2 9 18.4 120 2 4 6 12.2 140 1 1 2.0 160 180 1 1 2 4.1 200 220 240 1 1 2.0 260 restes 1 1 2 4.1 total 15 4 16 14 49 100.0 repete 4 0 0 5 9 26 séquence 2 0 0 2 4 11 sans 2 9 9 2 22 63 clusters 8 9 9 9 35 100 5 0 0 10 2 3 5 10.2 15 1 1 2.0 20 0 0
Les moyennes par génome[modifier | modifier le wikicode]
|
|
Intergen51. Archeo. Les RNA-RNA rares[modifier | modifier le wikicode]
- tRNA hors x+, mfe 227.
- tRNA 16s c+, 295.
- 5s5s c+, 748