Recherche:Les clusters de gènes tRNA et rRNA chez les procaryotes/Annexe/clostridia
Aller à la navigation
Aller à la recherche
- Annexe en préparation
Tanger le 3.11.19
Paeniclostridium sordellii AM370[modifier | modifier le wikicode]
psor opérons[modifier | modifier le wikicode]
- Liens: gtRNAdb, NCBI [1], génome [2]
- Lien tableur: psor opérons
- Phylogénie: Bacteria; Firmicutes; Clostridia; Clostridiales;Peptostreptococcaceae; Paeniclostridium.
- Légende: cdsa: cds aas, cdsj: cdsa sans jaune, cdsd: cdsa dirigé
- - @2, cds de 62 aas, hp, à allure répétitive susceptible d'être créé par contrainte lors des conversions ou d'autres réparations: MWLFFLFFFLFFFLFFFFFLFFFLFFFFFLFFFFFFPIVVLQTEINFRYGYIYTIHSGIIF
- - @4, riboswitch se trouve dans un bloc à rRNA. Concerne cette remarque aussi le RNA non codant, ncRNA, à l'adresse 19421..19685.
- Note: il n'y apas de gtRNAdb. Aussi j'ai comparé (EXACT NB.CAR STXT) les 1ers atgf atgi atgj du génome cdc, avec les atg de psor.
27.3%GC | 8.8.19 Paris | 112 | doubles | intercal | cds | aa | avec aa | cdsa | cdsd |
---|---|---|---|---|---|---|---|---|---|
9847..10620 | CDS | 205 | 205 | 258 | |||||
10826..12332 | 16s | 196 | |||||||
12529..15445 | 23s | 78 | |||||||
15524..15640 | 5s | 85 | 85 | 85 | |||||
15726..15947 | CDS | 74 | |||||||
18845..19297 | CDS | 3 | 3 | 151 | 3 | ||||
19301..19393 | tcc | 27 | |||||||
19421..19685 | ncRNA | 152 | 152 | ||||||
19838..21478 | CDS | *547 | |||||||
24343..24570 | CDS | 309 | 309 | 76 | |||||
24880..26386 | 16s | 196 | |||||||
26583..29499 | 23s | 122 | |||||||
29622..29738 | 5s | 5 | 5 | ||||||
29744..29832 | tta | + | 13 | 13 | |||||
29846..29921 | atgf | 3 aaa | 15 | 15 | |||||
29937..30011 | gaa | 6 atg | 9 | 9 | |||||
30021..30094 | gga | 3 gta | 6 | 6 | |||||
30101..30176 | gta | 1 cgt | 5 | 5 | |||||
30182..30258 | gac | 1 ggc | 16 | 16 | |||||
30275..30350 | aac | 2 fois suite | 4 | 4 | |||||
30355..30429 | aca | aac aca aga | 4 | 4 | |||||
30434..30518 | tac | caa cac cca | 15 | 15 | |||||
30534..30617 | cta | cta gaa gac | 14 | 14 | |||||
30632..30708 | aga | gga tac tca | 7 | 7 | |||||
30716..30791 | caa | tgc tta ttc | 11 | 11 | |||||
30803..30878 | aaa | 6 | 6 | ||||||
30885..30973 | tca | 3 | 3 | ||||||
30977..31052 | ttc | 9 | 9 | ||||||
31062..31138 | atgj | 8 | 8 | ||||||
31147..31223 | atgi | 21 | 21 | ||||||
31245..31321 | cca | 6 | 6 | ||||||
31328..31404 | cac | 4 | 4 | ||||||
31409..31482 | tgc | 25 | 25 | ||||||
31508..31596 | tta | 13 | 13 | ||||||
31610..31685 | atgf | 15 | 15 | ||||||
31701..31775 | gaa | 9 | 9 | ||||||
31785..31858 | gga | 6 | 6 | ||||||
31865..31940 | gta | 5 | 5 | ||||||
31946..32022 | gac | 16 | 16 | ||||||
32039..32114 | aac | 4 | 4 | ||||||
32119..32193 | aca | 4 | 4 | ||||||
32198..32282 | tac | 15 | 15 | ||||||
32298..32381 | cta | 11 | 11 | ||||||
32393..32467 | ggc | 13 | 13 | ||||||
32481..32557 | aga | 7 | 7 | ||||||
32565..32640 | caa | 11 | 11 | ||||||
32652..32727 | aaa | 6 | 6 | ||||||
32734..32822 | tca | 3 | 3 | ||||||
32826..32901 | ttc | 9 | 9 | ||||||
32911..32987 | atgj | 8 | 8 | ||||||
32996..33072 | atgi | 21 | 21 | ||||||
33094..33170 | cca | 6 | 6 | ||||||
33177..33253 | cac | 9 | 9 | ||||||
33263..33338 | aaa | 21 | 21 | ||||||
33360..33433 | tgc | 6 | 6 | ||||||
33440..33516 | cgt | 10 | |||||||
33527..33602 | gta | 162 | 162 | 162 | |||||
33765..34016 | CDS | 84 | |||||||
34042..34455 | CDS | 249 | 249 | 138 | |||||
34705..36211 | 16s | 196 | |||||||
36408..39324 | 23s | 78 | |||||||
39403..39519 | 5s | 402 | *402 | ||||||
comp | 39922..40113 | CDS | 348 | 348 | 64 | ||||
40462..41968 | 16s | 196 | |||||||
42165..45081 | 23s | 78 | |||||||
45160..45276 | 5s | 180 | 180 | *180 | |||||
45457..47394 | CDS | *646 | |||||||
101428..102144 | CDS | 276 | 276 | 239 | |||||
102421..103927 | 16s | 54 | |||||||
103982..104057 | gca | 114 | |||||||
104172..107096 | 23s | 41 | |||||||
107138..107211 | gga | 11 | |||||||
107223..107339 | 5s | 99 | 99 | 99 | |||||
comp | 107439..108617 | CDS | 393 | ||||||
111345..111884 | CDS | 431 | *431 | 180 | |||||
112316..113822 | 16s | 54 | |||||||
113877..113952 | gca | 114 | |||||||
114067..116982 | 23s | 193 | |||||||
117176..117292 | 5s | 5 | |||||||
117298..117386 | tta | 9 | 9 | ||||||
117396..117472 | atgi | 123 | |||||||
117596..119102 | 16s | 54 | |||||||
119157..119232 | gca | 114 | |||||||
119347..122263 | 23s | 193 | |||||||
122457..122573 | 5s | 5 | |||||||
122579..122667 | tta | 9 | 9 | ||||||
122677..122753 | atgi | 123 | |||||||
122877..124383 | 16s | 54 | |||||||
124438..124513 | gca | 114 | |||||||
124628..127549 | 23s | 78 | |||||||
127628..127744 | 5s | 100 | 100 | 100 | |||||
127845..129260 | CDS | 472 | |||||||
215388..216260 | CDS | 264 | 264 | 291 | |||||
216525..218030 | 16s | 123 | |||||||
218154..218229 | gca | 152 | |||||||
218382..221296 | 23s | 50 | |||||||
221347..221420 | gga | 12 | |||||||
221433..221549 | 5s | 109 | 109 | 109 | |||||
221659..221940 | CDS | 525 | *525 | 94 | |||||
222466..223972 | 16s | 196 | |||||||
224169..227083 | 23s | 144 | |||||||
227228..227344 | 5s | 228 | 228 | *228 | |||||
227573..227989 | CDS | 139 | |||||||
449964..450266 | CDS | 253 | 253 | 101 | |||||
450520..452026 | 16s | 196 | |||||||
452223..455139 | 23s | 144 | |||||||
455284..455400 | 5s | 112 | 112 | 112 | |||||
comp | 455513..456616 | CDS | 368 | ||||||
498418..499074 | CDS | 189 | 189 | 219 | |||||
499264..500770 | 16s | 118 | |||||||
500889..500964 | gca | 95 | |||||||
501060..503976 | 23s | 144 | |||||||
504121..504237 | 5s | 131 | 131 | 131 | |||||
504369..504551 | CDS | 61 | |||||||
546886..550416 | CDS | 41 | 41 | *1177 | *41 | ||||
comp | 550458..550544 | ttg | 138 | 138 | |||||
550683..553325 | CDS | *881 | |||||||
608009..608683 | CDS | 195 | 195 | 225 | |||||
608879..608975 | tga | 37 | 37 | 37 | |||||
comp | 609013..609732 | CDS | 240 | ||||||
815939..816655 | CDS | 71 | 71 | 239 | 71 | ||||
816727..816800 | tgc | 12 | 12 | ||||||
816813..816888 | aac | 3 | 3 | ||||||
816892..816966 | aca | 285 | 285 | ||||||
817252..818727 | CDS | 492 | |||||||
1284870..1288097 | CDS | 111 | 111 | *1076 | *111 | ||||
1288209..1288297 | cta | 426 | *426 | ||||||
1288724..1290853 | CDS | *710 | |||||||
1445161..1445664 | CDS | 135 | 135 | 168 | 135 | ||||
1445800..1445868 | other | @1 | 258 | 258 | |||||
1446127..1446813 | CDS | 229 | |||||||
2267513..2267698 | CDS | @2 | 306 | 306 | 62 | *306 | |||
comp | 2268005..2268088 | cta | 404 | *404 | |||||
2268493..2269758 | CDS | 422 | |||||||
3094098..3094784 | CDS | 40 | 40 | 229 | 40 | ||||
comp | 3094825..3094941 | 5s | 78 | ||||||
comp | 3095020..3097936 | 23s | 194 | ||||||
comp | 3098131..3099637 | 16s | 276 | 276 | |||||
comp | 3099914..3101161 | CDS | 416 | ||||||
3159922..3160827 | CDS | 37 | 37 | 302 | 37 | ||||
comp | 3160865..3160956 | agc | 120 | 120 | |||||
comp | 3161077..3161376 | CDS | 100 | ||||||
comp | 3274188..3274733 | CDS | 245 | 245 | 182 | *245 | |||
comp | 3274979..3275095 | 5s | @3 | 12 | |||||
comp | 3275108..3275181 | gga | 107 | ||||||
comp | 3275289..3278214 | 23s | 137 | ||||||
comp | 3278352..3279858 | 16s | 253 | 253 | |||||
comp | 3280112..3280690 | CDS | 193 | ||||||
comp | 3303104..3304150 | CDS | 124 | 124 | 349 | 124 | |||
comp | 3304275..3304459 | riboswitch | @4 | 96 | |||||
comp | 3304556..3304672 | 5s | 11 | ||||||
comp | 3304684..3304758 | aca | 116 | ||||||
comp | 3304875..3307789 | 23s | 196 | ||||||
comp | 3307986..3309492 | 16s | 364 | *364 | |||||
3309857..3310504 | CDS | 216 | |||||||
comp | 3438683..3439531 | CDS | 142 | 142 | 283 | 142 | |||
comp | 3439674..3439750 | aga | 7 | 7 | |||||
comp | 3439758..3439832 | ggc | 9 | 9 | |||||
comp | 3439842..3439918 | gac | 5 | 5 | |||||
comp | 3439924..3439999 | gta | 8 | 8 | |||||
comp | 3440008..3440082 | gaa | 5 | ||||||
comp | 3440088..3440204 | 5s | 40 | ||||||
comp | 3440245..3443168 | 23s | 112 | ||||||
comp | 3443281..3443356 | gca | 109 | ||||||
comp | 3443466..3444972 | 16s | 138 | ||||||
comp | 3445111..3445187 | atgj | + | 13 | 13 | ||||
comp | 3445201..3445276 | ttc | 3 atg | 6 | 6 | ||||
comp | 3445283..3445359 | atc | 2 cca | 6 | 6 | ||||
comp | 3445366..3445442 | cca | 2 gga | 31 | 31 | ||||
comp | 3445474..3445549 | tgg | 2 aac | 11 | 11 | ||||
comp | 3445561..3445637 | atgi | 6 | 6 | |||||
comp | 3445644..3445720 | cca | 6 | 6 | |||||
comp | 3445727..3445817 | agc | 11 | 11 | |||||
comp | 3445829..3445917 | tca | 6 | 6 | |||||
comp | 3445924..3445999 | aaa | 12 | 12 | |||||
comp | 3446012..3446087 | caa | 6 | 6 | |||||
comp | 3446094..3446170 | aga | 19 | 19 | |||||
comp | 3446190..3446263 | gga | 11 | 11 | |||||
comp | 3446275..3446359 | tac | 4 | 4 | |||||
comp | 3446364..3446438 | aca | 4 | 4 | |||||
comp | 3446443..3446518 | aac | 31 | 31 | |||||
comp | 3446550..3446625 | aac | 16 | 16 | |||||
comp | 3446642..3446718 | gac | 5 | 5 | |||||
comp | 3446724..3446799 | gta | 6 | 6 | |||||
comp | 3446806..3446879 | gga | 9 | 9 | |||||
comp | 3446889..3446963 | gaa | 15 | 15 | |||||
comp | 3446979..3447054 | atgf | 13 | 13 | |||||
comp | 3447068..3447156 | tta | 5 | ||||||
comp | 3447162..3447278 | 5s | 213 | ||||||
comp | 3447492..3450406 | 23s | 196 | ||||||
comp | 3450603..3452109 | 16s | 239 | 239 | |||||
comp | 3452349..3452552 | CDS | 68 | ||||||
comp | 3523330..3524046 | CDS | 129 | 129 | 239 | 129 | |||
comp | 3524176..3524251 | gta | + | 8 | 8 | ||||
comp | 3524260..3524334 | gaa | 2 fois | 20 | 20 | ||||
comp | 3524355..3524430 | aaa | gta gaa aaa | 10 | 10 | ||||
comp | 3524441..3524515 | aca | 10 | 10 | |||||
comp | 3524526..3524602 | gac | 7 | 7 | |||||
comp | 3524610..3524685 | gta | 9 | 9 | |||||
comp | 3524695..3524769 | gaa | 5 | 5 | |||||
comp | 3524775..3524850 | aaa | 289 | 289 | |||||
3525140..3526039 | CDS | 300 |
psor cumuls[modifier | modifier le wikicode]
- Lien tableur: psor cumuls
opérons | Fréquences intercalaires tRNAs | Fréquences intercalaires cds | Fréquences aas cds | ||||||||
---|---|---|---|---|---|---|---|---|---|---|---|
effectif | gammes | sans rRNAs | avec rRNAs | gammes | cds | gammes | cdsd | gammes | cdsa | ||
avec rRNA | opérons | 17 | 1 | 0 | 0 | 1 | 0 | 1 | 0 | 100 | 9 |
16 23 5s 0 | 6 | 20 | 9 | 65 | 50 | 5 | 20 | 1 | 200 | 8 | |
16 atc gca | 0 | 40 | 0 | 6 | 100 | 4 | 40 | 3 | 300 | 13 | |
16 23 5s a | 2 | 60 | 0 | 0 | 150 | 10 | 60 | 1 | 400 | 4 | |
max a | 44 | 80 | 0 | 0 | 200 | 5 | 80 | 1 | 500 | 4 | |
a doubles | 2 | 100 | 0 | 0 | 250 | 5 | 100 | 3 | 600 | 1 | |
autres | 9 | 120 | 0 | 0 | 300 | 8 | 120 | 3 | 700 | 1 | |
total aas | 87 | 140 | 0 | 0 | 350 | 3 | 140 | 4 | 800 | 1 | |
sans | opérons | 8 | 160 | 0 | 0 | 400 | 1 | 160 | 1 | 900 | 1 |
1 aa | 6 | 180 | 0 | 0 | 450 | 4 | 180 | 2 | 1000 | 0 | |
max a | 8 | 200 | 0 | 0 | 500 | 0 | 200 | 0 | 1100 | 1 | |
a doubles | 1 | 0 | 0 | 1 | 3 | 1 | |||||
total aas | 17 | 9 | 71 | 46 | 22 | 44 | |||||
total aas | 104 | ||||||||||
remarques | 4 | ||||||||||
avec jaune | moyenne | 9 | 10 | 206 | 119 | 304 | |||||
variance | 5 | 6 | 121 | 73 | 257 | ||||||
sans jaune | moyenne | 173 | 95 | 220 | |||||||
variance | 90 | 45 | 121 |
psor tRNA-cds[modifier | modifier le wikicode]
- Note: intercalaires prélevés de la colonne cds de psor opérons dans un bloc de tRNAs uniquement. Le début du bloc est dans l'ordre des adresses, deb intercalaire entre le cds et le 1er tRNA dd bloc, fin entre le dernier tRNA et le cds terminal. J'ai procédé, dans les colonnes petit et grand, à la réorientation des blocs d'après la constatation que les blocs à rRNA ont leurs cds de début et de fin sont orientés du cds-16s au 5s-tRNAs-cds, l'intercalaire cds-16s étant plus grands que l'intercalaire avec le cds terminal. En tête de colonne est le % du nombre des intercalaires inférieurs à 201 pbs.
psor 89 44 44 89 deb fin deb fin grand petit grand petit 3 27 3 27 27 3 27 3 37 120 195 37 120 37 120 37 41 138 37 120 138 41 195 37 71 285 41 138 195 37 138 41 111 426 135 258 258 135 285 71 129 289 71 285 285 71 426 111 135 258 129 289 289 129 289 129 195 37 306 404 404 306 258 135 306 404 111 426 426 111 404 306
- Comparaison cds-cds tRNA-cds: deb fin, c'est l'ordre des adresses et grand petit l'ordre après réorientation. Leur pourcentage est calculé par rapport à la colonne, c'est à dire la moitié du total des tRNA-cds.
clostridia cds total total <0 0-200 201-370 371-600 >600 deb fin grand petit psor 3,368 18 12 4 2 8 4 4 8 ‰ 667 222 111 889 444 444 889
psor blocs[modifier | modifier le wikicode]
- Lien tableur: psor blocs
- Lien cdc blocs: le tabeau de cdc blocs est à comparer à celui de psor pour les types manquants, en gris dans cdc blocs.
- Légende:
- - Les blocs sont rangés par type de I à IV pour les blocs 16s23s et de V à X pour les blocs 16sgca23s. Chaque bloc est noté par son type suivi d'un indice.
- - La 1ère partie du tableau représente la totalité des blocs; la 2ème les groupes où les blocs se suivent avec des intercalaires très faibles. Seul l'intercalaire séparant le bloc V2 de I4 est élevé et le plus grand du tableau, 525. Je considère qu'un intercalaire inférieur à 350 est faible relativement aux intercalaires intra bloc. Les intercalaires avec les CDS sont faibles ici puisque seulement 3 sont supérieurs à 350, 402 (I2), 431 (VI1) et 525 (I4). Voir le tableau des cumuls pour tout les intercalaires des cds où seulement 6 sur 46 dépassent 350, avec une moyenne de 173±90.
- - Les couleurs, rouge pour rRNA, vert pour une configuration peu courante, un gène tRNA entre 23s et 5s, et ribosw pour riboswitch. Le cyan pour repérer le même intercalaire par rapport à la direction 16s23s5s quand elle change quand on a des adresses complément.
- Notes:
- - 3 blocs avec des tRNAs longs, 44 23 5, concentrant les 2/3 des tRNAs avec des blocs 16s23s. 15 tRNAs sont dans des blocs courts ou 16sgca23s. Les tRNAs extra blocs sont 17.
- - 10 blocs 16s23s contre 7 blocs 16sgca23s
- - Le regroupement des blocs par 3 et 2 concerne 10 blocs et restent donc 7 blocs solitaires, 3 sans tRNA et 4 avec 1 ou 2 tRNA.
- - Existence de 4 cds intra groupe de petite taille en aas, 84 138 64 pour le 2èmer groupe, et 94 pour le 4ème groupe.
- - Le 1er groupe de 3 blocs n'a pas de cds internes et est constitué de la duplication d'un même bloc.
- - Des intercalaires très faibles inter blocs
- - Des intercalaires intra blocs qui se répètent beaucoup mais peuvent être divisés ou multipliés par 2.
- - note du 25.3.21, 348' pour complement à cheval sur 2 adresses 348' et souligné pour dire que le cds est partagé entre 2 blocs.
intercalaire Total 16s-23s 9*196 137 10 23s-5s 5*78 4*144 3*193 40 13 16s-gca 4*54 3*120 7 gca-23s 5*114 95 152 7 5s-aas 4*5 (tta) 5 (gaa) 5
I | I2 | I3 | I4 | II | III | IV | IV1 | IV2 | |||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
CDS | 124 | ||||||||||||
CDS | 245 | ribosw | 96 | ||||||||||
CDS | 205 | 249 | 348' | 525 | 253 | 40' | 5s | 12 | 5s | 11 | CDS | 309 | 5 |
16s | 196 | 196 | 196 | 196 | 196 | 78 | gga | 107 | aca | 116 | 16s | 196 | 213 |
23s | 78 | 78 | 78 | 144 | 144 | 194 | 23s | 137 | 23s | 196 | 23s | 122 | 196 |
5s | 85 | 402' | 180 | 228 | 112' | 276 | 16s | 253 | 16s | 364' | 5s | 5 | 239 |
CDS | CDS | CDS | tta | ||||||||||
V | V2 | VI | VI1 | VII | VII1 | VIII | VIII1 | IX | X | X1 | |||
CDS | 276 | 264 | CDS | 431 | CDS | 189 | gaa | 5 | |||||
16s | 54 | 123 | 16s | 54 | 16s | 54 | 16s | 54 | 16s | 118 | 5s | 40 | |
gca | 114 | 152 | gca | 114 | gca | 114 | gca | 114 | gca | 95 | 23s | 112 | |
23s | 41 | 50 | 23s | 193 | 23s | 193 | 23s | 78 | 23s | 144 | gca | 109 | |
gga | 11 | 12 | 5s | 5 | 5s | 5 | 5s | 100 | 5s | 131 | 16s | 138 | |
5s | 99' | 109 | tta | 9 | tta | 9 | CDS | CDS | atgj | ||||
CDS | atgi | 123 | atgi | 123 | |||||||||
groupe1 | groupe2 | groupe3 | groupe4 | ||||||||||
CDS | 431 | CDS | 309 | CDS | 142 | CDS | 264 | ||||||
VI1 | 16s | 54 | IV1 | 16s | 196 | **4aas | 8 | V2 | 16s | 123 | |||
gca | 114 | 23s | 122 | gaa | 5 | gca | 152 | ||||||
23s | 193 | 5s | 5 | 5s | 40 | 23s | 50 | ||||||
5s | 5 | tta | 13 | 23s | 112 | gga | 12 | ||||||
tta | 9 | **42aas | 10 | gca | 109 | 5s | 109 | ||||||
atgi | 123 | gta | 162 | X1 | 16s | 138 | CDS | 525 | |||||
VII1 | 16s | 54 | CDS | 25 | atgj | 13 | I4 | 16s | 196 | ||||
gca | 114 | CDS | 249 | **21aas | 13 | 23s | 144 | ||||||
23s | 193 | I2 | 16s | 196 | tta | 5 | 5s | 228 | |||||
5s | 5 | 23s | 78 | 5s | 213 | CDS | |||||||
tta | 9 | 5s | 402 | 23s | 196 | ||||||||
atgi | 123 | CDS | 348 | IV2 | 16s | 239 | |||||||
VIII1 | 16s | 54 | I3 | 16s | 196 | CDS | |||||||
gca | 114 | 23s | 78 | ||||||||||
23s | 78 | 5s | 180 | ||||||||||
5s | 100 | CDS | |||||||||||
CDS |
psor remarques[modifier | modifier le wikicode]
- Lien tableur: psor remarques
- Nombre de gènes protéines: 3327 (NCBI)
- Rmarques @:
- - Un tRNA nommé other, non déterminé
- - cds de 62 aas, hp, à allure répétitive susceptible d'être créé par contrainte lors des conversions ou d'autres réparations: MWLFFLFFFLFFFLFFFFFLFFFLFFFFFLFFFFFFPIVVLQTEINFRYGYIYTIHSGIIF
- - une configuration rare 23s-aas-5s concerne 3 gga et 1 aca
- - Les RNAs non codants: riboswitch dans un bloc à rRNA et ncRNA dans un bloc sans rRNA, adresse 19421..19685.
- Configuration des blocs: voir psor blocs.
- Les séquences des doubles: Il y a très peu de doubles mais des duplications de séquences. Le signe + dans psor opérons indique les doubles.
- - séquence 44 aas: voir psor opérons, la couleur cyan pour la duplication de 20 aas et la couleur verte pour les insertions. Je n'ai pas pu distingué les 3 types d'atg dans 6 atg, qui certainement doivent être départagés en 2 atgf 2 atgj 2 atgi. Ce qui laisse 2 doubles aaa et gta.
- - séquence 23 aas: voir ci-dessous l'analogie de séquence entre 23 aas et le début de 44 aas. Seuls 3 aas ont des doubles cca gga aac, aucune séquence n'est dupliquée.
- - séquence 5 aas, c'est une petite séquence simple à la suite du blocs 23aas. Est-ce le fait d'être dans un bloc 416s-gca-23s?
- - séquence 8 aas: voir psor opérons, adresse 3523330..3524046, duplication de 3 aas. Est-ce que ça ne serait pas une séquence détachée d'un bloc 16s23s5s comme les 2 autres longs blocs.
23aas tta atg gaa gga gta gac aac aac aca tac gga aga caa aaa tca agc cca atg tgg cca atc ttc atg 44aas tta atg gaa gga gta gac aac aca tac cta aga caa aaa tca ttc atg atg cca cac - - - -
psor distribution[modifier | modifier le wikicode]
- Lien tableur: psor distribution
- Notes: tableau Cl12 blocs à de 3 tRNAs sauf
- - -5s: 3 gga et aca
- - 1-3 aas: 2 tta et 2 atgi
|
|
psor. Intergen51[modifier | modifier le wikicode]
Intergen51. psor. Le génome[modifier | modifier le wikicode]
- psor Le prélèvement: Aclostridia
- Le nom et le lien NCBI: psor, Paeniclostridium sordellii strain AM370 chromosome, NCBI [3], date 8.1.18.
- psor La longueur totale des intercalaires, longueur du génome et taux intercalaires/génome:
Nom intercals génome taux en % psor 450,598 3,550,458 12.7
psor données intercalaires[modifier | modifier le wikicode]
- Lien tableur: psor données intercalaires
- Lien sauvegarde NCBI: Aclostridia
psor données intercalaires 200[modifier | modifier le wikicode]
- Lien tableur: données intercalaires 200.
psor autres intercalaires aas[modifier | modifier le wikicode]
- Lien tableur: psor autres intercalaires aas
- Lien sauvegarde NCBI: Aclostridia
Intergen51. psor. Les différents types d'intercalaires[modifier | modifier le wikicode]
- Lien au tableur: Intergen51. psor les différents types d'intercalaires.
- Légende:
- - S pour intercalaire CDS-CDS et R pour tRNA-CDS,
- - c pour intercalaire continu (les 2 gènes sont sur le même brin) et x pour discontinu (les 2 gènes sont sur 2 brins différents, le brin et son complément)
- - %reste = 100*reste/total, le reste étant ce qui reste du total après la fin du diagramme, gamme.
- - %t30 = 100*t30/total, t30 étant le total des fréquences 10 20 30
- - %t5 = 100*t/total, t5 étant le total des fréquences de -1 à -5 dans le diagramme des S-.
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
Intergen51. psor. Les diagrammes CDS-CDS positifs[modifier | modifier le wikicode]
- Lien tableur: Les diagrammes
- Diagrammes des gamma: psor présente 2 diagrammes
- - fc40, CDS-CDS continu, fréquence unitaire en abscisses et effectif en ordonnées
- - fx%, CDS-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et pourcentage en ‰ par rapport au total, en ordonnées.
- Équations des courbes de tendance en pour 1000: colonnes %fx %fc
Courbes de tendances pour les diagrammes en pour 1000 Calculs des f.41 psor R2 x3 x2 x c Inflexion poly3 x c 0.515 5.62E-07 -4.32E-04 -9.67E-03 39.1 fx1 abscisse 210.1 219.5 0.718 -5.50E-06 4.12E-03 -1.07E+00 103.0 fc1 ordonnée 22.1 16.3 0.636 -1.22E-06 7.69E-04 -2.40E-01 49.9 fx41 0.926 3.28E-06 -2.16E-03 3.12E-01 17.2 fc41
Intergen51. psor. Les CDS-CDS négatifs[modifier | modifier le wikicode]
Sous-totaux psor totale fréquence x- c- x- c- - 1 0 52 4 4140 - 2 0 0 85 11 - 3 0 0 3 12 - 4 1 23 717 10938 - 5 0 3 5 19 sp6 2 157 1642 8424 total 3 235 2,456 23,544 reste 1 1 264 420 s6 0 0 361 41 s7 0 27 321 1438 s8 1 129 696 6525 rappot s1-5 4/2/1 - 0.4 8.4 2.6 % / sp6 s6/sp6 0.0 0.0 22.0 0.5 s7/sp6 0.0 17.2 19.5 17.1 s8/sp6 50.0 82.2 42.4 77.5 reste/sp6 50.0 0.6 16.1 5.0 total s1-5 1 78 814 15120 % / total %s1-5 33.3 33.2 33.1 64.2 %sp6 66.7 66.8 66.9 35.8
Intergen51. psor. Les intercalaires des blocs[modifier | modifier le wikicode]
- Le détail
RNA-RNA c x CDS-RNA c x 23s 5s 13 CDS 16s 11 3 16s 23s 10 5s CDS 7 4 16s tRNA 7 16 CDS tRNA 23s 7 CDS 5s 5s tRNA 5 23s CDS tRNA in 2 CDS 23s tRNA contig 69 5s 16s tRNA hors 9 16s16s tRNA 16s 3 23s tRNA 4 tRNA 5s 4 16s 5s 5s 23s 5s 5s total 133 0 total 18 7
- Les rares voir gamma pour la longueur des intercalaires
- Les tRNA-CDS compris, comparaison dans le clade et dans l'étude.
Intergen51. psor. Les intercalaires tRNA-tRNA extra bloc[modifier | modifier le wikicode]
- Lien tableur: Intergen51. psor. Les intercalaires tRNA-tRNA extra bloc
cont1 | cont2 | cont3 | cont4 | |||||||
---|---|---|---|---|---|---|---|---|---|---|
inter | aa | inter | aa | inter | aa | inter | aa | |||
13 | tta | 9 | gaa | 7 | aga | 4 | aca | |||
15 | atgf | 6 | gga | 9 | ggc | 31 | aac | |||
9 | gaa | 5 | gta | 5 | gac | 16 | aac | |||
6 | gga | 16 | gac | 8 | gta | 5 | gac | |||
5 | gta | 4 | aac | ** | gaa | 6 | gta | |||
16 | gac | 4 | aca | 13 | atgj | 9 | gga | |||
4 | aac | 15 | tac | 6 | ttc | 15 | gaa | |||
4 | aca | 11 | cta | 6 | atc | 13 | atgf | |||
15 | tac | 13 | ggc | 31 | cca | ** | tta | |||
14 | cta | 7 | aga | 11 | tgg | |||||
7 | aga | 11 | caa | 6 | atgi | hors | ||||
11 | caa | 6 | aaa | 6 | cca | 12 | tgc | |||
6 | aaa | 3 | tca | 11 | agc | 3 | aac | |||
3 | tca | 9 | ttc | 6 | tca | ** | aca | |||
9 | ttc | 8 | atgj | 12 | aaa | 8 | gta | |||
8 | atgj | 21 | atgi | 6 | caa | 20 | gaa | |||
21 | atgi | 6 | cca | 19 | aga | 10 | aaa | |||
6 | cca | 9 | cac | 11 | gga | 10 | aca | |||
4 | cac | 21 | aaa | 4 | tac | 7 | gac | |||
25 | tgc | 6 | tgc | 9 | gta | |||||
13 | tta | 10 | cgt | 5 | gaa | |||||
15 | atgf | ** | gta | ** | aaa | |||||
- |
Peptoclostridium difficile CD196[modifier | modifier le wikicode]
cdc opérons[modifier | modifier le wikicode]
- Liens: gtRNAdb [4], NCBI [5], génome [orgn]
- Lien tableur: cdc opérons
- Phylogénie: Bacteria; Firmicutes; Clostridia; Clostridiales;Peptostreptococcaceae; Clostridioides.
- Légende: cdsa: cds aas, cdsd: cds dirigé
28.6%GC | 11.9.19 Paris | 83 | doubles | intercal | cds | aa | avec aa | cdsa | cdsd | protéines |
---|---|---|---|---|---|---|---|---|---|---|
dir | 9857..10630 | cds | 179 | 179 | 258 | SigB/SigF/SigG family RNA polymerase sigma factor | ||||
dir | 10810..12317 | 16s | 52 | |||||||
dir | 12370..12445 | gca | 249 | |||||||
dir | 12695..15596 | 23s | 111 | |||||||
dir | 15708..15824 | 5s | 126 | 126 | 126 | |||||
dir | 15951..16460 | cds | 170 | transcription repressor NadR | ||||||
dir | 19402..19857 | cds | 0 | 0 | 152 | 0 | nucleoside deaminase | |||
dir | 19858..19949 | tcc | 37 | |||||||
dir | 19987..20251 | ncRNA | @1 | 76 | 76 | |||||
dir | 20328..21965 | cds | 546 | DNA polymerase III subunit gamma/tau | ||||||
comp | 23419..24624 | cds | 505 | *505 | 402 | glycosyl transferase | ||||
dir | 25130..26637 | 16s | 279 | |||||||
dir | 26917..29816 | 23s | + | 180 | ||||||
dir | 29997..30113 | 5s | 3 aaa | 6 | ||||||
dir | 30120..30194 | aac | 3 gta | 6 | 6 | |||||
dir | 30201..30286 | tta | 15 | 15 | ||||||
dir | 30302..30377 | atgf | 7 | 7 | ||||||
dir | 30385..30459 | gaa | 9 | 9 | ||||||
dir | 30469..30542 | gga | 5 | 5 | ||||||
dir | 30548..30623 | gta | 5 | 5 | ||||||
dir | 30629..30705 | gac | 9 | 9 | ||||||
dir | 30715..30789 | aca | 14 | 14 | ||||||
dir | 30804..30888 | tac | 8 | 8 | ||||||
dir | 30897..30980 | cta | 29 | 29 | ||||||
dir | 31010..31086 | aga | 7 | 7 | ||||||
dir | 31094..31169 | caa | 88 | 88 | ||||||
dir | 31258..31346 | tca | 3 | 3 | ||||||
dir | 31350..31425 | ttc | 6 | 6 | ||||||
dir | 31432..31508 | atgj | 11 | 11 | ||||||
dir | 31520..31596 | atgi | 23 | 23 | ||||||
dir | 31620..31696 | cca | 7 | 7 | ||||||
dir | 31704..31780 | cac | 8 | 8 | ||||||
dir | 31789..31864 | aaa | 7 | 7 | ||||||
dir | 31872..31945 | tgc | 6 | 6 | ||||||
dir | 31952..32026 | aac | 5 | 5 | ||||||
dir | 32032..32117 | tta | 15 | 15 | ||||||
dir | 32133..32208 | atgf | 7 | 7 | ||||||
dir | 32216..32290 | gaa | 9 | 9 | ||||||
dir | 32300..32373 | gga | 5 | 5 | ||||||
dir | 32379..32454 | gta | 5 | 5 | ||||||
dir | 32460..32536 | gac | 9 | 9 | ||||||
dir | 32546..32620 | aca | 14 | 14 | ||||||
dir | 32635..32719 | tac | 9 | 9 | ||||||
dir | 32729..32812 | cta | 23 | 23 | ||||||
dir | 32836..32910 | ggc | 24 | 24 | ||||||
dir | 32935..33011 | aga | 9 | 9 | ||||||
dir | 33021..33096 | caa | 8 | 8 | ||||||
dir | 33105..33180 | aaa | 2 | 2 | ||||||
dir | 33183..33271 | tca | 3 | 3 | ||||||
dir | 33275..33350 | ttc | 6 | 6 | ||||||
dir | 33357..33433 | atgj | 11 | 11 | ||||||
dir | 33445..33521 | atgi | 17 | 17 | ||||||
dir | 33539..33615 | cac | 8 | 8 | ||||||
dir | 33624..33699 | aaa | 7 | 7 | ||||||
dir | 33707..33780 | tgc | 7 | 7 | ||||||
dir | 33788..33864 | cgt | 12 | 12 | ||||||
dir | 33877..33952 | gta | 75 | 75 | 75 | |||||
dir | 34028..34441 | cds | 308 | 308 | 138 | hp | ||||
dir | 34750..38181 | cds | 1144 | pyruvate carboxylase | ||||||
dir | 127011..127715 | cds | 281 | 281 | 235 | N-acetylmuramoyl-L-alanine amidase CwlD | ||||
dir | 127997..129505 | 16s | 279 | |||||||
dir | 129785..132685 | 23s | + | 131 | ||||||
dir | 132817..132933 | 5s | 2 cca | 6 | ||||||
dir | 132940..133014 | aac | 4 | 4 | ||||||
dir | 133019..133093 | gaa | 5 | 5 | ||||||
dir | 133099..133174 | gta | 5 | 5 | ||||||
dir | 133180..133256 | gac | 10 | 10 | ||||||
dir | 133267..133341 | aca | 14 | 14 | ||||||
dir | 133356..133440 | tac | 9 | 9 | ||||||
dir | 133450..133523 | gga | 10 | 10 | ||||||
dir | 133534..133610 | aga | 9 | 9 | ||||||
dir | 133620..133695 | caa | 11 | 11 | ||||||
dir | 133707..133782 | aaa | 2 | 2 | ||||||
dir | 133785..133873 | tca | 17 | 17 | ||||||
dir | 133891..133981 | agc | 8 | 8 | ||||||
dir | 133990..134066 | cca | 85 | 85 | ||||||
dir | 134152..134227 | tgg | 60 | 60 | ||||||
dir | 134288..134364 | cca | 6 | 6 | ||||||
dir | 134371..134447 | atc | 3 | 3 | ||||||
dir | 134451..134526 | ttc | 7 | 7 | ||||||
dir | 134534..134610 | atgj | 114 | |||||||
dir | 134725..136115 | 16s | 68 | |||||||
dir | 136184..136259 | gca | 271 | |||||||
dir | 136531..139430 | 23s | 126 | |||||||
dir | 139557..139673 | 5s | 213 | 213 | 213 | |||||
comp | 139887..141071 | cds | 372 | *372 | 395 | pyridoxal phosphate-dependent aminotransferase | ||||
dir | 141444..143795 | cds | 21 | 21 | 784 | anaerobic ribonucleoside triphosphate reductase | ||||
dir | 143817..144356 | cds | 776 | *776 | 180 | anaerobic ribonucleoside-triphosphate reductase activating protein | ||||
dir | 145133..146640 | 16s | 52 | |||||||
dir | 146693..146768 | gca | 373 | |||||||
dir | 147142..150041 | 23s | 126 | |||||||
dir | 150168..150284 | 5s | 7 | 7 | ||||||
dir | 150292..150366 | aac | 5 | 5 | ||||||
dir | 150372..150457 | tta | 15 | 15 | ||||||
dir | 150473..150548 | atgf | 7 | 7 | ||||||
dir | 150556..150630 | gaa | 14 | 14 | ||||||
dir | 150645..150718 | gga | 5 | 5 | ||||||
dir | 150724..150799 | gta | 5 | 5 | ||||||
dir | 150805..150881 | gac | 10 | 10 | ||||||
dir | 150892..150966 | ggc | 9 | 9 | ||||||
dir | 150976..151049 | aga | 975 | *975 | ||||||
dir | 152025..152864 | cds | 280 | TIGR00159 family protein | ||||||
dir | 378341..380728 | cds | 583 | *583 | 796 | cadmium-translocating P-type ATPase | ||||
dir | 381312..382819 | 16s | 311 | |||||||
dir | 383131..386030 | 23s | 126 | |||||||
dir | 386157..386273 | 5s | 177 | 177 | 177 | |||||
dir | 386451..387059 | cds | 203 | DedA family protein | ||||||
comp | 833130..833894 | cds | 258 | 258 | 255 | DeoR/GlpR transcriptional regulator | ||||
dir | 834153..834243 | agc | 87 | 87 | 87 | |||||
dir | 834331..835119 | cds | 263 | flagellar motor protein | ||||||
dir | 1089165..1090139 | cds | 239 | 239 | 325 | 239 | Mannosyl-glycoprotein endo-beta-N-acetylglucosamidase | |||
dir | 1090379..1091886 | 16s | 320 | |||||||
dir | 1092207..1095106 | 23s | 91 | |||||||
dir | 1095198..1095271 | gga | @2 | 8 | ||||||
dir | 1095280..1095396 | 5s | 273 | 273 | ||||||
dir | 1095670..1097688 | cds | 673 | N-acetylmuramoyl-L-alanine amidase | ||||||
comp | 1181549..1182958 | cds | 1374 | *1374 | 470 | MBOAT family protein | ||||
comp | 1184333..1184415 | ttg | 318 | 318 | 318 | |||||
dir | 1184734..1187382 | cds | 883 | DNA polymerase I | ||||||
dir | 1835768..1837498 | cds | 109 | 109 | 577 | 109 | Na+/H+ antiporter NhaC family protein | |||
dir | 1837608..1837688 | cta | 231 | 231 | ||||||
<dir | 1837920..1838093 | cds | 58 | HXXEE domain-containing protein | ||||||
dir | 2981767..2982444 | cds | 159 | 159 | 226 | 159 | sortase SrtB | |||
comp | 2982604..2982678 | aca | @3 | 94 | ||||||
comp | 2982773..2985672 | 23s | 184 | |||||||
comp | 2985857..2987364 | 16s | 340 | 340 | ||||||
dir | 2987705..2988643 | cds | 313 | delta-lactam-biosynthetic de-N-acetylase | ||||||
comp | 3787361..3788431 | cds | 454 | *454 | 357 | ABC transporter ATP-binding protein | ||||
comp | 3788886..3789002 | 5s | 126 | |||||||
comp | 3789129..3792028 | 23s | 281 | |||||||
comp | 3792310..3793817 | 16s | 191 | 191 | 191 | |||||
comp | 3794009..3794587 | cds | 193 | bifunctional precorrin-2 dehydrogenase/sirohydrochlorin ferrochelatase | ||||||
comp | 3944262..3944453 | cds | 119 | 119 | 64 | 119 | DUF378 domain-containing protein | |||
comp | 3944573..3944689 | 5s | 126 | |||||||
comp | 3944816..3947715 | 23s | 217 | |||||||
comp | 3947933..3949440 | 16s | 282 | 282 | ||||||
comp | 3949723..3950004 | cds | 221 | 221 | 94 | hp | ||||
comp | 3950226..3951755 | cds | 510 | lysine--tRNA ligase | ||||||
dir | 4084445..4085437 | cds | 382 | *382 | 331 | DNA replication protein DnaC | ||||
comp | 4085820..4085894 | aca | 33 | |||||||
comp | 4085928..4086003 | gta | 4 | |||||||
comp | 4086008..4086082 | gaa | 6 | |||||||
comp | 4086089..4086164 | aaa | 326 | 326 | 326 | |||||
comp | 4086491..4087780 | cds | 430 | adenylosuccinate synthase |
cdc cumuls[modifier | modifier le wikicode]
- Lien tableur: cdc cumuls
opérons | Fréquences intercalaires tRNAs | Fréquences intercalaires cds | Fréquences aas cds | ||||||||
---|---|---|---|---|---|---|---|---|---|---|---|
effectif | gammes | sans rRNAs | avec rRNAs | gammes | cds | gammes | cdsd | gammes | cdsa | ||
avec rRNA | opérons | 10 | 1 | 0 | 1 | 1 | 1 | 1 | 100 | 3 | |
16 23 5s 0 | 3 | 20 | 2 | 61 | 50 | 1 | 20 | 0 | 200 | 5 | |
16 gca 235 | 3 | 40 | 1 | 4 | 100 | 3 | 40 | 0 | 300 | 7 | |
16 23 5s a | 2 | 60 | 1 | 150 | 3 | 60 | 0 | 400 | 5 | ||
max a | 43 | 80 | 0 | 200 | 4 | 80 | 1 | 500 | 3 | ||
a doubles | 2 | 100 | 2 | 250 | 4 | 100 | 1 | 600 | 3 | ||
autres | 2 | 120 | 0 | 300 | 4 | 120 | 2 | 700 | 1 | ||
total aas | 75 | 140 | 0 | 350 | 4 | 140 | 1 | 800 | 2 | ||
sans | opérons | 5 | 160 | 0 | 400 | 2 | 160 | 1 | 900 | 1 | |
1 aa | 4 | 180 | 0 | 450 | 0 | 180 | 1 | 1000 | 0 | ||
max a | 4 | 200 | 0 | 500 | 1 | 200 | 1 | 1100 | 0 | ||
a doubles | 0 | 0 | 5 | 4 | 1 | ||||||
total aas | 8 | 3 | 68 | 32 | 13 | 31 | |||||
total aas | 83 | ||||||||||
remarques | 3 | ||||||||||
avec jaune | moyenne | 14 | 12 | 313 | 165 | 378 | |||||
variance | 15 | 283 | 94 | 259 | |||||||
sans jaune | moyenne | 9 | 206 | 286 | |||||||
variance | 5 | 107 | 144 |
cdc tRNA-cds[modifier | modifier le wikicode]
- Note: intercalaires prélevés de la colonne cds de cdc opérons dans un bloc de tRNAs uniquement. Le début du bloc est dans l'ordre des adresses, deb intercalaire entre le cds et le 1er tRNA dd bloc, fin entre le dernier tRNA et le cds terminal. J'ai procédé, dans les colonnes petit et grand, à la réorientation des blocs d'après la constatation que les blocs à rRNA ont leurs cds de début et de fin sont orientés du cds-16s au 5s-tRNAs-cds, l'intercalaire cds-16s étant plus grands que l'intercalaire avec le cds terminal. En tête de colonne est le % du nombre des intercalaires inférieurs à 201 pbs.
cdc 40 40 20 60 deb fin deb fin grand petit grand petit 0 37 0 37 37 0 37 0 109 231 258 87 231 109 258 87 258 87 109 231 258 87 231 109 382 326 1374 318 382 326 1374 318 1374 318 382 326 1374 318 382 326
- Comparaison cds-cds tRNA-cds: deb fin, c'est l'ordre des adresses et grand petit l'ordre après réorientation. Leur pourcentage est calculé par rapport à la colonne, c'est à dire la moitié du total des tRNA-cds.
clostridia cds total total <0 0-200 201-370 371-600 >600 deb fin grand petit cdc 3,614 10 4 4 1 1 2 2 1 3 cdc ‰ 400 400 100 100 400 400 200 600
cdc blocs[modifier | modifier le wikicode]
- Lien tableur: cdc blocs
- Lien psor blocs: le tabeau de cdc blocs est à comparer à celui de psor pour les types manquants, ici en gris.
- Légende: voir psor blocs.
- Notes:
- - cdc a perdu 3 blocs de type I, 16s23s5s sans tRNAs; les 2 blocs de type V, 16s-gca-23sgga5s et les 2 blocs 16s-gca-23s5s-2aas de type VI et VII. Soit la moitié des blocs courts, 7 sur 14, et plus de la moitié des blocs 16s-gca, 4 sur 7. Les 3 blocs longs sont maintenus mais modifiés.
groupes | types | absents | ||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
cds | 281 | I | II | III | IV | IV1 | IV2 | |||||||
IV2 | 16s | 279 | ||||||||||||
23s | 131 | CDS | 583 | 454 | 119 | cds | 239 | |||||||
5s | 6 | 16s | 311 | 126 | 126 | 16s | 320 | cds | 159 | cds | 505 | 281 | ||
aac | 4 | 23s | 126 | 281 | 217 | 23s | 91 | aca | 94 | 16s | 279 | 279 | ||
**16aas | 3 | 5s | 177 | 191 | 282 | gga | 8 | 23s | 184 | 23s | 180 | 131 | ||
ttc | 7 | CDS | 5s | 273 | 16s | 340 | 5s | 6 | 6 | |||||
atgj | 114 | cds | cds | aac | 6 | 4 | ||||||||
VIII1 | 16s | 68 | ||||||||||||
gca | 271 | V | V2 | VI | VI1 | VII | VII1 | |||||||
23s | 126 | |||||||||||||
5s | 213 | |||||||||||||
cds | 372 | |||||||||||||
cds | 21 | VIII | VIII1 | IX | X | X1 | ||||||||
cds | 776 | cds | 21 | |||||||||||
X1 | 16s | 52 | atgj | 114 | cds | 179 | cds | 776 | ||||||
gca | 373 | 16s | 68 | 16s | 52 | 16s | 52 | |||||||
23s | 126 | gca | 271 | gca | 249 | gca | 373 | |||||||
5s | 7 | 23s | 126 | 23s | 111 | 23s | 126 | |||||||
aac | 5 | 5s | 213 | 5s | 126 | 5s | 7 | |||||||
**7aas | 9 | cds | 372 | cds | aac | 5 | ||||||||
aga | 975 | |||||||||||||
cds |
cdc psor[modifier | modifier le wikicode]
- Lien tableur: cdc psor
- Comparaison bsu-lmo: Les séquences, les cumuls.
- Légende:
- - La couleur cyan pour les différents entre cdc et psor; bois pour les identiques entre les clusters 43aas et 18aas de cdc d'une part et les clusters 44aas et 23aas de psor. Le gène aaa du cluster 18aas de cdc a son identique dans la 2ème partie du cluster 43aas et non dans la 1ère partie, car la duplication n'est pas exacte.
- - Le bleu pour des intercalaires exceptionnels.
- - Les blocs 16s indiquent des rRNAs de bordure, l'équivalent d'un cds.
- - Le jaune pour la conservation des cds: je ne l'ai appliqué ici qu'aux petits clusters sans rRNAs; Comparer les cumuls des intercalaires et protéines des cds de cdc et psor montre clairement que les clusters soit, sont très mobiles ou bien qu'il y a de nombreuses recombinansons entre le cluster et ses cds. Le jaune indique ici des intercalaires et des protéines presque identiques.
- - Les bordures très épaisses noires encadrent les 7 gènes du cluster 9aas identiques dans les duplicata du 43aas, comparaison cdc-cdc. Les bordures très épaisses bleues encadrent les 4 gènes du cluster 9aas de cdc et ceux du 23aas de psor, comparaison cdc-psor.
- Notes:
- - Les 3 blocs longs de cdc commencent tous par aac. Chez psor 2 blocs longs et 2 courts commencent par tta et 1 bloc long gca commence par gaa.
- - Le jaune encadré montre que le cluster cta conservé dans cdc est celui ayant une protéine identique, 58 contre 62 aas dans psor. Or dans psor ce cluster présente des répétitions caractéristiques des contraintes imposées aux réparations.
- - Les fréquences des différences entre intercalaires (diff) sont reportées dans le dernier tableau C24 et sont établies sur la plage des différences entre intercalaires cdc et psor du tableau C21 pour des couples identiques. 16% des différences sont nulles (8 sur 49) et 50% ne dépassent pas 2 paires de bases. Ces résultats sont à mettre en parallèle avec ceux de la omparaison bsu-lmo, avec les séquences et les cumuls. La faible variabilité des intercalaires cdc-psor par rapport à bsu-lmo est due à leur plus grande filiation, niveau genre contre le niveau famille pour bsu-lmo.
|
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|
cdc remarques[modifier | modifier le wikicode]
- Nombre de gènes protéines: cdc 3615, psor 3327 (NCBI)
- Comparaison bsu-lmo: Les séquences, les cumuls. bsu-lmo nouveau
- Rmarques @: On retrouve une partie des remarques de psor
- - Les RNAs non codants: seul le bloc cds-tcc-ncRNA-cds est maintenu.
- - Une configuration rare 23s-gga-5s complète au lieu de 3.
- - La configuration 16s23s-aca-5s-riboswitch perd 5s-riboswitch et devient 16s23s-aca.
- Comparaison cdc-psor
- Les blocs à rRNAs: Les blocs disparaissent au moment des divisions et ce sont les non protégés par des séquences de tRNAs qui disparaissent en 1er. 7 clusters simples disparaissent et les groupes se défont.
- Les séquences longues:
- Comparaison entre les 2 génomes, cdc-psor: Très peu de modifications, plutôt des mutations que des recombinaisons et encore moins des créations. Le cas de la disparition de aaa qui apparaît dans un intercalaire est emblématique.
- Comparaisons intra génome, cdc-cdc et psor-psor. Là les remaniements sont légions et puissants: duplication de 20 tRNAs d'un seul coup, recombinaisons par lots ou tRNA par tRNA.
- Comparaison clostridia-bacilli entre cdc-psor et bsu-lmo: la comparaison est saisissante et on arrive à repérer une recombinaison après division, celle de 16s23s5s en 16s-atcgca-23s5s entre bsu et lmo. La mutation de cta en ctg, entre génome, qui conserve la longueur du tRNA, ainsi que la agc en tcc dans le petit bloc aac-**-gaa en intra.
- - Seul les clostridia présentent des cds dans les groupes, les bacilli non. Les autres génomes de clostridia (voir fiche) présentent beaucoup de cds dans les clusters alors que les bacilli (fiche) jamais.
- Conclusion: Tout se passe comme si le processus se déroulait d'un seul coup dans un génome, en dehors de la division. Puis pendant la 1ère division et les divisions suivantes certains clusters disparaissent facilement alors que se produisent quelques rares mutations et recombinaisons. C'est avant tout un processus de création ordonné donnant des séquences qui peuvent se dupliquer et se recombiner. Les séquences de tRNA stabilisent et maintiennent les blocs de rRNAs, un seul cluster à 6 tRNAs disparaît entre bsu et lmo, et aucun entre cdc et psor.
cdc distribution[modifier | modifier le wikicode]
- Lien tableur: cdc distribution
- Notes: Tableau Cl22
- - -5s: gga aca
|
|
cdc. Intergen51[modifier | modifier le wikicode]
Intergen51. cdc. Le génome[modifier | modifier le wikicode]
- cdc Le prélèvement: Aclostridia
- Le nom et le lien NCBI: cdc, Clostridioides difficile CD196, NCBI [6], date 6.2.22.
- cdc La longueur totale des intercalaires, longueur du génome et taux intercalaires/génome:
Nom intercals génome taux en % cdc 636,447 4,110,554 15.5
cdc données intercalaires[modifier | modifier le wikicode]
- Lien tableur: cdc données intercalaires
- Lien sauvegarde NCBI: Aclostridia
cdc données intercalaires 200[modifier | modifier le wikicode]
- Lien tableur: données intercalaires 200.
cdc autres intercalaires aas[modifier | modifier le wikicode]
- Lien tableur: cdc autres intercalaires aas
- Lien sauvegarde NCBI: Aclostridia
Intergen51. cdc. Les différents types d'intercalaires[modifier | modifier le wikicode]
- Lien au tableur: Intergen51. cdc les différents types d'intercalaires.
- Légende:
- - S pour intercalaire CDS-CDS et R pour tRNA-CDS,
- - c pour intercalaire continu (les 2 gènes sont sur le même brin) et x pour discontinu (les 2 gènes sont sur 2 brins différents, le brin et son complément)
- - %reste = 100*reste/total, le reste étant ce qui reste du total après la fin du diagramme, gamme.
- - %t30 = 100*t30/total, t30 étant le total des fréquences 10 20 30
- - %t5 = 100*t/total, t5 étant le total des fréquences de -1 à -5 dans le diagramme des S-.
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
Intergen51. cdc. Les diagrammes CDS-CDS positifs[modifier | modifier le wikicode]
- Lien tableur: Les diagrammes
- Diagrammes des gamma: cdc présente 2 diagrammes
- - fc40, CDS-CDS continu, fréquence unitaire en abscisses et effectif en ordonnées
- - fx%, CDS-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et pourcentage en ‰ par rapport au total, en ordonnées.
- Équations des courbes de tendance en pour 1000: colonnes %fx %fc
Courbes de tendances pour les diagrammes en pour 1000 Calculs des f.41 cdc R2 x3 x2 x c Inflexion poly3 x c 0.718 2.24E-06 -2.16E-03 5.54E-01 11.8 fx1 abscisse 286.2 430.8 0.844 -6.73E-06 5.06E-03 -1.22E+00 105.0 fc1 ordonnée 21.4 4.3 0.670 3.89E-06 -3.34E-03 8.06E-01 -26.9 fx41 0.903 -2.77E-07 3.58E-04 -1.86E-01 40.1 fc41
Intergen51. cdc. Les CDS-CDS négatifs[modifier | modifier le wikicode]
Sous-totaux cdc totale fréquence x- c- x- c- - 1 0 59 4 4140 - 2 0 0 85 11 - 3 0 1 3 12 - 4 1 44 717 10938 - 5 0 0 5 19 sp6 1 192 1642 8424 total 2 296 2,456 23,544 reste 1 5 264 420 s6 0 1 361 41 s7 0 32 321 1438 s8 0 154 696 6525 rappot s1-5 4/2/1 - 0.7 8.4 2.6 % / sp6 s6/sp6 0.0 0.5 22.0 0.5 s7/sp6 0.0 16.7 19.5 17.1 s8/sp6 0.0 80.2 42.4 77.5 reste/sp6 100.0 2.6 16.1 5.0 total s1-5 1 104 814 15120 % / total %s1-5 50.0 35.1 33.1 64.2 %sp6 50.0 64.9 66.9 35.8
Intergen51. cdc. Les intercalaires des blocs[modifier | modifier le wikicode]
- Le détail
RNA-RNA c x CDS-RNA c x 23s 5s 8 CDS 16s 7 2 16s 23s 7 5s CDS 5 1 16s tRNA 3 16 CDS tRNA 23s 3 CDS 5s 5s tRNA 3 23s CDS tRNA in CDS 23s tRNA contig 67 5s 16s tRNA hors 3 16s16s tRNA 16s 1 23s tRNA 2 tRNA 5s 1 16s 5s 5s 23s 5s 5s total 98 0 total 12 3
- Les rares voir gamma pour la longueur des intercalaires
- Les tRNA-CDS compris, comparaison dans le clade et dans l'étude.
Intergen51. cdc. Les intercalaires tRNA-tRNA extra bloc[modifier | modifier le wikicode]
- Lien tableur: Intergen51. cdc. Les intercalaires tRNA-tRNA extra bloc
cont1 | cont2 | cont3 | cont5 | |||||||
---|---|---|---|---|---|---|---|---|---|---|
inter | aa | inter | aa | inter | aa | inter | aa | |||
6 | aac | 5 | aac | 8 | cac | 6 | cca | |||
15 | tta | 15 | tta | 7 | aaa | 3 | atc | |||
7 | atgf | 7 | atgf | 7 | tgc | 7 | ttc | |||
9 | gaa | 9 | gaa | 12 | cgt | ** | atgj | |||
5 | gga | 5 | gga | ** | gta | 5 | aac | |||
5 | gta | 5 | gta | cont4 | 15 | tta | ||||
9 | gac | 9 | gac | 4 | aac | 7 | atgf | |||
14 | aca | 14 | aca | 5 | gaa | 14 | gaa | |||
8 | tac | 9 | tac | 5 | gta | 5 | gga | |||
29 | cta | 23 | cta | 10 | gac | 5 | gta | |||
7 | aga | 24 | ggc | 14 | aca | 10 | gac | |||
88 | caa | 9 | aga | 9 | tac | 9 | ggc | |||
3 | tca | 8 | caa | 10 | gga | ** | aga | |||
6 | ttc | 2 | aaa | 9 | aga | |||||
14 | atgj | 3 | tca | 11 | caa | |||||
23 | atgi | 6 | ttc | 2 | aaa | hors | ||||
7 | cca | 14 | atgj | 17 | tca | 33 | aca | |||
8 | cac | 17 | atgi | 8 | agc | 4 | gta | |||
7 | aaa | 85 | cca | 6 | gaa | |||||
6 | tgc | 60 | tgg | ** | aaa | |||||
- |
Peptoclostridium difficile M68[modifier | modifier le wikicode]
cdc8 opérons[modifier | modifier le wikicode]
- Liens data bases: gtRNAdb [7], NCBI [8], génome [9]
- Lien tableur: cdc8 opérons
- Phylogénie: Bacteria; Firmicutes; Clostridia; Clostridiales;Peptostreptococcaceae; Clostridioides.
- Liens internes: noms abrégés cdc8 remarques cdc8 cumuls
- Légende: voir cdc8 cumuls pour cdsa: cds en pbs, cdsd: cds dirigé; voir cdc8 remarques pour @ et +
- - 23s': possible 23S ribosomal RNA but does not have good blast hits on one or both of the ends.
- - 23s°: 23S ribosomal RNA rRNA prediction is too short
- - cca: tRNA dupliqué dans le cluster 43aas (4306341).
- - cca: tRNA non dupliqué dans le cluster 43aas (4306341), ou remarques @2 et @3.
- - 554: voir cdc8 cumuls, veut dire sans jaune, exclu de la moyenne.
28.6%GC | 11.9.19 Paris | 110 | doubles | intercal | cds | aa | avec aa | cdsa | cdsd | protéines |
---|---|---|---|---|---|---|---|---|---|---|
dir | 4299490..4300134 | cds | 214 | 214 | 645 | tyrosine-type recombinase/integrase | ||||
dir | 4300349..4300807 | cds | @1 | 554 | 554 | 459 | helix-turn-helix domain-containing protein | |||
dir | 4301362..4303101 | cds | 0 | 0 | 1740 | hypothetical protein | ||||
dir | 4303102..4303305 | cds | 167 | 167 | 204 | hp | ||||
dir | 4303473..4304299 | 23s° | 132 | 827 | ||||||
dir | 4304432..4304548 | 5s | + | 6 | 117 | |||||
dir | 4304555..4304629 | aac | 4 | 4 | 75 | |||||
dir | 4304634..4304708 | gaa | 2 cca | 5 | 5 | 75 | ||||
dir | 4304714..4304789 | gta | 5 | 5 | 76 | |||||
dir | 4304795..4304871 | gac | 11 | 11 | 77 | |||||
dir | 4304883..4304957 | aca | 14 | 14 | 75 | |||||
dir | 4304972..4305056 | tac | 9 | 9 | 85 | |||||
dir | 4305066..4305139 | gga | 10 | 10 | 74 | |||||
dir | 4305150..4305226 | aga | 9 | 9 | 77 | |||||
dir | 4305236..4305311 | caa | 11 | 11 | 76 | |||||
dir | 4305323..4305398 | aaa | 2 | 2 | 76 | |||||
dir | 4305401..4305489 | tca | 18 | 18 | 89 | |||||
dir | 4305508..4305598 | agc | 8 | 8 | 91 | |||||
dir | 4305607..4305683 | cca | 85 | 85 | 77 | |||||
dir | 4305769..4305844 | tgg | 60 | 60 | 76 | |||||
dir | 4305905..4305981 | cca | 5 | 5 | 77 | |||||
dir | 4305987..4306063 | atc | 3 | 3 | 77 | |||||
dir | 4306067..4306142 | ttc | 7 | 7 | 76 | |||||
dir | 4306150..4306226 | atgj | 114 | 77 | ||||||
dir | 4306341..4307538 | 16s | 0 | 0 | 1198 | 0 | ||||
dir | 4307539..4308225 | cds | 100 | 100 | 687 | xylose isomerase | ||||
dir | 1..796 | 23s° | 181 | 796 | ||||||
dir | 978..1094 | 5s | 6 | 117 | ||||||
dir | 1101..1175 | aac | + | 6 | 6 | 75 | ||||
dir | 1182..1267 | tta | 3 aaa | 15 | 15 | 86 | ||||
dir | 1283..1358 | atgf | 3 gta | 7 | 7 | 76 | ||||
dir | 1366..1440 | gaa | 9 | 9 | 75 | |||||
dir | 1450..1523 | gga | 5 | 5 | 74 | |||||
dir | 1529..1604 | gta | 5 | 5 | 76 | |||||
dir | 1610..1686 | gac | 9 | 9 | 77 | |||||
dir | 1696..1770 | aca | 14 | 14 | 75 | |||||
dir | 1785..1869 | tac | 10 | 10 | 85 | |||||
dir | 1880..1963 | cta | 28 | 28 | 84 | |||||
dir | 1992..2068 | aga | 7 | 7 | 77 | |||||
dir | 2076..2151 | caa | 89 | 89 | 76 | |||||
dir | 2241..2329 | tca | 3 | 3 | 89 | |||||
dir | 2333..2408 | ttc | 6 | 6 | 76 | |||||
dir | 2415..2491 | atgj | 11 | 11 | 77 | |||||
dir | 2503..2579 | atgi | 29 | 29 | 77 | |||||
dir | 2609..2685 | cca | 7 | 7 | 77 | |||||
dir | 2693..2769 | cac | 8 | 8 | 77 | |||||
dir | 2778..2853 | aaa | 7 | 7 | 76 | |||||
dir | 2861..2934 | tgc | 6 | 6 | 74 | |||||
dir | 2941..3015 | aac | 6 | 6 | 75 | |||||
dir | 3022..3107 | tta | 15 | 15 | 86 | |||||
dir | 3123..3198 | atgf | 7 | 7 | 76 | |||||
dir | 3206..3280 | gaa | 9 | 9 | 75 | |||||
dir | 3290..3363 | gga | 5 | 5 | 74 | |||||
dir | 3369..3444 | gta | 5 | 5 | 76 | |||||
dir | 3450..3526 | gac | 9 | 9 | 77 | |||||
dir | 3536..3610 | aca | 14 | 14 | 75 | |||||
dir | 3625..3709 | tac | 9 | 9 | 85 | |||||
dir | 3719..3802 | cta | 24 | 24 | 84 | |||||
dir | 3827..3901 | ggc | 24 | 24 | 75 | |||||
dir | 3926..4002 | aga | 9 | 9 | 77 | |||||
dir | 4012..4087 | caa | 8 | 8 | 76 | |||||
dir | 4096..4171 | aaa | 2 | 2 | 76 | |||||
dir | 4174..4262 | tca | 3 | 3 | 89 | |||||
dir | 4266..4341 | ttc | 6 | 6 | 76 | |||||
dir | 4348..4424 | atgj | 11 | 11 | 77 | |||||
dir | 4436..4512 | atgi | 17 | 17 | 77 | |||||
dir | 4530..4606 | cac | 8 | 8 | 77 | |||||
dir | 4615..4690 | aaa | 7 | 7 | 76 | |||||
dir | 4698..4771 | tgc | 7 | 7 | 74 | |||||
dir | 4779..4855 | cgt | 12 | 12 | 77 | |||||
dir | 4868..4943 | gta | 75 | 75 | 76 | 75 | ||||
dir | 5019..5432 | cds | 308 | 308 | 414 | hp | ||||
dir | 5741..9172 | cds | 3432 | pyruvate carboxylase | ||||||
dir | 94032..94736 | cds | 281 | 281 | 705 | 281 | N-acetylmuramoyl-L-alanine amidase CwlD | |||
dir | 95018..95994 | 16s° | 100 | 977 | ||||||
dir | 96095..97613 | 23s° | 126 | 1519 | ||||||
dir | 97740..97856 | 5s | 7 | 117 | ||||||
dir | 97864..97938 | aac | 6 | 6 | 75 | |||||
dir | 97945..98030 | tta | 15 | 15 | 86 | |||||
dir | 98046..98121 | atgf | 7 | 7 | 76 | |||||
dir | 98129..98203 | gaa | 8 | 8 | 75 | |||||
dir | 98212..98285 | gga | 4 | 4 | 74 | |||||
dir | 98290..98365 | gta | 5 | 5 | 76 | |||||
dir | 98371..98447 | gac | 10 | 10 | 77 | |||||
dir | 98458..98532 | ggc | 9 | 9 | 75 | |||||
dir | 98542..98615 | aga | 954 | 954 | 74 | |||||
dir | 99570..100409 | cds | 840 | TIGR00159 family protein | ||||||
dir | 306829..309216 | cds | 733 | 733 | 2388 | cadmium-translocating P-type ATPase | ||||
<> comp | 309950..310076 | cds | 1 | 1 | 127 | 1 | glycine/sarcosine/betaine reductase complex selenoprotein A | |||
dir | 310078..311313 | 23s° | 126 | 1236 | ||||||
dir | 311440..311556 | 5s | 177 | 177 | 117 | |||||
dir | 311734..312342 | cds | 609 | DedA family protein | ||||||
comp | 861856..862620 | cds | 258 | 258 | 765 | DeoR/GlpR transcriptional regulator | ||||
dir | 862879..862969 | agc | 87 | 87 | 91 | 87 | ||||
dir | 863057..863845 | cds | 789 | flagellar motor protein | ||||||
dir | 1106477..1107451 | cds | 238 | 238 | 975 | 238 | Mannosyl-glycoprotein endo-beta-N-acetylglucosamidase | |||
dir | 1107690..1109197 | 16s | @2 | 320 | 1508 | |||||
dir | 1109518..1112416 | 23s | 91 | 2899 | ||||||
dir | 1112508..1112581 | gga | 8 | 74 | ||||||
dir | 1112590..1112706 | 5s | 273 | 273 | 117 | |||||
dir | 1112980..1114998 | cds | 2019 | N-acetylmuramoyl-L-alanine amidase | ||||||
comp | 1196804..1198213 | cds | 1378 | 1378 | 1410 | MBOAT family protein | ||||
comp | 1199592..1199674 | ttg | 318 | 318 | 83 | 318 | ||||
dir | 1199993..1202641 | cds | 2649 | DNA polymerase I | ||||||
dir | 1850896..1852626 | cds | 109 | 109 | 1731 | 109 | Na+/H+ antiporter NhaC family protein | |||
dir | 1852736..1852816 | cta | 334 | 334 | 81 | |||||
dir | 1853151..1853666 | cds | 516 | HXXEE domain-containing protein | ||||||
dir | 3024038..3024715 | cds | 150 | 150 | 678 | 150 | sortase SrtB | |||
comp | 3024866..3024940 | aca | @3 | 93 | 75 | |||||
comp | 3025034..3027933 | 23s | 184 | 2900 | ||||||
comp | 3028118..3029625 | 16s | 374 | 374 | 1508 | |||||
dir | 3030000..3030938 | cds | 939 | delta-lactam-biosynthetic de-N-acetylase | ||||||
dir | 3805298..3806743 | cds | 208 | 208 | 1446 | tyrosine-type recombinase/integrase | ||||
comp | 3806952..3807028 | agg | 61 | 61 | 77 | 61 | ||||
<comp | 3807090..3808790 | cds | 1701 | formate dehydrogenase subunit alpha | ||||||
comp | 3875816..3876886 | cds | 452 | 452 | 1071 | ABC transporter ATP-binding protein | ||||
comp | 3877339..3877455 | 5s | 125 | 117 | ||||||
comp | 3877581..3880480 | 23s | 261 | 2900 | ||||||
comp | 3880742..3882249 | 16s | 190 | 190 | 1508 | 190 | ||||
comp | 3882440..3883018 | cds | 579 | bifunctional precorrin-2 dehydrogenase/sirohydrochlorin ferrochelatase | ||||||
comp | 4017523..4017714 | cds | 118 | 118 | 192 | 118 | DUF378 domain-containing protein | |||
comp | 4017833..4017949 | 5s | 126 | 117 | ||||||
comp | 4018076..4020975 | 23s | 321 | 2900 | ||||||
comp | 4021297..4022804 | 16s | 292 | 292 | 1508 | |||||
comp | 4023097..4023378 | cds | 221 | 221 | 282 | hp | ||||
comp | 4023600..4025129 | cds | 1530 | lysine--tRNA ligase | ||||||
dir | 4135881..4136873 | cds | 383 | 383 | 993 | DNA replication protein DnaC | ||||
comp | 4137257..4137331 | aca | 33 | 33 | 75 | |||||
comp | 4137365..4137440 | gta | 4 | 4 | 76 | |||||
comp | 4137445..4137519 | gaa | 6 | 6 | 75 | |||||
comp | 4137526..4137601 | aaa | 331 | 331 | 76 | 331 | ||||
comp | 4137933..4139222 | cds | 1290 | adenylosuccinate synthase | ||||||
dir | 4178197..4178970 | cds | 179 | 179 | 774 | SigB/SigF/SigG family RNA polymerase sigma factor | ||||
dir | 4179150..4180587 | 16s | 161 | 1438 | ||||||
comp | 4180749..4180865 | 5s | 201 | 117 | ||||||
comp | 4181067..4183959 | 23s | 217 | 2893 | ||||||
comp | 4184177..4185684 | 16s | 108 | 1508 | ||||||
comp | 4185793..4185869 | atgi | 11 | 11 | 77 | |||||
comp | 4185881..4185969 | tta | 5 | 89 | ||||||
comp | 4185975..4186091 | 5s | 201 | 117 | ||||||
comp | 4186293..4189192 | 23s | 375 | 2900 | ||||||
comp | 4189568..4189643 | gca | 52 | 76 | ||||||
comp | 4189696..4190959 | 16s’ | @4 | 100 | 1264 | |||||
dir | 4191060..4192225 | 16s’ | 52 | 1166 | ||||||
dir | 4192278..4192353 | gca | 248 | 76 | ||||||
dir | 4192602..4193197 | 23s° | 100 | 596 | ||||||
dir | 4193298..4193874 | 16s° | 321 | 577 | ||||||
dir | 4194196..4196423 | 23s’ | 100 | 2228 | ||||||
dir | 4196524..4197091 | 16s° | 320 | 568 | ||||||
dir | 4197412..4199044 | 23s° | 100 | 1633 | ||||||
dir | 4199145..4201593 | 23s’ | 126 | 2449 | ||||||
dir | 4201720..4201836 | 5s | 127 | 127 | 117 | 127 | ||||
dir | 4201964..4202473 | cds | 510 | transcription repressor NadR | ||||||
dir | 4205417..4205872 | cds | 0 | 0 | 456 | 0 | nucleoside deaminase | |||
dir | 4205873..4205964 | tcc | @5 | 37 | 92 | |||||
dir | 4206002..4206266 | ncRNA | 76 | 76 | 265 | |||||
dir | 4206343..4207980 | cds | 1638 | DNA polymerase III subunit gamma/tau | ||||||
comp | 4209435..4210639 | cds | 496 | 496 | 1205 | glycosyl transferase | ||||
4211136..4212643 | 16s | 321 | 1508 | |||||||
4212965..4213127 | 23s° | 100 | 100 | 163 | 100 | |||||
<>comp | 4213228..4213849 | cds | 111 | 622 | CHAP domain-containing protein | |||||
comp | 4213961..4214620 | cds | 228 | 228 | 660 | 228 | type A-1 chloramphenicol O-acetyltransferase | |||
dir | 4214849..4216199 | 16s | 321 | 1351 | ||||||
dir | 4216521..4217008 | 23s° | 101 | 488 | ||||||
comp | 4217110..4218529 | 23s° | 250 | 1420 | ||||||
comp | 4218780..4218855 | gca | 52 | 76 | ||||||
comp | 4218908..4219471 | 16s° | 100 | 564 | ||||||
comp | 4219572..4219856 | 23s° | 217 | 285 | ||||||
comp | 4220074..4221581 | 16s | 179 | 179 | 1508 | 179 | ||||
>comp | 4221761..4222206 | cds | 386 | 386 | 446 | 386 | B/F/G family RNA polymerase sigma-70 factor | |||
dir | 4222593..4224100 | 16s | 321 | 1508 | ||||||
dir | 4224422..4227321 | 23s | 181 | 2900 | ||||||
dir | 4227503..4227619 | 5s | 6 | 117 | ||||||
dir | 4227626..4227700 | aac | 6 | 6 | 75 | |||||
dir | 4227707..4227792 | tta | 15 | 15 | 86 | |||||
dir | 4227808..4227883 | atgf | 7 | 7 | 76 | |||||
dir | 4227891..4227965 | gaa | 9 | 9 | 75 | |||||
dir | 4227975..4228048 | gga | 5 | 5 | 74 | |||||
dir | 4228054..4228129 | gta | 5 | 5 | 76 | |||||
dir | 4228135..4228211 | gac | 9 | 9 | 77 | |||||
dir | 4228221..4228295 | aca | 14 | 14 | 75 | |||||
dir | 4228310..4228394 | tac | 10 | 10 | 85 | |||||
dir | 4228405..4228488 | cta | 28 | 28 | 84 | |||||
dir | 4228517..4228593 | aga | 7 | 7 | 77 | |||||
dir | 4228601..4228676 | caa | 89 | 89 | 76 | |||||
dir | 4228766..4228854 | tca | 3 | 3 | 89 | |||||
dir | 4228858..4228933 | ttc | 6 | 6 | 76 | |||||
dir | 4228940..4229016 | atgj | 11 | 11 | 77 | |||||
dir | 4229028..4229104 | atgi | 29 | 29 | 77 | |||||
dir | 4229134..4229210 | cca | 7 | 7 | 77 | |||||
dir | 4229218..4229294 | cac | 8 | 8 | 77 | |||||
dir | 4229303..4229378 | aaa | 353 | 76 | ||||||
comp | 4229732..4229848 | 5s | 126 | 117 | ||||||
comp | 4229975..4232010 | 23s' | 582 | 2036 | ||||||
dir | 4232593..4234098 | 16s | @6 | 217 | 1506 | |||||
dir | 4234316..4237215 | 23s | 126 | 2900 | ||||||
dir | 4237342..4237458 | 5s | 216 | 216 | 117 | 216 | ||||
comp | 4237675..4238859 | cds | 372 | 372 | 1185 | pyridoxal phosphate-dependent aminotransferase | ||||
dir | 4239232..4241583 | cds | 21 | 21 | 2352 | anaerobic ribonucleoside triphosphate reductase | ||||
dir | 4241605..4242144 | cds | 778 | 778 | 540 | anaerobic ribonucleoside-triphosphate reductase activating protein | ||||
dir | 4242923..4244459 | 16s | @7 | 261 | 1537 | |||||
dir | 4244721..4247619 | 23s | 201 | 2899 | ||||||
dir | 4247821..4247937 | 5s | 5 | 117 | ||||||
dir | 4247943..4248031 | tta | 11 | 11 | 89 | |||||
dir | 4248043..4248119 | atgi | 108 | 77 | ||||||
dir | 4248228..4249735 | 16s | 184 | 1508 | ||||||
dir | 4249920..4250564 | 23s° | 100 | 100 | 645 | 100 | ||||
<dir | 4250665..4250923 | cds | 112 | 112 | 259 | 112 | hp | |||
comp | 4251036..4253145 | 23s’ | 375 | 2110 | ||||||
comp | 4253521..4253596 | gca | 52 | 76 | ||||||
comp | 4253649..4254226 | 16s° | 282 | 282 | 578 | |||||
dir | 4254509..4254712 | cds | 12 | 12 | 204 | hp | ||||
dir | 4254725..4256002 | cds | 1278 | phage portal protein |
cdc8 cumuls[modifier | modifier le wikicode]
- Lien tableur: cdc8 cumuls
- Liens internes: cdc8 opérons
- Légende:
- - avec et sans rRNA, fréquences des intercalaires dans les clusters avec rRNA ou sans rRNA.
- - cdsd, je ne choisis que le cds avec l'intercalaire le plus faible d'un cluster donné, en supposant que ce cds a été créé par le cluster lors des conversions.
- - cdsa, longueur du cds en aas ici. C'est le cdsa de cdc8 opérons divisé par 3.
- - 1 : occurences exclues de la moyenne. Sont exclus de la moyenne les jaunes 554 de cdc8 opérons.
opérons | Fréquences intercalaires tRNAs | Fréquences intercalaires cds | Fréquences aas cds | ||||||||
---|---|---|---|---|---|---|---|---|---|---|---|
effectif | gammes | sans rRNAs | avec rRNAs | gammes | cds | gammes | cdsd | gammes | cdsa | ||
avec rRNA | opérons | 21 | 1 | 0 | 1 | 4 | 1 | 3 | 100 | 6 | |
16 23 5s 0 | 4 | 20 | 2 | 77 | 50 | 2 | 20 | 0 | 200 | 8 | |
16 gca 235 | 2 | 40 | 1 | 6 | 100 | 7 | 40 | 0 | 300 | 11 | |
16 23 5s a | 5 | 60 | 0 | 150 | 5 | 60 | 0 | 400 | 5 | ||
max a | 43 | 80 | 1 | 200 | 5 | 80 | 2 | 500 | 5 | ||
a doubles | 2 | 100 | 3 | 250 | 6 | 100 | 3 | 600 | 5 | ||
autres | 10 | 120 | 0 | 300 | 5 | 120 | 3 | 700 | 1 | ||
total aas | 98 | 140 | 0 | 350 | 4 | 140 | 1 | 800 | 1 | ||
sans | opérons | 6 | 160 | 0 | 400 | 4 | 160 | 1 | 900 | 1 | |
1 aa | 5 | 180 | 0 | 450 | 0 | 180 | 1 | 1000 | 0 | ||
max a | 4 | 200 | 0 | 500 | 2 | 200 | 1 | 1100 | 0 | ||
a doubles | 0 | 0 | 4 | 7 | 1 | ||||||
total aas | 9 | 3 | 87 | 48 | 22 | 44 | |||||
total aas | 108 | ||||||||||
remarques | 7 | ||||||||||
avec jaune | moyenne | 14 | 13 | 256 | 155 | 330 | |||||
variance | 16 | 252 | 109 | 234 | |||||||
sans jaune | moyenne | 10 | 182 | 208 | |||||||
variance | 6 | 117 | 97 |
cdc8 tRNA-cds[modifier | modifier le wikicode]
- Note: intercalaires prélevés de la colonne cds de cdc8 opérons dans un bloc de tRNAs uniquement. Le début du bloc est dans l'ordre des adresses, deb intercalaire entre le cds et le 1er tRNA dd bloc, fin entre le dernier tRNA et le cds terminal. J'ai procédé, dans les colonnes petit et grand, à la réorientation des blocs d'après la constatation que les blocs à rRNA ont leurs cds de début et de fin sont orientés du cds-16s au 5s-tRNAs-cds, l'intercalaire cds-16s étant plus grands que l'intercalaire avec le cds terminal. En tête de colonne est le % du nombre des intercalaires inférieurs à 201 pbs.
cdc8 33 50 17 67 deb fin deb fin grand petit grand petit 0 37 0 37 37 0 37 0 109 334 208 61 208 61 208 61 208 61 258 87 258 87 258 87 258 87 1378 318 334 109 334 109 383 331 383 331 383 331 1378 318 1378 318 109 334 1378 318 383 331
- Comparaison cds-cds tRNA-cds: deb fin, c'est l'ordre des adresses et grand petit l'ordre après réorientation. Leur pourcentage est calculé par rapport à la colonne, c'est à dire la moitié du total des tRNA-cds.
clostridia cds total total <0 0-200 201-370 371-600 >600 deb fin grand petit cdc8 3,831 12 5 5 1 1 2 3 1 4 ‰ 417 417 83 83 333 500 167 667
cdc8 blocs[modifier | modifier le wikicode]
- Lien tableur: cdc8 blocs
- Lien cdc blocs: La colonne "Bloc type" de cdc8 blocs correspond aux types définis dans cdc blocs.
- Légende
- - 23s': possible 23S ribosomal RNA but does not have good blast hits on one or both of the ends.
- - 23s°: 23S ribosomal RNA rRNA prediction is too short
- - cca: remarques @2 et @3.
- Notes:
- - Je définis le type de bloc en comparant avec un bloc de cdc_bloc ayant approximativement les mêmes intercalaires et quand c'est possible les tRNAs identiques qui l'accompagnent. L'identification des tRNAs est faite dans la comparaison entre cdc et cdc 8 dans 43aas, 18aas et 9aas.
- - Les groupes de clusters. Un groupe de cluster à rRNA, et ici avec les débris de rRNA aussi, est un ensemble de rRNAs espacés de tRNAs et de cds par des intercalaires faibles, inférieurs à 778 pbs ici. Les 2 intercalaires des cds terminaux peuvent être très élevés, indiquant que le cds n'est pas sous l'influence de la conversion appliquée au cluster. Au total cdc8 a 9 groupes dont 6 avec un seul bloc, et 3 avec plus de 2 comprenant la quasi totalité des rRNAs, 40/46.
- Les solitaires, 6 dont 5 bien typés, I2 I3 II III et X1.
- Le groupe à 2 blocs, IV1 et IV2 bien typés.
- Le groupe à 15 rRNAs dans lequel je n'ai pu typé que 2 blocs, I1 et VII1.
- Le groupe à 23 rRNAs dans lequel je n'ai pu typé que 3 blocs, I4 IV3 IV4.
- Le type IV4, 16s23s5s-tta-atgi, n'existe pas dans psor mais est ajouté ici parce qu'il est semblable aux types IV, 16s23s5s suivi de tRNAs. Mais en plus avec tta-atgi il est comparable aussi aux types VII1 et VIII1. Ce point est important quand on considère l'origine de cdc8 comme croisement de cdc et psor. Ce type IV4 va en faveur d'une évolution de cdc vers psor en passant par cdc8.
Bloc type | groupes | intercal | Bloc type | groupes | intercal | Bloc type | groupe | intercal |
---|---|---|---|---|---|---|---|---|
cds | 554 | cds | 150 | cds | 496 | |||
cds | 0 | aca | 93 | 16s | 321 | |||
cds | 167 | 23s | 184 | 23s° | 100 | |||
23s° | 132 | III | 16s | 374 | cds | 111 | ||
IV2 | 5s | 6 | cds | cds | 228 | |||
aac | 4 | 16s | 321 | |||||
**16aas | 7 | cds | 452 | 23s° | 101 | |||
atgj | 114 | 5s | 125 | 23s° | 250 | |||
IV1 | 16s | 0 | 23s | 261 | gca | 52 | ||
cds | 100 | I2 | 16s | 190 | 16s° | 100 | ||
23s° | 181 | cds | 23s° | 217 | ||||
5s | 6 | 16s | 179 | |||||
aac | 6 | cds | 118 | cds | 386 | |||
**41aas | 12 | 5s | 126 | IV3 | 16s | 321 | ||
gta | 75 | 23s | 321 | 23s | 181 | |||
cds | 308 | I3 | 16s | 292 | 5s | 6 | ||
cds | cds | aac | 6 | |||||
**17aas | 8 | |||||||
cds | 281 | cds | 179 | aaa | 353 | |||
16s° | 100 | 16s | 161 | 5s | 126 | |||
23s° | 126 | 5s | 201 | 23s' | 582 | |||
X1 | 5s | 7 | I1 | 23s | 217 | I4 | 16s | 217 |
aac | 6 | 16s | 108 | 23s | 126 | |||
**7aas | 9 | atgi | 11 | 5s | 216 | |||
aga | 954 | tta | 5 | cds | 372 | |||
cds | 5s | 201 | cds | 21 | ||||
23s | 375 | cds | 778 | |||||
cds | 733 | VII1 | gca | 52 | IV4 | 16s | 261 | |
cds | 1 | 16s’ | 100 | 23s | 201 | |||
23s° | 126 | 16s’ | 52 | 5s | 5 | |||
5s | 177 | gca | 248 | tta | 11 | |||
cds | 23s° | 100 | atgi | 108 | ||||
16s° | 321 | 16s | 184 | |||||
cds | 238 | 23s' | 100 | 23s° | 100 | |||
II | 16s | 320 | 16s° | 320 | cds | 112 | ||
23s | 91 | 23s° | 100 | 23s’ | 375 | |||
gga | 8 | 23s’ | 126 | gca | 52 | |||
5s | 273 | 5s | 127 | 16s° | 282 | |||
cds | cds | cds |
cdc8 cdc psor 43[modifier | modifier le wikicode]
- Lien tableur: cdc8 cdc psor 43
- Lien cdc psor: le tableau de comparaison cdc-psor
- Légende
- - 23s': possible 23S ribosomal RNA but does not have good blast hits on one or both of the ends.
- - 23s°: 23S ribosomal RNA rRNA prediction is too short
- - cca: marque les tRNAs différents entre les 2 génomes.
- - diff pour différence entre les intercalaires (intercal) cdc moins cdc8.
- - séquences identiques (bordure épaisse): Une séquence identique entre les 2 génomes est encadrée par 2 tRNAs différents (cyan) dans l'un et par 2 bordures épaisses dans l'autre.
- Notes:
- - identité entre cdc et cdc8 avec de rares différences faibles entre les intercalaires.
- - Aussi on retrouve les différences entre cdc et psor dans le tableau de droite.
|
|
cdc8 cdc psor 18[modifier | modifier le wikicode]
- Lien tableur: cdc8 cdc psor 18
- Lien cdc psor: le tableau de comparaison cdc-psor
- Légende
- - 23s': possible 23S ribosomal RNA but does not have good blast hits on one or both of the ends.
- - 23s°: 23S ribosomal RNA rRNA prediction is too short
- - cca: marque les tRNAs différents entre les 2 génomes.
- - diff pour différence entre les intercalaires (intercal) colonne de droite moins colonne de gauche.
- - séquences identiques (bordure épaisse): Une séquence identique entre les 2 génomes est encadrée par 2 tRNAs différents (cyan) dans l'un et par 2 bordures épaisses dans l'autre.
- Notes:
- - Sont comparés ici des suite de longueurs équivalentes entre les 3 génomes, 18aas 19aas 23aas,
- - avec 4 comparaisons cdc8 18aas/cdc 18aas, cdc8 19aas/psor 23aas, cdc8 18aas/psor 23aas, cdc8 19aas/cdc8 18aas,
- - cdc8 18aas et cdc 18aas sont identiques alors que, en intra, cdc8 19aas est très différent de cdc8 18aas.
- - cdc8 18aas est quasiment inclus dans psor 23aas: les 14 tRNAs de la fin de cdc8 se trouvent en fin de psor avec une seule insertion dans psor, mais les différences entre intercalaires sont élevées comme entre cdc et psor.
|
|
cdc8 cdc psor 9[modifier | modifier le wikicode]
- Lien tableur: cdc8 cdc psor 9
- Lien cdc psor: le tableau de comparaison cdc-psor
- Légende
- - 23s': possible 23S ribosomal RNA but does not have good blast hits on one or both of the ends.
- - 23s°: 23S ribosomal RNA rRNA prediction is too short
- - cca: marque les tRNAs différents entre les 2 génomes.
- - diff pour différence entre les intercalaires (intercal) colonne de droite moins colonne de gauche.
- - séquences identiques (bordure épaisse): Une séquence identique entre les 2 génomes est encadrée par 2 tRNAs différents (cyan) dans l'un et par 2 bordures épaisses dans l'autre.
- Notes:
- - Sont comparés ici des suites courtes, en intra cdc8 18aas/9aas et 19aas/9aas, cdc8 9aas/cdc 9aas et cdc8 VII1/psor VII1.
- - cdc8 9aas et cdc 9aas sont identiques
- - cdc8 9aas se retrouve entièrement (sauf 1 tRNA) dans cdc8 19aas avec cependant des diff élevés, mais il est très différent de cdc8 18aas (4 tRNAs différents).
- - La comparaison cdc8 VII1/psor VII1: le groupe de psor à 3 blocs 16s-gca-23s5s est caractérisé en plus par la séquence courte tta-atg (atg supposé atgi). On retrouve le bloc du milieu, VII1 dans cdc8, à l'envers (compléments) et on retrouve partiellement le bloc de fin VIII1 à l'endroit. Dans cdc8 ces blocs sont partiellement abîmés et se trouvent dans le groupe à 15 rRNAs (voir cdc8_blocs). Attention aux diff qui suivent le changement de sens.
- - 3 intercalaires sont préservés entre cdc8 VII1 et celui de psor, 16s-gca 5s-tta tta-atgi. De même pour 16s-gca du bloc VIII1.
|
|
cdc8 cdc protéines[modifier | modifier le wikicode]
- Notes:
- - L'altération poussée des rRNAs dans cdc8 qui saute aux yeux quand on comapre les blocs en tRNAs et intercalaires, m'a poussé à comparer les tailles en pbs ici des rRNAs et des cds qui les entourent avec l'idée que ces cds sont issus de la conversion de ces rRNAs. D'où l'idée de création de gène par conversion à l'instar du processus CRISPR.
Alignement sur cdc[modifier | modifier le wikicode]
- Lien tableur: Alignement sur cdc
- Lien noms abrégés
- Légende: abrégé pour noms abrégés des protéines.
- - 23s': possible 23S ribosomal RNA but does not have good blast hits on one or both of the ends.
- - 23s°: 23S ribosomal RNA rRNA prediction is too short
- - SigB: Protéine existant dans cdc et cdc8 mais est décalée dans cdc8 par les grands remaniements. Voir alignement sur cdc8, tableau qui suit.
- Notes:
- - cdc présente 15 clusters avec ou sans rRNAs. 5 clusters sans rRNAs sont reproduits tels quels dans cdc8. Les clusters avec rRNAs se répartissent en 3 16sgca23s et 7 16s23s. Dans cdc8 les 3 16sgca23s sont modifiés ou altérés, 3 16s23s sont altérés et les 4 autres sont reproduits tels quels.
- - Les 3 16sgca23s5s perdent leur gca mais gardent le 5s. Deux sont durement altérés dont un porte une séquence de 9 tRNAs et l'autre rien. La modification du 3ème consiste en la suppression du gca seulement sans tocher le reste. Cependant l'intercalaire 16s-23s de 415 pbs dans cdc est divisé par 2 dans cdc8, 217 pbs.
- - Les 3 16s23s5s altérés le sont fortement, 2 portent des séquences longues de tRNAs, 43 et 18, le 3ème est sans tRNAs.
- - La colonne "ordre dans cdc" servira à repérer les grands remaniement quand je ferai l'alignement sur cdc8. De même pour les protéines en bleu foncé.
- - cdc présente 15 clusters avec ou sans rRNAs. 5 clusters sans rRNAs sont reproduits tels quels dans cdc8. Les clusters avec rRNAs se répartissent en 3 16sgca23s et 7 16s23s. Dans cdc8 les 3 16sgca23s sont modifiés ou altérés, 3 16s23s sont altérés et les 4 autres sont reproduits tels quels.
|
|
Alignement sur cdc8[modifier | modifier le wikicode]
- Lien tableur: Alignement sur cdc8
- Lien noms abrégés
- Légende:
- - 23s': possible 23S ribosomal RNA but does not have good blast hits on one or both of the ends.
- - 23s°: 23S ribosomal RNA rRNA prediction is too short
- - SigB: Protéine existant dans cdc et cdc8 mais est décalée dans cdc8 par les grands remaniements. Voir alignement sur cdc, tableau précédent.
- Notes:
- - Ici je n'ai pas fait de parallélisme cdc8/cdc. Il suffit de voir la colonne ordre de cdc décrit dans le tableau précédent (alignement sur cdc) pour se rendre compte des grands remaniements du chromosome. Dans cette colonne j'ai ajouté "insert" pour insertion par rapport à cdc.
- - Pour comparer cdc8 à psor pour certains clusters j'ai du intervertir l'ordre des tableaux, le tableau de gauche doit être la suite de celui de droite.
- - Les insertions accumulent les 2 grands groupes qu'on a vu dans cdc8-blocs, à 15 et 23 rRNAs. Par contre en dehors des insertions on trouve 3 groupes altérés à 1 ou 2 clusters, et tous les groupes non altérés sauf l'ordre 5 de cdc.
- - comparaison avec psor: on devine les types VI VII VIII, mais il y a de nouveau type le IV4 par exemple qu'on a signalé dans cdc8-blocs.
|
|
cdc8 cdc création de cds[modifier | modifier le wikicode]
- Lien tableur: cdc8 cdc création de cds
- Lien abrégé
- Notes:
- - Dans la colonne abrégé sont marqués les cds spécifiques à cdc8, cyan dans Alignement sur cdc8.
- - Certains de ces cds, étant donné leur position dans un bloc de rRNAs dégradés, seraient des candidats de gènes créés de novo lors des conversions qui ont altéré ce bloc. Il est évident qu'on peut toujours rétorquer que ce gène a été copié ou intégré à ce niveau par la conversion. Mais si ce gène ou plusieurs n'existaient pas dans cdc mais seulement dans cdc8, alors l'hypothèse de création de novo serait renforcée.
- - 7 gènes de cdc8, Y-r1 Helix xylose seleno CHAP A-1chlor sigB2, répondent aux critères de la conversion mais n'existent pas dans cdc. Ces cds sont colorés en jaunes et repérés par leur taille en pbs.
- - 4 gènes parmi les 7, seleno CHAP A-1chlor sigB2, n'existent qu'en un seul exemplaire, et ne peuvent donc être extraits à la limite que d'un cds hypothétique, hypothetical protein.
- - Les 3 gènes restants, Y-r1 Helix xylose, ont des cds analogues, c.a.d portant le même nom dans mes recherches et pourraient être extraits de ces analogues d'autant plus qu'ils ont des noms portant la mention type ou domaine.
- - Le gène PhagePP est à la limite du critère de conversion puisqu'il est en fin de bloc mais séparé de 12 pbs du cds hp-204 qui est plus proche de la création de novo puisqu'il est hypothétique. Il appartiendrait au 2ème groupe de gènes ayant des analogues. Cependant j'ai trouvé un gène dans cdc et un gène dans psor qui ont des tailles quasi identiques. Aussi j'ai recherché les cdcs encadrant ces gènes, ils sont tous différents dans les 3 génomes. PhagePP serait analogue donc à Y-r1 Helix xylose.
- Le nom complet du cds Clp est "Clp protéase" et celui de PhageHM est "phage head morphogenesis, SPP1 gp7 family domain protein".
- - J'ai inclue aussi 2 cds appartenant à un cluster sans rRNA, Y-r2 et fdhA. Y-r2 avec sa taille de 1446 se comporte comme Y-r1, il n'existe pas dans cdc. fdhA est le contre exemple de cds qui n'est pas créé de novo, il n'est pas dans une zone altérée par la conversion des rRNA, et il existe dans cdc, mais pas dans psor qui est plus loin phylogénétiquement.
abrégé | cdc8 | pbs | cdc | pbs | psor | pbs |
---|---|---|---|---|---|---|
seleno A | 309950..310076 | 127 | 0 | - | ||
Y-r | 457663..457878 | 216 | 457207..457422 | 216 | - | |
1237414..1237986 | 573 | 1223841..1224413 | 573 | |||
1291413..1292327 | 915 | 1277836..1278750 | 915 | |||
1418672..1419580 | 909 | 1405262..1406170 | 909 | |||
2120221..2121348 | 1128 | |||||
2785863..2786042 | 180 | |||||
3564835..3565434 | 600 | |||||
Y-r2 | 3805298..3806743 | 1446 | ||||
Y-r1 | 4299490..4300134 | 645 | ||||
Helix | 351106..351336 | 231 | 391813..392001 | 189 | - | |
379952..380503 | 552 | 429510..430061 | 552 | |||
456588..456776 | 189 | 461727..462398 | 672 | |||
1187185..1187736 | 552 | 1169984..1170535 | 552 | |||
1466364..1466783 | 420 | 1292255..1292926 | 672 | |||
1467749..1468147 | 399 | 1454375..1454773 | 399 | |||
1605760..1606344 | 585 | 1517855..1518619 | 765 | |||
1694358..1694750 | 393 | 1592306..1592890 | 585 | |||
1936722..1937267 | 546 | 1682266..1682658 | 393 | |||
2105662..2106711 | 1050 | 1695592..1696284 | 693 | |||
2196549..2198204 | 1656 | 1916424..1916630 | 207 | |||
2342487..2342690 | 204 | 1922813..1923358 | 546 | |||
2353934..2354578 | 645 | 2164151..2165806 | 1656 | |||
2378761..2379891 | 1131 | 2308386..2308589 | 204 | |||
2721795..2722316 | 522 | 2319833..2320477 | 645 | |||
3485137..3486024 | 888 | 2344477..2345607 | 1131 | |||
3570953..3571183 | 231 | 2501260..2501931 | 672 | |||
3571660..3571878 | 219 | 2688255..2688776 | 522 | |||
3804379..3804627 | 249 | 3459701..3460588 | 888 | |||
3804878..3805279 | 402 | 3475449..3475589 | 141 | |||
4286854..4287222 | 369 | |||||
4288799..4289518 | 720 | |||||
4300349..4300807 | 459 | |||||
xylose | 3383443..3384780 | 1338 | 3349843..3351180 | 1338 | 0 | |
<4307539..4308225 | 687 | |||||
CHAP | <4213228..>4213849 | 622 | 0 | - | ||
A-1chlor | 4213961..4214620 | 660 | 0 | 0 | ||
SigB2 | 4221761..4222206 | 446 | 0 | 0 | ||
fdHa | 4221761..4222206 | 1701 | 3711229..3713373 | 2145 | - | |
R-deca | 0 | 0 | 127845..129260 | 1416 | ||
876023..877522 | 1500 | |||||
phagePP | 1448919..1449983 | 1065 | 1435547..1436611 | 1065 | 1489507..1490769 | 1263 |
1450539..1450985 | 447 | 1437167..1437613 | 447 | |||
1709611..1711050 | 1440 | 1697521..1698963 | 1443 | |||
1718404..1718844 | 441 | 1708192..1708632 | 441 | |||
3560756..3561910 | 1155 | 3841162..3842367 | 1206 | |||
4254725..4256002 | 1278 | |||||
4260531..4261586 | 1056 | |||||
4262058..4262474 | 417 | |||||
hp-204 | 4254509..4254712 | 204 | ||||
phagePP | 4254725..4256002 | 1278 | ||||
phageHM | 4255980..4256741 | 762 | ||||
hp-543 | 3840525..3841067 | 543 | ||||
phagePP | 3841162..3842367 | 1206 | ||||
hydrolase | 3842345..3842512 | 168 | ||||
terminase | 1487770..1489491 | 1722 | ||||
phagePP | 1489507..1490769 | 1263 | ||||
Clp | 1490762..1491607 | 846 |
cdc8 cdc abrégé protéines[modifier | modifier le wikicode]
- Lien tableur: cdc8 cdc abrégé protéines
- Légende:
- - Helix: spécifique cdc8
- - R-deca: spécifique psor
- - SigB: délocalisé dans cdc8
abrégé | nom protéine |
---|---|
A-1chlor | type A-1 chloramphenicol O-acetyltransferase |
ABC | ABC transporter ATP-binding protein |
Ala amid | N-acetylmuramoyl-L-alanine amidase |
Art-red | anaerobic ribonucleoside triphosphate reductase |
Art-reda | anaerobic ribonucleoside-triphosphate reductase activating protein |
B6 | pyridoxal phosphate-dependent aminotransferase |
cad | cadmium-translocating P-type ATPase |
CHAP | CHAP domain-containing protein |
CwlD | N-acetylmuramoyl-L-alanine amidase CwlD |
DedA | DedA family protein |
DeoR | DeoR/GlpR transcriptional regulator |
DnaC | DNA replication protein DnaC |
DUF378 | DUF378 domain-containing protein |
fdHa | formate dehydrogenase subunit alpha |
flagellar | flagellar motor protein |
Glyco-tr | glycosyl transferase |
Helix | helix-turn-helix domain-containing protein |
hp-1740 | hp-1740 |
hp-204 | hp-204 |
hp-282 | hp-282 |
hp-414 | hp-414 |
HXXEE | HXXEE domain-containing protein |
III-tau | DNA polymerase III subunit gamma/tau |
K-ligase | lysine--tRNA ligase |
lactam | delta-lactam-biosynthetic de-N-acetylase |
Mannosyl | Mannosyl-glycoprotein endo-beta-N-acetylglucosamidase |
MBOAT | MBOAT family protein |
mecano | mechanosensitive ion channel |
NadR | transcription repressor NadR |
NhaC | Na+/H+ antiporter NhaC family protein |
Nuc-de | nucleoside deaminase |
phagePP | phage portal protein |
PolyI | DNA polymerase I |
precorrin | bifunctional precorrin-2 dehydrogenase/sirohydrochlorin ferrochelatase |
pyruvate | pyruvate carboxylase |
R-deca | arginine decarboxylase |
seleno | glycine/sarcosine/betaine reductase complex selenoprotein A |
SigB | SigB/SigF/SigG family RNA polymerase sigma factor |
SigB2 | B/F/G family RNA polymerase sigma-70 factor |
S-ligase | serine--tRNA ligase |
SrtB | sortase SrtB |
succinate | adenylosuccinate synthase |
TIGR | TIGR00159 family protein |
xylose | xylose isomerase |
Y-r1 | tyrosine-type recombinase/integrase – 1 |
Y-r2 | tyrosine-type recombinase/integrase – 2 |
cdc8 cdc psor stats[modifier | modifier le wikicode]
- Lien tableur: cdc8 cdc psor stats
- légende
NCBI du 13.11.19 | cdc8 | cdc | psor |
---|---|---|---|
date | 15-MAR-2017 | 18-MAY-2017 | 08-JAN-2018 |
DNA circulaire | 4 308 325 | 4 110 554 | 3 550 458 |
Genes (total) | 4 025 | 3 807 | 3 528 |
CDS (total) | 3 870 | 3 691 | 3 368 |
Genes (coding) | 3 763 | 3 615 | 3 327 |
CDS (coding) | 3 763 | 3 615 | 3 327 |
Genes (RNA) | 155 | 116 | 160 |
RRNAs (5S, 16S, 23S) | 14, 16, 13 | 9, 10, 10 | 17, 17, 17 |
complete rRNAs | 14, 16, 13 | 9, 10, 10 | 17, 17, 17 |
tRNAs | 108 | 83 | 105 |
ncRNAs | 4 | 4 | 4 |
Pseudo Genes (total) | 107 | 76 | 41 |
Pseudo Genes (ambiguous residues) | 0 of 107 | 0 of 76 | 0 of 41 |
Pseudo Genes (frameshifted) | 60 of 107 | 42 of 76 | 4 of 41 |
Pseudo Genes (incomplete) | 35 of 107 | 30 of 76 | 18 of 41 |
Pseudo Genes (internal stop) | 31 of 107 | 18 of 76 | 22 of 41 |
Pseudo Genes (multiple problems) | 18 of 107 | 12 of 76 | 3 of 41 |
CRISPR Arrays | 4 | 9 | - |
Décompte du 19.11.19 | |||
hypothetical protein | 609 | 523 | 1 256 |
hp / cds (total) | 0,16 | 0,14 | 0,37 |
cdc8 remarques[modifier | modifier le wikicode]
- Lien noms abrégés
- Liens pour ce chapitre: noms abrégés opérons cumuls blocs cdc8 cdc psor 43 cdc8 cdc psor 18 cdc8 cdc psor 9 Alignement sur cdc Alignement sur cdc8.
- Remarques des 7 @ dans opérons :
- @ Dans la comparaison cdc8-cdc du bloc à 18aas, les rRNAs 23s et 16s disparaissent. Les 4 cds récupérés et le 23s° (voir opérons pour les noms et les longueurs des cds)
- - correspondraient à la somme des longueurs de 16s (1500 pbs) et 23s (2900 pbs), soit 4400 pbs
- - correspondraient à la longueur totale entre le 1er cds et le 5s, 4304299-4299490 = 4810 pbs
- - la somme des 4 cds récupérés et du 23s° est de 3875 pbs. Les longueurs des cds en aas sont dans l'ordre 215 153 580 68.
- - Le plus intéressant c'est que, si on suppose que les 2 protéines hypothétiques 580 et 68 sont dues aux remaniements,
- - les 2 protéines qui les précèdent sont qualifiées de type intégrase et de protéine contenant un domaine. C'est comme si les remaniements (certainement des conversions géniques) utilisaient une partie d'un gène protéique comme matrice de copie.
- @ configuration de bloc peu courante, avec gga: même bloc que cdc et psor.
- @ configuration de bloc peu courante, avec aca, et perte de 5s: même bloc que cdc et psor sans 5s.
- @ On retrouve le groupe1 de psor, avec 2 gca: VII1 en comp suivi de VIII1 en dir
- - L’intercalaire 23s-gca de VII1 est de 375, beaucoup plus élevé que celui de psor , 114.
- - De même pour VIII1, 248 contre 114.
- @ Conservation du bloc tcc-ncRNA dans cdc8 cdc et psor, avec les mêmes intercalaires.
- @ Conservation des 3 cds , avec leurs intercalaires, du seul groupe de cdc, mais les gca disparaissent.
- @ Nouveau bloc analogue au VI1 et VII1 de psor, sans gca, et qui n’existe pas chez cdc: 16s23s5s-tta-atgi. Avec ces 2 dernières remarques c'est comme si les remaniements des blocs à RNA consistaient à supprimer les gca des blocs 16sgca23s5s, et en le faisant ils laissaient des morceaux de 16s et 23s.
- @ Dans la comparaison cdc8-cdc du bloc à 18aas, les rRNAs 23s et 16s disparaissent. Les 4 cds récupérés et le 23s° (voir opérons pour les noms et les longueurs des cds)
- Décompte des rRNAs de cdc8 d'après Alignement sur cdc8.
Les RNAs 16s 14 16s’ 2 16s° 5 23s 9 23s’ 4 23s° 11 5s 14 taille d’un bloc normal 16s 16 1508 soit 10/14 23s 13 2900 soit 9/9 5s 14 117 soit 14/14
- Notes:
- - Les autres cds créés création de cds
- - Alignement sur cdc8: cdc8 résulte d'une recombinaison d'une clostridia de type cdc et d'une autre de type psor Alignement sur cdc8
- - Orientation des créations stats: soit création en masse par la mobilité et l'insertion des blocs 16s23s5s (cas de psor) puis dégradation de ces blocs dans une étape intermédiaire (cas de cdc8) qui aboutit à un état stable (cas de cdc), soit création par une évolution progressive de cdc vers psor en passant par cdc8. Le 1er cas serait soutenu la proportion très élevée des hp par rapport au total de 37% (voir stats) alors que le 2ème cas serait soutenu par par le type IV4 de cluster dans cdc8 et n'existe ni dans cdc ni dans psor, 16s23s5s-tta-atgi (voir alignement sur cdc8).
- - Les 3 types de création: avec altération des rRNAs (cdc8), dans les blocs 16s23s5s ou 16s-aaas-23s5s (décompte des cds dans un échantillon de clostridia) et après les blocs à la suite des tRNAs ou non (psor opérons).
- - Hypothèse de la création des gènes [10]
cdc8 distribution[modifier | modifier le wikicode]
- Lien tableur: cdc8 distribution
- Notes: Tableau Cl32
- - -5s: gga et aca
- - 1-3: 2 tta et 2 atgi
|
|
cdc8. Intergen51[modifier | modifier le wikicode]
Intergen51. cdc8. Le génome[modifier | modifier le wikicode]
- cdc8 Le prélèvement: Aclostridia
- Le nom et le lien NCBI: cdc8, Clostridioides difficile M68, NCBI [11], date 6.2.22.
- cdc8 La longueur totale des intercalaires, longueur du génome et taux intercalaires/génome:
Nom intercals génome taux en % cdc8 663,874 4,308,325 15.4
cdc8 données intercalaires[modifier | modifier le wikicode]
- Lien tableur: cdc8 données intercalaires
- Lien sauvegarde NCBI: Aclostridia
cdc8 données intercalaires 200[modifier | modifier le wikicode]
- Lien tableur: données intercalaires 200.
cdc8 autres intercalaires aas[modifier | modifier le wikicode]
- Lien tableur: cdc8 autres intercalaires aas
- Lien sauvegarde NCBI: Aclostridia
Intergen51. cdc8. Les différents types d'intercalaires[modifier | modifier le wikicode]
- Lien au tableur: Intergen51. cdc8 les différents types d'intercalaires.
- Légende:
- - S pour intercalaire CDS-CDS et R pour tRNA-CDS,
- - c pour intercalaire continu (les 2 gènes sont sur le même brin) et x pour discontinu (les 2 gènes sont sur 2 brins différents, le brin et son complément)
- - %reste = 100*reste/total, le reste étant ce qui reste du total après la fin du diagramme, gamme.
- - %t30 = 100*t30/total, t30 étant le total des fréquences 10 20 30
- - %t5 = 100*t/total, t5 étant le total des fréquences de -1 à -5 dans le diagramme des S-.
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
Intergen51. cdc8. Les diagrammes CDS-CDS positifs[modifier | modifier le wikicode]
- Lien tableur: Les diagrammes
- Diagrammes des gamma: cdc8 présente 2 diagrammes
- - fc40, CDS-CDS continu, fréquence unitaire en abscisses et effectif en ordonnées
- - fx%, CDS-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et pourcentage en ‰ par rapport au total, en ordonnées.
- Équations des courbes de tendance en pour 1000: colonnes %fx %fc
Courbes de tendances pour les diagrammes en pour 1000 Calculs des f.41 cdc8 R2 x3 x2 x c Inflexion poly3 x c 0.680 1.93E-06 -1.89E-03 4.85E-01 -7.46 fx1 abscisse 284.3 551.3 0.829 -6.53E-06 4.96E-03 -1.21E+00 105.0 fc1 ordonnée 21.5 4.4 0.663 3.67E-06 -3.13E-03 7.51E-01 -23.4 fx41 0.905 -2.11E-07 3.49E-04 -1.96E-01 41.7 fc41
Intergen51. cdc8. Les CDS-CDS négatifs[modifier | modifier le wikicode]
Sous-totaux cdc8 totale fréquence x- c- x- c- - 1 0 71 4 4140 - 2 0 0 85 11 - 3 0 1 3 12 - 4 1 51 717 10938 - 5 0 0 5 19 sp6 3 203 1642 8424 total 4 326 2,456 23,544 reste 0 5 264 420 s6 0 1 361 41 s7 1 30 321 1438 s8 2 167 696 6525 rappot s1-5 4/2/1 - 0.7 8.4 2.6 % / sp6 s6/sp6 0.0 0.5 22.0 0.5 s7/sp6 33.3 14.8 19.5 17.1 s8/sp6 66.7 82.3 42.4 77.5 reste/sp6 0.0 2.5 16.1 5.0 total s1-5 1 123 814 15120 % / total %s1-5 25.0 37.7 33.1 64.2 %sp6 75.0 62.3 66.9 35.8
Intergen51. cdc8. Les intercalaires des blocs[modifier | modifier le wikicode]
- Le détail
RNA-RNA c x CDS-RNA c x 23s 5s 7 CDS 16s 6 4 16s 23s 8 5s CDS 5 1 16s tRNA 1 16 CDS 2 tRNA 23s 2 CDS 5s 5s tRNA 6 1 23s CDS 1 tRNA in 2 CDS 23s tRNA contig 85 5s 16s 1 tRNA hors 3 16s16s tRNA 16s 3 23s tRNA 2 tRNA 5s 1 16s 5s 5s 23s 5s 5s total 120 1 total 13 7
- Les rares voir gamma pour la longueur des intercalaires
- Les tRNA-CDS compris, comparaison dans le clade et dans l'étude.
Intergen51. cdc8. Les intercalaires tRNA-tRNA extra bloc[modifier | modifier le wikicode]
- Lien tableur: Intergen51. cdc8. Les intercalaires tRNA-tRNA extra bloc
cont1 | cont2 | cont3 | cont5 | cont6 | |||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
inter | aa | inter | aa | inter | aa | inter | aa | inter | aa | ||||
6 | aac | 7 | atgf | 6 | aac | 89 | caa | 4 | aac | ||||
15 | tta | 9 | gaa | 15 | tta | 3 | tca | 5 | gaa | ||||
7 | atgf | 5 | gga | 7 | atgf | 6 | ttc | 5 | gta | ||||
9 | gaa | 5 | gta | 8 | gaa | 14 | atgj | 11 | gac | ||||
5 | gga | 9 | gac | 4 | gga | 29 | atgi | 14 | aca | ||||
5 | gta | 14 | aca | 5 | gta | 7 | cca | 9 | tac | ||||
9 | gac | 9 | tac | 10 | gac | 8 | cac | 10 | gga | ||||
14 | aca | 24 | cta | 9 | ggc | ** | aaa | 9 | aga | ||||
10 | tac | 24 | ggc | ** | aga | 11 | caa | ||||||
28 | cta | 9 | aga | cont4 | 2 | aaa | |||||||
7 | aga | 8 | caa | 6 | aac | 18 | tca | ||||||
89 | caa | 2 | aaa | 15 | tta | 8 | agc | ||||||
3 | tca | 3 | tca | 7 | atgf | 85 | cca | ||||||
6 | ttc | 6 | ttc | 9 | gaa | 60 | tgg | ||||||
14 | atgj | 14 | atgj | 5 | gga | 5 | cca | ||||||
29 | atgi | 17 | atgi | 5 | gta | 3 | atc | ||||||
7 | cca | 8 | cac | 9 | gac | hors | 7 | ttc | |||||
8 | cac | 7 | aaa | 14 | aca | 33 | aca | ** | atgj | ||||
7 | aaa | 7 | tgc | 10 | tac | 4 | gta | ||||||
6 | tgc | 12 | cgt | 28 | cta | 6 | gaa | ||||||
6 | aac | ** | gta | 7 | aga | ** | aaa | ||||||
15 | tta | ||||||||||||
- |
Clostridium botulinum CDC_297[modifier | modifier le wikicode]
- Notes: Il n'y a pas de code KEGG pour ce génome, je lui ai donné le code cbc*, mais pour les têtes de chapitre je mets cbc.
cbc opérons[modifier | modifier le wikicode]
- Lien tableur: cbc* opérons
- Liens: gtRNAdb [12], NCBI [13], génome
- Phylogénie: Bacteria; Firmicutes; Clostridia; Clostridiales; Clostridiaceae;Clostridium.
- Légende:
- - cyan pour les doubles signalés par le signe + dans la colonne doubles.
- - cds, ce cds a la particularité d'être très court et collé au cluster à rRNA. Il fait 108 pbs et sa séquence est,
MNEGCDRILIVVARWQVSKNKKMLTKIKKRATIIKH. - - @ voir le chapitre remarques de ce génome.
28%GC | 30.6.19 Paris | 52 | doubles | intercal | aa | avec aa |
---|---|---|---|---|---|---|
comp | 1309334..1309408 | gag | ||||
comp | 1385938..1386012 | aac | 8 | |||
comp | 1386021..1386134 | 5s | 108 | |||
comp | 1386243..1389140 | 23s | 228 | |||
comp | 1389369..1390866 | 16s | @1 | |||
comp | 1392997..1393072 | ttc | 7 | |||
comp | 1393080..1393193 | 5s | 108 | |||
comp | 1393302..1396199 | 23s | 228 | |||
comp | 1396428..1397925 | 16s | ||||
comp | 1408673..1408762 | tcc | ||||
comp | 1412183..1412259 | agg | ||||
comp | 1415464..1415540 | cgt | 84 | 84 | ||
comp | 1415625..1415715 | agc | + | 20 | 20 | |
comp | 1415736..1415826 | tca | 2 agc | 306 | 306 | |
comp | 1416133..1416223 | agc | 2 tca | 20 | 20 | |
comp | 1416244..1416334 | tca | @4 | |||
comp | 1425969..1426044 | gca | 3 | 3 | ||
comp | 1426048..1426124 | atgi | 8 | |||
comp | 1426133..1426246 | 5s | 79 | |||
comp | 1426326..1427823 | 16s | @2 | 117 | ||
comp | 1427941..1428051 | cds | ||||
1694943..1695017 | cag | |||||
comp | 1722580..1722664 | tac | 5 | 5 | ||
comp | 1722670..1722745 | aca | ||||
comp | 1841437..1841510 | tgc | ||||
comp | 1842698..1842811 | 5s | 108 | |||
comp | 1842920..1845817 | 23s | 228 | |||
comp | 1846046..1847543 | 16s | ||||
1890534..1890608 | gaa | + | 17 | 17 | ||
1890626..1890701 | gta | 3 gaa | 9 | 9 | ||
1890711..1890787 | gac | 3 gta | 4 | 4 | ||
1890792..1890867 | aca | 3 gac | 5 | 5 | ||
1890873..1890947 | gaa | 2 aca | 18 | 18 | ||
1890966..1891041 | gta | 7 | 7 | |||
1891049..1891125 | gac | 57 | 57 | |||
1891183..1891257 | gaa | 17 | 17 | |||
1891275..1891350 | gta | 9 | 9 | |||
1891360..1891436 | gac | 4 | 4 | |||
1891441..1891516 | aca | |||||
comp | 1948153..1948228 | cca | ||||
1969157..1969245 | tta | 4 | 4 | |||
1969250..1969325 | atgf | + | 53 | 53 | ||
1969379..1969454 | atgf | 2 atgf | 10 | 10 | ||
1969465..1969541 | atg | |||||
1987541..1989040 | 16s | @3 | 226 | |||
1989267..1992166 | 23s | 93 | ||||
1992260..1992375 | 5s | 7 | ||||
1992383..1992457 | aac | + | 27 | 27 | ||
1992485..1992559 | aac | |||||
2013239..2013313 | ggg | 18 | 18 | |||
2013332..2013407 | acc | |||||
2222515..2222590 | tgg | |||||
2294767..2294842 | cca | + | 7 | 7 | ||
2294850..2294923 | gga | 2 cca | 6 | 6 | ||
2294930..2295006 | aga | 2 gga | 5 | 5 | ||
2295012..2295087 | aag | 26 | 26 | |||
2295114..2295189 | cca | 29 | 29 | |||
2295219..2295292 | gga | 24 | 24 | |||
2295317..2295393 | cga | |||||
2402556..2402631 | gta | 5 | 5 | |||
2402637..2402713 | gac | 3 | 3 | |||
2402717..2402792 | ttc | 4 | 4 | |||
2402797..2402871 | ggc | 9 | 9 | |||
2402881..2402954 | tgc | |||||
2517305..2517391 | ttg | |||||
2548708..2548792 | ctc | |||||
2583298..2583388 | tga |
cbc cumuls[modifier | modifier le wikicode]
- Note: Les statistiques sur les intercalaires entre tRNA ne sont pas correctes. Se reporter à intergen51.cbc. Il n'y a aucun commentaire sur les CDS. J'ai réduit le tableau aux clusters à rRNA. L'intitulé opéron doit d'être compris dans le sens cluster ou bloc de RNA, rRNA ou tRNA.
cbc cumuls opérons effectif avec rRNA opérons 5 16 23 5s 0 1 16 atc gca 0 16 23 5s a 3 max a 2 a doubles 1 spéciaux 1 total aas 6 sans opérons 17 1 aa 10 max a 11 a doubles 4 total aas 46 total aas 52 remarques 4
cbc blocs[modifier | modifier le wikicode]
- Lien tableur: cbc* blocs
- Légende:
aac | 8 | 7 | - | |
5s | 108 | 108 | 108 | 226 |
23s | 228 | 228 | 228 | 93 |
16s | - | 7 | ||
gca | 3 | |||
atgi | 8 | |||
5s | 79 | |||
16s |
cbc remarques[modifier | modifier le wikicode]
@1 Les 4 blocs 16.23.5.aa ont des intercalaires identiques à 1 base près. - 1 a 0aa, 2 ont 1aa et 1 a 2aas (@3. @2 C’est 1 bloc 16.23.5.aa qui a perdu 23s. - L'intercalaire 5s-aa est le même que pour les 4 blocs de @1. - Il a 2aas dont le 1er est atgi, rare avec les rRNAs. - Il est précédé d'une protéine de 36aas avec un intercalaire de 117. - Est-ce qu'elle appartient à l'opéron? @3 C’est 1 bloc 16.23.5.aa de @1 avec 1 aa double. - L'intercalaire 23-5 est très faible, 14% de moins par rapport à @1, 15/108. @4 Dépassement de la règle des intercalaires, 210 bases, 306. - Il se trouve entre 2 séquences de 2 aas. - Est-ce 2 opérons? Séquences des doubles : - 1 opéron à 1 doublet. - 2 opérons à 2 séquences de 2 aas chacun. - 1 opéron de 11 aas avec 4 séquences de 3 aas, moins 1 aa.
cbc distribution[modifier | modifier le wikicode]
- Lien tableur: cbc distribution
- Notes:
- - 1-3aas: gca atgi aac ttc aac2
- - >1aa: atgf2
g1 | t1 | ||||||
---|---|---|---|---|---|---|---|
atgi | 1 | tct | tat | atgf | 2 | ||
att | act | aat | agt | ||||
ctt | cct | cat | cgc | ||||
gtt | gct | gat | ggt | ||||
ttc | 2 | tcc | 1 | tac | 1 | tgc | 2 |
atc | acc | 1 | aac | 3 | agc | 2 | |
ctc | 1 | ccc | cac | cgt | 1 | ||
gtc | gcc | gac | 4 | ggc | 1 | ||
tta | 1 | tca | 2 | taa | tga | 1 | |
ata | aca | 3 | aaa | aga | 1 | ||
cta | cca | 3 | caa | cga | 1 | ||
gta | 4 | gca | 1 | gaa | 3 | gga | 2 |
ttg | 1 | tcg | tag | tgg | 1 | ||
atgj | 1 | acg | aag | 1 | agg | 1 | |
ctg | ccg | cag | 1 | cgg | |||
gtg | gcg | gag | 1 | ggg | 1 | ||
clos | >1aa | =1aa | -5s | +5s | -16s | +16s | total |
cbc* | 36 | 10 | 6* | 52 |
cbc. Intergen51[modifier | modifier le wikicode]
Intergen51. cbc. Le génome[modifier | modifier le wikicode]
- cbc Le prélèvement: Aclostridia
- Le nom et le lien NCBI: cbc, Clostridium botulinum CDC_297, NCBI [14], date 14.4.15.
- cbc La longueur totale des intercalaires, longueur du génome et taux intercalaires/génome:
Nom intercals génome taux en % cbc 696,513 3,892,029 17.9
cbc données intercalaires[modifier | modifier le wikicode]
- Lien tableur: cbc données intercalaires
- Lien sauvegarde NCBI: Aclostridia
cbc données intercalaires 200[modifier | modifier le wikicode]
- Lien tableur: données intercalaires 200.
cbc autres intercalaires aas[modifier | modifier le wikicode]
- Lien tableur: cbc autres intercalaires aas
- Lien sauvegarde NCBI: Aclostridia
Intergen51. cbc. Les différents types d'intercalaires[modifier | modifier le wikicode]
- Lien au tableur: Intergen51. cbc les différents types d'intercalaires.
- Légende:
- - S pour intercalaire CDS-CDS et R pour tRNA-CDS,
- - c pour intercalaire continu (les 2 gènes sont sur le même brin) et x pour discontinu (les 2 gènes sont sur 2 brins différents, le brin et son complément)
- - %reste = 100*reste/total, le reste étant ce qui reste du total après la fin du diagramme, gamme.
- - %t30 = 100*t30/total, t30 étant le total des fréquences 10 20 30
- - %t5 = 100*t/total, t5 étant le total des fréquences de -1 à -5 dans le diagramme des S-.
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
Intergen51. cbc. Les diagrammes CDS-CDS positifs[modifier | modifier le wikicode]
- Lien tableur: Les diagrammes
- Diagrammes des gamma: cbc présente 2 diagrammes
- - fc40, CDS-CDS continu, fréquence unitaire en abscisses et effectif en ordonnées
- - fx%, CDS-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et pourcentage en ‰ par rapport au total, en ordonnées.
- Équations des courbes de tendance en pour 1000: colonnes %fx %fc
Courbes de tendances pour les diagrammes en pour 1000 Calculs des f.41 cbc R2 x3 x2 x c Inflexion poly3 x c 0.481 1.11E-06 -1.01E-03 2.51E-01 4.94 fx1 abscisse 309.3 164.9 0.782 -5.00E-06 3.83E-03 -9.48E-01 87.8 fc1 ordonnée 18.6 19.2 0.365 1.11E-06 -1.03E-03 2.60E-01 3.84 fx41 0.885 8.29E-07 -4.10E-04 -2.04E-02 30.0 fc41
Intergen51. cbc. Les CDS-CDS négatifs[modifier | modifier le wikicode]
Sous-totaux cbc totale fréquence x- c- x- c- - 1 0 72 4 4140 - 2 0 0 85 11 - 3 0 0 3 12 - 4 3 58 717 10938 - 5 0 0 5 19 sp6 4 158 1642 8424 total 7 288 2,456 23,544 reste 1 4 264 420 s6 1 0 361 41 s7 1 28 321 1438 s8 1 126 696 6525 rappot s1-5 4/2/1 - 0.8 8.4 2.6 % / sp6 s6/sp6 25.0 0.0 22.0 0.5 s7/sp6 25.0 17.7 19.5 17.1 s8/sp6 25.0 79.7 42.4 77.5 reste/sp6 25.0 2.5 16.1 5.0 total s1-5 3 130 814 15120 % / total %s1-5 42.9 45.1 33.1 64.2 %sp6 57.1 54.9 66.9 35.8
Intergen51. cbc. Les intercalaires des blocs[modifier | modifier le wikicode]
- Le détail
RNA-RNA c x CDS-RNA c x 23s 5s 4 CDS 16s 5 16s 23s 4 5s CDS 1 16s tRNA 16 CDS tRNA 23s CDS 5s 5s tRNA 4 23s CDS tRNA in CDS 23s tRNA contig 2 5s 16s tRNA hors 29 16s16s tRNA 16s 23s tRNA tRNA 5s 16s 5s 1 5s 23s 5s 5s total 44 0 total 6 0
- Les rares voir gamma pour la longueur des intercalaires
- Les tRNA-CDS compris, comparaison dans le clade et dans l'étude.
Intergen51. cbc. Les intercalaires tRNA-tRNA extra bloc[modifier | modifier le wikicode]
- Lien tableur: Intergen51. cbc. Les intercalaires tRNA-tRNA extra bloc
hors1 | hors2 | |||
---|---|---|---|---|
inter | aa | inter | aa | |
84 | cgt | 18 | ggg | |
20 | agc | ** | acc | |
306 | tca | 7 | cca | |
20 | agc | 6 | gga | |
** | tca | 5 | aga | |
5 | tac | 26 | aag | |
** | aca | 29 | cca | |
17 | gaa | 24 | gga | |
9 | gta | ** | cga | |
4 | gac | 5 | gta | |
5 | aca | 3 | gac | |
18 | gaa | 4 | ttc | |
7 | gta | 9 | ggc | |
57 | gac | ** | tgc | |
17 | gaa | |||
9 | gta | |||
4 | gac | |||
** | aca | cont | ||
4 | tta | 3 | gca | |
53 | atgf | ** | atgi | |
10 | atgf | 27 | aac | |
** | atgj | ** | aac | |
- |
Clostridium botulinum BKT015925[modifier | modifier le wikicode]
cbn opérons[modifier | modifier le wikicode]
- Lien tableur: cbn opérons
- Liens: gtRNAdb [15], NCBI [16], génome
- Phylogénie: Bacteria; Firmicutes; Clostridia; Clostridiales; Clostridiaceae;Clostridium.
- Légende:
- - cyan pour les doubles signalés par le signe + dans la colonne doubles.
- - @ voir le chapitre remarques de ce génome.
28%GC | 30.6.19 Paris | 86 | doubles | intercal | aa | avec aa |
---|---|---|---|---|---|---|
20666..20741 | acg | |||||
36413..36487 | gaa | + | 12 | 12 | ||
36500..36575 | gta | 2 gaa | 13 | 13 | ||
36589..36665 | gac | 2 gta | 5 | 5 | ||
36671..36746 | aca | 2 gac | 18 | 18 | ||
36765..36839 | gaa | 2 aca | 12 | 12 | ||
36852..36927 | gta | 13 | 13 | |||
36941..37017 | gac | 5 | 5 | |||
37023..37098 | aca | |||||
137366..137441 | cca | |||||
161964..162052 | tta | + | 5 | 5 | ||
162058..162133 | atgf | 3 tta | 5 | 5 | ||
162139..162215 | atgj | 3 atgf | 46 | 46 | ||
162262..162350 | tta | 2 atgj | 5 | 5 | ||
162356..162431 | atgf | 30 | 30 | |||
162462..162538 | atgj | 46 | 46 | |||
162585..162673 | tta | 5 | 5 | |||
162679..162754 | atgf | |||||
76258..176332 | aac | |||||
180177..181695 | 16s | @5 | 233 | |||
181929..184836 | 23s | 45 | ||||
184882..184956 | aac | + | 14 | |||
184971..185087 | 5s | 7 | ||||
185095..185169 | aac | 2 aac | ||||
222409..222484 | acc | |||||
comp | 578417..578492 | cag | ||||
comp | 944747..944833 | ttg | ||||
955546..955630 | ctt | |||||
1026946..1027021 | gta | 17 | 17 | 17 | ||
1027039..1027115 | gac | 14 | 14 | 14 | ||
1027130..1027205 | ttc | 4 | 4 | 4 | ||
1027210..1027284 | ggc | 8 | 8 | 8 | ||
1027293..1027367 | tgc | + | 57 | 57 | 57 | |
1027425..1027499 | tgc | 2 tgc | ||||
comp | 2030816..2030890 | aac | 45 | |||
comp | 2030936..2033842 | 23s | 96 | |||
comp | 2033939..2034015 | atc | 7 | 7 | ||
comp | 2034023..2034098 | gca | 121 | |||
comp | 2034220..2035734 | 16s | ||||
comp | 2283768..2283884 | 5s | 95 | |||
comp | 2283980..2286886 | 23s | 233 | |||
comp | 2287120..2288638 | 16s | @3 | 464 | ||
comp | 2289103..2289176 | gga | 15 | 15 | ||
comp | 2289192..2289268 | atc | 7 | 7 | ||
comp | 2289276..2289351 | gca | ||||
comp | 2350598..2350674 | cga | + | 21 | 21 | |
comp | 2350696..2350769 | gga | 4 gga | 28 | 28 | |
comp | 2350798..2350873 | aaa | 2 aaa | 4 | 4 | |
comp | 2350878..2350952 | caa | 2 caa | 4 | 4 | |
comp | 2350957..2351032 | cac | 2 cac | 5 | 5 | |
comp | 2351038..2351112 | aag | 3 aag | 3 | 3 | |
comp | 2351116..2351192 | aga | 3 aga | 6 | 6 | |
comp | 2351199..2351272 | gga | 2 cca | 4 | 4 | |
comp | 2351277..2351352 | cca | 2 ggc | 21 | 21 | |
comp | 2351374..2351449 | aag | 5 | 5 | ||
comp | 2351455..2351531 | aga | 5 | 5 | ||
comp | 2351537..2351610 | gga | 5 | 5 | ||
comp | 2351616..2351690 | ggc | 3 | 3 | ||
comp | 2351694..2351777 | cta | 22 | 22 | ||
comp | 2351800..2351875 | aaa | 4 | 4 | ||
comp | 2351880..2351954 | caa | 4 | 4 | ||
comp | 2351959..2352034 | cac | 5 | 5 | ||
comp | 2352040..2352115 | aag | 5 | 5 | ||
comp | 2352121..2352197 | aga | 5 | 5 | ||
comp | 2352203..2352276 | gga | 5 | 5 | ||
comp | 2352282..2352356 | ggc | 6 | 6 | ||
comp | 2352363..2352438 | cca | ||||
comp | 2432784..2432859 | tgg | ||||
comp | 2454880..2454964 | tac | + | 39 | 39 | |
comp | 2455004..2455079 | gta | 2 tac | 8 | 8 | |
comp | 2455088..2455172 | tac | 4 | 4 | ||
comp | 2455177..2455252 | aca | ||||
comp | 2697795..2697911 | 5s | @1 | 31 | ||
comp | 2697943..2700847 | 23s | 233 | |||
comp | 2701081..2702599 | 16s | ||||
comp | 2703946..2704021 | aaa | 311 | 311 | ||
comp | 2704333..2704408 | ttc | 5 | |||
comp | 2704414..2704530 | 5s | 336 | |||
comp | 2704867..2704942 | ttc | 5 | |||
comp | 2704948..2705064 | 5s | 97 | |||
comp | 2705162..2708066 | 23s | 233 | |||
comp | 2708300..2709814 | 16s | ||||
comp | 2721253..2721328 | aaa | @2 | 5 | ||
comp | 2721334..2721450 | 5s | 95 | |||
comp | 2721546..2724452 | 23s | 233 | |||
comp | 2724686..2726203 | 16s | ||||
comp | 2731902..2731976 | gag | 61 | 61 | ||
comp | 2732038..2732112 | caa | 6 | 6 | ||
comp | 2732119..2732195 | aga | 4 | 4 | ||
comp | 2732200..2732273 | gga | 19 | 19 | ||
comp | 2732293..2732376 | cta | 16 | 16 | ||
comp | 2732393..2732467 | gaa | 4 | |||
comp | 2732472..2732588 | 5s | 97 | |||
comp | 2732686..2735592 | 23s | @4 | 94 | ||
comp | 2735687..2735763 | atc | 3 | |||
comp | 2735767..2735842 | gca | 74 | |||
comp | 2735917..2737435 | 16s | ||||
comp | 2742262..2742351 | tcc | ||||
comp | 2743220..2743312 | tcg | ||||
comp | 2743891..2743967 | agg | ||||
comp | 2748534..2748610 | cgt | 144 | 144 | ||
comp | 2748755..2748845 | agc | 23 | 23 | ||
comp | 2748869..2748959 | tca | + | 69 | 69 | |
comp | 2749029..2749119 | tca | 2 tca | |||
comp | 2758688..2758763 | gca | 4 | 4 | ||
comp | 2758768..2758844 | atgi | 3 | |||
comp | 2758848..2758964 | 5s | 73 | |||
comp | 2759038..2761942 | 23s | 233 | |||
comp | 2762176..2763694 | 16s | ||||
comp | 2150504..2150620 | 5s | 31 | |||
comp | 2150652..2153560 | 23s | 233 | |||
comp | 2153794..2155308 | 16s | ||||
comp | 2169525..2169641 | 5s | 32 | |||
comp | 2169674..2172579 | 23s | 233 | |||
comp | 2172813..2174331 | 16s | ||||
sur plasmide | tgg |
cbn cumuls[modifier | modifier le wikicode]
- Note: Les statistiques sur les intercalaires entre tRNA ne sont pas correctes. Se reporter à intergen51.cbn. Il n'y a aucun commentaire sur les CDS. J'ai réduit le tableau aux clusters à rRNA. L'intitulé opéron doit d'être compris dans le sens cluster ou bloc de RNA, rRNA ou tRNA.
cbn cumuls opérons effectif avec rRNA opérons 10 16 23 5s 0 3 16 gca atc 2 16 23 5s a 4 max a 8 a doubles 1 spéciaux 1 total aas 22 sans opérons 18 1 aa 12 max a 22 a doubles 6 total aas 64 total aas 86 remarques 5
cbn blocs[modifier | modifier le wikicode]
- Lien tableur: cbn blocs
- Légende:
5s | 31 | 31 | 32 | |||
23s | 233 | 233 | 233 | |||
16s | ||||||
ttc | 5 | |||||
5s | 336 | |||||
aaa | 5 | 3 | ttc | 5 | ||
5s | 95 | 73 | 5s | 95 | 5s | 97 |
23s | 233 | 233 | 23s | 233 | 23s | 233 |
16s | aaa | atgi | 16s | 464 | 16s | |
gga | 15 | |||||
16s | 233 | |||||
23s | 45 | |||||
aac | 14 | |||||
5s | 7 | |||||
aac | ||||||
gaa | 4 | |||||
5s | 97 | aac | 45 | |||
23s | 94 | 23s | 96 | |||
atc | 3 | atc | 7 | |||
gca | 74 | gca | 121 | |||
16s | 16s |
cbn remarques[modifier | modifier le wikicode]
*Remarques @1 Les 3 opérons 16-23-5s ont les mêmes intercalaires, 233-31 bases. @2 Les 4 opérons 16-23-5s -aa ont tous à peu près les mêmes intercalaires 233-95-5. - Mais ils sont tous différents: + 1 seul opéron répond au critère des intercalaires, il a 1aa. + 1 seul opéron ne répond pas strictement au critère des intercalaires. Ses 3aas sont du côté du 16s et l’intercalaire avec le 1er aa est très Élevé, 464. + L'opéron à 2aas a l'intercalaire 23-5s très faible de 23% inférieur à 95, 22/95. + L'opéron à 3aas répondant aux critères a un 5s en plus. @3 Le critère d’un intercalaire entre 2aas, supérieur à 210 bases, se trouve dans le 4ème opéron à rRNA, mais il est accompagné d’un intercalaire très élevé entre 5s et le 1er aa, comme pour le 2ème opéron à rRNA. @4 C’est un opéron à rRNA atypique : 2aas double entourant le 5s. - Mais coserve l’intercalaire 16-23s de 233 bases comme les 7 opérons de ce type. @5 Les 2 opérons à 16-atc gca présentent, ici, la particularité d’inverser ses 2 aas, gca-atc. - Ils ont aussi, à peu près, les mêmes intercalaires 16-gca-atc-23s, 74 4 94. - L'opéron à rRNA présentant le max d'aas, au nombre de 8, est de ce type. Il a le même intercalaire 23-5s que tous les autres opérons à rRNA, 97 bases. *Séquences des doubles : tous les opérons à plus de 3aas ont des doubles, 6/6. - Les répétitions vont de 5 à 2. - 3 opérons sur 6 ont des séquences qui se répètent, avec 22aas et 2 avec 8aas. - L'opéron contenant le max d'aas, 22, a 2 séquences de 6 aas qui se répètent. - On peut repérer dans cet opéron d'autres séquences de 3 aas. - Ces séquences sont séparées par 1 ou 2 aas différents.
cbn distribution[modifier | modifier le wikicode]
- Lien tableur: cbn distribution
- Notes:
- - Tableau Cl51: gca, 1-3aas et -16s. aac, 1aa et 1-3aas.
- - Tableau Cl52: 4-8aas, gag caa aga gga cta gaa. >1aa, tgc2 et tca2 en gras.
|
|
cbn. Intergen51[modifier | modifier le wikicode]
Intergen51. cbn. Le génome[modifier | modifier le wikicode]
- cbn Le prélèvement: Acbn
- Le nom et le lien NCBI: cbn, Clostridium botulinum BKT015925, NCBI [17], date 31.01.14.
- cbn La longueur totale des intercalaires, longueur du génome et taux intercalaires/génome:
Nom intercals génome taux en % cbn 330,729 2,773,157 11.9
cbn données intercalaires[modifier | modifier le wikicode]
- Lien tableur: cbn données intercalaires
- Lien sauvegarde NCBI: Acbn
cbn données intercalaires 200[modifier | modifier le wikicode]
- Lien tableur: données intercalaires 200.
cbn autres intercalaires aas[modifier | modifier le wikicode]
- Lien tableur: cbn autres intercalaires aas
- Lien sauvegarde NCBI: Acbn
Intergen51. cbn. Les différents types d'intercalaires[modifier | modifier le wikicode]
- Lien au tableur: Intergen51. cbn les différents types d'intercalaires.
- Légende:
- - S pour intercalaire CDS-CDS et R pour tRNA-CDS,
- - c pour intercalaire continu (les 2 gènes sont sur le même brin) et x pour discontinu (les 2 gènes sont sur 2 brins différents, le brin et son complément)
- - %reste = 100*reste/total, le reste étant ce qui reste du total après la fin du diagramme, gamme.
- - %t30 = 100*t30/total, t30 étant le total des fréquences 10 20 30
- - %t5 = 100*t/total, t5 étant le total des fréquences de -1 à -5 dans le diagramme des S-.
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
Intergen51. cbn. Les diagrammes CDS-CDS positifs[modifier | modifier le wikicode]
- Lien tableur: Les diagrammes
- Diagrammes des gamma: cbn présente 2 diagrammes
- - fc40, CDS-CDS continu, fréquence unitaire en abscisses et effectif en ordonnées
- - fx%, CDS-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et pourcentage en ‰ par rapport au total, en ordonnées.
- Équations des courbes de tendance en pour 1000: colonnes %fx %fc
Courbes de tendances pour les diagrammes en pour 1000 Calculs des f.41 cbn R2 x3 x2 x c Inflexion poly3 x c 0.450 1.33E-06 -9.44E-04 1.11E-01 29.70 fx1 abscisse 243.0 186.3 0.856 -3.49E-06 2.27E-03 -7.66E-01 85.6 fc1 ordonnée 19.3 20.5 0.692 -4.02E-06 2.93E-03 -7.31E-01 81.60 fx41 0.941 1.70E-06 -9.50E-04 2.68E-02 37.5 fc41
Intergen51. cbn. Les CDS-CDS négatifs[modifier | modifier le wikicode]
Sous-totaux cbn totale fréquence x- c- x- c- - 1 0 34 4 4140 - 2 0 0 85 11 - 3 0 0 3 12 - 4 0 28 717 10938 - 5 0 0 5 19 sp6 9 105 1642 8424 total 9 167 2,456 23,544 reste 0 0 264 420 s6 5 0 361 41 s7 0 23 321 1438 s8 4 82 696 6525 rappot s1-5 4/2/1 - 0.8 8.4 2.6 % / sp6 s6/sp6 55.6 0.0 22.0 0.5 s7/sp6 0.0 21.9 19.5 17.1 s8/sp6 44.4 78.1 42.4 77.5 reste/sp6 0.0 0.0 16.1 5.0 total s1-5 0 62 814 15120 % / total %s1-5 0.0 37.1 33.1 64.2 %sp6 100.0 62.9 66.9 35.8
Intergen51. cbn. Les intercalaires des blocs[modifier | modifier le wikicode]
- Le détail
RNA-RNA c x CDS-RNA c x 23s 5s 8 CDS 16s 8 2 16s 23s 8 5s CDS 2 2 16s tRNA 2 16 CDS tRNA 23s 2 CDS 5s 5s tRNA 6 23s CDS tRNA in 2 CDS 23s tRNA contig 7 5s 16s tRNA hors 48 16s16s tRNA 16s 23s tRNA 2 tRNA 5s 2 16s 5s 5s 23s 5s 5s total 87 0 total 10 4
- Les rares voir gamma pour la longueur des intercalaires
- Les tRNA-CDS compris, comparaison dans le clade et dans l'étude.
Intergen51. cbn. Les intercalaires tRNA-tRNA extra bloc[modifier | modifier le wikicode]
- Lien tableur: Intergen51. cbn. Les intercalaires tRNA-tRNA extra bloc
hors1 | hors2 | hors3 | |||||
---|---|---|---|---|---|---|---|
inter | aa | inter | aa | inter | aa | ||
12 | gaa | 21 | cga | 39 | tac | ||
13 | gta | 28 | gga | 8 | gta | ||
5 | gac | 4 | aaa | 4 | tac | ||
18 | aca | 4 | caa | ** | aca | ||
12 | gaa | 5 | cac | 144 | cgt | ||
13 | gta | 3 | aag | 23 | agc | ||
5 | gac | 6 | aga | 69 | tca | ||
** | aca | 4 | gga | ** | tca | ||
5 | tta | 21 | cca | ||||
5 | atgf | 5 | aag | ||||
46 | atgj | 5 | aga | ||||
5 | tta | 5 | gga | cont | |||
30 | atgf | 3 | ggc | 311 | aaa | ||
46 | atgj | 22 | cta | ** | ttc | ||
5 | tta | 4 | aaa | 61 | gag | ||
** | atgf | 4 | caa | 6 | caa | ||
17 | gta | 5 | cac | 4 | aga | ||
14 | gac | 5 | aag | 19 | gga | ||
4 | ttc | 5 | aga | 16 | cta | ||
8 | ggc | 5 | gga | ** | gaa | ||
57 | tgc | 6 | ggc | 4 | gca | ||
** | tgc | ** | cca | ** | atgi | ||
15 | gga | ||||||
7 | atc | ||||||
** | gca | ||||||
- |
cbn intercalaires entre cds[modifier | modifier le wikicode]
- Lien NCBI [18]
- Note: Pour les génomes des annexes j'ai relevé les intercalaires entre tRNAs et entre ceux-ci et les cds qui leur sont adjacents. L'exemple est celui de rru du clade alpha. L'idée de départ de ces prélèvements est la recherche d'opérons formés de tRNA et de protéine comme dans le cas d'E.coli: l'intercalaire entre le tRNA et la protéine devrait être faible. Voir l'exemple d'eco (remarque @3) avec tac-tac-tpr et aca-tac-gga-acc-tufB.
cbn intercalaires positifs S+[modifier | modifier le wikicode]
- Lien tableur: cbn intercalaires positifs S+
- Diagrammes 400: cbn cvi, diagramme 1-40: c+ cbn c+ cvi x+ cvi total, texte: cvi.
- Légende: voir la légende de cvi.
cbn | Sx+ | Sc+ | ||||||||||||
Poly3 | -7 | -5 | -3 | 1 | R2 | flex x+ | comment. | -7 | -5 | -3 | 1 | R2 | flex c+ | comment. |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
1 à 400 | 15 | -107 | 126 | 33 | 450 | 238 | max50 | -50 | 394 | -1048 | 106 | 855 | 263 | min50 |
31 à 400 | 2 parties | 8.8 | -32 | -123 | 49 | 932 | 121 | 2 parties | ||||||
droite | -a | cste | - | R2 | note | R2’ | -a | cste | - | R2 | note | R2’ | ||
1 à 400 | 86 | 43 | - | 424 | dte | 26 | tf | 184 | 63 | - | 652 | poly | 203 | SF |
31 à 400 | - | 120 | 45 | - | 891 | dte | 41 | tf |
- Légende du tableau corrélations et fréquences faibles
effectifs diagramme | corrélation x+ c+, 41-n | corrélation x+ c+, 1-n | |||||||||
gen | minima | x+ | c+ | total | 400 | 200 | 250 | diff | 200 | 250 | 400 |
---|---|---|---|---|---|---|---|---|---|---|---|
scc | min10 | 416 | 961 | 1377 | 748 | 440 | 530 | 90 | -88 | 49 | 367 |
cbn | min20 | 489 | 1701 | 2190 | 731 | 543 | 505 | -38 | -222 | -114 | 271 |
eco | min20 | 1003 | 2130 | 3133 | 735 | 296 | 440 | 144 | -178 | -64 | 287 |
1-30 ‰ | effectifs | 0 ‰ | <0 ‰ | effectifs 1-40 | corel | ||||||
1-30 x+ | 1-30 c+ | x+/c+ | x | c | x | c | x- | c- | x+ | c+ | x+/c+ |
118 | 353 | 0.33 | 485 | 1320 | 4 | 5 | 58 | 242 | 60 | 389 | -177 |
65 | 312 | 0.21 | 553 | 1940 | 2 | 5 | 17 | 86 | 56 | 620 | -382 |
63 | 348 | 0.18 | 1169 | 2855 | 11 | 6 | 80 | 226 | 126 | 821 | -119 |
- Diagrammes 400: cbn cvi, diagramme 1-40: c+ cbn c+ cvi x+ cvi total, texte: cvi.
- Résumé: J’ai classé les 21 génomes suivant la forme des diagrammes x+ 1-400. J’ai obtenu 3 groupes,
- Les tildes au nombre de 5. Ils sont réguliers et forts, tF, avec un R2’ supérieur à 138 pour 4 d’entre eux et scc avec 71. Ce sont, cbei mba pmq et blo scc.
- Les formes S au nombre de 6. Leurs forces (R2’) sont variables, ade rru Sf 20-39, ant mja Sm 70-78, pmg pub SF 179-249.
- Les diagrammes à pyramide, c’est à dire présentant une bosse avec 4 ou 5 points contigus. Ils sont au nombre de 10 dont 9 sont des tildes et bsu est un Sf très faible (R2’18). abra rtb spl afn sont des tF avec plus de 96, ase cbn cvi sont des tf avec moins de 30, eco myr sont des tm 43 68.
- - cbn ressemble beaucoup à cvi comme on vient de le voir avec des courbes x+ 1-400 à pyramide et de forme tilde faible (R2’ 26 30). Il diffère principalement par la corrélation sur 41-250 de 505 contre 891 et une courbe c+ 31-400 de forme tilde moyenne tm (41) contre un tilde fort tF (107) pour cvi. Le total des effectifs est 50% plus faible que cvi, 2190 contre 3328.
- - Les diagrammes 400
- x+ 1-400:
- + Les 2 génomes ont une pyramide à 4 fréquences avec un maximum à 50 pour cbn et 70 pour cvi. Quand j’enlève les fréquences faibles pour ne laisser que la pyramide, 3 pour cbn et 4 pour cvi, les 2 courbes deviennent de S forts, SF, avec R2’ de 76 pour cbn contre 68 pour cvi. Je n’ai pas représenté les courbes x+ 31-400 à cause des taux peu élevés des fréquences faibles 1-30, 65 pour cbn et 112 pour cvi.
- + Les fréquences faibles 1-30 sont en opposition avec celles des cbn c+1-400 et en parallèle avec cvi. Cette différence va impacter différemment les corrélations 1-n qu’on verra plus loin.
- + Les points d’inflexion sont normaux et presque égaux 238 pour cbn contre 200.
- c+ 1-400: Ce sont 2 courbes presque identiques de formes S fort avec le même R2’ de 203 et des 2 points d’inflexion normaux, 263 pour cbn et 282 pour cvi.
- x+ 31-400: Je n’ai pas représenté les courbes x+ 31-400 à cause des taux peu élevés des fréquences faibles 1-30, 65 pour cbn et 112 pour cvi. Il faudrait les remplacer par les courbes avec pyramide seule sans les fréquences faibles, soit 1-30 pour cbn et 1-40 pour cvi, voir le paragraphe x+ 1-400 ci-dessus.
- c+ 31-400: C’est la différence entre ces courbes qui va impacter le plus la corrélation sur 41-250 qui passe de 505 chez cbn à 891 chez cvi. En effet la courbe de cbn est un tilde faible à moyen avec un R2’ de 41 alors que cvi arbore un tilde fort avec un R2’ de 107. Les 2 points d’inflexions sont faibles en valeur absolue, mais celui de cbn est positif, 121, alors que celui de cvi est négatif, -137.
- x+ 1-400:
- - Les corrélations:
- Sur les plages 41-n: La grande différence entre les 2 génomes c’est une corrélation moyenne pour cbn avec 505 et la 2ème plus forte des 21 génomes de cvi avec 891 après 940 de ase. Dans les 2 génomes elle se maintient légèrement sur 41-200, avec une amélioration pour cbn, différence de -38 (diff), et un recul de 33 pour cvi. Avec cbn c’est la seule amélioration constatée chez les 21 génomes étudiés.
- Sur les plages 1-n: les évolutions contraires des fréquences faibles 1-30 que j’ai mentionnées au paragraphe x+ 1-400 agissent fortement sur les corrélations 1-n.
- + Chez cbn les fréquences faibles évoluent en opposition entre celles de x+ 1-400 et c+ 1-400 d’où des corrélations sur 1-n fortement négatives -222 pour 1 -200 et -114 pour 1 -250.
- + Chez cvi les fréquences faibles évoluent en parallèle entre celles de x+ 1-400 et c+ 1-400 d’où des corrélations sur 1-n, certes fortement diminuées mais sont positives et seulement moitié que sur 41-n, 434/858 pour 1-200 et 549/891 pour 1-250.
- - Les faibles fréquences: Les faibles fréquences 1-30 ne sont intéressantes à comparer que pour les génomes à courbes 1-400 semblables où le taux de ces fréquences sont élevés et évoluent en parallèle comme entre pmg et pub où le rapport x+/c+ passe de 0.78 à 0.51. Entre cbn et cvi il passe de 0.21 à 0.37. Les zéros sont identiques et font 7‰, alors que le taux des négatifs fait le triple de cbn chez cvi, 103‰ contre 280‰.
- - Les courbes 1-40:
- c+ 1-40: Les 2 courbes sont semblales et très proche de celle du total des c+ 1-40.
- x+ 1-40: Avec un effectif de 56 pour cbn la courbe ne peut être significative. Avec 130 pour cvi sa courbe a été étudiée dans cvi.
cbn autres intercalaires[modifier | modifier le wikicode]
- Lien tableur: cbn autres intercalaires aas
- Légende:
- - comp, le gène est sur le brin complement
- - deb, fin sont respectivement dans le sens des adresses croissantes, le cds avant le 1er tRNA et le cds après le dernier tRNA du bloc.
- - misc_f, pour misc_feature
- - misc_R, pour misc_RNA
- Totaux: il y a 2 pseudo gene
tRNA-cds tRNA-tRNA autres-cds total c+ x+ x- c+ x+ c- c+ x+ c- 43 13 87 2 2 147
- Méthode de calculs des intercalaires autres que les CDS-CDS voir le cas de amed.
Clostridium lentocellum DSM 5427[modifier | modifier le wikicode]
cle opérons[modifier | modifier le wikicode]
- Lien tableur: cle opérons
- Liens: gtRNAdb, NCBI [19], génome
- Phylogénie: Bacteria; Firmicutes; Clostridia; Clostridiales; Lachnospiraceae;Cellulosilyticum.
- Légende:
- - cyan pour les doubles signalés par le signe + dans la colonne doubles.
- - @ voir le chapitre remarques de ce génome.
- Note: il n'y apas de gtRNAdb. Aussi j'ai comparé (EXACT NB.CAR STXT) les 1ers atgf atgi atgj du génome cdc, avec les atg de cle.
34.3%GC | 30.6.19 Paris | 104 | doubles | intercal | aa | avec aa |
---|---|---|---|---|---|---|
10157..10246 | agc | @1 | 202 | |||
10449..11981 | 16s | 72 | ||||
12054..12171 | 5s | 4 | ||||
12176..12248 | gca | 262 | ||||
12511..15414 | 23s | 55 | ||||
15470..15543 | gac | 61 | 61 | |||
15605..15677 | gta | 7 | 7 | |||
15685..15757 | aca | 34 | 34 | |||
15792..15872 | tac | 12 | 12 | |||
15885..15961 | atgj | 3 | 3 | |||
15965..16040 | ttc | 3 | 3 | |||
16044..16116 | aaa | |||||
30118 | ||||||
46235..47767 | 16s | @3 | 21284 | |||
69052..71964 | 23s | |||||
4873 | ||||||
76838..78371 | 16s | 72 | ||||
78444..78561 | 5s | 5 | ||||
78567..78639 | gca | 282 | ||||
78922..81829 | 23s | |||||
904 | ||||||
82734..82851 | 5s | 4 | ||||
82856..82928 | ggc | |||||
1463 | ||||||
84392..85929 | 16s | 72 | ||||
86002..86119 | 5s | 4 | ||||
86124..86196 | gca | 280 | ||||
86477..89386 | 23s | |||||
7380 | ||||||
96767..96884 | 5s | 89 | ||||
96974..97047 | ggc | |||||
5082 | ||||||
102130..102204 | cag | |||||
104716..104799 | tta | 13 | 13 | |||
104813..104898 | tca | |||||
141499..143034 | 16s | 138 | ||||
143173..143290 | 5s | 7 | ||||
143298..143374 | atc | 258 | ||||
143633..146538 | 23s | |||||
150968..151085 | 5s | @4 | 4 | |||
151090..151161 | gaa | 457 | ||||
151619..153160 | 16s | 605 | ||||
153766..156671 | 23s | 475 | ||||
157147..157219 | aaa | 9 | 9 | |||
157229..157299 | gga | 6 | 6 | |||
157306..157379 | aga | |||||
4223 | ||||||
161603..161720 | 5s | 4 | ||||
161725..161797 | ggc | |||||
11104 | ||||||
172902..172973 | gaa | 23 | 23 | |||
172997..173071 | cca | 45 | 45 | |||
173117..173189 | aaa | 11 | 11 | |||
173201..173274 | gac | 56 | 56 | |||
173331..173403 | gta | 7 | 7 | |||
173411..173494 | tta | 187 | 187 | |||
173682..173754 | aca | 26 | 26 | |||
173781..173861 | tac | 10 | 10 | |||
173872..173948 | atgj | 31 | 31 | |||
173980..174052 | ttc | |||||
248498 | ||||||
422551..424086 | 16s | |||||
113898 | ||||||
537985..540890 | 23s | |||||
25153 | ||||||
566044..566117 | cac | 23 | 23 | |||
566141..566212 | caa | 32 | 32 | |||
566245..566330 | tca | |||||
571984..573519 | 16s | 72 | ||||
573592..573709 | 5s | 4 | ||||
573714..573786 | gca | 282 | ||||
574069..576975 | 23s | |||||
25302 | ||||||
602278..603812 | 16s | 137 | ||||
603950..604067 | 5s | |||||
11014 | ||||||
615082..617987 | 23s | |||||
21159 | ||||||
639147..639362 | 16s° | @5 | ||||
98139 | ||||||
737502..737619 | 5s | 4 | ||||
737624..737696 | ggc | |||||
3291 | ||||||
740988..741058 | gga | |||||
759839..759920 | cta | |||||
911999..912083 | ctt | + | 148 | 148 | ||
912232..912316 | ctt | 2 ctt | ||||
1035192..1035265 | cga | |||||
1061152..1061225 | agg | |||||
comp | 1136376..1136448 | ccc | ||||
1229184..1230718 | 16s | @2 | 72 | |||
1230791..1230908 | 5s | 7 | ||||
1230916..1230989 | atc | 53 | 53 | |||
1231043..1231115 | gca | 261 | ||||
1231377..1234282 | 23s | 110 | ||||
1234393..1234464 | aac | + | 9 | 9 | ||
1234474..1234545 | gaa | 2 tgc | 6 | 6 | ||
1234552..1234622 | tgc | 2 aac | 23 | 23 | ||
1234646..1234717 | aac | 58 | 58 | |||
1234776..1234846 | tgc | |||||
1280211..1280283 | atgf | |||||
1283250..1283320 | gga | + | 5 | 5 | ||
1283326..1283399 | aga | 2 gga | 5 | 5 | ||
1283405..1283478 | cac | 2 aga | 31 | 31 | ||
1283510..1283581 | caa | 2 caa | 23 | 23 | ||
1283605..1283677 | aaa | 30 | 30 | |||
1283708..1283792 | cta | 23 | 23 | |||
1283816..1283886 | gga | 5 | 5 | |||
1283892..1283965 | aga | 6 | 6 | |||
1283972..1284043 | caa | |||||
1299560..1299632 | ggc | 4 | 4 | |||
1299637..1299711 | cca | |||||
1346208..1346290 | ctg | |||||
1363346..1363428 | ctg | |||||
1515234..1515305 | gaa | 62 | 62 | |||
1515368..1515442 | cca | 22 | 22 | |||
1515465..1515537 | aaa | |||||
1597292..1597364 | acg | |||||
1611976..1612042 | acg | |||||
2065352..2065425 | ata | |||||
comp | 2090478..2090550 | acc | ||||
2394421..2394501 | tac | 3 | 3 | |||
2394505..2394577 | ttc | |||||
2592342..2592422 | ttg | |||||
2606024..2606104 | ttg | |||||
comp | 2737232..2737304 | gcc | ||||
comp | 2798802..2798874 | aag | ||||
comp | 2881571..2881642 | gag | ||||
comp | 3215471..3215545 | cca | ||||
comp | 3252582..3252655 | atgj | 7 | 7 | ||
comp | 3252663..3252735 | gta | 4 | 4 | ||
comp | 3252740..3252813 | gac | 10 | 10 | ||
comp | 3252824..3252896 | tgg | 20 | 20 | ||
comp | 3252917..3252988 | aac | ||||
683 | ||||||
comp | 3253672..3253748 | atgj | 7 | 7 | ||
comp | 3253756..3253828 | gta | 9 | 9 | ||
comp | 3253838..3253910 | tgg | 18 | 18 | ||
comp | 3253929..3254000 | aac | 60 | |||
comp | 3254061..3256967 | 23s | ||||
362637 | ||||||
comp | 3619605..3619677 | aca | + | 4 | 4 | |
comp | 3619682..3619755 | cgt | 2 cgt | 50 | 50 | |
comp | 3619806..3619879 | cgt | 2 aca | 27 | 27 | |
comp | 3619907..3619990 | tta | 3 | 3 | ||
comp | 3619994..3620069 | gta | 47 | 47 | ||
comp | 3620117..3620190 | gac | 22 | 22 | ||
comp | 3620213..3620289 | atgi | 23 | 23 | ||
comp | 3620313..3620385 | aca | 14 | 14 | ||
comp | 3620400..3620471 | gaa | 9 | 9 | ||
comp | 3620481..3620552 | aac | 110 | |||
comp | 3620663..3623568 | 23s | 261 | |||
comp | 3623830..3623902 | gca | 53 | 53 | ||
comp | 3623956..3624029 | atc | 7 | |||
comp | 3624037..3624154 | 5s | 72 | |||
comp | 3624227..3625761 | 16s | 149 | |||
comp | 3625911..3625999 | tcc | 33 | 33 | ||
comp | 3626033..3626118 | tca | ||||
comp | 3714637..3714709 | gta | 1 | 1 | ||
comp | 3714711..3714787 | atgj |
cle cumuls[modifier | modifier le wikicode]
- Note: Les statistiques sur les intercalaires entre tRNA ne sont pas correctes. Se reporter à intergen51.cle. Il n'y a aucun commentaire sur les CDS. J'ai réduit le tableau aux clusters à rRNA. L'intitulé opéron doit d'être compris dans le sens cluster ou bloc de RNA, rRNA ou tRNA.
cle cumuls opérons effectif avec rRNA opérons 19 16 5 aa 23 5 16 5 atc gca 2 solo 11 max a 14 a doubles 2 indéterminé 1 total aas 46 sans opérons 29 1 aa 19 max a 10 a doubles 2 total aas 59 total aas 105 remarques 5
cle blocs[modifier | modifier le wikicode]
- Lien tableur: cle blocs
- Légende:
Solitaires | |||
16s | *2 | 16s° | @5 |
23s | *3 | ||
5s | 3*4 | 89 | |
ggc | |||
aac | 60 | ||
23s | |||
16s | 137 | ||
5s | |||
16s | 72 | 72 | 72 |
5s | 5 | 4 | 4 |
gca | 282 | 280 | 282 |
23s | |||
agc | 202 | ||
16s | 138 | 16s | 72 |
5s | 7 | 5s | 4 |
atc | 258 | gca | 262 |
23s | 23s | 55 | |
gac | 61 | ||
aac | 110 | ||
16s | 72 | 23s | 261 |
5s | 7 | gca | 53 |
atc | 53 | atc | 7 |
gca | 261 | 5s | 72 |
23s | 110 | 16s | 149 |
aac | 9 | tcc | 33 |
5s | 4 | @4 | |
gaa | 457 | ||
16s | 605 | ||
23s | 475 | ||
aaa | 9 |
cle remarques[modifier | modifier le wikicode]
Remarques : Pas de blocs 16-23-5s ni de séquence 16-atc-gca-23. @1 5 blocs 16-5-aa-23s avec les mêmes intercalaires, à peu près, 72 4 280. - 4 blocs avec gca dont 3 à 1aa et 1 avec 9aas. - Le bloc à 9aas a un aa avant le 16s, compatible. - 1 bloc avec atc seul et les intercalaires modifiées, 138 7 258. @2 2 blocs 16-5-atc-gca-23s, avec les mêmes intercalaires, 72 7 53 261. - Les 2 blocs contiennent des doubles, 2 paires chacun avec 7 et 14aas. - Le bloc contenant le max de 14aas a 2aas avant le 16s compatibles. @3 Les solos ne contiennent qu’un seul rRNA avec ou sans aas. - 5s-1aa, il y en a 4 et l'intercalaire est équivalente de celle des blocs. - 23s, il y en a 4 dont 1 seul avec 4aas - 16s, 2 sans aas et 1 du 16s5s avec une intercalaire comme le bloc atc, 137. @4 Apparemment un trio de solos. Les 3 intercalaires supérieures à 450 permettent de diviser le groupe en 3 opérons, 5saa avec une intercalaire semblable aux autres 5saa, 23s avec 3aas aux petites intercalaires et 1 16s sasns aas. @5 16s°: 16S ribosomal RNA rRNA prediction is too short Séquences des doubles : très peu de doublons. - 2 opérons avec rRNAs ont des doublons sur 5 possédant au moins 2 aas. - 2 opérons sans rRNAs sur 10 possédant au moins 2 aas. - 4 doublons pour chaque type d'opérons. - 1 seule paire répétée chez les opérons sans rRNAs.
cle distribution[modifier | modifier le wikicode]
- Lien tableur: cle distribution
- Notes:
- - Tableau Cl61: ctt2 en gras, très rare
- - Tableau Cl62
- 1-3aas: aaa aga gga
- -5s: Ces 5s sont seuls sans 16s ni 23s. Ce sont 4 5s ggc et 1 5s gaa
- Blocs à rRNA: ils ont la forme 16s5saa23s
- cgt2 double en gras
|
|
cle. Intergen51[modifier | modifier le wikicode]
Intergen51. cle. Le génome[modifier | modifier le wikicode]
- cle Le prélèvement: Aclostridia
- Le nom et le lien NCBI: cle, Cellulosilyticum lentocellum DSM 5427, NCBI [20], date 19.3.21.
- cle La longueur totale des intercalaires, longueur du génome et taux intercalaires/génome:
Nom intercals génome taux en % cle 615,068 4,714,237 13.0
cle données intercalaires[modifier | modifier le wikicode]
- Lien tableur: cle données intercalaires
- Lien sauvegarde NCBI: Aclostridia
cle données intercalaires 200[modifier | modifier le wikicode]
- Lien tableur: données intercalaires 200.
cle autres intercalaires aas[modifier | modifier le wikicode]
- Lien tableur: cle autres intercalaires aas
- Lien sauvegarde NCBI: Aclostridia
Intergen51. cle. Les différents types d'intercalaires[modifier | modifier le wikicode]
- Lien au tableur: Intergen51. cle les différents types d'intercalaires.
- Légende:
- - S pour intercalaire CDS-CDS et R pour tRNA-CDS,
- - c pour intercalaire continu (les 2 gènes sont sur le même brin) et x pour discontinu (les 2 gènes sont sur 2 brins différents, le brin et son complément)
- - %reste = 100*reste/total, le reste étant ce qui reste du total après la fin du diagramme, gamme.
- - %t30 = 100*t30/total, t30 étant le total des fréquences 10 20 30
- - %t5 = 100*t/total, t5 étant le total des fréquences de -1 à -5 dans le diagramme des S-.
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
Intergen51. cle. Les diagrammes CDS-CDS positifs[modifier | modifier le wikicode]
- Lien tableur: Les diagrammes
- Diagrammes des gamma: cle présente 2 diagrammes
- - fc40, CDS-CDS continu, fréquence unitaire en abscisses et effectif en ordonnées
- - fx%, CDS-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et pourcentage en ‰ par rapport au total, en ordonnées.
- Équations des courbes de tendance en pour 1000: colonnes %fx %fc
Courbes de tendances pour les diagrammes en pour 1000 Calculs des f.41 cle R2 x3 x2 x c Inflexion poly3 x c 0.708 3.88E-06 -2.96E-03 5.83E-01 1.51 fx1 abscisse 259.1 181.0 0.810 -6.21E-06 4.68E-03 -1.15E+00 105.0 fc1 ordonnée 21.5 19.5 0.727 2.29E-06 -1.78E-03 3.17E-01 19.00 fx41 0.948 8.86E-07 -4.81E-04 -2.70E-02 34.9 fc41
Intergen51. cle. Les CDS-CDS négatifs[modifier | modifier le wikicode]
Sous-totaux cle totale fréquence x- c- x- c- - 1 0 78 4 4140 - 2 0 0 85 11 - 3 0 0 3 12 - 4 8 107 717 10938 - 5 0 1 5 19 sp6 13 255 1642 8424 total 21 441 2,456 23,544 reste 0 10 264 420 s6 2 0 361 41 s7 3 37 321 1438 s8 8 208 696 6525 rappot s1-5 4/2/1 - 1.4 8.4 2.6 % / sp6 s6/sp6 15.4 0.0 22.0 0.5 s7/sp6 23.1 14.5 19.5 17.1 s8/sp6 61.5 81.6 42.4 77.5 reste/sp6 0.0 3.9 16.1 5.0 total s1-5 8 186 814 15120 % / total %s1-5 38.1 42.2 33.1 64.2 %sp6 61.9 57.8 66.9 35.8
Intergen51. cle. Les intercalaires des blocs[modifier | modifier le wikicode]
- Le détail
RNA-RNA c x CDS-RNA c x 23s 5s CDS 16s 7 1 16s 23s 1 5s CDS 1 16s tRNA 16 CDS 1 1 tRNA 23s 7 CDS 5s 1 4 5s tRNA 12 23s CDS 6 2 tRNA in 2 CDS 23s 3 tRNA contig 25 5s 16s tRNA hors 30 16s16s tRNA 16s 3 23s tRNA 5 tRNA 5s 16s 5s 8 5s 23s 5s 5s total 93 0 total 19 8
- Les rares voir gamma pour la longueur des intercalaires
- Les tRNA-CDS compris, comparaison dans le clade et dans l'étude.
Intergen51. cle. Les intercalaires tRNA-tRNA extra bloc[modifier | modifier le wikicode]
- Lien tableur: Intergen51. cle. Les intercalaires tRNA-tRNA extra bloc
hors1 | hors2 | cont1 | cont2 | |||||||
---|---|---|---|---|---|---|---|---|---|---|
inter | aa | inter | aa | inter | aa | inter | aa | |||
13 | tta | 5 | gga | 61 | gac | 7 | atgj | |||
** | tca | 5 | aga | 7 | gta | 9 | gta | |||
23 | gaa | 31 | cac | 34 | aca | 18 | tgg | |||
45 | cca | 23 | caa | 12 | tac | ** | aac | |||
11 | aaa | 30 | aaa | 3 | atgj | 4 | aca | |||
56 | gac | 26 | cta | 3 | ttc | 50 | cgt | |||
7 | gta | 5 | gga | ** | aaa | 27 | cgt | |||
187 | tta | 6 | aga | 9 | aaa | 6 | tta | |||
26 | aca | ** | caa | 6 | gga | 47 | gta | |||
10 | tac | 4 | ggc | ** | aga | 25 | gac | |||
31 | atgj | ** | cca | 9 | aac | 23 | atgi | |||
** | ttc | 62 | gaa | 6 | gaa | 14 | aca | |||
23 | cac | 22 | cca | 23 | tgc | 9 | gaa | |||
32 | caa | ** | aaa | 58 | aac | ** | aac | |||
** | tca | 3 | tac | ** | tgc | 33 | tcc | |||
148 | ctt | ** | ttc | ** | tca | |||||
** | ctt | 7 | atgj | |||||||
4 | gta | |||||||||
10 | gac | |||||||||
20 | tgg | |||||||||
** | aac | |||||||||
4 | gta | |||||||||
** | atgj | |||||||||
- |
Heliobacterium modesticaldum Ice1 ATCC 51547[modifier | modifier le wikicode]
hmo opérons[modifier | modifier le wikicode]
- Lien tableur: hmo opérons
- Liens: gtRNAdb [21], NCBI [22], génome [23]
- Phylogénie: Bacteria; Firmicutes; Clostridia; Clostridiales; Heliobacteriaceae;Heliobacterium.
- Légende: cdsa: cds aas, cdsd: cds dirigé
- - cds : cds inséré dans un cluster avec ou sans rRNA.
57%GC | 24.7.19 Paris | 109 | doubles | intercal | cds | aa | avec aa | cdsa | cdsd |
---|---|---|---|---|---|---|---|---|---|
103699..104088 | CDS | 380 | 130 | ||||||
104469..105695 | CDS | 186 | 186 | 409 | 186 | ||||
comp | 105882..105956 | ggc | 1 | 1 | |||||
comp | 105958..106044 | ctg | 321 | 321 | |||||
comp | 106366..106929 | CDS | @1 | 241 | 241 | 188 | 241 | ||
comp | 107171..107246 | aca | 202 | 202 | 202 | ||||
comp | 107449..108183 | CDS | 111772 | 245 | |||||
comp | 219956..220483 | CDS | 260 | 260 | 176 | 260 | |||
comp | 220744..220820 | gac | 5 | 5 | |||||
comp | 220826..220901 | gta | 10 | 10 | |||||
comp | 220912..220987 | gaa | 4 | 4 | |||||
comp | 220992..221067 | aaa | 18 | 18 | |||||
comp | 221086..221160 | caa | 103 | ||||||
comp | 221264..224182 | 23s | 237 | ||||||
comp | 224420..224495 | gcc | 64 | ||||||
comp | 224560..224676 | 5s | @2 | 328 | |||||
comp | 225005..226536 | 16s | 651 | 651 | |||||
comp | 227188..228162 | CDS | 98792 | 325 | |||||
comp | 326955..328340 | CDS | 178 | 178 | 462 | 178 | |||
comp | 328519..328601 | cta | 65 | 65 | |||||
comp | 328667..328743 | aga | 60 | 60 | |||||
comp | 328804..328880 | cca | 568 | 568 | |||||
comp | 329449..330090 | CDS | 57730 | 214 | |||||
comp | 387821..388105 | CDS | 135 | 135 | 95 | ||||
388241..388317 | ccc | 7 | 7 | ||||||
388325..388410 | tac | 47 | 47 | 47 | |||||
comp | 388458..388742 | CDS | 588493 | 95 | |||||
comp | 977236..978504 | CDS | 439 | 439 | 423 | ||||
comp | 978944..981860 | 23s | 237 | ||||||
comp | 982098..982173 | gcc | 64 | ||||||
comp | 982238..982354 | 5s | 328 | ||||||
comp | 982683..984208 | 16s | 460 | ||||||
comp | 984669..984744 | tgg | @3 | 5 | 5 | ||||
comp | 984750..984824 | cgg | 207 | 207 | 207 | ||||
comp | 985032..987656 | CDS | 26258 | 875 | |||||
comp | 1013915..1014760 | CDS | 105 | 105 | 282 | 105 | |||
comp | 1014866..1014942 | gac | 75 | 75 | |||||
comp | 1015018..1015093 | gaa | 265 | 265 | |||||
comp | 1015359..1016642 | CDS | 40115 | 428 | |||||
1056758..1058014 | CDS | 121 | 121 | 419 | 121 | ||||
comp | 1058136..1058233 | tga | 173 | 173 | |||||
1058407..1058733 | CDS | 62951 | 109 | ||||||
1121685..1122878 | CDS | 588 | 588 | 398 | |||||
1123467..1124998 | 16s | 328 | |||||||
1125327..1125443 | 5s | 64 | |||||||
1125508..1125583 | gcc | 233 | |||||||
1125817..1128734 | 23s | 337 | 337 | 337 | |||||
> | 1129072..1129785 | CDS | 24938 | 238 | |||||
1154724..1155224 | CDS | 99 | 99 | 167 | |||||
1155324..1155413 | tca | 56 | 56 | 56 | |||||
comp | 1155470..1156627 | CDS | 13350 | 386 | |||||
1169978..1171828 | CDS | 129 | 129 | 617 | 129 | ||||
1171958..1172034 | cgt | 85 | 85 | ||||||
1172120..1172196 | agg | 181 | 181 | ||||||
1172378..1172812 | CDS | 62 | 62 | 145 | 62 | ||||
1172875..1172966 | tcg | 548 | 548 | ||||||
1173515..1174330 | CDS | 6655 | 272 | ||||||
comp | 1180986..1182974 | CDS | 444 | 444 | 663 | ||||
1183419..1183512 | tcc | 39 | 39 | 39 | |||||
1183552..1183817 | ncRNA | 11908 | 89 | ||||||
1195726..1195998 | CDS | 181 | 181 | 91 | |||||
1196180..1196255 | gcg | 151 | 151 | 151 | |||||
1196407..1197051 | CDS | 86894 | 215 | ||||||
comp | 1283946..1285331 | CDS | 177 | 177 | 462 | 177 | |||
1285509..1285584 | atgf | 5 | 5 | ||||||
1285590..1285667 | atgj | 7 | 7 | ||||||
1285675..1285750 | gaa | 542 | 542 | ||||||
1286293..1287630 | CDS | 63447 | 446 | ||||||
1351078..1352549 | CDS | 704 | 704 | 491 | |||||
1353254..1354786 | 16s | 252 | |||||||
1355039..1355155 | 5s | 64 | |||||||
1355220..1355296 | atc | 194 | |||||||
1355491..1358408 | 23s | 112 | |||||||
1358521..1358595 | aac | 109 | 109 | 109 | |||||
comp | 1358705..1358926 | CDS | 139555 | 74 | |||||
1498482..1498898 | CDS | 535 | 535 | 139 | |||||
comp | 1499434..1499509 | acg | 238 | 238 | 238 | ||||
1499748..1500836 | CDS | 262182 | 363 | ||||||
1763019..1763858 | CDS | 68 | 68 | 280 | 68 | ||||
1763927..1764003 | gac | 4 | 4 | ||||||
1764008..1764083 | ttc | 3 | 3 | ||||||
1764087..1764161 | ggc | 92 | 92 | ||||||
comp | 1764254..1764493 | CDS | 72 | 72 | 80 | 72 | |||
1764566..1764641 | tgc | 18 | 18 | ||||||
1764660..1764746 | tta | 253 | 253 | ||||||
comp | 1765000..1765467 | CDS | 52131 | 156 | |||||
1817599..1818318 | CDS | 487 | 487 | 240 | |||||
1818806..1820337 | 16s | 252 | |||||||
1820590..1820706 | 5s | 64 | |||||||
1820771..1820847 | atc | 6 | 6 | ||||||
1820854..1820929 | gca | 229 | |||||||
1821159..1824076 | 23s | 112 | |||||||
1824189..1824263 | aac | 6 | 6 | ||||||
1824270..1824345 | atgf | 243 | 243 | 243 | |||||
1824589..1825014 | CDS | 168198 | 142 | ||||||
1993213..1994328 | CDS | 99 | 99 | 372 | |||||
1994428..1994502 | atgi | 41 | 41 | 41 | |||||
1994544..1995368 | CDS | 284281 | 275 | ||||||
2279650..2279997 | CDS | 541 | 541 | 116 | |||||
2280539..2282070 | 16s | 253 | |||||||
2282324..2282440 | 5s | 64 | |||||||
2282505..2282580 | gcc | 234 | |||||||
2282815..2285735 | 23s | 119 | |||||||
2285855..2285948 | tcc | 6 | 6 | ||||||
2285955..2286031 | ccg | 10 | 10 | ||||||
2286042..2286115 | gga | 14 | 14 | ||||||
2286130..2286205 | cac | 1 | 1 | ||||||
2286207..2286281 | tgc | 9 | 9 | ||||||
2286291..2286367 | gtc | 3 | 3 | ||||||
2286371..2286446 | ttc | 6 | 6 | ||||||
2286453..2286537 | tac | 4 | 4 | ||||||
2286542..2286616 | caa | 17 | 17 | ||||||
2286634..2286709 | aaa | 4 | 4 | ||||||
2286714..2286789 | gaa | 5 | 5 | ||||||
2286795..2286870 | gta | 5 | 5 | ||||||
2286876..2286952 | gac | 7 | 7 | ||||||
2286960..2287050 | agc | 43 | 43 | ||||||
2287094..2287170 | ccc | 30 | 30 | ||||||
2287201..2287287 | ctg | 3 | 3 | ||||||
2287291..2287365 | ggc | 4 | 4 | ||||||
2287370..2287446 | cgt | 4 | 4 | ||||||
2287451..2287526 | acc | 352 | 352 | 352 | |||||
2287879..2288343 | CDS | 33184 | 155 | ||||||
comp | 2321528..2322544 | CDS | 268 | 268 | 339 | ||||
comp | 2322813..2322889 | gtc | 9 | 9 | |||||
comp | 2322899..2322973 | cgg | 81 | 81 | 81 | ||||
comp | 2323055..2323243 | CDS | 3375 | 63 | |||||
2326619..2327947 | CDS | 464 | 464 | 443 | 464 | ||||
2328412..2329943 | 16s | 327 | |||||||
2330271..2330387 | 5s | 226 | |||||||
2330614..2333532 | 23s | 98 | |||||||
2333631..2333706 | aaa | 4 | 4 | ||||||
2333711..2333786 | acc | 8 | 8 | ||||||
2333795..2333877 | ctc | 89 | 89 | 89 | |||||
comp | 2333967..2334704 | CDS | 7389 | 246 | |||||
2342094..2342804 | CDS | 155 | 155 | 237 | 155 | ||||
comp | 2342960..2343030 | ttc | 213 | 213 | |||||
2343244..2343936 | CDS | 563 | 563 | 231 | |||||
2344500..2346025 | 16s | 252 | |||||||
2346278..2346394 | 5s | 64 | |||||||
2346459..2346535 | atc | 141 | |||||||
2346677..2349594 | 23s | 100 | |||||||
2349695..2349769 | aac | 6 | 6 | ||||||
2349776..2349851 | atgf | 102 | 102 | 102 | |||||
2349954..2350976 | CDS | 113601 | 341 | ||||||
2464578..2465114 | CDS | 271 | 271 | 179 | 271 | ||||
comp | 2465386..2465461 | aca | 432 | 432 | |||||
2465894..2466226 | CDS | 4722 | 111 | ||||||
2470949..2471977 | CDS | 69 | 69 | 343 | 69 | ||||
2472047..2472133 | ctg | 678 | 678 | ||||||
2472812..2473192 | CDS | 22232 | 127 | ||||||
2495425..2496048 | CDS | 402 | 402 | 208 | |||||
comp | 2496451..2496527 | gtc | 4 | 4 | |||||
comp | 2496532..2496609 | atgj | 175 | 175 | 175 | ||||
2496785..2497120 | CDS | 217 | 217 | 112 | |||||
comp | 2497338..2497420 | ctc | 7 | 7 | |||||
comp | 2497428..2497503 | acc | 18 | 18 | |||||
comp | 2497522..2497596 | tgg | 14 | 14 | |||||
comp | 2497611..2497684 | ggg | 19 | 19 | |||||
comp | 2497704..2497778 | ggc | 7 | 7 | |||||
comp | 2497786..2497873 | ttg | 8 | 8 | |||||
comp | 2497882..2497958 | gtg | -10 | -10 | -10 | ||||
comp | 2497949..2498185 | CDS | 66 | 66 | 79 | 66 | |||
2498252..2498328 | ccg | 314 | 314 | ||||||
comp | 2498643..2499506 | CDS | 55292 | 288 | |||||
2554799..2554984 | CDS | 109 | 109 | 62 | 109 | ||||
2555094..2555169 | gaa | 2 | 2 | ||||||
2555172..2555247 | ttc | 6 | 6 | ||||||
2555254..2555338 | tac | 4 | 4 | ||||||
2555343..2555417 | caa | 18 | 18 | ||||||
2555436..2555511 | aaa | 4 | 4 | ||||||
2555516..2555590 | ggc | 9 | 9 | ||||||
2555600..2555675 | cac | 117 | 117 | ||||||
comp | 2555793..2557049 | CDS | 235940 | 419 | |||||
comp | 2792990..2793442 | CDS | 219 | 219 | 151 | 219 | |||
comp | 2793662..2796583 | 23s | 236 | ||||||
comp | 2796820..2796895 | gca | 6 | 6 | |||||
comp | 2796902..2796978 | atc | 64 | ||||||
comp | 2797043..2797159 | 5s | 328 | ||||||
comp | 2797488..2799019 | 16s | 505 | ||||||
comp | 2799525..2799599 | ggc | + | 1 | 1 | ||||
comp | 2799601..2799687 | ctg | 2 ggc | 32 | 32 | ||||
comp | 2799720..2799796 | ccc | 42 | 42 | |||||
comp | 2799839..2799915 | cgt | 4 | 4 | |||||
comp | 2799920..2799994 | ggc | 120 | 120 | |||||
comp | 2800115..2800192 | atgj | 42 | 42 | |||||
comp | 2800235..2800325 | agc | 16 | 16 | |||||
comp | 2800342..2800417 | atgf | 6 | 6 | |||||
comp | 2800424..2800498 | aac | 7 | 7 | |||||
comp | 2800506..2800581 | gaa | 4 | 4 | |||||
comp | 2800586..2800661 | aaa | 18 | 18 | |||||
comp | 2800680..2800754 | caa | 4 | 4 | |||||
comp | 2800759..2800843 | tac | 91 | 91 | |||||
comp | 2800935..2801011 | gtc | 7 | 7 | |||||
comp | 2801019..2801093 | tgc | 325 | 325 | |||||
2801419..2801724 | CDS | 230813 | 102 | ||||||
3032538..3032729 | CDS | 109 | 109 | 64 | 109 | ||||
comp | 3032839..3035757 | 23s | 233 | ||||||
comp | 3035991..3036066 | gcc | 64 | ||||||
comp | 3036131..3036247 | 5s | 253 | ||||||
comp | 3036501..3038026 | 16s | 779 | 779 | |||||
comp | 3038806..3040017 | CDS | 232 | 404 | |||||
comp | 3040250..3042013 | CDS | 588 |
hmo cumuls[modifier | modifier le wikicode]
- Lien tableur: hmo cumuls
- Légende:
- - avec et sans rRNA, fréquences des intercalaires dans les clusters avec rRNA ou sans rRNA.
- - cdsd, je ne choisis que le cds avec l'intercalaire le plus faible d'un cluster donné, en supposant que ce cds a été créé par le cluster lors des conversions.
- - cdsa, longueur du cds en aas ici.
- - 1 : occurences exclues de la moyenne. Sont exclus de la moyenne les jaunes 554 de hmo opérons.
opérons | Fréquences intercalaires tRNAs | Fréquences intercalaires cds | Fréquences aas cds | ||||||||
---|---|---|---|---|---|---|---|---|---|---|---|
effectif | gammes | sans rRNAs | avec rRNAs | gammes | cds | gammes | cdsd | gammes | cdsa | ||
avec rRNA | opérons | 10 | 1 | 1 | 2 | 1 | 1 | 40 | 1 | 100 | 10 |
16 5s gcc 23 | 5 | 20 | 20 | 34 | 50 | 3 | 80 | 8 | 200 | 16 | |
16 5s atc 23 | 2 | 40 | 0 | 2 | 100 | 11 | 120 | 7 | 300 | 14 | |
16 5 23s a | 1 | 60 | 1 | 3 | 150 | 9 | 160 | 4 | 400 | 8 | |
max a | 20 | 80 | 2 | 0 | 200 | 9 | 200 | 4 | 500 | 11 | |
a doubles | 1 | 100 | 1 | 1 | 250 | 8 | 240 | 4 | 600 | 0 | |
16 5s atc gca | 2 | 120 | 0 | 1 | 300 | 5 | 280 | 4 | 700 | 2 | |
total aas | 60 | 140 | 0 | 0 | 350 | 4 | 320 | 0 | 800 | 0 | |
sans | opérons | 24 | 160 | 0 | 0 | 400 | 1 | 360 | 2 | 900 | 1 |
1 aa | 12 | 180 | 0 | 0 | 450 | 4 | 400 | 0 | 1000 | 0 | |
max a | 7 | 200 | 0 | 0 | 500 | 2 | 440 | 0 | 1100 | 0 | |
a doubles | 0 | 0 | 0 | 11 | 1 | 0 | |||||
total aas | 49 | 21 | 38 | 56 | 32 | 59 | |||||
total aas | 109 | ||||||||||
remarques | 3 | ||||||||||
avec jaune | moyenne | ||||||||||
variance | |||||||||||
sans jaune | moyenne | 8 | 8 | 196 | 137 | 230 | |||||
variance | 6 | 7 | 120 | 71 | 128 |
hmo tRNA-cds[modifier | modifier le wikicode]
- Note: intercalaires prélevés de la colonne cds de hmo opérons dans un bloc de tRNAs uniquement. Le début du bloc est dans l'ordre des adresses, deb intercalaire entre le cds et le 1er tRNA dd bloc, fin entre le dernier tRNA et le cds terminal. J'ai procédé, dans les colonnes petit et grand, à la réorientation des blocs d'après la constatation que les blocs à rRNA ont leurs cds de début et de fin sont orientés du cds-16s au 5s-tRNAs-cds, l'intercalaire cds-16s étant plus grands que l'intercalaire avec le cds terminal. En tête de colonne est le % du nombre des intercalaires inférieurs à 201 pbs.
hmo 70 52 35 87 deb fin deb fin grand petit grand petit 62 548 217 -10 92 68 217 -10 66 314 444 39 99 41 444 39 68 92 99 41 99 56 99 41 69 678 135 47 117 109 135 47 72 253 99 56 135 47 99 56 99 56 268 81 173 121 548 62 99 41 68 92 181 151 314 66 105 265 109 117 181 129 92 68 109 117 181 151 217 -10 678 69 121 173 121 173 241 202 253 72 129 181 402 175 253 72 268 81 135 47 129 181 265 105 265 105 177 542 241 202 268 81 117 109 178 568 535 238 314 66 173 121 181 151 72 253 321 186 181 129 186 321 105 265 402 175 181 151 217 -10 66 314 432 271 402 175 241 202 186 321 444 39 542 177 268 81 271 432 535 238 568 178 271 432 177 542 542 177 321 186 402 175 62 548 548 62 241 202 444 39 178 568 568 178 535 238 535 238 69 678 678 69 432 271
- Comparaison cds-cds tRNA-cds: deb fin, c'est l'ordre des adresses et grand petit l'ordre après réorientation. Leur pourcentage est calculé par rapport à la colonne, c'est à dire la moitié du total des tRNA-cds.
clostridia cds total total <0 0-200 201-370 371-600 >600 deb fin grand petit hmo 2,707 46 1 27 10 7 1 16 11 8 19 ‰ 22 587 217 152 22 696 478 348 826
hmo blocs[modifier | modifier le wikicode]
- Lien tableur: hmo blocs
- Légende:
- - tgg: L'intercalaire, en jaune aussi, est entre tgg et 16s.
- Notes:
- - Les spécificités gcc atc atc-gca et tRNA avant 16s
- - Homogénéité des intercalaires intra bloc
tgg | |||||
CDS | 541 | 651 | 588 | 779 | 460 |
16s | 253 | 328 | 328 | 253 | 328 |
5s | 64 | 64 | 64 | 64 | 64 |
gcc | 234 | 237 | 233 | 233 | 237 |
23s | 119 | 103 | 337 | 109 | 439 |
tcc | tcc | caa | cds | cds | cds |
CDS | 704 | 563 | CDS | 464 | |
16s | 252 | 252 | 16s | 327 | |
5s | 64 | 64 | 5s | 226 | |
atc | 194 | 141 | 23s | 98 | |
23s | 112 | 100 | aaa | ||
aac | aac | aac | |||
ggc | |||||
CDS | 487 | 505 | |||
16s | 252 | 328 | |||
5s | 64 | 64 | |||
atc | 6 | 6 | |||
gca | 229 | 236 | |||
23s | 112 | 219 | |||
aac | aac | cds |
hmo remarques[modifier | modifier le wikicode]
- Remarques des 3 @ dans opérons :
- @ Les cds en vert.
- - Ces cds sont insérés dans un cluster avec ou sans rRNA. Ce sont des candidats pour la création. Plus les 2 intercalaires avec les voisins sont petits plus ils sont intéressants. Il y en a 6 dont un seul, *, est accolé à un 16s. Un intercalaire est même négatif, c’est-à-dire que le cds démarre dans le tRNA, adresse 2497949. Dansl’ordre des adresses croissantes les intercalaires sont les suivants : 321-241 181-62 92-72 213-563* 175-217 -10-66.
- - Voir hmo cumuls : 9 intercalaires entre tRNAs dans un cluster ont plus de 40 pbs et 1 fait 120 pbs (adresse 2799920).
- - Dans hmo_opérons j'ai ajouté l'intercalaire entre 2 clusters, qui contient plusieurs autres gènes, pour faire ressortir la proximité des cds intra cluster avec les rRNAs et les tRNAs.
- @ Voir hmo blocs.
- - Il y a 10 blocs avec rRNA et tous sont complets. Cependant le 5s est anormalement positionné entre 16s et 23s au lieu d’être en 3ème position. Ce type de génome est rare, voir les statistiques des blocs à rRNAs.
- - Il n'y a qu'un seul bloc sans aas, adresse 2328412, mais ce génome a 5 blocs sur 10 qui est rare dans cette position, gcc, au lieu de gca, plus courant. Les 4 autres blocs arborent des aas courants dans cette position, 2 atc-gca et 2 atc.
- @ tRNAs avant 16s
- - Des tRNAs se trouvent avant le 16s, adresses 982683 et 2797488, le 1er avec 2 et le 2ème avec 15 tRNAs.
- - Les 2 intercalaires aa-16s sont du même de grandeur général qu'un cds-16s, 460 et 505 pbs ici.
- @ Les cds en vert.
- Séquences des doubles: Voir hmo cumuls :beaucoup de séquences longues et à peine un double dans la séquence 15aas-16s5s-gcc-23s.
- Notes:
- - Les 5 cds, candidats à la création, sont insérés dans des clusters sans rRNAs et 1 seul est collé à 16s.
- - Le 5s est positionné anormalement en 16s5s23s, dans les 10 blocs que possède le génome.
- - Un tRNA intra bloc très rare, gcc au lieu de gca, dans 5 cas sur 10. 4 autres sont courants, 2 atc et 2 atc-gca.
hmo distribution[modifier | modifier le wikicode]
- Lien tableur: hmo distribution
- Notes: Tableau Cl72,
- - les 1-3aas sont au nombre de 10 et sont soulignés, aac est composé de 1 >3aas et 3 1-3aas alors que aaa est composé respectivement de 3 et 1, et atgf de 2 et 1 respectivement.
- - Les blocs à rRNA sont de la forme 16s5saa23s
|
|
hmo. Intergen51[modifier | modifier le wikicode]
Intergen51. hmo. Le génome[modifier | modifier le wikicode]
- hmo Le prélèvement: Aclostridia
- Le nom et le lien NCBI: hmo, Heliomicrobium modesticaldum Ice1, NCBI [24], date 6.3.22.
- hmo La longueur totale des intercalaires, longueur du génome et taux intercalaires/génome:
Nom intercals génome taux en % hmo 396,940 3,075,407 12.9
hmo données intercalaires[modifier | modifier le wikicode]
- Lien tableur: hmo données intercalaires
- Lien sauvegarde NCBI: Aclostridia
hmo données intercalaires 200[modifier | modifier le wikicode]
- Lien tableur: données intercalaires 200.
hmo autres intercalaires aas[modifier | modifier le wikicode]
- Lien tableur: hmo autres intercalaires aas
- Lien sauvegarde NCBI: Aclostridia
Intergen51. hmo. Les différents types d'intercalaires[modifier | modifier le wikicode]
- Lien au tableur: Intergen51. hmo les différents types d'intercalaires.
- Légende:
- - S pour intercalaire CDS-CDS et R pour tRNA-CDS,
- - c pour intercalaire continu (les 2 gènes sont sur le même brin) et x pour discontinu (les 2 gènes sont sur 2 brins différents, le brin et son complément)
- - %reste = 100*reste/total, le reste étant ce qui reste du total après la fin du diagramme, gamme.
- - %t30 = 100*t30/total, t30 étant le total des fréquences 10 20 30
- - %t5 = 100*t/total, t5 étant le total des fréquences de -1 à -5 dans le diagramme des S-.
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
Intergen51. hmo. Les diagrammes CDS-CDS positifs[modifier | modifier le wikicode]
- Lien tableur: Les diagrammes
- Diagrammes des gamma: hmo présente 2 diagrammes
- - fc40, CDS-CDS continu, fréquence unitaire en abscisses et effectif en ordonnées
- - fx%, CDS-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et pourcentage en ‰ par rapport au total, en ordonnées.
- Équations des courbes de tendance en pour 1000: colonnes %fx %fc
Courbes de tendances pour les diagrammes en pour 1000 Calculs des f.41 hmo R2 x3 x2 x c Inflexion poly3 x c 0.427 2.46E-06 -1.95E-03 3.93E-01 8.01 fx1 abscisse 257.3 151.9 0.885 -3.49E-06 2.27E-03 -7.66E-01 85.6 fc1 ordonnée 21.3 25.7 0.449 3.20E-06 -2.47E-03 4.97E-01 2.46 fx41 0.959 9.96E-07 -4.54E-04 -7.46E-02 44.0 fc41
Intergen51. hmo. Les CDS-CDS négatifs[modifier | modifier le wikicode]
Sous-totaux hmo totale fréquence x- c- x- c- - 1 0 36 4 4140 - 2 1 0 85 11 - 3 0 0 3 12 - 4 3 149 717 10938 - 5 0 0 5 19 sp6 7 132 1642 8424 total 11 332 2,456 23,544 reste 2 0 264 420 s6 1 1 361 41 s7 3 41 321 1438 s8 1 90 696 6525 rappot s1-5 4/2/1 3.0 4.1 8.4 2.6 % / sp6 s6/sp6 14.3 0.8 22.0 0.5 s7/sp6 42.9 31.1 19.5 17.1 s8/sp6 14.3 68.2 42.4 77.5 reste/sp6 28.6 0.0 16.1 5.0 total s1-5 4 185 814 15120 % / total %s1-5 36.4 55.7 33.1 64.2 %sp6 63.6 44.3 66.9 35.8
Intergen51. hmo. Les intercalaires des blocs[modifier | modifier le wikicode]
- Le détail
RNA-RNA c x CDS-RNA c x 23s 5s CDS 16s 10 16s 23s 5s CDS 16s tRNA 16 CDS tRNA 23s 9 CDS 5s 5s tRNA 9 23s CDS 3 1 tRNA in 2 CDS 23s tRNA contig 40 5s 16s tRNA hors 26 1 16s16s tRNA 16s 23s tRNA 6 tRNA 5s 16s 5s 10 5s 23s 1 5s 5s total 103 1 total 13 1
- Les rares voir gamma pour la longueur des intercalaires
- Les tRNA-CDS compris, comparaison dans le clade et dans l'étude.
Intergen51. hmo. Les intercalaires tRNA-tRNA extra bloc[modifier | modifier le wikicode]
- Lien tableur: Intergen51. hmo. Les intercalaires tRNA-tRNA extra bloc
cont1 | cont2 | hors1 | hors2 | |||||||
---|---|---|---|---|---|---|---|---|---|---|
inter | aa | inter | aa | inter | aa | inter | aa | |||
5 | gac | 4 | aaa | 1 | ggc | 18 | tgc | |||
10 | gta | 8 | acc | ** | ctg | ** | tta | |||
4 | gaa | ** | ctc | 65 | cta | 9 | gtc | |||
18 | aaa | 6 | aac | 60 | aga | ** | cgg | |||
** | caa | ** | atgf | ** | cca | 4 | gtc | |||
6 | aac | 1 | ggc | 7 | ccc | ** | atgj | |||
** | atgf | 32 | ctg | ** | tac | 7 | ctc | |||
6 | tcc | 42 | ccc | 5 | tgg | 18 | acc | |||
10 | ccg | 4 | cgt | ** | cgg | 14 | tgg | |||
14 | gga | 120 | ggc | 75 | gac | 19 | ggg | |||
1 | cac | 42 | atgj | ** | gaa | 7 | ggc | |||
9 | tgc | 16 | agc | 85 | cgt | 8 | ttg | |||
3 | gtc | 6 | atgf | ** | agg | x293 | gtg | |||
6 | ttc | 7 | aac | 5 | atgf | ** | ccg | |||
4 | tac | 4 | gaa | 7 | atgj | 2 | gaa | |||
17 | caa | 18 | aaa | ** | gaa | 6 | ttc | |||
4 | aaa | 4 | caa | 4 | gac | 4 | tac | |||
5 | gaa | 91 | tac | 3 | ttc | 18 | caa | |||
5 | gta | 7 | gtc | ** | ggc | 4 | aaa | |||
7 | gac | ** | tgc | 9 | ggc | |||||
43 | agc | ** | cac | |||||||
30 | ccc | |||||||||
3 | ctg | |||||||||
4 | ggc | |||||||||
4 | cgt | |||||||||
** | acc | |||||||||
- |
Clostridium beijerinckii strain NCIMB 14988[modifier | modifier le wikicode]
cbei opérons[modifier | modifier le wikicode]
- Lien tableur: cbei opérons
- Liens: gtRNAdb [], NCBI [25], génome []
- Phylogénie: Bacteria; Firmicutes; Clostridia; Clostridiales; Clostridiaceae;Clostridium.
- Légende: cdsa: cds aas, cdsd: cds dirigé
- - cyan pour les doubles signalés par le signe + dans la colonne doubles.
- - @ voir le chapitre remarques de ce génome.
- Notes:
- - Les atg ont été résolus en comparant avec ceux de cdc avec stxt. A faire pour psor aussi.
29.65%GC | 29.7.19 Paris | 93 | doubles | intercal | cds | aa | avec aa | cdsa | cdsd |
---|---|---|---|---|---|---|---|---|---|
6477551..6480031 | CDS | 496 | 496 | 827 | |||||
6480528..6482044 | 16s | 213 | |||||||
6482258..6485171 | 23s | 108 | |||||||
6485280..6485394 | 5s | 14 | |||||||
15..91 | atgi | 1 | 1 | ||||||
93..168 | gca | 85 | 85 | 85 | |||||
254..769 | CDS | 1940 | 172 | ||||||
2710..2937 | CDS | 119 | 119 | 76 | 119 | ||||
3057..3147 | tca | + | 30 | 30 | |||||
3178..3268 | agc | 2 tca | 241 | 241 | |||||
3510..3600 | tca | 2 agc | 18 | 18 | |||||
3619..3709 | agc | 125 | 125 | ||||||
3835..4350 | CDS | 9470 | 172 | ||||||
13821..14726 | CDS | 187 | 187 | 302 | |||||
14914..14988 | cgt | 34 | 34 | 34 | |||||
comp | 15023..15913 | CDS | 109014 | 297 | |||||
124928..125338 | CDS | 275 | 275 | 137 | 275 | ||||
125614..125702 | tta | + | 20 | 20 | |||||
125723..125798 | atgf | 4 tta | 7 | 7 | |||||
125806..125882 | atgj | 4 atgf | 6 | 6 | |||||
125889..125977 | tta | 2 atgj | 22 | 22 | |||||
126000..126075 | atgf | 7 | 7 | ||||||
126083..126159 | atgj | 6 | 6 | ||||||
126166..126254 | tta | 21 | 21 | ||||||
126276..126351 | atgf | 70 | 70 | ||||||
126422..126510 | tta | 21 | 21 | ||||||
126532..126607 | atgf | 664 | 664 | ||||||
127272..129683 | CDS | 8954 | 804 | ||||||
138638..140143 | CDS | 307 | 307 | 502 | |||||
140451..140525 | aac | + | 234 | 234 | |||||
140760..140834 | aac | 3 aac | 439 | 439 | |||||
141274..141348 | aac | @6 | 299 | 299 | 299 | ||||
141648..143039 | CDS | 1587 | 464 | ||||||
comp | 144627..145649 | CDS | 543 | 543 | 341 | ||||
146193..147709 | 16s | 140 | |||||||
147850..147925 | gca | 3 | 3 | ||||||
147929..148005 | atc | 111 | |||||||
148117..151030 | 23s | 70 | |||||||
151101..151217 | 5s | 5 | 5 | ||||||
151223..151298 | ttc | 4 | |||||||
151303..151377 | tgc | 167 | 167 | 167 | |||||
151545..151841 | CDS | 25608 | 99 | ||||||
177450..178097 | CDS | 76 | 76 | 216 | |||||
178174..178249 | acc | 65 | 65 | 65 | |||||
178315..179508 | CDS | 134221 | 398 | ||||||
313730..316207 | CDS | 90 | 90 | 826 | 90 | ||||
316298..316382 | cta | 4 | 4 | ||||||
316387..316461 | ggg | 120 | 120 | ||||||
comp | 316582..316986 | CDS | 85487 | 135 | |||||
402474..402953 | CDS | 125 | 125 | 160 | 125 | ||||
403079..403154 | cca | + | 17 | 17 | |||||
403172..403245 | gga | 2* | 149 | 149 | |||||
403395..403471 | aga | cca gga aga | 6 | 6 | |||||
403478..403553 | cca | 16 | 16 | ||||||
403570..403643 | gga | 35 | 35 | ||||||
403679..403755 | aga | 5 | 5 | ||||||
403761..403836 | cac | 3 | 3 | ||||||
403840..403914 | caa | 2* | 7 | 7 | |||||
403922..403997 | aaa | caa aaa cta | 18 | 18 | |||||
404016..404100 | cta | ggc gga | 5 | 5 | |||||
404106..404180 | ggc | 25 | 25 | ||||||
404206..404279 | gga | 5 | 5 | ||||||
404285..404360 | aag | 57 | 57 | ||||||
404418..404492 | caa | 7 | 7 | ||||||
404500..404575 | aaa | 18 | 18 | ||||||
404594..404678 | cta | 5 | 5 | ||||||
404684..404758 | ggc | 25 | 25 | ||||||
404784..404857 | gga | 46 | 46 | ||||||
404904..404980 | cga | 325 | 325 | ||||||
< | 405306..405467 | CDS | 8393 | 54 | |||||
413861..415921 | CDS | 385 | 385 | 687 | |||||
416307..417823 | 16s | @5 | 132 | ||||||
417956..418032 | atc | 84 | |||||||
418117..421031 | 23s | 71 | |||||||
421103..421177 | aac | 345 | 345 | 345 | |||||
421523..422449 | CDS | 63814 | 309 | ||||||
486264..486668 | CDS | 159 | 159 | 135 | 159 | ||||
486828..486912 | tac | + | 9 | 9 | |||||
486922..486997 | gta | 3 tac | 27 | 27 | |||||
487025..487099 | aca | 2 gta | 12 | 12 | |||||
487112..487196 | tac | 2 aca | 9 | 9 | |||||
487206..487281 | gta | 30 | 30 | ||||||
487312..487386 | aca | 12 | 12 | ||||||
487399..487483 | tac | 451 | 451 | ||||||
487935..489110 | CDS | 50956 | 392 | ||||||
540067..540969 | CDS | 187 | 187 | 301 | 187 | ||||
541157..541231 | tgg | 208 | 208 | ||||||
541440..541820 | CDS | 97 | 127 | ||||||
comp | 541918..542985 | CDS | 252 | 252 | 356 | 252 | |||
543238..543312 | tgg | 354 | 354 | ||||||
543667..544683 | CDS | 347735 | 339 | ||||||
892419..893339 | CDS | 560 | 560 | 307 | |||||
893900..895416 | 16s | 137 | |||||||
895554..895629 | gca | 118 | |||||||
895748..898661 | 23s | 204 | |||||||
898866..898982 | 5s | 552 | 552 | 552 | |||||
899535..900446 | CDS | 351 | 304 | ||||||
900798..902048 | CDS | 704 | 704 | 417 | |||||
902753..904269 | 16s | 339 | |||||||
904609..907522 | 23s | 273 | |||||||
907796..907912 | 5s | 69 | 69 | 69 | |||||
comp | 907982..908449 | CDS | 43545 | 156 | |||||
951995..952630 | CDS | 97 | 97 | 212 | 97 | ||||
952728..952813 | ctc | 396 | 396 | ||||||
953210..954919 | CDS | 784414 | 570 | ||||||
1739334..1739933 | CDS | 380 | 380 | 200 | 380 | ||||
1740314..1740389 | cac | 3 | 3 | ||||||
1740393..1740467 | cag | 5 | 5 | ||||||
1740473..1740548 | aaa | 443 | 443 | ||||||
comp | 1740992..1742350 | CDS | 151829 | 453 | |||||
1894180..1895406 | CDS | 34 | 34 | 409 | 34 | ||||
comp | 1895441..1895527 | ttg | 574 | 574 | |||||
1896102..1896794 | CDS | 200701 | 231 | ||||||
2097496..2097915 | CDS | 722 | 722 | 140 | |||||
2098638..2100154 | 16s | 502 | |||||||
2100657..2103569 | 23s | 205 | |||||||
2103775..2103891 | 5s | 315 | 315 | 315 | |||||
2104207..2104905 | CDS | 234313 | 233 | ||||||
2339219..2340322 | CDS | 662 | 662 | 368 | |||||
2340985..2342501 | 16s | 338 | |||||||
2342840..2345755 | 23s | 140 | |||||||
2345896..2345970 | aac | 3 | |||||||
2345974..2346090 | 5s | 429 | 429 | 429 | |||||
2346520..2348088 | CDS | 3574 | 523 | ||||||
2351663..2352139 | CDS | 568 | 568 | 159 | |||||
2352708..2354224 | 16s | 338 | |||||||
2354563..2357477 | 23s | 140 | |||||||
2357618..2357692 | aac | 3 | |||||||
2357696..2357812 | 5s | 90 | 90 | 90 | |||||
2357903..2358316 | CDS | 406783 | 138 | ||||||
2765100..2765525 | CDS | 625 | 625 | 142 | |||||
2766151..2767667 | 16s | 503 | |||||||
2768171..2771082 | 23s | 202 | |||||||
2771285..2771401 | 5s | 5 | |||||||
2771407..2771482 | ttc | 6 | 6 | ||||||
2771489..2771565 | gac | 25 | 25 | ||||||
2771591..2771665 | gaa | 448 | 448 | 448 | |||||
2772114..2774864 | CDS | 781818 | 917 | ||||||
3556683..3557051 | CDS | 565 | 565 | 123 | 565 | ||||
3557617..3557691 | gag | 925 | 925 | ||||||
comp | 3558617..3559759 | CDS | 192275 | 381 | |||||
comp | 3752035..3752652 | CDS | 245 | 245 | 206 | 245 | |||
comp | 3752898..3752985 | agt | @1 | 711 | 711 | ||||
comp | 3753697..3755112 | CDS | 501326 | 472 | |||||
comp | 4256439..4258403 | CDS | 267 | 267 | 655 | 267 | |||
comp | 4258671..4258746 | aaa | 79 | 79 | |||||
comp | 4258826..4258901 | cac | 7 | 7 | |||||
comp | 4258909..4258985 | aga | 35 | 35 | |||||
comp | 4259021..4259094 | gga | 752 | 752 | |||||
4259847..4260392 | CDS | 619853 | 182 | ||||||
comp | 4880246..4880488 | CDS | 508 | 508 | 81 | 508 | |||
comp | 4880997..4881113 | 5s | 274 | ||||||
comp | 4881388..4884300 | 23s | 578 | ||||||
comp | 4884879..4886395 | 16s | 703 | 703 | |||||
comp | 4887099..4888034 | CDS | 1272704 | 312 | |||||
comp | 6160739..6161977 | CDS | 343 | 343 | 413 | ||||
6162321..6162396 | cca | 242 | 242 | 242 | |||||
6162639..6163283 | CDS | 2040 | 215 | ||||||
6165324..6165734 | CDS | 222 | 222 | 137 | |||||
comp | 6165957..6166032 | ttc | 5 | ||||||
comp | 6166038..6166154 | 5s | @2 | 188 | 188 | 188 | |||
6166343..6167074 | CDS | 8085 | 244 | ||||||
comp | 6175160..6175597 | CDS | 249 | 249 | 146 | 249 | |||
comp | 6175847..6175922 | gca | 1 | 1 | |||||
comp | 6175924..6176000 | atgi | 44 | ||||||
comp | 6176045..6176161 | 5s | 138 | ||||||
comp | 6176300..6179216 | 23s | 339 | ||||||
comp | 6179556..6181072 | 16s | 567 | 567 | |||||
comp | 6181640..6182446 | CDS | 223 | 269 | |||||
6182670..6183419 | CDS | 190 | 190 | 250 | 190 | ||||
comp | 6183610..6183685 | aaa | + | 5 | |||||
comp | 6183691..6183807 | 5s | 2 aaa | 159 | 159 | 159 | |||
comp | 6183967..6184914 | CDS | @3 | 294 | 294 | 316 | 294 | ||
comp | 6185209..6185284 | aaa | 7 | ||||||
comp | 6185292..6185408 | 5s | 138 | ||||||
comp | 6185547..6188463 | 23s | 339 | ||||||
comp | 6188803..6190319 | 16s | 771 | 771 | |||||
comp | 6191091..6192203 | CDS | 7306 | 371 | |||||
comp | 6199510..6202059 | CDS | 661 | 661 | 850 | ||||
comp | 6202721..6202837 | 5s | @4 | 139 | |||||
comp | 6202977..6205893 | 23s | 339 | ||||||
comp | 6206233..6207749 | 16s | 1102 | ||||||
comp | 6208852..6208968 | 5s | 138 | ||||||
comp | 6209107..6212023 | 23s | 339 | ||||||
comp | 6212363..6213879 | 16s | 502 | 502 | 502 | ||||
comp | 6214382..6215329 | CDS | 90019 | 316 | |||||
comp | 6305349..6306314 | CDS | 123 | 123 | 322 | 123 | |||
comp | 6306438..6306527 | tcc | 281 | 281 | |||||
comp | 6306809..6307984 | CDS | 66527 | 392 | |||||
6374512..6375684 | CDS | 125 | 125 | 391 | 125 | ||||
comp | 6375810..6375884 | agg | 303 | 303 | |||||
comp | 6376188..6378578 | CDS | 13398 | 797 | |||||
comp | 6391977..6392753 | CDS | 114 | 114 | 259 | 114 | |||
comp | 6392868..6392984 | 5s | 134 | ||||||
comp | 6393119..6396033 | 23s | 214 | ||||||
comp | 6396248..6397764 | 16s | 1120 | ||||||
comp | 6398885..6399001 | 5s | 139 | ||||||
comp | 6399141..6402055 | 23s | 214 | ||||||
comp | 6402270..6403786 | 16s | 748 | 748 | |||||
comp | 6404535..6405107 | CDS | 31702 | 191 | |||||
6436810..6437790 | CDS | 192 | 192 | 327 | |||||
comp | 6437983..6438059 | gac | + | 6 | 6 | ||||
comp | 6438066..6438141 | gta | 3* | 14 | 14 | ||||
comp | 6438156..6438230 | gaa | gac gta | 29 | 29 | ||||
comp | 6438260..6438334 | aca | gaa aca – 1 | 10 | 10 | ||||
comp | 6438345..6438421 | gac | 6 | 6 | |||||
comp | 6438428..6438503 | gta | 16 | 16 | |||||
comp | 6438520..6438594 | gaa | 29 | 29 | |||||
comp | 6438624..6438698 | aca | 10 | 10 | |||||
comp | 6438709..6438785 | gac | 6 | 6 | |||||
comp | 6438792..6438867 | gta | 14 | 14 | |||||
comp | 6438882..6438956 | gaa | 162 | 162 | 162 | ||||
comp | 6439119..6439685 | CDS | 37865 | 189 |
cbei cumuls[modifier | modifier le wikicode]
- Lien tableur: cbei cumuls
- Légende:
- - avec et sans rRNA, fréquences des intercalaires dans les clusters avec rRNA ou sans rRNA.
- - cdsd, je ne choisis que le cds avec l'intercalaire le plus faible d'un cluster donné, en supposant que ce cds a été créé par le cluster lors des conversions.
- - cdsa, longueur du cds en aas ici.
- - 1 : occurences exclues de la moyenne. Sont exclus de la moyenne les jaunes 554 de cbei opérons.
- Notes:
opérons | Fréquences intercalaires tRNAs | Fréquences intercalaires cds | Fréquences aas cds | ||||||||
---|---|---|---|---|---|---|---|---|---|---|---|
effectif | gammes | sans rRNAs | avec rRNAs | gammes | cds | gammes | cdsd | gammes | cdsa | ||
avec rRNA | opérons | 17 | 1 | 0 | 2 | 1 | 0 | 1 | 0 | 100 | 4 |
16 23 5s 0 | 7 | 20 | 34 | 3 | 50 | 2 | 50 | 2 | 200 | 19 | |
16 atc gca | 1 | 40 | 12 | 1 | 100 | 7 | 100 | 6 | 300 | 11 | |
16 23 5s a | 4 | 60 | 2 | 0 | 150 | 7 | 150 | 5 | 400 | 20 | |
max a | 4 | 80 | 2 | 0 | 200 | 9 | 200 | 7 | 500 | 6 | |
a doubles | 1 | 100 | 0 | 0 | 250 | 5 | 250 | 3 | 600 | 3 | |
autres | 6 | 120 | 0 | 0 | 300 | 6 | 300 | 5 | 700 | 2 | |
total aas | 19 | 140 | 0 | 0 | 350 | 6 | 350 | 2 | 800 | 1 | |
sans | opérons | 20 | 160 | 1 | 0 | 400 | 4 | 400 | 1 | 900 | 4 |
1 aa | 11 | 180 | 0 | 0 | 450 | 3 | 450 | 2 | 1000 | 1 | |
max a | 19 | 200 | 0 | 0 | 500 | 2 | 500 | 0 | 1100 | 0 | |
a doubles | 5 | 3 | 0 | 21 | 4 | 0 | |||||
total aas | 74 | 54 | 6 | 72 | 37 | 71 | |||||
total aas | 93 | ||||||||||
remarques | 6 | ||||||||||
avec jaune | moyenne | ||||||||||
variance | |||||||||||
sans jaune | moyenne | 18 | 7 | 350 | 195 | 328 | |||||
variance | 17 | 9 | 225 | 111 | 206 |
cbei blocs[modifier | modifier le wikicode]
- Lien tableur: cbei blocs
- Légende:
- Notes:
16s | 213 | 503 | 339 | |
23s | 108 | 202 | 138 | |
5s | 14 | 5 | 44 | |
atgi | atgi | ttc | atgi | |
16s | 339 | 502 | 578 | |
23s | 273 | 205 | 274 | |
5s | ||||
aaa | 5 | |||
5s | 159 | 5s | 139 | 134 |
cds | 294 | 23s | 339 | 214 |
aaa | 7 | 16s | 1102 | 1120 |
5s | 138 | 5s | 138 | 139 |
23s | 339 | 23s | 339 | 214 |
16s | 16s | |||
16s | 338 | 338 | 16s | 140 |
23s | 140 | 140 | gca | 3 |
aac | 3 | 3 | atc | 111 |
5s | aac | aac | 23s | 70 |
5s | 5 | |||
ttc | ||||
16s | 137 | 16s | 132 | |
gca | 118 | atc | 84 | |
23s | 204 | 23s | 71 | |
5s | aac | |||
ttc | 5 | |||
5s |
cbei remarques[modifier | modifier le wikicode]
- Remarques des 6 @ de cbei opérons
- @ Un tRNA très rare même chez les eucaryotes, agt.
- @ Un 5s isolé avec un tRNA.
- @ Les cds candidats à la création
- - Un cds inséré dans un cluster, candidat pour la création. Ses 2 intercalaires sont faibles, 159 et 294, se trouvent dans les 36 1ers sur un total de 72 ( voir cbei cumuls ). C’est une protéine moyenne de 316 aas.
- - Les groupes de 2 clusters réunis par 2 cds. Ces cds sont colorés en vert comme candidats à la création:
- le groupe contenant @3, adresse 6181640, intercalaires des cds 567 223 190, taille en aas 269 250 ;
- le groupe d’ adresse 541440 contient 2 tgg, intercalaires des cds 208 97 252, taille en aas 127 356 ;
- le groupe d’ adresse 899535, intercalaires des cds 552 351 704, taille en aas 304 417 ;
- @ Un cluster à 2 blocs complets en rRNAs, séparés par un intercalaire de 1102 pbs pouvant contenir un protéine moyenne comme @3. Adresse 6202721. Et le même cluster se retrouve à l’adresse 6392868 avec le même intercalaire 1120. Les 2 clusters se différencient, en intra, uniquement par l’intercalaire 23s-5s qui est le même pour les 2 blocs du premier, 339, et pour le deuxième, 214. Ce qui prouve que ce n’est pas une simple copie.
- @ Les blocs 16s-atc-23s5s sont relativement nombreux quand les 16s-atcgca-23s5s existent. Voir la fiche des clostridia. Ici le 5s est remplacé par un tRNA aac ce qui renforce l’hypothèse de 5s comme modèle.
- @ Un rare triplet pour un firmicutes et en plus les 2 intercalaires sont de la même longueur que les 2 intercalaires avec les 2 cds du cluster, 307 234 439 299, alors que la moyenne des intercalaires entre aas, sans rRNA, et sans jaunes n’est que de 18 (écart 17), celle des cds 350 (écart 225), voir cbei cumuls.
- Séquence des doubles
- - Les doubles ne se trouvent que dans les clusters sans rRNAs puisqu’ils totalisent 74 tRNAs sur 93 et les tRNAs des clusters avec rRNA se trouvent à l’intérieur.
- - A part le triplet de @6 les clusters avec des doubles, signalés par le signe +, totalisent 5 sur 8 contenant plus d’un tRNA. Ce ne sont uniquement que des duplications de séquences colorées en cyan ou séparées par une bordure épaisse.
- - Les longueurs des séquences dupliquées sont: 2*2 4*3 1*4 1*5
- Notes
- - Les blocs à rRNAs, voir cbei blocs. Ils sont caractérisés par très peu de tRNAs internes ou externes et par 5 groupes de 2 clusters chacun (@3), totalisant 10 blocs sur 16 . La distribution est la suivante :
- 11 clusters complets sans tRNAs internes
- 2 clusters peu courants avec un tRNA entre 23s et 5s,
- 3 clusters avec tRNAs internes gcaatc gca atc voir la fiche des firmicutes.
- - 7 cds insérés dans les groupes à 2 clusters, candidats à la création .
- - Le 5s perçu comme un modèle dans @5, 16s-atc-23s-aac
- - Beaucoup de duplications dans les clusters sans rRNAs, caractéristique des firmicutes renforcée par la présence
- d’un cluster avec un triplet aux intercalaires de type cds plutôt que tRNAs.
- et des longueurs de séquences dupliquées variables: 2*2 4*3 1*4 1*5.
- Ces longs clusters sans rRNAs seraient alors issus des clusters longs à rRNAs , qui , quand ils existent dans les autres génomes étudiés des firmicutes, présentent des duplications analogues.
- - Les blocs à rRNAs, voir cbei blocs. Ils sont caractérisés par très peu de tRNAs internes ou externes et par 5 groupes de 2 clusters chacun (@3), totalisant 10 blocs sur 16 . La distribution est la suivante :
cbei distribution[modifier | modifier le wikicode]
- Lien tableur: cbei distribution
- Notes:
- - Tous les +5s sont des 1-3aas
- - aaa es composé de 2 +5s et 4 >1aa
- - gca de 2 +16s, 2 +5s
- - aac de 3 -5s et de 3 >1aa
g1 | t1 | ||||||
---|---|---|---|---|---|---|---|
atgi | 2 | tct | tat | atgf | 4 | ||
att | act | aat | agt | 1 | |||
ctt | cct | cat | cgc | ||||
gtt | gct | gat | ggt | ||||
ttc | 3 | tcc | 1 | tac | 3 | tgc | 1 |
atc | 2 | acc | 1 | aac | 6 | agc | 2 |
ctc | 1 | ccc | cac | 3 | cgt | 1 | |
gtc | gcc | gac | 4 | ggc | 2 | ||
tta | 4 | tca | 2 | taa | tga | ||
ata | aca | 4 | aaa | 6 | aga | 3 | |
cta | 3 | cca | 3 | caa | 2 | cga | 1 |
gta | 5 | gca | 4 | gaa | 4 | gga | 5 |
ttg | 1 | tcg | tag | tgg | 2 | ||
atgj | 2 | acg | aag | 1 | agg | 1 | |
ctg | ccg | cag | 1 | cgg | |||
gtg | gcg | gag | 1 | ggg | 1 | ||
clos | >1aa | =1aa | -5s | +5s | -16s | +16s | total |
cbei | 63 | 11 | 3 | 12* | 4 | 93 |
cbei. Intergen51[modifier | modifier le wikicode]
Intergen51. cbei. Le génome[modifier | modifier le wikicode]
- cbei Le prélèvement: Acbei
- Le nom et le lien NCBI: cbei, Clostridium beijerinckii strain NCIMB 14988, NCBI [26], date 31.07.20.
- cbei La longueur totale des intercalaires, longueur du génome et taux intercalaires/génome:
Nom intercals génome taux en % cbei 1,199,672 6,485,394 18.5
cbei données intercalaires[modifier | modifier le wikicode]
- Lien tableur: cbei données intercalaires
- Lien sauvegarde NCBI: Apmq
cbei données intercalaires 200[modifier | modifier le wikicode]
- Lien tableur: données intercalaires 200.
cbei autres intercalaires aas[modifier | modifier le wikicode]
- Lien tableur: cbei autres intercalaires aas
- Lien sauvegarde NCBI: Apmq
Intergen51. cbei. Les différents types d'intercalaires[modifier | modifier le wikicode]
- Lien au tableur: Intergen51. cbei les différents types d'intercalaires.
- Légende:
- - S pour intercalaire CDS-CDS et R pour tRNA-CDS,
- - c pour intercalaire continu (les 2 gènes sont sur le même brin) et x pour discontinu (les 2 gènes sont sur 2 brins différents, le brin et son complément)
- - %reste = 100*reste/total, le reste étant ce qui reste du total après la fin du diagramme, gamme.
- - %t30 = 100*t30/total, t30 étant le total des fréquences 10 20 30
- - %t5 = 100*t/total, t5 étant le total des fréquences de -1 à -5 dans le diagramme des S-.
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
Intergen51. cbei. Les diagrammes CDS-CDS positifs[modifier | modifier le wikicode]
- Lien tableur: Les diagrammes
- Diagrammes des gamma: cbei présente 2 diagrammes
- - fc40, CDS-CDS continu, fréquence unitaire en abscisses et effectif en ordonnées
- - fx%, CDS-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et pourcentage en ‰ par rapport au total, en ordonnées.
- Équations des courbes de tendance en pour 1000: colonnes %fx %fc
Courbes de tendances pour les diagrammes en pour 1000 Calculs des f.41 cbei R2 x3 x2 x c Inflexion poly3 x c 0.723 2.51E-06 -2.02E-03 4.47E-01 -2.49 fx1 abscisse 262.1 -3362.0 0.780 -3.89E-06 2.87E-03 -6.97E-01 70.6 fc1 ordonnée 21.0 667.9 0.642 3.04E-06 -2.39E-03 5.24E-01 -6.94 fx41 0.931 4.65E-09 4.69E-05 -8.38E-02 32.8 fc41
Intergen51. cbei. Les CDS-CDS négatifs[modifier | modifier le wikicode]
Sous-totaux cbei totale fréquence x- c- x- c- - 1 0 71 4 4140 - 2 0 0 85 11 - 3 0 0 3 12 - 4 2 83 717 10938 - 5 1 0 5 19 sp6 7 236 1642 8424 total 10 390 2,456 23,544 reste 1 4 264 420 s6 1 0 361 41 s7 2 32 321 1438 s8 3 200 696 6525 rappot s1-5 4/2/1 - 1.2 8.4 2.6 % / sp6 s6/sp6 14.3 0.0 22.0 0.5 s7/sp6 28.6 13.6 19.5 17.1 s8/sp6 42.9 84.7 42.4 77.5 reste/sp6 14.3 1.7 16.1 5.0 total s1-5 3 154 814 15120 % / total %s1-5 30.0 39.5 33.1 64.2 %sp6 70.0 60.5 66.9 35.8
Intergen51. cbei. Les intercalaires des blocs[modifier | modifier le wikicode]
- Le détail
RNA-RNA c x CDS-RNA c x 23s 5s 13 CDS 16s 13 1 16s 23s 13 5s CDS 7 3 16s tRNA 3 16 CDS tRNA 23s 3 CDS 5s 5s tRNA 7 23s CDS tRNA in 1 CDS 23s tRNA contig 5 5s 16s 2 tRNA hors 54 16s16s tRNA 16s 23s tRNA 3 tRNA 5s 2 16s 5s 5s 23s 5s 5s total 104 0 total 22 4
- Les rares voir gamma pour la longueur des intercalaires
- Les tRNA-CDS compris, comparaison dans le clade et dans l'étude.
Intergen51. cbei. Les intercalaires tRNA-tRNA extra bloc[modifier | modifier le wikicode]
- Lien tableur: Intergen51. cbei. Les intercalaires tRNA-tRNA extra bloc
hors1 | hors2 | hors3 | hors3 | |||||||
---|---|---|---|---|---|---|---|---|---|---|
inter | aa | inter | aa | inter | aa | inter | aa | |||
30 | tca | 17 | cca | 9 | tac | 6 | gac | |||
241 | agc | 149 | gga | 27 | gta | 14 | gta | |||
18 | tca | 6 | aga | 12 | aca | 29 | gaa | |||
** | agc | 16 | cca | 9 | tac | 10 | aca | |||
20 | tta | 35 | gga | 30 | gta | 6 | gac | |||
7 | atgf | 5 | aga | 12 | aca | 16 | gta | |||
6 | atgj | 3 | cac | ** | tac | 29 | gaa | |||
22 | tta | 7 | caa | 3 | cac | 10 | aca | |||
7 | atgf | 18 | aaa | 5 | cag | 6 | gac | |||
6 | atgj | 5 | cta | ** | aaa | 14 | gta | |||
21 | tta | 25 | ggc | 79 | aaa | ** | gaa | |||
70 | atgf | 5 | gga | 7 | cac | cont | ||||
21 | tta | 57 | aag | 35 | aga | 1 | atgi | |||
** | atgf | 7 | caa | ** | gga | ** | gca | |||
234 | aac | 18 | aaa | 4 | ttc | |||||
439 | aac | 5 | cta | ** | tgc | |||||
** | aac | 25 | ggc | 6 | ttc | |||||
4 | cta | 46 | gga | 25 | gac | |||||
** | ggg | ** | cga | ** | gaa | |||||
1 | gca | |||||||||
** | atgi | |||||||||
- |
cbei intercalaires entre cds[modifier | modifier le wikicode]
- Lien NCBI [27]
- Note: Pour les génomes des annexes j'ai relevé les intercalaires entre tRNAs et entre ceux-ci et les cds qui leur sont adjacents. L'exemple est celui de rru du clade alpha. L'idée de départ de ces prélèvements est la recherche d'opérons formés de tRNA et de protéine comme dans le cas d'E.coli: l'intercalaire entre le tRNA et la protéine devrait être faible. Voir l'exemple d'eco (remarque @3) avec tac-tac-tpr et aca-tac-gga-acc-tufB.
cbei intercalaires positifs S+[modifier | modifier le wikicode]
- Lien tableur: cbei intercalaires positifs S+
- Diagrammes 400: cbei cbei 600 afn, diagramme 1-40: c+ cbei c+ afn total, texte: afn.
- Légende: voir la légende de cvi.
- - "*", diagramme en effectifs de 1 à 600 pour cbei x+. Les lignes 31-400 sont pour cbei c+ en ‰.
cbei | Sx+ | Sc+ | ||||||||||||
Poly3 | -7 | -5 | -3 | 1 | R2 | flex x+ | comment. | -7 | -5 | -3 | 1 | R2 | flex c+ | comment. |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
1 à 400 | 32 | -258 | 569 | -3.0 | 712 | 269 | max160 | -46 | 338 | -822 | 83 | 779 | 245 | min50 |
31 à 400 | 12.7 | -134 | 357 | 3.5 | 790 | 352 | * | -1.4 | 16 | -123 | 40 | 937 | 391 | 1 partie |
droite | -a | cste | - | R2 | note | R2’ | -a | cste | - | R2 | note | R2’ | ||
1 à 400 | 5 | 26 | - | 4 | poly | 708 | tF | 123 | 50 | - | 566 | poly | 213 | SF |
31 à 400 | 36 | 30 | - | 345 | poly | 445 | tF * | 75 | 37 | - | 929 | dte | 8 | Sf |
- Légende du tableau des corrélations et des faibles fréquences
effectifs diagramme | corrélation x+ c+, 41-n | corrélation x+ c+, 1-n | |||||||||
gen | minima | x+ | c+ | total | 400 | 200 | 250 | diff | 200 | 250 | 400 |
---|---|---|---|---|---|---|---|---|---|---|---|
mba | min10 | 705 | 1651 | 2356 | 154 | -330 | -221 | 109 | -512 | -477 | -223 |
cbei | min10 | 950 | 3395 | 4345 | 402 | -509 | -375 | 134 | -649 | -648 | -290 |
pmq | min10 | 1613 | 4170 | 5783 | 455 | -834 | -652 | 182 | -867 | -826 | -61 |
1-30 ‰ | effectifs | 0 ‰ | <0 ‰ | effectifs 1-40 | corel | ||||||
1-30 x+ | 1-30 c+ | x+/c+ | x | c | x | c | x- | c- | x+ | c+ | x+/c+ |
45 | 214 | 0.21 | 1255 | 2688 | 1 | 8 | 18 | 114 | 51 | 428 | -74 |
26 | 244 | 0.11 | 1212 | 4400 | 0 | 4 | 8 | 89 | 35 | 954 | 272 |
32 | 217 | 0.15 | 1926 | 5302 | 3 | 5 | 22 | 142 | 68 | 1155 | -203 |
- Diagrammes 400: cbei cbei 600 afn, diagramme 1-40: c+ cbei c+ afn total, texte: afn.
- Résumé: J’ai classé les 21 génomes suivant la forme des diagrammes x+ 1-400. J’ai obtenu 3 groupes,
- Les tildes au nombre de 5. Ils sont réguliers et forts, tF, avec un R2’ supérieur à 138 pour 4 d’entre eux et scc avec 71. Ce sont, cbei mba pmq et blo scc.
- Les formes S au nombre de 6. Leurs forces (R2’) sont variables, ade rru Sf 20-39, ant mja Sm 70-78, pmg pub SF 179-249.
- Les diagrammes à pyramide, c’est à dire présentant une bosse avec 4 ou 5 points contigus. Ils sont au nombre de 10 dont 9 sont des tildes et bsu est un Sf très faible (R2’18). abra rtb spl afn sont des tF avec plus de 96, ase cbn cvi sont des tf avec moins de 30, eco myr sont des tm 43 68.
- - cbei / afn: Malgré la différence de forme, sur x+ 1-400, entre afn, tilde avec pyramides, et cbei, tilde régulier, les génomes ont en commun le tilde fort, 183 contre 708, le minimum10 et une corrélation très faible et négative sur 41-250. Certes cbei et pmq sont très semblables mais la comparaison avec un génome d’un autre groupe à corrélation faible permet de faire le lien entre groupes. J’aurais pu comparer cbei à blo puisqu’ils ont la régularité du tilde mais ses taux aux fréquences 10 20 sont très élevés par rapport au trio cbei mba pmq, 19‰ pour cbei contre 56‰, soit 3 fois plus et les corrélations sont très différentes 537 contre -377.
- - Les diagrammes 400
- x+ 1-400:
- + Les 2 courbes ont des taux peu élevés des fréquences faibles, 26‰ pour cbei et 46‰ pour afn à comparer à 89‰ de blo. Ensuite leur tilde est fort, 708 (R2 712 4) pour cbei contre 183 (R2 486 303). Les R2 montrent bien la régularité de cbei par rapport à afn, 712 contre 486.
- + Les points d’inflexion sont normaux et presque égaux 269 pour cbei contre 261.
- c+ 1-400: Ce sont 2 courbes presque identiques de formes S fort avec un R2’ de 213 pour cbei contre 297 et des 2 points d’inflexion normaux, 245 pour cbei et 250 pour afn.
- x+ 31-400: Je n’ai pas représenté les courbes x+ 31-400 à cause des taux peu élevés des fréquences faibles 1-30, 26 pour cbei contre 46.
- c+ 31-400: La courbe cbei présente le plus faible R2’ des 21 génomes avec 8, ce qui la rend quasiment une droite et je n’arrive pas à distinguer une première partie en bosse comme pour les autres génomes, c’est pour ça que j’ai indiqué 1 partie en commentaire. La courbe de afn est un tilde moyen, tm, R2’ de 45 (904 859). Les points d’inflexion sont aussi différents, il est faible pour afn à 147 et très faible pour cbei à 38.
- x+ 1-400:
- - Les corrélations:
- Sur les plages 41-n: Les 2 corrélations sur 41-250 sont différentes, il n’y a pas corrélation entre x+ et c+ pour afn, mais cbei a une corrélation négative, c’est à dire x+ et c+ s’opposent entre elles. Mais leur comportement sont les mêmes quand on passe d’une palge de fréquences à l’autre, les 2 génomes chutent pareil en passant à 41-200, différence (diff) de 133 pour cbei cntre 125. De même en passant à 1-250, cbei devient -646 contre -407, c’est à dire que les 2 génomes sont complètement décorrélés.
- - Les faibles fréquences: Les faibles fréquences 1-30 ne sont intéressantes à comparer que pour les génomes à courbes 1-400 semblables où le taux de ces fréquences sont élevés et évoluent en parallèle comme entre pmg et pub où le rapport x+/c+ passe de 0.78 à 0.51. Pour cbei et afn ils sont très faibles et égaux à 0.11. Les zéros sont à 4‰ pour cbei et 11‰ pour afn, alors que le taux des négatifs fait le double de cbei chez afn, 191‰ contre 97‰.
- - Les courbes 1-40:
- c+ 1-40: Les 2 courbes sont semblales et très proche de celle du total des c+ 1-40.
- x+ 1-40: Avec un effectif de 35 pour chacun, la courbe ne peut être significative.
- - Les diagrammes x+ 1-600: Ces diagrammes affinent la forme des courbes x+ 1-400 en la prolongeant à 600 à cause de nombreux restes (reste) non intégrés pour les 2 génomes, pour mba 705 sont représentés contre 527 en reste et pour cbei 946 contre 262.
- cbei x+ 1-600: Le tilde se renforce avec R2p R2d R2’ qui passent respectivement de 712 4 708 à 783 344 439. Le R2 de la droite, R2d, devient conséquent à 344 contre 4. La corrélation 41-400 de 395 passe à 651, elle reste faible pour la longueur de la plage 41-600.
- mba x+ 1-600: La forme devient clairement tilde et se renforce en passant de 350 1 349 à 465 156 309. Le R2 de la droite devient conséquent à 156 contre 1. La variabilité entre cbei et mba est maintenue et passe, en faisant la différence des R2 des tildes cbei-mba, de 712-349 = 363 à 783-465= 318 avec des effectifs qui passent de 946 à 1126 (reste 82 non pris en compte) pour cbei et de 705 à 937 (reste 295 non pris en compte) pour mba. La corrélation 41-400 de 154 passe à 435, elle reste faible pour la longueur de la plage 41-600.
cbei autres intercalaires[modifier | modifier le wikicode]
- Lien tableur: cbei autres intercalaires aas
- Légende:
- - comp, le gène est sur le brin complement
- - deb, fin sont respectivement dans le sens des adresses croissantes, le cds avant le 1er tRNA et le cds après le dernier tRNA du bloc.
- - misc_f, pour misc_feature
- - misc_R, pour misc_RNA
- - gene, c'est un pseudo sans cds
- Totaux: il y a une erreur dans les couleurs et il y a un pseudo gene
tRNA-cds tRNA-tRNA autres-cds total c+ x+ x- c+ x+ c- c+ x+ c- 57 15 106 10 3 1 192
- Méthode de calculs des intercalaires autres que les CDS-CDS voir le cas de amed.
Negativicutes[modifier | modifier le wikicode]
Acidaminococcus fermentans DSM 20731[modifier | modifier le wikicode]
afn opérons[modifier | modifier le wikicode]
- Lien tableur: afn opérons
- Liens: gtRNAdb [28], NCBI [29], génome []
- Phylogénie: Bacteria; Firmicutes; Negativicutes; Acidaminococcales; Acidaminococcaceae; Acidaminococcus.
56%GC | 30.6.19 Paris | 60 | doubles | intercalaire |
---|---|---|---|---|
24678..26242 | 16s | @1 | 359 | |
26602..29507 | 23s | 228 | ||
29736..29852 | 5s | |||
36819..36894 | acg | |||
57713..59277 | 16s | 359 | ||
59637..62543 | 23s | 228 | ||
62772..62888 | 5s | |||
169459..169534 | gcc | |||
249791..249867 | agg | |||
comp | 274627..274703 | cgt | ||
311123..311198 | aca | 22 | ||
311221..311305 | tac | 5 | ||
311311..311386 | atg | 3 | ||
311390..311465 | acc | 6 | ||
311472..311548 | atgf | |||
380482..382046 | 16s | 251 | ||
382298..385204 | 23s | 229 | ||
385434..385550 | 5s | |||
461553..461627 | aac | 3 | ||
461631..461705 | gaa | 8 | ||
461714..461789 | gta | 50 | ||
461840..461916 | cca | 11 | ||
461928..462001 | gga | 8 | ||
462010..462086 | aga | |||
526984..527070 | ctg | + | 30 | |
527101..527186 | ctc | 2 ctg | 52 | |
527239..527325 | ctg | |||
578049..578123 | ggc | |||
636984..638548 | 16s | @2 | 94 | |
638643..638719 | atc | 66 | ||
638786..638861 | gca | 273 | ||
639135..642040 | 23s | 139 | ||
642180..642296 | 5s | |||
712229..712304 | cac | 18 | ||
712323..712398 | caa | 3 | ||
712402..712477 | aaa | 16 | ||
712494..712577 | cta | |||
comp | 724421..724497 | gtc | ||
774880..774956 | gac | 4 | ||
774961..775036 | ttc | 8 | ||
775045..775119 | ggc | 9 | ||
775129..775202 | tgc | 13 | ||
775216..775304 | tta | |||
796654..796728 | cgg | |||
842393..842469 | gac | 2 | ||
842472..842547 | ttc | 8 | ||
842556..842630 | ggc | 9 | ||
842640..842713 | tgc | |||
889670..889746 | ccc | |||
906136..906210 | aac | |||
1022783..1022859 | gac | 2 | ||
1022862..1022936 | ggc | 1 | ||
1022938..1023011 | tgg | |||
1555201..1555277 | ccg | |||
comp | 1567911..1567999 | tca | ||
comp | 1613773..1613863 | agc | ||
1702659..1702744 | ttg | |||
comp | 1711770..1711886 | 5s | 228 | |
comp | 1712115..1715021 | 23s | 359 | |
comp | 1715381..1716945 | 16s | ||
comp | 1823852..1823927 | gta | 6 | |
comp | 1823934..1824008 | gaa | 8 | |
comp | 1824017..1824092 | aag | ||
1909446..1909536 | tcc | |||
comp | 1911342..1911429 | tcg | ||
comp | 1974984..1975058 | atgi | ||
comp | 1984782..1984856 | gag | 12 | |
comp | 1984869..1984942 | cag | + | 111 |
comp | 1985054..1985127 | cag | 2 cag | |
comp | 2072279..2072395 | 5s | 228 | |
comp | 2072624..2075529 | 23s | 298 | |
comp | 2075828..2075903 | gca | 66 | |
comp | 2075970..2076046 | atc | 94 | |
comp | 2076141..2077705 | 16s | ||
2148343..2148418 | gcg | |||
comp | 2287117..2287192 | aaa | ||
comp | 2303018..2303094 | gtg | ||
comp | 2323563..2323636 | ggg |
afn cumuls[modifier | modifier le wikicode]
- Note: Les statistiques sur les intercalaires entre tRNA ne sont pas correctes. Se reporter à intergen51.afn. Il n'y a aucun commentaire sur les CDS. J'ai réduit le tableau aux clusters à rRNA. L'intitulé opéron doit d'être compris dans le sens cluster ou bloc de RNA, rRNA ou tRNA.
afn cumuls opérons effectif avec rRNA opérons 6 16 23 5s 0 4 16 atc gca 2 16 23 5s a 0 max a 2 a doubles 0 spéciaux 0 total aas 4 sans opérons 29 1 aa 20 max a 6 a doubles 2 total aas 56 total aas 60 remarques 2
afn blocs[modifier | modifier le wikicode]
- Lien tableur: afn blocs
16s | 359 | 1565 | 359 | 1565 | 251 | 1565 |
23s | 228 | 2906 | 228 | 2907 | 229 | 2907 |
5s | 117 | 117 | 117 | |||
16s | 94 | 1565 | 5s | 228 | 117 | |
atc | 66 | 23s | 298 | 2906 | ||
gca | 273 | gca | 66 | |||
23s | 139 | 2906 | atc | 94 | ||
5s | 117 | 16s | 1565 | |||
5s | 228 | 117 | ||||
23s | 359 | 2907 | ||||
16s | 1565 |
afn remarques[modifier | modifier le wikicode]
- Lien tableur: afn remarques
- Remarques : 4 blocs 16-23-5s sans aas et très peu de doubles. Très simple.
- @ 4 blocs 16-23-5s sans aas .
- - 3 opérons ont leurs intercalaires identiques, 359 228.
- - 1 opéron a son intercalaire 16s-23s diminué de 30%, 108/359, l’autre intercalaire est commune aux 4 opérons.
- @ 2 blocs 16-atc gca 23s-5s, classiques mais sans aas en plus.
- - 3 intercallaires sont identiques et celui entre 23s-5s varie du simple au double, 94 66 298 228 et 94 66 273 139.
- @ 4 blocs 16-23-5s sans aas .
- Séquences des doubles : Très peu de doubles, 2 opérons à 2aas et plus sur 11 ont des doubles.
- - 2 doublets au total: opéron ctc + 2ctg et opéron gag + 2cag.
afn distribution[modifier | modifier le wikicode]
- Lien tableur: afn distribution
- Notes:
- - cag2 est un double, en gras
- - ggc est composé de 1 1aa et 3 >1aa, les autres soulignés contiennent 1 et 1 respectivement.
|
|
|
afn. Intergen51[modifier | modifier le wikicode]
Intergen51. afn. Le génome[modifier | modifier le wikicode]
- afn Le prélèvement: Artb
- Le nom et le lien NCBI: afn, Acidaminococcus fermentans DSM 20731, NCBI [30], date 30.08.20.
- afn La longueur totale des intercalaires, longueur du génome et taux intercalaires/génome:
Nom intercals génome taux en % afn 242,270 2,329,769 10.4
afn données intercalaires[modifier | modifier le wikicode]
- Lien tableur: afn données intercalaires
- Lien sauvegarde NCBI: Artb
afn données intercalaires 200[modifier | modifier le wikicode]
- Lien tableur: données intercalaires 200.
afn autres intercalaires aas[modifier | modifier le wikicode]
- Lien tableur: afn autres intercalaires aas
- Lien sauvegarde NCBI: Artb
Intergen51. afn. Les différents types d'intercalaires[modifier | modifier le wikicode]
- Lien au tableur: Intergen51. afn les différents types d'intercalaires.
- Légende:
- - S pour intercalaire CDS-CDS et R pour tRNA-CDS,
- - c pour intercalaire continu (les 2 gènes sont sur le même brin) et x pour discontinu (les 2 gènes sont sur 2 brins différents, le brin et son complément)
- - %reste = 100*reste/total, le reste étafn ce qui reste du total après la fin du diagramme, gamme.
- - %t30 = 100*t30/total, t30 étafn le total des fréquences 10 20 30
- - %t5 = 100*t/total, t5 étafn le total des fréquences de -1 à -5 dans le diagramme des S-.
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
Intergen51. afn. Les diagrammes CDS-CDS positifs[modifier | modifier le wikicode]
- Lien tableur: Les diagrammes
- Diagrammes des gamma: afn présente 2 diagrammes
- - fc40, CDS-CDS continu, fréquence unitaire en abscisses et effectif en ordonnées
- - fx%, CDS-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et pourcentage en ‰ par rapport au total, en ordonnées.
- Équations des courbes de tendance en pour 1000: colonnes %fx %fc
Courbes de tendances pour les diagrammes en pour 1000 Calculs des f.41 afn R2 x3 x2 x c Inflexion poly3 x c 0.471 2.75E-06 -2.14E-03 3.98E-01 14.50 fx1 abscisse 276.0 164.2 0.722 -9.09E-06 6.80E-03 -1.62E+00 131.0 fc1 ordonnée 1.0 19.8 0.537 1.92E-06 -1.59E-03 2.95E-01 19.0 fx41 0.893 1.06E-06 -5.22E-04 -3.39E-02 34.7 fc41
Intergen51. afn. Les CDS-CDS négatifs[modifier | modifier le wikicode]
Sous-totaux afn totale fréquence x- c- x- c- - 1 0 38 4 4140 - 2 0 0 85 11 - 3 0 0 3 12 - 4 1 129 717 10938 - 5 0 0 5 19 sp6 3 136 1642 8424 total 4 303 2,456 23,544 reste 1 9 264 420 s6 1 2 361 41 s7 1 20 321 1438 s8 0 105 696 6525 rapport s1-5 4/2/1 - 3.4 8.4 2.6 % / sp6 s6/sp6 33.3 1.5 22.0 0.5 s7/sp6 33.3 14.7 19.5 17.1 s8/sp6 0.0 77.2 42.4 77.5 reste/sp6 33.3 6.6 16.1 5.0 total s1-5 1 167 814 15120 % / total %s1-5 25.0 55.1 33.1 64.2 %sp6 75.0 44.9 66.9 35.8
Intergen51. afn. Les intercalaires des blocs[modifier | modifier le wikicode]
- Le détail
RNA-RNA c x CDS-RNA c x 23s 5s 6 CDS 16s 6 16s 23s 4 5s CDS 2 4 16s tRNA 2 16 CDS tRNA 23s 2 CDS 5s 5s tRNA 23s CDS tRNA in 2 CDS 23s tRNA contig 5s 16s tRNA hors 27 16s16s tRNA 16s 23s tRNA tRNA 5s 16s 5s 5s 23s 5s 5s total 43 0 total 8 4
- Les rares voir gamma pour la longueur des intercalaires
- Les tRNA-CDS compris, comparaison dans le clafn et dans l'étude.
Intergen51. afn. Les intercalaires tRNA-tRNA extra bloc[modifier | modifier le wikicode]
- Lien tableur: Intergen51. afn. Les intercalaires tRNA-tRNA extra bloc
inter | aa | inter | aa | ||
---|---|---|---|---|---|
22 | aca | 4 | gac | ||
5 | tac | 8 | ttc | ||
3 | atgj | 9 | ggc | ||
6 | acc | 13 | tgc | ||
** | atgf | ** | tta | ||
3 | aac | 2 | gac | ||
8 | gaa | 8 | ttc | ||
50 | gta | 9 | ggc | ||
11 | cca | ** | tgc | ||
8 | gga | 2 | gac | ||
** | aga | 1 | ggc | ||
30 | ctg | ** | tgg | ||
52 | ctc | 6 | gta | ||
** | ctg | 8 | gaa | ||
18 | cac | ** | aag | ||
3 | caa | 12 | gag | ||
16 | aaa | 111 | cag | ||
** | cta | ** | cag |
afn intercalaires entre cds[modifier | modifier le wikicode]
- Lien NCBI [31]
- Note: Pour les génomes des annexes j'ai relevé les intercalaires entre tRNAs et entre ceux-ci et les cds qui leur sont adjacents. L'exemple est celui de rru du clade alpha. L'idée de départ de ces prélèvements est la recherche d'opérons formés de tRNA et de protéine comme dans le cas d'E.coli: l'intercalaire entre le tRNA et la protéine devrait être faible. Voir l'exemple d'eco (remarque @3) avec tac-tac-tpr et aca-tac-gga-acc-tufB.
afn intercalaires positifs S+[modifier | modifier le wikicode]
- Lien tableur: afn intercalaires positifs S+
- Diagrammes 400: afn rtb, diagramme 1-40: c+ afn c+ rtb total, texte: rtb.
- Légende: voir la légende de cvi.
afn | Sx+ | Sc+ | ||||||||||||
Poly3 | -7 | -5 | -3 | 1 | R2 | flex x+ | comment. | -7 | -5 | -3 | 1 | R2 | flex c+ | comment. |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
1 à 400 | 29 | -227 | 419 | 16 | 486 | 261 | max40,140 | -95 | 712 | -1690 | 137 | 722 | 250 | min50 |
31 à 400 | 2 parties | 9.5 | -42 | -63 | 38 | 904 | 147 | 2 parties | ||||||
droite | -a | cste | - | R2 | note | R2’ | -a | cste | - | R2 | note | R2’ | ||
1 à 400 | 75 | 40 | - | 303 | poly | 183 | tF | 197 | 65 | 425 | poly | 297 | SF | |
31 à 400 | 92 | 36 | - | 859 | dte | 45 | tm |
- Légende du tableau corrélations et fréquences faibles
effectifs diagramme | corrélation x+ c+, 41-n | corrélation x+ c+, 1-n | |||||||||
gen | minima | x+ | c+ | total | 400 | 200 | 250 | diff | 200 | 250 | 400 |
---|---|---|---|---|---|---|---|---|---|---|---|
rtb | min30 | 118 | 402 | 520 | 536 | -105 | 148 | 253 | -277 | -165 | 202 |
afn | min10 | 328 | 1322 | 1650 | 607 | -17 | 108 | 125 | -467 | -407 | -8 |
mba | min10 | 705 | 1651 | 2356 | 154 | -330 | -221 | 109 | -512 | -477 | -223 |
1-30 ‰ | effectifs | 0 ‰ | <0 ‰ | effectifs 1-40 | corel | ||||||
1-30 x+ | 1-30 c+ | x+/c+ | x | c | x | c | x- | c- | x+ | c+ | x+/c+ |
51 | 294 | 0.17 | 189 | 604 | 5 | 7 | 21 | 162 | 8 | 131 | -81 |
46 | 402 | 0.11 | 350 | 1688 | 6 | 5 | 11 | 180 | 36 | 580 | -369 |
45 | 214 | 0.21 | 1255 | 2688 | 1 | 8 | 18 | 114 | 51 | 428 | -74 |
- Diagrammes 400: afn rtb, diagramme 1-40: c+ afn c+ rtb total, texte: rtb.
- Résumé: J’ai classé les 21 génomes suivant la forme des diagrammes x+ 1-400. J’ai obtenu 3 groupes,
- Les tildes au nombre de 5. Ils sont réguliers et forts, tF, avec un R2’ supérieur à 138 pour 4 d’entre eux et scc avec 71. Ce sont, cbei mba pmq et blo scc.
- Les formes S au nombre de 6. Leurs forces (R2’) sont variables, ade rru Sf 20-39, ant mja Sm 70-78, pmg pub SF 179-249.
- Les diagrammes à pyramide, c’est à dire présentant une bosse avec 4 ou 5 points contigus. Ils sont au nombre de 10 dont 9 sont des tildes et bsu est un Sf très faible (R2’18). abra rtb spl afn sont des tF avec plus de 96, ase cbn cvi sont des tf avec moins de 30, eco myr sont des tm 43 68.
- - afn est un génome bien particulier. Dans les diagrammes x+ 1-400, il appartient au groupe à pyramide et à tilde fort, tF, donc un tilde non régulier et possède un minimum local à la fréquence 10 comme tout le groupe à pyramide qui a ce minimum entre 10 et 40. Mais il possède 2 pyramides à 40 et 140 alternant avec 2 creux profonds à 70 et 180, au lieu d’une seule pyramide pour les autres. Avec sa faible corrélation de 101 sur 41-250, il ressemble plus, dans son groupe, à rtb avec une corrélation de 148, plutôt qu’à spl ou abra avec respectivement 797 et 784.
- - Les diagrammes 400
- x+ 1-400:
- + Les 2 génomes se différencient avant tout par leurs pyramides, rtb en a une seule à 5 fréquences avec un maximum à 80 et afn en a 2 à 3 et 4 fréquences avec des maxima À 40 et 140 respectivement, alternant avec 2 creux profonds avec des minima à 70 et 180.
- + Les fréquences faibles 1-30 sont en opposition avec celles des c+1-400 pour les 2 génomes. Cette différence va impacter fortement leurs corrélations 1-n qu’on verra plus loin.
- + Les points d’inflexion sont normaux, 246 pour rtb contre 261 pour afn.
- c+ 1-400: Ce sont 2 courbes semblables de forme S, moyenne pour rtb avec un R2’ de 82 et forte pour afn avec un R2’ de 297. Les 2 points d’inflexion sont normaux, 258 pour rtb et 250 pour afn. Les fréquences faibles sont concentrées aux fréquences 10 et 20 pour les 2 génomes et les minima locaux sont à la fréquence 50 pour tout les 2. La différence des effectifs, 402 pour rtb et 1323 pour afn explique la différence de forme avec des R2 très différents, 569 pour rtb et 722 pour afn.
- x+ 31-400: Je n’ai pas représenté les courbes x+ 31-400 à cause des taux peu élevés des fréquences faibles 1-30. Quand j’enlève ces fréquences il y a un changement dans la forme de afn qui passe de tF 183 (R2 486 et 303) à Sf 12 (R2 541 et 529) alors que rtb passe de la forme tF 191 (R2 496 et 304) à la forme tm 41 (R2 515 et 474). Ce sont de faibles changement par rapport à leurs faibles totaux en effectif, 118 pour rtb contre 328 pour afn.
- c+ 31-400: Les 2 formes sont 2 tildes très différents , tF pour rtb, avec un R2’ de 190 (788 598) et moyen pour afn, tm, R2’ de 45 (904 859). Les points d’inflexion sont aussi différents, il est normal pour rtb à la fréquence 228 et plus faible pour afn à 147. Les effectifs de ces diagrammes sont de 284 pour rtb et 790 pour afn.
- x+ 1-400:
- - Les corrélations:
- Sur les plages 41-n: Les 2 corrélations sur 41-250 sont du même ordre de grandeur, 148 pour rtb contre 101 pour afn. Par contre rtb chute fortement sur 41-200, avec une différence de 253, alors que afn le fait moins avec une différence de 127.
- Sur les plages 1-n: les 2 génomes chutent fortement, -165 pour rtb et -407 pour afn
- - Les faibles fréquences: Les faibles fréquences 1-30 ne sont intéressantes à comparer que pour les génomes à courbes 1-400 semblables où le taux de ces fréquences sont élevés et évoluent en parallèle comme entre pmg et pub où le rapport x+/c+ passe de 0.78 à 0.51. Ici rtb et afn se comportent de la même façon, respectivement, le rapport x+/c+ fait 0.17 et 0.11, les zéros font 12‰ et 11‰ et les négatifs 183‰ et 190‰.
- - Les courbes 1-40:
- c+ 1-40: La courbe afn est semblable et très proche de celle du total des c+ 1-40; celle de rtb le devient aussi en omettant les fréquences 6 et 10.
- x+ 1-40: Avec un effectif de 8 pour rtb et 51 pour afn les courbes ne peuvent pas être significatives.
afn autres intercalaires[modifier | modifier le wikicode]
- Lien tableur: afn autres intercalaires aas
- Légende:
- - comp, le gène est sur le brin complement
- Totaux
tRNA-cds tRNA-tRNA autres-cds total c+ x+ c- c+ x+ c- c+ x+ nc-tRNA 51 16 43 37 6 1 154
- - deb, fin sont respectivement dans le sens des adresses croissantes, le cds avant le 1er tRNA et le cds après le dernier tRNA du bloc.
- Méthode de calculs des intercalaires autres que les CDS-CDS voir le cas de amed.
afn par rapport au groupe de référence[modifier | modifier le wikicode]
- Lien tableur: afn par rapport au groupe de référence
- Le groupe de référence: voir la référence
- Légende:
- - carré ccc, c'est ctc gtc ccc gcc
- - g+cga, c'est gtg xcg xag ggg cga (dans l'hypothèse de la bascule des cgx, cgt/cgc cga/cgg)
tRNAs | blocs tRNAs | blocs rRNAs | |||||||
afn | 1aa | >1aa | dup | +5s | 1-3aas | autres | total | ||
---|---|---|---|---|---|---|---|---|---|
21 | faible | 11 | 3 | 2 | 16 | ||||
16 | moyen | 5 | 12 | 4 | 21 | ||||
14 | fort | 4 | 19 | 23 | |||||
20 | 34 | 2 | 4 | 60 | |||||
10 | g+cga | 6 | 2 | 2 | 10 | ||||
2 | agg+cgg | 2 | 2 | ||||||
4 | carre ccc | 3 | 1 | 4 | |||||
5 | autres | ||||||||
11 | 3 | 2 | 16 | ||||||
total tRNAs ‰ | |||||||||
afn | 1aa | >1aa | dup | +5s | 1-3aas | autres | afn ‰ | ref.‰ | |
21 | faible | 183 | 50 | 33 | 267 | 26 | |||
16 | moyen | 83 | 200 | 0 | 67 | 350 | 324 | ||
14 | fort | 67 | 317 | 0 | 383 | 650 | |||
333 | 567 | 33 | 67 | 60 | 729 | ||||
10 | g+cgg | 100 | 33 | 33 | 167 | 10 | |||
2 | agg+cga | 33 | 33 | ||||||
4 | carre ccc | 50 | 17 | 67 | 16 | ||||
5 | autres | ||||||||
183 | 50 | 33 | 267 | ||||||
blocs tRNAs ‰ | total colonne % | ||||||||
afn | 1aa | >1aa | dup | total | ref.‰ | 1aa | >1aa | dup | |
21 | faible | 196 | 54 | 36 | 286 | 26 | 55 | 9 | |
16 | moyen | 89 | 214 | 304 | 324 | 25 | 35 | ||
14 | fort | 71 | 339 | 411 | 650 | 20 | 56 | ||
357 | 607 | 36 | 56 | 729 | 20 | 34 | |||
10 | g+cgg | 107 | 36 | 36 | 179 | 10 | 55 | ||
2 | agg+cga | 36 | 36 | 18 | |||||
4 | carre ccc | 54 | 18 | 71 | 16 | 27 | |||
5 | autres | ||||||||
196 | 54 | 36 | 286 | 11 |
negativicutes distribution[modifier | modifier le wikicode]
- Lien tableur: negativicutes distribution
- Liens fiche: 1-3aas 9-23aas
- Légende: prélèvement de la base gtRNAdb le 22.1.21
- - ttt et tgt sont nuls partout
- - atgi, c'est Ile2, mis à la place de ttt, très rare chez les procaryotes.
- - atgf, c'est Metf, mis à la place de tgt, très rare chez les procaryotes.
- - atgj, c'est Met, remplace le atg standard qui est la somme Ile2 Met fMet.
- - Voir la légende des tris, g1 t1 et des couleurs
- Notes: attention tableau neg4, atc est négatif et n'est pas contenu dans le total de 423. Le tableau neg4 est égal à neg1-neg2-neg3. Dans neg2 le rouge est totalement +16s.
|
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|
- Discussion
- - La comparaison avec le classement des tRNAs montre que les effectifs élevés des -rRNAs correspondraient à des duplications. Il faut tenir compte aussi des doubles qui ne sont pas des duplications comme dans le génome afn avec le bloc ctg ctc ctg.
- - pour les 1-3aas aac est élevé alors que atgf est absent.
- - Les tRNAs faibles (cyan) seraient plutôt des 1aa.
- - La méthode de comparaison, ici, sans passer par les indices, c'est à dire une fiche de la totalité des génomes, montre qu'il y a des différences entre le décompte total et la fiche des +rRNAs. Notamment pour le +16s atc avec une valeur négative dans la différence. Pour les comparaions avec indices, pour les autres clades, il faut que ces valeurs négatives soient les plus petites possible en valeur absolue. Sinon il faut vérifier les calculs et les relevés. Voir la comparaison du clade avec le tRNA afn.
negativicutes, estimation des -rRNAs[modifier | modifier le wikicode]
- Lien tableur: negativicutes, estimation des -rRNAs
- Liens fiche: 1-3aas 9-23aas
- Légende: prélèvement de la base gtRNAdb le 22.1.21
- - ttt et tgt sont nuls partout
- - atgi, c'est Ile2, mis à la place de ttt, très rare chez les procaryotes.
- - atgf, c'est Metf, mis à la place de tgt, très rare chez les procaryotes.
- - atgj, c'est Met, remplace le atg standard qui est la somme Ile2 Met fMet.
- - Voir la légende des tris, g1 t1 et des couleurs
negativicutes, calcul des -rRNAs[modifier | modifier le wikicode]
- Lien tableur: negativicutes, calcul des -rRNAs
|
|
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|
|
negativicutes, comparaison clade-annexe des -rRNAs[modifier | modifier le wikicode]
- Lien tableur: negativicutes, comparaison clade-annexe des -rRNAs
- Légende
- - neg7. diff, somme des couleurs de neg7. La différence entre tRNAs est faite entre neg5 et neg6 du tableau précédent. Elle est exprimée en % et rapporté à la plus grande valeur des 2 termes de la différence. Ce qui fait quand un tRNA est à zéro la différence en % est égale à 100.
- - neg8. rap, rapport des sommes couleurs neg5/neg2. Le rapport -rRNA/total est celui du tRNA de neg5 sur celui de neg2.
- Fréquences des différences en % du tableau neg7
gamme 0/0 10 20 30 40 50 60 70 80 90 100 total fréquence 2 11 13 9 5 3 2 0 0 0 3 0 48 tot ≤ 50 41
- Comparaison avec le nombre de tRNAs de la fiche du clade: L’estimation des -rRNA par l'annexe est 10% au dessus de celle de la fiche des negativicutes.
tRNAs fiche annexe sans 456 56 avec 152 4 genomes 9 1 indice % 51 56
|
|
clostridia synthèse[modifier | modifier le wikicode]
- notes: 16 blocs longs +5s
- Liens aux indices des clades: alpha bacilli gamma actino clostridia bacteroide cyano tener spiro beta epsilon delta bactéries
- Liens aux fiches: spiro tener gama alpha beta delta epsilon bacilli clostridia autres firmicutes actino bactero cyano archeo
clostridia distribution par génome[modifier | modifier le wikicode]
- Lien tableur: clostridia distribution par génome
baci | >1aa | 1aa | -5s | +5s | -16s | +16s | duplica | 1-3aas | total |
psor | 12 | 5 | 4 | 72 | 7 | 4 | 104 | ||
cdc | 4 | 4 | 2 | 70 | 3 | 83 | |||
cdc8 | 4 | 5 | 2 | 89 | 4 | 4 | 108 | ||
cbc* | 34 | 10 | 0 | 0 | 2 | 6 | 54 | ||
cbn | 48 | 12 | 2 | 6 | 3 | 4 | 4 | 7 | 90 |
cle | 38 | 19 | 26 | 3 | 9 | 2 | 8 | 107 | |
hmo | 37 | 12 | 39 | 11 | 10 | 109 | |||
cbei | 63 | 11 | 3 | 0 | 4 | 12 | 93 | ||
total | 240 | 78 | 13 | 302 | 6 | 42 | 8 | 51 | 748 |
clostridia distribution du total[modifier | modifier le wikicode]
- Lien tableur: clostridia distribution du total
- Légende:
- - Couleurs du 1er tableau: voir la distribution des bacilli
- - Couleurs du 2ème tableau: d'après les couleurs du pieds du tableau
- - Couleurs du 3ème tableau: comme le tableau 2. Cependant les duplicata ne sont pas comptés dans le total de 55 mais dans le total des >1aa du 1er tableau.
- - Tableau des indices, en-tête: total des génomes, total des tRNAs, indice ttt, indice tgt.
|
|
|
|
clostridia distribution par type[modifier | modifier le wikicode]
- Lien tableur: clostridia distribution par type
- Légende: voir bacilli
|
|
|
clostridia par rapport au groupe de référence[modifier | modifier le wikicode]
- Lien tableur: clostridia par rapport au groupe de référence
- Le groupe de référence: voir la référence
- Légende:
- - carré ccc, c'est ctc gtc ccc gcc
- - g+cga, c'est gtg xcg xag ggg cga (dans l'hypothèse de la bascule des cgx, cgt/cgc cga/cgg)
tRNAs | blocs tRNAs | blocs rRNAs | |||||||
clos8 | 1aa | >1aa | dup | +5s | 1-3aas | autres | total | ||
---|---|---|---|---|---|---|---|---|---|
21 | faible | 31 | 19 | 2 | 6 | 2 | 5 | 65 | |
16 | moyen | 36 | 66 | 4 | 101 | 20 | 42 | 269 | |
14 | fort | 11 | 155 | 2 | 195 | 29 | 14 | 406 | |
78 | 240 | 8 | 302 | 51 | 61 | 740 | |||
10 | g+cga | 16 | 13 | 2 | 31 | ||||
2 | agg+cgg | 5 | 2 | 1 | 8 | ||||
4 | carre ccc | 4 | 4 | 4 | 1 | 5 | 13 | ||
5 | autres | 6 | 2 | 8 | |||||
31 | 19 | 2 | 6 | 2 | 5 | 65 | |||
total tRNAs ‰ | |||||||||
clos8 | 1aa | >1aa | dup | +5s | 1-3aas | autres | clos ‰ | ref.‰ | |
21 | faible | 42 | 26 | 3 | 8 | 3 | 7 | 88 | 26 |
16 | moyen | 49 | 89 | 5 | 136 | 27 | 57 | 364 | 324 |
14 | fort | 15 | 209 | 3 | 264 | 39 | 19 | 549 | 650 |
105 | 324 | 11 | 408 | 69 | 82 | 740 | 729 | ||
10 | g+cga | 22 | 18 | 3 | 42 | 10 | |||
2 | agg+cgg | 7 | 3 | 1 | 11 | ||||
4 | carre ccc | 5 | 5 | 5 | 1 | 7 | 18 | 16 | |
5 | autres | 8 | 0 | 3 | 0 | 11 | |||
42 | 26 | 3 | 8 | 3 | 7 | 88 | |||
blocs tRNAs ‰ | total colonne % | ||||||||
clos8 | 1aa | >1aa | dup | total | ref.‰ | 1aa | >1aa | dup | |
21 | faible | 95 | 58 | 6 | 160 | 26 | 40 | 8 | |
16 | moyen | 110 | 202 | 12 | 325 | 324 | 46 | 28 | |
14 | fort | 34 | 475 | 6 | 515 | 650 | 14 | 65 | |
239 | 736 | 25 | 326 | 729 | 78 | 240 | |||
10 | g+cga | 49 | 40 | 89 | 10 | 52 | |||
2 | agg+cgg | 15 | 6 | 21 | 16 | ||||
4 | carre ccc | 12 | 12 | 25 | 16 | 13 | |||
5 | autres | 18 | 6 | 25 | 19 | ||||
95 | 58 | 6 | 160 | 31 |
clostridia, estimation des -rRNAs[modifier | modifier le wikicode]
- Lien tableur: clostridia, estimation des -rRNAs
- Liens fiche: typage
- Légende: prélèvement de la base gtRNAdb le 27.5.20
- - ttt et tgt sont nuls partout
- - atgi, c'est Ile2, mis à la place de ttt, très rare chez les procaryotes.
- - atgf, c'est Metf, mis à la place de tgt, très rare chez les procaryotes.
- - atgj, c'est Met, remplace le atg standard qui est la somme Ile2 Met fMet.
- - Voir la légende des tris, g1 t1 et des couleurs
clostridia, calcul des -rRNAs[modifier | modifier le wikicode]
- Lien tableur: clostridia, calcul des -rRNAs
|