Recherche:Les clusters de gènes tRNA et rRNA chez les procaryotes/Annexe/bacilli
Aller à la navigation
Aller à la recherche
- Annexe en préparation
Tanger le 21.10.19
Bacillus subtilis[modifier | modifier le wikicode]
bsu opérons[modifier | modifier le wikicode]
43.6%GC | 7.3.19 Paris | 86 | doubles | intercal |
---|---|---|---|---|
9810..11364 | 16s | @2 | 99 | |
11464..11540 | atc | 11 | ||
11552..11627 | gca | 81 | ||
11709..14636 | 23s | 55 | ||
14692..14810 | 5s | |||
22292..22384 | tca | |||
30279..31832 | 16s | 99 | ||
31932..32008 | atc | 11 | ||
32020..32095 | gca | 81 | ||
32177..35103 | 23s | 133 | ||
35237..35355 | 5s | |||
70181..70257 | atg | 9 | ||
70267..70338 | gaa | |||
90536..92089 | 16s | @1 | 164 | |
92254..95181 | 23s | 55 | ||
95237..95354 | 5s | 20 | ||
95375..95450 | gta | 4 | ||
95455..95530 | aca | 36 | ||
95567..95642 | aaa | 6 | ||
95649..95731 | cta | 40 | ||
95772..95846 | ggc | 14 | ||
95861..95946 | tta | 9 | ||
95956..96032 | cgt | 27 | ||
96060..96136 | cca | 9 | ||
96146..96221 | gca | 170 | ||
96392..97945 | 16s | 164 | ||
98110..101037 | 23s | 55 | ||
101093..101211 | 5s | |||
160893..162445 | 16s | 164 | ||
162610..165535 | 23s | 55 | ||
165591..165707 | 5s | 46 | ||
165754..165825 | aac | 4 | ||
165830..165902 | acc | 56 | ||
165959..166033 | ggc | 30 | ||
166064..166140 | cgt | 27 | ||
166168..166244 | cca | 8 | ||
166253..166328 | gca | 171 | ||
166500..168053 | 16s | 164 | ||
168218..171141 | 23s | 55 | ||
171197..171314 | 5s | 183 | ||
171498..173049 | 16s | 164 | ||
173214..176141 | 23s | 55 | ||
176197..176315 | 5s | |||
194205..194279 | gaa | 3 | ||
194283..194358 | gta | 4 | ||
194363..194435 | aca | 22 | ||
194458..194542 | tac | 4 | ||
194547..194621 | caa | |||
528704..528778 | aac | 4 | ||
528783..528873 | agc | 29 | ||
528903..528974 | gaa | 11 | ||
528986..529060 | caa | 26 | ||
529087..529162 | aaa | 11 | ||
529174..529255 | cta | 80 | ||
529336..529422 | ctc | |||
635110..635186 | cgt | 13 | ||
635200..635273 | gga | 159 | ||
635433..636987 | 16s | 167 | ||
637155..640082 | 23s | 55 | ||
640138..640254 | 5s | 13 | ||
640268..640344 | atgf | 60 | ||
640405..640481 | gac | |||
946696..948250 | 16s | 167 | ||
948418..951345 | 23s | 111 | ||
951457..951572 | 5s | 9 | ||
951582..951656 | aac | 5 | ||
951662..951753 | tcc | 34 | ||
951788..951859 | gaa | 9 | ||
951869..951944 | gta | 9 | ||
951954..952030 | atgf | 11 | ||
952042..952118 | gac | 12 | ||
952131..952206 | ttc | 5 | ||
952212..952284 | aca | 22 | ||
952307..952391 | tac | 5 | ||
952397..952470 | tgg | 24 | ||
952495..952570 | cac | 9 | ||
952580..952651 | caa | 49 | ||
952701..952775 | ggc | 5 | ||
952781..952851 | tgc | 7 | ||
952859..952947 | tta | @3 | 265 | |
953213..953294 | ttg | |||
967065..967138 | gga | |||
1262789..1262861 | gtc | |||
comp | 2003276..2003348 | agg | ||
2563889..2563959 | caa | |||
comp | 2899816..2899889 | aga | ||
comp | 3171879..3171950 | gaa | 25 | |
comp | 3171976..3172066 | agc | 3 | |
comp | 3172070..3172144 | aac | 10 | |
comp | 3172155..3172231 | atc | 15 | |
comp | 3172247..3172320 | gga | 10 | |
comp | 3172331..3172406 | cac | 17 | |
comp | 3172424..3172499 | ttc | 12 | |
comp | 3172512..3172588 | gac | 11 | |
comp | 3172600..3172676 | atgf | 17 | |
comp | 3172694..3172786 | tca | 6 | |
comp | 3172793..3172869 | atgi | 2 | |
comp | 3172872..3172948 | atgj | 19 | |
comp | 3172968..3173040 | gca | 5 | |
comp | 3173046..3173122 | cca | 15 | |
comp | 3173138..3173214 | cgt | 9 | |
comp | 3173224..3173309 | tta | 14 | |
comp | 3173324..3173398 | ggc | 5 | |
comp | 3173404..3173490 | ctg | 10 | |
comp | 3173501..3173576 | aaa | 37 | |
comp | 3173614..3173689 | aca | 32 | |
comp | 3173722..3173797 | gta | 20 | |
comp | 3173818..3173935 | 5s | 55 | |
comp | 3173991..3176918 | 23s | 167 | |
comp | 3177086..3178640 | 16s | ||
comp | 3194455..3194527 | gcc | ||
comp | 3545889..3545964 | cgg | ||
comp | 4154787..4154859 | ttc | 35 | |
comp | 4154895..4154971 | gac | 81 | |
comp | 4155053..4155124 | gaa | 9 | |
comp | 4155134..4155209 | aaa |
bsu cumuls[modifier | modifier le wikicode]
- Note: Les statistiques sur les intercalaires entre tRNA ne sont pas correctes. Se reporter à intergen51.bsu. Il n'y a aucun commentaire sur les CDS. J'ai réduit le tableau aux clusters à rRNA. L'intitulé opéron doit d'être compris dans le sens cluster ou bloc de RNA, rRNA ou tRNA.
bsu cumuls opérons effectif avec rRNA opérons 10 16 23 5s 0 3 16 atc gca 2 16 23 5s a 5 max a 21 a doubles 0 spéciaux 0 total aas 60 sans opérons 12 1 aa 8 max a 7 a doubles 0 total aas 26 total aas 86 remarques 3
bsu remarques[modifier | modifier le wikicode]
- Nombre de gènes protéines: 4174 (KEGG)
*Remarques : lmo-bsu (ref. sont les 1ers génomes de cette étude qui m’ont poussé à étendre l’échantillon. Lma* lmo et bsu sont des bacilli et donc ont des points communs en terme d’opréons à RNAs avec des taux %GC très proches 38-44 %. @1 Blocs 16-23-5s : il y en a 8 avec 2 dans l’opéron 9aas et 3 dans 6aas. Soit le double de lmo. - Dans la 1ère étude ces blocs paraissaient arborer les séquences les plus longues d’aas et j’attribuait la longueur de 16 aas de l’opéron 16-act-gca à un remaniement entre opérons. Ce n’est plus le cas puisqu’il s’est avéré que ces derniers sont plus courants et peuvent être aussi long que les premiers avec 18 aas chez lam (ref.. - Les intercalaires sont les mêmes pour les 4 blocs 16-23-5s, 164 55 20. - L'opéron 16aas a un intercalaire 23s-5s double des autres blocs, 111 contre 55. - L'opéron 4aas contient 2 aas avant le 16s et 2 après le 5s. L'intercalaire aa-16s est à peu près égale à celui de 16s-23s, 159 contre 167. - Les intercalaires qui séparent les blocs surnuméraires sont aussi du même ordre que celui de 16s-23s, 170 171 183 contre 164 pour le 16s-23s. - Les 5 opérons avec ces blocs ont 4 6 9 16 21 aas. @2 Blocs 16-atc-gca : il y en a 2 et n’ont pas d’autres aas comme l’opéron 16aas de lmo. - Les intercalaires sont les mêmes pour les 2 opérons, 99 11 81, sauf pour celui de 23s-5s, 55 bases pour l’un, comme 7 blocs 16-23-5s, et le double pour l’autre, 113 comme pour l’opéron 16aas. @3 intercalaire élevé pour 2 aas. Est-ce que le dernier aa est solitaire ? Séquences des doubles : aucun double sur 7 opérons à 2 aas et plus. Comme lmo.
bsu distribution[modifier | modifier le wikicode]
- Lien tableur: bsu distribution
- Notes:
- - Les 1-3aas après 5s, +5s, sont soulignés:atgf gac.
|
|
bsu lmo[modifier | modifier le wikicode]
- Lien tableur: bsu lmo
- Légende:
- - La couleur cyan pour les différents entre bsu et lmo; bois pour les identiques entre les clusters 21 16 9 aas de bsu d'une part et ceux de lmo. Le gène cac est conservé dans les 3 clusters.
- - Le bleu pour des intercalaires exceptionnels.
- - Les bordures très épaisses noires encadrent 3 gènes pour les distingués entre eux.
- Notes:
- - Les fréquences des différences entre intercalaires (diff) sont reportées dans le dernier tableau B14 et sont établies sur la plage des différences entre intercalaires bsu et lmo du tableau B11 pour des couples identiques (entre génomes), et entre intercalaires bsu-bsu et lmo-lmo (intra génome). Ces résultats sont à mettre en parallèle avec ceux de la comparaison cdc-psor. La faible variabilité des intercalaires cdc-psor par rapport à bsu-lmo est due à leur plus grande filiation, niveau genre contre le niveau famille pour bsu-lmo.
|
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|
bsu blocs[modifier | modifier le wikicode]
- Lien tableur: bsu blocs
Types | |||||||||
---|---|---|---|---|---|---|---|---|---|
I | I1 | I2 | I3 | I4 | II | II1 | II2 | II3 | |
16s | 167 | 167 | 164 | 164 | 16s | 164 | 164 | 164 | |
23s | 111 | 55 | 55 | 55 | 23s | 55 | 55 | 55 | |
5s | 9 | 20 | 46 | 20 | 5s | ||||
5 | 32 | 4 | 4 | ||||||
aac | gta | aac | gta | ||||||
**15aas | **20aas | **5aas | ** 8aas | ||||||
III | IV | ||||||||
16s | 99 | 99 | cgt | 13 | |||||
atc | 11 | 11 | gga | 159 | |||||
gca | 81 | 81 | 16s | 167 | |||||
23s | 55 | 133 | 23s | 55 | |||||
5s | 5s | 13 | |||||||
atgf | 60 | ||||||||
gac | |||||||||
groupe1 | groupe2 | ||||||||
16s | 164 | 16s | 164 | ||||||
I3 | 23s | 55 | I4 | 23s | 55 | ||||
5s | 46 | 5s | 20 | ||||||
aac | 4 | gta | 4 | ||||||
**4aas | 8 | ** 7aas | 9 | ||||||
gca | 171 | gca | 170 | ||||||
II1 | 16s | 164 | II3 | 16s | 164 | ||||
23s | 55 | 23s | 55 | ||||||
II2 | 5s | 183 | 5s | ||||||
16s | 164 | ||||||||
23s | 55 | ||||||||
5s |
bsu. Intergen51[modifier | modifier le wikicode]
Intergen51. bsu. Le génome[modifier | modifier le wikicode]
- bsu Le prélèvement: Aspl
- Le nom et le lien NCBI: bsu, Bacillus subtilis subsp. subtilis str. 168, NCBI [4], date 08.02.18.
- bsu La longueur totale des intercalaires, longueur du génome et taux intercalaires/génome:
Nom intercals génome taux en % bsu 434,723 4,215,606 10.3
bsu données intercalaires[modifier | modifier le wikicode]
- Lien tableur: bsu données intercalaires
- Lien sauvegarde NCBI: Aspl
bsu autres intercalaires aas[modifier | modifier le wikicode]
- Lien tableur: bsu autres intercalaires aas
- Lien sauvegarde NCBI: Aspl
Intergen51. bsu. Les différents types d'intercalaires[modifier | modifier le wikicode]
- Lien au tableur: Intergen51. bsu les différents types d'intercalaires.
- Légende:
- - S pour intercalaire CDS-CDS et R pour tRNA-CDS,
- - c pour intercalaire continu (les 2 gènes sont sur le même brin) et x pour discontinu (les 2 gènes sont sur 2 brins différents, le brin et son complément)
- - %reste = 100*reste/total, le reste étant ce qui reste du total après la fin du diagramme, gamme.
- - %t30 = 100*t30/total, t30 étant le total des fréquences 10 20 30
- - %t5 = 100*t/total, t5 étant le total des fréquences de -1 à -5 dans le diagramme des S-.
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
Intergen51. bsu. Les diagrammes CDS-CDS positifs[modifier | modifier le wikicode]
- Lien tableur: Les diagrammes
- Diagrammes des gamma: bsu présente 2 diagrammes
- - fc40, CDS-CDS continu, fréquence unitaire en abscisses et effectif en ordonnées
- - fx%, CDS-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et pourcentage en ‰ par rapport au total, en ordonnées.
- Équations des courbes de tendance en pour 1000: colonnes %fx %fc
Courbes de tendances pour les diagrammes en pour 1000 Calculs des f.41 bsu R2 x3 x2 x c Inflexion poly3 x c 0.457 -4.94E-07 5.75E-04 -3.05E-01 62.5 fx1 abscisse 218.1 166.0 0.790 -4.03E-06 3.46E-03 -1.02E+00 109.0 fc1 ordonnée 19.2 23.8 0.620 4.31E-07 -2.82E-04 -5.47E-02 40.1 fx41 0.936 2.33E-06 -1.16E-03 -1.36E-02 47.4 fc41
Intergen51. bsu. Les CDS-CDS négatifs[modifier | modifier le wikicode]
Sous-totaux bsu totale fréquence x- c- x- c- - 1 0 72 4 4140 - 2 0 4 85 11 - 3 0 0 3 12 - 4 14 229 717 10938 - 5 0 0 5 19 sp6 21 268 1642 8424 total 35 573 2,456 23,544 reste 7 17 264 420 s6 4 0 361 41 s7 6 42 321 1438 s8 4 209 696 6525 rappot s1-5 4/2/1 - 3.2 8.4 2.6 % / sp6 s6/sp6 19.0 0.0 22.0 0.5 s7/sp6 28.6 15.7 19.5 17.1 s8/sp6 19.0 78.0 42.4 77.5 reste/sp6 33.3 6.3 16.1 5.0 total s1-5 14 305 814 15120 % / total %s1-5 40.0 53.2 33.1 64.2 %sp6 60.0 46.8 66.9 35.8
Intergen51. bsu. Les intercalaires des blocs[modifier | modifier le wikicode]
- Le détail
RNA-RNA c x CDS-RNA c x 23s 5s 10 CDS 16s 4 1 16s 23s 8 5s CDS 3 1 16s tRNA 2 16 CDS tRNA 23s 2 CDS 5s 5s tRNA 5 23s CDS tRNA in 2 CDS 23s tRNA contig 50 5s 16s 1 tRNA hors 14 16s16s tRNA 16s 3 23s tRNA tRNA 5s 16s 5s 5s 23s 5s 5s total 96 0 total 8 2
- Les rares voir gamma pour la longueur des intercalaires
- Les tRNA-CDS compris, comparaison dans le clade et dans l'étude.
Intergen51. bsu. Les intercalaires tRNA-tRNA extra bloc[modifier | modifier le wikicode]
- Lien tableur: Intergen51. bsu. Les intercalaires tRNA-tRNA extra bloc
contig | contig | contig | hors | |||||||
---|---|---|---|---|---|---|---|---|---|---|
inter | aa | inter | aa | inter | aa | inter | aa | |||
4 | gta | 5 | aac | 25 | gaa | 9 | atgj | |||
36 | aca | 34 | tcc | 3 | agc | ** | gaa | |||
6 | aaa | 9 | gaa | 10 | aac | 3 | gaa | |||
40 | cta | 9 | gta | 15 | atc | 4 | gta | |||
14 | ggc | 11 | atgf | 10 | gga | 22 | aca | |||
9 | tta | 12 | gac | 17 | cac | 4 | tac | |||
27 | cgt | 5 | ttc | 12 | ttc | ** | caa | |||
9 | cca | 22 | aca | 11 | gac | 4 | aac | |||
** | gca | 5 | tac | 17 | atgf | 29 | agc | |||
4 | aac | 24 | tgg | 6 | tca | 11 | gaa | |||
56 | acc | 9 | cac | 2 | atgi | 26 | caa | |||
30 | ggc | 49 | caa | 19 | atgj | 11 | aaa | |||
27 | cgt | 5 | ggc | 5 | gca | 80 | cta | |||
8 | cca | 7 | tgc | 15 | cca | ** | ctc | |||
** | gca | 265 | tta | 9 | cgt | 35 | ttc | |||
13 | cgt | ** | ttg | 14 | tta | 81 | gac | |||
** | gga | 5 | ggc | 9 | gaa | |||||
60 | atgf | 10 | ctg | ** | aaa | |||||
** | gac | 37 | aaa | |||||||
32 | aca | |||||||||
** | gta |
bsu intercalaires entre cds[modifier | modifier le wikicode]
- Lien NCBI [5]
- Note: Pour les génomes des annexes j'ai relevé les intercalaires entre tRNAs et entre ceux-ci et les cds qui leur sont adjacents. L'exemple est celui de rru du clade alpha. L'idée de départ de ces prélèvements est la recherche d'opérons formés de tRNA et de protéine comme dans le cas d'E.coli: l'intercalaire entre le tRNA et la protéine devrait être faible. Voir l'exemple d'eco (remarque @3) avec tac-tac-tpr et aca-tac-gga-acc-tufB.
bsu intercalaires positifs S+[modifier | modifier le wikicode]
- Lien tableur: bsu intercalaires positifs S+
- Diagrammes 400: bsu eco, diagramme 1-40: c+ bsu c+ eco x+ bsu x+ eco total, texte: eco.
- Légende: voir la légende de cvi.
bsu | Sx+ | Sc+ | ||||||||||||
Poly3 | -7 | -5 | -3 | 1 | R2 | flex x+ | comment. | -7 | -5 | -3 | 1 | R2 | flex c+ | comment. |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
1 à 400 | -6.4 | 69 | -338 | 67 | 458 | 359 | max40 | -41 | 352 | -1040 | 112 | 790 | 286 | min50 |
51 à 400 | 48 | -359 | 711 | -11 | 861 | 249 | 2 parties | 12 | -27 | -230 | 64 | 954 | 75 | 2 parties |
droite | -a | cste | - | R2 | note | R2’ | -a | cste | - | R2 | note | R2’ | ||
1 à 400 | 152 | 56 | - | 440 | dte | 18 | max40 | 211 | 68 | 617 | poly | 173 | SF | |
51 à 400 | 94 | 40 | - | 694 | poly | 167 | tF | 145 | 50 | - | 850 | poly | 104 | tF |
- Légende du tableau corrélations et faibles fréquences
effectifs diagramme | corrélation x+ c+, 41-n | corrélation x+ c+, 1-n | |||||||||
gen | minima | x+ | c+ | total | 400 | 200 | 250 | diff | 200 | 250 | 400 |
---|---|---|---|---|---|---|---|---|---|---|---|
eco | min20 | 1003 | 2130 | 3133 | 735 | 296 | 440 | 144 | -178 | -64 | 287 |
bsu | min10 | 1028 | 2444 | 3472 | 659 | 8 | 282 | 274 | 152 | 257 | 470 |
rtb | min30 | 118 | 402 | 520 | 536 | -105 | 148 | 253 | -277 | -165 | 202 |
1-30 ‰ | effectifs | 0 ‰ | <0 ‰ | effectifs 1-40 | corel | ||||||
1-30 x+ | 1-30 c+ | x+/c+ | x | c | x | c | x- | c- | x+ | c+ | x+/c+ |
63 | 348 | 0.18 | 1169 | 2855 | 11 | 6 | 80 | 226 | 126 | 821 | -119 |
140 | 333 | 0.42 | 1125 | 3091 | 2 | 8 | 31 | 186 | 302 | 936 | -432 |
51 | 294 | 0.17 | 189 | 604 | 5 | 7 | 21 | 162 | 8 | 131 | -81 |
- Diagrammes 400: bsu eco, diagramme 1-40: c+ bsu c+ eco x+ bsu x+ eco total, texte: eco.
- Résumé: J’ai classé les 21 génomes suivant la forme des diagrammes x+ 1-400. J’ai obtenu 3 groupes,
- Les tildes au nombre de 5. Ils sont réguliers et forts, tF, avec un R2’ supérieur à 138 pour 4 d’entre eux et scc avec 71. Ce sont, cbei mba pmq et blo scc.
- Les formes S au nombre de 6. Leurs forces (R2’) sont variables, ade rru Sf 20-39, ant mja Sm 70-78, pmg pub SF 179-249.
- Les diagrammes à pyramide, c’est à dire présentant une bosse avec 4 ou 5 points contigus. Ils sont au nombre de 10 dont 9 sont des tildes et bsu est un Sf très faible (R2’18). abra rtb spl afn sont des tF avec plus de 96, ase cbn cvi sont des tf avec moins de 30, eco myr sont des tm 43 68.
- - bsu ressemble beaucoup à eco comme on vient de le voir avec des courbes x+ 1-400 à pyramide et de forme tilde moyen pour eco (R2’ 43) et Sf pour bsu (R2’ 18). Ils ont des effectifs égaux 3133 contre 3472.
- - Les diagrammes 400
- x+ 1-400:
- + Les 2 génomes ont une pyramide à 4 fréquences avec un maximum à 50 pour eco contre 40 pour bsu. Quand j’enlève les 3 fréquences faibles de eco pour ne laisser que la pyramide, sa courbe devient une S faible, Sf, R2’ à 36 et la courbe bsu sans la fréquence 10 devient une S moyenne, Sm, R2’ à 60. Je n’ai pas représenté les courbes x+ 31-400 à cause des taux peu élevés des fréquences faibles 1-30, 65 pour eco et 140 pour bsu.
- + Les fréquences faibles 1-30 sont en opposition avec celles de bsu c+1-400 et en parallèle avec eco. Cette différence va impacter différemment les corrélations 1-n qu’on verra plus loin.
- + Les points d’inflexion sont normaux mais nettement différents, 359 pour bsu contre 230 pour eco, différence due à la différence de forme.
- c+ 1-400: Ce sont 2 courbes presque identiques de formes S fort avec un R2’ de 173 pour bsu contre 265 et des 2 points d’inflexion normaux, 286 pour bsu et 255 pour eco.
- x+ 31-400: Je n’ai pas représenté les courbes x+ 31-400 à cause des taux peu élevés des fréquences faibles 1-30, 140 et 65. Il faudrait les remplacer par les courbes avec pyramide seule sans les fréquences faibles 1-30, voir le paragraphe x+ 1-400 ci-dessus. Néanmoins j’ai fait la courbe qui donne un SF avec un R2’ de 121 (R2 554 433 pour la droite) et celle d’eco qui a donné un Sf de 36 (R2 742 706 pour la droite). Il y a encore une bonne ressemblance.
- x+ 51-400: A la place de 31-400 j’ai fait pour bsu 51-400, sans la pyramide et j’ai obtenu un tilde très fort, tF, avec un R2’ de 167 (861 694). Avec eco j’ai fait la courbe 71-400 pour respecter la modification faite sur bsu et j’ai obtenu là aussi un tilde très fort, tF, avec un R2’ de 120 (835 715) donc on a le même ordre de grandeur.
- c+ 31-400: j’ai fait la courbe de bsu qui a donné un tilde fort, tF, avec un R2’ de 80 (942 862). La courbe d’eco avait donné un tilde moyen, R2’ 67 (948 881). Encore même ordre de grandeur. La différence entre les courbes est le point d’inflexion, négatif et grand chez eco -407, positif et normal chez bsu 150 environ.
- c+ 51-400: A la place de 31-400 j’ai fait pour bsu 51-400, sans la pyramide et j’ai obtenu un tilde très fort, tF, avec un R2’ de 104 (954 850). Avec eco j’ai fait la courbe 71-400 pour respecter la modification faite sur bsu et j’ai obtenu par contre là, un S fort, SF, avec un R2’ de 94 (956 862) donc là les 2 génomes diffèrent.
- x+ 1-400:
- - Les corrélations:
- Sur les plages 41-n: Les 2 corrélations sur 41-250 sont nettement différentes, la corrélation de bsu devient faible, 282, alors qu’eco reste moyenne, 440. Sur 41-200, elles chutent toutes les 2 fortement avec une différence (diff) de 144 pour eco et 274 pour bsu qui devient quasi nulle, 8. 178 -64
- Sur les plages 1-n: Le rapport x+/c+ des faibles fréquences que j’ai mentionnées au paragraphe x+ 1-400 agissent fortement sur les corrélations 1-n.
- + Chez eco il y a très peu de faibles fréquences 1-30, avec un rapport de 0.18, d’où des corrélations sur 1-n négatives, -178 pour 1-200 et -64 pour 1-250.
- + Chez bsu il y a beaucoup plus de faibles fréquences 1-30, avec un rapport de 0.42, d’où des corrélations sur les plages 1-n positives qui améliorent celles des plages 41-n. La corrélation de 282 sur 41-250 est maintenue à 257, grâces aux taux élevés des fréquences faibles dans x+ 1-400.
- - Les faibles fréquences: Les faibles fréquences 1-30 ne sont intéressantes à comparer que pour les génomes à courbes 1-400 semblables où le taux de ces fréquences sont élevés et évoluent en parallèle comme entre pmg et pub où le rapport x+/c+ passe de 0.78 à 0.51. Bsu en a beaucoup dans x+ par rapport à eco, 0.42 contre 0.18. Ce rapport explique bien le comportement des corrélations de bsu sur les plages 1-n où les faibles fréquences maintiennent et améliorent même celles des plages 41-n. L’absence notable des faibles fréquences de eco explique la chute de ses corrélations sur les plages 1-n par rapport à celles des plages. Les zéros sont à 10‰ pour bsu et 17‰ pour eco, avantage donné par les x+. Le taux des négatifs est presque le même pour les 2 génomes, 217‰ contre 306‰ pour eco, avec un déficit en x- chez bsu.
- - Les courbes 1-40:
- c+ 1-40: Les 2 courbes sont semblables et très proches de celle du total des c+ 1-40.
- x+ 1-40: Avec des effectifs élevés, 302 pour bsu et 126 pour eco, et des corrélations (corel) fortement négatives, l’éloignement du modèle c+ 1-40 est sans équivoques, les 2 courbes croissent régulièrement au lieu de présenter un creux à la fréquence 7 suivi d’une bosse à la fréquence 11.
bsu autres intercalaires[modifier | modifier le wikicode]
- Lien tableur: bsu autres intercalaires aas
- Légende:
- - comp, le gène est sur le brin complement
- - deb, fin sont respectivement dans le sens des adresses croissantes, le cds avant le 1er tRNA et le cds après le dernier tRNA du bloc.
- - misc_f, pour misc_feature
- - misc_R, pour misc_RNA
- Totaux
tRNA-cds tRNA-tRNA autres-cds total gen c+ x+ x- c+ x+ c- c+ x+ c- 19 19 97 169 1 17 322 2 misc-misc
- Méthode de calculs des intercalaires autres que les CDS-CDS voir le cas de amed.
Listeria monocytogenes[modifier | modifier le wikicode]
lmo opérons[modifier | modifier le wikicode]
37.9%GC | 7.3.19 Paris | 67 | doubles | intercal |
---|---|---|---|---|
82705..82777 | aag | |||
237466..239020 | 16s | @1 | 244 | |
239265..242195 | 23s | 80 | ||
242276..242385 | 5s | 13 | ||
242399..242471 | gta | 8 | ||
242480..242555 | aca | 41 | ||
242597..242669 | aaa | 5 | ||
242675..242756 | cta | 14 | ||
242771..242842 | ggc | 21 | ||
242864..242949 | tta | 12 | ||
242962..243035 | cgt | 10 | ||
243046..243119 | cca | 19 | ||
243139..243214 | gca | 341 | ||
243556..245041 | 16s | 244 | ||
245286..248216 | 23s | 80 | ||
248297..248406 | 5s | |||
677464..677553 | tcg | |||
936656..936728 | aac | 3 | ||
936732..936819 | agc | |||
940017..940088 | gaa | 27 | ||
940116..940188 | gac | |||
970867..970937 | gga | |||
1266675..1266748 | aga | |||
comp | 1740916..1740987 | gaa | 5 | |
comp | 1740993..1741083 | agc | 34 | |
comp | 1741118..1741190 | aac | 6 | |
comp | 1741197..1741270 | atc | 25 | |
comp | 1741296..1741366 | gga | 23 | |
comp | 1741390..1741462 | cac | 28 | |
comp | 1741491..1741563 | ttc | 4 | |
comp | 1741568..1741643 | gac | 4 | |
comp | 1741648..1741721 | atgf | 42 | |
comp | 1741764..1741853 | tca | 22 | |
comp | 1741876..1741949 | atgi | 11 | |
comp | 1741961..1742034 | atgj | 42 | |
comp | 1742077..1742149 | gca | 22 | |
comp | 1742172..1742245 | cca | 10 | |
comp | 1742256..1742329 | cgt | 9 | |
comp | 1742339..1742424 | tta | 14 | |
comp | 1742439..1742513 | ggc | 15 | |
comp | 1742529..1742610 | cta | 5 | |
comp | 1742616..1742688 | aaa | 41 | |
comp | 1742730..1742805 | aca | 8 | |
comp | 1742814..1742886 | gta | 13 | |
comp | 1742900..1743009 | 5s | 81 | |
comp | 1743091..1746021 | 23s | 244 | |
comp | 1746266..1747811 | 16s | ||
1776112..1776183 | cgt | |||
comp | 1848821..1848930 | 5s | 81 | |
comp | 1849012..1851942 | 23s | 244 | |
comp | 1852187..1853732 | 16s | ||
2162187..2162273 | ctc | |||
2215375..2215446 | gaa | 157 | ||
2215604..2215677 | acg | 9 | ||
2215687..2215770 | tac | 11 | ||
2215782..2215856 | caa | 6 | ||
2215863..2215935 | aaa | |||
comp | 2436493..2436576 | ttg | 45 | |
comp | 2436622..2436695 | tgc | 19 | |
comp | 2436715..2436786 | ggc | 5 | |
comp | 2436792..2436863 | caa | 29 | |
comp | 2436893..2436965 | cac | 15 | |
comp | 2436981..2437054 | tgg | 7 | |
comp | 2437062..2437145 | tac | 20 | |
comp | 2437166..2437238 | ttc | 4 | |
comp | 2437243..2437318 | gac | 6 | |
comp | 2437325..2437398 | atgf | 21 | |
comp | 2437420..2437495 | gta | 56 | |
comp | 2437552..2437623 | gaa | 33 | |
comp | 2437657..2437745 | tcc | 6 | |
comp | 2437752..2437827 | aac | 14 | |
comp | 2437842..2437951 | 5s | 80 | |
comp | 2438032..2440962 | 23s | 172 | |
comp | 2441135..2441210 | gca | 46 | |
comp | 2441257..2441330 | atc | 127 | |
comp | 2441458..2443003 | 16s | @2 | |
comp | 2540230..2540301 | cgg | ||
comp | 2672664..2672736 | acc | 24 | |
comp | 2672761..2672836 | aac | 14 | |
comp | 2672851..2672960 | 5s | 80 | |
comp | 2673041..2675971 | 23s | 172 | |
comp | 2676144..2676219 | gca | 46 | |
comp | 2676266..2676339 | atc | 127 | |
comp | 2676467..2678012 | 16s | ||
2930362..2930434 | gtc |
lmo cumuls[modifier | modifier le wikicode]
- Note: Les statistiques sur les intercalaires entre tRNA ne sont pas correctes. Se reporter à intergen51.lmo. Il n'y a aucun commentaire sur les CDS. J'ai réduit le tableau aux clusters à rRNA. L'intitulé opéron doit d'être compris dans le sens cluster ou bloc de RNA, rRNA ou tRNA.
lmo cumuls opérons effectif avec rRNA opérons 6 16 23 5s 0 2 16 atc gca 2 16 23 5s a 2 max a 21 a doubles 0 spéciaux 0 total aas 50 sans opérons 11 1 aa 8 max a 5 a doubles 0 total aas 17 total aas 67 remarques 2
lmo blocs[modifier | modifier le wikicode]
- Lien tableur: lmo blocs
Types | ||||||||
---|---|---|---|---|---|---|---|---|
I | I1 | I2 | I3 | I4 | II | II1 | II2 | |
16s | 244 | 244 | 16s | 244 | 244 | |||
23s | 81 | 80 | 23s | 80 | 81 | |||
5s | 13 | 13 | 5s | |||||
8 | 8 | |||||||
gta | gta | |||||||
**20aas | **8aas | |||||||
III | IV | |||||||
16s | 127 | 127 | ||||||
atc | 46 | 46 | ||||||
gca | 172 | 172 | ||||||
23s | 80 | 80 | ||||||
5s | 14 | 14 | ||||||
6 | 24 | |||||||
aac | aac | |||||||
**13aas | acc | |||||||
Groupes | ||||||||
16s | 244 | |||||||
I4 | 23s | 80 | ||||||
5s | 13 | |||||||
gta | 8 | |||||||
**7aas | 19 | |||||||
gca | 341 | |||||||
16s | 244 | |||||||
II1 | 23s | 80 | ||||||
5s |
lmo remarques[modifier | modifier le wikicode]
- Nombre de gènes protéines: 2867 (KEGG)
*Remarques : lmo-bsu (ref. sont les 1ers génomes de cette étude qui m’ont poussé à étendre l’échantillon. Lma* lmo et bsu sont des bacilli et donc ont des points communs en terme d’opréons à RNAs avec des taux %GC très proches 38-44 %. @1 Blocs 16-23-5s : il y en a 4 dont 1 sans aas et 2 réunis dans un seul opéron. - Dans la 1ère étude ces blocs paraissaient arborer les séquences les plus longues d’aas et j’attribuait la longueur de 16 aas de l’opéron 16-act-gca à un remaniement entre opérons. Ce n’est plus le cas puisqu’il s’est avéré que ces derniers sont plus courants et peuvent être aussi long que les premiers avec 18 aas chez lam (ref.. - Les intercalaires sont les mêmes pour les 4 blocs 16-23-5s, 244 80 13. - L'opéron à 2 blocs: le 2ème n'ayant pas d'aa à la suite de 5s et ayant une intercalaire du côté de 16s, très élevée, 341 bases, pourrait être un solitaire. @2 Blocs 16-atc-gca : il y en a 2 dont un le fameux 16aas et l’autre avec 4 aas. - Les intercalaires sont les mêmes pour les 2 opérons, 127 46 172 80 14. - Ils partagent les mêmes intercalaires 5s-aa avec les blocs 16-23-5s-aa, 80 13. Séquences des doubles : aucun double sur 7 opérons à 2 aas et plus. Comme bsu.
lmo distribution[modifier | modifier le wikicode]
- Lien tableur: lmo distribution
- Notes:- Les 1-3aas après 5s, +5s, sont soulignés:aac acc.
|
|
lmo. Intergen51[modifier | modifier le wikicode]
Intergen51. lmo. Le génome[modifier | modifier le wikicode]
- lmo Le prélèvement: Abacilli
- Le nom et le lien NCBI: lmo, Listeria monocytogenes EGD-e, NCBI [8], date 27.2.15.
- lmo La longueur totale des intercalaires, longueur du génome et taux intercalaires/génome:
Nom intercals génome taux en % lmo 288,032 2,944,528 9.8
lmo données intercalaires[modifier | modifier le wikicode]
- Lien tableur: lmo données intercalaires
- Lien sauvegarde NCBI: Abacilli
lmo autres intercalaires aas[modifier | modifier le wikicode]
- Lien tableur: lmo autres intercalaires aas
- Lien sauvegarde NCBI: Abacilli
Intergen51. lmo. Les différents types d'intercalaires[modifier | modifier le wikicode]
- Lien au tableur: Intergen51. lmo les différents types d'intercalaires.
- Légende:
- - S pour intercalaire CDS-CDS et R pour tRNA-CDS,
- - c pour intercalaire continu (les 2 gènes sont sur le même brin) et x pour discontinu (les 2 gènes sont sur 2 brins différents, le brin et son complément)
- - %reste = 100*reste/total, le reste étant ce qui reste du total après la fin du diagramme, gamme.
- - %t30 = 100*t30/total, t30 étant le total des fréquences 10 20 30
- - %t5 = 100*t/total, t5 étant le total des fréquences de -1 à -5 dans le diagramme des S-.
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
Intergen51. lmo. Les diagrammes CDS-CDS positifs[modifier | modifier le wikicode]
- Lien tableur: Les diagrammes
- Diagrammes des gamma: lmo présente 2 diagrammes
- - fc40, CDS-CDS continu, fréquence unitaire en abscisses et effectif en ordonnées
- - fx%, CDS-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et pourcentage en ‰ par rapport au total, en ordonnées.
- Équations des courbes de tendance en pour 1000: colonnes %fx %fc
Courbes de tendances pour les diagrammes en pour 1000 Calculs des f.41 lmo R2 x3 x2 x c Inflexion poly3 x c 0.325 1.78E-07 2.12E-04 -2.46E-01 59.10 fx1 abscisse 255.6 201.9 0.671 -6.21E-06 4.88E-03 -1.27E+00 118.0 fc1 ordonnée 14.4 17.0 0.418 -5.23E-06 4.01E-03 -1.03E+00 103.0 fx41 0.850 3.17E-06 -1.92E-03 2.08E-01 27.2 fc41
Intergen51. lmo. Les CDS-CDS négatifs[modifier | modifier le wikicode]
Sous-totaux lmo totale fréquence x- c- x- c- - 1 0 61 4 4140 - 2 0 0 85 11 - 3 0 0 3 12 - 4 3 173 717 10938 - 5 0 0 5 19 sp6 7 159 1642 8424 total 10 393 2,456 23,544 reste 1 7 264 420 s6 1 0 361 41 s7 3 18 321 1438 s8 2 134 696 6525 rappot s1-5 4/2/1 - 2.8 8.4 2.6 % / sp6 s6/sp6 14.3 0.0 22.0 0.5 s7/sp6 42.9 11.3 19.5 17.1 s8/sp6 28.6 84.3 42.4 77.5 reste/sp6 14.3 4.4 16.1 5.0 total s1-5 3 234 814 15120 % / total %s1-5 30.0 59.5 33.1 64.2 %sp6 70.0 40.5 66.9 35.8
Intergen51. lmo. Les intercalaires des blocs[modifier | modifier le wikicode]
- Le détail
RNA-RNA c x CDS-RNA c x 23s 5s 6 CDS 16s 5 16s 23s 4 5s CDS 2 16s tRNA 2 16 CDS tRNA 23s 2 CDS 5s 5s tRNA 4 23s CDS tRNA in 2 CDS 23s tRNA contig 42 5s 16s tRNA hors 6 16s16s tRNA 16s 1 23s tRNA tRNA 5s 16s 5s 5s 23s 5s 5s total 69 0 total 7 0
- Les rares voir gamma pour la longueur des intercalaires
- Les tRNA-CDS compris, comparaison dans le clade et dans l'étude.
Intergen51. lmo. Les intercalaires tRNA-tRNA extra bloc[modifier | modifier le wikicode]
- Lien tableur: Intergen51. lmo. Les intercalaires tRNA-tRNA extra bloc
cont1 | cont2 | cont3 | |||||
---|---|---|---|---|---|---|---|
inter | aa | inter | aa | inter | aa | ||
5 | gaa | 45 | ttg | 8 | gta | ||
34 | agc | 19 | tgc | 41 | aca | ||
6 | aac | 5 | ggc | 5 | aaa | ||
25 | atc | 29 | caa | 14 | cta | ||
23 | gga | 15 | cac | 21 | ggc | ||
28 | cac | 7 | tgg | 12 | tta | ||
4 | ttc | 20 | tac | 10 | cgt | ||
4 | gac | 4 | ttc | 19 | cca | ||
42 | atgf | 6 | gac | ** | gca | ||
22 | tca | 21 | atgf | 24 | acc | ||
11 | atgi | 56 | gta | ** | aac | ||
42 | atgj | 33 | gaa | hors | |||
22 | gca | 6 | tcc | 3 | aac | ||
10 | cca | ** | aac | ** | agc | ||
9 | cgt | 27 | gaa | ||||
14 | tta | ** | gac | ||||
15 | ggc | 157 | gaa | ||||
5 | cta | 9 | acg | ||||
41 | aaa | 11 | tac | ||||
8 | aca | 6 | caa | ||||
** | gta | ** | aaa | ||||
- |
Lactobacillus amylovorus strain 30SC[modifier | modifier le wikicode]
lam opérons[modifier | modifier le wikicode]
- Liens: gtRNAdb [9], NCBI [10]
- Lien tableur: lam
- Légende:
- -cds1, hp 186: hypothetical protein, 186 pb, MESRNTKRSIQSKRKHTEKLCLVLRVVPQGVSTLKTEYNPSKKPRQSKRTDCRATEKRILE
- -cds2, hp 186: hypothetical protein, 186 pb, MESRNTKRSIQSKRKHTEKLCLVLRVVPQRVSTLKTEYNPSKKPRQSKRTDCRATEKRILE
38%GC | 30.6.19 Paris | 63 | doubles | intercal |
---|---|---|---|---|
447399..448972 | 16s | @1 | 125 | |
449098..449172 | atc | 52 | ||
449225..449297 | gca | 115 | ||
449413..452324 | 23s | 68 | ||
452393..452509 | 5s | 4 | ||
452514..452586 | gta | 2 | ||
452589..452661 | aaa | 13 | ||
452675..452756 | cta | 23 | ||
452780..452852 | aca | 10 | ||
452863..452934 | ggc | 11 | ||
452946..453031 | tta | 8 | ||
453040..453113 | cgt | 5 | ||
453119..453192 | cca | 29 | ||
453222..453295 | atg | 12 | ||
453308..453381 | atgi | 27 | ||
453409..453482 | atgf | 3 | ||
453486..453559 | gac | 6 | ||
453566..453638 | ttc | 19 | ||
453658..453728 | gga | 5 | ||
453734..453808 | atc | 2 | ||
453811..453900 | agc | |||
57091..58664 | 16s | 125 | ||
58790..58864 | atc | 52 | ||
58917..58989 | gca | 115 | ||
59105..62016 | 23s | 68 | ||
62085..62201 | 5s | 13 | ||
62215..62287 | aac | |||
469566..471139 | 16s | @2 | 9 | |
471149..471334 | cds1 | hp 186 | -3 | |
471332..474243 | 23s | 68 | ||
474312..474428 | 5s | 13 | ||
474442..474514 | aac | |||
comp | 1709284..1709374 | tcc | 10 | |
comp | 1709385..1709457 | aac | 13 | |
comp | 1709471..1709587 | 5s | 68 | |
comp | 1709656..1712567 | 23s | -3 | |
comp | 1712565..1712750 | cds2 | hp 186 | 9 |
comp | 1712760..1714333 | 16s | ||
comp | 79386..79458 | aag | ||
comp | 79913..79985 | aag | ||
193922..193994 | acc | |||
comp | 210866..210939 | ggg | ||
287678..287752 | ggc | + | 111 | |
287864..287938 | ggc | 3 ggc | 109 | |
288048..288122 | ggc | 35 | ||
288158..288231 | ccg | |||
457611..457682 | gaa | 35 | ||
457718..457804 | tca | 9 | ||
457814..457887 | atgf | 3 | ||
457891..457964 | gac | 6 | ||
457971..458046 | ttc | 4 | ||
458051..458132 | tac | 4 | ||
458137..458207 | tgg | 12 | ||
458220..458295 | cac | 4 | ||
458300..458371 | caa | 23 | ||
458395..458465 | tgc | 40 | ||
458506..458590 | ttg | |||
474442..474514 | aac | |||
507688..507760 | acg | |||
526886..526957 | caa | |||
551550..551631 | tac | 34 | ||
551666..551737 | caa | |||
567329..567416 | ctt | |||
583327..583413 | tca | 6 | ||
583420..583493 | gac | 7 | ||
583501..583576 | cac | 4 | ||
583581..583653 | gta | |||
642034..642106 | agg | |||
comp | 729370..729441 | cgg | ||
784793..784864 | gag | |||
917887..917975 | tcg | |||
1456724..1456800 | aga | |||
1681218..1681301 | ctg | |||
comp | 1707998..1708070 | gta | 5 | |
comp | 1708076..1708147 | gaa | ||
1987190..1987263 | cgt | 8 | ||
1987272..1987345 | cca |
lam cumuls[modifier | modifier le wikicode]
- Note: Les statistiques sur les intercalaires entre tRNA ne sont pas correctes. Se reporter à intergen51.lam. Il n'y a aucun commentaire sur les CDS. J'ai réduit le tableau aux clusters à rRNA. L'intitulé opéron doit d'être compris dans le sens cluster ou bloc de RNA, rRNA ou tRNA.
lam cumuls opérons effectif avec rRNA opérons 4 16 23 5s 0 0 16 atc gca 2 16 23 5s a 0 max a 18 a doubles 0 spéciaux 2 total aas 24 sans opérons 20 1 aa 14 max a 11 a doubles 1 total aas 39 total aas 63 remarques 2
lam blocs[modifier | modifier le wikicode]
- Lien tableur: lam blocs
16s | 125 | 1574 | 16s | 9 | 1574 |
atc | 52 | cds1 | -3 | 62 | |
gca | 115 | 23s | 68 | 2912 | |
23s | 68 | 2912 | 5s | 13 | 117 |
5s | 4 | 117 | aac | ||
gta | |||||
16s | 125 | 1574 | 16s | 9 | 1574 |
atc | 52 | cds2 | -3 | 62 | |
gca | 115 | 23s | 68 | 2912 | |
23s | 68 | 2912 | 5s | 13 | 117 |
5s | 13 | 117 | aac | ||
aac |
lam remarques[modifier | modifier le wikicode]
*Remarques : pratiquement pas de doublons, 1 seul triplet dans 1 opéron sur 11. - Que des blocs de type 16-atcgca, il y en a 4. @1 Les 2 blocs 16-atcgca sont standard comme dans bsu et lmo (ref.. - Ils ont les mêmes intercalaires du début, 125 52 115 68 13. - un opéron avec 1 aa en plus, aac comme dans bsu-lmo. - un opéron à 18 aas plus grand que celui de lmo avec 16. @2 Les 2 blocs 16s-protéine-23s-5s. Ressemblance avec EFTU. - très petite protéine, 62 aas. - Dans les 2 cas les intercalaires sont les mêmes, 9 -3 68 13 - Notez le -3 pour le stop. - les intercalaires 25s-5s-aac sont à peu près les mêmes que les Blocs 16 atc gca 23-5s-aa, 68 13. contrôle du 3.10.20: les 2 cds ont disparus dans NCBI du 31.7.2020. Séquences des doubles : pratiquement pas de doublons, 1 seul triplet dans 1 opéron sur 11 opérons à plus de 2 aas.
lam distribution[modifier | modifier le wikicode]
- Lien tableur: lam distribution
- Notes:
- - Les 1-3aas après 5s, +5s, sont soulignés: 3 aac et tcc.
- - duplicata: ggc3
|
|
lam. Intergen51[modifier | modifier le wikicode]
Intergen51. lam. Le génome[modifier | modifier le wikicode]
- lam Le prélèvement: Abacilli
- Le nom et le lien NCBI: lam, Lactobacillus amylovorus, NCBI [11], date 6.3.22.
- lam La longueur totale des intercalaires, longueur du génome et taux intercalaires/génome:
Nom intercals génome taux en % lam 210,907 2,078,001 10.1
lam données intercalaires[modifier | modifier le wikicode]
- Lien tableur: lam données intercalaires
- Lien sauvegarde NCBI: Abacilli
lam autres intercalaires aas[modifier | modifier le wikicode]
- Lien tableur: lam autres intercalaires aas
- Lien sauvegarde NCBI: Abacilli
Intergen51. lam. Les différents types d'intercalaires[modifier | modifier le wikicode]
- Lien au tableur: Intergen51. lam les différents types d'intercalaires.
- Légende:
- - S pour intercalaire CDS-CDS et R pour tRNA-CDS,
- - c pour intercalaire continu (les 2 gènes sont sur le même brin) et x pour discontinu (les 2 gènes sont sur 2 brins différents, le brin et son complément)
- - %reste = 100*reste/total, le reste étant ce qui reste du total après la fin du diagramme, gamme.
- - %t30 = 100*t30/total, t30 étant le total des fréquences 10 20 30
- - %t5 = 100*t/total, t5 étant le total des fréquences de -1 à -5 dans le diagramme des S-.
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
Intergen51. lam. Les diagrammes CDS-CDS positifs[modifier | modifier le wikicode]
- Lien tableur: Les diagrammes
- Diagrammes des gamma: lam présente 2 diagrammes
- - fc40, CDS-CDS continu, fréquence unitaire en abscisses et effectif en ordonnées
- - fx%, CDS-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et pourcentage en ‰ par rapport au total, en ordonnées.
- Équations des courbes de tendance en pour 1000: colonnes %fx %fc
Courbes de tendances pour les diagrammes en pour 1000 Calculs des f.41 lam R2 x3 x2 x c Inflexion poly3 x c 0.608 4.90E-06 -3.13E-03 4.29E-01 26.70 fx1 abscisse 295.7 -166.3 0.769 -6.64E-06 5.24E-03 -1.36E+00 123.0 fc1 ordonnée 11.2 116.8 0.835 -2.66E-06 2.36E-03 -7.69E-01 101.0 fx41 0.875 4.43E-07 2.21E-04 -3.02E-01 62.5 fc41
Intergen51. lam. Les CDS-CDS négatifs[modifier | modifier le wikicode]
Sous-totaux lam totale fréquence x- c- x- c- - 1 0 96 4 4140 - 2 0 0 85 11 - 3 0 0 3 12 - 4 8 49 717 10938 - 5 0 0 5 19 sp6 7 127 1642 8424 total 15 272 2,456 23,544 reste 0 0 264 420 s6 0 0 361 41 s7 1 13 321 1438 s8 6 114 696 6525 rappot s1-5 4/2/1 - 0.5 8.4 2.6 % / sp6 s6/sp6 0.0 0.0 22.0 0.5 s7/sp6 14.3 10.2 19.5 17.1 s8/sp6 85.7 89.8 42.4 77.5 reste/sp6 0.0 0.0 16.1 5.0 total s1-5 8 145 814 15120 % / total %s1-5 53.3 53.3 33.1 64.2 %sp6 46.7 46.7 66.9 35.8
Intergen51. lam. Les intercalaires des blocs[modifier | modifier le wikicode]
- Le détail
RNA-RNA c x CDS-RNA c x 23s 5s 4 CDS 16s 2 2 16s 23s 2 5s CDS 16s tRNA 2 16 CDS tRNA 23s 2 CDS 5s 5s tRNA 4 23s CDS tRNA in 2 CDS 23s tRNA contig 16 5s 16s tRNA hors 19 16s16s tRNA 16s 23s tRNA tRNA 5s 16s 5s 5s 23s 5s 5s total 51 0 total 2 2
- Les rares voir gamma pour la longueur des intercalaires
- Les tRNA-CDS compris, comparaison dans le clade et dans l'étude.
Intergen51. lam. Les intercalaires tRNA-tRNA extra bloc[modifier | modifier le wikicode]
- Lien tableur: Intergen51. lam. Les intercalaires tRNA-tRNA extra bloc
cont | hors | hors | |||||
---|---|---|---|---|---|---|---|
inter | aa | inter | aa | inter | aa | ||
2 | gta | 111 | ggc | 34 | tac | ||
13 | aaa | 112 | ggc | ** | caa | ||
23 | cta | 35 | ggc | 6 | tca | ||
10 | aca | ** | ccg | 7 | gac | ||
11 | ggc | 35 | gaa | 4 | cac | ||
8 | tta | 9 | tca | ** | gta | ||
5 | cgt | 3 | atgf | 5 | gta | ||
29 | cca | 6 | gac | ** | gaa | ||
12 | atgj | 7 | ttc | 8 | cgt | ||
27 | atgi | 4 | tac | ** | cca | ||
3 | atgf | 12 | tgg | ||||
6 | gac | 7 | cac | ||||
19 | ttc | 23 | caa | ||||
5 | gga | 40 | tgc | ||||
2 | atc | ** | ttg | ||||
** | agc | ||||||
10 | tcc | ||||||
** | aac | ||||||
- |
Paenibacillus polymyxa SC2[modifier | modifier le wikicode]
ppm opérons[modifier | modifier le wikicode]
ppm opérons chromosome[modifier | modifier le wikicode]
- Liens: gtRNAdb [12], NCBI [13]
- Lien tableur: ppm
- Légende: cdsa: cds aas, cdsj: cdsa sans jaune, cdsd: cdsa dirigé
45.5%GC | 26.7.19 Paris | 110 | doubles | intercal | cds | aa | avec aa | cdsa | cdsd |
---|---|---|---|---|---|---|---|---|---|
10545..11633 | CDS | 327 | 327 | 363 | |||||
11961..13519 | 16s | 280 | |||||||
13800..16728 | 23s | 143 | |||||||
16872..16988 | 5s | 232 | 232 | 232 | |||||
17221..17640 | CDS | 93 855 | 140 | ||||||
comp | 111496..112530 | CDS | 616 | 345 | |||||
113147..114705 | 16s | 207 | |||||||
114913..117843 | 23s | 76 | |||||||
117920..118036 | 5s | 343 | 343 | ||||||
118380..119837 | CDS | 3 348 | 486 | ||||||
123186..124469 | CDS | 90 | 90 | 428 | 90 | ||||
124560..124648 | tca | 145 | 145 | ||||||
124794..125135 | CDS | 55 592 | 114 | ||||||
180728..181003 | CDS | 412 | 92 | ||||||
181416..182974 | 16s | 108 | |||||||
183083..183199 | 5s | @1 | 39 | ||||||
183239..183315 | atc | 20 | 20 | ||||||
183336..183411 | gca | 128 | |||||||
183540..186468 | 23s | 130 | |||||||
186599..186690 | agc | 28 | 28 | ||||||
186719..186795 | atgj | 10 | 10 | ||||||
186806..186881 | gta | 4 | 4 | ||||||
186886..186961 | aca | 19 | 19 | ||||||
186981..187057 | gac | 77 | 77 | ||||||
187135..187210 | ttc | 6 | 6 | ||||||
187217..187302 | tac | 7 | 7 | ||||||
187310..187385 | aaa | 154 | 154 | 154 | |||||
187540..188682 | CDS | 24 062 | 381 | ||||||
comp | 212745..213341 | CDS | 211 | 211 | 199 | 211 | |||
comp | 213553..213624 | cgg | 259 | 259 | |||||
213884..214921 | CDS | 238 832 | 346 | ||||||
453754..455364 | CDS | 392 | 537 | ||||||
455757..457315 | 16s | 207 | |||||||
457523..460453 | 23s | 76 | |||||||
460530..460646 | 5s | 34 | |||||||
460681..460757 | atc | 22 | 22 | ||||||
460780..460855 | gca | 4 | 4 | ||||||
460860..460935 | aac | 34 | 34 | ||||||
460970..461043 | atgj | 3 | 3 | ||||||
461047..461138 | agc | 31 | 31 | ||||||
461170..461241 | gaa | 6 | 6 | ||||||
461248..461323 | gta | 10 | 10 | ||||||
461334..461407 | atgf | 25 | 25 | ||||||
461433..461509 | gac | 50 | 50 | ||||||
461560..461635 | ttc | 22 | 22 | ||||||
461658..461733 | aca | 5 | 5 | ||||||
461739..461824 | tac | 16 | 16 | ||||||
461841..461913 | cac | 18 | 18 | ||||||
461932..462006 | caa | 4 | 4 | ||||||
462011..462086 | aaa | 15 | 15 | ||||||
462102..462189 | ctg | 6 | 6 | ||||||
462196..462270 | ggc | 10 | 10 | ||||||
462281..462351 | tgc | 26 | 26 | ||||||
462378..462454 | cgt | 22 | 22 | ||||||
462477..462550 | cca | 9 | 9 | ||||||
462560..462630 | gga | 204 | 204 | 204 | |||||
comp | 462835..463938 | CDS | 1 537 | 368 | |||||
465476..466216 | CDS | 524 | 247 | ||||||
466741..468299 | 16s | 207 | |||||||
468507..471434 | 23s | 76 | |||||||
471511..471627 | 5s | 629 | |||||||
472257..473588 | CDS | 103 459 | 444 | ||||||
577048..577794 | CDS | 1 116 | 249 | ||||||
578911..580469 | 16s | 207 | |||||||
580677..583607 | 23s | 76 | |||||||
583684..583800 | 5s | 82 | |||||||
583883..583958 | gca | 4 | 4 | ||||||
583963..584038 | aac | 3 | 3 | ||||||
584042..584133 | tcc | 19 | 19 | ||||||
584153..584224 | gaa | 9 | 9 | ||||||
584234..584309 | gta | 29 | 29 | ||||||
584339..584412 | atgf | 25 | 25 | ||||||
584438..584514 | gac | 13 | 13 | ||||||
584528..584603 | aca | 4 | 4 | ||||||
584608..584693 | tac | 102 | 102 | ||||||
584796..584870 | caa | 4 | 4 | ||||||
584875..584950 | aaa | 12 | 12 | ||||||
584963..585043 | cta | 10 | 10 | ||||||
585054..585128 | ggc | 5 | 5 | ||||||
585134..585210 | cgt | 12 | 12 | ||||||
585223..585302 | ttg | 7 | 7 | ||||||
585310..585386 | cca | 7 | 7 | ||||||
585394..585464 | gga | 1 133 | |||||||
586598..587560 | CDS | 22 016 | 321 | ||||||
609577..609924 | CDS | 73 | 73 | 116 | 73 | ||||
609998..610069 | acg | 1 613 | |||||||
comp | 611683..612030 | CDS | 140 810 | 116 | |||||
752841..754124 | CDS | 611 | 428 | ||||||
754736..756294 | 16s | 208 | |||||||
756503..759431 | 23s | 75 | |||||||
759507..759623 | 5s | 183 | 183 | 183 | |||||
comp | 759807..760232 | CDS | 173 078 | 142 | |||||
933311..934681 | CDS | 449 | 457 | ||||||
935131..936689 | 16s | 221 | |||||||
936911..939839 | 23s | 76 | |||||||
939916..940032 | 5s | 216 | 216 | 216 | |||||
940249..941241 | CDS | 521 183 | 331 | ||||||
1462425..1462937 | CDS | 44 | 44 | 171 | 44 | ||||
1462982..1463057 | aac | 1 | 1 | ||||||
1463059..1463147 | agc | 122 | 122 | ||||||
comp | 1463270..1464145 | CDS | 74 | 292 | |||||
comp | 1464220..1464981 | CDS | 246 | 246 | 254 | ||||
1465228..1465299 | gaa | 86 | 86 | ||||||
1465386..1465461 | aaa | 15 | 15 | ||||||
1465477..1465562 | ctc | 162 | 162 | 162 | |||||
1465725..1466180 | CDS | 1 667 | 152 | ||||||
comp | 1467848..1468585 | CDS | 262 | 262 | 246 | ||||
1468848..1468930 | ctc | 148 | 148 | 148 | |||||
comp | 1469079..1469564 | CDS | 112 990 | 162 | |||||
1582555..1583361 | CDS | 490 | 269 | ||||||
1583852..1583925 | ccc | 244 | 244 | ||||||
comp | 1584170..1585441 | CDS | 32 099 | 424 | |||||
1617541..1619682 | CDS | 107 | 107 | 714 | 107 | ||||
1619790..1619860 | gga | 265 | 265 | ||||||
1620126..1621163 | CDS | 254 529 | 346 | ||||||
1875693..1876160 | CDS | 129 | 129 | 156 | 129 | ||||
1876290..1876365 | gcc | 11 | 11 | ||||||
1876377..1876449 | aag | 520 | |||||||
comp | 1876970..1877974 | CDS | 55 215 | 335 | |||||
comp | 1933190..1933630 | CDS | 381 | 147 | |||||
1934012..1934096 | ctg | 91 | 91 | 91 | |||||
comp | 1934188..1934718 | CDS | 74 847 | 177 | |||||
comp | 2009566..2010102 | CDS | 222 | 222 | 179 | ||||
2010325..2010409 | ctg | 213 | 213 | ||||||
2010623..2011135 | CDS | 432 608 | 171 | ||||||
2443744..2448333 | CDS | 540 | 1530 | ||||||
2448874..2450432 | 16s | 400 | |||||||
2450833..2453761 | 23s | 143 | |||||||
2453905..2454021 | 5s | 236 | 236 | 236 | |||||
comp | 2454258..2455367 | CDS | 186 804 | 370 | |||||
2642172..2643329 | CDS | 426 | 386 | ||||||
2643756..2645314 | 16s | 343 | |||||||
2645658..2648586 | 23s | 144 | |||||||
2648731..2648847 | 5s | 156 | 156 | 156 | |||||
2649004..2649228 | CDS | 884 577 | 75 | ||||||
comp | 3533806..3534249 | CDS | 139 | 139 | 148 | 139 | |||
3534389..3534460 | gtc | 279 | 279 | ||||||
comp | 3534740..3535069 | CDS | 103 837 | 110 | |||||
3638907..3639338 | CDS | 728 | 144 | ||||||
comp | 3640067..3640152 | tta | 249 | 249 | 249 | ||||
3640402..3640560 | CDS | 28 092 | 53 | ||||||
3668653..3669450 | CDS | 247 | 247 | 266 | |||||
comp | 3669698..3669766 | atg | 267 | 267 | |||||
comp | 3670034..3670234 | CDS | 54 456 | 67 | |||||
3724691..3725086 | CDS | 122 | 122 | 132 | 122 | ||||
comp | 3725209..3725282 | atgi | 435 | ||||||
comp | 3725718..3726359 | CDS | 612 148 | 214 | |||||
comp | 4338508..4339209 | CDS | 107 | 107 | 234 | 107 | |||
comp | 4339317..4339390 | cca | 7 | 7 | |||||
comp | 4339398..4339477 | ttg | 12 | 12 | |||||
comp | 4339490..4339566 | cgt | 5 | 5 | |||||
comp | 4339572..4339646 | ggc | 35 | 35 | |||||
comp | 4339682..4339757 | aaa | 28 | 28 | |||||
comp | 4339786..4339862 | gac | 26 | 26 | |||||
comp | 4339889..4339965 | atgf | 30 | 30 | |||||
comp | 4339996..4340071 | gta | 9 | 9 | |||||
comp | 4340081..4340152 | gaa | 17 | 17 | |||||
comp | 4340170..4340261 | tcc | 3 | 3 | |||||
comp | 4340265..4340340 | aac | 18 | ||||||
comp | 4340359..4340475 | 5s | 76 | ||||||
comp | 4340552..4343482 | 23s | 400 | ||||||
comp | 4343883..4345441 | 16s | 493 | ||||||
comp | 4345935..4347563 | CDS | 46 596 | 543 | |||||
comp | 4394160..4395092 | CDS | 238 | 238 | 311 | ||||
4395331..4395404 | aga | 214 | 214 | ||||||
4395619..4396383 | CDS | 49 894 | 255 | ||||||
4446278..4447621 | CDS | 207 | 207 | 448 | |||||
comp | 4447829..4447902 | aga | 174 | 174 | |||||
4448077..4448370 | CDS | 256 556 | 98 | ||||||
4704927..4705187 | CDS | 361 | 87 | ||||||
comp | 4705549..4705627 | ttg | 11 | 11 | |||||
comp | 4705639..4705713 | tgc | 11 | 11 | |||||
comp | 4705725..4705796 | ggc | 6 | 6 | |||||
comp | 4705803..4705877 | caa | 9 | 9 | |||||
comp | 4705887..4705959 | cac | 17 | 17 | |||||
comp | 4705977..4706050 | tgg | 7 | 7 | |||||
comp | 4706058..4706143 | tac | 4 | 4 | |||||
comp | 4706148..4706223 | aca | 22 | 22 | |||||
comp | 4706246..4706318 | ttc | 35 | 35 | |||||
comp | 4706354..4706430 | gac | 15 | 15 | |||||
comp | 4706446..4706522 | atgf | 25 | 25 | |||||
comp | 4706548..4706623 | gta | 58 | 58 | |||||
comp | 4706682..4706753 | gaa | 17 | 17 | |||||
comp | 4706771..4706862 | tcc | 3 | 3 | |||||
comp | 4706866..4706941 | aac | 326 | 326 | |||||
comp | 4707268..4707597 | CDS | 279 544 | 110 | |||||
comp | 4987142..4989934 | CDS | 726 | 931 | |||||
comp | 4990661..4990731 | gga | 9 | 9 | |||||
comp | 4990741..4990814 | cca | 22 | 22 | |||||
comp | 4990837..4990913 | cgt | 5 | 5 | |||||
comp | 4990919..4990993 | ggc | 10 | 10 | |||||
comp | 4991004..4991084 | cta | 11 | 11 | |||||
comp | 4991096..4991171 | aaa | 4 | 4 | |||||
comp | 4991176..4991250 | caa | 55 | 55 | |||||
comp | 4991306..4991381 | gta | 11 | 11 | |||||
comp | 4991393..4991464 | gaa | 11 | 11 | |||||
comp | 4991476..4991548 | acc | 3 | 3 | |||||
comp | 4991552..4991627 | aac | 18 | ||||||
comp | 4991646..4991762 | 5s | 76 | ||||||
comp | 4991839..4994768 | 23s | 129 | ||||||
comp | 4994898..4994973 | gca | 20 | 20 | |||||
comp | 4994994..4995070 | atc | 38 | ||||||
comp | 4995109..4995225 | 5s | 93 | ||||||
comp | 4995319..4996877 | 16s | 367 | ||||||
comp | 4997245..4997475 | CDS | 60 140 | 77 | |||||
comp | 5057616..5058803 | CDS | 163 | 163 | 396 | 163 | |||
comp | 5058967..5059083 | 5s | 76 | ||||||
comp | 5059160..5062089 | 23s | 185 | ||||||
comp | 5062275..5062350 | gca | 89 | ||||||
comp | 5062440..5063998 | 16s | 380 | ||||||
comp | 5064379..5066394 | CDS | 647 899 | 672 | |||||
5714294..5714611 | CDS | 206 | 206 | 106 | |||||
comp | 5714818..5714908 | tcg | 77 | 77 | 77 | ||||
comp | 5714986..5715210 | CDS | 75 |
ppm opérons plasmide[modifier | modifier le wikicode]
- Liens: gtRNAdb [14], NCBI [15]
- Lien tableur: ppm
- Légende: cdsa: cds aas, cdsj: cdsa sans jaune, cdsd: cdsa dirigé
|
|
ppm cumuls[modifier | modifier le wikicode]
- Lien tableur: ppm cumuls
Chromosome[modifier | modifier le wikicode]
- Légende: cdsa: cds aas, cdsj: cdsa sans jaune, cdsd: cdsa dirigé
Opérons | Fréquences intercalaires | Fréquences aas cds | ||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|
effectifs | gammes | sans rRNAs | avec rRNAs | gammes | cds | gammes | cdsa | cdsj | gammes | cdsd | ||
avec rRNA | opérons | 13 | 1 | 1 | 0 | 1 | 0 | 100 | 8 | 5 | 40 | 0 |
16 23 5s 0 | 7 | 20 | 12 | 46 | 50 | 1 | 200 | 20 | 17 | 60 | 1 | |
16 5 atc gca | 2 | 40 | 3 | 15 | 100 | 4 | 300 | 10 | 6 | 80 | 2 | |
16 23 5s a | 3 | 60 | 1 | 2 | 150 | 8 | 400 | 13 | 9 | 100 | 2 | |
max a | 21 | 80 | 0 | 1 | 200 | 6 | 500 | 7 | 4 | 120 | 2 | |
a doubles | 0 | 100 | 1 | 0 | 250 | 15 | 600 | 2 | 0 | 140 | 3 | |
16 gca 23 5s | 1 | 120 | 0 | 1 | 300 | 5 | 700 | 1 | 0 | 160 | 3 | |
total aas | 73 | 140 | 0 | 0 | 350 | 3 | 800 | 1 | 1 | 180 | 2 | |
sans | opérons | 19 | 160 | 0 | 0 | 400 | 5 | 900 | 0 | 0 | 200 | 1 |
1 aa | 15 | 180 | 0 | 0 | 450 | 4 | 1000 | 1 | 0 | 220 | 3 | |
max a | 15 | 200 | 0 | 0 | 500 | 2 | 1100 | 0 | 0 | 240 | 2 | |
a doubles | 0 | 0 | 0 | 11 | 1 | 0 | 1 | |||||
total aas | 37 | 18 | 65 | 64 | 64 | 42 | 22 | |||||
total aas | 110 | moyenne | 20 | 17 | 193 | 292 | 229 | 150 | ||||
remarques | 1 | variance | 21 | 17 | 73 | 234 | 123 | 58 | ||||
jaune | sans | sans |
Plasmide[modifier | modifier le wikicode]
- Légende: cdsa: cds aas, cdsj: cdsa sans jaune, cdsd: cdsa dirigé
Opérons | Fréquences intercalaires | Fréquences aas cds | ||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|
effectifs | gammes | sans rRNAs | avec rRNAs | gammes | cds | gammes | cdsa | cdsj | gammes | cdsd | ||
avec rRNA | opérons | 0 | 1 | 0 | 1 | 1 | 60 | 0 | 40 | 4 | ||
16 23 5s 0 | 20 | 33 | 50 | 4 | 80 | 4 | 60 | 0 | ||||
16 5 atc gca | 40 | 1 | 100 | 4 | 100 | 5 | 80 | 1 | ||||
16 23 5s a | 60 | 1 | 150 | 3 | 120 | 2 | 100 | 1 | ||||
max a | 80 | 1 | 200 | 1 | 140 | 1 | 120 | 1 | ||||
a doubles | 100 | 1 | 250 | 2 | 160 | 2 | 140 | 0 | ||||
16 gca 23 5s | 120 | 2 | 300 | 2 | 180 | 1 | 160 | 0 | ||||
total aas | 140 | 2 | 350 | 0 | 200 | 0 | 180 | 1 | ||||
sans | opérons | 10 | 160 | 0 | 400 | 0 | 220 | 1 | 200 | 0 | ||
1 aa | 6 | 180 | 0 | 450 | 1 | 240 | 0 | 220 | 0 | |||
max a | 32 | 200 | 0 | 500 | 0 | 260 | 0 | 240 | 0 | |||
a doubles | 2 | 0 | 2 | 1 | 1 | |||||||
total aas | 51 | 41 | 20 | 17 | 9 | |||||||
total aas | 51 | moyenne | 6 | 126 | 102 | 89 | ||||||
remarques | 3 | variance | 3 | 92 | 32 | 77 | ||||||
jaune | sans | sans | sans |
ppm tRNA-cds[modifier | modifier le wikicode]
- Note: intercalaires prélevés de la colonne cds de ppm opérons dans un bloc de tRNAs uniquement. Le début du bloc est dans l'ordre des adresses, deb intercalaire entre le cds et le 1er tRNA dd bloc, fin entre le dernier tRNA et le cds terminal. J'ai procédé, dans les colonnes petit et grand, à la réorientation des blocs d'après la constatation que les blocs à rRNA ont leurs cds de début et de fin sont orientés du cds-16s au 5s-tRNAs-cds, l'intercalaire cds-16s étant plus grands que l'intercalaire avec le cds terminal. En tête de colonne est le % du nombre des intercalaires inférieurs à 201 pbs.
ppm 45 48 21 72 deb fin deb fin grand petit grand petit -24 100 116 18 100 35 100 -24 24 289 536 33 100 -24 116 18 44 122 100 35 103 94 289 24 73 1613 293 72 116 18 536 33 90 145 206 77 122 44 100 35 94 103 381 91 145 90 122 44 100 35 -24 100 206 77 293 72 107 265 94 103 207 174 1613 73 116 18 226 119 222 213 206 77 122 435 44 122 226 119 145 90 129 520 90 145 238 214 381 91 139 279 262 148 246 162 103 94 161 977 246 162 259 211 265 107 206 77 207 174 262 148 226 119 207 174 222 213 265 107 435 122 211 259 238 214 267 247 520 129 222 213 490 244 279 139 279 139 226 119 444 248 289 24 262 148 238 214 728 249 293 72 977 161 246 162 211 259 361 326 246 162 247 267 107 265 381 91 207 174 262 148 247 267 435 122 259 211 293 72 139 279 444 248 222 213 361 326 24 289 490 244 238 214 381 91 361 326 520 129 490 244 444 248 122 435 536 33 267 247 490 244 129 520 728 249 444 248 536 33 161 977 977 161 728 249 728 249 73 1613 1613 73 361 326
- Comparaison cds-cds tRNA-cds: deb fin, c'est l'ordre des adresses et grand petit l'ordre après réorientation. Leur pourcentage est calculé par rapport à la colonne, c'est à dire la moitié du total des tRNA-cds.
bacilli cds total total <0 0-200 201-370 371-600 >600 deb fin grand petit ppm 5,384 58 1 26 22 6 3 12 14 6 20 ppm ‰ 17 448 379 103 52 414 483 207 690
ppm blocs[modifier | modifier le wikicode]
- Lien tableur: ppm blocs
cds | 392 | cds | 1116 | cds | 493 | ||
16s | 207 | 16s | 207 | 16s | 400 | ||
23s | 76 | 23s | 76 | 23s | 76 | ||
5s | 34 | 5s | 82 | 5s | 18 | ||
atc | 22 | gca | 4 | aac | 3 | ||
19aas | * | 15aas | * | 9aas | * | ||
gga | 204’ | gga | 1133 | cca | 107 | ||
cds | cds | cds | |||||
cds | 367 | cds | 412 | cds | 380 | ||
16s | 93 | 16s | 108 | 16s | 89 | ||
5s | 38 | 5s | 39 | gca | 185 | ||
atc | 20 | atc | 20 | 23s | 76 | ||
gca | 129 | gca | 128 | 5s | 163 | ||
23s | 76 | 23s | 130 | cds | |||
5s | 18 | agc | 28 | ||||
aac | 3 | 6aas | * | ||||
9aas | * | aaa | 154 | ||||
gga | 726 | cds | |||||
cds | |||||||
cds | 327 | 616’ | 524 | 611 | 449 | 540 | 426 |
16s | 280 | 207 | 207 | 208 | 221 | 400 | 343 |
23s | 143 | 76 | 76 | 75 | 76 | 143 | 144 |
5s | 232 | 343 | 629 | 183’ | 216 | 236’ | 156 |
cds | |||||||
5s | constant | 39 aas | 117 pbs |
ppm remarques[modifier | modifier le wikicode]
ppm chromosome[modifier | modifier le wikicode]
tRNAs 21 17 11 16s 207 207 400 23s 76 76 76 5s 34 82 18 tRNAs 13 - - 10 16s 93 16s 108 16s 89 5s 38 5s 39 gca 185 atc 20 atc 20 23s 76 gca 129 gca 128 5s 23s 76 23s 130 5s 18 16s 280 207 207 208 221 400 343 23s 143 76 76 75 76 143 144 5s 5s constant 39 aas 117 pb *Remarques :Il n’y a pas de doublons dans les 13 blocs à rRNA, ni dans les blocs sans rRNA. - La majorité des tRNAs se trouvent dans les clusters à rRNA 73 contre 37. - Les blocs 16s23s5s sont majoritaires , 10 sur 13, dont 7 ne portent pas de tRNAs. - Les intercalaires 16s-23s sont quasiment identiques pour 7 blocs/10 les 3 autres sont doubles. - Les intercalaires 23s-5s sont aussi quasiment identiques pour 10/12 les autres sont doubles. - Les 2 intercalaires 16s-5s sont moitié de ceux de23s-5s. - Voir la liste ci-dessus pour les intercalaires et le nombre de tRNAs. @1 - Le bloc 16s5s-atcgca-23s-10aas a son 5s anormalement positionné, pas après 23s mais après 16s. Certains génomes (ref.) n’ont que que ce type. -Le bloc 16s5s-atcgca-23s5s-13aas porte les 2 types de position alors que en général un bloc à 2 5s est du type 16s23s5s5s, avec les 2 5s du même côté du 23s. Séquences des doubles : Il n’y a pas de doublons dans les 13 blocs à rRNA, ni dans les blocs sans rRNA.
ppm plasmide[modifier | modifier le wikicode]
Plasmide 24.10.19 Tanger *Remarques : - Il n'y a pas de cluster avec des gènes rRNAs, mais il existe au moins un plasmide avec ce type de cluster (ref.) chez les bactéries. - 46 gènes de tRNA sur 49 sont regroupés en 11 152 pb pour une longueur de plasmide de 510 118. Soit 2 % seulement de la taille du plasmide. - Ces 46 gènes sont répartis en 4 clusters dont le principal avec 39 gènes contient 2 cds entourés chacun par 2 tRNAs. Les 3 autres ne contiennent pas de cds à l’intérieur . Les 3 1ers clusters sont contigus et entre le 3ème et le 4ème existe un seul cds particulier de 83 aas, trans-rg, transcription regulator. Il est précédé d’une transcriptase reverse, rev-trans, de154 aas. - Particularité du cluster principal: régularité qui n'existe pas chez les clusters du chromosome. + dans le chromosome les intercalaires des clusters avec ou sans rRNA, moyenne et variance sont égales et du même ordre que la moyenne du cluster principal, à peu près 20, alors que sa variance est quasiment double, 36 pb. + 33 des intercalaires faibles du plasmide ont 6 et 3 pour respectivement moyenne et variance + Les intercalaires élevés sont répartis régulièrement et sont du même ordre que ceux entre tRNA-cds. Voir la liste ci-dessous où les intercalaires avec cds sont signalés en gras. - Les intercalaires entre les cds d'encadrement des 4 clusters sont aussi du même ordre que ceux à l'intérieur du cluster principal. Cette similitude et la contiguité entre les cds militent pour le regroupent de ces 4 clusters. - Les 3 derniers tRNAs du plasmide, aux adresses élevées, ne semblent pas former un groupe de clusters : Chaque tRNA est, à peu près, aussi proche d’un cds d’encadrement que dans le cluster principal (248 24 161), mais il est très éloigné de l’autre cds d’encadrement (444 783 977). De même la distance entre les cds est très élevées, 1401. - Si l'on considère le groupe des 4 clusters à 46 gènes de tRNA comme encadré par 2 cds, les intercalaires proches et éloignés équivalents respectivement à ceux des 3 tRNA à adresses élevées, sont du même ordre, 109 et 536. Et dans ce groupe la distance entre 2 cds contigus reste largement inférieure aux 1401 des gènes à adresses élevées, 442 qui est une exception par la fonction régulatrice d’un des 2 cds de l’intercalaire, « cds trans-rg », alors que les autres intercalaires sont inférieurs à 216. - Dans la série de 31 gènes il y a très peu de doublons comme le chromosome: Ils sont signalés par le signe +. Mais ils ne présentent pas de séries de gènes identiques ou de répétitions de séquences comme dans d’autres génomes, (ref.) à part la séquence cca-tgg répétée 2 fois. Sinon les doublons sont séparés par de nombreux autres gènes. Si l’on compare par rapport aux séries longues des clusters avec rRNA du chromosome, 21 aas, ou sans rRNA, 15 aas, les 31 aas de la série du plasmide, de part sa longueur et le nombre limité de type de gènes (ceux se terminant par a et c) candidats à la création dans le cluster, il est normal qu’il y ait des doublons. D’autant plus que la série fait appel à des gènes rares, ctt ata tat. Donc le plasmide ne déroge pas à l’absence des doublons du génome en entier. - @1,2 aas rares, acg et ctt, ou très rares, tat et ata. - @3 regroupement de 5 gènes de tRNA longs dont 4 Ser, 3 rares et un doublets de rares. Alors qu’aucun gène de ser n’est présent dans la série de 31 gènes. - @4 l’intercalaire négatif élevé entre le cds (124aas) et le gène de gac illustre bien l’intégration des cds du groupe des 4 clusters au processus de création de gènes. entre aas et cds du cluster principal 1-2 cds 536 2-3 tgc 63 5-6 cca 101 10-11 gac 125 18-19 tgg 131 20-21 ggc 55 21-22 ttc 22 27-28 gca 109 31-32 tgg 33 33-34 cds -24 35-36 tac 86 39-40 acg 100 40-41 cds 89 42-43 aca 35 entre cds de clusters cl1-cl2 150 cl2-cl3 216 cl3-trans rg 195 trans rg-cl4 442
ppm distribution[modifier | modifier le wikicode]
- Lien tableur: ppm distribution
|
|
|
ppm. Intergen51[modifier | modifier le wikicode]
Intergen51. ppm. Le génome[modifier | modifier le wikicode]
- ppm Le prélèvement: Abacilli
- Le nom et le lien NCBI: ppm, Paenibacillus polymyxa SC2, NCBI [16], date 10.11.21.
- ppm La longueur totale des intercalaires, longueur du génome et taux intercalaires/génome:
Nom intercals génome taux en % ppm 791,310 5,728,392 13.8
ppm données intercalaires[modifier | modifier le wikicode]
- Lien tableur: ppm données intercalaires
- Lien sauvegarde NCBI: Abacilli
ppm autres intercalaires aas[modifier | modifier le wikicode]
- Lien tableur: ppm autres intercalaires aas
- Lien sauvegarde NCBI: Abacilli
Intergen51. ppm. Les différents types d'intercalaires[modifier | modifier le wikicode]
- Lien au tableur: Intergen51. ppm les différents types d'intercalaires.
- Légende:
- - S pour intercalaire CDS-CDS et R pour tRNA-CDS,
- - c pour intercalaire continu (les 2 gènes sont sur le même brin) et x pour discontinu (les 2 gènes sont sur 2 brins différents, le brin et son complément)
- - %reste = 100*reste/total, le reste étant ce qui reste du total après la fin du diagramme, gamme.
- - %t30 = 100*t30/total, t30 étant le total des fréquences 10 20 30
- - %t5 = 100*t/total, t5 étant le total des fréquences de -1 à -5 dans le diagramme des S-.
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
Intergen51. ppm. Les diagrammes CDS-CDS positifs[modifier | modifier le wikicode]
- Lien tableur: Les diagrammes
- Diagrammes des gamma: ppm présente 2 diagrammes
- - fc40, CDS-CDS continu, fréquence unitaire en abscisses et effectif en ordonnées
- - fx%, CDS-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et pourcentage en ‰ par rapport au total, en ordonnées.
- Équations des courbes de tendance en pour 1000: colonnes %fx %fc
Courbes de tendances pour les diagrammes en pour 1000 Calculs des f.41 ppm R2 x3 x2 x c Inflexion poly3 x c 0.802 4.30E-06 -3.28E-03 6.47E-01 -1.18 fx1 abscisse 251.3 201.3 0.917 -2.23E-06 1.78E-03 -5.37E-01 72.1 fc1 ordonnée 22.1 20.7 0.823 5.20E-06 -3.92E-03 7.79E-01 -8.61 fx41 0.956 1.25E-06 -7.55E-04 1.74E-02 37.6 fc41
Intergen51. ppm. Les CDS-CDS négatifs[modifier | modifier le wikicode]
Sous-totaux ppm totale fréquence x- c- x- c- - 1 0 59 4 4140 - 2 0 0 85 11 - 3 0 0 3 12 - 4 7 229 717 10938 - 5 0 0 5 19 sp6 22 235 1642 8424 total 29 523 2,456 23,544 reste 3 7 264 420 s6 4 1 361 41 s7 3 24 321 1438 s8 12 203 696 6525 rappot s1-5 4/2/1 - 3.9 8.4 2.6 % / sp6 s6/sp6 18.2 0.4 22.0 0.5 s7/sp6 13.6 10.2 19.5 17.1 s8/sp6 54.5 86.4 42.4 77.5 reste/sp6 13.6 3.0 16.1 5.0 total s1-5 7 288 814 15120 % / total %s1-5 24.1 55.1 33.1 64.2 %sp6 75.9 44.9 66.9 35.8
Intergen51. ppm. Les intercalaires des blocs[modifier | modifier le wikicode]
- Le détail
RNA-RNA c x CDS-RNA c x 23s 5s 12 CDS 16s 11 2 16s 23s 10 5s CDS 5 3 16s tRNA 1 16 CDS tRNA 23s 3 CDS 5s 5s tRNA 6 23s CDS tRNA in 2 CDS 23s tRNA contig 63 5s 16s tRNA hors 18 16s16s tRNA 16s 23s tRNA 1 tRNA 5s 16s 5s 2 5s 23s 5s 5s total 118 0 total 16 5
- Les rares voir gamma pour la longueur des intercalaires
- Les tRNA-CDS compris, comparaison dans le clade et dans l'étude.
Intergen51. ppm. Les intercalaires tRNA-tRNA extra bloc[modifier | modifier le wikicode]
- Lien tableur: Intergen51. ppm. Les intercalaires tRNA-tRNA extra bloc
- Note: le jaune ne signifie pas ici des doubles éclatés, mais la séquence en jaune du 1er cluster se retrouve éclatée dans le 2ème cluster.
cont1 | cont2 | cont3 | cont4 | hors | |||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
inter | aa | inter | aa | inter | aa | inter | aa | inter | aa | ||||
28 | agc | 22 | atc | 4 | gca | 7 | cca | 1 | aac | ||||
10 | atgj | 4 | gca | 3 | aac | 12 | ttg | ** | agc | ||||
4 | gta | 34 | aac | 19 | tcc | 5 | cgt | 86 | gaa | ||||
19 | aca | 3 | atgj | 9 | gaa | 38 | ggc | 15 | aaa | ||||
77 | gac | 31 | agc | 29 | gta | 28 | aaa | ** | ctc | ||||
9 | ttc | 6 | gaa | 25 | atgf | 26 | gac | 11 | gcc | ||||
7 | tac | 10 | gta | 13 | gac | 30 | atgf | ** | aag | ||||
** | aaa | 25 | atgf | 4 | aca | 9 | gta | 11 | ttg | ||||
50 | gac | 102 | tac | 17 | gaa | 11 | tgc | ||||||
25 | ttc | 4 | caa | 3 | tcc | 6 | ggc | ||||||
5 | aca | 12 | aaa | ** | aac | 9 | caa | ||||||
16 | tac | 10 | cta | 9 | gga | 17 | cac | ||||||
18 | cac | 5 | ggc | 22 | cca | 7 | tgg | ||||||
4 | caa | 12 | cgt | 5 | cgt | 4 | tac | ||||||
15 | aaa | 7 | ttg | 10 | ggc | 22 | aca | ||||||
6 | ctg | 7 | cca | 11 | cta | 35 | ttc | ||||||
10 | ggc | ** | gga | 4 | aaa | 15 | gac | ||||||
26 | tgc | 55 | caa | 25 | atgf | ||||||||
22 | cgt | 11 | gta | 58 | gta | ||||||||
9 | cca | 11 | gaa | 17 | gaa | ||||||||
** | gga | 3 | acc | 3 | tcc | ||||||||
** | aac | ** | aac | ||||||||||
- |
ppmp. Intergen51[modifier | modifier le wikicode]
Intergen51. ppmp. Le génome[modifier | modifier le wikicode]
- ppmp Le prélèvement: Abacilli
- Le nom et le lien NCBI: ppmp, Paenibacillus polymyxa SC2, plasmid pSC2., NCBI [17], date 10.11.21.
- ppmp La longueur totale des intercalaires, longueur du génome et taux intercalaires/génome:
Nom intercals génome taux en % ppmp 119,608 510,118 23.4
ppmp données intercalaires[modifier | modifier le wikicode]
- Lien tableur: ppmp données intercalaires
- Lien sauvegarde NCBI: Abacilli
ppmp autres intercalaires aas[modifier | modifier le wikicode]
- Lien tableur: ppmp autres intercalaires aas
- Lien sauvegarde NCBI: Abacilli
Intergen51. ppmp. Les différents types d'intercalaires[modifier | modifier le wikicode]
- Lien au tableur: Intergen51. ppmp les différents types d'intercalaires.
- Légende:
- - S pour intercalaire CDS-CDS et R pour tRNA-CDS,
- - c pour intercalaire continu (les 2 gènes sont sur le même brin) et x pour discontinu (les 2 gènes sont sur 2 brins différents, le brin et son complément)
- - %reste = 100*reste/total, le reste étant ce qui reste du total après la fin du diagramme, gamme.
- - %t30 = 100*t30/total, t30 étant le total des fréquences 10 20 30
- - %t5 = 100*t/total, t5 étant le total des fréquences de -1 à -5 dans le diagramme des S-.
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
Intergen51. ppmp. Les diagrammes CDS-CDS positifs[modifier | modifier le wikicode]
- Lien tableur: Les diagrammes
- Diagrammes des gamma: ppmp présente 2 diagrammes
- - fc40, CDS-CDS continu, fréquence unitaire en abscisses et effectif en ordonnées
- - fx%, CDS-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et pourcentage en ‰ par rapport au total, en ordonnées.
- Équations des courbes de tendance en pour 1000: colonnes %fx %fc
Courbes de tendances pour les diagrammes en pour 1000 Calculs des f.41 ppmp R2 x3 x2 x c Inflexion poly3 x c 0.257 2.11E-06 -1.88E-03 4.14E-01 2.61 fx1 abscisse 322.2 196.4 0.794 2.49E-08 1.91E-04 -1.99E-01 51.6 fc1 ordonnée 12.0 21.1 0.247 1.50E-06 -1.45E-03 3.25E-01 7.65 fx41 0.726 1.31E-06 -7.72E-04 2.02E-02 37.0 fc41
Intergen51. ppmp. Les CDS-CDS négatifs[modifier | modifier le wikicode]
Sous-totaux ppmp totale fréquence x- c- x- c- - 1 0 4 4 4140 - 2 0 0 85 11 - 3 0 0 3 12 - 4 0 11 717 10938 - 5 0 0 5 19 sp6 0 17 1642 8424 total 0 32 2,456 23,544 reste 0 2 264 420 s6 0 1 361 41 s7 0 2 321 1438 s8 0 12 696 6525 rappot s1-5 4/2/1 - 2.8 8.4 2.6 % / sp6 s6/sp6 - 5.9 22.0 0.5 s7/sp6 - 11.8 19.5 17.1 s8/sp6 - 70.6 42.4 77.5 reste/sp6 - 11.8 16.1 5.0 total s1-5 0 15 814 15120 % / total %s1-5 - 46.9 33.1 64.2 %sp6 - 53.1 66.9 35.8
Intergen51. ppmp. Les intercalaires des blocs[modifier | modifier le wikicode]
- Le détail
RNA-RNA c x CDS-RNA c x 23s 5s CDS 16s 16s 23s 5s CDS 16s tRNA 16 CDS tRNA 23s CDS 5s 5s tRNA 23s CDS tRNA in CDS 23s tRNA contig 36 5s 16s tRNA hors 5 16s16s tRNA 16s 23s tRNA tRNA 5s 16s 5s 5s 23s 5s 5s total 41 0 total 0 0
- Les rares voir gamma pour la longueur des intercalaires
- Les tRNA-CDS compris, comparaison dans le clade et dans l'étude.
Intergen51. ppmp. Les intercalaires tRNA-tRNA extra bloc[modifier | modifier le wikicode]
- Lien tableur: Intergen51. ppmp. Les intercalaires tRNA-tRNA extra bloc
cont1 | cont1 | hors | |||||
---|---|---|---|---|---|---|---|
inter | aa | inter | aa | inter | aa | ||
5 | agc | 55 | ggc | 3 | tta | ||
63 | tgc | 22 | ttc | ** | aca | ||
7 | gaa | 7 | cga | 8 | tcg | ||
6 | ctt | 5 | cca | 7 | tcc | ||
101 | cca | 5 | ttg | 6 | ctt | ||
4 | tgg | 4 | atc | 5 | tcg | ||
7 | tat | 5 | atgf | ** | tca | ||
6 | caa | 109 | gca | ||||
5 | cac | 3 | cga | ||||
125 | gac | 13 | cta | ||||
10 | gga | 8 | atc | ||||
4 | aac | 4 | aac | ||||
9 | tac | ** | tgg | ||||
82 | ata | 8 | gac | ||||
5 | atgi | 86 | tac | ||||
4 | aac | 14 | aaa | ||||
131 | tgg | 4 | gga | ||||
5 | gaa | 7 | ttc | ||||
** | acg | ||||||
- |
Paenibacillus mucilaginosus 3016[modifier | modifier le wikicode]
pmq opérons[modifier | modifier le wikicode]
- Liens: gtRNAdb [18], NCBI [19], génome [20]
- Lien tableur: pmq opérons
- Légende: cdsa: cds aas, cdsj: cdsa sans jaune, cdsd: cdsa dirigé
58.3%GC | 24.7.19 Paris | 110 | doubles | intercal | cds | aa | avec aa | cdsa | cdsd |
---|---|---|---|---|---|---|---|---|---|
9206..10276 | CDS | 322 | 322 | 357 | |||||
10599..12139 | 16s | 269 | |||||||
12409..15343 | 23s | 95 | |||||||
15439..15555 | 5s | 178 | 178 | 178 | |||||
15734..17190 | CDS | 3061 | 486 | ||||||
20252..21532 | CDS | 47 | 47 | 427 | 47 | ||||
21580..21666 | tca | 140 | 140 | ||||||
21807..22157 | CDS hp | @1 | 17 | 117 | |||||
22175..22357 | CDS hp | 23 | *61 | ||||||
22381..22524 | CDS hp | 86 | *48 | ||||||
comp | 22611..22796 | CDS hp | 138 | *62 | |||||
comp | 22935..25265 | replicase | 156 | *777 | |||||
25422..26165 | CDS | 220 | 220 | 248 | |||||
comp | 26386..26460 | cgg | 183 | 183 | 183 | ||||
26644..27168 | CDS | 151287 | 175 | ||||||
178456..179454 | CDS | 298 | 298 | 333 | |||||
179753..181299 | 16s | 254 | |||||||
181554..184488 | 23s | 168 | |||||||
184657..184773 | 5s | 15 | |||||||
184789..184876 | agc | 29 | 29 | ||||||
184906..184982 | atgj | 39 | 39 | ||||||
185022..185097 | gta | 15 | 15 | ||||||
185113..185189 | atgf | 14 | 14 | ||||||
185204..185280 | gac | 48 | 48 | ||||||
185329..185404 | ttc | 5 | 5 | ||||||
185410..185485 | aca | 9 | 9 | ||||||
185495..185579 | tac | 15 | 15 | ||||||
185595..185670 | aaa | 183 | 183 | 183 | |||||
comp | 185854..187104 | CDS | 30460 | 417 | |||||
comp | 217565..218146 | CDS | 129 | 129 | 194 | 129 | |||
comp | 218276..218350 | cgg | 261 | 261 | |||||
218612..219643 | CDS | 34238 | 344 | ||||||
253882..254526 | CDS | 677 | *677 | 215 | |||||
255204..256745 | 16s | 268 | |||||||
257014..259948 | 23s | 95 | |||||||
260044..260160 | 5s | 55 | |||||||
260216..260292 | atc | 19 | 19 | ||||||
260312..260387 | gca | + | 16 | 16 | |||||
260404..260475 | gaa | 2 gca | 9 | 9 | |||||
260485..260569 | tac | 20 | 20 | ||||||
260590..260665 | aac | 3 | 3 | ||||||
260669..260744 | gta | 19 | 19 | ||||||
260764..260840 | gac | 20 | 20 | ||||||
260861..260933 | ttc | 15 | 15 | ||||||
260949..261021 | aaa | 10 | 10 | ||||||
261032..261118 | ctg | 3 | 3 | ||||||
261122..261196 | ggc | 12 | 12 | ||||||
261209..261280 | tgc | 15 | 15 | ||||||
261296..261369 | cgt | 5 | 5 | ||||||
261375..261448 | cca | 158 | *158 | ||||||
261607..261682 | gca | 4 | 4 | ||||||
261687..261759 | acc | 5 | 5 | ||||||
261765..261854 | tcg | 19 | 19 | ||||||
261874..261961 | agc | 17 | 17 | ||||||
261979..262054 | gtc | 5 | 5 | ||||||
262060..262134 | acg | 39 | 39 | ||||||
262174..262262 | tcc | 41 | 41 | ||||||
262304..262386 | ctc | 283 | 283 | *283 | |||||
262670..263515 | CDS | 314679 | 282 | ||||||
578195..579055 | CDS | 324 | 324 | 287 | |||||
579380..580921 | 16s | 258 | |||||||
581180..584114 | 23s | 166 | |||||||
584281..584397 | 5s | 31 | |||||||
584429..584505 | aac | 6 | 6 | ||||||
584512..584600 | tcc | 38 | 38 | ||||||
584639..584710 | gaa | 11 | 11 | ||||||
584722..584797 | gta | 17 | 17 | ||||||
584815..584891 | atgf | 15 | 15 | ||||||
584907..584983 | gac | 67 | 67 | ||||||
585051..585125 | acg | 11 | 11 | ||||||
585137..585212 | cac | 10 | 10 | ||||||
585223..585297 | caa | 5 | 5 | ||||||
585303..585378 | aaa | 17 | 17 | ||||||
585396..585470 | ggc | + | 40 | 40 | |||||
585511..585585 | ggc | 2 ggc | 24 | 24 | |||||
585610..585692 | ttg | 5 | 5 | ||||||
585698..585774 | cca | 19 | 19 | ||||||
585794..585867 | gga | 1 | 1 | ||||||
585869..585942 | aga | 187 | 187 | 187 | |||||
586130..586885 | CDS | 85587 | 252 | ||||||
672473..672949 | CDS | 18 | 18 | 159 | 18 | ||||
672968..673043 | aac | 7 | 7 | ||||||
673051..673138 | agc | @2 | 297 | 297 | |||||
673436..673507 | gaa | 9 | 9 | ||||||
673517..673599 | ctc | 180 | 180 | ||||||
673780..674199 | CDS | 182 | 140 | ||||||
674382..675278 | CDS | 159 | 159 | 299 | |||||
675438..675520 | ctc | 64 | 64 | 64 | |||||
675585..675833 | CDS | 18450 | 83 | ||||||
694284..695636 | CDS | 797 | *797 | 451 | |||||
696434..697974 | 16s | 261 | |||||||
698236..701170 | 23s | 94 | |||||||
701265..701381 | 5s | 43 | |||||||
701425..701498 | atc | 11 | 11 | ||||||
701510..701584 | gaa | 5 | 5 | ||||||
701590..701665 | gtc | 5 | 5 | ||||||
701671..701747 | atgf | 4 | 4 | ||||||
701752..701825 | tgg | 9 | 9 | ||||||
701835..701909 | caa | 8 | 8 | ||||||
701918..701990 | aaa | 18 | 18 | ||||||
702009..702095 | ctg | 4 | 4 | ||||||
702100..702174 | ggc | 11 | 11 | ||||||
702186..702259 | cgt | 12 | 12 | ||||||
702272..702348 | cca | 577 | *577 | *577 | |||||
702926..703120 | CDS | 370320 | 65 | ||||||
1073441..1074214 | CDS | 373 | 373 | 258 | |||||
1074588..1076136 | 16s | 260 | |||||||
1076397..1079331 | 23s | 168 | |||||||
1079500..1079616 | 5s | 9 | |||||||
1079626..1079701 | aac | 6 | 6 | ||||||
1079708..1079796 | tcc | 38 | 38 | ||||||
1079835..1079906 | gaa | 11 | 11 | ||||||
1079918..1079993 | gta | 17 | 17 | ||||||
1080011..1080087 | atgf | 13 | 13 | ||||||
1080101..1080177 | gac | 49 | 49 | ||||||
1080227..1080302 | ttc | 4 | 4 | ||||||
1080307..1080382 | aca | 13 | 13 | ||||||
1080396..1080481 | tac | 8 | 8 | ||||||
1080490..1080560 | tgg | 13 | 13 | ||||||
1080574..1080649 | cac | 26 | 26 | ||||||
1080676..1080747 | caa | 9 | 9 | ||||||
1080757..1080831 | ggc | 12 | 12 | ||||||
1080844..1080917 | tgc | 10 | 10 | ||||||
1080928..1081016 | tta | 20 | 20 | ||||||
1081037..1081113 | cgt | 3 | 3 | ||||||
1081117..1081199 | ttg | 147 | 147 | 147 | |||||
1081347..1081973 | CDS | 128630 | 209 | ||||||
1210604..1213519 | CDS | 354 | 354 | 972 | |||||
1213874..1213949 | gca | 16 | 16 | ||||||
1213966..1214037 | gaa | 12 | 12 | ||||||
1214050..1214125 | gta | 16 | 16 | ||||||
1214142..1214218 | gac | 17 | 17 | ||||||
1214236..1214311 | cac | 9 | 9 | ||||||
1214321..1214395 | caa | 9 | 9 | ||||||
1214405..1214477 | aaa | 8 | 8 | ||||||
1214486..1214572 | ctg | 3 | 3 | ||||||
1214576..1214647 | ggc | 169 | 169 | 169 | |||||
comp | 1214817..1215602 | CDS | 378784 | 262 | |||||
1594387..1594665 | CDS | 537 | *537 | 93 | |||||
1595203..1596743 | 16s | 252 | |||||||
1596996..1599930 | 23s | 94 | |||||||
1600025..1600141 | 5s | 43 | |||||||
1600185..1600261 | atc | 19 | 19 | ||||||
1600281..1600356 | gca | 17 | 17 | ||||||
1600374..1600445 | gaa | 8 | 8 | ||||||
1600454..1600529 | gta | + | 5 | 5 | |||||
1600535..1600610 | aca | 2 gta | 10 | 10 | |||||
1600621..1600705 | tac | 18 | 18 | ||||||
1600724..1600799 | aac | 4 | 4 | ||||||
1600804..1600879 | gta | 21 | 21 | ||||||
1600901..1600977 | atgf | 12 | 12 | ||||||
1600990..1601066 | gac | 34 | 34 | ||||||
1601101..1601176 | cac | 13 | 13 | ||||||
1601190..1601264 | caa | 8 | 8 | ||||||
1601273..1601345 | aaa | 17 | 17 | ||||||
1601363..1601448 | ctc | 13 | 13 | ||||||
1601462..1601548 | ctg | 5 | 5 | ||||||
1601554..1601628 | ggc | 14 | 14 | ||||||
1601643..1601713 | tgc | 10 | 10 | ||||||
1601724..1601797 | cgt | 5 | 5 | ||||||
1601803..1601876 | cca | 105 | 105 | 105 | |||||
1601982..1602245 | CDS | 232535 | 88 | ||||||
1834781..1835260 | CDS | 106 | 106 | 160 | 106 | ||||
1835367..1835439 | gcc | 137 | 137 | ||||||
comp | 1835577..1835978 | CDS | 371114 | 134 | |||||
comp | 2207093..2208091 | CDS | 192 | 192 | 333 | 192 | |||
2208284..2208367 | ctg | + | 49 | 49 | |||||
2208417..2208500 | ctg | 2 ctg | 315 | 315 | |||||
2208816..2209952 | CDS | 1246561 | 379 | ||||||
3456514..3456786 | CDS | 256 | 256 | 91 | |||||
3457043..3457119 | ccc | 142 | 142 | 142 | |||||
3457262..3457483 | CDS | 1547757 | 74 | ||||||
comp | 5005241..5005426 | CDS | 127 | 127 | 62 | 127 | |||
comp | 5005554..5005636 | ctc | 40 | 40 | |||||
comp | 5005677..5005765 | tcc | 13 | 13 | |||||
comp | 5005779..5005852 | atg | 19 | 19 | |||||
comp | 5005872..5005958 | tcg | 167 | 167 | |||||
5006126..5006220 | ncRNA | 1377035 | 32 | ||||||
comp | 6383256..6384173 | CDS | 228 | 228 | 306 | ||||
6384402..6384477 | gtc | 69 | 69 | 69 | |||||
comp | 6384547..6385458 | CDS | 5453 | 304 | |||||
comp | 6390912..6391130 | CDS | 142 | 142 | 73 | 142 | |||
comp | 6391273..6391358 | tta | 7 | 7 | |||||
comp | 6391366..6391442 | atgi | 19 | 19 | |||||
comp | 6391462..6391538 | atgf | 370 | 370 | |||||
comp | 6391909..6392460 | CDS | 962046 | 184 | |||||
7354507..7354737 | CDS | 342 | 342 | 77 | *342 | ||||
comp | 7355080..7355162 | ctc | 28 | 28 | |||||
comp | 7355191..7355279 | tcc | 12 | 12 | |||||
comp | 7355292..7355368 | atgf | 14 | 14 | |||||
comp | 7355383..7355459 | atgj | 14 | 14 | |||||
comp | 7355474..7355561 | agc | 8 | 8 | |||||
comp | 7355570..7355659 | tcg | 4 | 4 | |||||
comp | 7355664..7355736 | acc | 4 | 4 | |||||
comp | 7355741..7355816 | gca | 119 | ||||||
7355936..7356030 | ncRNA | @3 | 36 | ||||||
comp | 7356067..7356140 | cca | 6 | 6 | |||||
comp | 7356147..7356220 | cgt | 104 | *104 | |||||
comp | 7356325..7356396 | ggc | 7 | 7 | |||||
comp | 7356404..7356490 | ctg | 9 | 9 | |||||
comp | 7356500..7356572 | aaa | 9 | 9 | |||||
comp | 7356582..7356656 | caa | 9 | 9 | |||||
comp | 7356666..7356741 | cac | 17 | 17 | |||||
comp | 7356759..7356835 | gac | 12 | 12 | |||||
comp | 7356848..7356923 | gta | 4 | 4 | |||||
comp | 7356928..7357003 | aac | 15 | 15 | |||||
comp | 7357019..7357103 | tac | 8 | 8 | |||||
comp | 7357112..7357187 | aca | 5 | 5 | |||||
comp | 7357193..7357264 | gaa | 15 | 15 | |||||
comp | 7357280..7357355 | gcc | 9 | 9 | |||||
comp | 7357365..7357438 | atc | 54 | ||||||
comp | 7357493..7357609 | 5s | 112 | ||||||
comp | 7357722..7360655 | 23s | 258 | ||||||
comp | 7360914..7362454 | 16s | 403 | *403 | |||||
7362858..7363397 | CDS | 254752 | 180 | ||||||
7618150..7618842 | CDS | 280 | 280 | 231 | *280 | ||||
comp | 7619123..7619193 | ggg | 335 | 335 | |||||
7619529..7620461 | CDS | 46171 | 311 | ||||||
comp | 7666633..7668069 | CDS | 104 | 104 | 479 | 104 | |||
comp | 7668174..7668244 | ggg | 5 | 5 | |||||
comp | 7668250..7668326 | cca | 106 | *106 | |||||
comp | 7668433..7668506 | cgt | 11 | 11 | |||||
comp | 7668518..7668592 | ggc | 5 | 5 | |||||
comp | 7668598..7668684 | ctg | 13 | 13 | |||||
comp | 7668698..7668783 | ctc | 16 | 16 | |||||
comp | 7668800..7668872 | aaa | 10 | 10 | |||||
comp | 7668883..7668967 | tac | 28 | 28 | |||||
comp | 7668996..7669071 | ttc | 12 | ||||||
comp | 7669084..7669200 | 5s | 159 | ||||||
comp | 7669360..7672297 | 23s | 256 | ||||||
comp | 7672554..7674095 | 16s | 537 | *537 | |||||
7674633..7675382 | CDS | 177794 | 250 | ||||||
comp | 7853177..7853761 | CDS | 57 | 57 | 195 | 57 | |||
comp | 7853819..7853892 | cac | 230 | 230 | |||||
comp | 7854123..7854196 | cac | 404 | *404 | |||||
comp | 7854601..7854801 | CDS | 245639 | 67 | |||||
comp | 8100441..8100854 | CDS | 123 | 123 | 138 | 123 | |||
comp | 8100978..8101094 | 5s | 167 | ||||||
comp | 8101262..8104180 | 23s | 248 | ||||||
comp | 8104429..8105969 | 16s | 325 | 325 | |||||
comp | 8106295..8106636 | CDS | 45281 | 114 | |||||
comp | 8151918..8152448 | CDS | 460 | *460 | 177 | *460 | |||
comp | 8152909..8153031 | 5s | 94 | ||||||
comp | 8153126..8156060 | 23s | 258 | ||||||
comp | 8156319..8157859 | 16s | 456 | *456 | |||||
8158316..8158642 | CDS | 98285 | 109 | ||||||
8256928..8257746 | CDS | 83 | 83 | 273 | 83 | ||||
comp | 8257830..8257903 | gga | 5 | 5 | |||||
comp | 8257909..8257985 | cca | 16 | 16 | |||||
comp | 8258002..8258078 | cgt | 4 | 4 | |||||
comp | 8258083..8258157 | ggc | 8 | 8 | |||||
comp | 8258166..8258248 | cta | 42 | 42 | |||||
comp | 8258291..8258366 | aaa | 8 | 8 | |||||
comp | 8258375..8258449 | caa | 9 | 9 | |||||
comp | 8258459..8258532 | tgg | 4 | 4 | |||||
comp | 8258537..8258613 | atgf | 5 | 5 | |||||
comp | 8258619..8258694 | gtc | 5 | 5 | |||||
comp | 8258700..8258774 | gaa | 11 | 11 | |||||
comp | 8258786..8258859 | atc | 43 | ||||||
comp | 8258903..8259019 | 5s | 94 | ||||||
comp | 8259114..8262048 | 23s | 255 | ||||||
comp | 8262304..8263845 | 16s | 306 | 306 | |||||
comp | 8264152..8264370 | CDS | 58373 | 73 | |||||
comp | 8322744..8323205 | CDS | 393 | 393 | 154 | *393 | |||
comp | 8323599..8323715 | 5s | 94 | ||||||
comp | 8323810..8326748 | 23s | 258 | ||||||
comp | 8327007..8328547 | 16s | 369 | 369 | |||||
comp | 8328917..8330413 | CDS | 21505 | 499 | |||||
comp | 8351919..8354414 | CDS | 396 | 396 | 832 | ||||
comp | 8354811..8354884 | atg | 149 | 149 | 149 | ||||
comp | 8355034..8355537 | CDS | 34450 | 168 | |||||
8389988..8390512 | CDS | 296 | 296 | 175 | *296 | ||||
comp | 8390809..8390925 | 5s | 94 | ||||||
comp | 8391020..8393954 | 23s | 259 | ||||||
comp | 8394214..8395754 | 16s | 234 | 234 | |||||
comp | 8395989..8396255 | CDS | 220222 | 89 | |||||
comp | 8616478..8616924 | CDS | 417 | *417 | 149 | ||||
8617342..8617418 | gac | 157 | 157 | 157 | |||||
8617576..8618541 | CDS | 105821 | 322 | ||||||
8724363..8724614 | CDS | 455 | *455 | 84 | |||||
comp | 8725070..8725160 | tcg | 165 | 165 | 165 | ||||
comp | 8725326..8725559 | CDS | 9205 | 78 | |||||
opéron | doubles | intercalaires | cds | aa | avec aa | cdsa | cdsd |
pmq cumuls[modifier | modifier le wikicode]
opérons | Fréquences intercalaires tRNAs | Fréquences intercalaires cds | Fréquences aas cds | |||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|
effectif | gammes | sans rRNAs | avec rRNAs | gammes | cds | gammes | cds dirigé | gammes | cdsa | cdsd | ||
avec rRNA | opérons | 14 | 1 | 0 | 1 | 1 | 0 | 1 | 0 | 100 | 15 | 8 |
16 23 5s 0 | 5 | 20 | 14 | 107 | 50 | 3 | 20 | 1 | 200 | 18 | 10 | |
16 atc gca | 0 | 40 | 1 | 12 | 100 | 4 | 40 | 0 | 300 | 12 | 6 | |
16 23 5s a | 9 | 60 | 1 | 4 | 150 | 11 | 60 | 2 | 400 | 9 | 3 | |
max a | 23 | 80 | 0 | 1 | 200 | 11 | 80 | 2 | 500 | 6 | 4 | |
a doubles | 3 | 100 | 0 | 0 | 250 | 3 | 100 | 1 | 600 | 0 | 0 | |
spéciaux | 0 | 120 | 0 | 2 | 300 | 6 | 120 | 3 | 700 | 0 | 0 | |
total aas | 138 | 140 | 0 | 0 | 350 | 7 | 140 | 3 | 800 | 0 | 0 | |
sans | opérons | 17 | 160 | 0 | 1 | 400 | 6 | 160 | 5 | 900 | 1 | 0 |
1 aa | 11 | 180 | 0 | 0 | 450 | 3 | 180 | 3 | 1000 | 1 | 0 | |
max a | 9 | 200 | 0 | 0 | 500 | 3 | 200 | 4 | 1100 | 0 | 0 | |
a doubles | 1 | 2 | 0 | 5 | 7 | 0 | 0 | |||||
total aas | 35 | 18 | 128 | 62 | 31 | 62 | 31 | |||||
total aas | 173 | |||||||||||
remarques | 3 | |||||||||||
avec jaune | moyenne | 16 | 235 | 213 | ||||||||
variance | 20 | 184 | 122 | |||||||||
sans jaune | moyenne | 16 | 14 | 207 | 126 | |||||||
variance | 12 | 11 | 106 | 49 |
pmq blocs[modifier | modifier le wikicode]
- Lien tableur: pmq blocs
CDS | 298 | 324 | 373 | 12 | |
16s | 254 | 258 | 260 | 159 | |
23s | 168 | 166 | 168 | 256 | |
5s | 15 | 31 | 9 | 537 | |
1er aa | agc | aac | aac | ttc | |
aas | 9 | 16 | 17 | 9 | |
CDS | 183 | 187 | 147 | 104 | |
CDS | 677 | 797 | 537 | 54 | 43 |
16s | 268 | 261 | 252 | 112 | 94 |
23s | 95 | 94 | 94 | 258 | 255 |
5s | 55 | 43 | 43 | 403 | 306 |
atc / aas | 22 | 11 | 19 | 23 | 12 |
CDS | 283 | 577 | 105 | 342 | 83 |
CDS | 322 | 123 | 460 | 393 | 296 |
16s | 269 | 167 | 94 | 94 | 94 |
23s | 95 | 248 | 258 | 258 | 259 |
5s | 178 | 325 | 456 | 369 | 234 |
pmq remarques[modifier | modifier le wikicode]
*Remarques : Que des blocs 16-23-5s, 14. Très peu d’opérons sans rRNA, 35 aas pour 17 opérons. Très peu de doubles, 4 doublets. #@1 Suite aux gènes de protéines cotranscrits avec les gènes de tRNA, voir eco, j’ai entouré les opérons tRNA, dans les 7 génomes suivants, Par 2 CDS, un avant et un après. Dans cette remarque j’ai voulu montré les intercalalires et les tailles des CDS qui suivent l’opéron. Ce sont pour la plupart de petites protéines hypothétiques, largement plus petites que FT-U mais plus grandes que tpr (voir eco). #@2 L’intercalaire maximum qui laisserait penser qu’on a affaire à 2 opérons différents. Une recherche simple des promoteurs me paraît difficile dans les bases de données , sauf dans BioCyc qui est payant, aussi je me base sur le regroupement des gènes pour décider que je suis en présence d’un opéron ou non. Mais arrivé à ce stade de ma réflexion, comme je l’expiciterai plus tard, je ne m’interesse plus à l’existence de l’opéron mais seulement au regroupement CDS-séquence à t-rRNAs-CDS qu’il soit sur 1 ou 2 brins. Ce sont seulement les statistiques des intercalaires et, surtout, le sens 16s-23s qui paraît prévilégier les intercalaires courts, qui m’ontpoussé à changer cette limite vers 400 pb au lieu de 210, limite basée sur l’intercalaire max de 264 entre les 2 derniers tRNAs du 21aas de bsu qui est bien un opéron dans BioCyc. #@3 Voici une séquence qui n’est pas un CDS et pas sur le même brin que le reste du groupe, mais qui répond aux niveaux critères de la remarque @2 précédente. L’intercalaire entre les 2 tRNAs du même brin qui enjambent cette séquence est de 250 pb. #Séquence des doubles : Très peu de doubles. 3 doublets se trouvent avec les rRNAs dont 1 est successif, un 4ème doublet successif se trouve dans un opéron sans rRNAs. Les doublets dans ce génome sont rares mais se répartissent proportionnellement sur les 2 types d’opérons. #Les intercalaires dans les blocs : rappel des opérons à bloc chez eco voir sigma FIS 362 162 Terminateur #: - CDS-16s 234, 298-537, 677 797 voir ici sigma FIS 442 322 rien #: - 16s-23s 258 néant sigma FIS 473 228 Terminateur #: - 23s-5s 168*4, 112, 94*9 93*7 sigma FIS 480 95 Terminateur #: - 5s-tRNA 9-15*3 31-54*6 8-12*2, 52 Sigma Lrp-leu 377 228 rien #: - L’orientation CDS-16s, CDS de fin de bloc. 83-105*3 Sigma Lrp-leu 373 300 Terminateur 123-187*5 sigma FIS 614 74 Terminateur 283-577*6 #Les intercalaires entre tRNAs #: - Dans les opérons sans rRNAs inf à 20 14/18 16±12 #: - Dans les opérons à rRNAs inf à 20 107/128 16±20 #Les intercalaires avec les CDS des bordures #: - tous les CDS #: - Les CDS orientés #Taille des CDS de bordure en aas #: - tous les CDS #: - Les CDS orientés Notes : l’opéron de BioCyc et la direction 16s-23s dans les statistiques des intercalaires des CDS. Promoteur et terminateur. Les cds Bacteria; Firmicutes; Bacilli; Bacillales; Paenibacillaceae;Paenibacillus. bloc protein interc aas 268 262304..262386 ctc 283 - 95 262670..263515 PRD domain 267 282 55 263783..265834 GlcT 179 684 atc 266014..266286 Hpr -8 91 22 266279..268003 PeP 575 258 585869..585942 aga 187 - 166 586130..586885 biotine Stase 40 252 31 586926..587918 BioB 8 331 aac 587927..589093 nanoate 176 389 16 589270..589914 hydrolase 215 20252..21532 Ser ligase 47 427 21580..21666 tca 140 21807..22157 CDS hp 17 117 22175..22357 CDS hp 23 61 22381..22524 CDS hp 86 48 22611..22796 CDS hp 138 62 22935..25265 Replicase 156 777 25422..26165 Peptidase 220 248 comp 26386..26460 cgg 183 26644..27168 sigma factor 151287 175 Les blocs à rRNAs CDS 298 324 373 12 16s 254 258 260 159 23s 168 166 168 256 5s 15 31 9 537 1er aa agc aac aac ttc aas 9 16 17 9 CDS 183 187 147 104 CDS 677 797 537 54 43 16s 268 261 252 112 94 23s 95 94 94 258 255 5s 55 43 43 403 306 atc/aas 22 11 19 23 12 CDS 283 577 105 342 83 CDS 322 123 460 393 296 16s 269 167 94 94 94 23s 95 248 258 258 259 5s 178 325 456 369 234
pmq distribution[modifier | modifier le wikicode]
- Lien tableur: pmq distribution
- Notes:
- - duplicata: ggc2 ctg2
|
|
pmq. Intergen51[modifier | modifier le wikicode]
Intergen51. pmq. Le génome[modifier | modifier le wikicode]
- pmq Le prélèvement: Apmq
- Le nom et le lien NCBI: pmq, Paenibacillus mucilaginosus 3016, NCBI [21], date 07.02.21.
- pmq La longueur totale des intercalaires, longueur du génome et taux intercalaires/génome:
Nom intercals génome taux en % pmq 1,228,719 8,739,048 14.1
pmq données intercalaires[modifier | modifier le wikicode]
- Lien tableur: pmq données intercalaires
- Lien sauvegarde NCBI: Apmq
pmq autres intercalaires aas[modifier | modifier le wikicode]
- Lien tableur: pmq autres intercalaires aas
- Lien sauvegarde NCBI: Apmq
Intergen51. pmq. Les différents types d'intercalaires[modifier | modifier le wikicode]
- Lien au tableur: Intergen51. pmq les différents types d'intercalaires.
- Légende:
- - S pour intercalaire CDS-CDS et R pour tRNA-CDS,
- - c pour intercalaire continu (les 2 gènes sont sur le même brin) et x pour discontinu (les 2 gènes sont sur 2 brins différents, le brin et son complément)
- - %reste = 100*reste/total, le reste étant ce qui reste du total après la fin du diagramme, gamme.
- - %t30 = 100*t30/total, t30 étant le total des fréquences 10 20 30
- - %t5 = 100*t/total, t5 étant le total des fréquences de -1 à -5 dans le diagramme des S-.
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
Intergen51. pmq. Les diagrammes CDS-CDS positifs[modifier | modifier le wikicode]
- Lien tableur: Les diagrammes
- Diagrammes des gamma: pmq présente 2 diagrammes
- - fc40, CDS-CDS continu, fréquence unitaire en abscisses et effectif en ordonnées
- - fx%, CDS-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et pourcentage en ‰ par rapport au total, en ordonnées.
- Équations des courbes de tendance en pour 1000: colonnes %fx %fc
Courbes de tendances pour les diagrammes en pour 1000 Calculs des f.41 pmq R2 x3 x2 x c Inflexion poly3 x c 0.878 2.70E-06 -2.45E-03 5.77E-01 -6.46 fx1 abscisse 27.4 387.5 0.946 -2.70E-06 2.12E-03 -5.95E-01 73.0 fc1 ordonnée -3.3 5.0 0.502 5.02E-06 -4.13E-04 9.41E-01 -28.9 fx41 0.950 -3.20E-07 3.72E-04 -2.08E-01 48.4 fc41
Intergen51. pmq. Les CDS-CDS négatifs[modifier | modifier le wikicode]
Sous-totaux pmq totale fréquence x- c- x- c- - 1 0 80 4 4140 - 2 3 0 85 11 - 3 0 1 3 12 - 4 11 384 717 10938 - 5 0 1 5 19 sp6 28 287 1642 8424 total 42 753 2,456 23,544 reste 5 16 264 420 s6 6 1 361 41 s7 4 44 321 1438 s8 13 226 696 6525 rappot s1-5 4/2/1 3.7 4.8 8.4 2.6 % / sp6 s6/sp6 21.4 0.3 22.0 0.5 s7/sp6 14.3 15.3 19.5 17.1 s8/sp6 46.4 78.7 42.4 77.5 reste/sp6 17.9 5.6 16.1 5.0 total s1-5 14 466 814 15120 % / total %s1-5 33.3 61.9 33.1 64.2 %sp6 66.7 38.1 66.9 35.8
Intergen51. pmq. Les intercalaires des blocs[modifier | modifier le wikicode]
- Le détail
RNA-RNA c x CDS-RNA c x 23s 5s 14 CDS 16s 11 3 16s 23s 14 5s CDS 4 1 16s tRNA 16 CDS tRNA 23s CDS 5s 5s tRNA 9 23s CDS tRNA in CDS 23s tRNA contig 128 5s 16s tRNA hors 18 16s16s tRNA 16s 23s tRNA tRNA 5s 16s 5s 5s 23s 5s 5s total 183 0 total 15 4
- Les rares voir gamma pour la longueur des intercalaires
- Les tRNA-CDS compris, comparaison dans le clade et dans l'étude.
Intergen51. pmq. Les intercalaires tRNA-tRNA extra bloc[modifier | modifier le wikicode]
- Lien tableur: Intergen51. pmq. Les intercalaires tRNA-tRNA extra bloc
cont1 | cont1 | cont2 | cont2 | cont3 | cont4 | hors | |||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
inter | aa | inter | aa | inter | aa | inter | aa | inter | aa | inter | aa | inter | aa | ||||||
29 | agc | 5 | acc | 11 | atc | 10 | tgc | 28 | ctc | 5 | ggg | 7 | aac | ||||||
39 | atgj | 19 | tcg | 5 | gaa | 20 | tta | 12 | tcc | 106 | cca | 297 | agc | ||||||
15 | gta | 17 | agc | 5 | gtc | 3 | cgt | 14 | atgf | 11 | cgt | 9 | gaa | ||||||
14 | atgf | 5 | gtc | 4 | atgf | ** | ttg | 14 | atgj | 5 | ggc | ** | ctc | ||||||
48 | gac | 39 | acg | 9 | tgg | 19 | atc | 8 | agc | 13 | ctg | 16 | gca | ||||||
5 | ttc | 41 | tcc | 8 | caa | 17 | gca | 4 | tcg | 16 | ctc | 12 | gaa | ||||||
9 | aca | ** | ctc | 18 | aaa | 8 | gaa | 4 | acc | 10 | aaa | 16 | gta | ||||||
15 | tac | 10 | aac | 7 | ctg | 5 | gta | x119 | gca | 28 | tac | 17 | gac | ||||||
** | aaa | 38 | tcc | 11 | ggc | 10 | aca | x36 | ncRNA | ** | ttc | 9 | cac | ||||||
19 | atc | 11 | gaa | 12 | cgt | 18 | tac | 6 | cca | 5 | gga | 9 | caa | ||||||
16 | gca | 17 | gta | ** | cca | 4 | aac | 104 | cgt | 16 | cca | 8 | aaa | ||||||
9 | gaa | 15 | atgf | 6 | aac | 21 | gta | 7 | ggc | 4 | cgt | 3 | ctg | ||||||
20 | tac | 67 | gac | 38 | tcc | 12 | atgf | 9 | ctg | 8 | ggc | ** | ggc | ||||||
3 | aac | 11 | acg | 11 | gaa | 34 | gac | 9 | aaa | 42 | cta | 49 | ctg | ||||||
19 | gta | 10 | cac | 17 | gta | 13 | cac | 9 | caa | 8 | aaa | ** | ctg | ||||||
20 | gac | 5 | caa | 13 | atgf | 8 | caa | 17 | cac | 9 | caa | 40 | ctc | ||||||
15 | ttc | 17 | aaa | 49 | gac | 17 | aaa | 12 | gac | 4 | tgg | 13 | tcc | ||||||
10 | aaa | 40 | ggc | 4 | ttc | 13 | ctc | 4 | gta | 5 | atgf | 19 | atgj | ||||||
3 | ctg | 24 | ggc | 13 | aca | 5 | ctg | 15 | aac | 5 | gtc | ** | tcg | ||||||
12 | ggc | 8 | ttg | 8 | tac | 14 | ggc | 8 | tac | 11 | gaa | 7 | tta | ||||||
15 | tgc | 19 | cca | 13 | tgg | 10 | tgc | 5 | aca | ** | atc | 19 | atgi | ||||||
5 | cgt | 1 | gga | 26 | cac | 5 | cgt | 15 | gaa | ** | atgf | ||||||||
158 | cca | ** | aga | 9 | caa | ** | cca | 9 | gcc | 230 | cac | ||||||||
4 | gca | 12 | ggc | ** | atc | ** | cac | ||||||||||||
- |
pmq intercalaires entre cds[modifier | modifier le wikicode]
- Lien NCBI [22]
- Note: Pour les génomes des annexes j'ai relevé les intercalaires entre tRNAs et entre ceux-ci et les cds qui leur sont adjacents. L'exemple est celui de rru du clade alpha. L'idée de départ de ces prélèvements est la recherche d'opérons formés de tRNA et de protéine comme dans le cas d'E.coli: l'intercalaire entre le tRNA et la protéine devrait être faible. Voir l'exemple d'eco (remarque @3) avec tac-tac-tpr et aca-tac-gga-acc-tufB.
pmq intercalaires positifs S+[modifier | modifier le wikicode]
- Lien tableur: pmq intercalaires positifs S+
- Diagrammes 400: pmq cbei, diagramme 1-40: c+ pmq c+ cbei total, texte: cbei.
- Légende: voir la légende de cvi.
pmq | Sx+ | Sc+ | ||||||||||||
Poly3 | -7 | -5 | -3 | 1 | R2 | flex x+ | comment. | -7 | -5 | -3 | 1 | R2 | flex c+ | comment. |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
1 à 400 | 31 | -283 | 664 | -7.0 | 878 | 304 | max190 | -29 | 229 | -645 | 79 | 946 | 263 | min70 |
31 à 400 | 2 parties | -13 | 112 | -388 | 63 | 937 | 287 | 2 parties | ||||||
droite | -a | cste | - | R2 | note | R2’ | -a | cste | - | R2 | note | R2’ | ||
1 à 400 | 28 | 31 | - | 65 | poly | 813 | tF | 143 | 54 | 806 | poly | 140 | SF | |
31 à 400 | 113 | 46 | - | 886 | dte | 51 | Sf |
- Légende du tableau des corrélations et des fréquences faibles
effectifs diagramme | corrélation x+ c+, 41-n | corrélation x+ c+, 1-n | |||||||||
gen | minima | x+ | c+ | total | 400 | 200 | 250 | diff | 200 | 250 | 400 |
---|---|---|---|---|---|---|---|---|---|---|---|
mba | min10 | 705 | 1651 | 2356 | 154 | -330 | -221 | 109 | -512 | -477 | -223 |
cbei | min10 | 950 | 3395 | 4345 | 402 | -509 | -375 | 134 | -649 | -648 | -290 |
pmq | min10 | 1614 | 4164 | 5778 | 458 | -832 | -651 | 181 | -866 | -825 | -61 |
1-30 ‰ | effectifs | 0 ‰ | <0 ‰ | effectifs 1-40 | corel | ||||||
1-30 x+ | 1-30 c+ | x+/c+ | x | c | x | c | x- | c- | x+ | c+ | x+/c+ |
45 | 214 | 0.21 | 1255 | 2688 | 1 | 8 | 18 | 114 | 51 | 428 | -74 |
26 | 244 | 0.11 | 1212 | 4400 | 0 | 4 | 8 | 89 | 35 | 954 | 272 |
32 | 218 | 0.15 | 1927 | 5296 | 3 | 5 | 22 | 140 | 68 | 1156 | -207 |
- Diagrammes 400: pmq cbei, diagramme 1-40: c+ pmq c+ cbei total, texte: cbei.
- Résumé: J’ai classé les 21 génomes suivant la forme des diagrammes x+ 1-400. J’ai obtenu 3 groupes,
- Les tildes au nombre de 5. Ils sont réguliers et forts, tF, avec un R2’ supérieur à 138 pour 4 d’entre eux et scc avec 71. Ce sont, cbei mba pmq et blo scc.
- Les formes S au nombre de 6. Leurs forces (R2’) sont variables, ade rru Sf 20-39, ant mja Sm 70-78, pmg pub SF 179-249.
- Les diagrammes à pyramide, c’est à dire présentant une bosse avec 4 ou 5 points contigus. Ils sont au nombre de 10 dont 9 sont des tildes et bsu est un Sf très faible (R2’18). abra rtb spl afn sont des tF avec plus de 96, ase cbn cvi sont des tf avec moins de 30, eco myr sont des tm 43 68.
- - pmq / cbei: Les 2 génomes se ressemblent beaucoup, totaux des effectifs très élevés et diffèrent à peine de 33%, 5778 contre 4345; corrélations sur 41-250 les plus négatives des 21 génomes,-651 contre -377 et les courbes sur x+ 1-400 sont presque identiques avec les tildes très forts, tF, 813 contre 708 et de même sur c+ 31-400 avec la forme S faible, Sf, 8 contre 51.
- - Les diagrammes 400
- x+ 1-400:
- + Les 2 courbes se ressemblent beaucoup, de forme tilde fort, avec un R2’ de 813 pour pmq contre 708. Cependant les allures sont différentes, plus grande variabilité chez cbei avec un R2 de 712 contre 878 pour pmq et la courbe cbei est plus étirée à la fin car le reste de l’effectif non pris en compte dans le diagramme (reste) est plus élevé que chez pmq, dans un rapport de 0.28 (262/946) contre 0.16 (266/1614 ) pour pmq. De ce point de vue cbei est plus proche de mba que ne l’est pmq, avec un rapport de 0.75 (527/705).
- + Les taux des fréquences faibles 1-30 sont parmi les plus faibles des 21 génomes, 32‰ pour pmq contre 26 pour cbei , et expliquent la forte chute des corrélations sur 1-250 par rapport à 41-250.
- + Les points d’inflexion sont normaux, 304 pour pmq contre 269 pour cbei. Avec pmq, le point d’inflexion élevé et le reste faible non pris en compte dans le diagramme fait que la courbe est arrondie.
- c+ 1-400: Ce sont 2 courbes semblables de forme S fort, cbei avec un R2’ de 213 et pmq avec un R2’ de 140. Les 2 points d’inflexion sont normaux, 263 pour pmq et 245 pour cbei. Les fréquences faibles sont concentrées à la fréquence 20 qui est maximum local pour cbei. C’est un maximum pour pmq mais les taux sont répartis régulièrement de 10 à 40. Les minima locaux sont différents pour les 2 génomes, min70 pour pmq et min50 pour cbei.
- x+ 31-400: Je n’ai pas représenté les courbes x+ 31-400 à cause des taux peu élevés des fréquences faibles 1-30.
- c+ 31-400: Les 2 formes sont 2 S faibles, Sf, très faible pour cbei avec un R2’ de 8 (935 927) et faible pour pmq avec un R2’ de 51 (937 886). Les points d’inflexion sont aussi différents, il est normal pour pmq à la fréquence 287 et très faible pour cbei à 38. La courbe de pmq présente bien 2 parties avec un début renflé, alors que cbei se confond avec une droite d’un seul tenant sans renflement au début d’où le commentaire de “1 partie”.
- x+ 1-400:
- - Les corrélations:
- Sur les plages 41-n: Les 2 corrélations sur 41-250 sont négatives et du même ordre de grandeur, -651 pour pmq et -377 pour cbei. Elles chutent fortement pour les 2 génomes sur 41-200, avec une différence (diff) de 181 pour pmq et 133 pour cbei.
- Sur les plages 1-n: les 2 génomes chutent fortement aussi, -825 pour pmq et -646 pour cbei.
- - Les faibles fréquences: Les faibles fréquences 1-30 ne sont intéressantes à comparer que pour les génomes à courbes 1-400 semblables où le taux de ces fréquences sont élevés et évoluent en parallèle comme entre pmg et pub où le rapport x+/c+ passe de 0.78 à 0.51. Ici pmq et cbei se comportent de la même façon, respectivement, le rapport x+/c+ fait 0.15 et 0.11, les zéros sont très faibles, 8‰ et 4‰. Les négatifs sont faibles par rapport aux autres génomes mais chez pmq ils sont nettement plus élevés que chez cbei, 162‰ contre 97‰.
- - Les courbes 1-40:
- c+ 1-40: Les 2 courbes sont très proche de celle du total des c+ 1-40.
- x+ 1-40: Avec un effectif commun de 68 pour les 2 génomes, les courbes ne peuvent pas être significatives.
pmq autres intercalaires[modifier | modifier le wikicode]
- Lien tableur: pmq autres intercalaires aas
- Légende:
- - comp, le gène est sur le brin complement
- - deb, fin sont respectivement dans le sens des adresses croissantes, le cds avant le 1er tRNA et le cds après le dernier tRNA du bloc.
- - misc_f, pour misc_feature
- - misc_R, pour misc_RNA
- Totaux: 1 tmRNA 3 ncRNA
tRNA-cds tRNA-tRNA autres-cds total c+ x+ x- c+ x+ c- c+ x+ c- 44 19 185 7 255 1 ax+
- Méthode de calculs des intercalaires autres que les CDS-CDS voir le cas de amed.
Lactobacillus delbrueckii subsp. bulgaricus ATCC BAA-365[modifier | modifier le wikicode]
lbu opérons[modifier | modifier le wikicode]
- Liens: gtRNAdb [23], NCBI [24]
- Lien tableur: lbu opérons
- Légende: cdsa: cds aas, cdsj: cdsa sans jaune, cdsd: cdsa dirigé
49.8%GC | 29.7.19 Paris | 110 | doubles | intercal | cds | aa | avec aa | cdsa | cdsd |
---|---|---|---|---|---|---|---|---|---|
comp | 18533..19237 | CDS | 128 | 128 | 235 | 128 | |||
19366..19438 | act | @1 | 195 | 195 | |||||
19634..20371 | CDS | 6912 | 246 | ||||||
27284..29785 | CDS | 276 | 276 | *834 | |||||
30062..30134 | act | 134 | 134 | 134 | |||||
30269..30907 | CDS | 11768 | 213 | ||||||
42676..43248 | cds hp | 451 | *451 | *191 | |||||
43700..45271 | 16s | 209 | |||||||
45481..48391 | 23s | 69 | |||||||
48461..48577 | 5s | 275 | 275 | 275 | |||||
48853..49091 | cds hp | 56679 | 80 | ||||||
comp | 105771..106547 | CDS | 56 | 56 | 259 | 56 | |||
comp | 106604..106679 | aag | 125 | 125 | |||||
106805..107533 | CDS | 103754 | 243 | ||||||
211288..212553 | CDS | 94 | 94 | 422 | |||||
212648..212720 | acc | 23 | 23 | 23 | |||||
comp< | 212744..213262 | CDS | 64997 | 173 | |||||
278260..278928 | CDS | 69 | 69 | 223 | 69 | ||||
comp | 278998..279068 | ggg | 181 | 181 | |||||
279250..280275 | CDS | 44047 | 342 | ||||||
comp | 324323..324949 | CDS | 117 | 117 | 209 | 117 | |||
325067..325138 | ggc | + | 4 | 4 | |||||
325143..325216 | ccg | 2 ggc | 108 | ||||||
325325..325399 | ggc | 155 | 155 | ||||||
325555..326016 | CDS | 37886 | 154 | ||||||
363903..364394 | CDS | 98 | 98 | 164 | 98 | ||||
364493..364564 | caa | 614 | *614 | ||||||
365179..366360 | CDS | -14 | *394 | ||||||
366347..367402 | CDS | 75 | 75 | 352 | |||||
367478..367559 | tac | 5 | 5 | ||||||
367565..367636 | caa | 62 | 62 | 62 | |||||
< | 367699..368318 | CDS | 14127 | 207 | |||||
382446..382907 | CDS | 30 | 30 | 154 | 30 | ||||
382938..383026 | ctt | 118 | 118 | ||||||
383145..383768 | CDS | 70441 | 208 | ||||||
454210..455529 | CDS | 61 | 61 | 440 | 61 | ||||
455591..455665 | agg | 341 | 341 | ||||||
456007..457035 | CDS | 75557 | 343 | ||||||
532593..533285 | CDS | 82 | 82 | 231 | 82 | ||||
comp | 533368..533442 | cgg | 296 | 296 | |||||
533739..534782 | CDS | 48963 | 348 | ||||||
583746..584728 | CDS | 57 | 57 | 328 | 57 | ||||
comp | 584786..584858 | cag | 5 | 5 | |||||
comp | 584864..584935 | gag | 170 | 170 | |||||
585106..586110 | CDS | 94988 | 335 | ||||||
681099..682741 | CDS | 518 | *518 | *548 | |||||
683260..684831 | 16s | 106 | |||||||
684938..685011 | atc | 69 | 69 | ||||||
685081..685153 | gca | 127 | |||||||
685281..688191 | 23s | 68 | |||||||
688260..688376 | 5s | 208 | 208 | 208 | |||||
comp | 688585..689801 | CDS | 55794 | 406 | |||||
comp | 745596..745821 | CDS | 134 | 134 | 75 | 134 | |||
comp | 745956..746044 | tcg | 787 | *787 | |||||
746832..749597 | CDS | 36741 | *922 | ||||||
786339..787004 | CDS | 54 | 54 | 222 | 54 | ||||
787059..787142 | ctg | 109 | 109 | ||||||
comp | 787252..787872 | CDS | 2072 | 207 | |||||
comp | 789945..791867 | CDS | 613 | *613 | *641 | ||||
792481..794052 | 16s | 105 | |||||||
794158..794231 | atc | 69 | 69 | ||||||
794301..794373 | gca | 126 | |||||||
794500..797410 | 23s | 69 | |||||||
797480..797596 | 5s | 87 | 87 | 87 | |||||
797684..798559 | CDS | 36 | 292 | ||||||
comp | 798596..800178 | CDS | 530 | *530 | *528 | ||||
800709..800781 | aac | @2 | 3 | 3 | |||||
800785..800858 | cca | 24 | 24 | ||||||
800883..800954 | ggc | 30 | 30 | ||||||
800985..801058 | cgt | 2 | 2 | ||||||
801061..801133 | gta | 3 | 3 | ||||||
801137..801208 | gaa | 42 | 42 | ||||||
801251..801338 | tca | 9 | 9 | ||||||
801348..801421 | atgf | 3 | 3 | ||||||
801425..801498 | gac | 6 | 6 | ||||||
801505..801577 | ttc | 8 | 8 | ||||||
801586..801667 | tac | 4 | 4 | ||||||
801672..801742 | tgg | 13 | 13 | ||||||
801756..801831 | cac | 26 | 26 | ||||||
801858..801928 | tgc | 28 | 28 | ||||||
801957..802041 | ttg | 356 | 356 | 356 | |||||
802398..802961 | CDS | 284259 | 188 | ||||||
comp | 1087221..1088531 | CDS | 157 | 157 | 437 | 157 | |||
comp | 1088689..1088760 | caa | 656 | *656 | |||||
comp | 1089417..1090313 | CDS | 173317 | *299 | |||||
comp | 1263631..1265769 | CDS | 188 | 188 | *713 | 188 | |||
comp | 1265958..1266031 | aga | 222 | 222 | |||||
1266254..1268632 | CDS | 84103 | *793 | ||||||
comp | 1352736..1354022 | CDS | 98 | 98 | 429 | 98 | |||
1354121..1354204 | ctg | 204 | 204 | ||||||
comp | 1354409..1354928 | CDS | 13182 | 173 | |||||
comp | 1368111..1369307 | CDS | 161 | 161 | 399 | 161 | |||
comp | 1369469..1369541 | gta | 3 | 3 | |||||
comp | 1369545..1369616 | gaa | 138 | *138 | |||||
comp | 1369755..1369828 | atgj | 6 | 6 | |||||
comp | 1369835..1369925 | tcc | 8 | 8 | |||||
comp | 1369934..1370006 | aac | 7 | ||||||
comp | 1370014..1370130 | 5s | 69 | ||||||
comp | 1370200..1373111 | 23s | 126 | ||||||
comp | 1373238..1373310 | gca | 69 | 69 | |||||
comp | 1373380..1373453 | atc | 105 | ||||||
comp | 1373559..1375130 | 16s | 547 | *547 | |||||
1375678..1376604 | CDS | 102845 | *309 | ||||||
comp | 1479450..1479824 | CDS | 200 | 200 | 125 | ||||
comp | 1480025..1480101 | gac | 26 | 26 | |||||
comp | 1480128..1480199 | gaa | 3 | 3 | |||||
comp | 1480203..1480275 | gta | 2 | 2 | |||||
comp | 1480278..1480351 | cgt | 35 | 35 | |||||
comp | 1480387..1480458 | ggc | 36 | ||||||
comp | 1480495..1480611 | 5s | 68 | ||||||
comp | 1480680..1483590 | 23s | 208 | ||||||
comp | 1483799..1485370 | 16s | 153 | 153 | 153 | ||||
comp | 1485524..1485716 | CDS | 20944 | 64 | |||||
comp | 1506661..1507464 | CDS | 270 | 270 | 268 | ||||
comp | 1507735..1507807 | aag | + | 34 | 34 | ||||
comp | 1507842..1507914 | aag | 5 aag | 33 | 33 | ||||
comp | 1507948..1508020 | aag | 33 | 33 | |||||
comp | 1508054..1508126 | aag | @3 | 33 | 33 | ||||
comp | 1508160..1508232 | aag | 130 | 130 | 130 | ||||
comp | 1508363..1509226 | CDS | 167 | 288 | |||||
1509394..1510872 | CDS | 106 | 106 | 493 | 106 | ||||
comp | 1510979..1511051 | gta | 3 | 3 | |||||
comp | 1511055..1511126 | gaa | 151 | *151 | |||||
1511278..1511366 | ctt | 113 | 113 | ||||||
1511480..1512010 | CDS | 21195 | 177 | ||||||
comp | 1533206..1534129 | CDS | 355 | 355 | 308 | ||||
comp | 1534485..1534557 | acg | 154 | 154 | 154 | ||||
comp | 1534712..1535950 | CDS | 18502 | 413 | |||||
1554453..1554638 | CDS | 303 | 303 | 62 | 303 | ||||
comp | 1554942..1555029 | agc | 673 | *673 | |||||
comp | 1555703..1556203 | CDS | 595 | *167 | |||||
1556799..1558178 | CDS | 277 | 277 | 460 | |||||
comp | 1558456..1558572 | 5s | 68 | ||||||
comp | 1558641..1561551 | 23s | 126 | ||||||
comp | 1561678..1561750 | gca | 69 | 69 | |||||
comp | 1561820..1561893 | atc | 105 | ||||||
comp | 1561999..1563570 | 16s | 189 | 189 | 189 | ||||
1563760..1563948 | CDS | 19274 | 63 | ||||||
comp | 1583223..1584392 | CDS | 151 | 151 | 390 | 151 | |||
comp | 1584544..1584628 | ttg | + | 17 | 17 | ||||
comp | 1584646..1584730 | ttg | 2 ttg | 28 | 28 | ||||
comp | 1584759..1584829 | tgc | 2 ttc | 26 | 26 | ||||
comp | 1584856..1584931 | cac | 2 atgf | 13 | 13 | ||||
comp | 1584945..1585015 | tgg | 4 | 4 | |||||
comp | 1585020..1585101 | tac | 8 | 8 | |||||
comp | 1585110..1585182 | ttc | 6 | 6 | |||||
comp | 1585189..1585262 | gac | 3 | 3 | |||||
comp | 1585266..1585339 | atgf | 9 | 9 | |||||
comp | 1585349..1585436 | tca | 42 | 42 | |||||
comp | 1585479..1585550 | gaa | 258 | *258 | |||||
comp | 1585809..1585899 | agc | 2 | 2 | |||||
comp | 1585902..1585975 | atc | 3 | 3 | |||||
comp | 1585979..1586049 | gga | 14 | 14 | |||||
comp | 1586064..1586136 | ttc | 17 | 17 | |||||
comp | 1586154..1586227 | atgf | 11 | 11 | |||||
comp | 1586239..1586312 | atgi | 12 | 12 | |||||
comp | 1586325..1586398 | atg | 36 | 36 | |||||
comp | 1586435..1586508 | cca | 6 | 6 | |||||
comp | 1586515..1586588 | cgt | 5 | 5 | |||||
comp | 1586594..1586679 | tta | 15 | 15 | |||||
comp | 1586695..1586766 | ggc | 4 | 4 | |||||
comp | 1586771..1586843 | aca | 11 | 11 | |||||
comp | 1586855..1586936 | cta | 12 | 12 | |||||
comp | 1586949..1587021 | aaa | 2 | 2 | |||||
comp | 1587024..1587096 | gta | 157 | 157 | |||||
comp | 1587254..1588681 | CDS | 539 | 476 | |||||
comp | 1589221..1590557 | CDS | 156 | 156 | 446 | 156 | |||
comp | 1590714..1590830 | 5s | 68 | ||||||
comp | 1590899..1593809 | 23s | 126 | ||||||
comp | 1593936..1594008 | gca | 69 | 69 | |||||
comp | 1594078..1594151 | atc | 105 | ||||||
comp | 1594257..1595828 | 16s | 581 | *581 | |||||
comp | 1596410..1597276 | CDS | 189853 | *289 | |||||
comp | 1787130..1788440 | CDS | 298 | 298 | 437 | 298 | |||
comp | 1788739..1788855 | 5s | 68 | ||||||
comp | 1788924..1791834 | 23s | @4 | 208 | |||||
comp | 1792043..1793614 | 16s | 436 | *436 | |||||
comp | 1794051..1794596 | CDS | -8 | *182 | |||||
comp | 1794589..1795436 | CDS | 138 | 138 | 283 | 138 | |||
comp | 1795575..1795648 | gac | 3 | 3 | |||||
comp | 1795652..1795724 | gta | 2 | 2 | |||||
comp | 1795727..1795800 | cgt | 35 | 35 | |||||
comp | 1795836..1795907 | ggc | 19 | 19 | |||||
comp | 1795927..1796000 | cca | 3 | 3 | |||||
comp | 1796004..1796076 | aac | 7 | ||||||
comp | 1796084..1796200 | 5s | 68 | ||||||
comp | 1796269..1799179 | 23s | 208 | ||||||
comp | 1799388..1800959 | 16s | 501 | *501 | |||||
comp | 1801461..1802087 | CDS | *209 |
lbu cumuls[modifier | modifier le wikicode]
- Lien tableur: lbu cumuls
opérons | Fréquences intercalaires tRNAs | Fréquences intercalaires cds | Fréquences aas cds | ||||||||
---|---|---|---|---|---|---|---|---|---|---|---|
effectif | gammes | sans rRNAs | avec rRNAs | gammes | cds | gammes | cdsd | gammes | cdsa | ||
avec rRNA | opérons | 9 | 1 | 0 | 0 | 1 | 0 | 1 | 0 | 100 | 5 |
16 23 5s 0 | 2 | 20 | 33 | 9 | 50 | 2 | 20 | 0 | 200 | 11 | |
16 atc gca | 5 | 40 | 11 | 3 | 100 | 12 | 40 | 2 | 300 | 19 | |
16 23 5s a | 2 | 60 | 2 | 0 | 150 | 11 | 60 | 3 | 400 | 11 | |
max a | 7 | 80 | 0 | 5 | 200 | 14 | 80 | 3 | 500 | 11 | |
a doubles | 0 | 100 | 0 | 0 | 250 | 3 | 100 | 4 | 600 | 2 | |
autres | 0 | 120 | 0 | 0 | 300 | 6 | 120 | 2 | 700 | 1 | |
total aas | 26 | 140 | 0 | 1 | 350 | 2 | 140 | 5 | 800 | 2 | |
sans | opérons | 23 | 160 | 1 | 0 | 400 | 2 | 160 | 5 | 900 | 1 |
1 aa | 16 | 180 | 0 | 0 | 450 | 1 | 180 | 1 | 1000 | 1 | |
max a | 26 | 200 | 0 | 0 | 500 | 1 | 200 | 2 | 1100 | 0 | |
a doubles | 3 | 1 | 0 | 10 | 5 | 0 | |||||
total aas | 72 | 48 | 18 | 64 | 32 | 64 | |||||
total aas | 98 | ||||||||||
remarques | |||||||||||
avec jaune | moyenne | 138 | 320 | ||||||||
variance | 81 | 182 | |||||||||
sans jaune | moyenne | 14 | 29 | 159 | 114 | 275 | |||||
variance | 12 | 29 | 85 | 50 | 122 |
lbu tRNA-cds[modifier | modifier le wikicode]
- Note: intercalaires prélevés de la colonne cds de lbu opérons dans un bloc de tRNAs uniquement. Le début du bloc est dans l'ordre des adresses, deb intercalaire entre le cds et le 1er tRNA dd bloc, fin entre le dernier tRNA et le cds terminal. J'ai procédé, dans les colonnes petit et grand, à la réorientation des blocs d'après la constatation que les blocs à rRNA ont leurs cds de début et de fin sont orientés du cds-16s au 5s-tRNAs-cds, l'intercalaire cds-16s étant plus grands que l'intercalaire avec le cds terminal. En tête de colonne est le % du nombre des intercalaires inférieurs à 201 pbs.
lbu 78 61 48 91 deb fin deb fin grand petit grand petit 30 118 94 23 75 62 94 23 54 109 75 62 94 23 118 30 56 125 54 109 109 54 109 54 57 170 106 113 113 106 125 56 61 341 30 118 118 30 170 57 69 181 56 125 125 56 341 61 75 62 270 130 155 117 75 62 82 296 276 134 157 151 181 69 94 23 355 154 170 57 296 82 98 614 117 155 181 69 204 98 98 204 151 157 195 128 614 98 106 113 57 170 204 98 113 106 117 155 69 181 222 188 155 117 128 195 128 195 270 130 195 128 134 787 98 204 276 134 270 130 151 157 188 222 296 82 276 134 157 656 82 296 341 61 787 134 188 222 61 341 355 154 157 151 270 130 530 356 530 356 355 154 276 134 98 614 614 98 656 157 303 673 157 656 656 157 222 188 355 154 303 673 673 303 673 303 530 356 134 787 787 134 530 356
- Comparaison cds-cds tRNA-cds: deb fin, c'est l'ordre des adresses et grand petit l'ordre après réorientation. Leur pourcentage est calculé par rapport à la colonne, c'est à dire la moitié du total des tRNA-cds.
bacilli cds total total <0 0-200 201-370 371-600 >600 deb fin grand petit lbu 1,838 46 32 9 1 4 18 14 11 21 lbu ‰ 696 196 22 87 783 609 478 913
lbu blocs[modifier | modifier le wikicode]
- Lien tableur: lbu blocs
cds | 277’ | cds | 156 | cds | 298 | ||
5s | 68 | 5s | 68 | 5s | 68 | ||
23s | 126 | 23s | 126 | 23s | 208 | ||
gca | 69 | gca | 69 | 16s | 436 | ||
atc | 105 | atc | 105 | cds | -8 | ||
16s | 189’ | 16s | 581 | cds | 138 | ||
cds | cds | gac | 3 | ||||
4aas | * | ||||||
cds | 518 | cds | 613’ | aac | 7 | ||
16s | 106 | 16s | 105 | 5s | 68 | ||
atc | 69 | atc | 69 | 23s | 208 | ||
gca | 127 | gca | 126 | 16s | 501 | ||
23s | 68 | 23s | 69 | cds | |||
5s | 208’ | 5s | 87 | ||||
cds | cds | ||||||
cds | 161 | cds hp | 451 | cds | 200 | ||
gta | 3 | 16s | 209 | gac | 26 | ||
3aas | * | 23s | 69 | 3aas | * | ||
aac | 7 | 5s | 275 | ggc | 36 | ||
5s | 69 | cds hp | 5s | 68 | |||
23s | 126 | 23s | 208 | ||||
gca | 69 | 16s | 153 | ||||
atc | 105 | cds | |||||
16s | 547’ | ||||||
cds |
lbu remarques[modifier | modifier le wikicode]
- Les indices des bacilli
*Remarques : Ce génome se distingue par un indice 4 fois supérieur des gènes de tRNAs par rapport à ceux du total des bacilli. @1 Les gènes de tRNA se terminant par g et t sont rares chez les et ont un indice total de 5 par génome. Ce génome en a 20. La plupart sont isolés, seuls ou dans de petits clusters sans rRNA. aag se distingue par sa fréquence élevée, 6, et surtout par sa répétition de 5 dans un seul cluster. Cependant chez les bacilli les gènes présents ont un indice plus élevés que les très rares. J’ai repéré 4 groupes : indice présents absents rares moyens 99>ind>43 aag6 cgg agg ctt2 ctg2 (ctc gtc) tcg acg (acc tcc) rares 26>ind>11 ggg ccg cag gag act2 (gcc) très rares 7,9>ind>0,6 gtg gcg ttt cct (ccc ata) nuls 0,6>ind autres xxt, tous absents @2 Les clusters sans rRNAs sont beaucoup plus longs que ceux avec rRNA, 26 15 5, contre 6 5 5. Les petits clusters sont en grande partie ceux de @1. Les clusters 26 et 15 n’ont pas de doublons ou très peu et se comportent comme les clusters avec rRNAs longs des bacilli (ppm bsu lmo lma* pmq ban*) : pas de répétition, pas de séquence et doublons séparés. @3 répétition de 5 de aag, voir @1 ci-dessus. @4 5 blocs 635 et 4 blocs 6-atcgca-35 avec des intercalaires identiques. Très peu de gènes tRNA à la suite de ces blocs (6 5 5 ) contrairement aux autres bacilli étudiés qui dépassent les 21 aas : ppm bsu lmo lma* pmq ban*. Séquences des doubles (indiqués par le signe + dans le tableau): Les doubles, peu nombreux, se trouvent dans les clusters sans rRNAs. pas de séquences mais une répétition de 5 chez les gènes rares. Voir ci-dessus @2.
lbu distribution[modifier | modifier le wikicode]
- Lien tableur: lbu distribution
- Notes:
- - duplicata: ttg2 aag5
|
|
lbu. Intergen51[modifier | modifier le wikicode]
Intergen51. lbu. Le génome[modifier | modifier le wikicode]
- lbu Le prélèvement: Abacilli
- Le nom et le lien NCBI: lbu, Lactobacillus delbrueckii subsp. bulgaricus ATCC BAA-365, NCBI [25], date 13.2.22.
- lbu La longueur totale des intercalaires, longueur du génome et taux intercalaires/génome:
Nom intercals génome taux en % lbu 222,489 1,856,951 12.0
lbu données intercalaires[modifier | modifier le wikicode]
- Lien tableur: lbu données intercalaires
- Lien sauvegarde NCBI: Abacilli
lbu autres intercalaires aas[modifier | modifier le wikicode]
- Lien tableur: lbu autres intercalaires aas
- Lien sauvegarde NCBI: Abacilli
Intergen51. lbu. Les différents types d'intercalaires[modifier | modifier le wikicode]
- Lien au tableur: Intergen51. lbu les différents types d'intercalaires.
- Légende:
- - S pour intercalaire CDS-CDS et R pour tRNA-CDS,
- - c pour intercalaire continu (les 2 gènes sont sur le même brin) et x pour discontinu (les 2 gènes sont sur 2 brins différents, le brin et son complément)
- - %reste = 100*reste/total, le reste étant ce qui reste du total après la fin du diagramme, gamme.
- - %t30 = 100*t30/total, t30 étant le total des fréquences 10 20 30
- - %t5 = 100*t/total, t5 étant le total des fréquences de -1 à -5 dans le diagramme des S-.
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
Intergen51. lbu. Les diagrammes CDS-CDS positifs[modifier | modifier le wikicode]
- Lien tableur: Les diagrammes
- Diagrammes des gamma: lbu présente 2 diagrammes
- - fc40, CDS-CDS continu, fréquence unitaire en abscisses et effectif en ordonnées
- - fx%, CDS-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et pourcentage en ‰ par rapport au total, en ordonnées.
- Équations des courbes de tendance en pour 1000: colonnes %fx %fc
Courbes de tendances pour les diagrammes en pour 1000 Calculs des f.41 lbu R2 x3 x2 x c Inflexion poly3 x c 0.582 5.83E-06 -3.82E-03 5.83E-01 17.0 fx1 abscisse 296.7 162.1 0.815 -5.52E-06 4.32E-03 -1.12E+00 108.0 fc1 ordonnée 11.3 23.2 0.837 -2.64E-06 2.35E-03 -7.67E-01 101.0 fx41 0.936 1.54E-06 -7.49E-04 -4.16E-02 43.1 fc41
Intergen51. lbu. Les CDS-CDS négatifs[modifier | modifier le wikicode]
Sous-totaux lbu totale fréquence x- c- x- c- - 1 1 80 4 4140 - 2 1 0 85 11 - 3 0 1 3 12 - 4 4 55 717 10938 - 5 0 0 5 19 sp6 14 144 1642 8424 total 20 280 2,456 23,544 reste 6 0 264 420 s6 3 1 361 41 s7 0 19 321 1438 s8 5 124 696 6525 rappot s1-5 4/2/1 4.0 0.7 8.4 2.6 % / sp6 s6/sp6 21.4 0.7 22.0 0.5 s7/sp6 0.0 13.2 19.5 17.1 s8/sp6 35.7 86.1 42.4 77.5 reste/sp6 42.9 0.0 16.1 5.0 total s1-5 6 136 814 15120 % / total %s1-5 30.0 48.6 33.1 64.2 %sp6 70.0 51.4 66.9 35.8
Intergen51. lbu. Les intercalaires des blocs[modifier | modifier le wikicode]
- Le détail
RNA-RNA c x CDS-RNA c x 23s 5s 9 CDS 16s 6 3 16s 23s 4 5s CDS 4 2 16s tRNA 5 16 CDS tRNA 23s 5 CDS 5s 5s tRNA 3 23s CDS tRNA in 5 CDS 23s tRNA contig 13 5s 16s tRNA hors 48 1 16s16s tRNA 16s 23s tRNA tRNA 5s 16s 5s 5s 23s 5s 5s total 92 1 total 10 5
- Les rares voir gamma pour la longueur des intercalaires
- Les tRNA-CDS compris, comparaison dans le clade et dans l'étude.
Intergen51. lbu. Les intercalaires tRNA-tRNA extra bloc[modifier | modifier le wikicode]
- Lien tableur: Intergen51. lbu. Les intercalaires tRNA-tRNA extra bloc
contig | hors | hors | hors | |||||||
---|---|---|---|---|---|---|---|---|---|---|
inter | aa | inter | aa | inter | aa | inter | aa | |||
3 | gta | 4 | ggc | 34 | aag | 17 | ttg | |||
138 | gaa | 108 | ccg | 33 | aag | 28 | ttg | |||
6 | atgj | ** | ggc | 33 | aag | 29 | tgc | |||
8 | tcc | 5 | tac | 33 | aag | 13 | cac | |||
** | aac | ** | caa | ** | aag | 4 | tgg | |||
26 | gac | 5 | cag | 3 | gta | 8 | tac | |||
3 | gaa | ** | gag | x151 | gaa | 6 | ttc | |||
2 | gta | 3 | aac | ** | ctt | 3 | gac | |||
35 | cgt | 24 | cca | 9 | atgf | |||||
** | ggc | 30 | ggc | 42 | tca | |||||
3 | gac | 2 | cgt | 261 | gaa | |||||
2 | gta | 3 | gta | 2 | agc | |||||
35 | cgt | 42 | gaa | 3 | atc | |||||
19 | ggc | 9 | tca | 14 | gga | |||||
3 | cca | 3 | atgf | 17 | ttc | |||||
** | aac | 6 | gac | 11 | atgf | |||||
8 | ttc | 12 | atgi | |||||||
4 | tac | 36 | atgj | |||||||
13 | tgg | 6 | cca | |||||||
29 | cac | 5 | cgt | |||||||
28 | tgc | 15 | tta | |||||||
** | ttg | 4 | ggc | |||||||
11 | aca | |||||||||
12 | cta | |||||||||
2 | aaa | |||||||||
** | gta | |||||||||
- |
ban* Bacillus anthracis strain 2002013094[modifier | modifier le wikicode]
- Attention: la notation KEGG pour ce génome n'existe pas. Elle est remplacée par ban*. Mais par commodité j'ai mis ban pour la suite. Ce n'est pas le génome ban de KEGG Bacillus anthracis Ames
ban opérons[modifier | modifier le wikicode]
- Liens: gtRNAdb [26], NCBI [27], génome [orgn]
- Lien tableur: ban opérons
- Légende: cdsa: cds aas, cdsj: cdsa sans jaune, cdsd: cdsa dirigé
35.1%GC | 15.8.19 Paris | 112 | doubles | intercal | cds | aa | avec aa | cdsa | cdsd |
---|---|---|---|---|---|---|---|---|---|
618142..618366 | CDS | 188 | 188 | 75 | 188 | ||||
618555..618627 | gtc | 419 | *419 | ||||||
comp | 619047..619235 | CDS | 63 | ||||||
comp | 1102183..1102602 | CDS | 130 | 130 | 140 | 130 | |||
comp | 1102733..1102804 | gaa | + | 1 | 1 | ||||
comp | 1102806..1102880 | aac | 2 aca | 8 | 8 | ||||
comp | 1102889..1102965 | atc | 2 tca | 11 | 11 | ||||
comp | 1102977..1103047 | tgg | 6 | 6 | |||||
comp | 1103054..1103126 | aca | 9 | 9 | |||||
comp | 1103136..1103211 | ttc | 9 | 9 | |||||
comp | 1103221..1103296 | gac | 4 | 4 | |||||
comp | 1103301..1103377 | atgf | 20 | 20 | |||||
comp | 1103398..1103490 | tca | 54 | 54 | |||||
comp | 1103545..1103637 | tca | 20 | 20 | |||||
comp | 1103658..1103730 | gca | 16 | 16 | |||||
comp | 1103747..1103820 | cca | 10 | 10 | |||||
comp | 1103831..1103904 | cgt | 3 | 3 | |||||
comp | 1103908..1103996 | tta | 16 | 16 | |||||
comp | 1104013..1104087 | ggc | 29 | 29 | |||||
comp | 1104117..1104197 | cta | 22 | 22 | |||||
comp | 1104220..1104295 | cac | 9 | 9 | |||||
comp | 1104305..1104380 | aca | 4 | 4 | |||||
comp | 1104385..1104460 | gta | 4 | ||||||
comp | 1104465..1104580 | 5s | 97 | ||||||
comp | 1104678..1107604 | 23s | 141 | ||||||
comp | 1107746..1109299 | 16s | 694 | *694 | |||||
1109994..1113038 | CDS | *1015 | |||||||
comp | 1306706..1307848 | CDS | 198 | 198 | 381 | ||||
comp | 1308047..1308120 | gga | 115 | 115 | 115 | ||||
comp | 1308236..1308889 | CDS | 218 | ||||||
1312025..1312345 | CDS | 207 | 207 | 107 | 207 | ||||
comp | 1312553..1312637 | ttg | 10 | 10 | |||||
comp | 1312648..1312718 | tgc | 14 | 14 | |||||
comp | 1312733..1312807 | ggc | 5 | 5 | |||||
comp | 1312813..1312887 | caa | 63 | 63 | |||||
comp | 1312951..1313026 | cac | 19 | 19 | |||||
comp | 1313046..1313119 | tgg | 7 | 7 | |||||
comp | 1313127..1313210 | tac | 17 | 17 | |||||
comp | 1313228..1313303 | gta | 5 | 5 | |||||
comp | 1313309..1313383 | gaa | 24 | 24 | |||||
comp | 1313408..1313480 | acc | 4 | 4 | |||||
comp | 1313485..1313559 | aac | 9 | ||||||
comp | 1313569..1313684 | 5s | 96 | ||||||
comp | 1313781..1316709 | 23s | 141 | ||||||
comp | 1316851..1318405 | 16s | 386 | *386 | |||||
1318792..1319148 | CDS | 119 | |||||||
1556278..1556507 | CDS | 57 | 57 | 77 | 57 | ||||
comp | 1556565..1556680 | 5s | 49 | ||||||
comp | 1556730..1560126 | 23s | 173 | ||||||
comp | 1560300..1562132 | 16s | 476 | *476 | |||||
1562609..1563322 | CDS | 238 | |||||||
> | 1566949..1567219 | CDS | 99 | 99 | 90 | 99 | |||
comp | 1567319..1567434 | 5s | 46 | ||||||
comp | 1567481..1570409 | 23s | 142 | ||||||
comp | 1570552..1572115 | 16s | 451 | *451 | |||||
1572567..1574498 | CDS | *644 | |||||||
1579539..1580615 | CDS | 14 | 14 | 359 | 14 | ||||
comp | 1580630..1580745 | 5s | 45 | ||||||
comp | 1580791..1583912 | 23s | 153 | ||||||
comp | 1584066..1585720 | 16s | 294 | 294 | |||||
comp | 1586015..1587520 | CDS | *502 | ||||||
comp | 1600693..1601166 | CDS | 174 | 174 | 158 | ||||
comp | 1601341..1601416 | gac | 3 | 3 | |||||
comp | 1601420..1601496 | atgf | 12 | ||||||
comp | 1601509..1601624 | 5s | @1 | 46 | |||||
comp | 1601671..1604598 | 23s | 141 | ||||||
comp | 1604740..1606294 | 16s | 75 | ||||||
comp | 1606370..1606440 | gga | 1 | 1 | |||||
comp | 1606442..1606518 | cca | + | 4 | 4 | ||||
comp | 1606523..1606599 | cgt | Séquence 10 | 3 | 3 | ||||
comp | 1606603..1606691 | tta | 16 | 16 | |||||
comp | 1606708..1606782 | ggc | 29 | 29 | |||||
comp | 1606812..1606892 | cta | 14 | 14 | |||||
comp | 1606907..1606982 | aaa | 5 | 5 | |||||
comp | 1606988..1607062 | caa | 87 | *87 | |||||
comp | 1607150..1607225 | gac | 46 | 46 | |||||
comp | 1607272..1607347 | gta | 4 | 4 | |||||
comp | 1607352..1607426 | gaa | 1 | 1 | |||||
comp | 1607428..1607502 | aac | 2 aac | 8 | 8 | ||||
comp | 1607511..1607587 | atc | 11 | 11 | |||||
comp | 1607599..1607669 | tgg | 6 | 6 | |||||
comp | 1607676..1607748 | aca | 9 | 9 | |||||
comp | 1607758..1607833 | ttc | 8 | 8 | |||||
comp | 1607842..1607917 | gac | 4 | 4 | |||||
comp | 1607922..1607998 | atgf | 20 | 20 | |||||
comp | 1608019..1608111 | tca | 2 tca | 54 | 54 | ||||
comp | 1608166..1608258 | tca | 20 | 20 | |||||
comp | 1608279..1608351 | gca | 16 | 16 | |||||
comp | 1608368..1608441 | cca | 10 | 10 | |||||
comp | 1608452..1608525 | cgt | 3 | 3 | |||||
comp | 1608529..1608617 | tta | 16 | 16 | |||||
comp | 1608634..1608708 | ggc | 29 | 29 | |||||
comp | 1608738..1608818 | cta | 13 | 13 | |||||
comp | 1608832..1608907 | aaa | 5 | 5 | |||||
comp | 1608913..1608987 | caa | 87 | *87 | |||||
comp | 1609075..1609150 | gac | 46 | 46 | |||||
comp | 1609197..1609272 | gta | 4 | 4 | |||||
comp | 1609277..1609351 | gaa | 8 | 8 | |||||
comp | 1609360..1609450 | agc | 3 | 3 | |||||
comp | 1609454..1609528 | aac | 114 | 114 | 114 | ||||
comp | 1609643..1610101 | CDS | 153 | ||||||
comp | 1702642..1703788 | CDS | 114 | 114 | 382 | 114 | |||
comp | 1703903..1703975 | gca | 10 | 10 | |||||
comp | 1703986..1704057 | ggc | 5 | 5 | |||||
comp | 1704063..1704138 | aaa | 5 | 5 | |||||
comp | 1704144..1704218 | caa | 65 | 65 | |||||
comp | 1704284..1704366 | tac | 17 | 17 | |||||
comp | 1704384..1704459 | gta | 5 | 5 | |||||
comp | 1704465..1704539 | gaa | 24 | 24 | |||||
comp | 1704564..1704636 | acc | 4 | 4 | |||||
comp | 1704641..1704715 | aac | 9 | ||||||
comp | 1704725..1704840 | 5s | 82 | ||||||
comp | 1704923..1707851 | 23s | 141 | ||||||
comp | 1707993..1709545 | 16s | 223 | 223 | |||||
comp | 1709769..1709987 | CDS | 73 | ||||||
comp | 1767157..1767618 | CDS | 206 | 206 | 154 | 206 | |||
comp | 1767825..1767940 | 5s | 45 | ||||||
comp | 1767986..1770913 | 23s | 141 | ||||||
comp | 1771055..1772608 | 16s | 372 | *372 | |||||
comp | 1772981..1774480 | CDS | *500 | ||||||
comp | 1787717..1790188 | CDS | 259 | 259 | *824 | ||||
comp | 1790448..1790519 | gaa | 13 | 13 | |||||
comp | 1790533..1790606 | atgj | @2 | 160 | 160 | 160 | |||
comp | 1790767..1791249 | CDS | 161 | ||||||
comp | 1820538..1820717 | CDS | 190 | 190 | 60 | 190 | |||
comp | 1820908..1821023 | 5s | 44 | ||||||
comp | 1821068..1823996 | 23s | 77 | ||||||
comp | 1824074..1824149 | gca | 8 | 8 | |||||
comp | 1824158..1824234 | atc | 130 | ||||||
comp | 1824365..1825919 | 16s | 217 | 217 | |||||
comp | 1826137..1826406 | CDS | 90 | ||||||
comp | 1832600..1832992 | CDS | 166 | 166 | 131 | ||||
comp | 1833159..1833251 | tca | 156 | 156 | 156 | ||||
comp | 1833408..1834682 | CDS | 425 | ||||||
1839668..1840669 | CDS | 34 | 34 | 334 | 34 | ||||
comp | 1840704..1840819 | 5s | 44 | ||||||
comp | 1840864..1843791 | 23s | 76 | ||||||
comp | 1843868..1843943 | gca | 8 | 8 | |||||
comp | 1843952..1844028 | atc | 130 | ||||||
comp | 1844159..1845713 | 16s | 240 | 240 | |||||
comp | 1845954..1848425 | CDS | *824 | ||||||
1873838..1875127 | CDS | 139 | 139 | 430 | 139 | ||||
1875267..1875342 | aaa | 13 | 13 | ||||||
1875356..1875427 | gaa | 21 | 21 | ||||||
1875449..1875524 | gac | 41 | 41 | ||||||
1875566..1875638 | ttc | 403 | *403 | ||||||
1876042..1876749 | CDS | 236 | |||||||
comp | 2217640..2217846 | CDS | 205 | 205 | 69 | 205 | |||
2218052..2218130 | cgg | 255 | 255 | ||||||
2218386..2219693 | CDS | 436 | |||||||
comp | 2428815..2429495 | CDS | 404 | *404 | 227 | ||||
2429900..2431456 | 16s | 139 | |||||||
2431596..2434524 | 23s | 97 | |||||||
2434622..2434737 | 5s | 4 | |||||||
2434742..2434817 | gta | + | 4 | 4 | |||||
2434822..2434897 | aca | 2 cta | 9 | 9 | |||||
2434907..2434982 | cac | 2 aca | 22 | 22 | |||||
2435005..2435085 | cta | 29 | 29 | ||||||
2435115..2435189 | ggc | 16 | 16 | ||||||
2435206..2435294 | tta | 3 | 3 | ||||||
2435298..2435371 | cgt | 10 | 10 | ||||||
2435382..2435455 | cca | 16 | 16 | ||||||
2435472..2435544 | gca | 20 | 20 | ||||||
2435565..2435657 | tca | 54 | 54 | ||||||
2435712..2435805 | cta | 20 | 20 | ||||||
2435826..2435902 | atgf | 1 | 1 | ||||||
2435904..2435979 | gac | 12 | 12 | ||||||
2435992..2436067 | ttc | 14 | 14 | ||||||
2436082..2436157 | aca | 10 | 10 | ||||||
2436168..2436243 | aaa | 13 | 13 | ||||||
2436257..2436327 | gga | 10 | 10 | ||||||
2436338..2436414 | atc | 7 | 7 | ||||||
2436422..2436496 | aac | 7 | 7 | ||||||
2436504..2436594 | agc | 6 | 6 | ||||||
2436601..2436672 | gaa | 59 | 59 | 59 | |||||
2436732..2436842 | CDS | 37 | |||||||
2798971..2799474 | CDS | 109 | 109 | 168 | 109 | ||||
2799584..2799657 | gga | 1 | 1 | ||||||
2799659..2799735 | aga | 407 | *407 | ||||||
2800143..2800343 | CDS | 67 | |||||||
comp | 2991608..2992366 | CDS | 242 | 242 | 253 | ||||
2992609..2992682 | atgi | 221 | 221 | 221 | |||||
2992904..2993515 | CDS | 204 |
ban cumuls[modifier | modifier le wikicode]
- Lien tableur: ban cumuls
- Note du 16.11.20: attention le @1 doit être intégré dans les rRNA et non dans les sans. Refaire les calculs.
opérons | Fréquences intercalaires tRNAs | Fréquences intercalaires cds | Fréquences aas cds | ||||||||
---|---|---|---|---|---|---|---|---|---|---|---|
effectif | gammes | sans rRNAs | avec rRNAs | gammes | cds | gammes | cdsd | gammes | cdsa | ||
avec rRNA | opérons | 11 | 1 | 3 | 2 | 1 | 0 | 1 | 0 | 100 | 10 |
16 23 5s 0 | 4 | 20 | 25 | 47 | 50 | 2 | 20 | 1 | 200 | 9 | |
16 atc gca | 2 | 40 | 3 | 6 | 100 | 3 | 40 | 1 | 300 | 6 | |
16 23 5s a | 5 | 60 | 4 | 2 | 150 | 6 | 60 | 2 | 400 | 4 | |
max a | 21 | 80 | 0 | 2 | 200 | 7 | 80 | 0 | 500 | 4 | |
a doubles | 2 | 100 | 2 | 0 | 250 | 8 | 100 | 1 | 600 | 1 | |
autres | 0 | 120 | 0 | 0 | 300 | 3 | 120 | 4 | 700 | 1 | |
total aas | 66 | 140 | 0 | 0 | 350 | 0 | 140 | 2 | 800 | 0 | |
sans | opérons | 9 | 160 | 0 | 0 | 400 | 2 | 160 | 2 | 900 | 2 |
1 aa | 5 | 180 | 0 | 0 | 450 | 3 | 180 | 0 | 1000 | 0 | |
max a | 33 | 200 | 0 | 0 | 500 | 0 | 200 | 2 | 1100 | 1 | |
a doubles | 1 | 0 | 0 | 0 | 4 | 0 | |||||
total aas | 46 | 37 | 59 | 34 | 19 | 38 | |||||
total aas | 112 | ||||||||||
remarques | 2 | ||||||||||
avec jaune | moyenne | 18 | 15 | 232 | 132 | 274 | |||||
variance | 21 | 14 | 143 | 62 | 238 | ||||||
sans jaune | moyenne | 14 | 165 | 191 | |||||||
variance | 14 | 71 | 124 |
ban tRNA-cds[modifier | modifier le wikicode]
- Note: intercalaires prélevés de la colonne cds de ban opérons dans un bloc de tRNAs uniquement. Le début du bloc est dans l'ordre des adresses, deb intercalaire entre le cds et le 1er tRNA dd bloc, fin entre le dernier tRNA et le cds terminal. J'ai procédé, dans les colonnes petit et grand, à la réorientation des blocs d'après la constatation que les blocs à rRNA ont leurs cds de début et de fin sont orientés du cds-16s au 5s-tRNAs-cds, l'intercalaire cds-16s étant plus grands que l'intercalaire avec le cds terminal. En tête de colonne est le % du nombre des intercalaires inférieurs à 201 pbs.
ban 63 38 25 75 deb fin deb fin grand petit grand petit 109 407 198 115 166 156 407 109 139 403 166 156 198 115 198 115 166 156 259 160 242 221 403 139 188 419 242 221 255 205 166 156 198 115 205 255 259 160 259 160 205 255 139 403 403 139 419 188 242 221 109 407 407 109 255 205 259 160 188 419 419 188 242 221
- Comparaison cds-cds tRNA-cds: deb fin, c'est l'ordre des adresses et grand petit l'ordre après réorientation. Leur pourcentage est calculé par rapport à la colonne, c'est à dire la moitié du total des tRNA-cds.
bacilli cds total total <0 0-200 201-370 371-600 >600 deb fin grand petit ban 5,700 16 8 5 3 5 3 2 6 ban ‰ 500 312.5 187.5 0 625 375 250 750
ban blocs[modifier | modifier le wikicode]
- Lien tableur: ban blocs
cds | 694’ | cds | 386’ | cds | 114 | ||
16s | 141 | 16s | 141 | aac | * | ||
23s | 97 | 23s | 96 | 31aas | 1 | ||
5s | 4 | 5s | 9 | gga | 75 | ||
gta | * | aac | * | 16s | 141 | ||
17aas | 1 | 9aas | 10 | 23s | 46 | ||
gaa | 130 | ttg | 207’ | 5s | 12 | ||
cds | cds | atgf | 3 | ||||
gac | 174 | ||||||
cds | 223 | cds | 404’ | cds | |||
16s | 141 | 16s | 139 | ||||
23s | 82 | 23s | 97 | cds | 217 | 240 | |
5s | 9 | 5s | 4 | 16s | 130 | 130 | |
aac | * | gta | 4 | atc | 8 | 8 | |
7aas | 10 | 19aas | * | gca | 77 | 76 | |
gca | 114 | gaa | 59 | 23s | 44 | 44 | |
cds | cds | 5s | 190 | 34’ | |||
cds | |||||||
cds | 476’ | 451’ | 294 | 372 | |||
16s | 173 | 142 | 153 | 141 | |||
23s | 49 | 46 | 45 | 45 | |||
5s | 57’ | 99’ | 14’ | 206 | |||
cds |
ban séquences[modifier | modifier le wikicode]
- Lien au tableau ban opérons
- Lien tableur: ban séquences
- Lien bsu-lmo
- Légende: 33 aas, cluster à 33 gènes de tRNA
- - répétitions de séquence intra bloc: Dans le bloc 33aas uniquement, il y a une séquence de 10aas répétée. Elle est divisée de 2 séquences de 5 chacune, cyan et bleu.
- - répétitions de séquence entre blocs
- - entre les clusters 11aas et 9aas: une séquence de 5 se répète, le jaune.
- - entre les clusters 33aas 21aas et 19aas je repère 3 grandes séquences qui se répètent, contenant des sous séquences qui se répètent aussi: séquence de 16 (cadre solide) commune à 33aas et 19aas, séquence de 15 (cadre en tirets) commune à 21aas et 19aas et une séquence de 12 commune aux 3 clusters et composée de la séquence 5 cyan et d'une séquence de 7aas (rouge) contenant atgf et un doublet tca. Il faut noter ici que tca est modifié en cta alors que les intercalaires atgf-cta-tca et atgf-tca-tca ne changement pas, 20-54. C'est que cta et tca sont des tRNAs de même longueur, seule une mutation ponctuelle est en cause.
- - entre le cluster 33aas et 21aas existe un bloc commun de 3 gènes gaa-agc-acc qu'on ne peut mettre en parallèle. A-t-il un rôle important dans les recombinaisons?
- - Les intercalaires qui changent: la plupart des intercalaires se répètent comme les gènes sauf les intercalaires de aca-ttc-gac-atgf qui sont constants dans les clusters 33aas et 19aas et diffèrent dans le 21aas. De même pour cca-cgt (cyan) qui diffèrent dans 33as mais restent constants entre les 3 clusters. Ce qui différencie les 2 séquences cyan de 33aas. En fin de 33aas le triplet gaa-agc-aac se répète au début de 21aas mais avec des intercalaires changeant, 8-3 contre 6-7. Ces changements dans les intercalaires laissent penser qu'ils se produisent lors des recombinaisons des blocs intra cluster (cyan 1 et 2 de 33aas) ou entre clusters.
33 aas | inter | 21 aas | inter | 19 aas | inter | 11 aas | inter |
---|---|---|---|---|---|---|---|
gga | 1 | ttg | 10 | ||||
cca | 4 | tgc | 14 | ||||
cgt | 3 | ggc | 5 | ||||
tta | 16 | caa | 63 | ||||
ggc | 29 | cac | 19 | ||||
cta | 14 | tgg | 7 | ||||
aaa | 5 | tac | 17 | ||||
caa | 87 | gta | 5 | ||||
gac | 46 | gaa | 6 | gaa | 24 | ||
gta | 4 | agc | 7 | acc | 4 | ||
gaa | 1 | aac | 7 | gaa | 1 | aac | |
aac | 8 | atc | 10 | aac | 8 | ||
atc | 11 | gga | 13 | atc | 11 | ||
tgg | 6 | aaa | 10 | tgg | 6 | ||
aca | 9 | aca | 14 | aca | 9 | ||
ttc | 8 | ttc | 12 | ttc | 9 | ||
gac | 4 | gac | 1 | gac | 4 | ||
atgf | 20 | atgf | 20 | atgf | 20 | ||
tca | 54 | cta | 54 | tca | 54 | 9 aas | inter |
tca | 20 | tca | 20 | tca | 20 | ||
gca | 16 | gca | 16 | gca | 16 | gca | 10 |
cca | 10 | cca | 10 | cca | 10 | ggc | 5 |
cgt | 3 | cgt | 3 | cgt | 3 | aaa | 5 |
tta | 16 | tta | 16 | tta | 16 | caa | 65 |
ggc | 29 | ggc | 29 | ggc | 29 | tac | 17 |
cta | 13 | cta | 22 | cta | 22 | gta | 5 |
aaa | 5 | cac | 9 | cac | 9 | gaa | 24 |
caa | 87 | aca | 4 | aca | 4 | acc | 4 |
gac | 46 | gta | gta | aac | |||
gta | 4 | ||||||
gaa | 8 | ||||||
agc | 3 | ||||||
aac |
ban occurrences[modifier | modifier le wikicode]
- Légende: atgi pour Ile2, atgf pour fMet et atgj pour Met
ttt | tct | tat | tgt | ||||
att | act | aat | agt | ||||
ctt | cct | cat | cgc | ||||
gtt | gct | gat | ggt | ||||
ttc | 4 | tcc | tac | 2 | tgc | 1 | |
atc | 5 | acc | 2 | aac | 6 | agc | 2 |
ctc | ccc | cac | 3 | cgt | 4 | ||
gtc | 1 | gcc | gac | 7 | ggc | 6 | |
tta | 4 | tca | 6 | taa | tga | ||
atgi | 1 | aca | 5 | aaa | 5 | aga | 1 |
cta | 5 | cca | 4 | caa | 4 | cga | |
gta | 6 | gca | 6 | gaa | 8 | gga | 4 |
ttg | 1 | tcg | tag | tgg | 3 | ||
atgf/j | 4/1 | acg | aag | agg | |||
ctg | ccg | cag | cgg | 1 | |||
gtg | gcg | gag | ggg |
ban intercalaires[modifier | modifier le wikicode]
- Légende: aa pour gène tRNA, inter aa pour intercalaire rRNA-aa
aa | gta | aac | atgf | aac | CDS |
inter aa | 4 | 9 | 12 | 9 | 404 |
5s | 97 | 96 | 46 | 82 | 139 |
23s | 141 | 141 | 141 | 141 | 97 |
16s | 694 | 386 | 75 | 223 | 4 |
CDS | CDS | CDS | gga | CDS | gta |
CDS | 57 | 99 | 14 | 206 | |
5s | 49 | 46 | 45 | 45 | |
23s | 173 | 142 | 153 | 141 | |
16s | 476 | 451 | 294 | 372 | |
CDS | |||||
CDS | 190 | 34 | |||
5s | 44 | 44 | |||
23s | 77 | 76 | |||
gca | 8 | 8 | |||
atc | 130 | 130 | |||
16s | 217 | 240 | |||
CDS |
ban remarques[modifier | modifier le wikicode]
- Liens: ban séquences, ban intercalaires, ban occurrences, indices bacilli
- Note du 16.11.20: attention le @1 doit être intégré dans les rRNA et non dans les sans. Refaire les calculs.
- Remarques:
- @1 Existence des blocs à rRNA inversés
- - Ce sont des blocs dont les gènes tRNAs se trouvent juste après le rRNA 16s au lieu d’être après le 5s ou parfois le 23s dans le sens 16s23s5s. J’en ai rencontré beaucoup dans les génomes détaillés dans ces annexes. Mais leurs présences systématiques dans les études exhaustives des fiches me laissaient penser à croire en leur existence.
- - En effet, le comportement des blocs normaux laissait penser que la juxtaposition des gènes tRNAs et du 16s était fortuite, le bloc 16s serait mobile et s’introduirait au hasard à côté d’une séquence de gènes tRNA. Dans l’étude des intercalaires entre gènes de tRNA, je voulais savoir s’il y avait une différence entre les blocs à rRNA et les blocs sans. Tout au début, je considérais les gènes de tRNA des blocs inversés comme appartenant aux blocs sans rRNA. Cependant l’intercalaire entre le 16s et le 1er aa était si faible quelquefois que cela me gênait de l’en séparer. Dans les cumuls de ce génome ban*, j’ai considéré la séquence de 33aas comme n’appartenant pas au bloc 16s adjacent. Cependant la moyenne et la variance des intercalaires sont les mêmes que celles des blocs 16s normaux.
- -Avec le génome ban* j’ai pu comparer les séquences des gènes tRNA ici et il est évident qu’avec la disposition des sous séquences et leurs intercalaires tout se passe comme si les réarrangements étaient dus à l’existence des blocs 16s. Et donc que la séquence des 33aas devait se trouver à la suite du 5s et a été déplacée par retournement, ce qui a facilité l’homogénéisation des séquences 12aas (cadres en tirets) par conversion dans les 3 blocs. Ensuite une conversion entre blocs 2 à 2 s’est faite séparément. Donc avant les conversions, il y a eu le retournement de 33aas et avant d’être 33aas, il y a eu duplication du bloc cyan+bleu.
- - Donc après cette analyse des séquences, je considérerai tous les blocs inversés comme appartenant au bloc 16s quelle que soit la distance de juxtaposition. Il reste cependant une inconnue : est-ce que l’espace entre 16s et le 1er aa est dû à notre incapacité à reconnaître une séquence fonctionnelle, ou bien effectivement dans certains rares cas li y a eu juxtaposition au hasard.
- @2 Il n’y a que 13 tRNAs sans rRNA. Tous les atgf se trouvent avec rRNA alors qu’il n’y a qu’un seul exemplaire de atgi et atgj. Voir le tableau des occurrences totales de ban* et le tableau ci-dessous pour les gènes rares.
- - Ils se répartissent en 8 clusters dont 5 ne contiennent qu’un seul gène. Trois gènes rares chez les bacilli s’y trouvent, gtc cgg aga.
- - Par comparaison les clusters à rRNAs ne contiennent que 3 gènes rares sur 99, 2 acc et tgc.
- - Le plus grand cluster à 4 gènes ressemble beaucoup au au bloc bleu du cluster 33aas, aaa gaa gac ttc contre aaa caa gac gta gaa pour le bloc bleu.
- - Au tableau des indices bacilliles 3527 gènes atg ne sont pas différenciés pour 672 génomes. Le décompte suivant montre que atgi et agj ont un indice moyen, un gène par génome, donc c’est un gène obligatoire comme l’est tgc.
- @1 Existence des blocs à rRNA inversés
Les gènes rares chez les bacilli Clusters sans rRNAs de ban* indice pour 100 génomes occurrence chez ban* tcc 108 0 aaa gaa gac ttc acc 83 2 gtc ccc 5,7 0 gga gcc 26 0 gaa atgj tgc 106 1 tca aga 108 1 cgg cga 5,4 0 gga aga agg 66 0 atgi cgg 99 1 ctc 67 0 gtc 47 1 Décompte des atg pour 678 génomes, 30.10.19 Tanger . atg indice décompte fMet 260 1762 Ile2 133 901 Met 139 941 total 3604
- Les intercalaires des clusters à rRNAs. Dans le tableau ban intercalaires, je ne mets en valeur que les intercalaires faisant intervenir les rRNAs.
- - les intercalaires 5s-23s: 4 blocs avec des gènes tRNA ont un intercalaire double des 7 autres et le bloc inversé se comporte comme les autres: 97-82 contre 49-44.
- - L'intercalaire 23s-16s: il est constant pour 7 blocs, 142-139 les 2 autres ont 10% (153) et 20% (173) de plus.
- - L'intercalaire aa-5s: il est très faible, 4-12. L’intercalaire aa-16s du bloc inversé est du même ordre que le 5s-23s et cela est du au retournement de la séquence des 33aas.
- - L'intercalaire cds-5s : sur les 6 blocs qui le portent 3 sont très faibles, 57 34 14 et les 3 autres sont moyens relativement aux cds-16s, 99 190 206, et restent orientés cds-16s-5s-cds.
- - L'intercalaire cds-16s: ils sont très élevés mais peu variables. 5 blocs ne contenant pas d'aas tournent autour de 420, 476-372, un sixième a 50% de plus, 694. Les 4 restants ont un intercalaire faible et se répartissent en 2 avec aas, 217 240, et 2 sans aas, 223 294.
- - L'homogénéité de ces blocs est comparable avec celle de bsu.
- Séquence des doubles : Très peu de doubles, si l’on ne tient pas compte de la duplication des blocs cyan et bleu de 10 aas dans le cluster à 33aas. Dans celui-ci il y a 2 doubles gac aac et une répétition tca-tca. Si l’on tient compte des aas proche du 5s, il faut ajouter atgf (double) et gac (triple). Pour le cluster 21aas aca et cta sont doubles, et pour le 19aas aca est double et tca répété. Les clusters 11aas et 9aas n’ont pas de doubles.
ban distribution[modifier | modifier le wikicode]
- Lien tableur: ban distribution
- Notes:
- - Les avant 16s, -16s, sont comptés comme les après 5s, +5s. Ils sont au nombre de 33 et ne sont pas soulignés.
- - Les 1-3aas après 5s, +5s, sont soulignés: atgf gac
- - duplicata: tca2
|
|
ban. Intergen51[modifier | modifier le wikicode]
Intergen51. ban. Le génome[modifier | modifier le wikicode]
- ban Le prélèvement: Abacilli
- Le nom et le lien NCBI: ban, Bacillus anthracis strain 2002013094 chromosome, NCBI [28], date 21.1.22.
- ban La longueur totale des intercalaires, longueur du génome et taux intercalaires/génome:
Nom intercals génome taux en % ban 749,857 5,321,900 14.1
ban données intercalaires[modifier | modifier le wikicode]
- Lien tableur: ban données intercalaires
- Lien sauvegarde NCBI: Abacilli
ban autres intercalaires aas[modifier | modifier le wikicode]
- Lien tableur: ban autres intercalaires aas
- Lien sauvegarde NCBI: Abacilli
Intergen51. ban. Les différents types d'intercalaires[modifier | modifier le wikicode]
- Lien au tableur: Intergen51. ban les différents types d'intercalaires.
- Légende:
- - S pour intercalaire CDS-CDS et R pour tRNA-CDS,
- - c pour intercalaire continu (les 2 gènes sont sur le même brin) et x pour discontinu (les 2 gènes sont sur 2 brins différents, le brin et son complément)
- - %reste = 100*reste/total, le reste étant ce qui reste du total après la fin du diagramme, gamme.
- - %t30 = 100*t30/total, t30 étant le total des fréquences 10 20 30
- - %t5 = 100*t/total, t5 étant le total des fréquences de -1 à -5 dans le diagramme des S-.
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
Intergen51. ban. Les diagrammes CDS-CDS positifs[modifier | modifier le wikicode]
- Lien tableur: Les diagrammes
- Diagrammes des gamma: ban présente 2 diagrammes
- - fc40, CDS-CDS continu, fréquence unitaire en abscisses et effectif en ordonnées
- - fx%, CDS-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et pourcentage en ‰ par rapport au total, en ordonnées.
- Équations des courbes de tendance en pour 1000: colonnes %fx %fc
Courbes de tendances pour les diagrammes en pour 1000 Calculs des f.41 ban R2 x3 x2 x c Inflexion poly3 x c 0.541 1.52E-06 -8.89E-04 3.90E-02 38.1 fx1 abscisse 431.0 198.3 0.739 -3.16E-06 2.60E-03 -7.46E-01 85.6 fc1 ordonnée 3.5 19.9 0.772 -1.98E-07 2.56E-04 -1.76E-01 47.7 fx41 0.900 2.37E-06 -1.41E-03 1.28E-01 31.5 fc41
Intergen51. ban. Les CDS-CDS négatifs[modifier | modifier le wikicode]
Sous-totaux ban totale fréquence x- c- x- c- - 1 0 73 4 4140 - 2 0 1 85 11 - 3 0 0 3 12 - 4 3 241 717 10938 - 5 0 0 5 19 sp6 10 249 1642 8424 total 13 564 2,456 23,544 reste 1 0 264 420 s6 4 0 361 41 s7 2 40 321 1438 s8 3 209 696 6525 rappot s1-5 4/2/1 - 3.3 8.4 2.6 % / sp6 s6/sp6 40.0 0.0 22.0 0.5 s7/sp6 20.0 16.1 19.5 17.1 s8/sp6 30.0 83.9 42.4 77.5 reste/sp6 10.0 0.0 16.1 5.0 total s1-5 3 315 814 15120 % / total %s1-5 23.1 55.9 33.1 64.2 %sp6 76.9 44.1 66.9 35.8
Intergen51. ban. Les intercalaires des blocs[modifier | modifier le wikicode]
- Le détail
RNA-RNA c x CDS-RNA c x 23s 5s 11 CDS 16s 5 5 16s 23s 9 5s CDS 2 4 16s tRNA 2 16 CDS tRNA 23s 2 CDS 5s 5s tRNA 5 23s CDS tRNA in 2 CDS 23s tRNA contig 89 5s 16s tRNA hors 5 16s16s tRNA 16s 1 23s tRNA tRNA 5s 16s 5s 5s 23s 5s 5s total 126 0 total 7 9
- Les rares voir gamma pour la longueur des intercalaires
- Les tRNA-CDS compris, comparaison dans le clade et dans l'étude.
Intergen51. ban. Les intercalaires tRNA-tRNA extra bloc[modifier | modifier le wikicode]
- Lien tableur: Intergen51. ban. Les intercalaires tRNA-tRNA extra bloc
cont1 | cont2 | cont3 | cont3 | cont4 | |||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
inter | aa | inter | aa | inter | aa | inter | aa | inter | aa | ||||
1 | gaa | 10 | ttg | 1 | gga | 20 | atgf | 4 | gta | ||||
8 | aac | 14 | tgc | 4 | cca | 54 | tca | 9 | aca | ||||
11 | atc | 5 | ggc | 3 | cgt | 20 | tca | 22 | cac | ||||
6 | tgg | 63 | caa | 16 | tta | 16 | gca | 29 | cta | ||||
9 | aca | 19 | cac | 29 | ggc | 10 | cca | 16 | ggc | ||||
9 | ttc | 7 | tgg | 14 | cta | 3 | cgt | 3 | tta | ||||
4 | gac | 17 | tac | 5 | aaa | 16 | tta | 10 | cgt | ||||
20 | atgf | 5 | gta | 87 | caa | 29 | ggc | 16 | cca | ||||
54 | tca | 24 | gaa | 46 | gac | 13 | cta | 20 | gca | ||||
20 | tca | 4 | acc | 4 | gta | 5 | aaa | 54 | tca | ||||
16 | gca | ** | aac | 1 | gaa | 87 | caa | 20 | cta | ||||
10 | cca | 3 | gac | 8 | aac | 46 | gac | 1 | atgf | ||||
3 | cgt | ** | atgf | 11 | atc | 4 | gta | 12 | gac | ||||
16 | tta | hors | 6 | tgg | 8 | gaa | 14 | ttc | |||||
29 | ggc | 13 | gaa | 9 | aca | 3 | agc | 10 | aca | ||||
22 | cta | ** | atgj | 8 | ttc | ** | aac | 13 | aaa | ||||
9 | cac | 13 | aaa | 4 | gac | 10 | gga | ||||||
4 | aca | 21 | gaa | 7 | atc | ||||||||
** | gta | 41 | gac | 7 | aac | ||||||||
** | ttc | 6 | agc | ||||||||||
1 | gga | ** | gaa | ||||||||||
** | aga | ||||||||||||
- |
bacilli synthèse[modifier | modifier le wikicode]
- notes: 30 blocs longs +5s
- Liens aux indices des clades: alpha bacilli gamma actino clostridia bacteroide cyano tener spiro beta epsilon delta bactéries
- Liens aux fiches: spiro tener gama alpha beta delta epsilon bacilli clostridia autres firmicutes actino bactero cyano archeo
bacilli distribution par génome[modifier | modifier le wikicode]
- Lien tableur: bacilli distribution par génome
baci | >1aa | 1aa | -5s | +5s | -16s | +16s | duplica | 1-3aas | total |
bsu | 18 | 8 | 52 | 2 | 4 | 2 | 86 | ||
lmo | 9 | 8 | 44 | 4 | 2 | 67 | |||
lam | 22 | 14 | 16 | 4 | 3 | 4 | 63 | ||
ppm | 67 | 21 | 68 | 5 | 161 | ||||
pmq | 22 | 11 | 138 | 0 | 2 | 173 | |||
lbu | 49 | 16 | 16 | 10 | 7 | 98 | |||
ban | 8 | 5 | 60 | 33 | 4 | 2 | 112 | ||
total | 195 | 83 | 0 | 394 | 35 | 31 | 12 | 10 | 760 |
bacilli distribution du total[modifier | modifier le wikicode]
- Lien tableur: bacilli distribution du total
- Légende:
- Tableau de gauche
- - Les couleurs cyan et jaune sont les emplacements des >3 des +5s de bacilli + clostridia
- Cyan pour les valeurs faibles, total 82.
- Jaune pour les valeurs fortes et en gras les plus fortes, total 410.
- blanc pour les valeurs intermédiaires, gca et atc le sont aussi, total 225.
- - Le rouge pour l'emplacement des +16s occupés, gca et atc.
- - Les encadrés sont les emplacements des 1-3aas des +5s de alpha + gamma.
- - Le -16s de 33 aas est compté ici comme un +5s long (inversion).
- - Les couleurs cyan et jaune sont les emplacements des >3 des +5s de bacilli + clostridia
- Tableau de droite: Les duplicata ne sont pas comptés dans le total de 43 mais dans le total des >1aa du tableau de gauche.
- Tableau des indices, en-tête: total des génomes, total des tRNAs, indice ttt, indice tgt.
|
|
|
bacilli distribution par type[modifier | modifier le wikicode]
- Lien tableur: bacilli distribution par type
|
|
|
bacilli par rapport au groupe de référence[modifier | modifier le wikicode]
- Lien tableur: bacilli par rapport au groupe de référence
- Le groupe de référence: voir la référence
- Légende:
- - carré ccc, c'est ctc gtc ccc gcc
- - g+cga, c'est gtg xcg xag ggg cga (dans l'hypothèse de la bascule des cgx, cgt/cgc cga/cgg)
tRNAs | blocs tRNAs | blocs rRNAs | |||||||
baci8 | 1aa | >1aa | dup | +5s | 1-3aas | autres | total | ||
---|---|---|---|---|---|---|---|---|---|
21 | faible | 43 | 21 | 5 | 13 | 82 | |||
16 | moyen | 27 | 59 | 4 | 135 | 2 | 31 | 227 | |
14 | fort | 13 | 115 | 3 | 279 | 8 | 2 | 418 | |
83 | 195 | 12 | 427 | 10 | 33 | 760 | |||
10 | g+cga | 16 | 12 | 5 | 5 | 38 | |||
2 | agg+cgg | 11 | 0 | 11 | |||||
4 | carre ccc | 12 | 5 | 8 | 25 | ||||
5 | autres | 4 | 4 | 8 | |||||
43 | 21 | 5 | 13 | 82 | |||||
total tRNAs ‰ | |||||||||
baci8 | 1aa | >1aa | dup | +5s | 1-3aas | autres | baci ‰ | ref.‰ | |
21 | faible | 57 | 28 | 7 | 17 | 108 | 26 | ||
16 | moyen | 36 | 78 | 5 | 178 | 3 | 41 | 299 | 324 |
14 | fort | 17 | 151 | 4 | 367 | 11 | 3 | 550 | 650 |
109 | 257 | 16 | 562 | 13 | 43 | 760 | 729 | ||
10 | g+cga | 21 | 16 | 7 | 7 | 50 | 10 | ||
2 | agg+cgg | 14 | 14 | ||||||
4 | carre ccc | 16 | 7 | 11 | 33 | 16 | |||
5 | autres | 5 | 5 | 11 | |||||
57 | 28 | 7 | 17 | 108 | |||||
blocs tRNAs ‰ | total colonne % | ||||||||
baci8 | 1aa | >1aa | dup | total | ref.‰ | 1aa | >1aa | dup | |
21 | faible | 148 | 72 | 17 | 238 | 26 | 52 | 11 | |
16 | moyen | 93 | 203 | 14 | 310 | 324 | 33 | 30 | |
14 | fort | 45 | 397 | 10 | 452 | 650 | 16 | 59 | |
286 | 672 | 41 | 290 | 729 | 83 | 195 | |||
10 | g+cga | 55 | 41 | 17 | 114 | 10 | 37 | ||
2 | agg+cgg | 38 | 38 | 26 | |||||
4 | carre ccc | 41 | 17 | 59 | 16 | 28 | |||
5 | autres | 14 | 14 | 28 | 9 | ||||
148 | 72 | 17 | 238 | 43 |
bacilli, estimation des -rRNAs[modifier | modifier le wikicode]
- Lien tableur: bacilli, estimation des -rRNAs
- Liens fiche: typage
- Légende: prélèvement de la base gtRNAdb le 29.5.20
- - ttt et tgt sont nuls partout
- - atgi, c'est Ile2, mis à la place de ttt, très rare chez les procaryotes.
- - atgf, c'est Metf, mis à la place de tgt, très rare chez les procaryotes.
- - atgj, c'est Met, remplace le atg standard qui est la somme Ile2 Met fMet.
- - Voir la légende des tris, g1 t1 et des couleurs
bacilli, calcul des -rRNAs[modifier | modifier le wikicode]
- Lien tableur: bacilli, calcul des -rRNAs
|
|
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|
|
bacilli, comparaison clade-annexe des -rRNAs[modifier | modifier le wikicode]
- Lien tableur: bacilli, comparaison clade-annexe des -rRNAs
- Légende
- - bac7. diff, somme des couleurs de bac7. La différence entre tRNAs est faite entre bac5 et bac6 du tableau précédent. Elle est exprimée en % et rapporté à la plus grande valeur des 2 termes de la différence. Ce qui fait quand un tRNA est à zéro la différence en % est égale à 100.
- - bac8. rap, rapport des sommes couleurs bac5/bac2. Le rapport -rRNA/total est celui du tRNA de bac5 sur celui de bac2.
- Fréquences des différences en % du tableau bac7
gamme 0/0 10 20 30 40 50 60 70 80 90 100 total fréquence 0 2 3 1 9 6 5 9 5 3 6 1 50 tot ≤ 50 21
- Comparaison avec le nombre de tRNAs de la fiche du clade: L’estimation des -rRNA par l'annexe est 43% au dessus de celle de la fiche des bacilli.
tRNAs fiche annexe sans 925 290 avec 1902 470 genomes 32 7 indice % 29 41
|
|
Bacilli. Intergen51[modifier | modifier le wikicode]
Intergen51. Bacilli. Introduction[modifier | modifier le wikicode]
- Voir les 51 génomes
Intergen51. Bacilli. Historique des pré-études[modifier | modifier le wikicode]
- Voir les 51 génomes
Intergen51. Bacilli. Formatage des résultats pour les 7 génomes[modifier | modifier le wikicode]
- Lien tableur: bacilli données intercalaires
bacilli données intercalaires[modifier | modifier le wikicode]
- Lien tableur: bacilli données intercalaires
Intergen51. Bacilli. Vue de l'ensemble[modifier | modifier le wikicode]
Intergen51. Bacilli. La longueur totale des intercalaires d'un génome[modifier | modifier le wikicode]
- Note: Seul le plasmide ppmp sort de la médiane des 51 génomes qui est de 12.6%.
Nom intercalaires génome taux en % bacilli ban 749,857 5,321,900 14.1 bsu 434,723 4,215,606 10.3 lam 210,907 2,078,001 10.1 lbu 222,489 1,856,951 12.0 lmo 288,032 2,944,528 9.8 pmq 1,228,719 8,739,048 14.1 ppm 791,310 5,728,392 13.8 ppmp 119,608 510,118 23.4
Intergen51. Bacilli. Les différents types d'intercalaires[modifier | modifier le wikicode]
- Lien au tableur: Intergen51. bacilli les différents types d'intercalaires.
- Légende:
- - S pour intercalaire CDS-CDS et R pour tRNA-CDS,
- - c pour intercalaire continu (les 2 gènes sont sur le même brin) et x pour discontinu (les 2 gènes sont sur 2 brins différents, le brin et son complément)
- - %reste = 100*reste/total, le reste étant ce qui reste du total après la fin du diagramme, gamme.
- - %t30 = 100*t30/total, t30 étant le total des fréquences 10 20 30
- - %t5 = 100*t/total, t5 étant le total des fréquences de -1 à -5 dans le diagramme des S-.
- Note:
- - taux des R-: c-/c = 100*1/163 = 0.9 et x-/x = 100*0/108 = 0.
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
Intergen51. Bacilli. Détail des intercalaires RNA-RNA et CDS-rRNA[modifier | modifier le wikicode]
- Lien tableur: bacilli données intercalaires
RNA-RNA c x CDS-RNA c x 23s5s 66 CDS 16s 44 16 16s23s 51 5s CDS 20 11 16stRNA 14 16 CDS tRNA23s 16 CDS 5s 5stRNA 36 23s CDS tRNAin 24 CDS 23s tRNAcontig 391 5s 16s 1 tRNAhors 169 1 16s16s tRNA16s 5 23stRNA 1 tRNA5s 16s5s 2 5s23s 5s5s total 775 1 total 65 27
Intergen51. Bacilli. Les intercalaires rares[modifier | modifier le wikicode]
- Lien tableur: bacilli données intercalaires
tRNA-CDS c- ppmp -24 tRNAhors x+ lbu 151 5s16s c bsu 183 16s 5s c ppm 102 ppm 117 23stRNA c ppm 131 tRNA16s c ban 76 bsu 159 bsu 170 bsu 171 lmo 341
Intergen51. Bacilli. Les diagrammes des bacilli[modifier | modifier le wikicode]
Intergen51. Bacilli. Les diagrammes CDS-CDS et tRNA-CDS[modifier | modifier le wikicode]
Intergen51. Bacilli. Les diagrammes CDS-CDS et tRNA-CDS positifs[modifier | modifier le wikicode]
- Lien aux données intercalaires.
- Diagrammes des bacilli: tbl présente 4 diagrammes
- - fc40, CDS-CDS continu, fréquence unitaire en abscisses et effectif en ordonnées
- - fx%, CDS-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et pourcentage en ‰ par rapport au total, en ordonnées.
- - ftc, tRNA-CDS continu, fréquences regroupées par 10 (freq10) en abscisses et effectif en ordonnées
- - ftx, tRNA-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et effectif en ordonnées
- Équations des courbes de tendance en pour 1000: colonnes %fx %fc
Courbes de tendances pour les diagrammes en pour 1000 Calculs des f.41 et autres R2 des f.1 R2 x3 x2 x c Inflexion poly3 x c 0,738 2,36E-06 -1,72E-03 2,68E-01 22,9 fx1 abscisse 254,5 170,3 0,857 -3,62E-06 2,91E-03 -8,14E-01 89,8 fc1 ordonnée 19,1 23,0 poly3/droite 18,6 23,4 0,901 1,48E-06 -1,13E-03 1,58E-01 27,7 fx41 0,979 1,37E-06 -7,00E-04 -2,94E-02 41,5 fc41 R2 f.1 x c Poly 3 738 857 0,873 -0,097 43,3 fx41 Poly 6 812 915 0,935 -0,110 42,2 fc41 Poly 9 864 942 0,614 -0,082 39,2 fx1 0,687 -0,162 56,6 fc1
Intergen51. Bacilli. Les diagrammes CDS-CDS négatifs[modifier | modifier le wikicode]
Intergen51. Bacilli. comparaison avec la totale[modifier | modifier le wikicode]
- Lien aux données intercalaires.
- Comparaison avec la totale: bacilli et la totale sont comparables notamment le 4/2/1 des c-, égale à 2.6.
Sous-totaux bacilli totale fréquence x- c- x- c- -1 1 525 4 4140 -2 4 5 85 11 -3 0 2 3 12 -4 50 1371 717 10938 -5 0 1 5 19 sp6 109 1486 1642 8424 total 164 3390 2 456 23 544 reste 23 49 264 420 s6 22 4 361 41 s7 19 202 321 1438 s8 45 1231 696 6525 rappot s1-5 4/2/1 12,5 2,6 8,4 2,6 % / sp6 s6/sp6 20,2 0,3 22,0 0,5 s7/sp6 17,4 13,6 19,5 17,1 s8/sp6 41,3 82,8 42,4 77,5 reste/sp6 21,1 3,3 16,1 5,0 total s1-5 55 1904 814 15120 % / total %s1-5 33,5 56,2 33,1 64,2 %sp6 66,5 43,8 66,9 35,8
Intergen51. Bacilli. Homogénéité des génomes[modifier | modifier le wikicode]
- Lien aux données intercalaires de chaque génome
- Homogénéité: Les 8 génomes sont homogènes dans l'ensemble, sauf lam et lbu qui se distinguent par leur rapport 4/1 inverse des autres, 0.5 et 0.7 contre 2.6 du total. Pour compenser ce rapport ppm et pmq se distinguent par le leur très élevé, 3.9 et 4.8 respectivement.
négatifs x bsu ban lam lbu lmo pmq ppm ppmp total total 35 13 15 20 10 42 29 0 164 s1-5 14 3 8 6 3 14 7 55 sp6 21 10 7 14 7 28 22 109 rapport s1-5 4/2 - - - 4.0 - 3.7 - 12.5 % / sp6 s6 19 40 0 21 14 21 18 20 s7 29 20 14 0 43 14 14 17 s8 19 30 86 36 29 46 55 41 reste 33 10 0 43 14 18 14 21 % / total s1-5 40 23 53 30 30 33 24 34 sp6 60 77 47 70 70 67 76 66 négatifs c bsu ban lam lbu lmo pmq ppm ppmp total total 573 564 272 280 393 753 523 32 3390 s1-5 305 315 145 136 234 466 288 15 1904 sp6 268 249 127 144 159 287 235 17 1486 rapport s1-5 4/1 3.2 3.3 0.5 0.7 2.8 4.8 3.9 2.8 2.6 % / sp6 s6 0 0 0 1 0 0 0 6 0 s7 16 16 10 13 11 15 10 12 14 s8 78 84 90 86 84 79 86 71 83 reste 6 0 0 0 4 6 3 12 3 % / total s1-5 53 56 53 49 60 62 55 47 56 sp6 47 44 47 51 40 38 45 53 44
Intergen51. Bacilli. Les grands négatifs inférieurs à -120[modifier | modifier le wikicode]
- Voir intergen51
Intergen51. Bacilli. Les diagrammes CDS-rRNA[modifier | modifier le wikicode]
Intergen51. Bacilli. Les diagrammes CDS-16s[modifier | modifier le wikicode]
- Lien au tableur: Intergen51. Bacilli. Les diagrammes CDS-16s.
- Lien aux données intercalaires.
- Les diagrammes
CDS16sc CDS16sx 5sCDSc 5sCDSx 0,542 - - - 353,9 499,7 232,9 146,9 210-540 270-720 60-480 30-300 40 15 19 11 91 94 95 100 4 1 1 0 9 6 5 0 0 0 0 0 0 0 0 0 390;7 540;2 180;4 60;3 44 16 20 11 30 30 30 30
- Les moyennes par génome
|
|
Intergen51. Bacilli. Les diagrammes 5s-CDS[modifier | modifier le wikicode]
- Lien aux données intercalaires.
- Comparaison avec les tRNA-CDS
- - Les équations des polynômes de d°3
- fct f(X) = 5.93E-07 x3 –4.32E-04 x2 + 8.03E-02 x – 7.27E-02
- fxt f(x) = 1.63E-06 x3 – 1.11E-03 x2 + 1.98E-01 x – 2.83
- - Les caractéristiques des courbes: xs abscisse calculée du maximum de la courbe en pbs, plage des effectifs forts et max de l'effectif maximum et son abscisse.
- - Les équations des polynômes de d°3
bacilli ftc ftx 5sCDSc 5sCDSx R2 0,662 0,427 - - xs 121,9 125,2 232,9 146,9 plage 60-230 50-280 60-480 30-300 total-p 118 85 19 11 % 72 79 95 100 queue 35 19 1 0 % 21 18 5 0 tête 9 4 0 0 % 6 3 0 0 max 130;13 90;9 180;4 60;3 total7 163 108 20 11 freq 10 10 30 30
Intergen51.bacilli. Comparaison 5s-CDS tRNA-CDS CDS-CDS[modifier | modifier le wikicode]
- Lien tableur: Intergen51.bacilli. Comparaison 5s-CDS tRNA-CDS CDS-CDS.
- Légende:
- - Inf40, Sup700: nombre d'intercalaires du génome inférieurs à 41 et supérieurs à 700. Dans les tableaux 5sCDS ils sont notés en gras avec un *. A voir aux données intercalaires du génome.
- - moyenne: elle est calculée pour tous les intercalaires compris entre inf40 et sup700, 40 exclu. Et son écart est la fonction ecartype.
- - haut, bas: pour estimer que la moyenne du génome est très élevée ou trop basse par rapport à celle du total des alpha.
- + la référence du haut est égale à (total + total/10), indiquée sur la ligne total.
- + la référence du bas est égale à (total - total/10), indiquée sur la ligne total.
- + Pour un génome le haut est égal à (haut référence - sa moyenne): si cette différence est négative la moyenne est considérée trop élevée.
- + Pour un génome le bas est égal à (sa moyenne - haut référence): si cette différence est négative la moyenne est considérée trop basse.
- + pour les tableaux 5sCDS les références sont sur la ligne du total précédés du signe ++
- - Les colonnes ft*-f* représentent la différence entre les 2 moyennes.
- - intercalaires: pour les tableaux 5sCDS où les effectifs sont très faibles. Une plage continue de plus de 2 effectifs est représentée par un tiret, inférieur - supérieur. S'il n'y a que 2 intercalaires, ils sont séparés par 2 points, :.
- Note: Sommes des différences ft*-f*, positives et négatives, dans les tableaux correspondants
ftc-fc 145,5 ftc-fc -42,1 ftx-fx 75,9 ftx-fx -271,8
|
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|
Intergen51. Bacilli. Les CDS-rRNA rares[modifier | modifier le wikicode]
Intergen51. Bacilli. Les diagrammes RNA-RNA[modifier | modifier le wikicode]
Intergen51. Bacilli. Les diagrammes rRNA-rRNA[modifier | modifier le wikicode]
- Lien au tableur: Intergen51. Bacilli. Les diagrammes rRNA-rRNA.
- Lien aux données intercalaires.
bacilli 16s23s 16stRNA tRNA23s 23s5s R2 0,312 - - 0,845 xs 183,7 117,6 123,9 77,1 plage 140-300 100-140 80-200 40-180 total-p 48 14 16 66 % 94 100 100 100 queue 3 0 0 0 % 6 0 0 0 tête 0 0 0 0 % 0 0 0 0 max 280;13 140;6 140;7 80;26 total7 51 14 16 66 freq 20 20 20 20
Intergen51. Bacilli. Les diagrammes tRNA-rRNA[modifier | modifier le wikicode]
- Lien au tableur: Intergen51. Bacilli. Les diagrammes tRNA-rRNA.
|
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|
Intergen51. Bacilli. Les diagrammes tRNA-tRNA[modifier | modifier le wikicode]
- Lien au tableur: Intergen51. Bacilli. Les diagrammes tRNA-tRNA.
- Lien aux données intercalaires.
- Note: HC, hors/contig, pour considérer certains tRNA hors bloc comme appartenant au processus des contig
Les diagrammes des tRNA-tRNA[modifier | modifier le wikicode]
type c S40 % R2 diag total reste x+ restes 5stRNA hors contig HC HC hors 145 86 0,901 145 169 4 151 82 157 138 101 157 contig 360 92 0,973 115 391 3 - 230 158 109 261 in 14 58 - 70 24 0 - 261 265 125 297 5stRNA 29 81 0,315 55 36 1 - 297 131 HC 115 87 0,959 95 132 7 -
Les pourcentages des tRNA-tRNA hors blocs[modifier | modifier le wikicode]
tRNA h bsu pmq ppm ppmp lmo lam lbu ban total % 20 8 14 12 5 4 12 33 3 91 68.4 40 4 1 5 1 5 11 1 28 21.1 60 0 1 2 1 4 3.0 80 1 1 0.8 100 1 1 2 1.5 120 0 2 1 3 2.3 140 0 160 1 1 0.8 240 1 1 0.8 260 1 1 0.8 restes 1 1 0.8 total 14 18 18 5 6 19 48 5 133 100 repete 0 2 0 0 0 1 1 0 4 11 séquence 0 0 0 0 0 0 1 0 1 3 sans 4 4 4 1 3 5 4 3 28 80 éclaté 0 0 0 1 0 0 1 0 2 6 clusters 4 6 4 2 3 6 7 3 35 100 5 4 1 4 2 1 4 16 1 33 24 10 2 6 7 3 2 7 7 0 34 25 15 2 2 1 0 1 1 8 2 17 12 20 0 5 0 0 0 0 2 0 7 5
Les pourcentages des tRNA-tRNA contigus aux blocs[modifier | modifier le wikicode]
tRNA cont bsu pmq ppm ppmp lmo lam lbu ban total % 20 35 108 13 26 25 13 9 72 301 77.4 40 11 12 3 1 11 3 3 8 52 13.4 60 3 4 1 6 5 19 4.9 80 1 1 2 4 1.0 100 2 2 4 1.0 120 2 2 4 1.0 140 2 1 3 0.8 160 1 1 0.3 180 0 200 0 220 0 240 0 260 0 restes 1 1 0.3 total 50 128 16 35 42 16 13 89 389 100 repete 0 0 0 0 0 0 0 0 0 0 séquence 0 0 0 0 0 0 0 0 0 0 sans 6 6 4 1 4 2 3 3 29 78 éclaté 0 3 1 1 0 0 0 3 8 22 clusters 6 9 5 2 4 2 3 6 37 100 5 10 29 5 14 7 5 6 26 102 26 10 13 29 4 10 9 4 2 22 93 24 15 9 30 3 2 6 3 0 8 61 16 20 3 20 1 0 3 1 1 16 45 12
Les moyennes des tRNA-tRNA par génome[modifier | modifier le wikicode]
|
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|