Recherche:Les clusters de gènes tRNA et rRNA chez les procaryotes/Annexe/spiro

Une page de Wikiversité.
Aller à la navigation Aller à la recherche
spiro
Image logo représentative de la faculté
Annexe 9
Recherche : Les clusters de gènes tRNA et rRNA chez les procaryotes
Précédent :cyano
Suivant :archeo
Icon falscher Titel.svg
En raison de limitations techniques, la typographie souhaitable du titre, « Annexe : spiro
Les clusters de gènes tRNA et rRNA chez les procaryotes/Annexe/spiro
», n'a pu être restituée correctement ci-dessus.



Spirochetes[modifier | modifier le wikicode]

Sphaerochaeta coccoides DSM 17374[modifier | modifier le wikicode]

scc opérons[modifier | modifier le wikicode]

  • Lien tableur: scc opérons
  • Liens: gtRNAdb [1], NCBI [2], génome [orgn]
  • Phylogénie: Bacteria; Spirochaetes; Spirochaetales; Spirochaetaceae; Sphaerochaeta.
  • Légende:
Sp1. scc opérons, Sphaerochaeta coccoides DSM 17374.
50.6%GC 12.1.21 Paris 3.16s doubles intercal cds aa  avec.aa cdsa cdsd protéines
comp 215073..215231 cds 1194 1194 53 hp
comp 216426..216498 gcg @1 369 369 369
comp 216868..217047 cds 60 hp
243358..244170 cds @2 812 812 271 HAD-IIB family hydrolase
244983..246519 16s 132 132
246652..246725 atc 79 79
246805..249778 23s 72
249851..249962 5s 175 175 175
250138..250947 cds 270 metal ABC transporter permease
300128..301798 cds 669 669 557 formate--tetrahydrofolate ligase
302468..302539 ggg 452 452 452
302992..304032 cds 347 ABC transporter substrate-binding protein
comp 316296..317216 cds 152 152 307 152 phosphatase PAP2 family protein
317369..317442 gac 176 176
317619..318692 cds 358 tRNA 2-thiouridine(34) synthase MnmA
330207..331004 cds 16 16 266 16 class I SAM-dependent methyltransferase
comp 331021..331104 ttg 251 251
331356..333446 cds 697 patatin-like phospholipase family protein
comp 345290..346216 cds 228 228 309 hp
comp 346445..346517 ccg 182 182 182
comp 346700..347059 cds 120 hp
422975..424363 cds 71 71 463 71 sulfatase-like hydrolase/transferase
comp 424435..424506 gtc 252 252
424759..426600 cds 614 hp
436852..438168 cds 237 237 439 MFS transporter
comp 438406..438477 gtg 202 202 202
438680..440152 cds 491 hp
comp 481186..482484 cds 180 180 433 HD domain-containing protein
482665..482737 atgj 82 82 82
482820..483494 cds 225 hp
530805..532313 cds 82 82 503 82 IMP dehydrogenase
532396..532467 gta 310 310
532778..533485 cds 236 YggS family pyridoxal phosphate-dependent enzyme
568939..569700 cds 102 102 254 102 NAD-dependent deacetylase
569803..569874 gga 412 412
570287..570952 cds 222 hp
636017..636391 cds 52 52 125 52 chorismate mutase
636444..636517 aca 334 334
comp 636852..637013 cds 54 hp
comp 717326..717772 cds 66 66 149 66 YkgJ family cysteine cluster protein
comp 717839..717920 tac 230 230
718151..719386 cds 412 aminopeptidase
comp 721419..723056 cds @3 67 67 546 67 ATP-binding cassette domain-containing protein
comp 723124..723195 gag 10 10
comp 723206..723276 cag 104 104
comp 723381..723911 cds 177 adenine phosphoribosyltransferase
comp 724974..725225 cds 236 236 84 hp
comp 725462..725533 acg 124 124 124
comp 725658..728366 cds 903 pyruvate, phosphate dikinase
comp 767509..768549 cds 350 350 347 350 DegT/DnrJ/EryC1/StrS aminotransferase family protein
comp 768900..769011 5s 72
comp 769084..772057 23s 40 40
comp 772098..772171 gca 137 137
comp 772309..773845 16s 535 535
774381..774947 cds 189 peroxiredoxin
783089..784627 cds 273 273 513 glycoside hydrolase family 43 protein
comp 784901..784972 gaa 43 43
comp 785016..785088 aaa 223 223 223
785312..787483 cds 724 cadmium-translocating P-type ATPase
comp 877367..879202 cds 447 447 612 447 translational GTPase TypA
comp 879650..879761 5s 72
comp 879834..882807 23s 40 40
comp 882848..882921 gca 137 137
comp 883059..884595 16s 648 648
885244..885867 cds 208 GNAT family N-acetyltransferase
900855..901490 cds 73 73 212 73 Fic family protein
comp 901564..901637 ccc 214 214
901852..903519 cds 556 Alpha-glucosidase
928254..930545 cds 138 138 764 138 AAA family ATPase
930684..930755 cac 32 32
930788..930861 cga 38 38
930900..930972 aag 37 37
931010..931091 cta 36 36
931128..931199 ggc 423 423
931623..932981 cds 453 trigger factor
937885..939693 cds 171 171 603 171 oligoendopeptidase F
939865..939938 aga 437 437
940376..940579 cds 68 helix-turn-helix domain-containing protein
comp 974079..974468 cds @4 223 223 130 tyrosine-type recombinase/integrase
comp 974692..974775 ctc 153 153 153
comp 974929..975384 cds 112 112 152 VOC family protein
comp 975497..975569 cca 95 95 95
975665..976339 cds 225 endonuclease III
1069506..1069922 cds 81 81 139 hp
comp 1070004..1070087 tta 78 78 78
1070166..1070981 cds 272 TatD family hydrolase
comp 1113338..1113928 cds 247 247 197 247 NAD(P)H-dependent oxidoreductase
1114176..1114248 aac 247 247
comp 1114496..1117318 cds 941 5'-nucleotidase C-terminal domain-containing protein
comp 1126672..1127604 cds 173 173 311 173 DUF362 domain-containing protein
1127778..1127850 caa 193 193
comp 1128044..1128334 cds 97 septation regulator SpoVG
comp 1257969..1258763 cds 140 140 265 nucleotidyltransferase domain-containing protein
1258904..1258977 agg 79 79 79
1259057..1259779 cds 241 nitroreductase family protein
comp 1273039..1273944 cds 217 217 302 DNA-protecting protein DprA
1274162..1274234 ttc 103 103 103
comp 1274338..1274865 cds 176 cysteine hydrolase
comp 1363097..1364389 cds 432 432 431 H(+)-transporting two-sector ATPase
1364822..1364894 atgf 213 213 213
1365108..1366457 cds 450 Trk system potassium transporter TrkA
comp 1478531..1479448 cds 196 196 306 196 hp
1479645..1479718 cgg 256 256
comp 1479975..1481738 cds 588 ABC transporter ATP-binding protein
comp 1522454..1523143 cds 86 86 230 hp
1523230..1523301 tgc 34 34 34
comp 1523336..1523890 cds 185 hp
comp 1540671..1541807 cds 186 186 379 186 DUF2974 domain-containing protein
comp 1541994..1542066 gcc 351 351
1542418..1544223 cds 602 IS1634 family transposase
1691238..1692578 cds 189 189 447 189 sn-glycerol-1-phosphate dehydrogenase
1692768..1692851 ctg 564 564
1693416..1693646 cds 77 helix-turn-helix domain-containing protein
comp 1760709..1761905 cds 185 185 399 185 hp
1762091..1762164 atgi 316 316
comp 1762481..1765135 cds 885 valine--tRNA ligase
comp 2034849..2035028 cds @4 32 32 60 preprotein translocase subunit SecE
comp 2035061..2035134 tgg 26 26 26
comp 2035161..2035337 cds 64 64 59 64 50S ribosomal protein L33
comp 2035402..2035474 acc 246 246
2035721..2036506 cds 262 HAD family hydrolase
2185380..2186171 cds @5 84 84 264 84 16S rRNA (uracil(1498)-N(3))-methyltransferase
2186256..2186340 tca 40 40
2186381..2186467 agc 25 25
2186493..2186566 cgc 16 16
2186583..2186669 tcg 40 40
2186710..2186795 tcc 13
2186809..2186906 ncRNA 133 133 33
comp 2187040..2188236 cds 399 transposase

scc cumuls[modifier | modifier le wikicode]

cumuls. scc.
opérons Fréquences intercalaires tRNAs Fréquences intercalaires cds Fréquences aas cds
effectif gammes sans rRNAs avec rRNAs gammes cds gammes cdsd gammes cdsa gammes cdsa 300
avec rRNA opérons 3 1 0 1 0 1 0 100 9 - -
16 23 5s 0 20 2 50 4 20 1 200 11
16 atc23s5s 1 40 7 2 100 14 40 2 300 16
16gca23s5s 2 60 1 0 150 8 60 1 400 11
max a 1 80 1 200 13 80 7 500 9
a doubles 100 0 250 13 100 4 600 6
autres 120 0 300 4 120 2 700 5
total aas 3 140 3 350 4 140 2 800 2
sans opérons 34 160 400 2 160 2 900 1
1 aa 30 180 450 5 180 3 1000 2
max a 5 200 500 1 200 5 1100
a doubles 0 6 4
total aas 44 10 6 74 33 72
total aas 47
remarques 5
avec jaune moyenne 32 94 236 154 343
variance 11 47 196 108 215
sans jaune moyenne 188 124 299
variance 110 64 164

scc blocs[modifier | modifier le wikicode]

Sp1. Sphaerochaeta coccoides
cds 812    cds 350 447
16s 132 5s 72 72
atc 79 23s 40 40
23s 72 gca 137 137
5s 175 16s 535 648
cds cds

scc remarques[modifier | modifier le wikicode]

  • Lien tableur: scc remarques
  • Remarques : Ce génome se distingue par ses 3 blocs à rRNA avec 1 seul aa et le grand nombre de solitaires.
    1. @ Sur les 30 solitaires 9 sont rares dont ccc. Deux autres rares sont dans un blocs de 2 aas. Les 2 blocs de 5aas contiennent chacun un rare, tcg aag.
    2. @ Il n’y a pas plus d’un aa entre 16s et 23s et qui sont les plus communs, atc et gca comme les archées qui n’ont que gca. Les intercalaires, à par les cds, sont identiques sauf pour l’intercalaire aa-23s qui est différent entre atc et gca, du double, 40/79.
    3. @ Les 2 rares ne sont pas solitaires comme les 9 autres. Ils appartiennent à la même colonne, xag qui est plus fréquentes que la colonne xcg.
    4. @ 2 blocs avec 2 opérons solitaires séparés par un petit cds de 152 et 59 aas. Les intercalaires sont moyens pour le 1er (120 pbs) et faibles (30 pbs) pour le second.
    5. @ 2 blocs de 5 aas. Le dernier contient un aa rare et cgc au lieu de cgt.
  • Séquences des doubles: pas de doubles.

scc distribution[modifier | modifier le wikicode]

sp1 scc, Sphaerochaeta coccoides DSM 17374. spirochète.
sp11 scc, distribution par type
g1    t1       
atgi 1 tct tat atgf 1
att act aat agt
ctt cct cat cgc 1
gtt gct gat ggt
ttc 1 tcc 1 tac 1 tgc 1
atc 1 acc 1 aac 1 agc 1
ctc 1 ccc 1 cac 1 cgt 0
gtc 1 gcc 1 gac 1 ggc 1
tta 1 tca 1 taa tga
ata aca 1 aaa 1 aga 1
cta 1 cca 1 caa 1 cga 1
gta 1 gca 2 gaa 1 gga 1
ttg 1 tcg 1 tag tgg 1
atgj 1 acg 1 aag 1 agg 1
ctg 1 ccg 1 cag 1 cgg 1
gtg 1 gcg 1 gag 1 ggg 1
spiro >1aa =1aa -5s +5s -16s +16s total
scc 14 30 3 47
sp12 scc, distribution sur référence
g1    t1       
atgi 1 tct tat atgf 1
att act aat agt
ctt cct cat cgc 1
gtt gct gat ggt
ttc 1 tcc 1 tac 1 tgc 1
atc 1 acc 1 aac 1 agc 1
ctc 1 ccc 1 cac 1 cgt 0
gtc 1 gcc 1 gac 1 ggc 1
tta 1 tca 1 taa tga
ata aca 1 aaa 1 aga 1
cta 1 cca 1 caa 1 cga 1
gta 1 gca 2 gaa 1 gga 1
ttg 1 tcg 1 tag tgg 1
atgj 1 acg 1 aag 1 agg 1
ctg 1 ccg 1 cag 1 cgg 1
gtg 1 gcg 1 gag 1 ggg 1
inter max min total
17 13 17 47
spiro2. indices du 11.1.21 73 génomes
g1 t1 73 2823 0  0
atgi 96 tct tat atgf 96
att act aat agt
ctt cct cat cgc 90
gtt gct gat ggt
ttc 125 tcc 100 tac 100 tgc 100
atc 100 acc 100 aac 100 agc 100
ctc 103 ccc 55 cac 100 cgt 12
gtc 55 gcc 59 gac 107 ggc 103
tta 100 tca 100 taa tga 16
ata 1 aca 100 aaa 100 aga 101
cta 100 cca 100 caa 100 cga 92
gta 101 gca 114 gaa 82 gga 100
ttg 100 tcg 41 tag tgg 100
atgj 97 acg 58 aag 78 agg 66
ctg 52 ccg 42 cag 42 cgg 47
gtg 34 gcg 41 gag 40 ggg 21
inter max min total

scc intercalaires entre cds[modifier | modifier le wikicode]

  • Lien NCBI [3]
  • Note: Pour les génomes des annexes j'ai relevé les intercalaires entre tRNAs et entre ceux-ci et les cds qui leur sont adjacents. L'exemple est celui de rru du clade alpha. L'idée de départ de ces prélèvements est la recherche d'opérons formés de tRNA et de protéine comme dans le cas d'E.coli: l'intercalaire entre le tRNA et la protéine devrait être faible. Voir l'exemple d'eco (remarque @3) avec tac-tac-tpr et aca-tac-gga-acc-tufB.

scc les fréquences[modifier | modifier le wikicode]

  • Lien tableur: scc intercalaires entre cds
  • Légende:   long, longueur en pbs,   intercal pour intercalaire
    - fréquence-1 1 5 6 f, respectivement fréquence des intercalaires négatives à l'unité, positives à l'unité, par blocs de 5, par blocs de 10 jusqu'à 600 pbs et f pour finales. Ces fréquences servent à faire les diagrammes. La fréquence fréquence6 est étendue à 1200 pour certains grands génomes.
    - cumul,% colonne à la droite de frequence6, reprend les fréquences par plages et leurs pourcentages indiqués déjà dans la 1ère partie du tableau.
    - La couleur cyan des fréquences fréquence-1 et 1 sert à montrer leur périodicité ternaire.
    - intercaln intercalx, pour les intercalaires négatifs minimaux et intercalaires positifs maximaux.
    - colonne ADN pour la longueur totale du génome en pbs et intercals pour le total en pbs des intercalaires entre cds uniquement, d'après la méthode des prélèvements de NCBI du 16.7.20.
scc Les fréquences des intercalaires entre cds
scc intercalaires total % intercalaires moyenne ecartype plage ADN intercal frequence5
négatif 347 19.2 négatif -10 13 -1 à -74 2 227 296 -1 347
zéro 8 0.4 intercals 0 8
1 à 200 1112 61.6 0 à 200 69 57 195 310 5 106
201 à 370 241 13.4 201 à 370 269 49 8.8% 10 67
371 à 600 78 4.3 371 à 600 445 63 15 78
601 à max 19 1.1 601 à 1048 779 145 20 57
total 1805 <201 81 total 1800 103 136 -74 à 1048 25 44
adresse intercalx intercal fréquence1 intercal fréquence6 cumul,% intercal fréquence-1 30 36
1398976 1670 -1 347 -70 2 0 8 35 30
1167746 1666 0 8 -60 2 -1 39 40 31
1943263 1598 1 32 -50 3 -2 1 45 39
2221165 1229 2 27 -40 6 -3 0 50 33
940376 1048 3 26 -30 6 min à -1 -4 158 55 27
2116721 960 4 8 -20 27 347 -5 0 60 14
1197192 959 5 13 -10 62 19.2% -6 2 65 36
1728512 916 6 4 0 247 -7 6 70 26
1917725 874 7 10 10 173 -8 31 75 22
972954 867 8 11 20 135 -9 2 80 31
1554925 775 9 21 30 80 -10 5 85 26
1997696 715 10 21 40 61 1 à 100 -11 19 90 27
1693573 700 11 12 50 72 785 -12 2 95 33
1314184 671 12 17 60 41 43.5% -13 3 100 22
1528150 655 13 18 70 62 -14 17 105 23
1659099 643 14 18 80 53 -15 1 110 21
1773078 643 15 13 90 53 -16 5 115 20
1732369 635 16 8 100 55 0 à 200 -17 9 120 21
356981 617 17 8 110 44 1120 -18 1 125 20
137346 590 18 15 120 41 -19 0 130 18
1639500 590 19 11 130 38 -20 10 135 20
977451 580 20 15 140 39 -21 0 140 19
661808 579 21 7 150 30 -22 0 145 16
1611095 565 22 6 160 30 -23 4 150 14
1590201 563 23 10 170 27 1 à 200 -24 2 155 17
1330173 561 24 12 180 28 1112 -25 2 160 13
379215 558 25 9 190 22 62% -26 7 165 15
1755945 548 26 12 200 28 -27 0 170 12
191845 527 27 7 210 21 -28 0 175 12
1897378 525 28 5 220 27 -29 2 180 16
72886 522 29 6 230 19 -30 0 185 12
1978592 521 30 6 240 22 -31 2 190 10
511329 515 31 9 250 17 -32 3 195 14
220737 512 32 3 260 12 42 200 14
1410834 511 33 4 270 15 reste 14 205 11
34 8 280 10 total 355 210 10
35 6 290 15 215 20
36 6 300 12 intercal frequencef 220 7
37 4 310 11 600 1786 225 11
38 9 320 16 620 1 230 8
39 10 330 8 640 1 235 10
40 2 340 11 201 à 370 660 3 240 12
reste 1001 350 7 241 680 1 245 8
total 1638 360 12 13.4% 700 1 250 9
370 6 720 1 255 7
380 8 740 260 5
adresse intercaln décalage long 390 10 760 265 8
438680 -120 comp 400 6 780 1 270 7
1693416 -74 shift2 158 410 7 800 275 4
277564 -68 shift2 1487 420 8 820 280 6
1935981 -68 shift2 686 430 4 840 285 6
964418 -59 shift2 296 440 4 860 290 9
1721260 -59 shift2 1127 450 1 880 2 295 8
482820 -53 shift2 623 460 1 900 300 4
1283977 -47 comp 470 5 920 1 305 6
1310625 -46 shift2 417 480 3 940 310 5
1544483 -44 shift2 374 490 2 960 2 315 9
1705959 -44 shift2 1007 500 2 980 320 7
950419 -41 510 1 1000 325 4
1249575 -41 520 3 1020 330 4
2054241 -34 530 4 1040 335 4
937251 -32 540 0 371 à 600 1060 1 340 7
1154295 -32 550 1 78 15 345 2
1972305 -32 560 1 4.3% 350 5
485333 -31 570 3 355 4
1666650 -31 580 2 601 à max 360 8
952193 -29 590 2 19 365 4
1123783 -29 600 0 1.1% 370 2
669889 -26 reste 19 reste 4 reste 97
733006 -26 total 1805 total 1805 total 1805

scc autres intercalaires[modifier | modifier le wikicode]

  • Lien tableur: scc autres intercalaires
  • Légende:  
    - comp, le gène est sur le brin complement
    - deb, fin sont respectivement dans le sens des adresses croissantes, le cds avant le 1er tRNA et le cds après le dernier tRNA du bloc.
scc Les autres intercalaires.
scc1 adresses1
deb-fin gènes adresses intercal sens
deb CDS 215073 1194 comp
tRNA 216426 369 comp
fin CDS 216868 comp
deb CDS 243358 812
rRNA 244983 132
tRNA 246652 79
rRNA 246805 72
rRNA 249851 175
fin CDS 250138 comp
deb CDS 300128 669
tRNA 302468 452
fin CDS 302992
deb CDS 316296 152 comp
tRNA 317369 176
fin CDS 317619
deb CDS 330207 16
tRNA 331021 251 comp
fin CDS 331356
deb CDS 345290 228 comp
tRNA 346445 182 comp
fin CDS 346700 comp
deb CDS 422975 71
tRNA 424435 252 comp
fin CDS 424759
deb CDS 436852 237
tRNA 438406 202 comp
fin CDS 438680
deb CDS 481186 180 comp
tRNA 482665 82
fin CDS 482820
deb CDS 530805 82
tRNA 532396 310
fin CDS 532778
deb CDS 568939 102
tRNA 569803 412
fin CDS 570287
deb CDS 636017 52
tRNA 636444 334
fin CDS 636852 comp
deb CDS 640192 79
tmRNA 640610 334
fin CDS 641322 comp
deb CDS 711173 51
ncRNA 712064 10 comp
fin CDS 712417 comp
deb CDS 717326 66
tRNA 717839 230
fin CDS 718151
scc2 adresses2
deb-fin gènes adresses intercal sens
deb CDS 721419 67 comp
tRNA 723124 10 comp
tRNA 723206 104 comp
fin CDS 723381 comp
deb CDS 724974 236 comp
tRNA 725462 124 comp
fin CDS 725658 comp
deb CDS 767509 350 comp
rRNA 768900 72 comp
rRNA 769084 40 comp
tRNA 772098 137 comp
rRNA 772309 535 comp
fin CDS 774381
deb CDS 783089 273
tRNA 784901 43 comp
tRNA 785016 223 comp
fin CDS 785312
deb CDS 877367 447 comp
rRNA 879650 72 comp
rRNA 879834 40 comp
tRNA 882848 137 comp
rRNA 883059 648 comp
fin CDS 885244
deb CDS 900855 73
tRNA 901564 214 comp
fin CDS 901852
deb CDS 928254 138
tRNA 930684 32
tRNA 930788 38
tRNA 930900 37
tRNA 931010 36
tRNA 931128 423
fin CDS 931623
deb CDS 937885 171
tRNA 939865 437
fin CDS 940376
deb CDS 974079 223 comp
tRNA 974692 153 comp
deb CDS 974929 112 comp
tRNA 975497 95 comp
fin CDS 975665
deb CDS 1069506 81
tRNA 1070004 78 comp
fin CDS 1070166
deb CDS 1084097 24
regulatory 1084535 39
fin CDS 1084670
scc3 adresses3
deb-fin gènes adresses intercal sens
deb CDS 1113338 247 comp
tRNA 1114176 247
fin CDS 1114496 comp
deb CDS 1126672 173 comp
tRNA 1127778 193
fin CDS 1128044 comp
deb CDS 1257969 140 comp
tRNA 1258904 79
fin CDS 1259057
deb CDS 1273039 217 comp
tRNA 1274162 103
fin CDS 1274338 comp
deb CDS 1301674 54
repeat_region 1302007 4
fin CDS 1306496
deb CDS 1319568 73
repeat_region 1319986 84
fin CDS 1322087 comp
deb CDS 1363097 432 comp
tRNA 1364822 213
fin CDS 1365108
deb CDS 1478531 196 comp
tRNA 1479645 256
fin CDS 1479975 comp
deb CDS 1522454 86 comp
tRNA 1523230 34
fin CDS 1523336 comp
deb CDS 1540671 186 comp
tRNA 1541994 351 comp
fin CDS 1542418
deb CDS 1691238 189
tRNA 1692768 564
fin CDS 1693416
deb CDS 1760709 185 comp
tRNA 1762091 316
fin CDS 1762481 comp
deb CDS 2034849 32 comp
tRNA 2035061 26 comp
deb CDS 2035161 64 comp
tRNA 2035402 246 comp
fin CDS 2035721
deb CDS 2185380 84
tRNA 2186256 40
tRNA 2186381 25
tRNA 2186493 16
tRNA 2186583 40
tRNA 2186710 13
ncRNA 2186809 133
fin CDS 2187040 comp

scc intercalaires tRNA[modifier | modifier le wikicode]

  • Lien tableur: scc intercalaires tRNA
  • Légende:
    - comp', l'intercalaire est entre un gène comp (sur le complément) et un gène sur le brin direct. Continu les 2 gènes sont sur le même brin.
    - deb, fin sont les intercalaires des cds du tableau précédent, autres intercalaires: respectivement dans le sens des adresses croissantes, le cds avant le 1er tRNA et le cds après le dernier tRNA du bloc.
  • Cumuls comp'+continu du tableau
	deb	fin	total
<201	24	13	37
total	34	33	67
%	71	39	55
scc intercalaires tRNA
scc les relevés deb-fin
comp’ entre tRNAs comp’ deb comp’ fin
1194 369
669 452
comp’ 152 176
comp’ 16 comp’ 251
228 182
comp’ 71 comp’ 252
comp’ 237 comp’ 202
comp’ 180 82
82 310
102 412
52 comp’ 334
66 230
10 67 104
236 124
43 comp’ 273 comp’ 223
comp’ 73 comp’ 214
32 38 37 36 138 423
171 437
223 153
112 comp’ 95
comp’ 81 comp’ 78
comp’ 247 comp’ 247
comp’ 173 comp’ 193
comp’ 140 79
comp’ 217 comp’ 103
comp’ 432 213
comp’ 196 comp’ 256
comp’ 86 comp’ 34
186 comp’ 351
189 564
comp’ 185 comp’ 316
32 26
64 comp’ 246
40 25 16 40 13 84
scc intercalaires inférieures à 201 pbs
deb fin continu cumuls
32 26 deb
52 79 <201 13
64 82 total 18
66 104 taux 72%
67 124
82 153 fin
84 176 <201 8
102 182 total 17
112 213 taux 47%
138 230
171 310 total
186 369 <201 21
189 412 total 35
223 423 taux 60%
228 437
236 452
669 564
1194 comp’ cumuls
16 34 deb
71 78 <201 11
73 95 total 16
81 103 taux 69%
86 193
140 202 fin
152 214 <201 5
173 223 total 16
180 246 taux 31%
185 247
196 251 total
217 252 <201 16
237 256 total 32
247 316 taux 50%
273 334
432 351

scc intercalaires rRNA[modifier | modifier le wikicode]

  • Voir la présentation des blocs à rRNA dans le chapitre scc blocs de l'étude préliminaire. A comparer avec le tableau scc autres intercalaires.
  • Remarque: Quand le 16s n'est pas précédé de tRNAs l'intercalaire cds-16s est élevé, il est ici de 812 pbs pour le 1er boc. L'intercalaire cds-bloc de l'autre côté du bloc est beaucoup plus faible, ici 175 pbs. Cette orientation est quasiment générale chez tous les génomes que j'ai étudié ici. Je l'ai notée dans les chapitres génome-bloc de chaque génome.
  • Note: J'ai supposé souvent que les blocs à tRNA sans rRNA sont aussi orientés de l'intercalaire le plus grand au plus petit. Dans scc cumuls et de même pour les autres génomes, j'ai noté cette orientation dans la colonne cdsd, pour cds dirigé. Je n'ai conservé pour les calculs que le plus petit intercalaire des 2 cds bordant le bloc. L'idée était que cette orientation provoquait la création du cds en fin de bloc. Ces cds sont souvent de petites protéines et souvent hypothétiques. Aussi je présente ci-dessous la transformation deb-fin qui est imposée par l'adressage en intercalaire plus grand et plus petit.
deb	fin		tri	grand	petit		deb	fin		tri	grand	petit
1194	369		4	251	16		171	437		17	423	138
669	452		32	32	26		223	153		3	176	152
152	176		28	86	34		112	95		19	223	153
16	251		11	334	52		81	78		18	437	171
228	182		33	246	64		247	247		23	193	173
71	252		12	230	66		173	193		5	228	182
237	202		13	104	67		140	79		31	316	185
180	82		6	252	71		217	103		29	351	186
82	310		16	214	73		432	213		30	564	189
102	412		21	81	78		196	256		27	256	196
52	334		24	140	79		86	34		7	237	202
66	230		8	180	82		186	351		26	432	213
67	104		9	310	82		189	564		15	273	223
236	124		20	112	95		185	316		22	247	247
273	223		10	412	102		32	26		1	1194	369
73	214		25	217	103		64	246		2	669	452
138	423		14	236	124		-	-		-	-	-

scc par rapport au groupe de référence[modifier | modifier le wikicode]

scc: Comparaison avec la référence
tRNAs blocs tRNAs blocs rRNAs
scc 1aa >1aa dup +5s 1-3aas autres total
21 faible 11 6 17
16 moyen 9 5 3 17
14 fort 10 3 13
30 14 0 0 0 3 47
10 g+cga 5 6 11
2 agg+cgg 2 2
4 carre ccc 4 4
5 autres 0
11 6 0 0 0 0 17
total tRNAs ‰
scc 1aa >1aa dup +5s 1-3aas autres scc ‰ ref.‰
21 faible 234 128 362 26
16 moyen 191 106 64 362 324
14 fort 213 64 277 650
638 298 64 47 729
10 g+cga 106 128 234 10
2 agg+cgg 43 43
4 carre ccc 85 85 16
5 autres
234 128 362
blocs tRNAs ‰ total colonne %
scc 1aa >1aa dup total ref.‰ 1aa >1aa dup
21 faible 250 136 386 26 37 43
16 moyen 205 114 318 324 30 36
14 fort 227 68 295 650 33 21
682 318 44 729 30 14
10 g+cga 114 136 250 10 45 100
2 agg+cgg 45 45 18
4 carre ccc 91 91 16 36
5 autres
250 136 386 11 6

spirochetes, estimation des -rRNAs[modifier | modifier le wikicode]

  • Lien tableur: spirochetes, estimation des -rRNAs
  • Liens fiche:   typage
  • Légende: prélèvement de la base gtRNAdb le 11.1.21
    - ttt et tgt sont nuls partout
    - atgi, c'est Ile2, mis à la place de ttt, très rare chez les procaryotes.
    - atgf, c'est Metf, mis à la place de tgt, très rare chez les procaryotes.
    - atgj, c'est Met, remplace le atg standard qui est la somme Ile2 Met fMet.
    - Voir la légende des tris, g1 t1 et des couleurs

spirochetes, calcul des -rRNAs[modifier | modifier le wikicode]

spi spirochetes 13 génomes
spi1 cumul des +rRNAs de la fiche spirochetes pour 13 génomes
g1    t1       
atgi tct tat atgf
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc tcc tac tgc
atc 9 acc aac agc
ctc ccc cac cgt
gtc gcc gac ggc
tta tca taa tga
ata aca aaa aga
cta cca caa cga
gta gca 12 gaa gga
ttg tcg tag tgg
atgj acg aag agg
ctg ccg cag cgg
gtg gcg gag ggg
spir13 inter max min total
13 21
spi2 indices du clade spirochetes du 11.1.21 de gtRNAdb pour 100 génomes
g1    t1       
atgi 96 tct tat atgf 96
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc 125 tcc 100 tac 100 tgc 100
atc 100 acc 100 aac 100 agc 100
ctc 103 ccc 55 cac 100 cgt 12
gtc 55 gcc 59 gac 107 ggc 103
tta 100 tca 100 taa tga 16
ata 1 aca 100 aaa 100 aga 101
cta 100 cca 100 caa 100 cga 92
gta 101 gca 114 gaa 82 gga 100
ttg 100 tcg 41 tag tgg 100
atgj 97 acg 58 aag 78 agg 66
ctg 52 ccg 42 cag 42 cgg 47
gtg 34 gcg 41 gag 40 ggg 21
gtRNA inter max min total
1560 1326 891 3777
spi3 cumul des -rRNAs de l'annexe spiro de 1 génome
g1    t1       
atgi 1 tct tat atgf 1
att act aat agt
ctt cct cat cgc 1
gtt gct gat ggt
ttc 1 tcc 1 tac 1 tgc 1
atc acc 1 aac 1 agc 1
ctc 1 ccc 1 cac 1 cgt
gtc 1 gcc 1 gac 1 ggc 1
tta 1 tca 1 taa tga
ata aca 1 aaa 1 aga 1
cta 1 cca 1 caa 1 cga 1
gta 1 gca gaa 1 gga 1
ttg 1 tcg 1 tag tgg 1
atgj 1 acg 1 aag 1 agg 1
ctg 1 ccg 1 cag 1 cgg 1
gtg 1 gcg 1 gag 1 ggg 1
spir1 inter max min total
14 14 16 44
spi4 indices des +rRNAs de la fiche spirochetes pour 100 génomes
g1    t1       
atgi tct tat atgf
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc tcc tac tgc
atc 69 acc aac agc
ctc ccc cac cgc
gtc gcc gac ggc
tta tca taa tga
ata aca aaa aga
cta cca caa cga
gta gca 92 gaa gga
ttg tcg tag tgg
atgj acg aag agg
ctg ccg cag cgg
gtg gcg gag ggg
spir13 inter max min total
162 0 0 162
spi5 estimation des -rRNA du clade spirochetes pour 100 génomes
g1    t1       
atgi 96 tct tat atgf 96
att act aat agt
ctt cct cat cgc 90
gtt gct gat ggt
ttc 125 tcc 100 tac 100 tgc 100
atc 31 acc 100 aac 100 agc 100
ctc 103 ccc 55 cac 100 cgt 12
gtc 55 gcc 59 gac 107 ggc 103
tta 100 tca 100 taa tga 16
ata 1 aca 100 aaa 100 aga 101
cta 100 cca 100 caa 100 cga 92
gta 101 gca 22 gaa 82 gga 100
ttg 100 tcg 41 tag tgg 100
atgj 97 acg 58 aag 78 agg 66
ctg 52 ccg 42 cag 42 cgg 47
gtg 34 gcg 41 gag 40 ggg 21
-rRNA inter max min total
1398 1326 891 3615
spi6 indices des -rRNAs de l'annexe archeo pour 100 génomes
g1    t1       
atgi 100 tct tat atgf 100
att act aat agt
ctt cct cat cgc 100
gtt gct gat ggt
ttc 100 tcc 100 tac 100 tgc 100
atc acc 100 aac 100 agc 100
ctc 100 ccc 100 cac 100 cgt
gtc 100 gcc 100 gac 100 ggc 100
tta 100 tca 100 taa tga
ata aca 100 aaa 100 aga 100
cta 100 cca 100 caa 100 cga 100
gta 100 gca gaa 100 gga 100
ttg 100 tcg 100 tag tgg 100
atgj 100 acg 100 aag 100 agg 100
ctg 100 ccg 100 cag 100 cgg 100
gtg 100 gcg 100 gag 100 ggg 100
spir1 inter max min total
1400 1400 1600 4400

spirochetes, comparaison clade-annexe des -rRNAs[modifier | modifier le wikicode]

  • Lien tableur: spirochetes, comparaison clade-annexe des -rRNAs
  • Légende
    - spi7. diff, somme des couleurs de spi7. La différence entre tRNAs est faite entre spi5 et spi6 du tableau précédent. Elle est exprimée en % et rapporté à la plus grande valeur des 2 termes de la différence. Ce qui fait quand un tRNA est à zéro la différence en % est égale à 100.
    - spi8. rap, rapport des sommes couleurs spi5/spi2. Le rapport -rRNA/total est celui du tRNA de spi5 sur celui de spi2.
  • Fréquences des différences en % du tableau spi7
gamme		0/0	10	20	30	40	50	60	70	80	90	100			total
fréquence		27	2	1	1	5	6	1	1	0	5	0	49
tot ≤ 50							36							
  • Comparaison avec le nombre de tRNAs de la fiche du clade: L’estimation des -rRNA par l'annexe est 18% au dessus de celle de la fiche des spirochetes.
tRNAs		fiche		annexe
sans		485		44
avec		22		3
genomes		13		1
indice %	37		44
spi spirochetes 13 génomes
spi7 spirochetes, différence clade-annexe des -rRNAs
g1    t1       
atgi 4 tct tat atgf 4
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc 20 tcc 0 tac 0 tgc 0
atc 100 acc 0 aac 0 agc 0
ctc 3 ccc 45 cac 0 cgt 100
gtc 45 gcc 41 gac 7 ggc 3
tta 0 tca 0 taa tga 100
ata 100 aca 0 aaa 0 aga 1
cta 0 cca 0 caa 0 cga 8
gta 1 gca 100 gaa 18 gga 0
ttg 0 tcg 59 tag tgg 0
atgj 3 acg 42 aag 22 agg 34
ctg 48 ccg 58 cag 58 cgg 53
gtg 66 gcg 59 gag 60 ggg 79
diff inter max min total
56 62 732 850
spi8 spirochetes, rapports -rRNA/total
g1    t1       
atgi tct tat atgf
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc tcc tac tgc
atc 31 acc aac agc
ctc ccc cac cgc
gtc gcc gac ggc
tta tca taa tga
ata aca aaa aga
cta cca caa cga
gta gca 19 gaa gga
ttg tcg tag tgg
atgj acg aag agg
ctg ccg cag cgg
gtg gcg gag ggg
rap inter max min total
50 0 0 50