Aller au contenu

Recherche:Les clusters de gènes tRNA et rRNA chez les procaryotes/Annexe/actino

Une page de Wikiversité, la communauté pédagogique libre.
actino
Image logo représentative de la faculté
Annexe 5
Recherche : Les clusters de gènes tRNA et rRNA chez les procaryotes
Précédent :clostridia
Suivant :bacteroide
En raison de limitations techniques, la typographie souhaitable du titre, « Annexe : actino
Les clusters de gènes tRNA et rRNA chez les procaryotes/Annexe/actino
 », n'a pu être restituée correctement ci-dessus.



Actinoplanes sp. SE50/110

[modifier | modifier le wikicode]
  • Liens: gtRNAdb [1], NCBI [2], génome [3]
  • Lien tableur: ase opérons
  • Phylogénie: Bacteria; Actinobacteria; Micromonosporales; Micromonosporaceae;Actinoplanes; unclassified Actinoplanes.
  • Légende: cdsa: cds aas, cdsd: cds dirigé
Ac1. Actinoplanes sp. SE50/110
71.15%GC 13.8.19 Paris  98   doubles intercal cds aa avec aa cdsa cdsd protéines
12658..13392 CDS 78 78 245
13471..13547 atc @1 242 242
13790..13862 gca 202 202
comp 14065..14607 CDS 181
153733..155094 CDS 556 556 454
155651..157174 16s 308 1524
157483..160591 23s 99 3109
160691..160807 5s 134 134 117
comp 160942..161988 CDS 349
comp 45153..45968 CDS 276 276 272
comp 46245..46330 ctg 257 257
46588..47385 CDS 266
568633..569007 CDS 492 492 125
569500..571022 16s 308 1523
571331..574439 23s 108 3109
574548..574664 5s 245 245 117
574910..576340 CDS 477
comp 66324..66533 CDS 177 177 70
comp 66711..66784 ggg 151 151
comp 66936..67442 CDS 169
comp 145264..145572 CDS 595 595 103
comp 146168..146244 ttc 12 12
comp 146257..146333 gac 62 62
comp 146396..146468 gaa 338 338
comp 146807..148066 CDS 420
164168..164716 CDS 92 92 183
164809..164883 aaa 250 250
165134..166444 CDS 437
comp 457033..458760 CDS 116 116 576
458877..458950 acg 74 74
comp 459025..460758 CDS 578
627485..628396 CDS 42 42 304
628439..628515 gac 5 5
comp 628521..629174 CDS 218
645098..645421 CDS 355 355 108
645777..645849 agg 459 459
comp 646309..648462 CDS 718
747312..748337 CDS 430 430 342
comp 748768..748851 tac 148 148
749000..749491 CDS 164
752175..754703 CDS 94 94 843
754798..754873 acc 44 44
754918..754990 atgj 138 138
755129..755296 CDS 56
755829..756224 CDS 79 79 132
756304..756376 tgg 103 103
756480..756857 CDS 126
940643..942004 CDS 55 55 454
942060..942142 tta 221 221
942364..943218 CDS 285
comp 1155560..1155901 CDS 200 200 114
comp 1156102..1156177 gcc 89 89
comp 1156267..1156824 CDS 186
1222705..1223634 CDS 259 259 310
comp 1223894..1223980 cta 244 244
comp 1224225..1224701 CDS 159
1237525..1238115 CDS 91 91 197
1238207..1238282 cac 54 54
comp 1238337..1238684 CDS 116
comp 1248040..1249266 CDS 132 132 409
1249399..1249474 aag + 118 118
1249593..1249668 aag 2 aag -15 -15
comp 1249654..1249878 CDS @2 75
1335812..1336096 CDS 296 296 95
comp 1336393..1336465 aga 13 13
comp 1336479..1337558 CDS 360
comp 1399552..1400070 CDS 376 376 173
comp 1400447..1400520 gga 130 130
1400651..1400724 cca 38 38
1400763..1402112 CDS 450
comp 1406634..1406849 CDS 586 586 72
1407436..1408958 16s 307 1523
1409266..1412374 23s 99 3109
1412474..1412590 5s 122 122 117
comp 1412713..1413510 CDS 266
comp 1519931..1520254 CDS 217 217 108
1520472..1520544 aac 315 315
1520860..1522122 CDS 236 236 421
1522359..1522432 atgi 1097 1097
< comp 1523530..1523919 CDS 130
1604562..1605026 CDS 38 38 155
1605065..1605139 gta 357 357
<> 1605497..1605583 CDS 29
comp 1935668..1936510 CDS 317 317 281
comp 1936828..1936904 ttg 131 131
1937036..1937656 CDS 207
2434408..2435559 CDS 19 19 384
comp 2435579..2435661 ctc 151 151
2435813..2438881 CDS 1023
comp 2570204..2570824 CDS 794 794 207
2571619..2573141 16s 315 1523
2573457..2576562 23s 98 3106
2576661..2576777 5s 247 247 117
comp 2577025..2577462 CDS 146
comp 4900233..4901780 CDS 19 19 516
comp 4901800..4901878 tgc 29 29
comp 4901908..4901981 gcg 19 19
comp 4902001..4902321 CDS 23 23 107
comp 4902345..4902417 gac 31 31
comp 4902449..4903369 CDS 307
5443888..5444526 CDS 409 409 213
5444936..5445012 ctc 17 17
5445030..5445114 tac 29 29
comp 5445144..5446565 CDS 474
6208479..6209489 CDS 101 101 337
comp 6209591..6209666 cgg 9 9
comp 6209676..6209749 cca 17 17
comp 6209767..6209859 agc 5 5
comp 6209865..6209939 ctg 4 4
comp 6209944..6210015 cag 8 8
comp 6210024..6210100 ggc 4 4
comp 6210105..6210177 cgt 3 3
comp 6210181..6210254 gcc 43 43
comp 6210298..6210369 tgg 562 562
comp 6210932..6212365 CDS 478
6397923..6398423 CDS 699 699 167
6399123..6399196 tgg 199 199
6399396..6399468 ggg 157 157
6399626..6399701 gcc 61 61
6399763..6399837 gag 78 78
6399916..6399992 gga 359 359
6400352..6400426 ttg 1 1
6400428..6400500 acc 5 5
6400506..6400577 ggc 25 25
6400603..6401055 CDS 35 35 151
6401091..6401163 cag 110 110
6401274..6401350 ctc 1 1
6401352..6401427 acg 1 1
6401429..6401503 ctg 5 5
6401509..6401584 gcg 30 30
6401615..6401686 gac 5 5
6401692..6401779 agc 1 1
6401781..6401854 atc 6 6
6401861..6402227 ncRNA @3 7 7
6402235..6402309 cgt 10 10
6402320..6402395 other @4 11 11
6402407..6402477 aag 14 14
6402492..6402565 aga 11 11
6402577..6402650 aaa 1 1
6402652..6402727 atgf 1 1
6402729..6402804 gtc 1 1
6402806..6402879 gaa 5 5
6402885..6402958 aac 44 44
6403003..6403088 tcc 1 1
6403090..6403163 gtg 2 2
6403166..6403239 cac 93 93
6403333..6403405 other 411 411
comp 6403817..6404185 CDS 123
6543230..6543619 CDS 412 412 130
6544032..6544106 ctg 152 152
6544259..6544331 gca 410 410
6544742..6545917 CDS 392
6934653..6935819 CDS 69 69 389
comp 6935889..6935962 ccc 51 51
comp 6936014..6937450 CDS 479
comp 6991952..6992437 CDS 174 174 162
comp 6992612..6992728 5s 170 117
comp 6992899..6996006 23s 307 3108
comp 6996314..6997836 16s 531 531 1523
comp 6998368..6999624 CDS 419
7455514..7456608 CDS 167 167 365
comp 7456776..7456847 gtg 55 55
comp 7456903..7457310 CDS 136
7481671..7483989 CDS 83 83 773
comp 7484073..7484189 5s 169 117
comp 7484359..7487466 23s 315 3108
comp 7487782..7489304 16s 800 800 1523
comp 7490105..7490731 CDS 209
7670534..7671652 CDS 136 136 373
comp 7671789..7671863 gtc 18 18
comp 7671882..7671952 tgc 38 38
comp 7671991..7672063 ggc 116 116
comp 7672180..7674045 CDS 622
7710075..7711193 CDS 136 136 373
comp 7711330..7711404 gtc 28 28
comp 7711433..7711503 tgc 38 38
comp 7711542..7711614 ggc 112 112
7711727..7712905 CDS 393
8111157..8111843 CDS 546 546 229
comp 8112390..8112465 gag + 532 532
comp 8112998..8113070 gag 2 gag 57 57
comp 8113128..8113199 cag 451 451
comp 8113651..8114457 CDS 269
8275151..8275810 CDS 65 65 220
8275876..8275950 cgg 416 416
comp 8276367..8276921 CDS 185
comp 8391343..8392530 CDS 255 255 396
comp 8392786..8392862 atgf 296 296
comp 8393159..8394607 CDS 483
comp 8397029..8399113 CDS 596 596 695
comp 8399710..8399786 atgf 71 71
comp 8399858..8402857 CDS 1000
comp 8601686..8603128 CDS 81 81 481
comp 8603210..8603280 caa 37 37
comp 8603318..8604199 CDS 294
8623005..8623730 CDS 64 64 242
comp 8623795..8623871 gcg 171 171
comp 8624043..8624792 CDS 250
comp 8821061..8822146 CDS 136 136 362
8822283..8822356 aca 175 175
comp 8822532..8824421 CDS 630
8945870..8946763 CDS 190 190 298
8946954..8947030 ccg 204 204
comp 8947235..8947531 CDS 99
comp 8963177..8966704 CDS 104 104 1176
comp 8966809..8966904 ncRNA 83 83 83
8966988..8967075 tcc 270 270
comp 8967346..8967687 CDS 114
8968639..8969070 CDS 521 521 144
comp 8969592..8969681 tcg 116 116
8969798..8970505 CDS 236
9077764..9078855 CDS 326 326 364
comp 9079182..9079256 cgt 370 370
comp 9079627..9082830 CDS 1068
comp 9084051..9086675 CDS 560 560 875
comp 9087236..9087311 cgt 40 40
comp 9087352..9087442 agc 399 399
9087842..9089017 CDS 392
comp 9100587..9101549 CDS 77 77 321
9101627..9101714 tca 144 144
comp 9101859..9102145 CDS 96
cumuls. ase.
opérons Fréquences intercalaires tRNAs Fréquences intercalaires cds Fréquences aas cds chromosome
effectif gammes sans rRNAs avec rRNAs gammes cds gammes cdsd gammes cdsa gammes cdsa 300
avec rRNA opérons 6 1 8 - 1 1 1 100 8 30 1
16 23 5s 0 6 20 19 50 16 20 200 29 60 1
16 atc gca 0 40 6 100 19 40 300 19 90 3
16 23 5s a 0 60 4 150 17 60 400 19 120 10
max a 0 80 3 200 9 80 500 14 150 9
a doubles 0 100 2 250 9 100 600 3 180 8
autres 0 120 2 300 7 120 700 3 210 8
total aas 0 140 1 350 4 140 800 2 240 5
sans opérons 45 160 2 400 5 160 900 2 270 6
1 aa 31 180 0 450 6 180 1000 1 300 5
max a 29 200 1 500 3 200 1100 2 330 4
a doubles 2 3 13 1 43
total aas 98 40 0 86 0 89 60
total aas 98
remarques 4
avec jaune moyenne 58 229 328
variance 98 206 173
sans jaune moyenne 19 147 254 179
variance 21 104 111 62
Ac1. Actinoplanes sp. SE50/110
CDS 556 454 492 125 586 72
16s 308 1524 308 1523 307 1523
23s 99 3109 108 3109 99 3109
5s 134 117 245 117 122 117
CDS 349 477 266
CDS 794 207 531 419 800 209
16s 315 1523 307 1523 315 1523
23s 98 3106 170 3108 169 3108
5s 247 117 174 117 83 117
CDS 146 162 773

ase distribution

[modifier | modifier le wikicode]
Ac1 ase, Actinoplanes sp. SE50/110. actinomycete.
Ac11 ase. La distribution des tRNAs solitaires.
g1    t1       
atgi 1 tct tat atgf 2
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc tcc 1 tac 1 tgc
atc acc aac 1 agc
ctc 1 ccc 1 cac 1 cgt 1
gtc gcc 1 gac 2 ggc
tta 1 tca 1 taa tga
ata aca 1 aaa 1 aga 1
cta 1 cca caa 1 cga
gta 1 gca gaa gga
ttg 1 tcg 1 tag tgg 1
atgj acg 1 aag agg 1
ctg 1 ccg 1 cag cgg 1
gtg 1 gcg 1 gag ggg 1
actino >1aa =1aa -5s +5s -16s +16s total
ase 32 32
Ac12 ase. La distribution des tRNAs multiples.
g1    t1       
atgi tct tat atgf 1
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc 1 tcc 1 tac 1 tgc 3
atc 2 acc 2 aac 1 agc 3
ctc 2 ccc cac 1 cgt 3
gtc 3 gcc 2 gac 2 ggc 4
tta tca taa tga
ata aca aaa 1 aga 1
cta cca 2 caa cga
gta gca 2 gaa 2 gga 2
ttg 1 tcg tag tgg 2
atgj 1 acg 1 aag 3 agg
ctg 3 ccg cag 3 cgg 1
gtg 1 gcg 2 gag 3 ggg 1
actino >1aa =1aa -5s +5s -16s +16s total
ase 64 64

ase. Intergen51

[modifier | modifier le wikicode]

Intergen51. ase. Le génome

[modifier | modifier le wikicode]
  • ase Le prélèvement: Apmq
  • Le nom et le lien NCBI: ase, Actinoplanes sp. SE50/110, NCBI [4], date 17.12.20.
  • ase La longueur totale des intercalaires, longueur du génome et taux intercalaires/génome:
Nom	intercals	génome		taux en %			
ase	1,100,127	9,239,851	11.9	
ase données intercalaires
[modifier | modifier le wikicode]
ase données intercalaires 200
[modifier | modifier le wikicode]
ase autres intercalaires aas
[modifier | modifier le wikicode]

Intergen51. ase. Les différents types d'intercalaires

[modifier | modifier le wikicode]
  • Lien au tableur: Intergen51. ase les différents types d'intercalaires.
  • Légende:
    - S pour intercalaire CDS-CDS et R pour tRNA-CDS,
    - c pour intercalaire continu (les 2 gènes sont sur le même brin) et x pour discontinu (les 2 gènes sont sur 2 brins différents, le brin et son complément)
    - %reste = 100*reste/total, le reste étant ce qui reste du total après la fin du diagramme, gamme.
    - %t30 = 100*t30/total, t30 étant le total des fréquences 10 20 30
    - %t5 = 100*t/total, t5 étant le total des fréquences de -1 à -5 dans le diagramme des S-.
Int51.2 ase les différents types d'intercalaires entre gène
Int51.21 Les différents types
intercalaires CDS-CDS * autres intercalaires
continu S+ S- S0 total c/x RNA-RNA CDS-rRNA total
c 3,841 1,300 13 5,154 1.7 61 6 67
x 2,669 352 22 3,043 1 6 7
t 6,510 1,652 35 8,197 62 12 74
% 79.4 20.2 0.4
Int51.22 Détail des * autres intercalaires
intercalaires tRNA-CDS récapitulatif des * autres intercalaires
continu R+ R- R0 total c/x * autres total %
c 56 0 0 56 1.2 tRNA-CDS 101 55
x 44 1 0 45 RNA-RNA 62 34
t 100 1 0 101 CDS-rRNA 12 7
% 99.0 1.0 0.0 non RNA 8 4
- total 183 100
Int51.23 Les taux remarquables
taux %reste %t30 %t5 %0
type S+ R+ S- S+ R+ S- S+ R+
gamme 400 400 6-50 - - - - -
type S+ R+ S- S+ R+ S- S+ R+
c 7.6 17.9 2.2 24.4 8.9 81 0.3 0.0
x 9.7 20.0 15.1 12.1 4.4 31 0.7 0.0

Intergen51. ase. Les diagrammes CDS-CDS positifs

[modifier | modifier le wikicode]
  • Lien tableur: ase données intercalaires
  • Diagrammes:
    - fc40, CDS-CDS continu, fréquence unitaire en abscisses et effectif en ordonnées ase fc40
    - fx%, CDS-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et pourcentage en ‰ par rapport au total, en ordonnées. ase fx1
    - fc%, CDS-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et pourcentage en ‰ par rapport au total, en ordonnées. ase fc1
  • Équations des courbes de tendance en pour 1000: colonnes %fx %fc
Courbes de tendances pour les diagrammes en pour 1000			Calculs des f.41	ase
R2	x3		x2		x		c		Inflexion poly3	x	c
0.870	1.75E-06	-1.01E-03	3.94E-02	40.70	fx1	abscisse	-54.4	333.3
0.911	-3.97E-06	3.28E-03	-9.17E-01	96.4	fc1	ordonnée	69.4	5.6
								
0.947	3.49E-07	5.70E-05	-2.09E-01	57.90	fx41			
0.972	-1.60E-06	1.60E-03	-5.69E-01	76.7	fc41			
  • Le rfin après 400 est de 292 sur un total de 3854 . Jusqu'à 1% les freq10 sont en continu jusqu'à 1030 , reste 39 . L'indice i.rfin1 = 253/630=0,402.
  • Le reste après 1030 est de 39 sur un total de 3854 . Jusqu'à 2‰ les freq10 sont en continu jusqu'à 1540 , reste 10 . L'indice i.rf2 = 29/510=0,057.
  • Moyennes glissantes fc+400, diagonale. Voir le détail des calculs dans abs.
données	ase		calculs			poly3	ase
effect	3854		R2.21	870		abscis	200
xm	25		pte	18,71		flexa	93
ym	19		cste	5,40		flexo	3,64
x1m	235		r400l	165		xm	25
y1m	1		restp	178,00		sup4	81,9
rfin	75,77		%sd	10,96		sup4t	328,2
bornf	95		lond	210		%	24,9
supd	66,3		%sf	13,85		long	68
supdt	604,6		lonf	70		R2	697
xmp	217,44		sf/lf	0,66			
r400	102,23		sr/lr	0,14			
supf	46,4		sd/ld	0,32			
supft	335,2		i.r400	0,62									

Intergen51. ase. Les CDS-CDS négatifs

[modifier | modifier le wikicode]
Sous-totaux	ase			totale	
fréquence	x-	c-		x-	c-
 - 1		0	168		4	4140
 - 2		18	0		85	11
 - 3		0	0		3	12
 - 4		90	886		717	10938
 - 5		0	1		5	19
sp6		244	245		1642	8424
total		352	1300		2,456	23,544
reste		53	28		264	420
s6		39	3		361	41
s7		49	70		321	1438
s8		103	144		696	6525
rappot s1-5						
4/2/1		5.0	5.3		8.4	2.6
% / sp6						
s6/sp6		16.0	1.2		22.0	0.5
s7/sp6		20.1	28.6		19.5	17.1
s8/sp6		42.2	58.8		42.4	77.5
reste/sp6	21.7	11.4		16.1	5.0
						
total s1-5	108	1055		814	15120
% / total						
%s1-5		30.7	81.2		33.1	64.2
%sp6		69.3	18.8		66.9	35.8

Intergen51. ase. Les intercalaires des blocs

[modifier | modifier le wikicode]
  • Le détail
RNA-RNA		c	x		CDS-RNA		c	x
23s 5s		6			CDS 16s		4	2
16s 23s		6			5s CDS		2	4
16s tRNA				16 CDS			
tRNA 23s				CDS 5s			
5s tRNA					23s CDS			
tRNA in					CDS 23s			
tRNA contig				5s 16s			
tRNA hors	49	1		16s16s			
tRNA 16s								
23s tRNA								
tRNA 5s								
16s 5s								
5s 23s								
5s 5s								
total		61	1		total		6	6

  • Les rares voir gamma pour la longueur des intercalaires
  • Les tRNA-CDS compris, comparaison dans le clade et dans l'étude.

Intergen51. ase. Les intercalaires tRNA-tRNA extra bloc

[modifier | modifier le wikicode]
Int51.31 ase. Les intercalaires tRNA-tRNA extra blocs
hors1 hors2 hors3 hors4
inter aa    inter aa    inter aa    inter aa
245 atc 9 cgg 110 cag 152 ctg
** gca 17 cca 4 ctc ** gca
15 ttc 5 agc 1 acg 18 gtc
62 gac 4 ctg 5 ctg 38 tgc
** gaa 11 cag 30 gcg ** ggc
47 acc 4 ggc 5 gac 28 gtc
** atgj 3 cgt 1 agc 38 tgc
118 aag 43 gcc ** atc ** ggc
** aag ** tgg 97 cgt 532 gag
29 tgc 199 tgg 14 aag 57 gag
** gcg 157 ggg 11 aga ** cag
20 ctc 64 gcc 1 aaa 40 cgt
** tac 81 gag 1 atgf ** agc
29 tgc 141 gga 1 gtc
** gcg 144 caa 5 gaa
20 ctc 1 ttg 44 aac
** tac 5 acc 1 tcc
** ggc 2 gtg
96 cac
** other
-

ase intercalaires entre cds

[modifier | modifier le wikicode]
  • Lien NCBI [5]
  • Note: Pour les génomes des annexes j'ai relevé les intercalaires entre tRNAs et entre ceux-ci et les cds qui leur sont adjacents. L'exemple est celui de rru du clade alpha. L'idée de départ de ces prélèvements est la recherche d'opérons formés de tRNA et de protéine comme dans le cas d'E.coli: l'intercalaire entre le tRNA et la protéine devrait être faible. Voir l'exemple d'eco (remarque @3) avec tac-tac-tpr et aca-tac-gga-acc-tufB.

ase intercalaires positifs S+

[modifier | modifier le wikicode]
ase. Sx+ Sc+ Les diagrammes 400
ase Sx+ Sc+
Poly3 -7 -5 -3 1 R2 flex x+ comment. -7 -5 -3 1 R2 flex c+ comment.
1 à 400 19 -108 35 46 872 189 max70 -43 352 -987 104 910 273 min50
31 à 400 22 -129 74 44 881 195 2 parties -18 182 -637 85 976 337 2 parties
droite -a cste - R2 note R2’ -a cste - R2 note R2’
1 à 400 125 51 - 847 dte 25 tf 184 63 - 694 poly 216 SF
31 à 400 129 52 - 849 dte 32 tf 141 51 - 827 poly 149 SF
  • Légende du tableau corrélations et fréquences faibles:
ase. Sx+ Sc+ Les diagrammes 400. Corrélations et les fréquences faibles 1-30
effectifs diagramme corrélation x+ c+, 41-n corrélation x+ c+, 1-n
gen minima x+ c+ total 400 200 250 diff 200 250 400
ade min50 1229 2242 3471 867 624 758 134 879 897 903
ase min40 2398 3558 5956 959 922 940 18 646 725 814
cvi min30 1008 2320 3328 931 858 891 33 434 549 696
1-30 ‰ effectifs 0 ‰ <0 ‰ effectifs 1-40 corel
1-30 x+ 1-30 c+ x+/c+ x c x c x- c- x+ c+ x+/c+
221 335 0.66 1412 3052 8 6 72 234 304 876 459
135 264 0.51 3031 5166 7 3 116 252 389 1165 346
112 301 0.37 1171 3111 4 3 59 221 130 815 582
  • Diagrammes 400:  ase pmg,   diagramme 1-40: c+ asec+ pmgx+ asex+ pmgtotal,   texte: pmg.
  • Résumé: ase est le génome dont la corrélation 41-250 est la plus élevée, 0.940. Elle se maintient à 41-200, comme pub, mais contrairement à pmg et ade où elle chute fortement. Par contre elle chute fortement dans les plages 1-n contrairement à pub qui se maintient et à pmg et ade qui s’améliorent nettement pour atteindre 0.900. Les courbes 400 ressemblent à celles de pmg avec une légère modification. Ce sont les fréquences faibles x+ qui agissent sur les corrélations et les courbes x+ n-400 de ase.
    - La courbe x+ 1-400
    • Le génome ase se distingue par un faux départ à la fréquence 10 comme maximum. Son taux 1-30 est de 135 ‰ or les vrais départ à 10 ont un taux supérieur à 169 (rru), ade ant mja pmg pub rru. Son vrai maximum est à 70 au-delà de 30 comme les 15 génomes restant.
    • La forme de la courbe est un tilde faible, tf, due notamment au renflement au niveau du maximum 70 contrairement aux formes S des 6 vrais départs en 10 listés auparavant, ade Sf39, ant SF71, mja SF78, pmg SF179, pub SF249, rru Sf20.
    - Comparaison pmg ase: ils se ressemblent par leurs courbes plus qu’entre ase/ade.
    • ils ont tous les 2 un minimum à 40 mais ase possède un renflement important avec un maximum à 700.
    • ase a des effectifs 4 fois plus élevés que pmg avec un total de 5956 contre 1454.
    • Les courbes c+ n-400 sont les 4 de forme SF.
    • Les courbes x+ n-400 : seule pmg x+ 1-400 est SF, les 3 autres sont des tildes plutôt faibles.
    - Les corrélations: comme indiqué dans l’introduction, ase se démarque de pub pmg et ade par le comportement de ses corrélations à cause de ses faibles fréquences. Le génome cvi, avec un taux peu élevé des fréquences faibles, a le même comportement. On verra que les 14 autres génomes au taux peu élevé des fréquences faibles ont des corrélations peu élevées dans les plages 1-n.
    - Les faibles fréquences: Le rapport des faibles fréquences x+/c+ de 0.51 est le même que celui de pub. Au contraire de pub et pmg il agit peu sur les taux des zéros, qui sont inférieurs à 1%. Par contre les x- sont aussi élevés que ceux de pmg.
    - Les courbes 1-40
    • c+ est très proche du modèle des c+ comme celui de ade et mieux que celui de pmg.
    • Avec une corrélation x+/c+ de 0.346, la courbe x+1-40 ressemble à celle de pmg et ade avec une bosse à la fréquence 6 et un creux à 11, bien qu’il apparaît une bosse à la fréquence 9 comme sur le modèle des c+.

ase autres intercalaires

[modifier | modifier le wikicode]
  • Lien tableur: ase autres intercalaires aas
  • Légende:  
    - comp, le gène est sur le brin complement
    - deb, fin sont respectivement dans le sens des adresses croissantes, le cds avant le 1er tRNA et le cds après le dernier tRNA du bloc.
  • Totaux
tRNA-cds		tRNA-tRNA		autres-cds		total
c+	x+	x-	c+	x+	c-	c+	x+	nc-tRNA	
66	46	1	63	1		3	2	1	183
  • Méthode de calculs des intercalaires autres que les CDS-CDS voir le cas de amed.

Bifidobacterium longum NCC2705

[modifier | modifier le wikicode]
  • Liens: gtRNAdb [6], NCBI [7], génome [8]
  • Lien tableur: blo opérons
  • Phylogénie: Bacteria; Actinobacteria; Bifidobacteriales; Bifidobacteriaceae; Bifidobacterium.
Ac2. Bifidobacterium longum NCC2705
60%GC 30.6.19 Paris  57  doubles intercal
115187..115260 gta
159243..160772 16s @1 430
161203..164268 23s 168
164437..164556 5s
comp 207382..207457 tgg
comp 382849..382924 aac + 43
comp 382968..383040 aac 2 aac
comp 440078..440150 aac
503549..503624 ggc + 24
503649..503719 tgc 2 ggc 41
503761..503835 gtc 45
503881..503953 gtg 31
503985..504060 ggc
521008..521084 ccc
648764..648851 ctc
comp 747296..747369 cgt + 29
comp 747399..747472 cgt 2 cgt
775646..775716 caa
778709..778784 gcc + 86
778871..778946 gcc 2 gcc
793729..793805 cca
comp 804390..804463 ttg
comp 841055..841136 tta
937056..937131 cac
comp 981177..981253 aga
1202433..1202505 acg 87
1202593..1202676 cta
1208139..1208211 acg
comp 1264390..1264465 gtg 48
comp 1264514..1264585 gtc 46
comp 1264632..1264704 ggc
comp 1280591..1280666 cgg
1295466..1295542 atgf
comp 1350001..1350074 aag
comp 1388875..1388950 aaa
1410594..1410681 tcc
comp 1424793..1424867 cag 36
comp 1424904..1424979 gag
comp 1524142..1524215 ggg
1534802..1534887 ctg
1606163..1606236 atc 42
1606279..1606351 gca
comp 1646835..1646911 aca
1705902..1707431 16s 429
1707861..1710926 23s 168
1711095..1711215 5s
1712083..1713614 16s 422
1714037..1717102 23s 168
1717271..1717390 5s
1769952..1770027 gcg
1905665..1905740 tgg
1908902..1910431 16s 428
1910860..1913926 23s 168
1914095..1914214 5s
1936132..1936205 gga
1971396..1971477 tac 1
1971479..1971550 acc 4
1971555..1971631 atgj
1979312..1979401 agc
2016025..2016112 tcg
2047072..2047159 tca
comp 2068637..2068713 ccg
comp 2085402..2085473 gaa
2087969..2088042 gac 47
2088090..2088165 ttc
2110850..2110926 gac
2130626..2130699 atgi
2171440..2171512 agg
  • Note: Les statistiques sur les intercalaires entre tRNA ne sont pas correctes. Se reporter à intergen51.blo. Il n'y a aucun commentaire sur les CDS. J'ai réduit le tableau aux clusters à rRNA. L'intitulé opéron doit d'être compris dans le sens cluster ou bloc de RNA, rRNA ou tRNA.
blo cumuls	opérons		effectif
avec rRNA	opérons		4
		16 23 5s 0	4
		16 atc gca	0
		16 23 5s a	0
		max a		0
		a doubles	0
		spéciaux	0
		total aas	0
sans 		opérons		41
		1 aa		31
		max a		5
		a doubles	4
		total aas	55
total aas			55
remarques			1
Ac2. Bifidobacterium longum, blocs rRNA.
16s 430 1530 422 1532
23s 168 3066 168 3066
5s 120 120
16s 429 1530 428 1530
23s 168 3066 168 3067
5s 121 120
  • Remarques : 4 blocs 16-23-5s sans aas, en tout, et très peu de doubles. Très simple.
    1. @ 4 blocs 16-23-5s sans aas .
      - Leurs intercalaires sont identiques, 428 168.
  • Séquences des doubles : Très peu de doubles, 4 opérons à 2aas et plus sur 10 ont des doubles.
    - 4 doublets au total: 2aac 2cgt 2gcc et (3aas + 2ggc).
  • Notes :

blo distribution

[modifier | modifier le wikicode]
  • Lien tableur: blo distribution
  • Notes:
    - cgt2 aac2 gcc2
    - Les soulignés ont 1 seul tRNA solitaire
Ac2 blo. La distribution. Actinoplanes sp. SE50/110. actinomycete.
g1    t1       
atgi 1 tct tat atgf 1
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc 1 tcc 1 tac 1 tgc 1
atc 1 acc 1 aac 3 agc 1
ctc 1 ccc 1 cac 1 cgt 2
gtc 2 gcc 2 gac 2 ggc 3
tta 1 tca 1 taa tga
ata aca 1 aaa 1 aga 1
cta 1 cca 1 caa 1 cga
gta 1 gca 1 gaa 1 gga 1
ttg 1 tcg 1 tag tgg 2
atgj 1 acg 2 aag 1 agg 1
ctg 1 ccg 1 cag 1 cgg 1
gtg 2 gcg 1 gag 1 ggg 1
actino >1aa =1aa -5s +5s -16s +16s total
blo 25 31 56

blo. Intergen51

[modifier | modifier le wikicode]

Intergen51. blo. Le génome

[modifier | modifier le wikicode]
  • blo Le prélèvement: Artb
  • Le nom et le lien NCBI: blo, Bifidobacterium longum NCC2705, NCBI [9], date 25.10.20.
  • blo La longueur totale des intercalaires, longueur du génome et taux intercalaires/génome:
Nom	intercals	génome		taux en %			
blo	267,098		2,256,640	11.8	
blo données intercalaires
[modifier | modifier le wikicode]
  • Lien tableur: blo données intercalaires
  • Lien sauvegarde NCBI: Artb
  • Attention les données intercalaires ont changées pour blo aux freq10 50 150 240 250, de 40 30 17 12 en 39 29 18 13. Vérifier dans les totaux des actino. J'ai mis à jour les courbes en freq10 de blo.
blo données intercalaires 200
[modifier | modifier le wikicode]
blo autres intercalaires aas
[modifier | modifier le wikicode]

Intergen51. blo. Les différents types d'intercalaires

[modifier | modifier le wikicode]
  • Lien au tableur: Intergen51. blo les différents types d'intercalaires.
  • Légende:
    - S pour intercalaire CDS-CDS et R pour tRNA-CDS,
    - c pour intercalaire continu (les 2 gènes sont sur le même brin) et x pour discontinu (les 2 gènes sont sur 2 brins différents, le brin et son complément)
    - %reste = 100*reste/total, le reste étant ce qui reste du total après la fin du diagramme, gamme.
    - %t30 = 100*t30/total, t30 étant le total des fréquences 10 20 30
    - %t5 = 100*t/total, t5 étant le total des fréquences de -1 à -5 dans le diagramme des S-.
Int51.2 blo les différents types d'intercalaires entre gène
Int51.21 Les différents types
intercalaires CDS-CDS * autres intercalaires
continu S+ S- S0 total c/x RNA-RNA CDS-rRNA total
c 1,044 210 1 1,255 2.4 23 4 27
x 497 18 2 517 0 3 3
t 1,541 228 3 1,772 23 7 30
% 87.0 12.9 0.2
Int51.22 Détail des * autres intercalaires
intercalaires tRNA-CDS récapitulatif des * autres intercalaires
continu R+ R- R0 total c/x * autres total %
c 55 1 0 56 2.2 tRNA-CDS 82 64
x 24 2 0 26 RNA-RNA 23 18
t 79 3 0 82 CDS-rRNA 7 5
% 96.3 3.7 0.0 non RNA 16 13
- total 128 100
Int51.23 Les taux remarquables
taux %reste %t30 %t5 %0
type S+ R+ S- S+ R+ S- S+ R+
gamme 400 400 6-50 - - - - -
type S+ R+ S- S+ R+ S- S+ R+
c 4.9 8.9 1.0 19.8 0.0 77 0.1 0.0
x 9.8 15.4 11.1 8.0 0.0 17 0.4 0.0

Intergen51. blo. Les diagrammes CDS-CDS positifs

[modifier | modifier le wikicode]
  • Lien tableur: blo données intercalaires
  • Diagrammes:
    - fc40, CDS-CDS continu, fréquence unitaire en abscisses et effectif en ordonnées blo fc40
    - fx%, CDS-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et pourcentage en ‰ par rapport au total, en ordonnées. blo fx1
  • Équations des courbes de tendance en pour 1000: colonnes %fx %fc
Courbes de tendances pour les diagrammes en pour 1000			Calculs des f.41	blo
R2	x3		x2		x		c		Inflexion poly3	x	c
0.728	3.00E-06	-2.09E-03	3.25E-01	21.40	fx1	abscisse	230.9	191.0
0.865	-5.93E-07	6.78E-04	-3.39E-01	65.7	fc1	ordonnée	21.4	23.7
								
0.753	2.96E-06	-2.05E-03	3.10E-01	22.70	fx41			
0.903	1.92E-06	-1.10E-03	3.11E-02	44.5	fc41			
  • Le rfin après 400 est de 51 sur un total de 1045 . Jusqu'à 1% les freq10 sont en continu jusqu'à 660 , reste 10 . L'indice i.rfin1 = 41/260=0,158.
  • Moyennes glissantes fc+400, diagonale. Voir le détail des calculs dans abs.
données	blo		calculs			poly3	blo
effect	1045		R2.21	611		abscis	400
xm	35		pte	9,64		flexa	201
ym	3		cste	3,21		flexo	2,17
x1m	229		r400l	171		xm	35
y1m	1		restp	174,16		sup4	256,9
rfin	48,80		%sd	45,71		sup4t	575,1
bornf	184		lond	194		%	44,7
supd	279,9		%sf	46,24		long	166
supdt	612,4		lonf	149		R2	471
xmp	213,40		sf/lf	1,68			
r400	125,36		sr/lr	0,65			
supf	250,9		sd/ld	1,44			
supft	542,6		i.r400	0,73							

Intergen51. blo. Les CDS-CDS négatifs

[modifier | modifier le wikicode]
Sous-totaux	blo			totale	
fréquence	x-	c-		x-	c-
 - 1		0	52		4	4140
 - 2		1	0		85	11
 - 3		0	0		3	12
 - 4		2	109		717	10938
 - 5		0	0		5	19
sp6		15	49		1642	8424
total		18	210		2,456	23,544
reste		2	2		264	420
s6		1	1		361	41
s7		4	10		321	1438
s8		8	36		696	6525
rappot s1-5						
4/2/1		2.0	2.1		8.4	2.6
% / sp6						
s6/sp6		6.7	2.0		22.0	0.5
s7/sp6		26.7	20.4		19.5	17.1
s8/sp6		53.3	73.5		42.4	77.5
reste/sp6	13.3	4.1		16.1	5.0
						
total s1-5	3	161		814	15120
% / total						
%s1-5		16.7	76.7		33.1	64.2
%sp6		83.3	23.3		66.9	35.8

Intergen51. blo. Les intercalaires des blocs

[modifier | modifier le wikicode]
  • Le détail
RNA-RNA		c	x		CDS-RNA		c	x
23s 5s		4			CDS 16s		2	1
16s 23s		4			5s CDS		1	2
16s tRNA				16 CDS			
tRNA 23s				CDS 5s			
5s tRNA					23s CDS			
tRNA in					CDS 23s			
tRNA contig				5s 16s		1	
tRNA hors	15			16s16s			
tRNA 16s								
23s tRNA								
tRNA 5s								
16s 5s								
5s 23s								
5s 5s								
total		23	0		total		4	3
  • Les rares voir gamma pour la longueur des intercalaires
  • Les tRNA-CDS compris, comparaison dans le clade et dans l'étude.

Intergen51. blo. Les intercalaires tRNA-tRNA extra bloc

[modifier | modifier le wikicode]
Int51.31 blo sma ksk. Les intercalaires tRNA-tRNA extra blocs
blo hors sma hors ksk hors1 ksk hors2
inter aa    inter aa    inter aa    inter aa
43 aac 37 other 35 other 129 aag
** aac 37 other ** other ** aag
27 ggc 34 other 209 gtg 42 atgj
41 tgc ** tct ** gtg ** acc
48 gtc 20 gag 79 ggc 35 cgt
31 gtg 21 cag 36 tgc 240 cgt
** ggc 62 gag 34 gtc ** agc
29 cgt 42 gag 37 gtc 51 ggc
** cgt ** cag ** gtc ** ggc
89 gcc 47 gaa 5 aac 34 ttc
** gcc 24 gac ** aac 42 gac
87 acg ** ttc 269 gcc ** gaa
** cta 79 gga 38 gcc 21 cag
48 gtg ** ggc ** gcc 38 gag
46 gtc 205 cgt x151 cca 13 gag
** ggc ** agc ** gga 4 gag
39 cag 46 acc 18 cga ** gag
** gag ** atgj 18 cga 22 tgc
42 atc x153 gga 18 other ** ggc
** gca ** cca 18 cga
1 tac 5 aac ** other
4 acc 166 aac
** atgj ** atgi
47 gac 40 gtc
** ttc 19 gtc
1 gtc
38 tgc
** ggc
-

blo intercalaires entre cds

[modifier | modifier le wikicode]
  • Lien NCBI [10]
  • Note: Pour les génomes des annexes j'ai relevé les intercalaires entre tRNAs et entre ceux-ci et les cds qui leur sont adjacents. L'exemple est celui de rru du clade alpha. L'idée de départ de ces prélèvements est la recherche d'opérons formés de tRNA et de protéine comme dans le cas d'E.coli: l'intercalaire entre le tRNA et la protéine devrait être faible. Voir l'exemple d'eco (remarque @3) avec tac-tac-tpr et aca-tac-gga-acc-tufB.

blo intercalaires positifs S+

[modifier | modifier le wikicode]
blo. Sx+ Sc+ Les diagrammes 400
blo Sx+ Sc+
Poly3 -7 -5 -3 1 R2 flex x+ comment. -7 -5 -3 1 R2 flex c+ comment.
1 à 400 33 -233 362 24 728 235 min20 -5.7 69 -354 69 868 404 min40
31 à 400 2 parties 28 -174 163 38 897 207 2 parties
droite -a cste - R2 note R2’ -a cste - R2 note R2’
1 à 400 93 44 - 590 poly 138 tF 159 58 827 dte 41 Sf
31 à 400 136 51 - 861 dte 36 tf
  • Légende du tableau des corrélations et des fréquences faibles
blo. Sx+ Sc+ Les diagrammes 400. Corrélations et les fréquences faibles 1-30
effectifs diagramme corrélation x+ c+, 41-n corrélation x+ c+, 1-n
gen minima x+ c+ total 400 200 250 diff 200 250 400
ant min40 601 1616 2217 730 271 538 267 892 886 876
blo min20 448 993 1441 820 406 537 131 38 255 669
scc min10 416 961 1377 748 440 530 90 -88 49 367
1-30 ‰ effectifs 0 ‰ <0 ‰ effectifs 1-40 corel
1-30 x+ 1-30 c+ x+/c+ x c x c x- c- x+ c+ x+/c+
281 485 0.58 714 2381 13 24 116 285 186 836 575
89 208 0.43 517 1255 4 1 35 167 54 241 -109
118 353 0.33 485 1320 4 5 58 242 60 389 -177
  • Diagrammes 400:  blo abra,   diagramme 1-40: c+ bloc+ abratotal,   texte: abra.
  • Résumé: Le génome blo se détache des 20 autres génomes par une courbe de forme S très faible avec un R2’ de seulement 41 suivi de rtb avec 82. En plus les x+ 1-400 ont peu de fréquences faibles et il est comparable par ses effectifs à abra, 1441 contre 1190. Son minimum x+ est à la fréquence 20, min20 ce qui donne un diagramme 1-400 en tilde fort, tF.
    - Les courbes des diagrammes 400
    • Je n’ai pas représenté le diagramme x+ 31-400, les fréquences faibles ayant très peu d’effectifs pour modifier notablement la courbe de x+ 1-400. Cela sera le cas des 13 génomes sans fréquences faibles.
    • La courbe x+ 1-400 est un tilde fort, tF, avec un R2’ de 138 contre 96 pour la courbe de abra.
    • La courbe c+ 1-400 est l’exception parmi les 21 génomes avec une forme S très faible, Sf, avec un R2’ de 41 suivi par 82 de rtb. Les 19 autres génomes ont un R2’ entre 139 et 368.Cette faiblesse de S est due à la faiblesse des fréquences faibles 1-30. Le taux de blo est le plus bas parmi les génomes étudiés, 208‰ suivi par ase 264 et rru 270.
    • La conséquence de ce Sf est un tilde faible, tf, de la courbe c+ 31-400 avec un R2’ de 36. Cependant la 1ère partie de la courbe est bien proéminante, différente de la 2ème partie.
    - Les corrélations
    • La corrélation x+/c+ sur la plage 41-250 est moyenne, 537, comme ant avec 538, mais beaucoup plus faible que celle de abra avec 797 qui a les mêmes effectifs. Elle chute fortement par rapport à la plage 41-200, avec une différence de 131 (diff) moindre que celle de ant, 267, mais plus forte que celle de abra, 81.
    • A cause des fréquences faibles des x+ les corrélations 1-200 et 1-250 sont très faibles par rapport aux corrélations 41-n comme abra mais contrairement à ant où ces corrélations augmentent.
    • La particularité du taux le plus bas des fréquences faibles parmi les 21 génomes, la corrélation sur 1-400 est très forte par rapport à 1-200 et 1-250 et légèrement plus faible que celle de 41-400.
    - Les courbes des diagrammes 1-40
    • Avec un effectif réduit de 54 pour le total des fréquences x+ 1-40, le diagramme et la corrélation c+/x+ sont peu significatifs. Et abra a un effectif encore plus faible de 41 seulement.
    • Avec un effectif de 241 du au taux faible des fréquences 1-30, le diagramme c+ 1-40 est éloigné du modèle alors que abra, avec un effectif de 420, ressemble beaucoup au modèle avec néanmoins une bosse à la fréquence 11 amoindrie. Le génome blo a les 2 caractéristiques principales du modèle, le creux en 7 et un maximum en 10 mais les effectifs en 5 et 6 sont très élevés alors qu’ils devraient être au même niveau que celui de 7. Ensuite il présente un creux très profond en 14 et un maximum en 15. Même en enlevant le creux du 14 le diagramme de blo reste plus éloigné que celui de pmg qui se rapproche du modèle en enlevant le 6.

blo autres intercalaires

[modifier | modifier le wikicode]
  • Lien tableur: blo autres intercalaires aas
  • Légende:  
    - comp, le gène est sur le brin complement
    - deb, fin sont respectivement dans le sens des adresses croissantes, le cds avant le 1er tRNA et le cds après le dernier tRNA du bloc.
  • Totaux: 5 regulatory 3 ncRNA 1 tmRNA
tRNA-cds 		tRNA-tRNA		autres-cds		total	
c+	x+	x-	c+	x+	c-	c+	x+	c-		
59	26	2	24			10	5	1	127	1 cds c- 
  • Méthode de calculs des intercalaires autres que les CDS-CDS voir le cas de amed.

Streptomyces avermitilis MA-4680

[modifier | modifier le wikicode]
  • Liens: gtRNAdb [11], NCBI [12], génome []
  • Lien tableur: sma opérons
  • Phylogénie: Bacteria; Actinobacteria; Streptomycetales; Streptomycetaceae; Streptomyces.
Ac3. Streptomyces avermitilis MA-4680
70%GC 30.6.19 Paris  74  doubles intercal
357776..357847 gtg
comp 1219274..1219346 gga
comp 1225751..1225823 gga
1675869..1675942 atgf
comp 1965347..1965423 ccc
comp 1992012..1992088 ccc
comp 2222599..2222686 ctc
comp 3072632..3072707 acc
comp 3073568..3073684 5s @1 84
comp 3073769..3076918 23s 288
comp 3077207..3078737 16s
comp 3295252..3295324 gag + 20
comp 3295345..3295416 cag 3 gag 21
comp 3295438..3295510 gag 2 cag 62
comp 3295573..3295645 gag 42
comp 3295688..3295759 cag
3655871..3655942 cgg
comp 3813093..3813166 atgf
comp 3815457..3815530 atgf
comp 4362610..4362695 tta
4410534..4410608 caa
comp 4542466..4542542 gcg
4589760..4589835 agg
comp 4886830..4886906 aca
comp 5024109..5024225 5s 84
comp 5024310..5027458 23s 288
comp 5027747..5029277 16s
comp 5051970..5052043 atgf
comp 5055486..5055561 aaa
5063087..5063159 gaa 47
5063207..5063281 gac 24
5063306..5063382 ttc
5068123..5068197 gac
5081640..5081711 gga 79
5081791..5081866 ggc
5085779..5085854 ggc
5095224..5095311 tcc
5129698..5129782 tcg
comp 5154937..5155009 cgt 205
comp 5155215..5155305 agc
comp 5177691..5177777 tca
comp 5206939..5207028 agc
comp 5299302..5299378 atc
5304905..5304977 gca
5322106..5322192 ctg
comp 5452769..5452842 ggg
comp 5594481..5594554 ccg
5650316..5650389 acg
5759342..5760872 16s 288
5761161..5764309 23s 84
5764394..5764510 5s
5950170..5950251 tac
5956602..5956674 acc 46
5956721..5956793 atgj
5964532..5964607 tgg
6124386..6125916 16s 288
6126205..6129353 23s 84
6129438..6129554 5s
comp 6242261..6242335 tgc
comp 6279029..6279112 cta
comp 6329202..6329278 aag
comp 6335068..6335141 aag
comp 6349312..6349385 aag
comp 6372705..6372777 cac
comp 6501509..6501584 aga
comp 6604435..6604508 gga 153
comp 6604662..6604738 cca
6653846..6653918 gcc
6658303..6658375 gcc
6875603..6875675 aac + 5
6875681..6875753 aac 2 aac 166
6875920..6875996 atgi
7021984..7022058 gta
7025336..7025415 gtg
comp 7471270..7471342 ttg
7765513..7767043 16s 284
7767328..7770477 23s 133
7770611..7770727 5s
comp 7937463..7937550 ctc
comp 8122352..8122426 gtc + 40
comp 8122467..8122538 gtc 3 gtc 19
comp 8122558..8122629 gtc 1
comp 8122631..8122704 tgc 38
comp 8122743..8122815 ggc
8129564..8129635 gtg
8139938..8140012 gtg
8328596..8330126 16s 288
8330415..8333563 23s 84
8333648..8333764 5s
8576989..8577062 ccc
  • Note: Les statistiques sur les intercalaires entre tRNA ne sont pas correctes. Se reporter à intergen51.sma. Il n'y a aucun commentaire sur les CDS. J'ai réduit le tableau aux clusters à rRNA. L'intitulé opéron doit d'être compris dans le sens cluster ou bloc de RNA, rRNA ou tRNA.
sma cumuls	opérons		effectif
avec rRNA	opérons		6
		16 23 5s 0	6
		16 atc gca	0
		16 23 5s a	0
		max a		0
		a doubles	0
		spéciaux	0
		total aas	0
sans 		opérons		56
		1 aa		48
		max a		5
		a doubles	3
		total aas	72
total aas			72
remarques			1
Ac3. Streptomyces avermitilis MA-4680, blocs rRNAs
5s 84 117 84 117 288 1531
23s 288 3150 288 3149 84 3149
16s 1531 1531 117
16s 288 1531 284 1531 288 1531
23s 84 3149 133 3150 84 3149
5s 117 117 117
  • Remarques : 6 blocs 16-23-5s. Beaucoup de tRNAs solitaires.
    1. @ 6 blocs 16-23-5s sans aas.
      - 5 opérons ont les mêmes intercalaires, 288 84
      - 1 opéron a l'intercalaire 23s-5s 58% plus élevée, 49/84. L'autre est commune aux 6 opérons, 284.
  • Séquences des doubles : 48 des 56 opérons à tRNAs sont des tRNAs solitaires.
    - Il n'y a que 3 opérons contenant des doubles:
    - (3gag 2cag) avec une répétition de séquence 2*2
    - (ggc tgc 3gtc), répétition triple
    - (atgi 2aac) avec 1 doublet
    - Au total 2 doublets et 2 triplets. Ce qui est très peu, alors que le total des tRNAs est de 72. C’est donc que ce sont les opérons qui se répètent et non les tRNAs. Les opérons à rRNAs font de même, avec 6 blocs quasi identiques même dans la longueur de leurs intercalaires.

sma distribution

[modifier | modifier le wikicode]
  • Lien tableur: sma distribution
  • Notes:
    - gag2 gtc3 gag2
    - gga a 2 tRNAs solitaires et 2 multiples (>1aa) les autres soulignes ont 1 seul solitaire.
Ac3 sma. La distribution. Streptomyces avermitilis MA-4680. actinomycete.
g1    t1       
atgi 1 tct tat atgf 4
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc 1 tcc 1 tac 1 tgc 2
atc 1 acc 2 aac 2 agc 2
ctc 2 ccc 3 cac 1 cgt 1
gtc 3 gcc 2 gac 2 ggc 3
tta 1 tca 1 taa tga
ata aca 1 aaa 1 aga 1
cta 1 cca 1 caa 1 cga
gta 1 gca 1 gaa 1 gga 4
ttg 1 tcg 1 tag tgg 1
atgj 1 acg 1 aag 3 agg 1
ctg 1 ccg 1 cag 2 cgg 1
gtg 4 gcg 1 gag 3 ggg 1
actino >1aa =1aa -5s +5s -16s +16s total
sma 24 48 72

sma. Intergen51

[modifier | modifier le wikicode]

Intergen51. sma. Le génome

[modifier | modifier le wikicode]
  • sma Le prélèvement: Aactino
  • Le nom et le lien NCBI: sma, Streptomyces avermitilis MA-4680 = NBRC 14893, NCBI [13], date 20.4.21.
  • sma a un chromosome linéaire
  • sma La longueur totale des intercalaires, longueur du génome et taux intercalaires/génome:
Nom	intercals	génome		taux en %			
sma	1,241,224	9,025,608	13.8	
sma données intercalaires
[modifier | modifier le wikicode]
sma données intercalaires 200
[modifier | modifier le wikicode]
sma autres intercalaires aas
[modifier | modifier le wikicode]

Intergen51. sma. Les différents types d'intercalaires

[modifier | modifier le wikicode]
  • Lien au tableur: Intergen51. sma les différents types d'intercalaires.
  • Légende:
    - S pour intercalaire CDS-CDS et R pour tRNA-CDS,
    - c pour intercalaire continu (les 2 gènes sont sur le même brin) et x pour discontinu (les 2 gènes sont sur 2 brins différents, le brin et son complément)
    - %reste = 100*reste/total, le reste étant ce qui reste du total après la fin du diagramme, gamme.
    - %t30 = 100*t30/total, t30 étant le total des fréquences 10 20 30
    - %t5 = 100*t/total, t5 étant le total des fréquences de -1 à -5 dans le diagramme des S-.
Int51.2 sma les différents types d'intercalaires entre gène
Int51.21 Les différents types
intercalaires CDS-CDS * autres intercalaires
continu S+ S- S0 total c/x RNA-RNA CDS-rRNA total
c 3,883 1,077 11 4,971 1.8 30 9 39
x 2,572 135 9 2,716 1 3 4
t 6,455 1,212 20 7,687 31 12 43
% 84.0 15.8 0.3
Int51.22 Détail des * autres intercalaires
intercalaires tRNA-CDS récapitulatif des * autres intercalaires
continu R+ R- R0 total c/x * autres total %
c 55 1 0 56 0.9 tRNA-CDS 115 70
x 58 1 0 59 RNA-RNA 31 19
t 113 2 0 115 CDS-rRNA 12 7
% 98.3 1.7 0.0 non RNA 6 4
- total 164 100
Int51.23 Les taux remarquables
taux %reste %t30 %t5 %0
type S+ R+ S- S+ R+ S- S+ R+
gamme 400 400 6-50 - - - - -
type S+ R+ S- S+ R+ S- S+ R+
c 8.4 21.4 2.2 17.8 1.8 82 0.2 0.0
x 11.6 11.9 17.0 8.8 0.0 14 0.3 0.0

Intergen51. sma. Les diagrammes CDS-CDS positifs

[modifier | modifier le wikicode]
  • Lien tableur: sma données intercalaires
  • Diagrammes:
    - fc40, CDS-CDS continu, fréquence unitaire en abscisses et effectif en ordonnées sma fc40
    - fx%, CDS-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et pourcentage en ‰ par rapport au total, en ordonnées. sma fx1
    - fc%, CDS-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et pourcentage en ‰ par rapport au total, en ordonnées. sma fc1
  • Équations des courbes de tendance en pour 1000: colonnes %fx %fc
Courbes de tendances pour les diagrammes en pour 1000			Calculs des f.41	sma
R2	x3		x2		x		c		Inflexion poly3	x	c
0.940	2.19E-06	-1.50E-03	2.06E-01	25.90	fx1	abscisse	224.1	198.2
0.913	-1.26E-06	1.12E-03	-3.94E-01	62.7	fc1	ordonnée	21.1	21.6
								
0.913	1.80E-06	-1.21E-03	1.40E-01	30.20	fx41			
0.952	1.90E-06	-1.13E-03	8.58E-02	34.2	fc41			
  • Le rfin après 400 est de 329 sur un total de 3894 . Jusqu'à 1% les freq10 sont en continu jusqu'à 930 , reste 39 . L'indice i.rfin1 = 290/530=0,547.
  • Le reste après 930 est de 39 sur un total de 3894 . Jusqu'à 2‰ les freq10 sont en continu jusqu'à 1420 , reste 9 . L'indice i.rf2 = 30/490=0,0612.
  • Moyennes glissantes fc+400, diagonale. Voir le détail des calculs dans abs.
données	sma		calculs			poly3	sma		données	sma		calculs			poly3	sma
effect	3894		R2.21	820		abscis	400		effect	3894		R2.21	820		abscis	400
xm	25		pte	11,00		xm	25		xm	49		pte	8,61		xm	49
ym	14		cste	3,87		flexa	184		ym	11		cste	3,25		flexa	201
x1m	261		r400l	139		flexo	3,50		x1m	261		r400l	139		flexo	2,06
y1m	1		restpf	380,59		sup4	46,4		y1m	1		restpf	380,59		sup4	150,5
rfin	84,49		%sd	20,66		sup4t	514,1		rfin	84,49		%sd	28,42		sup4t	451,7
bornf	159		lond	236		%	9,0		bornf	159		lond	212		%	33,3
supd	131,7		%sf	20,65		long	159		supd	154,2		%sf	30,10		long	152
supdt	637,4		lonf	134		R2	708		supdt	542,6		lonf	110		R2	701
xmp	159,7		sf/lonf	0,71					xmp	254,49		sf/lonf	1,00			
r400	118,39		sr/lonr	0,36					r400	118,39		sr/lonr	0,44			
supf	94,9		sd/lond	0,56					supf	109,8		sd/lond	0,73			
supft	459,7		i.r400	0,85					supft	364,9		i.r400	0,85			

Intergen51. sma. Les CDS-CDS négatifs

[modifier | modifier le wikicode]
Sous-totaux	sma			totale	
fréquence	x-	c-		x-	c-
 - 1		0	126		4	4140
 - 2		4	0		85	11
 - 3		0	0		3	12
 - 4		15	752		717	10938
 - 5		0	0		5	19
sp6		116	199		1642	8424
total		135	1077		2,456	23,544
reste		23	24		264	420
s6		17	1		361	41
s7		24	52		321	1438
s8		52	122		696	6525
rappot s1-5						
4/2/1		3.8	6.0		8.4	2.6
% / sp6						
s6/sp6		14.7	0.5		22.0	0.5
s7/sp6		20.7	26.1		19.5	17.1
s8/sp6		44.8	61.3		42.4	77.5
reste/sp6	19.8	12.1		16.1	5.0
						
total s1-5	19	878		814	15120
% / total						
%s1-5		14.1	81.5		33.1	64.2
%sp6		85.9	18.5		66.9	35.8

Intergen51. sma. Les intercalaires des blocs

[modifier | modifier le wikicode]
  • Le détail
RNA-RNA		c	x		CDS-RNA		c	x
23s 5s		6			CDS 16s		4	2
16s 23s		6			5s CDS		5	1
16s tRNA				16 CDS			
tRNA 23s				CDS 5s			
5s tRNA					23s CDS			
tRNA in					CDS 23s			
tRNA contig				5s 16s			
tRNA hors	18	1		16s16s			
tRNA 16s								
23s tRNA								
tRNA 5s								
16s 5s								
5s 23s								
5s 5s								
total		30	1		total		9	3
  • Les rares voir gamma pour la longueur des intercalaires
  • Les tRNA-CDS compris, comparaison dans le clade et dans l'étude.

Intergen51. sma. Les intercalaires tRNA-tRNA extra bloc

[modifier | modifier le wikicode]

Kitasatospora setae KM-6054

[modifier | modifier le wikicode]
  • Liens: gtRNAdb [14], NCBI [15], génome []
  • Lien tableur: ksk opérons
  • Phylogénie: Bacteria; Actinobacteria; Streptomycetales; Streptomycetaceae; Kitasatospora.
Ac4. Kitasatospora setae KM-6054
72%GC 30.6.19 Paris  74  doubles intercal
comp 631024..631098 act
976172..976245 tgc
comp 1615691..1615765 gtg + 206
comp 1615972..1616046 gtg 2 gtg
1621501..1621576 ggc 76
1621653..1621726 tgc 36
1621763..1621834 gtc + 34
1621869..1621940 gtc 3 gtc 37
1621978..1622052 gtc
comp 1707344..1707460 5s @1 73
comp 1707534..1710667 23s 267
comp 1710935..1712463 16s
comp 1888620..1888736 5s 73
comp 1888810..1891942 23s 267
comp 1892210..1893738 16s
1970574..1970661 ctc
2264495..2264580 ttg
comp 2741186..2741257 gta
comp 2788071..2788147 atgi
comp 2790422..2790494 aac + 5
comp 2790500..2790572 aac 2 aac
comp 2887231..2887303 gcc + 269
comp 2887573..2887645 gcc 3 gcc 38
comp 2887684..2887756 gcc @2
comp 2932411..2932487 cca 151
direct 2932639..2932712 gga
comp 2982955..2983071 5s 73
comp 2983145..2986276 23s 266
comp 2986543..2988071 16s
3018063..3018138 cac
3036654..3036730 aag
3044201..3044277 aag
3111827..3111900 aag 129
3112030..3112103 aag
3157748..3157834 cta
3210241..3210315 tgc
comp 3289891..3290007 5s 73
comp 3290081..3293213 23s 267
comp 3293481..3295009 16s
comp 3608705..3608777 tgg
comp 3616894..3616969 atgj 42
comp 3617012..3617084 acc
comp 3618677..3618757 tac
comp 3851412..3851488 aca
comp 3987214..3987290 acg
4071208..4071281 ccg
4095099..4095186 tcc
4142544..4142633 tcg
comp 4160864..4160939 cgt + 35
comp 4160975..4161050 cgt 2 cgt 240
comp 4161291..4161381 agc
comp 4177523..4177608 tca
comp 4240397..4240470 ggg
4285828..4285900 ggc + 51
4285952..4286027 ggc 2 ggc
4383368..4383444 atc
4385556..4385631 gca
4401492..4401575 ctg
comp 4622975..4623048 gac
comp 4640883..4640959 ttc 34
comp 4640994..4641067 gac 42
comp 4641110..4641182 gaa
4651832..4651904 aaa
comp 4773547..4773620 atgf
comp 4774128..4774201 atgf
4796510..4798038 16s 267
4798306..4801439 23s 71
4801511..4801627 5s
5027433..5027508 agg
5076388..5076464 gcg
5123784..5123856 acc
5132819..5132892 caa
comp 5216466..5216550 tta
5430075..5430148 atgf
comp 5530949..5531020 cgg
5714968..5715039 cag 21
5715061..5715133 gag + 38
5715172..5715244 gag 3 gag 13
5715258..5715330 gag 2 cag 4
5715335..5715409 cag
5853168..5854696 16s 256
5854953..5858085 23s 73
5858159..5858275 5s
5932168..5933696 16s 256
5933953..5937085 23s 71
5937157..5937273 5s
6074082..6075610 16s 264
6075875..6079006 23s 73
6079080..6079196 5s
comp 6104344..6104419 aga
6400221..6401749 16s 267
6402017..6405146 23s 106
6405253..6405369 5s
6485836..6485909 ccc
7355279..7355354 tgc 19
7355374..7355449 ggc
comp 7461078..7461165 ctc
  • Note: Les statistiques sur les intercalaires entre tRNA ne sont pas correctes. Se reporter à intergen51.ksk. Il n'y a aucun commentaire sur les CDS. J'ai réduit le tableau aux clusters à rRNA. L'intitulé opéron doit d'être compris dans le sens cluster ou bloc de RNA, rRNA ou tRNA.
ksk cumuls	opérons		effectif
avec rRNA	opérons		9
		16 23 5s 0	9
		16 atc gca	0
		16 23 5s a	0
		max a		0
		a doubles	0
		spéciaux	0
		total aas	0
sans 		opérons		49
		1 aa		37
		max a		5
		a doubles	7
		total aas	70
total aas			70
remarques			2
Ac4. Kitasatospora setae KM-6054, blocs rRNA.
5s 73 117 73 117 73 117
23s 267 3134 267 3133 266 3132
16s 1529 1529 1529
16s 73 117 267 1529 256 1529
23s 267 3133 71 3134 73 3133
5s 1529 117 117
16s 256 1529 264 1529 267 1529
23s 71 3133 73 3132 106 3130
5s 117 117 117
  • Remarques : 9 blocs 16-23-5s. Beaucoup de tRNAs solitaires. Analogue à sma.
    1. @ 9 blocs 16-23-5s sans aas.
      - 8 opérons ont des intercalaires identiques, 267 73.
      - 1 opéron a l'intercalaire 23s-5s 45% plus élevée, 33/73. L'autre est commune aux 9 opérons, 267.
    2. @ Les intercalaires élevés ne touchent que 2 opérons sans rRNAs et sont à la limite de la règle de 210 bases, et sont équivalents à l’intercalaire 16s-23s, 269 et 240.
  • Séquences des doubles : 48 des 56 opérons à tRNAs sont des tRNAs solitaires.
    - Il n'y a que 7 opérons contenant des doubles:
    - (3gag 2cag) avec une répétition de séquence 2*2 , comme sma.
    - (ggc tgc 3gtc), répétition triple comme sma, plus (3gcc).
    - (atgi 2aac) est remplacé par 4 doublets, 2gtg 2aac 2ggc et (agc 2cgt).
    - Au total 5 doublets et 3 triplets. Ce qui est très peu, alors que le total des tRNAs est de 70. C’est donc que ce sont les opérons qui se répètent et non les tRNAs. Les opérons à rRNAs font de même, avec 9 blocs quasi identiques même dans la longueur de leurs intercalaires.

ksk distribution

[modifier | modifier le wikicode]
  • Lien tableur: ksk distribution
  • Notes:
    - Les doubles et les triples, gtg2 gcc3 ggc2 gtc3 aag2 gag3 aac2 cgt2, font 19 tRNas sur les 33 multiples, soit 58%. Ne sont pas accompagnés de solitaires.
    - Tableau Ac42, ggc a 1 double et 2 non doubles appartenant à 2 blocs multiples.
    - 3 tRNAs ont 1 solitaire et 1 multiple, acc cca gac. Le tRNA tgc a 2 multiples non doubles et 2 solitaires.
Ac4 ksk, Kitasatospora setae KM-6054. actinomycete.
Ac41 ase. La distribution des tRNAs solitaires.
g1    t1       
atgi 1 tct tat atgf 3
att act 1 aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc tcc 1 tac 1 tgc 2
atc 1 acc 1 aac agc
ctc 2 ccc 1 cac 1 cgt
gtc gcc gac 1 ggc
tta 1 tca 1 taa tga
ata aca 1 aaa 1 aga 1
cta 1 cca 1 caa cga
gta 1 gca 1 gaa gga
ttg 1 tcg 1 tag tgg 1
atgj acg 1 aag 2 agg 1
ctg 1 ccg 1 cag cgg 1
gtg gcg 1 gag ggg 1
actino >1aa =1aa -5s +5s -16s +16s total
ksk 37 37
Ac42 ksk. La distribution des tRNAs multiples.
g1    t1       
atgi tct tat atgf
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc 1 tcc tac tgc 2
atc acc 1 aac 2 agc 1
ctc ccc cac cgt 2
gtc 3 gcc 3 gac 1 ggc 4
tta tca taa tga
ata aca aaa aga
cta cca 1 caa cga
gta gca gaa 1 gga 1
ttg tcg tag tgg
atgj 1 acg aag 2 agg
ctg ccg cag 2 cgg
gtg 2 gcg gag 3 ggg
actino >1aa =1aa -5s +5s -16s +16s total
ksk 33 33

ksk. Intergen51

[modifier | modifier le wikicode]

Intergen51. ksk. Le génome

[modifier | modifier le wikicode]
  • ksk Le prélèvement: Aactino
  • Le nom et le lien NCBI: ksk, Kitasatospora setae KM-6054, NCBI [16], date 15.12.21.
  • ksk a un chromosome linéaire
  • ksk La longueur totale des intercalaires, longueur du génome et taux intercalaires/génome:
Nom	intercals	génome		taux en %			
ksk	1,255,749	8,783,278	14.3	
ksk données intercalaires
[modifier | modifier le wikicode]
ksk données intercalaires 200
[modifier | modifier le wikicode]
ksk autres intercalaires aas
[modifier | modifier le wikicode]

Intergen51. ksk. Les différents types d'intercalaires

[modifier | modifier le wikicode]
  • Lien au tableur: Intergen51. ksk les différents types d'intercalaires.
  • Légende:
    - S pour intercalaire CDS-CDS et R pour tRNA-CDS,
    - c pour intercalaire continu (les 2 gènes sont sur le même brin) et x pour discontinu (les 2 gènes sont sur 2 brins différents, le brin et son complément)
    - %reste = 100*reste/total, le reste étant ce qui reste du total après la fin du diagramme, gamme.
    - %t30 = 100*t30/total, t30 étant le total des fréquences 10 20 30
    - %t5 = 100*t/total, t5 étant le total des fréquences de -1 à -5 dans le diagramme des S-.
Int51.2 ksk les différents types d'intercalaires entre gène
Int51.21 Les différents types
intercalaires CDS-CDS * autres intercalaires
continu S+ S- S0 total c/x RNA-RNA CDS-rRNA total
c 3,991 959 4 4,954 1.9 43 15 58
x 2,557 93 7 2,657 1 3 4
t 6,548 1,052 11 7,611 44 18 62
% 86.0 13.8 0.1
Int51.22 Détail des * autres intercalaires
intercalaires tRNA-CDS récapitulatif des * autres intercalaires
continu R+ R- R0 total c/x * autres total %
c 51 1 0 52 1.0 tRNA-CDS 103 60
x 50 1 0 51 RNA-RNA 44 26
t 101 2 0 103 CDS-rRNA 18 11
% 98.1 1.9 0.0 non RNA 6 4
- total 171 100
Int51.23 Les taux remarquables
taux %reste %t30 %t5 %0
type S+ R+ S- S+ R+ S- S+ R+
gamme 400 400 6-50 - - - - -
type S+ R+ S- S+ R+ S- S+ R+
c 7.9 7.7 2.2 12.9 3.8 80 0.1 0.0
x 11.6 15.7 15.1 11.3 2.0 14 0.3 0.0

Intergen51. ksk. Les diagrammes CDS-CDS positifs

[modifier | modifier le wikicode]
  • Lien tableur: ksk données intercalaires
  • Diagrammes:
    - fc40, CDS-CDS continu, fréquence unitaire en abscisses et effectif en ordonnées ksk fc40
    - fx%, CDS-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et pourcentage en ‰ par rapport au total, en ordonnées. ksk fx1
    - fc%, CDS-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et pourcentage en ‰ par rapport au total, en ordonnées. ksk fc1
  • Équations des courbes de tendance en pour 1000: colonnes %fx %fc
Courbes de tendances pour les diagrammes en pour 1000			Calculs des f.41	ksk
R2	x3		x2		x		c		Inflexion poly3	x	c
0.922	9.67E-07	-5.61E-04	1.25E-02	39.40	fx1	abscisse	-126.8	193.3
0.913	1.87E-06	-1.07E-03	3.01E-02	44.4	fc1	ordonnée	67.1	24.2
								
0.913	1.32E-07	5.02E-05	-1.47E-01	47.90	fx41			
0.955	2.19E-06	-1.27E-03	6.55E-02	43.2	fc41			
  • Le rfin après 400 est de 316 sur un total de 3995. Jusqu'à 1% les freq10 sont en continu jusqu'à 1060, reste 40. L'indice i.rfin1 = 276/660=0,418.
  • Le reste après 1060 est de 40 sur un total de 3995 . Jusqu'à 2‰ les freq10 sont en continu jusqu'à 1920 , reste 9 . L'indice i.rf2 = 31/860=0,036.
  • Moyennes glissantes fc+400, diagonale. Voir le détail des calculs dans abs.
données	ksk		calculs			poly3	ksk
effect	3995		R2.21	764		abscis	400
xm	20		pte	7,34		flexa	197
ym	11		cste	2,90		flexo	2,29
x1m	259		r400l	141		xm	25
y1m	1		restp	176,47		sup4	232,1
rfin	79,10		%sd	40,09		sup4t	616,8
bornf	137		lond	239		%	37,6
supd	292,0		%sf	42,13		long	172
supdt	728,4		lonf	117		R2	742
xmp	95,12		sf/lf	1,68			
r400	97,37		sr/lr	0,78			
supf	197,1		sd/ld	1,22			
supft	467,8		i.r400	0,69									

Intergen51. ksk. Les CDS-CDS négatifs

[modifier | modifier le wikicode]
Sous-totaux	ksk			totale	
fréquence	x-	c-		x-	c-
 - 1		0	107		4	4140
 - 2		1	0		85	11
 - 3		0	1		3	12
 - 4		12	663		717	10938
 - 5		0	0		5	19
sp6		80	188		1642	8424
total		93	959		2,456	23,544
reste		14	21		264	420
s6		10	2		361	41
s7		29	48		321	1438
s8		27	117		696	6525
rappot s1-5						
4/2/1		12.0	6.2		8.4	2.6
% / sp6						
s6/sp6		12.5	1.1		22.0	0.5
s7/sp6		36.3	25.5		19.5	17.1
s8/sp6		33.8	62.2		42.4	77.5
reste/sp6	17.5	11.2		16.1	5.0
						
total s1-5	13	771		814	15120
% / total						
%s1-5		14.0	80.4		33.1	64.2
%sp6		86.0	19.6		66.9	35.8

Intergen51. ksk. Les intercalaires des blocs

[modifier | modifier le wikicode]
  • Le détail
RNA-RNA		c	x		CDS-RNA		c	x
23s 5s		9			CDS 16s		7	2
16s 23s		9			5s CDS		8	1
16s tRNA				16 CDS			
tRNA 23s				CDS 5s			
5s tRNA					23s CDS			
tRNA in					CDS 23s			
tRNA contig				5s 16s			
tRNA hors	25	1		16s16s			
tRNA 16s								
23s tRNA								
tRNA 5s								
16s 5s								
5s 23s								
5s 5s								
total		43	1		total		15	3
  • Les rares voir gamma pour la longueur des intercalaires
  • Les tRNA-CDS compris, comparaison dans le clade et dans l'étude.

Intergen51. ksk. Les intercalaires tRNA-tRNA extra bloc

[modifier | modifier le wikicode]

actino synthèse

[modifier | modifier le wikicode]

actino distribution par génome

[modifier | modifier le wikicode]
Actino distribution par génome
actino >1aa 1aa -5s +5s -16s +16s duplica 1-3aas total
ase 58 32 0 6 96
blo 19 31 0 6 56
sma 17 48 0 7 72
ksk 14 37 0 19 70
total 108 148 0 0 0 0 38 0 294

actino distribution du total

[modifier | modifier le wikicode]
actino. Distribution et indices
actino. Distribution du total: >1aa 1aa duplicata.
g1    t1       
atgi 4 tct tat atgf 11
att act 1 aat agt
ctt cct cat cgt
gtt gct gat ggt
ttc 5 tcc 5 tac 5 tgc 10
atc 5 acc 7 aac 9 agc 7
ctc 8 ccc 6 cac 5 cgc 9
gtc 11 gcc 10 gac 10 ggc 14
tta 4 tca 4 taa tga
ata aca 4 aaa 5 aga 5
cta 4 cca 6 caa 3 cga
gta 4 gca 5 gaa 5 gga 7
ttg 5 tcg 4 tag tgg 7
atgj 4 acg 6 aag 11 agg 4
ctg 7 ccg 4 cag 8 cgg 5
gtg 10 gcg 6 gag 10 ggg 5
actino4 >1aa 1aa -5s +5s -16s +16s total
type 146 148 0 294
actino. indices du 26.5.20 434 génomes
g1 t1 618 21937 0,5  0,2
atgi 104 tct 0,2 tat atgf 135
att act 0,7 aat agt 0,2
ctt 0,9 cct 0,5 cat 0,9 cgc 1,4
gtt 0,2 gct 0,2 gat 0,9 ggt 0,2
ttc 106 tcc 100 tac 104 tgc 118
atc 104 acc 111 aac 126 agc 104
ctc 113 ccc 106 cac 100 cgt 131
gtc 145 gcc 129 gac 138 ggc 184
tta 100 tca 100 taa tga 19
ata 1,2 aca 100 aaa 104 aga 103
cta 100 cca 100 caa 99 cga 1,4
gta 98 gca 119 gaa 101 gga 108
ttg 105 tcg 125 tag 0,9 tgg 109
atgj 102 acg 104 aag 126 agg 104
ctg 100 ccg 99 cag 110 cgg 105
gtg 114 gcg 86 gag 143 ggg 104
inter max min total

actino distribution par type

[modifier | modifier le wikicode]
Actino. Distribution par type.
actino. distribution des solitaires
g1    t1          
atgi 3 tct tat atgf 10
att act 1 aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc 1 tcc 4 tac 3 tgc 3
atc 2 acc 2 aac 2 agc 2
ctc 6 ccc 6 cac 4 cgt 1
gtc gcc 3 gac 5 ggc 1
tta 4 tca 4 taa tga
ata aca 4 aaa 4 aga 4
cta 3 cca 2 caa 3 cga
gta 4 gca 2 gaa 1 gga 2
ttg 4 tcg 4 tag tgg 5
atgj acg 4 aag 6 agg 4
ctg 4 ccg 4 cag cgg 4
gtg 5 gcg 4 gag ggg 4
actino4 1aa 148
actino. distribution du type >1aa sans duplicata.
g1    t1          
atgi 1 tct tat atgf 1
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc 4 tcc 1 tac 2 tgc 7
atc 3 acc 5 aac 1 agc 5
ctc 2 ccc cac 1 cgt 4
gtc 5 gcc 2 gac 5 ggc 11
tta tca taa tga
ata aca aaa 1 aga 1
cta 1 cca 4 caa cga
gta gca 3 gaa 4 gga 5
ttg 1 tcg tag tgg 2
atgj 4 acg 2 aag agg
ctg 3 ccg cag 8 cgg 1
gtg 3 gcg 2 gag 2 ggg 1
actino >1aa 108
actino. distribution des duplicata
g1    t1          
atgi tct tat atgf
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc tcc tac tgc
atc acc aac 6 agc
ctc ccc cac cgt 4
gtc 6 gcc 5 gac ggc 2
tta tca taa tga
ata aca aaa aga
cta cca caa cga
gta gca gaa gga
ttg tcg tag tgg
atgj acg aag 5 agg
ctg ccg cag cgg
gtg 2 gcg gag 8 ggg
actino dupli 38

actino par rapport au groupe de référence

[modifier | modifier le wikicode]
Comparaison avec la référence
tRNAs blocs tRNAs blocs rRNAs
actino4 1aa >1aa dup +5s 1-3aas autres total
21 faible 55 28 26 109
16 moyen 50 38 88
14 fort 43 42 12 97
148 108 38 294
10 g+cga 31 18 15 64
2 agg+cgg 8 1 9
4 carre ccc 15 9 11 35
5 autres 1 1
55 28 26 109
total tRNAs ‰
actino4 1aa >1aa dup +5s 1-3aas autres actino ‰ ref.‰
21 faible 187 95 88 371 26
16 moyen 170 129 299 324
14 fort 146 143 41 330 650
503 367 129 294 729
10 g+cga 105 61 51 218 10
2 agg+cgg 27 3 31
4 carre ccc 51 31 37 119 16
5 autres 3 3
187 95 88 371
blocs tRNAs ‰ total colonne %
actino4 1aa >1aa dup total ref.‰ 1aa >1aa dup
21 faible 187 95 88 371 26 37 26 68
16 moyen 170 129 299 324 34 35
14 fort 146 143 41 330 650 29 39 32
503 367 129 294 729 148 108 38
10 g+cga 105 61 51 218 10 56 64 58
2 agg+cgg 27 3 31 15 4
4 carre ccc 51 31 37 119 16 27 32 42
5 autres 3 3 2
187 95 88 371 55 28 26

actinobacteria, estimation des -rRNAs

[modifier | modifier le wikicode]
  • Lien tableur: actinobacteria, estimation des -rRNAs
  • Liens fiche:   typage
  • Légende: prélèvement de la base gtRNAdb le 22.1.21
    - ttt et tgt sont nuls partout
    - atgi, c'est Ile2, mis à la place de ttt, très rare chez les procaryotes.
    - atgf, c'est Metf, mis à la place de tgt, très rare chez les procaryotes.
    - atgj, c'est Met, remplace le atg standard qui est la somme Ile2 Met fMet.
    - Voir la légende des tris, g1 t1 et des couleurs

actinobacteria, calcul des -rRNAs

[modifier | modifier le wikicode]
act actinobacteria 63 génomes
act1 cumul des +rRNAs de la fiche actinobacteria pour 99 génomes
g1    t1       
atgi tct tat atgf
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc tcc 2 tac tgc
atc acc aac agc
ctc ccc cac cgt
gtc gcc gac ggc
tta tca taa tga
ata aca aaa aga
cta cca caa cga
gta gca gaa gga
ttg tcg tag tgg
atgj acg aag agg
ctg ccg cag cgg
gtg gcg gag ggg
acti99 inter max min total
2 0 0 2
act2 indices du clade actinobacteria du 26.5.20 de gtRNAdb pour 100 génomes
g1    t1      618 0.5  0.2
atgi 104 tct 0.2 tat atgf 135
att act 0.7 aat agt 0.2
ctt 0.9 cct 0.5 cat 0.9 cgc 1.4
gtt 0.2 gct 0.2 gat 0.9 ggt 0.2
ttc 106 tcc 100 tac 104 tgc 118
atc 104 acc 111 aac 126 agc 104
ctc 113 ccc 106 cac 100 cgt 131
gtc 145 gcc 129 gac 138 ggc 184
tta 100 tca 100 taa tga 19
ata 1.2 aca 100 aaa 104 aga 103
cta 100 cca 100 caa 99 cga 1.4
gta 98 gca 119 gaa 101 gga 108
ttg 105 tcg 125 tag tgg 109
atgj 102 acg 104 aag 126 agg 104
ctg 100 ccg 99 cag 110 cgg 105
gtg 114 gcg 86 gag 143 ggg 104
gtRNA inter max min total
1679 1634 1736 5049
act3 cumul des -rRNAs de l'annexe archeo 4 génomes
g1    t1       
atgi 4 tct tat atgf 11
att act 1.0 aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc 5 tcc 5 tac 5 tgc 10
atc 5 acc 7 aac 9 agc 7
ctc 8 ccc 6 cac 5 cgt 9
gtc 11 gcc 10 gac 10 ggc 14
tta 4 tca 4 taa tga
ata aca 4 aaa 5 aga 5
cta 4 cca 6 caa 3 cga
gta 4 gca 5 gaa 5 gga 7
ttg 5 tcg 4 tag tgg 7
atgj 4 acg 6 aag 11 agg 4
ctg 7 ccg 4 cag 8 cgg 5
gtg 10 gcg 6 gag 10 ggg 5
acti4 inter max min total
88 97 109 294
act4 indices des +rRNAs de la fiche actinobacteria pour 100 génomes
g1    t1       
atgi tct tat atgf
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc tcc 2 tac tgc
atc acc aac agc
ctc ccc cac cgt
gtc gcc gac ggc
tta tca taa tga
ata aca aaa aga
cta cca caa cga
gta gca gaa gga
ttg tcg tag tgg
atgj acg aag agg
ctg ccg cag cgg
gtg gcg gag ggg
acti99 inter max min total
2 0 0 2
act5 estimation des -rRNA du clade actinobacteria pour 100 génomes
g1    t1       
atgi 104 tct 0.2 tat atgf 135
att act 0.7 aat agt 0.2
ctt 0.9 cct 0.5 cat 0.9 cgc 1.4
gtt 0.2 gct 0.2 gat 0.9 ggt 0.2
ttc 106 tcc 98 tac 104 tgc 118
atc 104 acc 111 aac 126 agc 104
ctc 113 ccc 106 cac 100 cgt 131
gtc 145 gcc 129 gac 138 ggc 184
tta 100 tca 100 taa tga 19
ata 1.2 aca 100 aaa 104 aga 103
cta 100 cca 100 caa 99 cga 1.4
gta 98 gca 119 gaa 101 gga 108
ttg 105 tcg 125 tag tgg 109
atgj 102 acg 104 aag 126 agg 104
ctg 100 ccg 99 cag 110 cgg 105
gtg 114 gcg 86 gag 143 ggg 104
-rRNA inter max min total
1677 1634 1736 5047
act6 indices des -rRNAs de l'annexe archeo pour 100 génomes
g1    t1       
atgi 100 tct tat atgf 275
att act 25 aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc 125 tcc 125 tac 125 tgc 250
atc 125 acc 175 aac 225 agc 175
ctc 200 ccc 150 cac 125 cgt 225
gtc 275 gcc 250 gac 250 ggc 350
tta 100 tca 100 taa tga
ata aca 100 aaa 125 aga 125
cta 100 cca 150 caa 75 cga
gta 100 gca 125 gaa 125 gga 175
ttg 125 tcg 100 tag tgg 175
atgj 100 acg 150 aag 275 agg 100
ctg 175 ccg 100 cag 200 cgg 125
gtg 250 gcg 150 gag 250 ggg 125
acti4 inter max min total
2200 2425 2725 7350

actinobacteria, comparaison clade-annexe des -rRNAs

[modifier | modifier le wikicode]
  • Lien tableur: actinobacteria, comparaison clade-annexe des -rRNAs
  • Légende
    - act7. diff, somme des couleurs de act7. La différence entre tRNAs est faite entre act5 et act6 du tableau précédent. Elle est exprimée en % et rapporté à la plus grande valeur des 2 termes de la différence. Ce qui fait quand un tRNA est à zéro la différence en % est égale à 100.
    - act8. rap, rapport des sommes couleurs act5/act2. Le rapport -rRNA/total est celui du tRNA de act5 sur celui de act2.
  • Fréquences des différences en % du tableau act7
gamme		0/0	10	20	30	40	50	60	70	80	90	100		total
fréquence	0	10	12	2	5	12	4	0	0	0	3	0	48
tot ≤ 50						41							
  • Comparaison avec le nombre de tRNAs de la fiche du clade: L’estimation des -rRNA par l'annexe est 36% au dessus de celle de la fiche des actinobacteria.
tRNAs		fiche		annexe
sans		5354		294
avec		2		0
genomes		99		4
indice %	54		75
act actinobacteria 99 génomes
act7 actinobacteria, différence clade-annexe des -rRNAs
g1    t1       
atgi 4 tct 100 tat atgf 51
att act 97 aat agt 100
ctt 100 cct 100 cat 100 cgc 100
gtt 100 gct 100 gat 100 ggt 100
ttc 15 tcc 22 tac 17 tgc 53
atc 17 acc 37 aac 44 agc 41
ctc 44 ccc 29 cac 20 cgt 42
gtc 47 gcc 48 gac 45 ggc 47
tta 0 tca 0 taa tga 100
ata 100 aca 0 aaa 17 aga 18
cta 0 cca 33 caa 24 cga 100
gta 2 gca 5 gaa 19 gga 38
ttg 16 tcg 20 tag tgg 38
atgj 2 acg 31 aag 54 agg 4
ctg 43 ccg 1 cag 45 cgg 16
gtg 54 gcg 43 gag 43 ggg 17
diff inter max min total
313 395 593 1301
act8 actinobacteria, rapports -rRNA/total
g1    t1       
atgi tct tat atgf
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc tcc 98 tac tgc
atc acc aac agc
ctc ccc cac cgt
gtc gcc gac ggc
tta tca taa tga
ata aca aaa aga
cta cca caa cga
gta gca gaa gga
ttg tcg tag tgg
atgj acg aag agg
ctg ccg cag cgg
gtg gcg gag ggg
rap inter max min total
100 100 100 100

Actino. Intergen51

[modifier | modifier le wikicode]

Intergen51. Actino. Introduction

[modifier | modifier le wikicode]

Intergen51. Actino. Historique des pré-études

[modifier | modifier le wikicode]

Intergen51. Actino. Formatage des résultats pour 51 génomes

[modifier | modifier le wikicode]
  • Lien au tableur:

actino données intercalaires

[modifier | modifier le wikicode]
	total	max1	reste	max2	un
ase	3854	1320	19	3290	3760
blo	1045	765	5	982	1039
sma	3894	1160	19	2317	2597
ksk	3995	1403	20	3533	3930

actino données intercalaires 200

[modifier | modifier le wikicode]

Intergen51. Actino. Vue de l'ensemble

[modifier | modifier le wikicode]

Intergen51. Actino. La longueur totale des intercalaires d'un génome

[modifier | modifier le wikicode]
  • Note: Les 4 génomes ont des taux moyens comme pour la totalité des 51 génomes étudiés avec une moyenne de 12,6%. Voir la totale.
Nom	intercalaires		génome		taux en %
actino				
ase	1,100,127		9,239,851	11.9
blo	267,098			2,256,640	11.8
ksk	1,255,749		8,783,278	14.3
sma	1,241,224		9,025,608	13.8

Intergen51. Actino. Les différents types d'intercalaires

[modifier | modifier le wikicode]
  • Lien au tableur: Intergen51. Actino. Les différents types d'intercalaires.
  • Légende:
    - S pour intercalaire CDS-CDS et R pour tRNA-CDS,
    - c pour intercalaire continu (les 2 gènes sont sur le même brin) et x pour discontinu (les 2 gènes sont sur 2 brins différents, le brin et son complément)
    - %reste = 100*reste/total, le reste étant ce qui reste du total après la fin du diagramme, gamme.
    - %t30 = 100*t30/total, t30 étant le total des fréquences 10 20 30
    - %t5 = 100*t/total, t5 étant le total des fréquences de -1 à -5 dans le diagramme des S-.
  • Note: taux élevé des R-, 2% du total des R.
Int51.2 Actino les différents types d'intercalaires entre gènes de 4 génomes
Int51.21 Les différents types
intercalaires CDS-CDS * autres intercalaires
continu S+ S- S0 total c/x RNA-RNA CDS-rRNA total
c 12 759 3 546 29 16 334 1,8 157 34 191
x 8 295 598 40 8 933 0 15 15
t 21 054 4 144 69 25 267 157 49 206
% 83,3 16,4 0,3
Int51.22 Détail des * autres intercalaires
intercalaires tRNA-CDS récapitulatif des * autres intercalaires
continu R+ R- R0 total c/x * autres total %
c 217 3 0 220 1,2 tRNA-CDS 401 62
x 181 5 0 186 RNA-RNA 157 24
t 398 8 0 406 CDS-rRNA 49 8
% 98,0 2,0 0,0 non RNA 36 6
Int51.23 Les taux remarquables
taux %reste %t30 %t5 %0
type S+ R+ S- S+ R+ S- S+ R+
gamme 400 400 6-50 - - - - -
c 7,7 14,1 2,1 18,4 3,6 81 0,2 0,0
x 10,9 15,5 15,4 10,6 1,7 24 0,4 0,0

Intergen51. Actino. Détail des intercalaires RNA-RNA et CDS-rRNA

[modifier | modifier le wikicode]
RNA-RNA		c	x		CDS-RNA		c	x
23s5s		25			CDS 16s		17	7
16s23s		25			5s CDS		16	8
16stRNA					16 CDS			
tRNA23s					CDS 5s			
5stRNA					23s CDS			
tRNAin					CDS 23s			
tRNAcontig				5s 16s		1	
tRNAhors	107			16s16s			
tRNA16s								
23stRNA								
tRNA5s								
16s5s								
5s23s								
5s5s								
total		157	0		total		34	15

Intergen51. Actino. Les intercalaires rares

[modifier | modifier le wikicode]
  • Note:
tRNA-CDS		
gen	x-	c-
ase	-12	
blo	-8,-39	-17
sma	-3	-10
ksk	-3	-13
total	5	3
tRNA hors		
gen	x+	
ase	130	
sma	153	
ksk	151	
5s16s		c+
blo		866

Intergen51. Actino. Les diagrammes de la totale

[modifier | modifier le wikicode]

Intergen51. Actino. Les diagrammes CDS-CDS et tRNA-CDS

[modifier | modifier le wikicode]
Intergen51. Actino. Les diagrammes CDS-CDS et tRNA-CDS positifs
[modifier | modifier le wikicode]
  • Lien aux données intercalaires.
  • Diagrammes des actino:  tac présente 4 diagrammes
    - fc40, CDS-CDS continu, fréquence unitaire en abscisses et effectif en ordonnées
    - fx% fc%, CDS-CDS discontinu continu, fréquences regroupées par 10 (freq10) en abscisses et pourcentage en ‰ par rapport au total, en ordonnées.
    - ftc, tRNA-CDS continu, fréquences regroupées par 10 (freq10) en abscisses et effectif en ordonnées
    - ftx, tRNA-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et effectif en ordonnées
  • Équations des courbes de tendance en pour 1000: colonnes %fx %fc
Courbes de tendances pour les diagrammes en pour 1000				Calculs des f.41 et autres R2 des f.1		
R2	x3		x2		x		c		diag	Inflexion poly3	x	c
0,945	1,72E-06	-1,09E-03	9,20E-02	3,46E-01	fx1	abscisse	173,6	123,9
0,910	-1,04E-06	1,05E-03	-4,15E-01	6,74E+01	fc1	ordonnée	26,0	31,9
										poly3/droite	26,3	31,2
0,968	8,87E-07	-4,62E-04	-5,09E-02	4,41E+01	fx41				
0,982	9,36E-07	-3,48E-04	-1,23E-01	5,07E+01	fc41	R2 f.1	x	c
										Poly 3	945	910
0,950					-0,107		44,9		fx41	Poly 6	960	968
0,932					-0,119		45,9		fc41	Poly 9	981	989
0,912					-0,096		41,8		fx1				
0,830					-0,140		51,8		fc1				
Intergen51. Actino. Les diagrammes CDS-CDS négatifs
[modifier | modifier le wikicode]
Intergen51. Actino. comparaison avec la totale
[modifier | modifier le wikicode]
Sous-totaux	actino			totale	
fréquence	x-	c-		x-	c-
-1		0	453		4	4 140
-2		24	0		85	11
-3		0	1		3	12
-4		119	2 410		717	10 938
-5		0	1		5	19
sp6		455	681		1642	8 424
total		598	3 546		2 456	23 544
reste		92	75		264	420
s6		67	7		361	41
s7		106	180		321	1 438
s8		190	419		696	6 525
rappot s1-5						
4/2/1		5,0	5,3		8,4	2,6
% / sp6						
s6/sp6		14,7	1,0		22,0	0,5
s7/sp6		23,3	26,4		19,5	17,1
s8/sp6		41,8	61,5		42,4	77,5
reste/sp6	20,2	11,0		16,1	5,0
						
total s1-5	143	2 865		814	15 120
% / total						
%s1-5		23,9	80,8		33,1	64,2
%sp6		76,1	19,2		66,9	35,8
Intergen51. Actino. Homogénéité des génomes
[modifier | modifier le wikicode]
  • Lien aux données intercalaires des génomes
  • Homogénéité des génomes: En continu et en discontinu ase ksk sma sont homogènes avec des effectifs élevés pour les 2 types et des rapports 4/2/1 autour de 5.0. Cependant ase se distingue par ses effectifs les plus élevés des 51 génomes étudiés, 352 en x et 1300 en c. Par contre blo a un effectif faible et les 2 rapports 4/2/1 aux alentours de 2.0. Comparé à ksk j'ai respectivement 18 210 pour les totaux x et c contre 93 953.
négatifs x	ase	blo	ksk	sma	total
total		352	18	93	135	598
s1-5		108	3	13	19	143
sp6		244	15	80	116	455
rapport s1-5						
4/2		5.0	2.0	12.0	3.8	5.0
% / sp6						
s6		16	7	13	15	15
s7		20	27	36	21	23
s8		42	53	34	45	42
reste		22	13	18	20	20
% / total						
s1-5		31	17	14	14	24
sp6		69	83	86	86	76
						
						
négatifs c	ase	blo	ksk	sma	total
total		1300	210	959	1077	3546
s1-5		1055	161	771	878	2865
sp6		245	49	188	199	681
rapport s1-5						
4/1		5.3	2.1	6.2	6.0	5.3
% / sp6						
s6		1	2	1	1	1
s7		29	20	26	26	26
s8		59	73	62	61	62
reste		11	4	11	12	11
% / total						
s1-5		81	77	80	82	81
sp6		19	23	20	18	19
Intergen51. Actino. Les grands négatifs inférieurs à -120
[modifier | modifier le wikicode]

Intergen51. Actino. Les diagrammes CDS-rRNA

[modifier | modifier le wikicode]
Intergen51. Actino. Les diagrammes CDS-16s
[modifier | modifier le wikicode]
actino		CDS16sc		CDS16sx		5sCDSc		5sCDSx
R2		-		-		-		-
xs		579,2		689,9		191,4		155,3
plage		450-660		510-870		60-390		60-270
total-p		15		7		13		7
%		88		100		81		88
queue		1		0		3		1
%		6		0		19		12
tête		1		0		0		0
%		6		0		0		0
max		630;5		690;2		150;3		90;2
total8		17		7		16		8
freq		30		30		30		30
  • Les moyennes par génome
Intergen51.actino. Moyennes CDS-16s
CDS16sx. discontinu
CDS16sx moyenne écart m/e intercalaires haut bas
ase 689,0 147,1 4,7 585 793 69,8 68,1
blo 518 518 240,8 -102,9
ksk 703,0 43,8 16,0 672 734 55,8 82,1
sma 763,5 125,2 6,1 675 852 -4,7 142,6
total 689,9 115,4 6,0 758,8 620,9
CDS16sc. continu
CDS16sc moyenne écart m/e intercalaires haut bas
ase 593,8 139,3 4,3 3x491-555 799 46,3 70,1
blo 595,5 31,8 18,7 573 618 44,6 71,8
ksk 544,3 89,9 6,1 405 3x452-553 3x611-645 95,8 20,6
sma 629,0 21,6 29,1 4x607-653 11,1 105,3
total 581,9 89,8 6,5 640,1 523,7
Intergen51. Actino. Les diagrammes 5s-CDS
[modifier | modifier le wikicode]
  • Lien au tableur:
actino		5sCDSc		5sCDSx		ftx		ftc
R2		-		-		0,288		0,547
xs		191,4		155,3		128,2		111,1
plage		60-390		60-270		50-220		40-200
total-p		13		7		99		129
%		81		88		55		59
queue		3		1		71		80
%		19		12		39		36
tête		0		0		6		8
%		0		0		3		4
max		150;3		90;2		140;11		120;16
total8		16		8		181		220
freq		30		30		10		10
Intergen51.actino. Comparaison 5s-CDS tRNA-CDS CDS-CDS
[modifier | modifier le wikicode]
ftx-fx	92,7	ftc-fc	127,4
ftx-fx	-1,7	ftc-fc	-19,6
Intergen51.Actino Comparaison 5s-CDS tRNA-CDS CDS-CDS
ftx. tRNA-CDS discontinu
ftx moyenne écart m/e Inf 40 Sup 700 haut bas
ase 215,8 132,0 1,6 3 3 21,9 21,4
blo 263,7 147,3 1,8 0 0 -26,0 69,2
ksk 203,5 124,2 1,6 1 4 34,2 9,0
sma 205,8 145,2 1,4 2 1 31,9 11,3
total 216,1 137,1 1,6 ++ 237,7 194,5
5sCDSx. 5s-CDS discontinu
5sCDSx moyenne écart m/e intercalaires  -
ase 207,3 133,0 1,6 83:122 247:377
blo 219,5 44,5 4,9 188 251
ksk 82 82
sma 114 114
total 183,0 103,6 1,8 ++ 201,3 164,7 -
ftc. tRNA-CDS continu
ftc moyenne écart m/e Inf 40 Sup 700 haut bas
ase 237,3 174,3 1,4 11 2 -12,7 53,5
blo 202,2 115,4 1,8 1 1 22,4 18,4
ksk 156,6 84,5 1,9 3 3 67,9 -27,1
sma 220,6 147,9 1,5 3 2 4,0 36,8
total 204,2 136,1 1,5 ++ 224,6 183,7
5sCDSc. 5s-CDS continu
5sCDSc moyenne écart m/e intercalaires  -
ase 614,0 521,8 1,2 245 983
blo 375 375
ksk 257,4 141,9 1,8 101 5x182-271 553:*3080
sma 123,8 29,5 4,2 77:114 134:144 150
total 268,3 231,8 1,2 ++ 295,1 241,4 -
fx. CDS-CDS discontinu
fx moyenne écart m/e ftx-fx Sup 700 haut bas
ase 188,9 135,0 1,4 27,0 57 30,0 9,8
blo 201,0 136,0 1,5 62,6 8 17,9 21,9
ksk 200,4 136,9 1,5 3,1 87 18,5 21,3
sma 207,5 138,1 1,5 -1,7 81 11,4 28,4
total 199,0 136,8 1,45 17,1 ++ 218,9 179,1
fc. CDS-CDS continu
fc moyenne écart m/e ftc-fc Sup 700 haut bas
ase 171,8 132,0 1,3 65,5 101 25,7 10,2
blo 167,7 114,9 1,5 34,5 8 29,8 6,1
ksk 176,2 123,5 1,4 -19,6 104 21,2 14,7
sma 193,1 130,8 1,5 27,4 72 4,4 31,6
total 179,5 127,8 1,41 24,6 ++ 197,5 161,6
Intergen51. Actino. Les CDS-rRNA rares
[modifier | modifier le wikicode]
  • Note: un seul dans le génome blo, 5s16s avec un intercalaire de 866

Intergen51. Actino. Les diagrammes RNA-RNA

[modifier | modifier le wikicode]
Intergen51. Actino. Les diagrammes rRNA-rRNA
[modifier | modifier le wikicode]
actino		16s23s	16stRNA	tRNA23s	23s5s
R2		-			-
xs		330,7			110,6
plage		260-440			60-180
total-p		25			25
%		100			100
queue		0			0
%		0			0
tête		0			0
%		0			0
max		300;7			80;8
total8		25	0	0	25
freq		20	20	20	20
Intergen51. Actino. Les diagrammes tRNA-rRNA
[modifier | modifier le wikicode]
Intergen51.actino. Moyennes rRNA-RNA
16s23s.
16s23s moyenne écart m/e intercalaires haut bas
ase 347,0 3,9 89,0 2x344 2x345 2x352 16,8 49,4
blo 431,3 0,5 862,5 3x431 432 -67,5 133,6
ksk 288,1 4,7 61,3 2x280 7x288-291 75,7 -9,5
sma 311,3 1,6 190,7 308 5x312 52,5 13,7
total 330,7 50,4 6,6 363,8 297,6
23s5s.
23s5s moyenne écart m/e intercalaires haut bas
ase 129,2 36,2 3,6 4x100-114 175:176 -7,5 29,6
blo 170 4x 170 -48,3 70,4
ksk 80,9 10,2 7,9 2x 76 6x 78 108 40,8 -18,7
sma 97,2 20,0 4,9 5x 89 138 24,5 -2,4
total 110,6 38,0 2,9 121,7 99,6
Intergen51. Actino. Les diagrammes tRNA-tRNA
[modifier | modifier le wikicode]
Les diagrammes des tRNA-tRNA
[modifier | modifier le wikicode]
type c		S40	%	R2	diag	total	reste	x+	restes	hors
hors		65	61	0,541	220	107	4	-	240	269
									245	532
Les pourcentages des tRNA-tRNA hors blocs
[modifier | modifier le wikicode]
tRNA h 		ase	blo	sma	ksk	total	%	- ase	-ase %	ase %
20		25	2	4	7	38	35.5	13	22.4	51.0
40		6	4	7	10	27	25.2	21	36.2	12.2
60		4	7	3	3	17	15.9	13	22.4	8.2
80		2	0	2	1	5	4.7	3	5.2	4.1
100		3	2			5	4.7	2	3.4	6.1
120		2				2	1.9	0	0	4.1
140					1	1	0.9	1	1.7	0
160		4				4	3.7	0	0	8.2
180				1		1	0.9	1	1.7	0
200		1				1	0.9	0	0	2.0
220				1	1	2	1.9	2	3.4	0
240					1	1	0.9	1	1.7	0
260		1			1	2	1.9	1	1.7	2.0
restes		1				1	0.9	0	0	2.0
total		49	15	18	25	107	100	58	100	100
										
repete		2	3	3	8	16	35	14	45	13.3
séquence	0		1	1	2	4	2	6	0
sans		13	7	4	4	28	61	15	48	86.7
clusters	15	10	8	13	46	100	31	100	100
										
5		17	2	2	2	23	21	6	10.3	34.7
10		1	0	0	0	1	1	0	0	2.0
15		4	0	0	1	5	5	1	1.7	8.2
20		3	0	2	4	9	8	6	10.3	6.1

Les moyennes des tRNA-tRNA par génome
[modifier | modifier le wikicode]
Intergen51.actino. Moyennes tRNA-tRNA
tRNA hors moyenne écart m/e total S60% sup120 haut bas
ase 28,2 32,7 0,9 49 71 7 6,8 -0,5
blo 41,5 23,9 1,7 15 87 0 -6,4 12,8
ksk 30,4 16,9 1,8 25 80 4 4,7 1,7
sma 34,5 19,8 1,7 18 78 2 0,6 5,8
total 31,9 26,6 1,2 107 77 13 35,1 28,7
Intergen51. Actino. Les RNA-RNA rares
[modifier | modifier le wikicode]
  • Néant