Recherche:Techniques de prédictions/Vers l'échantillonnage prédictifiable idéal

**Vers l'échantillonnage prédictifiable idéal**
Recherche : Techniques de prédictions

Chapitre n^o 2
Chap. préc. :	Premiers pas
Chap. suiv. :	Traitement de l'échantillonnage prédictifiable idéal

En raison de limitations techniques, la typographie souhaitable du titre, « Techniques de prédictions : Vers l'échantillonnage prédictifiable idéal
Techniques de prédictions/Vers l'échantillonnage prédictifiable idéal », n'a pu être restituée correctement ci-dessus.

À été repris en remontant de la forme de l'ECHANTILLON PREDICTIFIABLE IDEAL COMPLET de de 4k+1 données centrées et distantes de 1

VERS la forme de l' ECHANTILLON BRUT EXTRAIT de l'echantillonnage traité, ECHANTILLON à variable explicative traitée au niveau de l'échelle et de l'origine

VERS la forme de l'ECHANTILLONNAGE PREDICTIFIABLE TRAITE COMPLET de 8k+1 données

Types d'échantillons prédictifiables

Définitions

Les échantillons idéaux sont tout dabord constitués de couples associant une variable explicative indépendante, celle mise en abscisse, avec une variable réponse dépendante, celle mise en ordonnée. Ceci est trivial.

Mais en plus il faudra respecter les étapes suivantes pour un traitement approprié de l'échantillon afin de lui donner la structure d'un échantillon prédictifiable, si possible idéal et complet. Prédictifiable signifie capable de devenir prédictif, après traitement et anlyse bien sûr.

Un échantillon est un extrait d'échantillonnage. Judicieusement placé et dimensionné, il peut devenir un échantillon prdictifiable

Un échantillon prédictifiable traité peut devenir un échantillon prédictif après modélisation et testages

L'échantillonnage prédictifiable est un échantillonnage qui correspond à certains modèles , dont un idéal et complet, afin de pouvoir être traité .

Un échantillonnage prédictifiable traité peut devenir un échantillonnage prédictif après suffisamment de testages

L'échantillonnage prédictif est un un échantillonnage prédictifiable valable pour une extrapolation fiable et maîtrisée muni d'un échantillon prédictifiable qui donne un résultat du domaine du possible .

Modèle d'Echantillon Prédictifiable Idéal Complet EPIC

C'est un modèle idéal d'échantillon prédictifiable avec un nombre impair de données ( 3 particulier , en général 4n+1 ), données respectant la forme ci-dessous. Elle est bien sûr rare à l'état brut et naturel pour un échantillonnage imposé, mais faisable pour un échantillon construit .

Lors d'une prédiction ou d'une extrapolation, la dernière valeur x , la première parfois, est la valeur indicée 0, surtout si c’est un temps, et dans ce cas le temps présent, le temps 0 à partir duquel on cherche la suite. ( à déplacer dans la partie échantillonnage )

Les valeurs explicatives xi sont le plus souvent quelconques et donc non-équipotentes avec des écarts variables. Tout l'art du statisticien - mathématicien sera de transformer l'échantillonnage pour le ramener sous la forme idéale ci-dessous de l'échantillonnage prédictable. Les méthodes existent et seront rappelées dans le sous-chapitre suivant.

EPIC : $[(x_{-2n},y_{-2n})(x_{-2n}+1,y_{-2n+1})...(x_{-1},y_{-}1)(x_{0},y_{0})(x_{1},y_{1})...(x_{2n}-1,y_{2n-1})(x_{2n},y_{2n})]$

si x n'a pas encore été réduit .

EPIC : $[(-2n,y_{-2n})(-2n+1,y_{-2n+1})...(-1,y_{-}1)(0,y_{0})(1,y_{1})...(2n-1,y_{2n-1})(2n,y_{2n})]$

après réduction de x avec n>0 entier.

La plage de la variable x explicative est constituée des nombres relatifs entiers de -4n à +4n :

$[-2n,-2n+1,...,-1,0,1,...,2n-1,2n]$

Voici donc l'Echantillon Prédictifiable Idéal Complet EPIC : variable explicative à valeurs équipotentes ( écart entre deux valeurs consécutives pris comme unité et noté unité 1 ), nombre total impair de valeurs en quantité 4n+ 1, de n = 1 à ce qui est traitable par calculateur ou a ce qui paraît représentatif ( citères en annexes ).

L'échantillon étudié aura une taille optimale de 4n+1 couples de données, idéalement la moitié de celle d'un échantillonnage de 8n+1 plus un couple, tout ou partie du reste des 4k valeurs servant pour les tests. cette presque moitié peut être extraite de l'échantillonnage de différentes façons, la plus judicieuse étant de prendre les 4k+1 dernières valeurs avant extrapolation et de faire un suivi du test en remontant sur les valeurs précédentes. ( vpoir chapitre suivant )

Des extraits avec plus ou moins de 4n+1 couples ( 4n+2 et 4n+3 ) sont possibles mais la qualité des extrapolation et l'horizon prédictif s'en ressentiront.

De même qu’il est possible de traiter des échantillonnage de plus ou moins 8n+1 couples ( 8n+2 à 8n+7 ), par glissement de l'échantillon et moyennage ( voir schémas en annexes ).

Autres Formes prédictifiables

D'autres formes d'échantillons sont traitables à fin de prédiction. Leur traitement aussi bien structural que mathématique est plus lourd.

Pourtant il ne peut être exclu pour certaines applications. Il est conseillé néanmoins d’éviter ces modèles lorsque c’est possible.

Ces cas seront évoqués dans les annexes. En voici un aperçu :

Modéle prédictifiable avec un nombre pair

Modéle d'échantillon prédictifiable avec un nombre pair 4k de couples de données :

$[(x_{-4n}-1,y_{-4n+1})...(x_{-3},y_{-3})(x_{-1},y_{-}1)(x_{1},y_{1})(x_{3},y_{3})...(x_{4n}+1,y_{4n-1})]$ si x a été réduit.

$[(-4n-1,y_{-4n+1})...(-3,y_{-3})(-1,y_{-}1)(1,y_{1})(3,y_{3})...(4n+1,y_{4n-1})]$ si x a été réduit.

Modèle prédictifiable à trous

Il y a présence de trous avec un nombre maximum fonction du nombre de valeurs idéales de l'échantillon. Il peut y avoir des trous soit parce que les valeurs sont fantaisistes et exclues, soit parce qu'on ne les possède pas

Par exemple, le modèle à nombre pair de données ci-dessus correspond au modèle complet avec 4n+1 trous, 1 couple sur 2 supprimé plus surtout le couple central.

Exemple de modèle pair à 2 trous

Les deux trous sont ici

(x_{-3},y_{-3})et(x_{5},y_{5})

. Leur nombre et leur position peut être autre dans certaines limites :

$[(x_{-4n}-1,y_{-4n+1})...(x_{-5},y_{-5})(x_{-1},y_{-}1)(x_{1},y_{1})(x_{7},y_{7})...(x_{4n}+1,y_{4n-1})]$ si x n'a pas été réduit.

$[(-4n-1,y_{-4n+1})...(-5,y_{-5})(-1,y_{-}1)(1,y_{1})(7,y_{7})...(4n+1,y_{4n-1})]$ si x a été réduit.

Exemple de modèle impair idéal à 2 trous

Les 2 trous

(x_{-1},y_{-1})et(x_{4n}-1,y_{4n-1})

. Même remarque:

[(x_{-2n},y_{-2n})(x_{-2n}+1,y_{-2n+1})...(x_{-2},y_{-}2)(x_{0},y_{0})(x_{1},y_{1})...(x_{2n}-1,y_{2n-1})(x_{2n},y_{2n})]

si x n'a pas été réduit.

[(-2n,y_{-2n})(-2n+1,y_{-2n+1})...(-2,y_{-}2)(0,y_{0})(1,y_{1})...(2n-1,y_{2n-1})(2n,y_{2n})]

si x a été réduit.

Conclusion et perspectives

Dans tous les cas, il s'agit maintenant de traiter et de ramener dans un premier temps l'échantillon brut EB sous la forme d'un échantillonnage prédictifiable EP, de préférence idéal et complet à 4k+1 couples nommé EPIC, soit simplement sous une autre forme prédictifiable comme indiqué et décrit ci-dessus.

La partie suivante, qui est surtout un rappel, traite des possibilités et des façons afin de l'amener sous une de ces formes.

Nota sur le nombre de données

Cas extrême qui ira dans les annexes :

Un échantillon de 3 données peut être analysé et donner un résulat sous certaines conditions .

Le résultat trouvé doit être testé au moins 1 fois, pour la valeur suivante, ce qui donne un horizon prédictif de 1 avec ou sans erreur selon le résultat du test.

Il doit être testé statistiquement au moins 2 fois, pour les 2 valeurs suivantes, ce qui donne un horizon prédictif de 2, avec ou sans erreur selon le résultat du test.

Il faut au minimum 5 données en général pour avoir un résultat. Une population de six ou sept données seront en fait nécessaire pour un horizon à +1.

Noter que s'il est analysé l'échantillon des 6 premières valeurs d'un échantillonnage, testé ensuite sur les n-6 valeurs restantes d'un échantillonnage de n valeurs, il n'y aura pas nécessairement un horizon prédictif de n-6 coups au-delà de l'échantillonnage ( voir annexe 1 ).

Dans l'état actuel de cette recherche, il semble que pour un échantillonnage de type idéal de 8n+1 valeurs, la taille optimale de l'échantillon soit de 4n+1 valeurs, avec un résultat testé sur les 4n valeurs finales avec un horizon prédictif possible de 4n données avec exactitude ou avec une erreur estimable et estimée selon les conditions de l'analyse et le résultat des tests.

De l'Echantillon Brut EB extrait de l'Echantillonnage Brut Traité EgBT à l'Echantillon Prédictifiable Idéal Complet EPIC

Rappel de la forme de l'Echantillon Prédictable Idéal Complet EPIC ( variable exlicative réduite ) à obtenir :

$[(-4n,y_{-4n})(-4n+1,y_{-4n+1})...(-1,y_{-1})(0,y_{0})(1,y_{1})...(4n-1,y_{4n-1})(4n,y_{4n})]$

Réduction d' échelle explicative entre l' EB et l' EPIC

Exemple d'échantillon à 9 données ( 4k+1 avec avec k=2 ):

Explicatif de l'Echantillonage Brut Traité ( voir chapitre 2 ) EgBT de 19 données ( 2*9données de l'échantillon +1 ) avant extrait de l' Echantillon Brut EB et avant Réduction d'Echelle RE:

$[-120,-110,-100,-90,-80,-70,-60,-50,-40,-30,-20,-10,0,+10,+20,+30,+40,+50,+60]$

Explicatif de l'échantillon Brut extrait EB avant Réduction d'Echelle RE :

{\begin{vmatrix}-20,&-10,&0,&+10,&+20,&+30,&+40,&+50,&+60\\\end{vmatrix}}

Explicatif de l'EB après réduction d'échelle ( EBER ):

{\begin{vmatrix}-2,&-1,&0,&+1,&+2,&+3,&+4,&+5,&+6\\\end{vmatrix}}

Différence d' origine explicative entre l' EBER et l' EPIC

Il est remarquable que l'EPIC ( Echantillon Prédictable Idéal Complet ), sous sa forme analysable, est centré et à son origine de la variable explicative au milieu de la plage min-max de cette variable. Cela doit en être ainsi si on désire l'analyser dans sa totalité.

L'origine ou zéro de la variable explicative de l'échantillon brut est là où il est : à gauche, à droite ou entre les deux, voire hors des limites de la plage min-max.

Exemple d'Echantillon Brut à Echelle Réduite ( EBER ) donné avec origine à droite :

$[(-4k,y_{-4k})(-4k+1,y_{-4k+1})...(-2k-1,y_{-2k-1})(-2k,y_{-2k})(-2k+1,y_{-2k+1})...(-1,y_{-1})(0,y_{0})]$

L'origine peut être à droite ou à gauche.

L' origine à droite, c’est l'exemple avec des chronogrammes, des frises et des suites chronologiques avec t=0 à droite pour x0.

$[(-4k,y_{-4k})(-4k+1,y_{-4k+1})...(-2k-1,y_{-2k-1})(-2k,y_{-2k})(-2k+1,y_{-2k+1})...(-1,y_{-1})(0,y_{0})]$

L' origine à gauche, c’est l'exemple avec des relevés de variable explicative standard , temporelles ou non, relevées et classées par ordre croissant avec le minimum à gauche.

$[(0,y_{0})(1,y_{1})...(2k-1,y_{2k-1})(2k,y_{2k})(2k+1,y_{2k+1})...(4k-1,y_{4k-1})(4k,y_{4k})]$

Effectuer un changement d'origine de "0" qui est le zéro de la variable explicative pour amener le nouveau zéro au milieu de la plage de l'échantillon.

Exemple d'échantillon à 9 données :

Explicatif de l' EBER avant changement d'origine :

{\begin{vmatrix}-2,&-1,&0,&+1,&+2,&+3,&+4,&+5,&+6\\\end{vmatrix}}

Explicatif de l' EBER après changement d'origine ( l' EBERCO ou EBT , Echantillon Brut Traité, à savoir l' EPIC ) :

${\begin{vmatrix}-4,&-3,&-2,&-1,&0,&+1,&+2,&+3,&+4,\\\end{vmatrix}}$

EPIC de 4*2+1 données régulièrement espacées de 1 et centrées ( k=2 ).

La correspondance et le passage de $x^{*}$ à $X^{*}$ et de $X^{*}$ à $x^{*}$ se fait par un changement d'échelle et un d'origine zéro:

X^{*}={\frac {x^{*}-20}{10}}

et

x^{*}=(X^{*}*10)+20

Calcul général pour 4k+1 valeurs explicatives xi* :

Superposer à la plage $[xmin^{*},xmax^{*}]$ un axe X* orienté de gauche à droite, centré sur la position milieu $x_{4k+1}^{*}$ , et gradué en + et - avec l'unité 1.

Repérer la valeur $x_{i}^{*}$ correspondant à $X^{*}=0$ .

Le changement d'origine se fait par :

$X^{*}={\frac {x^{*}-x_{i}^{*}}{x_{4k+1}^{*}}}$ et $x^{*}=(X^{*}*x_{4k+1}^{*})+x_{i}^{*}$

Valeurs aléatoires

Si l'analyse de l'EPIC et des autres EP conduisent à une impossible modélisation, on peut s'attendre à des valeurs aléatoires. Alors :

Extraire plusieurs Echantillons Prédictifiables Idéaux de tailles et de positions différentes à l'intérieur de l'échantillonnage.

Balayer l'échantillonnage. Tester les écarts de chaque modèle et retenir les formules les plus fiables en conséquence.

Etablir un suivi des paramètres de la décomposition. Refraire une modélisation sur leur évolution séparée ou conjointe .

( ceci est une esquisse pour les variables aléatoires )

Techniques de prédictions

Premiers pas

Traitement de l'échantillonnage prédictifiable idéal