Aller au contenu

Modélisation par dichotomie paritaire

Une page de Wikiversité, la communauté pédagogique libre.

Principe général de la méthode

[modifier | modifier le wikicode]

On se propose de modéliser un échantillonnage de données, dans un premier temps sans trous dans les données.

Aucun a priori sur les fonctions composantes ; nature, nombre,

Il est plus simple de décomposer l'échantillonnage en la somme d'une partie paire et impaire et de modéliser chacune séparément.

D'autre part , il est possible aussi de réitérer cette partition en l'exerçant sur chaque partie obtenue, par dichotomie. Des précautions seront à prendre lors de la modélisation fonctionnelle. Il est conseillé de s'arrêter à des sous-échantillons de 5 données.

Ces sous-partitions permettent de suivre l'évolution des fonctions composantes.

C'est une des façons aussi de décomposer le problème si il y a un grand nombre de données. De scinder les fonctions composantes si elle sont disjointes dans l'intervalle.

Critères de choix de l'échantillonnage

[modifier | modifier le wikicode]

1 ) Nombre de données : 2k+1 de préférence à 2k simplement pour une question de simplicité des calculs et d'une valeur centrale ainsi connue . Cela est lié à k paramètres inconnus des fonctions composantes qui seront à déterminer.

Ce qui donne 2k +1 données pour 2k+1 inconnues et pour 2k équations ( k équations pour la partie paire + k équations pour la partie impaire et 1 pour la valeur centrale ). Et réciproquement.

Règle: 2 DONNÉES COURANTES DONNE 1 INCONNUE // 1 INCONNUE A BESOIN DE 2 DONNÉES COURANTES

2 ) La finalité de la recherche conditionne la taille et la position de l'échantillon dans la totalité des données disponibles du phénomène. Une résolution au mieux permettra de dégrossir ou de simplifier la calculie.

2.1 ) Soit il s'agit de modéliser sur un intervalle sans extrapoler avec des contraintes et des limites .

2.2 ) Soit il s'agit d'extrapoler à court , moyen ou long terme, ce qui est le cas de données chronologiques par exemple.

Chaque donnée à trouver en plus est considérée comme une inconnue . De plus, pour chacune il faut associer de préférence une donnée connue à gauche. Les tests finaux peuvent porter sur des données inconnues postérieures.

Forme, contenu et approche du modèle de l'échantillon

[modifier | modifier le wikicode]
Le modèle sera de la forme
Avec 2k+1 données , et
I et P seront des combinaisons linéaires de produits de fonctions de base paires et impaires.
On s'arrangera toujours pour poser cette forme et ces conditions.
On verra comment procéder dans le cas de 2k données.
nombre de données 5 7
nombre d'inconnues 5 : C, A, B, w1, w2 avec C=f(0) 7 : C, A, B, w1, w2, ɛ1, ɛ2 avec C=f(0)
exemple de forme
pas des données 4 6
Pour les différentes possibilités de composantes paires et impaires , voir Modélisation Classement des fonctions selon la parité
Pour le traitement de l'exemple de 5 données , on se rapporte voir Modélisation Mixte Harmonique Hyperbolique par 5 ou 7 points
On devra ainsi construire et tester différentes formes et fonctions à partir des fonctions de base, en se fixant des limites et des contraintes. Sachant que les cos et sin sont compris entre -1 et 1 et que ch est >1
On sera amené souvent à augmenter du pas des données, ou de sa moitié, le nombre de données considérées, ceci à cause de ces conditions sur le résultats
Il existe 3 formes possible d'approximation
avec des données moyennes
au mieux
par blocs disjoints
en imposant l'encadrement strict des valeurs par leur maximale et leur minimale, ce qui induit deux équations en plus pour les dérivées nulles en ces données et donc amène à ajouter deux couples à l'échantillon.
Cette forme permet de déterminer ce qu'on appelle la porteuse, la tendance principale...