Leçons de niveau 18

Prévision décisionnelle/Méthode de la prévision

Une page de Wikiversité.
Sauter à la navigation Sauter à la recherche
Début de la boite de navigation du chapitre
Méthode de la prévision
Icône de la faculté
Chapitre no 3
Leçon : Prévision décisionnelle
Chap. préc. :Avantages et limites de la prévision décisionnelle
Chap. suiv. :Cas particuliers
fin de la boite de navigation du chapitre
Icon falscher Titel.svg
En raison de limitations techniques, la typographie souhaitable du titre, « Prévision décisionnelle : Méthode de la prévision
Prévision décisionnelle/Méthode de la prévision
 », n'a pu être restituée correctement ci-dessus.

Une décision ne peut se prendre sans données, ni observation. La place de la donnée dans la décision prévisionnelle est donc vitale. Il est important de définir ce qu’est une donnée et ce qu’est une information, pour comprendre la distinction qu’il y a entre les deux, et le rôle centrale qu’elles auront à jouer dans la décision prévisionnelle.


Qu’est ce qu'une donnée?[modifier | modifier le wikicode]

Le mot « donnée » peut se définir comme « un élément fondamental sur lequel se bâtit un raisonnement, une recherche ou une étude. Les données se réfèrent souvent aux données brutes ou informations non traitées. » Il existe différents types de données. En effet, il est rare de trouver le terme donnée sans qualificatif associé. Nous trouvons alors :


Les Données informatiques

« Informations numériques et alphanumériques codées et lisibles par la seule machine, en vue de leur enregistrement, traitement, conservation et communication ».


Les données personnelles

« Les données personnelles sont selon la CNIL des données qui permettent d’identifier directement ou indirectement un individu. Il s’agit du nom , du numéro de téléphone, de l’adresse, des différents numéros d’immatriculation (Sécurité sociale, automobile,..) , de l’adresse email , puis de l’adresse IP (son caractère personnel est encore sujet à débat juridique). La collecte des données personnelles est étroitement encadrée par le Loi Informatiques et libertés de 1978 réformée en 2004. Elle prévoit notamment une obligation de déclaration de fichier auprès de la CNIL et des conditions de recueil et d’utilisation devant être conformes à la loi ».


Les données publiques

« La définition des données publiques englobe toutes les données créées par des administrations dans le cadre de leurs missions. Ce sont principalement les données géographiques ou météorologiques, mais oui, cela peut aussi inclure des données financières ou juridiques ».

Pour résumer, nous pouvons dire qu’une donnée est une information brute. Nous pouvons lui donner un sens que si celle-ci est traitée. Une donnée seule, non exploité, n’a pas de réel intérêt si l’on souhaite prendre une décision.

Qu’est ce qu'une information?[modifier | modifier le wikicode]

Une information peut être considérée comme « un ensemble de données traitées portant sur un sujet précis et présentées dans un contexte particulier, par exemple un contexte de prise de décisions. »

Dans une entreprise, il existe des zones de pouvoir. Ainsi, celui qui détient la bonne information, au bon moment, peut se démarquer de ses collègues, et permettre à l’entreprise d’avoir un avantage sur ses concurrents. Moins il y a de personnes détenant une information, plus celle-ci à de la valeur. Il est possible grâce à la formule suivante de déterminer la valeur de l’information dans une entreprise.

            Valeur de l’information = (nombre d’utilisateurs) ^2 * (nombre de départements de l’entreprise)


Il en ressort que « l’accroissement de la valeur de l’information est proportionnel à son usage ».

L’information se distingue donc d’une donnée par le fait que celle-ci a été traitée, tandis que la donnée est brute. L’information peut être intégrée à l’actif d’une entreprise et considéré comme une ressource stratégique.


Importance de l'information[modifier | modifier le wikicode]

L’information comme nous avons pu le voir, est traité, mais cela ne suffit pas pour appuyer les décisions. En plus d’être traité, l’information doit être :

Juste

Fiable

De qualité

Pertinente

L’information peut être formelle, ou informelle et peut provenir de différentes sources. Le schéma ci-dessous illustre les différentes sources d’informations possibles.

L’information et son environnement

Pourquoi un besoin croissant d’aide à la décision?[modifier | modifier le wikicode]

Dans une entreprise, le système d’information se matérialise de la façon suivante :


Le système d’information dans l’entreprise


Les grandes décisions sont prises au niveau stratégique. Par décision, nous entendons « l’acte par lequel un ou des décideurs opèrent un choix entre plusieurs options permettant d’apporter une solution satisfaisante a un problème donné », ou pour donner uns direction à l’entreprise.

Nous pouvons appliquer à chaque niveau du système d’information certains types de décisions qui sont prises :


• Les décisions stratégiques qui correspondent au système d’information stratégique, il s’agit de décisions qui sont prises sur le long terme c’est-à-dire à plus de cinq ans. Ces décisions ont donc des répercussions sur toutes les composantes de l’entreprise.


• Les décisions tactiques qui correspondent système d’information tactique, il s’agit de décisions qui sont prises à moyen entre un et cinq ans. À ce niveau, les managers prennent des décisions pour traduire les décisions du niveau supérieur (stratégique), au niveau inférieur (opérationnel)


Les décisions opérationnelles qui correspondent au système d’information opérationnel, il s’agit de décision qui sont prises à court terme, cela peut se faire instantanément à quelques semaine, ou quelques mois.


Les décisions prises au niveau stratégique, sont rendus possible grâce aux informations conçues au niveau du niveau opérationnel. Dans une entreprise, c’est au niveau opérationnel que sont produites toutes les données relatives aux business et qui peuvent faire tourner l’entreprise. Pour que des décisions puissent être prise au niveau stratégique, des outils d’aide la décision sont nécessaires.

Nécessité des bases de données[modifier | modifier le wikicode]

Dans un monde mondialisé, ou il y a une explosion des nouvelles technologies et une abondance des données, il est nécessaire, indispensable d’avoir des outils d’aide à la décision.

Grâce à l’importance de données collectées à travers ses systèmes, ou autre forme de récolte de d’information, l’entreprise pourra constituer une base de données. Une base de données est un « ensemble de données organisé en vue de son utilisation par des programmes correspondant à des applications distinctes et de manière à faciliter l'évolution indépendante des données et des programmes ». Ces informations seront exploitées, lorsque l’on procédera à la décision prévisionnelle.


Un décideur en possession d’information, de données peut donc analyser des situations, faire ressortir des tendances, effectuer des prévisions, et aller encore plus loin en prenant des décisions qui pourront lui permettre de faire tourner son business, de mettre en place de nouvelle stratégie. D’où la nécessité de l’informatique décisionnelle.

Les données un élément stratégique Après avoir défini et expliquer l’importance des données, de l’information et identifier le niveau auquel les décisions sont prises, nous allons voir comment les données peuvent-elles être considérées comme un élément stratégique.


Pour que la donnée soit exploitable et que les décideurs puissent fonder leur prévision sur des éléments significatifs et représentatif, la donnée doit être, fiable de bonne qualité et précise. Ainsi, les données peuvent être :

• Issues de multiples sources internes ou externes

• Obtenus sous différents formats

• Datées et séquencé

Format des données[modifier | modifier le wikicode]

Il faut savoir qu’aujourd’hui, il existe des outils d’analyse de données du type ACL ou IDEA, souvent utilisés en Audit pour exploiter, analyser un nombre important de données. Pour être exploiter le format des données est primordiale, car l’outil doit être capable de les lire, sinon il faut les convertir dans le format adéquat.

Il est important de rester simple dans le traitement des données, cela permet une meilleure prise en main des fichiers ou des logiciels. Il faut pouvoir anticiper les consolidations, les insertions futures. L’intégration des logiciels permet une meilleure coordination et évite les conflits entre logiciels ou la multiplication des interfaces.


Le choix des données à extraire s’effectue en fonction de l’univers de référence défini. Celui-ci sera le plus restreint possible. Trop de précision fait parfois perdre du temps au détriment de la réactivité. En effet, le volume des données doit être maîtrisable, ainsi que les flux de données à chaque mise à jour. Un logiciel adapté au volume traité est requis. En théorie de la connaissance, pour passer d’une donnée à une information on considère qu'un minimum de contextualisation est cependant nécessaire.


Une base de données fait gagner du temps, et permet de limiter les erreurs de saisie des opérateurs. Une base de données est une mine d’or sur lequel il est indispensable de se pencher avant de prendre toute décision qui aura un impact sur le futur. La prévision ne peut se faire qu’à partir d’élément probant. Ce que la base de données permet de démontrer. Il faut alors protégés cette ressource contre d’éventuel, virus, perte de données, codages et brouillages qui en perturberont le stockage.

Stockage des données[modifier | modifier le wikicode]

Les outils de stockage de plus en plus performant, les sites internet, les moteurs de recherche, ou certaines contraintes qui peuvent être réglementaire pour certains établissements financiers comme le Plan de continuité des activités (PCA), ou encore l’émergence du Cloud computing nous poussent à stocker de plus en plus de données. Cela a conduit au phénomène de Big Data.


Par conséquent, entre les années 2010-2020, l’expansion des masses d’informations va confronter les matériels à de nouveaux ordres de grandeurs à tous les niveaux de stockage (y compris datawarehousing) et de traitement des données, ainsi que dans les gestions de réseaux. Aux caractéristiques précédentes des données s'ajoute le fait que :

• les données ne sont plus forcément organisées avec des tables,

• elles sont produites en temps réel,

• elles sont en liens divers avec d’autres données (heure, localisation) de façon très désordonnée,

• elles arrivent en flot ininterrompu du monde entier.

Lien entre les modèles mathématiques et la prévision[modifier | modifier le wikicode]

En finance pour connaître le rendement futur d’un instrument financier, prévoir l’avenir est possible grâce à des modèles mathématiques. Cela peut parfois avoir des conséquences dramatique comme la crise des subprimes. Il n’empêche que des individus soient dédiés à créer sans cesse de nouveau modèle.

Grâce aux informations, on peut comprendre les rapports de causalité ayant entraîné des variations si celles-ci répondent à un modèle, avant de l’utiliser. En théorie de l’information, c’est le moins probable qui contient le plus d’information. Maintenant, les entreprises analysent souvent les données en temps réel pour connaître leurs projections de résultats à venir.



Les limites des modèles[modifier | modifier le wikicode]

Malgré les méthodes de prévision, il peut arriver que subsistent:

  • un flou total,
  • des postulats restant à démontrer comme vrais ou faux,
  • des données non productrices de schémas susceptibles de se reproduire.

De plus, les modèles doivent être mis à jour afin de s'adapter aux changements.
Dans un contexte qui évolue trop rapidement, la réactivité ne se maintient qu'avec un degré de précision moindre.

À noter: plus l’historique est important, plus les modèles sont censés être fiables. Autrement dit, une entreprise gagne sur le long terme à investir dans de bons systèmes de stockage de données.

Un exemple de modèle démontré[modifier | modifier le wikicode]

Deux chercheurs, LIN Ping-Chen (Université nationale des sciences appliquées de Kaohsiung) et CHEN Jiah-Shing (Université centrale de Taïwan), ont conçu autour de 2008 un algorithme très précis en réutilisant certains principes de l'évolution biologique. Ils le testent sur les données recueillies auparavant jusqu'à trouver le poids approprié de chaque variable permettant de trouver les résultats actuels.

Toute prévision gagne à être confrontée à des informations subjectives. Qu’en pensent les décideurs ? Comment voient-ils les évolutions du marché ?



Les outils d'aide à la prise de décision[modifier | modifier le wikicode]

L’hypercube ou On Line Analytical Processing[modifier | modifier le wikicode]

L'OLAP (exemple le TCD d’excel) permet de manipuler les données à travers plusieurs dimensions. Zoom/ dézoom, rotation, tranchage (slicing ou scoring) sont des actions qui permettent de les présenter de façon exploitable pour l’analyste ou le décideur. Il y a plusieurs appellations des hypercubes selon leurs applications :

  • U-OLAP > intrus
  • O-OLAP> objet
  • M-OLAP> multidimensionnel
  • R-OLAP> Relationnel
  • H-OLAP> Hybride

Le data mining (webmining sur les sites internet) ou fouille de données[modifier | modifier le wikicode]

Ensemble de techniques et de méthodes du domaine :

  • des statistiques,
  • des mathématiques,
  • de l’informatique,

permettant à partir d’un important volume de données brutes :

  • le repérage de comportements,
  • la mise en évidence d’ensemble d’individus dans une population spécifique,
  • l’aide aux décideurs d’une entreprise,
  • la découverte de connaissances cachées.

Différentes techniques ou méthodes existent :

  • Réseaux de neurones (exemple Dell, méthode supervisée et non supervisée)
  • Arbres de décisions (exemple Google, méthode supervisée ou prédictive)
  • Nuées dynamiques (exemple Amazon, méthode non supervisée)
  • Probabilités (méthode supervisée ou prédictive)

À titre d’exemple, voici quelques logiciels SIAD : BO de SAP, SAS, Forests and Trees, Hyperion Essbase d’Oracle, Power Play d’IBM. Côté logiciels libres, Birt et Pentaho sont spécialisés en report, Talend en datawarehousing, Tanagra en data mining, Mondrian et Jpivot en hypercube.