Aller au contenu

Arbres de décision/Définition

Leçons de niveau 18
Une page de Wikiversité, la communauté pédagogique libre.
Début de la boite de navigation du chapitre
Définition
Icône de la faculté
Chapitre no 1
Leçon : Arbres de décision
Retour auSommaire
Chap. suiv. :Historique
fin de la boite de navigation du chapitre
En raison de limitations techniques, la typographie souhaitable du titre, « Arbres de décision : Définition
Arbres de décision/Définition
 », n'a pu être restituée correctement ci-dessus.

L’arbre de décision est un arbre au sens informatique du terme. Il est représenté sous la forme graphique d’un arbre, d’une arborescence, ou encore d’un diagramme illustrant des règles de décision. Un arbre décisionnel est un outil d'aide à la décision, qui représente graphiquement un séquencement logique, faisant apparaître les différents résultats possibles, en fonction des choix effectués à chaque étape.

Les arbres de décision permettent d’effectuer des classifications pour des données, représentées par des ensembles d’attributs. Il existe deux catégories d'arbre de décision :

  • arbre de classification : la variable expliquée est de type nominale (facteur). À chaque étape du partage, on cherche à réduire l'impureté totale des deux nœuds fils par rapport au nœud père.
  • arbre de régression : la variable expliquée est de type numérique et il s'agit de prédire une valeur la plus proche possible de la vraie valeur.


Un arbre de décision est composé de nœuds de décision, qui permettent de tester les attributs. Un nœud de décision est étiqueté par un test qui peut être appliqué à chaque description d’un individu ou d’une population. Il est composé de branches qui représentent chacune une valeur de l’attribut testé. Il peut également être constitué de feuilles, c'est-à-dire les nœuds terminaux, qui indiquent la classe résultante. À toute description est associée une seule feuille de l’arbre de décision.


Détails en illustration

[modifier | modifier le wikicode]


Il permet de mettre à plat divers résultats envisagés en fonction des décisions prises. Il permet de faire des prédictions utilisées lors d’un lancement de projet, ou pour la résolution d’un problème rencontré. Il y a peu de perturbation des individus extrêmes, car ils sont isolés dans les petites feuilles de l'arbre. On peut aboutir à un traitement d'un grand nombre de variables explicatives.

Cet arbre regroupe toutes les observations d’un échantillonnage. Divers résultats sont envisagés et envisageables en fonctions des décisions prises, ou à prendre. Les résultats sont représentés avec chacune des options intermédiaires.