Aller au contenu

Apprentissage non supervisé/Méthode des k-moyennes

Une page de Wikiversité, la communauté pédagogique libre.
Début de la boite de navigation du chapitre
Méthode des k-moyennes
Icône de la faculté
Chapitre no 1
Leçon : Apprentissage non supervisé
Retour auSommaire
Chap. suiv. :Classification hiérarchique
fin de la boite de navigation du chapitre
En raison de limitations techniques, la typographie souhaitable du titre, « Apprentissage non supervisé : Méthode des k-moyennes
Apprentissage non supervisé/Méthode des k-moyennes
 », n'a pu être restituée correctement ci-dessus.

La méthode des k-moyennes (k-means en anglais) est une méthode de partitionnement des données. Elle permet de regrouper en k partitions (clusters en anglais) les données qui se ressemblent. Pour rappel, nous sommes en contexte non supervisé, c'est-à-dire que nous ne connaissons pas la vérité terrain sur les données.

Définition formelle

[modifier | modifier le wikicode]

Considérons un ensemble de points (x1, x2, …, xn). La méthode des k-moyennes consiste à partitionner les n points en k ensembles S = {S1, S2, …, Sk} (kn) en minimisant la distance entre les points à l'intérieur de chaque partition :

μi est le barycentre des points dans Si.

Problème simple

[modifier | modifier le wikicode]

Limites de la méthode

[modifier | modifier le wikicode]