diff --git a/readme.md b/readme.md index df155bdd98f6044c765c289ed52cfcf45ea94264..cc3692109d639484cdf73418e3c3531d11837715 100644 --- a/readme.md +++ b/readme.md @@ -1,6 +1,7 @@ % Programmation séquentielle - K-Means # But + Le but de ce travail est d'implémenter la méthode des k-moyennes pour partitionner des données de façon non supervisée. @@ -42,26 +43,14 @@ Il faut simplement s'assurer qu'ils ne soient pas trop proches les uns des autre ### Etapes -Ainsi vous devrez les assigner à des _clusters_ par rapport à la distance séparent les points. -En effet, chaque point devra appartenir au _cluster_ dont son _centroïde_ est le plus proche. - - -Afin de quantifier la proximité de deux éléments entre eux, nous avons -besoin de définir une fonction distance, qui sera notre métrique. - -Cette fonction distance peut retourner simplement une distance -de Manhattan ou une distance euclidienne et prend en argument deux vecteurs éléments de notre univers. +Ainsi, l'assignation des points à leurs _clusters_ se déroule de la manière suivante : -$$d(x,y)$$ - - -Ainsi, l'assignation de chaque point à un _cluster_ se déroule de la manière suivante : +Pour chaque point, il faut: 1. Calculer la distance entre le point et les _centroïdes_. -2. Comparer les distances pour déterminer le _centroïde_ le plus proche. -3. Assigner le point au _cluster_ du _centroïde_ le plus proche . - - +2. Prendre le centroïde qui correspond à la distance trouvée la plus petite. +3. Assigner le point au _cluster_ du _centroïde_ ainsi trouvé. +4. Calculer le nouveau centre de gravité du _cluster_. ## Calcul de similarité