Skip to content
Snippets Groups Projects
Commit 5185627a authored by Boris Stefanovic's avatar Boris Stefanovic
Browse files

save

parent 1fcfb6ea
No related branches found
No related tags found
No related merge requests found
% Programmation séquentielle - K-Means
# But
Le but de ce travail est d'implémenter la méthode des k-moyennes
pour partitionner des données de façon non supervisée.
......@@ -42,26 +43,14 @@ Il faut simplement s'assurer qu'ils ne soient pas trop proches les uns des autre
### Etapes
Ainsi vous devrez les assigner à des _clusters_ par rapport à la distance séparent les points.
En effet, chaque point devra appartenir au _cluster_ dont son _centroïde_ est le plus proche.
Afin de quantifier la proximité de deux éléments entre eux, nous avons
besoin de définir une fonction distance, qui sera notre métrique.
Cette fonction distance peut retourner simplement une distance
de Manhattan ou une distance euclidienne et prend en argument deux vecteurs éléments de notre univers.
Ainsi, l'assignation des points à leurs _clusters_ se déroule de la manière suivante :
$$d(x,y)$$
Ainsi, l'assignation de chaque point à un _cluster_ se déroule de la manière suivante :
Pour chaque point, il faut:
1. Calculer la distance entre le point et les _centroïdes_.
2. Comparer les distances pour déterminer le _centroïde_ le plus proche.
3. Assigner le point au _cluster_ du _centroïde_ le plus proche .
2. Prendre le centroïde qui correspond à la distance trouvée la plus petite.
3. Assigner le point au _cluster_ du _centroïde_ ainsi trouvé.
4. Calculer le nouveau centre de gravité du _cluster_.
## Calcul de similarité
......
0% Loading or .
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment