diff --git a/readme.md b/readme.md index 0239bd01257a4d12d6e4ecd5dac62a491a21b43b..2cdcb73480835b89e398309f2979a6ff96b5d409 100644 --- a/readme.md +++ b/readme.md @@ -19,6 +19,7 @@ Ci-dessous un exemple du résultat attendu: {width=400px} # Solution analytique +## Minimisation de la fonction de coût En premier lieux, nous avons cherchons à minimiser la fonction de coût (Erreur quadratique): E(a,b) = $\sum_{j=1}^N (a * x_{j} + b - y_{j})^2$ @@ -29,21 +30,21 @@ Nous alons d'abord chercher la dérivée en a et en b de la fonction de cout. Tels que : -a : $\frac{\partial E}{\partial a} = 2 * \sum{(a * x_{j} + b - y_{j}) * x_{j} = 0} $ +a : $\frac{\partial E}{\partial a} = 2 * \sum{(a * x_{j} + b - y_{j}) * x_{j} = 0}$ -b : $\frac{\partial E}{\partial b} = 2 * \sum{(a * x_{j} + b - y_{j}) = 0} $ +b : $\frac{\partial E}{\partial b} = 2 * \sum{(a * x_{j} + b - y_{j}) = 0}$ En suprimant le **2**, distribuant la **$\sum$** et **$x_{j}$** on obtient: -a : $\sum{(ax_{j}² + bx_{j} - x_{j}y_{j})} = a\sum{x_{j}²} + b\sum{x_{j}} - \sum{x_{j}y_{j}} = 0$ +a : $\sum{({ax_{j}}^2 + bx_{j} - x_{j}y_{j})} = a\sum{{x_{j}}^2} + b\sum{x_{j}} - \sum{x_{j}y_{j}} = 0$ b : $\sum{(ax_{j} + b_{j} - y_{j})} = a\sum{x_{j}} + \sum{}b\ - \sum{y_{j}} = a\sum{x_{j}} + Nb - \sum{y_{j}} = 0$ -Afin d'abtenir une formule **a** et **b** ayant que des constante en parametre (nos somme de point), il faut resoudre ce sytem a deux equation. +Afin d'obtenir une formule **a** et **b** ayant que des constantes en paramètre (nos sommes de points), il faut résoudre ce sytème à deux equations. -Poue nous symplifier dans l'ecriture des fonction et par la suite dans nos code, on vas definir les sommes par des variables: +Pour nous symplifier dans l'écriture des fonctions et par la suite dans notre code, on va définir les sommes par des variables: -$A = \sum{x_{j}²}$ +$A = \sum{{x_{j}}^2}$ $B = \sum{x_{j}}$ @@ -51,7 +52,7 @@ $C = \sum{x_{j}}\sum{y_{j}}$ $D = \sum{y_{j}}$ -ce qui nous donnes: +ce qui nous donne: a : $aA + bB - C = 0$ @@ -61,46 +62,44 @@ b : $aB + Nb - D = 0$ $b = \frac{-aB + D}{N}$ -On inserant **b** dans la formul de **a**, afin de suprimer **b** de la formule - -on obtien: +En insérant **b** dans la formule de **a**, afin de supprimer **b** de la formule : $aA = -bB + C = - (\frac{-aB + D}{N})B + C$ -$aA = \frac{aB² - BD}{N} + C$ +$aA = \frac{{aB}^2 - BD}{N} + C$ -$a = \frac{aB²}{AN} - \frac{BD}{AN} + \frac{C}{A}$ +$a = \frac{{aB}^2}{AN} - \frac{BD}{AN} + \frac{C}{A}$ -$a - \frac{aB²}{AN} = - \frac{BD}{AN} + \frac{C}{A}$ +$a - \frac{{aB}^2}{AN} = - \frac{BD}{AN} + \frac{C}{A}$ -$a(1 - \frac{B²}{AN}) = - \frac{BD}{AN} + \frac{C}{A}$ +$a(1 - \frac{{B}^2}{AN}) = - \frac{BD}{AN} + \frac{C}{A}$ -$a = \frac{- \frac{BD}{AN} + \frac{CN}{AN}}{1 - \frac{B²}{AN}}$ +$a = \frac{- \frac{BD}{AN} + \frac{CN}{AN}}{1 - \frac{{B}^2}{AN}}$ -$a = \frac{- \frac{BD}{AN} + \frac{CN}{AN}}{\frac{AN - B²}{AN}}$ +$a = \frac{- \frac{BD}{AN} + \frac{CN}{AN}}{\frac{AN - {B}^2}{AN}}$ -$a = \frac{-BD + CN}{AN} * \frac{AN}{AN - B²}$ +$a = \frac{-BD + CN}{AN} * \frac{AN}{AN - {B}^2}$ -$a = \frac{-BD + CN}{AN - B²}$ +$a = \frac{-BD + CN}{AN - {B}^2}$ -$a = \frac{CN - BD}{AN - B²}$ +$a = \frac{CN - BD}{AN - {B}^2}$ On a alors obtenu **a**, il nous reste plus qu'a l'inserer dans la formul de **b**, pour obtenir **b** sans variable. On obtient: -$b = -a\frac{B}{N} + \frac{D}{N} = -(\frac{CN - BD}{AN - B²})\frac{B}{N} + \frac{D}{N}$ +$b = -a\frac{B}{N} + \frac{D}{N} = -(\frac{CN - BD}{AN - {B}^2})\frac{B}{N} + \frac{D}{N}$ -$b = -(\frac{CNB - B²D}{AN² - B²N}) + \frac{D}{N}$ +$b = -(\frac{CNB - {B^2}D}{{AN^2} - {B^2}N}) + \frac{D}{N}$ -### Vérifiaction +## Vérifiaction On peux tester nos deux formule dans un exel par exemple pour s'assurer de la justesse des transformation. On vas donc génerer un nuage de point suivant une droite, puis calculer nos deux formule en rentrant comme parametre les differents somme de points. ce qui vas nous donner un premier resultat (Solution analitique a et b) que lon peux comparer avec l'equation de la coubre de tendance lineaire calculer par exel. - + On compart donc que les deux resultat sont identique sur la base d'afichage des nombre a virgule obtenu. De cette façon, nous avons pu confirmer la qualité de nos calculs, mais aussi de s'avoir à quoi s'attendre en therme de résultat par la suite. @@ -150,6 +149,8 @@ Voici un tableau des données obtenue sur une génération aléatoire ainsi que On peut constater une différence de précision au niveau de l'erreur quadratique. En effet, l'erreur quadratique obtenue pendant la validation croisée par chacun des groupes sont bien plus petites que cette optenue sur le nuage complet. On peut en déduire qu'il est préférable de réaliser la descente de gradient sur des lots données pas trop volumineux et de vérifier l'écart de chacun des résultats afin de s'assurer que le résultat obtenu soit le plus juste possible. +# Amélioration possible + # Conclusion