diff --git a/images/CV_terminal.png b/images/CV_terminal.png deleted file mode 100644 index b7133963fb99a6d72b9175430b3a60a200c3cb61..0000000000000000000000000000000000000000 Binary files a/images/CV_terminal.png and /dev/null differ diff --git a/images/Cross_validation.png b/images/Cross_validation.png deleted file mode 100644 index 749dcc37463b11d902c09b3a61abc105822ad0d4..0000000000000000000000000000000000000000 Binary files a/images/Cross_validation.png and /dev/null differ diff --git a/images/First_result.png b/images/First_result.png deleted file mode 100644 index 55d3da1d19f700aaedb139b094513386449e5b93..0000000000000000000000000000000000000000 Binary files a/images/First_result.png and /dev/null differ diff --git a/images/First_step.png b/images/First_step.png deleted file mode 100644 index 352d90e1e1c43b66da54eee40694b993e5221a59..0000000000000000000000000000000000000000 Binary files a/images/First_step.png and /dev/null differ diff --git a/images/Full_sample.png b/images/Full_sample.png deleted file mode 100644 index 6471bef891d3e0d6a2ab37940ea4db8de049be2b..0000000000000000000000000000000000000000 Binary files a/images/Full_sample.png and /dev/null differ diff --git a/images/erreur_moyenne.png b/images/erreur_moyenne.png deleted file mode 100644 index 059c0e12a63294be2f302984acdf3b608656a305..0000000000000000000000000000000000000000 Binary files a/images/erreur_moyenne.png and /dev/null differ diff --git a/images/erreur_relative.png b/images/erreur_relative.png deleted file mode 100644 index ffc5c985863ef462d45e63f9c7da4abfe0d44333..0000000000000000000000000000000000000000 Binary files a/images/erreur_relative.png and /dev/null differ diff --git a/rapport.pdf b/rapport.pdf index c598f6b42557e9583284ab685de9214535e7169d..2594a75e65f6669406c8fff0da19ae7a05b9be5a 100644 Binary files a/rapport.pdf and b/rapport.pdf differ diff --git a/rapport.tex b/rapport.tex index fde945f49b837e2eb8b1f5024954affa2224f3fd..697b614f83585b1ac4fedca489f723d2307933e9 100644 --- a/rapport.tex +++ b/rapport.tex @@ -145,7 +145,7 @@ \begin{align*} \frac{\partial E}{\partial a} &= \sum_{j=1}^{N}(a \cdot x_j + b - y_j)\cdot x_j\\ - \frac{\partial E}{\delta b} &= \sum_{j=1}^{N}(a \cdot x_j + b - y_j) + \frac{\partial E}{\partial b} &= \sum_{j=1}^{N}(a \cdot x_j + b - y_j) \end{align*} L'ensemble de ces dérivées forment le gradient de $E(a,b)$.\\ @@ -273,7 +273,22 @@ \clearpage \newpage \section{Conclusion} -blabla +Lors de la collecte de données pour une étude statistique et/ou expérimentale, un biais humain ou matériel est souvent compris dans les données. Ce biais est du +'bruit', une erreur souvent comprise dans un interval de valeurs plus ou moins grand et plus ou moins fixe.\\ +Cette collecte de données est réalisé en général pour connaître la tendance que suis le phénomène que l'on observe. Pour définir cette tendance on traduit donc +notre nuage de point en une fonction représentant la meilleure droite (cas de la régression linéaire) ou courbe passant par le maximum de point de notre échantillon. +Notre étude a pu montrer qu'il est possible d'obtenir les paramètres $a$ et $b$ d'une droite d'équation $y = a \cdot x + b$ de façon analytique, ou à l'aide de la +méthode de la descente de gradient pour optimiser la fonction d'erreur quadratique d'un nuage de point. La droite obtenue est la régression linéaire d'un nuage de point. +A partir de cette régression linéaire, l'erreur moyenne de l'échantillon peut être calculée. Plus le bruit contenu dans un échantillon est important, plus la dispersion +des points est importante, et par conséquent l'erreur moyenne se voit aussi augmenté. Cependant, l'erreur moyenne ne peut être interprétée seule. Une erreur peut +faible dans l'absolue, mais si les valeurs de l'échantillons de données sont aussi très faible, l'erreur peut fausser complètement la fiabilité de l'échantillon. +L'erreur doit toujours être analysée en rapport avec l'ordre de grandeur des valeurs de l'échantillon. C'est pourquoi nous avons utilisé l'erreur relative. Cette +dernière correspond au rapport de la différence entre la valeur mesurée et la valeur théorique, sur la valeur théorique. L'erreur relative traduit le niveau de variation +que les valeurs d'un échantillons sont suceptible de subir par rapport aux valeurs théoriques calculées. Le niveau d'erreur acceptable doit être définit en fonction +du sujet/domaine de l'étude en cours.\\ +Certains phénomènes ne suivent pas des modèles linéaires. En effet, dans certains cas le modèle suivra plutôt une fonction quadratique (parabole), cubique, +logarithmique, ou encore exponentielle. Pour ce type de cas la régression linéaire est inadapté pour représenter le comportement de ces modèles. D'autres type de +régression existe permettant de mieux représenter ces phénomènes: regression logarithmique, regression polynomiale, regression non paramétrique, etc. \clearpage \newpage diff --git a/rapport.toc b/rapport.toc deleted file mode 100644 index 7864af114bb148a137283be1f8398f526bfb2d00..0000000000000000000000000000000000000000 --- a/rapport.toc +++ /dev/null @@ -1,12 +0,0 @@ -\babel@toc {french}{} -\contentsline {section}{\numberline {1}Introduction}{1}{}% -\contentsline {section}{\numberline {2}Théorie}{2}{}% -\contentsline {subsection}{\numberline {2.1}Solution analytique}{2}{}% -\contentsline {subsection}{\numberline {2.2}Solution numérique}{3}{}% -\contentsline {subsection}{\numberline {2.3}Validation croisée}{4}{}% -\contentsline {section}{\numberline {3}Résultats}{4}{}% -\contentsline {subsection}{\numberline {3.1}Solution analytique}{4}{}% -\contentsline {subsection}{\numberline {3.2}Solution numérique}{5}{}% -\contentsline {subsection}{\numberline {3.3}Validation croisée}{7}{}% -\contentsline {subsection}{\numberline {3.4}Evolution de l'erreur}{10}{}% -\contentsline {section}{\numberline {4}Conclusion}{12}{}%