diff --git a/01_rappel.md b/01_rappel.md
index daa08a5b46d1c46ea904b9a8b92879719da09970..b836992ed0480b12ec92bfd7238ed2fa39c09bd2 100644
--- a/01_rappel.md
+++ b/01_rappel.md
@@ -179,7 +179,7 @@ $f(x)=3x^3+1$, $g(x)=4x^3+2x^2+x$
 $$
 \lim_{x\rightarrow \infty}\frac{f(x)}{g(x)}=\lim_{x\rightarrow \infty}\frac{3x^3(1+1/3x^3)}{4x^3(1+1/2x^+1/4x^2)}=\frac{3}{4}.$$
 
-Ce genre dâ€™estimations est imporant en informatique lors de lâ€™analyse de
+Ce genre dâ€™estimations est important en informatique lors de lâ€™analyse de
 performance des algorithmes. On peut prendre lâ€™exemple des algorithmes
 de tri â€œbubble sortâ€ et â€œquick sortâ€. Leur complexitÃ© respective moyenne
 est de $n^2$ et de $n\log(n)$, quand $n$ est le nombre dâ€™Ã©lÃ©ments de la
diff --git a/02_integrales.md b/02_integrales.md
index 560a76ab0966b3d56f175b579f3b4f9c120b9ef3..53db1402f0096f824086cfebbe6a4dcd5d8ffca2 100644
--- a/02_integrales.md
+++ b/02_integrales.md
@@ -532,7 +532,7 @@ Indication: utiliser la substitution $\tau=x-t$.
 
 ---
 
-Afin de pouvoir interpÃªter un peu
+Afin de pouvoir interprÃ©ter un peu
 ce que cela veut dire, il est intÃ©ressant de faire un calcul
 "simple" pour se faire une idÃ©e.
 
diff --git a/03_optimisation.md b/03_optimisation.md
index f19a34c9b473a6b94b1917d44ac815fe34a20783..585deeb1e40c265c9a1ced8e33252e89d7d1bd3c 100644
--- a/03_optimisation.md
+++ b/03_optimisation.md
@@ -9,7 +9,7 @@ $i=1,...,N$ (voir @fig:reg).
 <https://bit.ly/2SfiLzb>](figs/Linear_regression.svg){#fig:reg width=70%}
 
 Pour dÃ©terminer l'Ã©quation de cette droite, nous devons donc trouver les coefficients $a$ et $b$ tels que la droite
-passe au plus proche des points. Nous devons d'abord dÃ©finir ce que signifie mathÃ©matiquement "passe au mieux par au travaers du nuage de points".
+passe au plus proche des points. Nous devons d'abord dÃ©finir ce que signifie mathÃ©matiquement "passe au mieux par au travers du nuage de points".
 Une faÃ§on de mesurer la "qualitÃ©" d'une droite est de mesurer la somme des distances au carrÃ© entre les points $(x_i,y_i)$ et
 la droite $y(x)=a\cdot x + b$ pour des valeurs de $a$ et $b$ donnÃ©es, soit
 $$
@@ -71,25 +71,25 @@ Ce genre de problÃ¨me, bien que possÃ©dant un espace de recherche infini,
 est bien souvent plus simple Ã  rÃ©soudre que les problÃ¨mes d'optimisation discrets, car il possÃ¨de un cadre thÃ©orique mieux dÃ©fini.
 
 Pour le rÃ©soudre, nous avons commencÃ© par construire un modÃ¨le mathÃ©matique.
-Nous avons dÃ©fini une fonction Ã  minimiser, $E(a)$, et ajoutÃ© une contraite, la forme de $y(x)$. Puis, il a suffi de trouver le minimum de $E(a)$
+Nous avons dÃ©fini une fonction Ã  minimiser, $E(a)$, et ajoutÃ© une contrainte, la forme de $y(x)$. Puis, il a suffi de trouver le minimum de $E(a)$
 sous la contrainte et le tour Ã©tait jouÃ©.
 
 ## L'optimisation mathÃ©matique
 
 Suite Ã  ces deux exemples, nous allons essayer de dÃ©finir de faÃ§on assez thÃ©orique comment formuler mathÃ©matiquement un problÃ¨me d'optimisation.
-Il existe deux types disctincts de problÃ¨mes d'optimisation:
+Il existe deux types distincts de problÃ¨mes d'optimisation:
 
 1. L'optimisation continue.
 2. L'optimisation discrÃ¨te (souvent appelÃ©e optimisation combinatoire).
 
-Dans ce chapitre nous ne parlerons que del'optimisation continue.
+Dans ce chapitre nous ne parlerons que de l'optimisation continue.
 
 ### L'optimisation continue
 
 L'optimisation continue ou *programme mathÃ©matique continu* est un programme d'optimisation soumis Ã  certaines contraintes.
 On peut l'exprimer de la faÃ§on suivante.
 
-Soit $f:\real^n\rightarrow\real$ une fonction objectif (ou fontion de coÃ»t), on cherche $\vec x_0\in\real^n$, tel que $f(\vec x_0)\leq f(\vec x)$ pour $\vec x$ certaines conditions: **les contraintes**. Celles-ci sont en gÃ©nÃ©ral des Ã©galitÃ©s strictes ou des inÃ©galitÃ©s qui peuvent s'exprimer de la faÃ§on suivante.
+Soit $f:\real^n\rightarrow\real$ une fonction objectif (ou fonction de coÃ»t), on cherche $\vec x_0\in\real^n$, tel que $f(\vec x_0)\leq f(\vec x)$ pour $\vec x$ certaines conditions: **les contraintes**. Celles-ci sont en gÃ©nÃ©ral des Ã©galitÃ©s strictes ou des inÃ©galitÃ©s qui peuvent s'exprimer de la faÃ§on suivante.
 Soient $m$ fonctions $g_i:\real^n\rightarrow\real$
 \begin{align}
 &g_i(\vec x)\leq 0,\quad i=1,...,m.
@@ -119,7 +119,7 @@ optimiser les poids des rÃ©seaux de neurones.
 ## Optimisation continue
 
 Dans cette section, nous allons considÃ©rer des problÃ¨mes purement continus.
-Nous allons dans un premier temps considÃ©rer une fonction opbjectif, $f$,
+Nous allons dans un premier temps considÃ©rer une fonction objectif, $f$,
 $$
 f:D\rightarrow\real,\quad D\subseteq \real,
 $$
@@ -144,8 +144,8 @@ $$
 Les cas oÃ¹ $f''(x)=0$ est un point d'inflexion et $f''(x)<0$ est un maximum.
 
 Un autre problÃ¨me beaucoup plus compliquÃ© Ã  rÃ©soudre est de dÃ©terminer un minimum **global**.
-En effet, comme pour la fonction de Ackley (voir la @fig:ackley), une fonction peut possÃ©der un grand nombre de minimam **locaux** (oÃ¹
-$f'(x)=0$ et $f''(x)>0$) mais qui n'est pas un mimumum global.
+En effet, comme pour la fonction de Ackley (voir la @fig:ackley), une fonction peut possÃ©der un grand nombre de minima **locaux** (oÃ¹
+$f'(x)=0$ et $f''(x)>0$) mais qui n'est pas un minimum global.
 
 MathÃ©matiquement un *minimum local* se dÃ©finit comme $x^\ast$ tel qu'il existe $\delta>0$ et que $f(x^\ast)\leq f(x)$, pour
 $x\in[x^\ast-\delta,x^\ast+delta]$. Un *minimum global* est un $x^\ast$ tel que $\forall x\in D$, $f(x^\ast)\leq f(x)$.
@@ -166,7 +166,7 @@ analytiquement les zÃ©ros. En revanche, pour des fonctions plus complexes, ou "i
 l'Ã©quation $g(x)=0$ sous la forme $x=...$) la dÃ©termination des zÃ©ros est beaucoup plus difficile et nÃ©cessite l'utilisation
 de **mÃ©thodes itÃ©ratives**. Nous allons en voir quelques unes.
 
-## MÃ©thodes par raffienement d'intervalles
+## MÃ©thodes par raffinement d'intervalles
 
 ### MÃ©thode de la bissection
 
@@ -175,7 +175,7 @@ de **mÃ©thodes itÃ©ratives**. Nous allons en voir quelques unes.
 
 Afin de dÃ©terminer le zÃ©ro d'une fonction, une des mÃ©thodes les plus simple est la mÃ©thode de la bissection.
 Il s'agit de choisir deux points, $a_1$ et $b_1$, $b_1>a_1$, tels que le signe de $g(a_1)$ et $g(b_1)$ est diffÃ©rent.
-Si cela est le cas, nous aommes assurÃ©s de l'existence d'au moins un zÃ©ro si la fonction $g(x)$ est continue
+Si cela est le cas, nous sommes assurÃ©s de l'existence d'au moins un zÃ©ro si la fonction $g(x)$ est continue
 (en vertu du thÃ©orÃ¨me de la valeur intermÃ©diaire). Ensuite, nous allons calculer la valeur se situant "au milieu"
 entre $a_1$ et $b_1$
 $$
@@ -183,7 +183,7 @@ c_1=\frac{b_1+a_1}{2}.
 $$
 Puis, nous Ã©valuons $g(c_1)$ et si ce n'est pas un zÃ©ro, Ã©tudions son signe. Si le signe $g(c_1)$ est diffÃ©rent de celui de $g(a_1)$, nous remplaÃ§ons
 $b_1$ par $c_1$ et recommenÃ§ons. Si le signe de $g(c_1)$ est diffÃ©rent de celui de $g(b_1)$, nous remplaÃ§ons $a_1$ par $c_1$.
-Nous itÃ©rons cette mÃ©thode jusqu'Ã  ce que nous ayons atteint une valeur "siffisamment proche" (nous vons une prÃ©cision acceptable pour nous)
+Nous itÃ©rons cette mÃ©thode jusqu'Ã  ce que nous ayons atteint une valeur "suffisamment proche" (nous avons une prÃ©cision acceptable pour nous)
 de zÃ©ro. Une faÃ§on d'exprimer "proche" est de considÃ©rer la taille de l'intervalle $b_1-a_1$ et de le comparer avec une prÃ©cision $\varepsilon>0$ que nous
 aurons choisie
 $$
@@ -196,7 +196,7 @@ distance maximale du zÃ©ro de $(b_1+a_1)/2^n$. On dit que cette mÃ©thode est d'o
 
 ---
 
-#### Exercice (Racice de polynÃ´me) {-}
+#### Exercice (Racine de polynÃ´me) {-}
 
 DÃ©terminer la racine du polynÃ´me $x^4+x^3+x^2-1$ avec $a_1=0.5$ et $b_1=1$ (faire au maximum 6 itÃ©rations).
 
@@ -271,7 +271,7 @@ $$
 
 ---
 
-### Recherche de la fourchette intiale
+### Recherche de la fourchette initiale
 
 Dans les mÃ©thodes ci-dessus, nous avons supposÃ© que nous avions une fonction $g(x)$ continue, ainsi qu'un intervalle, $[a,b]$,
 avec
@@ -304,7 +304,7 @@ Si $f(b)>0$, on a terminÃ©. Sinon on recommence avec $k\rightarrow 2\cdot k$ et
 ## MÃ©thodes de descentes locales
 
 L'idÃ©e de ce type de mÃ©thodes est, contrairement aux mÃ©thodes de la section prÃ©cÃ©dente, d'utiliser des
-connaissances *locales* que nous pouvons avoir sur la fonction. Cette connsaissance loale
+connaissances *locales* que nous pouvons avoir sur la fonction. Cette connaissance locale
 a en gÃ©nÃ©ral comme effet une *convergence* plus rapide de l'algorithme de recherche de zÃ©ros.
 
 ### MÃ©thode de Newton (ou *Newton-Raphson*)
@@ -338,7 +338,7 @@ $$
 |g(x_n)| < \varepsilon,\quad |x_n-x_{n-1}| < \varepsilon.
 $$
 
-Lorsque qu'elle converge la mtÃ©hode de Newton est la plus efficace de toutes celles que nous avons vues. On dit qu'elle est d'ordre $2$.
+Lorsque qu'elle converge la mÃ©thode de Newton est la plus efficace de toutes celles que nous avons vues. On dit qu'elle est d'ordre $2$.
 En revanche les contraintes pour sa convergence sont plus strictes que pour les mÃ©thodes vues prÃ©cÃ©demment.
 
 ---
@@ -377,7 +377,7 @@ Il suffit de remplacer $g(x)$ par $f'(x)$ et le tour est jouÃ©.
 
 #### Exercice {-}
 
-Ã‰crire l'algorithme de Newton pour le cas de la minimisation d'une fonction $f(x)$ quelconque, mais continuement dÃ©rivable 2 fois.
+Ã‰crire l'algorithme de Newton pour le cas de la minimisation d'une fonction $f(x)$ quelconque, mais continÃ»ment dÃ©rivable 2 fois.
 
 ---
 
@@ -417,7 +417,7 @@ f'(a)=\frac{\dd f}{\dd x}(a)=\lim_{\dd x\rightarrow 0}\frac{f(a+\dd x)-f(a)}{\dd
 \end{equation}
 La notation ici n'est pas tout Ã  fait usuelle. L'idÃ©e est de se rappeler que ce $\dd x$ est une toute petite variation 
 de $x$, et $\dd f$, une toute petite variation de $f$ en $a$. On voit immÃ©diatement que cette quantitÃ© est la pente
-de $f$ en $a$. Lorsque nous Ã©tudions une fonction Ã  plusieurs variables, nous pouvons faire le mÃªme raisonnement pour chaque variable indÃ©pendemment.
+de $f$ en $a$. Lorsque nous Ã©tudions une fonction Ã  plusieurs variables, nous pouvons faire le mÃªme raisonnement pour chaque variable indÃ©pendamment.
 Ainsi, nous calculons sa dÃ©rivÃ©e dans chacune des directions $x$, $y$, ... 
 
 Cette vision de la dÃ©rivÃ©e comme une variation de $f$, $\dd f$, divisÃ©e par une petite variation de $x$, $\dd x$, permet
@@ -556,7 +556,7 @@ $$
 \vec \nabla f=\left(2x, -2y\right)^\mathrm{T}.
 $$
 
-Graphiquement, ceci est un *champds de vecteur* est peut se reprÃ©senter comme
+Graphiquement, ceci est un *champs de vecteur* est peut se reprÃ©senter comme
 
 ![Le champs de vecteur $\vec \nabla f(x,y)=(2x,-2y)^\mathrm{T}$.](figs/gradient_vec.svg){width="50%"}