diff --git a/01_rappel.md b/01_rappel.md
index 25c80b6315c0e1a21af3a96b22ef0ce5c29cfe3e..daa08a5b46d1c46ea904b9a8b92879719da09970 100644
--- a/01_rappel.md
+++ b/01_rappel.md
@@ -10,7 +10,7 @@ Nous pouvons aussi exprimer cette notion de la manière suivante. Considérons d
 
 ---
 
-Exemple (Fonctions, généralités) +.#
+#### Exemple (Fonctions, généralités) {-}
 
 1. La tension $U$ est une fonction de la résistance $R$ et du courant
     $I$ $$\begin{aligned}
@@ -33,7 +33,7 @@ $$y=g(f(x)).$$
 
 ---
 
-Exemple (Fonctions) +.#
+#### Exemple (Fonctions) {-}
 
 1. Soit $f(x)=2\cdot x$ et $g(x)=\sqrt{x}$, alors la composition des
     deux fonctions $$(f\circ g)(x)=f(g(x))=f(\sqrt{x})=2\sqrt{x}.$$
@@ -50,7 +50,7 @@ la variable de départ $$f(f^{-1}(x))=x.$$
 
 ---
 
-Exemple (Fonction inverse) +.#
+#### Exemple (Fonction inverse) {-}
 
 1. Soient $f(x)=2\cdot x$ et $f^{-1}(x)=x/2$, alors la composition des
     deux fonctions $$f(f^{-1}(x))=f(x/2)=2x/2=x.$$
@@ -68,14 +68,14 @@ Exemple (Fonction inverse) +.#
 ## Domaine de définition
 
 
-Définition (Domaine de définition) +.#
+#### Définition (Domaine de définition) {-}
 
 Le domaine de définition, noté $D\subset{\real}$, d’une fonction
 $f$, est l’ensemble de valeurs où $f$ admet une image.
 
 ---
 
-Exemple (Domaine de définition) +.#
+#### Exemple (Domaine de définition) {-}
 
 1. Le domaine de définition de $f(x)=x$ est $D={\real}$.
 
@@ -92,7 +92,7 @@ Soit $f$ une fonction et $D\subseteq{\real}$ non-vide  et soient $a$ et $b$ deux
 
 ### Limite
 
-Définition (Limite) +.#
+#### Définition (Limite) {-}
 
 Pour $f$ définie en $D$,  on dit que $b$ est la
 limite de $x$ en $a$ si si au fur et à mesure que $x$ se rapproche de $a$, $f(x)$ se rapproche de $b$ et nous notons  $\lim\limits_{x\rightarrow a}f(x)=b$.
@@ -107,20 +107,20 @@ Ou encore quand le but est d'écrire ça de la façon la plus compacte possible
 
 $$\forall\varepsilon>0,\exists\delta>0\ |\ \forall x\in D,\ |x-a|<\delta\Rightarrow|f(x)-b|<\varepsilon.$$
 
-Remarque +.#
+#### Remarque {-}
 
 Il n'est pas nécessaire que $a\in D$. Mais si c'est le cas et donc
 $f$ est définie en $a$ alors on a $\lim\limits_{x\rightarrow a}=f(a)$.
 
 ---
 
-Exemple (Limite) +.#
+#### Exemple (Limite) {-}
 
 Si $f(x)=x$, alors $\lim\limits_{x\rightarrow 0}f(x)=0$.
 
 ---
 
-Définition (Limite, asymptote) +.#
+#### Définition (Limite, asymptote) {-}
 
 Pour $f$ définie en $D$,
 on dit que la limite de $f(x)$ en $a$ est égale à l’infini si pour tout $c>0$ l’intervalle
@@ -129,7 +129,7 @@ $a$. On dit aussi que $f$ tend vers l'infini.
 
 ---
 
-Exemple (Limite, asymptote) +.#
+#### Exemple (Limite, asymptote) {-}
 
 Si $f(x)=1/x^2$, alors $\lim\limits_{x\rightarrow 0}f(x)=\infty$.
 
@@ -150,7 +150,7 @@ fonction $f$ en $a$.
 Si la fonction $f$ admet une limite en $a$, alors les deux limites
 sont égales.
 
-Exemple (Limite à gauche/droite) +.#
+#### Exemple (Limite à gauche/droite) {-}
 
 Si $f(x)=1/x$, alors $\lim\limits_{x\rightarrow 0^+} f(x)=\infty$ et
 $\lim\limits_{x\rightarrow 0^-} f(x)=-\infty$.
@@ -202,13 +202,13 @@ $$\lim_{n\rightarrow\infty}\frac{n}{\log(n)}=\frac{A}{\log(10)}\cdot\lim_{p\righ
 
 ## Continuité
 
-Définition (Continuité) +.#
+#### Définition (Continuité) {-}
 
 Soit $f$ une fonction définie sur un intervalle ouvert $D$ contenant
 $a$. On dit que $f$ est continue en $a$ si et seulement si
 $\lim\limits_{x\rightarrow a}f(x)=f(a)$.
 
-Propriétés (Fonctions continues) +.#
+#### Propriétés (Fonctions continues) {-}
 
 Soient $f$ et $g$ deux fonctions continues en $a$ et $b$ un réel:
 
@@ -220,14 +220,14 @@ Soient $f$ et $g$ deux fonctions continues en $a$ et $b$ un réel:
 
 4. $h=g\circ f$ est continue en $a$.
 
-Définition (Continuité sur un intervalle) +.#
+#### Définition (Continuité sur un intervalle) {-}
 
 Une fonction $f$ est dite continue dans un intervalle $D=]a;b[$ si et
 seulement si elle est continue en tout point de $D$. De plus, elle est
 continue sur $D=[a,b]$ si elle est continue sur $]a;b[$ et continue à
 droite en $a$ et à gauche en $b$.
 
-Théorème (Valeurs intermédiaires) +.#
+#### Théorème (Valeurs intermédiaires) {-}
 
 Soit $f$ une fonction continue
 sur $D$, et $a,b$ deux points contenus dans $D$ tels que $a<b$ et
@@ -236,7 +236,7 @@ Nous pouvons bien sûr énoncer un résultat similaire dans le cas $f(a9>f(b)$.
 
 ## Dérivées
 
-Définition (Dérivée en un point) +.#
+#### Définition (Dérivée en un point) {-}
 
 Soit $f$ une fonction définie sur $D$ et $a\in D$. On dit que $f$ est
 dérivable en $a$ s’il existe un $b$ (appelé la dérivée de $f$ en $a$)
@@ -244,17 +244,17 @@ tel que $$\begin{aligned}
 &\lim\limits_{h\rightarrow 0}\frac{f(a+h)-f(a)}{h}=b,\hbox{ ou}\\
 &\lim\limits_{x\rightarrow a}\frac{f(x)-f(a)}{x-a}=b.\end{aligned}$$
 
-Définition (Dérivée sur un intervalle) +.#
+#### Définition (Dérivée sur un intervalle) {-}
 
 Si $f$ est dérivable en tout point de $D=]a;b[$, alors on définit $f'$
 la fonction dérivée de $f$ dans l’intervalle $D$ qui associe en tout
 point $x$ de $D$ la valeur dérivée de $f$.
 
-Propriété +.#
+#### Propriété {-}
 
 Si $f$ est dérivable en $a$ alors $f$ est continue en $a$.
 
-Propriétés +.#
+#### Propriétés {-}
 
 Soient $f$ et $g$ deux fonctions dérivables sur $D$ (dont les dérivées sont $f'$
 et $g'$), et $a\in{\real}$, alors
@@ -285,14 +285,14 @@ $C\in {\real}$, nous avons
 
 6. $f(x)=\cos(x)$, $f'(x)=-\sin(x$).
 
-Définition (Dérivée seconde) +.#
+#### Définition (Dérivée seconde) {-}
 
 Si $f'$ est dérivable sur $D$, alors sa dérivée, notée $f''$, est
 appelée la dérivée seconde de $f$.
 
 ### Variation des fonctions
 
-Propriétés (Croissance/décroissance) +.#
+#### Propriétés (Croissance/décroissance) {-}
 
 Soit $f'$ la fonction dérivée de $f$ sur $D$
 
@@ -302,13 +302,13 @@ Soit $f'$ la fonction dérivée de $f$ sur $D$
 
 3. Si $f'=0$ sur $D$, alors $f$ est constante sur $D$.
 
-Définition (Maximum/minimum local) +.#
+#### Définition (Maximum/minimum local) {-}
 
 Une fonction admet un maximum local (respectivement minimum local) sur
 un intervalle $D=]a;b[$ s’il existe un $x_0\in D$ tel que $f(x_0)\geq f(x)$
 (respectivement $f(x_0)\leq f(x)$) pour tout $x\in D$.
 
-Propriété (Maximum/minimum) +.#
+#### Propriété (Maximum/minimum) {-}
 
 Soient $f$ une fonction dérivable sur $D=]a;b[$ et $x_0\in D$. On dit que $f$
 admet un extremum en $x_0$ si $f'(x_0)=0$. De plus si
diff --git a/02_integrales.md b/02_integrales.md
index 02d9dedfb23496bb69b6c5e456502571c5ab1777..560a76ab0966b3d56f175b579f3b4f9c120b9ef3 100644
--- a/02_integrales.md
+++ b/02_integrales.md
@@ -38,14 +38,14 @@ L’aire de sous la fonction $f(x)$ est donnée par la limite pour
 $n\rightarrow\infty$ de $A^i$ ou $A^s$ (si elle existe). Dans ce cas $n\rightarrow\infty$ $A^R$ (pris en sandwich entre $A^i$ et $A^n$)
 nous donne aussi l'aire sous la fonction.
 
-Remarque +.#
+#### Remarque {-}
 
 1. Ces sommes peuvent être positives ou négatives en fonction du signe
     de $f$.
 
 2. Une implémentation informatique est immédiate, en particulier pour la somme de Riemann.
 
-Définition (Intégrabilité au sens de Riemann) +.#
+#### Définition (Intégrabilité au sens de Riemann) {-}
 
 Une fonction est dite intégrable au sens de Riemann si
 $$\lim\limits_{n\rightarrow\infty}A^i(n)=\lim\limits_{n\rightarrow\infty}A^s(n)=\int_a^b f(x){\mathrm{d}}x.$$
@@ -60,7 +60,7 @@ d’intégration.
 
 ---
 
-Exemple (Intégration de Riemann) +.#
+#### Exemple (Intégration de Riemann) {-}
 
 Intégrer de $f(x)=x$ dans intervalle $[0,1]$.
 
@@ -68,7 +68,7 @@ Intégrer de $f(x)=x$ dans intervalle $[0,1]$.
 
 ---
 
-Solution (Intégration de Riemann) +.#
+#### Solution (Intégration de Riemann) {-}
 
 Il est élémentaire de calculer que cette aire vaut $1/2$ (c’est l’aire d’un
 triangle rectangle de côté 1). Néanmoins, évaluons également cette aire
@@ -89,7 +89,7 @@ $\sup\limits_{[x_i,x_{i+1}]}f(x)=f(x_{i+1})$. On a donc que
 
 ---
 
-Exemple (Intégration de Riemann de $x^2$) +.#
+#### Exemple (Intégration de Riemann de $x^2$) {-}
 
 Calculer l’aire sous la courbe de $f(x)=x^2$ dans intervalle $[0,1]$.
 
@@ -125,7 +125,7 @@ Si maintenant nous essayons de généraliser le calcul de l’intégrale
 d’une fonction, il s’avère que le calcul d’une intégrale est l’inverse
 du calcul d’une dérivée.
 
-Définition (Primitive) +.#
+#### Définition (Primitive) {-}
 
 Soit $f$ une fonction. On dit que $F$ est une primitive de $f$ sur
 l’intervalle $D\subseteq{\real}$ si $F'(x)=f(x)$ $\forall x\in D$.
@@ -136,14 +136,14 @@ primitive de $f$. On voit que la primitive de $f$ est définie à une
 constante additive près. En effet, si $F'=f$ on a
 $$G'=F'+\underbrace{C'}_{=0}=F'=f.$$
 
-Théorème (Unicité) +.#
+#### Théorème (Unicité) {-}
 
 Pour $a\in D$ et $b\in{\real}$  il existe une unique
 primitive $F$ telle que $F(a)=b$.
 
 ---
 
-Illustration (Unicité) +.#
+#### Illustration (Unicité) {-}
 
 Soit $f(x)=x$, alors l’ensemble de primitives correspondantes est
 $G=x^2/2+C$. Si nous cherchons la primitive telle que $G(0)=0$, il vient
@@ -153,7 +153,7 @@ que $C=0$ et donc la primitive est unique et vaut $F(x)=x^2/2$.
 
 ---
 
-Exercices (Primitives) +.#
+#### Exercices (Primitives) {-}
 
 Calculez les primitives suivantes (*indication: il s’agit de trouver les
 fonctions $F(x)$ telles que $F'(x)=f(x)$*):
@@ -186,7 +186,7 @@ pouvons récapituler des formules qui seront importantes pour la suite:
 
 5. $\int \cos(x){\mathrm{d}}x=\sin(x)+C$.
 
-Théorème (Théorème fondamental du calcul intégral) +.#
+#### Théorème (Théorème fondamental du calcul intégral) {-}
 
 En définissant à présent l’intégrale à l’aide de la notion
 de primitive, nous avons que pour $a,b\in{\real}$ et $a<b$
@@ -199,7 +199,7 @@ symbole $x$ par n’importe quelle autre lettre (sauf $a,b,f,F$).
 
 ---
 
-Remarque +.#
+#### Remarque {-}
 
 On notera que la constante additive $C$ a disparu de cette formule. En
 effet, remplaçons $F$ par $G=F+C$, il vient
@@ -215,7 +215,7 @@ Nous pouvons à présent définir la fonction $G(x)$ telle que
 $$G(x)=\int_a^xf(y){\mathrm{d}}y=F(x)-F(a).$$ Il suit  que $G(x)$
 est la primitive de $f$ telle que $G(a)=0$.
 
-Propriétés +.#
+#### Propriétés {-}
 
 Soient $f$ et $g$ deux fonctions intégrables sur un intervalle
 $D=[a,b]\subseteq{\real}$, $c\in[a,b]$, et $\alpha\in{\real}$.
@@ -254,12 +254,12 @@ cas de figures suivants $$\begin{aligned}
 
 ---
 
-Exemple (Intégrale impropre) +.#
+#### Exemple (Intégrale impropre) {-}
 
 Calculer l’intégrale suivante
 $$\int_0^\infty e^{-ax}{\mathrm{d}}x,\quad a>0.$$
 
-Solution (Intégrale impropre) +.#
+#### Solution (Intégrale impropre) {-}
 
 Nous pouvons réécrire
 l’intégrale ci-dessus comme
@@ -269,7 +269,7 @@ $$\int_0^\infty e^{-ax}{\mathrm{d}}x=\lim\limits_{b\rightarrow \infty}\int_0^b e
 
 ---
 
-Exercice +.#
+#### Exercice {-}
 
 Calculer l’intégrale suivante
 $$\int_1^\infty \frac{1}{x^2}{\mathrm{d}}x.$$
@@ -280,11 +280,11 @@ Lorsque nous avons une discontinuité dans la fonction $f$ au point
 $c\in[a,b]$ nous avons
 $$\int_a^b f(x){\mathrm{d}}x = \lim\limits_{\varepsilon\rightarrow 0}\int_a^{c-\varepsilon} f(x){\mathrm{d}}x +\int_{c+\varepsilon}^b f(x){\mathrm{d}}x.$$
 
-Exercice +.#
+#### Exercice {-}
 
 Montrer que $$\int_{-1}^2\frac{1}{x}=\ln{2}.$$
 
-Définition (Valeur moyenne) +.#
+#### Définition (Valeur moyenne) {-}
 
 Soit une fonction $f$ admettant une primitive sur $[a,b]$ avec $a<b$,
 alors la valeur moyenne $\bar{f}$ de cette fonction sur $[a,b]$, est définie par
@@ -312,7 +312,7 @@ $(\{a_i\}_{i=0}^{n}\in{\real}$ $$\begin{aligned}
 
 ---
 
-Exercice +.#
+#### Exercice {-}
 
 Intégrer la fonction suivante
 $$\int (x+2)(x^3+3x^2+4x-3){\mathrm{d}}x.$$
@@ -334,14 +334,14 @@ $$\int \frac{f'(x)}{f(x)}{\mathrm{d}}x=\ln(f(x))+c.$$
 
 ---
 
-Exemple +.#
+#### Exemple {-}
 
 Calculer la primitive suivante
 $$
 \int \frac{1}{x}{\mathrm{d}}x.
 $$
 
-Solution +.#
+#### Solution {-}
 
 Le calcul de la primitive de suivante
 $$\int \frac{1}{x}{\mathrm{d}}x=\int \frac{(x)'}{x}{\mathrm{d}}x=\ln(x)+c.$$
@@ -354,7 +354,7 @@ Une des façons les plus simples de calculer une primitive est
 de reconnaître la règle de chaîne dans le terme à intégrer
 $$\int g'(f(x))f'(x){\mathrm{d}}x=\int [g(f(x))]' {\mathrm{d}}x=g(f(x))+c.$$
 
-Illustration +.#
+#### Illustration {-}
 
 Si $g$ est définie comme $g(x)=x^{-1}$ et $f(x)=3x^2+2$, alors la
 primitive
@@ -384,7 +384,7 @@ Des “règles” pour utiliser cette technique seraient que
 
 ---
 
-Exemple +.# 
+#### Exemple  {-}
 
 Calculer les primitives suivantes
 
@@ -392,7 +392,7 @@ Calculer les primitives suivantes
 
 2. $\int \cos(x)\sin(x){\mathrm{d}}x$. 
 
-Solution +.#
+#### Solution {-}
 
 1. $\int x e^x{\mathrm{d}}x$. $g(x)=x$, $f'(x)=e^x$ et donc $g'(x)=1$,
     $f(x)=e^x$. Il vient
@@ -415,11 +415,11 @@ parties.
 
 ---
 
-Exemple +.# 
+#### Exemple  {-}
 
 Calculer l’intégrale de $\int x^2 e^x{\mathrm{d}}x$. 
 
-Solution +.# 
+#### Solution  {-}
 
 En posant $g(x)=x^2$,
 $f'(x)=e^x$ et donc $g'(x)=2x$, $f(x)=e^x$. Il vient
@@ -432,7 +432,7 @@ $$\int x^2 e^x{\mathrm{d}}x=x^2e^x-2\left(x e^x -\int e^x{\mathrm{d}}x\right)=x^
 
 ---
 
-Exercice +.#
+#### Exercice {-}
 
 Calculer les primitives suivantes
 
@@ -453,7 +453,7 @@ où $f=F'$. Si nous intégrons cette relation on obtient $$\begin{aligned}
  \int_a^b f(g(y))g'(y){\mathrm{d}}y = \int_a^b [F(g(y))]'{\mathrm{d}}y=\left.F(g(y))\right|_a^b=F(g(b))-F(g(a))=\int_{g(a)}^{g(b)}f(x){\mathrm{d}}x.\end{aligned}$$
 Cette relation nous mène au théorème suivant.
 
-Théorème (Intégration par changement de variables) +.#
+#### Théorème (Intégration par changement de variables) {-}
 
 Soit $f$ une fonction continue presque partout, et $g$ une fonction dont
 la dérivée est continue presque partout sur un intervalle $[a,b]$. Soit
@@ -473,11 +473,11 @@ sur la solution.
 
 ---
 
-Exemple (Changement de variable) +.#
+#### Exemple (Changement de variable) {-}
 
 Intégrer par changement de variables $\int_1^3 6x\ln(x^2){\mathrm{d}}x$.
 
-Solution (Changement de variable) +.#
+#### Solution (Changement de variable) {-}
 
 En définissant $z=x^2$, nous avons ${\mathrm{d}}x={\mathrm{d}}z/(2x)$.
 Les bornes d’intégration deviennent $z(1)=1^2=1$ et $z(3)=3^2=9$. On
@@ -490,7 +490,7 @@ obtient donc $$\begin{aligned}
 
 ---
 
-Exercice +.#
+#### Exercice {-}
 
 Calculer les primitives suivantes par changement de variable
 
@@ -521,7 +521,7 @@ Pour chaque valeur de $x=x_0$, on calcule l'intégrale,
 
 ---
 
-Exercice (Commutativité) +.#
+#### Exercice (Commutativité) {-}
 
 Démontrer que le produit de convolution est commutatif, soit
 \begin{equation}
@@ -538,7 +538,7 @@ ce que cela veut dire, il est intéressant de faire un calcul
 
 ---
 
-Exercice +.#
+#### Exercice {-}
 
 Calculer la convolution du signal $f(t)$
 
@@ -629,7 +629,7 @@ dramatiquement la précision de l’intégration.
 
 ---
 
-Remarque +.#
+#### Remarque {-}
 
 De façon générale il est difficile de connaître à l’avance la valeur
 exacte de $E$. En revanche on est capable de déterminer **l’ordre**
@@ -639,7 +639,7 @@ de l’erreur.
 
 ---
 
-Définition (Ordre d'une méthode) +.#
+#### Définition (Ordre d'une méthode) {-}
 
 On dit qu’une méthode d’intégration est d’ordre $k$, si l’erreur commise
 par la méthode varie proportionnellement à $\delta x^k$. On note qu’une
diff --git a/03_optimisation.md b/03_optimisation.md
index 6aafe7def8c57c125b20d2517cf86a6c3e15e473..9fce76ffb6c6a1137f7a515dd71de0017c3532ce 100644
--- a/03_optimisation.md
+++ b/03_optimisation.md
@@ -45,7 +45,7 @@ a &= \frac{C}{B}=\frac{\sum_{i=1}^Nx_iy_i}{\sum_{i=1}^Nx_i^2}.
 
 ---
 
-Exemple +.#
+#### Exemple {-}
 
 Soient les 4 points $(0, 0.1)$, $(1, 0.3)$, $(2, 0.3)$ et $(3, 0.4)$. La fonction d'erreur $E(a)$ s'écrit
 $$
@@ -196,7 +196,7 @@ distance maximale du zéro de $(b_1+a_1)/2^n$. On dit que cette méthode est d'o
 
 ---
 
-Exercice (Racice de polynôme) +.#
+#### Exercice (Racice de polynôme) {-}
 
 Déterminer la racine du polynôme $x^4+x^3+x^2-1$ avec $a_1=0.5$ et $b_1=1$ (faire au maximum 6 itérations).
 
@@ -232,7 +232,7 @@ La méthode de la fausse position est plus efficace que la méthode de la bissec
 
 ---
 
-Exercice +.#
+#### Exercice {-}
 
 Déterminer le zéro positif de la fonction
 $$
@@ -261,7 +261,7 @@ En revanche elle est plus efficace, lorsque qu'elle converge, que ces deux méth
 
 ---
 
-Exercice +.#
+#### Exercice {-}
 
 Déterminer le zéro positif de la fonction
 $$
@@ -282,7 +282,7 @@ Mais, nous n'avons pas encore vu de méthode pour déterminer les valeur de la f
 
 ---
 
-Remarque +.#
+#### Remarque {-}
 
 On peut procéder de façon très similaire pour $[a,b]$ tel que
 
@@ -343,7 +343,7 @@ En revanche les contraintes pour sa convergence sont plus strictes que pour les
 
 ---
 
-Remarque (non-convergence ou convergence lente) +.#
+#### Remarque (non-convergence ou convergence lente) {-}
 
 Il y a un certain nombre de cas où la méthode de Newton ne converge pas.
 
@@ -357,7 +357,7 @@ Il y a un certain nombre de cas où la méthode de Newton ne converge pas.
 
 ---
 
-Exercice +.#
+#### Exercice {-}
 
 Déterminer le zéro de la fonction
 $$
@@ -375,7 +375,7 @@ Il suffit de remplacer $g(x)$ par $f'(x)$ et le tour est joué.
 
 ---
 
-Exercice +.#
+#### Exercice {-}
 
 Écrire l'algorithme de Newton pour le cas de la minimisation d'une fonction $f(x)$ quelconque, mais continuement dérivable 2 fois.
 
@@ -398,7 +398,7 @@ f:\real^n\rightarrow \real.
 
 ---
 
-Exemple (Régression linéaire) +.#
+#### Exemple (Régression linéaire) {-}
 
 Dans le cas de la régression linéaire, si la droite ne passe pas par l'origine, nous avons que
 la fonction de coût qui dépend de deux variables, $a$, et $b$ (et plus uniquement de $a$)
@@ -445,7 +445,7 @@ Comme on le voit ici, pour chaque dérivée partielle, on ne fait varier qu'une
 
 ---
 
-Exemple (Dérivée partielle) +.#
+#### Exemple (Dérivée partielle) {-}
 
 Les dérivée partielles de la fonction
 $$
@@ -468,7 +468,7 @@ $$
 
 ---
 
-Remarque +.#
+#### Remarque {-}
 
 Pour une fonction à une seule variable, $f(x)$, on a que
 $$
@@ -488,7 +488,7 @@ pour les façon à une seule variable. Pour une fonction à deux variables, on a
 
 ---
 
-Remarque +.#
+#### Remarque {-}
 
 Si $f$ est dérivable en $x$ et $y$, on a que 
 $$
@@ -499,7 +499,7 @@ $$
 
 ---
 
-Exemple (Dérivées partielles deuxièmes) +.#
+#### Exemple (Dérivées partielles deuxièmes) {-}
 
 Pour la fonction $f(x,y)=x^2-y^2$, on a
 \begin{align}
@@ -549,7 +549,7 @@ $$
 
 ---
 
-Exemple (Gradient d'une fonction à deux variables) +.#
+#### Exemple (Gradient d'une fonction à deux variables) {-}
 
 Pour la fonction $f(x,y)=x^2-y^2$, le gradient est donné par
 $$
@@ -610,7 +610,7 @@ Le taux de variation maximal est donc la longueur du vecteur $\vec \nabla f$.
 
 ---
 
-Remarque (Généralisation) +.#
+#### Remarque (Généralisation) {-}
 
 Tout ce que nous venons d'écrire ici se généralise à un nombre arbitraire de dimensions.
 
@@ -711,10 +711,43 @@ Même si cela ne suffit pas à prouver mathématique que $\vec 0$ est le minimum
 
 ---
 
-Question +.#
+#### Question {-}
 
 Avec ce qui précède, voyez-vous une façon de trouver le minimum de la fonction $f(x,y)$?
 
 ---
 
-Une méthode pour trouver le minimum de $f(x,y)$ est la méthode de la *descente de gradient*.
+<!-- Une méthode pour trouver le minimum de $f(x,y)$ est la méthode de la *descente de gradient*. Cette méthode
+correspond intuitivement à la méthode que suivrait un skieur pour arriver le plus vite possible en bas d'une montagne. Pour ce faire, il suivrait toujours la pente
+la plus raide possible.
+
+La méthode de la descente de gradient est une méthode
+itérative. Soient donnés un point de départ $\vec x_0$,
+et une fonction objectif $f(\vec x)$, on va approximer
+le zéro itérativement avec une suite $\vec x_1$, $\vec x_2$, ... telle que
+\begin{align}
+\vec x_1&=x_0-\lambda\cdot f(\vec x_0),\\
+\vec x_2&=x_1-\lambda\cdot f(\vec x_1),\\
+\cdots
+\vec x_{n+1}&=x_n-\lambda\cdot f(\vec x_n),
+\end{align}
+où $\lambda\in \real^+$ est un coefficient positif.
+On peut assez facilement se convaincre que si $\lambda$ est suffisamment petit, alors $f(\vec x_{n+1})\leq f(\vec x_n)$ (on ne fait que descendre la pente jusqu'à atteindre un minimum). Une illustration de ce processus
+peut se voir dans la @fig:gradient.
+
+![Suite d'étapes pour la descente de gradient. En bleu on voit les courbes de niveaux (les courbes où $f(\vec x)$ est constante). Source: Wikipedia
+<https://bit.ly/2Fhvn7p>](https://upload.wikimedia.org/wikipedia/commons/f/ff/Gradient_descent.svg){#fig:gradient width=70%}
+
+Comme pour les fonction à une seule variable, il est nécessaire de spécifier une condition d'arrêt pour
+la descente de gradient. En général, on choisit une tolérance, $\varepsilon>0$, et la condition d'arrêt s'écrit
+$$
+\mbox{Si }||\vec x_{n+1}-\vec x_n|| < \varepsilon, 
+$$
+alors $\vec x_{n+1}$ est le zéro de $f(\vec x)$.
+
+Dépendant de la valeur de $\lambda$ la *convergence* de la méthode peut varier grandement. Si $\lambda$ est trop petit
+il faut une énorme quantité d'itérations pour atteindre le minimum. A l'inverse, en choisissant un $\lambda$ trop grand,
+nous ne somme pas sûrs que nous convergerons un jour. En effet, on pourrait s'éloigner de plus en plus
+du minimum plutôt que de sen approcher. En général, on choisit $\lambda\in[0,1)$ mais il n'y a pas de méthode générale pour en choisir une valeur "optimale".
+Cela signifie que pour une fonction quelconque, $\lambda$ est choisi de façon empirique. -->
+
diff --git a/04_edo.md b/04_edo.md
index 1c4ce9b5a8168a95513cd698bda0433815b240e8..99faf32e2d2fa9e27c937746ffc32da266385947 100644
--- a/04_edo.md
+++ b/04_edo.md
@@ -37,7 +37,7 @@ $$x(t_0)=x_0=v\cdot t_0+B \Leftrightarrow B=x_0-v\cdot t_0.$$
 Finalement, la solution du problème différentiel est donnée par
 $$x(t)=v\cdot (t-t_0)+x_0.$$
 
-Remarque +.#
+#### Remarque {-}
 
 La solution de l’équation différentielle $$x'(t)=v,\ x(t_0)=x_0,$$
 revient à calculer $$\begin{aligned}
@@ -77,7 +77,7 @@ $$x(t_0)=x_0=\frac{a}{2}\cdot t_0^2+D \Leftrightarrow D=x_0-\frac{a}{2}\cdot t_0
 Finalement la solution est donnée par
 $$x(t)=\frac{a}{2}\cdot (t^2-t_0^2)+v_0\cdot (t-t_0)+x_0.$$
 
-Remarque +.#
+#### Remarque {-}
 
 La solution du problème différentiel peut également se calculer de
 la façon suivante $$x''(t)=a,\ x(t_0)=x_0,\ v(t_0)=v_0.$$ revient à
@@ -255,7 +255,7 @@ ans.](figs/interets.svg){#fig:interets width="50.00000%"}
 Définitions et théorèmes principaux
 -----------------------------------
 
-Définition (Équation différentielle ordinaire) +.#
+#### Définition (Équation différentielle ordinaire) {-}
 
 Soit $y$ une fonction dérivable $n$ fois et dépendant d’une seule
 variable. Une **équation différentielle ordinaire** est un équation de
@@ -265,7 +265,7 @@ $n$-ème de $y$.
 
 ---
 
-Illustation +.#
+#### Illustation {-}
 
 L’équation suivante est une équation différentielle ordinaire
 $$y''+4y'+8y+3x^2+9=0.$$
@@ -279,18 +279,18 @@ différentielle.
 Afin de classifier les équation différentielles, considérons les
 définitions suivantes
 
-Définition (Ordre) +.# 
+#### Définition (Ordre)  {-}
 
 L’ordre d’une équation différentielle est l’ordre le plus haut des
 dérivées de $y$ qui y apparaissent. L’ordre de l’équation différentielle
 $F(x,y,y',y'',...,y^{(n)})=0$ est de $n$, si $n\neq 0$.
 
-Illustration +.#
+#### Illustration {-}
 
 L’équation différentielle suivante est d’ordre $3$
 $$4y'''+x\cdot y'+4y+6x=0.$$
 
-Définition (Condition initiale) +.#
+#### Définition (Condition initiale) {-}
 
 Une condition initiale pour une équation différentielle d’ordre $n$, est
 un ensemble de valeurs, $y_0$, $y_1$, ..., $y_{n-1}$ donnée telles que
@@ -305,7 +305,7 @@ version approximative et la discuter
 
 ---
 
-Théorème (Existence et unicité) +.#
+#### Théorème (Existence et unicité) {-}
 
 Soit $D\subseteq{\real}$ le domaine de définition de la fonction
 $y$. Soit $y:D\rightarrow E\subseteq {\real}$ une fonction à valeur
@@ -343,7 +343,7 @@ peu les équations différentielles en fonction des propriétés de $F$.
 
 ---
 
-Définition (Linéarité) +.#
+#### Définition (Linéarité) {-}
 
 Une équation différentielle ordinaire d’ordre $n$ est dite linéaire si
 on peut l’écrire sous la forme
@@ -360,19 +360,19 @@ L’équation ci-dessus a les propriétés suivantes
 
 2. Les $y$ et toutes leur dérivées ont un degré polynomial de 1.
 
-Illustration +.#
+#### Illustration {-}
 
 L’équation suivante est linéaire $$y''+4x\cdot y'=e^x.$$ 
 L’équation
 suivante n’est pas linéaire $$y\cdot y''+4x\cdot y'=e^x.$$
 
-Définition (Homogénéité) +.#
+#### Définition (Homogénéité) {-}
 
 Une équation différentielle ordinaire est dite homogène si le terme
 dépendant uniquement de $x$ est nul. Dans le cas où nous avons à faire à
 une équation différentielle linéaire, cela revient à dire que $b(x)=0$.
 
-Illustration (Homogénéité) +.#
+#### Illustration (Homogénéité) {-}
 
 Les équations suivantes sont homogènes $$\begin{aligned}
   &y''+4x\cdot y\cdot y'+3x^2\cdot y^3=0,\\
@@ -385,7 +385,7 @@ $$\begin{aligned}
 
 ---
 
-Exercice (Homogénéité) +.#
+#### Exercice (Homogénéité) {-}
 
 Pour chacune de ces équations différentielles ordinaires 
 donner tous les qualificatifs possibles. Si l’équation est inhomogène
@@ -423,7 +423,7 @@ un certain nombre.
 
 ---
 
-Définition (Équations à variable séparables) +.#
+#### Définition (Équations à variable séparables) {-}
 
 On dit qu’une équation différentielle d’ordre 1 est à variables
 séparables, si elle peut s’écrire sous la forme suivante
@@ -433,7 +433,7 @@ $$y' a(y)=b(x).$$
 
 ---
 
-Illustration +.#
+#### Illustration {-}
 
 L’équation suivante est à variables séparables
 $$e^{x^2+y^2(x)}y'(x)=1.$$
@@ -453,11 +453,11 @@ $a(y)=1$ et il vient $$y=\int b(x){\mathrm{d}}x.$$
 
 ---
 
-Exemple +.#
+#### Exemple {-}
 
 Résoudre l’équation différentielle suivante $$n'(t)=r\cdot n(t).$$ 
 
-Solution +.#
+#### Solution {-}
 
 En
 écrivant $n'={\mathrm{d}}n /{\mathrm{d}}t$, on réécrit l’équation
@@ -472,7 +472,7 @@ n(t)&=e^{r\cdot t+C}=A\cdot e^{r\cdot t},\end{aligned}$$ où $A=e^C$.
 
 ---
 
-Exercice +.#
+#### Exercice {-}
 
 1. Résoudre l’équation différentielle suivante $$c'(t)=rc(t)+d.$$
 
@@ -524,12 +524,12 @@ Finalement, on a que la solution de l’équation générale de l’équation
 inhomogène est
 $$y=y_p+y_h=\left(\int \frac{b(x)}{e^{\int a(x){\mathrm{d}}x}}{\mathrm{d}}x+C\right)e^{\int a(x){\mathrm{d}}x}.$$
 
-Exemple +.#
+#### Exemple {-}
 
 Résoudre l’équation suivante
 $$U_C'(t)+\frac{U_C(t)}{RC}=\frac{U}{RC}.$${#eq:rc_inhom} 
 
-Solution +.#
+#### Solution {-}
 
 On
 commence par résoudre l’équation homogène
@@ -546,7 +546,7 @@ $U_c(0)=0$. On peut donc fixer la constante $C=-U$.
 
 Résoudre les équations différentielles suivantes
 
-Exercice +.#
+#### Exercice {-}
 
 1. $$y'+2y=t^2$$
 
@@ -572,11 +572,11 @@ de la méthode de la section @sec:eq_lin.
 
 ---
 
-Exemple +.#
+#### Exemple {-}
 
 Résoudre l’équation de Bernouilli suivante $$y'-y-x\cdot y^6=0.$$ 
 
-Solution +.#
+#### Solution {-}
 
 Avec
 la substitution $z=y^5$, on obtient $$z'-5z+5x=0.$$ Cette équation se
@@ -612,7 +612,7 @@ la résoudre.
 
 --
 
-Exercice +.#
+#### Exercice {-}
 
 Résoudre l’équation de Riccati suivante $$y'+y^2-\frac{2}{x^2}=0.$$
 Indication: la solution particulière a la forme $y=\frac{a}{x}$, avec
@@ -658,7 +658,7 @@ l’équation différentielle.
 
 ---
 
-Propriétés +.#
+#### Propriétés {-}
 
 Ces propriétés (qui caractérisent le mot "linéaires") sont à démontrer en exercice.
 
diff --git a/05_fourier.md b/05_fourier.md
index 383037749301ed50ea6c01a3dbfb9a5edb202428..e879cb037fbf138b11b68f8bdb0a70f6c9978798 100644
--- a/05_fourier.md
+++ b/05_fourier.md
@@ -48,7 +48,7 @@ vérifier la commutativité $$\begin{aligned}
 (a,b)\cdot(c,d)&=(a\cdot c-b\cdot d,a\cdot d+b\cdot c)\nonumber\\
 &=(c\cdot a-d\cdot b,d\cdot a+c\cdot b)=(c,d)\cdot (a,b).\end{aligned}$$
 
-Exercice +.#
+#### Exercice {-}
 
 Vérifier l’associativité du produit sur notre ensemble ${\real}^2$.
 
@@ -186,7 +186,7 @@ $${\mathrm{Re}}(z)=\frac{1}{2}(z+{\bar{z}}),\quad {\mathrm{Im}}(z)=\frac{1}{2i}(
 
 ---
 
-Exercice +.#
+#### Exercice {-}
 
 Démontrer ces trois relations.
 
@@ -199,7 +199,7 @@ $$\begin{aligned}
 
 ---
 
-Exercice +.#
+#### Exercice {-}
 
 Démontrer ces relations.
 
@@ -213,7 +213,7 @@ allons considérer un ensemble $V$ muni d’une addition et d’une multiplicati
 à un ensemble $E$. Dans notre cas $E$
 sera ${\real}$ ou ${\mathbb{C}}$ (l'ensemble des nombres complexes)  principalement.
 
-Définition +.#
+#### Définition {-}
 
 On appelle espace vectoriel sur $E$, un ensemble $V$, dont les éléments
 appelés vecteurs et notés $v$, sont sont munis des opérations 
@@ -245,7 +245,7 @@ propriétés suivantes
         $1$, pour la multiplication à gauche $$1 \cdot v=v.$$
 
 
-Exemple (Espaces vectoriels) +.#
+#### Exemple (Espaces vectoriels) {-}
 
 1. L’espace nul, $v=0$.
 
@@ -321,7 +321,7 @@ $$w=u+v=u_1\cdot e_1+u_2\cdot e_2+v_1\cdot e_1+v_2\cdot e_2=(u_1+v_1)\cdot e_1+(
 
 ---
 
-Illustration  (Exemples de bases d'espaces vectoriels) +.#
+#### Illustration  (Exemples de bases d'espaces vectoriels) {-}
 
 1. Pour l’espace des fonctions polynomiales $f(x)=\sum_{i=0}^Na_ix^i$
     les fonction $e_i=x^i$ forment une base.
@@ -336,13 +336,13 @@ Plus formellement nous allons introduire un certain nombre de concepts
 mathématiques pour définir une base. Considérons toujours $V$ un espace
 vectoriel sur $E$.
 
-Définition (Famille libre) +.#
+#### Définition (Famille libre) {-}
 
 Soient $\{\alpha_i\}_{i=1}^n\in E$. On dit qu’un ensemble de vecteurs
 $\{v_i\}_{i=1}^n\in V$ est une famille libre si
 $$\sum_{i=1}^n \alpha_iv_i=0 \Rightarrow \alpha_i=0,\ \forall i.$$
 
-Exemple (Famille libre) +.#
+#### Exemple (Famille libre) {-}
 
 1. $\{e_1\}$ est une famille libre de ${\real}^2$.
 
@@ -357,7 +357,7 @@ Exemple (Famille libre) +.#
     relie les deux. La relation est non-linéaire
     $\sin(x)=\sqrt{1-\cos^2(x)}$.
 
-Définition (Famille génératrice) +.#
+#### Définition (Famille génératrice) {-}
 
 On dit qu’un ensemble de vecteurs $\{e_i\}_{i=1}^n\in V$ est une famille
 génératrice si
@@ -365,7 +365,7 @@ $$\forall\ v\in V,\quad \exists \{\alpha_i\}_{i=1}^n\in E,\quad \mbox{t.q.}\quad
 En d’autres termes, tout $v\in V$ peut s’exprimer comme une combinaison
 linéaire des vecteur $e_i$.
 
-Illustration (Familles génératrices) +.#
+#### Illustration (Familles génératrices) {-}
 
 1. $\{e_1\}$ n’est pas une famille génératrice de ${\real}^2$. On ne
     peut pas représenter  les vecteurs de la forme $v=(0,v_2)$,
@@ -376,7 +376,7 @@ Illustration (Familles génératrices) +.#
 3. $\{e_1,e_2,v\}$, avec $v=(1,1)$ est une famille génératrice de
     ${\real}^2$.
 
-Définition (Base) +.#
+#### Définition (Base) {-}
 
 Un ensemble de vecteurs $B=\{e_i\}_{i=1}^n$ forme une base si c’est une
 famille génératrice et une famille libre. En d’autres termes cela
@@ -386,7 +386,7 @@ est unique
 $$\forall v\in V, \quad !\exists \{\alpha_i\}_{i=1}^n\in E,\quad t.q.\quad v=\sum_{i=1}^n\alpha_i v_i.$$
 Les $\alpha_i$ sont appelé les coordonnées de $v$ dans la base $B$.
 
-Illustration (Base de $\real ^2$) +.#
+#### Illustration (Base de $\real ^2$) {-}
 
 1. $\{e_1,e_2\}$ est une base de ${\real}^2$.
 
@@ -613,7 +613,7 @@ pouvoir calculer sa transformée de Fourier:
 
 ---
 
-Exercice +.#
+#### Exercice {-}
 
 Calculer les transformées de Fourier des fonctions suivantes
 
@@ -634,7 +634,7 @@ Calculer les transformées de Fourier des fonctions suivantes
 
 ---
 
-Exercice +.#
+#### Exercice {-}
 
 Calculer les transformées de Fourier inverse de la fonction suivante
 
@@ -649,7 +649,7 @@ Calculer les transformées de Fourier inverse de la fonction suivante
 
 La transformée de Fourier possède plusieurs propriétés intéressantes.
 
-Propriété +.#
+#### Propriété {-}
 
 1. Linéarité. Soit une fonction $h(t)=af(t)+bg(t)$, alors sa
     transformée de Fourier est donnée par
@@ -709,7 +709,7 @@ l’intégrale et on a $$\begin{aligned}
      &=f[n].\nonumber\end{aligned}$$
 
 
-Exercice +.# 
+#### Exercice  {-}
 
 Calculer les transformées de Fourier (inverses quand c’est approprié) en
 temps discret des fonctions suivantes
@@ -876,7 +876,7 @@ période $N$ $${\hat{f}}[k]={\hat{f}}[k+N].$$
 
 ---
 
-Exercice +.#
+#### Exercice {-}
 
 A démontrer en exercice.
 
diff --git a/06_probas_stats.md b/06_probas_stats.md
index f1ef4d9a5d943544d2a898dc0c526d34f7f2c3c1..2a69599ed3d0a4b397cca7dc79f476887c8ac99e 100644
--- a/06_probas_stats.md
+++ b/06_probas_stats.md
@@ -1,8 +1,6 @@
-Probabilités et statistiques
-============================
+# Probabilités et statistiques
 
-Introduction à la statistique descriptive
------------------------------------------
+## Introduction à la statistique descriptive
 
 En statistique, une *population* est un ensemble d’objets (d’individus)
 possédant un ou plusieurs *caractères* communs. L’étude des caractères
@@ -41,7 +39,7 @@ l’ensemble des valeurs possibles pour le dit caractère.
 
 ---
 
-Illustration +.#
+#### Illustration {-}
 
 1. Cas discret: On étudie la distribution de salaires annuels dans une
     entreprise. Les salaires possibles sont $40'000$, $50'000$, $60'000$
@@ -73,7 +71,7 @@ Illustration +.#
 Pour représenter de façon un peu plus parlante ces valeurs, deux
 méthodes principales existent: le tableau ou le graphique. Pour
 illustrer les exemples précédents sous forme de tableau on obtient pour
-le cas des salaires (voir Tabl. @fig:salaires)
+le cas des salaires (voir Tabl. @tbl:salaires)
 
    Salaire   Nombre de salariés
   --------- --------------------
@@ -84,7 +82,7 @@ le cas des salaires (voir Tabl. @fig:salaires)
 
   : Tableau du nombre de salariés par salaire. {#tbl:salaires}
 
-et du benchmark de l’application (voir Tabl. @fig:exec)
+et du benchmark de l’application (voir Tabl. @tbl:exec)
 
     Temps d’exécution     Nombre
    ------------------- --------
@@ -122,7 +120,7 @@ $$f_i=\frac{n_i}{n}.$$
 
 ---
 
-Exemple (Fréqunces) +.#
+#### Exemple (Fréqunces) {-}
 
 Les tableaux de fréquence des deux exemples précédents sont donnés par
 
@@ -157,7 +155,7 @@ retrouverons dans les sections suivantes qui sont assez intuitives
 
 ---
 
-Propriété (Propriétés de la fréquence) +.#
+#### Propriété (Propriétés de la fréquence) {-}
 
 1. Les fréquences sont toujours dans l’intervalle $[0,1]$
     $$0\leq f_i\leq 1.$$
@@ -192,7 +190,7 @@ tableaux @tbl:salaires et @tbl:exec (voir le
 
   : Tableau des temps d'exécution et la fréquence et fréquences cumulées des temps d'exécution. {#tbl:exec_freqcum}
 
-Exercice (Fréquence cumulée) +.#
+#### Exercice (Fréquence cumulée) {-}
 
 1. Tracer les graphes de la fréquence cumulée pour les deux exemples
     que nous avons vus.
@@ -216,7 +214,7 @@ $$\bar{x}=\sum_{i=0}^{k-1}f_i\cdot x_i.$$
 
 ---
 
-Exercice (Propriétés de la moyenne) +.#
+#### Exercice (Propriétés de la moyenne) {-}
 
 1. Démontrer la relation précédente.
 
@@ -226,7 +224,7 @@ Exercice (Propriétés de la moyenne) +.#
 
 ---
 
-Illustration (Moyenne) +.#
+#### Illustration (Moyenne) {-}
 
 Pour l’exemple des salaires la moyenne est donnée par
 $$\bar{x}_{\textrm{salaire}}=\frac{35\cdot40000+20\cdot50000+5\cdot60000+1\cdot1000000}{61}=60656.$$
@@ -254,7 +252,7 @@ le reste est telle que $x_i\geq\tilde{x}$.
 Pour l’exemple des salaires le salaire médian est de $40000 CHF$, ce qui
 reflète beaucoup mieux la distribution des salaire de notre population.
 
-Exercice (Moyenne, médiane) +.#
+#### Exercice (Moyenne, médiane) {-}
 
 Calculer la moyenne et la médiane pour l’exemple du temps d’exécution
 (prendre la borne inférieure des intervalles pour chaque temps
@@ -284,7 +282,7 @@ $$s=\sqrt{v}.$$
 
 ---
 
-Exercice (Variance, écart-type) +.#
+#### Exercice (Variance, écart-type) {-}
 
 Démontrer les relations suivantes
 
@@ -305,7 +303,7 @@ $$s=\sqrt{v}=121440.$$
 
 ---
 
-Exercice (Variance, écart-type) +.#
+#### Exercice (Variance, écart-type) {-}
 
 Calculer la variance et l’écart type à partir des valeurs du benchmark
 de l’application.
@@ -333,7 +331,7 @@ semi-inter-quartile.
 
 ---
 
-Exercice (Semi-inter quartile) +.#
+#### Exercice (Semi-inter quartile) {-}
 
 Calculer les intervalles semi-inter-quartiles des exemples que nous
 avons vus plus tôt dans le cours.
@@ -353,7 +351,7 @@ sera utile pour la suite.
 
 ---
 
-Définition +.#
+#### Définition {-}
 
 - L’ensemble des résultats possibles du lancer de dé est
     $\Omega=\{1,2,3,4,5,6\}$ et cet ensemble est appelé l’*univers* du
@@ -507,7 +505,7 @@ comme la conséquences des trois axiomes des probabilités suivants
 
 ---
 
-Définition (Axiomes des probabilités) +.#
+#### Définition (Axiomes des probabilités) {-}
 
 Soit $\Omega$ un univers. La probabilité de
 réaliser un événement $A\subseteq\Omega$ est une fonction $p(A)$ qui
@@ -529,7 +527,7 @@ De ces axiomes découlent tout un tas de théorèmes
 
 ---
 
-Théorème +.#
+#### Théorème {-}
 
 Pour $A,B\subseteq\Omega$ et $\Omega$ un univers et $p$ une probabilité.
 
@@ -585,7 +583,7 @@ $p(A|B)$, tel que $$p(A|B)=\frac{p(A\cap B)}{p(B)}.$$
 
 ---
 
-Exercice (Probabilités conditionnelles) +.#
+#### Exercice (Probabilités conditionnelles) {-}
 
 Sur une population de 1000 hommes qui naissent, 922 atteignent l’âge de
 50 ans et 665 l’âge de 70 ans.
@@ -628,7 +626,7 @@ résultat de celui de la semaine suivante.
 
 ---
 
-Exercice (Evénements indépendants) +.# 
+#### Exercice (Evénements indépendants)  {-}
 
 On jette une pièce de monnaie deux fois de
 suite. Les résultats possible pour chaque jet sont: $P$, ou $F$.
@@ -733,7 +731,7 @@ $1/6$. On a donc que $$p(A)=\frac{1}{3}\cdot \frac{1}{6}=\frac{1}{18}.$$
 
 ---
 
-Exercice +.#
+#### Exercice {-}
 
 1. Calculer la probabilité d’obtenir $2$ comme la somme des deux
     nombres tirés par deux dés.
@@ -805,7 +803,7 @@ $$p([n_1,...,n_k])=\frac{n!}{n_1!\cdots n_k!}p_1^{n_1}\cdots p_k^{n_k}.$$
 
 ---
 
-Exercice +.#
+#### Exercice {-}
 
 On lance un dé parfait 10 fois. Quelle est la probabilité d’obtenir:
 
@@ -874,7 +872,7 @@ $p(\{5,2\}\backslash \{2\mbox{ ou }5)=\frac{1}{5}$ pour trouver la probabilité
 
 ---
 
-Exerice +.#
+#### Exerice {-}
 
 1. Le jeu Euromillions consiste en un tirage de 5 numéros parmi 50
     possible, puis par le tirage de 2 “étoiles” parmi 11 possibles.
@@ -1004,7 +1002,7 @@ On peut noter dans le cas général qu’on a $D=X^{-1}(I)$.
 
 ---
 
-Définition (Variable aléatoire) +.#
+#### Définition (Variable aléatoire) {-}
 
 On dit que la fonction $X:\Omega\rightarrow{\real}$ est une
 *variable aléatoire* si la préimage de $X$ sur tout intervalle,
@@ -1016,7 +1014,7 @@ probabilité de réaliser l’événement $A$ $$p(X\in I)=p(A).$$
 
 ---
 
-Définition (Fonction de répartition) +.#
+#### Définition (Fonction de répartition) {-}
 
 On dit que la fonction $F:{\real}\rightarrow{\real}$ est une
 *fonction de répartition* si $F(x)=p(X\leq x)$ pour tout
diff --git a/Makefile b/Makefile
index b5d4f18cba21adf4defccd93a11f8ebd087d25b9..d31441e1aa45f5ace398fe8a5e2698e1c4cec19c 100644
--- a/Makefile
+++ b/Makefile
@@ -4,7 +4,6 @@ STYLES := css/tufte-css/tufte.css \
 	css/tufte-extra.css
 
 OPTIONS = --toc
-OPTIONS += --filter=pandoc-numbering
 OPTIONS += --filter=pandoc-crossref
 
 PDFOPTIONS = --highlight-style kate