Skip to content
GitLab
Explore
Sign in
Primary navigation
Search or go to…
Project
math_tech_info
Manage
Activity
Members
Labels
Plan
Issues
Issue boards
Milestones
Wiki
Code
Merge requests
Repository
Branches
Commits
Tags
Repository graph
Compare revisions
Snippets
Build
Pipelines
Jobs
Pipeline schedules
Artifacts
Deploy
Releases
Model registry
Operate
Environments
Monitor
Incidents
Analyze
Value stream analytics
Contributor analytics
CI/CD analytics
Repository analytics
Model experiments
Help
Help
Support
GitLab documentation
Compare GitLab plans
Community forum
Contribute to GitLab
Provide feedback
Keyboard shortcuts
?
Snippets
Groups
Projects
Show more breadcrumbs
xavier.perret
math_tech_info
Commits
a7dcc99a
Unverified
Commit
a7dcc99a
authored
7 years ago
by
malaspinas
Committed by
GitHub
7 years ago
Browse files
Options
Downloads
Patches
Plain Diff
Update cours.md
parent
212a704d
Branches
Branches containing commit
Tags
Tags containing commit
No related merge requests found
Changes
1
Hide whitespace changes
Inline
Side-by-side
Showing
1 changed file
cours.md
+12
-12
12 additions, 12 deletions
cours.md
with
12 additions
and
12 deletions
cours.md
+
12
−
12
View file @
a7dcc99a
...
...
@@ -3061,7 +3061,7 @@ Exercice (Fréquence cumulée) +.#
Jusqu’ici le nombre de valeurs étudiées était limité et il est assez
simple d’avoir une vue d’ensemble de la distribution des valeurs des
caractères de notre population.
I
l est plus aisé d’utiliser une nombre
caractères de notre population.
Mais en général i
l est plus aisé d’utiliser une nombre
de valeurs beaucoup plus restreint permettant de résumer les différents
caractères et nous allons en voir deux différents qui nous donne une
tendance dite centrale: la moyenne, la médiane.
...
...
@@ -3095,7 +3095,7 @@ $$\bar{x}_{\textrm{salaire}}=\frac{35\cdot40000+20\cdot50000+5\cdot60000+1\cdot1
On remarque ici que la moyenne des salaires donne une impression erronée
de la situation car elle est très sensible aux valeurs extrême de la
distribution. En effet, tous les salaires à l’exception d’un sont
inférieurs à la moyenne.
En effet, si on
retire le salaire d’un million
inférieurs à la moyenne.
Il suffit de
retire
r
le salaire d’un million
de notre ensemble de valeurs, la moyenne de l’échantillon restant
devient
$$\bar{x}_{\textrm{salaire}}=\frac{35\cdot40000+20\cdot50000+5\cdot60000}{60}=45000.$$
...
...
@@ -3103,11 +3103,11 @@ La différence est de l’ordre de $25\%$ par rapport aux $60'000$ CHF
obtenus avec toute la population. Il est donc nécessaire d’utiliser une
autre mesure pour illustrer mieux le salaire caractéristique de notre
population. De façon plus générale la moyenne est peu robuste à des
valeurs extrêmes dans l’étude d’échantillon.
valeurs extrêmes dans l’étude d’échantillon
s
.
Une mesure qui est plus parlante est la *médiane*, notée $\tilde{x}$. La
médiane se définit comme la valeur $\tilde{x}$ qui est telle que la
moitié des individus de la population
sont
ont un $x_i\leq \tilde{x}$ et
moitié des individus de la population ont un $x_i\leq \tilde{x}$ et
le reste est telle que $x_i\geq\tilde{x}$.
Pour l’exemple des salaires le salaire médian est de $40000 CHF$, ce qui
...
...
@@ -3122,7 +3122,7 @@ d’exécution[^7]).
### Mesures de dispersion
Nous avons vu deux mesures donnant une tendance générale des caractères
d’une population. Hors ce
tte
valeur ne nous dit absolument rien sur la
d’une population. Hors ce
s
valeur
s
ne nous di
sen
t absolument rien sur la
manière dont ces caractères sont distribués. Sont-ils proches de la
moyenne ou de la médiane? Ou en sont-ils au contraire éloignés? Nous
allons voir deux mesures différentes dans cette sous-section
:
la
...
...
@@ -3133,12 +3133,12 @@ Hors, comme on l’a vu dans la sous-section précédente l’écart à la
moyenne $x_i-\bar{x}$ est nul en moyenne. Cette grandeurs ne nous
apprend rien. On peut donc s’intéresser plutôt à la moyenne de l’écart
quadratique $(x_i-\bar{x})^2$ qui est une quantité toujours positive et
don
c
la moyenne
sera de cette écart quadratique
aura toujours une valeur
qui sera
positive ou nulle (elle sera nulle uniquement si
don
t
la moyenne aura toujours une valeur
positive ou nulle (elle sera nulle uniquement si
$x_i-\bar{x}=0,\forall i$)[^8]. On définit donc la *variance*, $v$,
comme étant la moyenne des écarts quadratiques
$$v=\frac{1}{n}\sum_{i=0}^{k-1}n_i(x_i-\bar{x})^2.$$ Si on considère
plutôt
la racine carrée de la variance, on obtient *l’écart-type*
la racine carrée de la variance, on obtient *l’écart-type*
$$s=\sqrt{v}.$$
---
...
...
@@ -3147,18 +3147,18 @@ Exercice (Variance, écart-type) +.#
Démontrer les relations suivantes
1.
On peut également calculer la variance avec l
a
fréquence
1.
On peut également calculer la variance avec l
es
fréquence
s
$$v=
\s
um_{i=0}^{k-1}f_i(x_i-
\b
ar{x})^2.$$
2.
On peut également calculer la variance à l’aide de la formule
suivante
$$v=
\f
rac{1}{n}
\l
eft(
\s
um_{i=0}^{k-1}n_ix_i^2
\r
ight)-
\b
ar{x}^2
.
$$
$$v=
\f
rac{1}{n}
\l
eft(
\s
um_{i=0}^{k-1}n_ix_i^2
\r
ight)-
\b
ar{x}^2
=
\b
ar{x^2}-
\b
ar{x}^2
$$
---
Pour l’exemple du salaire on obtient pour la variance $$
\b
egin{aligned}
v&=
\f
rac{1}{61}
\l
eft(35
\c
dot(40000-60656)^2+
35
\c
dot(50000-60656)^2
\r
ight.
\n
onumber
\\
&
\q
uad
\q
uad
\l
eft.+
3
5
\c
dot(60000-60656)^2+
35
\c
dot(1000000-60656)^2
\r
ight)
\n
onumber
\\
v&=
\f
rac{1}{61}
\l
eft(35
\c
dot(40000-60656)^2+
20
\c
dot(50000-60656)^2
\r
ight.
\n
onumber
\\
&
\q
uad
\q
uad
\l
eft.+5
\c
dot(60000-60656)^2+
1
\c
dot(1000000-60656)^2
\r
ight)
\n
onumber
\\
&=1.4747
\c
dot 10^{10},
\e
nd{aligned}$$ et l’écart-type
$$s=
\s
qrt{v}=121440.$$
...
...
This diff is collapsed.
Click to expand it.
Preview
0%
Loading
Try again
or
attach a new file
.
Cancel
You are about to add
0
people
to the discussion. Proceed with caution.
Finish editing this message first!
Save comment
Cancel
Please
register
or
sign in
to comment