Louise

De knowledge
Aller à la navigation Aller à la recherche

Page pour expliquer à Louise les statistiques.

Les données.

On dispose de données mesurées (données quantitatives discrètes)

On mesure le nombre de mises en causes par la police en fonction de la taille de l'agglomération (la variable explicative)

Mesures.png

Exemple de valeurs

Taille Agglo Nb Mise en cause
0.00 0.33
30.30 0.30
60.61 0.46
90.91 0.64
121.21 0.45
151.52 0.50
181.82 0.83
212.12 0.76
242.42 0.62
272.73 0.84
303.03 0.73
333.33 0.78
363.64 0.95
393.94 0.64
424.24 0.73
454.55 0.98
.... ....

On voit intuitivement que le loi qui régie le phénomène observé semble être une droite. Comment confirmer cela. On peut d'abord demander à Excel 😊

Regression avec excel.png

Il y a une fonction dans Excel pour faire cela. Il est même capable de calculer l'équation de la droite (y=ax+b avec a=0.0018 et b=0,2309). Il nous donne bien entendu la valeur de R².

Mais c'est trop facile calculons le nous même

Calcul de la droite f(x)=y=ax+b

f est la fonction qui pour une valeur de x (taille de l'agglo) donne la valeur estimée par notre intuition qu'une droite explique le phénomène observé. On note la valeur pour un x donné f(x).

Par définition on sait que :

La pente de la droite a correspond au rapport entre le covariance des deux variables et la variance de la variable explicative (x)

La formule de la covariance est :

Formule covariance.png

Donc c'est la somme (Σ) du:

la multiplication entre l'écart entre une valeur de x et la moyenne des x x&#x0304


La moyenne est notée <math>\bar{x}</math