Résultats d’apprentissage

  • Utiliser l’interpolation et l’extrapolation

Rappellez-vous cet exemple du contenu précédent:

Un échantillon aléatoire de 11 étudiants en statistiques a produit les données suivantes, où
x est la troisième note d’examen sur 80, et y est la note d’examen finale sur 200. Pouvez-vous prédire la note de l’examen final d’un étudiant aléatoire si vous connaissez la note du troisième examen ?

.

x (note du troisième examen) y (note de l’examen final)
65 175
67 133
71 185
71 163
66 126
75 198
67 153
70 163
71 159
69 151
69 159

Tableau indiquant les notes de l’examen final en fonction des notes du troisième examen.

C'est un diagramme de dispersion des données fournies. La note du troisième examen est représentée sur l'axe des abscisses, et la note de l'examen final est représentée sur l'axe des ordonnées. Les points forment un schéma linéaire fort et positif.Plot de dispersion montrant les notes de l’examen final en fonction des notes du troisième examen.

Nous avons examiné le nuage de points et montré que le coefficient de corrélation est significatif. Nous avons trouvé l’équation de la droite de meilleur ajustement pour la note de l’examen final en fonction de la note du troisième examen. Nous pouvons maintenant utiliser la droite de régression des moindres carrés pour la prédiction.

Supposons que vous voulez estimer, ou prédire, la note moyenne de l’examen final des étudiants en statistique qui ont obtenu 73 au troisième examen. Les notes d’examen (valeurs x) sont comprises entre 65 et 75. Puisque 73 se situe entre les valeurs x 65 et 75, substituez x = 73 dans l’équation. Alors :

\displaystyle\hat{{y}}=-{173.51}+{4.83}{({73})}={179.08}

Nous prédisons que les étudiants en statistique qui obtiennent une note de 73 au troisième examen obtiendront une note de 179,08 à l’examen final, en moyenne.

Exemple

Utiliser les données ci-dessus pour cet exemple :

  1. Qu’est-ce que vous prédiriez que la note de l’examen final sera pour un étudiant qui a obtenu une note de 66 au troisième examen ?
  2. Que prédiriez-vous que sera la note finale de l’examen pour un étudiant qui a obtenu une note de 90 au troisième examen ?

Solution:

  1. 145,27
  2. Les valeurs x des données sont comprises entre 65 et 75. Quatre-vingt-dix est en dehors du domaine des valeurs x observées dans les données (variable indépendante), vous ne pouvez donc pas prédire de manière fiable la note de l’examen final de cet étudiant. (Même s’il est possible d’entrer 90 dans l’équation pour x et de calculer une valeur y correspondante, la valeur y que vous obtiendrez ne sera pas fiable.)Pour comprendre à quel point la prédiction peut être peu fiable en dehors des valeurs x observées dans les données, remplacez x= 90 dans l’équation.\displaystyle\hat{{y}}=-{173.51}+{4.83}{({90})}={261.19}La note finale de l’examen est prédite à 261.19. La plus grande note finale de l’examen peut être 200.

Note

Le processus de prédiction à l’intérieur des valeurs x observées dans les données est appelé interpolation. Le processus de prédiction à l’extérieur des valeurs x observées dans les données est appelé extrapolation.

essayez-le

Des données sont collectées sur la relation entre le nombre d’heures par semaine de pratique d’un instrument de musique et les scores à un test de mathématiques. La droite de meilleur ajustement est la suivante :

\displaystyle\hat{y}}={72,5}+{2,8}{x}

Quel serait, selon vous, le score à un test de mathématiques pour un élève qui pratique un instrument de musique cinq heures par semaine ?

Données des Centers for Disease Control and Prevention.

Données du National Center for HIV, STD, and TB Prevention.

Données du United States Census Bureau. Disponible en ligne à l’adresse http://www.census.gov/compendia/statab/cats/transportation/motor_vehicle_accidents_and_fatalities.html

Données du National Center for Health Statistics.

Revue de concept

Après avoir déterminé la présence d’un fort coefficient de corrélation et calculé la ligne de meilleur ajustement, vous pouvez utiliser la ligne de régression des moindres carrés pour faire des prédictions sur vos données.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée.