Rezultatele învățării
- Utilizați interpolarea și extrapolarea
Reamintiți-vă acest exemplu din conținutul anterior:
Un eșantion aleatoriu de 11 studenți la statistică a produs următoarele date, unde
x este a treia notă de la examen din 80, iar y este nota finală de la examen din 200. Puteți prezice nota de la examenul final al unui student aleator dacă știți nota de la al treilea examen?
x (nota de la examenul al treilea) | y (nota de la examenul final) |
---|---|
65 | 175 |
67 | 133 |
71 | 185 |
71 | 163 |
66 | 126 |
75 | 198 |
67 | 153 |
70 | 163 |
71 | 159 |
69 | 151 |
69 | 159 |
Tabel cu notele la examenul final pe baza notelor de la a treia probă.
Plotul de dispersie care arată scorurile la examenul final pe baza scorurilor de la al treilea examen.
Am examinat diagrama de dispersie și am arătat că coeficientul de corelație este semnificativ. Am găsit ecuația dreptei care se potrivește cel mai bine pentru nota de la examenul final în funcție de nota de la al treilea examen. Acum putem folosi linia de regresie a celor mai mici pătrate pentru predicție.
Să presupunem că doriți să estimați, sau să preziceți, nota medie la examenul final a studenților de la statistică care au primit 73 la al treilea examen. Notele la examen (valorile x) variază între 65 și 75. Deoarece 73 se află între valorile x 65 și 75, înlocuiți x = 73 în ecuație. Atunci:
\displaystyle\hat{{y}}=-{173.51}+{4.83}{({73})}={179.08}
Prevedem că studenții de la statistică care au obținut o notă de 73 la al treilea examen vor obține o notă de 179.08 la examenul final, în medie.
Exemplu
Utilizați datele de mai sus pentru acest exemplu:
- Cum ați prezice că va fi nota la examenul final pentru un student care a obținut 66 la al treilea examen?
- Ce scor ați prezice că ar fi scorul final al examenului pentru un student care a obținut 90 la al treilea examen?
Soluție:
- 145.27
- Valorile x din date sunt între 65 și 75. Nouăzeci se află în afara domeniului valorilor x observate în date (variabila independentă), astfel încât nu puteți prezice în mod fiabil nota la examenul final pentru acest elev. (Chiar dacă este posibil să introduceți 90 în ecuația pentru x și să calculați o valoare y corespunzătoare, valoarea y pe care o veți obține nu va fi fiabilă.)Pentru a înțelege cu adevărat cât de nesigură poate fi predicția în afara valorilor x observate în date, efectuați înlocuirea x= 90 în ecuație.\displaystyle\hat{{y}}=-{173.51}+{4.83}{({90})}={261.19}Se prezice că nota de la examenul final va fi 261.19. Cel mai mare scor la examenul final poate fi 200.
Nota
Procesul de predicție în interiorul valorilor x observate în date se numește interpolare. Procesul de predicție în afara valorilor x observate observate în date se numește extrapolare.
încercați
Se colectează date privind relația dintre numărul de ore pe săptămână de practică a unui instrument muzical și notele la un test de matematică. Linia de cea mai bună potrivire este următoarea:
\displaystyle\hat{{y}}={72.5}+{2.8}{x}
Ce scor ați prezice că va obține la un test de matematică un elev care practică un instrument muzical timp de cinci ore pe săptămână?
Data from the Centers for Disease Control and Prevention.
Data from the National Center for HIV, STD, and TB Prevention.
Data from the United States Census Bureau. Disponibil online la http://www.census.gov/compendia/statab/cats/transportation/motor_vehicle_accidents_and_fatalities.html
Date de la National Center for Health Statistics.
Revizuirea conceptului
După ce ați determinat prezența unui coeficient de corelație puternic și ați calculat linia de cea mai bună potrivire, puteți folosi linia de regresie a celor mai mici pătrate pentru a face predicții despre datele dumneavoastră.
.