Leerresultaten
- Gebruik interpolatie en extrapolatie
Herinner je dit voorbeeld uit eerdere inhoud:
Een willekeurige steekproef van 11 statistiekstudenten leverde de volgende gegevens op, waarbij
x de derde tentamenscore op 80 is, en y de eindexamenscore op 200. Kun je de eindexamenscore van een willekeurige student voorspellen als je de score van het derde examen kent?
x (score derde examen) | y (score eindexamen) |
---|---|
65 | 175 |
67 | 133 |
71 | 185 |
71 | 163 |
66 | 126 |
75 | 198 |
67 | 153 |
70 | 163 |
71 | 159 |
69 | 151 |
69 | 159 |
Tabel met de scores op het eindexamen gebaseerd op de scores van het derde examen.
Spreidingsdiagram met de scores op het eindexamen gebaseerd op de scores van het derde examen.
We onderzochten de spreidingsdiagram en toonden aan dat de correlatiecoëfficiënt significant is. We vonden de vergelijking van de best passende lijn voor het eindexamencijfer als functie van het cijfer op het derde-examen. We kunnen nu de kleinste-kwadraten regressielijn gebruiken voor de voorspelling.
Voorstel dat je een schatting, of voorspelling, wilt maken van de gemiddelde eindexamenscore van studenten statistiek die 73 hebben gehaald op het derde examen. De examencijfers (x-waarden) variëren van 65 tot 75. Omdat 73 tussen de x-waarden 65 en 75 ligt, substitueer je x = 73 in de vergelijking. Dan:
Displaystyle{y}=-{173.51}+{4.83}{({73})}={179.08}
We voorspellen dat studenten statistiek die op het derde examen een cijfer van 73 halen, op het eindexamen gemiddeld een cijfer van 179.08 halen.
Voorbeeld
Gebruik de bovenstaande gegevens voor dit voorbeeld:
- Wat zou u voorspellen als eindexamencijfer voor een student die op het derde examen een 66 scoort?
- Wat zou u voorspellen als het eindexamencijfer zou zijn voor een student die 90 scoorde op het derde examen?
Oplossing:
- 145.27
- De x-waarden in de gegevens liggen tussen 65 en 75. Negentig ligt buiten het domein van de waargenomen x-waarden in de gegevens (onafhankelijke variabele), dus je kunt het eindexamencijfer voor deze student niet betrouwbaar voorspellen. (Ook al is het mogelijk om 90 in te vullen in de vergelijking voor x en een overeenkomstige y-waarde te berekenen, de y-waarde die je dan krijgt zal niet betrouwbaar zijn.)Om echt te begrijpen hoe onbetrouwbaar de voorspelling kan zijn buiten de waargenomen x-waarden in de gegevens, maak je de substitutie x= 90 in de vergelijking.{Displaystyle{{y}}=-{173.51}+{4.83}{({90})}={261.19}De eindexamenscore wordt voorspeld op 261.19. De hoogste eindexamenscore kan 200 zijn.
Noot
Het proces van voorspellen binnen de geobserveerde x-waarden die in de gegevens zijn waargenomen, wordt interpolatie genoemd. Het proces van voorspellen buiten de waargenomen x-waarden die in de gegevens zijn waargenomen, wordt extrapolatie genoemd.
probeer het
Er zijn gegevens verzameld over het verband tussen het aantal uren per week oefenen op een muziekinstrument en de scores op een wiskundetoets. De best passende lijn is als volgt:
Displaystylehat{{y}}={72.5}+{2.8}{x}
Wat zou je voorspellen dat de score op een wiskundetoets zou zijn voor een leerling die vijf uur per week een muziekinstrument oefent?
Gegevens van de Centers for Disease Control and Prevention.
Gegevens van het National Center for HIV, STD, and TB Prevention.
Gegevens van het United States Census Bureau. Online beschikbaar op http://www.census.gov/compendia/statab/cats/transportation/motor_vehicle_accidents_and_fatalities.html
Gegevens van het National Center for Health Statistics.
Concept Review
Nadat je de aanwezigheid van een sterke correlatiecoëfficiënt hebt vastgesteld en de line of best fit hebt berekend, kun je de kleinste kwadraten regressielijn gebruiken om voorspellingen te doen over je gegevens.