Leerresultaten

  • Gebruik interpolatie en extrapolatie

Herinner je dit voorbeeld uit eerdere inhoud:

Een willekeurige steekproef van 11 statistiekstudenten leverde de volgende gegevens op, waarbij
x de derde tentamenscore op 80 is, en y de eindexamenscore op 200. Kun je de eindexamenscore van een willekeurige student voorspellen als je de score van het derde examen kent?

x (score derde examen) y (score eindexamen)
65 175
67 133
71 185
71 163
66 126
75 198
67 153
70 163
71 159
69 151
69 159

Tabel met de scores op het eindexamen gebaseerd op de scores van het derde examen.

Dit is een spreidingsdiagram van de verstrekte gegevens. De score van het derde examen staat op de x-as en de score van het eindexamen op de y-as. De punten vormen een sterk, positief, lineair patroon.Spreidingsdiagram met de scores op het eindexamen gebaseerd op de scores van het derde examen.

We onderzochten de spreidingsdiagram en toonden aan dat de correlatiecoëfficiënt significant is. We vonden de vergelijking van de best passende lijn voor het eindexamencijfer als functie van het cijfer op het derde-examen. We kunnen nu de kleinste-kwadraten regressielijn gebruiken voor de voorspelling.

Voorstel dat je een schatting, of voorspelling, wilt maken van de gemiddelde eindexamenscore van studenten statistiek die 73 hebben gehaald op het derde examen. De examencijfers (x-waarden) variëren van 65 tot 75. Omdat 73 tussen de x-waarden 65 en 75 ligt, substitueer je x = 73 in de vergelijking. Dan:

Displaystyle{y}=-{173.51}+{4.83}{({73})}={179.08}

We voorspellen dat studenten statistiek die op het derde examen een cijfer van 73 halen, op het eindexamen gemiddeld een cijfer van 179.08 halen.

Voorbeeld

Gebruik de bovenstaande gegevens voor dit voorbeeld:

  1. Wat zou u voorspellen als eindexamencijfer voor een student die op het derde examen een 66 scoort?
  2. Wat zou u voorspellen als het eindexamencijfer zou zijn voor een student die 90 scoorde op het derde examen?

Oplossing:

  1. 145.27
  2. De x-waarden in de gegevens liggen tussen 65 en 75. Negentig ligt buiten het domein van de waargenomen x-waarden in de gegevens (onafhankelijke variabele), dus je kunt het eindexamencijfer voor deze student niet betrouwbaar voorspellen. (Ook al is het mogelijk om 90 in te vullen in de vergelijking voor x en een overeenkomstige y-waarde te berekenen, de y-waarde die je dan krijgt zal niet betrouwbaar zijn.)Om echt te begrijpen hoe onbetrouwbaar de voorspelling kan zijn buiten de waargenomen x-waarden in de gegevens, maak je de substitutie x= 90 in de vergelijking.{Displaystyle{{y}}=-{173.51}+{4.83}{({90})}={261.19}De eindexamenscore wordt voorspeld op 261.19. De hoogste eindexamenscore kan 200 zijn.

Noot

Het proces van voorspellen binnen de geobserveerde x-waarden die in de gegevens zijn waargenomen, wordt interpolatie genoemd. Het proces van voorspellen buiten de waargenomen x-waarden die in de gegevens zijn waargenomen, wordt extrapolatie genoemd.

probeer het

Er zijn gegevens verzameld over het verband tussen het aantal uren per week oefenen op een muziekinstrument en de scores op een wiskundetoets. De best passende lijn is als volgt:

Displaystylehat{{y}}={72.5}+{2.8}{x}

Wat zou je voorspellen dat de score op een wiskundetoets zou zijn voor een leerling die vijf uur per week een muziekinstrument oefent?

Gegevens van de Centers for Disease Control and Prevention.

Gegevens van het National Center for HIV, STD, and TB Prevention.

Gegevens van het United States Census Bureau. Online beschikbaar op http://www.census.gov/compendia/statab/cats/transportation/motor_vehicle_accidents_and_fatalities.html

Gegevens van het National Center for Health Statistics.

Concept Review

Nadat je de aanwezigheid van een sterke correlatiecoëfficiënt hebt vastgesteld en de line of best fit hebt berekend, kun je de kleinste kwadraten regressielijn gebruiken om voorspellingen te doen over je gegevens.

Geef een antwoord

Het e-mailadres wordt niet gepubliceerd.