Learning Outcomes

  • Az interpoláció és az extrapoláció használata

Emlékezzünk vissza erre a példára a korábbi tartalomból:

Egy 11 statisztika szakos hallgatóból álló véletlen minta a következő adatokat adta, ahol
x a 80-ból a harmadik vizsgapont, y pedig a 200-ból a végső vizsgapont. Meg tudja-e jósolni egy véletlenszerűen kiválasztott hallgató végső vizsgaeredményét, ha ismeri a harmadik vizsgaeredményt?

.

x (harmadik vizsga pontszáma) y (záróvizsga pontszáma)
65 175
67 133
71 185
71 163
66 126
75 198
67 153
70 163
71 159
69 151
69 159

A záróvizsga pontszámát bemutató táblázat a harmadik vizsgán elért pontszámok alapján.

A megadott adatok szórásdiagramja. Az x-tengelyen a harmadik vizsga pontszáma, az y-tengelyen pedig a záróvizsga pontszáma látható. A pontok erős, pozitív, lineáris mintázatot alkotnak.A záróvizsga pontszámait a harmadik vizsga pontszámai alapján mutató szórásdiagram.

Vizsgáltuk a szórásdiagramot, és kimutattuk, hogy a korrelációs együttható szignifikáns. Megtaláltuk a legjobb illeszkedésű egyenes egyenletét a záróvizsga jegyének a harmadik vizsgán kapott jegy függvényében. Most már használhatjuk a legkisebb négyzetek regressziós egyenesét az előrejelzéshez.

Tegyük fel, hogy meg akarjuk becsülni, vagyis meg akarjuk jósolni a harmadik vizsgán 73 pontot kapott statisztika szakos hallgatók záróvizsga-pontszámának átlagát. A vizsgaeredmények (x-értékek) 65 és 75 között mozognak. Mivel 73 a 65 és 75 x-értékek között van, helyettesítsük az egyenletbe az x = 73 értéket. Ekkor:

\displaystyle\hat{{y}}=-{173.51}+{4.83}{({73})}={179.08}

Megjósoljuk, hogy azok a statisztikus hallgatók, akik a harmadik vizsgán 73 pontot kaptak, a záróvizsgán átlagosan 179.08 pontot fognak kapni.

Példa

A fenti adatokat használjuk a következő példára:

  1. Mit jósolna annak a diáknak, aki a harmadik vizsgán 66 pontot szerzett, a záróvizsga pontszámára?
  2. Milyennek jósolná a záróvizsga pontszámát annak a diáknak, aki 90 pontot ért el a harmadik vizsgán?

Megoldás:

  1. 145,27
  2. Az adatokban szereplő x értékek 65 és 75 között vannak. A kilencven kívül esik az adatokban megfigyelt x értékek tartományán (független változó), így nem lehet megbízhatóan megjósolni ennek a diáknak a záróvizsga-eredményét. (Annak ellenére, hogy az x egyenletbe be lehet írni 90-et, és ki lehet számítani a megfelelő y értéket, a kapott y érték nem lesz megbízható.) Hogy valóban megértsük, mennyire megbízhatatlan lehet az előrejelzés az adatokban megfigyelt x értékeken kívül, tegyük be az egyenletbe az x=90 helyettesítést. \displaystyle\hat{{y}}=-{173.51}+{4.83}{({90})}={261.19}A záróvizsga pontszámot 261.19-re jósoljuk. A legnagyobb végső-vizsga pontszám, ami lehet, 200.

Jegyzet

Az adatokban megfigyelt x értékeken belül megfigyelt x értékek előrejelzésének folyamatát interpolációnak nevezzük. Az adatokban megfigyelt, megfigyelt x értékeken kívüli előrejelzés folyamatát extrapolációnak nevezzük.

próbáld ki

Adatokat gyűjtöttünk egy hangszer heti gyakorlásával töltött órák száma és egy matematikai teszten elért pontszámok közötti kapcsolatról. A legjobb illeszkedés egyenese a következő:

\displaystyle\hat{{y}}={72.5}+{2.8}{x}

Milyen eredményt jósolna egy matematikai teszten annak a diáknak, aki heti öt órát gyakorol egy hangszeren?

A Centers for Disease Control and Prevention adatai.

A National Center for HIV, STD, and TB Prevention adatai.

A United States Census Bureau adatai. Elérhető online a http://www.census.gov/compendia/statab/cats/transportation/motor_vehicle_accidents_and_fatalities.html

Adatok a National Center for Health Statistics-tól.

Koncepció áttekintése

Az erős korrelációs együttható jelenlétének megállapítása és a legjobb illeszkedés egyenesének kiszámítása után a legkisebb négyzetek regressziós egyenesét használhatja az adatokra vonatkozó előrejelzésekhez.

Vélemény, hozzászólás?

Az e-mail-címet nem tesszük közzé.